CN113891942A - 质粒系统 - Google Patents

质粒系统 Download PDF

Info

Publication number
CN113891942A
CN113891942A CN202080039790.8A CN202080039790A CN113891942A CN 113891942 A CN113891942 A CN 113891942A CN 202080039790 A CN202080039790 A CN 202080039790A CN 113891942 A CN113891942 A CN 113891942A
Authority
CN
China
Prior art keywords
plasmid
rep
gene
helper
cap
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080039790.8A
Other languages
English (en)
Inventor
M·霍莱尔
F·桑塔格
R·科伯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denggao Manufacturing Co ltd
Original Assignee
Free Exercise Therapy Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP19169121.1A external-priority patent/EP3722434B1/en
Priority claimed from GBGB1905263.8A external-priority patent/GB201905263D0/en
Application filed by Free Exercise Therapy Co ltd filed Critical Free Exercise Therapy Co ltd
Publication of CN113891942A publication Critical patent/CN113891942A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material

Abstract

本发明涉及用于生产重组AAV(rAAV)载体的双质粒系统、辅助质粒和/或载体质粒。本发明进一步涉及使用本发明的双质粒系统、辅助质粒和/或载体质粒的方法或其用途。

Description

质粒系统
发明领域
本发明涉及用于生产重组AAV(rAAV)载体的双质粒系统、辅助质粒和/或载体质粒。本发明进一步涉及使用本发明的双质粒系统、辅助质粒和/或载体质粒的方法或其用途。
发明背景
重组腺相关病毒(rAAV)载体具有相当大的基因治疗潜力,因为它们具有良好的安全性和体内转导许多组织的能力。然而,生产仍然相当困难和复杂,并且仅在有限程度上实现了工业规模的生产规模放大。一个原因是rAAV的生产依赖于与辅助病毒的共同感染来繁殖和建立生产性生命周期。用具有复制能力的辅助病毒(例如腺病毒)感染细胞用于生产rAAV的缺点是生产的rAAV储液被辅助病毒污染,需要在下游纯化过程中进行验证的病毒去除步骤。
出于这个原因,通常通过在质粒上提供相关的腺病毒辅助功能来避免使用腺病毒共感染,该质粒与其他几种含有AAV Rep和Cap功能的质粒以及rAAV“载体基因组”(即包含rAAV的遗传“有效载荷”的异源核酸)一起转染,侧翼是反向末端重复(ITR)序列,其确保异源核酸包装在生产的病毒颗粒内。例如,Emmerling等人(2016)在第3.1.2节中描述了四质粒系统,其中在分开的质粒上分别提供Rep、Cap和腺病毒辅助功能,同时在第四质粒上提供载体基因组。质粒合成是主要的商品成本驱动因素,从效率和经济的角度来看,使用四质粒(所有这些质粒都必须进入同一个细胞才能在该细胞中生产rAAV)是不利的。
Emmerling等人(2016)在第3.1.3节中提到了双质粒系统,其中一种质粒包含Rep、Cap和载体基因组,其中第二质粒提供腺病毒功能。在这方面必须指出的是,药物监管机构对基于病毒的产品安全性的一个主要关注方面,无论是溶瘤病毒还是基因转移载体,是通过重组起始材料基因信息来生产野生型样回复体,例如在这种情况下,是在用共同携带此信息的质粒转染生产细胞后。质粒之间的重组事件可导致生产所谓的具有复制能力的(rc)病毒(在AAV的情况下,是具有复制能力的AAV(rcAAV)颗粒)。当rep和cap存在于同一质粒上时,存在通过分子内或分子间(取决于携带ITR-异源核酸-ITR的质粒)重组生产不可接受水平的rcAAV的风险。
在需要转换到不同的载体基因组(即感兴趣的异源核酸;转基因盒)或转换到在寻求不同的组织趋向性的情况下可能需要的不同的衣壳血清型(即不同的cap基因)的情况下,这种质粒排列在经济上也是次优的。在任何一种情况下,都需要合成一种新的(Rep-Cap-载体基因组)质粒,每次合成的成本部分取决于质粒长度,(不变的)rep基因对此有贡献。
为了满足目前临床试验和市场供应对rAAV载体材料的需求,有待实现以下目标:(a)提高rAAV载体的安全性和质量概况,以满足对载体质量的监管要求;(b)在给定制造活动的起始材料成本以及活动之间转换的成本方面,提高rAAV制造的经济性;(c)rAAV产量高;以及(d)控制含有(“完整”)或缺乏(“空”)完整重组载体基因组的rAAV颗粒的比例。
发明概述
本发明涉及用于制造rAAV的双质粒系统,其中至少一些腺病毒辅助基因功能与一种质粒上的AAV rep组合,并且AAV cap与第二质粒上的rAAV载体基因组组合。除了本文公开的其他令人惊讶的优点之外,‘反式拆分(trans-split)Rep-Cap’双质粒系统在实现由更简单和更灵活的形式生产的改进的经济性、增强的安全性和质量属性的组合方面也优于已知系统。
因此,在本发明的第一方面,提供了双质粒系统,其包含辅助质粒和载体质粒,其中辅助质粒包含编码至少一种功能性Rep蛋白的至少一种rep基因,并且不包含编码一组功能性Cap蛋白的cap基因。
在本发明的第二方面,提供了一种双质粒系统,其包含辅助质粒和载体质粒,其中辅助质粒包含至少一种辅助病毒基因并且不包含编码功能性Cap蛋白的cap基因,并且至少一种辅助病毒基因包含在与SEQ ID NO:4的全长或长度为至少6000个、至少7000个或至少8000个核苷酸的片段(在一条链上)具有至少95%、至少98%、至少99%或100%的同一性的质粒的连续链段中。
此外,本发明涉及设计用于在本发明的双质粒系统中使用的辅助质粒和载体质粒。
因此,在本发明的第三方面,提供了辅助质粒,其包含编码至少一种功能性Rep蛋白的至少一种rep基因和至少一种辅助病毒基因,并且其不包含编码功能性Cap蛋白的cap基因。
类似地,在本发明的第四方面,提供了辅助质粒,其包含至少一种辅助病毒基因且不包含编码功能性Cap蛋白的cap基因,并且至少一种辅助病毒基因包含在与SEQ ID NO:4的全长或长度为至少6000个、至少7000个或至少8000个核苷酸的片段(在一条链上)具有至少95%、至少98%、至少99%或100%的同一性的质粒的连续链段中。
此外,在本发明的第五方面,提供了载体质粒,其包含:
(a)编码至少一种功能性Cap蛋白的cap基因;或者
(b)至少一种cap基因启动子、与cap基因启动子可操作地连接的克隆位点以及至少一侧上侧接ITR的表达盒;
其中载体质粒不包含编码功能性Rep蛋白的rep基因,并且表达盒包含与至少一种调控元件可操作地连接的转基因。
在本发明的第六方面,提供了宿主细胞,其包含本发明的双质粒系统、辅助质粒或载体质粒。
本发明还涉及这种双质粒系统、辅助质粒和载体质粒在制备rAAV制剂中的用途。本发明的质粒可用于获得具有低水平rcAAV、具有期望的完整颗粒与总颗粒的比率和/或以高产量或期望产量的rAAV制剂。
在本发明的第七方面,提供了本发明的双质粒系统、辅助质粒或载体质粒用于生产重组AAV制剂的用途,所述重组AAV制剂:
(a)具有低水平的具有复制能力的AAV(rcAAV);
(b)具有期望的完整颗粒与总颗粒的比率;和/或
(c)具有高产量或期望产量。
在本发明的第八方面,提供了本发明的双质粒系统、辅助质粒或载体质粒用于以下的用途:
(a)降低或最小化rAAV生产过程中生产的具有复制能力的(rcAAV)的水平;
(b)降低或最小化重组AAV生产过程中生产的假野生型具有复制能力的AAV(rcAAV)的水平;
(c)控制或最大化重组AAV生产过程中生产的完整颗粒与总颗粒的比率;和/或
(b)增加、优化或最大化重组AAV生产过程中生产的rAAV的产量。
在本发明的第九方面,提供了生产rAAV制剂的方法,其包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞。
在本发明的第十方面,提供了降低或最小化rAAV生产过程中生产的具有复制能力的AAV(rcAAV)的水平的方法,其包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞。
在本发明的第十一方面,提供了控制或最大化重组AAV生产过程中生产的完整颗粒与总颗粒的比率的方法,其包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞。
在本发明的第十二方面,提供了增加、优化或最大化重组AAV生产过程中生产的rAAV的产量的方法,其包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞。
在本发明的第十三方面,提供了通过本发明的方法可获得的rAAV制剂。
在本发明的第十四方面,提供了通过本发明的方法获得的rAAV制剂。
在本发明的第十五方面,提供了降低或最小化重组AAV生产过程中生产的假野生型具有复制能力的AAV(rcAAV)的水平的方法,其包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞。
附图说明
图1提供了天然AAV基因组的示意图,显示了重叠的rep和cap(VP1-3)转录物以及p5、p19和p40启动子的位置。ITR=反向末端重复。
图2提供了如实施例1所述构建的辅助质粒的示意图,插图显示了包括p5、p19和p40启动子的rep基因。穿过“p40”的叉表示这些启动子已失去功能。rep 52/40基因中的阴影区域表示存在内含子序列,该序列拼接到rep 52转录物中,但从rep 40转录物中剪接出来。Ori=细菌复制起点。KanR=卡那霉素抗性基因。注意,相应的质粒特征未按比例显示。
图3提供了如实施例1所述构建的载体质粒的示意图,插图显示了cap基因和包括p5、p19和p40启动子的上游启动子区域。穿过“ATG”和“GTG”的叉表示这些潜在的翻译起始密码子已被删除。Ori=细菌复制起点。KanR=卡那霉素抗性基因。ITR=反向末端重复。注意,相应的质粒特征未按比例显示。
图4提供了显示载体质粒实施方案的示意图:(A)含有cap基因和侧接ITR、用于克隆进表达盒中的多克隆位点;(B)含有cap基因和用于克隆进侧接ITR的表达盒的多克隆位点;(C)含有侧接ITR的表达盒和位于含有p5、p19和p40启动子的启动子区域下游、用于克隆进cap基因的多克隆位点;(D)含有侧接ITR、用于克隆进表达盒中的多克隆位点和位于含有p5、p19和p40启动子的启动子区域下游、用于克隆cap基因的另一个多克隆位点;(E)含有用于克隆进侧接ITR的表达盒的多克隆位点和位于含有p5、p19和p40启动子的启动子区域下游、用于克隆cap基因的另一个多克隆位点。
图5提供了如实施例2中所述生产和测定的rAAV的分析结果。(A)通过抗衣壳ELISA在总质粒DNA的水平不变的情况下以不同的辅助:载体质粒比率使用两质粒系统生产的rAAV中测量的每毫升颗粒滴度。‘非拆分’=在同一质粒上具有Rep和Cap功能的双质粒系统,以质粒比率AdV辅助表达盒:rep-cap 1.6:1使用。‘Ctrl’=阴性对照:用pUC19而不是载体质粒转染的辅助质粒。(B)在(A)的rAAV样品中,通过qPCR扩增表达盒启动子内的序列测量的每毫升载体基因组(vg)滴度。(C)vg(来自B)与总颗粒(来自A)的比率,表示为“完整%”,即vg的数量相对于颗粒数量的百分比。注意:1.0E+12=1.0×1012。误差条显示来自样品三次重复分析的标准偏差。
图6显示了不同rAAV批次中的rcAAV定量。分析了三批不同批次的含有相同(因子IX编码)转基因盒的rAAV的rcAAV含量。
实施例3描述了如何分析批次。
图7显示了通过质粒比率修改对产量和完整颗粒与总颗粒比率的调节。在rAAV生产中,针对双质粒系统测试了六种不同的质粒比率。摩尔质粒比为3:1、1.8:1、1:1.5、1:2、1:3和1:5。这些是从图5中执行的实验中选择的结果,这些结果已用于计算倍数变化。倍数变化是相对于辅助:载体摩尔质粒比3:1。(A)病毒(载体)基因组产量由转基因盒特异性qPCR确定。(B)衣壳产量由衣壳特异性ELISA确定。(C)根据qPCR和ELISA结果计算完整颗粒与总颗粒的比率。
图8显示了(A)双质粒包装系统中四种不同转基因的病毒(载体)基因组产量。四种不同的转基因(因子IX[FIX]、α-半乳糖苷酶A[GLA]、β-葡糖脑苷脂酶[GBA]和因子VIII[FVIII])用于rAAV包装。对每种转基因进行两种独立的包装实验。使用转基因盒特异性qPCR对产量进行定量。已经在GBA转基因和FVIII转基因的背景下比较了不同的辅助载体:载体质粒比率,结果显示在(B)到(D)中(GBA)和(E)到(G)中(FVIII)。如图所示,使用的辅助:载体摩尔质粒比为1:0.75、1:1.5、1:3和1:4.5。病毒(载体)基因组产量由转基因盒特异性qPCR确定。衣壳产量通过衣壳特异性ELISA确定。基于qPCR和ELISA结果计算载体基因组与总颗粒的比率。结果显示为相对于辅助载体:载体摩尔质粒比1:0.75的倍数变化。(H)显示了两种质粒包装中四种不同转基因(因子IX[FIX]、α-半乳糖苷酶A[GLA]、β-葡糖脑苷脂酶[GBA]和因子VIII[FVIII])的病毒(载体)基因组产量系统使用辅助:载体质粒比率1:1.8和1:3。使用转基因盒特异性qPCR对产量进行定量。结果显示为相对于辅助载体:载体摩尔质粒比1.8:1的倍数变化。
图9显示了生产应用不同cap血清型或合成cap变体的rAAV。应用相同的摩尔质粒比、五种不同cap血清型/合成cap变体(经工程改造的cap基因、AAV-2、AAV-5、AAV-8或AAV-9)和相同的转基因盒生产rAAV。通过转基因盒特异性qPCR确定病毒(载体)基因组产量。
图10——序列表。
图11显示了从rcAAV的富集中分离的DNA的Southern印迹分析。使用cap(A)和rep(B)特异性探针进行Southern印迹分析。印迹前带有染色标准参照物条带的相应凝胶的图片被下衬用于印迹上检测到的条带的大小相关性。
“rcAAV”:具有复制能力的AAV载体制剂,其含有一个4.7kb的载体基因组,所述载体基因组含有直接上样在凝胶上的功能性rep和cap基因。上样了1×107和1×106个基因组拷贝作为灵敏度对照。在凝胶的每一端上样两种量。正如预期的那样,两种探针都检测到了4.7kb条带。该样品还标记了含有功能性rep和cap基因的4.7kb野生型基因组长度。
“来自辅助质粒的片段”:用BsrGI-HF和NdeI消化后的辅助质粒P-150的4.2kb质粒片段被上样并用作特异性对照,因为它应该只给出rep探针(而不是cap探针)的信号。上样了1×107个拷贝的片段。
“来自载体质粒的片段”:用ApaLI和PvuI-HF消化后的载体质粒P-160的3.8kb质粒片段被上样并用作特异性对照,因为它应该只给出cap探针(而不是rep探针)的信号。上样了1×107个拷贝的片段。
“拆分(Split)”:使用反式拆分双质粒系统生成的rAAV在两轮感染(用于富集rcAAV)后分离的AAV载体基因组。也称为“富集的拆分DNA样品”。如实施例10中所述,使用qPCR对cap序列估计cap的拷贝数。将大约2×107、4×107和6×107个cap拷贝上样到印迹上。
“非拆分”:使用非拆分系统生成的rAAV在两轮感染(用于富集rcAAV)后分离的AAV载体基因组。也称为“富集的非拆分DNA样品”。如实施例10中所述,使用qPCR对cap序列估计cap的拷贝数。将大约5×107个cap拷贝上样到印迹上。
“rcAAV感染后”:使用带有功能性rep和cap基因的具有复制能力的AAV(富集阳性对照)在两轮感染(用于富集rcAAV)后分离的AAV载体基因组。上样了1×107个基因组拷贝作为对照,以证明当存在功能性Rep和Cap时,可以使用该测定生成rcAAV。检测到大约4.7kb的清晰信号。
“M”=荧光高范围DNA梯状条带(Jena Bioscience):0.5、0.6、0.8、1.0、1.5、2.0、3.0、4.0、5.0、6.0、8.0、10.0kb
图12显示了对富集的非拆分DNA样品(“非拆分”)和富集的拆分DNA样品(“拆分”)使用引物对O-108/109通过PCR获得的扩增产物的(1%)琼脂糖凝胶分离。每个泳道上样10μl每个PCR反应。
NTC:无模板对照(水代替模板DNA)
分子量标准(PeqLab):0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.2、1.5、2.0、2.5、3.0、3.5、4.0、5.0、6.0、8.0、10.0kb
箭头表示获得的主要产物:非拆分样品为约3.5kb;拆分样品为约3.5kb弱产物和约2.8kb强产物。
图13显示了对富集的DNA非拆分样品(“n.s.”)和富集的DNA拆分样品(“拆分”)使用引物对O-108/109(重复图12中的实验)和O-119/117通过PCR获得的扩增产物的(1%)琼脂糖凝胶分离。作为阳性对照,还对质粒P-143进行PCR以显示野生型排列rep-cap的扩增产物的长度,O-108/109的扩增产物的长度为约3.5kb,而O-119/117的扩增产物的长度则为约4.1kb。每个泳道上样10μl每个PCR反应。右侧的凝胶是含有使用O-119/117引物对的PCR产物的凝胶的放大视图。凝胶暴露更长时间以观察弱条带。白色箭头表示O-119/117对拆分样品的非常弱的产物,其代表含有潜在功能性rep-cap的AAV种类,而对于非拆分样品则能够很容易地检测到。
NTC:对应引物对的无模板对照(水代替模板DNA)
分子量标准(PeqLab):0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.2、1.5、2.0、2.5、3.0、3.5、4.0、5.0、6.0、8.0、10.0kb
图14提供了实施例8中描述的质粒的区域示意图。该示意图将编码Rep和Cap的P-143质粒的区域与编码Cap的载体质粒P-160的区域和编码Rep68、Rep40和Rep52的辅助质粒P-150的区域对齐。在P-143质粒和P-150辅助质粒中存在两个序列链段(由垂直矩形勾勒出),但在P-160载体质粒中不存在。载体质粒中的虚线对应于存在于P-143质粒和辅助质粒中但不存在于载体质粒中的序列。指示了引物对O-108/109和引物对O-117/119杂交的位置。反向引物O-109和O-117在编码cap序列内杂交,而正向引物O-119和O-108在辅助质粒和P-143质粒中存在但不存在于载体质粒中的rep序列的链段杂交。指示了启动子(p5、p19和p40)。“p40”上打的叉表示这些启动子已失去功能。质粒之间交叉影线的匹配模式表明包含同源序列的片段。请注意,各自的质粒特征未按比例显示。
图15提供了实施例8中描述的P-160载体质粒和P-150辅助质粒的区域的示意图。质粒之间交叉影线的匹配模式表明包含同源序列的片段。由虚线对角线指示的载体和辅助质粒区域之间的同源重组导致所示的同源重组产物。如图所示,在同源重组产物中,使用O-108/109引物对的扩增生产约2.8kb的产物,使用O-119/117引物对的扩增生产约3.5kb的产物。每个标记为***的框是存在于辅助质粒中编码Rep68/40和Rep52/40的序列中的rep基因座部分,但在同源重组产物中缺失。标有*的线代表存在于载体质粒中的突变,该突变也存在于大多数同源重组产物中,但并非唯一的。标记为**的三线代表载体质粒中存在的三个突变,它们也存在于同源重组产物中。显示了启动子(p5、p19和p40)。“p40”上打的叉表示这些启动子已失去功能。请注意,各自的质粒特征未按比例显示。
图16提供了实施例8中描述的P-160载体质粒和P-150辅助质粒的区域的示意图。质粒之间交叉影线的匹配模式表明包含同源序列的片段。由对角线指示的载体和辅助质粒区域之间的同源重组可能导致所示的同源重组产物。如图所示,在同源重组产物中,使用O-108/109引物对的扩增将生产大约3.5kb的产物,使用O-119/117引物对的扩增将生产大约4.1kb的产物。标记为***的每个框是存在于辅助质粒中编码Rep68/40和Rep52/40的序列中的rep基因座部分,并且在图15所示的同源重组产物中缺失,但存在于本发明的图16的同源重组产物中。标有*的线代表载体质粒中存在的突变。由于产物丰度低而无法测序,因此无法确定同源重组产物中是否存在突变。标记为**的三线代表载体质粒中存在的三个突变。无法确定同源重组产物中是否存在突变,因为产物丰度低而无法测序。显示了启动子(p5、p19和p40)。“p40”上打的叉表示这些启动子已失去功能。请注意,各自的质粒特征未按比例显示。
详述
一般定义
除非另有定义,否则本文使用的技术和科学术语具有与本发明所属领域的技术人员通常理解的含义相同的含义。
一般而言,术语“包含”旨在表示包括但不限于。例如,短语“包含至少一种rep基因的辅助质粒”应解释为表示辅助质粒具有至少一种rep基因,但辅助质粒可包含其他成分,例如其他基因。
在本发明的一些实施方案中,词语“包含”被短语“由……组成”或“基本上由……组成”替换。术语“由……组成”旨在进行限制。例如,短语“由一种rep基因组成的辅助质粒”应理解为表示辅助质粒具有一种rep基因而没有其他遗传物质。类似地,短语“基本上由一种rep基因组成的辅助质粒”应理解为表示辅助质粒具有一种rep基因并且不包含实质上影响辅助质粒的功能的额外成分。例如,基本上由rep基因组成的辅助质粒将不包含任何其他基因,但可能包含其他遗传物质,例如间隔子。
在本文中可互换使用术语“蛋白质”和“多肽”,旨在指任何长度的氨基酸聚合链。
出于本发明的目的,为了确定两条序列(例如两条多核苷酸序列或两条多肽序列)的同一性百分比,将序列比对以用于最佳比较目的(例如,可以在第一序列中引入缺口用于与第二序列进行最佳比对)。然后比较每个位置的核苷酸或氨基酸。当第一序列中的一个位置被与第二序列中的相应位置相同的氨基酸或核苷酸占据时,则该位置的氨基酸或核苷酸是相同的。两条序列之间的同一性百分比是序列共有的相同位置数量的函数(即,同一性%=相同位置的数量/参考序列中的位置总数×100)。
通常在参考序列的长度上进行序列比较。例如,如果用户希望确定给定(“测试”)序列是否与SEQ ID NO:1 95%相同,则SEQ ID NO:1将是参考序列。为了评估序列是否与SEQ ID NO:1(参考序列的一个实例)至少80%相同,本领域技术人员将在SEQ ID NO:1的长度上进行比对,并确定在测试序列中有多少个位置与SEQ ID NO:1的位置相同。如果至少80%的位置相同,则测试序列与SEQ ID NO:1至少有80%相同。如果序列比SEQ ID NO:1短,则缺口或缺失的位置应视为不相同的位置。
本领域技术人员知道可用于确定两条序列之间的同源性或同一性的不同计算机程序。例如,序列的比较和两条序列之间的同一性百分比的确定可以使用数学算法来完成。在一个实施方案中,两条氨基酸或核酸序列之间的同一性百分比是使用Blosum 62矩阵或PAM250矩阵和缺口权重为16、14、12、10、8、6或4和长度权重为1、2、3,4、5或6而使用Needleman和Wunsch(1970)算法(该算法已集成入Accelrys GCG软件包(可在http://www.accelrys.com/products/gcg/获得)的GAP程序中)确定的。
在本文中,术语“质粒”旨在指可独立于细胞染色体而复制的核酸分子。术语“质粒”旨在涵盖环状核酸分子和线性核酸分子。此外,术语“质粒”旨在涵盖细菌质粒,但也包括粘粒、微环(Nehlsen,K.,Broll S.,Bode,J.(2006),Gene Ther.Mol.Biol.,10:233–244;Kay,M.A.,He,C.-Y,Chen,Z.-H.(2010),Nature Biotechnology,28:1287–1289)和ministring(Nafissi N,Alqawlaq S,Lee EA,Foldvari M,Spagnuolo PA,Slavcev RA.(2014),Mol Ther Nucleic Acids,3:e165)。任选地,质粒是环状核酸分子。任选地,质粒是细菌来源的核酸分子。
术语“辅助”不旨在进行限制。因此,“辅助质粒”是以下的任何质粒:
(i)包含编码至少一种功能性Rep蛋白的至少一种rep基因并且不包含编码功能性Cap蛋白的cap基因;或
(ii)包含至少一种辅助病毒基因并且不包含编码功能性Cap蛋白的cap基因,并且该至少一种辅助病毒基因包含在与SEQ ID NO:4的全长或长度为至少6000个、至少7000个或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%的同一性的质粒的连续链段中。
术语“载体质粒”不旨在进行限制。因此,“载体质粒”是以下的任何质粒:
(i)适用于在本发明的双质粒系统中与辅助质粒一起使用;或
(ii)包含:
(a)编码至少一种功能性Cap蛋白的cap基因;或
(b)至少一种cap基因启动子、与cap基因启动子可操作地连接的克隆位点和在至少一侧上侧接ITR的表达盒;
其中载体质粒不包含编码功能性Rep蛋白的rep基因,并且表达盒包含与至少一种调控元件可操作地连接的转基因。
术语“核酸分子”是指任何长度的聚合形式的核苷酸。核苷酸可以是脱氧核糖核苷酸、核糖核苷酸或其类似物。优选地,质粒由脱氧核糖核苷酸或核糖核苷酸组成。甚至更优选地,质粒由脱氧核糖核苷酸组成,即质粒是DNA分子。
术语“野生型”和“天然”是同义词,指AAV或腺病毒株/血清型基因组中存在的基因,或由AAV或腺病毒株/血清型基因组中存在的基因编码的蛋白质。
AAV生产测定
在AAV生产测定中,用户能够确定给定的“测试”质粒或双质粒系统是否能有效地生产与如下所示的“参考”质粒或双质粒系统相似水平的rAAV。
用户提供“参考”双质粒系统,该系统包含“参考辅助质粒”和“参考载体质粒”。
例如,用户提供参考辅助质粒,其包含编码E2A、E4和VA RNA I和II的野生型腺病毒5辅助基因,即包含在SEQ ID NO:2内的腺病毒辅助基因。编码这些基因的SEQ ID NO:2中核酸位置的详细信息在下面的标题“至少一种病毒辅助基因”下更详细地列出。辅助质粒还包含编码Rep 40、Rep 52、Rep 68和Rep 78的野生型rep基因以及rep启动子p5、p19和p40,即包含在SEQ ID NO:1的核苷酸200-2252内的序列。
用户提供参考载体质粒,其包含与包含p5、p19和p40的野生型cap基因启动子可操作地连接的野生型cap基因,即包含在SEQ ID NO:1内的cap基因(SEQ ID NO:1的核苷酸5961-8171)。载体质粒进一步包含侧接两个AAV2 ITR的转基因,即包含在SEQ ID NO:1的核苷酸1-145和4535-4679内的ITR。
然后,用户提供包含“测试辅助质粒”和“测试载体质粒”的“测试”双质粒系统,该系统基于参考双质粒系统,但具有与用户希望去测试的特征相关的单一变化。例如,如果用户希望查看给定的Rep蛋白是否是功能性的,用户可以更换“参考辅助质粒”的rep基因,并用测试rep蛋白替换它以提供“测试辅助质粒”。
然后,用户比较参考双质粒系统和测试双质粒系统的能力,以允许生产rAAV。为此,用户可以使用参考双质粒系统转染第一组合适的宿主细胞(例如表达E1A/B基因的HEK293T细胞,使得辅助质粒不需要包含E1A/B基因),并用测试双质粒系统转染第二组相同的宿主细胞,并孵育宿主细胞一段时间,以适合AAV生产发生。然后可以收获从参考双质粒系统和测试双质粒系统生产的AAV重组体的产量,并使用qPCR测量以定量载体基因组的数量。例如,qPCR可用于确定与用参考双质粒系统转染的宿主细胞相比,在用测试双质粒系统转染的宿主细胞中生产的包含载体基因组组分(例如启动子序列)的核酸分子实例的数量。或者,可以例如通过抗衣壳ELISA来确定颗粒的比较产量。
在实施例2中公开了合适的AAV生产测定。
双质粒系统
本发明提供了双质粒系统,其包含辅助质粒和载体质粒,其中辅助质粒包含编码至少一种功能性Rep蛋白的至少一种rep基因,不包含编码功能性Cap蛋白的cap基因。
本发明还提供了双质粒系统,其包含辅助质粒和载体质粒,其中助质粒包含至少一种辅助病毒基因且不包含编码功能性Cap蛋白的cap基因,并且所述至少一种辅助病毒基因包含在质粒的连续链段中,该质粒具有与SEQ ID NO:4的全长或长度为至少6000个、至少7000个或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%同一性。
任选地,双质粒系统中使用的辅助质粒和/或载体质粒为本发明的辅助质粒或载体质粒。任选地,双质粒系统包含本发明的辅助质粒和载体质粒。
双质粒系统可用于生产rAAV。任选地,双质粒系统适用于生产rAAV。任选地,双质粒系统用于生产rAAV。任选地,双质粒系统用于生产适用于基因治疗的rAAV。任选地,双质粒系统用于生产用于基因治疗的rAAV。
短语“双质粒系统”是指包含两种质粒的系统,并且无需额外的质粒即可用于生产rAAV。可选地,双质粒系统可用于生产rAAV,而无需例如腺病毒的辅助病毒。任选地,双质粒系统可用于生产rAAV,而无需源自宿主细胞的遗传物质,任选地,编码E1A/B的基因除外。然而,该系统可包含额外的非质粒组分。任选地,双质粒系统不包含辅助病毒。任选地,本发明的双质粒系统包含生产rAAV所需的所有遗传信息。例如,本发明的双质粒系统可以包含至少一种rep基因、至少一种cap基因和至少一种辅助基因。任选地,本发明的双质粒系统包含生产适用于基因治疗的rAAV所需的所有必要遗传信息。例如,本发明的双质粒系统可包含至少一种rep基因、至少一种cap基因、至少一种辅助基因和包含与至少一种调控元件可操作地连接的转基因的表达盒。然而,在实施方案中,本发明的双质粒系统可能缺乏功能性cap基因(生产rAAV所需)和/或包含可操作地连接至至少一种调控元件的表达盒(生产适用于基因治疗的rAAV所需的转基因)。
本发明的一个优点是载体质粒中的cap基因和/或转基因可以相互交换以治疗不同的遗传疾病。因此,任选地,本发明的双质粒系统可以包含除功能性cap基因之外的所有用于生产rAAV的必要遗传信息,并且在此类实施方案中,本发明的双质粒系统可以包含适合于在cap基因中克隆的位点。这样的位点可以包括与cap基因启动子相邻的克隆位点。适合在cap基因中克隆的位点将存在于载体质粒上。任选地,本发明的双质粒系统包含生产适用于基因治疗的rAAV所需的所有遗传信息,除了功能性cap基因和包含转基因和调控元件的表达盒,其中所述双质粒系统包含适合在cap基因中克隆的位点(例如cap基因启动子和与cap基因启动子可操作地连接即邻近的克隆位点)和适合在表达盒中克隆的位点(例如侧接一个或多个ITR的克隆位点)。任选地,本发明的双质粒系统包含生产适用于基因治疗的rAAV所需的所有遗传信息,除了包含转基因和调控元件的表达盒,其中所述双质粒系统包含适合在表达盒中克隆的位点(例如侧接一个或多个ITR的克隆位点)。在这些情况下,适合在cap基因中克隆的位点和适合在表达盒中克隆的位点将存在于载体质粒上。任选地,本发明的双质粒系统包含在载体质粒和辅助质粒之间拆分的以下组分:
-编码至少一种功能性Rep蛋白的至少一种rep基因;
-至少一种辅助病毒基因;
-编码至少一种功能性衣壳蛋白的cap基因,或cap基因启动子和与cap基因启动子可操作地连接的克隆位点;
-至少一种ITR;和
-包含与至少一种调控元件可操作地连接的转基因的表达盒,或在至少一侧上侧接(即相邻)ITR的适合在表达盒中克隆的位点。
载体质粒可包含:
(a)编码至少一种功能性Cap蛋白的cap基因;或者
(b)至少一种cap基因启动子、与cap基因启动子可操作地连接的克隆位点以及至少一侧上侧接ITR的表达盒;
其中载体质粒不包含编码功能性Rep蛋白的rep基因,并且表达盒包含与至少一种调控元件可操作地连接的转基因。
辅助质粒可包含:
(a)编码至少一种功能性Rep蛋白的至少一种rep基因盒至少一种辅助病毒基因,并且不包含编码功能性Cap蛋白的cap基因;或
(b)至少一种辅助病毒基因并且不包含编码功能性Cap蛋白的cap基因,并且至少一种辅助病毒基因包含在与SEQ ID NO:4的全长或长度为至少6000个、至少7000个或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%的同一性的质粒的连续链段中。
任选地,辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7、1.2:1至1:6、1.1:1至1:5、1:1至1:4或1:1.5至1:3。任选地,双质粒系统包含与辅助质粒相比摩尔过量的载体质粒。任选地,辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7、1.2:1至1:6、1.1:1至1:5、1:1至1:4、1:1.5至1:3、1:2至1:4或约为1:3。任选地,辅助质粒与载体质粒的比率为1:2至1:4或约为1:3。优选地,辅助质粒与载体质粒的比率约为1:3。
如下文更详细所述,改变辅助质粒与载体质粒的比率可用于控制在rAAV生产过程中生产的完整颗粒与总颗粒的比率(或完整衣壳/颗粒的比例),或提高rAAV生产过程中生产的rAAV的产量。
短语“辅助质粒与载体质粒的比率”是指摩尔比,即存在的辅助质粒的摩尔数与存在的载体质粒的摩尔数的比率。辅助质粒与载体质粒的给定比率可以通过将辅助质粒和载体质粒以适当的摩尔比简单混合来提供。
辅助质粒
本发明提供了辅助质粒,其包含编码至少一种功能性Rep蛋白的至少一种rep基因和至少一种辅助病毒基因,并且不包含编码功能性Cap蛋白的cap基因。
本发明涉及适用于生产rAAV的改进的双质粒系统。包含编码至少一种功能性Rep蛋白的至少一种rep基因且不包含编码功能性Cap蛋白的cap基因的辅助质粒可有利地用于此类改进的双质粒系统中。为了生产rAAV,需要rep基因和cap基因。然而,本发明的质粒和双质粒系统被安排成使得rep和cap基因没有都存在于单个质粒上(‘反式拆分’配置)。确保辅助质粒不包含rep基因和cap基因是困难的,因为天然AAV cap和rep基因是重叠的,因此在保持足够的遗传物质以允许生产完整蛋白质的同时将它们分开是困难的。然而,在辅助质粒和载体质粒之间拆分rep基因和cap基因是有利的,因为它增加了形成rcAAV所需的重组事件的数量。
本发明还提供了辅助质粒,其包含至少一种辅助病毒基因并且不包含编码功能性Cap蛋白的cap基因,其中至少一种辅助病毒基因包含在与SEQ ID NO:4的全长或长度为至少6000个、至少7000个或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%的同一性的质粒的连续链段上。任选地,辅助质粒包含编码至少一种功能性Rep蛋白的至少一种rep基因。
AAV只能在存在辅助病毒的情况下传播,辅助病毒编码有助于AAV传播的蛋白质。然而,在存在辅助病毒的情况下培养AAV并不有利,因为辅助病毒可以溶解细胞,包括用于培养AAV的宿主细胞。此外,如果在例如用于基因治疗的rAAV的rAAV产品的生产中使用辅助病毒,则辅助病毒可能会污染产品。作为与辅助病毒(例如腺病毒)共感染的替代方法,可以在转染的质粒上提供必要的辅助病毒的基因。对于表达腺病毒E1A/B基因的宿主细胞(例如HEK293T细胞),其余所需的腺病毒辅助基因编码E4、E2A和VA RNA I和II。虽然这些基因分布在腺病毒基因组的长链段中,但本发明人已经确定,可以在不影响基因表达的情况下去除分隔基因组基因的大链段的非编码核苷酸。因此,本发明人设计了最小辅助基因区域,其为SEQ ID NO:4。在用于生产rAAV的质粒中使用这样的最小辅助基因区域是有利的,因为它允许用户使用较小的质粒,其生产成本更低并且更容易转染到细胞中。
至少一种rep基因
辅助质粒可包含编码至少一种功能性Rep蛋白的至少一种rep基因。AAV包含编码四种Rep蛋白(Rep 78、Rep 68、Rep 52和Rep 40)的rep基因区域。该基因区域受p5和p19启动子的控制。当使用p5启动子时,会转录编码Rep 78和Rep 68的基因。Rep 78和Rep 68是两种可变剪接变体(Rep 78包含在Rep 68中被切除的内含子)。类似地,当使用p19启动子时,会转录编码Rep 52和Rep 40的基因。Rep 52和Rep 40是可变剪接变体(Rep 52包含在Rep40中被切除的内含子)。
已知这四种Rep蛋白参与病毒基因组的复制和包装,因此可用于rAAV生产。
存在所有四种Rep蛋白不是必须的。但是,任选地,至少一种rep基因编码大Rep蛋白(Rep 78或Rep 68)和小Rep蛋白(Rep 52或Rep 40)。Rep 78可能对细胞有毒,并且不需要存在Rep 78即可发生AAV复制。在至少一种rep基因没有编码Rep 78的实施方案中,至少一种rep基因优选确实编码Rep 68。因此,辅助质粒可包含至少一种rep基因,其编码:
(a)功能性Rep 52蛋白;
(b)功能性Rep 40蛋白;和/或
(c)功能性Rep 68蛋白。
“功能性”Rep蛋白是一种允许生产AAV颗粒的蛋白。具体而言,Rep 78或Rep 68(大Rep蛋白)被认为参与AAV基因组的复制,而Rep 52和Rep 40(小Rep蛋白)被认为参与将AAV基因组包装成衣壳。确定给定的Rep蛋白是否是功能性的在本领域技术人员的能力范围内。本领域技术人员仅需要使用如上所述的AAV生产测定来确定Rep蛋白是否支持AAV生产。在这种情况下,测试双质粒系统将包含辅助质粒,该辅助质粒包含待确定其“功能性”的Rep蛋白,而在其他方面所使用的测试双质粒系统将与参考双质粒系统相同。
在一个实施方案中,辅助质粒的至少一种rep基因编码“功能性”Rep蛋白。如果该Rep蛋白以野生型Rep蛋白所支持的水平的至少25%、至少40%、至少50%、至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,即如果所生产的rAAV载体基因组的产量为使用参考双质粒系统所生产的rAAV载体基因组的产量的至少25%、至少40%、至少50%、至少70%、至少80%、至少90%或至少95%。优选地,如果辅助质粒的至少一种rep基因以野生型Rep蛋白所支持的水平的至少80%的水平支持rAAV生产,则它是功能性的。
一般而言,Rep蛋白只有在与待包装的AAV基因组周围的ITR兼容时才能支持rAAV生产。一些Rep蛋白可能只有在其侧接与Rep蛋白具有相同血清型的ITR时才能包装基因组材料(例如表达盒)。其他Rep蛋白是交叉相容的,这意味着它们能够包装侧接不同血清型ITR的基因组材料。例如,在双质粒系统的情况下,优选Rep蛋白能够支持包含在载体质粒内的表达盒的复制和包装,并且这种Rep蛋白将与侧接表达盒的至少一种ITR相容(即能够复制和包装在至少一侧上侧接ITR的表达盒)。
任选地,至少一种rep基因包含编码功能性Rep 52蛋白的基因、至少一种编码功能性Rep 40蛋白的基因和编码功能性Rep 68蛋白的基因。
辅助质粒可以包含两种编码功能性Rep 40蛋白的基因。在一个实施方案中,至少一种rep基因包含两种编码功能性Rep 40蛋白的基因。例如,辅助质粒可以包含在质粒上分开的两种rep基因。两种分开的rep基因中的第一基因可以编码Rep 68(例如使用p5启动子或位于rep基因中p5启动子正常位置附近的不同启动子)和Rep 40(例如使用p19启动子或位于p19启动子正常位置附近的不同启动子)。两种分开的rep基因中的第二基因可以编码Rep 52和Rep 40。Rep 52和Rep 40是可变剪接变体。
如果辅助质粒包含两种编码Rep 40蛋白的基因,则编码功能性Rep 40蛋白的两种基因之一可包含内含子。在一个实施方案中,编码功能性Rep 40蛋白的两种基因都包含内含子。然而,在优选的实施方案中,编码功能性Rep 40蛋白的基因中仅其一包含内含子。例如,如果用户希望避免编码Rep 78的至少一种rep基因,则该rep基因可能会通过部分复制拆分成两种基因。一种基因可以包含对应于全长天然rep基因的核苷酸,其中对应于内含子的序列被去除。这样的基因将编码Rep 68和Rep 40,但不会编码Rep 78或Rep 52,因为Rep78和Rep 52蛋白中的每一种的一部分由在rep 40情况下的充当内含子的序列编码。第二基因可以包含对应于p19启动子下游的天然rep基因区域的核苷酸,其将编码Rep 52(内含子被剪接进来)和Rep 40(内含子被剪接掉)。
SEQ ID NO:1提供了野生型AAV2的基因组序列,SEQ ID NO:1的核苷酸321-2252编码这四种Rep蛋白。全长rep基因(核苷酸321-2252)编码所有四种Rep蛋白(来自p5启动子的Rep 78和Rep 68以及来自p19启动子的Rep 52和Rep 40)。p19启动子下游的rep基因的较短链段(核苷酸993-2252)仅编码Rep 52和Rep 40(即rep基因的该链段从p19启动子结束处延伸到该基因结束处)。SEQ ID NO:1的核苷酸1907-2227对应于内含子。Rep 78和Rep 52包含由该内含子编码的氨基酸,但是Rep 68和Rep 40是可变剪接变体,其不包含由该内含子编码的氨基酸。rep基因与四种Rep蛋白的关系示于图1中。
任选地,双质粒系统或辅助质粒包含编码功能性Rep 52蛋白的基因,并且编码功能性Rep 52蛋白的基因包含与SEQ ID NO:1的核苷酸993-2186的全长或长度为至少800个、至少900个、至少1000个或至少1100个核苷酸的片段或者与AAV的不同血清型中的相应核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸序列。
确定特定(测试)核苷酸链段是否是“AAV的不同血清型中的相应核苷酸链段”在本领域技术人员的能力范围内。所需要的只是本领域技术人员将测试核苷酸链段与参考血清型的基因组(即SEQ ID NO:1)进行比对。如果测试核苷酸链段与SEQ ID NO:1中相同长度的连续核苷酸链段具有大于90%的同一性,则该连续核苷酸链段是AAV的不同血清型中的相应核苷酸链段。这同样适用于腺病毒序列的情况(除了这里参考血清型是SEQ ID NO:2)。
任选地,至少一种rep基因包含编码功能性Rep 40蛋白的基因,并且编码功能性Rep 40蛋白的基因包含与对应于SEQ ID NO:1的核苷酸993-2252减去核苷酸1907-2227的核苷酸链段的全长或长度为至少600个、至少700个、至少800个或至少900个核苷酸的片段或者与AAV的不同血清型中的相应核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸序列。因此,这种编码Rep 40的基因与由SEQ ID NO:1的核苷酸993-1906与SEQ ID NO:1的核苷酸2228-2252紧邻并置组成的名义核苷酸链段(5'-[993-1906]-[2228-2252]-3')或来自不同AAV血清型的名义核苷酸链段至少具有上述指定的同一性。
任选地,至少一种rep基因包含编码功能性Rep 40蛋白的基因,并且编码功能性Rep 40蛋白的基因包含与SEQ ID NO:1的核苷酸993-2252的全长或长度为至少900个、至少1000个、至少1100个或至少1200个核苷酸的片段或者与AAV的不同血清型中的相应核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸序列。
任选地,至少一种rep基因包含编码功能性Rep 68蛋白的基因,并且编码功能性Rep 68蛋白的基因包含与对应于SEQ ID NO:1的核苷酸321-2252减去核苷酸1907-2227的核苷酸链段的全长或长度为至少1000个、至少1400个、至少1500个或至少1600个核苷酸的片段或者与AAV的不同血清型中的相应核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸序列。因此,这种编码Rep 68的基因与由SEQ ID NO:1的核苷酸321-1906与SEQ ID NO:1的核苷酸2228-2252紧邻并置组成的名义核苷酸链段(5'-[321-1906]-[2228-2252]-3')或来自不同AAV血清型的名义核苷酸链段至少具有上述指定的同一性。
由于Rep 68不包含任何由内含子(核苷酸1907-2227)编码的氨基酸,编码功能性Rep 68蛋白的基因不需要包含对应于核苷酸1907-2227的核苷酸。实际上,从至少一种rep基因中排除核苷酸1907-2227确保了Rep 78不被编码(因为Rep78包含由该内含子编码的氨基酸)。优选地,辅助质粒不包含编码功能性Rep 78蛋白的基因。
任选地,至少一种rep基因包含编码功能性Rep 68和Rep 40蛋白的基因,其中所述基因包含与位于天然AAV2序列(SEQ ID NO:1)的以下的从5'到3':200-1906;2228-2309紧邻并置的链段的全长或长度为至少1400个、1500个、1600个或1700个核苷酸的片段或来自AAV的不同血清型的相应并置核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸。
任选地,至少一种rep基因包含编码功能性Rep 52和Rep 40蛋白的基因,其中所述基因包含与天然AAV2序列(SEQ ID NO:1)的以下的658-2300的链段的全长或长度为至少1300个、1400个、1500个或1600个核苷酸的片段或来自AAV的不同血清型的相应核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸。
任选地,至少一种rep基因包含编码功能性Rep 68、Rep 52和Rep 40蛋白的核苷酸链段,其中所述链段包含与位于天然AAV2序列(SEQ ID NO:1)的以下的从5'到3':200-1906;2228-2309;658-2300紧邻并置的链段的全长或长度为至少3000个、3200个、3300个或3400个核苷酸的片段或来自AAV的不同血清型的相应并置核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸。
任选地,双质粒系统或辅助质粒不包含对应于包含在SEQ ID NO:1的核苷酸321-2186内或在AAV的不同血清型中的相应核苷酸链段内的相等长度的连续核苷酸链段的至少1700个、至少1800个或1866个核苷酸的连续序列。包含在核苷酸321-2186内的连续核苷酸链段对应于Rep 78。
在一些实施方案中,至少一种rep基因不包含功能性内部p40启动子。天然rep/cap基因包含p40启动子(D.J.Pereira and N.Muzyczka(1997),J.Virol.71:1747-1756)。p40启动子驱动cap基因的表达,但rep基因的表达不需要p40启动子。功能性p40启动子是能够驱动cap基因的表达的启动子。
可以通过测试其驱动蛋白质表达的能力(使用表达测定)来确定给定的p40启动子是否是功能性的。例如,用户可以制备“参考”载体,其包含位于报告蛋白(例如GFP)上游的天然p40启动子(例如SEQ ID NO:1的核苷酸1710-1827的天然p40启动子)。然后,用户可以制备与参考载体相同的“测试”载体,除了天然p40启动子被其功能性待测试的p40启动子(“测试”p40启动子)替换。可以将两种载体转染到合适的宿主细胞中,并在适合报告蛋白表达的条件下孵育宿主细胞。在宿主细胞中表达的报告蛋白的水平可以通过例如荧光光谱法来测量。然后可以将参考载体的表达水平(对应于由天然p40启动子驱动的表达水平)与来自测试载体的表达水平(对应于由测试启动子驱动的表达水平)进行比较。
如果p40启动子驱动的表达水平至少是由天然p40启动子驱动的表达水平的40%,则该p40启动子将被认为是功能性的。任选地,功能性p40启动子以由天然p40启动子驱动的表达的至少60%、至少70%、至少80%、至少90%或至少95%的水平驱动表达。任选地,如果至少一个rep基因不包含对应于p40启动子的序列(例如SEQ ID NO:1的核苷酸1710-1827)的序列,其以由天然p40启动子驱动的表达的至少60%、至少70%、至少80%、至少90%或至少95%的水平驱动表达,则至少一种rep基因不包含功能性内部p40启动子。
缺少“TATA框”的P40启动子是非功能性的。p40启动子包含从对应于SEQ ID NO:1的位置1823的位置处开始的TATA框。因此,不包含功能性内部p40启动子的辅助质粒可包含一个或多个其中TATA框发生突变使的p40启动子成为非功能性的p40启动子。任选地,至少一种rep基因在对应于SEQ ID NO:1的位置1823的位置处不包含T核苷酸。任选地,至少一种rep基因在对应于SEQ ID NO:1的位置1823的位置处包含C核苷酸。任选地,至少一种rep基因在对应于SEQ ID NO:1的位置1826-1828的位置处不包含AAG。任选地,至少一种rep基因在对应于SEQ ID NO:1的位置1826-1828的位置处包含CTC。
缺少cap基因
本发明的辅助质粒不包含编码一组功能性Cap蛋白的cap基因。
在天然AAV(例如具有如SEQ ID NO:1所示的基因组的AAV)中,cap和rep基因是重叠的。具体而言,驱动cap基因表达的p40启动子存在于rep基因中。因此,任何编码Rep蛋白的辅助质粒将包含来自cap基因的核苷酸。然而,本发明的辅助质粒不包含编码一组功能性Cap蛋白的核苷酸链段。具体而言,本发明的辅助质粒可以不包含仅为cap基因序列的大量核苷酸链段。短语“仅为cap基因序列”旨在指编码Cap蛋白的一部分但不编码Rep蛋白的一部分的基因序列,例如SEQ ID NO:1的核苷酸2253-4410。
Cap蛋白(VP1、VP2和VP3;参见图1)是组装形成围绕病毒基因组的衣壳的蛋白质。因此,编码一组功能性Cap蛋白的基因是编码能够组装成用衣壳包裹病毒基因组的Cap蛋白的基因。
一组“功能性”Cap蛋白是足以用于AAV衣壳化的蛋白。确定cap基因的产物是否是功能性的在本领域技术人员的能力范围内。本领域技术人员仅需要使用如上所述的AAV生产测定来确定编码的Cap蛋白是否支持AAV生产。在这种情况下,测试双质粒系统将包含载体质粒,该载体质粒包含编码待确定其“功能性”的蛋白质的cap基因,而在其他方面所使用的测试双质粒系统将与参考双质粒系统相同。如果辅助质粒不包含任何对应于cap基因的遗传物质,或者如果辅助质粒中存在的任何cap基因编码以低于野生型cap基因产物所支持水平的10%的水平支持AAV生产的蛋白质,即如果所生产的rAAV产量低于使用参考双质粒系统所生产的rAAV产量的10%,则辅助质粒不包含编码一组功能性Cap蛋白的cap基因。
一般而言,功能性cap基因的长度大于250个核苷酸。因此,不包含编码一组功能性Cap蛋白的cap基因的辅助质粒可不包含仅为cap基因序列的超过250个核苷酸、超过100个核苷酸或超过60个核苷酸的连续链段。如上所述,天然AAV中的cap基因和rep基因重叠。任选地,辅助质粒不包含仅为cap基因序列的超过60个核苷酸的连续链段。任选地,辅助质粒不包含编码功能性VP1蛋白的cap基因。可选地,辅助质粒包含部分cap基因序列,且该部分cap基因序列不编码一组功能性Cap蛋白。辅助质粒可以包含部分cap基因序列,只要它不编码一组功能性Cap蛋白。只要部分cap基因序列是非功能性的,就需要多个重组事件来提供rcAAV。
至少一种辅助病毒基因
辅助质粒可包含至少一种辅助病毒基因。AAV只能在存在辅助病毒的情况下传播。辅助病毒的实例包括腺病毒和疱疹病毒。
然而,如上所述,在存在辅助病毒的情况下培养AAV并不有利,因为辅助病毒可以溶解细胞,包括用于培养AAV的宿主细胞。此外,如果在例如基因治疗载体的rAAV产品的生产中使用辅助病毒,则辅助病毒可能会污染产品。作为与辅助病毒(例如腺病毒)共感染的替代方法,可以在转染的质粒上提供必要的辅助病毒的基因。对于表达腺病毒E1A/B基因的宿主细胞(例如HEK293T细胞),其余所需的辅助基因是E4、E2A和VA RNA I和II(一种VA核酸)。虽然这些基因分布在腺病毒基因组的长链段中,但本发明人已经确定,可以在不影响基因表达的情况下去除分隔基因组基因的大链段的非编码核苷酸。因此,本发明人设计了最小辅助基因区域,其为SEQ ID NO:4。SEQ ID NO:4含有VA核酸,以及E2A基因和E4基因的反向互补序列(如存在于双链质粒中)。在用于生产rAAV的质粒中使用这样的最小辅助基因区域是有利的,因为它允许用户使用较小的质粒,其生产成本更低且更容易转染到细胞中。
在一些实施方案中,本发明的辅助质粒包含至少一种辅助病毒基因。优选地,本发明的辅助质粒包含足够的辅助基因以允许AAV复制和包装。可以使用如上所述的AAV生产测定来评估辅助质粒是否包含足够的辅助基因以促进AAV生产。在这种情况下,测试双质粒系统将包含辅助质粒,该辅助质粒包含待测试其促进AAV生产能力的辅助基因,并且在其他方面所使用的测试双质粒系统将与参考双质粒系统相同。在一个实施方案中,如果辅助基因产物以编码E4、E2A和VA RNA I和II的腺病毒辅助基因所支持的水平的至少25%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,即如果所生产的rAAV的产量为使用参考双质粒系统所生产的rAAV产量的至少25%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%,则会认为辅助基因产物促进AAV生产。优选地,如果辅助基因产物以编码E4、E2A和VA RNA I和II的腺病毒辅助基因所支持水平的至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,则会认为辅助基因产物促进AAV生产。
由于辅助质粒编码允许有效AAV生产所需的基因,因此不需要添加辅助病毒。
任选地,至少一种辅助病毒基因是腺病毒基因。腺病毒是一种已知有助于AAV传播的病毒(Xiao et al(1998),J.Virol,72:2224-2232)。任选地,至少一种辅助病毒基因是腺病毒5基因或腺病毒2基因。在SEQ ID NO:2中列出了腺病毒5的基因组,在SEQ ID NO:3中列出了腺病毒2的基因组。因此,辅助基因可以包含存在于SEQ ID NO:2或SEQ ID NO:3中的核苷酸链段,或腺病毒的另一血清型中的相应核苷酸链段。
腺病毒的辅助基因编码E1A、E1B、E4、E2A和VA RNA I和II。
E1A由腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸560-1545编码。核苷酸560-1545含有从核苷酸1113到核苷酸1228的内含子。该内含子不是必需的,并因此包含SEQ ID NO:2的核苷酸560-1112和1229-1545的E1A基因将编码功能性E1A蛋白。
E1B实际上是两种蛋白质E1B 19K和E1B 55K,它们共同作用以阻断感染腺病毒的细胞的细胞凋亡。E1B由腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸1714-2244(E1B 19K)和核苷酸2019-3509(E1B 55K)编码。
E4由腺病毒5基因组(例如SEQ ID NO:2的基因组)的许多不同的开放阅读框(ORF)编码。E4 ORF 6/7由核苷酸32914-34077编码,其包含核苷酸33193和33903之间的内含子。该内含子不是必需的,因此包含SEQ ID NO:2的核苷酸32914-33192和33904-34077的E4ORF 6/7就够了。E4 34K由腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸33193-34077编码。E4 ORF 4由腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸33998-34342编码。E4 ORF3由腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸34353-34703编码。E4 ORF B由腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸34700至35092编码。E4ORF 1由腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸35140-35526编码。
功能性E4蛋白可仅包含由ORF 6和7编码的氨基酸,因为只有由ORF 6和7编码的氨基酸是活性需要。因此,任选地,功能性E4蛋白包含由ORF 6和7的全部或很大一部分编码的多肽序列。任选地,功能性E4蛋白不包含由ORF 1-4和34K的全部或部分编码的多肽序列。然而,由ORF 1-3和34K编码的氨基酸确实提高了E4蛋白的活性,并且因此在一些实施方案中,功能性E4蛋白包含由ORF 1-7编码的氨基酸。
E2(E2A)基因由腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸22443-24032编码。
VA RNA I和II由腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸10589-11044编码。
E1B和E4被认为可以增强AAV mRNA的积累,而E2A和VA RNA I和II被认为可以增强AAV mRNA的剪接和翻译。E1B、E4和E2A是由存在于腺病毒基因组中的基因编码的蛋白质,而VA核酸编码两种RNA转录物,称为VA RNA I和VA RNA II。转录物本身在细胞中是功能性的,并且永远不会被翻译成氨基酸序列。因此,应当理解,VA核酸不编码蛋白质,但确实“编码”或“对应于”RNA,即当使用术语“编码”时,VA核酸是非翻译核酸序列。
在五种腺病毒基因中,辅助质粒中可能不包含E1A或E1B,因为一些宿主细胞系(例如HEK293细胞)组成型表达一种或多种E1A或E1B。因此,任选地,辅助质粒不包含编码功能性腺病毒E1A/B蛋白的基因。
在一个实施方案中,至少一种辅助病毒基因包含:
(a)编码功能性VA RNA I和II的VA(病毒相关)核酸;
(b)编码功能性E2A蛋白的E2A基因;和/或
(c)编码功能性E4蛋白的E4基因。
任选地,至少一种辅助病毒基因包含VA核酸、E2A基因和E4基因。
“功能性”VA RNA I和II、E2A蛋白或E4蛋白能够促进AAV的生产。确定给定的VARNA I和II、E2A蛋白或E4蛋白是否是功能性的在本领域技术人员的能力范围内。本领域技术人员仅需要使用如上所述的AAV生产测定来确定VA RNA I和II、E2A蛋白或E4蛋白是否支持AAV生产。在这种情况下,测试双质粒系统将包含辅助质粒,该辅助质粒包含待确定其“功能性”VA RNA I和II、E2A蛋白或E4蛋白,而在其他方面所使用的测试双质粒系统将与参考双质粒系统相同。在一个实施方案中,如果VA RNA I和II、E2A蛋白或E4蛋白以野生型(例如在天然腺病毒5中发现的;SEQ ID NO:2)VA RNA I和II、E2A蛋白或E4蛋白所支持的水平的至少25%、至少40%、至少50%、至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,即如果生产的rAAV的产量是使用参考双质粒系统所生产的rAAV产量的至少25%、至少40%、至少50%、至少70%、至少80%、至少90%或至少95%,则VA RNA I和II、E2A蛋白或E4蛋白被认为是“功能性的”。优选地,如果E4蛋白以野生型E4蛋白所支持的水平的至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,则E4蛋白被认为是“功能性的”。
任选地,E4基因不位于VA核酸和E2A基因之间,即质粒的序列使得E4基因序列不出现在VA核酸序列和E2A基因序列之间的质粒中。任选地,E2A基因位于VA核酸和E4基因之间。
辅助质粒是双链的,并且辅助质粒内包含的任何基因都可以“正向”或“反向”的方向存在。例如,E4基因可包含腺病毒5基因组(例如SEQ ID NO:2的基因组)的核苷酸22443-24032或可包含核苷酸22443-24032的反向互补序列。因此,在参考“包含”特定核酸序列的质粒的本申请的所有实例中,这些参考应该被解释为涵盖其中质粒包含该核酸序列的反向互补序列的实施方案。
本发明人已经证明,去除存在于腺病毒基因组(例如SEQ ID NO:2的基因组)中位置10595-10619处的全部或部分核苷酸链段显著降低(约50%)由VA核酸编码的VA RNA I和II的活性。避免这种活性降低是有利的。
因此,在一个实施方案中,VA核酸具有来自腺病毒5的野生型VA核酸的活性的至少75%、至少80%、至少90%、至少95%或95%至100%的活性水平。任选地,通过测量rAAV产量确定VA核酸的活性水平,例如使用上述AAV生产测定。在一个实施方案中,VA核酸包含与SEQ ID NO:2的核苷酸10595-10619的至少15个核苷酸、至少20个核苷酸或25个核苷酸的链段或腺病毒的不同血清型中的相应核苷酸链段至少95%、至少98%或100%相同的连续序列。
任选地,E2A基因与启动子可操作地连接,该启动子包含与SEQ ID NO:2的核苷酸27037-27136的至少60个、至少70个、至少80个或100个核苷酸的链段或腺病毒的不同血清型中的相应核苷酸链段至少96%、至少98%或100%相同的连续序列。
E4基因的表达由对应于SEQ ID NO:2的核苷酸35585-35848的启动子(本文称为“E4启动子”)驱动。对应于腺病毒5基因组的35793-35848的核苷酸(例如SEQ ID NO:2的基因组),是启动子具有完全活性跃所必需的。因此,任选地,E4基因与具有来自腺病毒5的野生型启动子的活性的至少50%、至少70%或至少90%的E4启动子可操作地连接。E4启动子的活性可以通过测试其驱动蛋白质表达的能力来确定。
可以使用如上所述的AAV生产测定来确定给定的E4启动子是否能够驱动E4基因表达。具体而言,如果E4启动子可以驱动E4基因表达,它将促进AAV生产。在这种情况下,测试双质粒系统将包含载体质粒,该载体质粒包含E4基因和待测试其促进AAV生产能力的E4基因启动子,而在其他方面所使用的测试双质粒系统将与参考双质粒系统相同。在一个实施方案中,如果E4启动子以野生型E4基因启动子支持的水平的至少25%、至少40%、至少50%、至少60%、至少70%或至少90%的水平支持rAAV生产,即如果产生的rAAV的产量是使用参考双质粒系统产生的rAAV的产量的至少50%、至少70%或至少90%,则E4启动子将被认为具有来自腺病毒5的野生型E4启动子的活性的至少25%、至少40%、至少50%、至少70%或至少90%。优选地,如果E4启动子以使用参考质粒系统生产的rAAV的产量的至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,则E4启动子被认为促进AAV生产。
任选地,E4启动子包含对应于SEQ ID NO:2的核苷酸35793-35848的至少30个、至少40个或55个核苷酸的序列,或腺病毒的不同血清型中的相应核苷酸链段。
减小辅助质粒的大小
本发明人已经确定在天然腺病毒5中不同辅助基因序列之间存在大量非辅助基因核酸序列,并且可以去除该核酸序列的大部分而不显著影响由辅助基因序列编码的蛋白质的表达水平和功能。因此,本发明人已经成功地定义了尺寸减小的辅助基因区域,并且可以将其包括在辅助质粒中以减小其尺寸。具有减小尺寸的辅助基因区域是有利的,因为它允许减小辅助质粒的总尺寸。较小的质粒生产成本更低并且更容易引入宿主细胞。
因此,辅助质粒的长度可以小于25000bp、小于20000bp、小于15000bp、小于14500bp、10000bp至25000bp、10000bp至20000bp、12000bp至15000bp或约14021bp。
类似地,至少一种辅助病毒基因包含VA核酸、E2A基因和E4基因,并且VA核酸、E2A基因和E4基因包含在小于15000个、小于12000个、小于10000个、小于9000个或小于8500个核苷酸的辅助质粒上的连续核苷酸链段内。
具有减小尺寸的辅助基因区域的实例在SEQ ID NO:4中列出。辅助基因区域是起始于编码辅助基因的第一个核苷酸并终止于编码辅助基因的最后一个核苷酸的质粒的连续区域。任选地,辅助基因区域包含与SEQ ID NO:4的全长或长度为至少6000个核苷酸、至少7000个核苷酸或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%同一性的序列,即至少一种辅助病毒基因包含在与SEQ ID NO:4的全长或长度为至少6000个核苷酸、至少7000个核苷酸或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%的同一性的质粒的连续链段上。任选地,辅助基因区域由与SEQ ID NO:4的全长或长度为至少6000个核苷酸、至少7000个核苷酸或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%的同一性的序列组成,即至少一种辅助病毒基因包含在由与SEQ ID NO:4的全长或长度为至少6000个核苷酸、至少7000个核苷酸或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%的同一性的序列组成的质粒的连续链段上。
本发明人已经鉴定了可以从辅助质粒中排除的腺病毒5基因组的特定区域。
在一个实施方案中,辅助质粒不包含在SEQ ID NO:2的核苷酸194-3620内所包含的相等长度的连续核苷酸链段的至少2000个、至少2500个、至少3000个或3427个核苷酸的连续序列,或腺病毒的不同血清型中的相应核苷酸链段。在一个实施方案中,辅助质粒不包含在SEQ ID NO:2的核苷酸4032-4100内所包含的相等长度的连续核苷酸链段的至少50个、至少60个或69个核苷酸的连续序列,或腺病毒的不同血清型中的相应核苷酸链段。
在一个实施方案中,辅助质粒不包含在SEQ ID NO:2的核苷酸10619-32755内所包含的相等长度的连续核苷酸链段的至少15000个、至少20000个、至少22000个或22137个核苷酸的连续序列,或腺病毒的不同血清型中的相应核苷酸链段。
在一个实施方案中,辅助质粒不包含在SEQ ID NO:2的核苷酸11045-32755内所包含的相等长度的连续核苷酸链段的至少15000个、至少20000个、至少21000个或21711个核苷酸的连续序列,或腺病毒的不同血清型中的相应核苷酸链段。
类似地,本发明人已经鉴定了不需要包括在辅助质粒中的AAV2基因组区域并且可以因此为了最小化辅助质粒的大小而将其排除。因此,在一个实施方案中,辅助质粒不包含在SEQ ID NO:1的核苷酸4051-4413内所包含的相等长度的连续核苷酸链段的至少200个、至少300个、至少350个或363个核苷酸的连续序列,或AAV的不同血清型中的相应核苷酸链段。类似地,在一个实施方案中,辅助质粒不包含在SEQ ID NO:1的核苷酸2301-2947内所包含的相等长度的连续核苷酸链段的至少400个、至少500个、至少600个或647个核苷酸的连续序列,或AAV的不同血清型中的相应核苷酸链段。
人工rep结合位点
Rep蛋白与rep结合位点(RBS)结合,该位点是具有GCTCGCTCGCTCGCTC(SEQ ID NO:6)共有序列的核酸序列(McCarty,D.M.et al.(1994),J.Virol.,68(8):4988–4997))。因此,rep结合位点是与GCTCGCTCGCTCGCTC(SEQ ID NO:6)具有同源性的核酸序列。确定核酸序列(测试核酸序列)是否包含rep结合位点,例如确定核酸序列是否包含与GCTCGCTCGCTCGCTC(SEQ ID NO:6)具有同源性的序列,可以使用电泳迁移率变动分析(EMSA)进行。该测试核酸序列被施加到适用于电泳的凝胶的第一孔,并且该测试核酸序列和Rep68/Rep78蛋白的混合物被施加到凝胶的第二孔。如果该测试核酸序列包含rep结合位点,这将导致包含Rep68/Rep78蛋白的孔中核酸序列的迁移率与缺少Rep68/Rep78蛋白的孔相比发生变化。
Rep蛋白与异常RBS的结合可导致包含RBS的不同序列之间由Rep介导的非同源重组,从而产生不希望的融合序列。例如,Rep蛋白可以结合AAV ITR中的RBS和细菌质粒主链上存在的任何RBS,从而导致质粒主链序列与ITR融合。这可能导致这种不希望的融合序列的复制和包装增强。
因此,优选地,本发明的质粒中存在的仅有的RBS对应于野生型AAV中存在的RBS(允许Rep蛋白执行其正常功能)。然而,当构建质粒时,可能会存在RBS,无论是在质粒主链中还是在质粒的非AAV衍生序列中的其他地方,并且此类序列被认为是“人工”或“异常”RBS,并且应该避免/去除。
质粒中人工RBS的常见来源是来自质粒主链。质粒主链是在细菌宿主细胞中扩增质粒所需的细菌序列。质粒主链可以是不是衍生自腺病毒或AAV或不位于两个AAV衍生的ITR之间的质粒区域。任选地,载体质粒主链涵盖除了cap基因、与cap基因可操作地连接的启动子(区域)、ITR和表达盒之外的任何核苷酸。任选地,辅助质粒主链涵盖除了至少一种辅助基因和相关的腺病毒衍生调控元件、至少一种rep基因和相关的AAV衍生调控元件以及一种或多种可操作地连接到至少一种rep基因的启动子之外的任何核苷酸。在一个实施方案中,辅助质粒和/或载体质粒包含主链,并且质粒主链不包含人工RBS。任选地,辅助质粒和载体质粒各自包含主链,并且任一质粒主链均不包含人工RBS。
因此,在一个实施方案中,辅助质粒和/或载体质粒不包含人工RBS。优选地,辅助质粒和载体质粒不包含人工RBS。任选地,除了在任何ITR、p5启动子和p19启动子内,载体质粒和/或辅助质粒中没有RBS。
Cap基因
载体质粒可包含cap基因。cap基因编码功能性Cap蛋白。cap基因可编码一组功能性的Cap蛋白。AAV通常包含三种Cap蛋白,VP1、VP2和VP3。这三种蛋白质形成衣壳,AAV基因组插入其中,并允许AAV基因组转移到宿主细胞中。所有VP1、VP2和VP3在天然AAV中都由单个基因(cap基因)编码。VP1的氨基酸序列包含VP2的序列。不构成VP2的部分的VP1部分被称为VP1独有或VP1U。VP2的氨基酸序列包含VP3的序列。不构成VP3的部分的VP2部分称为VP2独有或VP2U。
一组“功能性”Cap蛋白是一种允许AAV衣壳化的蛋白。如上所述,确定给定的Cap蛋白或一组Cap蛋白是否是功能性的在本领域技术人员的能力范围内。本领域技术人员仅需要使用如上所述的AAV生产测定来确定编码的Cap蛋白是否支持AAV生产。在这种情况下,测试双质粒系统将包含载体质粒,该载体质粒包含编码待确定其“功能性”的蛋白质的cap基因,而在其他方面所使用的测试双质粒系统将与参考双质粒系统相同。如果Cap蛋白以野生型cap基因产物所支持的水平的至少25%、至少40%、至少50%、至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,即如果生产的rAAV的产量为使用参考双质粒系统生产的rAAV的产量的至少25%、至少40%、至少50%、至少70%、至少80%、至少90%或至少95%,则Cap蛋白被认为是“功能性”的。优选地,如果Cap蛋白以野生型cap基因产物所支持的水平的至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,则Cap蛋白被认为是“功能性”的。
任选地,如果包含VP2和/或VP3蛋白的AAV能够以包含野生型VP2和/或VP3蛋白的等效AAV的水平的至少25%、至少40%、至少50%、至少70%、至少80%、至少90%或至少95%的水平转导Huh7细胞,则VP2和/或VP3蛋白是“功能性”的。可以通过向AAV颗粒添加例如绿色荧光蛋白(GFP)的报告蛋白、将AAV颗粒与Huh7细胞混合并测量产生的荧光来测试AAV颗粒转导Huh7细胞的能力。
任选地,载体质粒包含编码VP1、VP2和/或VP3蛋白的cap基因。任选地,从超过一种cap基因表达VP1、VP2和VP3蛋白。任选地,载体质粒包含编码VP1、VP2和VP3蛋白的cap基因。任选地,载体质粒包含编码功能性VP1的cap基因,即能够与其他Cap蛋白组装成用衣壳包裹病毒基因组的VP1蛋白。
AAV的不同血清型具有拥有不同氨基酸序列的Cap蛋白。编码任何(一组)Cap蛋白的cap基因适用于本发明。Cap蛋白可以是在某一血清型的AAV中表达的天然Cap蛋白。或者,Cap蛋白可以是非天然的,例如工程改造的Cap蛋白,其被设计为包含不同于天然AAV Cap蛋白的序列的序列。编码非天然Cap蛋白的基因是特别有利的,因为在基因治疗应用的情况下,相对于天然衣壳,具有阻止包含非天然Cap蛋白的AAV转导的抗体水平的潜在患者可能更少。
任选地,cap基因编码来自选自血清型1、2、3A、3B、4、5、6、7、8、9、10、11、12或13的血清型的Cap蛋白。任选地,cap基因编码来自选自血清型2、5、8和9的血清型的Cap蛋白。任选地,cap基因编码选自LK03、rh74、rh10和Mut C的Cap蛋白(WO2016/181123;WO 2013/029030;WO 2017/096164)。任选地,cap基因编码选自AAV血清型组的Cap蛋白,该组由血清型2、5、8或9和Mut C(来自WO 2016/181123的SEQ ID NO:3)组成。任选地,cap基因编码Cap蛋白Mut C(来自WO 2016/181123的SEQ ID NO:3)。
Cap基因启动子
任选地,载体质粒包含cap基因启动子。cap基因启动子可以与cap基因可操作地连接。或者,载体质粒可不包含cap基因,但可包含与cap基因启动子可操作地连接(即紧密并置:5'-[cap基因启动子]-[克隆位点]-3')的克隆位点。克隆位点可以是多克隆位点(MCS或多接头;参见例如图4C-E)。用户可能希望选择为具体应用添加特定的cap基因。例如,如果将载体质粒用于生产用于基因治疗的AAV,用户可能希望载体质粒缺少cap基因,但包含克隆位点以允许将具体cap基因克隆进来用于具体应用。载体质粒可与任何转基因(在表达盒中)结合使用,并且用户可能会发现对于某些转基因,将此类盒衣壳化入具有肝嗜性等特性的衣壳中是有利的,而对于其他转基因,衣壳具有不同的嗜性则是有利的。通过设计包含与克隆位点相连的cap基因启动子的载体质粒,用户可以很容易地为具体应用(例如使用具体转基因)“插入”合适的cap基因。
任选地,载体质粒包含至少一种cap基因启动子,其是天然cap基因启动子。
天然cap基因(即野生型AAV的cap基因)与p40启动子、p5启动子和p19启动子可操作地连接。任选地,至少一种cap基因启动子包含AAV p40启动子、p5启动子和/或p19启动子。任选地,至少一种cap基因启动子包含AAV p40启动子、p5启动子和p19启动子。但是,可以使用能够驱动cap基因表达的任何合适的启动子。
可以使用如上所述的AAV生产测定来确定给定的cap基因启动子是否能够驱动cap基因表达。具体而言,如果该cap基因启动子可以驱动cap基因表达,它将促进AAV生产。在这种情况下,测试双质粒系统将包含载体质粒,该载体质粒包含cap基因和待测试其能力的cap基因启动子,而在其他方面所使用的测试双质粒系统将与参考双质粒系统相同。在一个实施方案中,如果cap基因启动子以野生型p40 cap基因启动子所支持的水平的至少25%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,即如果产生的rAAV载体的产量是使用参考双质粒系统产生的rAAV的产量的至少25%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%,则该cap基因启动子被认为促进AAV生产。优选地,如果cap基因启动子以使用参考质粒系统生产的rAAV的产量的至少70%、至少80%、至少90%或至少95%的水平支持rAAV生产,则该cap基因启动子被认为促进AAV生产。
p40启动子被理解为驱动cap基因的表达。天然p40启动子包含在天然rep基因中。AAV2 p40启动子具有SEQ ID NO:1的核苷酸1710-1827的序列。但是,AAV的其他血清型中的p40启动子可包含略微不同的序列。在一些实施方案中,p40启动子具有与SEQ ID NO:1的核苷酸1710-1827或来自AAV的另一血清型的相应序列至少95%、至少98%或99%相同的序列。在一些实施方案中,p40启动子具有与SEQ ID NO:1的核苷酸1710-1827至少98%相同的序列。
本发明人已经发现,包含p40启动子、p5启动子和p19启动子的至少一种cap基因启动子是有利的,因为p5启动子和p19启动子在调节p40启动子中起作用,并且p40启动子、p5启动子和p19启动子的存在导致cap基因的及时调控表达,从而产生高产量/高质量的rAAV。因此,在一些实施方案中,至少一种cap基因启动子包含在包含p40启动子、p5启动子和p19启动子的“启动子区域”中。任选地,启动子区域包含与位于天然AAV2序列(SEQ ID NO:1)的以下的从5'到3':200-354;600-1049;1701-2202紧邻并置的链段的全长或长度为至少800、至少900、至少1000或至少1100个核苷酸的片段或来自AAV的不同血清型的相应并置核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的序列。
天然p5启动子位于天然rep基因的上游。AAV2 p5启动子具有SEQ ID NO:1的核苷酸204-292的序列。然而,AAV的其他血清型中的p5启动子可包含略微不同的序列。在一些实施方案中,p5启动子具有与SEQ ID NO:1的核苷酸204-292或来自AAV的另一血清型的相应序列至少95%、至少98%或至少99%相同的序列。在一些实施方案中,p5启动子具有与SEQID NO:1的核苷酸204-292至少98%相同的序列。
p19启动子包含在天然rep基因中。AAV2 p19启动子具有SEQ ID NO:1的核苷酸730-890的序列。然而,AAV的其他血清型中的p19启动子可包含略微不同的序列。在一些实施方案中,p19启动子具有与SEQ ID NO:1的核苷酸730-890或来自AAV的另一血清型的相应序列至少95%、至少98%或至少99%相同的序列。在一些实施方案中,p19启动子具有与SEQID NO:1的核苷酸730-890至少98%相同的序列。
在至少一侧上侧接ITR的表达盒
本发明的载体质粒或双质粒系统可用于生产用于基因治疗的AAV载体。“基因治疗”涉及施用本发明的AAV/病毒颗粒,其能够在其施用的宿主中表达转基因(例如编码因子IX的核苷酸序列)。在这种情况下,载体质粒将包含表达盒。
任选地,载体质粒包含至少一个ITR。因此,任选地,载体质粒包含至少一个ITR,但更典型地包含两个ITR(通常在表达盒的任一端都有一个,即一个在5'端,一个在3'端)。在表达盒和一个或多个ITR之间可能存在插入序列。表达盒可以掺入位于两个常规ITR之间或位于带有两个D区域的ITR任一侧上的病毒颗粒中。任选地,载体质粒包含衍生自AAV1、AAV2、AAV4和/或AAV6的ITR序列。优选地,ITR序列是AAV2 ITR序列。
任选地,载体质粒包含表达盒。如本文所述,表达盒是指包含转基因和与转基因可操作地连接的启动子的核酸序列。任选地,该盒进一步包含另外的转录调控元件,例如增强子、内含子、非翻译区、转录终止子等。
任选地,表达盒包含转录调控元件,该转录调控元件包含来自HLP2、HLP1、LP1、HCR-hAAT、ApoE-hAAT和/或LSP的启动子元件和/或增强子元件。这些转录调控元件在以下参考文献中有更详细的描述:HLP2:WO16/075473;HLP1:McIntosh J.et al.,Blood2013Apr 25,121(17):3335-44;LP1:Nathwani et al.,Blood.2006April 1,107(7):2653–2661;HCR-hAAT:Miao et al.,Mol Ther.2000;1:522-532;ApoE-hAAT:Okuyama et al.,Human Gene Therapy,7,637-645(1996);和LSP:Wang et al.,Proc Natl Acad Sci U SA.1999March 30,96(7):3906–3910。这些转录调控元件中的每一个都包含启动子、增强子和任选的其他核苷酸。如果多核苷酸旨在在肝脏中表达,则启动子可以是肝脏特异性启动子。任选地,启动子是人肝脏特异性启动子。
转基因可以是任何合适的基因。如果载体质粒用于基因治疗,则转基因可以是包含或编码可用于治疗疾病的蛋白质或核苷酸序列的任何基因。例如,转基因可以编码酶、代谢蛋白、信号传导蛋白、抗体、抗体片段、抗体样蛋白、抗原或非翻译的RNA,例如miRNA、siRNA、snRNA或反义RNA。
任选地,转基因编码选自因子IX、α-半乳糖苷酶A、β-葡糖脑苷脂酶和因子VIII的蛋白质。
因子IX是丝氨酸蛋白酶,其构成凝血级联反应的一部分。因子IX蛋白可以是野生型因子IX蛋白。因子IX蛋白可以是野生型因子IX蛋白的片段。因子IX蛋白可以是野生型因子IX蛋白的变体。与野生型因子IX蛋白相比,因子IX蛋白或其片段可以包含一个或多个取代、缺失和/或添加。因子IX蛋白可以与野生型因子IX蛋白至少90%相同。优选地,因子IX蛋白或其片段是功能性的。任选地,因子IX蛋白或其片段是超功能性的。功能性因子IX蛋白或其片段是在因子X中进行精氨酸-异亮氨酸键水解以形成因子Xa的蛋白或其片段。
因子VIII蛋白可以是野生型因子VIII蛋白。因子VIII蛋白可以是野生型因子VIII蛋白的片段。因子VIII蛋白可以是野生型因子VIII蛋白的变体。与野生型因子VIII蛋白相比,因子VIII蛋白或其片段可以包含一个或多个取代、缺失和/或添加。因子VIII蛋白可包含缺失,例如β结构域缺失。因子VIII蛋白可以与野生型因子VIII蛋白至少90%相同。因子VIII蛋白可以与包含缺失例如β结构域缺失的野生型因子VIII蛋白至少90%相同。优选地,因子VIII蛋白或其片段是功能性的。任选地,因子VIII蛋白或其片段是超功能性的。功能性因子VIII蛋白或其片段是一种当被凝血酶激活时可与因子IXa、磷脂和钙形成酶复合物,并且该酶复合物可催化因子X转化为因子Xa的蛋白或其片段。
α-半乳糖苷酶A蛋白可以是野生型α-半乳糖苷酶A蛋白。α-半乳糖苷酶A蛋白可以是野生型α-半乳糖苷酶A蛋白的片段。α-半乳糖苷酶A蛋白可以是野生型α-半乳糖苷酶A蛋白的变体。与野生型α-半乳糖苷酶A蛋白相比,α-半乳糖苷酶A蛋白或其片段可以包含一个或多个取代、缺失和/或添加。α-半乳糖苷酶A蛋白可以与野生型α-半乳糖苷酶A蛋白至少90%相同。优选地,α-半乳糖苷酶A蛋白或其片段是功能性的。任选地,α-半乳糖苷酶A蛋白或其片段是超功能性的。功能性α-半乳糖苷酶A蛋白质或其片段是从糖脂和糖蛋白水解末端α-半乳糖基部分的蛋白或其片段。
β-葡萄糖脑苷脂酶蛋白可以是野生型β-葡萄糖脑苷脂酶蛋白。β-葡糖脑苷脂酶蛋白可以是野生型β-葡糖脑苷脂酶蛋白的片段。β-葡糖脑苷脂酶蛋白可以是野生型β-葡糖脑苷脂酶蛋白的变体。与野生型β-葡糖脑苷脂酶蛋白相比,β-葡糖脑苷脂酶蛋白或其片段可以包含一个或多个取代、缺失和/或添加。β-葡糖脑苷脂酶蛋白可以与野生型β-葡糖脑苷脂酶蛋白至少90%相同。优选地,β-葡糖脑苷脂酶蛋白或其片段是功能性的。任选地,β-葡糖脑苷脂酶蛋白或其片段是超功能性的。功能性β-葡糖脑苷脂酶蛋白或其片段是从糖脂和糖蛋白水解末端α-半乳糖基部分的蛋白或其片段。功能性β-葡糖脑苷脂酶蛋白或片段是进行葡糖脑苷脂水解的蛋白或其片段。
任选地,载体质粒包含cap基因并且进一步包含在至少一侧上侧接ITR的表达盒。
非必要的(dispensable)翻译起始密码子
任选地,载体质粒不包含任何非必要的翻译起始密码子。任选地,载体质粒可以包含至少两种必须能够被转录和翻译的基因(转基因(在表达盒中)和cap基因)。任选地,转基因编码不编码翻译蛋白或多肽的功能性RNA。转基因(如果编码蛋白质)和cap基因将包含起始(ATG或GTG)密码子以促进基因翻译的起始。然而,载体质粒可能包含另外的ATG或GTG实例(与这些基因的阅读框同框或不同框),并且可能在这些位置之一起始翻译。由于不需要在这些另外的ATG或GTG实例的位点起始翻译,因此可以将ATG或GTG密码子视为“非必要的翻译起始密码子”。优选去除非必要的翻译起始密码子或使其成为非功能性的,特别是当它们出现在启动子区域时。启动子区域是包含一个或多个与cap基因可操作连接的启动子的载体质粒区域。在一些实施方案中,cap基因与p5、p19和p40启动子中的一个或多个可操作地连接,并且在这样的实施方案中,启动子区域包含p5、p19和p40启动子。
任选地,该质粒含有包含一个或多个启动子的启动子区域,并且该启动子区域不包含ATG或GTG密码子。任选地,启动子区域包含p5、p19和/或p40启动子,并且其中ATG或GTG密码子位于对应于SEQ ID NO:1的位置(a)321-323(Rep78/68ATG起始密码子)、(b)766-768(ATG密码子)、(c)955-957(ATG密码子)、(d)993-995(Rep52/40ATG起始密码子)和(e)1014-1016(GTG密码子)的一个或多个位置处的ATG或GTC密码子不存在或发生突变。
任选地,在启动子区域中:
(a)不存在对应于SEQ ID NO:1的核苷酸321-323的核苷酸;
(b)对应于SEQ ID NO:1的核苷酸766-768的核苷酸不是ATG并且任选地是ATT;
(c)不存在对应于SEQ ID NO:1的核苷酸955-957的核苷酸;
(d)不存在对应于SEQ ID NO:1的核苷酸993-995的核苷酸;和/或
(e)不存在对应于SEQ ID NO:1的核苷酸1014-1016的核苷酸。
任选地,在启动子区域中:
(a)不存在对应于SEQ ID NO:1的核苷酸321-323的核苷酸;
(b)对应于SEQ ID NO:1的核苷酸766-768的核苷酸不是ATG并且任选地是ATT;
(c)不存在对应于SEQ ID NO:1的核苷酸955-957的核苷酸;
(d)不存在对应于SEQ ID NO:1的核苷酸993-995的核苷酸;和
(e)不存在对应于SEQ ID NO:1的核苷酸1014-1016的核苷酸。
载体质粒的大小
如上文关于辅助质粒所讨论的,用于生产rAAV的质粒尽可能小是有利的。较小的质粒生产起来更具成本效益,并且更容易转染到细胞中。
载体质粒的大小将部分由包含的启动子、转录调控元件、转基因和cap基因的大小定义,并且如上所述,这些特征的性质将部分或完全由待使用rAAV的应用定义。
然而,可以通过确保所用主链的大小和/或通过确保载体质粒不包含间隔子(长度超过200个核苷酸的非编码核酸序列的连续区域)来减小载体质粒的大小。
任选地,载体质粒包含长度小于4000个核苷酸、小于3500个核苷酸、小于3000个核苷酸或小于2500个核苷酸的主链。任选地,载体质粒不包含任何间隔子。
宿主细胞
本发明提供了包含本发明的双质粒系统、辅助质粒或载体质粒的宿主细胞。
宿主细胞优选是可用于生产rAAV的宿主细胞。宿主细胞因此可以是适合生产rAAV的宿主细胞。此外,宿主细胞可用于生产rAAV。
通常,适合生产rAAV的宿主细胞是衍生自真核细胞系,优选脊椎动物细胞系,优选哺乳动物细胞系,优选人细胞系的宿主细胞。任选地,宿主细胞是选自以下的细胞:HEK293T细胞、HEK293细胞、HEK293EBNA细胞、CAP细胞、CAP-T细胞、AGE1.CR细胞、PerC6细胞、C139细胞、EB66细胞、BHK细胞、COS细胞、Vero细胞、Hela细胞和A549细胞。优选地,宿主细胞选自HEK293T细胞、HEK293细胞、HEK293EBNA细胞、CAP细胞、CAP-T细胞、AGE1.CR细胞、PerC6细胞、C139细胞和EB66细胞。甚至更优选地,宿主细胞选自HEK293T细胞、HEK293细胞和HEK293EBNA细胞。例如,宿主细胞可以是HEK293T细胞。任选地,宿主细胞是表达功能性腺病毒E1A/B蛋白的细胞。例如,宿主细胞可含有包含编码功能性腺病毒E1A/B蛋白的基因的染色体。在标题为“至少一种辅助病毒基因”的部分中讨论了功能性腺病毒E1A/B蛋白。
确定宿主细胞是否适合生产rAAV在本领域技术人员的能力范围内。本领域技术人员仅需要使用如上所述的AAV生产测定来确定宿主细胞是否支持AAV生产。在这种情况下,使用的测试双质粒系统和参考双质粒系统将是相同的。但是,测试双质粒系统将转染到待测试重组AAV生产适用性的宿主细胞中,而参考双质粒系统将转染HEK293T细胞。如果宿主细胞以HEK293T细胞支持水平的至少为30%、至少40%、至少50%、至少70%、至少80%、至少90%或至少95%的水平支持AAV生产,即如果产生的重组AAV的产量为在HEK293T细胞中生产的重组AAV产量的至少30%、至少40%、至少50%、至少70%、至少80%、至少90%或至少95%,则宿主细胞被认为适用于重组AAV生产。
低水平的具有复制能力的AAV(rcAAV)
本发明提供了本发明的双质粒系统、辅助质粒或载体质粒用于生产具有低水平的具有复制能力的AAV(rcAAV)的rAAV制剂的用途。
本发明还提供了本发明的双质粒系统、辅助质粒或载体质粒用于降低或最小化rAAV生产过程中生产的rcAAV水平的用途。
本发明还提供了本发明的双质粒系统、辅助质粒或载体质粒用于降低或最小化rAAV生产过程中生产的假野生型rcAAV的水平的用途。
本发明还提供了生产rAAV制剂的方法,包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞
其中rAAV制剂包含低水平的具有复制能力的AAV(rcAAV)。
该方法还可包括收获rAAV以提供包含低水平rcAAV的rAAV制剂的步骤。
本发明还涵盖用于降低或最小化在重组AAV(rAAV)生产过程中产生的具有复制能力的AAV(rcAAV)的水平的方法,包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞。
该方法还可包括收获rAAV以提供rAAV制剂的步骤,任选地具有低水平的rcAAV。
本发明还包括降低或最小化重组AAV(rAAV)生产过程中产生的假野生型具有复制能力的AAV(rcAAV)水平的方法,包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞。
该方法还可包括收获rAAV以提供rAAV制剂的步骤,任选地具有低水平的假野生型rcAAV。
“RAAV”或“重组AAV”是指AAV颗粒,即包含AAV基因组(例如载体基因组)和AAV衣壳的颗粒。
出于本发明的目的,术语“rcAAV”或“具有复制能力的AAV”旨在指含有包含rep基因的基因组或包含cap基因的基因组的rAAV颗粒。同时,出于本发明的目的,术语“rcAAV”旨在指含有包含rep基因或cap基因的基因组的rAAV颗粒,应理解的是,含有包含rep基因的基因组的rAAV颗粒但不是cap基因(本文中称为“cap缺陷型rcAAV”)或包含cap基因但不包含rep基因的基因组(本文中称为“rep缺陷型rcAAV”)在隔开时不具有复制能力。相反,为了复制(存在必要的辅助病毒功能,但不需要反式提供的AAV功能),AAV颗粒必须包含rep基因和cap基因(所谓的“假野生型rcAAV”)。然而,包含rep基因但不包含cap基因的AAV颗粒在宿主细胞中与包含cap基因的AAV颗粒共感染时可以复制,而包含cap基因但不包含rep基因的AAV颗粒在宿主细胞中与包含rep基因的AAV颗粒共感染时可以复制。因此,术语“rcAAV”涵盖“cap缺陷型rcAAV”,但也涵盖“假野生型rcAAV”和“rep缺陷型rcAAV”。假野生型rcAAV可能(在辅助病毒功能存在的情况下)能够在宿主细胞中复制而不会被另一种AAV颗粒共感染,并产生子代病毒。假野生型rcAAV可包含侧接ITR序列的rep基因和cap基因。
术语“rep-rcAAV”涵盖“假野生型rcAAV”和“cap缺陷型rcAAV”。术语“cap-rcAAV”涵盖“假野生型rcAAV”和“rep缺陷型rcAAV”。
所有种类的rcAAV在rAAV制剂中都是不受欢迎的。当与含有cap的AAV颗粒共感染时,Cap缺陷型rcAAV可以复制。当与含有rep的AAV颗粒共感染时,Rep缺陷型rcAAV可以复制,而假野生型rcAAV在没有AAV共感染的情况下可以复制。如果rcAAV复制,它可能会导致显著的副作用。因此,降低或最小化产生的rcAAV水平是有利的。如本文所用,术语“降低rcAAV的水平”是指减少产生的rcAAV的数量。如本文所用,术语“最小化rcAAV的水平”是指在给定方法的限制的情况下将rcAAV的水平降低到可能的最低水平。
使用本发明的方法,包装的rAAV基因组不应包含rep基因或cap基因,因为一般而言,无论是rep基因还是cap基因均不连接(在同一质粒上,非常接近)ITR。然而,单个重组事件可能会导致产生cap缺陷型或rep缺陷型rcAAV。要产生假野生型rcAAV,必须发生两个重组事件,这是极不可能的。
可以使用qPCR来确定rAAV颗粒是否含有包含rep基因的基因组,或rAAV颗粒的制剂是否包含含有包含rep基因的基因组的颗粒。任选地,通过确定产生的rep的拷贝数来测量rcAAV的量。任选地,通过使用qPCR确定每个细胞(即宿主细胞)的rep拷贝数来测量rcAAV的量。
qPCR中应使用特异性针对rep基因的一个引物(或两个引物)。任选地,所述(或两个)引物特异性针对(反向和互补或相同,取决于引物是正向引物还是反向引物)在SEQ IDNO:1的核苷酸321-2252中的至少12个、至少14个、至少16个或至少18个核苷酸的区域,其编码四种Rep蛋白。任选地,引物特异性针对rep 40。任选地,引物特异性针对rep 52。任选地,引物特异性针对rep 68。
要使用qPCR确定每个细胞的rep拷贝数,应在qPCR中使用第二对引物,该引物特异性针对宿主细胞中的内源性基因(例如内源性管家基因),例如HEK293细胞中的人白蛋白。任选地,每个引物或引物对特异性针对(与其互补)人白蛋白基因组序列的至少8个、至少10个、至少12个或至少15个核苷酸的区域。然后可以将每个细胞的拷贝数确定为rep的拷贝数与内源基因的拷贝数的比率。
或者,上述检测/测量rcAAV(假野生型和/或cap缺陷型rcAAV)的方法可以通过cap基因特异性qPCR进行,该qPCR可用于检测rep缺陷型rcAAV。
该方法或用途可提供rAAV制剂。在此类实施方案中,rAAV制剂优选包含低水平的rcAAV。低水平的rcAAV通常是低于107个rAAV中1个rcAAV的rcAAV水平,或者低于使用除了载体质粒包含至少一种rep基因和至少一种cap基因之外与本发明方法的效果等效的方法生产的rAAV制剂中的水平。可以通过使用qPCR来确定载体基因组的数量来确定rAAV的水平,如下面标题为“高产量”的部分所述。
任选地,rcAAV的水平低于107个重组AAV中1个rcAAV、低于109个重组AAV中1个rcAAV或低于1010个重组AAV中1个rcAAV。任选地,rcAAV的水平低于使用除了载体质粒包含至少一种rep基因和至少一种cap基因之外与本发明方法等效的方法生产的rcAAV的水平。任选地,如上述所述使用qPCR测量rcAAV的水平。任选地,在两代或三代培养之后使用qPCR测量rcAAV的水平。任选地,rcAAV是假野生型rcAAV。任选地,rcAAV是cap缺陷型rcAAV。任选地,rcAAV是rep缺陷型rcAAV。任选地,rcAAV包含假野生型rcAAV、cap缺陷型rcAAV和rep缺陷型rcAAV。
短语“与本发明方法的效果等效的方法”旨在指除了载体质粒包含至少一种rep基因和至少一种cap基因之外相同的方法。
任选地,低水平的rcAAV包括低水平的rep-rcAAV。当rcAAV“包含低水平的rep-rcAAV”时,制剂中存在的rcAAV最多只有一小部分rep-rcAAV。因此,本文所用的短语“低水平的rcAAV包括低水平的rep-rcAAV”是指制剂中存在的低水平的rcAAV至多具有小比例的rep-rcAAV。任选地,与使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统生产的rep-rcAAV的水平相比,低水平的rcAAV包含较低水平的rep-rcAAV。
含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统在本文中也称为“用于比较的双质粒系统”。用于比较的双质粒系统可以是传统的“非拆分”配置。(用于比较的双质粒系统的)包含至少一种rep基因和至少一种cap基因的质粒可以包含所有四种rep基因(例如AAV2 rep盒)。(用于比较的双质粒系统的)包含至少一种rep基因和至少一种cap基因的质粒可以包含与本发明的双质粒系统相同的cap基因序列。(用于比较的双质粒系统的)包含至少一种rep基因和至少一种cap基因的质粒可以包含与本发明的双质粒系统相同的rep基因序列。用于比较的双质粒系统可以含有包含与本发明的双质粒系统相同的AdV(腺病毒)辅助和载体基因组序列(例如表达盒)的质粒。例如,用于比较的双质粒系统可以含有包含与本发明的双质粒系统相同的AdV辅助和载体基因组序列(例如表达盒)的质粒,并且(用于比较的双质粒系统的)包含至少一个rep基因和至少一个cap基因的质粒包含与本发明的双质粒系统相同的cap基因序列和相同的rep基因序列。作为进一步的实例,用于比较的双质粒系统可以含有包含与本发明的双质粒系统相同的AdV辅助和载体基因组序列(例如表达盒)的质粒,并且(用于比较的双质粒系统的)包含至少一个rep基因和至少一个cap基因的质粒包含与本发明的双质粒系统相同的cap基因序列和包含所有四种rep基因的AAV(例如AAV2)rep盒。任选地,用于比较的双质粒系统的质粒以1.8:1的摩尔质粒比(AdV辅助载体基因组质粒:rep-cap质粒)进行转染。
任选地,低水平的rcAAV包括至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的rep-rcAAV或cap-rcAAV。任选地,低水平的rcAAV包含至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的cap-rcAAV,即rcAAV可以包含比rep序列多至少5倍、至少10倍、至少25倍、至少30倍或至少35倍的cap序列。任选地,低水平的rcAAV包括至少5倍至至少100倍或至少25倍至至少50倍的cap-rcAAV,即低水平的rcAAV可以包含比rep序列多至少5倍至至少100倍或至少25倍至至少50倍的cap序列。当cap-rcAAV的水平过量时,则rep-rcAAV的水平必须更低。较低水平的rep-rcAAV表示较低水平的假野生型rcAAV(因为假野生型rcAAV包含rep基因)。
任选地,低水平的rcAAV包含至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的rep-rcAAV,即rcAAV可以包含比cap序列多至少5倍、至少10倍、至少25倍、至少30倍或至少35倍的rep序列。任选地,低水平的rcAAV包括至少5倍至至少100倍或至少25倍至至少50倍的rep-rcAAV,即低水平的rcAAV可以包含比cap序列多至少5倍至至少100倍或至少25倍至至少50倍的rep序列。如果rep-rcAAV的水平过量,则cap-rcAAV的水平必须更低。较低水平的cap-rcAAV表明较低水平的假野生型rcAAV(因为假野生型rcAAV包含cap基因)。
如果包含rep或cap基因的质粒还包含至少一个ITR序列,则rep或cap基因是否被包装到AAV颗粒中的可能性增加。例如,如果一个质粒包含rep基因并且不包含至少一个ITR序列,而另一个质粒包含cap基因和至少一个ITR序列,则可能比rep基因包装更多的cap基因。作为进一步的实例,如果一个质粒包含cap基因并且不包含至少一个ITR序列,而另一个质粒包含rep基因和至少一个ITR序列,那么可能比cap基因包装更多的rep基因。
任选地,低水平的rcAAV包含小于1/5rep-rcAAV、小于1/10rep-rcAAV、小于1/25rep-rcAAV、小于1/30rep-rcAAV或小于1/35rep-rcAAV的比例。例如,如果rcAAV的比例小于1/5rep-rcAAV,则至少4/5的rcAAV必须是cap-rcAAV。
任选地,低水平的rcAAV包含的rep-rcAAV的比例小于使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统产生的比例。可选地,rep-rcAAV的比例小于90%、小于75%、小于60%、小于50%、小于25%、小于20%、小于17%或小于15%的使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统产生的比例。含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统在本文中也称为用于比较的双质粒系统。
任选地,低水平的rcAAV包括低水平的假野生型rcAAV。任选地,低水平的rcAAV包括小于1/5的假野生型rcAAV、小于1/10的假野生型rcAAV、小于1/25的假野生型rcAAV、小于1/30的假野生型rcAAV或小于1/35的假野生型rcAAV。
在生产的rcAAV中,在rep和cap序列的数量不相等的情况下,rep和cap序列的数量之间的较低数量是在同一DNA分子上含有rep和cap基因的AAV种类的最大可能数量的指标。因此,rep和cap序列数量之间的较低数量是假野生型rcAAV的最大可能数量的指标。因此,在rep-rcAAV或cap-rcAAV过量的情况下,假型rcAAV的数量可能低于rep-rcAAV和cap-rcAAV的水平相等的情况下的数量。rep和cap序列的数量之间的较低数量作为rep和cap序列数量之间的较高数量的比例是假野生型rcAAV的rcAAV比例的指标。例如,如果cap序列比rep序列多40倍,那么rcAAV是假野生型rcAAV的比例可能是1/40。在生产的rcAAV中,rcAAV是假野生型rcAAV的比例可能小于1/5、小于1/10、小于1/25、小于1/30或小于1/35。
可以通过qPCR测量cap和rep序列的数量。在实施例10中讨论了合适的qPCR。任选地,rep-rcAAV的水平是使用与rep68外显子1结合的引物通过qPCR检测到的rep-rcAAV的水平。任选地,rep-rcAAV的水平是使用正向引物CACGTGCATGTGGAAGTAG(SEQ ID NO:7)和反向引物CGACTTTCTGACGGAATGG(SEQ ID NO:8)通过qPCR检测到的rep-rcAAV的水平。任选地,cap-rcAAV的水平是使用与编码VP3的序列结合的引物通过qPCR检测到的cap-rcAAV的水平。任选地,cap-rcAAV的水平是使用正向引物TACTGAGGGACCATGAAGAC(SEQ ID NO:9)和反向引物GTTTACGGACTCGGAGTATC(SEQ ID NO:10)通过qPCR检测到的cap-rcAAV的水平。
任选地,过量的rep-rcAAV或cap-rcAAV表明假野生型rcAAV的水平被降低或被最小化。任选地,过量是至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的rep-rcAAV或cap-rcAAV。任选地,过量是至少5倍至至少100倍或至少25倍至至少50倍过量的rep-rcAAV或cap-rcAAV。任选地,低水平的rcAAV包含至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的cap-rcAAV,即低水平的rcAAV可以包含比rep序列多至少5倍、至少10倍、至少25倍、至少30倍或至少35倍的cap序列。任选地,低水平的rcAAV包含至少5倍至至少100倍或至少25倍至至少50倍过量的cap-rcAAV,即低水平的rcAAV可以包含比rep序列多至少5倍至至少100倍或至少25倍至至少50倍的cap序列。在cap-rcAAV的水平过量的情况下,rep-rcAAV的水平必须更低。较低水平的rep-rcAAV表明较低水平的假野生型rcAAV(因为假野生型rcAAV包含rep基因)。任选地,低水平的rcAAV包含至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的rep-rcAAV,即rcAAV可包含比cap序列多至少5倍、至少10倍、至少25倍、至少30倍或至少35倍的rep序列。任选地,低水平的rcAAV包括至少5倍至至少100倍或至少25倍至至少50倍过量的rep-rcAAV,即低水平的rcAAV可以包含比cap序列多至少5倍至至少100倍或至少25倍至至少50倍的rep序列。在rep-rcAAV的水平过量的情况下,cap-rcAAV的水平必须更低。较低水平的cap-rcAAV表明较低水平的假野生型rcAAV(因为假野生型rcAAV包含cap基因)。任选地,该过量大于使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统产生的过量。含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统在本文中也称为用于比较的双质粒系统。
任选地,在至少一轮扩增之后测量rAAV制剂的cap和rep序列的量。例如,可以在两轮扩增后测量rAAV制剂中的cap和rep序列的量。为了进行一轮扩增,任选地,用rAAV制剂感染合适的宿主细胞(例如HEK293T细胞),与腺病毒共感染,并在适合生产rAAV的条件下孵育。可以裂解细胞并测量裂解物中cap和rep序列的数量。任选地,裂解物可用于第二轮扩增。例如,裂解物可用于感染其他合适的宿主细胞(例如HEK293T细胞),这些细胞也与腺病毒共感染并在适合生产rAAV的条件下孵育。可以裂解细胞并测量裂解物中cap和rep序列的数量。在实施例8中列出了合适的扩增方法。
期望的完整颗粒与总颗粒的比率
本发明提供了本发明的双质粒系统、辅助质粒或载体质粒用于生产具有期望的完整颗粒与总颗粒的比率的rAAV制剂的用途。
本发明还提供了本发明的双质粒系统、辅助质粒或载体质粒用于控制或最大化在rAAV生产过程中生产的完整颗粒与总颗粒的比率的用途。
本发明还提供了生产rAAV制剂的方法,包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞
其中rAAV制剂包含期望的完整颗粒与总颗粒的比率。
本发明还涵盖控制或最大化在rAAV生产过程中生产的完整颗粒与总颗粒的比率的方法,包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞。
该方法还可包括收获rAAV以提供rAAV制剂的步骤,任选地具有期望的完整颗粒与总颗粒的比率。
本发明人已经确定改变辅助质粒与载体质粒的比率可用于改变所生产的完整颗粒与总颗粒的比率。具体而言,本发明人已经确定相对于辅助质粒增加载体质粒的水平会降低完整颗粒与总颗粒的比率。
“完整”颗粒是如使用下述qPCR方法确定的包含衣壳和预期载体基因组或至少部分这样的基因组的rAAV颗粒。“空”颗粒(即不完整的颗粒)包含衣壳但不包含基因组,或仅包含使用qPCR方法检测不到的部分基因组(因此不形成完整的rAAV颗粒)。然而,rAAV制剂可能包含完整颗粒和空颗粒。通常低或最小比例的空颗粒是期望的。例如,如果rAAV待被用于基因治疗,则任何空颗粒都不会包含整个感兴趣的表达盒并因此在治疗中不会有效。另一方面,在某些情况下,可能需要存在空颗粒。在一些情况下,在一些患者群体中,可能是这样:空颗粒可能表现为“诱饵”,以减少患者对施用的rAAV颗粒的免疫反应(WO2013/078400)。此外,如下文将更详细讨论的,虽然增加载体质粒相对于辅助质粒的水平会降低完整颗粒与总颗粒的比率,但它也增加了生产的rAAV的产量(并且因此在一些情况下所生产的完整颗粒的总数)。因此,即使该方法的用户认为较高的完整颗粒与总颗粒的比率是期望的,但是如果会导致更高的产量,用户也可以使用较低比例的辅助质粒。或者,例如,如果用户在给定产品的开发过程中实施了工艺改变,例如从生物反应器A切换到生物反应器B导致在保持质粒比率恒定时不同的完整颗粒与总颗粒的比率,可以改变质粒比率以补偿或抵消该工艺改变的影响,以确保在整个开发过程中一致的完整颗粒与总颗粒的比率,因为这个比率是rAAV批次的关键质量参数,需要控制并保持批次间的可比性。
因此,本发明的方法和用途的优点是它们允许用户灵活地确定期望的完整颗粒与总颗粒的比率并修改辅助质粒与载体质粒的比率以实现期望的完整颗粒与总颗粒的比率。
如使用下文的qPCR测定,在本文中完整颗粒与总颗粒的比率可以表示为理论上包含载体基因组或至少部分此类基因组(假设每个衣壳有一个(部分)基因组)的颗粒(衣壳)总数的百分比。使用能够扩增表达盒启动子的至少一个区域的一对引物进行qPCR。任选地,至少一个引物特异性针对(反向和互补或相同,取决于引物是正向引物还是反向引物)表达盒启动子的至少12个、至少14个、至少16个或至少18个核苷酸的区域。任选地,一个引物特异性针对启动子的起始部分(启动子的前至少12个核苷酸),而另一个引物特异性针对表达盒的距第一引物的结合位点150个碱基对的区域。
可以使用qPCR来确定完整颗粒与总颗粒的比率(测量为完整颗粒的颗粒总数的百分比),以确定载体基因组的数量(如上一段所述),并使用衣壳-特异性ELISA来测量颗粒总数。例如,衣壳特异性ELISA可以包含将rAAV制剂暴露于结合衣壳蛋白的抗体。例如,如果载体质粒包含编码来自AAV2血清型的衣壳的cap基因,则抗体可以是与AAV2衣壳结合的抗体。例如,用户可以用特异性针对衣壳的抗体包被板。然后,用户可以将rAAV制剂通过板表面。颗粒将与抗体结合并固定在板上。然后可以洗涤该板以去除污染物。然后可以通过添加检测抗体来检测存在的颗粒量,该检测抗体可以与衣壳结合并与检测剂如链霉抗生物素蛋白过氧化物酶偶联。当链霉抗生物素蛋白过氧化物酶暴露于显色底物TMB(四甲基联苯胺)时,存在的颗粒量将与获得的颜色变化成正比。
任选地,期望的完整颗粒与总颗粒的比率(表示为理论上包含载体基因组的颗粒总数的百分比)为至少2%、至少3%、至少4%、至少5%、至少7%、至少10%或至少15%(在收获、纯化和/或浓缩rAAV制剂之前对散装产品进行测量)。在许多情况下,增加完整颗粒与总颗粒的比率是有利的,并且本发明人已经确定目标为至少2%、至少3%、至少4%、至少5%、至少7%、至少10%或至少15%的完整颗粒与总颗粒的比率在保持高的完整颗粒与总颗粒比率同时还实现了良好的产量之间实现了良好的平衡。任选地,期望的完整颗粒与总颗粒的比率是使用具有辅助质粒与载体质粒的比率为1.8:1的等效方法实现的完整颗粒与总颗粒的比率的至少20%或至少30%的完整颗粒与总颗粒的比率。任选地,期望的完整颗粒与总颗粒的比率是使用具有辅助质粒与载体质粒的比率为1.8:1的等效方法实现的完整颗粒与总颗粒的比率的至少40%或至少45%的完整颗粒与总颗粒的比率。
任选地,所使用、选择或调整的辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7;1.2:1至1:6;1.1:1至1:5;1:1至1:4或1:1.5至1:3。任选地,辅助质粒与载体质粒的比率包含摩尔过量的载体质粒。任选地,所使用、选择或调整的辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7;1.2:1至1:6;1.1:1至1:5;1:1至1:4;1:1.5至1:3;1:2至1:4;或约为1:3。任选地,所使用、选择或调整的辅助质粒与载体质粒的比率为1:2至1:4或约为1:3。优选地,所使用、选择或调整的辅助质粒与载体质粒的比率约为1:3。
高产量
本发明提供了本发明的双质粒系统、辅助质粒或载体质粒用于以高产量或期望产量生产rAAV制剂的用途。
本发明还提供了本发明的双质粒系统、辅助质粒或载体质粒用于增加、优化或最大化rAAV生产过程中生产的rAAV的产量的用途。
本发明还提供了生产rAAV制剂的方法,包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞
其中rAAV制剂具有高产量或期望产量。
本发明还包括用于增加、优化或最大化在rAAV生产过程中生产的rAAV的产量的方法,包括:
(a)获得本发明的双质粒系统、辅助质粒或载体质粒;
(b)用本发明的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合rAAV生产的条件下培养宿主细胞。
该方法可以进一步包括收获rAAV载体以提供任选地高产量或期望产量的rAAV制剂的步骤。术语“产量”是指在本发明的方法或用途中制备的AAV颗粒的量。“产量”可以表示为每毫升培养基的载体基因组(vg)数,如之前测量的(如在收获、纯化和/或浓缩rAAV制剂之前在散装产品上测量的)。载体基因组的数量可以如标题“期望的完整颗粒与总颗粒的比率”下所述进行测量,即可以通过使用qPCR定量含有包含启动子序列(vg)的盒的核酸序列的数量来确定rAAV(例如rAAV颗粒)的产量。
本发明人已经表明,改变辅助质粒与载体质粒的比率可用于增加生产rAAV的方法的产量(即生产的vg的量或vg/ml)。拥有尽可能高的产量显然是有利的,因为它减少了生rAAV所需的资源量。然而,在一些条件下,将产量提高到尽可能高的水平可能会导致完整颗粒与总颗粒的比率降低。因此,如果用户正在生产rAAV用于最大化完整颗粒与总颗粒的比率很重要的应用,那么他可以选择使用期望的产量,而不是通过使用优化有利于完整颗粒与总颗粒的比率(即“完整%”)的辅助质粒与载体质粒的比率来达到最高可能的产量。
如本文所用,术语“最大化”产量是指在本发明的方法的限制内以最高可能的产量为目标。如本文所用,术语“优化”是指增加产量,但目的可能不是最大可能的产量的期望产量,例如,如果用户渴望的是确保高的完整颗粒与总颗粒的比率(即最小化空颗粒的比例)。
如本文所用,术语“高产量”通常是指大于2×1010vg/ml或是使用辅助质粒与载体质粒的比率为1.8:1的等效方法实现的产量的至少2倍的产量。“等效方法”是指除了辅助质粒与载体质粒的比例为1.8:1之外完全相同的方法。
任选地,高产量或期望产量是大于2×1010vg/ml、大于4×1010vg/ml、大于6×1010vg/ml、大于8×1010vg/ml、大于1×1011vg/ml、大于2×1011vg/ml或大于4×1011vg/ml的产量。
任选地,高产量或期望产量是使用辅助质粒与载体质粒的比率为1.8:1的等效方法实现的产量的至少2倍、至少4倍、至少5倍或至少6倍的产量。
任选地,所使用、选择或调整的辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7;1.2:1至1:6;1.1:1至1:5;1:1至1:4或1:1.5至1:3。任选地,辅助质粒与载体质粒的比率包含相比辅助质粒摩尔过量的载体质粒。任选地,所使用、选择或调整的辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7;1.2:1至1:6;1.1:1至1:5;1:1至1:4;1:1.5至1:3;1:2至1:4;或约为1:3。任选地,所使用、选择或调整的辅助质粒与载体质粒的比率为1:2至1:4或约为1:3。优选地,所使用、选择或调整的辅助质粒与载体质粒的比率约为1:3。
高产量与高完整颗粒与总颗粒的比率之间的平衡
如上所讨论的,完整颗粒与总颗粒的比率和产量可能会受到改变方法中使用的辅助质粒与载体质粒的比率的影响。因此,用户可以将辅助质粒与载体质粒的比率调整到合适的比率,以获得期望的完整颗粒与总颗粒的比率。任选地,该方法或用途可以包括选择辅助质粒与载体质粒的比率的步骤。可以通过将辅助质粒和载体质粒以不同的相对比例简单混合实现改变辅助质粒与载体质粒的比率,或选择辅助质粒与载体质粒的比率。
用户可能需要执行一种测试方法来确定辅助质粒与载体质粒的比率,以获得期望的完整颗粒与总颗粒的比率,但这并不麻烦。例如,本领域技术人员可以进行小规模实验以确定所需的辅助质粒与载体质粒的比率,然后该比率可以用于更大规模的生产过程中。任选地,选择辅助质粒与载体质粒的比率的步骤可以包括使用不同的辅助质粒与载体质粒的比率进行本发明方法的小规模测试运行。
任选地,辅助质粒与载体质粒的比率被选择或调整为实现平衡的产量与完整颗粒与总颗粒的比率的比率。任选地,辅助质粒与载体质粒的比率被选择或调整为实现rAAV的最大产量(即vg)的比率,并且在rAAV的这种最大产量下可实现的颗粒产量最小,即用户使产量最大化,然后确定辅助质粒与载体质粒的比率,以实现该产量,同时提供最高的完整颗粒与总颗粒的比率。
任选地,调节辅助质粒与载体质粒的比率以获得期望的完整颗粒与总颗粒的比率和/或重组AAV的高产量或期望产量。任选地,辅助质粒与载体质粒的比率被选择或调整为允许用户获得期望的完整颗粒与总颗粒的比率或重组AAV的高产量或期望产量的比率。
任选地,所使用、选择或调整的辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7;1.2:1至1:6;1.1:1至1:5;1:1至1:4或1:1.5至1:3。任选地,辅助质粒与载体质粒的比率包含摩尔过量的载体质粒。任选地,所使用、选择或调整的辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7;1.2:1至1:6;1.1:1至1:5;1:1至1:4;1:1.5至1:3;1:2至1:4;或约为1:3。任选地,所使用、选择或调整的辅助质粒与载体质粒的比率为1:2至1:4或约为1:3。优选地,所使用、选择或调整的辅助质粒与载体质粒的比率约为1:3。
转染、培养与收获
本发明的方法可以包括以下步骤:获得本发明的双质粒系统、辅助质粒或载体质粒,用双质粒系统、辅助质粒或载体质粒转染宿主细胞,和在适合重组AAV生产的条件下培养宿主细胞。
用双质粒系统、辅助质粒或载体质粒转染宿主细胞可以包括在适合转染的条件下将宿主细胞暴露于双质粒系统、辅助质粒或载体质粒。例如,该方法的用户可以添加转染剂(添加转染剂将被认为是适合转染的条件)。或者,可以使用磷酸钙转染、电穿孔或阳离子脂质体。任选地,转染宿主细胞的步骤在宿主细胞已经生长至汇合时发生。
在适合rAAV生产的条件下培养宿主细胞是指在宿主细胞能够生长和AAV能够复制的条件下培养宿主细胞。例如,可以在32℃至40℃、34℃至38℃、35℃至38℃或约37℃的温度下培养宿主细胞。任选地,宿主细胞可以在完全细胞培养基如杜氏改良伊格尔培养基(DMEM)存在下培养。完整的细胞培养基是提供宿主细胞生长所需的所有必需营养素的培养基。任选地,完全细胞培养基补充有血清,例如胎牛血清或牛血清白蛋白。
任选地,宿主细胞是例如上文在标题“宿主细胞”下定义的那些宿主细胞。任选地,宿主细胞选自HEK293T细胞、HEK293细胞、HEK293EBNA细胞、CAP细胞、CAP-T细胞、AGE1.CR细胞、PerC6细胞、C139细胞和EB66细胞。任选地,宿主细胞是表达功能性E1A/B蛋白的细胞。
该方法还可包括纯化rAAV的步骤。通常,与制剂的其他组分相比,纯化rAAV的步骤将涉及增加rAAV的浓度。任选地,纯化rAAV的步骤产生浓缩的rAAV制剂。任选地,纯化rAAV的步骤产生分离的rAAV。
可以使用任何合适的纯化方法。任选地,使用选自梯度密度离心(例如CsCl或碘克沙醇梯度密度离心)、过滤、离子交换层析、尺寸排阻层析、亲和层析和疏水相互作用层析的技术进行纯化rAAV的步骤。
任选地,该方法包括使用超速离心、切向流过滤或凝胶过滤进一步浓缩rAAV。
任选地,该方法包括用药学上可接受的赋形剂配制rAAV。药学上可接受的赋形剂可以包括承载体、稀释剂和/或其他药用剂、药物剂或佐剂等。任选地,药学上可接受的赋形剂包括盐水溶液。任选地,药学上可接受的赋形剂包括人血清白蛋白。
重组AAV(rAAV)制剂
本发明还提供了可通过本发明的方法获得的重组AAV(rAAV)制剂。本发明还提供了通过本发明的方法获得的重组AAV制剂。
可通过本发明的方法获得或通过本发明的方法获得的重组AAV制剂是有利的,因为它们通常包含低水平的rcAAV,和/或具有期望的完整颗粒与总颗粒的比率。标题为“期望的完整颗粒与总颗粒的比率”、“高产量与高完整颗粒与总颗粒的比率之间的平衡”和“低水平的具有复制能力的AAV(rcAAV)”的部分提供了术语低水平的rcAAV和期望的完整颗粒与总颗粒的比率的含义的进一步细节。
序列表表格
序列标识编号 序列
1 AAV2(AF043303.1)的基因组
2 AdV5(AC_000008.1)的基因组
3 AdV2(AC_000007.1)的基因组
4 辅助基因区域
5 可变AdV5基因组(AY339865.1)
6 Rep结合位点
7 Rep正向引物
8 Rep反向引物
9 Cap正向引物
10 Cap反向引物
本发明的编号方面
1.双质粒系统,其包含辅助质粒和载体质粒,其中辅助质粒包含编码至少一种功能性Rep蛋白的至少一种rep基因并且不包含编码一组功能性Cap蛋白的cap基因。
2.双质粒系统,其包含辅助质粒和载体质粒,其中辅助质粒包含至少一种辅助病毒基因并且不包含编码一组功能性Cap蛋白的cap基因,并且至少一种辅助病毒基因包含在与SEQ ID NO:4的全长或长度为至少6000个、至少7000个或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%的同一性的质粒的连续链段中。
3.根据方面2所述的双质粒系统,其中辅助质粒包含编码至少一种功能性Rep蛋白的至少一种rep基因。
4.根据方面1-3中任一项所述的双质粒系统,其中双质粒系统包含相比于辅助质粒摩尔过量的载体质粒。
5.根据方面1-4中任一项所述的双质粒系统,其中辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7;1.2:1至1:6;1.1:1至1:5;1:1至1:4;1:1.5至1:3;1:2至1:4;或约为1:3。
6.辅助质粒,其包含编码至少一种功能性Rep蛋白的至少一种rep基因和至少一种辅助病毒基因,并且其不包含编码一组功能性Cap蛋白的cap基因。
7.辅助质粒,其包含至少一种辅助病毒基因并且其不包含编码一组功能性Cap蛋白的cap基因,其中至少一种辅助病毒基因包含在与SEQ ID NO:4的全长或长度为至少6000个、至少7000个或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%的同一性的质粒的连续链段中。
8.根据方面7所述的辅助质粒,其中辅助质粒包含编码至少一种功能性Rep蛋白的至少一种rep基因。
9.载体质粒,其包含:
(a)编码至少一种功能性Cap蛋白的cap基因;或者
(b)至少一种cap基因启动子、与cap基因启动子可操作地连接的克隆位点以及至少一侧上侧接ITR的表达盒;
其中载体质粒不包含编码功能性Rep蛋白的rep基因,并且表达盒包含与至少一种调控元件可操作地连接的转基因。
10.根据方面1-5中任一项所述的双质粒系统,其中载体质粒包含:
(a)编码至少一种功能性Cap蛋白的cap基因;或者
(b)至少一种cap基因启动子、与cap基因启动子可操作地连接的克隆位点以及至少一侧上侧接ITR的表达盒;
其中载体质粒不包含编码功能性Rep蛋白的rep基因,并且表达盒包含与至少一种调控元件可操作地连接的转基因。
11.根据方面1、3-6、8或10中任一项所述的双质粒系统或辅助质粒,其中至少一种rep基因包含编码以下的基因:
(a)功能性Rep 52蛋白;
(b)功能性Rep 40蛋白;和/或
(c)功能性Rep 68蛋白。
12.根据方面1、3-6、8、10或11中任一项所述的双质粒系统或辅助质粒,其中至少一种rep基因包含编码功能性Rep 52蛋白的基因、编码功能性Rep 40蛋白的至少一种基因和编码功能性Rep 68蛋白的基因。
13.根据方面1-8或10-12中任一项所述的双质粒系统或辅助质粒,其中辅助质粒包含编码功能性Rep 40蛋白的两种基因。
14.根据方面13所述的双质粒系统或辅助质粒,其中编码功能性Rep 40蛋白的两种基因中只有一种基因包含内含子。
15.根据方面11-14中任一项所述的双质粒系统或辅助质粒,其中编码功能性Rep52蛋白的基因包含与SEQ ID NO:1的核苷酸993-2186的全长或长度为至少800个、至少900个、至少1000个或至少1100个核苷酸的片段或者与AAV的不同血清型中的相应核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸序列。
16.根据方面11-15中任一项所述的双质粒系统或辅助质粒,其中编码功能性Rep40蛋白的至少一种基因包含与对应于SEQ ID NO:1的核苷酸993-2252减去核苷酸1907-2227的核苷酸链段的全长或长度为至少600个、至少700个、至少800个或至少900个核苷酸的片段或者与AAV的不同血清型中的相应核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸序列。
17.根据方面11-16中任一项所述的双质粒系统或辅助质粒,其中编码功能性Rep40蛋白的至少一种基因包含与SEQ ID NO:1的核苷酸993-2252的全长或长度为至少900个、至少1000个、至少1100个或至少1200个核苷酸的片段或者与AAV的不同血清型中的相应核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸序列。
18.根据方面11-17中任一项所述的双质粒系统或辅助质粒,其中编码功能性Rep68蛋白的基因包含与对应于SEQ ID NO:1的核苷酸321-2252减去核苷酸1907-2227的核苷酸链段的全长或长度为至少1000个、至少1400个、至少1500个或至少1600个核苷酸的片段或者与AAV的不同血清型中的相应核苷酸链段具有至少95%、至少98%、至少99%或100%的同一性的核酸序列。
19.根据方面1-8或10-18中任一项所述的双质粒系统或辅助质粒,其中辅助质粒不包含编码功能性Rep 78蛋白的基因。
20.根据方面1-8或10-19中任一项所述的双质粒系统或辅助质粒,其中辅助质粒不包含对应于包含在SEQ ID NO:1的核苷酸321-2186内或在AAV的不同血清型中的相应核苷酸链段内的相等长度的连续核苷酸链段的至少1700个、至少1800个或1866个核苷酸的连续序列。
21.根据方面1、3-6、8、10或11-20中任一项所述的双质粒系统或辅助质粒,其中至少一种rep基因不包含功能性内部p40启动子。
22.根据方面1、3-6、8、10或11-21中任一项所述的双质粒系统或辅助质粒,其中至少一种rep基因在对应于SEQ ID NO:1的位置1823的位置处不包含T核苷酸。
23.根据方面22中所述的双质粒系统或辅助质粒,其中至少一种rep基因在对应于SEQ ID NO:1的位置1823的位置处包含C核苷酸。
24.根据方面1、3-6、8或11-23中任一项所述的双质粒系统或辅助质粒,其中至少一种rep基因在对应于SEQ ID NO:1的位置1826-1828的位置处不包含AAG。
25.根据方面1、3-6、8或11-24中任一项所述的双质粒系统或辅助质粒,其中至少一种rep基因在对应于SEQ ID NO:1的位置1826-1828的位置处包含CTC。
26.根据方面1-8或10-25中任一项所述的双质粒系统或辅助质粒,其中辅助质粒不包含仅为cap基因序列的超过250个核苷酸、超过100个核苷酸或超过60个核苷酸的连续链段。
27.根据方面26所述的双质粒系统或辅助质粒,其中辅助质粒不包含仅为cap基因序列的超过60个核苷酸的连续链段。
28.根据方面1-8或10-27中任一项所述的双质粒系统或辅助质粒,其中辅助质粒包含部分cap基因序列,且该部分cap基因序列不编码一组功能性Cap蛋白。
29.根据方面1-5或10-28中任一项所述的双质粒系统或辅助质粒,其中辅助质粒包含至少一种辅助病毒基因。
30.根据方面2、3、6-8或29中任一项所述的双质粒系统或辅助质粒,其中至少一种辅助病毒基因是腺病毒基因。
31.根据方面30所述的双质粒系统或辅助质粒,其中至少一种辅助病毒基因是腺病毒5或腺病毒2基因。
32.根据方面2、3、6-8或29-31中任一项所述的双质粒系统或辅助质粒,其中至少一种辅助病毒基因包含:
(a)编码功能性VA RNA I和II的VA(病毒相关)核酸;
(b)编码功能性E2A蛋白的E2A基因;和/或
(c)编码功能性E4蛋白的E4基因。
33.根据方面32所述的双质粒系统或辅助质粒,其中至少一种辅助病毒基因包含VA核酸、E2A基因和E4基因。
34.根据方面33所述的双质粒系统或辅助质粒,其中E4基因不位于VA核酸和E2A基因之间。
35.根据方面1-8或10-34中任一项所述的双质粒系统或辅助质粒,其中辅助质粒的长度小于25000bp、小于20000bp、小于15000bp、小于14500bp、10000bp至25000bp、10000bp至20000bp、12000bp至15000bp或约14021bp。
36.根据方面1-8或10-35中任一项所述的双质粒系统或辅助质粒,其中辅助质粒不包含编码功能性腺病毒E1A/B蛋白的基因。
37.根据方面1-8或10-36中任一项所述的双质粒系统或辅助质粒,其中辅助质粒不包含在SEQ ID NO:2的核苷酸194-3620内所包含的相等长度的连续核苷酸链段的至少2000个、至少2500个、至少3000个或3427个核苷酸的连续序列,或腺病毒的不同血清型中的相应核苷酸链段。
38.根据方面1-8或10-37中任一项所述的双质粒系统或辅助质粒,其中辅助质粒不包含在SEQ ID NO:2的核苷酸4032-4100内所包含的相等长度的连续核苷酸链段的至少50个、至少60个或69个核苷酸的连续序列,或腺病毒的不同血清型中的相应核苷酸链段。
39.根据方面1-8或10-38中任一项所述的双质粒系统或辅助质粒,其中辅助质粒不包含在SEQ ID NO:1的核苷酸4051-4413内所包含的相等长度的连续核苷酸链段的至少200个、至少300个、至少350个或363个核苷酸的连续序列,或AAV的不同血清型中的相应核苷酸链段。
40.根据方面1-8或10-39中任一项所述的双质粒系统或辅助质粒,其中辅助质粒不包含在SEQ ID NO:1的核苷酸2301-2947内所包含的相等长度的连续核苷酸链段的至少400个、至少500个、至少600个或647个核苷酸的连续序列,或AAV的不同血清型中的相应核苷酸链段。
41.根据方面32-40中任一项所述的双质粒系统或辅助质粒,其中VA核酸具有来自腺病毒5的野生型VA核酸的活性的至少75%、至少80%、至少90%、至少95%或95%至100%的活性水平。
42.根据方面41所述的双质粒系统或辅助质粒,其中通过测量rAAV产量确定VA核酸的活性水平。
43.根据方面32-42中任一项所述的双质粒系统或辅助质粒,其中VA核酸包含与SEQ ID NO:2的核苷酸10595-10619的至少15个核苷酸、至少20个核苷酸或25个核苷酸的链段或腺病毒的不同血清型中的相应核苷酸链段至少95%、至少98%或100%相同的连续序列。
44.根据方面32-43中任一项所述的双质粒系统或辅助质粒,其中E2A基因与启动子可操作地连接,该启动子包含与SEQ ID NO:2的核苷酸27037-27136的至少60个、至少70个、至少80个或100个核苷酸的链段或腺病毒的不同血清型中的相应核苷酸链段至少96%、至少98%或100%相同的连续序列。
45.根据方面32-44中任一项所述的双质粒系统或辅助质粒,其中至少一种辅助病毒基因包含VA核酸、E2A基因和E4基因,并且VA核酸、E2A基因和E4基因包含在小于15000个、小于12000个、小于10000个或小于9000个核苷酸的辅助质粒上的连续核苷酸链段内。
46.根据方面1、3-8或10-45中任一项所述的双质粒系统或辅助质粒,其中至少一种辅助病毒基因包含在与SEQ ID NO:4的全长或长度为至少6000个核苷酸、至少7000个核苷酸或至少8000个核苷酸的片段具有至少95%、至少98%、至少99%或100%的同一性的质粒的连续链段上。
47.根据方面32-46中任一项所述的双质粒系统或辅助质粒,其中辅助质粒不包含在SEQ ID NO:2的核苷酸10619-32755内所包含的相等长度的连续核苷酸链段的至少15000个、至少20000个、至少22000个或22137个核苷酸的连续序列,或腺病毒的不同血清型中的相应核苷酸链段。
48.根据方面32-47中任一项所述的双质粒系统或辅助质粒,其中E4基因与具有来自腺病毒5的野生型启动子的活性的至少50%、至少70%或至少90%的E4启动子可操作地连接。
49.根据方面48所述的双质粒系统或辅助质粒,其中E4启动子包含对应于SEQ IDNO:2的核苷酸35793-35848的至少30个、至少40个或55个核苷酸的序列,或腺病毒的不同血清型中的相应核苷酸链段。
50.根据方面1-49中任一项所述的双质粒系统、辅助质粒或载体质粒,其中辅助质粒和/或载体质粒不包含人工Rep结合位点。
51.根据方面1-50中任一项所述的双质粒系统、辅助质粒或载体质粒,其中辅助质粒和/或载体质粒包含质粒主链,并且质粒主链不包含人工Rep结合位点。
52.根据方面1-5或9-51中任一项所述的双质粒系统或载体质粒,其中载体质粒包含与至少一种cap基因启动子可操作地连接的cap基因。
53.根据方面1-5或9-52中任一项所述的双质粒系统或载体质粒,其中载体质粒包含cap基因并且还包含至少一侧上侧接ITR的表达盒。
54.根据方面1-5或9-53中任一项所述的双质粒系统或载体质粒,其中载体质粒包含cap基因并且cap基因编码VP1、VP2和/或VP3蛋白。
55.根据方面1-5或9-54中任一项所述的双质粒系统或载体质粒,其中载体质粒包含cap基因并且cap基因编码选自血清型1、2、3A、3B、4、5、6、7、8、9、10、11、12或13、LK03、rh74、rh10和Mut C(来自WO 2016/181123的SEQ ID NO:3)的AAV血清型的Cap蛋白。
56.根据方面1-5或9-55中任一项所述的双质粒系统或载体质粒,其中载体质粒包含cap基因并且cap基因编码选自血清型2、5、8、9和Mut C(来自WO 2016/181123的SEQ IDNO:3)的AAV血清型的Cap蛋白。
57.根据方面1-5或9-56中任一项所述的双质粒系统或载体质粒,其中载体质粒包含至少一种cap基因启动子,其是天然cap基因启动子。
58.根据方面1-5或9-57中任一项所述的双质粒系统或载体质粒,其中载体质粒包含至少一种cap基因启动子,其包含AAV p40启动子、p5启动子和/或p19启动子。
59.根据方面58所述的双质粒系统或载体质粒,其中至少一种cap基因启动子包含p40启动子。
60.根据方面58或59所述的双质粒系统或载体质粒,其中至少一种cap基因启动子包含p40启动子、p5启动子和p19启动子。
61.根据方面9-60中任一项所述的双质粒系统或载体质粒,其中转基因编码酶、代谢蛋白、信号传导蛋白、抗体、抗体片段、抗体样蛋白、抗原或非翻译的RNA,例如miRNA、siRNA、snRNA或反义RNA。
62.根据方面9-61中任一项所述的双质粒系统或载体质粒,其中转基因编码选自因子IX、α-半乳糖苷酶A、β-葡糖脑苷脂酶和因子VIII的蛋白质。
63.根据方面9-62中任一项所述的双质粒系统或载体质粒,其中克隆位点是多克隆位点(MCS)。
64.根据方面1-5或9-63中任一项所述的双质粒系统或载体质粒,其中载体质粒不包含任何非必要的翻译起始密码子。
65.根据方面64所述的双质粒系统或载体质粒,其中载体质粒含有包含一个或多个启动子的启动子区域,并且该启动子区域不包含ATG或GTG密码子。
66.根据方面65所述的双质粒系统或载体质粒,其中启动子区域包含p5、p19和/或p40启动子,并且其中ATG或GTG密码子位于对应于SEQ ID NO:1的位置(a)321-323、(b)766-768、(c)955-957、(d)993-995和(e)1014-1016的一个或多个位置处的ATG或GTC密码子不存在或发生突变。
67.根据方面66所述的双质粒系统或载体质粒,其中在启动子区域中:
(a)不存在对应于SEQ ID NO:1的核苷酸321-323的核苷酸;
(b)对应于SEQ ID NO:1的核苷酸766-768的核苷酸不是ATG并且任选地是ATT;
(c)不存在对应于SEQ ID NO:1的核苷酸955-957的核苷酸;
(d)不存在对应于SEQ ID NO:1的核苷酸993-995的核苷酸;和/或
(e)不存在对应于SEQ ID NO:1的核苷酸1014-1016的核苷酸。
68.根据方面67所述的双质粒系统或载体质粒,其中在启动子区域中:
(a)不存在对应于SEQ ID NO:1的核苷酸321-323的核苷酸;
(b)对应于SEQ ID NO:1的核苷酸766-768的核苷酸不是ATG并且任选地是ATT;
(c)不存在对应于SEQ ID NO:1的核苷酸955-957的核苷酸;
(d)不存在对应于SEQ ID NO:1的核苷酸993-995的核苷酸;和
(e)不存在对应于SEQ ID NO:1的核苷酸1014-1016的核苷酸。
69.根据方面1-5或9-68中任一项所述的双质粒系统或载体质粒,其中载体质粒包含长度小于4000个核苷酸、小于3500个核苷酸、小于3000个核苷酸或小于2500个核苷酸的主链。
70.根据方面1-5或9-69中任一项所述的双质粒系统或载体质粒,其中载体质粒不包含任何间隔子。
71.宿主细胞,其包含前述方面中任一项所述的双质粒系统、辅助质粒或载体质粒。
72.根据方面1-70中任一项中所述的双质粒系统、辅助质粒或载体质粒用于生产重组AAV制剂的用途,所述重组AAV制剂:
(a)具有低水平的具有复制能力的AAV(rcAAV);
(b)具有期望的完整颗粒与总颗粒的比率;和/或
(c)具有高产量或期望产量。
73.根据方面72所述的用途,其中低水平的rcAAV包括低水平的rep-rcAAV。
74.根据方面72或73所述的用途,其中与使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统生产的rep-rcAAV的水平相比,低水平的rcAAV包含较低水平的rep-rcAAV。
75.根据方面72-74中任一项所述的用途,其中低水平的rcAAV包含至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的rep-rcAAV或cap-rcAAV。
76.根据方面72-75中任一项所述的用途,其中低水平的rcAAV包含小于1/5rep-rcAAV、小于1/10rep-rcAAV、小于1/25rep-rcAAV、小于1/30rep-rcAAV或小于1/35rep-rcAAV的比例。
77.根据方面72-76中任一项所述的用途,其中低水平的rcAAV包含的rep-rcAAV的比例小于使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统产生的比例。
78.根据方面77所述的用途,其中rep-rcAAV的比例小于90%、小于75%、小于60%、小于50%、小于25%、小于20%、小于17%或小于15%的使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统产生的比例。
79.根据方面72-78中任一项所述的用途,其中低水平的rcAAV包括低水平的假野生型rcAAV。
80.根据方面72-79中任一项所述的用途,其中低水平的rcAAV包括小于1/5的假野生型rcAAV、小于1/10的假野生型rcAAV、小于1/25的假野生型rcAAV、小于1/30的假野生型rcAAV或小于1/35的假野生型rcAAV。
81.根据方面72-80中任一项所述的用途,其中rep-rcAAV的水平是使用与rep68外显子1结合的引物通过qPCR检测到的rep-rcAAV的水平。
82.根据方面72-81中任一项所述的用途,其中rep-rcAAV的水平是使用正向引物CACGTGCATGTGGAAGTAG(SEQ ID NO:7)和反向引物CGACTTTCTGACGGAATGG(SEQ ID NO:8)通过qPCR检测到的rep-rcAAV的水平。
83.根据方面72-82中任一项所述的用途,其中cap-rcAAV的水平是使用与编码VP3的序列结合的引物通过qPCR检测到的cap-rcAAV的水平。
84.根据方面72-83中任一项所述的用途,其中cap-rcAAV的水平是使用正向引物TACTGAGGGACCATGAAGAC(SEQ ID NO:9)和反向引物GTTTACGGACTCGGAGTATC(SEQ ID NO:10)通过qPCR检测到的cap-rcAAV的水平。
85.根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒用于以下的用途:
(a)降低或最小化rAAV生产过程中生产的具有复制能力的AAV(rcAAV)的水平;
(b)降低或最小化重组AAV生产过程中生产的假野生型具有复制能力的AAV(rcAAV)的水平;
(c)控制或最大化重组AAV生产过程中生产的完整颗粒与总颗粒的比率;和/或
(d)增加、优化或最大化重组AAV生产过程中生产的rAAV的产量。
86.根据方面72-85中任一项所述的用途,其中该用途包括用方面1-70中任一项的双质粒系统、辅助质粒或载体质粒转染宿主细胞,并在适合重组AAV生产的条件下培养宿主细胞。
87.根据方面85或86所述的用途,其中过量的rep-rcAAV或cap-rcAAV表明假野生型rcAAV的水平被降低或被最小化。
88.根据方面87所述的用途,其中过量是至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的rep-rcAAV或cap-rcAAV。
89.根据方面87或88所述的用途,其中该过量大于使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统产生的过量。
90.根据方面87-89中任一项所述的用途,其中rep-rcAAV的水平是使用与rep68外显子1结合的引物通过qPCR检测到的rep-rcAAV的水平。
91.根据方面87-90中任一项所述的用途,其中rep-rcAAV的水平是使用正向引物CACGTGCATGTGGAAGTAG(SEQ ID NO:7)和反向引物CGACTTTCTGACGGAATGG(SEQ ID NO:8)通过qPCR检测到的rep-rcAAV的水平。
92.根据方面87-91中任一项所述的用途,其中cap-rcAAV的水平是使用与编码VP3的序列结合的引物通过qPCR检测到的cap-rcAAV的水平。
93.根据方面87-92中任一项所述的用途,其中cap-rcAAV的水平是使用正向引物TACTGAGGGACCATGAAGAC(SEQ ID NO:9)和反向引物GTTTACGGACTCGGAGTATC(SEQ ID NO:10)通过qPCR检测到的cap-rcAAV的水平。
94.生产重组AAV制剂的方法,其包括:
(a)获得根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒;
(b)用根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合重组AAV生产的条件下培养宿主细胞。
95.根据方面94所述的方法,其还包括收获重组AAV以提供重组AAV制剂的步骤。
96.降低或最小化重组AAV生产过程中生产的具有复制能力的AAV(rcAAV)的水平的方法,其包括:
(a)获得根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒;
(b)用根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合重组AAV生产的条件下培养宿主细胞。
97.降低或最小化重组AAV生产过程中生产的假野生型具有复制能力的AAV(rcAAV)的水平的方法,其包括:
(a)获得根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒;
(b)用根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合重组AAV生产的条件下培养宿主细胞。
98.根据方面97所述的方法,其中过量的rep-rcAAV或cap-rcAAV表明假野生型rcAAV的水平被降低或被最小化。
99.根据方面98所述的方法,其中过量是至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的rep-rcAAV或cap-rcAAV。
100.根据方面98或99所述的方法,其中该过量大于使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统产生的过量。
101.根据方面98-100中任一项所述的方法,其中rep-rcAAV的水平是使用与rep68外显子1结合的引物通过qPCR检测到的rep-rcAAV的水平。
102.根据方面98-101中任一项所述的方法,其中rep-rcAAV的水平是使用正向引物CACGTGCATGTGGAAGTAG(SEQ ID NO:7)和反向引物CGACTTTCTGACGGAATGG(SEQ ID NO:8)通过qPCR检测到的rep-rcAAV的水平。
103.根据方面98-102中任一项所述的方法,其中cap-rcAAV的水平是使用与编码VP3的序列结合的引物通过qPCR检测到的cap-rcAAV的水平。
104.根据方面98-103中任一项所述的方法,其中cap-rcAAV的水平是使用正向引物TACTGAGGGACCATGAAGAC(SEQ ID NO:9)和反向引物GTTTACGGACTCGGAGTATC(SEQ ID NO:10)通过qPCR检测到的cap-rcAAV的水平。
105.根据方面86-93或96-104中任一项所述的方法,其还包括收获重组AAV以提供重组AAV制剂的步骤。
106.根据方面94、95或105中任一项所述的方法,其中重组AAV制剂包含低水平的rcAAV。
107.根据方面106所述的方法,其中低水平的rcAAV包括低水平的rep-rcAAV。
108.根据方面106或107所述的方法,其中与使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统生产的rep-rcAAV的水平相比,低水平的rcAAV包含较低水平的rep-rcAAV。
109.根据方面106-108中任一项所述方法,其中低水平的rcAAV包含至少5倍、至少10倍、至少25倍、至少30倍或至少35倍过量的rep-rcAAV或cap-rcAAV。
110.根据方面106-109中任一项所述方法,其中低水平的rcAAV包含小于1/5rep-rcAAV、小于1/10rep-rcAAV、小于1/25rep-rcAAV、小于1/30rep-rcAAV或小于1/35rep-rcAAV的比例。
111.根据方面106-110中任一项所述方法,其中低水平的rcAAV包含的rep-rcAAV的比例小于使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统产生的比例。
112.根据方面111所述的方法,其中rep-rcAAV的比例小于90%、小于75%、小于60%、小于50%、小于25%、小于20%、小于17%或小于15%的使用含有包含至少一种rep基因和至少一种cap基因的质粒的双质粒系统产生的比例。
113.根据方面106-112中任一项所述方法,其中低水平的rcAAV包括低水平的假野生型rcAAV。
114.根据方面106-113中任一项所述方法,其中低水平的rcAAV包括小于1/5的假野生型rcAAV、小于1/10的假野生型rcAAV、小于1/25的假野生型rcAAV、小于1/30的假野生型rcAAV或小于1/35的假野生型rcAAV。
115.根据方面106-114中任一项所述方法,其中rep-rcAAV的水平是使用与rep68外显子1结合的引物通过qPCR检测到的rep-rcAAV的水平。
116.根据方面106-115中任一项所述方法,其中rep-rcAAV的水平是使用正向引物CACGTGCATGTGGAAGTAG(SEQ ID NO:7)和反向引物CGACTTTCTGACGGAATGG(SEQ ID NO:8)通过qPCR检测到的rep-rcAAV的水平。
117.根据方面106-116中任一项所述方法,其中cap-rcAAV的水平是使用与编码VP3的序列结合的引物通过qPCR检测到的cap-rcAAV的水平。
118.根据方面106-117中任一项所述方法,其中cap-rcAAV的水平是使用正向引物TACTGAGGGACCATGAAGAC(SEQ ID NO:9)和反向引物GTTTACGGACTCGGAGTATC(SEQ ID NO:10)通过qPCR检测到的cap-rcAAV的水平。
119.根据方面72-84或106-118中任一项所述的用途或方法,其中rcAAV的水平被测量为低于107个重组AAV中1个rcAAV、低于109个重组AAV中1个rcAAV或低于1010个重组AAV中1个rcAAV。
120.根据方面106-119中任一项所述方法,其中rcAAV的水平低于使用除了载体质粒包含至少一种rep基因和至少一种cap基因之外与本发明方法等效的方法生产的rcAAV的水平。
121.根据方面72-84、86-93或106-120中任一项所述的用途或方法,其中使用qPCR测量rcAAV的水平,以测量包含rep基因的重组AAV颗粒的数量。
122.根据方面72-84、86-95或105-121中任一项所述的用途或方法,其中重组AAV制剂具有期望的完整颗粒与总颗粒的比率。
123.控制或最大化重组AAV生产过程中生产的完整颗粒与总颗粒的比率的方法,其包括:
(a)获得根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒;
(b)用根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合重组AAV生产的条件下培养宿主细胞。
124.根据方面123所述的方法,其还包括收获重组AAV以提供包含期望的完整颗粒与总颗粒的比率的重组AAV制剂的步骤。
125.根据方面72-84、86-93、122或124中任一项所述的用途或方法,其中期望的完整颗粒与总颗粒的比率为至少2%、至少3%、至少4%、至少5%、至少7%、至少10%或至少15%。
126.根据方面94-125中任一项所述的方法,其中该方法是以高产量或期望产量生产重组AAV制剂的方法。
127.增加、优化或最大化重组AAV生产过程中生产的rAAV的产量的方法,其包括:
(a)获得根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒;
(b)用根据方面1-70中任一项所述的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合重组AAV生产的条件下培养宿主细胞。
128.根据方面127所述的方法,其还包括收获重组AAV以提供包含高产量或期望产量的重组AAV的重组AAV制剂的步骤。
129.根据方面72-84、86-93、124-126或128中任一项所述的用途或方法,其中调整辅助质粒与载体质粒的比率,以获得期望的完整颗粒与总颗粒的比率和/或高产量或期望产量的重组AAV。
130.根据方面72-84、86-93或123-129中任一项所述的用途或方法,其包括选择辅助质粒与载体质粒的比率的步骤。
131.根据方面130所述的用途或方法,其中调整辅助质粒与载体质粒的比率,以获得期望的完整颗粒与总颗粒的比率或高产量或期望产量的重组AAV。
132.根据方面72-93、122-126或128-131中任一项所述的用途或方法,其中辅助质粒与载体质粒的比率被选择或调整为实现产量相对于完整颗粒与总颗粒的比率的平衡的比率。
133.根据方面72-93、122-126或128-132中任一项所述的用途或方法,其中辅助质粒与载体质粒的比率被选择或调整为实现重组AAV的最大产量和在重组AAV的这种最大产量下可实现的空颗粒的最小产量的比率。
134.根据方面72-84、86-93、125、126或128-133中任一项所述的用途或方法,其中高产量或期望产量是使用辅助质粒与载体质粒的比率为1.8:1的等效方法所实现的产量的至少2倍、至少4倍、至少5倍或至少6倍的产量。
135.根据方面72-84、86-93、125、126或128-134中任一项所述的用途或方法,其中高产量或期望产量是大于2×1010vg/ml、大于4×1010vg/ml、大于6×1010vg/ml、大于8×1010vg/ml、大于1×1011vg/ml、大于2×1011vg/ml或大于4×1011vg/ml的产量。
136.根据方面72-84、86-93、122、124-126或129-135中任一项所述的用途或方法,其中期望的完整颗粒与总颗粒的比率是使用辅助质粒与载体质粒的比率为1.8:1的等效方法所实现的完整颗粒与总颗粒的比率的至少20%或至少30%的完整颗粒与总颗粒的比率。
137.根据方面72-84、86-93、122-126或129-136中任一项所述的用途或方法,其中通过使用qPCR定量含有包含启动子序列的盒的核酸序列的数量(载体基因组;vg)来计算载体基因组的数量来测量完整颗粒与总颗粒的比率;使用衣壳特异性ELISA测量颗粒总数;并使用下式vg/ml÷颗粒/ml×100计算比率。
138.根据方面72-84、86-93、123-126或128-137中任一项所述的用途或方法,其中通过使用qPCR定量含有包含启动子序列的盒的核酸序列的数量(vg)来确定重组AAV的产量。
139.根据方面72-93、122-126或128-138中任一项所述的用途或方法,其中辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7、1.2:1至1:6、1.1:1至1:5、1:1至1:4、1:1.5至1:3、1:2至1:4或约为1:3。
140.根据方面72-93、122-126或128-139中任一项所述的用途或方法,其中辅助质粒与载体质粒的比率包含相比于辅助质粒摩尔过量的载体质粒。
141.根据方面72-140中任一项所述的方法或用途,其中宿主细胞选自HEK293T细胞、HEK293细胞、HEK293EBNA细胞、CAP细胞、CAP-T细胞、AGE1.CR细胞、PerC6细胞、C139细胞和EB66细胞。
142.根据方面72-141中任一项所述的方法或用途,其中宿主细胞是表达功能性E1A/B蛋白的细胞。
143.根据方面72-142中任一项所述的方法或用途,其还包括纯化重组AAV颗粒的步骤。
144.根据方面143所述的方法或用途,其中使用选自梯度密度离心(例如CsCl或碘克沙醇梯度密度离心)、过滤、离子交换层析、尺寸排阻层析、亲和层析和疏水相互作用层析的技术进行纯化重组AAV颗粒的步骤。
145.根据方面143或144所述的方法或用途,其包括使用超速离心、切向流过滤或凝胶过滤进一步浓缩重组AAV。
146.根据方面72-145中任一项所述的方法或用途,其包括用药学上可接受的赋形剂配制重组AAV。
147.可通过根据方面94-146中任一项所述的方法获得的重组AAV制剂。
148.通过根据方面94-146中任一项所述的方法获得的重组AAV制剂。
实施例
实施例1——构建(‘反式拆分’)双质粒系统的辅助质粒和载体质粒
辅助质粒
将含有rep和cap基因的野生型AAV2(Genbank登录号AF043303;SEQ ID NO:1)的核苷酸200-4497克隆到pUC19以制备辅助质粒(Yanisch-Perron et al(1985),Gene,33:103-119)。接下来,使AAV2核苷酸4461-4497缺失以使与载体质粒(其构建如下所述)的序列同源性最小化。为了在保持Rep 68表达的同时阻止Rep 78表达,使克隆的rep基因内的内含子缺失。为了在内含子缺失后提供Rep52的表达,将对应于包含p19启动子的rep 52的AAV2核苷酸克隆到紧邻无内含子rep 68基因的3'。然后使大多数cap基因序列缺失。
通过TATA盒的消融(对应于AAV2位置1823的T和对应于AAV2位置1826-1828的AAG的分别突变为C和CTC)使两个p40启动子(在Rep 68和Rep 52编码的rep基因重复中各有一个)变得无功能。
然后将所得“rep盒”克隆到包含8342个核苷酸链段的质粒中,该链段包含来自腺病毒(即辅助病毒)血清型5(SEQ ID NO:4)的功能性VA RNA I和II、E2A和E4基因。含有卡那霉素抗性基因和细菌复制起点的质粒主链长约2.2kb,产生了14021个核苷酸的辅助质粒。
图2是显示了主要特征的辅助质粒的示意图。对于“rep盒”,通过参考SEQ ID NO:1的核苷酸位置,指示了AAV2序列的部分。
载体质粒
将含有rep和cap基因的野生型AAV2(Genbank登录号AF043303;SEQ ID NO:1)的核苷酸200-4497克隆到pUC19以制备载体质粒。然后,分别在p5和p19之间以及p19和p40启动子之间使rep基因相连的两个部分缺失,以阻止Rep蛋白表达同时在三个启动子的调控下保持下游cap基因。如上针对辅助质粒所述的,使AAV2核苷酸4461-4497缺失以使与辅助质粒的序列同源性最小化。
为了最小化或阻止来自剩余启动子区域内潜在起始密码子的不需要的产物的翻译,去除了四个ATG密码子和一个GTG密码子:对应于AAV2核苷酸321-323、955-957和993-995位置处的ATG,以及对应于AAV2核苷酸1014-1016的GTG被缺失,而AAV2核苷酸766-768处的ATG被突变为ATT。
编码上述启动子区域紧邻3'VP 1、2和3的AAV2 cap基因被工程改造的cap基因的相应序列替换,所述cap基因比AAV2 cap基因长3个核苷酸(相当于一个额外的编码氨基酸)。将得到的“启动子-cap”盒克隆到含有卡那霉素抗性基因和细菌复制起点的质粒主链中。将表达盒插入到该主链中,该表达盒含有与启动子和多聚腺苷转录调控元件相连的转基因序列,侧接包含天然AAV2 ITR(AAV2核苷酸1-145和4535-4679)的AAV2序列。
在如在实施例2中使用的包含2672个核苷酸(ITR到ITR)因子IX表达盒的载体质粒的情况下,质粒主链的长度约为2.3kb,产生了8525个核苷酸的载体质粒。在所有后续工作中,包括生产实施例3的rAAV批次,质粒主链的长度减短到大约2kb。α-半乳糖苷酶A(GLA)表达盒(实施例3)的长度为2297个核苷酸。
图3是显示了主要特征的载体质粒的示意图。对于“启动子-cap”盒,通过参考SEQID NO:1的核苷酸位置,指示了AAV2序列的部分。
实施例2——双质粒系统:辅助质粒:载体质粒比率的比较
细胞培养
在标准条件下,在37℃、95%相对湿度和5%v/v CO2条件下,在补充有10%胎牛血清(FBS)和1%GlutaMaxTM(L-丙氨酸-L-谷氨酰胺二肽)的杜氏改良伊格尔培养基(DMEM)中贴壁培养维持HEK293T细胞。传代过程中的细胞汇合度范围为40-95%。
HEK293T细胞的转染及细胞裂解物的制备
用辅助质粒和载体质粒(后者包含工程改造的cap基因和因子IX表达盒;实施例1)使用不同的摩尔质粒比(从辅助质粒:载体质粒3:1到1:6)同时保持总质粒DNA量转染HEK293T细胞。在转染前一天,将每平方厘米培养面积1.5×105个活细胞接种在6厘米培养皿中,体积为3ml DMEM、10%FBS、1%GlutaMaxTM,在转染当天达到60-70%的汇合度。根据制造商的手册,使用线性聚乙烯亚胺转染试剂PEIproTM(Polyplus)在没有补充物的DMEM中制备PEI-DNA复合物。保持6μg总质粒DNA的量和PEI与DNA的比率为2:1,而与所应用的质粒组合比率无关。培养细胞直至转染后第3天,在培养基中收获并通过三个冻融循环(-80℃和37℃)裂解。通过以10,000×g离心5分钟去除细胞碎片。
rAAV载体基因组的定量
AAV载体基因组测定基于特异性针对rAAV表达盒的启动子序列的定量聚合酶链反应(qPCR)。原则上,qPCR引物可以设计为结合重组AAV基因组而在野生型AAV基因组中不常见的任何部分,但建议不要使用非常接近ITR的引物模板序列,因为这样做会导致载体基因组滴度测量被夸大。
使细胞裂解物测试样品经过核酸酶处理程序,以便在进行qPCR之前去除未包装的载体基因组。为此,在含有0.125%Pluronic F-68的无核酸酶水中以1:250的比例预稀释样品。25μl预稀释液用于用含有2个单位的Turbo DNase(ThermoFisher Scientific,Waltham,USA)和1×Turbo DNase反应缓冲液得到反应总体积为29μl进行消化。在37℃下孵育1小时。之后,加入1体积的0.4M NaOH并将样品在65℃下孵育45分钟。将补充有0.1%Pluronic F-68的1035μl无核酸酶的水与30μl 0.4M HCl一起加入。为了控制Turbo DNase消化的质量,平行测量了含有未纯化细胞裂解物的趋势对照,其具有已知的AAV载体基因组滴度和使用携带启动子序列的质粒DNA的掺入对照。
对于每个样品,将12.5μl QuantiFast SYBR Green PCR Master Mix(Qiagen,Venlo,Netherlands)与0.75μl qPCR引物工作储液(含有10μM的每种引物)混合,并用无核酸酶的水填充至至多20μl的体积。将5μl Turbo DNase处理的细胞裂解物或纯化的病毒测试样品添加到混合物中(总反应体积25μl,反应中的最终引物浓度各为300nM),并在CFX96Touch实时PCR循环仪(Bio-Rad Laboratories Inc.,Hercules,USA)中进行qPCR,程序步骤如下:95℃ 5分钟;39个循环(95℃ 10秒,60℃ 30秒,读板);95℃ 10秒;60-95℃(+0.5℃/步),10秒;读板。为了控制qPCR的质量,平行测量了具有已知AAV载体基因组滴度的趋势对照。为了检查污染,还包括无模板对照(NTC,5μl H2O)。对于每个稀释度,标准行、测试样品和对照一式三份进行测量。纯化的病毒测试样品和趋势对照通常在EB缓冲液(10mMTris-Cl,pH 8.5)中以3种不同的稀释度进行测量。Turbo DNase处理的细胞裂解物测试样品直接用于qPCR,无需进一步稀释。使用CFX ManagerTM软件3.1(Bio-Rad LaboratoriesInc.)分析数据。
解链曲线分析证实仅存在一种扩增子。用荧光嵌入剂SYBR Green检测到新生双链DNA扩增子的扩增结果,以实时监测PCR反应。线性化质粒形式的已知量的启动子遗传物质被连续稀释以产生标准曲线,并且从标准曲线插值得到样品载体基因组滴度。
rAAV颗粒(衣壳)的定量
AAV2滴定ELISA方法是对总AAV颗粒(衣壳)的测量,并且基于市售试剂盒(ProgenTM,Heidelberg,Germany;目录号PRATV)。这种夹心免疫测定技术利用单克隆抗体A20(Wobus et al(2000),JVirol,74:9281-9293)进行捕获和检测。该抗体特异性针对AAV2、AAV3血清型的组装衣壳和在这些实验中所使用的工程改造的衣壳上存在的构象表位。
根据制造商的说明,使用AAV2滴定ELISA试剂盒对细胞裂解物和纯化病毒制剂中的总AAV颗粒进行定量。简而言之,将100μl稀释的AAV2试剂盒对照、测试样品或具有已知总颗粒滴度的工程改造衣壳的趋势对照加入包被有单克隆抗体A20的微量滴定板的每个孔中,并在37℃下孵育1小时。对于每个稀释度,标准行、测试样品和对照物一式两份地测量。在第二步中,加入100μl预稀释的偶联有生物素的单克隆抗体A20(1:20在检测缓冲液[ASSB]中)并在37℃下孵育1小时。然后,加入100μl预稀释的链霉抗生物素蛋白过氧化物酶偶联物(1:20在ASSB中)并在37℃下孵育1小时。加入100μl底物溶液(TMB[四甲基联苯胺]),孵育15分钟后,使用100μl终止溶液终止反应。使用SpectraMax M3酶标仪(MolecularDevices,San Jose,USA)在450nm处光化学测量吸光度。使用SoftMax Pro 7.0软件(Molecular Devices)分析数据。
将测试样品稀释到测定范围内,并使用标准曲线(其使用所提供的AAV2试剂盒对照制备得到)通过插值法确定AAV总颗粒浓度。ASSB用作空白。
载体基因组与总颗粒的比率
载体基因组与总AAV颗粒的比率以百分比表示。这是基于载体基因组滴度(由qPCR测定,如上所述)和总AAV颗粒的数量(由衣壳ELISA测定,如上所述)。
结果
从图5A和B可以明显看出,载体质粒比例的提高导致更高的颗粒和载体基因组的产量。然而,颗粒(衣壳)产量的相对增加更为明显,并且更早实现了载体基因组产量的平台期。这些观察结果导致载体基因组与总颗粒的比率逐渐降低(图5C和7C)。与之前应用的1.8:1的比率相比,1:3的辅助质粒:载体质粒的比率导致载体基因组滴度几乎最大增加约3.5倍(图7B),而颗粒滴度增加了约8倍(图7A)。
为了比较,常规“非拆分”配置中的两个质粒(即其中一个质粒含有相同的AdV辅助和载体基因组(因子IX表达盒)序列,而另一个质粒除含有所有四个rep基因的AAV2 rep盒外还含有相同的cap基因序列,这样Rep和Cap功能不会在两个质粒之间拆分)以1.6:1的既定摩尔质粒比转染,展示了相当低的颗粒和载体基因组产量。
辅助质粒的后续确认测序揭示了对应于AAV2(SEQ ID NO:1)位置429-431的Rep68编码序列内密码子的突变,导致Rep 68蛋白的位置37的氨基酸从亮氨酸置换成苯丙氨酸。校正辅助质粒序列以恢复编码亮氨酸的野生型AAV2密码子,得到直接与“突变”的辅助质粒相比下vg/ml产量的增加和载体基因组与总颗粒的比率(即完整颗粒%)的约两倍增加。校正的辅助质粒序列用于所有后续工作,包括实施例3中分析的rAAV批次的生产。
实施例3——测定反式拆分双质粒系统生产的rAAV中具有复制能力的AAV(rcAAV) 频率
rcAAV测试
将使用
Figure BDA0003379222870000831
生物反应器用双质粒系统转染的细胞并使用许多下游工艺纯化以去除产品杂质而大规模生产的rAAV纯化的原料药物对rcAAV的存在进行了限制测试。使用包含工程改造的cap基因和(i)α-半乳糖苷酶A表达盒(如实施例1中所述)或(ii)除了不同的部分密码子优化的因子IX编码序列之外与实施例1中提到的相同的因子IX表达盒的载体质粒生产rAAV批次。用于生产这rAAV批次的两个质粒系统分别使用了如实施例1和2中提到的缩短的载体质粒主链和校正的辅助质粒序列。在该限制测试中,在存在或不存在野生型腺病毒的情况下,rAAV以其最浓缩的形式(药物后纯化和预配制)转导HEK293细胞。如下所述进行三轮连续的病毒扩增。
将细胞接种到T75/T175培养瓶中。在80%+/-10的汇合度和>90%的存活率下,以7.8×103的感染复数(MOI)和待测试的rAAV产品在有和没有辅助野生型腺病毒5型(“Ad5wt”)的情况下转导细胞。孵育2天后,通过机械分离收获细胞。从第一轮收集并离心三组细胞:1)保留备用(储存以备需要重复分析);2)用于DNA纯化和分析;3)进行第二轮转导。用于纯化和随后几轮转导的细胞通过在干冰/乙醇中冷冻/解冻(3x)至37℃水浴进行裂解,并通过在56℃度下孵育30分钟并以1500g离心2分钟来灭活Ad5wt。用来自第一次收获的裂解物在有和没有Ad5wt的情况下转导接种用于第二次转导的细胞,重复整个过程以收集来自第二次收获的样品。用来自第二次收获的裂解物在有和没有Ad5wt的情况下转导接种用于第三次转导的细胞,并重复整个过程,以收集来自第三次收获的样品。
使用
Figure BDA0003379222870000841
Tissue试剂盒(Qiagen)从三个扩增步骤中的每一个中提取基因组DNA,并在A260/A280下通过紫外光进行定量。通过实时定量PCR(qPCR)检测rcAAV的存在:从HEK293细胞中分离DNA,使用1)特异性针对AAV2的rep编码序列(“rep”)的引物,和2)HEK293细胞中的内源管家基因(人白蛋白;hAlb)从分离的DNA扩增两个序列。
将浓度为100ng的DNA添加到25μl qPCR反应中。rep的拷贝数是相对于质粒标准范围(每个qPCR反应从100到1×108个拷贝)计算的,每个细胞的rep序列的相对拷贝数计算为rep拷贝和人白蛋白序列拷贝的比率,乘以二(hAlb,两个拷贝/细胞)。在连续扩增轮次中每个细胞的rep序列水平增加表明存在rcAAV。
阳性对照是带有腺病毒的野生型AAV2(Ad5wt);它们单独测试或在rAAV产品样品存在的情况下作为抑制对照进行测试。对照确认测试的检测限(LOD)介于10个rcAAV/1×1010至10个rcAAV/1×1011vg AAV2的rAAV产品样品之间。LOD是一个测定和产品依赖性参数。阴性对照由未感染的细胞(有或没有腺病毒)和用wt AAV2(无腺病毒)转导的细胞组成。当每个细胞的rep序列拷贝数在3轮扩增中的至少1轮中大于10时建立复制,如果多于1轮则在后续轮中。没有rep被报告为“无复制”,这意味着在1×1010到1×1011vg的测试样品中<10个rcAAV。rep序列的检测报告为“复制”,即在1×1010到1×1011vg的测试样品中检测到rcAAV。
结果
对含有α-半乳糖苷酶A和含有因子IX的rAAV产品中的每一个的几个批次进行了限制测试。野生型AAV2与Ad5wt共感染的具有复制能力的阳性对照证实了通过该测定检测到rcAAV。掺入rAAV产品样品的rcAAV(AAV2)阳性对照显示没有样品抑制。阳性对照确认该测试的检测限(LOD)为每1×1011vg的含有因子IX的rAAV产品样品10个rcAAV,以及每1×1010或1×1011vg的含有α-半乳糖苷酶A的rAAV产品样品10个rcAAV。未感染细胞(有或无腺病毒)和用wt AAV2转导的细胞(无腺病毒)的阴性对照对rcAAV呈阴性。因此,使用双质粒系统生产的测试rAAV产品批次显示每1×1010vg的含有因子IX的rAAV产品含有<1个rcAAV,并且每1×109-1×1010vg的含有α-半乳糖苷酶A的rAAV产品含有<1个rcAAV。
实施例4——双质粒系统:在另外的转基因的情况下的辅助质粒:载体质粒的比率 的比较
细胞培养
在标准条件下,在37℃、95%相对湿度和5%v/v CO2条件下,在补充有5%胎牛血清(FBS)和2mM L-谷氨酰胺的杜氏改良伊戈尔培养基(DMEM)中贴壁培养维持HEK293细胞。传代过程中的细胞汇合度范围为40-95%。
HEK293细胞的转染及细胞裂解物的制备
用辅助质粒和载体质粒(后者包含工程改造的cap基因和β-葡糖脑苷脂酶[GBA]或因子VIII[FVIII]表达盒)使用不同的摩尔质粒比(从辅助质粒:载体质粒1:0.75至1:4.5)同时保持质粒DNA总量转染HEK293细胞。在转染前一天,将每平方厘米培养面积1.5×105个活细胞接种在6厘米培养皿中,体积为3ml DMEM、5%FBS、2mM L-谷氨酰胺,在转染当天达到60-70%的汇合度。根据制造商的手册,使用线性聚乙烯亚胺转染试剂PEIproTM(Polyplus)在没有补充物的DMEM中制备PEI-DNA复合物。保持6μg总质粒DNA的量和PEI与DNA的比率为2:1,而与所应用的质粒组合比率无关。培养细胞直至转染后第3天,在培养基中收获并通过三个冻融循环(-80℃和37℃)裂解。通过以10,000×g离心5分钟去除细胞碎片。
rAAV载体基因组的定量
AAV载体基因组测定基于特异性针对GBA表达盒的启动子序列或特异性针对FVIII表达盒的编码序列的定量聚合酶链反应(qPCR)。
使细胞裂解物测试样品经过核酸酶处理程序,以便在进行qPCR之前去除未包装的载体基因组。为此,在含有0.125%Pluronic F-68的无核酸酶水中以1:250的比例预稀释样品。25μl预稀释液用于用含有2个单位的Turbo DNase(ThermoFisher Scientific,Waltham,USA)和1×Turbo DNase反应缓冲液得到反应总体积为29μl进行消化。在37℃下孵育1小时。之后,加入1体积的0.4M NaOH并将样品在65℃下孵育45分钟。将补充有0.1%Pluronic F-68的1035μl无核酸酶的水与30μl 0.4M HCl一起加入。为了控制Turbo DNase消化的质量,平行测量了含有未纯化细胞裂解物的趋势对照,其具有已知的AAV载体基因组滴度和使用携带启动子序列(在GBA表达盒的情况下)或FVIII编码序列(在FVIII表达盒的情况下)的质粒DNA的掺入对照。
对于每个样品,将12.5μl QuantiFast SYBR Green PCR Master Mix(Qiagen,Venlo,Netherlands)与0.75μl qPCR引物工作储液(含有10μM的每种引物)混合,并用无核酸酶的水填充至至多20μl的体积。将5μl Turbo DNase处理的细胞裂解物或纯化的病毒测试样品添加到混合物中(总反应体积25μl,反应中的最终引物浓度各为300nM),并在CFX 96Touch实时PCR循环仪(Bio-Rad Laboratories Inc.,Hercules,USA)中进行qPCR,程序步骤如下:95℃ 5分钟;39个循环(95℃ 10秒,60℃ 30秒,读板);95℃ 10秒;60-95℃(+0.5℃/步),10秒;读板。为了控制qPCR的质量,平行测量了具有已知AAV载体基因组滴度的趋势对照。为了检查污染,还包括无模板对照(NTC,5μl H2O)。对于每个稀释度,标准行、测试样品和对照一式三份进行测量。纯化的病毒测试样品和趋势对照通常在EB缓冲液(10mM Tris-Cl,pH 8.5)中以3种不同的稀释度进行测量。Turbo DNase处理的细胞裂解物测试样品直接用于qPCR,无需进一步稀释。使用CFX ManagerTM软件3.1(Bio-Rad Laboratories Inc.)分析数据。
解链曲线分析证实仅存在一种扩增子。用荧光嵌入剂SYBR Green检测到新生双链DNA扩增子的扩增结果,以实时监测PCR反应。线性化质粒形式的已知量的启动子(对于GBA表达盒)盒编码序列(对于FVIII表达盒)遗传物质被连续稀释以产生标准曲线,并且从各自标准曲线插值得到样品载体基因组滴度。
rAAV颗粒(衣壳)的定量
AAV2滴定ELISA方法是对总AAV颗粒(衣壳)的测量,并且基于市售试剂盒(ProgenTM,Heidelberg,Germany;目录号PRATV)。这种夹心免疫测定技术利用单克隆抗体A20(Wobus et al(2000),JVirol,74:9281-9293)进行捕获和检测。该抗体特异性针对AAV2、AAV3血清型的组装衣壳和在这些实验中所使用的工程改造的衣壳上存在的构象表位。
根据制造商的说明,使用AAV2滴定ELISA试剂盒对细胞裂解物和纯化病毒制剂中的总AAV颗粒进行定量。简而言之,将100μl稀释的AAV2试剂盒对照、测试样品或具有已知总颗粒滴度的工程改造衣壳的趋势对照加入包被有单克隆抗体A20的微量滴定板的每个孔中,并在37℃下孵育1小时。对于每个稀释度,标准行、测试样品和对照物一式两份地测量。在第二步中,加入100μl预稀释的偶联有生物素的单克隆抗体A20(1:20在检测缓冲液[ASSB]中)并在37℃下孵育1小时。然后,加入100μl预稀释的链霉抗生物素蛋白过氧化物酶偶联物(1:20在ASSB中)并在37℃下孵育1小时。加入100μl底物溶液(TMB[四甲基联苯胺]),孵育15分钟后,使用100μl终止溶液终止反应。使用SpectraMax M3酶标仪(MolecularDevices,San Jose,USA)在450nm处光化学测量吸光度。使用SoftMax Pro 7.0软件(Molecular Devices)分析数据。
将测试样品稀释到测定范围内,并使用标准曲线(其使用所提供的AAV2试剂盒对照制备得到)通过插值法确定AAV总颗粒浓度。ASSB用作空白。
载体基因组与总颗粒的比率
载体基因组与总AAV颗粒的比率以百分比表示。这是基于载体基因组滴度(由qPCR测定,如上所述)和总AAV颗粒的数量(由衣壳ELISA测定,如上所述)。
结果
GBA(图8B-D)和FVIII(图8E-G)转基因情况下不同辅助载体:载体质粒的比率的比较证实了实施例2中的观察结果,即载体质粒比例的升高导致更高的颗粒和载体基因组的产量。由于颗粒(衣壳)产量的相对增加再次比载体基因组产量的相对增加更明显,因此注意到载体基因组与总颗粒的比率逐渐降低(图8D和8G)。辅助载体:载体1:3的质粒比率导致载体基因组滴度的几乎最大(GBA)或最大(FVIII)增加,同时保持高产量和可接受的载体基因组与总颗粒的比率之间的平衡。
实施例5——双质粒系统:各种转基因情况下的评价
细胞培养
在标准条件下,在37℃、95%相对湿度和5%v/v CO2条件下,在补充有10%胎牛血清(FBS)和1%GlutaMaxTM(L-丙氨酸-L-谷氨酰胺二肽)的杜氏改良伊格尔培养基(DMEM)中贴壁培养维持HEK293T细胞。传代过程中的细胞汇合度范围为40-95%。
在标准条件下,在37℃、95%相对湿度和5%v/v CO2条件下,在补充有5%胎牛血清(FBS)和2mM L-谷氨酰胺的杜氏改良伊戈尔培养基(DMEM)中贴壁培养维持HEK293细胞。传代过程中的细胞汇合度范围为40-95%。
HEK293T或HEK293细胞的转染及细胞裂解物的制备
用辅助质粒和载体质粒(后者包含工程改造的cap基因和因子IX、α-半乳糖苷酶A[GLA]、β-葡糖脑苷脂酶[GBA]或因子VIII[FVIII]表达盒)使用摩尔质粒比1:3(辅助质粒:载体质粒)同时保持质粒DNA总量转染HEK293T或HEK293细胞。在转染前一天,将每平方厘米培养面积1.5×105个活细胞接种在6厘米培养皿中,体积为3ml DMEM、10%FBS、1%GlutaMaxTM(HEK293T)或体积为3ml DMEM、5%FBS、2mM L-谷氨酰胺(HEK293),在转染当天达到60-70%的汇合度。根据制造商的手册,使用线性聚乙烯亚胺转染试剂PEIproTM(Polyplus)在没有补充物的DMEM中制备PEI-DNA复合物。保持6μg总质粒DNA的量和PEI与DNA的比率为2:1,而与所应用的质粒组合无关。培养细胞直至转染后第3天,在培养基中收获并通过三个冻融循环(-80℃和37℃)裂解。通过以10,000×g离心5分钟去除细胞碎片。在HEK293T细胞中制造含有因子IX或GLA表达盒的AAV载体,而在HEK293细胞中制造含有GBA或因子VIII表达盒的AAV载体。
rAAV载体基因组的定量
AAV载体基因组测定基于特异性针对rAAV表达盒的定量聚合酶链反应(qPCR)。
使细胞裂解物测试样品经过核酸酶处理程序,以便在进行qPCR之前去除未包装的载体基因组。为此,在含有0.125%Pluronic F-68的无核酸酶水中以1:250的比例预稀释样品。25μl预稀释液用于用含有2个单位的Turbo DNase(ThermoFisher Scientific,Waltham,USA)和1×Turbo DNase反应缓冲液得到反应总体积为29μl进行消化。在37℃下孵育1小时。之后,加入1体积的0.4M NaOH并将样品在65℃下孵育45分钟。将补充有0.1%Pluronic F-68的1035μl无核酸酶的水与30μl 0.4M HCl一起加入。为了控制Turbo DNase消化的质量,平行测量了含有未纯化细胞裂解物的趋势对照,其具有已知的AAV载体基因组滴度和使用携带启动子序列的质粒DNA的掺入对照。
对于每个样品,将12.5μl QuantiFast SYBR Green PCR Master Mix(Qiagen,Venlo,Netherlands)与0.75μl qPCR引物工作储液(含有10μM的每种引物)混合,并用无核酸酶的水填充至至多20μl的体积。将5μl Turbo DNase处理的细胞裂解物或纯化的病毒测试样品添加到混合物中(总反应体积25μl,反应中的最终引物浓度各为300nM),并在CFX96Touch实时PCR循环仪(Bio-Rad Laboratories Inc.,Hercules,USA)中进行qPCR,程序步骤如下:95℃ 5分钟;39个循环(95℃ 10秒,60℃ 30秒,读板);95℃ 10秒;60-95℃(+0.5℃/步),10秒;读板。为了控制qPCR的质量,平行测量了具有已知AAV载体基因组滴度的趋势对照。为了检查污染,还包括无模板对照(NTC,5μl H2O)。对于每个稀释度,标准行、测试样品和对照一式三份进行测量。纯化的病毒测试样品和趋势对照通常在EB缓冲液(10mMTris-Cl,pH 8.5)中以3种不同的稀释度进行测量。Turbo DNase处理的细胞裂解物测试样品直接用于qPCR,无需进一步稀释。使用CFX ManagerTM软件3.1(Bio-Rad LaboratoriesInc.)分析数据。
解链曲线分析证实仅存在一种扩增子。用荧光嵌入剂SYBR Green检测到新生双链DNA扩增子的扩增结果,以实时监测PCR反应。线性化质粒形式的已知量的启动子遗传物质被连续稀释以产生标准曲线,并且从标准曲线插值得到样品载体基因组滴度。
结果
含有不同大小的转基因和表达盒(因子IX[FIX]、α-半乳糖苷酶A[GLA]、β-葡糖脑苷脂酶[GBA]和因子VIII[FVIII])的四种不同的载体基因组在两个独立实验中被各自包装到工程改造的衣壳中。如图8A所示,当HEK293T和HEK293细胞用于载体生产时,不依赖于表达盒并且两者都实现了稳健的高载体基因组产量。这些结果表明,该质粒系统能够用作在不同人胚胎肾293细胞谱系中制造各种编码AAV载体的转基因的平台。
实施例6——双质粒系统:各种血清型盒工程改造的cap基因情况下的评估
细胞培养
在标准条件下,在37℃、95%相对湿度和5%v/v CO2条件下,在补充有10%胎牛血清(FBS)和1%GlutaMaxTM(L-丙氨酸-L-谷氨酰胺二肽)的杜氏改良伊格尔培养基(DMEM)中贴壁培养维持HEK293T细胞。传代过程中的细胞汇合度范围为40-95%。
HEK293T细胞的转染及细胞裂解物的制备
用辅助质粒和载体质粒(后者包含因子IX表达盒和AAV-2、AAV-5、AAV-8、AAV-9或工程改造的cap基因)使用摩尔质粒比1:3(辅助质粒:载体质粒)同时保持总质粒DNA量转染HEK293T细胞。在转染前一天,将每平方厘米培养面积1.5×105个活细胞接种在6厘米培养皿中,体积为3ml DMEM、10%FBS、1%GlutaMaxTM,在转染当天达到60-70%的汇合度。根据制造商的手册,使用线性聚乙烯亚胺转染试剂PEIproTM(Polyplus)在没有补充物的DMEM中制备PEI-DNA复合物。保持6μg总质粒DNA的量和PEI与DNA的比率为2:1,而与所应用的质粒组合无关。培养细胞直至转染后第3天,在培养基中收获并通过三个冻融循环(-80℃和37℃)裂解。通过以10,000×g离心5分钟去除细胞碎片。
rAAV载体基因组的定量
AAV载体基因组测定基于特异性针对rAAV表达盒的启动子序列的定量聚合酶链反应(qPCR)。
使细胞裂解物测试样品经过核酸酶处理程序,以便在进行qPCR之前去除未包装的载体基因组。为此,在含有0.125%Pluronic F-68的无核酸酶水中以1:250的比例预稀释样品。25μl预稀释液用于用含有2个单位的Turbo DNase(ThermoFisher Scientific,Waltham,USA)和1×Turbo DNase反应缓冲液得到反应总体积为29μl进行消化。在37℃下孵育1小时。之后,加入1体积的0.4M NaOH并将样品在65℃下孵育45分钟。将补充有0.1%Pluronic F-68的1035μl无核酸酶的水与30μl 0.4M HCl一起加入。为了控制Turbo DNase消化的质量,平行测量了含有未纯化细胞裂解物的趋势对照,其具有已知的AAV载体基因组滴度和使用携带启动子序列的质粒DNA的掺入对照。
对于每个样品,将12.5μl QuantiFast SYBR Green PCR Master Mix(Qiagen,Venlo,Netherlands)与0.75μl qPCR引物工作储液(含有10μM的每种引物)混合,并用无核酸酶的水填充至至多20μl的体积。将5μl Turbo DNase处理的细胞裂解物或纯化的病毒测试样品添加到混合物中(总反应体积25μl,反应中的最终引物浓度各为300nM),并在CFX96Touch实时PCR循环仪(Bio-Rad Laboratories Inc.,Hercules,USA)中进行qPCR,程序步骤如下:95℃ 5分钟;39个循环(95℃ 10秒,60℃ 30秒,读板);95℃ 10秒;60-95℃(+0.5℃/步),10秒;读板。为了控制qPCR的质量,平行测量了具有已知AAV载体基因组滴度的趋势对照。为了检查污染,还包括无模板对照(NTC,5μl H2O)。对于每个稀释度,标准行、测试样品和对照一式三份进行测量。纯化的病毒测试样品和趋势对照通常在EB缓冲液(10mMTris-Cl,pH 8.5)中以3种不同的稀释度进行测量。Turbo DNase处理的细胞裂解物测试样品直接用于qPCR,无需进一步稀释。使用CFX ManagerTM软件3.1(Bio-Rad LaboratoriesInc.)分析数据。
解链曲线分析证实仅存在一种扩增子。用荧光嵌入剂SYBR Green检测到新生双链DNA扩增子的扩增结果,以实时监测PCR反应。线性化质粒形式的已知量的启动子遗传物质被连续稀释以产生标准曲线,并且从标准曲线插值得到样品载体基因组滴度。
结果
编码因子IX的载体基因组被包装到工程改造的衣壳以及天然存在的AAV-2、AAV-5、AAV-8和AAV-9血清型衣壳中。图9中描述的获得的载体基因组产量在合理范围内,最高值和最低值之间的差异小于3倍。因此,该质粒系统被认为是在各种衣壳变体的情况下生产AAV载体的合适平台。
实施例7——双质粒系统:在各种转基因情况下选择的辅助质粒:载体质粒的比率 的比较
细胞培养
在标准条件下,在37℃、95%相对湿度和5%v/v CO2条件下,在补充有10%胎牛血清(FBS)和1%GlutaMaxTM(L-丙氨酸-L-谷氨酰胺二肽)的杜氏改良伊格尔培养基(DMEM)中贴壁培养维持HEK293T细胞。传代过程中的细胞汇合度范围为40-95%。
HEK293T细胞的转染及细胞裂解物的制备
用辅助质粒和载体质粒(后者包含工程改造的cap基因和因子IX表达盒[FIX]、α-半乳糖苷酶A[GLA]、β-葡糖脑苷脂酶[GBA]或因子VIII[FVIII]表达盒)使用两种不同摩尔质粒比(辅助质粒:载体质粒1.8:1和1:3)同时保持总质粒DNA量转染HEK293T细胞。在转染前一天,将每平方厘米培养面积1.5×105个活细胞接种在6厘米培养皿中,体积为3mlDMEM、10%FBS、1%GlutaMaxTM,在转染当天达到60-70%的汇合度。根据制造商的手册,使用线性聚乙烯亚胺转染试剂PEIproTM(Polyplus)在没有补充物的DMEM中制备PEI-DNA复合物。保持6μg总质粒DNA的量和PEI与DNA的比率为2:1,而与所应用的质粒组合比率无关。培养细胞直至转染后第3天,在培养基中收获并通过三个冻融循环(-80℃和37℃)裂解。通过以10,000×g离心5分钟去除细胞碎片。
rAAV载体基因组的定量
AAV载体基因组测定基于特异性针对rAAV表达盒的启动子序列的定量聚合酶链反应(qPCR)。
使细胞裂解物测试样品经过核酸酶处理程序,以便在进行qPCR之前去除未包装的载体基因组。为此,在含有0.125%Pluronic F-68的无核酸酶水中以1:250的比例预稀释样品。25μl预稀释液用于用含有2个单位的Turbo DNase(ThermoFisher Scientific,Waltham,USA)和1×Turbo DNase反应缓冲液得到反应总体积为29μl进行消化。在37℃下孵育1小时。之后,加入1体积的0.4M NaOH并将样品在65℃下孵育45分钟。将补充有0.1%Pluronic F-68的1035μl无核酸酶的水与30μl 0.4M HCl一起加入。为了控制Turbo DNase消化的质量,平行测量了含有未纯化细胞裂解物的趋势对照,其具有已知的AAV载体基因组滴度和使用携带启动子序列的质粒DNA的掺入对照。
对于每个样品,将12.5μl QuantiFast SYBR Green PCR Master Mix(Qiagen,Venlo,Netherlands)与0.75μl qPCR引物工作储液(含有10μM的每种引物)混合,并用无核酸酶的水填充至至多20μl的体积。将5μl Turbo DNase处理的细胞裂解物或纯化的病毒测试样品添加到混合物中(总反应体积25μl,反应中的最终引物浓度各为300nM),并在CFX 96Touch实时PCR循环仪(Bio-Rad Laboratories Inc.,Hercules,USA)中进行qPCR,程序步骤如下:95℃ 5分钟;39个循环(95℃ 10秒,60℃ 30秒,读板);95℃ 10秒;60-95℃(+0.5℃/步),10秒;读板。为了控制qPCR的质量,平行测量了具有已知AAV载体基因组滴度的趋势对照。为了检查污染,还包括无模板对照(NTC,5μl H2O)。对于每个稀释度,标准行、测试样品和对照一式三份进行测量。纯化的病毒测试样品和趋势对照通常在EB缓冲液(10mM Tris-Cl,pH 8.5)中以3种不同的稀释度进行测量。Turbo DNase处理的细胞裂解物测试样品直接用于qPCR,无需进一步稀释。使用CFX ManagerTM软件3.1(Bio-Rad Laboratories Inc.)分析数据。
解链曲线分析证实仅存在一种扩增子。用荧光嵌入剂SYBR Green检测到新生双链DNA扩增子的扩增结果,以实时监测PCR反应。线性化质粒形式的已知量的启动子遗传物质被连续稀释以产生标准曲线,并且从标准曲线插值得到样品载体基因组滴度。
结果
已在实施例5中使用并含有不同大小的转基因的四种不同载体质粒以先前应用的1.8:1的辅助质粒:载体质粒的比率和1:3的质粒比率转染到HEK293T细胞中。在所有情况下,观察到1:3的质粒比率的载体基因组产量显著提高,其范围为从4.55倍到9.32倍的增加(图8H),突显了1:3的质粒比率在含有各种表达盒的AAV载体的情况下的优势。
实施例8——研究由反式拆分双质粒系统生产的具有复制能力的AAV(rcAAV,其包 括rep缺陷型rcAAV、cap缺陷型rcAAV和假野生型rcAAV)
来自实施例3的限制测试表明,使用反式拆分双质粒系统生产的测试rAAV产品批次显示每1×1010vg的含有因子IX的rAAV产品含有<1个rcAAV,并且每1×109-1×1010vg的含有α-半乳糖苷酶A的rAAV产品含有<1个rcAAV。因此,生产任何rcAAV均为罕见事件。为了研究反式拆分双质粒系统是否产生了任何rcAAV,以及这种rcAAV与传统“非拆分”配置产生的任何rcAAV相比如何,进行了以下一系列实验。
质粒
对于反式拆分双质粒系统,辅助质粒和载体质粒的构建如实施例1所述。图2和3分别提供了辅助质粒和载体质粒的示意图。分别如实施例1和2所述使用缩短的载体质粒主链和校正的辅助质粒序列。载体质粒包含与实施例3中提到的相同的工程改造的cap基因和因子IX表达盒。
使用常规“非拆分”配置的两个质粒进行比较。一个质粒含有与反式拆分双质粒系统中使用的相同的AdV辅助和载体基因组(因子IX表达盒)序列。另一个质粒(在本文中也称为“P-143”)包含与反式拆分双质粒系统中使用的相同的cap基因序列和包含所有四个rep基因的AAV2 rep盒,使得Rep和Cap功能没有在两个质粒之间拆分(图14)。因此,cap和rep基因处于如图1所示的野生型配置中。
所使用的辅助质粒也称为“P-150”,所使用的载体质粒也称为“P-160”。
细胞培养
如实施例2中在“细胞培养”部分中所述培养HEK293T细胞。
HEK293T细胞的转染及纯化rAAV
对于反式拆分双质粒系统和对于非拆分系统,用辅助质粒和载体质粒使用不同的摩尔质粒比同时保持总质粒DNA量转染HEK293T细胞。反式拆分双质粒系统的辅助质粒:载体质粒的比率为1:3,非拆分系统的AdV辅助表达盒:cap-rep的比率为1.8:1。在转染前一天,将每平方厘米培养面积8×104个活细胞接种在15厘米培养皿中,体积为25ml DMEM、10%FBS、1%GlutaMaxTM,在转染当天达到60-70%的汇合度。根据制造商的手册,使用线性聚乙烯亚胺转染试剂PEIproTM(Polyplus)在没有补充物的DMEM中制备PEI-DNA复合物。保持每个板42μg总质粒DNA的量和PEI与DNA的比率为2:1,而与所应用的质粒组合比率无关。培养细胞直至转染后第3天,在培养基中收获并通过三个冻融循环(-80℃和37℃)裂解。用Denarase(Sartorius Stedim Biotech)处理一组七个培养皿以去除残留的质粒DNA,并通过亲和层析进行纯化。qPCR用于定量rAAV载体基因组(即确定rAAV载体基因组滴度),用于最终在PBS中配制的纯化的反式拆分双质粒系统和非拆分系统rAAV。通过扩增rAAV表达盒的启动子序列中的区域进行qPCR。如上文实施例2中“rAAV载体基因组的定量”部分所述进行qPCR。非拆分系统制剂的滴度为1.3×1012vg/ml,而反式拆分双质粒系统制剂的滴度为8.2×1012vg/ml。
rcAAV(包括rep缺陷型rcAAV、cap缺陷型rcAAV和假野生型rcAAV)的富集和载体DNA的分离
由于从反式拆分双质粒系统生产的任何rcAAV都是罕见的事件,因此在进一步的Southern印迹、qPCR和PCR分析之前对rcAAV种类(species)进行了富集。
为了富集rcAAV颗粒,用反式拆分双质粒系统(也称为“拆分样品”)和非拆分系统(也称为“非拆分样品”)产生的rAAV感染HEK293T细胞。用最浓缩形式的rAAV样品感染HEK293T细胞,并与Ad5wt共感染。如下所述,总共进行了两轮连续感染。为了在这两轮过程中生产AAV颗粒,需要用包含Rep和Cap功能的rcAAV感染HEK293T细胞,或者用其中细胞中存在的rcAAV组合提供Rep和Cap功能的超过一个rcAAV感染HEK293T细胞。
将细胞以1.2e5个vc/cm2(vc=活细胞)接种于96孔板中。第二天,在80%+/-10%汇合度下,在每孔150μl的总体积中,以2.5的MOI用25μl未稀释的rAAV样品感染细胞并与Ad5wt共感染。作为阴性对照,某些孔仅在150μl总体积中用Ad5wt以2.5的MOI感染,而不添加rAAV样品。
感染后3天,通过三个冻融循环(-80℃和37℃)在培养基中裂解细胞,并在56℃下35分钟灭活Ad5wt。将每个孔中的25μl裂解物转移到新的96孔板的孔中,用于第二轮感染。如第一轮感染那样,在第二轮感染中,将细胞以1.2e5个vc/cm2接种于96孔板中,第二天,在80%+/-10%汇合度下,在每孔150μl的总体积中,以2.5的MOI用25μl来自第一轮感染的裂解物并与Ad5wt共感染。
感染后3天,通过三个冻融循环(-80℃和37℃)在培养基中裂解细胞,并在56℃下35分钟灭活Ad5wt。用150μl PBS以1:16稀释10μl的每种裂解物。通过靶向cap基因中的特异性序列以qPCR分析5μl的该稀释液,以确认在rAAV/Ad5wt感染的孔中是否存在含有cap序列的颗粒。除了所使用的针对cap序列的引物外,以与实施例2中“rAAV载体基因组的定量”部分下的qPCR相同的方式进行qPCR。所使用的是以下引物:
正向cap引物:TACTGAGGGACCATGAAGAC(SEQ ID NO:9)
反向cap引物:GTTTACGGACTCGGAGTATC(SEQ ID NO:10)
仅用Ad5wt的感染(阴性对照)在qPCR中没有显示出针对cap序列的特异性产物,而rAAV/Ad5wt感染的孔则显示出具有Cq(定量循环)值<25的特异性产物。
收获第二轮感染后来自cap阳性孔的裂解物、合并以及通过以3500×g离心5分钟去除细胞碎片。为了从裂解液中包装的AAV颗粒中分离DNA,游离的细胞DNA通过在37℃下使用75U/ml Denarase(Sartorius Stedim Biotech)消化1.5小时去除。通过随后在65℃下孵育裂解物30分钟,使脱核酶失活。然后使用QIAamp MinElute Virus Spin Kit(Qiagen)分离来自包装的AAV颗粒的DNA,根据柱上样前的裂解液体积增加缓冲液AL体积和乙醇。没有使用承载体RNA。为了能够更快地将更大体积的样品上样到色谱柱中,应用了抽吸泵。蛋白酶K水平和柱上样后的所有后续步骤均根据制造商的说明进行,而不去适应裂解液体积。DNA在30-50μl无核酸酶的水中洗脱,用于如下所示的Southern印迹、qPCR和PCR分析(参见实施例9和10)。
为了用作阳性对照,一些孔用含有4.7kb vg的具有复制能力的AAV感染,其中含有功能性rep和cap基因,侧接ITR,而不是用含有FIX的rAAV感染并与Ad5wt共感染。阳性对照的感染、收获和分析与rAAV/Ad5wt感染平行进行。该样品被命名为“rcAAV感染后”,并在以下印迹和基于PCR的分析中用作阳性对照。包括该样品以证明当存在功能性rep和cap基因时,可以在测定系统中产生rcAAV。
实施例9——使用Southern印迹来研究由反式拆分双质粒系统生产的具有复制能 力的AAV(rcAAV,其包括rep缺陷型rcAAV、cap缺陷型rcAAV和假野生型rcAAV)
方法
通过Southern印迹用靶向rep或cap序列的探针分析在实施例8中两轮感染(用于富集rcAAV)后分离的DNA。其中用于感染的rAAV是使用非拆分系统产生的分离的DNA样品也称为“富集的非拆分DNA样品”。其中用于感染的rAAV是使用反式拆分双质粒系统产生的分离的DNA样品也称为“富集的拆分DNA样品”。
用6×上样缓冲液(18%Ficoll、300mM NaOH、6mM EDTA、2.4%SDS、0.15%二甲苯氰醇)将分离的DNA样品上样到1%碱性琼脂糖(GeneOn)凝胶(50mM NaOH、1mM EDTA)上并在4℃下以24V运行17小时。通过在1×TAE缓冲液(40mM Tris-醋酸盐,1mM EDTA pH 8.3)中洗涤3×15分钟来进行中和,然后在1×TAE中用10×GelRedTM(Bovendis)将凝胶染色1小时以显示DNA分子量条带。在Fusion检测系统(Vilber)上以紫外光模式拍摄凝胶照片。
为了制备DNA以进行转移,将凝胶在脱嘌呤缓冲液(0.29M HCl)中孵育30分钟。随后在变性缓冲液(0.5M NaOH、1.5M NaCl)中再振荡30分钟后,将凝胶在中和缓冲液(1MTrizma碱、2M NaCl)中中和30分钟。使用Biometra Vacu-印迹装置(Analytik Jena)使用20×SSC缓冲液(3M NaCl、0.3M柠檬酸三钠二水合物)在100mbar下进行5小时,将DNA转移到Amersham Hybond N+印迹膜(GE Healthcare)上。
通过辅助质粒(P-150)的PCR扩增产生604bp的大rep特异性探针。通过P-143质粒的PCR扩增产生2200bp的大cap特异性探针。2200bp的大cap特异性探针几乎涵盖所有cap基因序列。两个PCR均在具有40个循环的常规PCR循环仪系统中进行。使用QIAquick PCR纯化试剂盒(Qiagen)纯化探针。
根据制造商的说明,通过带有CDP-Star(GE Healthcare)的AlkPhos DirectTM标记和检测系统进行探针标记和检测。用Fusion检测系统在化学发光模式下拍摄6小时获取照片。
除了富集的拆分DNA样品和富集的非拆分DNA样品外,还另外上样了几个对照样品。上样了含有功能性rep和cap基因的具有复制能力的AAV(命名为“rcAAV”)。两条“rcAAV”泳道上样在凝胶的两侧。两条“rcAAV”泳道的拷贝数分别为1e7和1e6 vg/泳道。包括不同的拷贝数作为灵敏度对照。还包括“rcAAV”对照以指示野生型排列形式的4.7kb基因组大小。用于分离样品生成的两种质粒(P-150辅助质粒;和P-160载体质粒)也被消化,并上样编码rep或cap基因的片段以检查探针的特异性。最后,制备并上样名为“rcAAV感染后”的样品。“rcAAV感染后”包含来自实施例8中讨论的阳性对照的纯化DNA。
结果
进行Southern印迹分析是为了显示和比较在富集的非拆分DNA样品和富集的拆分DNA样品中携带rep和/或cap序列产生的rcAAV种类。
cap Southern印迹(图11A)显示富集的非拆分DNA样品和富集的拆分DNA样品都没有明显的条带,而“rcAAV”和“rcAAV感染后”对照样品则可以看到明显的条带。虽然非拆分样品和拆分样品主要在泳道上显示出涂抹条带(smear),但可以检测到非拆分样品的在4.7kb左右信号最强的扩散条带,其对应于携带功能性rep和cap基因的野生型长度。相比之下,拆分样品(在cap印迹上以不同的量上样)显示出各种种类,其信号最强的明显低于4.7kb的野生型长度。这表明拆分样品中最突出的种类(在富集后被检测到)包含cap基因和/或rep基因的缺失。
在rep Southern印迹(图11B)上,所有对照都显示了预期的条带模式,其中对于非拆分样品可以检测到涂抹条带,而对于拆分样品则几乎没有检测到信号。对于拆分样品,既不能检测到明显的条带,也不能检测到强烈的涂抹条带。
由于Southern印迹的灵敏度限制(在开发过程中已经进行了显著优化),因此使用基于PCR的分析来更详细地表征rcAAV富集后存在的种类。
实施例10——使用qPCR来研究由反式拆分双质粒系统生产的具有复制能力的AAV (rcAAV,其包括rep缺陷型rcAAV、cap缺陷型rcAAV和假野生型rcAAV)
方法
使用qPCR测试在实施例8中从使用非拆分系统(也称为“富集的非拆分DNA样品”)和拆分系统(也称为“富集的拆分DNA样品”)产生的rAAV的两轮感染(用于富集rcAAV)后的等体积裂解物分离的DNA,以定量rep和cap序列的量。
在样品中检测到的rep和cap的拷贝数是相对于质粒标准范围(每个qPCR反应从100到1×108个拷贝)计算的。简而言之,已知数量的含有rep(P-150)或含有cap(P-160)的线性化质粒被连续稀释以产生标准曲线,并且从标准曲线插值得到样品中rep和cap的拷贝数。
除了所使用的针对rep和cap序列的引物外,qPCR以与实施例2中“rAAV载体基因组的定量”部分下的qPCR相同的方式进行。所使用的是以下引物:
结合rep的引物(结合于rep68外显子1中,它们不结合于P-160中):
正向rep引物:5’-CACGTGCATGTGGAAGTAG-3’(SEQ ID NO:7)
反向rep引物:5’-CGACTTTCTGACGGAATGG-3’(SEQ ID NO:8)
结合于cap序列中的引物:
正向cap引物:5’-TACTGAGGGACCATGAAGAC-3’(SEQ ID NO:9)
反向cap引物:5’-GTTTACGGACTCGGAGTATC-3’(SEQ ID NO:10)
结果
比较富集的非拆分DNA样品和富集的拆分DNA样品中的rep和cap序列的量,以评估富集的rcAAV颗粒的分子排列并比较两个质粒系统。
在非拆分系统中,cap和rep序列都来自用于rAAV生产的同一质粒(P-143),因此不需要重组事件以将rep和cap基因放在一个DNA分子上。因此,在两轮感染(用于富集rcAAV)后产生的大部分rcAAV可能在同一DNA分子上携带cap和rep序列。比较检测到的rep和cap序列的数量的结果支持了这一点。从富集的非拆分DNA样品中检测到几乎等量的rep和cap序列。cap与rep序列的比例(即cap的量除以rep的量)为0.66。
相比之下,富集的拆分DNA样品的cap序列是rep的约40倍(cap的量除以rep的量为39.74)。由于存在的cap明显多于rep,因此在产生的AAV中,cap和rep序列可能没有存在于同一DNA分子上。这与rep和cap序列存在于拆分质粒系统中不同质粒上一致,因此,重组发生的要求是rep和cap序列都存在于同一DNA分子上。因此,反式拆分双质粒系统似乎产生较少的包含rep和cap序列的AAV种类。
比较从两个样品中检测到的rep拷贝的量,富集的拆分DNA样品包含的rep种类比富集的非拆分DNA样品少得多,富集的非拆分DNA样品显示的rep数量是富集的DNA样品1.7倍。值得注意的是,从拆分质粒系统产生并用于两轮感染(用于富集rcAAV)的rAAV的初始滴度是非拆分质粒系统产生的rAAV的等效初始滴度的6.3倍。当考虑到初始滴度的差异时,似乎富集的非拆分DNA样品含有的rep序列是富集的拆分DNA样品的10.7倍。
为了比较可能由拆分和非拆分质粒系统产生的包含rep和cap序列的rcAAV的最大可能量,在富集的拆分DNA样品和富集的非拆分DNA样品之间进行了比较。当rep和cap的数量不相等时,rep和cap之间的较低数量表示在同一DNA分子上包含rep和cap基因的AAV种类的最大可能数。在富集的非拆分DNA样品中,cap的数量低于rep,而在富集的拆分DNA样品中,rep的数量低于cap。来自富集的非拆分DNA样品的cap数量比来自富集的拆分DNA样品的rep数量高11%。再者,考虑到由拆分质粒系统产生并用于两轮感染(用于富集rcAAV)的rAAV初始滴度是非拆分质粒系统产生的rAAV的等效初始滴度的6.3倍,似乎富集的非拆分DNA样品含有的可能同时包含rep和cap序列的AAV种类是富集的拆分DNA样品的7倍,它们。
当在两轮感染(用于富集)之前由拆分和非拆分系统产生的rAAV群体中的rep和cap的数量通过qPCR测量时,也获得了与上述结果类似的结果。
实施例11——使用PCR来研究由反式拆分双质粒系统生产的具有复制能力的AAV (rcAAV,其包括rep缺陷型rcAAV、cap缺陷型rcAAV和假野生型rcAAV)
方法
对在实施例8中两轮感染(用于富集rcAAV)后的等体积裂解物分离的DNA进行PCR分析,以鉴定在同一分子上含有功能性Rep和Cap的序列的AAV种类。设计了两个引物组。
引物组O-108/109:引物O-108结合于rep68基因序列中。该序列存在于反式拆分双质粒系统的辅助质粒(P-150)中。引物O-109结合于反式拆分双质粒系统的载体质粒(P-160)中存在的cap序列中(图15)。使用O-108/109引物对从富集的拆分DNA样品中产生扩增产物表明在用于rAAV生产的两个质粒(P-150和P-160)之间发生了重组事件。
引物组O-119/117:引物O-119结合于上述引物O-108的142bp 5′处的rep68基因序列中。该序列存在于反式拆分双质粒系统的辅助质粒(P-150)中。引物O-117从反式拆分双质粒系统的载体质粒(P-160)中存在的cap序列的终止密码子开始(图15)。使用O-119/117引物对从富集的拆分DNA样品中产生扩增产物也表明在用于rAAV生产的两个质粒(P-150和P-160)之间发生了重组事件。
引物组O-119/117应检测与引物组O-108/109相同的重组事件,但扩增了较大部分的rep和cap序列(包括所有cap基因序列)。
PCR操作方案:在25μl的总体积中,将12.5μl 2×HotStarTaq Plus Master Mix(Qiagen)与相应的引物对(每个引物的终浓度为200nM)和10μl的1:100稀释的样品DNA混合。P-143质粒用作阳性对照,每个反应有106个拷贝。在热循环仪(BioRad)上使用下述相应程序进行PCR。作为另外的对照,平行运行非模板对照(NTC),其中将10μl无核酸酶的水代替样品DNA添加到PCR混合物中。
为了进行凝胶分析,将10μl的每种PCR产物与2μl 6×DNA上样缓冲液混合,并上样到含有1×TAE(40mM Tris-醋酸盐、1mM EDTA pH 8.3)和0.005%ROTIGel Stain的1%琼脂糖凝胶上(Carl Roth,)。进行凝胶运行直到可以检测到最佳分子量条带(PeqLab)分离。用Fusion检测系统(Vilber)在紫外光模式下拍摄照片。
为了进行测序,从琼脂糖凝胶上切下检测到的DNA条带,并使用QIAquick凝胶提取试剂盒(Qiagen)进行纯化,然后送至GATC(Konstanz)。
O-108/109和O-119/117的PCR程序:95℃ 5分钟;39个循环(94℃ 30秒,60℃ 30秒,72℃ 4分钟);72℃ 10分钟;保持
结果
进行PCR分析是为了尝试从富集的DNA样品中检测在一个分子上携带rep和cap基因的种类。因此,正向引物(O-108和O-119)置于rep68基因中,而反向引物(O-109和O-117)置于cap基因序列中。由于正向引物O-108和O-119结合在最初存在于辅助质粒中的rep序列中,而反向引物O-109和O-117结合在最初存在于载体质粒中的cap序列中,富集的拆分DNA样品所获得的PCR产物代表源于载体包装期间反式拆分系统的两个质粒序列之间的同源重组事件的AAV种类。由于rep和cap序列存在于非拆分系统中的同一质粒上,因此使用这些引物对从富集的非拆分DNA样品中获得PCR产物不需要同源重组。
如图12所示,对于富集的非拆分DNA样品,在约3.5kb的长度处检测到引物对O-108/109的强PCR产物。这对应于P-143质粒中rep和cap序列的原始(野生型)排列,并且还通过纯化PCR产物的测序得到证实(数据未显示)。该产物被认为具有潜在功能性,因为它在扩增的rep-cap序列中不包含缺失。
对于富集的拆分DNA样品,在约2.8kb的长度处检测到最强的PCR产物。对该约2.8kb条带的测序证实存在反式拆分两个质粒系统的载体质粒(P-160)和辅助质粒(P-150)的重组产物,从而产生如图15所示的具有非功能性rep基因座的rep-cap分子。从图15中可以看出,重组产物没有原始辅助质粒中存在的一部分rep基因座(标记为***的框)。因此不存在功能性rep基因(因为包含rep基因座部分的每个rep基因(rep68、rep78、rep40和rep52)都不存在)。在3.5kb处检测到的条带非常弱,由于低丰度而无法测序,但可能代表了类似rep-cap野生型的排列,与富集的非拆分DNA样品中检测到的种类相当。图16描绘了导致这种野生型样排列的反式拆分双质粒系统的载体质粒(P-160)和辅助质粒(P-150)之间可能的同源重组事件。当重复使用引物对O-108/109进行PCR扩增时(如图13所示),未检测到3.5kb条带,证实其低丰度。
将富集的拆分DNA样品的潜在功能性重排rep-cap 3.5kb PCR产物与富集的非拆分DNA样品的潜在功能性rep-cap 3.5kb PCR产物进行比较,显示与拆分系统相比,非拆分系统的产物强得多。因此,与富集的非拆分DNA样品相比,富集的拆分DNA样品中一个DNA分子上的rep和cap的潜在野生型配置较低。与实现没有功能性rep的产物所需的同源重组(如图15所示)相比,拆分系统中实现重排的潜在野生型配置(如图16所示)所需的同源重组似乎代表性不足。当考虑到由拆分质粒系统产生并用于两轮感染(用于富集rcAAV)的rAAV的初始滴度是非拆分质粒系统产生的rAAV的等效初始滴度的6.3倍时,似乎在富集的拆分DNA样品中检测到的潜在功能性rep-cap AAV种类的数量明显低于富集的非拆分DNA样品。使用Bio1D软件(Vilber)对图12中所示的3.5kb条带进行定量信号积分。富集的非拆分DNA样品的条带强度是富集的拆分DNA样品的条带强度的7.2倍。考虑到非拆分的3.5kb条带已经处于饱和状态(因此被低估),并且从拆分质粒系统产生的rAAV的初始滴度是从非拆分质粒系统产生的rAAV的等效初始滴度的6.3倍,似乎在拆分样品和非拆分样品之间检测到的潜在功能性rep-cap AAV种类至少有45倍的差异。
使用第二个引物对O-119/117进行的PCR产生与使用引物O-108/109进行的PCR相似的结果(图13)。重复使用引物对O-108/109的PCR扩增并显示在图13中。第二个引物对O-119/117扩增了的rep-cap序列的更大部分,包括几乎整个rep基因座并包括所有cap基因序列。对于引物对O-119/117,富集的非拆分DNA样品具有长度约为4.1kb的强PCR产物,这对应于P-143质粒中rep和cap序列的原始(野生型)排列,并且还通过对纯化的PCR产物进行测序得到证实(数据未显示)。对于富集的拆分DNA样品,在约3.5kb的长度处检测到最强的PCR产物。如对于由O-108/109引物对扩增的约2.8kb产物那样,对该约3.5kb条带的测序证实了存在如图15所示的反式拆分双质粒系统产生具有非功能性rep基因座的rep-cap分子的载体质粒(P-160)和辅助质粒(P-150)的重组产物。如对于由O-108/109引物对扩增的少量约3.5kb产物那样,使用O-119/117引物对检测到的约4.1kb的条带非常弱,由于低丰度而无法测序,但可能代表了与富集非拆分DNA样品中检测到的种类相当的rep-cap潜在野生型样排列。图16描绘了反式拆分双质粒系统的导致这种野生型样排列的载体质粒(P-160)和辅助质粒(P-150)之间可能的同源重组事件。
序列表
<110> 自由行疗法有限公司
<120> 质粒系统
<130> N415537WO
<150> EP19169121.1
<151> 2019-04-12
<150> GB1905263.8
<151> 2019-04-12
<160> 10
<170> PatentIn version 3.5
<210> 1
<211> 4679
<212> DNA
<213> 2型腺相关病毒
<400> 1
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctggagg ggtggagtcg tgacgtgaat tacgtcatag 180
ggttagggag gtcctgtatt agaggtcacg tgagtgtttt gcgacatttt gcgacaccat 240
gtggtcacgc tgggtattta agcccgagtg agcacgcagg gtctccattt tgaagcggga 300
ggtttgaacg cgcagccgcc atgccggggt tttacgagat tgtgattaag gtccccagcg 360
accttgacga gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg 420
aatgggagtt gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga 480
ccgtggccga gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc 540
cggaggccct tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc 600
tcgtggaaac caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg 660
aaaaactgat tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg 720
tcacaaagac cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc 780
ccaattactt gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac 840
agtatttaag cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga 900
cgcacgtgtc gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc 960
cggtgatcag atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca 1020
aggggattac ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca 1080
atgcggcctc caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta 1140
tgagcctgac taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt 1200
ccagcaatcg gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt 1260
ccgtctttct gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg 1320
ggcctgcaac taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct 1380
acgggtgcgt aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg 1440
tgatctggtg ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc 1500
tcggaggaag caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga 1560
ctcccgtgat cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga 1620
ccttcgaaca ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc 1680
tggatcatga ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa 1740
aggatcacgt ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa 1800
gacccgcccc cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc 1860
agccatcgac gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat 1920
gttctcgtca cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga 1980
atcagaattc aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg 2040
tgtcagaatc tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc 2100
atcatatcat gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt 2160
tggatgactg catctttgaa caataaatga tttaaatcag gtatggctgc cgatggttat 2220
cttccagatt ggctcgagga cactctctct gaaggaataa gacagtggtg gaagctcaaa 2280
cctggcccac caccaccaaa gcccgcagag cggcataagg acgacagcag gggtcttgtg 2340
cttcctgggt acaagtacct cggacccttc aacggactcg acaagggaga gccggtcaac 2400
gaggcagacg ccgcggccct cgagcacgac aaagcctacg accggcagct cgacagcgga 2460
gacaacccgt acctcaagta caaccacgcc gacgcggagt ttcaggagcg ccttaaagaa 2520
gatacgtctt ttgggggcaa cctcggacga gcagtcttcc aggcgaaaaa gagggttctt 2580
gaacctctgg gcctggttga ggaacctgtt aagacggctc cgggaaaaaa gaggccggta 2640
gagcactctc ctgtggagcc agactcctcc tcgggaaccg gaaaggcggg ccagcagcct 2700
gcaagaaaaa gattgaattt tggtcagact ggagacgcag actcagtacc tgacccccag 2760
cctctcggac agccaccagc agccccctct ggtctgggaa ctaatacgat ggctacaggc 2820
agtggcgcac caatggcaga caataacgag ggcgccgacg gagtgggtaa ttcctcggga 2880
aattggcatt gcgattccac atggatgggc gacagagtca tcaccaccag cacccgaacc 2940
tgggccctgc ccacctacaa caaccacctc tacaaacaaa tttccagcca atcaggagcc 3000
tcgaacgaca atcactactt tggctacagc accccttggg ggtattttga cttcaacaga 3060
ttccactgcc acttttcacc acgtgactgg caaagactca tcaacaacaa ctggggattc 3120
cgacccaaga gactcaactt caagctcttt aacattcaag tcaaagaggt cacgcagaat 3180
gacggtacga cgacgattgc caataacctt accagcacgg ttcaggtgtt tactgactcg 3240
gagtaccagc tcccgtacgt cctcggctcg gcgcatcaag gatgcctccc gccgttccca 3300
gcagacgtct tcatggtgcc acagtatgga tacctcaccc tgaacaacgg gagtcaggca 3360
gtaggacgct cttcatttta ctgcctggag tactttcctt ctcagatgct gcgtaccgga 3420
aacaacttta ccttcagcta cacttttgag gacgttcctt tccacagcag ctacgctcac 3480
agccagagtc tggaccgtct catgaatcct ctcatcgacc agtacctgta ttacttgagc 3540
agaacaaaca ctccaagtgg aaccaccacg cagtcaaggc ttcagttttc tcaggccgga 3600
gcgagtgaca ttcgggacca gtctaggaac tggcttcctg gaccctgtta ccgccagcag 3660
cgagtatcaa agacatctgc ggataacaac aacagtgaat actcgtggac tggagctacc 3720
aagtaccacc tcaatggcag agactctctg gtgaatccgg gcccggccat ggcaagccac 3780
aaggacgatg aagaaaagtt ttttcctcag agcggggttc tcatctttgg gaagcaaggc 3840
tcagagaaaa caaatgtgga cattgaaaag gtcatgatta cagacgaaga ggaaatcagg 3900
acaaccaatc ccgtggctac ggagcagtat ggttctgtat ctaccaacct ccagagaggc 3960
aacagacaag cagctaccgc agatgtcaac acacaaggcg ttcttccagg catggtctgg 4020
caggacagag atgtgtacct tcaggggccc atctgggcaa agattccaca cacggacgga 4080
cattttcacc cctctcccct catgggtgga ttcggactta aacaccctcc tccacagatt 4140
ctcatcaaga acaccccggt acctgcgaat ccttcgacca ccttcagtgc ggcaaagttt 4200
gcttccttca tcacacagta ctccacggga caggtcagcg tggagatcga gtgggagctg 4260
cagaaggaaa acagcaaacg ctggaatccc gaaattcagt acacttccaa ctacaacaag 4320
tctgttaatg tggactttac tgtggacact aatggcgtgt attcagagcc tcgccccatt 4380
ggcaccagat acctgactcg taatctgtaa ttgcttgtta atcaataaac cgtttaattc 4440
gtttcagttg aactttggtc tctgcgtatt tctttcttat ctagtttcca tggctacgta 4500
gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc 4560
actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 4620
ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 4679
<210> 2
<211> 35938
<212> DNA
<213> 5型腺病毒
<400> 2
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc 420
cgggtcaaag ttggcgtttt attattatag tcagctgacg tgtagtgtat ttatacccgg 480
tgagttcctc aagaggccac tcttgagtgc cagcgagtag agttttctcc tccgagccgc 540
tccgacaccg ggactgaaaa tgagacatat tatctgccac ggaggtgtta ttaccgaaga 600
aatggccgcc agtcttttgg accagctgat cgaagaggta ctggctgata atcttccacc 660
tcctagccat tttgaaccac ctacccttca cgaactgtat gatttagacg tgacggcccc 720
cgaagatccc aacgaggagg cggtttcgca gatttttccc gactctgtaa tgttggcggt 780
gcaggaaggg attgacttac tcacttttcc gccggcgccc ggttctccgg agccgcctca 840
cctttcccgg cagcccgagc agccggagca gagagccttg ggtccggttt ctatgccaaa 900
ccttgtaccg gaggtgatcg atcttacctg ccacgaggct ggctttccac ccagtgacga 960
cgaggatgaa gagggtgagg agtttgtgtt agattatgtg gagcaccccg ggcacggttg 1020
caggtcttgt cattatcacc ggaggaatac gggggaccca gatattatgt gttcgctttg 1080
ctatatgagg acctgtggca tgtttgtcta cagtaagtga aaattatggg cagtgggtga 1140
tagagtggtg ggtttggtgt ggtaattttt tttttaattt ttacagtttt gtggtttaaa 1200
gaattttgta ttgtgatttt tttaaaaggt cctgtgtctg aacctgagcc tgagcccgag 1260
ccagaaccgg agcctgcaag acctacccgc cgtcctaaaa tggcgcctgc tatcctgaga 1320
cgcccgacat cacctgtgtc tagagaatgc aatagtagta cggatagctg tgactccggt 1380
ccttctaaca cacctcctga gatacacccg gtggtcccgc tgtgccccat taaaccagtt 1440
gccgtgagag ttggtgggcg tcgccaggct gtggaatgta tcgaggactt gcttaacgag 1500
cctgggcaac ctttggactt gagctgtaaa cgccccaggc cataaggtgt aaacctgtga 1560
ttgcgtgtgt ggttaacgcc tttgtttgct gaatgagttg atgtaagttt aataaagggt 1620
gagataatgt ttaacttgca tggcgtgtta aatggggcgg ggcttaaagg gtatataatg 1680
cgccgtgggc taatcttggt tacatctgac ctcatggagg cttgggagtg tttggaagat 1740
ttttctgctg tgcgtaactt gctggaacag agctctaaca gtacctcttg gttttggagg 1800
tttctgtggg gctcatccca ggcaaagtta gtctgcagaa ttaaggagga ttacaagtgg 1860
gaatttgaag agcttttgaa atcctgtggt gagctgtttg attctttgaa tctgggtcac 1920
caggcgcttt tccaagagaa ggtcatcaag actttggatt tttccacacc ggggcgcgct 1980
gcggctgctg ttgctttttt gagttttata aaggataaat ggagcgaaga aacccatctg 2040
agcggggggt acctgctgga ttttctggcc atgcatctgt ggagagcggt tgtgagacac 2100
aagaatcgcc tgctactgtt gtcttccgtc cgcccggcga taataccgac ggaggagcag 2160
cagcagcagc aggaggaagc caggcggcgg cggcaggagc agagcccatg gaacccgaga 2220
gccggcctgg accctcggga atgaatgttg tacaggtggc tgaactgtat ccagaactga 2280
gacgcatttt gacaattaca gaggatgggc aggggctaaa gggggtaaag agggagcggg 2340
gggcttgtga ggctacagag gaggctagga atctagcttt tagcttaatg accagacacc 2400
gtcctgagtg tattactttt caacagatca aggataattg cgctaatgag cttgatctgc 2460
tggcgcagaa gtattccata gagcagctga ccacttactg gctgcagcca ggggatgatt 2520
ttgaggaggc tattagggta tatgcaaagg tggcacttag gccagattgc aagtacaaga 2580
tcagcaaact tgtaaatatc aggaattgtt gctacatttc tgggaacggg gccgaggtgg 2640
agatagatac ggaggatagg gtggccttta gatgtagcat gataaatatg tggccggggg 2700
tgcttggcat ggacggggtg gttattatga atgtaaggtt tactggcccc aattttagcg 2760
gtacggtttt cctggccaat accaacctta tcctacacgg tgtaagcttc tatgggttta 2820
acaatacctg tgtggaagcc tggaccgatg taagggttcg gggctgtgcc ttttactgct 2880
gctggaaggg ggtggtgtgt cgccccaaaa gcagggcttc aattaagaaa tgcctctttg 2940
aaaggtgtac cttgggtatc ctgtctgagg gtaactccag ggtgcgccac aatgtggcct 3000
ccgactgtgg ttgcttcatg ctagtgaaaa gcgtggctgt gattaagcat aacatggtat 3060
gtggcaactg cgaggacagg gcctctcaga tgctgacctg ctcggacggc aactgtcacc 3120
tgctgaagac cattcacgta gccagccact ctcgcaaggc ctggccagtg tttgagcata 3180
acatactgac ccgctgttcc ttgcatttgg gtaacaggag gggggtgttc ctaccttacc 3240
aatgcaattt gagtcacact aagatattgc ttgagcccga gagcatgtcc aaggtgaacc 3300
tgaacggggt gtttgacatg accatgaaga tctggaaggt gctgaggtac gatgagaccc 3360
gcaccaggtg cagaccctgc gagtgtggcg gtaaacatat taggaaccag cctgtgatgc 3420
tggatgtgac cgaggagctg aggcccgatc acttggtgct ggcctgcacc cgcgctgagt 3480
ttggctctag cgatgaagat acagattgag gtactgaaat gtgtgggcgt ggcttaaggg 3540
tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg 3600
ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc 3660
gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc 3720
ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg 3780
agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg 3840
actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg 3900
acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt 3960
ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca 4020
atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt 4080
cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt 4140
cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat 4200
acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg 4260
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt 4320
ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt 4380
taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt 4440
tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag 4500
tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact 4560
tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg 4620
gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt 4680
ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg 4740
gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg 4800
ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg 4860
gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc 4920
cggtgggccc gtaaatcaca cctattaccg ggtgcaactg gtagttaaga gagctgcagc 4980
tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt 5040
ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag 5100
caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa 5160
gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat 5220
ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag 5280
acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac 5340
ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct 5400
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt 5460
gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc 5520
gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga 5580
ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca 5640
ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt 5700
cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc 5760
cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag 5820
aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg 5880
ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat 5940
gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg 6000
tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc 6060
atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac 6120
ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc 6180
ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc 6240
aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag 6300
ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc 6360
gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac 6420
gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag 6480
gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc 6540
tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc 6600
gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc 6660
aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga 6720
ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt 6780
agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg 6840
agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg 6900
cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc 6960
gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac 7020
cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc 7080
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc 7140
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta 7200
gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg 7260
cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag 7320
gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt 7380
gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc 7440
cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt 7500
aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta 7560
aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt 7620
gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt 7680
ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa 7740
ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg 7800
gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag 7860
aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc 7920
ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg 7980
cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg 8040
gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc 8100
gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg 8160
cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc 8220
tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac 8280
caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac 8340
aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg 8400
gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata 8460
cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg 8520
cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc 8580
atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg 8640
agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg 8700
ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag 8760
acgacgggcc cggtgagctt gagcctgaaa gagagttcga cagaatcaat ttcggtgtcg 8820
ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc 8880
tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg 8940
gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc 9000
tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc 9060
tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag 9120
aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc 9180
aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc 9240
acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga 9300
cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct 9360
tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg 9420
ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc 9480
atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc 9540
agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc 9600
agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg 9660
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag 9720
tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg 9780
tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg 9840
gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg 9900
ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct 9960
accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg 10020
gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc 10080
ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc 10140
acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg 10200
ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc 10260
gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa 10320
gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc 10380
cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg 10440
tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg 10500
cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg 10560
ccggtcaggc gcgcgcaatc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg 10620
ggcactcttc cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt 10680
tcgagccccg tatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc 10740
caggtgtgcg acgtcagaca acgggggagt gctccttttg gcttccttcc aggcgcggcg 10800
gctgctgcgc tagctttttt ggccactggc cgcgcgcagc gtaagcggtt aggctggaaa 10860
gcgaaagcat taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc 10920
gcgggacccc cggttcgagt ctcggaccgg ccggactgcg gcgaacgggg gtttgcctcc 10980
ccgtcatgca agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc 11040
ttttcccaga tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag 11100
caagagcagc ggcagacatg cagggcaccc tcccctcctc ctaccgcgtc aggaggggcg 11160
acatccgcgg ttgacgcggc agcagatggt gattacgaac ccccgcggcg ccgggcccgg 11220
cactacctgg acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag 11280
cggtacccaa gggtgcagct gaagcgtgat acgcgtgagg cgtacgtgcc gcggcagaac 11340
ctgtttcgcg accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca 11400
gggcgcgagc tgcggcatgg cctgaatcgc gagcggttgc tgcgcgagga ggactttgag 11460
cccgacgcgc gaaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta 11520
accgcatacg agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac 11580
gtgcgtacgc ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt 11640
gtaagcgcgc tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata 11700
gtgcagcaca gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc 11760
gagggccgct ggctgctcga tttgataaac atcctgcaga gcatagtggt gcaggagcgc 11820
agcttgagcc tggctgacaa ggtggccgcc atcaactatt ccatgcttag cctgggcaag 11880
ttttacgccc gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc 11940
gaggggttct acatgcgcat ggcgctgaag gtgcttacct tgagcgacga cctgggcgtt 12000
tatcgcaacg agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac 12060
cgcgagctga tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag 12120
gccgagtcct actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg 12180
gaggcagctg gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc 12240
ggcgtggagg aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg 12300
gtgatgtttc tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc 12360
agagccagcc gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca 12420
tgtcgctgac tgcgcgcaat cctgacgcgt tccggcagca gccgcaggcc aaccggctct 12480
ccgcaattct ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg 12540
cgatcgtaaa cgcgctggcc gaaaacaggg ccatccggcc cgacgaggcc ggcctggtct 12600
acgacgcgct gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg 12660
accggctggt gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg 12720
gcaacctggg ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc 12780
cgcggggaca ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga 12840
caccgcaaag tgaggtgtac cagtctgggc cagactattt tttccagacc agtagacaag 12900
gcctgcagac cgtaaacctg agccaggctt tcaaaaactt gcaggggctg tggggggtgc 12960
gggctcccac aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt 13020
tgctgctgct aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag 13080
gtcacttgct gacactgtac cgcgaggcca taggtcaggc gcatgtggac gagcatactt 13140
tccaggagat tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg 13200
caaccctaaa ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa 13260
acagcgagga ggagcgcatt ttgcgctacg tgcagcagag cgtgagcctt aacctgatgc 13320
gcgacggggt aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca 13380
tgtatgcctc aaaccggccg tttatcaacc gcctaatgga ctacttgcat cgcgcggccg 13440
ccgtgaaccc cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg 13500
gtttctacac cgggggattc gaggtgcccg agggtaacga tggattcctc tgggacgaca 13560
tagacgacag cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc 13620
aggcagaggc ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag 13680
gcgctgcggc cccgcggtca gatgctagta gcccatttcc aagcttgata gggtctctta 13740
ccagcactcg caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc 13800
tgctgcagcc gcagcgcgaa aaaaacctgc ctccggcatt tcccaacaac gggatagaga 13860
gcctagtgga caagatgagt agatggaaga cgtacgcgca ggagcacagg gacgtgccag 13920
gcccgcgccc gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg 13980
acgatgactc ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg 14040
cgcaccttcg ccccaggctg gggagaatgt tttaaaaaaa aaaaagcatg atgcaaaata 14100
aaaaactcac caaggccatg gcaccgagcg ttggttttct tgtattcccc ttagtatgcg 14160
gcgcgcggcg atgtatgagg aaggtcctcc tccctcctac gagagtgtgg tgagcgcggc 14220
gccagtggcg gcggcgctgg gttctccctt cgatgctccc ctggacccgc cgtttgtgcc 14280
tccgcggtac ctgcggccta ccggggggag aaacagcatc cgttactctg agttggcacc 14340
cctattcgac accacccgtg tgtacctggt ggacaacaag tcaacggatg tggcatccct 14400
gaactaccag aacgaccaca gcaactttct gaccacggtc attcaaaaca atgactacag 14460
cccgggggag gcaagcacac agaccatcaa tcttgacgac cggtcgcact ggggcggcga 14520
cctgaaaacc atcctgcata ccaacatgcc aaatgtgaac gagttcatgt ttaccaataa 14580
gtttaaggcg cgggtgatgg tgtcgcgctt gcctactaag gacaatcagg tggagctgaa 14640
atacgagtgg gtggagttca cgctgcccga gggcaactac tccgagacca tgaccataga 14700
ccttatgaac aacgcgatcg tggagcacta cttgaaagtg ggcagacaga acggggttct 14760
ggaaagcgac atcggggtaa agtttgacac ccgcaacttc agactggggt ttgaccccgt 14820
cactggtctt gtcatgcctg gggtatatac aaacgaagcc ttccatccag acatcatttt 14880
gctgccagga tgcggggtgg acttcaccca cagccgcctg agcaacttgt tgggcatccg 14940
caagcggcaa cccttccagg agggctttag gatcacctac gatgatctgg agggtggtaa 15000
cattcccgca ctgttggatg tggacgccta ccaggcgagc ttgaaagatg acaccgaaca 15060
gggcgggggt ggcgcaggcg gcagcaacag cagtggcagc ggcgcggaag agaactccaa 15120
cgcggcagcc gcggcaatgc agccggtgga ggacatgaac gatcatgcca ttcgcggcga 15180
cacctttgcc acacgggctg aggagaagcg cgctgaggcc gaagcagcgg ccgaagctgc 15240
cgcccccgct gcgcaacccg aggtcgagaa gcctcagaag aaaccggtga tcaaacccct 15300
gacagaggac agcaagaaac gcagttacaa cctaataagc aatgacagca ccttcaccca 15360
gtaccgcagc tggtaccttg catacaacta cggcgaccct cagaccggaa tccgctcatg 15420
gaccctgctt tgcactcctg acgtaacctg cggctcggag caggtctact ggtcgttgcc 15480
agacatgatg caagaccccg tgaccttccg ctccacgcgc cagatcagca actttccggt 15540
ggtgggcgcc gagctgttgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta 15600
ctcccaactc atccgccagt ttacctctct gacccacgtg ttcaatcgct ttcccgagaa 15660
ccagattttg gcgcgcccgc cagcccccac catcaccacc gtcagtgaaa acgttcctgc 15720
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac 15780
cattactgac gccagacgcc gcacctgccc ctacgtttac aaggccctgg gcatagtctc 15840
gccgcgcgtc ctatcgagcc gcactttttg agcaagcatg tccatcctta tatcgcccag 15900
caataacaca ggctggggcc tgcgcttccc aagcaagatg tttggcgggg ccaagaagcg 15960
ctccgaccaa cacccagtgc gcgtgcgcgg gcactaccgc gcgccctggg gcgcgcacaa 16020
acgcggccgc actgggcgca ccaccgtcga tgacgccatc gacgcggtgg tggaggaggc 16080
gcgcaactac acgcccacgc cgccaccagt gtccacagtg gacgcggcca ttcagaccgt 16140
ggtgcgcgga gcccggcgct atgctaaaat gaagagacgg cggaggcgcg tagcacgtcg 16200
ccaccgccgc cgacccggca ctgccgccca acgcgcggcg gcggccctgc ttaaccgcgc 16260
acgtcgcacc ggccgacggg cggccatgcg ggccgctcga aggctggccg cgggtattgt 16320
cactgtgccc cccaggtcca ggcgacgagc ggccgccgca gcagccgcgg ccattagtgc 16380
tatgactcag ggtcgcaggg gcaacgtgta ttgggtgcgc gactcggtta gcggcctgcg 16440
cgtgcccgtg cgcacccgcc ccccgcgcaa ctagattgca agaaaaaact acttagactc 16500
gtactgttgt atgtatccag cggcggcggc gcgcaacgaa gctatgtcca agcgcaaaat 16560
caaagaagag atgctccagg tcatcgcgcc ggagatctat ggccccccga agaaggaaga 16620
gcaggattac aagccccgaa agctaaagcg ggtcaaaaag aaaaagaaag atgatgatga 16680
tgaacttgac gacgaggtgg aactgctgca cgctaccgcg cccaggcgac gggtacagtg 16740
gaaaggtcga cgcgtaaaac gtgttttgcg acccggcacc accgtagtct ttacgcccgg 16800
tgagcgctcc acccgcacct acaagcgcgt gtatgatgag gtgtacggcg acgaggacct 16860
gcttgagcag gccaacgagc gcctcgggga gtttgcctac ggaaagcggc ataaggacat 16920
gctggcgttg ccgctggacg agggcaaccc aacacctagc ctaaagcccg taacactgca 16980
gcaggtgctg cccgcgcttg caccgtccga agaaaagcgc ggcctaaagc gcgagtctgg 17040
tgacttggca cccaccgtgc agctgatggt acccaagcgc cagcgactgg aagatgtctt 17100
ggaaaaaatg accgtggaac ctgggctgga gcccgaggtc cgcgtgcggc caatcaagca 17160
ggtggcgccg ggactgggcg tgcagaccgt ggacgttcag atacccacta ccagtagcac 17220
cagtattgcc accgccacag agggcatgga gacacaaacg tccccggttg cctcagcggt 17280
ggcggatgcc gcggtgcagg cggtcgctgc ggccgcgtcc aagacctcta cggaggtgca 17340
aacggacccg tggatgtttc gcgtttcagc cccccggcgc ccgcgcggtt cgaggaagta 17400
cggcgccgcc agcgcgctac tgcccgaata tgccctacat ccttccattg cgcctacccc 17460
cggctatcgt ggctacacct accgccccag aagacgagca actacccgac gccgaaccac 17520
cactggaacc cgccgccgcc gtcgccgtcg ccagcccgtg ctggccccga tttccgtgcg 17580
cagggtggct cgcgaaggag gcaggaccct ggtgctgcca acagcgcgct accaccccag 17640
catcgtttaa aagccggtct ttgtggttct tgcagatatg gccctcacct gccgcctccg 17700
tttcccggtg ccgggattcc gaggaagaat gcaccgtagg aggggcatgg ccggccacgg 17760
cctgacgggc ggcatgcgtc gtgcgcacca ccggcggcgg cgcgcgtcgc accgtcgcat 17820
gcgcggcggt atcctgcccc tccttattcc actgatcgcc gcggcgattg gcgccgtgcc 17880
cggaattgca tccgtggcct tgcaggcgca gagacactga ttaaaaacaa gttgcatgtg 17940
gaaaaatcaa aataaaaagt ctggactctc acgctcgctt ggtcctgtaa ctattttgta 18000
gaatggaaga catcaacttt gcgtctctgg ccccgcgaca cggctcgcgc ccgttcatgg 18060
gaaactggca agatatcggc accagcaata tgagcggtgg cgccttcagc tggggctcgc 18120
tgtggagcgg cattaaaaat ttcggttcca ccgttaagaa ctatggcagc aaggcctgga 18180
acagcagcac aggccagatg ctgagggata agttgaaaga gcaaaatttc caacaaaagg 18240
tggtagatgg cctggcctct ggcattagcg gggtggtgga cctggccaac caggcagtgc 18300
aaaataagat taacagtaag cttgatcccc gccctcccgt agaggagcct ccaccggccg 18360
tggagacagt gtctccagag gggcgtggcg aaaagcgtcc gcgccccgac agggaagaaa 18420
ctctggtgac gcaaatagac gagcctccct cgtacgagga ggcactaaag caaggcctgc 18480
ccaccacccg tcccatcgcg cccatggcta ccggagtgct gggccagcac acacccgtaa 18540
cgctggacct gcctcccccc gccgacaccc agcagaaacc tgtgctgcca ggcccgaccg 18600
ccgttgttgt aacccgtcct agccgcgcgt ccctgcgccg cgccgccagc ggtccgcgat 18660
cgttgcggcc cgtagccagt ggcaactggc aaagcacact gaacagcatc gtgggtctgg 18720
gggtgcaatc cctgaagcgc cgacgatgct tctgaatagc taacgtgtcg tatgtgtgtc 18780
atgtatgcgt ccatgtcgcc gccagaggag ctgctgagcc gccgcgcgcc cgctttccaa 18840
gatggctacc ccttcgatga tgccgcagtg gtcttacatg cacatctcgg gccaggacgc 18900
ctcggagtac ctgagccccg ggctggtgca gtttgcccgc gccaccgaga cgtacttcag 18960
cctgaataac aagtttagaa accccacggt ggcgcctacg cacgacgtga ccacagaccg 19020
gtcccagcgt ttgacgctgc ggttcatccc tgtggaccgt gaggatactg cgtactcgta 19080
caaggcgcgg ttcaccctag ctgtgggtga taaccgtgtg ctggacatgg cttccacgta 19140
ctttgacatc cgcggcgtgc tggacagggg ccctactttt aagccctact ctggcactgc 19200
ctacaacgcc ctggctccca agggtgcccc aaatccttgc gaatgggatg aagctgctac 19260
tgctcttgaa ataaacctag aagaagagga cgatgacaac gaagacgaag tagacgagca 19320
agctgagcag caaaaaactc acgtatttgg gcaggcgcct tattctggta taaatattac 19380
aaaggagggt attcaaatag gtgtcgaagg tcaaacacct aaatatgccg ataaaacatt 19440
tcaacctgaa cctcaaatag gagaatctca gtggtacgaa actgaaatta atcatgcagc 19500
tgggagagtc cttaaaaaga ctaccccaat gaaaccatgt tacggttcat atgcaaaacc 19560
cacaaatgaa aatggagggc aaggcattct tgtaaagcaa caaaatggaa agctagaaag 19620
tcaagtggaa atgcaatttt tctcaactac tgaggcgacc gcaggcaatg gtgataactt 19680
gactcctaaa gtggtattgt acagtgaaga tgtagatata gaaaccccag acactcatat 19740
ttcttacatg cccactatta aggaaggtaa ctcacgagaa ctaatgggcc aacaatctat 19800
gcccaacagg cctaattaca ttgcttttag ggacaatttt attggtctaa tgtattacaa 19860
cagcacgggt aatatgggtg ttctggcggg ccaagcatcg cagttgaatg ctgttgtaga 19920
tttgcaagac agaaacacag agctttcata ccagcttttg cttgattcca ttggtgatag 19980
aaccaggtac ttttctatgt ggaatcaggc tgttgacagc tatgatccag atgttagaat 20040
tattgaaaat catggaactg aagatgaact tccaaattac tgctttccac tgggaggtgt 20100
gattaataca gagactctta ccaaggtaaa acctaaaaca ggtcaggaaa atggatggga 20160
aaaagatgct acagaatttt cagataaaaa tgaaataaga gttggaaata attttgccat 20220
ggaaatcaat ctaaatgcca acctgtggag aaatttcctg tactccaaca tagcgctgta 20280
tttgcccgac aagctaaagt acagtccttc caacgtaaaa atttctgata acccaaacac 20340
ctacgactac atgaacaagc gagtggtggc tcccgggtta gtggactgct acattaacct 20400
tggagcacgc tggtcccttg actatatgga caacgtcaac ccatttaacc accaccgcaa 20460
tgctggcctg cgctaccgct caatgttgct gggcaatggt cgctatgtgc ccttccacat 20520
ccaggtgcct cagaagttct ttgccattaa aaacctcctt ctcctgccgg gctcatacac 20580
ctacgagtgg aacttcagga aggatgttaa catggttctg cagagctccc taggaaatga 20640
cctaagggtt gacggagcca gcattaagtt tgatagcatt tgcctttacg ccaccttctt 20700
ccccatggcc cacaacaccg cctccacgct tgaggccatg cttagaaacg acaccaacga 20760
ccagtccttt aacgactatc tctccgccgc caacatgctc taccctatac ccgccaacgc 20820
taccaacgtg cccatatcca tcccctcccg caactgggcg gctttccgcg gctgggcctt 20880
cacgcgcctt aagactaagg aaaccccatc actgggctcg ggctacgacc cttattacac 20940
ctactctggc tctataccct acctagatgg aaccttttac ctcaaccaca cctttaagaa 21000
ggtggccatt acctttgact cttctgtcag ctggcctggc aatgaccgcc tgcttacccc 21060
caacgagttt gaaattaagc gctcagttga cggggagggt tacaacgttg cccagtgtaa 21120
catgaccaaa gactggttcc tggtacaaat gctagctaac tacaacattg gctaccaggg 21180
cttctatatc ccagagagct acaaggaccg catgtactcc ttctttagaa acttccagcc 21240
catgagccgt caggtggtgg atgatactaa atacaaggac taccaacagg tgggcatcct 21300
acaccaacac aacaactctg gatttgttgg ctaccttgcc cccaccatgc gcgaaggaca 21360
ggcctaccct gctaacttcc cctatccgct tataggcaag accgcagttg acagcattac 21420
ccagaaaaag tttctttgcg atcgcaccct ttggcgcatc ccattctcca gtaactttat 21480
gtccatgggc gcactcacag acctgggcca aaaccttctc tacgccaact ccgcccacgc 21540
gctagacatg acttttgagg tggatcccat ggacgagccc acccttcttt atgttttgtt 21600
tgaagtcttt gacgtggtcc gtgtgcaccg gccgcaccgc ggcgtcatcg aaaccgtgta 21660
cctgcgcacg cccttctcgg ccggcaacgc cacaacataa agaagcaagc aacatcaaca 21720
acagctgccg ccatgggctc cagtgagcag gaactgaaag ccattgtcaa agatcttggt 21780
tgtgggccat attttttggg cacctatgac aagcgctttc caggctttgt ttctccacac 21840
aagctcgcct gcgccatagt caatacggcc ggtcgcgaga ctgggggcgt acactggatg 21900
gcctttgcct ggaacccgca ctcaaaaaca tgctacctct ttgagccctt tggcttttct 21960
gaccagcgac tcaagcaggt ttaccagttt gagtacgagt cactcctgcg ccgtagcgcc 22020
attgcttctt cccccgaccg ctgtataacg ctggaaaagt ccacccaaag cgtacagggg 22080
cccaactcgg ccgcctgtgg actattctgc tgcatgtttc tccacgcctt tgccaactgg 22140
ccccaaactc ccatggatca caaccccacc atgaacctta ttaccggggt acccaactcc 22200
atgctcaaca gtccccaggt acagcccacc ctgcgtcgca accaggaaca gctctacagc 22260
ttcctggagc gccactcgcc ctacttccgc agccacagtg cgcagattag gagcgccact 22320
tctttttgtc acttgaaaaa catgtaaaaa taatgtacta gagacacttt caataaaggc 22380
aaatgctttt atttgtacac tctcgggtga ttatttaccc ccacccttgc cgtctgcgcc 22440
gtttaaaaat caaaggggtt ctgccgcgca tcgctatgcg ccactggcag ggacacgttg 22500
cgatactggt gtttagtgct ccacttaaac tcaggcacaa ccatccgcgg cagctcggtg 22560
aagttttcac tccacaggct gcgcaccatc accaacgcgt ttagcaggtc gggcgccgat 22620
atcttgaagt cgcagttggg gcctccgccc tgcgcgcgcg agttgcgata cacagggttg 22680
cagcactgga acactatcag cgccgggtgg tgcacgctgg ccagcacgct cttgtcggag 22740
atcagatccg cgtccaggtc ctccgcgttg ctcagggcga acggagtcaa ctttggtagc 22800
tgccttccca aaaagggcgc gtgcccaggc tttgagttgc actcgcaccg tagtggcatc 22860
aaaaggtgac cgtgcccggt ctgggcgtta ggatacagcg cctgcataaa agccttgatc 22920
tgcttaaaag ccacctgagc ctttgcgcct tcagagaaga acatgccgca agacttgccg 22980
gaaaactgat tggccggaca ggccgcgtcg tgcacgcagc accttgcgtc ggtgttggag 23040
atctgcacca catttcggcc ccaccggttc ttcacgatct tggccttgct agactgctcc 23100
ttcagcgcgc gctgcccgtt ttcgctcgtc acatccattt caatcacgtg ctccttattt 23160
atcataatgc ttccgtgtag acacttaagc tcgccttcga tctcagcgca gcggtgcagc 23220
cacaacgcgc agcccgtggg ctcgtgatgc ttgtaggtca cctctgcaaa cgactgcagg 23280
tacgcctgca ggaatcgccc catcatcgtc acaaaggtct tgttgctggt gaaggtcagc 23340
tgcaacccgc ggtgctcctc gttcagccag gtcttgcata cggccgccag agcttccact 23400
tggtcaggca gtagtttgaa gttcgccttt agatcgttat ccacgtggta cttgtccatc 23460
agcgcgcgcg cagcctccat gcccttctcc cacgcagaca cgatcggcac actcagcggg 23520
ttcatcaccg taatttcact ttccgcttcg ctgggctctt cctcttcctc ttgcgtccgc 23580
ataccacgcg ccactgggtc gtcttcattc agccgccgca ctgtgcgctt acctcctttg 23640
ccatgcttga ttagcaccgg tgggttgctg aaacccacca tttgtagcgc cacatcttct 23700
ctttcttcct cgctgtccac gattacctct ggtgatggcg ggcgctcggg cttgggagaa 23760
gggcgcttct ttttcttctt gggcgcaatg gccaaatccg ccgccgaggt cgatggccgc 23820
gggctgggtg tgcgcggcac cagcgcgtct tgtgatgagt cttcctcgtc ctcggactcg 23880
atacgccgcc tcatccgctt ttttgggggc gcccggggag gcggcggcga cggggacggg 23940
gacgacacgt cctccatggt tgggggacgt cgcgccgcac cgcgtccgcg ctcgggggtg 24000
gtttcgcgct gctcctcttc ccgactggcc atttccttct cctataggca gaaaaagatc 24060
atggagtcag tcgagaagaa ggacagccta accgccccct ctgagttcgc caccaccgcc 24120
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag 24180
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggaccgctca 24240
gtaccaacag aggataaaaa gcaagaccag gacaacgcag aggcaaacga ggaacaagtc 24300
gggcgggggg acgaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag 24360
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc 24420
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tattctcacc gcgcgtaccc 24480
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta 24540
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc 24600
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct 24660
gtcatacctg atatcgcctc gctcaacgaa gtgccaaaaa tctttgaggg tcttggacgc 24720
gacgagaagc gcgcggcaaa cgctctgcaa caggaaaaca gcgaaaatga aagtcactct 24780
ggagtgttgg tggaactcga gggtgacaac gcgcgcctag ccgtactaaa acgcagcatc 24840
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggtcat gagcacagtc 24900
atgagtgagc tgatcgtgcg ccgtgcgcag cccctggaga gggatgcaaa tttgcaagaa 24960
caaacagagg agggcctacc cgcagttggc gacgagcagc tagcgcgctg gcttcaaacg 25020
cgcgagcctg ccgacttgga ggagcgacgc aaactaatga tggccgcagt gctcgttacc 25080
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag 25140
gaaacattgc actacacctt tcgacagggc tacgtacgcc aggcctgcaa gatctccaac 25200
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg ccttgggcaa 25260
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt 25320
tacttatttc tatgctacac ctggcagacg gccatgggcg tttggcagca gtgcttggag 25380
gagtgcaacc tcaaggagct gcagaaactg ctaaagcaaa acttgaagga cctatggacg 25440
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca tcattttccc cgaacgcctg 25500
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcagaacttt 25560
aggaacttta tcctagagcg ctcaggaatc ttgcccgcca cctgctgtgc acttcctagc 25620
gactttgtgc ccattaagta ccgcgaatgc cctccgccgc tttggggcca ctgctacctt 25680
ctgcagctag ccaactacct tgcctaccac tctgacataa tggaagacgt gagcggtgac 25740
ggtctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtttgc 25800
aattcgcagc tgcttaacga aagtcaaatt atcggtacct ttgagctgca gggtccctcg 25860
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct 25920
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac 25980
caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacattctt 26040
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg 26100
gtttacttgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc 26160
tatcagcagc agccgcgggc ccttgcttcc caggatggca cccaaaaaga agctgcagct 26220
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga 26280
cgaggaggag gaggacatga tggaagactg ggagagccta gacgaggaag cttccgaggt 26340
cgaagaggtg tcagacgaaa caccgtcacc ctcggtcgca ttcccctcgc cggcgcccca 26400
gaaatcggca accggttcca gcatggctac aacctccgct cctcaggcgc cgccggcact 26460
gcccgttcgc cgacccaacc gtagatggga caccactgga accagggccg gtaagtccaa 26520
gcagccgccg ccgttagccc aagagcaaca acagcgccaa ggctaccgct catggcgcgg 26580
gcacaagaac gccatagttg cttgcttgca agactgtggg ggcaacatct ccttcgcccg 26640
ccgctttctt ctctaccatc acggcgtggc cttcccccgt aacatcctgc attactaccg 26700
tcatctctac agcccatact gcaccggcgg cagcggcagc ggcagcaaca gcagcggcca 26760
cacagaagca aaggcgaccg gatagcaaga ctctgacaaa gcccaagaaa tccacagcgg 26820
cggcagcagc aggaggagga gcgctgcgtc tggcgcccaa cgaacccgta tcgacccgcg 26880
agcttagaaa caggattttt cccactctgt atgctatatt tcaacagagc aggggccaag 26940
aacaagagct gaaaataaaa aacaggtctc tgcgatccct cacccgcagc tgcctgtatc 27000
acaaaagcga agatcagctt cggcgcacgc tggaagacgc ggaggctctc ttcagtaaat 27060
actgcgcgct gactcttaag gactagtttc gcgccctttc tcaaatttaa gcgcgaaaac 27120
tacgtcatct ccagcggcca cacccggcgc cagcacctgt cgtcagcgcc attatgagca 27180
aggaaattcc cacgccctac atgtggagtt accagccaca aatgggactt gcggctggag 27240
ctgcccaaga ctactcaacc cgaataaact acatgagcgc gggaccccac atgatatccc 27300
gggtcaacgg aatccgcgcc caccgaaacc gaattctctt ggaacaggcg gctattacca 27360
ccacacctcg taataacctt aatccccgta gttggcccgc tgccctggtg taccaggaaa 27420
gtcccgctcc caccactgtg gtacttccca gagacgccca ggccgaagtt cagatgacta 27480
actcaggggc gcagcttgcg ggcggctttc gtcacagggt gcggtcgccc gggcagggta 27540
taactcacct gacaatcaga gggcgaggta ttcagctcaa cgacgagtcg gtgagctcct 27600
cgcttggtct ccgtccggac gggacatttc agatcggcgg cgccggccgt ccttcattca 27660
cgcctcgtca ggcaatccta actctgcaga cctcgtcctc tgagccgcgc tctggaggca 27720
ttggaactct gcaatttatt gaggagtttg tgccatcggt ctactttaac cccttctcgg 27780
gacctcccgg ccactatccg gatcaattta ttcctaactt tgacgcggta aaggactcgg 27840
cggacggcta cgactgaatg ttaagtggag aggcagagca actgcgcctg aaacacctgg 27900
tccactgtcg ccgccacaag tgctttgccc gcgactccgg tgagttttgc tactttgaat 27960
tgcccgagga tcatatcgag ggcccggcgc acggcgtccg gcttaccgcc cagggagagc 28020
ttgcccgtag cctgattcgg gagtttaccc agcgccccct gctagttgag cgggacaggg 28080
gaccctgtgt tctcactgtg atttgcaact gtcctaacct tggattacat caagatcttt 28140
gttgccatct ctgtgctgag tataataaat acagaaatta aaatatactg gggctcctat 28200
cgccatcctg taaacgccac cgtcttcacc cgcccaagca aaccaaggcg aaccttacct 28260
ggtactttta acatctctcc ctctgtgatt tacaacagtt tcaacccaga cggagtgagt 28320
ctacgagaga acctctccga gctcagctac tccatcagaa aaaacaccac cctccttacc 28380
tgccgggaac gtacgagtgc gtcaccggcc gctgcaccac acctaccgcc tgaccgtaaa 28440
ccagactttt tccggacaga cctcaataac tctgtttacc agaacaggag gtgagcttag 28500
aaaaccctta gggtattagg ccaaaggcgc agctactgtg gggtttatga acaattcaag 28560
caactctacg ggctattcta attcaggttt ctctagaatc ggggttgggg ttattctctg 28620
tcttgtgatt ctctttattc ttatactaac gcttctctgc ctaaggctcg ccgcctgctg 28680
tgtgcacatt tgcatttatt gtcagctttt taaacgctgg ggtcgccacc caagatgatt 28740
aggtacataa tcctaggttt actcaccctt gcgtcagccc acggtaccac ccaaaaggtg 28800
gattttaagg agccagcctg taatgttaca ttcgcagctg aagctaatga gtgcaccact 28860
cttataaaat gcaccacaga acatgaaaag ctgcttattc gccacaaaaa caaaattggc 28920
aagtatgctg tttatgctat ttggcagcca ggtgacacta cagagtataa tgttacagtt 28980
ttccagggta aaagtcataa aacttttatg tatacttttc cattttatga aatgtgcgac 29040
attaccatgt acatgagcaa acagtataag ttgtggcccc cacaaaattg tgtggaaaac 29100
actggcactt tctgctgcac tgctatgcta attacagtgc tcgctttggt ctgtacccta 29160
ctctatatta aatacaaaag cagacgcagc tttattgagg aaaagaaaat gccttaattt 29220
actaagttac aaagctaatg tcaccactaa ctgctttact cgctgcttgc aaaacaaatt 29280
caaaaagtta gcattataat tagaatagga tttaaacccc ccggtcattt cctgctcaat 29340
accattcccc tgaacaattg actctatgtg ggatatgctc cagcgctaca accttgaagt 29400
caggcttcct ggatgtcagc atctgacttt ggccagcacc tgtcccgcgg atttgttcca 29460
gtccaactac agcgacccac cctaacagag atgaccaaca caaccaacgc ggccgccgct 29520
accggactta catctaccac aaatacaccc caagtttctg cctttgtcaa taactgggat 29580
aacttgggca tgtggtggtt ctccatagcg cttatgtttg tatgccttat tattatgtgg 29640
ctcatctgct gcctaaagcg caaacgcgcc cgaccaccca tctatagtcc catcattgtg 29700
ctacacccaa acaatgatgg aatccataga ttggacggac tgaaacacat gttcttttct 29760
cttacagtat gattaaatga gacatgattc ctcgagtttt tatattactg acccttgttg 29820
cgcttttttg tgcgtgctcc acattggctg cggtttctca catcgaagta gactgcattc 29880
cagccttcac agtctatttg ctttacggat ttgtcaccct cacgctcatc tgcagcctca 29940
tcactgtggt catcgccttt atccagtgca ttgactgggt ctgtgtgcgc tttgcatatc 30000
tcagacacca tccccagtac agggacagga ctatagctga gcttcttaga attctttaat 30060
tatgaaattt actgtgactt ttctgctgat tatttgcacc ctatctgcgt tttgttcccc 30120
gacctccaag cctcaaagac atatatcatg cagattcact cgtatatgga atattccaag 30180
ttgctacaat gaaaaaagcg atctttccga agcctggtta tatgcaatca tctctgttat 30240
ggtgttctgc agtaccatct tagccctagc tatatatccc taccttgaca ttggctggaa 30300
acgaatagat gccatgaacc acccaacttt ccccgcgccc gctatgcttc cactgcaaca 30360
agttgttgcc ggcggctttg tcccagccaa tcagcctcgc cccacttctc ccacccccac 30420
tgaaatcagc tactttaatc taacaggagg agatgactga caccctagat ctagaaatgg 30480
acggaattat tacagagcag cgcctgctag aaagacgcag ggcagcggcc gagcaacagc 30540
gcatgaatca agagctccaa gacatggtta acttgcacca gtgcaaaagg ggtatctttt 30600
gtctggtaaa gcaggccaaa gtcacctacg acagtaatac caccggacac cgccttagct 30660
acaagttgcc aaccaagcgt cagaaattgg tggtcatggt gggagaaaag cccattacca 30720
taactcagca ctcggtagaa accgaaggct gcattcactc accttgtcaa ggacctgagg 30780
atctctgcac ccttattaag accctgtgcg gtctcaaaga tcttattccc tttaactaat 30840
aaaaaaaaat aataaagcat cacttactta aaatcagtta gcaaatttct gtccagttta 30900
ttcagcagca cctccttgcc ctcctcccag ctctggtatt gcagcttcct cctggctgca 30960
aactttctcc acaatctaaa tggaatgtca gtttcctcct gttcctgtcc atccgcaccc 31020
actatcttca tgttgttgca gatgaagcgc gcaagaccgt ctgaagatac cttcaacccc 31080
gtgtatccat atgacacgga aaccggtcct ccaactgtgc cttttcttac tcctcccttt 31140
gtatccccca atgggtttca agagagtccc cctggggtac tctctttgcg cctatccgaa 31200
cctctagtta cctccaatgg catgcttgcg ctcaaaatgg gcaacggcct ctctctggac 31260
gaggccggca accttacctc ccaaaatgta accactgtga gcccacctct caaaaaaacc 31320
aagtcaaaca taaacctgga aatatctgca cccctcacag ttacctcaga agccctaact 31380
gtggctgccg ccgcacctct aatggtcgcg ggcaacacac tcaccatgca atcacaggcc 31440
ccgctaaccg tgcacgactc caaacttagc attgccaccc aaggacccct cacagtgtca 31500
gaaggaaagc tagccctgca aacatcaggc cccctcacca ccaccgatag cagtaccctt 31560
actatcactg cctcaccccc tctaactact gccactggta gcttgggcat tgacttgaaa 31620
gagcccattt atacacaaaa tggaaaacta ggactaaagt acggggctcc tttgcatgta 31680
acagacgacc taaacacttt gaccgtagca actggtccag gtgtgactat taataatact 31740
tccttgcaaa ctaaagttac tggagccttg ggttttgatt cacaaggcaa tatgcaactt 31800
aatgtagcag gaggactaag gattgattct caaaacagac gccttatact tgatgttagt 31860
tatccgtttg atgctcaaaa ccaactaaat ctaagactag gacagggccc tctttttata 31920
aactcagccc acaacttgga tattaactac aacaaaggcc tttacttgtt tacagcttca 31980
aacaattcca aaaagcttga ggttaaccta agcactgcca aggggttgat gtttgacgct 32040
acagccatag ccattaatgc aggagatggg cttgaatttg gttcacctaa tgcaccaaac 32100
acaaatcccc tcaaaacaaa aattggccat ggcctagaat ttgattcaaa caaggctatg 32160
gttcctaaac taggaactgg ccttagtttt gacagcacag gtgccattac agtaggaaac 32220
aaaaataatg ataagctaac tttgtggacc acaccagctc catctcctaa ctgtagacta 32280
aatgcagaga aagatgctaa actcactttg gtcttaacaa aatgtggcag tcaaatactt 32340
gctacagttt cagttttggc tgttaaaggc agtttggctc caatatctgg aacagttcaa 32400
agtgctcatc ttattataag atttgacgaa aatggagtgc tactaaacaa ttccttcctg 32460
gacccagaat attggaactt tagaaatgga gatcttactg aaggcacagc ctatacaaac 32520
gctgttggat ttatgcctaa cctatcagct tatccaaaat ctcacggtaa aactgccaaa 32580
agtaacattg tcagtcaagt ttacttaaac ggagacaaaa ctaaacctgt aacactaacc 32640
attacactaa acggtacaca ggaaacagga gacacaactc caagtgcata ctctatgtca 32700
ttttcatggg actggtctgg ccacaactac attaatgaaa tatttgccac atcctcttac 32760
actttttcat acattgccca agaataaaga atcgtttgtg ttatgtttca acgtgtttat 32820
ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca 32880
tagcttatac agatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc 32940
acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat 33000
catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc 33060
caaacgctca tcagtgatat taataaactc cccgggcagc tcacttaagt tcatgtcgct 33120
gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgcttaacgg gcggcgaagg 33180
agaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg 33240
ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat 33300
ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc ataaggcgcc ttgtcctccg 33360
ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac 33420
aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac 33480
agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa 33540
cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca 33600
tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac 33660
ctgcccgccg gctatacact gcagggaacc gggactggaa caatgacagt ggagagccca 33720
ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca 33780
cacgtgcata cacttcctca ggattacaag ctcctcccgc gttagaacca tatcccaggg 33840
aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact 33900
cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt 33960
agcgcgggtt tctgtctcaa aaggaggtag acgatcccta ctgtacggag tgcgccgaga 34020
caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt 34080
tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgccgct 34140
tagatcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc 34200
tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg 34260
cagaataagc cacacccagc caacctacac attcgttctg cgagtcacac acgggaggag 34320
cgggaagagc tggaagaacc atgttttttt ttttattcca aaagattatc caaaacctca 34380
aaatgaagat ctattaagtg aacgcgctcc cctccggtgg cgtggtcaaa ctctacagcc 34440
aaagaacaga taatggcatt tgtaagatgt tgcacaatgg cttccaaaag gcaaacggcc 34500
ctcacgtcca agtggacgta aaggctaaac ccttcagggt gaatctcctc tataaacatt 34560
ccagcacctt caaccatgcc caaataattc tcatctcgcc accttctcaa tatatctcta 34620
agcaaatccc gaatattaag tccggccatt gtaaaaatct gctccagagc gccctccacc 34680
ttcagcctca agcagcgaat catgattgca aaaattcagg ttcctcacag acctgtataa 34740
gattcaaaag cggaacatta acaaaaatac cgcgatcccg taggtccctt cgcagggcca 34800
gctgaacata atcgtgcagg tctgcacgga ccagcgcggc cacttccccg ccaggaacca 34860
tgacaaaaga acccacactg attatgacac gcatactcgg agctatgcta accagcgtag 34920
ccccgatgta agcttgttgc atgggcggcg atataaaatg caaggtgctg ctcaaaaaat 34980
caggcaaagc ctcgcgcaaa aaagaaagca catcgtagtc atgctcatgc agataaaggc 35040
aggtaagctc cggaaccacc acagaaaaag acaccatttt tctctcaaac atgtctgcgg 35100
gtttctgcat aaacacaaaa taaaataaca aaaaaacatt taaacattag aagcctgtct 35160
tacaacagga aaaacaaccc ttataagcat aagacggact acggccatgc cggcgtgacc 35220
gtaaaaaaac tggtcaccgt gattaaaaag caccaccgac agctcctcgg tcatgtccgg 35280
agtcataatg taagactcgg taaacacatc aggttgattc acatcggtca gtgctaaaaa 35340
gcgaccgaaa tagcccgggg gaatacatac ccgcaggcgt agagacaaca ttacagcccc 35400
cataggaggt ataacaaaat taataggaga gaaaaacaca taaacacctg aaaaaccctc 35460
ctgcctaggc aaaatagcac cctcccgctc cagaacaaca tacagcgctt ccacagcggc 35520
agccataaca gtcagcctta ccagtaaaaa agaaaaccta ttaaaaaaac accactcgac 35580
acggcaccag ctcaatcagt cacagtgtaa aaaagggcca agtgcagagc gagtatatat 35640
aggactaaaa aatgacgtaa cggttaaagt ccacaaaaaa cacccagaaa accgcacgcg 35700
aacctacgcc cagaaacgaa agccaaaaaa cccacaactt cctcaaatcg tcacttccgt 35760
tttcccacgt tacgtaactt cccattttaa gaaaactaca attcccaaca catacaagtt 35820
actccgccct aaaacctacg tcacccgccc cgttcccacg ccccgcgcca cgtcacaaac 35880
tccaccccct cattatcata ttggcttcaa tccaaaataa ggtatattat tgatgatg 35938
<210> 3
<211> 35937
<212> DNA
<213> 2型腺病毒
<400> 3
catcatcata atatacctta ttttggattg aagccaatat gataatgagg gggtggagtt 60
tgtgacgtgg cgcggggcgt gggaacgggg cgggtgacgt agtagtgtgg cggaagtgtg 120
atgttgcaag tgtggcggaa cacatgtaag cgccggatgt ggtaaaagtg acgtttttgg 180
tgtgcgccgg tgtatacggg aagtgacaat tttcgcgcgg ttttaggcgg atgttgtagt 240
aaatttgggc gtaaccaagt aatgtttggc cattttcgcg ggaaaactga ataagaggaa 300
gtgaaatctg aataattctg tgttactcat agcgcgtaat atttgtctag ggccgcgggg 360
actttgaccg tttacgtgga gactcgccca ggtgtttttc tcaggtgttt tccgcgttcc 420
gggtcaaagt tggcgtttta ttattatagt cagctgacgc gcagtgtatt tatacccggt 480
gagttcctca agaggccact cttgagtgcc agcgagtaga gttttctcct ccgagccgct 540
ccgacaccgg gactgaaaat gagacatatt atctgccacg gaggtgttat taccgaagaa 600
atggccgcca gtcttttgga ccagctgatc gaagaggtac tggctgataa tcttccacct 660
cctagccatt ttgaaccacc tacccttcac gaactgtatg atttagacgt gacggccccc 720
gaagatccca acgaggaggc ggtttcgcag atttttcccg agtctgtaat gttggcggtg 780
caggaaggga ttgacttatt cacttttccg ccggcgcccg gttctccgga gccgcctcac 840
ctttcccggc agcccgagca gccggagcag agagccttgg gtccggtttc tatgccaaac 900
cttgtgccgg aggtgatcga tcttacctgc cacgaggctg gctttccacc cagtgacgac 960
gaggatgaag agggtgagga gtttgtgtta gattatgtgg agcaccccgg gcacggttgc 1020
aggtcttgtc attatcaccg gaggaatacg ggggacccag atattatgtg ttcgctttgc 1080
tatatgagga cctgtggcat gtttgtctac agtaagtgaa aattatgggc agtcggtgat 1140
agagtggtgg gtttggtgtg gtaatttttt tttaattttt acagttttgt ggtttaaaga 1200
attttgtatt gtgatttttt aaaaggtcct gtgtctgaac ctgagcctga gcccgagcca 1260
gaaccggagc ctgcaagacc tacccggcgt cctaaattgg tgcctgctat cctgagacgc 1320
ccgacatcac ctgtgtctag agaatgcaat agtagtacgg atagctgtga ctccggtcct 1380
tctaacacac ctcctgagat acacccggtg gtcccgctgt gccccattaa accagttgcc 1440
gtgagagttg gtgggcgtcg ccaggctgtg gaatgtatcg aggacttgct taacgagtct 1500
gggcaacctt tggacttgag ctgtaaacgc cccaggccat aaggtgtaaa cctgtgattg 1560
cgtgtgtggt taacgccttt gtttgctgaa tgagttgatg taagtttaat aaagggtgag 1620
ataatgttta acttgcatgg cgtgttaaat ggggcggggc ttaaagggta tataatgcgc 1680
cgtgggctaa tcttggttac atctgacctc atggaggctt gggagtgttt ggaagatttt 1740
tctgctgtgc gtaacttgct ggaacagagc tctaacagta cctcttggtt ttggaggttt 1800
ctgtggggct cctcccaggc aaagttagtc tgcagaatta aggaggatta caagtgggaa 1860
tttgaagagc ttttgaaatc ctgtggtgag ctgtttgatt ctttgaatct gggtcaccag 1920
gcgcttttcc aagagaaggt catcaagact ttggattttt ccacaccggg gcgcgctgcg 1980
gctgctgttg cttttttgag ttttataaag gataaatgga gcgaagaaac ccatctgagc 2040
ggggggtacc tgctggattt tctggccatg catctgtgga gagcggtggt gagacacaag 2100
aatcgcctgc tactgttgtc ttccgtccgc ccggcaataa taccgacgga ggagcaacag 2160
caggaggaag ccaggcggcg gcggcggcag gagcagagcc catggaaccc gagagccggc 2220
ctggaccctc gggaatgaat gttgtacagg tggctgaact gtttccagaa ctgagacgca 2280
ttttaaccat taacgaggat gggcaggggc taaagggggt aaagagggag cggggggctt 2340
ctgaggctac agaggaggct aggaatctaa cttttagctt aatgaccaga caccgtcctg 2400
agtgtgttac ttttcagcag attaaggata attgcgctaa tgagcttgat ctgctggcgc 2460
agaagtattc catagagcag ctgaccactt actggctgca gccaggggat gattttgagg 2520
aggctattag ggtatatgca aaggtggcac ttaggccaga ttgcaagtac aagattagca 2580
aacttgtaaa tatcaggaat tgttgctaca tttctgggaa cggggccgag gtggagatag 2640
atacggagga tagggtggcc tttagatgta gcatgataaa tatgtggccg ggggtgcttg 2700
gcatggacgg ggtggttatt atgaatgtga ggtttactgg tcccaatttt agcggtacgg 2760
ttttcctggc caataccaat cttatcctac acggtgtaag cttctatggg tttaacaata 2820
cctgtgtgga agcctggacc gatgtaaggg ttcggggctg tgccttttac tgctgctgga 2880
agggggtggt gtgtcgcccc aaaagcaggg cttcaattaa gaaatgcctg tttgaaaggt 2940
gtaccttggg tatcctgtct gagggtaact ccagggtgcg ccacaatgtg gcctccgact 3000
gtggttgctt catgctagtg aaaagcgtgg ctgtgattaa gcataacatg gtgtgtggca 3060
actgcgagga cagggcctct cagatgctga cctgctcgga cggcaactgt cacttgctga 3120
agaccattca cgtagccagc cactctcgca aggcctggcc agtgtttgag cacaacatac 3180
tgacccgctg ttccttgcat ttgggtaaca ggaggggggt gttcctacct taccaatgca 3240
atttgagtca cactaagata ttgcttgagc ccgagagcat gtccaaggtg aacctgaacg 3300
gggtgtttga catgaccatg aagatctgga aggtgctgag gtacgatgag acccgcacca 3360
ggtgcagacc ctgcgagtgt ggcggtaaac atattaggaa ccagcctgtg atgctggatg 3420
tgaccgagga gctgaggccc gatcacttgg tgctggcctg cacccgcgct gagtttggct 3480
ctagcgatga agatacagat tgaggtactg aaatgtgtgg gcgtggctta agggtgggaa 3540
agaatatata aggtgggggt ctcatgtagt tttgtatctg ttttgcagca gccgccgcca 3600
tgagcgccaa ctcgtttgat ggaagcattg tgagctcata tttgacaacg cgcatgcccc 3660
catgggccgg ggtgcgtcag aatgtgatgg gctccagcat tgatggtcgc cccgtcctgc 3720
ccgcaaactc tactaccttg acctacgaga ccgtgtctgg aacgccgttg gagactgcag 3780
cctccgccgc cgcttcagcc gctgcagcca ccgcccgcgg gattgtgact gactttgctt 3840
tcctgagccc gcttgcaagc agtgcagctt cccgttcatc cgcccgcgat gacaagttga 3900
cggctctttt ggcacaattg gattctttga cccgggaact taatgtcgtt tctcagcagc 3960
tgttggatct gcgccagcag gtttctgccc tgaaggcttc ctcccctccc aatgcggttt 4020
aaaacataaa taaaaaccag actctgtttg gattttgatc aagcaagtgt cttgctgtct 4080
ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt cgttgagggt 4140
cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat acatgggcat 4200
aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg gggtggtgtt 4260
gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt ctttcagtag 4320
caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt taagctggga 4380
tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt tggctatgtt 4440
cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag tgtatccggt 4500
gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact tggagacgcc 4560
cttgtgacct ccgagatttt ccatgcattc gtccataatg atggcaatgg gcccacgggc 4620
ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt ccaggatgag 4680
atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg gtataatggt 4740
tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg ctttgagttc 4800
agatgggggg atcatgtcta cctgcggggc gatgaagaaa accgtttccg gggtagggga 4860
gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc cggtgggccc 4920
gtaaatcaca cctattaccg gctgcaactg gtagttaaga gagctgcagc tgccgtcatc 4980
cctgagcagg ggggccactt cgttaagcat gtccctgact tgcatgtttt ccctgaccaa 5040
atgcgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag caaagttttt 5100
caacggtttg aggccgtccg ccgtaggcat gcttttgagc gtttgaccaa gcagttccag 5160
gcggtcccac agctcggtca cgtgctctac ggcatctcga tccagcatat ctcctcgttt 5220
cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag acgggccagg 5280
gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac ggtgaagggg 5340
tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct ggtgctgaag 5400
cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt gtcatagtcc 5460
agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc gccgcacgag 5520
gggcagtgca gacttttaag ggcgtagagc ttgggcgcga gaaataccga ttccggggag 5580
taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca ggtgagctct 5640
ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt cttacctctg 5700
gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc cccgtataca 5760
gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag aaactcggac 5820
cactctgaga cgaaggctcg cgtccaggcc agcacgaagg aggctaagtg ggaggggtag 5880
cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat gtcgccctct 5940
tcggcatcaa ggaaggtgat tggtttatag gtgtaggcca cgtgaccggg tgttcctgaa 6000
ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc atcgctgtct 6060
gcgagggcca gctgttgggg tgagtactcc ctctcaaaag cgggcatgac ttctgcgcta 6120
agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc ggtgatgcct 6180
ttgagggtgg ccgcgtccat ctggtcagaa aagacaatct ttttgttgtc aagcttggtg 6240
gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag ggtttggttt 6300
ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc gcgcgcaacg 6360
caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac gcgccaaccg 6420
cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag gcgctcgttg 6480
gtccagcaga ggcggccgcc cttgcgcgaa cagaatggcg gtagtgggtc tagctgcgtc 6540
tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc gtcgaagtag 6600
tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc aagcgcgcgc 6660
tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga ggcgtacatg 6720
ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt agggtagcat 6780
cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg agcgaggagg 6840
tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg cctgaagatg 6900
gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc gtctgtgaga 6960
cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac cagctcggcg 7020
gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc atacttatcc 7080
tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc tttccagtac 7140
tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta gaactggttg 7200
acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg cgcggccttc 7260
cggagcgagg tgtgggtgag cgcaaaggtg tccctaacca tgactttgag gtactggtat 7320
ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt gcgctttttg 7380
gaacgcgggt ttggcagggc gaaggtgaca tcgttgaaaa gtatctttcc cgcgcgaggc 7440
ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt aattacctgg 7500
gcggcgagca cgatctcgtc gaagccgttg atgttgtggc ccacgatgta aagttccaag 7560
aagcgcgggg tgcccttgat ggagggcaat tttttaagtt cctcgtaggt gagctcctca 7620
ggggagctga gcccgtgttc tgacagggcc cagtctgcaa gatgagggtt ggaagcgacg 7680
aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa ggtcctaaac 7740
tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg gtcttgttcc 7800
cagcggtccc atccaaggtc cacggctagg tctcgcgcgg cggtcaccag aggctcatct 7860
ccgccgaact tcataaccag catgaagggc acgagctgct tcccaaaggc ccccatccaa 7920
gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg cgagccgatc 7980
gggaagaact ggatctcccg ccaccagttg gaggagtggc tgttgatgtg gtgaaagtag 8040
aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc gcagtactgg 8100
cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg cacaaggaag 8160
cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc tacttcggct 8220
gcttgtcctt gaccgtctgg ctgctcgagg ggagttatgg tggatcggac caccacgccg 8280
cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac aacatcgcgc 8340
agatgggagc tgtccatggt ctggagctcc cgcggcgaca ggtcaggcgg gagctcctgc 8400
aggtttacct cgcatagccg ggtcagggcg cgggctaggt ccaggtgata cctgatttcc 8460
aggggctggt tggtggcggc gtcgatgact tgcaagaggc cgcatccccg cggcgcgact 8520
acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc atctaaaagc 8580
ggtgacgcgg gcgggccccc ggaggtaggg ggggctcggg acccgccggg agagggggca 8640
ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcggagg ttgctggcga 8700
acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag acgacgggcc 8760
cggtgagctt gaacctgaaa gagagttcga cagaatcaat ttcggtgtcg ttgacggcgg 8820
cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatt tcggccatga 8880
actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg gtggcggcga 8940
ggtcgttgga gatgcgggcc atgagctgcg agaaggcgtt gaggcctccc tcgttccaga 9000
cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc tgcgcgagat 9060
tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag aggtagttga 9120
gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc aacgtggatt 9180
cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc acggcgaagt 9240
tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga cggatgagct 9300
cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct tcttcaatct 9360
cctcttccat aagggcctcc ccttcttctt cttcttctgg cggcggtggg ggagggggga 9420
cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc atctccccgc 9480
ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc agttggaaga 9540
cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccgtgcggc agggatacgg 9600
cgctaacgat gcatctcaac aattgttgtg taggtactcc gccaccgagg gacctgagcg 9660
agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag tcacagtcgc 9720
aaggtaggct gagcaccgtg gcgggcggca gcgggtggcg gtcggggttg tttctggcgg 9780
aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg gtcgacagaa 9840
gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg ccccaggctt 9900
cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct accggcactt 9960
cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctacggcg gcggcggagt 10020
ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc ctcatcggct 10080
gaagcagggc caggtcggcg acaacgcgct cggctaatat ggcctgctgc acctgcgtga 10140
gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg ttgatggtgt 10200
aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc gagagctcgg 10260
tgtacctgag acgcgagtaa gcccttgagt caaagacgta gtcgttgcaa gtccgcacca 10320
ggtactgata tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc cagcgtaggg 10380
tggccggggc tccgggggcg aggtcttcca acataaggcg atgatatccg tagatgtacc 10440
tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg cggacgcggt 10500
tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg ccggtgaggc 10560
gtgcgcagtc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg ggcactcttc 10620
cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt tcgaaccccg 10680
gatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc caggtgtgcg 10740
acgtcagaca acgggggagc gctccttttg gcttccttcc aggcgcggcg gctgctgcgc 10800
tagctttttt ggccactggc cgcgcgcggc gtaagcggtt aggctggaaa gcgaaagcat 10860
taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc gcaggacccc 10920
cggttcgagt ctcgggccgg ccggactgcg gcgaacgggg gtttgcctcc ccgtcatgca 10980
agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc ttttcccaga 11040
tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag caagagcagc 11100
ggcagacatg cagggcaccc tccccttctc ctaccgcgtc aggaggggca acatccgcgg 11160
ctgacgcggc ggcagatggt gattacgaac ccccgcggcg ccgggcccgg cactacctgg 11220
acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag cgacacccaa 11280
gggtgcagct gaagcgtgac acgcgcgagg cgtacgtgcc gcggcagaac ctgtttcgcg 11340
accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca gggcgcgagt 11400
tgcggcatgg cctgaaccgc gagcggttgc tgcgcgagga ggactttgag cccgacgcgc 11460
ggaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta accgcgtacg 11520
agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac gtgcgcacgc 11580
ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt gtaagcgcgc 11640
tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata gtgcagcaca 11700
gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc gagggccgct 11760
ggctgctcga tttgataaac attctgcaga gcatagtggt gcaggagcgc agcttgagcc 11820
tggctgacaa ggtggccgcc attaactatt ccatgctcag tctgggcaag ttttacgccc 11880
gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc gaggggttct 11940
acatgcgcat ggcgttgaag gtgcttacct tgagcgacga cctgggcgtt tatcgcaacg 12000
agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac cgcgagctga 12060
tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag gccgagtcct 12120
actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg gaggcagctg 12180
gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc ggcgtggagg 12240
aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg gtgatgtttc 12300
tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc agagccagcc 12360
gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca tgtcgctgac 12420
tgcgcgtaac cctgacgcgt tccggcagca gccgcaggcc aaccggctct ccgcaattct 12480
ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg cgatcgtaaa 12540
cgcgctggcc gaaaacaggg ccatccggcc cgatgaggcc ggcctggtct acgacgcgct 12600
gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg accggctggt 12660
gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg gcaacctggg 12720
ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc cgcggggaca 12780
ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga caccgcaaag 12840
tgaggtgtac cagtccgggc cagactattt tttccagacc agtagacaag gcctgcagac 12900
cgtaaacctg agccaggctt tcaagaactt gcaggggctg tggggggtgc gggctcccac 12960
aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt tgctgctgct 13020
aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag gtcacttgct 13080
gacactgtac cgcgaggcca taggtcaggc gcatgtggac gagcatactt tccaggagat 13140
tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg caaccctgaa 13200
ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa acagcgagga 13260
ggagcgcatc ttgcgctatg tgcagcagag cgtgagcctt aacctgatgc gcgacggggt 13320
aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca tgtatgcctc 13380
aaaccggccg tttatcaatc gcctaatgga ctacttgcat cgcgcggccg ccgtgaaccc 13440
cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg gtttctacac 13500
cgggggattt gaggtgcccg agggtaacga tggattcctc tgggacgaca tagacgacag 13560
cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc aggcagaggc 13620
ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag gcgctgcggc 13680
cccgcggtca gatgcgagta gcccatttcc aagcttgata gggtctttta ccagcactcg 13740
caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc tgctgcagcc 13800
gcagcgcgaa aagaacctgc ctccggcatt tcccaacaac gggatagaga gcctagtgga 13860
caagatgagt agatggaaga cgtatgcgca ggagcacagg gatgtgcccg gcccgcgccc 13920
gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg acgatgactc 13980
ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg cgcaccttcg 14040
ccccaggctg gggagaatgt tttaaaaaaa aaaaaaaaaa gcatgatgca aaataaaaaa 14100
ctcaccaagg ccatggcacc gagcgttggt tttcttgtat tccccttagt atgcagcgcg 14160
cggcgatgta tgaggaaggt cctcctccct cctacgagag cgtggtgagc gcggcgccag 14220
tggcggcggc gctgggttcc cccttcgatg ctcccctgga cccgccgttt gtgcctccgc 14280
ggtacctgcg gcctaccggg gggagaaaca gcatccgtta ctctgagttg gcacccctat 14340
tcgacaccac ccgtgtgtac cttgtggaca acaagtcaac ggatgtggca tccctgaact 14400
accagaacga ccacagcaac tttctaacca cggtcattca aaacaatgac tacagcccgg 14460
gggaggcaag cacacagacc atcaatcttg acgaccgttc gcactggggc ggcgacctga 14520
aaaccatcct gcataccaac atgccaaatg tgaacgagtt catgtttacc aataagttta 14580
aggcgcgggt gatggtgtcg cgctcgctta ctaaggacaa acaggtggag ctgaaatatg 14640
agtgggtgga gttcacgctg cccgagggca actactccga gaccatgacc atagacctta 14700
tgaacaacgc gatcgtggag cactacttga aagtgggcag gcagaacggg gttctggaaa 14760
gcgacatcgg ggtaaagttt gacacccgca acttcagact ggggtttgac ccagtcactg 14820
gtcttgtcat gcctggggta tatacaaacg aagccttcca tccagacatc attttgctgc 14880
caggatgcgg ggtggacttc acccacagcc gcctgagcaa cttgttgggc atccgcaagc 14940
ggcaaccctt ccaggagggc tttaggatca cctacgatga cctggagggt ggtaacattc 15000
ccgcactgtt ggatgtggac gcctaccagg caagcttaaa agatgacacc gaacagggcg 15060
gggatggcgc aggcggcggc aacaacagtg gcagcggcgc ggaagagaac tccaacgcgg 15120
cagccgcggc aatgcagccg gtggaggaca tgaacgatca tgccattcgc ggcgacacct 15180
ttgccacacg ggcggaggag aagcgcgctg aggccgaggc agcggcagaa gctgccgccc 15240
ccgctgcgca acccgaggtc gagaagcctc agaagaaacc ggtgatcaaa cccctgacag 15300
aggacagcaa gaaacgcagt tacaacctaa taagcaatga cagcaccttc acccagtacc 15360
gcagctggta ccttgcatac aactacggcg accctcagac cgggatccgc tcatggaccc 15420
tcctttgcac tcctgacgta acctgcggct cggagcaggt ctactggtcg ttgccagaca 15480
tgatgcaaga ccccgtgacc ttccgctcca cgagccagat cagcaacttt ccggtggtgg 15540
gcgccgagct gttgcccgtg cactccaaga gcttctacaa cgaccaggcc gtctactccc 15600
agctcatccg ccagtttacc tctctgaccc acgtgttcaa tcgctttccc gagaaccaga 15660
ttttggcgcg cccgccagcc cccaccatca ccaccgtcag tgaaaacgtt cctgctctca 15720
cagatcacgg gacgctaccg ctgcgcaaca gcatcggagg agtccagcga gtgaccatta 15780
ctgacgccag acgccgcacc tgcccctacg tttacaaggc cctgggcata gtctcgccgc 15840
gcgtcctatc gagccgcact ttttgagcaa acatgtccat ccttatatcg cccagcaata 15900
acacaggctg gggcctgcgc ttcccaagca agatgtttgg cggggcaaag aagcgctccg 15960
accaacaccc agtgcgcgtg cgcgggcact accgcgcgcc ctggggcgcg cacaaacgcg 16020
gccgcactgg gcgcaccacc gtcgatgacg ccattgacgc ggtggtggag gaggcgcgca 16080
actacacgcc cacgccgcca ccagtgtcca cagtggacgc ggccattcag accgtggtgc 16140
gcggagcccg gcgttatgct aaaatgaaga gacggcggag gcgcgtagca cgtcgccacc 16200
gccgccgacc cggcactgcc gcccaacgcg cggcggcggc cctgcttaac cgcgcacgtc 16260
gcaccggccg acgggcggcc atgcgggccg ctcgaaggct ggccgcgggt attgtcactg 16320
tgccccccag gtccaggcga cgagcggccg ccgcagcagc cgcggccatt agtgctatga 16380
ctcagggtcg caggggcaac gtgtactggg tgcgcgactc ggttagcggc ctgcgcgtgc 16440
ccgtgcgcac ccgccccccg cgcaactaga ttgcaagaaa aaactactta gactcgtact 16500
gttgtatgta tccagcggcg gcggcgcgca acgaagctat gtccaagcgc aaaatcaaag 16560
aagagatgct ccaggtcatc gcgccggaga tctatggccc cccgaagaag gaagagcagg 16620
attacaagcc ccgaaagcta aagcgggtca aaaagaaaaa gaaagatgat gatgatgatg 16680
aacttgacga cgaggtggaa ctgctgcacg caaccgcgcc caggcggcgg gtacagtgga 16740
aaggtcgacg cgtaagacgt gttttgcgac ccggcaccac cgtagttttt acgcccggtg 16800
agcgctccac ccgcacctac aagcgcgtgt atgatgaggt gtacggcgac gaggacctgc 16860
ttgagcaggc caacgagcgc ctcggggagt ttgcctacgg aaagcggcat aaggacatgt 16920
tggcgttgcc gctggacgag ggcaacccaa cacctagcct aaagcccgtg acactgcagc 16980
aggtgctgcc cacgcttgca ccgtccgaag aaaagcgcgg cctaaagcgc gagtctggtg 17040
acttggcacc caccgtgcag ctgatggtac ccaagcgcca gcgactggaa gatgtcttgg 17100
aaaaaatgac cgtggagcct gggctggagc ccgaggtccg cgtgcggcca atcaagcagg 17160
tggcaccggg actgggcgtg cagaccgtgg acgttcagat acccaccacc agtagcacta 17220
gtattgccac tgccacagag ggcatggaga cacaaacgtc cccggttgcc tcggcggtgg 17280
cagatgccgc ggtgcaggcg gccgctgcgg ccgcgtccaa aacctctacg gaggtgcaaa 17340
cggacccgtg gatgtttcgc gtttcagccc cccggcgccc gcgccgttcc aggaagtacg 17400
gcaccgccag cgcactactg cccgaatatg ccctacatcc ttccatcgcg cctacccccg 17460
gctatcgtgg ctacacctac cgccccagaa gacgagcgac tacccgacgc cgaaccacca 17520
ctggaacccg ccgccgccgt cgccgtcgcc agcccgtgct ggccccgatt tccgtgcgca 17580
gggtggctcg cgaaggaggc aggaccctgg tgctgccaac agcgcgctac caccccagca 17640
tcgtttaaaa gccggtcttt gtggttcttg cagatatggc cctcacctgc cgcctccgtt 17700
tcccggtgcc gggattccga ggaagaatgc accgtaggag gggcatggcc ggccacggcc 17760
tgacgggcgg catgcgtcgt gcgcaccacc ggcggcggcg cgcgtcgcac cgtcgcatgc 17820
gcggcggtat cctgcccctc cttattccac tgatcgccgc ggcgattggc gccgtgcccg 17880
gaattgcatc cgtggccttg caggcgcaga gacactgatt aaaaacaagt tgcatgtgga 17940
aaaatcaaaa taaaaagtct ggagtctcac gctcgcttgg tcctgtaact attttgtaga 18000
atggaagaca tcaactttgc gtctctggcc ccgcgacacg gctcgcgccc gttcatggga 18060
aactggcaag atatcggcac cagcaatatg agcggtggcg ccttcagctg gggctcgctg 18120
tggagcggca ttaaaaattt cggttccacc attaagaact atggcagcaa ggcctggaac 18180
agcagcacag gccagatgct gagggacaag ttgaaagagc aaaatttcca acaaaaggtg 18240
gtagatggcc tggcctctgg cattagcggg gtggtggacc tggccaacca ggcagtgcaa 18300
aataagatta acagtaagct tgatccccgc cctcccgtag aggagcctcc accggccgtg 18360
gagacagtgt ctccagaggg gcgtggcgaa aagcgtccgc ggcccgacag ggaagaaact 18420
ctggtgacgc aaatagatga gcctccctcg tacgaggagg cactaaagca aggcctgccc 18480
accacccgtc ccatcgcgcc catggctacc ggagtgctgg gccagcacac acctgtaacg 18540
ctggacctgc ctccccccgc tgacacccag cagaaacctg tgctgccagg gccgtccgcc 18600
gttgttgtaa cccgccctag ccgcgcgtcc ctgcgccgtg ccgccagcgg tccgcgatcg 18660
atgcggcccg tagccagtgg caactggcaa agcacactga acagcatcgt gggtctgggg 18720
gtgcaatccc tgaagcgccg acgatgcttc taaatagcta acgtgtcgta tgtgtcatgt 18780
atgcgtccat gtcgccgcca gaggagctgc tgagccgccg tgcgcccgct ttccaagatg 18840
gctacccctt cgatgatgcc gcagtggtct tacatgcaca tctcgggcca ggacgcctcg 18900
gagtacctga gccccgggct ggtgcagttt gcccgcgcca ccgagacgta cttcagcctg 18960
aataacaagt ttagaaaccc cacggtggca cctacgcacg acgtaaccac agaccggtcc 19020
cagcgtttga cgctgcggtt catccctgtg gaccgcgagg ataccgcgta ctcgtacaaa 19080
gcgcggttca ccctggctgt gggtgacaac cgtgtgcttg atatggcttc cacgtacttt 19140
gacatccgcg gcgtgctgga cagggggcct acttttaagc cctactccgg cactgcctac 19200
aacgctctag ctcccaaggg cgctcctaac tcctgtgagt gggaacaaac cgaagatagc 19260
ggccgggcag ttgccgagga tgaagaagag gaagatgaag atgaagaaga ggaagaagaa 19320
gagcaaaacg ctcgagatca ggctactaag aaaacacatg tctatgccca ggctcctttg 19380
tctggagaaa caattacaaa aagcgggcta caaataggat cagacaatgc agaaacacaa 19440
gctaaacctg tatacgcaga tccttcctat caaccagaac ctcaaattgg cgaatctcag 19500
tggaacgaag ctgatgctaa tgcggcagga gggagagtgc ttaaaaaaac aactcccatg 19560
aaaccatgct atggatctta tgccaggcct acaaatcctt ttggtggtca atccgttctg 19620
gttccggatg aaaaaggggt gcctcttcca aaggttgact tgcaattctt ctcaaatact 19680
acctctttga acgaccggca aggcaatgct actaaaccaa aagtggtttt gtacagtgaa 19740
gatgtaaata tggaaacccc agacacacat ctgtcttaca aacctggaaa aggtgatgaa 19800
aattctaaag ctatgttggg tcaacaatct atgccaaaca gacccaatta cattgctttc 19860
agggacaatt ttattggcct aatgtattat aacagcactg gcaacatggg tgttcttgct 19920
ggtcaggcat cgcagctaaa tgccgtggta gatttgcaag acagaaacac agagctgtcc 19980
tatcaactct tgcttgattc cataggtgat agaaccagat atttttctat gtggaatcag 20040
gctgtagaca gctatgatcc agatgttaga atcattgaaa accatggaac tgaggatgaa 20100
ttgccaaatt attgttttcc tcttgggggt attggggtaa ctgacaccta tcaagctatt 20160
aaggctaatg gcaatggctc aggcgataat ggagatacta catggacaaa agatgaaact 20220
tttgcaacac gtaatgaaat aggagtgggt aacaactttg ccatggaaat taacctaaat 20280
gccaacctat ggagaaattt cctttactcc aatattgcgc tgtacctgcc agacaagcta 20340
aaatacaacc ccaccaatgt ggaaatatct gacaacccca acacctacga ctacatgaac 20400
aagcgagtgg tggctcccgg gcttgtagac tgctacatta accttggggc gcgctggtct 20460
ctggactaca tggacaacgt taatcccttt aaccaccacc gcaatgcggg cctccgttat 20520
cgctccatgt tgttgggaaa cggccgctac gtgccctttc acattcaggt gccccaaaag 20580
ttttttgcca ttaaaaacct cctcctcctg ccaggctcat atacatatga atggaacttc 20640
aggaaggatg ttaacatggt tctgcagagc tctctgggaa acgatcttag agttgacggg 20700
gctagcatta agtttgacag catttgtctt tacgccacct tcttccccat ggcccacaac 20760
acggcctcca cgctggaagc catgctcaga aatgacacca acgaccagtc ctttaatgac 20820
tacctttccg ccgccaacat gctatacccc atacccgcca acgccaccaa cgtgcccatc 20880
tccatcccat cgcgcaactg ggcagcattt cgcggttggg ccttcacacg cttgaagaca 20940
aaggaaaccc cttccctggg atcaggctac gacccttact acacctactc tggctccata 21000
ccataccttg acggaacctt ctatcttaat cacaccttta agaaggtggc cattaccttt 21060
gactcttctg ttagctggcc gggcaacgac cgcctgctta ctcccaatga gtttgagatt 21120
aaacgctcag ttgacgggga gggctacaac gtagctcagt gcaacatgac caaggactgg 21180
ttcctggtgc agatgttggc caactacaat attggctacc agggcttcta cattccagaa 21240
agctacaagg accgcatgta ctcgttcttc agaaacttcc agcccatgag ccggcaagtg 21300
gttgacgata ctaaatacaa ggagtatcag caggttggaa ttcttcacca gcataacaac 21360
tcaggattcg taggctacct cgctcccacc atgcgcgagg gacaggctta ccccgccaac 21420
gtgccctacc cactaatagg caaaaccgcg gttgacagta ttacccagaa aaagtttctt 21480
tgcgatcgca ccctttggcg catcccattc tccagtaact ttatgtccat gggcgcactc 21540
acagacctgg gccaaaacct tctctacgcc aactccgccc acgcgctaga catgactttt 21600
gaggtggatc ccatggacga gcccaccctt ctttatgttt tgtttgaagt ctttgacgtg 21660
gtccgtgtgc accagccgca ccgcggcgtc atcgagaccg tgtacctgcg cacgcccttc 21720
tcggccggca acgccacaac ataaaagaag caagcaacat caacaacagc tgccgccatg 21780
ggctccagtg agcaggaact gaaagccatt gtcaaagatc ttggttgtgg gccatatttt 21840
ttgggcacct atgacaagcg ctttccaggc tttgtttctc cacacaagct cgcctgcgcc 21900
atagtcaata cggccggtcg cgagactggg ggcgtacact ggatggcctt tgcctggaac 21960
ccgcgctcaa aaacatgcta cctctttgag ccctttggct tttctgacca acgactcaag 22020
caggtttacc agtttgagta cgagtcactc ctgcgccgta gcgccattgc ttcttccccc 22080
gaccgctgta taacgctgga aaagtccacc caaagcgtgc aggggcccaa ctcggccgcc 22140
tgtggactat tctgctgcat gtttctccac gcctttgcca actggcccca aactcccatg 22200
gatcacaacc ccaccatgaa ccttattacc ggggtaccca actccatgct taacagtccc 22260
caggtacagc ccaccctgcg tcgcaaccag gaacagctct acagcttcct ggagcgccac 22320
tcgccctact tccgcagcca cagtgcgcag attaggagcg ccacttcttt ttgtcacttg 22380
aaaaacatgt aaaaataatg tactaggaga cactttcaat aaaggcaaat gtttttattt 22440
gtacactctc gggtgattat ttacccccca cccttgccgt ctgcgccgtt taaaaatcaa 22500
aggggttctg ccgcgcatcg ctatgcgcca ctggcaggga cacgttgcga tactggtgtt 22560
tagtgctcca cttaaactca ggcacaacca tccgcggcag ctcggtgaag ttttcactcc 22620
acaggctgcg caccatcacc aacgcgttta gcaggtcggg cgccgatatc ttgaagtcgc 22680
agttggggcc tccgccctgc gcgcgcgagt tgcgatacac agggttgcag cactggaaca 22740
ctatcagcgc cgggtggtgc acgctggcca gcacgctctt gtcggagatc agatccgcgt 22800
ccaggtcctc cgcgttgctc agggcgaacg gagtcaactt tggtagctgc cttcccaaaa 22860
agggtgcatg cccaggcttt gagttgcact cgcaccgtag tggcatcaga aggtgaccgt 22920
gcccggtctg ggcgttagga tacagcgcct gcatgaaagc cttgatctgc ttaaaagcca 22980
cctgagcctt tgcgccttca gagaagaaca tgccgcaaga cttgccggaa aactgattgg 23040
ccggacaggc cgcgtcatgc acgcagcacc ttgcgtcggt gttggagatc tgcaccacat 23100
ttcggcccca ccggttcttc acgatcttgg ccttgctaga ctgctccttc agcgcgcgct 23160
gcccgttttc gctcgtcaca tccatttcaa tcacgtgctc cttatttatc ataatgctcc 23220
cgtgtagaca cttaagctcg ccttcgatct cagcgcagcg gtgcagccac aacgcgcagc 23280
ccgtgggctc gtggtgcttg taggttacct ctgcaaacga ctgcaggtac gcctgcagga 23340
atcgccccat catcgtcaca aaggtcttgt tgctggtgaa ggtcagctgc aacccgcggt 23400
gctcctcgtt tagccaggtc ttgcatacgg ccgccagagc ttccacttgg tcaggcagta 23460
gcttgaagtt tgcctttaga tcgttatcca cgtggtactt gtccatcaac gcgcgcgcag 23520
cctccatgcc cttctcccac gcagacacga tcggcaggct cagcgggttt atcaccgtgc 23580
tttcactttc cgcttcactg gactcttcct tttcctcttg cgtccgcata ccccgcgcca 23640
ctgggtcgtc ttcattcagc cgccgcaccg tgcgcttacc tcccttgccg tgcttgatta 23700
gcaccggtgg gttgctgaaa cccaccattt gtagcgccac atcttctctt tcttcctcgc 23760
tgtccacgat cacctctggg gatggcgggc gctcgggctt gggagagggg cgcttctttt 23820
tctttttgga cgcaatggcc aaatccgccg tcgaggtcga tggccgcggg ctgggtgtgc 23880
gcggcaccag cgcatcttgt gacgagtctt cttcgtcctc ggactcgaga cgccgcctca 23940
gccgcttttt tgggggcgcg cggggaggcg gcggcgacgg cgacggggac gacacgtcct 24000
ccatggttgg tggacgtcgc gccgcaccgc gtccgcgctc gggggtggtt tcgcgctgct 24060
cctcttcccg actggccatt tccttctcct ataggcagaa aaagatcatg gagtcagtcg 24120
agaaggagga cagcctaacc gccccctttg agttcgccac caccgcctcc accgatgccg 24180
ccaacgcgcc taccaccttc cccgtcgagg cacccccgct tgaggaggag gaagtgatta 24240
tcgagcagga cccaggtttt gtaagcgaag acgacgagga tcgctcagta ccaacagagg 24300
ataaaaagca agaccaggac gacgcagagg caaacgagga acaagtcggg cggggggacc 24360
aaaggcatgg cgactaccta gatgtgggag acgacgtgct gttgaagcat ctgcagcgcc 24420
agtgcgccat tatctgcgac gcgttgcaag agcgcagcga tgtgcccctc gccatagcgg 24480
atgtcagcct tgcctacgaa cgccacctgt tctcaccgcg cgtacccccc aaacgccaag 24540
aaaacggcac atgcgagccc aacccgcgcc tcaacttcta ccccgtattt gccgtgccag 24600
aggtgcttgc cacctatcac atctttttcc aaaactgcaa gataccccta tcctgccgtg 24660
ccaaccgcag ccgagcggac aagcagctgg ccttgcggca gggcgctgtc atacctgata 24720
tcgcctcgct cgacgaagtg ccaaaaatct ttgagggtct tggacgcgac gagaaacgcg 24780
cggcaaacgc tctgcaacaa gaaaacagcg aaaatgaaag tcactgtgga gtgctggtgg 24840
aacttgaggg tgacaacgcg cgcctagccg tgctgaaacg cagcatcgag gtcacccact 24900
ttgcctaccc ggcacttaac ctacccccca aggttatgag cacagtcatg agcgagctga 24960
tcgtgcgccg tgcacgaccc ctggagaggg atgcaaactt gcaagaacaa accgaggagg 25020
gcctacccgc agttggcgat gagcagctgg cgcgctggct tgagacgcgc gagcctgccg 25080
acttggagga gcgacgcaag ctaatgatgg ccgcagtgct tgttaccgtg gagcttgagt 25140
gcatgcagcg gttctttgct gacccggaga tgcagcgcaa gctagaggaa acgttgcact 25200
acacctttcg ccagggctac gtgcgccagg cctgcaaaat ttccaacgtg gagctctgca 25260
acctggtctc ctaccttgga attttgcacg aaaaccgcct cgggcaaaac gtgcttcatt 25320
ccacgctcaa gggcgaggcg cgccgcgact acgtccgcga ctgcgtttac ttatttctgt 25380
gctacacctg gcaaacggcc atgggcgtgt ggcagcaatg cctggaggag cgcaacctaa 25440
aggagctgca gaagctgcta aagcaaaact tgaaggacct atggacggcc ttcaacgagc 25500
gctccgtggc cgcgcacctg gcggacatta tcttccccga acgcctgctt aaaaccctgc 25560
aacagggtct gccagacttc accagtcaaa gcatgttgca aaactttagg aactttatcc 25620
tagagcgttc aggaattctg cccgccacct gctgtgcgct tcctagcgac tttgtgccca 25680
ttaagtaccg tgaatgccct ccgccgcttt ggggtcactg ctaccttctg cagctagcca 25740
actaccttgc ctaccactcc gacatcatgg aagacgtgag cggtgacggc ctactggagt 25800
gtcactgtcg ctgcaaccta tgcaccccgc accgctccct ggtctgcaat tcgcaactgc 25860
ttagcgaaag tcaaattatc ggtacctttg agctgcaggg tccctcgcct gacgaaaagt 25920
ccgcggctcc ggggttgaaa ctcactccgg ggctgtggac gtcggcttac cttcgcaaat 25980
ttgtacctga ggactaccac gcccacgaga ttaggttcta cgaagaccaa tcccgcccgc 26040
caaatgcgga gcttaccgcc tgcgtcatta cccagggcca catccttggc caattgcaag 26100
ccatcaacaa agcccgccaa gagtttctgc tacgaaaggg acggggggtt tacctggacc 26160
cccagtccgg cgaggagctc aacccaatcc ccccgccgcc gcagccctat cagcagccgc 26220
gggcccttgc ttcccaggat ggcacccaaa aagaagctgc agctgccgcc gccgccaccc 26280
acggacgagg aggaatactg ggacagtcag gcagaggagg ttttggacga ggaggaggag 26340
atgatggaag actgggacag cctagacgaa gcttccgagg ccgaagaggt gtcagacgaa 26400
acaccgtcac cctcggtcgc attcccctcg ccggcgcccc agaaattggc aaccgttccc 26460
agcatcgcta caacctccgc tcctcaggcg ccgccggcac tgcctgttcg ccgacccaac 26520
cgtagatggg acaccactgg aaccagggcc ggtaagtcta agcagccgcc gccgttagcc 26580
caagagcaac aacagcgcca aggctaccgc tcgtggcgcg ggcacaagaa cgccatagtt 26640
gcttgcttgc aagactgtgg gggcaacatc tccttcgccc gccgctttct tctctaccat 26700
cacggcgtgg ccttcccccg taacatcctg cattactacc gtcatctcta cagcccctac 26760
tgcaccggcg gcagcggcag cggcagcaac agcagcggtc acacagaagc aaaggcgacc 26820
ggatagcaag actctgacaa agcccaagaa atccacagcg gcggcagcag caggaggagg 26880
agcgctgcgt ctggcgccca acgaacccgt atcgacccgc gagcttagaa ataggatttt 26940
tcccactctg tatgctatat ttcaacaaag caggggccaa gaacaagagc tgaaaataaa 27000
aaacaggtct ctgcgctccc tcacccgcag ctgcctgtat cacaaaagcg aagatcagct 27060
tcggcgcacg ctggaagacg cggaggctct cttcagcaaa tactgcgcgc tgactcttaa 27120
ggactagttt cgcgcccttt ctcaaattta agcgcgaaaa ctacgtcatc tccagcggcc 27180
acacccggcg ccagcacctg tcgtcagcgc cattatgagc aaggaaattc ccacgcccta 27240
catgtggagt taccagccac aaatgggact tgcggctgga gctgcccaag actactcaac 27300
ccgaataaac tacatgagcg cgggacccca catgatatcc cgggtcaacg gaatccgcgc 27360
ccaccgaaac cgaattctcc tcgaacaggc ggctattacc accacacctc gtaataacct 27420
taatccccgt agttggcccg ctgccctggt gtaccaggaa agtcccgctc ccaccactgt 27480
ggtacttccc agagacgccc aggccgaagt tcagatgact aactcagggg cgcagcttgc 27540
gggcggcttt cgtcacaggg tgcggtcgcc cgggcagggt ataactcacc tgaaaatcag 27600
agggcgaggt attcagctca acgacgagtc ggtgagctcc tctcttggtc tccgtccgga 27660
cgggacattt cagatcggcg gcgctggccg ctcttcattt acgccccgtc aggcgatcct 27720
aactctgcag acctcgtcct cggagccgcg ctccggaggc attggaactc tacaatttat 27780
tgaggagttc gtgccttcgg tttacttcaa ccccttttct ggacctcccg gccactaccc 27840
ggaccagttt attcccaact ttgacgcggt gaaagactcg gcggacggct acgactgaat 27900
gaccagtgga gaggcagagc gactgcgcct gacacacctc gaccactgcc gccgccacaa 27960
gtgctttgcc cgcggctccg gtgagttttg ttactttgaa ttgcccgaag agcatatcga 28020
gggcccggcg cacggcgtcc ggctcaccac ccaggtagag cttacacgta gcctgattcg 28080
ggagtttacc aagcgccccc tgctagtgga gcgggagcgg ggtccctgtg ttctgaccgt 28140
ggtttgcaac tgtcctaacc ctggattaca tcaagatctt tgttgtcatc tctgtgctga 28200
gtataataaa tacagaaatt agaatctact ggggctcctg tcgccatcct gtgaacgcca 28260
ccgtttttac ccacccaaag cagaccaaag caaacctcac ctccggtttg cacaagcggg 28320
ccaataagta ccttacctgg tactttaacg gctcttcatt tgtaatttac aacagtttcc 28380
agcgagacga agtaagtttg ccacacaacc ttctcggctt caactacacc gtcaagaaaa 28440
acaccaccac caccaccctc ctcacctgcc gggaacgtac gagtgcgtca ccggttgctg 28500
cgcccacacc tacagcctga gcgtaaccag acattactcc catttttcca aaacaggagg 28560
tgagctcaac tcccggaact caggtcaaaa aagcattttg cggggtgctg ggatttttta 28620
attaagtata tgagcaattc aagtaactct acaagcttgt ctaatttttc tggaattggg 28680
gtcggggtta tccttactct tgtaattctg tttattctta tactagcact tctgtgcctt 28740
agggttgccg cctgctgcac gcacgtttgt acctattgtc agctttttaa acgctggggg 28800
caacatccaa gatgaggtac atgattttag gcttgctcgc ccttgcggca gtctgcagcg 28860
ctgccaaaaa ggttgagttt aaggaaccag cttgcaatgt tacatttaaa tcagaagcta 28920
atgaatgcac tactcttata aaatgcacca cagaacatga aaagcttatt attcgccaca 28980
aagacaaaat tggcaagtat gctgtatatg ctatttggca gccaggtgac actaacgact 29040
ataatgtcac agtcttccaa ggtgaaaatc gtaaaacttt tatgtataaa tttccatttt 29100
atgaaatgtg cgatattacc atgtacatga gcaaacagta caagttgtgg cccccacaaa 29160
agtgtttaga gaacactggc accttttgtt ccaccgctct gcttattaca gcgcttgctt 29220
tggtatgtac cttactttat ctcaaataca aaagcagacg cagttttatt gatgaaaaga 29280
aaatgccttg attttccgct tgcttgtatt cccctggaca atttactcta tgtgggatat 29340
gctccaggcg ggcaagatta tacccacaac cttcaaatca aactttcctg gacgttagcg 29400
cctgatttct gccagcgcct gcactgcaaa tttgatcaaa cccagcttca gcttgcctgc 29460
tccagagatg accggctcaa ccatcgcgcc cacaacggac tatcgcaaca ccactgctac 29520
cggactaaca tctgccctaa atttacccca agttcatgcc tttgtcaatg actgggcgag 29580
cttggacatg tggtggtttt ccatagcgct tatgtttgtt tgccttatta ttatgtggct 29640
tatttgttgc ctaaagcgca gacgcgccag accccccatc tataggccta tcattgtgct 29700
caacccacac aatgaaaaaa ttcatagatt ggacggtctg aaaccatgtt ctcttctttt 29760
acagtatgat taaatgagac atgattcctc gagttcttat attattgacc cttgttgcgc 29820
ttttctgtgc gtgctctaca ttggccgcgg tcgctcacat cgaagtagat tgcatcccac 29880
ctttcacagt ttacctgctt tacggatttg tcacccttat cctcatctgc agcctcgtca 29940
ctgtagtcat cgccttcatt cagttcattg actgggtttg tgtgcgcatt gcgtacctca 30000
ggcaccatcc gcaatacaga gacaggacta tagctgatct tctcagaatt ctttaattat 30060
gaaacggagt gtcatttttg ttttgctgat tttttgcgcc ctacctgtgc tttgctccca 30120
aacctcagcg cctcccaaaa gacatatttc ctgcagattc actcaaatat ggaacattcc 30180
cagctgctac aacaaacaga gcgatttgtc agaagcctgg ttatacgcca tcatctctgt 30240
catggttttt tgcagtacca tttttgccct agccatatat ccataccttg acattggctg 30300
gaatgccata gatgccatga accaccctac tttcccagtg cccgctgtca taccactgca 30360
acaggttatt gccccaatca atcagcctcg ccccccttct cccaccccca ctgagattag 30420
ctactttaat ttgacaggtg gagatgactg aatctctaga tctagaattg gatggaatta 30480
acaccgaaca gcgcctacta gaaaggcgca aggcggcgtc cgagcgagaa cgcctaaaac 30540
aagaagttga agacatggtt aacctacacc agtgtaaaag aggtatcttt tgtgtggtca 30600
agcaggccaa acttacctac gaaaaaacca ctaccggcaa ccgcctcagc tacaagctac 30660
ccacccagcg ccaaaaactg gtgcttatgg tgggagaaaa acctatcacc gtcacccagc 30720
actcggcaga aacagagggc tgcctgcact tcccctatca gggtccagag gacctctgca 30780
ctcttattaa aaccatgtgt ggtattagag atcttattcc attcaactaa cataaacaca 30840
caataaatta cttacttaaa atcagtcagc aaatctttgt ccagcttatt cagcatcacc 30900
tcctttcctt cctcccaact ctggtatctc agccgccttt tagctgcaaa ctttctccaa 30960
agtttaaatg ggatgtcaaa ttcctcatgt tcttgtccct ccgcacccac tatcttcata 31020
ttgttgcaga tgaaacgcgc cagaccgtct gaagacacct tcaaccccgt gtatccatat 31080
gacacagaaa ccgggcctcc aactgtgccc tttcttaccc ctccatttgt ttcacccaat 31140
ggtttccaag aaagtccccc tggagttctc tctctacgcg tctccgaacc tttggacacc 31200
tcccacggca tgcttgcgct taaaatgggc agcggtctta ccctagacaa ggccggaaac 31260
ctcacctccc aaaatgtaac cactgttact cagccactta aaaaaacaaa gtcaaacata 31320
agtttggaca cctccgcacc acttacaatt acctcaggcg ccctaacagt ggcaaccacc 31380
gctcctctga tagttactag cggcgctctt agcgtacagt cacaagcccc actgaccgtg 31440
caagactcca aactaagcat tgctactaaa gggcccatta cagtgtcaga tggaaagcta 31500
gccctgcaaa catcagcccc cctctctggc agtgacagcg acacccttac tgtaactgca 31560
tcacccccgc taactactgc cacgggtagc ttgggcatta acatggaaga tcctatttat 31620
gtaaataatg gaaaaatagg aattaaaata agcggtcctt tgcaagtagc acaaaactcc 31680
gatacactaa cagtagttac tggaccaggt gtcaccgttg aacaaaactc ccttagaacc 31740
aaagttgcag gagctattgg ttatgattca tcaaacaaca tggaaattaa aacgggcggt 31800
ggcatgcgta taaataacaa cttgttaatt ctagatgtgg attacccatt tgatgctcaa 31860
acaaaactac gtcttaaact ggggcaggga cccctgtata ttaatgcatc tcataacttg 31920
gacataaact ataacagagg cctatacctt tttaatgcat caaacaatac taaaaaactg 31980
gaagttagca taaaaaaatc cagtggacta aactttgata atactgccat agctataaat 32040
gcaggaaagg gtctggagtt tgatacaaac acatctgagt ctccagatat caacccaata 32100
aaaactaaaa ttggctctgg cattgattac aatgaaaacg gtgccatgat tactaaactt 32160
ggagcgggtt taagctttga caactcaggg gccattacaa taggaaacaa aaatgatgac 32220
aaacttaccc tgtggacaac cccagaccca tctcctaact gcagaattca ttcagataat 32280
gactgcaaat ttactttggt tcttacaaaa tgtgggagtc aagtactagc tactgtagct 32340
gctttggctg tatctggaga tctttcatcc atgacaggca ccgttgcaag tgttagtata 32400
ttccttagat ttgaccaaaa cggtgttcta atggagaact cctcacttaa aaaacattac 32460
tggaacttta gaaatgggaa ctcaactaat gcaaatccat acacaaatgc agttggattt 32520
atgcctaacc ttctagccta tccaaaaacc caaagtcaaa ctgctaaaaa taacattgtc 32580
agtcaagttt acttgcatgg tgataaaact aaacctatga tacttaccat tacacttaat 32640
ggcactagtg aatccacaga aactagcgag gtaagcactt actctatgtc ttttacatgg 32700
tcctgggaaa gtggaaaata caccactgaa acttttgcta ccaactctta caccttctcc 32760
tacattgccc aggaataaag aatcgtgaac ctgttgcatg ttatgtttca acgtgtttat 32820
ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca 32880
tagcttatat tgatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc 32940
acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat 33000
catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc 33060
caaacgctca tcagtgatat taataaactc cccgggcagc tcgcttaagt tcatgtcgct 33120
gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgctcaacgg gcggcgaagg 33180
ggaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg 33240
ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat 33300
ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc atgagacgcc ttgtcctccg 33360
ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac 33420
aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac 33480
agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa 33540
cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca 33600
tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac 33660
ctgcccgccg gctatgcact gcagggaacc gggactggaa caatgacagt ggagagccca 33720
ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca 33780
cacgtgcata cacttcctca ggattacaag ctcctcccgc gtcagaacca tatcccaggg 33840
aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact 33900
cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt 33960
agcgcgggtc tctgtctcaa aaggaggtag gcgatcccta ctgtacggag tgcgccgaga 34020
caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt 34080
tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgtcgct 34140
tagctcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc 34200
tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg 34260
cagaataagc cacacccagc caacctacac attcgttctg cgagtcacac acgggaggag 34320
cgggaagagc tggaagaacc atgttttttt tttttttatt ccaaaagatt atccaaaacc 34380
tcaaaatgaa gatctattaa gtgaacgcgc tcccctccgg tggcgtggtc aaactctaca 34440
gccaaagaac agataatggc atttgtaaga tgttgcacaa tggcttccaa aaggcaaact 34500
gccctcacgt ccaagtggac gtaaaggcta aacccttcag ggtgaatctc ctctataaac 34560
attccagcac cttcaaccat gcccaaataa ttttcatctc gccaccttat caatatgtct 34620
ctaagcaaat cccgaatatt aagtccggcc attgtaaaaa tctgctccag agcgccctcc 34680
accttcagcc tcaagcagcg aatcatgatt gcaaaaattc aggttcctca cagacctgta 34740
taagattcaa aagcggaaca ttaacaaaaa taccgcgatc ccgtaggtcc cttcgcaggg 34800
ccagctgaac ataatcgtgc aggtctgcac ggaccagcgc ggccacttcc ccgccaggaa 34860
ccatgacaaa agaacccaca ctgattatga cacgcatact cggagctatg ctaaccagcg 34920
tagcccctat gtaagcttgt tgcatgggcg gcgatataaa atgcaaggtg ctgctcaaaa 34980
aatcaggcaa agcctcgcgc aaaaaagcaa gcacatcgta gtcatgctca tgcagataaa 35040
ggcaggtaag ttccggaacc accacagaaa aagacaccat ttttctctca aacatgtctg 35100
cgggttcctg cattaaacac aaaataaaat aacaaaaaaa aacatttaaa cattagaagc 35160
ctgtcttaca acaggaaaaa caacccttat aagcataaga cggactacgg ccatgccggc 35220
gtgaccgtaa aaaaactggt caccgtgatt aaaaagcacc accgacagtt cctcggtcat 35280
gtccggagtc ataatgtaag actcggtaaa cacatcaggt tggttaacat cggtcagtgc 35340
taaaaagcga ccgaaatagc ccgggggaat acatacccgc aggcgtagag acaacattac 35400
agcccccata ggaggtataa caaaattaat aggagagaaa aacacataaa cacctgaaaa 35460
accctcctgc ctaggcaaaa tagcaccctc ccgctccaga acaacataca gcgcttccac 35520
agcggcagcc ataacagtca gccttaccag taaaaaaacc tattaaaaaa caccactcga 35580
cacggcacca gctcaatcag tcacagtgta aaaagggcca agtacagagc gagtatatat 35640
aggactaaaa aatgacgtaa cggttaaagt ccacaaaaaa cacccagaaa accgcacgcg 35700
aacctacgcc cagaaacgaa agccaaaaaa cccacaactt cctcaaatct tcacttccgt 35760
tttcccacga tacgtcactt cccattttaa aaaaactaca attcccaata catgcaagtt 35820
actccgccct aaaacctacg tcacccgccc cgttcccacg ccccgcgcca cgtcacaaac 35880
tccaccccct cattatcata ttggcttcaa tccaaaataa ggtatattat gatgatg 35937
<210> 4
<211> 8342
<212> DNA
<213> 人工序列
<220>
<223> 辅助基因区域
<400> 4
ccgtgcaaaa ggagagcctg taagcgggca ctcttccgtg gtctggtgga taaattcgca 60
agggtatcat ggcggacgac cggggttcga gccccgtatc cggccgtccg ccgtgatcca 120
tgcggttacc gcccgcgtgt cgaacccagg tgtgcgacgt cagacaacgg gggagtgctc 180
cttttggctt ccttccaggc gcggcggctg ctgcgctagc ttttttggcc actggccgcg 240
cgcagcgtaa gcggttaggc tggaaagcga aagcattaag tggctcgctc cctgtagccg 300
gagggttatt ttccaagggt tgagtcgcgg gacccccggt tcgagtctcg gaccggccgg 360
actgcggcga acgggggttt gcctccccgt catgcaagac cccgcttgca aattcctccg 420
gaaacaggga cgagcccctt ttttgctttt aaaggcaaat gcttttattt gtacactctc 480
gggtgattat ttacccccac ccttgccgtc tgcgccgttt aaaaatcaaa ggggttctgc 540
cgcgcatcgc tatgcgccac tggcagggac acgttgcgat actggtgttt agtgctccac 600
ttaaactcag gcacaaccat ccgcggcagc tcggtgaagt tttcactcca caggctgcgc 660
accatcacca acgcgtttag caggtcgggc gccgatatct tgaagtcgca gttggggcct 720
ccgccctgcg cgcgcgagtt gcgatacaca gggttgcagc actggaacac tatcagcgcc 780
gggtggtgca cgctggccag cacgctcttg tcggagatca gatccgcgtc caggtcctcc 840
gcgttgctca gggcgaacgg agtcaacttt ggtagctgcc ttcccaaaaa gggcgcgtgc 900
ccaggctttg agttgcactc gcaccgtagt ggcatcaaaa ggtgaccgtg cccggtctgg 960
gcgttaggat acagcgcctg cataaaagcc ttgatctgct taaaagccac ctgagccttt 1020
gcgccttcag agaagaacat gccgcaagac ttgccggaaa actgattggc cggacaggcc 1080
gcgtcgtgca cgcagcacct tgcgtcggtg ttggagatct gcaccacatt tcggccccac 1140
cggttcttca cgatcttggc cttgctagac tgctccttca gcgcgcgctg cccgttttcg 1200
ctcgtcacat ccatttcaat cacgtgctcc ttatttatca taatgcttcc gtgtagacac 1260
ttaagctcgc cttcgatctc agcgcagcgg tgcagccaca acgcgcagcc cgtgggctcg 1320
tgatgcttgt aggtcacctc tgcaaacgac tgcaggtacg cctgcaggaa tcgccccatc 1380
atcgtcacaa aggtcttgtt gctggtgaag gtcagctgca acccgcggtg ctcctcgttc 1440
agccaggtct tgcatacggc cgccagagct tccacttggt caggcagtag tttgaagttc 1500
gcctttagat cgttatccac gtggtacttg tccatcagcg cgcgcgcagc ctccatgccc 1560
ttctcccacg cagacacgat cggcacactc agcgggttca tcaccgtaat ttcactttcc 1620
gcttcgctgg gctcttcctc ttcctcttgc gtccgcatac cacgcgccac tgggtcgtct 1680
tcattcagcc gccgcactgt gcgcttacct cctttgccat gcttgattag caccggtggg 1740
ttgctgaaac ccaccatttg tagcgccaca tcttctcttt cttcctcgct gtccacgatt 1800
acctctggtg atggcgggcg ctcgggcttg ggagaagggc gcttcttttt cttcttgggc 1860
gcaatggcca aatccgccgc cgaggtcgat ggccgcgggc tgggtgtgcg cggcaccagc 1920
gcgtcttgtg atgagtcttc ctcgtcctcg gactcgatac gccgcctcat ccgctttttt 1980
gggggcgccc ggggaggcgg cggcgacggg gacggggacg acacgtcctc catggttggg 2040
ggacgtcgcg ccgcaccgcg tccgcgctcg ggggtggttt cgcgctgctc ctcttcccga 2100
ctggccattt ccttctccta taggcagaaa aagatcatgt cgacaacgtt ggagtcagtc 2160
gagaagaagg acagcctaac cgccccctct gagttcgcca ccaccgcctc caccgatgcc 2220
gccaacgcgc ctaccacctt ccccgtcgag gcacccccgc ttgaggagga ggaagtgatt 2280
atcgagcagg acccaggttt tgtaagcgaa gacgacgagg accgctcagt accaacagag 2340
gataaaaagc aagaccagga caacgcagag gcaaacgagg aacaagtcgg gcggggggac 2400
gaaaggcatg gcgactacct agatgtggga gacgacgtgc tgttgaagca tctgcagcgc 2460
cagtgcgcca ttatctgcga cgcgttgcaa gagcgcagcg atgtgcccct cgccatagcg 2520
gatgtcagcc ttgcctacga acgccaccta ttctcaccgc gcgtaccccc caaacgccaa 2580
gaaaacggca catgcgagcc caacccgcgc ctcaacttct accccgtatt tgccgtgcca 2640
gaggtgcttg ccacctatca catctttttc caaaactgca agatacccct atcctgccgt 2700
gccaaccgca gccgagcgga caagcagctg gccttgcggc agggcgctgt catacctgat 2760
atcgcctcgc tcaacgaagt gccaaaaatc tttgagggtc ttggacgcga cgagaagcgc 2820
gcggcaaacg ctctgcaaca ggaaaacagc gaaaatgaaa gtcactctgg agtgttggtg 2880
gaactcgagg gtgacaacgc gcgcctagcc gtactaaaac gcagcatcga ggtcacccac 2940
tttgcctacc cggcacttaa cctacccccc aaggtcatga gcacagtcat gagtgagctg 3000
atcgtgcgcc gtgcgcagcc cctggagagg gatgcaaatt tgcaagaaca aacagaggag 3060
ggcctacccg cagttggcga cgagcagcta gcgcgctggc ttcaaacgcg cgagcctgcc 3120
gacttggagg agcgacgcaa actaatgatg gccgcagtgc tcgttaccgt ggagcttgag 3180
tgcatgcagc ggttctttgc tgacccggag atgcagcgca agctagagga aacattgcac 3240
tacacctttc gacagggcta cgtacgccag gcctgcaaga tctccaacgt ggagctctgc 3300
aacctggtct cctaccttgg aattttgcac gaaaaccgcc ttgggcaaaa cgtgcttcat 3360
tccacgctca agggcgaggc gcgccgcgac tacgtccgcg actgcgttta cttatttcta 3420
tgctacacct ggcagacggc catgggcgtt tggcagcagt gcttggagga gtgcaacctc 3480
aaggagctgc agaaactgct aaagcaaaac ttgaaggacc tatggacggc cttcaacgag 3540
cgctccgtgg ccgcgcacct ggcggacatc attttccccg aacgcctgct taaaaccctg 3600
caacagggtc tgccagactt caccagtcaa agcatgttgc agaactttag gaactttatc 3660
ctagagcgct caggaatctt gcccgccacc tgctgtgcac ttcctagcga ctttgtgccc 3720
attaagtacc gcgaatgccc tccgccgctt tggggccact gctaccttct gcagctagcc 3780
aactaccttg cctaccactc tgacataatg gaagacgtga gcggtgacgg tctactggag 3840
tgtcactgtc gctgcaacct atgcaccccg caccgctccc tggtttgcaa ttcgcagctg 3900
cttaacgaaa gtcaaattat cggtaccttt gagctgcagg gtccctcgcc tgacgaaaag 3960
tccgcggctc cggggttgaa actcactccg gggctgtgga cgtcggctta ccttcgcaaa 4020
tttgtacctg aggactacca cgcccacgag attaggttct acgaagacca atcccgcccg 4080
cctaatgcgg agcttaccgc ctgcgtcatt acccagggcc acattcttgg ccaattgcaa 4140
gccatcaaca aagcccgcca agagtttctg ctacgaaagg gacggggggt ttacttggac 4200
ccccagtccg gcgaggagct caacccaatc cccccgccgc cgcagcccta tcagcagcag 4260
ccgcgggccc ttgcttccca ggatggcacc caaaaagaag ctgcagctgc cgccgccacc 4320
cacggacgag gaggaatact gggacagtca ggcagaggag gttttggacg aggaggagga 4380
ggacatgatg gaagactggg agagcctaga cgaggaagct tccgaggtcg aagaggtgtc 4440
agacgaaaca ccgtcaccct cggtcgcatt cccctcgccg gcgccccaga aatcggcaac 4500
cggttccagc atggctacaa cctccgctcc tcaggcgccg ccggcactgc ccgttcgccg 4560
acccaaccgt agatgggaca ccactggaac cagggccggt aagtccaagc agccgccgcc 4620
gttagcccaa gagcaacaac agcgccaagg ctaccgctca tggcgcgggc acaagaacgc 4680
catagttgct tgcttgcaag actgtggggg caacatctcc ttcgcccgcc gctttcttct 4740
ctaccatcac ggcgtggcct tcccccgtaa catcctgcat tactaccgtc atctctacag 4800
cccatactgc accggcggca gcggcagcaa cagcagcggc cacacagaag caaaggcgac 4860
cggatagcaa gactctgaca aagcccaaga aatccacagc ggcggcagca gcaggaggag 4920
gagcgctgcg tctggcgccc aacgaacccg tatcgacccg cgagcttaga aacaggattt 4980
ttcccactct gtatgctata tttcaacaga gcaggggcca agaacaagag ctgaaaataa 5040
aaaacaggtc tctgcgatcc ctcacccgca gctgcctgta tcacaaagtc gacagcgaag 5100
atcagcttcg gcgcacgctg gaagacgcgg aggctctctt cagtaaatac tgcgcgctga 5160
ctcttaagga ctagtttcgc gccctttctc aaatttaagc gcgaaaacta cgtcatctcc 5220
agcgttcgaa cttacacttt ttcatacatt gcccaagaat aaagaatcgt ttgtgttatg 5280
tttcaacgtg tttatttttc aattgcagaa aatttcaagt catttttcat tcagtagtat 5340
agccccacca ccacatagct tatacagatc accgtacctt aatcaaactc acagaaccct 5400
agtattcaac ctgccacctc cctcccaaca cacagagtac acagtccttt ctccccggct 5460
ggccttaaaa agcatcatat catgggtaac agacatattc ttaggtgtta tattccacac 5520
ggtttcctgt cgagccaaac gctcatcagt gatattaata aactccccgg gcagctcact 5580
taagttcatg tcgctgtcca gctgctgagc cacaggctgc tgtccaactt gcggttgctt 5640
aacgggcggc gaaggagaag tccacgccta catgggggta gagtcataat cgtgcatcag 5700
gatagggcgg tggtgctgca gcagcgcgcg aataaactgc tgccgccgcc gctccgtcct 5760
gcaggaatac aacatggcag tggtctcctc agcgatgatt cgcaccgccc gcagcataag 5820
gcgccttgtc ctccgggcac agcagcgcac cctgatctca cttaaatcag cacagtaact 5880
gcagcacagc accacaatat tgttcaaaat cccacagtgc aaggcgctgt atccaaagct 5940
catggcgggg accacagaac ccacgtggcc atcataccac aagcgcaggt agattaagtg 6000
gcgacccctc ataaacacgc tggacataaa cattacctct tttggcatgt tgtaattcac 6060
cacctcccgg taccatataa acctctgatt aaacatggcg ccatccacca ccatcctaaa 6120
ccagctggcc aaaacctgcc cgccggctat acactgcagg gaaccgggac tggaacaatg 6180
acagtggaga gcccaggact cgtaaccatg gatcatcatg ctcgtcatga tatcaatgtt 6240
ggcacaacac aggcacacgt gcatacactt cctcaggatt acaagctcct cccgcgttag 6300
aaccatatcc cagggaacaa cccattcctg aatcagcgta aatcccacac tgcagggaag 6360
acctcgcacg taactcacgt tgtgcattgt caaagtgtta cattcgggca gcagcggatg 6420
atcctccagt atggtagcgc gggtttctgt ctcaaaagga ggtagacgat ccctactgta 6480
cggagtgcgc cgagacaacc gagatcgtgt tggtcgtagt gtcatgccaa atggaacgcc 6540
ggacgtagtc atatttcctg aagcaaaacc aggtgcgggc gtggatccga caaacagatc 6600
tgcgtctccg gtctcgccgc ttagatcgct ctgtgtagta gttgtagtat atccactctc 6660
tcaaagcatc caggcgcccc ctggcttcgg gttctatgta aactccttca tgcgccgctg 6720
ccctgataac atccaccacc gcagaataag ccacacccag ccaacctaca cattcgttct 6780
gcgagtcaca cacgggagga gcgggaagag ctggaagaac catgtttttt ttttttattc 6840
caaaagatta tccaaaacct caaaatgaag atctattaag tgaacgcgct cccctccggt 6900
ggcgtggtca aactctacag ccaaagaaca gataatggca tttgtaagat gttgcacaat 6960
ggcttccaaa aggcaaacgg ccctcacgtc caagtggacg taaaggctaa acccttcagg 7020
gtgaatctcc tctataaaca ttccagcacc ttcaaccatg cccaaataat tctcatctcg 7080
ccaccttctc aatatatctc taagcaaatc ccgaatatta agtccggcca ttgtaaaaat 7140
ctgctccaga gcgccctcca ccttcagcct caagcagcga atcatgattg caaaaattca 7200
ggttcctcac agacctgtat aagattcaaa agcggaacat taacaaaaat accgcgatcc 7260
cgtaggtccc ttcgcagggc cagctgaaca taatcgtgca ggtctgcacg gaccagcgcg 7320
gccacttccc cgccaggaac catgacaaaa gaacccacac tgattatgac acgcatactc 7380
ggagctatgc taaccagcgt agccccgatg taagcttgtt gcatgggcgg cgatataaaa 7440
tgcaaggtgc tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag cacatcgtag 7500
tcatgctcat gcagataaag gcaggtaagc tccggaacca ccacagaaaa agacaccatt 7560
tttctctcaa acatgtctgc gggtttctgc ataaacacaa aataaaataa caaaaaaaca 7620
tttaaacatt agaagcctgt cttacaacag gaaaaacaac ccttataagc ataagacgga 7680
ctacggccat gctggcgtga ccgtaaaaaa actggtcacc gtgattaaaa agcaccaccg 7740
acagctcctc ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca tcaggttgat 7800
tcacatcggt cagtgctaaa aagcgaccga aatagcccgg gggaatacat acccgcaggc 7860
gtagagacaa cattacagcc cccataggag gtataacaaa attaatagga gagaaaaaca 7920
cataaacacc tgaaaaaccc tcctgcctag gcaaaatagc accctcccgc tccagaacaa 7980
catacagcgc ttccacagcg gcagccataa cagtcagcct taccagtaaa aaagaaaacc 8040
tattaaaaaa acaccactcg acacggggat cccaccagct caatcagtca cagtgtaaaa 8100
aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 8160
acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 8220
cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtcacttcc cattttaaga 8280
ttaattaaac tacaattccc aacacataca agttactccg ccctaaaacc tacgtcaccc 8340
gc 8342
<210> 5
<211> 35934
<212> DNA
<213> 5型腺病毒
<400> 5
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc 420
cgggtcaaag ttggcgtttt attattatag tcagctgacg tgtagtgtat ttatacccgg 480
tgagttcctc aagaggccac tcttgagtgc cagcgagtag agttttctcc tccgagccgc 540
tccgacaccg ggactgaaaa tgagacatat tatctgccac ggaggtgtta ttaccgaaga 600
aatggccgcc agtcttttgg accagctgat cgaagaggta ctggctgata atcttccacc 660
tcctagccat tttgaaccac ctacccttca cgaactgtat gatttagacg tgacggcccc 720
cgaagatccc aacgaggagg cggtttcgca gatttttccc gactctgtaa tgttggcggt 780
gcaggaaggg attgacttac tcacttttcc gccggcgccc ggttctccgg agccgcctca 840
cctttcccgg cagcccgagc agccggagca gagagccttg ggtccggttt ctatgccaaa 900
ccttgtaccg gaggtgatcg atcttacctg ccacgaggct ggctttccac ccagtgacga 960
cgaggatgaa gagggtgagg agtttgtgtt agattatgtg gagcaccccg ggcacggttg 1020
caggtcttgt cattatcacc ggaggaatac gggggaccca gatattatgt gttcgctttg 1080
ctatatgagg acctgtggca tgtttgtcta cagtaagtga aaattatggg cagtgggtga 1140
tagagtggtg ggtttggtgt ggtaattttt tttttaattt ttacagtttt gtggtttaaa 1200
gaattttgta ttgtgatttt tttaaaaggt cctgtgtctg aacctgagcc tgagcccgag 1260
ccagaaccgg agcctgcaag acctacccgc cgtcctaaaa tggcgcctgc tatcctgaga 1320
cgcccgacat cacctgtgtc tagagaatgc aatagtagta cggatagctg tgactccggt 1380
ccttctaaca cacctcctga gatacacccg gtggtcccgc tgtgccccat taaaccagtt 1440
gccgtgagag ttggtgggcg tcgccaggct gtggaatgta tcgaggactt gcttaacgag 1500
cctgggcaac ctttggactt gagctgtaaa cgccccaggc cataaggtgt aaacctgtga 1560
ttgcgtgtgt ggttaacgcc tttgtttgct gaatgagttg atgtaagttt aataaagggt 1620
gagataatgt ttaacttgca tggcgtgtta aatggggcgg ggcttaaagg gtatataatg 1680
cgccgtgggc taatcttggt tacatctgac ctcatggagg cttgggagtg tttggaagat 1740
ttttctgctg tgcgtaactt gctggaacag agctctaaca gtacctcttg gttttggagg 1800
tttctgtggg gctcatccca ggcaaagtta gtctgcagaa ttaaggagga ttacaagtgg 1860
gaatttgaag agcttttgaa atcctgtggt gagctgtttg attctttgaa tctgggtcac 1920
caggcgcttt tccaagagaa ggtcatcaag actttggatt tttccacacc ggggcgcgct 1980
gcggctgctg ttgctttttt gagttttata aaggataaat ggagcgaaga aacccatctg 2040
agcggggggt acctgctgga ttttctggcc atgcatctgt ggagagcggt tgtgagacac 2100
aagaatcgcc tgctactgtt gtcttccgtc cgcccggcga taataccgac ggaggagcag 2160
cagcagcagc aggaggaagc caggcggcgg cggcaggagc agagcccatg gaacccgaga 2220
gccggcctgg accctcggga atgaatgttg tacaggtggc tgaactgtat ccagaactga 2280
gacgcatttt gacaattaca gaggatgggc aggggctaaa gggggtaaag agggagcggg 2340
gggcttgtga ggctacagag gaggctagga atctagcttt tagcttaatg accagacacc 2400
gtcctgagtg tattactttt caacagatca aggataattg cgctaatgag cttgatctgc 2460
tggcgcagaa gtattccata gagcagctga ccacttactg gctgcagcca ggggatgatt 2520
ttgaggaggc tattagggta tatgcaaagg tggcacttag gccagattgc aagtacaaga 2580
tcagcaaact tgtaaatatc aggaattgtt gctacatttc tgggaacggg gccgaggtgg 2640
agatagatac ggaggatagg gtggccttta gatgtagcat gataaatatg tggccggggg 2700
tgcttggcat ggacggggtg gttattatga atgtaaggtt tactggcccc aattttagcg 2760
gtacggtttt cctggccaat accaacctta tcctacacgg tgtaagcttc tatgggttta 2820
acaatacctg tgtggaagcc tggaccgatg taagggttcg gggctgtgcc ttttactgct 2880
gctggaaggg ggtggtgtgt cgccccaaaa gcagggcttc aattaagaaa tgcctctttg 2940
aaaggtgtac cttgggtatc ctgtctgagg gtaactccag ggtgcgccac aatgtggcct 3000
ccgactgtgg ttgcttcatg ctagtgaaaa gcgtggctgt gattaagcat aacatggtat 3060
gtggcaactg cgaggacagg gcctctcaga tgctgacctg ctcggacggc aactgtcacc 3120
tgctgaagac cattcacgta gccagccact ctcgcaaggc ctggccagtg tttgagcata 3180
acatactgac ccgctgttcc ttgcatttgg gtaacaggag gggggtgttc ctaccttacc 3240
aatgcaattt gagtcacact aagatattgc ttgagcccga gagcatgtcc aaggtgaacc 3300
tgaacggggt gtttgacatg accatgaaga tctggaaggt gctgaggtac gatgagaccc 3360
gcaccaggtg cagaccctgc gagtgtggcg gtaaacatat taggaaccag cctgtgatgc 3420
tggatgtgac cgaggagctg aggcccgatc acttggtgct ggcctgcacc cgcgctgagt 3480
ttggctctag cgatgaagat acagattgag gtactgaaat gtgtgggcgt ggcttaaggg 3540
tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg 3600
ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc 3660
gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc 3720
ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg 3780
agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg 3840
actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg 3900
acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt 3960
ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca 4020
atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt 4080
cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt 4140
cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat 4200
acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg 4260
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt 4320
ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt 4380
taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt 4440
tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag 4500
tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact 4560
tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg 4620
gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt 4680
ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg 4740
gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg 4800
ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg 4860
gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc 4920
cggtgggccc gtaaatcaca cctattaccg gctgcaactg gtagttaaga gagctgcagc 4980
tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt 5040
ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag 5100
caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa 5160
gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat 5220
ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag 5280
acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac 5340
ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct 5400
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt 5460
gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc 5520
gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga 5580
ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca 5640
ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt 5700
cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc 5760
cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag 5820
aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg 5880
ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat 5940
gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg 6000
tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc 6060
atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac 6120
ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc 6180
ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc 6240
aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag 6300
ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc 6360
gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac 6420
gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag 6480
gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc 6540
tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc 6600
gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc 6660
aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga 6720
ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt 6780
agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg 6840
agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg 6900
cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc 6960
gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac 7020
cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc 7080
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc 7140
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta 7200
gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg 7260
cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag 7320
gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt 7380
gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc 7440
cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt 7500
aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta 7560
aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt 7620
gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt 7680
ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa 7740
ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg 7800
gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag 7860
aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc 7920
ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg 7980
cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg 8040
gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc 8100
gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg 8160
cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc 8220
tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac 8280
caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac 8340
aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg 8400
gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata 8460
cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg 8520
cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc 8580
atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg 8640
agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg 8700
ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag 8760
acgacgggcc cggtgagctt gaacctgaaa gagagttcga cagaatcaat ttcggtgtcg 8820
ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc 8880
tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg 8940
gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc 9000
tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc 9060
tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag 9120
aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc 9180
aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc 9240
acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga 9300
cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct 9360
tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg 9420
ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc 9480
atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc 9540
agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc 9600
agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg 9660
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag 9720
tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg 9780
tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg 9840
gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg 9900
ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct 9960
accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg 10020
gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc 10080
ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc 10140
acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg 10200
ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc 10260
gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa 10320
gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc 10380
cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg 10440
tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg 10500
cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg 10560
ccggtcaggc gcgcgcaatc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg 10620
ggcactcttc cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt 10680
tcgagccccg tatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc 10740
caggtgtgcg acgtcagaca acgggggagt gctccttttg gcttccttcc aggcgcggcg 10800
gctgctgcgc tagctttttt ggccactggc cgcgcgcagc gtaagcggtt aggctggaaa 10860
gcgaaagcat taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc 10920
gcgggacccc cggttcgagt ctcggaccgg ccggactgcg gcgaacgggg gtttgcctcc 10980
ccgtcatgca agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc 11040
ttttcccaga tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag 11100
caagagcagc ggcagacatg cagggcaccc tcccctcctc ctaccgcgtc aggaggggcg 11160
acatccgcgg ttgacgcggc agcagatggt gattacgaac ccccgcggcg ccgggcccgg 11220
cactacctgg acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag 11280
cggcacccaa gggtgcagct gaagcgtgat acgcgtgagg cgtacgtgcc gcggcagaac 11340
ctgtttcgcg accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca 11400
gggcgcgagc tgcggcatgg cctgaatcgc gagcggttgc tgcgcgagga ggactttgag 11460
cccgacgcgc gaaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta 11520
accgcatacg agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac 11580
gtgcgtacgc ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt 11640
gtaagcgcgc tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata 11700
gtgcagcaca gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc 11760
gagggccgct ggctgctcga tttgataaac atcctgcaga gcatagtggt gcaggagcgc 11820
agcttgagcc tggctgacaa ggtggccgcc atcaactatt ccatgcttag cctgggcaag 11880
ttttacgccc gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc 11940
gaggggttct acatgcgcat ggcgctgaag gtgcttacct tgagcgacga cctgggcgtt 12000
tatcgcaacg agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac 12060
cgcgagctga tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag 12120
gccgagtcct actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg 12180
gaggcagctg gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc 12240
ggcgtggagg aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg 12300
gtgatgtttc tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc 12360
agagccagcc gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca 12420
tgtcgctgac tgcgcgcaat cctgacgcgt tccggcagca gccgcaggcc aaccggctct 12480
ccgcaattct ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg 12540
cgatcgtaaa cgcgctggcc gaaaacaggg ccatccggcc cgacgaggcc ggcctggtct 12600
acgacgcgct gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg 12660
accggctggt gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg 12720
gcaacctggg ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc 12780
cgcggggaca ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga 12840
caccgcaaag tgaggtgtac cagtctgggc cagactattt tttccagacc agtagacaag 12900
gcctgcagac cgtaaacctg agccaggctt tcaaaaactt gcaggggctg tggggggtgc 12960
gggctcccac aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt 13020
tgctgctgct aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag 13080
gtcacttgct gacactgtac cgcgaggcca taggtcaggc gcatgtggac gagcatactt 13140
tccaggagat tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg 13200
caaccctaaa ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa 13260
acagcgagga ggagcgcatt ttgcgctacg tgcagcagag cgtgagcctt aacctgatgc 13320
gcgacggggt aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca 13380
tgtatgcctc aaaccggccg tttatcaacc gcctaatgga ctacttgcat cgcgcggccg 13440
ccgtgaaccc cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg 13500
gtttctacac cgggggattc gaggtgcccg agggtaacga tggattcctc tgggacgaca 13560
tagacgacag cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc 13620
aggcagaggc ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag 13680
gcgctgcggc cccgcggtca gatgctagta gcccatttcc aagcttgata gggtctctta 13740
ccagcactcg caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc 13800
tgctgcagcc gcagcgcgaa aaaaacctgc ctccggcatt tcccaacaac gggatagaga 13860
gcctagtgga caagatgagt agatggaaga cgtacgcgca ggagcacagg gacgtgccag 13920
gcccgcgccc gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg 13980
acgatgactc ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg 14040
cgcaccttcg ccccaggctg gggagaatgt tttaaaaaaa aaaaaagcat gatgcaaaat 14100
aaaaaactca ccaaggccat ggcaccgagc gttggttttc ttgtattccc cttagtatgc 14160
ggcgcgcggc gatgtatgag gaaggtcctc ctccctccta cgagagtgtg gtgagcgcgg 14220
cgccagtggc ggcggcgctg ggttctccct tcgatgctcc cctggacccg ccgtttgtgc 14280
ctccgcggta cctgcggcct accgggggga gaaacagcat ccgttactct gagttggcac 14340
ccctattcga caccacccgt gtgtacctgg tggacaacaa gtcaacggat gtggcatccc 14400
tgaactacca gaacgaccac agcaactttc tgaccacggt cattcaaaac aatgactaca 14460
gcccggggga ggcaagcaca cagaccatca atcttgacga ccggtcgcac tggggcggcg 14520
acctgaaaac catcctgcat accaacatgc caaatgtgaa cgagttcatg tttaccaata 14580
agtttaaggc gcgggtgatg gtgtcgcgct tgcctactaa ggacaatcag gtggagctga 14640
aatacgagtg ggtggagttc acgctgcccg agggcaacta ctccgagacc atgaccatag 14700
accttatgaa caacgcgatc gtggagcact acttgaaagt gggcagacag aacggggttc 14760
tggaaagcga catcggggta aagtttgaca cccgcaactt cagactgggg tttgaccccg 14820
tcactggtct tgtcatgcct ggggtatata caaacgaagc cttccatcca gacatcattt 14880
tgctgccagg atgcggggtg gacttcaccc acagccgcct gagcaacttg ttgggcatcc 14940
gcaagcggca acccttccag gagggcttta ggatcaccta cgatgatctg gagggtggta 15000
acattcccgc actgttggat gtggacgcct accaggcgag cttgaaagat gacaccgaac 15060
agggcggggg tggcgcaggc ggcagcaaca gcagtggcag cggcgcggaa gagaactcca 15120
acgcggcagc cgcggcaatg cagccggtgg aggacatgaa cgatcatgcc attcgcggcg 15180
acacctttgc cacacgggct gaggagaagc gcgctgaggc cgaagcagcg gccgaagctg 15240
ccgcccccgc tgcgcaaccc gaggtcgaga agcctcagaa gaaaccggtg atcaaacccc 15300
tgacagagga cagcaagaaa cgcagttaca acctaataag caatgacagc accttcaccc 15360
agtaccgcag ctggtacctt gcatacaact acggcgaccc tcagaccgga atccgctcat 15420
ggaccctgct ttgcactcct gacgtaacct gcggctcgga gcaggtctac tggtcgttgc 15480
cagacatgat gcaagacccc gtgaccttcc gctccacgcg ccagatcagc aactttccgg 15540
tggtgggcgc cgagctgttg cccgtgcact ccaagagctt ctacaacgac caggccgtct 15600
actcccaact catccgccag tttacctctc tgacccacgt gttcaatcgc tttcccgaga 15660
accagatttt ggcgcgcccg ccagccccca ccatcaccac cgtcagtgaa aacgttcctg 15720
ctctcacaga tcacgggacg ctaccgctgc gcaacagcat cggaggagtc cagcgagtga 15780
ccattactga cgccagacgc cgcacctgcc cctacgttta caaggccctg ggcatagtct 15840
cgccgcgcgt cctatcgagc cgcacttttt gagcaagcat gtccatcctt atatcgccca 15900
gcaataacac aggctggggc ctgcgcttcc caagcaagat gtttggcggg gccaagaagc 15960
gctccgacca acacccagtg cgcgtgcgcg ggcactaccg cgcgccctgg ggcgcgcaca 16020
aacgcggccg cactgggcgc accaccgtcg atgacgccat cgacgcggtg gtggaggagg 16080
cgcgcaacta cacgcccacg ccgccaccag tgtccacagt ggacgcggcc attcagaccg 16140
tggtgcgcgg agcccggcgc tatgctaaaa tgaagagacg gcggaggcgc gtagcacgtc 16200
gccaccgccg ccgacccggc actgccgccc aacgcgcggc ggcggccctg cttaaccgcg 16260
cacgtcgcac cggccgacgg gcggccatgc gggccgctcg aaggctggcc gcgggtattg 16320
tcactgtgcc ccccaggtcc aggcgacgag cggccgccgc agcagccgcg gccattagtg 16380
ctatgactca gggtcgcagg ggcaacgtgt attgggtgcg cgactcggtt agcggcctgc 16440
gcgtgcccgt gcgcacccgc cccccgcgca actagattgc aagaaaaaac tacttagact 16500
cgtactgttg tatgtatcca gcggcggcgg cgcgcaacga agctatgtcc aagcgcaaaa 16560
tcaaagaaga gatgctccag gtcatcgcgc cggagatcta tggccccccg aagaaggaag 16620
agcaggatta caagccccga aagctaaagc gggtcaaaaa gaaaaagaaa gatgatgatg 16680
atgaacttga cgacgaggtg gaactgctgc acgctaccgc gcccaggcga cgggtacagt 16740
ggaaaggtcg acgcgtaaaa cgtgttttgc gacccggcac caccgtagtc tttacgcccg 16800
gtgagcgctc cacccgcacc tacaagcgcg tgtatgatga ggtgtacggc gacgaggacc 16860
tgcttgagca ggccaacgag cgcctcgggg agtttgccta cggaaagcgg cataaggaca 16920
tgctggcgtt gccgctggac gagggcaacc caacacctag cctaaagccc gtaacactgc 16980
agcaggtgct gcccgcgctt gcaccgtccg aagaaaagcg cggcctaaag cgcgagtctg 17040
gtgacttggc acccaccgtg cagctgatgg tacccaagcg ccagcgactg gaagatgtct 17100
tggaaaaaat gaccgtggaa cctgggctgg agcccgaggt ccgcgtgcgg ccaatcaagc 17160
aggtggcgcc gggactgggc gtgcagaccg tggacgttca gatacccact accagtagca 17220
ccagtattgc caccgccaca gagggcatgg agacacaaac gtccccggtt gcctcagcgg 17280
tggcggatgc cgcggtgcag gcggtcgctg cggccgcgtc caagacctct acggaggtgc 17340
aaacggaccc gtggatgttt cgcgtttcag ccccccggcg cccgcgccgt tcgaggaagt 17400
acggcgccgc cagcgcgcta ctgcccgaat atgccctaca tccttccatt gcgcctaccc 17460
ccggctatcg tggctacacc taccgcccca gaagacgagc aactacccga cgccgaacca 17520
ccactggaac ccgccgccgc cgtcgccgtc gccagcccgt gctggccccg atttccgtgc 17580
gcagggtggc tcgcgaagga ggcaggaccc tggtgctgcc aacagcgcgc taccacccca 17640
gcatcgttta aaagccggtc tttgtggttc ttgcagatat ggccctcacc tgccgcctcc 17700
gtttcccggt gccgggattc cgaggaagaa tgcaccgtag gaggggcatg gccggccacg 17760
gcctgacggg cggcatgcgt cgtgcgcacc accggcggcg gcgcgcgtcg caccgtcgca 17820
tgcgcggcgg tatcctgccc ctccttattc cactgatcgc cgcggcgatt ggcgccgtgc 17880
ccggaattgc atccgtggcc ttgcaggcgc agagacactg attaaaaaca agttgcatgt 17940
ggaaaaatca aaataaaaag tctggactct cacgctcgct tggtcctgta actattttgt 18000
agaatggaag acatcaactt tgcgtctctg gccccgcgac acggctcgcg cccgttcatg 18060
ggaaactggc aagatatcgg caccagcaat atgagcggtg gcgccttcag ctggggctcg 18120
ctgtggagcg gcattaaaaa tttcggttcc accgttaaga actatggcag caaggcctgg 18180
aacagcagca caggccagat gctgagggat aagttgaaag agcaaaattt ccaacaaaag 18240
gtggtagatg gcctggcctc tggcattagc ggggtggtgg acctggccaa ccaggcagtg 18300
caaaataaga ttaacagtaa gcttgatccc cgccctcccg tagaggagcc tccaccggcc 18360
gtggagacag tgtctccaga ggggcgtggc gaaaagcgtc cgcgccccga cagggaagaa 18420
actctggtga cgcaaataga cgagcctccc tcgtacgagg aggcactaaa gcaaggcctg 18480
cccaccaccc gtcccatcgc gcccatggct accggagtgc tgggccagca cacacccgta 18540
acgctggacc tgcctccccc cgccgacacc cagcagaaac ctgtgctgcc aggcccgacc 18600
gccgttgttg taacccgtcc tagccgcgcg tccctgcgcc gcgccgccag cggtccgcga 18660
tcgttgcggc ccgtagccag tggcaactgg caaagcacac tgaacagcat cgtgggtctg 18720
ggggtgcaat ccctgaagcg ccgacgatgc ttctgatagc taacgtgtcg tatgtgtgtc 18780
atgtatgcgt ccatgtcgcc gccagaggag ctgctgagcc gccgcgcgcc cgctttccaa 18840
gatggctacc ccttcgatga tgccgcagtg gtcttacatg cacatctcgg gccaggacgc 18900
ctcggagtac ctgagccccg ggctggtgca gtttgcccgc gccaccgaga cgtacttcag 18960
cctgaataac aagtttagaa accccacggt ggcgcctacg cacgacgtga ccacagaccg 19020
gtcccagcgt ttgacgctgc ggttcatccc tgtggaccgt gaggatactg cgtactcgta 19080
caaggcgcgg ttcaccctag ctgtgggtga taaccgtgtg ctggacatgg cttccacgta 19140
ctttgacatc cgcggcgtgc tggacagggg ccctactttt aagccctact ctggcactgc 19200
ctacaacgcc ctggctccca agggtgcccc aaatccttgc gaatgggatg aagctgctac 19260
tgctcttgaa ataaacctag aagaagagga cgatgacaac gaagacgaag tagacgagca 19320
agctgagcag caaaaaactc acgtatttgg gcaggcgcct tattctggta taaatattac 19380
aaaggagggt attcaaatag gtgtcgaagg tcaaacacct aaatatgccg ataaaacatt 19440
tcaacctgaa cctcaaatag gagaatctca gtggtacgaa acagaaatta atcatgcagc 19500
tgggagagtc ctaaaaaaga ctaccccaat gaaaccatgt tacggttcat atgcaaaacc 19560
cacaaatgaa aatggagggc aaggcattct tgtaaagcaa caaaatggaa agctagaaag 19620
tcaagtggaa atgcaatttt tctcaactac tgaggcagcc gcaggcaatg gtgataactt 19680
gactcctaaa gtggtattgt acagtgaaga tgtagatata gaaaccccag acactcatat 19740
ttcttacatg cccactatta aggaaggtaa ctcacgagaa ctaatgggcc aacaatctat 19800
gcccaacagg cctaattaca ttgcttttag ggacaatttt attggtctaa tgtattacaa 19860
cagcacgggt aatatgggtg ttctggcggg ccaagcatcg cagttgaatg ctgttgtaga 19920
tttgcaagac agaaacacag agctttcata ccagcttttg cttgattcca ttggtgatag 19980
aaccaggtac ttttctatgt ggaatcaggc tgttgacagc tatgatccag atgttagaat 20040
tattgaaaat catggaactg aagatgaact tccaaattac tgctttccac tgggaggtgt 20100
gattaataca gagactctta ccaaggtaaa acctaaaaca ggtcaggaaa atggatggga 20160
aaaagatgct acagaatttt cagataaaaa tgaaataaga gttggaaata attttgccat 20220
ggaaatcaat ctaaatgcca acctgtggag aaatttcctg tactccaaca tagcgctgta 20280
tttgcccgac aagctaaagt acagtccttc caacgtaaaa atttctgata acccaaacac 20340
ctacgactac atgaacaagc gagtggtggc tcccgggcta gtggactgct acattaacct 20400
tggagcacgc tggtcccttg actatatgga caacgtcaac ccatttaacc accaccgcaa 20460
tgctggcctg cgctaccgct caatgttgct gggcaatggt cgctatgtgc ccttccacat 20520
ccaggtgcct cagaagttct ttgccattaa aaacctcctt ctcctgccgg gctcatacac 20580
ctacgagtgg aacttcagga aggatgttaa catggttctg cagagctccc taggaaatga 20640
cctaagggtt gacggagcca gcattaagtt tgatagcatt tgcctttacg ccaccttctt 20700
ccccatggcc cacaacaccg cctccacgct tgaggccatg cttagaaacg acaccaacga 20760
ccagtccttt aacgactatc tctccgccgc caacatgctc taccctatac ccgccaacgc 20820
taccaacgtg cccatatcca tcccctcccg caactgggcg gctttccgcg gctgggcctt 20880
cacgcgcctt aagactaagg aaaccccatc actgggctcg ggctacgacc cttattacac 20940
ctactctggc tctataccct acctagatgg aaccttttac ctcaaccaca cctttaagaa 21000
ggtggccatt acctttgact cttctgtcag ctggcctggc aatgaccgcc tgcttacccc 21060
caacgagttt gaaattaagc gctcagttga cggggagggt tacaacgttg cccagtgtaa 21120
catgaccaaa gactggttcc tggtacaaat gctagctaac tataacattg gctaccaggg 21180
cttctatatc ccagagagct acaaggaccg catgtactcc ttctttagaa acttccagcc 21240
catgagccgt caggtggtgg atgatactaa atacaaggac taccaacagg tgggcatcct 21300
acaccaacac aacaactctg gatttgttgg ctaccttgcc cccaccatgc gcgaaggaca 21360
ggcctaccct gctaacttcc cctatccgct tataggcaag accgcagttg acagcattac 21420
ccagaaaaag tttctttgcg atcgcaccct ttggcgcatc ccattctcca gtaactttat 21480
gtccatgggc gcactcacag acctgggcca aaaccttctc tacgccaact ccgcccacgc 21540
gctagacatg acttttgagg tggatcccat ggacgagccc acccttcttt atgttttgtt 21600
tgaagtcttt gacgtggtcc gtgtgcacca gccgcaccgc ggcgtcatcg aaaccgtgta 21660
cctgcgcacg cccttctcgg ccggcaacgc cacaacataa agaagcaagc aacatcaaca 21720
acagctgccg ccatgggctc cagtgagcag gaactgaaag ccattgtcaa agatcttggt 21780
tgtgggccat attttttggg cacctatgac aagcgctttc caggctttgt ttctccacac 21840
aagctcgcct gcgccatagt caatacggcc ggtcgcgaga ctgggggcgt acactggatg 21900
gcctttgcct ggaacccgca ctcaaaaaca tgctacctct ttgagccctt tggcttttct 21960
gaccagcgac tcaagcaggt ttaccagttt gagtacgagt cactcctgcg ccgtagcgcc 22020
attgcttctt cccccgaccg ctgtataacg ctggaaaagt ccacccaaag cgtacagggg 22080
cccaactcgg ccgcctgtgg actattctgc tgcatgtttc tccacgcctt tgccaactgg 22140
ccccaaactc ccatggatca caaccccacc atgaacctta ttaccggggt acccaactcc 22200
atgctcaaca gtccccaggt acagcccacc ctgcgtcgca accaggaaca gctctacagc 22260
ttcctggagc gccactcgcc ctacttccgc agccacagtg cgcagattag gagcgccact 22320
tctttttgtc acttgaaaaa catgtaaaaa taatgtacta gagacacttt caataaaggc 22380
aaatgctttt atttgtacac tctcgggtga ttatttaccc ccacccttgc cgtctgcgcc 22440
gtttaaaaat caaaggggtt ctgccgcgca tcgctatgcg ccactggcag ggacacgttg 22500
cgatactggt gtttagtgct ccacttaaac tcaggcacaa ccatccgcgg cagctcggtg 22560
aagttttcac tccacaggct gcgcaccatc accaacgcgt ttagcaggtc gggcgccgat 22620
atcttgaagt cgcagttggg gcctccgccc tgcgcgcgcg agttgcgata cacagggttg 22680
cagcactgga acactatcag cgccgggtgg tgcacgctgg ccagcacgct cttgtcggag 22740
atcagatccg cgtccaggtc ctccgcgttg ctcagggcga acggagtcaa ctttggtagc 22800
tgccttccca aaaagggcgc gtgcccaggc tttgagttgc actcgcaccg tagtggcatc 22860
aaaaggtgac cgtgcccggt ctgggcgtta ggatacagcg cctgcataaa agccttgatc 22920
tgcttaaaag ccacctgagc ctttgcgcct tcagagaaga acatgccgca agacttgccg 22980
gaaaactgat tggccggaca ggccgcgtcg tgcacgcagc accttgcgtc ggtgttggag 23040
atctgcacca catttcggcc ccaccggttc ttcacgatct tggccttgct agactgctcc 23100
ttcagcgcgc gctgcccgtt ttcgctcgtc acatccattt caatcacgtg ctccttattt 23160
atcataatgc ttccgtgtag acacttaagc tcgccttcga tctcagcgca gcggtgcagc 23220
cacaacgcgc agcccgtggg ctcgtgatgc ttgtaggtca cctctgcaaa cgactgcagg 23280
tacgcctgca ggaatcgccc catcatcgtc acaaaggtct tgttgctggt gaaggtcagc 23340
tgcaacccgc ggtgctcctc gttcagccag gtcttgcata cggccgccag agcttccact 23400
tggtcaggca gtagtttgaa gttcgccttt agatcgttat ccacgtggta cttgtccatc 23460
agcgcgcgcg cagcctccat gcccttctcc cacgcagaca cgatcggcac actcagcggg 23520
ttcatcaccg taatttcact ttccgcttcg ctgggctctt cctcttcctc ttgcgtccgc 23580
ataccacgcg ccactgggtc gtcttcattc agccgccgca ctgtgcgctt acctcctttg 23640
ccatgcttga ttagcaccgg tgggttgctg aaacccacca tttgtagcgc cacatcttct 23700
ctttcttcct cgctgtccac gattacctct ggtgatggcg ggcgctcggg cttgggagaa 23760
gggcgcttct ttttcttctt gggcgcaatg gccaaatccg ccgccgaggt cgatggccgc 23820
gggctgggtg tgcgcggcac cagcgcgtct tgtgatgagt cttcctcgtc ctcggactcg 23880
atacgccgcc tcatccgctt ttttgggggc gcccggggag gcggcggcga cggggacggg 23940
gacgacacgt cctccatggt tgggggacgt cgcgccgcac cgcgtccgcg ctcgggggtg 24000
gtttcgcgct gctcctcttc ccgactggcc atttccttct cctataggca gaaaaagatc 24060
atggagtcag tcgagaagaa ggacagccta accgccccct ctgagttcgc caccaccgcc 24120
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag 24180
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggaccgctca 24240
gtaccaacag aggataaaaa gcaagaccag gacaacgcag aggcaaacga ggaacaagtc 24300
gggcgggggg acgaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag 24360
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc 24420
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tattctcacc gcgcgtaccc 24480
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta 24540
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc 24600
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct 24660
gtcatacctg atatcgcctc gctcaacgaa gtgccaaaaa tctttgaggg tcttggacgc 24720
gacgagaagc gcgcggcaaa cgctctgcaa caggaaaaca gcgaaaatga aagtcactct 24780
ggagtgttgg tggaactcga gggtgacaac gcgcgcctag ccgtactaaa acgcagcatc 24840
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggtcat gagcacagtc 24900
atgagtgagc tgatcgtgcg ccgtgcgcag cccctggaga gggatgcaaa tttgcaagaa 24960
caaacagagg agggcctacc cgcagttggc gacgagcagc tagcgcgctg gcttcaaacg 25020
cgcgagcctg ccgacttgga ggagcgacgc aaactaatga tggccgcagt gctcgttacc 25080
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag 25140
gaaacattgc actacacctt tcgacagggc tacgtacgcc aggcctgcaa gatctccaac 25200
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg ccttgggcaa 25260
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt 25320
tacttatttc tatgctacac ctggcagacg gccatgggcg tttggcagca gtgcttggag 25380
gagtgcaacc tcaaggagct gcagaaactg ctaaagcaaa acttgaagga cctatggacg 25440
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca tcattttccc cgaacgcctg 25500
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcagaacttt 25560
aggaacttta tcctagagcg ctcaggaatc ttgcccgcca cctgctgtgc acttcctagc 25620
gactttgtgc ccattaagta ccgcgaatgc cctccgccgc tttggggcca ctgctacctt 25680
ctgcagctag ccaactacct tgcctaccac tctgacataa tggaagacgt gagcggtgac 25740
ggtctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtttgc 25800
aattcgcagc tgcttaacga aagtcaaatt atcggtacct ttgagctgca gggtccctcg 25860
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct 25920
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac 25980
caatcccgcc cgcctaatgc ggagcttacc gcctgcgtca ttacccaggg ccacattctt 26040
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg 26100
gtttacttgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc 26160
tatcagcagc agccgcgggc ccttgcttcc caggatggca cccaaaaaga agctgcagct 26220
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga 26280
cgaggaggag gaggacatga tggaagactg ggagagccta gacgaggaag cttccgaggt 26340
cgaagaggtg tcagacgaaa caccgtcacc ctcggtcgca ttcccctcgc cggcgcccca 26400
gaaatcggca accggttcca gcatggctac aacctccgct cctcaggcgc cgccggcact 26460
gcccgttcgc cgacccaacc gtagatggga caccactgga accagggccg gtaagtccaa 26520
gcagccgccg ccgttagccc aagagcaaca acagcgccaa ggctaccgct catggcgcgg 26580
gcacaagaac gccatagttg cttgcttgca agactgtggg ggcaacatct ccttcgcccg 26640
ccgctttctt ctctaccatc acggcgtggc cttcccccgt aacatcctgc attactaccg 26700
tcatctctac agcccatact gcaccggcgg cagcggcagc aacagcagcg gccacacaga 26760
agcaaaggcg accggatagc aagactctga caaagcccaa gaaatccaca gcggcggcag 26820
cagcaggagg aggagcgctg cgtctggcgc ccaacgaacc cgtatcgacc cgcgagctta 26880
gaaacaggat ttttcccact ctgtatgcta tatttcaaca gagcaggggc caagaacaag 26940
agctgaaaat aaaaaacagg tctctgcgat ccctcacccg cagctgcctg tatcacaaaa 27000
gcgaagatca gcttcggcgc acgctggaag acgcggaggc tctcttcagt aaatactgcg 27060
cgctgactct taaggactag tttcgcgccc tttctcaaat ttaagcgcga aaactacgtc 27120
atctccagcg gccacacccg gcgccagcac ctgttgtcag cgccattatg agcaaggaaa 27180
ttcccacgcc ctacatgtgg agttaccagc cacaaatggg acttgcggct ggagctgccc 27240
aagactactc aacccgaata aactacatga gcgcgggacc ccacatgata tcccgggtca 27300
acggaatacg cgcccaccga aaccgaattc tcctggaaca ggcggctatt accaccacac 27360
ctcgtaataa ccttaatccc cgtagttggc ccgctgccct ggtgtaccag gaaagtcccg 27420
ctcccaccac tgtggtactt cccagagacg cccaggccga agttcagatg actaactcag 27480
gggcgcagct tgcgggcggc tttcgtcaca gggtgcggtc gcccgggcag ggtataactc 27540
acctgacaat cagagggcga ggtattcagc tcaacgacga gtcggtgagc tcctcgcttg 27600
gtctccgtcc ggacgggaca tttcagatcg gcggcgccgg ccgctcttca ttcacgcctc 27660
gtcaggcaat cctaactctg cagacctcgt cctctgagcc gcgctctgga ggcattggaa 27720
ctctgcaatt tattgaggag tttgtgccat cggtctactt taaccccttc tcgggacctc 27780
ccggccacta tccggatcaa tttattccta actttgacgc ggtaaaggac tcggcggacg 27840
gctacgactg aatgttaagt ggagaggcag agcaactgcg cctgaaacac ctggtccact 27900
gtcgccgcca caagtgcttt gcccgcgact ccggtgagtt ttgctacttt gaattgcccg 27960
aggatcatat cgagggcccg gcgcacggcg tccggcttac cgcccaggga gagcttgccc 28020
gtagcctgat tcgggagttt acccagcgcc ccctgctagt tgagcgggac aggggaccct 28080
gtgttctcac tgtgatttgc aactgtccta accctggatt acatcaagat ctttgttgcc 28140
atctctgtgc tgagtataat aaatacagaa attaaaatat actggggctc ctatcgccat 28200
cctgtaaacg ccaccgtctt cacccgccca agcaaaccaa ggcgaacctt acctggtact 28260
tttaacatct ctccctctgt gatttacaac agtttcaacc cagacggagt gagtctacga 28320
gagaacctct ccgagctcag ctactccatc agaaaaaaca ccaccctcct tacctgccgg 28380
gaacgtacga gtgcgtcacc ggccgctgca ccacacctac cgcctgaccg taaaccagac 28440
tttttccgga cagacctcaa taactctgtt taccagaaca ggaggtgagc ttagaaaacc 28500
cttagggtat taggccaaag gcgcagctac tgtggggttt atgaacaatt caagcaactc 28560
tacgggctat tctaattcag gtttctctag aatcggggtt ggggttattc tctgtcttgt 28620
gattctcttt attcttatac taacgcttct ctgcctaagg ctcgccgcct gctgtgtgca 28680
catttgcatt tattgtcagc tttttaaacg ctggggtcgc cacccaagat gattaggtac 28740
ataatcctag gtttactcac ccttgcgtca gcccacggta ccacccaaaa ggtggatttt 28800
aaggagccag cctgtaatgt tacattcgca gctgaagcta atgagtgcac cactcttata 28860
aaatgcacca cagaacatga aaagctgctt attcgccaca aaaacaaaat tggcaagtat 28920
gctgtttatg ctatttggca gccaggtgac actacagagt ataatgttac agttttccag 28980
ggtaaaagtc ataaaacttt tatgtatact tttccatttt atgaaatgtg cgacattacc 29040
atgtacatga gcaaacagta taagttgtgg cccccacaaa attgtgtgga aaacactggc 29100
actttctgct gcactgctat gctaattaca gtgctcgctt tggtctgtac cctactctat 29160
attaaataca aaagcagacg cagctttatt gaggaaaaga aaatgcctta atttactaag 29220
ttacaaagct aatgtcacca ctaactgctt tactcgctgc ttgcaaaaca aattcaaaaa 29280
gttagcatta taattagaat aggatttaaa ccccccggtc atttcctgct caataccatt 29340
cccctgaaca attgactcta tgtgggatat gctccagcgc tacaaccttg aagtcaggct 29400
tcctggatgt cagcatctga ctttggccag cacctgtccc gcggatttgt tccagtccaa 29460
ctacagcgac ccaccctaac agagatgacc aacacaacca acgcggccgc cgctaccgga 29520
cttacatcta ccacaaatac accccaagtt tctgcctttg tcaataactg ggataacttg 29580
ggcatgtggt ggttctccat agcgcttatg tttgtatgcc ttattattat gtggctcatc 29640
tgctgcctaa agcgcaaacg cgcccgacca cccatctata gtcccatcat tgtgctacac 29700
ccaaacaatg atggaatcca tagattggac ggactgaaac acatgttctt ttctcttaca 29760
gtatgattaa atgagacatg attcctcgag tttttatatt actgaccctt gttgcgcttt 29820
ttttgtgcgt gctccacatt ggctgcggtt tctcacatcg aagtagactg cattccagcc 29880
ttcacagtct atttgcttta cggatttgtc accctcacgc tcatctgcag cctcatcact 29940
gtggtcatcg cctttatcca gtgcattgac tgggtctgtg tgcgctttgc atatctcaga 30000
caccatcccc agtacaggga caggactata gctgagcttc ttagaattct ttaattatga 30060
aatttactgt gacttttctg ctgattattt gcaccctatc tgcgttttgt tccccgacct 30120
ccaagcctca aagacatata tcatgcagat tcactcgtat atggaatatt ccaagttgct 30180
acaatgaaaa aagcgatctt tccgaagcct ggttatatgc aatcatctct gttatggtgt 30240
tctgcagtac catcttagcc ctagctatat atccctacct tgacattggc tggaacgcaa 30300
tagatgccat gaaccaccca actttccccg cgcccgctat gcttccactg caacaagttg 30360
ttgccggcgg ctttgtccca gccaatcagc ctcgcccacc ttctcccacc cccactgaaa 30420
tcagctactt taatctaaca ggaggagatg actgacaccc tagatctaga aatggacgga 30480
attattacag agcagcgcct gctagaaaga cgcagggcag cggccgagca acagcgcatg 30540
aatcaagagc tccaagacat ggttaacttg caccagtgca aaaggggtat cttttgtctg 30600
gtaaagcagg ccaaagtcac ctacgacagt aataccaccg gacaccgcct tagctacaag 30660
ttgccaacca agcgtcagaa attggtggtc atggtgggag aaaagcccat taccataact 30720
cagcactcgg tagaaaccga aggctgcatt cactcacctt gtcaaggacc tgaggatctc 30780
tgcaccctta ttaagaccct gtgcggtctc aaagatctta ttccctttaa ctaataaaaa 30840
aaaataataa agcatcactt acttaaaatc agttagcaaa tttctgtcca gtttattcag 30900
cagcacctcc ttgccctcct cccagctctg gtattgcagc ttcctcctgg ctgcaaactt 30960
tctccacaat ctaaatggaa tgtcagtttc ctcctgttcc tgtccatccg cacccactat 31020
cttcatgttg ttgcagatga agcgcgcaag accgtctgaa gataccttca accccgtgta 31080
tccatatgac acggaaaccg gtcctccaac tgtgcctttt cttactcctc cctttgtatc 31140
ccccaatggg tttcaagaga gtccccctgg ggtactctct ttgcgcctat ccgaacctct 31200
agttacctcc aatggcatgc ttgcgctcaa aatgggcaac ggcctctctc tggacgaggc 31260
cggcaacctt acctcccaaa atgtaaccac tgtgagccca cctctcaaaa aaaccaagtc 31320
aaacataaac ctggaaatat ctgcacccct cacagttacc tcagaagccc taactgtggc 31380
tgccgccgca cctctaatgg tcgcgggcaa cacactcacc atgcaatcac aggccccgct 31440
aaccgtgcac gactccaaac ttagcattgc cacccaagga cccctcacag tgtcagaagg 31500
aaagctagcc ctgcaaacat caggccccct caccaccacc gatagcagta cccttactat 31560
cactgcctca ccccctctaa ctactgccac tggtagcttg ggcattgact tgaaagagcc 31620
catttataca caaaatggaa aactaggact aaagtacggg gctcctttgc atgtaacaga 31680
cgacctaaac actttgaccg tagcaactgg tccaggtgtg actattaata atacttcctt 31740
gcaaactaaa gttactggag ccttgggttt tgattcacaa ggcaatatgc aacttaatgt 31800
agcaggagga ctaaggattg attctcaaaa cagacgcctt atacttgatg ttagttatcc 31860
gtttgatgct caaaaccaac taaatctaag actaggacag ggccctcttt ttataaactc 31920
agcccacaac ttggatatta actacaacaa aggcctttac ttgtttacag cttcaaacaa 31980
ttccaaaaag cttgaggtta acctaagcac tgccaagggg ttgatgtttg acgctacagc 32040
catagccatt aatgcaggag atgggcttga atttggttca cctaatgcac caaacacaaa 32100
tcccctcaaa acaaaaattg gccatggcct agaatttgat tcaaacaagg ctatggttcc 32160
taaactagga actggcctta gttttgacag cacaggtgcc attacagtag gaaacaaaaa 32220
taatgataag ctaactttgt ggaccacacc agctccatct cctaactgta gactaaatgc 32280
agagaaagat gctaaactca ctttggtctt aacaaaatgt ggcagtcaaa tacttgctac 32340
agtttcagtt ttggctgtta aaggcagttt ggctccaata tctggaacag ttcaaagtgc 32400
tcatcttatt ataagatttg acgaaaatgg agtgctacta aacaattcct tcctggaccc 32460
agaatattgg aactttagaa atggagatct tactgaaggc acagcctata caaacgctgt 32520
tggatttatg cctaacctat cagcttatcc aaaatctcac ggtaaaactg ccaaaagtaa 32580
cattgtcagt caagtttact taaacggaga caaaactaaa cctgtaacac taaccattac 32640
actaaacggt acacaggaaa caggagacac aactccaagt gcatactcta tgtcattttc 32700
atgggactgg tctggccaca actacattaa tgaaatattt gccacatcct cttacacttt 32760
ttcatacatt gcccaagaat aaagaatcgt ttgtgttatg tttcaacgtg tttatttttc 32820
aattgcagaa aatttcaagt catttttcat tcagtagtat agccccacca ccacatagct 32880
tatacagatc accgtacctt aatcaaactc acagaaccct agtattcaac ctgccacctc 32940
cctcccaaca cacagagtac acagtccttt ctccccggct ggccttaaaa agcatcatat 33000
catgggtaac agacatattc ttaggtgtta tattccacac ggtttcctgt cgagccaaac 33060
gctcatcagt gatattaata aactccccgg gcagctcact taagttcatg tcgctgtcca 33120
gctgctgagc cacaggctgc tgtccaactt gcggttgctt aacgggcggc gaaggagaag 33180
tccacgccta catgggggta gagtcataat cgtgcatcag gatagggcgg tggtgctgca 33240
gcagcgcgcg aataaactgc tgccgccgcc gctccgtcct gcaggaatac aacatggcag 33300
tggtctcctc agcgatgatt cgcaccgccc gcagcataag gcgccttgtc ctccgggcac 33360
agcagcgcac cctgatctca cttaaatcag cacagtaact gcagcacagc accacaatat 33420
tgttcaaaat cccacagtgc aaggcgctgt atccaaagct catggcgggg accacagaac 33480
ccacgtggcc atcataccac aagcgcaggt agattaagtg gcgacccctc ataaacacgc 33540
tggacataaa cattacctct tttggcatgt tgtaattcac cacctcccgg taccatataa 33600
acctctgatt aaacatggcg ccatccacca ccatcctaaa ccagctggcc aaaacctgcc 33660
cgccggctat acactgcagg gaaccgggac tggaacaatg acagtggaga gcccaggact 33720
cgtaaccatg gatcatcatg ctcgtcatga tatcaatgtt ggcacaacac aggcacacgt 33780
gcatacactt cctcaggatt acaagctcct cccgcgttag aaccatatcc cagggaacaa 33840
cccattcctg aatcagcgta aatcccacac tgcagggaag acctcgcacg taactcacgt 33900
tgtgcattgt caaagtgtta cattcgggca gcagcggatg atcctccagt atggtagcgc 33960
gggtttctgt ctcaaaagga ggtagacgat ccctactgta cggagtgcgc cgagacaacc 34020
gagatcgtgt tggtcgtagt gtcatgccaa atggaacgcc ggacgtagtc atatttcctg 34080
aagcaaaacc aggtgcgggc gtgacaaaca gatctgcgtc tccggtctcg ccgcttagat 34140
cgctctgtgt agtagttgta gtatatccac tctctcaaag catccaggcg ccccctggct 34200
tcgggttcta tgtaaactcc ttcatgcgcc gctgccctga taacatccac caccgcagaa 34260
taagccacac ccagccaacc tacacattcg ttctgcgagt cacacacggg aggagcggga 34320
agagctggaa gaaccatgtt tttttttttt attccaaaag attatccaaa acctcaaaat 34380
gaagatctat taagtgaacg cgctcccctc cggtggcgtg gtcaaactct acagccaaag 34440
aacagataat ggcatttgta agatgttgca caatggcttc caaaaggcaa acggccctca 34500
cgtccaagtg gacgtaaagg ctaaaccctt cagggtgaat ctcctctata aacattccag 34560
caccttcaac catgcccaaa taattctcat ctcgccacct tctcaatata tctctaagca 34620
aatcccgaat attaagtccg gccattgtaa aaatctgctc cagagcgccc tccaccttca 34680
gcctcaagca gcgaatcatg attgcaaaaa ttcaggttcc tcacagacct gtataagatt 34740
caaaagcgga acattaacaa aaataccgcg atcccgtagg tcccttcgca gggccagctg 34800
aacataatcg tgcaggtctg cacggaccag cgcggccact tccccgccag gaaccatgac 34860
aaaagaaccc acactgatta tgacacgcat actcggagct atgctaacca gcgtagcccc 34920
gatgtaagct tgttgcatgg gcggcgatat aaaatgcaag gtgctgctca aaaaatcagg 34980
caaagcctcg cgcaaaaaag aaagcacatc gtagtcatgc tcatgcagat aaaggcaggt 35040
aagctccgga accaccacag aaaaagacac catttttctc tcaaacatgt ctgcgggttt 35100
ctgcataaac acaaaataaa ataacaaaaa aacatttaaa cattagaagc ctgtcttaca 35160
acaggaaaaa caacccttat aagcataaga cggactacgg ccatgccggc gtgaccgtaa 35220
aaaaactggt caccgtgatt aaaaagcacc accgacagct cctcggtcat gtccggagtc 35280
ataatgtaag actcggtaaa cacatcaggt tgattcacat cggtcagtgc taaaaagcga 35340
ccgaaatagc ccgggggaat acatacccgc aggcgtagag acaacattac agcccccata 35400
ggaggtataa caaaattaat aggagagaaa aacacataaa cacctgaaaa accctcctgc 35460
ctaggcaaaa tagcaccctc ccgctccaga acaacataca gcgcttccac agcggcagcc 35520
ataacagtca gccttaccag taaaaaagaa aacctattaa aaaaacacca ctcgacacgg 35580
caccagctca atcagtcaca gtgtaaaaaa gggccaagtg cagagcgagt atatatagga 35640
ctaaaaaatg acgtaacggt taaagtccac aaaaaacacc cagaaaaccg cacgcgaacc 35700
tacgcccaga aacgaaagcc aaaaaaccca caacttcctc aaatcgtcac ttccgttttc 35760
ccacgttacg tcacttccca ttttaagaaa actacaattc ccaacacata caagttactc 35820
cgccctaaaa cctacgtcac ccgccccgtt cccacgcccc gcgccacgtc acaaactcca 35880
ccccctcatt atcatattgg cttcaatcca aaataaggta tattattgat gatg 35934
<210> 6
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> rep结合位点(RBS)
<400> 6
gctcgctcgc tcgctc 16
<210> 7
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> rep正向引物
<400> 7
cacgtgcatg tggaagtag 19
<210> 8
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> rep反向引物
<400> 8
cgactttctg acggaatgg 19
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> cap正向引物
<400> 9
tactgaggga ccatgaagac 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> cap反向引物
<400> 10
gtttacggac tcggagtatc 20

Claims (27)

1.双质粒系统,其包含辅助质粒和载体质粒,其中所述辅助质粒包含编码至少一种功能性Rep蛋白的至少一种rep基因并且不包含编码一组功能性Cap蛋白的cap基因。
2.根据权利要求1所述的双质粒系统,其中与辅助质粒相比,所述双质粒系统包含摩尔过量的载体质粒。
3.根据权利要求1或2所述的双质粒系统,其中辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7、1.2:1至1:6、1.1:1至1:5、1:1至1:4或1:1.5至1:3。
4.根据权利要求1-3中任一项所述的双质粒系统,其中辅助质粒与载体质粒的比率为1:2至1:4或约为1:3。
5.根据权利要求1-4中任一项所述的双质粒系统,其中所述载体质粒包含:
(a)编码至少一种功能性Cap蛋白的cap基因;或者
(b)至少一种cap基因启动子、与所述cap基因启动子可操作地连接的克隆位点以及至少一侧上侧接ITR的表达盒;
其中所述载体质粒不包含编码功能性Rep蛋白的rep基因,并且所述表达盒包含与至少一种调控元件可操作地连接的转基因。
6.根据权利要求1-5中任一项所述的双质粒系统,其中所述至少一种rep基因包含编码功能性Rep 52蛋白的基因、编码功能性Rep 40蛋白的至少一种基因和编码功能性Rep 68蛋白的基因。
7.根据权利要求1-6中任一项所述的双质粒系统,其中所述至少一种rep基因不包含功能性内部p40启动子。
8.根据权利要求1-7中任一项所述的双质粒系统,其中:
(i)所述至少一种rep基因在对应于SEQ ID NO:1的位置1823的位置处包含C核苷酸;和/或
(ii)所述辅助质粒不包含仅为cap基因序列的超过250个核苷酸、超过100个核苷酸或超过60个核苷酸的连续链段。
9.根据权利要求1-8中任一项所述的双质粒系统,其中所述辅助质粒包含部分cap基因序列,并且所述部分cap基因序列不编码一组功能性的Cap蛋白。
10.根据权利要求1-9中任一项所述的双质粒系统,其中所述辅助质粒包含至少一种辅助病毒基因,任选地其中:
(i)所述至少一种辅助病毒基因是腺病毒基因,任选地是腺病毒5或腺病毒2基因;和/或
(ii)所述至少一种辅助病毒基因包含编码功能性VA RNA I和II的VA核酸、编码功能性E2A蛋白的E2A基因和编码功能性E4蛋白的E4基因。
11.根据权利要求10所述的双质粒系统,其中:
(i)所述至少一种辅助病毒基因包含编码功能性VA RNA I和II的VA核酸、编码功能性E2A蛋白的E2A基因和编码功能性E4蛋白的E4基因,并且其中所述E4基因不位于所述VA核酸和所述E2A基因之间;和/或
(ii)所述辅助质粒的长度小于25000bp、小于20000bp、小于15000bp、小于14500bp、10000bp至25000bp、10000bp至20000bp、12000bp至15000bp或约14021bp。
12.根据权利要求1-11中任一项所述的双质粒系统,其中:
(i)所述辅助质粒和/或所述载体质粒不包含人工Rep结合位点;和/或
(ii)所述辅助质粒和/或所述载体质粒包含质粒主链,并且所述质粒主链不包含人工Rep结合位点。
13.根据权利要求1-12中任一项所述的双质粒系统,其中所述载体质粒包含cap基因并且进一步包含在至少一侧上侧接ITR的表达盒。
14.根据权利要求1-13中任一项所述的双质粒系统,其中所述载体质粒包含cap基因,并且所述cap基因编码选自以下的Cap蛋白:由血清型2、5、8、9组成的AAV血清型和Mut C(来自WO 2016/181123的SEQ ID NO:3)。
15.根据权利要求1-14中任一项所述的双质粒系统,其中:
(i)所述载体质粒不包含任何非必要的翻译起始密码子;和/或
(ii)所述载体质粒不包含任何非必要的翻译起始密码子,其中所述载体质粒含有包含一个或多个启动子的启动子区域,并且所述启动子区域不包含ATG或GTG密码子,任选地其中所述启动子区域包含p5、p19和p40启动子,其中位于对应于SEQ ID NO:1的位置(a)321-323、(b)766-768、(c)955-957、(d)993-995和(e)1014-1016的一个或多个位置的ATG或GTG密码子不存在或发生突变。
16.根据权利要求1-15中任一项所述的双质粒系统,其中所述载体质粒包含长度小于4000个核苷酸、小于3500个核苷酸、小于3000个核苷酸或小于2500个核苷酸的主链。
17.根据权利要求1-16中任一项所述的双质粒系统、辅助质粒或载体质粒用于生产重组AAV制剂的用途,所述重组AAV制剂:
(a)具有期望的完整颗粒与总颗粒的比率;和/或
(b)具有高产量或期望产量。
18.根据权利要求1-16中任一项所述的双质粒系统、辅助质粒或载体质粒用于以下的用途:
(a)控制或最大化重组AAV生产过程中生产的完整颗粒与总颗粒的比率;和/或
(b)增加、优化或最大化重组AAV生产过程中生产的重组AAV的产量。
19.根据权利要求17或18所述的用途,其中所述用途包括用根据权利要求1-16中任一项所述的双质粒系统、辅助质粒或载体质粒转染宿主细胞,并在适合重组AAV生产的条件下培养所述宿主细胞。
20.控制或最大化重组AAV生产过程中生产的完整颗粒与总颗粒的比率的方法,其包括:
(a)获得根据权利要求1-16中任一项所述的双质粒系统、辅助质粒或载体质粒;
(b)用根据权利要求1-16中任一项所述的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合重组AAV生产的条件下培养所述宿主细胞。
21.根据权利要求20所述的方法,其还包括收获重组AAV以提供包含期望比率的完整颗粒与总颗粒的重组AAV制剂的步骤。
22.根据权利要求20或21所述的方法,其中所述方法是以高产量或期望产量生产重组AAV制剂的方法。
23.增加、优化或最大化重组AAV生产过程中生产的重组AAV产量的方法,其包括:
(a)获得根据权利要求1-16中任一项所述的双质粒系统、辅助质粒或载体质粒;
(b)用根据权利要求1-16中任一项所述的双质粒系统、辅助质粒或载体质粒转染宿主细胞;和
(c)在适合重组AAV生产的条件下培养所述宿主细胞。
24.根据权利要求17、19或22中任一项所述的用途或方法,其中所述高产量或期望产量是使用辅助质粒与载体质粒的比率为1.8:1的等效方法所实现的产量的至少2倍、至少4倍、至少5倍或至少6倍的产量。
25.根据权利要求17、19、21、22或24中任一项所述的用途或方法,其中所述期望的完整颗粒与总颗粒的比率是使用辅助质粒与载体质粒的比率为1.8:1的等效方法所实现的完整颗粒与总颗粒的比率的至少20%或至少30%的完整颗粒与总颗粒的比率。
26.根据权利要求17-19、20、21、22、24或25中任一项所述的用途或方法,其中辅助质粒与载体质粒的比率为3:1至1:10、1.5:1至1:9、1.4:1至1:8、1.3:1至1:7、1.2:1至1:6、1.1:1至1:5、1:1至1:4或1:1.5至1:3。
27.根据权利要求17-19、20、21、22、24、25或26中任一项所述的用途或方法,其中辅助质粒与载体质粒的比率为1:2至1:4或约为1:3。
CN202080039790.8A 2019-04-12 2020-04-14 质粒系统 Pending CN113891942A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP19169121.1 2019-04-12
EP19169121.1A EP3722434B1 (en) 2019-04-12 2019-04-12 Plasmid system
GBGB1905263.8A GB201905263D0 (en) 2019-04-12 2019-04-12 Plasmid system
GB1905263.8 2019-04-12
PCT/GB2020/050947 WO2020208379A1 (en) 2019-04-12 2020-04-14 Plasmid system

Publications (1)

Publication Number Publication Date
CN113891942A true CN113891942A (zh) 2022-01-04

Family

ID=70295566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080039790.8A Pending CN113891942A (zh) 2019-04-12 2020-04-14 质粒系统

Country Status (11)

Country Link
US (1) US20220162642A1 (zh)
EP (1) EP3953482A1 (zh)
JP (1) JP2022530192A (zh)
KR (1) KR20220019669A (zh)
CN (1) CN113891942A (zh)
AU (1) AU2020272557A1 (zh)
BR (1) BR112021020401A2 (zh)
CA (1) CA3136545A1 (zh)
IL (2) IL296544A (zh)
SG (1) SG11202111149VA (zh)
WO (1) WO2020208379A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2928689T3 (es) 2019-04-12 2022-11-22 Freeline Therapeutics Ltd Sistema de plásmidos
WO2021084277A2 (en) 2019-11-01 2021-05-06 Freeline Therapeutics Limited Transcription regulatory elements
BR112023016997A2 (pt) * 2021-02-26 2023-11-07 Logicbio Therapeutics Inc Fabricação e uso de vetores aav recombinantes
WO2023054671A1 (ja) 2021-09-30 2023-04-06 富士フイルム株式会社 アデノ随伴ウイルスの製造方法、細胞および発現ベクター
GB202214328D0 (en) 2022-09-29 2022-11-16 Freeline Therapeutics Ltd Method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030103939A1 (en) * 2001-07-13 2003-06-05 Engelhardt John F. Pseudotyped adeno-associated viruses and uses thereof
US20050080027A1 (en) * 2001-11-30 2005-04-14 Markus Horer Optimized production of viral vectors derived from paroviruses in packaging and production cells by hsv infection or treatment with dna methylation inhibitors
CN102112616A (zh) * 2008-06-04 2011-06-29 西马生物医学计划公司 高容量腺病毒的包装系统
CN102341406A (zh) * 2009-03-04 2012-02-01 德国癌症研究中心 组装活化蛋白(aap)及其用于制备基本上由vp3组成的细小病毒颗粒的应用
CN108048483A (zh) * 2018-01-30 2018-05-18 中国疾病预防控制中心病毒病预防控制所 复制型重组腺病毒HAdV-5载体系统及其应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3795581A3 (en) 2011-08-24 2021-06-09 The Board of Trustees of the Leland Stanford Junior University New avv capsid proteins for nucleic acid transfer
US10640785B2 (en) 2011-11-22 2020-05-05 The Children's Hospital Of Philadelphia Virus vectors for highly efficient transgene delivery
GB201420139D0 (en) 2014-11-12 2014-12-24 Ucl Business Plc Factor IX gene therapy
GB201508026D0 (en) 2015-05-11 2015-06-24 Ucl Business Plc Capsid
US10385320B2 (en) 2015-12-02 2019-08-20 The Board Of Trustees Of The Leland Stanford Junior University Recombinant adeno-associated virus capsids with enhanced human skeletal muscle tropism

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030103939A1 (en) * 2001-07-13 2003-06-05 Engelhardt John F. Pseudotyped adeno-associated viruses and uses thereof
US20050080027A1 (en) * 2001-11-30 2005-04-14 Markus Horer Optimized production of viral vectors derived from paroviruses in packaging and production cells by hsv infection or treatment with dna methylation inhibitors
CN102112616A (zh) * 2008-06-04 2011-06-29 西马生物医学计划公司 高容量腺病毒的包装系统
CN102341406A (zh) * 2009-03-04 2012-02-01 德国癌症研究中心 组装活化蛋白(aap)及其用于制备基本上由vp3组成的细小病毒颗粒的应用
CN108048483A (zh) * 2018-01-30 2018-05-18 中国疾病预防控制中心病毒病预防控制所 复制型重组腺病毒HAdV-5载体系统及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
宁秦洁等: "人体肝脏靶向性新型AAV血清型载体的研发", 华东理工大学学报(自然科学版), vol. 46, no. 3, 30 June 2020 (2020-06-30), pages 404 - 410 *
董小岩: "新型重组AAV5/5载体及包装系统", 生物工程学报, vol. 26, no. 5, 25 May 2010 (2010-05-25), pages 679 - 686 *

Also Published As

Publication number Publication date
BR112021020401A2 (pt) 2021-12-07
SG11202111149VA (en) 2021-11-29
EP3953482A1 (en) 2022-02-16
IL287100A (en) 2021-12-01
CA3136545A1 (en) 2020-10-15
WO2020208379A1 (en) 2020-10-15
IL296544A (en) 2022-11-01
AU2020272557A1 (en) 2021-12-09
KR20220019669A (ko) 2022-02-17
JP2022530192A (ja) 2022-06-28
US20220162642A1 (en) 2022-05-26

Similar Documents

Publication Publication Date Title
US6040174A (en) Defective adenoviruses and corresponding complementation lines
CN113891942A (zh) 质粒系统
US6133028A (en) Defective adenoviruses and corresponding complementation lines
US5994132A (en) Adenovirus vectors
KR101721725B1 (ko) 아데노바이러스 조립 방법
CN107849111B (zh) 在免疫显性腺病毒抗原表位中具有突变的溶瘤腺病毒及其在癌症治疗中的用途
AU2022203504A1 (en) Oncolytic tumor viruses and methods of use
US20200239859A1 (en) Life-cycle-defective adenovirus helper viruses, their production and use for producing raav
AU2013232101B2 (en) Selective cell targeting using adenovirus and chemical dimers
US6627190B2 (en) Recombinant adenovirus vectors that are replication-competent in tert-expressing cells
CN111094577A (zh) 携带转基因的重组腺病毒
KR102089121B1 (ko) 종양살상형 아데노바이러스 조성물
KR102643016B1 (ko) 재조합 바이러스의 제조 방법
KR20190128634A (ko) 다중 트랜스진 재조합 아데노바이러스
AU2016333996A1 (en) Synthetic adenoviruses with tropism to damaged tissue for use in promoting wound repair and tissue regeneration
AU780613B2 (en) Replication-competent anti-cancer vectors
KR20200006058A (ko) 다중 트랜스진 재조합 아데노바이러스
CA2430367C (en) Recombent viral and non-viral vectors containing the human urokinase plasminogen activator gene and its utilization in the treatment of various types of hepatic renal, pulmonary, pancreatic and cardiac fibrosis and hypertrophic scars
US20040086485A1 (en) Chemeric viral vectors for gene therapy
CN101440379B (zh) 选择性封闭肿瘤stat3的新型溶瘤腺病毒构建体的获得及用途
US20020102731A1 (en) Hybrid adenovirus/adeno-associated virus vectors and methods of use thereof
KR102371663B1 (ko) 아데노바이러스 벡터
RU2753742C1 (ru) Рекомбинантный штамм Ad6-hTERT-GMCSF, содержащий встройку промотора теломеразы человека hTERT, а также гена гранулоцитарно-макрофагального колониестимулирующего фактора человека, обладающий избирательной цитолитической активностью против теломераза-положительных опухолевых клеток и экспрессирующий активный человеческий гранулоцитарно-макрофагальный колониестимулирующий фактор
KR20230008069A (ko) 아데노바이러스 발현 벡터, 및 제조를 위한 방법 및 세포주
Class et al. Patent application title: ONCOLYTIC ADENOVIRUSES WITH INCREASED PROPORTION OF THE 156R SPLICING ISOFORM OF THE E1B PROTEIN Inventors: Hans Daniel Öberg (Uppsala, SE) Assignees: Ixogen Ltd.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230725

Address after: Cheshire

Applicant after: Denggao Manufacturing Co.,Ltd.

Address before: Hurt Forde

Applicant before: Free exercise therapy Co.,Ltd.