CN101035901A

CN101035901A - 腺病毒载体中转基因的插入

Info

Publication number: CN101035901A
Application number: CN 200580031943
Authority: CN
Inventors: 琳达·霍金; 雷迪·鲍里斯·塞西达
Original assignee: Cell Genesys Inc
Current assignee: Cell Genesys Inc
Priority date: 2004-07-22
Filing date: 2005-07-21
Publication date: 2007-09-12

Abstract

提供一种腺病毒载体，其含有插入在病毒基因组新位点的转基因，其使得一个或多个天然加工、调节信号或诸如分支点位点、剪接受体位点、内部核糖体进入位点、自加工切割位点和/或poly A信号的异源转录信号有助于转基因表达。

Description

腺病毒载体中转基因的插入

本申请要求2004年7月22日提交的序列号为60/589,804的美国临时申请和2005年3月11日提交的序列号为60/660,542的美国临时申请的优先权。

技术领域：

本发明涉及包含在基因组不同位置插入转基因的，使得转基因表达依赖于天然腺病毒加工和/或调节信号或异源转录信号的腺病毒载体及其制备方法。

背景技术：

在哺乳动物细胞中，腺病毒载体已广泛地用于体外、离体和体内转移并表达基因。腺病毒载体为基因转移提供了许多有利条件：在健康个体中野生型腺病毒仅引起轻微的疾病，其易于增殖到高滴度，其能感染大多数的细胞类型且与它们的生长状态无关，其能将感兴趣的编码蛋白的核酸转移至细胞，且在其最近的具体实践中，其能被改造以在特定细胞中选择性地复制，并能通过结合或依附衣壳蛋白配位体而被靶向。

存在着两种主要类型的腺病毒载体，非复制型(复制缺陷型)和复制型。传统上，复制缺陷型载体缺少复制所必需的一种或多种基因。这些非复制型病毒在具有其所缺少的必需基因的细胞中增殖。传统上，复制型腺病毒载体并不缺少复制所必需的任何腺病毒基因。一种类型的复制型腺病毒在特定的细胞中能选择性地复制。例如，已描述了在特定细胞类型中优先复制(并因此破坏这些特定细胞)的多种不同的细胞和组织特异性复制型腺病毒载体。一种构建细胞特异性复制型病毒的方法是以与必需的腺病毒编码序列可操作地连接的方式来放置异源转录调节元件(TRE)。另一种方法是当所要被缺失或失活的腺病毒编码序列在某种细胞类型如肿瘤细胞中能引起病毒优先复制时，缺失或失活该序列。

腺病毒载体受限于其基因组尺寸(Bett等，J Virol 67：5911-5921，1993)。这又限制了能插入载体的异源DNA数量，并因此限制了能插入在腺病毒基因组的异源编码序列数量和/或长度。因此，复制缺陷型病毒能插入最大的异源DNA，但仍受限于腺病毒基因组DNA尺寸以及腺病毒DNA缺失的数量。

至于复制型病毒，它们受限不仅因为它们包含大部分腺病毒编码序列，还在于异源DNA插入位点的数量。传统上，已插入DNA异源插入物以取代复制型病毒中腺病毒E3编码序列(WO 02/067861，WO01/02540)。这限制了异源DNA插入物的尺寸，仅稍大于E3缺失。同样地，对于特定的应用，缺失E3编码序列或在E3区中插入异源DNA并非是所期望或有利的。

根据病毒DNA复制，腺病毒感染分为早期和晚期。在病毒DNA复制前(早期)和/或在病毒DNA复制后(晚期)病毒基因被表达。一般而言，早期基因编码细胞为病毒增殖所准备的蛋白，而晚期蛋白是衣壳蛋白或与病毒颗粒包装和装配有关。一种已广泛使用的表达转基因的方法是通过病毒自身组成型及非自调节型表达的方式将盒插入在病毒基因组中。在这种情况下，一般地转基因插入取代了非必需基因或必需基因，其中必需基因为用于病毒载体增殖的细胞系所补充。

在腺病毒中，DNA复制后主要由主要晚期启动子(MLP)启动晚期转录。在晚期时间点，MLP启动的转录占总RNA合成的大约30％。在所有腺病毒中，初级转录物从MLP开始向右延伸约28kb并在接近于病毒基因组99图距单位的位置终止。每个区都具有自己的多腺苷酸化信号序列，通常由几个不同的剪接信使组成。沿着基因组在五个位置中的一个，初级转录物被切割并多腺苷酸化，产生五个家族(L1-L5)的mRNAs，每个都具有3′共有末端。在3′末端选择后，通过这样一种方式剪接加工初级转录物，即每个成熟的RNA都获得一组共有的源自16.8、19.8和26.9图距单位的三条短的5′前导区区段，称为三联前导序列(TPL)。在某些腺病毒血清型中，除L5之外的五个家族中的每一个都表达超过一种的蛋白。Ad 40和41表达超过一种的来自L5区的蛋白。由于在基因组晚期区中，三联前导序列剪接入开放阅读框(ORF)上游剪接受体位点的位置不同，因此家族中mRNAs之间彼此不同。例如，四种产生自L2区的mRNAs，都具有共有的3′末端。天然Ad转录物中尽管信使是多顺反子的，但只有位于5′末端的ORF被认为将被翻译。Fuerer等(Gene Therapy11：142-151(2004))描述了使用至少两种方法将胞嘧啶脱氨酶(CD)编码序列插入复制型病毒中。一种方法依赖于使用脑炎心肌病毒内部核糖体进入位点(IRES)，将L5转录物转变为双顺反子mRNA。Fuerer等还描述了一种利用源自Ad41长尾丝基因的剪接受体位点序列以在主要晚期转录物的三联前导序列外显子上剪接CD盒。

发明内容：

本发明涉及一种新的基因转移系统，其使用腺病毒(Ad)基因组作为基因转移和/或表达载体。腺病毒基因组可以是复制型或非复制型(复制缺陷型)。

本发明提供了腺病毒载体，其中转基因以有效地利用和/或使用天然腺病毒加工的位置和方式，插入在腺病毒基因组的不同位置(例如现有基因上游或下游)，而无需插入大的调节序列如启动子，以使得异源DNA(转基因)插入Ad基因组。

在本发明某些方面，转录信号(如分支点位点、剪接受体位点、IRES、自加工切割位点和/或polyA信号)被添加到本发明的腺病毒载体。具有诸如分支点序列的加工信号的插入基因与剪接受体序列一起利用了天然腺病毒所使用的mRNA加工和表达系统。

附图说明：

图1是Ad5天然基因组结构的示意图。

图2是天然Ad5转录单位的示意图。

图3是Ad5 L1区的示意图。

图4是Ad5 L2区的示意图。

图5是Ad5 L3区的示意图。

图6是E3转录单位的示意图。

图7是E3A区的示意图。星号表示Ad5中的192碱基对被经常从腺病毒载体中删除。

图8是E3B区的示意图。

图9是本发明一个示范性实施例的示意图，其中L3区插入位点显示具有嵌合腺病毒前导区的一个例子，其中转基因插入在六邻体(hexon)和23K蛋白酶编码序列之间。，转基因可操作地连接(即用于表达)位于Ad5中六邻体终止密码子上游约95个碱基的用于23K mRNA的天然剪接受体位点。异源剪接受体位点是被插入在转基因编码序列和23K编码序列之间，并可操作地连接23K编码序列。这使得四种不同的mRNAs从L3区转录。在该例子中，天然L3多腺苷酸化序列保持完整，并为嵌合L3区的所有四种mRNAs所利用。

图10是本发明一个示范性实施例的示意图，其中L3区插入位点显示具有嵌合腺病毒前导区的一个例子，该情况下，转基因插入在L3区中23K蛋白酶编码序列和L3多腺苷酸化序列之间。转基因可操作地连接(即用于表达)2A-样序列或IRES。2A-样序列或IRES同样可操作地连接23K编码序列。类似于天然的L3区，这个嵌合腺病毒L3区将产生三种L3 mRNAs。在该情况下，所有三种L3 mRNAs都包含IRES(或2A-样序列)，因此所有三种这些mRNAs的翻译将导致转基因的表达。就该例子而言，天然L3多腺苷酸化序列保持完整，并为嵌合L3区的所有三种mRNAs所利用。

图11提供了OV-1160的示意图，其在5′-3′方向上包含：可操作地连接E1A的E2F-1启动子；以及在L3区中的：pVI、六邻体、剪接受体和肿瘤坏死因子相关凋亡诱导配体(TRAIL)编码序列。该载体在天然位置携带包装信号，并在E2F-1启动子上游携带多腺苷酸化信号以抑制由LITR的转录连读。

图12提供了OV-1164的示意图，在5′-3′方向上包含：可操作地连接E1A的E2F-1启动子；以及在L3区中的：pVI、六邻体、IRES、TRAIL编码序列和23K基因。该载体在天然位置携带包装信号，并在E2F-1启动子上游携带多腺苷酸化信号以抑制由LITR的转录连读。

具体实施方式：

本发明提供了用于表达一种或多种转基因的，依赖于使用现有的(天然的)转录和/或翻译调节元件的重组腺病毒载体。在一个例子中，通过插入一种或多种转基因至晚期区，在感染晚期主要晚期启动子用于表达转基因。在另一个例子中，使用该策略将转基因插入在腺病毒早期区中。只要必需腺病毒基因及诸如内源多腺苷酸化和转录信号的天然腺病毒加工信号的开放阅读框(ORF)不被扰乱，并且病毒能有效地复制，转基因就可以可操作地连接任何内源腺病毒启动子的方式插入。

除转基因之外，分支点、剪接受体位点或其它类似序列皆可包含在本发明的腺病毒载体中，以提供对转录物的正确加工。通过改变特定的加工信号序列，可以操纵转基因表达的数量和动力学，例如剪接效率、翻译启动效率或信号效率，以便获得期望的动力学。多个转基因可包含在同一个载体的相同或不同的基因组区中。其它内源腺病毒基因可以被删除，以获得期望的效果或供包含更长的外源DNA序列之用。

在一方面，本发明“恢复转录信号”到腺病毒载体。就“恢复转录信号”意味着非天然转录信号被用于执行与天然转录信号类似功能或以类似于天然转录信号的方式影响转录。例如，在L5区中尾丝终止密码子包含在L5polyA信号中。在尾丝编码区下游转基因的插入通常包括破坏天然L5polyA位点功能的突变，但仍保留尾丝终止密码子。因此，为了正确加工L5信使应恢复polyA位点。这需要添加polyA信号到L5区。该polyA信号可以是与被破坏序列相同的序列，或可以是非天然或异源polyA信号。在一个转基因被插入尾丝编码区下游的示范性实施例中，polyA信号被插入转基因编码区下游。在本发明转基因插入在现有腺病毒编码序列之间的另一实施例中，额外的剪接受体位点的恢复/插入通常得到使用。例如，转基因可使用对于转基因编码序列下游邻接的腺病毒编码序列为天然剪接位点的腺病毒天然剪接位点。在该情况下，为了转基因编码序列下游邻接的腺病毒编码序列，该剪接位点必须恢复。该“恢复的”剪接位点可以是与在此用于剪接转基因序列上游的天然序列相同的序列，或可以是异源剪接位点。在本领域中已知不同的剪接位点具有不同的剪接效率。因此，视具体应用所需，本领域技术人员可选择具有不同剪接效率的剪接位点。

本发明所提供的有利之处在于以下几个方面：a)通过利用现有表达信号，可在尺寸受限的载体中接入更大尺寸的转基因；b)已知和可预测的腺病毒基因表达模式使设计具有期望的转基因表达动力学例如表达水平和时限的腺病毒载体成为可能，其中表达是基于转基因的特性而定制；c)本发明的腺病毒载体利用了已置于腺病毒基因组中的天然调节系统；d)本发明的腺病毒载体包括导入的调节序列，例如自加工切割位点、分支点序列和剪接受体序列，与其它通常用于转基因表达的元件相比它们是小的；和e)异源转录因子的选择可用于进一步调节表达。诸多转基因和/或可作为转基因候选物的现有转基因物类，在此得到进一步描述。

除非另有说明，本发明实施应使用处于本领域技术范畴之内的常规分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学技术。在文献中详细描述上述技术，例如“Molecular Cloning：ALaboratory Manual”，第2版(Sambrook等，1989)；“OligonucleotideSynthesis”(MJ.Gait编，1984)；“Animal Cell Culture”(R.I.Freshney编，1987)；“Methods in Enzymology”(Academic Press，Inc.)；“Handbookof Experimental Immunology”(D.M.Weir & CC.Blackwell，编)；“GeneTransfer Vectors for Mammalian Cells”(J.M.Miller & M.P.Calos编，1987)；“Current Protocols in Molecular Biology”(F.M.Ausubel等编，1987)；“PCR：The Polymerase Chain Reaction”，(Mullis等编，1994)；和“Current Protocols in Immunology”(J.E.Coligan等编，1991)。

定义

除非另有说明，所有本文使用的术语具有与本领域技术人员所理解的相同含义，且本发明实施应使用处于本领域技术人员知识范畴之内的常规微生物学和重组DNA技术。

术语“病毒”、“病毒颗粒”、“载体颗粒”、“病毒载体颗粒”和“病毒粒子”可交换使用，并可宽泛地理解为这样一种含义，即指当例如本发明的病毒载体被导入适当细胞或细胞系中用于产生感染性颗粒时，所形成的感染性病毒颗粒。为了在体外或体内将DNA转移到细胞，可使用根据本发明的病毒颗粒。对本发明来说，这些术语指腺病毒，包括当本发明的腺病毒载体包在腺病毒衣壳中时所形成的重组腺病毒。

“腺病毒载体(adenovirus vector)”或“腺病毒载体(adenoviralvector)”(可交换使用)在此指一种复制型或非复制型(复制缺陷型)的多核苷酸构建体。

本发明的示范性腺病毒载体包括但不限于，DNA、包在腺病毒包衣中的DNA、包装在其它病毒或病毒样形式(例如单纯疱疹和AAV)中的腺病毒DNA、包在脂质体中的腺病毒DNA、与多聚赖氨酸复合的腺病毒DNA、与合成的聚阳离子分子复合的腺病毒DNA、与铁传递蛋白缀合的腺病毒、或与诸如PEG的化合物复合以在免疫学上“掩蔽”抗原性和/或增加半衰期的腺病毒DNA、或与非病毒蛋白缀合的腺病毒DNA。因此，本文使用的术语“腺病毒载体”或“腺病毒载体”包括腺病毒或腺病毒颗粒。

术语“多核苷酸”和“核酸”在此可交换使用，指任何长度的核糖核苷酸或脱氧核糖核苷酸的核苷酸多聚形式。这些术语包括单链、双链或三链DNA，基因组DNA，cDNA，RNA，DNA-RNA杂交体，或包含嘌呤和嘧啶碱基或其它天然、化学、生物化学修饰的、非天然或衍生的核苷酸碱基的聚合物。优选地，本发明的载体包含DNA。本文使用的“DNA”不但包括碱基A、T、C和G，还包括它们的任何类似物或这些碱基的修饰形式，例如甲基化核苷酸、诸如不带电键合和硫代的核苷酸间修饰、糖类似物的使用、以及修饰的和/或可选择的主链结构，例如聚酰胺。

以下是多核苷酸的非限制性例子：基因或基因片段、外显子、内含子、mRNA、tRNA、rRNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、分离的任何序列的DNA、分离的任何序列的RNA、核酸探针以及引物。多核苷酸可包含修饰的核苷酸，例如甲基化核苷酸和核苷酸类似物、尿嘧啶、其它糖类以及诸如氟代核糖和硫代的连接基团，以及核苷酸分支。核苷酸序列可为非核苷酸组分所中断。在聚合后多核苷酸可得到进一步修饰，例如通过与标记组分缀合。包括在该定义中的其它类型修饰是加帽、用类似物取代一个或多个天然存在的多核苷酸、以及导入用于连接多核苷酸与蛋白、金属离子、标记组分、其它多核苷酸或固体载体的试剂。优选地，多核苷酸是DNA。本文使用的“DNA”不但包括碱基A、T、C和G，而且包括任何一种它们的类似物或这些碱基的修饰形式，例如甲基化核苷酸、诸如不带电键合和硫代的核苷酸间修饰、糖类似物的使用、以及修饰的和/或可选择的骨干结构，例如聚酰胺。当其与其它核酸序列处于一种功能关系时，核酸序列是“可操作性地连接的(operatively linked)”或“可操作地连接的(operably linked)”。例如，如果这两个序列处于使得启动子或调节DNA序列影响编码或结构DNA序列表达水平时，则启动子或调节DNA序列“可操作地连接”或“可操作地连接”到用于编码RNA和/或蛋白的DNA序列。可操作地连接意味着被连接的DNA序列通常是邻接的，在需要连接两个蛋白编码区处，编码区邻接且处于同一个阅读框。然而，因为增强子通常在与启动子相隔几千碱基对时起作用，且内含子序列长度可变，因此某些多核苷酸元件可以是可操作地连接但不邻接。

本文使用的术语“编码区”指含有编码序列的核酸区。编码区可含有其它来自相应基因的区，包括内含子。术语“编码序列”(CDS)指编码蛋白的含有密码子的核酸序列。编码序列通常起始于翻译起始密码子(如ATG)并终止于翻译终止密码子。在编码序列上游的序列是翻译起始密码子的5′，在CDS下游的序列是翻译终止密码子的3′。

术语“ORF”指开放阅读框。

术语“基因”指位于基因组内的一段规定的区域，除前述编码序列之外，包含其它负责控制表达即编码部分的转录和翻译的核酸序列，主要是调节序列。基因还可包含其它的5′和3′非翻译序列和终止序列。取决于基因源，可存在更多的元件，例如内含子。

本文使用的术语“异源的”和“外源的”是指诸如启动子和基因编码序列的核酸分子，其为对于特定病毒或宿主细胞而言源于外源(非天然)的序列，或如果来自同源，则是修饰自其原型的。因此，病毒或细胞中的异源基因包括对于特定病毒或细胞是内源的，但已通过例如密码子优化而被修饰的基因。该术语还包括非天然存在的天然存在的核酸序列的多拷贝。因此，该术语所指的核酸片段是对于病毒或细胞而言为外源或异源，或对于病毒或细胞是同源的但处于并不常见于宿主病毒或细胞基因组中的位置。

术语“天然的”指存在于野生型病毒或细胞的基因组中的基因。

术语“天然存在的”或“野生型”用于描述可存在于自然界中，不同于人工制造的物体。例如，存在于生物体(包括病毒)中的蛋白或核苷酸序列，其能从天然来源中分离且不被人在实验室中所有意地修饰，是天然存在的。

术语“互补”和“互补的”指两条包含反平行核苷酸序列的核苷酸序列，可以在反平行核苷酸序列互补碱基残基之间形成氢键而彼此配对。至于核酸分子，本文使用的术语“重组的”指使用重组DNA技术将核酸分子连接在一起成为后代核酸分子的组合。至于病毒、细胞和生物体，本文使用的术语“重组的”、“转化的”和“转基因的”指其中已导入异源核酸的宿主病毒、细胞或生物体。核酸分子可稳定地整合入宿主基因组中，或者核酸分子还可作为染色体外分子存在。这样的染色体外分子可自发复制。重组病毒、细胞和生物体理解为不仅包含转化加工的终产物，还包含其重组后代。“非转化的”、“非转基因的”或“非重组的”宿主指不含有异源核酸分子的野生型病毒、细胞或生物体。

“调节元件”是与控制核苷酸序列表达有关的序列。调节元件包括启动子、增强子和终止信号。它们通常还包括核苷酸序列正确翻译所必需的序列。

术语“启动子”指通常位于编码区上游，且含有RNA聚合酶II结合位点，并启动DNA转录的非翻译DNA序列。启动子区还可包括作为基因表达调节物的其它元件。术语“最小启动子”指一种启动子元件，特别是一种失活的或在缺失上游激活元件下启动子活性急剧减少的TATA元件。

在本发明中术语“增强子”的含义可以是任何遗传元件如核苷酸序列，其增加了编码序列可操作地连接启动子的转录水平到一个高于当可操作地连接编码序列的启动子自身所实现的转录活化，即其增加了源自启动子的转录。

“嵌合腺病毒区”定义为含有一部分天然腺病毒基因组和一部分异源DNA序列的腺病毒载体的一部分。例如“嵌合腺病毒前导区”包含至少一部分的天然腺病毒前导区。例如L1、L2、L3、L4、L5，还包含异源DNA序列。在一个实施例中，异源DNA序列包含转基因CDS。在另一个实施例中，异源DNA序列包含转基因CDS、分支点和剪接受体位点。

术语“转录调节元件”和“翻译调节元件”是影响核酸转录和/或翻译的那些元件。这些元件包括但不限于剪接供体和受体位点、翻译终止和起始密码子、以及腺苷酸化信号。

本文使用的“转录应答元件”或“转录调节元件”或“TRE”是一种多核苷酸序列(优选地是一种DNA序列)，其包含一个或多个增强子和/或启动子和/或启动子元件，例如转录调节蛋白应答序列或增加可操作地连接的多核苷酸在容许TRE起作用的宿主细胞中的转录的序列。

“处于转录控制下”是本领域众所周知的术语，指多核苷酸序列(通常是DNA序列)的转录依赖于其被可操作地连接到有利于启动或促进转录的元件。

本文使用的术语“载体”指被设计用于在不同的宿主细胞之间进行转移的核酸构建体。载体可以是，例如，被设计用于分离、增殖和复制插入的核苷酸的“克隆载体”，被设计用于在宿主细胞中表达核苷酸序列的“表达载体”，或被设计用于产生重组病毒或病毒样颗粒的“病毒载体”，或包含多于一种类型载体的“穿梭载体”。任何用于基因导入的载体基本上都能用作“载体”，在其中具有期望序列的DNA已经被导入。质粒载体可用于本发明。当应用于本发明时，术语载体用来描述重组载体，如质粒或病毒载体(包括复制缺陷型或复制型病毒)。术语“载体”、“多核苷酸载体”、“多核苷酸载体构建体”、“核酸载体构建体”和“载体构建体”在此可交换地用来指如本领域技术人员所理解的任何用于基因转移的核酸构建体。

本文使用的与本发明病毒载体有关的术语“复制缺陷型”指无法进一步复制并包装其基因组的病毒载体。例如，当使用完整E1和E4编码区缺失或失活的腺病毒载体感染受试者细胞时，只有转基因在细胞中转录激活，才在患者细胞中表达异源转基因。然而，鉴于患者细胞缺少Ad E1和E4编码序列的事实，Ad载体复制缺陷且在这些细胞中无法形成病毒颗粒。

术语“复制型”指能在特定细胞类型(“靶细胞”)如癌细胞中复制，并优先地影响那些细胞的细胞溶解的载体。已开发出能在癌细胞中选择性复制并优先破坏那些细胞的特异性复制型病毒载体。对于多种细胞特异性复制型腺病毒构建体，其优先在某些细胞类型中复制(并因此破坏了这些细胞类型)。这样的病毒载体可称为“溶瘤病毒”或“溶瘤载体”，被认为能“溶细胞”或“致细胞病变”，并影响靶细胞的“选择性细胞溶解”。“复制型”或“溶瘤”病毒载体的例子描述于，例如PCT公开号WO98/39466，WO95/19434，WO97/01358，WO98/39467，WO98/39465，WO01/72994，WO04/009790，WO00/15820，WO98/14593，WO00/46355，WO02/067861，WO98/39464，WO98/13508，WO20004/009790；美国临时申请序列号60/511,812、60/423,203和美国专利公开号US 2001/0053352，其中每一篇都在此特别并入作为参考。

术语“复制条件性病毒”、“优先复制病毒”、“特异性复制病毒”和“选择性复制病毒”在此可交换使用，指在某些类型细胞或组织中优先复制但在其它细胞中复制水平较低或根本就不复制的复制型病毒载体和颗粒。在本发明的一个实施例中，病毒载体和/或颗粒在肿瘤细胞和/或诸如实体瘤或其它赘生物的异常增生组织中选择性复制。这样的病毒可称为“溶瘤病毒”或“溶瘤载体”，被认为能“溶细胞”或“致细胞病变”，并影响靶细胞的“选择性细胞溶解”。“优先复制”和“选择性复制”以及“特异性复制”可交换使用，并指与非靶细胞相比，在靶细胞中病毒复制更多。与非靶细胞相比，在靶细胞中病毒以更高的速率复制，例如至少约3倍高、至少约10倍高、至少约50倍高，以及在某些情况下，至少约100倍、400倍、500倍、1000倍或甚至1×10⁶倍高。在一个实施例中，病毒只在靶细胞中复制(也就是，在非靶细胞中根本就不复制或复制水平极低)。

本文使用的术语“质粒”指能在宿主细胞染色体外或作为宿主细胞染色体一部分能自发复制的DNA分子。本文的起始质粒是已经商用的，在不受限制的基础上公众能获得的，或可构建自依照在此所披露的和/或根据公开方法这样可获得的质粒。在某些情况下，如本领域技术人员所显而易见的，其它本领域已知的质粒能与在此描述的质粒可交换地使用。

术语“表达”指细胞中内源基因、转基因或编码区的转录和/或翻译。

“多腺苷酸化信号序列”是位于多腺苷酸化共有序列AATAAA之后的RNA转录物内源切割的识别区。多腺苷酸化信号序列提供了“polyA位点”，即通过后转录多腺苷酸化添加腺嘌呤残基到RNA转录物上的位点。一般来说，多腺苷酸化信号序列包括由侧接切割多腺苷酸化位点的两个识别元件组成的核心poly(A)信号(如WO 02/067861和WO 02/068627的图1)。当完成与poly(A)位点强度有关的多腺苷酸化加工时，选择适合的多腺苷酸化信号序列应考虑多腺苷酸化信号序列的强度(Chao等，Molecular and Cellular Biology，1999，19：5588-5600)。例如，强SV40晚期poly(A)位点比弱SV40早期poly(A)位点被切割得更快。如果需要的话，本领域技术人员应考虑选择更强的多腺苷酸化信号序列。原则上，对于本发明来说任何腺苷酸化信号序列都能使用。然而，在本发明的一些实施例中，终止信号序列是SV40晚期多腺苷酸化信号序列或SV40早期多腺苷酸化信号序列。一般而言，终止信号序列是分离自其基因源或通过合成构建并在适当位置插入本发明的载体中。

“多顺反子转录物”指含有多于一个蛋白编码区或顺反子的mRNA分子。包含两个编码区的mRNA称为“双顺反子转录物”。“5′-近侧”编码区或顺反子是其翻译起始密码子(通常是AUG)接近多顺反子mRNA分子5′-末端的编码区或顺反子。“5′-远侧”编码区或顺反子是其翻译起始密码子(通常是AUG)不接近mRNA 5′末端起始密码子的编码区或顺反子。术语“5′-远侧”和“下游”同义地用来指不接近mRNA分子5′末端的编码区。

本文使用的“内部核糖体进入位点”或“IRES”指一种元件，其促进指导内部核糖体进入顺反子(蛋白编码区)的起始密码子(例如ATG)，由此产生基因不依赖于加帽翻译(Jackson R J，Howell M T，Kaminski A(1990)Trends Biochem Sci 15(12)：477-83)和Jackson R J和Kaminski，A.(1995)RNA 1(10)：985-1000)。本发明包括使用任何一种能促进指导内部核糖体进入顺反子起始密码子的IRES元件。PCT公开WO 01/55369描述了包括合成序列的IRES序列的例子，根据本发明这些序列亦可使用。本文使用的“处于IRES翻译控制下”指与IRES有关且以不依赖于加帽的方式进行的翻译。本领域已知的“IRES”的例子包括，但不限于，可获得自小RNA病毒的IRES(Jackson等，1990，Trends BiochemSci 15(12)：477-483)；和可获得自病毒或细胞mRNA源的IRES，例如免疫球蛋白重链结合蛋白(BiP)、血管内皮生长因子(VEGF)(Huez等(1998)MoI.Cell.Biol.18(11)：6178-6190)、成纤维细胞生长因子2和胰岛素类生长因子、翻译起始因子eIF4G、酵母转录因子TFIID和HAP4。在不同的病毒中还报道有IRES，例如心病毒、鼻病毒、口蹄疫病毒、HCV、弗里德小鼠白血病病毒(FrMLV)和莫洛尼鼠白血病病毒(MoMLV)。本文使用的“IRES”包含IRES序列的功能性变体，只要该变体能促进指导内部核糖体进入顺反子的起始密码子即可。在某些实施例中，IRES是哺乳动物的。在其它实施例中，IRES是病毒或原生动物的。在一个实施例中，IRES可获得自脑心肌炎病毒(ECMV)(购自Novogen，Duke等(1992)J.Virol 66(3)：1602-1609)。在另一个在此披露的示范性实施例中，IRES来自VEGF。IRES序列的例子描述于美国专利号6,692,736。

“自加工切割位点”或“自加工切割序列”在此指一种DNA或氨基酸序列，其中在翻译后，包含自加工切割位点的多肽发生快速分子内(顺式)切割，引起分离的成熟蛋白或多肽产物表达。这样的“自加工切割位点”也可称为后翻译或共翻译加工切割位点(如2A位点)、序列或域。2A位点、序列或域通过调节核糖体活性以促进酯键水解，由此以容许进行分离的下游翻译产物合成的方式从翻译复合物上释放多肽，从而显示对翻译的作用(Donnelly，2001)。可选择地，2A位点、序列或域通过顺式切割其自身C-末端以产生主要切割产物，从而显示“自我蛋白酶解”或“切割”(Furler；Palmenberg，Ann.Rev.Microbiol.44：603-623(1990))。

术语“剪接受体位点”或“3′剪接受体位点”(以下简称3′SAS)是一种可被改造进入野生型Ad5基因组不同位置的序列。通过利用腺病毒内源选择性剪接机制，该位点的导入提供了一种便于表达一段异源DNA序列(即转基因)的方法。3′SAS位点的一个例子是： TACTTATGACTCGTACTATTGTTATTCATCC AG↓G(SEQ ID NO：45)，在此标记下划线的碱基是共有分支点(其是可变的)，A指分支点，其是高保守的，下箭头指剪接位点(使得箭头(前)的5′序列被切除，在箭头后的序列成为外显子的一部分)。

术语“分支点”和“分支点序列”可交换使用，指与剪接有关的核苷酸序列，并在本领域中被认为是套索形成位点的识别信号。当涉及DNA载体时，分支点序列是编码RNA分支点序列的DNA序列。

本文使用的“转基因”指一种在适当条件下在非天然环境或异源细胞中能通过重组技术可以表达的多核苷酸。在本发明中，转基因编码区被插入病毒载体中。在一个实施例中，病毒载体是一种腺病毒载体。转基因可来源于其要被表达、但从外源途径导入的相同类型的细胞，与相应的天然型相比是修饰的和/或由非天然位点表达的，或其可来源于异源细胞。“转基因”与“外源基因(exogenous gene)”、“异质基因(foreign gene)”、“异源编码序列”和“异源基因”是同义的。在上下文用于实施本发明的载体中，“异源多核苷酸”或“异源基因”或“转基因”是任何不存在于相应野生型载体或病毒中的多核苷酸或基因。转基因编码序列可以是天然存在的编码某一蛋白的序列。转基因编码序列还可以是非天然的编码序列。例如，本领域技术人员使用密码子选择图表，可容易地对编码序列再编码以优化在某些物种中用于表达的密码子。在一个实施例中，对于转基因，再编码序列依然与天然编码序列编码相同的氨基酸序列。在此提供了包含于本发明载体中的优选的转基因的例子。转基因可以是治疗基因。转基因并不是必需编码蛋白。

本文使用的“治疗”基因指当被表达时，赋予其中该基因被表达的细胞、组织或哺乳动物有益效果的转基因。有益效果的例子包括病症或疾病的病征或症状改善、病症或疾病预防或抑制、或赋予期望的特性。本领域已知为数众多的治疗基因例子，其中一些将进一步描述如下。

在上下文用于实施本发明的载体中，“异源”序列或元件是一种与相应的野生型载体或病毒无关或非源自相应的野生型载体或病毒的序列或元件。

在上下文用于实施本发明的载体中，“内源”序列或元件是天然于或源自相应的野生型载体或病毒的序列或元件。

“复制”和“增殖”可交换使用，指本发明病毒载体复制或增殖的能力。这些术语为本领域众所周知。对本发明来说，复制涉及病毒蛋白产生，且通常指病毒繁殖。可使用本领域标准的及在此描述的测定法测定复制，例如病毒产量测定、爆发集落测定(burst assay)或色斑测定。“复制”和“增殖”包括任何直接或间接涉及病毒制造过程的活性，包括但不限于，病毒基因表达；病毒蛋白产生、核酸或其它成分复制；病毒成分包装为完整病毒和细胞溶解。

本文使用的“包装细胞”是一种能包装腺病毒基因组或修饰的基因组以产生病毒颗粒的细胞。其能提供缺失的基因产物或其等价物。因此，对于基因缺失的腺病毒基因组，包装细胞能提供补充功能，并能将腺病毒基因组包装为腺病毒颗粒。这种颗粒的产生需要复制基因组以及产生组装感染性病毒所必需的那些蛋白。这些颗粒还需要某些病毒颗粒成熟所必需的蛋白。这样的蛋白可由载体或包装细胞提供。

病毒载体的“生产细胞”是本领域众所周知的。生产细胞是一种在其中腺病毒载体被转移并复制及包装为病毒粒子的细胞。如果病毒载体必需基因缺失或失活，则生产细胞补充该失活的基因。腺病毒载体生产细胞的例子是PerC.6(Fallaux等Hum Gene Ther.1998年9月1日；9(13)：1909-17)和293细胞(Graham等J Gen Virol.1977年7月；36(1)：59-74)。就选择性复制病毒来说，生产细胞可以是在其中病毒选择性复制的细胞类型。或则，此外生产细胞可表达在病毒载体中选择性受控或失活的基因。

术语“HeLa-S3”指可获得自美国典型培养物保藏中心(ATCC，Manassas，VA)并命名为ATCC号CCL-2.2的人宫颈肿瘤衍生的细胞系。HeLa-S3是一种亲本HeLa系(ATCC CCL-2)的克隆衍生物。HeLa-S3是在1955年被T.T.Puck等(J.Exp.Med.103：273-284(1956))克隆得到的。

“个体”是一种脊椎动物、哺乳动物或人。哺乳动物包括但不限于耕畜、体育动物、啮齿类、灵长类和宠物。“宿主细胞”包括能成为或已成为本发明的腺病毒载体受体的个体细胞或细胞培养物。宿主细胞包括单个宿主细胞的后代，且由于天然的、偶然的或有意的突变和/或改变，该后代无需完全相同(在形态学或总DNA上)于原始的亲本细胞。宿主细胞包括使用本发明的腺病毒载体体内或体外转染或感染的细胞。

本文使用的“细胞毒性”是本领域众所周知的术语，指其中细胞通常的生物化学或生物学活性受损(即被抑制)的状态。这些活性包括但不限于新陈代谢；细胞复制；DNA复制；转录；翻译；分子摄取。“细胞毒性”包括细胞死亡和/或细胞溶解。指示细胞毒性的测定法是本领域已知的，例如染料排除、3H-胸苷摄取和噬菌斑测定。

本文使用的术语“赘生性细胞”、“瘤形成”、“肿瘤”、“肿瘤细胞”、“癌(carcinoma)”、“癌细胞(carcinoma cells)”、“癌(cancer)”和“癌细胞(cancer cells)”(可交换使用)指显示相对自发生长的细胞，使得它们显示异常的生长表型，具有细胞增殖明显失控的特征。赘生性细胞可以是恶性或良性的。

腺病毒载体

本文使用的术语“腺病毒”和“腺病毒颗粒”包括任何及所有可被分类为腺病毒的病毒，包括任何感染人或动物的腺病毒，包括所有已知的及之后发现的组、亚组和血清型。因此，除非另有说明，本文使用的“腺病毒”(“Ad”)和“腺病毒颗粒”指病毒自身或其衍生物，并覆盖了所有的血清型和亚型，并且是天然存在的或重组形式。这样的腺病毒可以是野生型的或可以是以多种本领域已知的或在此披露的方法所修饰的。这样的修饰包括改变包装在颗粒中的腺病毒基因组以便制备感染性病毒。这样的修饰还包括本领域已知的缺失，例如缺失一个或多个腺病毒复制必需基因，如E1a、E1b、E2a、E2b、E3或E4编码区。术语“复制必需基因”指对于在靶细胞中复制病毒载体，需要其转录的核酸序列。例如，在本发明的腺病毒载体中，复制必需基因可选自E1a、E1b、E2a、E2b和E4基因。该术语还包括复制特异性腺病毒；即在某些类型的细胞或组织中优先复制，但在其它类型的细胞或组织中复制水平较低或根本就不复制的病毒。有时，这样的病毒称为“溶细胞性”或“致细胞病变”病毒(或载体)，如果它们对赘生性细胞具有这样的作用，则称为“溶瘤”病毒(或载体)。

本发明示范性的腺病毒载体包括，但不限于DNA、包在腺病毒外壳中的DNA、包装在另一种病毒或病毒样形式(例如单纯疱疹和AAV)中的腺病毒DNA、包在脂质体中的腺病毒DNA、与多聚赖氨酸复合的腺病毒DNA、与合成的聚阳离子分子复合的腺病毒DNA、与铁传递蛋白缀合的腺病毒DNA、或与诸如PEG的化合物复合以在免疫学上“掩蔽”抗原性和/或增加半衰期的腺病毒DNA、或与非病毒蛋白缀合的腺病毒DNA。

在上下文腺病毒载体中，术语“5′”与“上游”可交换使用，并指在反向末端重复(ITR)的左侧方向。在上下文腺病毒载体中，术语“3′”与“下游”可交换使用，并指在ITR的右侧方向。

用于产生表达插入序列的腺病毒载体的标准系统是本领域已知的，并且商业可购，例如获得自得Clontech(Clontechniques(2000年1月)p.10-12)的Adeno-X表达系统。

本发明的腺病毒载体包括复制缺陷型和复制型载体。在靶细胞中，复制缺陷型载体不复制或复制水平十分低。在一个实施例中，复制缺陷型载体一般通过缺失或突变部分或全部的编码区，在E1a、E1b、E2a、E2b或E4中具有至少一个失活的编码区。增殖这些载体的方法是本领域众所周知的。

本发明涉及使用所有的腺病毒血清型以构建腺病毒载体和根据本发明的病毒颗粒。根据本发明可被使用的腺病毒株包括所有的腺病毒血清型。现在，腺病毒血清型1-47可获得自美国典型培养物保藏中心(ATCC，Manassas，VA)，且本发明包括所有其它任何来源所能获得的腺病毒血清型。根据本发明可被使用的腺病毒可以是人源或非人源的。举例来说，腺病毒可以是亚组A(如血清型12、18、31)、亚组B(如血清型3、7、11、14、16、21、34、35)、亚组C(如血清型1、2、5、6)、亚组D(如血清型8、9、10、13、15、17、19、20、22-30、32、33、36-39、42-47)、亚组E(血清型4)、亚组F(血清型40、41)、或任何其它腺病毒血清型。说明书全文中所提到的是5型腺病毒中的特定核苷酸。基于本领域技术人员所能获得的常规知识，本领域技术人员可以确定其它血清型中的相应核苷酸，并因此构建腺病毒血清型不同于血清型5的类似的腺病毒载体。在一个优选的实施例中，腺病毒核酸主链源自腺病毒血清型2(Ad2)、5(Ad5)或35(Ad35)，或者嵌合腺病毒主链包含腺病毒血清型2(Ad2)或5(Ad5)部分与腺病毒血清型35(Ad35)部分的组合。

腺病毒血清型2和5的DNA和蛋白序列可见于基因库(GenBank)保藏登记号NC_001405(Ad2)和AY339865(Ad5)，两者全文在此并入。随同完整的基因组DNA序列一起，GenBank条目包括了有用的详细资料，例如参考文献、剪接信号位置、多腺苷酸化位点、TATA信号、内含子、每一标识基因的起始和终止密码子、蛋白序列、每一基因的cDNA以及在存在于全文文献中的一列序列变体。同样地，对于本发明特别感兴趣的是，可从所指示的每一基因或区的剪接位点和多腺苷酸化切割位点推断出每一区的mRNA结构，以及在这些GenBank记录中相关出版物的引用列表。

以下参考文献提供了腺病毒基因位置、基因剪接、转录元件(如剪接位点、多腺苷酸化信号序列)位置的详细资料：Nevins和Chen-Kiang，Adv Virus Res.1981；26：1-35；Akusjarvi和Stevenin，Curr Topics MicrobiolImmunology 272：253-86(2003)；Prescott和Falck-Pedersen，Mol CellBiol 1994 14：4682-4693；Muhlemann等1995 J Virol 69：7324-7327；Nevins和Wilson，Nature.1981年3月12日；290(5802)：113-8；Prescott和Falck-Pederson，J Biol Chem 267：8175；1992；Larsson，Svensson和Akusjarvi J MoI Biol 225：287；1992；Farley，Brown和Leppard，J Virol 78：1782；2004。对于其基因组两条链(上链及下链)上的基因，腺病毒编码基因和加工信号。

当进行任何变化时，注意在互补链上应不存在不希望有的改变。同样地，有时转基因相对较小，则因此多个转基因有可能被插入到一个腺病毒载体基因组中。只要两条DNA链上必需基因和加工信号都保持完整，转基因就能基本上插入Ad基因间的任何位置。可选择地，在某些情况下，期望改变现有基因和/或信号以改变病毒基因表达来适应载体的应用。同样地，对于新的CDS，可能需要添加分支点和剪接受体位点或其它加工信号，与转基因一起用于新导入mRNA的正确加工。

在一个优选的方面，腺病毒载体是复制型或复制条件型的。这样的载体能在靶细胞中复制。复制型病毒包括野生型病毒和被改造以在靶细胞中复制的病毒。这些包括与其它细胞相比用来在一种类型的靶细胞中特异性或优先复制的载体。靶细胞可以是某种细胞型、组织型或具有某种细胞状态。其中复制取决于细胞型、组织型或细胞状态的复制型腺病毒载体进一步描述如下。

在一个实施例中，本发明的腺病毒载体包含处于赋予腺病毒选择性复制的异源转录调节元件(TRE)转录控制下的一个或多个腺病毒复制必需基因。所述腺病毒复制必需基因是一种早期基因，选自E1A、E1B、E2a、E2b和E4。在另一个实施例中，一个或多个额外的TREs可操作地连接一个或多个腺病毒复制必需基因或转基因，例如治疗基因。

腺病毒E1B 19-kDa区指编码E1B 19-kDa产物的腺病毒E1B基因的基因组区。根据野生型Ad5，E1B 19-kDa区是位于核苷酸(nt)1714和nt 2244之间的261bp区。E1B 19-kDa区已描述于例如，Rao等，Proc.Natl.Acad.Sci.USA，89：7742-7746。在一个实施例中，本发明包括E1B 19-kDa区部分或全部缺失，以及其中E1B 19-kDa区突变的实施例，只要缺失或突变减少或消除与E1B-19kDa有关的细胞凋亡即可。

在本发明的一个实施例中，腺病毒载体优先在癌靶细胞中复制，通过比较癌靶细胞与非靶细胞、非癌细胞、正常或对照细胞中的复制水平(如细胞溶解或细胞杀死和/或滴度)以表明其复制优先。靶细胞中特定腺病毒滴度和非靶细胞(或“TRE失活的”细胞)中腺病毒滴度的比较表明复制优先在靶细胞中增加了和/或在非靶细胞中降低了。

腺病毒载体还可包括一个或多个异源TREs，其可以或不可以可操作地连接相同的基因。例如，细胞型特异性、细胞状态特异性或组织型特异性TRE(所有在此描述的都称为“细胞特异性”或“靶细胞特异性”型TREs)可与相同或不同类型的第二TRE并置。“并置”指第一TRE和第二TRE转录控制相同的基因。对于这些实施例，多于一个的TRE可以任何一种构型存在，包括但不限于：(a)彼此邻接(即毗连)；(b)都位于转录受控基因的5′(其中在两个TREs之间可具有间插序列)；(c)一个TRE可位于基因的5′而另一个TRE位于该基因的3′。

可使用本领域标准的重组技术制备本发明的病毒载体。修饰复制型或非复制型病毒载体的方法是本领域众所周知的，并描述于此及在此引用的出版物。描述于此的用于将转基因和期望的转录元件克隆入腺病毒的多种方法是标准方法，且为本领域众所周知。如在此描述的，转基因和期望的转录元件被克隆入腺病毒载体基因组中的不同位点。例如，在本领域中存在多种含有腺病毒基因组不同部分的质粒，包括含有完整腺病毒基因组的质粒。这些质粒的构建在本领域中也得到了充分的描述(如US20030104625)。一旦用于转基因插入的位点被选择，那么适当质粒就可被用来进行修饰。然后，该修饰可通过例如同源重组或体外连接导入全长腺病毒载体基因组。同源重组可在哺乳动物细胞(如PerC6)或细菌细胞(如大肠杆菌，参见WO9617070)中发生。病毒载体基因组操作能可选地或另外包括众所周知的分子生物学方法，包括但不限于，聚合酶链反应(PCR)、PCR-重叠延伸拼接(PCR-SOEing)、限制酶切消化。如果使用同源重组，则两个质粒通常具有至少约500bp的序列重叠，尽管较小的重叠区会重组，但通常效率较低。视所需，每个质粒可独立地操作，接着共转染入感受态宿主中，提供适合于腺病毒载体增殖的补充基因。使用诸如正离子脂质体或磷酸钙的适当转导方法，通常可将质粒导入适合的宿主细胞(如293、PerC.6、Hela-S3细胞)中。或者，还可进行腺病毒基因组右侧和左侧部分的体外连接以构建含有所有腺病毒基因组复制必需部分的重组腺病毒衍生物。Berkner等(1983)Nucleic Acid Research 11：6003-6020；Bridge等(1989)J.Virol.63：631-638。

为了方便起见，可使用提供了腺病毒必需部分的质粒。质粒pXC.1(McKinnon(1982)Gene 19：33-42)含有野生型Ad5的左侧末端。pBHG10(Bett等(1994)；Microbix Biosystems Inc.，Toronto)提供了具有E3缺失的Ad5的右侧末端。在病毒载体中E3缺失提供了更多插入异源序列的空间。E3基因位于E4(右链)的相反链上。pBHG11提供了甚至更大的E3缺失，缺失了额外的0.3kb(Bett等(1994))。可选择地，使用提供了具有全长E3的Ad5右侧末端的pBHGE3(MicrobixBiosystems，Inc.)。

将多核苷酸包装入腺病毒颗粒中的方法是本领域已知的，也描述于PCT/US98/04080。优选的包装细胞是已被用来限制能产生野生型腺病毒颗粒的同源重组的那些细胞。能用来产生本发明的腺病毒颗粒的细胞包括人胚胎肾细胞系293(Graham等，J Gen.Virol.36：59-72(1977))、人胚胎成视网膜细胞系PER.C6(美国专利号5,994,128和6,033,908；Fallaux等，Hum.Gene Ther.9：1909-1917(1998))以及人宫颈肿瘤衍生的细胞系HeLa-S3(PCT申请号US 04/11855)。病毒载体可以多种方式转移至靶细胞，包括但不限于脂质体、本领域众所周知的常用转染方法(例如磷酸钙沉淀或电穿孔)、直接注射和静脉输注。在很大程度上，转移方式取决于特定的载体(包括其类型)以及靶细胞的类型和位置(即细胞是否在体外或体内)。

本发明还提供了包含根据本发明的重组病毒载体的重组腺病毒颗粒。在一个实施例中，腺病毒颗粒的衣壳蛋白包含靶向配体。在一种方法中，衣壳蛋白是尾丝蛋白或pIX。在一方面，衣壳蛋白是尾丝蛋白，且配体在尾丝蛋白的C末端(羧基末端)或HI环中。腺病毒载体颗粒还可包括其它对尾丝蛋白的突变。在一个另外的实施例中，通过使用来自另一种腺病毒血清型的尾丝结(fiber knob)取代尾丝结以靶向病毒。这些突变的例子包括，但不限于描述于美国申请号10/403,337；美国申请公开号2004/0002060；PCT公开号WO 98/07877；WO 99/39734；WO00/67576；WO 01/92299；和美国专利号5,543,328；5,731,190；5,756,086；5,770,442；5,846,782；5,962,311；5,922,315；6,057,155；6,127,525；6,153,435；6,455,314；6,555,368和6,683,170以及Wu等(JVirol.2003年7月1日；77(13)：7225-7235)中的那些。这些包括，但不限于减少病毒载体颗粒与特定细胞类型或多于一种的细胞类型结合的突变、增强病毒载体颗粒与特定细胞类型或多于一种细胞类型结合的突变、和/或降低哺乳动物中对腺病毒载体颗粒免疫应答的突变。

在C组腺病毒中，腺病毒主要晚期转录单位(MLTU)分为五个区。每个区特点在于都具有自己的多腺苷酸化信号序列，且通常由几个不同的剪接信使组成。所有的晚期信使都在其三联前导序列(TPL)的5′末端被剪接。每个区的描述如下。

在本发明示范性的实施例中，转基因插入在至少一个如下位置中：A)L1区，插入52、55K和IIIa CDS之间，或pIIIa CDS之后和L1区多腺苷酸化信号序列上游之间(图3)；B)L2区：插入pV CDS和MuCDS之间，或pVII CDS和pV CDS之间，和/或五邻体之后和pVII之前(图4)；C)L3区：插入pVI上游，或pVI和六邻体之间，或六邻体和23K3之间，或23K基因之后和多腺苷酸化信号序列上游之间(图5-7)；D)L4区：使用如其它区所述的类似策略，可能插入L4区多腺苷酸化信号序列上游。然而，在L4和E2转录单位和加工信号之间存在着重要的重叠。因此，本领域技术人员会以不显著破坏其它转录单位和加工信号的方式插入转基因，当然除非期望所述破坏时。E)L5区：在Ad5L5区中只有一个尾丝基因编码的蛋白。终止密码子嵌在多腺苷酸化信号序列中。转基因插入在L5尾丝CDS的上游，或如果插入下游，则对于尾丝CDS，多腺苷酸化信号序列将被重建/添加，突变天然多腺苷酸化信号序列以保持终止密码子并失活多腺苷酸化功能。F)E3区：转基因插入在没有缺失的E3区。例如，转基因插入位点包括E3基因上游或下游的位点。G)其它存在于Ad基因组中的转录单位，例如编码pIX和IVa2的中间区，可以类似的方式得以使用。H)可添加到基因组中的新转录单位。例如，可添加新的晚期区到晚期转录单位，形成“L6区”。

在一个实施例中，转基因作为L1、L2、L3、L4或L5转录物的一部分表达。

在一个实施例中，载体中的转基因利用了(即可操作地连接)为至少一个病毒mRNAs所使用的相同的polyA信号。例如，当在主要晚期转录单位中插入转基因时，插入转基因的方法并不创建新的或第六前导区序列。相同的polyA信号可以是天然Ad polyA或异源polyA信号。

对多腺苷酸化信号序列附近序列的修饰可影响切割效率。因此，对这些区的修饰可增加、减少或产生相当的切割效率。当选择插入位点时，本领域技术人员能考虑到期望的表达时间和转基因的表达量。

在本发明的一个实施例中，IRES或自加工切割序列可操作地连接插入多腺苷酸化信号序列上游和腺病毒编码序列下游的转基因。多腺苷酸化信号序列通常是腺病毒多腺苷酸化信号序列，但可以是异源多腺苷酸化信号序列。在一个实施例中，所述异源多腺苷酸化信号序列替代了腺病毒多腺苷酸化信号序列的功能。在本发明的一个实施例中，IRES或自加工切割序列和转基因插入在编码多于一种蛋白的腺病毒转录单位或前导区序列(如L1、L2、L3、L4)中(如由于差别剪接)。该实施例优点在于IRES或自加工切割序列对来自所述转录物或前导区的每一mRNA都起作用，换言之，除腺病毒编码序列(CDS)之外，来自所述转录单位的每一mRNA应可操作地编码并表达转基因。在一个例子中，其后连接有转基因的IRES或自加工切割序列插入L2多腺苷酸化信号的上游，L2区产生的所有四种类型的mRNAs应都含有所插入的序列，因此所有四种类型的mRNAs都应表达转基因。不受理论束缚，人们相信IRES或自加工切割序列和转基因与多腺苷酸化信号越接近，转基因的表达水平就越高。当选择插入位点时，本领域技术人员能考虑到期望的表达时间和转基因的表达量。例如，如果期望在相对于病毒复制周期的中间时间表达转基因，则IRES或自加工切割序列转基因盒也可插入pIX或IVa2的polyA信号上游。能获得各种类型的IRESs和自加工切割序列，各自介导翻译的效率不同。本领域技术人员能选择具有已知效率的特定IRES或自加工切割序列用于调节转基因表达效率。当添加IRES或自加工切割序列和转基因时，务必小心避免破坏其它腺病毒序列，包括编码其它链(即反义链)的那些，除非期望破坏某些腺病毒基因。鉴于对腺病毒基因表达的大量描述，本领域技术人员能确定会或不会破坏腺病毒基因表达的位点。

L1区

如图1-3所示，L1区包括52/55K和IIIa编码区。在剪接受体位点之后的ATG上游，两个基因都只具有一个碱基。在所有的晚期区中，每个区所编码的mRNAs在其剪接受体位点与三联前导序列相连。已鉴定了在52/55K和IIIa编码区之间剪接增强子序列(25个碱基对序列)的存在和位置。此外，剪接阻遏区正好位于剪接增强子上游。L1区上游是VARNA编码区和位于互补链上的E2B编码区。事实上，VA RNA II结束于自52/55K mRNA剪接受体位点的约10个碱基对。L2区下游的剪接受体位点位于L1多腺苷酸化信号序列上游。这些重叠部分应被考虑，且当转基因插入在L1区时，通常要完整保留。尽管只产生52/55K基因的可检测水平，但在感染早期L1 mRNA就开始合成了。在进入晚期后，IIIa编码区被翻译，且52/55K翻译水平更低。此外，这种调节改变的机制应归于受进入感染晚期影响的差别剪接位点的使用。

转基因能潜在地位于两个L1编码区之间、或52/55K编码区上游、或紧接IIIa编码区下游以及L1多腺苷酸化信号序列上游。在一个实施例中，在转基因和/或腺病毒编码区下游添加分支点序列和剪接受体位点。在另一个实施例中，自加工切割位点添加在IIIa区下游并可操作地连接IIIa区，之后自加工切割位点可操作地连接位于自加工切割位点下游的转基因。同样地，当设计IIIa编码区下游插入时，务必小心避免破坏L1多腺苷酸化信号序列和L2剪接受体位点。或者，视所需可恢复或改变这些信号以改变蛋白表达。考虑到类似于病毒蛋白，插入52/55K上游和下游的转基因会在早期表达，而插入IIIa下游的转基因则会在感染晚期表达。取决于例如剪接增强子和阻遏区的布置，其可得到改变。

在另一个实施例中，将可操作地连接转基因的IRES插入IIIa编码区下游和L1多腺苷酸化信号序列或异源多腺苷酸化信号序列上游(即可操作地连接)。

L2区

如图1-2和4所示，L2区编码四个已鉴定的编码区：五邻体(akaIII)、proVII(aka pVII)、pV和pX(有时称为pV前体或“mu”)。五邻体具有在其起始密码子上游2个碱基处的剪接受体位点。proVII mRNA的剪接位点嵌在五邻体编码区中，其起始密码子在五邻体终止密码子下游7个碱基对处。proVII的终止密码子、pV mRNA的剪接位点和pV的起始密码子分别间隔46和23个碱基对。pX及其ATG起始密码子在pV终止密码子下游124个碱基处。L2区的多腺苷酸化信号序列在pX终止密码子后26个碱基处，在polyA信号后约12个碱基处发生切割。

转基因插入的选择包括但不限于：a)插入pV或pX CDSs后，和L2多腺苷酸化信号序列上游，b)插入pV mRNA剪接受体位点下游和pVCDS上游，和c)插入五邻体终止密码子和pVII起始密码子之间。当转基因插入方法和表达依赖于选择性剪接时，期望在每个编码区都具有剪接受体位点，可以是现有的或外源添加的序列。所有的L2 mRNA信使通常都使用L2多腺苷酸化信号，但是在某些实施例中，可利用非天然polyA信号。

使用自加工切割位点，转基因还可表达自L2区的这些区。在一个实施例中，自加工切割位点可操作地连接Ad CDS(如五邻体、proVII、pV和pX)的3′末端，转基因CDS可操作地连接自加工切割位点的3′末端。在一个可选的实施例中，转基因插入在Ad CDS上游，其中自加工切割位点可操作地连接转基因的3′末端，Ad CDS可操作地连接自加工切割位点的3′末端。在该情况下，转基因与适当的转录元件(如在此描述的)一起插入使得其从载体转录。这可包括插入可操作地连接Ad剪接位点和分支点的转基因。在一个实施例中，Ad剪接位点和分支点是在天然病毒中连接Ad CDS下游的位点。在另一个实施例中，转基因可操作地连接其中之一或两者为异源的剪接位点和分支点。

在另一个实施例中，可操作地连接转基因的IRES插入pV编码区下游和L2 polyA信号或异源多腺苷酸化信号序列上游(即可操作地连接)。

L3区

如图5-7所示，L3区含有pVI、六邻体(II)和23K(病毒蛋白酶)编码区。pVI mRNA的剪接受体位点位于L2多腺苷酸化位点下游和pVI起始密码子上游一个碱基处。pVI终止密码子位于六邻体信使剪接受体位点上游约50个碱基处，六邻体起始密码子位于自其mRNA剪接受体位点的约35个碱基处。23K mRNA的剪接受体位点包含在六邻体编码序列中，位于六邻体终止密码子上游约95个碱基处。23K起始密码子位于六邻体终止密码子下游的32个碱基处。23K终止密码子位于L3polyA信号上游约25个碱基处。L3多腺苷酸化区与E2A多腺苷酸化信号的重叠位于互补链上。在大多数情况下，期望在两条链上保留完整的多腺苷酸化信号序列用于有效加工。

转基因插入在L3区中存在多种选择：a)pVI编码区上游，b)pVI和六邻体编码区之间，c)六邻体和23K编码区之间和d)23K CDS末端。注意到L3 polyA信号十分强且六邻体mRNA大量表达。预计插入L3中的转基因还会大量表达。同样地，对于在六邻体和23K编码区之间的插入，对于转基因mRNA期望使用六邻体编码区中的剪接受体位点(通常用于23K mRNA)，对于23K信使合成则期望添加新的分支点和剪接受体位点。在另一个实施例中，转基因与具有自加工切割位点的六邻体CDS连接。在另一个实施例中，可操作地连接转基因的IRES插入23K编码区下游和L3polyA信号或异源多腺苷酸化信号序列上游(即可操作地连接)。

L4区

如图1和2所示，L4区含有100K、33K和pVIII蛋白编码区。33KCDS的一部分与100K CDS重叠。尽管在这两个基因之间存在非编码碱基对，但并非插入转基因的期望位置，因为这可能破坏33K内含子或改变其使用。pVIII CDS和polyA区与E2和E3启动子重叠。在互补链上的是E2A和E2B转录单位的前导区序列。因此，当利用该区进行转基因插入时，设计者应当意识到这一点。有可能在该区的任意插入或破坏能改变或破坏E2、E3和/或L4区中必需基因的表达。

在另一个实施例中，可操作地连接转基因的IRES或自加工切割位点插入100K编码区下游和L4 polyA信号或异源多腺苷酸化信号序列上游(即可操作地连接)。在该情况下，因为与L4 polyA序列重叠，E312.5K CDS可能会被中断。然而，某些该基因缺失的突变体在体外并不显示有表型改变，因此该转基因插入位置/方法能产生功能性腺病毒载体。

L5区

如图1和2所示，Ad5中L5区仅编码尾丝蛋白。尾丝mRNA的剪接受体位点位于尾丝起始密码子上游2个核苷酸(nts)处。尾丝终止密码子嵌于L5 polyA信号中。转基因可插入尾丝编码区上游或下游。然而，对于下游插入，天然L5多腺苷酸化信号序列被修饰，使得该序列不再提供多腺苷酸化功能。在一个实施例中，在mRNA合成中插入剪接受体位点和转基因。然后，通过在插入的转基因下游，多腺苷酸化信号得以恢复供改变的L5区使用。在另一个实施例中，自加工切割位点可操作地连接尾丝CDS下游末端，转基因CDS插入自加工切割位点下游并可操作地与其连接。

额外的晚期区

另一种将转基因插入在诸如Ad的病毒载体中的方法是插入额外的晚期区。可通过例如恰好插入现有区或转录单位(例如L3)，由分支点和剪接受体位点、转基因和多腺苷酸化信号(以及任何其它必需信号)组成的盒的下游而得以进行。该盒还可由IRES或可操作地连接第二转基因的自加工切割位点组成。第二转基因可编码与第一转基因相同或不同的蛋白。就相同的蛋白来说，优选转基因的编码序列“再编码”。换言之，使用不同的密码子来编码相同的氨基酸。能在DNA水平上减少两个转基因之间的同源性数值，因此减少或消除两个转基因之间的同源重组。

E3区

腺病毒中E3区编码已鉴定的蛋白12.5K、6.7K、gp19K、ADP、RID-α、RJD-β和14.7K的基因。在一个实施例中，转基因插入在gp19K编码区下游和ADP CDS上游。有趣的是，在Ad5病毒中有128bps位于gp19K和ADP编码区之间(保藏登记号AY339865的Ad基因组中碱基对29209-29336；SEQ ID NO：41)。

在本发明的一个实施例中，这些128bps或这些128bps的大多数都从Ad5载体上缺失了。在一个实施例中，Ad5载体含有gp19K和/或ADP编码区，且缺失这些128bps。Ad2病毒在该区并不含有这些128bps或类似序列。在另一个实施例中，转基因插入在14.7K编码区后和E3B多腺苷酸化信号序列上游。在另一个实施例中，转基因插入在ADP编码区后。然而，ADP终止密码子却嵌于E3A polyA位点中。因此，应修饰polyA位点以使得该序列不再提供多腺苷酸化功能，但在ADP编码序列读框中仍保留终止密码子。转基因可插入(如与剪接受体位点或自加工切割位点一起)ADP CDS下游。然后，多腺苷酸化信号序列插入转基因编码区下游。所插入的多腺苷酸化信号序列可以是天然的E3A polyA位点或额外的polyA位点(如SV40polyA位点)。

E3编码区并不是病毒复制所必需的。因此，在腺病毒载体中E3编码区不是必需的。结果，本发明的病毒载体可具有一个或多个E3编码区缺失，或可选择地，可包含所有的E3编码区。在本发明的实施例中，E314.7、14.5或10.4k编码区或其组合保留在腺病毒载体中。在本发明的一个实施例中，不插入取代E3CDS的转基因。例如，转基因插入在两个天然E3CDSs之间，其中在天然病毒中所述两个天然编码序列彼此邻接，且没有其它的E3CDS位于它们之间。在某些实施例中，本发明的腺病毒载体含有可操作地连接转基因的异源剪接受体位点，其作为E3转录单位的一部分转录。例如，异源剪接受体位点可操作地连接转基因，并且都插入E3区中。

在另一个实施例中，插入可操作地连接转基因CDS的自加工切割位点，使得该自加工切割位点还可操作地连接腺病毒E3 CDS。转基因CDS可位于自加工切割位点下游，E3 CDS位于自加工切割位点上游。在另一个实施例中，E3 CDS可位于自加工切割位点下游，转基因CDS位于自加工切割位点上游。

在另一个实施例中，可操作地连接转基因的IRES插入在14.7K编码区下游和E3B polyA信号或异源多腺苷酸化信号序列上游(即可操作地连接)。在一个实施例中，可操作地连接到转基因的IRES插入在ADP编码区下游和E3A polyA信号或异源多腺苷酸化信号序列的上游(即可操作地连接)。E3区编码不为病毒复制所需的蛋白，因此对于某些类型的腺病毒载体及其应用不是必要的。因此，在另一个实施例中，一个或多个E3编码序列缺失或突变，由可操作地连接转基因的IRES组成的异源DNA分别被插入在E3A或E3B多腺苷酸化信号序列和紧接着E3A或E3B多腺苷酸化信号序列5′的E3编码序列之间。

任何一种在此描述的转基因插入方法都可与任何另外一种在此或其它地方所描述的转基因插入方法组合使用，只要插入位点一致即可。例如，可操作地连接剪接受体位点和分支点的第一转基因可插入在转录单位中。然后，所插入的第一转基因能可操作地连接插入在所述第一转基因下游的自加工切割位点，接着第二转基因插入在自加工切割位点下游并与其可操作地连接。本领域技术人员应当理解的是，能依赖于本文教导，使用所披露的转基因插入和表达方法的组合插入转基因，所有方法和插入位点都包含在本发明中。

如果要将腺病毒载体DNA包装到病毒粒子中，那么必须小心不要超过病毒的包装容量。例如对于Ad5，当基因组DNA大于野生型Ad5基因组的尺寸约105％时，包装效率就大大降低(Bett等Virol.1993年10月；67(10)：5911-21)。不顾稳定的更大的Ad5载体已被报道。

为简单起见，除非另作说明，在说明书上下文中指向Ad血清型5。本领域技术人员无需过度试验就能容易地推断出在其它腺病毒或其它病毒中用于转基因的等价位点

取决于转基因的特性，可期望在感染早期或晚期表达；此外，亦可期望具有高或低的表达水平。例如，在某些情况下，优选在病毒DNA复制后的感染晚期表达。如果载体是具有驱动早期基因表达的肿瘤特异性启动子的溶瘤Ad载体，则晚期表达提供了一种额外的调节机制，因为晚期基因表达需要DNA复制。如果转基因插入在晚期转录物中，则表达是特异性，因为对于靶细胞病毒复制是特异性的，如果Ad载体被设计为复制选择性的话。

另一种可用于帮助调节转基因表达或改变病毒基因表达的机制是修饰与共有序列相比的所添加元件(如分支点序列和/或剪接受体位点或自加工切割位点)的序列。其改变了使用效率。例如，就剪接受体位点来说，如果期望高表达水平，则应使用与共有剪接受体序列十分接近的序列。共有剪接受体位点序列确定为(T/C)8，N，C/T，A，G，G(Mount，NucleicAcids Res 10：459；1982)。已进行了改变切割效率的突变分析(Roscigno等J Biol Chem 268：11222；1993；Lee等Gene Therapy 11：94；2004)。应当指出在病毒进入晚期后，通常所接受的共有序列定义和使用可以并进行改变(Akusjarvi和Svevenin，Curr Top Microbiol Immunol 272：253；2003；Nevins和Wilson，Nature 290：113；1981；Akusjarvi和Persson，J Virol 38：469；1981)。例如，在感染晚期非共有剪接受体位点的使用得以增加(Muhlemann等J Virol 69：7324；1995)。大多数的这些改变是由于病毒蛋白对用于转录和翻译的细胞结构的作用之故。

除剪接受体位点之外，分支点序列亦可包含在本发明的腺病毒载体中。分支点序列是内含子有效剪接所必需的(Vandenbroucke等，BMCGenomics 3：13；2002；Hall等，PNAS 85：704-708；1988；Harris等NuclAcid Res 18(10)3015-3019 1990)。分支点与剪接受体位点的距离也影响剪接效率，且通常为，但并不总是剪接受体位点上游10-50个碱基对，更经常地是18-37个碱基对(Vandenbroucke等，2002；Hall等1988；Harris等1990)。据信分支点序列的共有序列是YNYURAY(SEQ IDNO：40)(在此Y是嘧啶，N是任何核苷酸以及R是嘌呤)，下划线的A是不变的(Liao等，Virology 323：131；2004)。在该序列中，任何偏差都会引起分支点和剪接受体位点使用效率改变。

在本发明的一个实施例中，分支点序列加剪接受体序列是：TACTTAT GACTCGTACTATTGTTATTCATCC AG↓G(SEQ IDNO：39)。下划线序列是分支点序列，箭头表示依照剪接规则的剪接位点位置。因为该规则决定了共有序列并不是不变的，故其它遵守规则的类似序列也可使用。在一个实施例中，所使用的分支点加剪接受体位点来自另一种Ad血清型。换言之，分支点加剪接受体位点是异源的，即并非来自Ad载体所基于的天然腺病毒，但来自不同的Ad血清型。

可添加能改变剪接效率和/或期望的转基因表达的其它任选序列。例如，已鉴定了能增强或抑制剪接的存在于外显子中的顺式作用元件。这些序列称为外显子剪接增强子(ESE)或外显子剪接阻抑制子(ESS)(见Zheng，J Biomed Sci 11：278；2004评论)。尽管这些元件没有共有序列，但已在其它病毒和非病毒生物体中鉴定了许多ESSs和ESEs的例子，这些元件都可以使用。本领域技术人员能仔细审视文献和数据，并选择适当的序列。

总之，本发明提供了用于将转基因编码区插入在病毒载体基因组特定区域的方法。该方法利用了已知病毒转录元件和表达Ad基因的机制，因为无需额外的启动子且调节信号包含较小尺寸的DNA片段，减小了插入在Ad基因组中用于转基因表达的DNA序列的尺寸，提供了转基因时序调节(如感染早期对晚期；感染早期对中间期)的灵活性，还提供了调节转基因表达量的技术。例如，通过将转基因插入在通常以高水平表达的转录物中和/或可操作地连接高效剪接受体位点和转基因编码区，可表达更高数量的转基因。表达水平还受调节信号与其共有序列接近程度的影响；可进行改变以适应所需表达。

有时，转基因表达可抑制复制型病毒的生活周期。在这种情况下，转基因可以仅在感染晚期表达或在主要在感染晚期(在病毒DNA复制后)表达的方式插入。例如，根据本发明转基因可插入在L3中。对于某些转基因，期望在病毒生活周期早期表达转基因。例如，转基因可插入在任一早期区(如E3)或L1区上游。

转录调节元件(TREs)

本领域已知转录调节元件(TREs)、以及其鉴定、分离、表征、遗传操作和用于调节可操作地连接的编码序列的方法。TRE可来源于单基因的转录调节序列，可组合来自不同基因的序列以产生功能性TRE，或者可通过合成产生TRE(如CTP4启动子)。

取决于靶组织或肿瘤中存在的细胞类型，TRE可以是组织特异的、肿瘤特异的、发育阶段特异的、细胞状态特异的等。这样的TREs在此总的称为组织特异性或靶细胞特异性TREs。详述如下，靶细胞特异性TRE可包含许多构型，包括但不限于靶细胞特异性启动子和靶细胞特异性增强子；异源启动子和靶细胞特异性增强子；靶细胞特异性启动子和异源增强子；异源启动子和异源增强子；以及前述的多聚体。靶细胞特异性TRE的启动子和增强子元件可位于目标编码序列的任何方向和/或任何距离，只要获得期望的靶细胞特异性转录活性即可。

可用本领域已知的多种方法(详述如下)测定转录激活，但一般通过检测和/或定量受靶细胞特异性TRE控制的(即可操作地连接)编码序列的mRNA或蛋白产物来进行测定。

如在此所进一步讨论的，靶细胞特异性TRE可具有不同的长度和不同的序列组成。靶细胞特异性TRE优先在有限种群(或类型)的细胞中起作用，如前列腺细胞、肝细胞、黑色素瘤细胞等。因此，在某些实施例中，所使用的TRE在任一下列组织类型中优先起作用：前列腺；肝；乳腺；泌尿道上皮(膀胱)；结肠；肺；卵巢；胰腺；胃；子宫等。

易于为本领域技术人员所理解的是，TRE是一种多核苷酸序列，且多种序列变换后亦能起作用。本领域已知核苷酸取代、添加和缺失的方法，且易于获得使本领域技术人员能测定序列变体是否显示必需的细胞特异性转录调节功能的功能测定法(例如CAT或荧光素酶报道基因测定)。因此，包含核酸取代、添加和/或缺失的保留功能的TREs变体可用于在此披露的载体中。因此，TREs变体可在靶细胞中保留功能但无须显示最大功能。事实上，对于实现期望结果，并不总是需要TRE的最大转录激活活性，对于某些应用，TRE片段提供的诱导水平就足够。例如，如果用于治疗或缓解疾病状态，如果靶细胞不是特别有毒性的和/或疾病程度相对有限，小于最大的应答性就足够。

某些碱基修饰可产生增加的表达水平和/或细胞特异性。例如，本领域已知TRE中核酸序列缺失或添加可使转录调节蛋白结合位点较之正常构型彼此距离更近或更远，或使之旋转以处于DNA螺旋的对侧，由此改变TRE-结合的转录因子之间的空间关系，导致转录减少或增加。因此，尽管希望不受理论束缚，但本发明预计到某些TRE修饰会产生改变的处于TRE指导下的表达水平的可能性，包括增强的细胞特异性。在更具攻击性的肿瘤生长情况下和/或当要保证更快速和/或更具攻击性地杀死细胞时，特别期望获得增强的表达水平(例如，在无免疫应答的患者中)。

供本发明载体使用的TRE可包含或不包含沉默基因。沉默基因(即本领域已知的负调节元件)的存在可帮助关闭非靶细胞中的转录(以及由此的复制)。因此，沉默基因的存在能通过更有效地防止非靶细胞中的复制从而赋予增强的细胞特异性载体复制。或者，缺少沉默基因可刺激靶细胞中的复制，因此赋予增强的靶细胞特异性。

可以多种本领域已知的方法测量TRE指导的转录活性(包括抑制和增强)，但一般是通过检测和/或定量mRNA和/或处于TRE控制下(即可操作地连接)的序列编码的蛋白产物来测量。

如本文所讨论的，TRE可具有不同的长度以及不同的序列组成。在某种程度上，异源TRE的尺寸可通过病毒载体容量得以测定，还取决于载体的预期类型。一般来说，TREs优选具有最低限度的尺寸，其为插入所期望的其它序列提供潜在的空间，例如转基因和/或额外的调节序列。在一个优选的实施例中，这样的额外的调节序列是IRES、自加工切割序列，例如2A或2A-样序列、剪接序列或分支点。

举例来说，腺病毒载体可用总计达基因组尺寸的约105％或大约1.8kb的额外序列包装，无需缺失病毒序列。如果从腺病毒基因组上除去非必需序列，额外的4.6kb插入物就可容许(即总的插入容量为约6.4kb)。

就复制型腺病毒载体来说，为了使非特异性复制减到最小，优选从载体上除去内源(腺病毒)TREs(即天然的E1A和/或E1B启动子)。除利于靶细胞特异性复制之外，除去内源TREs还提供了更大的载体插入容量，如果腺病毒载体要包装在病毒颗粒中，则其是特别有意义的。更重要的是，内源TREs的缺失阻止了重组事件的可能性，由于异源TRE缺失，内源TRE承担了其相应的腺病毒编码序列的转录控制(因此容许非特异性复制)。在一个实施例中，构建腺病毒载体使得一个或多个腺病毒基因的内源转录控制序列缺失并为一个或多个异源TREs所取代。然而，只要足够的细胞特异性复制优先得以保存，内源TREs就可保留在腺病毒载体中。通过在内源TRE和编码复制必需区段的基因之间插入异源TREs构建了这些实施例。通过比较容许异源TREs可起作用的细胞与不起作用的细胞中腺病毒载体复制的传导测定，从而测定了必需的细胞特异性复制优先。

一般来说，与不存在TRE下的复制的基础水平相比，TRE会增加靶细胞中载体复制至少约2倍、优选至少约5倍、优选至少约10倍、更优选至少约20倍、更优选至少约50倍、更优选至少约100倍、更优选至少约200倍、还优选至少约400至约500倍，还优选至少约1000倍。可以经验为主地测定可接受的差异(通过使用例如RNA印迹测定法、RNase保护测定法或其它本领域已知的测定法测量mRNA水平)，并取决于该载体预期的用途和/或所期望的结果。

使用在靶细胞中优先起作用的TREs能产生定向于特异性靶细胞的腺病毒载体。在本发明的一个实施例中，靶细胞特异性或细胞状态特异性的异源TRE是肿瘤细胞特异性的。载体可包含单个肿瘤细胞特异性的TRE或多个肿瘤细胞特异性的并在相同细胞中起作用的异源TREs。在另一个实施例中，载体包含一个或多个肿瘤细胞特异性的异源TREs，并额外包含一个或多个组织特异性的异源TREs，籍此在相同细胞中所有TREs都起作用。

在一个优选的溶瘤腺病毒平台实施例中，含有IRES或诸如2A或2A-样序列的自加工切割序列的双顺反子或多顺反子盒包含腺病毒早期病毒基因(E1A、E1B、E2、E3和/或E4)或在病毒生活周期晚期表达的基因(尾丝、五邻体和六邻体)。

在某些情况下，由于例如癌靶细胞相对难治愈性或特别的攻击性，因此期望提高细胞毒素活性程度和/或等级。有利于细胞毒性的病毒基因的例子包括但不限于腺病毒死亡蛋白(ADP)基因。在本文披露的另一个实施例中，腺病毒包含其内源性启动子缺失或其中有缺失的腺病毒E1B基因。在本文披露的其它实施例中，E1B的19-kDa区缺失。

为提供对靶细胞而言增强的细胞毒性，一种或多种具有细胞毒性效应的转基因可存在于载体中。此外，或可选择地，有利于细胞毒性和/或细胞死亡的腺病毒基因，例如腺病毒死亡蛋白(ADP)基因，可包括在载体中，任选地处于异源TRE的选择性转录控制下，并任选地处于IRES或自加工切割序列例如2A或2A-样序列的转录控制下。可通过将靶细胞特异性细胞毒素活性与异源基因或转基因的细胞特异性表达相结合而得以实现。

任何一种异源治疗基因或转基因都可包括在本发明的复制型病毒载体中，进一步描述于下。

一般来说，前述双顺反子或多顺反子盒被置于处于转录应答元件(通常是优先在癌或肿瘤细胞中表达的与细胞类型或细胞状态有关的转录调节元件)的控制下。因此，取决于靶细胞的类型，包含在给定构建体中的治疗基因会有所变化。

本领域已知TREs活性可诱导。在不存在诱导物时，可诱导的TREs通常显示低活性，而在诱导物存在下则是向上调节的。诱导物包括例如核酸、多肽、小分子、有机化合物和/或诸如温度、压力或的低氧的环境条件。当期望仅在确定时间或确定位置表达时，或当期望使用诱导剂滴定决定表达水平时，优选可诱导的TREs。例如，通过雄激素可诱导来自PSE-TRE、PB-TRE和hKLK2-TRE的转录活性，如本文及在此特别并入作为参考的PCT/US98/04080所述。因此，在本发明的一个实施例中，腺病毒载体包含可诱导的异源TRE。

用于本发明的TRE可以多种构型存在。TRE可包含多聚体。例如，TRE可包含至少两个、至少三个、至少四个或至少五个靶细胞特异性TREs的串联序列。这些多聚体还可含有异源启动子和/或增强子序列。

可选择地，TRE可包含一个或多个启动子区以及一个或多个增强子区。TRE多聚体还可包含来自不同基因的启动子和/或增强子序列。TRE的启动子和增强子元件相对于彼此可以任何方向存在，且可与感兴趣的编码序列以任何方向和/或任何距离存在，只要获得期望的细胞特异性转录活性即可。

本文使用的来源于特定基因的TRE与其所来源的基因有关，且是一种调节可操作地连接的多核苷酸序列在表达该基因的宿主细胞中转录的多核苷酸序列。例如，本文使用的“人腺体激肽释放酶转录调节元件”或“hKLK2-TRE”是一种多核苷酸序列，优选是一种DNA序列，其增加可操作地连接的多核苷酸序列在容许hKLK2-TRE起作用的宿主细胞中的转录，例如表达雄激素受体的细胞(优选哺乳动物细胞，更优选人细胞)，例如前列腺细胞。因此，hKLK2-TKE响应于雄激素受体的结合，并包含至少一部分的hKLK2启动子和/或hKLK2增强子(即ARE或雄激素受体结合位点)。人腺激素增强子和包含该增强子的腺病毒载体描述于WO99/06576，在此特别并入作为参考。

本文使用的“probasin(PB)转录调节元件”或“PB-TRE”是一种多核苷酸序列，优选是一种DNA序列，其选择性增加可操作地连接的多核苷酸序列在容许PB-TRE起作用的宿主细胞中的转录，例如表达雄激素受体的细胞(优选哺乳动物细胞，更优选人细胞，还优选前列腺细胞)。因此，PB-TRE响应于雄激素受体的结合，并包含至少一部分的PB启动子和/或PB增强子(即ARE或雄激素受体结合位点)。特异于表达雄激素细胞的腺病毒载体描述于WO98/39466，在此特别并入作为参考。

本文使用的“前列腺特异性抗原(PSA)转录调节元件”或“PSA-TRE”或“PSE-TRE”是一种多核苷酸序列，优选是一种DNA序列，其选择性增加可操作地连接的多核苷酸序列在容许PSA-TRE起作用的宿主细胞中的转录，例如表达雄激素受体的细胞(优选哺乳动物细胞，更优选人细胞，还优选前列腺细胞)。因此，PSA-TRE响应于雄激素受体的结合，并包含至少一部分的PSA启动子和/或PSA增强子(即ARE或雄激素受体结合位点)。在前列腺中活化并用于腺病毒载体的组织特异性增强子描述于WO 95/19434和WO 97/01358，其中每篇在此特别并入作为参考。

本文使用的“癌胚抗原(CEA)转录调节元件”或“CEA-TRE”是一种多核苷酸序列，优选是一种DNA序列，其选择性增加可操作地连接的多核苷酸序列在容许CEA-TRE起作用的宿主细胞中的转录，例如表达CEA的细胞(优选哺乳动物细胞，更优选人细胞)。CEA-TRE响应于与CEA生成细胞有关的转录因子和/或辅因子，并包含至少一部分的CEA启动子和/或增强子。特异于表达癌胚抗原的细胞的腺病毒载体描述于WO98/39467，在此特别并入作为参考。

本文使用的“α-胎蛋白(AFP)转录调节元件”或“AFP-TRE”是一种多核苷酸序列，优选是一种DNA序列，其选择性增加(可操作地连接的多核苷酸序列)在容许AFP-TRE起作用的宿主细胞中的转录，例如表达AFP的细胞(优选哺乳动物细胞，更优选人细胞)。AFP-TRE响应于与AFP生成细胞有关的转录因子和/或辅因子，并包含至少一部分的AFP启动子和/或增强子。特异于表达α胎蛋白的细胞的腺病毒载体描述于WO98/39465，在此特别并入作为参考。

本文使用的“黏蛋白基因(MUC)转录调节元件”或“MUC1-TRE”是一种多核苷酸序列，优选是一种DNA序列，其选择性增加(可操作连接的多核苷酸序列)在容许MUC1-TRE起作用的宿主细胞中的转录，例如表达MUC1的细胞(优选哺乳动物细胞，更优选人细胞)。MUC1-TRE响应于与MUC1生成细胞有关的转录因子和/或辅因子，并包含至少一部分的MUC1启动子和/或增强子。

本文使用的“膀胱上皮细胞特异性转录应答元件”或“膀胱上皮细胞特异性TRE”是一种多核苷酸序列，优选是一种DNA序列，其增加可操作地连接的多核苷酸序列在容许膀胱上皮细胞特异性TRE起作用的宿主细胞即靶细胞中的转录。已知多种膀胱上皮细胞特异性TREs，响应于与膀胱上皮细胞有关的细胞蛋白(转录因子和/或辅因子)，并包含至少一部分的膀胱上皮细胞特异性启动子和/或膀胱上皮细胞特异性增强子。示范性的膀胱上皮细胞特异性转录调节序列包括人或啮齿动物尿斑素(uroplakin(UP))，如UPI、UPII、UPIII等。人膀胱上皮细胞特异性uroplakin转录调节序列及包含其的腺病毒载体描述于WO 01/72994，在此特别并入作为参考。

本文使用的“黑素细胞特异性转录应答元件”或“黑素细胞特异性TRE”是一种多核苷酸序列，优选是一种DNA序列，其增加可操作地连接的多核苷酸序列在容许黑素细胞特异性TRE起作用的宿主细胞即靶细胞中的转录。已知多种黑素细胞特异性TREs，响应于与黑素细胞有关的细胞蛋白(转录因子和/或辅因子)，并包含至少一部分的黑素细胞特异性启动子和/或黑素细胞特异性增强子。在此描述了用于测定黑素细胞特异性TRE活性并因此用于测定所给定的细胞是否容许黑素细胞特异性TRE起作用的方法。用于实施本发明的黑素细胞特异性TRE的例子包括但不限于来源于的酪氨酸酶基因5′侧翼区、酪氨酸酶相关蛋白-1基因的TRE，来源于酪氨酸酶相关蛋白-2基因5′侧翼区的TRE，来源于MART-1基因5′侧翼区的TRE或来源于在黑素瘤中异常表达的基因5′侧翼区的TRE。

在另一方面，本发明提供了包含来源于可操作地连接腺病毒复制必需基因的PRL-3基因或转基因的转移性结肠癌特异性TRE的腺病毒载体。本文使用的“来源于PRL-3基因的转移性结肠癌特异性TRE”或“PRL-3 TRE”是一种多核苷酸序列，优选是一种DNA序列，其选择性增加可操作地连接的多核苷酸序列在容许PRL-3 TRE起作用的宿主细胞中的转录，例如细胞(优选哺乳动物细胞、更优选人细胞、还优选转移性结肠癌细胞)。转移性结肠癌特异性TRE可包含一个或多个调节序列，如增强子、启动子、转录因子结合位点等，其可来源于相同的或不同的基因。在一个优选的方面，PRL-3 TRE包含PRL-3启动子。已发现在转移性结肠癌中PRL-3蛋白酪氨酸磷酸酶基因以高水平特异性表达(Saha等(2001)Science 294：1343)。最初鉴定属于转移性结肠癌文库上调节基因组，通过基因表达系列分析(SAGE)鉴定后，证实PRL-3基因仅在转移灶中而不在原发癌或癌变前腺瘤中升高。复制型腺病毒载体包含描述于WO 20004/009790的PRL-3转录调节序列。相关序列的例子是存在于PRL-3基因翻译起始密码子上游0.6kb和1kb序列(在WO 20004/009790中称为SEQ ID NO：1和SEQ ID NO：2)。

在另一方面，本发明提供了包含来源于可操作地连接腺病毒复制必需基因或转基因的CRG-L2基因的肝癌特异性TREs腺病毒载体。本文使用的“来源于CRG-L2基因的肝癌特异性TREs”或“CRG-L2TRE”是一种多核苷酸序列，优选是一种DNA序列，其选择性增加可操作地连接的多核苷酸序列在容许CRG-L2起作用的宿主细胞中的转录，例如细胞(优选哺乳动物细胞、更优选人细胞、还优选肝癌细胞)。肝细胞癌特异性TRE可包含一个或多个调节序列，如增强子、启动子、转录因子结合位点等，其可来源于相同的或不同的基因。在一个优选的方面，CRG-L2TRE可来源于CRG-L2基因翻译起始密码子上游0.8kb序列，或来源于包含于该0.8kb序列中的0.7kb序列(残基119-803)；或来源于该0.8kb序列的EcoRI至NcoI片段，其描述于序列号60/511,812美国临时申请，在此特别并入作为参考。

在另一方面，本发明提供了包含可操作地连接腺病毒复制必需基因或转基因的EBV-特异性转录调节元件(TRE)的腺病毒载体。在一方面，EBV特异性TRE来源于LMP1、LMP2A或LMP2B基因翻译起始密码子上游的序列，详述于美国临时申请序列号60/423,203，在此特别并入作为参考。该EBV-特异性TRE可包含一个或多个调节序列，如增强子、启动子、转录因子结合位点等，其可来源于相同的或不同的基因。

在又一方面，本发明提供了包含可操作地连接腺病毒复制必需基因或转基因的缺氧应答元件(“HRE”)腺病毒载体。HRE是一种包含转录复合物HIF-1结合位点或缺氧诱导因子-1的转录调节元件，其与包括血管内皮生长因子的几个基因的调节区相互作用，或与编码包括烯醇酶-1的糖分解酶类的几个基因的调节区相互作用。因此，在一个实施例中，腺病毒载体包含处于诸如HRE的细胞状态特异性TRE转录控制下的腺病毒基因，优选复制必需的腺病毒基因，详述于WO 00/15820，在此特别并入作为参考。

另一方面，本发明提供了包含可操作地连接腺病毒复制必需基因或转基因的“端粒酶启动子”或“TERT启动子”的腺病毒载体。本文使用的术语“端粒酶启动子”或“TERT启动子”指天然TERT启动子及其功能性片段、变体和衍生物。TERT启动子不必是全长或野生型启动子。本领域技术人员熟知如何由TERT启动子获得片段并测试它们所期望的选择性。本发明的TERT启动子片段具有肿瘤细胞选择性启动子活性，即驱动肿瘤选择性表达可操作地连接的编码序列。在一个实施例中，本发明的TERT启动子是哺乳动物TERT启动子。在另一个实施例中，哺乳动物TERT启动子是人TERT(hTERT)启动子。对于供本发明组合物和方法使用的示范性的TERT启动子，参见如WO 98/14593和WO 00/46355。

在又一方面，本发明提供了包含可操作地连接腺病毒复制必需基因或转基因的“E2F启动子”的腺病毒载体。本文使用的术语“E2F启动子”指天然E2F启动子及其功能性片段、变体和衍生物。E2F启动子不必是全长或野生型启动子。本领域技术人员熟知如何由E2F启动子获得片段并测试它们所期望的选择性。本发明的E2F启动子片段具有肿瘤细胞选择性启动子活性，即驱动肿瘤选择性表达可操作地连接的编码序列。本文使用的术语“肿瘤选择性启动子活性”指本发明的启动子片段的启动子活性在肿瘤细胞中高于在非肿瘤细胞类型中。E2F-应答启动子具有至少一个E2F结合位点。在一个实施例中，E2F-应答启动子是哺乳动物E2F启动子。在另一个实施例中，其是人E2F启动子。例如，E2F启动子可以是人E2F-1启动子。此外，人E2F-1启动子可以是例如具有SEQ ID NO：43所述序列的E2F-1启动子。本领域已知多个E2F启动子的例子(如Parr等Nature Medicine 1997：3(10)1145-1149，WO 02/067861，US20010053352和WO 98/13508)。E2F应答启动子通常具有共同的特征，例如邻近其E2F位点的Sp I和/或ATT7位点，该E2F位点常位于转录起始位点附近，还缺少可识别的TATA盒。E2F-应答启动子包括E2F启动子，例如E2F-1启动子、二氢叶酸还原酶(DHFR)启动子、DNA聚合酶A(DPA)启动子、c-myc启动子和B-myb启动子。E2F-1启动子含有四个在血清饥饿(serum-starved)细胞中作为转录阻遏元件的E2F位点。在一个实施例中，E2F-应答启动子具有至少两个E2F位点。在另一个实施例中，E2F启动子可操作地连接腺病毒E1a区。在又一个实施例中，E2F启动子可操作地连接腺病毒E1b区。在再一个实施例中，E2F启动子可操作地连接腺病毒E4区。

在本发明的一个实施例中，本发明的重组病毒载体在Rb-通道缺陷细胞中选择性复制并溶解该细胞。在一个实施例中，本发明的E2F启动子是哺乳动物E2F启动子。在另一个实施例中，哺乳动物E2F启动子是人E2F启动子，例如包含或基本上由SEQ ID NO：43组成的人E2F启动子。本发明的实施例包括包含E2F启动子的腺病毒载体，其中E2F启动子包含的核苷酸序列选自：(a)SEQ ID NO：43所示的核苷酸序列；(b)SEQ ID NO：43所示的核苷酸序列的片段，其中该片段具有肿瘤选择性启动子活性；(c)在其全长上与SEQ ID NO：43所示的核苷酸序列具有至少90、91、92、93、94、95、96、97、98、99％或更多％同一性的核苷酸序列，其中该核苷酸序列具有肿瘤选择性启动子活性；以及(d)在严谨条件下与SEQ ED NO：43所示的序列杂交的具有全长互补的核苷酸序列，其中该核苷酸序列具有肿瘤选择性启动子活性。在本发明的另一个实施例中，E2F启动子包含SEQ ID NO：43第7-270位核苷酸。在本发明的另一个实施例中，E2F启动子包含SEQ ID NO：43第7-270位核苷酸，其中SEQ ID NO：43第75位核苷酸是T而不是C。

在另一个实施例中，当比较并比对最大对应时，如使用以下序列比较算法或通过目视检查所测定的，根据本发明的E2F启动子与SEQ IDNO：43所示的核苷酸序列具有至少80、85、87、89、90、91、92、93、94、95、96、97、98、99％或更多的序列同一性。在一个实施例中，所给定的％序列同一性存在于至少约50个核苷酸长的序列的区中。在另一个实施例中，所给定的％序列同一性存在于至少约100个核苷酸长的序列的区中。在另一个实施例中，所给定的％序列同一性存在于至少约200个核苷酸长的序列的区中。在另一个实施例中，所给定的％序列同一性存在于全长序列中。

E2F-应答启动子不必是全长的或野生型启动子，但应具有至少3倍、至少5倍、至少10倍、至少20倍、至少30倍、至少50倍、至少100倍或甚至至少300倍的肿瘤选择性。可通过多种测定法测定肿瘤选择性，所述测定法使用了诸如WO 02/067861实施例4中使用的技术的已知技术，例如RT-PCR或在所选择的细胞类型中比较复制。

不受理论束缚，E2F-应答启动子(以下有时简称E2F启动子)的选择性据报道是基于Rb-通道缺陷肿瘤细胞中E2F启动子/反式作用子的脱阻遏。在休眠细胞中，E2F结合三元复合物中的肿瘤抑制蛋白pRB

蛋白尿激酶纤维蛋白溶酶原激活剂(uPA)及其细胞表面受体尿激酶纤维蛋白溶酶原激活剂受体(uPAR)表达于许多最常见的赘生物中，似乎是癌转移中重要的蛋白。这两种蛋白都涉及乳腺癌、结肠癌、前列腺癌、肝癌、肾癌、肺癌和卵巢癌。调节uPA和uPAR转录的序列元件已经被广泛地研究(Riccio等(1985)Nucleic Acids Res.13：2759-2771；Cannio等(1991)Nucleic Acids Res.19：2303-2308；也参见WO98/39464)。

可操作地连接必需Ad编码区的异源TRE(s)

对于早期基因的操作，Ad5E1A的转录起始位点在病毒基因组的第498位，E1A编码区段的ATG起始位点在病毒基因组的第560位。该区可用于插入异源TRE。图1描述了Ad5天然基因组结构，图2描述了天然Ad5转录单位。

通过使用聚合酶链式反应(PCR)可导入受限酶切位点，在此所使用的引物限于Ad5基因组，或可包含携带Ad5基因组DNA的质粒的一部分。例如，在使用pBR322时，引物可使用pBR322骨架中的EcoRI位点和Ad5nt 1339处的XbaI位点。PCR分两步进行，在该区中心的重叠引物处导入核苷酸序列改变，产生独特的限制酶切位点，可供在该位点插入异源TRE之用。

类似的策略亦可用于将异源TRE元件插入在可操作连接的E1B中。Ad5的E1B启动子由Sp1的单个高亲和力识别位点以及TATA盒组成。该区从Ad5nt 1636延伸到1701。通过在该区中插入细胞特异性异源TRE，可供E1B基因细胞特异性转录之用。通过使用调节E1A的细胞特异性应答元件修饰的左侧区，作为模板用于导入异源TRE以调节E1B，所得到的腺病毒载体会依赖于细胞特异性转录因子用于表达E1A和E1B。在一些实施例中，E1B的部分或全部19-kDa区缺失。

同样地，异源TRE可插入在E2基因上游使其细胞特异性表达。在Ad5中定位于约27050-27150的E2早期启动子由主要和次要转录起始位点，后者占E2转录物的约5％，2个非规范的TATA盒，两个E2F转录因子结合位点和ATF转录因子结合位点组成(E2启动子结构的详细论述见Swaminathan等，Curr.Topics in Micro，and Immunol.(1995)199(part3)：177-194)。

E2晚期启动子与相反链编码的基因的编码序列重叠，因此无法进行遗传操作。然而，E2早期启动子与相反链上编码33kD蛋白的序列仅重叠几个碱基对。值得注意的是SpeI限制酶切位点(Ad5第27082位)是上述33kD蛋白终止密码子的一部分，能方便地将主要E2早期转录起始位点和TATA-结合蛋白位点与从上游转录因子结合位点E2F和ATF分离。因此，在SpeI位点内插入具有SpeI末端的异源TRE会破坏Ad5的内源性E2早期启动子，且应容许E2转录物的细胞特异性表达。对于E4，可使用腺病毒基因组的右侧部分。对于Ad5，E4转录起始位点主要在约nt 35605，TATA盒在约nt 35631以及ORF I的第一AUG/CUG在约nt 35532。Virtanen等(1984)J.Virol.51：822-831。对于其它基因使用任何一种上述策略，异源TRE可被导入转录物起始位点上游。为了构建具有插入在E4区的异源TRE的全长腺病毒，可在W162细胞(Weinberg等(1983)Proc.Natl.Acad.Sci.80：5383-5386)中进行共转染和同源重组，其提供了E4蛋白以反向补偿这些蛋白合成中的缺陷。

“E3区”(与“E3”可交换使用)是本领域众所周知的术语，指编码E3基因产物的腺病毒基因组的区。在各种出版物中已描述了E3区，包括例如，Wold等(1995)Curr.Topics Microbiol.Immunol.199：237-274。E3区的“一部分”指小于完整的E3区，例如包括多核苷酸缺失以及编码一个或多个E3区多肽产物的多核苷酸。见图6、7和8。

在含有E3的腺病毒质粒例如BHGE3(Microbix Biosystems Inc.，Toronto)和不含有E3的腺病毒质粒之间进行同源重组可产生含有E3区的腺病毒构建体。

可选择地，可将包含E3区的腺病毒载体与腺病毒构建体或腺病毒质粒构建体一起导入细胞，例如293细胞，在此它们能经历同源重组以产生含有E3区的腺病毒。在该情况下，含有E3的腺病毒载体和腺病毒构建体或质粒构建体含有腺病毒的互补区，例如一种含有左侧区，而其它的则含有右侧区，具有足够的序列重叠以便进行同源重组。

可选择地，可使用其它常规方法构建本发明含有E3的腺病毒载体，包括标准重组法(如使用受限核酸酶和/或PCR)、化学合成或这些方法的组合。此外，使用标准的分子生物学技术可进行E3区一部分的缺失。

在某些实施例中，E3区中编码的腺病毒死亡蛋白(ADP)被保留在腺病毒载体中。该ADP基因受主要晚期启动子(MLP)控制，编码对于加速宿主细胞溶解起重要作用的蛋白(ADP)。Tollefson等(1996)J.Virol.70(4)：2296；Tollefson等(1992)J.Virol.66(6)：3633。因此，含有ADP基因的腺病毒载体可使腺病毒载体更有效，使更有效地治疗和/或更低的剂量需要成为可能。

因此，在一个实施例中，本发明提供了其中腺病毒基因处于第一TRE转录控制下以及编码ADP的多核苷酸序列处于第二TRE元件控制下的腺病毒载体，其中优选地腺病毒基因是复制必需的。编码ADP的DNA序列和ADP的氨基酸序列是公众可得到的。简言之，使用本领域已知技术例如PCR由Ad获得ADP编码序列。优选地，还获得Y前导区(其是一种用于晚期基因正确表达的重要序列)并连接ADP编码序列。然后，ADP编码序列(具有或不具有Y前导区)可导入腺病毒基因组中，例如在E3区中(在此ADP编码序列由MLP启动)。ADP编码序列还能插入在腺病毒基因组的其它位置，例如E4区。可选择地，ADP编码序列能可操作地连接不同类型的TRE，包括但并不仅限于其它病毒TRE。在一个实施例中，本发明的载体具有可操作地连接其天然TREs的ADP。

内部核糖体进入位点

为由一个病毒或非病毒载体表达两个或更多个蛋白，通常使用内部核糖体进入位点(IRES)序列来驱动第二、第三、第四个基因等的表达。本发明的腺病毒载体可包含一个或多个基因间IRES元件，其连接着两个或更多个编码序列的翻译。包含连接两个腺病毒编码区的IRES的腺病毒载体是稳定的，且与不含有IRES的载体相比可提供更好的特异性。包含基因间IRES的腺病毒载体而不是第二TRE则可以提供额外的载体空间用于包含额外的基因如治疗基因。包含IRES的腺病毒载体的例子描述于US 6,692,736，在此特别并入作为参考。在本发明一方面中，病毒载体在多顺反子转录物中包含至少一个IRES，其中多顺反子转录物的产生受异源、细胞型、组织型或细胞状态特异性TRE的调节。对于包含处于IRES控制下的第二腺病毒编码区的腺病毒载体，优选处于IRES翻译控制下的编码区的内源启动子缺失，以便内源启动子不干扰第二编码区转录。如果IRES含有起始密码子，优选第二编码区与IRES在读框内。如果IRES中存在诸如ATG的起始密码子，则优选除去第二编码序列的起始密码子，且IRES和第二编码区在读框内。或者，如果IRES不含有起始密码子或如果起始密码子从IRES上除去，则使用第二编码区的起始密码子。在一个实施例中，腺病毒载体包含腺病毒必需基因(处于异源TRE转录控制下的E1A和E1B基因)以及导入在E1A和E1B之间的IRES。因此，E1A和E1B处于共同的转录控制之下，由于IRES的存在获得了E1B编码区的翻译。在一个实施例中，E1A的内源性启动子缺失。在另一个实施例中，E1A的内源性增强子缺失，还在另外的实施例中，E1A的内源性启动子和增强子都缺失。在另一个实施例中，E1B的内源性启动子缺失。还在另外的实施例中，E1B的19-kDa区部分或全部缺失。

利用本领域已知以及本文之前所描述的方法和技术实现将IRES插入载体，包括但不限于限制性内切酶消化、连接和PCR。可通过化学合成或通过制备例如小RNA病毒IRES的cDNA副本，获得IRES的DNA副本。参见例如，Duke等(1995)J.Virol.66(3)：1602-9)对EMCVIRES的描述和Huez等(1998)，Mol.Cell.Biol.18(11)：6178-90)对VEGF IRES的描述。在使其位于多顺反子mRNA中5′-远侧编码区上游的位点，将内部翻译起始序列插入载体基因组。例如，在一个实施例中，其中腺病毒载体产生的双顺反子E1A-E1B mRNA处于异源TRE的控制下，E1B启动子缺失或失活，IRES序列置于E1A和E1B之间。在另一个实施例中，E1B的19-kDa区部分或全部缺失。心病毒和某些口蹄疫病毒的IRES序列在其3′末端含有AUG密码子，其既作为核糖体进入位点又作为翻译起始位点。因此，将这种类型的IRES导入载体以便替换其调节翻译的蛋白的翻译起始密码子。然而，在肠道/鼻病毒组的IRES中，IRES 3′末端的AUG仅用于核糖体进入，翻译是邻接的下游AUG密码子启动的。因此，如果肠道/鼻病毒IRES在载体中用于下游编码区的翻译调节，则下游基因的AUG(或其它翻译起始密码子)保留在载体构建体中。

在另一个实施例中，IRES可操作地连接到插入在并不紧接polyA信号上游的腺病毒CDS下游的转基因。例如，在前导区序列中，在最下游Ad CDS之后并不插入IRES转基因。例如，IRES转基因盒可操作地连接如下Ad CDSs之一：52/55K、pV、五邻体、pVI或六邻体。

多个编码序列能与IRESs相连接。在一个实施例中，Ad CDS通过第一IRES可操作地连接第一转基因，所述第一转基因通过第二IRES可操作地连接第二转基因。在一个实施例中，第一和第二转基因编码相同的或不同的蛋白。就相同的蛋白来说，有利之处在于转基因之一的编码序列可以是“再编码的”。换言之，使用不同的密码子编码相同的氨基酸。可在DNA水平上减少两个转基因之间的同源性数值，由此减少或消除两个转基因之间的同源重组。其它的实施例包括通过IRES可操作地连接的两个腺病毒CDSs。可伴随有腺病毒DNA序列的缺失。例如，位于相同前导区中且毗连的两个腺病毒CDSs可通过IRES可操作地连接，介于其间的Ad序列可部分或全部缺失，只要缺失不破坏病毒载体产生必需的其它序列或元件即可，尤其要注意互补链。所缺失的部分可以是1-5个核苷酸(nts)、6-15nts、16-25nts、26-35nts、36-40nts或大于40nts。在一个实施例中，第一转基因CDS通过第一IRES可操作地连接Ad CDS，第二IRES将第二转基因与所述Ad CDS连接。其它实施例包括多种Ad CDSs以及Ad CDSs和与IRES和/或自加工肽序列可操作地连接的转基因CDSs的组合。

当在载体中使用多个IRES序列时，优选两个IRES序列在DNA水平上具有最小同源性或不具同源性，以减少同源重组的频率。

自加工切割位点或序列

在本发明另一方面，“自加工切割位点”(如2A-样序列)被用来表达来自一个mRNA的两种多肽。“自加工切割位点”或“自加工切割序列”定义为一种DNA或氨基酸序列，其中在翻译后，发生包含自加工切割位点的多肽的快速分子内(顺式)切割，导致分离的成熟蛋白或多肽产物表达。这样的“自加工切割位点”也可称为翻译后或共翻译加工切割位点，在此例子是2A位点、序列或结构域。本文使用的“自加工肽”在此定义为编码自加工切割位点或序列的DNA序列的肽表达产物，其翻译后，介导包含自加工切割位点的蛋白或多肽快速分子内(顺式)切割以产生不连续的成熟蛋白或多肽产物。已报道2A位点、序列或结构域通过修饰核糖体活性以促进酯键水解，由此从多肽中以容许进行分离的下游翻译产物合成的方式释放翻译复合物，从而证实其翻译效应(Donnelly等J Gen Virol.2001年5月；82(Pt 5)：1013-25)。可选择地，还报道了2A位点、序列或结构域通过顺式切割其自身C-末端以产生初级切割产物，从而证实其“自体溶解”或“切割”(Furler；Palmenberg，Ann.Rev.Microbiol.44：603-623(1990))。

尽管该机制不是本发明的一部分，但是2A-样序列的活性可涉及密码子之间的核糖体跳跃(skipping)，这可以阻止肽键的形成(de Felipe等，Human Gene Therapy 11：1921-1931(2000)；Donnelly等，J.Gen.Virol.82：1013-1025(2001)；Donnelly等J Gen Virol.2001 May；82(Pt 5)：1027-41)；Szymczak等Nature Biotechnology 22：589-594和760(2004)，尽管已考虑了该结构域作用更类似于一种自溶酶(Ryan等，Virol.173：35-45(1989))。对克隆入表达载体并转染靶细胞的口蹄疫病毒(FMDV)2A编码区的研究显示FMDV 2A切割小麦胚裂解物和转基因烟草植物(Halpin等，US 5,846,767；1998和Halpin等，Plant J 17：453-459，1999)；Hs 683人神经胶质瘤细胞系(de Felipe等，Gene Therapy 6：198-208，1999)；以下简称“de Felipe II”)；兔网织红细胞裂解物和人HTK-143细胞(Ryan等，EMBO J.13：928-933(1994))；以及昆虫细胞(Roosien等，J.Gen.Virol.71：1703-1711，1990)中的人工报道分子多蛋白。对于IL-12，已显示FMDV 2A-介导的异源多蛋白切割(p40/p35异二聚体：Chaplin等，J.Interferon Cytokine Res.19：235-241，1999)。该参考文献证实了在转染的COS-7细胞中，FMDV 2A介导p40-2A-p35多蛋白切割为具有与IL-12有关活性的生物学功能亚基p40和p35。

FMDV 2A序列已单独或与不同的IRES序列组合掺入逆转录病毒载体中，以构建双顺反子、三顺反子和四顺反子载体。Furler等(Gene Ther.2001年6月；8(11)：864-73)通过使用编码α-突触核蛋白和EGFP或Cu/Zn超氧化物气化酶(SOD-1)和通过FMDV 2A序列连接的EGFP的重组腺病毒伴随病毒(AAV)载体证实了2A-介导的基因在动物中的表达效率。相对于相应的基于IRES的载体，在包括2A序列的载体中EGFP和α-突触核蛋白表达水平实质上更高，而SOD-1表达水平则相当或稍高。Furler还证实了在大鼠黑质注射了含有2A的AAV载体后，2A序列在体内产生双顺反子基因表达。Syzmczak等(Nature Biotechnology22：589-594&760(2004))描述了具有用三个2A序列连接四个编码区的逆转录病毒载体。

对于本发明，来源于小RNA病毒，包括但不限于肠道病毒、鼻病毒、心病毒、口蹄病毒或口蹄疫病毒(FMDV)的病毒序列例举说明了编码自加工切割位点的DNA序列。在一个优选的实施例中，自加工切割位点编码序列来源于FMDV。自加工切割位点包括但不限于2A和2A-样位点、序列或域(Donnelly等，J.Gen.Virol.82：1027-1041(2001))。

FMDV 2A是一种多蛋白区，其在FMDV基因组中起指导在其自身C-末端进行单一切割的作用，从而顺式起作用。FMDV 2A结构域通常报道有约19个氨基酸长度((LLNFDLLKLAGDVESNPGP(SEQ IDNO：1)；TLNFDLLKLAGD VESNPGP(SEQ ID NO：2)；Ryan等，J.Gen.Virol.72：2727-2732(1991))，然而少至14个氨基酸残基的寡肽((LLKLAGDVESNPGP(SEQ ID NO：3))也能显示以类似于其在天然FMDV多蛋白加工中角色的方式介导在2A C-末端的切割。已研究了2A序列变体介导多蛋白有效加工的能力(Donnelly等，J.Gen.Virol.82：1027-1041(2001))。2A序列同源物和变体也包括在本发明的范围内，包括但不限于如SEQ ID NOs：1-32所示的序列。

在一个实施例中，包括在根据本发明的载体中的FMDV 2A序列编码包含如SEQ ID NO：1所示序列的氨基酸残基。可选地，根据本发明的载体可编码如Donnelly等，J.Gen.Virol.82：1027-1041(2001)中所讨论的其它2A-样区的氨基酸残基，其包括但不限于来自小RNA病毒、昆虫病毒、C型轮状病毒、锥虫重复序列或细菌、热海栖热袍菌(Thermatogamaritima)的2A-样结构域。

本发明涉及编码诸如2A或2A-样多肽的自加工切割位点的核酸序列变体，以及相对于亲本(天然)核苷酸，一个或多个氨基酸具有不同密码子的核酸编码序列的应用。这样的变体是本发明所特别涉及并包含的。自加工切割肽和多肽的序列变体也包括在本发明的范围内。

依照本发明，还包含的是编码自加工切割多肽和自身与天然序列具有80、85、88、89、90、91、92、93、94、95、96、97、98、99％或更多的序列同一性的多肽的序列变体。

在本发明的一个实施例中，自加工切割序列(如2A或2A-样序列)可操作地连接腺病毒蛋白编码区和转基因。腺病毒蛋白CDS可位于自加工切割位点上游，转基因位于下游。可选择地，转基因CDS可位于自加工切割位点上游，而腺病毒蛋白CDS位于下游。

多个CDSs可连接有自加工切割位点。在一个实施例中，Ad CDS通过自加工切割位点可操作地连接第一转基因，所述第一转基因通过自加工切割位点可操作地连接第二转基因。在一个实施例中，第一和第二转基因编码相同或不同的蛋白。就相同的蛋白来说，有利之处在于转基因之一的编码序列可是“再编码的”。换言之，使用不同的密码子编码相同的氨基酸。可在DNA水平上减少两个转基因之间的同源性数值，由此减少或消除两个转基因之间的同源重组。其它的实施例包括通过自加工切割位点可操作地连接的两个Ad CDSs。可伴随有腺病毒序列的缺失。例如，位于相同前导区中且毗连的两个腺病毒CDSs可通过自加工切割位点可操作地连接，介于其间的Ad序列可部分或全部缺失，只要缺失不破坏病毒载体产生必需的其它序列或元件即可，尤其要注意互补链。所缺失的部分可以是1-5个核苷酸(nts)、6-15nts、16-25nts、26-35nts、36-40nts或大于40nts。

在一个实施例中，通过第一自加工切割位点，第一转基因CDS可操作地连接Ad CDS，通过第二自加工切割位点，Ad CDS可操作地连接第二转基因。其它实施例包括多种Ad CDSs以及Ad CDSs和与IRES和/或自加工肽序列可操作地连接的转基因CDSs的组合。

当在载体中使用多于一个的自加工肽序列时，优选自加工肽序列在DNA水平上具有最小同源性或不具有同源性，以减少同源重组频率。例如自加工肽序列可来源于不同来源，其中多个自加工肽序列的编码序列具有最小同源性或不具有同源性。在另一个实施例中，自加工肽序列的编码序列被再编码。换言之，不同的密码子被用于编码自加工肽序列的相同氨基酸。这样做可减少多于一个自加工肽编码序列之间的同源性数值，因此减少了或消除了两个转基因之间的同源重组。

当自加工肽序列的编码序列插入具有上游和下游CDS的读框中时，自加工肽序列可操作地连接CDS。

自加工肽序列的移除

人们所关心的是与使用自加工肽有关的，例如2A或2A-样序列，所述2A-样序列是含有源自自加工肽的氨基酸的表达多肽的C末端，即2A-衍生的氨基酸残基。对于宿主这些氨基酸残基是“外源的”，当重组蛋白体内表达或体外或离体表达后体内转移时，可引起免疫应答。此外，如果不被切除，自加工肽衍生的氨基酸残基可干扰蛋白功能和/或改变蛋白构象，导致达不到最佳表达水平和/或重组蛋白生物活性减少。换言之，取决于应用，其有利之处在于所得到的蛋白不含有所有2A-衍生的氨基酸残基。

本发明包括改造的载体，使得在第一蛋白或多肽编码序列(第一或5′ORF)和自加工切割位点之间提供了额外的蛋白水解切割位点，作为一种手段用于移除衍生自存在于表达的蛋白产物中的氨基酸残基的自加工切割位点。

额外的蛋白水解切割位点的例子是具有共有序列RXK(R)R(SEQ IDNO：33)的弗林蛋白酶切割位点，其能为内源枯草杆菌蛋白酶样蛋白酶所切割，例如弗林蛋白酶和其它丝氨酸蛋白酶。如USSN 10/831304的实施例6所示，发明人已阐明通过在第一多肽和自加工2A序列之间导入弗林蛋白酶切割位点RAKR(SEQ ID NO：33)，可有效地除去在第一表达蛋白C末端的自加工2A氨基酸残基。此外，与使用仅含有2A序列的质粒相比，使用含有2A序列以及与2A序列邻接的弗林蛋白酶切割位点的质粒产生更高水平蛋白表达。这种改善提供了更多的优点，即当2A氨基酸残基从蛋白的C-末端除去时，可使用更长的2A-或2A样序列或其它自加工序列，如USSN 10/831304所描述，在此特别并入作为参考。

如在此详述的，2A肽序列提供了在翻译加工过程中利于免疫球蛋白两条链或其它蛋白产生的“切割”位点。在一个示范性的实施例中，诸如免疫球蛋白重链的第一蛋白的C-末端含有来源于2A序列自身的约13个氨基酸残基。残留氨基酸的数量取决于所使用的2A序列。如上述及实施例所示，当弗林蛋白酶切割位点序列(如RAKR)插入在第一蛋白和2A序列之间时，2A残基被从第一蛋白的C-末端除去。然而，质谱数据显示RAKR-2A构建体表达的第一蛋白的C-末端含有两个来源于弗林蛋白酶切割位点RAKR的额外的氨基酸残基RA。

在一个实施例中，本发明提供了一种用于除去这些残留氨基酸的方法以及用于表达其的组合物。已设计了许多新的构建体，其提供用于从蛋白的C-末端除去这些额外的氨基酸。弗林蛋白酶切割发生在切割位点的C-末端，该切割位点具有共有序列RXR(K)R，其中X是任何氨基酸。在一方面，本发明提供了一种用于从蛋白的C-末端除去新暴露的碱性氨基酸残基R或K的方法，利用了称为羧肽酶(CPs)的一组酶，其包括但不限于羧肽酶D、E和H(CPD、CPE、CPH)。由于CPs能在蛋白C-末端除去碱性氨基酸残基，所有来源于只含有碱性氨基酸R或K例如RKKR、RKRR，RRRR等的弗林蛋白酶切割位点的氨基酸残基能通过CP切除。已构建了一系列含有2A序列和在C末端具有碱性氨基酸残基的弗林蛋白酶切割位点的免疫球蛋白表达构建体以评估切割和残基切除效率。示范性的构建体设计如下：H链-弗林蛋白酶(如RKKR、RKRR、RRKR或RRRR)-2A-L链或者L链-弗林蛋白酶(如RKKR、RKRR、RRKR或RRRR)-2A-H链。

本领域技术人员应当清楚，免疫球蛋白重(H)链的C末端存在碱性氨基酸残基(K)(使其适合于羧肽酶切割)，而免疫球蛋白轻(L)链末端则是非碱性氨基酸C。在本发明一个优选的实施例中，提供了包含弗林蛋白酶位点和2A序列的抗体表达构建体，其中免疫球蛋白L链位于免疫球蛋白H链的5′，以便在翻译后使用羧肽酶切除额外的弗林蛋白酶氨基酸残基。

产生具有完全人特性的治疗性蛋白、多肽、其片段或类似物通常是有利的。这些试剂避免了源自不同物种的蛋白、多肽、其片段或类似物所诱导的不期望的免疫应答。为了引导可能的宿主对来源于自加工肽的氨基酸残基的免疫应答，可将蛋白水解割位点编码序列插入在(使用本领域已知的标准方法)第一蛋白编码序列和自加工肽编码序列之间，以便从表达的蛋白或多肽的上除去自加工肽序列。

可被重组DNA技术表达任何一种本领域已知的额外的蛋白水解切割位点可被用于实施本专利。示范性的能插入在多肽或蛋白编码序列和自加工切割序列之间的额外的蛋白水解切割位点包括但不限于：

a)弗林蛋白酶共有序列或位点：RXK(R)R(SEQ ID.NO：33)；

b)因子Xa切割序列或位点：IE(D)GR(SEQ ID NO：34)；

c)信号肽酶I切割序列或位点：如LAGFATVAQA(SEQ ID.NO：35)；和

d)凝血酶切割序列或位点：LVPRGS(SEQ ID NO：36)；

e)腺病毒共有蛋白酶序列或位点(M，L，I)XGG/X(SEQ ID NO：37)和(M，L，I)XGX/G(SEQ ID NO：38)，参见Webster等J Gen Virol 70：3215-3223(1989)；Weber，Curr Top Microbiol Immunol 1991：227-235(1995)和Balakirev等J of Virol 76：6323-6331(2002)。

就腺病毒蛋白酶序列或位点来说，本发明并不旨在限制于上述所提供的共有序列。本发明预计使用任何一种的腺病毒蛋白酶。在一个实施例中，腺病毒蛋白酶来自与腺病毒载体基因组相同的腺病毒血清型。

转基因

本发明的载体可包括一种或多种转基因。这样，不同的遗传能力可导入靶细胞中。在一个实施例中，转基因编码可选择的标记。在另一个实施例中，转基因编码细胞毒蛋白。这些编码细胞毒蛋白的载体可用于消除研究环境中的某些细胞或实现治疗效果。例如，在某些情况下，期望通过增加细胞毒性以增强疗效。可通过结合细胞特异性复制的细胞毒素活性和一种或多种代谢酶的表达而得以实现，所述代谢酶例如HSV-tk、硝基还原酶、细胞色素P450或使细胞能代谢5-氟胞嘧啶(5-FC)为化学治疗剂5-氟尿嘧啶(5-FU)的胞嘧啶脱氨酶(CD)、羧酸酯酶(CA)、脱氧胞苷激酶(dCK)、嘌呤核苷磷酸化酶(PNP)、羧肽酶G2(CPG2；Niculescu-Duvaz等J Med Chem.2004年5月6日；47(10)：2651-2658)、胸苷磷酸化酶(TP)、胸苷激酶(TK)或黄嘌呤鸟嘌呤磷酸核糖转移酶(XGPRT)。这种类型的转基因还可用于赋予旁观者效应。

可导入本发明载体的额外的转基因包括能启动细胞凋亡的因子，具有作用于编码诸如结构蛋白、转录因子、聚合酶等的细胞或病原体增殖必需蛋白的mRNAs能力的反义分子或核酶，病原体在细胞内增殖时的病毒或其它病原体蛋白，细胞毒素蛋白，如白喉毒素、蓖麻毒素、相思豆毒素等的链，编码改造的核酸酶(如RNase A)或蛋白酶(如胰蛋白酶、木瓜蛋白酶、蛋白酶K、羧肽酶等)胞质变体的基因，诸如MCP3α或MIP-1的趋化因子，来源于病毒、细菌或哺乳动物细胞的生孔蛋白，融合基因，化学疗法敏感基因和放射敏感基因。其它感兴趣的基因包括细胞因子、抗原、跨膜蛋白等，例如IL-1、IL-2、IL-4、IL-5、IL-6、IL-10、IL-12、IL-18或flt3，GM-CSF，G-CSF，M-CSF，IFN-α、-β、-γ，TNF-α、-β，TGF-α、-β，NGF，MDA-7(黑素瘤分化相关基因-7，mda-7/白介素-24)等。其它的例子包括，诸如Fas、Bax、胱天蛋白酶(Caspase)、TRAIL、Fas配体、一氧化氮合酶(NOS)等的前凋亡基因；能引起细胞融合或利于细胞融合的融合基因，例如V22、VSV等；诸如p53、RB、p16、p17、W9等的肿瘤抑制基因；与细胞周期有关的基因以及编码诸如的内皮他丁(endostatin)、血管他丁(angiostatin)等的抗血管生成蛋白的基因。

其它可能用于特定的遗传修饰包括T细胞，例如肿瘤浸润淋巴细胞(TILs)，在此TILs可被修饰以增加扩张、增强细胞毒性、减少对增殖抑制剂的响应、增加淋巴因子表达等。还希望通过提供特定的表面膜蛋白如B7、SV40T抗原突变体等的表达增强靶细胞易损性。

尽管任何适当的基因或编码序列都可用于本发明实施，但是某些基因或其片段是特别适用的。例如，编码在本发明实施中有用的免疫原性多肽、毒素、免疫毒素和细胞因子的编码区。这些编码区包括上文中的那些以及包括编码如下的额外的编码区：刺激与诸如B7、CD28、I类MHC、II类MHC、TAPs的免疫细胞相互作用的蛋白、诸如来自MART-I的免疫原性序列的肿瘤相关抗原、gp100(pmel-17)、酪氨酸酶、酪氨酸酶相关蛋白1、酪氨酸酶相关蛋白2、促黑素细胞激素受体、MAGE1、MAGE2、MAGE3、MAGE12、BAGE、GAGE、NY-ESO-1、-连环蛋白、MUM-1、CDK-4、胱天蛋白酶8、KIA 0205、HLA-A2R1701、α-胎蛋白、端粒酶催化蛋白、G-250、MUC-1、癌胚蛋白、p53、Her2/neu、磷酸丙糖异构酶、CDC-27、LDLR-FUT、端粒酶逆转录酶、PSMA、阻断抑制信号(CTLA4阻断)的抗体的cDNAs、趋化因子(MIP1、MIP3、CCR7配体和网硬蛋白)、抗血管发生基因包括但不限于编码METH-1、METH-2、TrpRS片段基因、多育曲菌素相关蛋白、催乳素片段、PEDF、vasostatin、胞外基质蛋白和生长因子/细胞因子抑制剂的不同片段、包括但不限于血管他丁、内皮他丁、kininostatin、纤维蛋白素原-E片段、凝血酶敏感素、tumstatin、canstatin、网状内皮系统刺激素的胞外基质蛋白的不同片段、生长因子/细胞因子抑制剂包括但不限于VEGF/VEGFR拮抗剂、sFlt-1、sFlk、sNRP1、鼠Flt3配体(mFLT3L)、血管生成素/tie拮抗剂、sTie-2、趋化因子(IP-10、PF-4、Gro-β、IFN-γ(Mig)、IFN、FGF/FGFR拮抗剂(sFGFR)、肝配蛋白/Eph拮抗剂(sEphB4和sephrinB2)、PDGF、TGF和IGF-1。在本发明实施中适用的基因可编码酶类(例如脲酶、肾素、凝血酶、金属蛋白酶、一氧化氮合酶、超氧化物歧化酶、过氧化氢酶和其它本领域技术人员已知的酶类)、酶抑制剂(例如α1-抗胰蛋白酶、抗凝血酶III、细胞或病毒蛋白酶抑制剂、纤溶酶原激活物抑制剂-1、金属蛋白酶组织抑制剂等)、囊性纤维化跨膜通道调节因子(CFTR)蛋白、胰岛素、营养不良素或I类或II类主要组织相容性复合物(MHC)抗原。也有用的是编码能调节/调控相应基因表达的多肽，能抑制细菌、寄生虫或病毒感染或其发育的多肽(例如抗原性多肽、抗原性表位和通过竞争抑制天然蛋白作用的反式显性蛋白变体)，细胞凋亡诱导物或抑制剂(例如Bax、Bcl2、BclX和其它本领域技术人员已知的)，细胞生长抑制剂(如p21、p16、Rb等)，载脂蛋白(如ApoAI、ApoAIV、ApoE等)，氧自由基清除剂，具有抗肿瘤作用的多肽，抗体，毒素，免疫毒素，标记物(如β-半乳糖苷酶、荧光素酶等)的基因，或任何其它为本领域所公认用于治疗或预防临床症状的感兴趣的基因。更多的转基因包括编码抑制细胞分裂或信号转导的多肽，肿瘤抑制蛋白(例如p53、Rb、p73)，激活宿主免疫系统的多肽，肿瘤相关抗原(如MUC-1，BRCA-1，诸如E6、E7、L1、L2等的HPV早期或晚期抗原)，任选地与细胞因子结合。

已显示TRAIL在多种转化细胞系中诱导细胞凋亡(Jeremias I等，EurJ Immunol 1998，28：143-152和Walczak H等，Nat Med 1999，5：157-163)。TRAIL的生理学作用似乎涉及先天性和获得性免疫应答(病毒感然和转化细胞的NK和T-细胞调节)。尽管TRAIL表达分布广泛，但是正常的细胞似乎对TRAIL-诱导的细胞凋亡具有抗性，据说是由于胞内蛋白(bcl-2、IAPs、FLIP等)表达之故，其减少了凋亡信号应答。

尽管目前准确的TRAIL抗肿瘤特异性分子机制尚未明了，但是选择TRIAL作为目的转基因，理由在于文献中业已描述的TRAIL的诸多特性，认为经腺病毒TRAIL的晚期表达会增强细胞致死。已描述了E1A能增强通过TRAIL的致死(E1A和TRAIL：Routes等，J Immunol.2000年10月15日；165(8)：4522-7)；报道了E1B 19K和55K蛋白减小TRAIL的作用(E1B 19K和TRAIL：Routes等，J Immunol.2000年10月15日；165(8)：4522-7和抗凋亡活性：Tollefson等，J Virol.2001 Oct；75(19)：8875-87)；E3：10.4K和14.5K(RID)通过在溶酶体中诱导其降解除去细胞表面的FAS和TRAIL受体(RID、FAS和TRAIL：Tollefson等，Nature.1998年4月16日；392(6677)：726-30；Shisler等，J Virol.1997年11月；71(11)：8299-306；Lichtenstein等，J Virol.2002年11月；76(22)：11329-42；Tollefson等，J Virol.2001；E3：14.7K抑制了通过TNF、Fas和TRAIL的细胞凋亡，并结合胱天蛋白酶8(E3 14.7K和TRAIL：Chen等，J Biol.Chem.1998年3月6日；273(10)：5815-20和Tollefson等，J Virol.2001)以及E3：6.7K阻止了通过TRAIL的细胞凋亡，并保持ER Ca体内平衡(E36.7K和TRAIL/ER Ca2++动态平衡：Benedict等，J Biol.Chem.2001年2月2日；276(5)：3270-8和腺病毒的E3-6.7K蛋白/内质网中定位：Wilson-Rawls等，Virology.1993年7月；195(1)：6-15)。

本发明进一步包含具有协同作用、补充作用和/或无重叠毒性的两种或多种转基因的组合以及作用的方法。总之，本发明提供了在病毒载体基因组特定区域中插入转基因编码区的方法。该方法利用已知的病毒转录元件和表达Ad基因的机制，因为无需额外的启动子且调节信号包含较小尺寸的DNA片段，减小了插入在Ad基因组中用于转基因表达的DNA序列的尺寸，提供了转基因时序调节(如感染早期对晚期；感染早期对中间期)的灵活性，还提供了调节转基因表达量的技术。例如，通过将转基因插入在通常以高水平表达的转录物中和/或可操作地连接高效剪接受体位点和转基因编码区，可表达更高数量的转基因。表达水平还受调节信号与其共有序列接近程度的影响；可进行改变以适应所需表达。

在设计本发明的腺病毒载体中，要考虑到转基因的生物活性，如在某些情况下，将转基因插入在载体中使得该转基因仅在感染晚期表达或在主要在感染晚期表达(在病毒DNA复制后)是有利的。例如，如本文所进一步描述的，转基因可插入在L3中。对于某些转基因，优选在病毒生活周期早期表达转基因。在这样的情况下，转基因可插入在任一早期区(例如E3)或L1区上游。

治疗方法

将有效量的本发明的载体和药学上可接受的赋形剂作为组合物给予哺乳动物(如人)，所述赋形剂可包括以下一种或多种：盐水溶液、适合的缓冲液、防腐剂、稳定剂等。本发明的载体可与诸如止吐剂的合适药剂一起给予。有效量是一种足以产生有益或期望结果包括临床疗效的量。有效量可在一次或多次给药或剂量中给予。对本发明来说，载体的有效量是一种足以减轻、改善、稳定、逆转、减缓或延迟疾病状态进展，或缓解疾病的一种或多种症状的量。所要给予的量应取决于个体情况、疾病程度、给药途径、给药剂量以及期望的结果。

一般通过位点特异性注射或静脉注射实现本发明载体的转移。载体的位点特异性注射可包括，例如注射入肿瘤，以及腹膜内、胸膜内、鞘内、动脉内、皮下注射，皮内注射，肌内注射或局部施用。这些方法提供能容易地供仅使用载体或联合使用载体和化学治疗剂的治疗之用。本发明还涉及使用载体离体感染受试者细胞。例如，分离自哺乳动物的细胞。所分离的细胞可含有肿瘤细胞和非肿瘤细胞的混合物。用复制型病毒感染细胞，病毒在肿瘤细胞中特异性复制。因此，消除了肿瘤细胞，视所需保留的非肿瘤细胞可返回给予同一哺乳动物，或视所需给予不同的哺乳动物。

如果用作为包装的腺病毒，腺病毒载体可在适当的生理学上可接受的载体中以约10⁴至约10¹⁴的剂量给予。如果作为多核苷酸构建体(即不包装为病毒)给予，可给予约0.01g至约1000g的腺病毒载体。所要给予的精确剂量取决于多种因素，包括患者年龄、体重和性别，以及被治疗的肿瘤大小和严重程度。取决于预期用途和宿主潜在的免疫应答，腺病毒载体可一次或多次给予，还可多次、同时注射。如果不期望免疫应答，可通过使用多种免疫抑制剂或使用诸如从血液中除去腺病毒抗体的免疫吸附操作(如免疫血浆分离置换)的技术减少免疫应答，以便容许重复给药，而无强的免疫应答。如果包装为诸如HSV的不同病毒形式，所给予的量是基于与特定病毒相关的标准知识(其易于获得自，例如出版文献)且能凭经验确定。

在一个实施例中，宿主生物体是人类患者。对于人类患者，如果治疗编码区包括在载体中，则治疗编码区可以是人源的，尽管在人中可以使用具有高同源性和在生物学上相同或等价的功能的相关接近物种的基因，但前提在于所述基因在受体中不产生不利的免疫反应。核酸序列或治疗基因的治疗有效量是一种在剂量上且对于达到期望结果所需的一段时间有效的量。该量可随不同的因素而改变，包括但不限于受试者性别、年龄、体重等。

本发明的实施例包括给予本发明的癌特异性载体和另一种抗肿瘤治疗组合的方法，所述抗肿瘤治疗可包括放射、给予具有瘤形成个体抗肿瘤或化学治疗剂等，如美国申请20030068307所述。癌特异性载体和化学治疗剂可同时给予或连续给予，对于连续给药而言具有不同的时间间隔。在某些实施例中，有效量的载体和有效量的至少一种抗肿瘤剂或化学治疗剂与适合的赋形剂和/或缓冲溶液组合，并通过任一在此所列或本领域已知的方法，出于相同的解决方案同时给予。当化学治疗剂并不危及载体自身生存力和/或活性时，其是可以应用的。

在给予多于一种化学治疗剂时，可在相同的组合物中一起给予；或以任何顺序连续给予；或在不同的组合物中同时给予。如果药剂连续给予，则给药可进一步包含时间延迟。连续给药可以任何顺序，并相应地包括首先给予有效量的载体，接着给予有效量的化学治疗剂。给予癌特异性载体和化学治疗剂的间隔可在至少(或者，可选择地少于)几分钟、几小时或几天之内。连续给药还包括给予选择的抗肿瘤剂，之后给予载体。给药间隔可在至少(或者，可选择地少于)几分钟、几小时或几天之内。

上述给药方法还可包括癌特异性载体和化学治疗剂的重复剂量或疗程，尤其取决于个体响应和个体疾病的特性。在第一疗程后(即一天内)马上采用重复剂量，或在间隔几天、几周或几个月后采用，以达到和/或保持对肿瘤生长的抑制。根据上述方法，特定的疗程例如联合癌特异性载体和化学疗法可随后接有放射和癌特异性载体的联合疗程。

抗肿瘤(化学治疗)剂包括来自于每种主要类型化学疗法的那些，包括但不限于：烷化剂、生物碱、抗代谢物、抗肿瘤抗生素、亚硝脲、激素激动剂/拮抗剂和类似物、免疫调节剂、光敏剂、酶等。在某些实施例中，抗瘤剂是生物碱、抗代谢物、抗生素或烷化剂。在某些实施例中，抗肿瘤剂包括例如塞替派、干扰素α-2a和M-VAC组合(甲氨喋呤-长春碱、阿霉素、环磷酰胺)。优选的抗肿瘤剂包括例如5-氟尿嘧啶、顺铂、5-氮杂胞苷和2，2-二氟脱氧胞嘧啶核苷。特别优选的实施例包括，但不限于5-氟尿嘧啶、2，2-二氟脱氧胞嘧啶核苷、阿霉素、miroxantrone、丝裂霉素、氮烯咪胺、卡氮芥、长春碱、罗莫司丁、三苯氧胺、紫杉萜、紫杉醇或顺铂。化学治疗剂的具体选择取决于尤其是要被治疗的疾病的特性。这些特性包括但不限于肿瘤位置、患病期以及如果有的话个体对前述治疗的响应。

除单种抗肿瘤剂与特定的癌特异性载体联合使用之外，本发明还包括超过一种的药剂与癌特异性载体联合使用。当用于治疗瘤形成时，这些抗肿瘤剂的组合通常称为联合化疗，并且取决于个体癌症的特性，常作为还包括外科手术和或放射的联合物理疗法的一部分。预计本发明的联合癌特异性载体/化学疗法还可用作为联合物理疗法程序的一部分。

本领域众所周知多种用于给予抗肿瘤剂的转移方法，包括口服和肠胃外方法。口服给予大量抗肿瘤剂具有诸多缺点，包括低生物利用度、刺激消化道以及需要用药者记录复杂的药物组合。大多数的肠胃外抗肿瘤剂给药是经静脉内的，因为肌内和皮下注射通常导致对组织的刺激或损害。肠胃外注射的区域变化包括动脉内、膀胱内、肿瘤内、鞘内、胸膜内、腹膜内和腔内注射。

化学治疗剂的转移方法包括静脉内、肠胃外和腹膜内方法以及口服给药。静脉内方法还包括通过末端静脉转移以及包括更多的部位特异性转移，例如静脉滴注入门静脉中。其它肠胃外转移方法包括直接注射抗肿瘤剂溶液，例如皮下、腔内或肿瘤内注射。

可利用本领域已知的任何一种技术来评估特定治疗方法的有效性，包括诸如成像技术，血清肿瘤标记物分析，活组织检查，肿瘤相关症状的存在、不存在或改善的诊断方法。应当理解的是所给出的治疗方法可适当改变以获得最大疗效。

在本发明的另一方面中，提供了一种包含本发明的重组病毒载体和/或颗粒以及药学上可接受的载体的药物组合物。这样的在药学上可接受的载体中可包含有效量的本发明的癌特异性载体和/或病毒颗粒的组合物适合于以单位剂型、无菌注射用溶液或口服液剂或混悬液、无菌的非注射用溶液或口服液剂或混悬液、水包油或油包水乳状液等局部或全身给予个体。本领域熟知用于肠胃外和非肠胃外药物转移的剂型。组合物还包括冻干和/或重建形式的本发明的癌特异性载体或颗粒。可接受的药用载体是，例如盐水溶液、硫酸鱼精蛋白(Elkins-Sinn，Inc.，Cherry Hill，N.J.)、水、含水缓冲液例如磷酸盐缓冲液和Tris缓冲液、或聚凝胺(Polybrene)(Sigma Chemical，St.Louis MO)以及磷酸盐缓冲生理盐水和蔗糖。根据包含在此的教导，认为选择合适的药用载体对于本领域技术人员是显而易见的。这些溶液是无菌的，除所需的癌特异性载体外通常不含颗粒物质。所述组合物可含有接近生理条件所必需的药学上可接受的辅助物质，例如pH调节和缓冲剂、毒性调节剂等，例如，醋酸钠、氯化钠、氯化钾、氯化钙、乳酸钠等。可包括增强细胞癌特异性载体摄取的赋形剂。

提出以下实施例，以便提供给本领域技术人员如何获得和使用本发明的完整内容和描述，但并不旨在限制发明人对其发明所认定的范围，也不旨在表示以下试验涵盖全部或只有这些试验得以进行。就所使用的数值(如数量、温度等)来说，已努力保证了其的精确性，但某些试验误差和偏差应予说明。除非另有说明，份数是重量份，分子量是平均分子量，温度是摄氏度以及压力是大气压或接近大气压。

所有在该说明书中引用的出版物和专利申请在此并入作为参考，相当于每篇出版物或专利申请都特别且单独地被指示并入作为参考。

依照本发明人所建立或建议的以包含用于本发明实施的优选方法的特定实施例，本发明业已得到描述。本领域技术人员应当理解，考虑到现有公开内容，可对示范性的特定实施例进行众多的修饰和改变而不背离本发明的预定范围。例如，鉴于密码子冗余，可对下划线的DNA序列进行改变而不影响蛋白序列。此外，鉴于考虑到生物学功能等价性，可对蛋白结构进行改变，在性质或数量上不影响生物作用。所有这样的修饰都意在包括于优选实施例的范围中。

实验例

应当理解的是本发明的方法和组合物可以多种实施例的形式体现，但仅有少数在此披露。本领域技术人员应当明白其它实施例存在且并不背离本发明的精神。因此，所描述的实施例仅是示范性的，不应视为限制。

提供以下实施例作为例证而非限制。在以下实施例中，分支点序列加剪接受体序列是：TACTTAT GACTCGTACTATTGTTATTCATCCAG↑G(SEQ ID NO：39)。下划线的序列是分支点序列，箭头表示依照剪接规则的剪接位点位置。因为该规则决定了共有序列并不是不变的，故其它遵守规则的类似序列也可使用。可选择地，可使用存在于另一种Ad血清型中的分支点加剪接受体位点。以下实施例涉及来源于人Ad5血清型的示范性的腺病毒载体。由其它腺病毒可制备类似的构建体。

实验例1：构建Ad载体并增殖编码转基因的Ad载体病毒粒子

以下实施例描述了在载体中插入至少一个转基因，所述载体含有腺病毒载体基因组一部分或完整的腺病毒载体基因组以及所插入的转基因。就编码完整的腺病毒载体基因组以及所插入的转基因的载体来说，将载体转染入腺病毒生产细胞系，并使用标准技术增殖病毒。在转染前，可用限制性内切酶消化载体，在病毒载体基因组内其并不切割，但切割载体(如质粒)骨架。

可选择地，转基因插入在含有部分病毒基因组的载体。在该情况下，含有部分病毒基因组的载体的一部分被克隆入含有病毒载体基因组剩余部分的载体中。因此构建了编码完整的病毒载体的载体。接着，将完整的病毒载体基因组转染进入生产细胞系中，病毒被增殖。在另一种方法中，将含有转基因和病毒基因组一部分的载体与病毒载体基因组的适当片段一起转染进入生产细胞系中，由于同源重组，会形成完整的病毒载体基因组，其将在生产细胞系中复制并增殖。

以下参考文献提供了病毒载体构建和病毒增殖的更多细节：Ghosh-Choudhury等Gene.1986；50(1-3)：161-71；Toietta等Mol Ther.2002年2月；5(2)：204-10，在此并入作为参考。该实施例描述了在Ad的L2区中不同位置处插入转基因。

实验例2：克隆带有修饰的Ad载体并用于克隆在L2区中的进一步修饰

对于使用细菌系统的重组，有利之处在于具有在将被改变的区中也含有至少一个独特限制酶切位点的全长Ad基因组质粒(具有任意特定修饰的)。在以下一些实施例中，靶区是L2区。然而，并不存在独特位点。因此，通过以下方法构建具有这些特征的质粒。将相应于野生型Ad的碱基15672-21562的Ad的BamHI至AscI区插入克隆质粒pNEB193(New England Biolabs)中，并将该质粒称为CP 1563。进行定向诱变将独特的SwaI位点掺入位置16530(相应于Ad野生型的碱基)中，并将该质粒称为CP 1564。将BamHI至PmeI片段插入在克隆质粒pMCS5中，制备含有Ad5序列13259-21562的质粒，并称为cp 1165。改变cp 1165使得其不再含有克隆载体中所存在的AscI位点，并成为CP 1166。通过用AscI和BamHI消化切除来自CP 1564的含有SwaI的Ad片段，并插入用AscI和BamHI切割的CP 1566中，并将该质粒称为CP 1567。这就反向构建了一种全长Ad基因组质粒，以产生在L2区中含有独特SwaI位点的基因组质粒，可被切割用于L2区中重组。

实验例3：转基因插入在L2区中pVII CDS和pV CDS之间

在含有完整的腺病毒载体基因组(即ITR至ITR)或腺病毒基因组L2区或其相关部分的载体(如质粒)中执行以下克隆步骤。将转基因CDS即开放阅读框(ORF)或cDNA插入在pVII CDS下游和pV CDS上游。在这两个基因之间已存在剪接受体序列，其用于表达pV；有关的分支点序列没有精确作图。将转基因CDS或cDNA插入在内源pV剪接位点上游，并将额外的分支点和剪接受体位点插入在转基因上游。这些额外的剪接序列用于转基因表达。用于L2区的示范性的剪接受体序列不同于L3区所使用的。对于pVII根据已有的剪接位点选择新的剪接受体位点：TACTTATAGTGAA AACGTTCCTGCTCTCACAG通过保存强碱基(strong bases)以获得TACTTATAGTAATCTAATTCCTGCTCTCTCAG(SEQ ID NO：42)。可选择地，将可操作地连接转基因CDS的额外的分支点和剪接受体位点插入在天然pV分支点和剪接受体位点上游。

实验例4：转基因插入在L2区中五邻体CDS和pVII CDS之间

将转基因CDS插入在五邻CDS下游和pVII CDS上游。对于pVII推测的分支点和剪接受体位点存在于五邻体编码区中。因此，所插入的转基因使用了存在于五邻体CDS中的内源剪接信号，并将额外的分支点和剪接受体位点置于转基因CDS之后和(并可操作地连接)pVII CDS上游以合成pVII基因的mRNA。

实验例5：转基因插入在L2区中Mu CDS和L4polyA信号之间

将转基因插入在Mu(aka pX)CDS下游和L2多腺苷酸化信号序列上游。将分支点、剪接受体位点和转基因CDS插入在Mu CDS下游和L2多腺苷酸化信号序列上游。所插入的分支点和剪接受体位点可操作地连接转基因CDS。

实验例6：转基因插入在L2区中Mu CDS和L4polyA信号下游

将可操作地连接转基因的IRES插入在Mu CDS下游和L2多腺苷酸化信号序列上游。

实验例7：剪接元件和hIL-24克隆入L3区的23K CDS和L3 polyA之间

用EcoRI切割pCR2.1 Topo(Invitrogen，Carlsbad，California)，并再连接以除去一个EcoRI位点。然后用BspHI切割该质粒，用Klenow补平，并再连接以除去BspHI位点。接着用ApaI和RsrII切割该质粒，用Klenow补平，并再连接以除去在这些位点之间的额外序列。保留含有氨苄青霉素抗性基因的部分。将该质粒称为CP 1601。用HindIII和XhoI切割pBHGE3(Microbix Biosystems，Toronto，Ontario，Canada)，并将含有野生型Ad5基因组核苷酸18318-24795的HindIII/XhoI片段连接入HindIII-和Xhol-切割的CP 1601片段(载体骨架)中。所得到的质粒称为CP 1603。

为在23K CDS下游和L3多腺苷酸化信号序列上游插入转基因人-IL24(hIL-24，也被称为MDA-7)，并容许通过剪接机制表达，执行以下步骤：使用PCR重叠延伸拼接(Horton等Biotechniques.1990年5月；8(5)：528-35)含有分支点和剪接受体位点的片段，扩增了hIL-24 CDS。(该IL-24CDS获得自Invivogen质粒参见“porf-hil24”)。在PCR引物中编码了分支点和剪接受体位点。使用上述相同的分支点和剪接受体位点序列。PCR产物被TA克隆入pCR2.1Topo(Invitrogen，Carlsbad，California)构建CP1602。然后，将来自含有Ad和hIL-24序列的CP1602的HindIII/XhoI区连接入HindIII/XhoI消化的CP 1601，产生质粒CP1606Rev(SEQ ID NO：48)。将CP1606 Rev的KpnI/SfiI片段连接入KpnI/SfiI切割的CP1524以构建CP1610。CP1610是用于将修饰的L3区“穿梭”入完整的腺病毒载体基因组中的穿梭质粒。就该质粒，在用BspHI和NheI消化转基因片段(通常是通过PCR产生的，具有适当的末端)和CP1610后，任何转基因都可插入这里。通过同源重组CP 1606 Rev(SEQ IDNO：48)和腺病毒载体基因组骨架质粒，得以产生Ad载体或病毒。腺病毒载体基因组骨架含有所有其它必需的腺病毒基因以及提供与所要插入区同源性的DNA区，由此产生含有包括L3区修饰的腺病毒载体基因组完整序列的载体。重组科在大肠杆菌菌株中进行以产生含有带有期望改变的全长Ad基因组的质粒。然后，通过转染入哺乳动物细胞和病毒扩增，将该载体用于构建腺病毒病毒颗粒。

使用相同策略，其它转基因可正好插入在L3区的L2多腺苷酸化位点上游。可选择地，能用分别用其5′和3′末端上的限制酶切位点BspHI和NheI扩增转基因，并插入CP1606 Rev(SEQ ID NO：48)，使用该相同策略可产生相应的Ad病毒。

实验例8：克隆mIL21入L3区六邻体CDS和23K CDS之间

利用供表达的剪接将鼠白细胞介素-21转基因插入在L3六邻体CDS下游和23K CDS上游，进行如下。使用本领域技术人员的常用方法，将剪接受体位点和mIL21 cDNA(Invivogen参见：porf-mIL21)插入在六邻体CDS下游和23K CDS上游。在PCR引物中编码分支点和剪接受体位点。使用上述相同的分支点和剪接受体。在该情况下，因为对于六邻体正常的23K剪接信号存在于ORF中，故添加分支点加剪接受体位点到转基因的3′末端，同样地，转基因可插入在六邻体上游。该策略利用了转基因的内源(天然病毒)剪接序列，并添加要被用于表达23K CDS的额外的分支点加剪接受体。用消化适当的限制性内切酶含有Ad5基因组L3区片段(用限制性内切酶修饰克隆和/或剪接加工信号的位点)的PCR产物和hIL24 cDNA。然后将片段连接入CP1601等价载体中以构建CP1623。接着，将CP1623的BamHI/KpnI片段连接入BamHI/KpnI切割的CP1524(实施例7)中以构建CP1631，即一种穿梭载体，其中在六邻体终止密码子和23K起始密码子后插入改造的盒(在hIL24 cDNA之前的3′剪接受体位点)。CP1623是能用于其它以该方式要被表达的转基因的穿梭质粒。通过同源重组CP1631和含有期望的腺病毒基因组骨架的期望的全长载体，获得包含插入的mIL21转基因的完整的腺病毒载体。然后，将所得到的质粒CP1631用于构建新的Ad病毒OV1153，其将表达转基因。

实验例9：克隆IRES和hIL-24入L3区23K CDS和L3 polyA信号之间

使用供表达的IRES，可将诸如hIL-24(Invivogen参见：porf-hil24)的转基因插入在L3区，正好位于L3多腺苷酸化位点上游和所有的L3编码区下游。IRES和转基因应该包括于并翻译自所有的L3mRNAs。使用PCR重叠延伸拼接法(Horton等Biotechniques.1990年5月；8(5)：528-35)，产生PCR产物使得IRES例如获得自FMDV或ECMV的可操作地连接hIL-24CDS，并插入在23K CDS下游和L3多腺苷酸化信号序列上游。PCR产物被TA克隆入pCR2.1构建CP 1604。将来自CP 1604含有Ad和hIL-24序列的HindIII/XhoI区连接入HindHI/XhoI消化的CP1601-NotI中，得到CP1607。通过用NotI切割CP1601制备CP1601-NotI，用Klenow补平末端，然后再连接质粒，使得NotI位点被破坏。将CP1607的BamHI/SfiI片段连接入BamHI/SfiI切割的CP1603以构建质粒CP1609。CP1607是能用于其它以该方式要被表达的转基因的穿梭质粒。通过同源重组CP1609和期望的全长腺病毒基因组骨架质粒，获得包含插入的mFLT3L转基因的完整的腺病毒载体。然后，通过转染入哺乳动物细胞中，将所得到的质粒用于产生Ad病毒。

实验例10.构建OV 1165对照病毒

OV 1165是一种包含可操作地连接E1A的E2F-1启动子的对照病毒。该载体在天然位置中携带有包装信号，并在E2F-1启动子上游携带多腺苷酸化信号以抑制自LITR的转录连读。这些包含于OV1165中的序列来源于质粒pFLAr21pAE2Ff。

全长重组腺病毒基因组(pFLAr21pAE2Ff)产生如下。首先，通过在大肠杆菌中连接含有经PCR导入的I-SceI限制酶切位点的SmaI-线性化的pAd5LtRtSmaI穿梭质粒和Ad5基因组DNA产生全长质粒pFLAd5，得到含有边界为I-SceI位点的Ad5基因组的pFLAd5。其次，用SmaI消化pFLAd5，并通过凝胶纯化含有Ad5左末端和右末端的片段，自我连接以产生pAd5LtRtSmaI。用SmaI消化含有Ad5左末端(1006bp)和右末端(582bp)限制性酶切片段的质粒pAd5LtRtSmaI，并在大肠杆菌中与Ar21pAE2f的基因组病毒DNA连接以产生全长质粒pFLAr21pAE2Ff。

称为CP 1585的含有上述类型全长腺病毒衍生的基因组的质粒产生如下：

自pFLAr21pAE2fF质粒(pFLAr21Sma穿梭质粒)分离4648bpSmaI片段，其在E1A上游含有E2F启动子。通过Bam HI消化、klenow聚合酶补平以破坏该位点并再连接，从pFLAr21 Sma穿梭质粒上除去了BamHI位点。分离称为pE2f LtRT穿梭质粒的4646bp质粒产物。在BJ5183细胞中通过使用含有野生型Ad5基因组的CV802病毒DNA和线性化的pE2f LtRt穿梭质粒，进行细菌同源重组产生质粒CP 1585(38998bp)。最终产物CP 1585具有全长重组腺病毒基因组，带有可操作地连接E1A的E2F-1启动子。CP 1585还具有接近L4区的独特的BamHI位点(图上位置21796)，可用于促进基因插入在晚期区。

使用来源于CP1585的36,246个碱基对的I-SceI片段，经脂质转染胺转染A549细胞产生OV 1165病毒。在A549细胞上培养OV 1165并放大到5个滚瓶。

通过CsCl离心纯化病毒，并在ARCA缓冲液中配制，产量4.97ml，颗粒滴度2.33×10¹²vp/ml(每滚瓶2.3×10¹²vp)。

实验例11.产生L3载体

利用可变剪接机制，用于产生来自Ad5L3区的表达转基因的载体的穿梭质粒构建如下：

使用BJ5183细菌重组系统产生含有重组的、全长腺病毒基因组的质粒。

使用BJ5183细菌重组系统产生含有重组的、全长腺病毒基因组的质粒。在该系统的应用中，对含有腺病毒基因组较小片段的CP1606和CP1524穿梭质粒进行修饰。

还通过BJ5183细菌重组系统产生L3载体。将质粒骨架中含有全长腺病毒基因组的大的、线性化载体与来源于同样的腺病毒基因组的DNA较小片段共转化入BJ5183细菌具有功能性recB、recC、sbcB和sbcC基因的菌株。较小片段含有与侧接TRAIL编码序列的较大载体相同的值得注意的核苷酸序列延伸。大的、线性化载体与DNA较小片段共转化入BJ5183细胞，用于促进较小片段同源重组入大的、线性化载体。所得到的子代质粒含有掺入TRAIL编码序列(cDNA；SEQ ID NO：46)的全长腺病毒衍生的基因组。

从最终的穿梭质粒(CP 1581，来源于CP 1524)切下片段，并与含有全长重组腺病毒基因组的线性化质粒(pFLAr21pAE2Ff)共转化。子代质粒是pFLAr21pAE2Ff的衍生物。重组之前，在较小的基础载体CP1606 Rev(SEQ ID NO：48)中，将预有准备的改变导入CP 1524所含的Ad序列。CP1524(SEQ ID NO：47)和CP1606 Rev进一步描述如下。

CP1524(SEQ ID NO：47)是一种含有pcDNA3.1+(Invitrogen)衍生的质粒骨架中野生型Ad5基因组核苷酸18318-24795的基础穿梭载体。Ad5基因组核苷酸18318-24795的延伸含有野生型Ad5 L3区的一部分。

使用本领域技术人员常用的分子克隆方法构建CP 1524。最初，用限制性内切核酸酶BstZ17 I和Xba I(New England Biolabs)消化pcDNA3.1+。用DNA聚合酶I(Klenow)(New England Biolabs)处理所得到的消化载体，补平Xba I消化形成的DNA单链延伸。所得到的“平”末端连接到一起，形成修饰的pcDNA3.1+衍生载体CP1523，除去了额外的序列。CP 1524的Ad5序列来源于pBHGE3(Microbix)，除在E1区有大的缺失之外，其是一种含有野生型Ad5基因组的市售质粒。用限制性核酸内切酶HindIII和XhoI(New England Biolabs)从pBHGE3切下代表野生型Ad5序列核苷酸18318-24795的区，连接入同样切割的CP1523以产生子代质粒CP 1524。

实验例12.克隆剪接元件入L3区23K CDS和L3 polyA之间(CP1606 Rev构建)

CP 1606 Rev含有在截短的pCR2.1 Topo质粒骨架(Invitrogen)中代表野生型Ad5基因组核苷酸22181-23008的野生型Ad5L3区的修饰区段。对该区的修饰包括在hIL24cDNA之前的3′剪接受体位点(以下简称3′SAS)。hIL24 cDNA侧接BspHI(与NcoI相容)和NheI位点，用于置换为不同的cDNA序列，如TRAIL。

通过标准的分子克隆方法构建CP 1606 Rev。最初，产生包含野生型Ad5基因组核苷酸22181-23008的PCR片段，对其修饰以在野生型Ad523K基因(以下简称23K)终止密码子和L3 polyA之间包括3′SAS和hIL24 cDNA。通过PCR剪接重叠延伸构建该片段。

简言之，产生3个前体PCR片段。片段PCRp 1618.95.1/2含有用引物1618.95.1(SEQ ID NO：52)和1618.95.2(SEQ ID NO：56)扩增自pBHGE3的野生型Ad5基因组核苷酸22181-22354的一部分。PCRp1618.95.1/2在其下游末端掺入3′SAS(SEQ ID NO：45)。

片段PCRp 1618.97.1(SEQ ID NO：54)/1618.97.2(SEQ ID NO：55)含有用引物1618.97.1和1618.97.2扩增自pORF9-hIL24(Invivogen)的hIL24cDNA。PCRp 1618.97.1/2分别在其上游和下游掺入3′SAS和野生型Ad5L3区的一部分。

用引物1618.95.5(SEQ ID NO：56)和1618.95.6(SEQ ID NO：53)扩增野生型Ad5基因组核苷酸22355-23008。片段PCRp 1618.95.1/2和PCRp 1618.97.1/2具有重叠末端。将这两个片段的混合物置于具有侧翼引物1618.95.1(SEQ ID NO：52)和1618.97.2(SEQ ID NO：55)的PCR反应中。所得到的产物PCRp 1618.95.1/1618.97.2使野生型Ad5基因组核苷酸22181-22354的一部分与3′SAS和hIL24cDNA连接。

同样地，片段PCRp 1618.97.1/2和PCRp 1618.95.5/6具有重叠末端。将这两个片段的混合物置于具有侧翼引物1618.97.1和1618.95.6的PCR反应中。所得到的产物PCRp 1618.97.1/1618.95.6具有3′SAS和hIL24cDNA以及野生型Ad5基因组22355-23008位的一部分。

因此，PCRp 1618.95.1/1618.97.2和PCRp 1618.97.1/1618.95.6在改造的3′SAS和hIL24 cDNA重叠。将这两个片段的混合物置于具有侧翼引物1618.95.1(SEQ ID NO：52)和1618.95.6(SEQ ID NO：53)的PCR反应中。所得到的产物PCRp 1618.95.1/6代表了在原始位置22354和22355之间(以便导入元件位于23K终止密码子和L3polyA位点之间)掺入改造的3′SAS和hIL24cDNA的原始野生型Ad5基因组核苷酸22181-23008。通过Topo TA克隆，将PCRp 1618.95.1/6置于载体pCR2.1Topo中，产生质粒CP1602。

为了产生用于在上述修饰的23K区中除去和插入转基因的基础穿梭载体，通过修饰pCR2.1Topo构建质粒骨架。最初，用限制性核酸内切酶EcoRI(New England Biolabs)消化pCR 2.1Topo，并再连接以去除一个EcoRI位点和最初两个位点之间额外的核苷酸序列，产生pCR2.1TopoEcoRI。为了便于在下游克隆转基因，通过用限制性核酸内切酶BspHI(New England Biolabs)消化从pCR2.1TopoEcoRI上除去了BspHI限制酶切位点，用DNA聚合酶I(Klenow)处理，然后连接被处理的载体以产生pCR2.1 Topo.EcoRI-BspHI。为了减轻下游克隆工作量，通过用限制性核酸内切酶ApaI和RsrII(New England Biolabs)消化从pCR.21Topo.EcoRI-BspHI上除去额外的序列，用DNA聚合酶I(Klenow)处理，然后连接被处理的载体以产生CP 1601。

通过切下CP 1602的HindIII至XhoI片段，并将其置于同样切割的CP 1601载体中，构建最终的基础穿梭载体CP1606 Rev(SEQ IDNO：48)。

为产生适于与线性化载体pFLAr21pAE2Ff重组的较大的穿梭质粒，从CP1606 Rev上切下KpnI至SFiI(New England Biolabs)片段，并置于同样切割的CP1524载体中，产生质粒CP1610。

实验例13.产生在L3区23K CDS和L3polyA之间具有剪接受体(SA)位点和TRAIL的溶瘤载体(OV 1160)

为了产生含有改造的3′SAS和TRAIL cDNA(Invivogen；参见pORF-TRAIL)的pFLAr21pAE2Ff的重组衍生物，进行两步亚克隆。通过PCR自pORF-hTTRAIL扩增TRAIL cDNA(SEQ ID NO：46)构建质粒CP1580。使用NcoI-NheI位点对该片段进行限制酶切消化，并连接入BspHI-NheI消化后的CP 1606 Rev。BspHI位点与NcoI位点相容。由CP 1580的KpnI-SfiI片段构建CP1581质粒，其含有23K蛋白剪接位点3′的TRAIL，连接入CP 1524穿梭质粒用于重组。质粒CP 1582获得自下列CP1581的XhoI-HindIII片段与全长pFLar21paE2f的重组。分离含有改造的3′SAS(SEQ ID NO：45)和TRAIL cDNA(SEQ ID NO：46)的pFLAR21pAE2Ff的重组衍生物，并命名为CP 1582。

通过使用I-SceI酶的CP 1582限制酶切消化，释放全长腺病毒序列(含有新的剪接受体位点和TRAIL)，产生OV 1160病毒(SEQ IDNO：51)。

实验例14.产生在L3区23K CDS和L3 polyA之间具有IRES和TRAIL的溶瘤载体(OV 1164)

OV1164(SEQ ID NO：50)在六邻体编码序列终止密码子后具有IRES。涉及O V1164产生的质粒是CP 1590、CP 1591和CP1592(全长)。

在三步亚克隆后产生全长CP1592质粒。通过PCR重叠延伸拼接装配含有HexonFmdvTrail的质粒。为了通过重组产生具有足以产生下一个质粒的重叠的片段，在该序列两侧包含来自Ad5的1kb序列。PCR重叠延伸拼接进行如下：

(1)使用1706.83.1(SEQ ID NO：57)/1706.83.2(SEQ ID NO：58)扩增来自pBHG3的Ad5序列；(2)使用寡核苷酸1706.95.1(SEQ IDNO：59)/1618.116.3(SEQ ID NO：60)扩增来自pmcsHexFmdvTRAIL的HexFmdvTRAIL片段；和(3)使用1706.83.1和1618.116.3装配片段，克隆新片段入PCRstopo。

(2)CP1590是一种含有PCR装配片段(ad5HexFmdvTRAILAd5)的PCR2.1 topo载体。通过重组CP1590的HpaI-XhoI片段(Ad5HexFmdvTRAILAd5)和用BamHI线性化的CP1524产生CP1591。通过重组CP1591的XhoI-HindIII片段和用SgfI线性化的pFLar21paE2f产生最终全长CP1592质粒。

使用Expand聚合酶，通过寡核苷酸1619.144.1(SEQ ID NO：61)/1619.144.3(SEQ ID NO：62)从pORF-hTRAIL扩增TRAIL，将TRAIL克隆入pmcs HexFMDV。BSTZ171消化扩增片段，连接入CP1557(pmcsHexFmdv bamHI-EcoRI)以产生pmcsHexFmdvTrail。

用I-SceI酶限制酶切消化CP1592，释放全长腺病毒序列(含有IRES和TRAIL)，产生病毒。

实验例15.病毒生产、Trail表达和体外生物活性

从平板上转移A549细胞(1-2×10e7细胞)到滚瓶(带有通气孔盖的Falcon 35-3069折叠表面滚瓶)中，在第1天于具有2mM L-谷氨酰胺和10％FBS的RPMI 1640培养基中。在第4天，用5-10个病毒颗粒/细胞感染细胞3-6小时。在感染后72-96小时收获细胞并贮藏在-80℃，直至CsCl离心纯化。对于OV 1160批次1；OV 1160批次2和OV 1164分别获得2.55e12、2.05e12和2.11e12的滴度(通过HPLC测定)。通过OD在260nm处测定滴度(病毒在含有0.1％SDS的TE中以1∶10和1∶20稀释，在56℃温育20分钟，在分光光度计上读出260和280nm处吸光度)。

在A549、SW780和Hela S3细胞上，对每种病毒在50ppc下进行病毒生长。感染持续进行4小时，然后在添加3ml新鲜的完全培养基之前用PBS洗涤细胞两次。在第3天(转导后72小时)收获细胞，冻融3次并分析。表1显示了在第3天的病毒产量。

测定第3天(转导后72小时)的病毒产量，使用六邻体测定法滴定胶原包被的12-孔平板上293细胞。表1显示了在第3天的病毒产量。

表1.

	A549				SW780
	A549				SW780				总PFU	PFU/细胞	倍数差异		总PFU	PFU/细胞	倍数差异
OV1165	3.50E+10	7.00E+04	1.00E+00	OV1165	4.55E+10	9.10E+04	1.00E+00		总PFU	PFU/细胞	倍数差异		总PFU	PFU/细胞	倍数差异
OV1165	3.50E+10	7.00E+04	1.00E+00	OV1165	4.55E+10	9.10E+04	1.00E+00	OV1160#2	4.87E+09	9.74E+03	7.19E+00	OV1160#2	2.97E+09	5.94E+03	1.53E+01
OV1160#1	4.27E+09	8.54E+03	8.20E+00	OV1160#1	2.98E+09	5.96E+03	1.53E+01	OV1160#2	4.87E+09	9.74E+03	7.19E+00	OV1160#2	2.97E+09	5.94E+03	1.53E+01
OV1160#1	4.27E+09	8.54E+03	8.20E+00	OV1160#1	2.98E+09	5.96E+03	1.53E+01	OV1164	1.23E+09	2.46E+03	2.85E+01	OV1164	n/a
802	5.83E+10	1.17E+05	6.00E-01	802	8.90E+10	1.78E+05	5.11E-01	OV1164	1.23E+09	2.46E+03	2.85E+01	OV1164	n/a
802	5.83E+10	1.17E+05	6.00E-01	802	8.90E+10	1.78E+05	5.11E-01
	HelaS3
	HelaS3								总PFU	PFU/细胞	倍数差异
OV1165	3.20E+10	6.40E+04	1.00E+00						总PFU	PFU/细胞	倍数差异
OV1165	3.20E+10	6.40E+04	1.00E+00					OV1160#2	2.45E+09	4.90E+03	1.31E+01
OV1160#1	2.24E+09	4.48E+03	1.43E+01					OV1160#2	2.45E+09	4.90E+03	1.31E+01
OV1160#1	2.24E+09	4.48E+03	1.43E+01					OV1164	5.50E+08	1.10E+03	5.82E+01
802	7.30E+10	1.46E+05	4.38E-01					OV1164	5.50E+08	1.10E+03	5.82E+01

六邻体测定法是一种通过免疫染色测定所给培养细胞中腺病毒六邻体蛋白产量的生物学测定法。简言之，用连续稀释的CVL或纯化病毒感染细胞并在37℃温育。感染后48小时，用甲醇固定细胞，然后先用抗六邻体第一抗体，接着用缀合辣根过氧化物酶(以下简称HRP)的第二抗体检测。然后将固定的培养物暴露于二氨基联苯(以下简称DAB)底物，通过第二抗体的HRP将该底物转化为在显微镜下易于观察的暗色沉淀，显影六邻体生成细胞。接着对形成暗色沉淀的斑点进行目测打分。基于每个显微镜视野的斑点打分、培养皿中视野的总数、用于感染的连续稀释的病毒的体积以及打分斑点的稀释因子，计算每毫升的感染单位(以下简称IU/mL)：

IU/mL＝[(每个视野的斑点打分)*(总的视野)]/[(稀释的病毒体积)*(稀释因子)]

在该情况下，连续稀释的OV1160(批次1)、OV1160(批次2)或OV1164感染293细胞。使用抗六邻体第一抗体(Chemicon；MAB8043)、第二抗体(Amersham Biosciences；NA931V)和DAB底物(Pierce；1856090)进行该测定。补充有1％BSA(Boehringer Mannheim；100-350)的PBS(Mediatech；1-031-CV)用作为抗体稀释剂，并用于所有的中间清洗步骤。

在第7天，使用MTS测定法于多种细胞系上，测定OV1165、2批OV1160、OV1164、OV802、实验室来源的野生型Ad5分离株(Yu等，1999)和Addl312(一种E1a缺失的复制缺陷型病毒)的EC50。结果提供于表2，以下是50％细胞致死剂量(记录为PPC)。

表2.

细胞/病毒	OV1165	OV1160#1	OV1160#2	OV1164	802	dl312
细胞/病毒	OV1165	OV1160#1	OV1160#2	OV1164	802	dl312	A549	0.12	0.07	0.21	0.86	0.02	543
肺癌							A549	0.12	0.07	0.21	0.86	0.02	543
肺癌							SW780	6	2	2	52	0.63	895
转行细胞癌							SW780	6	2	2	52	0.63	895
转行细胞癌							SKMel-28	133	148	230	1033	15	4787
黑色素瘤							SKMel-28	133	148	230	1033	15	4787
黑色素瘤							HT29	147	90	106	784	5	4301
直肠腺癌							HT29	147	90	106	784	5	4301
直肠腺癌							H460	0.62	0.43	0.7	10	0.02	1862
肺癌							H460	0.62	0.43	0.7	10	0.02	1862
肺癌							DLD-1	64	28	34	525	18	na
直肠腺癌							DLD-1	64	28	34	525	18	na

TRAIL表达的蛋白质印迹和ELISA分析

使用本领域已知的方法(如Anton和Graham，J.Virology，69，4600-4606，1995，Sambrook和Russell，同上)进行蛋白质印迹分析。在A549细胞感染后，使用OV1164和OV1160的CVL(粗提病毒裂解液)进行第一系列的蛋白质印迹。对于OV1164，在1000、100或10个颗粒/细胞(ppc)下感染A549细胞24、48和72小时，通过HPLC测定的和病毒颗粒(vp)计数为8.6e9vp/ml。

还用不同体积的未滴定的OV1160CVL感染A549细胞72小时。感染后，用细胞刮棒收获A549细胞，在14,000下离心3分钟，将来自OV1160或OV1164感染的细胞的细胞沉淀重悬于200ul冷的印迹裂解缓冲液中，在冰上温育30分钟并在使用前贮藏在-80℃。使用Bradford蛋白测定法估算每份样品中的蛋白的量。将来自OV1160或OV1164感染细胞的10或30ug/ml的总细胞蛋白与含有100mM DTT的溶液混合并添加染料，在85□C变性5分钟并加载到4-12％梯度Bis-Tris SDS-Page凝胶(Novex from Invitrogen)上。

使用纯化的OV1160、OV1164和OV1165病毒感染A549细胞进行第二系列的蛋白质印迹。在10和100的PPC下进行A549细胞感染，感染后第6、24和48小时收集上清液。感染后24和48小时收集细胞。30μg的总蛋白或30μl的上清液加载到4-12％梯度Bis-Tris SDS-Page凝胶(Novex from Invitrogen)上。凝胶在1X MOPS缓冲液中于100伏1.5小时，接着转移到PDVF膜上，在10％MeOH的1X MOPS缓冲液中于400毫安1小时。使用的第一抗体是山羊IgG抗人TRAIL多克隆抗体(R&DSystems；AF375)。使用山羊抗-HRP第二抗体(Santa Cruz Bio SC-2056)。在暴露于Biomax MS膜(Kodak)后使用ECL-Plus试剂盒(Amersham)检测结果。

在OV1160和OV164以10、100和1000PPC感染24、48或72小时的A549细胞的细胞裂解液中，通过蛋白质印迹检测TRAIL蛋白。在OV1160以100的PCC感染48小时的A549细胞上清液中，还检测了TRAIL的19kDa切割部分(可溶形式)。

利用ELISA定量TRAIL表达，通过评估细胞凋亡程度，表现病毒感染细胞产生的TRAIL的旁观者效应(在进一步描述如下的生物测定法中评估)。进行分析以便确定病毒感染后是否产生TRAIL以及其是否是生物学活性的。

分别用OV1160、OV1164和OV1165在100的PPC下感染A549细胞24和48小时。收集上清液并冷冻在-80℃，直至利用ELISA进行检测以测定上清液中TRAIL的量。

收集条件培养基并用夹心ELISA测定TRAIL表达。用0.1M碳酸盐pH 9.6缓冲液中的小鼠抗人TRAIL单克隆抗体(BioSource)包被96-孔微量滴定板，并在4℃温育过夜。用PBS-0.05％Tween-20泛洗平板，并用PBS-1％BSA-0.05％Tween-20缓冲液封闭1小时。重组人TRAIL蛋白(R&D Systems，Minneapolis，MN)在连续稀释后用来做标准曲线。在孔中温育样品1小时，泛洗并与山羊抗人TRAIL多克隆抗体(R&D Systems，Minneapolis，MN)温育1小时。泛洗后，样品与HRP-缀合的抗山羊IgG抗体(Sigma Chemical Co.)温育1小时，再次洗涤，并用Sure Blue TMB底物(KPL，Gaithersburg，MD)在450/650nm吸光度处检测。使用重组的人TRAIL(R&D Systems；375TEC)产生标准曲线。该测定的结果提供于以下表3A中。

表3A.

	PPC100
	PPC100					24hr		平均值	TRAIL(ng/ml)
OV1160#1	0.093	0.11	0.1015	1.1		24hr		平均值	TRAIL(ng/ml)
OV1160#1	0.093	0.11	0.1015	1.1	OV1160#2	0.1	0.1	0.1	0.9
OV1165	0.078	0.079	0.0785		OV1160#2	0.1	0.1	0.1	0.9
OV1165	0.078	0.079	0.0785		OV1164
					OV1164

	48hr		平均值	TRAIL(ng/ml)
	48hr		平均值	TRAIL(ng/ml)	OV1160#1	0.192	0.191	0.1915	9.6
OV1160#2	0.208	0.207	0.2075	13.3	OV1160#1	0.192	0.191	0.1915	9.6
OV1160#2	0.208	0.207	0.2075	13.3	OV1165	0.079	0.08	0.0795
OV1164	0.082	0.08	0.081		OV1165	0.079	0.08	0.0795

对OV1160或OV1165在其相应的EC50(在第7天通过MTS测定)感染40小时的6种细胞系(SW780、A549、D1D-I、SKMel28、HT29、H460)进行第二次ELISA。进行该研究以估算多种不同细胞系产生的TRAIL量。表3B所示结果表明OV1160感染的SW780、A549和HT460细胞产生了最多数量的TRAIL。

表3B.

TRAIL(ng/ml)		SW780	A549	DLD1	SK-Mel28	HT29	H460
TRAIL(ng/ml)		SW780	A549	DLD1	SK-Mel28	HT29	H460	平均值	OV1165	0	0	0.201301	0	0	0
	OV1160#1	10.048	110.3783	4.790433	1.839404	0.727786	13.83983	平均值	OV1165	0	0	0.201301	0	0	0
	OV1160#1	10.048	110.3783	4.790433	1.839404	0.727786	13.83983		OV1160#2	5.921467	87.18996	5.231936	1.890064	0.616181	13.55111
									OV1160#2	5.921467	87.18996	5.231936	1.890064	0.616181	13.55111
								sd		0	0	0.284682	0	0	0
		1.997327	7.356895	0.159734	0.365634	0.072695	0	sd		0	0	0.284682	0	0	0
		1.997327	7.356895	0.159734	0.365634	0.072695	0				5.811357	1.379575	0.437278	0.04107	1.353553

通过将感染细胞上清液转移到新鲜的未感染细胞上，评估OV1160、OV1164和OV1165感染细胞产生TRAIL的旁观者效应。使用ELISA试剂盒(细胞死亡检测试剂盒Elisa plus/Roche 1774425)通过DNA断裂评估细胞凋亡程度。

用OV1165、OV 1164或两批OV1160中的一批于100PPC感染A549细胞48小时，收集感染后的100ul上清液，添加或不添加常用的胱天蛋白酶抑制剂(R&D systems：FMK001)，进行第一次测定。添加上清液16小时后进行分析。表4所示的结果表明对于SW780细胞，是OV1160而非OV1165能诱导细胞凋亡，当胱天蛋白酶抑制剂包含在培养物中时，效果降低。

表4.

	SW780	A549
	SW780	A549	仅有细胞	0.35	0.24
1165	0.68	0.26	仅有细胞	0.35	0.24
1165	0.68	0.26	1165+抑制剂	1	0.3
1160	3	0.175	1165+抑制剂	1	0.3
1160	3	0.175	1160+抑制剂	0.56	0.15
rTrail	3.75	1.45	1160+抑制剂	0.56	0.15
rTrail	3.75	1.45	来自试剂盒的阳性对照	3.3
培育缓冲液	0.21		来自试剂盒的阳性对照	3.3
培育缓冲液	0.21		ABTS(dye)	0.18

对OV1165或OV1160在其相应的EC50s感染的6种细胞系(SW780、DLD-1、HT29、SkMel28、H460和A549)进行第二次测定，所述EC50s在第7天通过MTS测定。向相应的未感染细胞添加来自每种病毒感染细胞系的新鲜收获的上清液，在进行ELISA前40小时，添加或不添加胱天蛋白酶抑制剂。如表3B所示，不同细胞系产生的TRAIL水平不同。该研究被设计来评估特定细胞系产生的TRAIL的生物活性。

实验例16.在皮下人膀胱SW780异种移植肿瘤模型中的抗肿瘤功效

使用人膀胱TCC细胞系SW780进行研究，以评估表达TRAIL病毒(OV1160)和对照(OV1165)病毒的抗肿瘤功效。在最近的研究中，分别通过五次肿瘤内注射OV1160和OV1165治疗裸鼠中SW780细胞的异种移植肿瘤。所测量的参数包括存活率、肿瘤体积改变、体重以及病毒感染程度、TRAIL表达和肿瘤中细胞凋亡程度。

通过皮下注射2×10⁶SW780细胞到雌性小鼠(每组10只动物)中建立肿瘤。当平均肿瘤体积达到大约150mm³时，开始肿瘤内病毒治疗。开始于研究日(SD 1)，肿瘤注射五次，每次注射剂量为1×10e8、1×10e9或1×10e10病毒颗粒(vp)，每隔一天总计给药5次。每周测量两次肿瘤体积[(W²×L)/2]；每周测量一次体重。在感染后的不同时间点进行六邻体染色和TRAIL ELISA。

序列表

以下是实施本发明所使用序列的描述。

LLNFDLLKLAGDVESNPGP(SEQ ID NO：1)

TLNFDLLKLAGDVESNPGP(SEQ ID NO：2)；

LLKLAGDVESNPGP(SEQ ID NO：3)

NFDLLKLAGDVESNPGP(SEQ ID NO：4)

QLLNFDLLKLAGDVESNPGP(SEQ ID NO：5)

APVKQTLNFDLLKLAGDVESNPGP(SEQ ID NO：6).

VTELLYRMKRAETYCPRPLLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPG P(SEQ ID NO：7)

LLAfflPTEARHKQKIVAPVKQTLNFDLLKLAGD VESNPGP(SEQ IDNO：8)

EARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP(SEQ ID NO：9)

NFDLLKLAGDVESNPGPFF(SEQ ID NO：10)

GIFNAHYAGYFADLLIHDIETNPGP(SEQ ID NO：11)

RIFNAHYAGYFADLLIHDIETNPGP(SEQ ID NO：12)

HVFETHYAGYFADLLIHDVETNPGP(SEQ ID NO：13)

KAVRGYHADYYKQRLIHDVEMNPGP(SEQ ID NO：14)

RAVRAYHADYYKQRLIHDVEMNPGP(SEQ ID NO：15)

KAVRGYHADYYRQRLIHDVETNPGP(SEQ ID NO：16)

LTNFDLLKLAGDVESNPGP(SEQ ID NO：17)

LLNFDLLKLAGDMESNPGP(SEQ ID NO：18)

MCNFDLLKLAGDVESNPGP(SEQ ID NO：19)

CTNYALLKLAGDVESNPGP(SEQ ID NO：20)

GATNFSLLKLAGDVELNPGP(SEQ ID NO：21)

GPGATNFSLLKQAGDVEENPGP(SEQ ID NO：22)

EAARQMLLLLSGDVETNPGP(SEQ ID NO：23)

FLRKRTQLLMSGDVESNPGP(SEQ ID NO：24)

GSWTDILLLLSGDVETNPGP(SEQ ID NO：25)

RAEGRGSLLTCGDVEENPGP(SEQ ID NO：26)

TRAEIEDELIRAGIESNPGP(SEQ ID NO：27)

SKFQIDRILISGDIELNPGP(SEQ ID NO：28)

AKFQIDKILISGDVELNPGP(SEQ ID NO：29)

SKFQIDKILISGDIELNPGP(SEQ ID NO：30)

SSIIRTKMLVSGDVEENPGP(SEQ ID NO：31)

CDAQRQKLLLSGDIEQNPGP(SEQ ID NO：32)

SEQ ID NO：33是弗林蛋白酶共有序列或位点：RXK(R)R

SEQ ID NO：34是凝血因子XA切割序列或位点：IE(D)GR

SEQ ID NO：35是信号肽酶I切割序列或位点：LAGFATVAQA

SEQ ID NO：36是凝血酶切割序列或位点：LVPRGS

SEQ ID NO：37是腺病毒共有蛋白酶序列或位点(M，L，I)XGG/X

SEQ ID NO：38是腺病毒共有蛋白酶序列或位点M L，I)XGX/G

SEQ ID NO：39是分支点加剪接受体的示范性序列

SEQ ID NO：40是分支点共有序列

SEQ ID NO：41是GenBank AY339865的核苷酸29209-29336

SEQ ID NO：42是L2区剪接位点

SEQ ID NO：43是E2F启动子序列

SEQ ID NO：44是FMDV(毒株C)IRES序列

SEQ ID NO：45是3′剪接受体位点或SAS

SEQ ID NO：46是hTRAIL ORF(INVIVOGEN)

SEQ ID NO：47是CP1524序列(9587个碱基对)

SEQ ID NO：48是CP 1606REV序列(3855个碱基对)

SEQ ID NO：49是OV 1165序列

SEQ ID NO：50是OV1164序列

SEQ ID NO：51是OV1160序列

SEQ ID NO：52是寡核苷酸引物1618.95.1的序列

SEQ ID NO：53是寡核苷酸引物1618.95.的序列

SEQ ID NO：54是寡核苷酸引物1618.97.1的序列

SEQ ID NO：55是寡核苷酸引物1618.97.2的序列

SEQ ID NO：56是寡核苷酸引物1618.95.5的序列

SEQ ID NO：57是寡核苷酸引物1706.83.1的序列

SEQ ID NO：58是寡核苷酸引物1706.83.2的序列

SEQ ID NO：59是寡核苷酸引物1706.95.1的序列

SEQ ID NO：60是寡核苷酸引物1618.116.3的序列

SEQ ID NO：61是寡核苷酸引物1619.144.1的序列

SEQ ID NO：62是寡核苷酸引物1619.144.3的序列

以下是实施本发明所使用序列的描述。

LLNFDLLKLAGDVESNPGP(SEQ ID NO：1)

TLNFDLLKLAGDVESNPGP(SEQ ID NO：2)；

LLKLAGDVESNPGP(SEQ ID NO：3)

NFDLLKLAGDVESNPGP(SEQ ID NO：4)

QLLNFDLLKLAGDVESNPGP(SEQ ID NO：5)

APVKQTLNFDLLKLAGDVESNPGP(SEQ ID NO：6).

VTELLYRMKRAETYCPRPLLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPG P(SEQ ID NO：7)

LLAFFLPTEARHKQKTVAPVKQTLNFDLLKLAGDVESNPGP(SEQID NO：8)

EARHKQKJVAPVKQTLNFDLLKLAGD VESNPGP(SEQ ID NO：9)

NFDLLKLAGDVESNPGPFF(SEQ ID NO：10)

GIFNAHYAGYFADLLIHDIETNPGP(SEQ ID NO：11)

RIFNAHYAGYFADLLIHDIETNPGP(SEQ ID NO：12)

HVFETHYAGYFADLLIHDVETNPGP(SEQ ID NO：13)

KAVRGYHADYYKQRLIHDVEMNPGP(SEQ ID NO：14)

RAVRAYHADYYKQRLIHDVEMNPGP(SEQ ID NO：15)

KAVRGYHADYYRQRLIHDVETNPGP(SEQ ID NO：16)

LTNFDLLKLAGDVESNPGP(SEQ ID NO：17)

LLNFDLLKLAGDMESNPGP(SEQ ID NO：18)

MCNFDLLKLAGDVESNPGP(SEQ ID NO：19)

CYNYALLKLAGDVESNPGP(SEQ ID NO：20)

GATNFSLLKLAGDVELNPGP(SEQ ID NO.-21)

GPGATNFSLLKQAGDVEENPGP(SEQ ID NO：22)

EAARQMLLLLSGDVETNPGP(SEQ ID NO：23)

FLRKRTQLLMSGDVESNPGP(SEQ ID NO-.24)

GSWTDILLLLSGDVETNPGP(SEQ ID NO：25)

RAEGRGSLLTCGDVEENPGP(SEQ ID NO：26)

TRAEIEDELIRAGIESNPGP(SEQ ID NO：27)

SKFQIDRILISGDIELNPGP(SEQ ID NO：28)

AKFQIDKILISGDVELNPGP(SEQ ID NO-.29)

SKPQIDKILISGDIELNPGP(SEQ ID NO：30)

SS[Pi]RTKMLVSGDVEENPGP(SEQ ID NO.-31)

CDAQRQKLLLSGDIEQNPGP(SEQ ID NO：32)

SEQ ID NO：33是弗林蛋白酶共有序列或位点：RXK(R)R

SEQ ID NO：34是凝血因子XA切割序列或位点：IE(D)GR

SEQ ID NO：35是信号肽酶I切割序列或位点：LAGFATVAQA

SEQ ID NO：36是凝血酶切割序列或位点：LVPRGS

SEQ ID NO：37是腺病毒共有蛋白酶序列或位点(M，L，I)XGG/X

SEQ ID NO：38是腺病毒共有蛋白酶序列或位点(M，L，I)XGX/G

SEQ ID NO：39是分支点加剪接受体的示范性序列TACTTATGACTCGTACTAT

TGTTATTCATCC AG6G

SEQ ID NO：40是分支点共有序列YNYUR AY(在此Y是嘧啶，N是任何核苷酸，和R是嘌呤)

SEQ ID NO：41是标号GenBank AY339865的核苷酸29209-29336

TAATTTACTAAGTTACAAAGCTAATGTCACCACTAACTGCTTTACTCGCTGCTTG

CAAAACAAATTCAAAAAGTTAGCATTATAATTAGAATAGGATTTAAACCCCCCG

GTCATTTCCTGCTCAATAC

SEQ ID NO：42是L2区剪接位点

TAC TTAT AGT AAT CTA A TT CCT G CT CTC TC AG

SEQ ID NO：43是E2F启动子序列

CATCCGGACAAAGCCTGCGCGCGCCCCGCCCCGCCATTGGCCGTACCGCCCCGC

GCCGCCGCCCCATCTCGCCCCTCGCCGCCGGGTCCGGCGCGTTAAAGCCAATAG

GAACCGCCGCCGTTGTTCCCGTCACGGCCGGGGCAGCCAATTGTGGCGGCGCTC

GGCGGCTCGTGGCTCTTTCGCGGCAAAAAGGATTTGGCGCGTAAAAGTGGCCGG

GACTTTGCAGGCAGCGGCGGCCGGGGGCGGAGCGGGATCGAGCCCTCGATGAT

ATCA

SEQ ID NO：44是FMDV(毒株C)IRES序列

AGCAGGTTTCCCCAACTG

ACACAAAACGTGCAACTTGAAACTCCGCCTGGTCTTTCCAGGTCTAGAGGGGTAACA

CTTTGTACTGCGT

TTGGCTCCACGCTCGATCCACTGGCGAGTGTTAGTAACAGCACTGTTGCTTCGTAGCG

GAGCATGACGGC

CGTGGGAACTCCTCCTTGGTAACAAGGACCCACGGGGCCAAAAGCCACGCCCACACG

GGCCCGTCATGTG

TGCAACCCCAGCACGGCGACTTTACTGCGAAACCCACTTTAAAGTGACATTGAAACT

GGTACCCACACAC

TGGTGACAGGCTAAGGATGCCCTTCAGGTACCCCGAGGTAACACGCGACACTCGGGA

TCTGAGAAGGGGA

CTGGGGCTTCTATAAAAGCGCTCGGTTTAAAAAGCTTCTATGCCTGAATAGGTGACC

GGAGGTCGGCACC

TTTCCTTTGCAATTAATGACCCT

SEQ ID NO：45是3′剪接受体位点或SAS

TACTTATGACTCGTACTATTGTTATTCATCCAG G

SEQ ID NO：46是hTRAIL ORF(INVIVOGEN)(SEQ ID NO：46)

ATGGCTATGATGGAGGTCCAGGGGGGACCCAGCCTGGGACAGACCTGCGTGCTGATC

GTGATCTTTACAGTG

CTCCTGCAGTCTCTCTGTGTGGCTGTAACTTACGTGTACTTTACCAACGAGCTGAAGC

AGATGCAGGACAAG

TACTCCAAAAGTGGCATTGCTTGTTTCTTAAAAGAAGATGACAGTTATTGGGACCCCA

ATGACGAAGAGAGT

ATGAACAGCCCCTGCTGGCAAGTCAAGTGGCAACTCCGTCAGCTCGTTAGAAAGATG

ATTTTGAGAACCTCT

GAGGAAACCATTTCTACAGTTCAAGAAAAGCAACAAAATATTTCTCCCCTAGTGAGA

GAAAGAGGTCCTCAG

AGAGTAGCAGCTCACATAACTGGGACCAGAGGAAGAAGCAACACATTGTCTTCTCCA

AACTCCAAGAATGAA

AAGGCTCTGGGCCGCAAAATAAACTCCTGGGAATCATCAAGGAGTGGGCATTCATTC

CTGAGCAACTTGCAC

TTGAGGAATGGTGAACTGGTCATCCATGAAAAAGGGTTTTACTACATCTATTCCCAAA

CATACTTTCGATTT

CAGGAGGAAATAAAAGAAAACACAAAGAACGACAAACAAATGGTCCAATATATTTA

CAAATACACAAGTTAT

CCTGACCCTATATTGTTGATGAAAAGTGCTAGAAATAGTTGTTGGTCTAAAGATGCAG

AATATGGACTCTAT

TCCATCTATCAAGGGGGAATATTTGAGCTTAAGGAAAATGACAGAATTTTTGTTTCTG

TAACAAATGAGCAC

TTAATAGACATGGACCATGAAGCCAGTTTTTTCGGGGCCTTTTTAGTTGGCTAA

SEQ ID NO：47是CP1524序列(9587个碱基对)

GACGGATCGGGAGATCTCCCGATCCCCTATGGTGCACTCTCAGTACAATCTGCTCT

GATGCCGCATAGTTAAG

CCAGTATCTGCTCCCTGCTTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAA

TTTAAGCTACAACAAGG

CAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTTAGGCGTTTTGCGCT

GCTTCGCGATGTACGGG

CCAGATATACGCGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACG

GGGTCATTAGTTCATAG

CCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGAC

CGCCCAACGACCCCCGC

CCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCA

TTGACGTCAATGGGTGG

AGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGT

ACGCCCCCTATTGACGT

CAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACT

TTCCTACTTGGCAGTAC

ATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAA

TGGGCGTGGATAGCGGT

TTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTT

GGCACCAAAATCAACG

GGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGG

CGTGTACGGTGGGAGGTC

TATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCTTATCGA

AATTAATACGACTCACT

ATAGGGAGACCCAAGCTGGCTAGCGTTTAAACTTAAGCTTGATCCCCGCCCTCCCG

TAGAGGAGCCTCCACCG

GCCGTGGAGACAGTGTCTCCAGAGGGGCGTGGCGAAAAGCGTCCGCGCCCCGACA

GGGAAGAAACTCTGGTGA

CGCAAATAGACGAGCCTCCCTCGTACGAGGAGGCACTAAAGCAAGGCCTGCCCAC

CACCCGTCCCATCGCGCC

CATGGCTACCGGAGTGCTGGGCCAGCACACACCCGTAACGCTGGACCTGCCTCCCC

CCGCCGACACCCAGCAG

AAACCTGTGCTGCCAGGCCCGACCGCCGTTGTTGTAACCCGTCCTAGCCGCGCGTC

CCTGCGCCGCGCCGCCA

GCGGTCCGCGATCGTTGCGGCCCGTAGCCAGTGGCAACTGGCAAAGCACACTGAA

CAGCATCGTGGGTCTGGG

GGTGCAATCCCTGAAGCGCCGACGATGCTTCTGAATAGCTAACGTGTCGTATGTGT

GTCATGTATGCGTCCAT

GTCGCCGCCAGAGGAGCTGCTGAGCCGCCGCGCGCCCGCTTTCCAAGATGGCTAC

CCCTTCGATGATGCCGCA

GTGGTCTTACATGCACATCTCGGGCCAGGACGCCTCGGAGTACCTGAGCCCCGGGC

TGGTGCAGTTTGCCCGC

GCCACCGAGACGTACTTCAGCCTGAATAACAAGTTTAGAAACCCCACGGTGGCGC

CTACGCACGACGTGACCA

CAGACCGGTCCCAGCGTTTGACGCTGCGGTTCATCCCTGTGGACCGTGAGGATACT

GCGTACTCGTACAAGGC

GCGGTTCACCCTAGCTGTGGGTGATAACCGTGTGCTGGACATGGCTTCCACGTACT

TTGACATCCGCGGCGTG

CTGGACAGGGGCCCTACTTTTAAGCCCTACTCTGGCACTGCCTACAACGCCCTGGC

TCCCAAGGGTGCCCCAA

ATCCTTGCGAATGGGATGAAGCTGCTACTGCTCTTGAAATAAACCTAGAAGAAGA

GGACGATGACAACGAAGA

CGAAGTAGACGAGCAAGCTGAGCAGCAAAAAACTCACGTATTTGGGCAGGCGCCT

TATTCTGGTATAAATATT

ACAAAGGAGGGTATTCAAATAGGTGTCGAAGGTCAAACACCTAAATATGCCGATA

AAACATTTCAACCTGAAC

CTCAAATAGGAGAATCTCAGTGGTACGAAACTGAAATTAATCATGCAGCTGGGAG

AGTCCTTAAAAAGACTAC

CCCAATGAAACCATGTTACGGTTCATATGCAAAACCCACAAATGAAAATGGAGGG

CAAGGCATTCTTGTAAAG

CAACAAAATGGAAAGCTAGAAAGTCAAGTGGAAATGCAATTTTTCTCAACTACTG

AGGCGACCGCAGGCAATG

GTGATAACTTGACTCCTAAAGTGGTATTGTACAGTGAAGATGTAGATATAGAAACC

CCAGACACTCATATTTC

TTACATGCCCACTATTAAGGAAGGTAACTCACGAGAACTAATGGGCCAACAATCT

ATGCCCAACAGGCCTAAT

TACATTGCTTTTAGGGACAATTTTATTGGTCTAATGTATTACAACAGCACGGGTAA

TATGGGTGTTCTGGCGG

GCCAAGCATCGCAGTTGAATGCTGTTGTAGATTTGCAAGACAGAAACACAGAGCT

TTCATACCAGCTTTTGCT

TGATTCCATTGGTGATAGAACCAGGTACTTTTCTATGTGGAATCAGGCTGTTGACA

GCTATGATCCAGATGTT

AGAATTATTGAAAATCATGGAACTGAAGATGAACTTCCAAATTACTGCTTTCCACT

GGGAGGTGTGATTAATA

CAGAGACTCTTACCAAGGTAAAACCTAAAACAGGTCAGGAAAATGGATGGGAAA

AAGATGCTACAGAATTTTC

AGATAAAAATGAAATAAGAGTTGGAAATAATTTTGCCATGGAAATCAATCTAAAT

GCCAACCTGTGGAGAAAT

TTCCTGTACTCCAACATAGCGCTGTATTTGCCCGACAAGCTAAAGTACAGTCCTTC

CAACGTAAAAATTTCTG

ATAACCCAAACACCTACGACTACATGAACAAGCGAGTGGTGGCTCCCGGGTTAGT

GGACTGCTACATTAACCT

TGGAGCACGCTGGTCCCTTGACTATATGGACAACGTCAACCCATTTAACCACCACC

GCAATGCTGGCCTGCGC

TACCGCTCAATGTTGCTGGGCAATGGTCGCTATGTGCCCTTCCACATCCAGGTGCC

TCAGAAGTTCTTTGCCA

TTAAAAACCTCCTTCTCCTGCCGGGCTCATACACCTACGAGTGGAACTTCAGGAAG

GATGTTAACATGGTTCT

GCAGAGCTCCCTAGGAAATGACCTAAGGGTTGACGGAGCCAGCATTAAGTTTGAT

AGCATTTGCCTTTACGCC

ACCTTCTTCCCCATGGCCCACAACACCGCCTCCACGCTTGAGGCCATGCTTAGAAA

CGACACCAACGACCAGT

CCTTTAACGACTATCTCTCCGCCGCCAACATGCTCTACCCTATACCCGCCAACGCT

ACCAACGTGCCCATATC

CATCCCCTCCCGCAACTGGGCGGCTTTCCGCGGCTGGGCCTTCACGCGCCTTAAGA

CTAAGGAAACCCCATCA

CTGGGCTCGGGCTACGACCCTTATTACACCTACTCTGGCTCTATACCCTACCTAGAT

GGAACCTTTTACCTCA

ACCACACCTTTAAGAAGGTGGCCATTACCTTTGACTCTTCTGTCAGCTGGCCTGGC

AATGACCGCCTGCTTAC

CCCCAACGAGTTTGAAATTAAGCGCTCAGTTGACGGGGAGGGTTACAACGTTGCC

CAGTGTAACATGACCAAA

GACTGGTTCCTGGTACAAATGCTAGCTAACTACAACATTGGCTACCAGGGCTTCTA

TATCCCAGAGAGCTACA

AGGACCGCATGTACTCCTTCTTTAGAAACTTCCAGCCCATGAGCCGTCAGGTGGTG

GATGATACTAAATACAA

GGACTACCAACAGGTGGGCATCCTACACCAACACAACAACTCTGGATTTGTTGGCT

ACCTTGCCCCCACCATG

CGCGAAGGACAGGCCTACCCTGCTAACTTCCCCTATCCGCTTATAGGCAAGACCGC

AGTTGACAGCATTACCC

AGAAAAAGTTTCTTTGCGATCGCACCCTTTGGCGCATCCCATTCTCCAGTAACTTTA

TGTCCATGGGCGCACT

CACAGACCTGGGCCAAAACCTTCTCTACGCCAACTCCGCCCACGCGCTAGACATGA

CTTTTGAGGTGGATCCC

ATGGACGAGCCCACCCTTCTTTATGTTTTGTTTGAAGTCTTTGACGTGGTCCGTGTG

CACCGGCCGCACCGCG

GCGTCATCGAAACCGTGTACCTGCGCACGCCCTTCTCGGCCGGCAACGCCACAACA

TAAAGAAGCAAGCAACA

TCAACAACAGCTGCCGCCATGGGCTCCAGTGAGCAGGAACTGAAAGCCATTGTCA

AAGATCTTGGTTGTGGGC

CATATTTTTTGGGCACCTATGACAAGCGCTTTCCAGGCTTTGTTTCTCCACACAAGC

TCGCCTGCGCCATAGT

CAATACGGCCGGTCGCGAGACTGGGGGCGTACACTGGATGGCCTTTGCCTGGAAC

CCGCACTCAAAAACATGC

TACCTCTTTGAGCCCTTTGGCTTTTCTGACCAGCGACTCAAGCAGGTTTACCAGTTT

GAGTACGAGTCACTCC

TGCGCCGTAGCGCCATTGCTTCTTCCCCCGACCGCTGTATAACGCTGGAAAAGTCC

ACCCAAAGCGTACAGGG

GCCCAACTCGGCCGCCTGTGGACTATTCTGCTGCATGTTTCTCCACGCCTTTGCCAA

CTGGCCCCAAACTCCC

ATGGATCACAACCCCACCATGAACCTTATTACCGGGGTACCCAACTCCATGCTCAA

CAGTCCCCAGGTACAGC

CCACCCTGCGTCGCAACCAGGAACAGCTCTACAGCTTCCTGGAGCGCCACTCGCCC

TACTTCCGCAGCCACAG

TGCGCAGATTAGGAGCGCCACTTCTTTTTGTCACTTGAAAAACATGTAAAAATAAT

GTACTAGAGACACTTTC

AATAAAGGCAAATGCTTTTATTTGTACACTCTCGGGTGATTATTTACCCCCACCCTT

GCCGTCTGCGCCGTTT

AAAAATCAAAGGGGTTCTGCCGCGCATCGCTATGCGCCACTGGCAGGGACACGTT

GCGATACTGGTGTTTAGT

GCTCCACTTAAACTCAGGCACAACCATCCGCGGCAGCTCGGTGAAGTTTTCACTCC

ACAGGCTGCGCACCATC

ACCAACGCGTTTAGCAGGTCGGGCGCCGATATCTTGAAGTCGCAGTTGGGGCCTCC

GCCCTGCGCGCGCGAGT

TGCGATACACAGGGTTGCAGCACTGGAACACTATCAGCGCCGGGTGGTGCACGCT

GGCCAGCACGCTCTTGTC

GGAGATCAGATCCGC

GGAGATCAGATCCGCGTCCAGGTCCTCCGCGTTGCTCAGGGCGAACGGAGTCAAC

TTTGGTAGCTGCCTTCCC

AAAAAGGGCGCGTGCCCAGGCTTTGAGTTGCACTCGCACCGTAGTGGCATCAAAA

GGTGACCGTGCCCGGTCT

GGGCGTTAGGATACAGCGCCTGCATAAAAGCCTTGATCTGCTTAAAAGCCACCTG

AGCCTTTGCGCCTTCAGA

GAAGAACATGCCGCAAGACTTGCCGGAAAACTGATTGGCCGGACAGGCCGCGTCG

TGCACGCAGCACCTTGCG

TCGGTGTTGGAGATCTGCACCACATTTCGGCCCCACCGGTTCTTCACGATCTTGGC

CTTGCTAGACTGCTCCT

TCAGCGCGCGCTGCCCGTTTTCGCTCGTCACATCCATTTCAATCACGTGCTCCTTAT

TTATCATAATGCTTCC

GTGTAGACACTTAAGCTCGCCTTCGATCTCAGCGCAGCGGTGCAGCCACAACGCGC

AGCCCGTGGGCTCGTGA

TGCTTGTAGGTCACCTCTGCAAACGACTGCAGGTACGCCTGCAGGAATCGCCCCAT

CATCGTCACAAAGGTCT

TGTTGCTGGTGAAGGTCAGCTGCAACCCGCGGTGCTCCTCGTTCAGCCAGGTCTTG

CATACGGCCGCCAGAGC

TTCCACTTGGTCAGGCAGTAGTTTGAAGTTCGCCTTTAGATCGTTATCCACGTGGTA

CTTGTCCATCAGCGCG

CGCGCAGCCTCCATGCCCTTCTCCCACGCAGACACGATCGGCACACTCAGCGGGTT

CATCACCGTAATTTCAC

TTTCCGCTTCGCTGGGCTCTTCCTCTTCCTCTTGCGTCCGCATACCACGCGCCACTG

GGTCGTCTTCATTCAG

CCGCCGCACTGTGCGCTTACCTCCTTTGCCATGCTTGATTAGCACCGGTGGGTTGCT

GAAACCCACCATTTGT

AGCGCCACATCTTCTCTTTCTTCCTCGCTGTCCACGATTACCTCTGGTGATGGCGGG

CGCTCGGGCTTGGGAG

AAGGGCGCTTCTTTTTCTTCTTGGGCGCAATGGCCAAATCCGCCGCCGAGGTCGAT

GGCCGCGGGCTGGGTGT

GCGCGGCACCAGCGCGTCTTGTGATGAGTCTTCCTCGTCCTCGGACTCGATACGCC

GCCTCATCCGCTTTTTT

GGGGGCGCCCGGGGAGGCGGCGGCGACGGGGACGGGGACGACACGTCCTCCATG

GTTGGGGGACGTCGCGCCG

CACCGCGTCCGCGCTCGGGGGTGGTTTCGCGCTGCTCCTCTTCCCGACTGGCCATTT

CCTTCTCCTATAGGCA

GAAAAAGATCATGGAGTCAGTCGAGAAGAAGGACAGCCTAACCGCCCCCTCTGAG

TTCGCCACCACCGCCTCC

ACCGATGCCGCCAACGCGCCTACCACCTTCCCCGTCGAGGCACCCCCGCTTGAGGA

GGAGGAAGTGATTATCG

AGCAGGACCCAGGTTTTGTAAGCGAAGACGACGAGGACCGCTCAGTACCAACAGA

GGATAAAAAGCAAGACCA

GGACAACGCAGAGGCAAACGAGGAACAAGTCGGGCGGGGGGACGAAAGGCATGG

CGACTACCTAGATGTGGGA

GACGACGTGCTGTTGAAGCATCTGCAGCGCCAGTGCGCCATTATCTGCGACGCGTT

GCAAGAGCGCAGCGATG

TGCCCCTCGCCATAGCGGATGTCAGCCTTGCCTACGAACGCCACCTATTCTCACCG

CGCGTACCCCCCAAACG

CCAAGAAAACGGCACATGCGAGCCCAACCCGCGCCTCAACTTCTACCCCGTATTTG

CCGTGCCAGAGGTGCTT

GCCACCTATCACATCTTTTTCCAAAACTGCAAGATACCCCTATCCTGCCGTGCCAA

CCGCAGCCGAGCGGACA

AGCAGCTGGCCTTGCGGCAGGGCGCTGTCATACCTGATATCGCCTCGCTCAACGAA

GTGCCAAAAATCTTTGA

GGGTCTTGGACGCGACGAGAAGCGCGCGGCAAACGCTCTGCAACAGGAAAACAG

CGAAAATGAAAGTCACTCT

GGAGTGTTGGTGGAACTCGAGTTACCGTCGACCTCTAGCTAGAGCTTGGCGTAATC

ATGGTCATAGCTGTTTC

CTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATA

AAGTGTAAAGCCTGGGG

TGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCC

AGTCGGGAAACCTGTCG

TGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTG

GGCGCTCTTCCGCTTCCT

CGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCAC

TCAAAGGCGGTAATACG

GTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCA

GCAAAAGGCCAGGAACCGTA

AAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCAC

AAAAATCGACGCTCAAGT

CAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAA

GCTCCCTCGTGCGCTCTCC

TGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGT

GGCGCTTTCTCATAGCT

CACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTG

CACGAACCCCCCGTTCAG

CCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACA

CGACTTATCGCCACTGGC

AGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAG

TTCTTGAAGTGGTGGCCTA

ACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTT

ACCTTCGGAAAAAGAGTT

GGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTTTTTTTGTTTGCAA

GCAGCAGATTACGCGCAG

AAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGT

GGAACGAAAACTCACGTT

AAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAAT

TAAAAATGAAGTTTTAAA

TCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAG

TGAGGCACCTATCTCAGC

GATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTAC

GATACGGGAGGGCTTAC

CATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGAT

TTATCAGCAATAAACCAG

CCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCC

AGTCTATTAATTGTTGCCG

GGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTG

CTACAGGCATCGTGGTGT

CACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGA

GTTACATGATCCCCCATG

TTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTT

GGCCGCAGTGTTATCACT

CATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTT

TTCTGTGACTGGTGAGT

ACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCG

GCGTCAATACGGGATAAT

ACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGG

GCGAAAACTCTCAAGGAT

CTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTT

CAGCATCTTTTACTTTCA

CCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAA

TAAGGGCGACACGGAAATGT

TGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGT

CTCATGAGCGGATACAT

ATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAA

AAGTGCCACCTGACGTC

SEQ ID NO：48是CP 1606 REV序列(3855个碱基对)

AGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAG

CTGGCACGACAGGTTTCCCG

ACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTA

GGCACCCCAGGCTTTACACT

TTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACA

GGAAACAGCTATGACCATG

ATTACGCCAAGCTTGGTACCGAGCTCGGATCCACTAGTAACGGCCGCCAGTGTGC

TGGAATTCGCCCTTGACGCG

GCCTGTCCGGCCAATCAGTTTTCCGGCAAGTCTTGCGGCATGTTCTTCTCTGAAGG

CGCAAAGGCTCAGGTGGCT

TTTAAGCAGATCAAGGCTTTTATGCAGGCGCTGTATCCTAACGCCCAGACCGGGC

ACGGTCACCTTTTGATGCCA

CTACGGTGCGAGTGCAACTCAAAGCCTGGGCACGCGCCCTTTTTGGGAAGGCAGC

TACCAAAGTTGACTCCGTTC

GCCCTGAGCAACGCGGAGGACCTGGACGCGGATCTGATCTCCGACAAGAGCGTG

CTGGCCAGCGTGCACCACCCG

GCGCTGATAGTGTTCCAGTGCTGCAACCCTGTGTATCGCAACTCGCGCGCGCAGG

GCGGAGGCCCCAACTGCGAC

TTCAAGATATCGGCGCCCGACCTGCTAAACGCGTTGGTGATGGTGCGCAGCCTGT

GGAGTGAAAACTTCACCGAG

CTGCCGCGGATGGTTGTGCCTGAGTTTAAGTGGAGCACTAAACACCAGTATCGCA

ACGTGTCCCTGCCAGTGGCG

CATAGCGATGCGCGGCAGAACCCCTTTGATTTTTAAACGGCGCAGACGGCAAGGG

TGGGGGTAAATAATCACCCG

AGAGTGTACAAATAAAAGCATTTGCCTTTATTGAAAGTGTCTCTAGTAGCTAGCG

GGAGGGAGGTCCTGGTCTAG

ACATTCAGAGCTTGTAGAATTTCTGCATCCAGGTCAGAAGAATGTCCACTTCCCCA

AGGGCTTTGGTCAGAGCTG

CTTCTACGTCCAACTGTTTGAATGCTCTCCGGAATAGCAGAAACCGCCTGTGTGCA

CTGTCTCTGATGGAAAACA

TCTCATTTTCTTGACTGGGTTGCAGTTGTGACACGATGAGAACAAAGTTGTTGGCC

AGAGTAGAGAATGACTTCA

GAGTCCTGACTTCAACTGTTCTATTGTGGTGGTTTTTGAAAACAGTTTTCAAGTAG

AACTCCAGCAGGGTGTGGA

CAAGGTAACAGCTCTCAGCATCCGAGACGTTCTGCAGAACCTCCTGCTGCAGCAG

CCGGGCACTCGTGATGTTAT

CCTGAGCTTGCATAGTGTCTTTCACAGCCCAGAAGGCTTCCCACAGTTTCTGGGGA

ACAACCCCCTTCACTTGGC

AGGGCCCAAAGTGGAATTCTTGGCCCTGGGCCCCTGATACCTGGCTCCAGAGAAG

CAGGGTAAAACCCAGGCAAG

GGAGCACAACCATCTGCATTTGAGAGGCTGTCGCCAGCAAAGGAGGGCAGAAGG

GTCTGGCTAAAGTCCACAGGC

TTTGCAGCCTCTGTTGAAAATTCATGATGGCCCTCCTACCGCCTGGATGAATAACA

ATAGTACGAGTCATAAGTA

ATTATTTTTACATGTTTTTCAAGTGACAAAAAGAAGTGGCGCTCCTAATCTGCGCA

CTGTGGCTGCGGAAGTAGG

GCGAGTGGCGCTCCAGGAAGCTGTAGAGCTGTTCCTGGTTGCGACGCAGGGTGGG

CTGTACCTGGGGACTGTTGA

GCATGGAGTTGGGTACCCCGGTAAAAAGGGCGAATTCTGCAGATATCCATCACAC

TGGCGGCCGCTCGAGCATGC

ATCTAGAGGACCGCTATCAGGACATAGCGTTGGCTACCCGTGATATTGCTGAAGA

GCTTGGCGGCGAATGGGCTG

ACCGCTTCCTCGTGCTTTACGGTATCGCCGCTCCCGATTCGCAGCGCATCGCCTTC

TATCGCCTTCTTGACGAGT

TCTTCTGAATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTA

TTCCCTTTTTTGCGGCATT

TTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAA

GATCAGTTGGGTGCACGAGT

GGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCC

GAAGAACGTTTTCCAATGAT

GAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGC

AAGAGCAACTCGGTCGCCG

CATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCAT

CTTACGGATGGCATGACAGT

AAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTA

CTTCTGACAACGATCGGAGG

ACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTT

GATCGTTGGGAACCGGAGCT

GAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGC

AACAACGTTGCGCAAACTATT

AACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAG

GCGGATAAAGTTGCAGGACC

ACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCG

GTGAGCGTGGGTCTCGCGG

TATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACA

CGACGGGGAGTCAGGCAAC

TATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCAT

TGGTAACTGTCAGACCAAGT

TTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTA

GGTGAAGATCCTTTTTGA

TAATCTCATGCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCA

GACCCCGTAGAAAAGATCA

AAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAA

AAACCACCGCTACCAGCGG

TGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTC

AGCAGAGCGCAGATACCAA

ATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCA

CCGCCTACATACCTCGCTC

TGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGG

TTGGACTCAAGACGATAGT

TACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCA

GCTTGGAGCGAACGACCTACA

CCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGG

GAGAAAGGCGGACAGGTATC

CGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAA

ACGCCTGGTATCTTTATAGTC

CTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGG

GGGCGGAGCCTATGGAAAA

ACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCAC

ATGTTCTTTCCTGCGTTAT

CCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGC

CGCAGCCGAACGACCGAGC

GCAGCGAGTCAGTGAGCGAGGAAGCGGAAG

SEQ ID NO：49 is the sequence for OV 1165

CAGGGTAATCATCATCAATAATATACCTTATTTTGGATTGAA

GCCAATATGATAATGAGG

GGGTGGAGTTTGTGACGTGGCGCGGGGCGTGGGAACGGGGC

GGGTGACGTAGTAGTGTGG

CGGAAGTGTGATGTTGCAAGTGTGGCGGAACACATGTAAGC

GACGGATGTGGCAAAAGTG

ACGTTTTTGGTGTGCGCCGGTGTACACAGGAAGTGACAATTT

TCGCGCGGTTTTAGGCGG

ATGTTGTAGTAAATTTGGGCGTAACCGAGTAAGATTTGGCCA

TTTTCGCGGGAAAACTGA

ATAAGAGGAAGTGAAATCTGAATAATTTTGTGTTACTCATAG

CGCGTAATATTTGTCTAG

GGCCGGGATCTCTGCAGGAATTTGATATCAAGCTTATCGATA

CCGTCGAAACTTGTTTAT

TGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAA

TTTCACAAATAAAGCATT

TTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAAT

GTATCTTATCATGTCTG

GATCGATCCGCTAGCGGCGCGCCGTTTCATCCGGACAAAGCC

TGCGCGCGCCCCGCCCCG

CCATTGGCCGTACCGCCCCGCGCCGCCGCCCCATCTCGCCCC

TCGCCGCCGGGTCCGGCG

CGTTAAAGCCAATAGGAACCGCCGCCGTTGTTCCCGTCACGG

CCGGGGCAGCCAATTGTG

GCGGCGCTCGGCGGCTCGTGGCTCTTTCGCGGCAAAAAGGAT

TTGGCGCGTAAAAGTGGC

CGGGACTTTGCAGGCAGCGGCGGCCGGGGGCGGAGCGGGAT

CGAGCCCTCGATGATATCA

GATCAAACGATATCACCGGTCGACTGAAAATGAGACATATTA

TCTGCCACGGAGGTGTTA

TTACCGAAGAAATGGCCGCCAGTCTTTTGGACCAGCTGATCG

AAGAGGTACTGGCTGATA

ATCTTCCACCTCCTAGCCATTTTGAACCACCTACCCTTCACGA

ACTGTATGATTTAGACG

TGACGGCCCCCGAAGATCCCAACGAGGAGGCGGTTTCGCAG

ATTTTTCCCGACTCTGTAA

TGTTGGCGGTGCAGGAAGGGATTGACTTACTCACTTTTCCGC

CGGCGCCCGGTTCTCCGG

AGCCGCCTCACCTTTCCCGGCAGCCCGAGCAGCCGGAGCAGA

GAGCCTTGGGTCCGGTTT＝

CTATGCCAAACCTTGTACCGGAGGTGATCGATCTTACCTGCC

ACGAGGCTGGCTTTCCAC

CCAGTGACGACGAGGATGAAGAGGGTGAGGAGTTTGTGTTA

GATTATGTGGAGCACCCCG

GGCACGGTTGCAGGTCTTGTCATTATCACCGGAGGAATACGG

GGGACCCAGATATTATGT

GTTCGCTTTGCTATATGAGGACCTGTGGCATGTTTGTCTACAG

TAAGTGAAAATTATGGG

CAGTGGGTGATAGAGTGGTGGGTTTGGTGTGGTAATTTTTTTT

TTAATTTTTACAGTTTT

GTGGTTTAAAGAATTTTGTATTGTGATTTTTTTAAAAGGTCCT

GTGTCTGAACCTGAGCC

TGAGCCCGAGCCAGAACCGGAGCCTGCAAGACCTACCCGCC

GTCCTAAAATGGCGCCTGC

TATCCTGAGACGCCCGACATCACCTGTGTCTAGAGAATGCAA

TAGTAGTACGGATAGCTG

TGACTCCGGTCCTTCTAACACACCTCCTGAGATACACCCGGT

GGTCCCGCTGTGCCCCAT

TAAACCAGTTGCCGTGAGAGTTGGTGGGCGTCGCCAGGCTGT

GGAATGTATCGAGGACTT

GCTTAACGAGCCTGGGCAACCTTTGGACTTGAGCTGTAAACG

CCCCAGGCCATAAGGTGT

AAACCTGTGATTGCGTGTGTGGTTAACGCCTTTGTTTGCTGAA

TGAGTTGATGTAAGTTT

AATAAAGGGTGAGATAATGTTTAACTTGCATGGCGTGTTAAA

TGGGGCGGGGCTTAAA GG

GTATATAATGCGCCGTGGGCTAATCTTGGTTACATCTGACCTC

ATGGAGGCTTGGGAGTG

TTTGGAAGATTTTTCTGCTGTGCGTAACTTGCTGGAACAGAG

CTCTAACAGTACCTCTTG

GTTTTGGAGGTTTCTGTGGGGCTCATCCCAGGCAAAGTT’AGT

CTGCAGA A TTAAGGAGGA

TTACAAGTGGGAATTTGAAGAGCTTTTGAAATCCTGTGGTGA

GCTGTTTGATTCTTTGAA

TCTGGGTCACCAGGCGCTTTTCCAAGAGAAGGTCATCAAGAC

TTTGGATTTTCCACACC

GGGGCGCGCTGCGGCTGCTGTTGCTTTTTTGAGTTTTATAAAG

GATA A ATGGAGCGAAGA

AACCCATCTGAGCGGGGGGTACCTGCTGGATTTTCTGGCCAT

GCATCTGTGGAGAGCGGT

TGTGAGACACAAGAATCGCCTGCTACTGTTGTCTTCCGTCCG

CCCGGCGATAATACCGAC

GGAGGAGCAGCAGCAGCAGCAGGAGGAAGCCAGGCGGCGG

CGGCAGGAGCAGAGCCCATG

GAACCCGAGAGCCGGCCTGGACCCTCGGGAATGAATGTTGTA

CAGGTGGCTGAACTGTAT

CCAGAACTGAGACGCATTTTGACAATTACAGAGGATGGGCA

GGGGCTA A AGGGGGTAAAG

AGGGAGCGGGGGGCTTGTGAGGCTACAGAGGAGGCTAGGAA

TCTAGCTTTTAGCTTAATG

ACCAGACACCGTCCTGAGTGTATTACTTTTCAACAGATCAAG

GATAATTGCGCTAATGAG

CTTGATCTGCTGGCGCAGAAGTATTCCATAGAGCAGCTGACC

ACTTACTGGCTGCAGCCA

GGGGATGATTTTGAGGAGGCTATTAGGGTATATGCAAAGGTG

GCACTTAGGCCAGATTGC

AAGTACAAGATCAGCAAACTTGTAAATATCAGGAATTGTTGC

TACATTTCTGGGAACGGG

GCCGAGGTGGAGATAGATACGGAGGATAGGGTGGCCTTTAG

ATGTAGCATGATAAATATG

TGGCCGGGGGTGCTTGGCATGGACGGGGTGGTTATTATGAAT

GTAAGGTTTACTGGCCCC

AATTTTAGCGGTACGGTTTTCCTGGCCAATACCAACCTTATCC

TACACGGTGTAAGCTTC

TATGGGTTTAACAATACCTGTGTGGAAGCCTGGACCGATGTA

AGGGTTCGGGGCTGTGCC

TTTTACTGCTGCTGGAAGGGGGTGGTGTGTCGCCCCAAAAGC

AGGGCTTCAATTAAGAAA

TGCCTCTTTGAAAGGTGTACCTTGGGTATCCTGTCTGAGGGTA

ACTCCAGGGTGCGCCAC

AATGTGGCCTCCGACTGTGGTTGCTTCATGCTAGTGAAAAGC

GTGGCTGTGATTAAGCAT

AACATGGTATGTGGCAACTGCGAGGACAGGGCCTCTCAGATG

CTGACCTGCTCGGACGGC

AACTGTCACCTGCTGAAGACCATTCACGTAGCCAGCCACTCT

CGCAAGGCCTGGCCAGTG

TTTGAGCATAACATACTGACCCGCTGTTCCTTGCATTTGGGTA

ACAGGAGGGGGGTGTTC

CTACCTTACCAATGCAATTTGAGTCACACTAAGATATTGCTTG

AGCCCGAGAGCATGTCC

AAGGTGAACCTGAACGGGGTGTTTGACATGACCATGAAGATC

TGGAAGGTGCTGAGGTAC

GATGAGACCCGCACCAGGTGCAGACCCTGCGAGTGTGGCGG

TAAACATATTAGGAACCAG

CCTGTGATGCTGGATGTGACCGAGGAGCTGAGGCCCGATCAC

TTGGTGCTGGCCTGCACC

CGCGCTGAGTTTGGCTCTAGCGATGAAGATACAGATTGAGGT

ACTGAAATGTGTGGGCGT

GGCTTAAGGGTGGGAAAGAATATATAAGGTGGGGGTCTTAT

GTAGTTTTGTATCTGTTTT

GCAGCAGCCGCCGCCGCCATGAGCACCAACTCGTTTGATGGA

AGCATTGTGAGCTCATAT

TTGACAACGCGCATGCCCCCATGGGCCGGGGTGCGTCAGAAT

GTGATGGGCTCCAGCATT

GATGGTCGCCCCGTCCTGCCCGCAAACTCTACTACCTTGACCT

ACGAGACCGTGTCTGGA

ACGCCGTTGGAGACTGCAGCCTCCGCCGCCGCTTCAGCCGCT

GCAGCCACCGCCCGCGGG

ATTGTGACTGACTTTGCTTTCCTGAGCCCGCTTGCAAGCAGTG

CAGCTTCCCGTTCATCC

GCCCGCGATGACAAGTTGACGGCTCTTTTGGCACAATTGGAT

TCTTTGACCCGGGAACTT

AATGTCGTTTCTCAGCAGCTGTTGGATCTGCGCCAGCAGGTTT

CTGCCCTGAAGGCTTCC

TCCCCTCCCAATGCGGTTTAAAACATAAATAAAAAACCAGAC

TCTGTTTGGATTTGGATC

AAGCAAGTGTCTTGCTGTCTTTATTTAGGGGTTTTGCGCGCGC

GGTAGGCCCGGGACCAG

CGGTCTCGGTCGTTGAGGGTCCTGTGTATTTTTTCCAGGACGT

GGTAAAGGTGACTCTGG

ATGTTCAGATACATGGGCATAAGCCCGTCTCTGGGGTGGAGG

TAGCACCACTGCAGAGCT

TCATGCTGCGGGGTGGTGTTGTAGATGATCCAGTCGTAGCAG

GAGCGCTGGGCGTGGTGC

CTAAAAATGTCTTTTCAGTAGCAAGCTGATTGCCAGGGGCAGG

CCCTTGGTGTAAGTGTTT

ACAA AGCGGTTAAGCTGGGATGGGTGCATACGTGGGGATAT

GAGATGCATCTTGGACTGT

ATTTTTAGGTTGGCTATGTTCCCAGCCATATCCCTCCGGGGAT

TCATGTTGTGCAGAACC

ACCAGCACAGTGTATCCGGTGCACTTGGGAAATTTGTCATGT

AGCTTAGAAGGA AA TGCG

TGGAAGAACTTGGAGACGCCCTTGTGACCTCCAAGATTTTCC

ATGCATTCGTCCATAATG

ATGGCAATGGGCCCACGGGCGGCGGCCTGGGCGAAGATATT

TCTGGGATCACTAACGTCA

TAGTTGTGTTCCAGGATGAGATCGTCATAGGCCATTTTTACA

AAGCGCGGGCGGAGGGTG

CCAGACTGCGGTATAATGGTTCCATCCGGCCCAGGGGCGTAG

TTACCCTCACAGATTTGC

ATTTCCCACGCTTTGAGTTCAGATGGGGGGATCATGTCTACCT

GCGGGGCGATGAAGAAA

ACGGTTTCCGGGGTAGGGGAGATCAGCTGGGAAGAAAGCAG

GTTCCTGAGCAGCTGCGAC

TTACCGCAGCCGGTGGGCCCGTAAATCACACCTATTACCGGG

TGCAACTGGTAGTTAAGA

GAGCTGCAGCTGCCGTCATCCCTGAGCAGGGGGGCCACTTCG

TTAAGCATGTCCCTGACT

CGCATGTTTTCCCTGACCAAATCCGCCAGAAGGCGCTCGCCG

CCCAGCGATAGCAGTTCT

TGCAAGGAAGCAAAGTTTTTCAACGGTTTGAGACCGTCCGCC

GTAGGCATGCTTTTGAGC

GTTTGACCAAGCAGTTCCAGGCGGTCCCACAGCTCGGTCACC

TGCTCTACGGCATCTCGA

TCCAGCATATCTCCTCGTTTCGCGGGTTGGGGCGGCTTTCGCT

GTACGGCAGTAGTCGGT

GCTCGTCCAGACGGGCCAGGGTCATGTCTTTCCACGGGCGCA

GGGTCCTCGTCAGCGTAG

TCTGGGTCACGGTGAAGGGGTGCGCTCCGGGCTGCGCGCTGG

CCAGGGTGCGCTTGAGGC

TGGTCCTGCTGGTGCTGAAGCGCTGCCGGTCTTCGCCCTGCG

CGTCGGCCAGGTAGCATT

TGACCATGGTGTCATAGTCCAGCCCCTCCGCGGCGTGGCCCT

TGGCGCGCAGCTTGCCCT

TGGAGGAGGCGCCGCACGAGGGGCAGTGCAGACTTTTGAGG

GCGTAGAGCTTGGGCGCGA

GAAATACCGATTCCGGGGAGTAGGCATCCGCGCCGCAGGCC

CCGCAGACGGTCTCGCATT

CCACGAGCCAGGTGAGCTCTGGCCGTTCGGGGTCAAAAACCA

GGTTTCCCCCATGCTTTT

TGATGCGTTTCTTACCTCTGGTTTCCATGAGCCGGTGTCCACG

CTCGGTGACGAAAAGGC

TGTCCGTGTCCCCGTATACAGACTTGAGAGGCCTGTCCTCGA

GCGGTGTTCCGCGGTCCT

CCTCGTATAGAAACTCGGACCACTCTGAGACAAAGGCTCGCG

TCCAGGCCAGCACGAAGG

AGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGG

TCCACTCGCTCCAGGGTGT

GAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTG

GTTTGTAGGTGTAGGCCA

CGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTG

GGGGCGCGTTCGTCCTCAC

TCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGGTG

AGTACTCCCTCTGAAAAG

CGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACG

AGGAGGATTTGATATTCA

CCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCATCCATCT

GGTCAGAAAAGACAATCT

TTTTGTTGTCAAGCTTGGTGGCAAACGACCCGTAGAGGGCGT

TGGACAGCAACTTGGCGA

GGAGCGCAGGGTTTGGTTTTTGTCGCGATCGGCGCGCTCCTT

GGCCGCGATGTTTAGCT

GCACGTATTCGCGCGCAACGCACCGCCATTCGGGAAAGACG

GTGGTGCGCTCGTCGGGCA

CCAGGTGCACGCGCCAACCGCGGTTGTGCAGGGTGACAAGG

TCAACGCTGGTGGCTACCT

CTCCGCGTAGGCGCTCGTTGGTCCAGCAGAGGCGGCCGCCCT

TGCGCGAGCAGAATGGCG

GTAGGGGGTCTAGCTGCGTCTCGTCCGGGGGGTCTGCGTCCA

CGGTAAAGACCCCGGGCA

GCAGGCGCGCGTCGAAGTAGTCTATCTTGCATCCTTGCAAGT

CTAGCGCCTGCTGCCATG

CGCGGGCGGCAAGCGCGCGCTCGTATGGGTTGAGTGGGGGA

CCCCATGGCATGGGGTGGG

TGAGCGCGGAGGCGTACATGCCGCAAATGTCGTAAACGTAG

AGGGGCTCTCTGAGTATTC

CAAGATATGTAGGGTAGCATCTTCCACCGCGGATGCTGGCGC

GCACGTAATCGTATAGTT

CGTGCGAGGGAGCGAGGAGGTCGGGACCGAGGTTGCTACGG

GCGGGCTGCTCTGCTCGGA

AGACTATCTGCCTGAAGATGGCATGTGAGTTGGATGATATGG

TTGGACGCTGGAAGACGT

TGAAGCTGGCGTCTGTGAGACCTACCGCGTCACGCACGAAGG

AGGCGTAGGAGTCGCGCA

GCTTGTTGACCAGCTCGGCGGTGACCTGCACGTCTAGGGCGC

AGTAGTCCAGGGTTTCCT

TGATGATGTCATACTTATCCTGTCCCTTTTTTTTCCACAGCTC

GCGGTTGAGGACAAACT

CTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGC

CTCCGAACGGTAAGAGC

CTAGCATGTAGAACTGGTTGACGGCCTGGTAGGCGCAGCATC

CCTTTTCTACGGGTAGCG

CGTATGCCTGCGCGGCCTTCCGGAGCGAGGTGTGGGTGAGCG

CAAAGGTGTCCCTGACCA

TGACTTTGAGGTACTGGTATTTGAAGTCAGTGTCGTCGCATCC

GCCCTGCTCCCAGAGCA

AAAAGTCCGTGCGCTTTTTGGAACGCGGATTTGGCAGGGCGA

AGGTGACATCGTTGAAGA

GTATCTTTCCCGCGCGAGGCATAAAGTTGCGTGTGATGCGGA

AGGGTCCCGGCACCTCGG

AACGGTTGTTAATTACCTGGGCGGCGAGCACGATCTCGTCAA

AGCCGTTGATGTTGTGGC

CCACAATGTAAAGTTCCAAGAAGCGCGGGATGCCCTTGATGG

AAGGCAATTTTTTAAGTT

CCTCGTAGGTGAGCTCTTCAGGGGAGCTGAGCCCGTGCTCTG

AAAGGGCCCAGTCTGCAA

GATGAGGGTTGGAAGCGACGAATGAGCTCCACAGGTCACGG

GCCATTAGCATTTGCAGGT

GGTCGCGAAAGGTCCTAAACTGGCGACCTATGGCCATTTTTT

CTGGGGTGATGCAGTAGA

AGGTAAGCGGGTCTTGTTCCCAGCGGTCCCATCCAAGGTTCG

CGGCTAGGTCTCGCGCGG

CAGTCACTAGAGGCTCATCTCCGCCGAACTTCATGACCAGCA

TGAAGGGCACGAGCTGCT

TCCCAAAGGCCCCCATCCAAGTATAGGTCTCTACATCGTAGG

TGACAAAGAGACGCTCGG

TGCGAGGATGCGAGCCGATCGGGAAGAACTGGATCTCCCGC

CACCAATTGGAGGAGTGGC

TATTGATGTGGTGAAAGTAGAAGTCCCTGCGACGGGCCGAAC

ACTCGTGCTGGCTTTTGT

AAAAACGTGCGCAGTACTGGCAGCGGTGCACGGGCTGTACA

TCCTGCACGAGGTTGACCT

GACGACCGCGCACAAGGAAGCAGAGTGGGAATTTGAGCCCC

TCGCCTGGCGGGTTTGGCT

GGTGGTCTTCTACTTCGGCTGCTTGTCCTTGACCGTCTGGCTG

CTCGAGGGGAGTTACGG

TGGATCGGACCACCACGCCGCGCGAGCCCAAAGTCCAGATGT

CCGCGCGCGGCGGTCGGA

GCTTGATGACAACATCGCGCAGATGGGAGCTGTCCATGGTCT

GGAGCTCCCGCGGCGTCA

GGTCAGGCGGGAGCTCCTGCAGGTTTACCTCGCATAGACGGG

TCAGGGCGCGGGCTAGAT

CCAGGTGATACCTAATTTCCAGGGGCTGGTTGGTGGCGGCGT

CGATGGCTTGCAAGAGGC

CGCATCCCCGCGGCGCGACTACGGTACCGCGCGGCGGGCGGT

GGGCCGCGGGGGTGTCCT

TGGATGATGCATCTAAAAGCGGTGACGCGGGCGAGCCCCCG

GAGGTAGGGGGGGCTCCGG

ACCCGCCGGGAGAGGGGGCAGGGGCACGTCGGCGCCGCGCG

CGGGCAGGAGCTGGTGCTG

CGCGCGTAGGTTGCTGGCGAACGCGACGACGCGGCGGTTGAT

CTCCTGAATCTGGCGCCT

CTGCGTGAAGACGACGGGCCCGGTGAGCTTGAGCCTGAAAG

AGAGTTCGACAGAATCAAT

TTCGGTGTCGTTGACGGCGGCCTGGCGCAAAATCTCCTGCAC

GTCTCCTGAGTTGTCTTG

ATAGGCGATCTCGGCCATGAACTGCTCGATCTCTTCCTCCTGGAGATCTCCGCGTC

CGGC

TCGCTCCACGGTGGCGGCGAGGTCGTTGGAAATGCGGGCCATGAGCTGCGAGAA

GGCGTT

GAGGCCTCCCTCGTTCCAGACGCGGCTGTAGACCACGCCCCCTTCGGCATCGCGG

GCGCG

CATGACCACCTGCGCGAGATTGAGCTCCACGTGCCGGGCGAAGACGGCGTAGTTT

CGCAG

GCGCTGAAAGAGGTAGTTGAGGGTGGTGGCGGTGTGTTCTGCCACGAAGAAGTAC

ATAAC

CCAGCGTCGCAACGTGGATTCGTTGATATCCCCCAAGGCCTCAAGGCGCTCCATG

GCCTC

GTAGAAGTCCACGGCGAAGTTGAAAAACTGGGAGTTGCGCGCCGACACGGTTAA

CTCCTC

CTCCAGAAGACGGATGAGCTCGGCGACAGTGTCGCGCACCTCGCGCTCAAAGGCT

ACAGG

GGCCTCTTCTTCTTCTTCAATCTCCTCTTCCATAAGGGCCTCCCCTTCTTCTTCTTCT

GG

CGGCGGTGGGGGAGGGGGGACACGGCGGCGACGACGGCGCACCGGGAGGCGGT

CGACAAA

GCGCTCGATCATCTCCCCGCGGCGACGGCGCATGGTCTCGGTGACGGCGCGGCCG

TTCTC

GCGGGGGCGCAGTTGGAAGACGCCGCCCGTCATGTCCCGGTTATGGGTTGGCGGG

GGGCT

GCCATGCGGCAGGGATACGGCGCTAACGATGCATCTCAACAATTGTTGTGTAGGT

ACTCC

GCCGCCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGAG

AAAGGC

GTCTAACCAGTCACAGTCGCAAGGTAGGCTGAGCACCGTGGCGGGCGGCAGCGG

GCGGCG

GTCGGGGTTGTTTCTGGCGGAGGTGCTGCTGATGATGTAATTAAAGTAGGCGGTC

TTGAG

ACGGCGGATGGTCGACAGAAGCACCATGTCCTTGGGTCCGGCCTGCTGAATGCGC

AGGCG

GTCGGCCATGCCCCAGGCTTCGTTTTGACATCGGCGCAGGTCTTTGTAGTAGTCTT

GCAT

GAGCCTTTCTACCGGCACTTCTTCTTCTCCTTCCTCTTGTCCTGCATCTCTTGCATC

TAT

CGCTGCGGCGGCGGCGGAGTTTGGCCGTAGGTGGCGCCCTCTTCCTCCCATGCGT

GTGAC

CCCGAAGCCCCTCATCGGCTGAAGCAGGGCTAGGTCGGCGACAACGCGCTCGGCT

AATAT

GGCCTGCTGCACCTGCGTGAGGGTAGACTGGAAGTCATCCATGTCCACAAAGCGG

TGGTA

TGCGCCCGTGTTGATGGTGTAAGTGCAGTTGGCCATAACGGACCAGTTAACGGTC

TGGTG

ACCCGGCTGCGAGAGCTCGGTGTACCTGAGACGCGAGTAAGCCCTCGAGTCAAAT

ACGTA

GTCGTTGCAAGTCCGCACCAGGTACTGGTATCCCACCAAAAAGTGCGGCGGCGGC

TGGCG

GTAGAGGGGCCAGCGTAGGGTGGCCGGGGCTCCGGGGGCGAGATCTTCCAACAT

AAGGCG

ATGATATCCGTAGATGTACCTGGACATCCAGGTGATGCCGGCGGCGGTGGTGGAG

GCGCG

CGGAAAGTCGCGGACGCGGTTCCAGATGTTGCGCAGCGGCAAAAAGTGCTCCATG

GTCGG

GACGCTCTGGCCGGTCAGGCGCGCGCAATCGTTGACGCTCTAGACCGTGCAAAAG

GAGAG

CCTGTAAGCGGGCACTCTTCCGTGGTCTGGTGGATAAATTCGCAAGGGTATCATG

GCGGA

CGACCGGGGTTCGAGCCCCGTATCCGGCCGTCCGCCGTGATCCATGCGGTTACCG

CCCGC

GTGTCGAACCCAGGTGTGCGACGTCAGACAACGGGGGAGTGCTCCTTTTGGCTTC

CTTCC

AGGCGCGGCGGCTGCTGCGCTAGCTTTTTTGGCCACTGGCCGCGCGCAGCGTAAG

CGGTT

AGGCTGGAAAGCGAAAGCATTAAGTGGCTCGCTCCCTGTAGCCGGAGGGTTATTT

TCCAA

GGGTTGAGTCGCGGGACCCCCGGTTCGAGTCTCGGACCGGCCGGACTGCGGCGAA

CGGGG

GTTTGCCTCCCCGTCATGCAAGACCCCGCTTGCAAATTCCTCCGGAAACAGGGAC

GAGCC

CCTTTTTTGCTTTTCCCAGATGCATCCGGTGCTGCGGCAGATGCGCCCCCCTCCTC

AGCA

GCGGCAAGAGCAAGAGCAGCGGCAGACATGCAGGGCACCCTCCCCTCCTCCTACC

GCGTC

AGGAGGGGCGACATCCGCGGTTGACGCGGCAGCAGATGGTGATTACGAACCCCC

GCGGCG

CCGGGCCCGGCACTACCTGGACTTGGAGGAGGGCGAGGGCCTGGCGCGGCTAGG

AGCGCC

CTCTCCTGAGCGGTACCCAAGGGTGCAGCTGAAGCGTGATACGCGTGAGGCGTAC

GTGCC

GCGGCAGAACCTGTTTCGCGACCGCGAGGGAGAGGAGCCCGAGGAGATGCGGGA

TCGAAA

GTTCCACGCAGGGCGCGAGCTGCGGCATGGCCTGAATCGCGAGCGGTTGCTGCGC

GAGGA

GGACTTTGAGCCCGACGCGCGAACCGGGATTAGTCCCGCGCGCGCACACGTGGCG

GCCGC

CGACCTGGTAACCGCATACGAGCAGACGGTGAACCAGGAGATTAACTTTCAAAA

AAGCTT

TAACAACCACGTGCGTACGCTTGTGGCGCGCGAGGAGGTGGCTATAGGACTGATG

CATCT

GTGGGACTTTGTAAGCGCGCTGGAGCAAAACCCAAATAGCAAGCCGCTCATGGCG

CAGCT

GTTCCTTATAGTGCAGCACAGCAGGGACAACGAGGCATTCAGGGATGCGCTGCTA

AACAT

AGTAGAGCCCGAGGGCCGCTGGCTGCTCGATTTGATAAACATCCTGCAGAGCATA

GTGGT

GCAGGAGCGCAGCTTGAGCCTGGCTGACAAGGTGGCCGCCATCAACTATTCCATG

CTTAG

CCTGGGCAAGTTTTACGCCCGCAAGATATACCATACCCCTTACGTTCCCATAGACA

AGGA

GGTAAAGATCGAGGGGTTCTACATGCGCATGGCGCTGAAGGTGCTTACCTTGAGC

GACGA

CCTGGGCGTTTATCGCAACGAGCGCATCCACAAGGCCGTGAGCGTGAGCCGGCGG

CGCGA

GCTCAGCGACCGCGAGCTGATGCACAGCCTGCAAAGGGCCCTGGCTGGCACGGG

CAGCGG

CGATAGAGAGGCCGAGTCCTACTTTGACGCGGGCGCTGACCTGCGCTGGGCCCCA

AGCCG

ACGCGCCCTGGAGGCAGCTGGGGCCGGACCTGGGCTGGCGGTGGCACCCGCGCG

CGCTGG

CAACGTCGGCGGCGTGGAGGAATATGACGAGGACGATGAGTACGAGCCAGAGGA

CGGCGA

GTACTAAGCGGTGATGTTTCTGATCAGATGATGCAAGACGCAACGGACCCGGCGG

TGCGG

GCGGCGCTGCAGAGCCAGCCGTCCGGCCTTAACTCCACGGACGACTGGCGCCAGG

TCATG

GACCGCATCATGTCGCTGACTGCGCGCAATCCTGACGCGTTCCGGCAGCAGCCGC

AGGCC

AACCGGCTCTCCGCAATTCTGGAAGCGGTGGTCCCGGCGCGCGCAAACCCCACGC

ACGAG

AAGGTGCTGGCGATCGTAAACGCGCTGGCCGAAAACAGGGCCATCCGGCCCGAC

GAGGCC

GGCCTGGTCTACGACGCGCTGCTTCAGCGCGTGGCTCGTTACAACAGCGGCAACG

TGCAG

ACCAACCTGGACCGGCTGGTGGGGGATGTGCGCGAGGCCGTGGCGCAGCGTGAG

CGCGCG

CAGCAGCAGGGCAACCTGGGCTCCATGGTTGCACTAAACGCCTTCCTGAGTACAC

AGCCC

GCCAACGTGCCGCGGGGACAGGAGGACTACACCAACTTTGTGAGCGCACTGCGG

CTAATG

GTGACTGAGACACCGCAAAGTGAGGTGTACCAGTCTGGGCCAGACTATTTTTTCC

AGACC

AGTAGACAAGGCCTGCAGACCGTAAACCTGAGCCAGGCTTTCAAAAACTTGCAGG

GGCTG

TGGGGGGTGCGGGCTCCCACAGGCGACCGCGCGACCGTGTCTAGCTTGCTGACGC

CCAAC

TCGCGCCTGTTGCTGCTGCTAATAGCGCCCTTCACGGACAGTGGCAGCGTGTCCCG

GGAC

ACATACCTAGGTCACTTGCTGACACTGTACCGCGAGGCCATAGGTCAGGCGCATG

TGGAC

GAGCATACTTTCCAGGAGATTACAAGTGTCAGCCGCGCGCTGGGGCAGGAGGAC

ACGGGC

AGCCTGGAGGCAACCCTAAACTACCTGCTGACCAACCGGCGGCAGAAGATCCCCT

CGTTG

CACAGTTTAAACAGCGAGGAGGAGCGCATTTTGCGCTACGTGCAGCAGAGCGTGA

GCCTT

AACCTGATGCGCGACGGGGTAACGCCCAGCGTGGCGCTGGACATGACCGCGCGC

AACATG

GAACCGGGCATGTATGCCTCAAACCGGCCGTTTATCAACCGCCTAATGGACTACT

TGCAT

CGCGCGGCCGCCGTGAACCCCGAGTATTTCACCAATGCCATCTTGAACCCGCACT

GGCTA

CCGCCCCCTGGTTTCTACACCGGGGGATTCGAGGTGCCCGAGGGTAACGATGGAT

TCCTC

TGGGACGACATAGACGACAGCGTGTTTTCCCCGCAACCGCAGACCCTGCTAGAGT

TGCAA

CAGCGCGAGCAGGCAGAGGCGGCGCTGCGAAAGGAAAGCTTCCGCAGGCCAAGC

AGCTTG

TCCGATCTAGGCGCTGCGGCCCCGCGGTCAGATGCTAGTAGCCCATTTCCAAGCTT

GATA

GGGTCTCTTACCAGCACTCGCACCACCCGCCCGCGCCTGCTGGGCGAGGAGGAGT

ACCTA

AACAACTCGCTGCTGCAGCCGCAGCGCGAAAAAAACCTGCCTCCGGCATTTCCCA

ACAAC

GGGATAGAGAGCCTAGTGGACAAGATGAGTAGATGGAAGACGTACGCGCAGGAG

CACAGG

GACGTGCCAGGCCCGCGCCCGCCCACCCGTCGTCAAAGGCACGACCGTCAGCGGG

GTCTG

GTGTGGGAGGACGATGACTCGGCAGACGACAGCAGCGTCCTGGATTTGGGAGGG

AGTGGC

AACCCGTTTGCGCACCTTCGCCCCAGGCTGGGGAGAATGTTTTAAAAAAAAAAAA

GCATG

ATGCAAAATAAAAAACTCACCAAGGCCATGGCACCGAGCGTTGGTTTTCTTGTAT

TCCCC

TTAGTATGCGGCGCGCGGCGATGTATGAGGAAGGTCCTCCTCCCTCCTACGAGAG

TGTGG

TGAGCGCGGCGCCAGTGGCGGCGGCGCTGGGTTCTCCCTTCGATGCTCCCCTGGA

CCCGC

CGTTTGTGCCTCCGCGGTACCTGCGGCCTACCGGGGGGAGAAACAGCATCCGTTA

CTCTG

AGTTGGCACCCCTATTCGACACCACCCGTGTGTACCTGGTGGACAACAAGTCAAC

GGATG

TGGCATCCCTGAACTACCAGAACGACCACAGCAACTTTCTGACCACGGTCATTCA

AAACA

ATGACTACAGCCCGGGGGAGGCAAGCACACAGACCATCAATCTTGACGACCGGT

CGCACT

GGGGCGGCGACCTGAAAACCATCCTGCATACCAACATGCCAAATGTGAACGAGTT

CATGT

TTACCAATAAGTTTAAGGCGCGGGTGATGGTGTCGCGCTTGCCTACTAAGGACAA

TCAGG

TGGAGCTGAAATACGAGTGGGTGGAGTTCACGCTGCCCGAGGGCAACTACTCCGA

GACCA

TGACCATAGACCTTATGAACAACGCGATCGTGGAGCACTACTTGAAAGTGGGCAG

ACAGA

ACGGGGTTCTGGAAAGCGACATCGGGGTAAAGTTTGACACCCGCAACTTCAGACT

GGGGT

TTGACCCCGTCACTGGTCTTGTCATGCCTGGGGTATATACAAACGAAGCCTTCCAT

CCAG

ACATCATTTTGCTGCCAGGATGCGGGGTGGACTTCACCCACAGCCGCCTGAGCAA

CTTGT

TGGGCATCCGCAAGCGGCAACCCTTCCAGGAGGGCTTTAGGATCACCTACGATGA

TCTGG

AGGGTGGTAACATTCCCGCACTGTTGGATGTGGACGCCTACCAGGCGAGCTTGAA

AGATG

ACACCGAACAGGGCGGGGGTGGCGCAGGCGGCAGCAACAGCAGTGGCAGCGGCG

CGGAAG

AGAACTCCAACGCGGCAGCCGCGGCAATGCAGCCGGTGGAGGACATGAACGATC

ATGCCA

TTCGCGGCGACACCTTTGCCACACGGGCTGAGGAGAAGCGCGCTGAGGCCGAAG

CAGCGG

CCGAAGCTGCCGCCCCCGCTGCGCAACCCGAGGTCGAGAAGCCTCAGAAGAAAC

CGGTGA

TCAAACCCCTGACAGAGGACAGCAAGAAACGCAGTTACAACCTAATAAGCAATG

ACAGCA

CCTTCACCCAGTACCGCAGCTGGTACCTTGCATACAACTACGGCGACCCTCAGAC

CGGAA

TCCGCTCATGGACCCTGCTTTGCACTCCTGACGTAACCTGCGGCTCGGAGCAGGTC

TACT

GGTCGTTGCCAGACATGATGCAAGACCCCGTGACCTTCCGCTCCACGCGCCAGAT

CAGCA

ACTTTCCGGTGGTGGGCGCCGAGCTGTTGCCCGTGCACTCCAAGAGCTTCTACAA

CGACC

AGGCCGTCTACTCCCAACTCATCCGCCAGTTTACCTCTCTGACCCACGTGTTCAAT

CGCT

TTCCCGAGAACCAGATTTTGGCGCGCCCGCCAGCCCCCACCATCACCACCGTCAG

TGAAA

ACGTTCCTGCTCTCACAGATCACGGGACGCTACCGCTGCGCAACAGCATCGGAGG

AGTCC

AGCGAGTGACCATTACTGACGCCAGACGCCGCACCTGCCCCTACGTTTACAAGGC

CCTGG

GCATAGTCTCGCCGCGCGTCCTATCGAGCCGCACTTTTTGAGCAAGCATGTCCATC

CTTA

TATCGCCCAGCAATAACACAGGCTGGGGCCTGCGCTTCCCAAGCAAGATGTTTGG

CGGGG

CCAAGAAGCGCTCCGACCAACACCCAGTGCGCGTGCGCGGGCACTACCGCGCGCC

CTGGG

GCGCGCACAAACGCGGCCGCACTGGGCGCACCACCGTCGATGACGCCATCGACG

CGGTGG

TGGAGGAGGCGCGCAACTACACGCCCACGCCGCCACCAGTGTCCACAGTGGACG

CGGCCA

TTCAGACCGTGGTGCGCGGAGCCCGGCGCTATGCTAAAATGAAGAGACGGCGGA

GGCGCG

TAGCACGTCGCCACCGCCGCCGACCCGGCACTGCCGCCCAACGCGCGGCGGCGGC

CCTGC

TTAACCGCGCACGTCGCACCGGCCGACGGGCGGCCATGCGGGCCGCTCGAAGGCT

GGCCG

CGGGTATTGTCACTGTGCCCCCCAGGTCCAGGCGACGAGCGGCCGCCGCAGCAGC

CGCGG

CCATTAGTGCTATGACTCAGGGTCGCAGGGGCAACGTGTATTGGGTGCGCGACTC

GGTTA

GCGGCCTGCGCGTGCCCGTGCGCACCCGCCCCCCGCGCAACTAGATTGCAAGAAA

AAACT

ACTTAGACTCGTACTGTTGTATGTATCCAGCGGCGGCGGCGCGCAACGAAGCTAT

GTCCA

AGCGCAAAATCAAAGAAGAGATGCTCCAGGTCATCGCGCCGGAGATCTATGGCC

CCCCGA

AGAAGGAAGAGCAGGATTACAAGCCCCGAAAGCTAAAGCGGGTCAAAAAGAAA

AAGAAAG

ATGATGATGATGAACTTGACGACGAGGTGGAACTGCTGCACGCTACCGCGCCCAG

GCGAC

GGGTACAGTGGAAAGGTCGACGCGTAAAACGTGTTTTGCGACCCGGCACCACCGT

AGTCT

TTACGCCCGGTGAGCGCTCCACCCGCACCTACAAGCGCGTGTATGATGAGGTGTA

CGGCG

ACGAGGACCTGCTTGAGCAGGCCAACGAGCGCCTCGGGGAGTTTGCCTACGGAA

AGCGGC

ATAAGGACATGCTGGCGTTGCCGCTGGACGAGGGCAACCCAACACCTAGCCTAAA

GCCCG

TAACACTGCAGCAGGTGCTGCCCGCGCTTGCACCGTCCGAAGAAAAGCGCGGCCT

AAAGC

GCGAGTCTGGTGACTTGGCACCCACCGTGCAGCTGATGGTACCCAAGCGCCAGCG

ACTGG

AAGATGTCTTGGAAAAAATGACCGTGGAACCTGGGCTGGAGCCCGAGGTCCGCGT

GCGGC

CAATCAAGCAGGTGGCGCCGGGACTGGGCGTGCAGACCGTGGACGTTCAGATAC

CCACTA

CCAGTAGCACCAGTATTGCCACCGCCACAGAGGGCATGGAGACACAAACGTCCCC

GGTTG

CCTCAGCGGTGGCGGATGCCGCGGTGCAGGCGGTCGCTGCGGCCGCGTCCAAGAC

CTCTA

CGGAGGTGCAAACGGACCCGTGGATGTTTCGCGTTTCAGCCCCCCGGCGCCCGCG

CGGTT

CGAGGAAGTACGGCGCCGCCAGCGCGCTACTGCCCGAATATGCCCTACATCCTTC

CATTG

CGCCTACCCCCGGCTATCGTGGCTACACCTACCGCCCCAGAAGACGAGCAACTAC

CCGAC

GCCGAACCACCACTGGAACCCGCCGCCGCCGTCGCCGTCGCCAGCCCGTGCTGGC

CCCGA

TTTCCGTGCGCAGGGTGGCTCGCGAAGGAGGCAGGACCCTGGTGCTGCCAACAGC

GCGCT

ACCACCCCAGCATCGTTTAAAAGCCGGTCTTTGTGGTTCTTGCAGATATGGCCCTC

ACCT

GCCGCCTCCGTTTCCCGGTGCCGGGATTCCGAGGAAGAATGCACCGTAGGAGGGG

CATGG

CCGGCCACGGCCTGACGGGCGGCATGCGTCGTGCGCACCACCGGCGGCGGCGCG

CGTCGC

ACCGTCGCATGCGCGGCGGTATCCTGCCCCTCCTTATTCCACTGATCGCCGCGGCG

ATTG

GCGCCGTGCCCGGAATTGCATCCGTGGCCTTGCAGGCGCAGAGACACTGATTAAA

AACAA

GTTGCATGTGGAAAAATCAAAATAAAAAGTCTGGACTCTCACGCTCGCTTGGTCC

TGTAA

CTATTTTGTAGAATGGAAGACATCAACTTTGCGTCTCTGGCCCCGCGACACGGCTC

GCGC

CCGTTCATGGGAAACTGGCAAGATATCGGCACCAGCAATATGAGCGGTGGCGCCT

TCAGC

TGGGGCTCGCTGTGGAGCGGCATTAAAAATTTCGGTTCCACCGTTAAGAACTATG

GCAGC

AAGGCCTGGAACAGCAGCACAGGCCAGATGCTGAGGGATAAGTTGAAAGAGCAA

AATTTC

CAACAAAAGGTGGTAGATGGCCTGGCCTCTGGCATTAGCGGGGTGGTGGACCTGG

CCAAC

CAGGCAGTGCAAAATAAGATTAACAGTAAGCTTGATCCCCGCCCTCCCGTAGAGG

AGCCT

CCACCGGCCGTGGAGACAGTGTCTCCAGAGGGGCGTGGCGAAAAGCGTCCGCGC

CCCGAC

AGGGAAGAAACTCTGGTGACGCAAATAGACGAGCCTCCCTCGTACGAGGAGGCA

CTAAAG

CAAGGCCTGCCCACCACCCGTCCCATCGCGCCCATGGCTACCGGAGTGCTGGGCC

AGCAC

ACACCCGTAACGCTGGACCTGCCTCCCCCCGCCGACACCCAGCAGAAACCTGTGC

TGCCA

GGCCCGACCGCCGTTGTTGTAACCCGTCCTAGCCGCGCGTCCCTGCGCCGCGCCG

CCAGC

GGTCCGCGATCGTTGCGGCCCGTAGCCAGTGGCAACTGGCAAAGCACACTGAACA

GCATC

GTGGGTCTGGGGGTGCAATCCCTGAAGCGCCGACGATGCTTCTGAATAGCTAACG

TGTCG

TATGTGTGTCATGTATGCGTCCATGTCGCCGCCAGAGGAGCTGCTGAGCCGCCGC

GCGCC

CGCTTTCCAAGATGGCTACCCCTTCGATGATGCCGCAGTGGTCTTACATGCACATC

TCGG

GCCAGGACGCCTCGGAGTACCTGAGCCCCGGGCTGGTGCAGTTTGCCCGCGCCAC

CGAGA

CGTACTTCAGCCTGAATAACAAGTTTAGAAACCCCACGGTGGCGCCTACGCACGA

CGTGA

CCACAGACCGGTCCCAGCGTTTGACGCTGCGGTTCATCCCTGTGGACCGTGAGGA

TACTG

CGTACTCGTACAAGGCGCGGTTCACCCTAGCTGTGGGTGATAACCGTGTGCTGGA

CATGG

CTTCCACGTACTTTGACATCCGCGGCGTGCTGGACAGGGGCCCTACTTTTAAGCCC

TACT

CTGGCACTGCCTACAACGCCCTGGCTCCCAAGGGTGCCCCAAATCCTTGCGAATG

GGATG

AAGCTGCTACTGCTCTTGAAATAAACCTAGAAGAAGAGGACGATGACAACGAAG

ACGAAG

TAGACGAGCAAGCTGAGCAGCAAAAAACTCACGTATTTGGGCAGGCGCCTTATTC

TGGTA

TAAATATTACAAAGGAGGGTATTCAAATAGGTGTCGAAGGTCAAACACCTAAATA

TGCCG

ATAAAACATTTCAACCTGAACCTCAAATAGGAGAATCTCAGTGGTACGAAACTGA

AATTA

ATCATGCAGCTGGGAGAGTCCTTAAAAAGACTACCCCAATGAAACCATGTTACGG

TTCAT

ATGCAAAACCCACAAATGAAAATGGAGGGCAAGGCATTCTTGTAAAGCAACAAA

ATGGAA

AGCTAGAAAGTCAAGTGGAAATGCAATTTTTCTCAACTACTGAGGCGACCGCAGG

CAATG

GTGATAACTTGACTCCTAAAGTGGTATTGTACAGTGAAGATGTAGATATAGAAAC

CCCAG

ACACTCATATTTCTTACATGCCCACTATTAAGGAAGGTAACTCACGAGAACTAAT

GGGCC

AACAATCTATGCCCAACAGGCCTAATTACATTGCTTTTAGGGACAATTTTATTGGT

CTAA

TGTATTACAACAGCACGGGTAATATGGGTGTTCTGGCGGGCCAAGCATCGCAGTT

GAATG

CTGTTGTAGATTTGCAAGACAGAAACACAGAGCTTTCATACCAGCTTTTGCTTGAT

TCCA

TTGGTGATAGAACCAGGTACTTTTCTATGTGGAATCAGGCTGTTGACAGCTATGAT

CCAG

ATGTTAGAATTATTGAAAATCATGGAACTGAAGATGAACTTCCAAATTACTGCTTT

CCAC

TGGGAGGTGTGATTAATACAGAGACTCTTACCAAGGTAAAACCTAAAACAGGTCA

GGAAA

ATGGATGGGAAAAAGATGCTACAGAATTTTCAGATAAAAATGAAATAAGAGTTG

GAAATA

ATTTTGCCATGGAAATCAATCTAAATGCCAACCTGTGGAGAAATTTCCTGTACTCC

AACA

TAGCGCTGTATTTGCCCGACAAGCTAAAGTACAGTCCTTCCAACGTAAAAATTTCT

GATA

ACCCAAACACCTACGACTACATGAACAAGCGAGTGGTGGCTCCCGGGTTAGTGGA

CTGCT

ACATTAACCTTGGAGCACGCTGGTCCCTTGACTATATGGACAACGTCAACCCATTT

AACC

ACCACCGCAATGCTGGCCTGCGCTACCGCTCAATGTTGCTGGGCAATGGTCGCTA

TGTGC

CCTTCCACATCCAGGTGCCTCAGAAGTTCTTTGCCATTAAAAACCTCCTTCTCCTG

CCGG

GCTCATACACCTACGAGTGGAACTTCAGGAAGGATGTTAACATGGTTCTGCAGAG

CTCCC

TAGGAAATGACCTAAGGGTTGACGGAGCCAGCATTAAGTTTGATAGCATTTGCCT

TTACG

CCACCTTCTTCCCCATGGCCCACAACACCGCCTCCACGCTTGAGGCCATGCTTAGA

AACG

ACACCAACGACCAGTCCTTTAACGACTATCTCTCCGCCGCCAACATGCTCTACCCT

ATAC

CCGCCAACGCTACCAACGTGCCCATATCCATCCCCTCCCGCAACTGGGCGGCTTTC

CGCG

GCTGGGCCTTCACGCGCCTTAAGACTAAGGAAACCCCATCACTGGGCTCGGGCTA

CGACC

CTTATTACACCTACTCTGGCTCTATACCCTACCTAGATGGAACCTTTTACCTCAAC

CACA

CCTTTAAGAAGGTGGCCATTACCTTTGACTCTTCTGTCAGCTGGCCTGGCAATGAC

CGCC

TGCTTACCCCCAACGAGTTTGAAATTAAGCGCTCAGTTGACGGGGAGGGTTACAA

CGTTG

CCCAGTGTAACATGACCAAAGACTGGTTCCTGGTACAAATGCTAGCTAACTACAA

CATTG

GCTACCAGGGCTTCTATATCCCAGAGAGCTACAAGGACCGCATGTACTCCTTCTTT

AGAA

ACTTCCAGCCCATGAGCCGTCAGGTGGTGGATGATACTAAATACAAGGACTACCA

ACAGG

TGGGCATCCTACACCAACACAACAACTCTGGATTTGTTGGCTACCTTGCCCCCACC

ATGC

GCGAAGGACAGGCCTACCCTGCTAACTTCCCCTATCCGCTTATAGGCAAGACCGC

AGTTG

ACAGCATTACCCAGAAAAAGTTTCTTTGCGATCGCACCCTTTGGCGCATCCCATTC

TCCA

GTAACTTTATGTCCATGGGCGCACTCACAGACCTGGGCCAAAACCTTCTCTACGCC

AACT

CCGCCCACGCGCTAGACATGACTTTTGAGGTGGATCCCATGGACGAGCCCACCCT

TCTTT

ATGTTTTGTTTGAAGTCTTTGACGTGGTCCGTGTGCACCGGCCGCACCGCGGCGTC

ATCG

AAACCGTGTACCTGCGCACGCCCTTCTCGGCCGGCAACGCCACAACATAAAGAAG

CAAGC

AACATCAACAACAGCTGCCGCCATGGGCTCCAGTGAGCAGGAACTGAAAGCCATT

GTCAA

AGATCTTGGTTGTGGGCCATATTTTTTGGGCACCTATGACAAGCGCTTTCCAGGCT

TTGT

TTCTCCACACAAGCTCGCCTGCGCCATAGTCAATACGGCCGGTCGCGAGACTGGG

GGCGT

ACACTGGATGGCCTTTGCCTGGAACCCGCACTCAAAAACATGCTACCTCTTTGAG

CCCTT

TGGCTTTTCTGACCAGCGACTCAAGCAGGTTTACCAGTTTGAGTACGAGTCACTCC

TGCG

CCGTAGCGCCATTGCTTCTTCCCCCGACCGCTGTATAACGCTGGAAAAGTCCACCC

AAAG

CGTACAGGGGCCCAACTCGGCCGCCTGTGGACTATTCTGCTGCATGTTTCTCCACG

CCTT

TGCCAACTGGCCCCAAACTCCCATGGATCACAACCCCACCATGAACCTTATTACC

GGGGT

ACCCAACTCCATGCTCAACAGTCCCCAGGTACAGCCCACCCTGCGTCGCAACCAG

GAACA

GCTCTACAGCTTCCTGGAGCGCCACTCGCCCTACTTCCGCAGCCACAGTGCGCAG

ATTAG

GAGCGCCACTTCTTTTTGTCACTTGAAAAACATGTAAAAATAATGTACTAGAGAC

ACTTT

CAATAAAGGCAAATGCTTTTATTTGTACACTCTCGGGTGATTATTTACCCCCACCC

TTGC

CGTCTGCGCCGTTTAAAAATCAAAGGGGTTCTGCCGCGCATCGCTATGCGCCACT

GGCAG

GGACACGTTGCGATACTGGTGTTTAGTGCTCCACTTAAACTCAGGCACAACCATC

GGCGG

CAGCTCGGTGAAGTTTTCACTCCACAGGCTGCGCACCATCACCAACGCGTTTAGC

AGGTC

GGGCGCCGATATCTTGAAGTCGCAGTTGGGGCCTCCGCCCTGCGCGCGCGAGTTG

CGATA

CACAGGGTTGCAGCACTGGAACACTATCAGCGCCGGGTGGTGCACGCTGGCCAGC

ACGCT

CTTGTCGGAGATCAGATCCGCGTCCAGGTCCTCCGCGTTGCTCAGGGCGAACGGA

GTCAA

CTTTGGTAGCTGCCTTCCCAAAAAGGGCGCGTGCCCAGGCTTTGAGTTGCACTCGC

ACCG

TAGTGGCATCAAAAGGTGACCGTGCCCGGTCTGGGCGTTAGGATACAGCGCCTGC

ATAAA

AGCCTTGATCTGCTTAAAAGCCACCTGAGCCTTTGCGCCTTCAGAGAAGAACATG

CCGCA

AGACTTGCCGGAAAACTGATTGGCCGGACAGGCCGCGTCGTGCACGCAGCACCTT

GCGTC

GGTGTTGGAGATCTGCACCACATTTCGGCCCCACCGGTTCTTCACGATCTTGGCCT

TGCT

AGACTGCTCCTTCAGCGCGCGCTGCCCGTTTTCGCTCGTCACATCCATTTCAATCA

CGTG

CTCCTTATTTATCATAATGCTTCCGTGTAGACACTTAAGCTCGCCTTCGATCTCAG

CGCA

GCGGTGCAGCCACAACGCGCAGCCCGTGGGCTCGTGATGCTTGTAGGTCACCTCT

GCAAA

CGACTGCAGGTACGCCTGCAGGAATCGCCCCATCATCGTCACAAAGGTCTTGTTG

CTGGT

GAAGGTCAGCTGCAACCCGCGGTGCTCCTCGTTCAGCCAGGTCTTGCATACGGCC

GCCAG

AGCTTCCACTTGGTCAGGCAGTAGTTTGAAGTTCGCCTTTAGATCGTTATCCACGT

GGTA

CTTGTCCATCAGCGCGCGCGCAGCCTCCATGCCCTTCTCCCACGCAGACACGATCG

GCAC

ACTCAGCGGGTTCATCACCGTAATTTCACTTTCCGCTTCGCTGGGCTCTTCCTCTTC

CTC

TTGCGTCCGCATACCACGCGCCACTGGGTCGTCTTCATTCAGCCGCCGCACTGTGC

GCTT

ACCTCCTTTGCCATGCTTGATTAGCACCGGTGGGTTGCTGAAACCCACCATTTGTA

GCGC

CACATCTTCTCTTTCTTCCTCGCTGTCCACGATTACCTCTGGTGATGGCGGGCGCTC

GGG

CTTGGGAGAAGGGCGCTTCTTTTTCTTCTTGGGCGCAATGGCCAAATCCGCCGCCG

AGGT

CGATGGCCGCGGGCTGGGTGTGCGCGGCACCAGCGCGTCTTGTGATGAGTCTTCC

TCGTC

CTCGGACTCGATACGCCGCCTCATCCGCTTTTTTGGGGGCGCCCGGGGAGGCGGC

GGCGA

CGGGGACGGGGACGACACGTCCTCCATGGTTGGGGGACGTCGCGCCGCACCGCGT

CCGCG

CTCGGGGGTGGTTTCGCGCTGCTCCTCTTCCCGACTGGCCATTTCCTTCTCCTATAG

GCA

GAAAAAGATCATGGAGTCAGTCGAGAAGAAGGACAGCCTAACCGCCCCCTCTGA

GTTCGC

CACCACCGCCTCCACCGATGCCGCCAACGCGCCTACCACCTTCCCCGTCGAGGCA

CCCCC

GCTTGAGGAGGAGGAAGTGATTATCGAGCAGGACCCAGGTTTTGTAAGCGAAGA

CGACGA

GGACCGCTCAGTACCAACAGAGGATAAAAAGCAAGACCAGGACAACGCAGAGGC

AAACGA

GGAACAAGTCGGGCGGGGGGACGAAAGGCATGGCGACTACCTAGATGTGGGAGA

CGACGT

GCTGTTGAAGCATCTGCAGCGCCAGTGCGCCATTATCTGCGACGCGTTGCAAGAG

CGCAG

CGATGTGCCCCTCGCCATAGCGGATGTCAGCCTTGCCTACGAACGCCACCTATTCT

CACC

GCGCGTACCCCCCAAACGCCAAGAAAACGGCACATGCGAGCCCAACCCGCGCCT

CAACTT

CTACCCCGTATTTGCCGTGCCAGAGGTGCTTGCCACCTATCACATCTTTTTCCAAA

ACTG

CAAGATACCCCTATCCTGCCGTGCCAACCGCAGCCGAGCGGACAAGCAGCTGGCC

TTGCG

GCAGGGCGCTGTCATACCTGATATCGCCTCGCTCAACGAAGTGCCAAAAATCTTT

GAGGG

TCTTGGACGCGACGAGAAGCGCGCGGCAAACGCTCTGCAACAGGAAAACAGCGA

AAATGA

AAGTCACTCTGGAGTGTTGGTGGAACTCGAGGGTGACAACGCGCGCCTAGCCGTA

CTAAA

ACGCAGCATCGAGGTCACCCACTTTGCCTACCCGGCACTTAACCTACCCCCCAAG

GTCAT

GAGCACAGTCATGAGTGAGCTGATCGTGCGCCGTGCGCAGCCCCTGGAGAGGGAT

GCAAA

TTTGCAAGAACAAACAGAGGAGGGCCTACCCGCAGTTGGCGACGAGCAGCTAGC

GCGCTG

GCTTCAAACGCGCGAGCCTGCCGACTTGGAGGAGCGACGCAAACTAATGATGGCC

GCAGT

GCTCGTTACCGTGGAGCTTGAGTGCATGCAGCGGTTCTTTGCTGACCCGGAGATG

CAGCG

CAAGCTAGAGGAAACATTGCACTACACCTTTCGACAGGGCTACGTACGCCAGGCC

TGCAA

GATCTCCAACGTGGAGCTCTGCAACCTGGTCTCCTACCTTGGAATTTTGCACGAAA

ACCG

CCTTGGGCAAAACGTGCTTCATTCCACGCTCAAGGGCGAGGCGCGCCGCGACTAC

GTCCG

CGACTGCGTTTACTTATTTCTATGCTACACCTGGCAGACGGCCATGGGCGTTTGGC

AGCA

GTGCTTGGAGGAGTGCAACCTCAAGGAGCTGCAGAAACTGCTAAAGCAAAACTT

GAAGGA

CCTATGGACGGCCTTCAACGAGCGCTCCGTGGCCGCGCACCTGGCGGACATCATT

TTCCC

CGAACGCCTGCTTAAAACCCTGCAACAGGGTCTGCCAGACTTCACCAGTCAAAGC

ATGTT

GCAGAACTTTAGGAACTTTATCCTAGAGCGCTCAGGAATCTTGCCCGCCACCTGCT

GTGC

ACTTCCTAGCGACTTTGTGCCCATTAAGTACCGCGAATGCCCTCCGCCGCTTTGGG

GCCA

CTGCTACCTTCTGCAGCTAGCCAACTACCTTGCCTACCACTCTGACATAATGGAAG

ACGT

GAGCGGTGACGGTCTACTGGAGTGTCACTGTCGCTGCAACCTATGCACCCCGCAC

CGCTC

CCTGGTTTGCAATTCGCAGCTGCTTAACGAAAGTCAAATTATCGGTACCTTTGAGC

TGCA

GGGTCCCTCGCCTGACGAAAAGTCCGCGGCTCCGGGGTTGAAACTCACTCCGGGG

CTGTG

GACGTCGGCTTACCTTCGCAAATTTGTACCTGAGGACTACCACGCCCACGAGATT

AGGTT

CTACGAAGACCAATCCCGCCCGCCAAATGCGGAGCTTACCGCCTGCGTCATTACC

CAGGG

CCACATTCTTGGCCAATTGCAAGCCATCAACAAAGCCCGCCAAGAGTTTCTGCTA

CGAAA

GGGACGGGGGGTTTACTTGGACCCCCAGTCCGGCGAGGAGCTCAACCCAATCCCC

CCGCC

GCCGCAGCCCTATCAGCAGCAGCCGCGGGCCCTTGCTTCCCAGGATGGCACCCAA

AAAGA

AGCTGCAGCTGCCGCCGCCACCCACGGACGAGGAGGAATACTGGGACAGTCAGG

CAGAGG

AGGTTTTGGACGAGGAGGAGGAGGACATGATGGAAGACTGGGAGAGCCTAGACG

AGGAAG

CTTCCGAGGTCGAAGAGGTGTCAGACGAAACACCGTCACCCTCGGTCGCATTCCC

CTCGC

CGGCGCCCCAGAAATCGGCAACCGGTTCCAGCATGGCTACAACCTCCGCTCCTCA

GGCGC

CGCCGGCACTGCCCGTTCGCCGACCCAACCGTAGATGGGACACCACTGGAACCAG

GGCCG

GTAAGTCCAAGCAGCCGCCGCCGTTAGCCCAAGAGCAACAACAGCGCCAAGGCT

ACCGCT

CATGGCGCGGGCACAAGAACGCCATAGTTGCTTGCTTGCAAGACTGTGGGGGCAA

CATCT

CCTTCGCCCGCCGCTTTCTTCTCTACCATCACGGCGTGGCCTTCCCCCGTAACATC

CTGC

ATTACTACCGTCATCTCTACAGCCCATACTGCACCGGCGGCAGCGGCAGCGGCAG

CAACA

GCAGCGGCCACACAGAAGCAAAGGCGACCGGATAGCAAGACTCTGACAAAGCCC

AAGAAA

TCCACAGCGGCGGCAGCAGCAGGAGGAGGAGCGCTGCGTCTGGCGCCCAACGAA

CCCGTA

TCGACCCGCGAGCTTAGAAACAGGATTTTTCCCACTCTGTATGCTATATTTCAACA

GAGC

AGGGGCCAAGAACAAGAGCTGAAAATAAAAAACAGGTCTCTGCGATCCCTCACC

CGCAGC

TGCCTGTATCACAAAAGCGAAGATCAGCTTCGGCGCACGCTGGAAGACGCGGAG

GCTCTC

TTCAGTAAATACTGCGCGCTGACTCTTAAGGACTAGTTTCGCGCCCTTTCTCAAAT

TTAA

GCGCGAAAACTACGTCATCTCCAGCGGCCACACCCGGCGCCAGCACCTGTCGTCA

GCGCC

ATTATGAGCAAGGAAATTCCCACGCCCTACATGTGGAGTTACCAGCCACAAATGG

GACTT

GCGGCTGGAGCTGCCCAAGACTACTCAACCCGAATAAACTACATGAGCGCGGGA

CCCCAC

ATGATATCCCGGGTCAACGGAATCCGCGCCCACCGAAACCGAATTCTCTTGGAAC

AGGCG

GCTATTACCACCACACCTCGTAATAACCTTAATCCCCGTAGTTGGCCCGCTGCCCT

GGTG

TACCAGGAAAGTCCCGCTCCCACCACTGTGGTACTTCCCAGAGACGCCCAGGCCG

AAGTT

CAGATGACTAACTCAGGGGCGCAGCTTGCGGGCGGCTTTCGTCACAGGGTGCGGT

CGCCC

GGGCAGGGTATAACTCACCTGACAATCAGAGGGCGAGGTATTCAGCTCAACGAC

GAGTCG

GTGAGCTCCTCGCTTGGTCTCCGTCCGGACGGGACATTTCAGATCGGCGGCGCCG

GCCGT

CCTTCATTCACGCCTCGTCAGGCAATCCTAACTCTGCAGACCTCGTCCTCTGAGCC

GCGC

TCTGGAGGCATTGGAACTCTGCAATTTATTGAGGAGTTTGTGCCATCGGTCTACTT

TAAC

CCCTTCTCGGGACCTCCCGGCCACTATCCGGATCAATTTATTCCTAACTTTGACGC

GGTA

AAGGACTCGGCGGACGGCTACGACTGAATGTTAAGTGGAGAGGCAGAGCAACTG

CGCCTG

AAACACCTGGTCCACTGTCGCCGCCACAAGTGCTTTGCCCGCGACTCCGGTGAGT

TTTGC

TACTTTGAATTGCCCGAGGATCATATCGAGGGCCCGGCGCACGGCGTCCGGCTTA

CCGCC

CAGGGAGAGCTTGCCCGTAGCCTGATTCGGGAGTTTACCCAGCGCCCCCTGCTAG

TTGAG

CGGGACAGGGGACCCTGTGTTCTCACTGTGATTTGCAACTGTCCTAACCTTGGATT

ACAT

CAAGATCTTTGTTGCCATCTCTGTGCTGAGTATAATAAATACAGAAATTAAAATAT

ACTG

GGGCTCCTATCGCCATCCTGTAAACGCCACCGTCTTCACCCGCCCAAGCAAACCA

AGGCG

AACCTTACCTGGTACTTTTAACATCTCTCCCTCTGTGATTTACAACAGTTTCAACCC

AGA

CGGAGTGAGTCTACGAGAGAACCTCTCCGAGCTCAGCTACTCCATCAGAAAAAAC

ACCAC

CCTCCTTACCTGCCGGGAACGTACGAGTGCGTCACCGGCCGCTGCACCACACCTA

CCGCC

TGACCGTAAACCAGACTTTTTCCGGACAGACCTCAATAACTCTGTTTACCAGAAC

AGGAG

GTGAGCTTAGAAAACCCTTAGGGTATTAGGCCAAAGGCGCAGCTACTGTGGGGTT

TATGA

ACAATTCAAGCAACTCTACGGGCTATTCTAATTCAGGTTTCTCTAGAATCGGGGTT

GGGG

TTATTCTCTGTCTTGTGATTCTCTTTATTCTTATACTAACGCTTCTCTGCCTAAGGC

TCG

CCGCCTGCTGTGTGCACATTTGCATTTATTGTCAGCTTTTTAAACGCTGGGGTCGC

CACC

CAAGATGATTAGGTACATAATCCTAGGTTTACTCACCCTTGCGTCAGCCCACGGTA

CCAC

CCAAAAGGTGGATTTTAAGGAGCCAGCCTGTAATGTTACATTCGCAGCTGAAGCT

AATGA

GTGCACCACTCTTATAAAATGCACCACAGAACATGAAAAGCTGCTTATTCGCCAC

AAAAA

CAAAATTGGCAAGTATGCTGTTTATGCTATTTGGCAGCCAGGTGACACTACAGAG

TATAA

TGTTACAGTTTTCCAGGGTAAAAGTCATAAAACTTTTATGTATACTTTTCCATTTTA

TGA

AATGTGCGACATTACCATGTACATGAGCAAACAGTATAAGTTGTGGCCCCCACAA

AATTG

TGTGGAAAACACTGGCACTTTCTGCTGCACTGCTATGCTAATTACAGTGCTCGCTT

TGGT

CTGTACCCTACTCTATATTAAATACAAAAGCAGACGCAGCTTTATTGAGGAAAAG

AAAAT

GCCTTAATTTACTAAGTTACAAAGCTAATGTCACCACTAACTGCTTTACTCGCTGC

TTGC

AAAACAAATTCAAAAAGTTAGCATTATAATTAGAATAGGATTTAAACCCCCCGGT

CATTT

CCTGCTCAATACCATTCCCCTGAACAATTGACTCTATGTGGGATATGCTCCAGCGC

TACA

ACCTTGAAGTCAGGCTTCCTGGATGTCAGCATCTGACTTTGGCCAGCACCTGTCCC

GCGG

ATTTGTTCCAGTCCAACTACAGCGACCCACCCTAACAGAGATGACCAACACAACC

AACGC

GGCCGCCGCTACCGGACTTACATCTACCACAAATACACCCCAAGTTTCTGCCTTTG

TCAA

TAACTGGGATAACTTGGGCATGTGGTGGTTCTCCATAGCGCTTATGTTTGTATGCC

TTAT

TATTATGTGGCTCATCTGCTGCCTAAAGCGCAAACGCGCCCGACCACCCATCTATA

GTCC

CATCATTGTGCTACACCCAAACAATGATGGAATCCATAGATTGGACGGACTGAAA

CACAT

GTTCTTTTCTCTTACAGTATGATTAAATGAGACATGATTCCTCGAGTTTTTATATTA

CTG

ACCCTTGTTGCGCTTTTTTGTGCGTGCTCCACATTGGCTGCGGTTTCTCACATCGAA

GTA

GACTGCATTCCAGCCTTCACAGTCTATTTGCTTTACGGATTTGTCACCCTCACGCT

CATC

TGCAGCCTCATCACTGTGGTCATCGCCTTTATCCAGTGCATTGACTGGGTCTGTGT

GCGC

TTTGCATATCTCAGACACCATCCCCAGTACAGGGACAGGACTATAGCTGAGCTTC

TTAGA

ATTCTTTAATTATGAAATTTACTGTGACTTTTCTGCTGATTATTTGCACCCTATCTG

CGT

TTTGTTCCCCGACCTCCAAGCCTCAAAGACATATATCATGCAGATTCACTCGTATA

TGGA

ATATTCCAAGTTGCTACAATGAAAAAAGCGATCTTTCCGAAGCCTGGTTATATGC

AATCA

TCTCTGTTATGGTGTTCTGCAGTACCATCTTAGCCCTAGCTATATATCCCTACCTTG

ACA

TTGGCTGGAACGCAATAGATGCCATGAACCACCCAACTTTCCCCGCGCCCGCTAT

GCTTC

CACTGCAACAAGTTGTTGCCGGCGGCTTTGTCCCAGCCAATCAGCCTCGCCCACCT

TCTC

CCACCCCCACTGAAATCAGCTACTTTAATCTAACAGGAGGAGATGACTGACACCC

TAGAT

CTAGA A ATGGACGGAATTATTACAGAGCAGCGCCTGCTAGAAAGACGCAGGGCA

GCGGCC

GAGCAACAGCGCATGAATCAAGAGCTCCAAGACATGGTTAACTTGCACCAGTGCA

AAAGG

GGTATCTTTTGTCTGGTAAAGCAGGCCAAAGTCACCTACGACAGTAATACCACCG

GACAC

CGCCTTAGCTACAAGTTGCCAACCAAGCGTCAGA A ATTGGTGGTCATGGTGGGAG

AAAAG

CCCATTACCATAACTCAGCACTCGGTAGAAACCGAAGGCTGCATTCACTCACCTT

GTCAA

GGACCTGAGGATCTCTGCACCCTTATTAAGACCCTGTGCGGTCTCAAAGATCTTAT

TCCC

TTTAACTAATAAAAAAAAATAATAAAGCATCACTTACTTAAAATCAGTTAGCAAA

TTTCT

GTCCAGTTTATTCAGCAGCACCTCCTTGCCCTCCTCCCAGCTCTGGTATTGCAGCT

TCCT

CCTGGCTGCAAACTTTCTCCACAATCTA从TGGAATGTCAGTTTCCTCCTGTTCCT

GTCC

ATCCGCACCCACTATCTTCATGTTGTTGCAGATGAAGCGCGCAAGACCGTCTGAA

GATAC

CTTCAACCCCGTGTATCCATATGACACGGAAACCGGTCCTCCAACTGTGCCTTTTC

TTAC

TCCTCCCTTTGTATCCCCCAATGGGTTTCAAGAGAGTCCCCCTGGGGTACTCTCTT

TGCG

CCTATCCGAACCTCTAGTTACCTCCAATGGCATGCTTGCGCTCAAAATGGGCAAC

GGCCT

CTCTCTGGACGAGGCCGGCAACCTTACCTCCCAAAATGTAACCACTGTGAGCCCA

CCTCT

CAAAAAAACCAAGTCAAACATAAACCTGGAAATATCTGCACCCCTCACAGTTACC

TCAGA

AGCCCTAACTGTGGCTGCCGCCGCACCTCTAATGGTCGCGGGCAACACACTCACC

ATGCA

ATCACAGGCCCCGCTAACCGTGCACGACTCCAAACTTAGCATTGCCACCCAAGGA

CCCCT

CACAGTGTCAGAAGGAAAGCTAGCCCTGCAAACATCA GGCCCCCTCACCACCACC

GATAG

CAGTACCCTTACTATCACTGCCTCACCCCCTCTAACTACTGCCACTGGTAGCTTGG

GCAT

TGACTTGAAAGAGCCCATTTATACACAAAATGGAAAACTAGGACTAAAGTACGG

GGCTCC

TTTGCATGTAACAGACGACCTAAACACTTTGACCGTAGCAACTGGTCCAGGTGTG

ACTAT

TAATAATACTTCCTTGCAAACTAAAGTTACTGGAGCCTTGGGTTTTGATTCACAAG

GCAA

TATGCAACTTAATGTAGCAGGAGGACTAAGGATTGATTCTCAAAACAGACGCCTT

ATACT

TGATGTTAGTTATCCGTTTGATGCTCAAAACCAACTAAATCTAAGACTAGGACAG

GGCCC

TCTTTTTATAAACTCAGCCCACAACTTGGATATTAACTACAACAAAGGCCTTTACT

TGTT

TACAGCTTCAAACAATTCCAAAAAGCTTGAGGTTAACCTAAGCACTGCCAAGGGG

TTGAT

GTTTGACGCTACAGCCATAGCCATTAATGCAGGAGATGGGCTTGAATTTGGTTCA

CCTAA

TGCACCAAACACAAATCCCCTCAAAACAAAAATTGGCCATGGCCTAGAATTTGAT

TCAAA

CAAGGCTATGGTTCCTAAACTAGGAACTGGCCTTAGTTTTGACAGCACAGGTGCC

ATTAC

AGTAGGAAACAAAAATAATGATAAGCTAACTTTGTGGACCACACCAGCTCCATCT

CCTAA

CTGTAGACTAAATGCAGAGAAAGATGCTAAACTCACTTTGGTCTTAACAAAATGT

GGCAG

TCAAATACTTGCTACAGTTTCAGTTTTGGCTGTTAAAGGCAGTTTGGCTCCAATAT

CTGG

AACAGTTCAAAGTGCTCATCTTATTATAAGATTTGACGAAAATGGAGTGCTACTA

AACAA

TTCCTTCCTGGACCCAGAATATTGGAACTTTAGAAATGGAGATCTTACTGAA GGC

ACAGC

CTATACAAACGCTGTTGGATTTATGCCTAACCTATCAGCTTATCCAAAATCTCACG

GTAA

AACTGCCAAAAGTAACATTGTCAGTCAAGTTTACTTAAACGGAGACAAAACTAAA

CCTGT

AACACTAACCATTACACTAAACGGTACACAGGAAACAGGAGACACAACTCCAAG

TGCATA

CTCTATGTCATTTTCATGGGACTGGTCTGGCCACAACTACATTAATGAAATATTTG

CCAC

ATCCTCTTACACTTTTTCATACATTGCCCAAGAATAAAGAATCGTTTGTGTTATGT

TTCA

ACGTGTTTATTTTTCAATTGCAGAAAATTTCAAGTCATTTTTCATTCAGTAGTATA

GCCC

CACCACCACATAGCTTATACAGATCACCGTACCTTAATCAAACTCACAGAACCCT

AGTAT

TCAACCTGCCACCTCCCTCCCAACACACAGAGTACACAGTCCTTTCTCCCCGGCTG

GCCT

TAAAAAGCATCATATCATGGGTAACAGACATATTCTTAGGTGTTATATTCCACAC

GGTTT

CCTGTCGAGCCAAACGCTCATCAGTGATATTAATAAACTCCCCGGGCAGCTCACT

TAAGT

TCATGTCGCTGTCCAGCTGCTGAGCCACAGGCTGCTGTCCAACTTGCGGTTGCTTA

ACGG

GCGGCGAAGGAGAAGTCCACGCCTACATGGGGGTAGAGTCATAATCGTGCATCA

GGATAG

GGCGGTGGTGCTGCAGCAGCGCGCGAATAAACTGCTGCCGCCGCCGCTCCGTCCT

GCAGG

AATACAACATGGCAGTGGTCTCCTCAGCGATGATTCGCACCGCCCGCAGCATAAG

GCGCC

TTGTCCTCCGGGCACAGCAGCGCACCCTGATCTCACTTAAATCAGCACAGTAACT

GCAGC

ACAGCACCACAATATTGTTCAAAATCCCACAGTGCAAGGCGCTGTATCCAAAGCT

CATGG

CGGGGACCACAGAACCCACGTGGCCATCATACCACAAGCGCAGGTAGATTAAGT

GGCGAC

CCCTCATAAACACGCTGGACATAAACATTACCTCTTTTGGCATGTTGTAATTCACC

ACCT

CCCGGTACCATATAAACCTCTGATTAAACATGGCGCCATCCACCACCATCCTAAA

CCAGC

TGGCCAAAACCTGCCCGCCGGCTATACACTGCAGGGAACCGGGACTGGAACAAT

GACAGT

GGAGAGCCCAGGACTCGTAACCATGGATCATCATGCTCGTCATGATATCAATGTT

GGCAC

AACACAGGCACACGTGCATACACTTCCTCAGGATTACAAGCTCCTCCCGCGTTAG

AACCA

TATCCCAGGGAACAACCCATTCCTGAATCAGCGTAAATCCCACACTGCAGGGAAG

ACCTC

GCACGTAACTCACGTTGTGCATTGTCAAAGTGTTACATTCGGGCAGCAGCGGATG

ATCCT

CCAGTATGGTAGCGCGGGTTTCTGTCTCAAAAGGAGGTAGACGATCCCTACTGTA

CGGAG

TGCGCCGAGACAACCGAGATCGTGTTGGTCGTAGTGTCATGCCAAATGGAACGCC

GGACG

TAGTCATATTTCCTGAAGCAAAACCAGGTGCGGGCGTGACAAACAGATCTGCGTC

TCCGG

TCTCGCCGCTTAGATCGCTCTGTGTAGTAGTTGTAGTATATCCACTCTCTCAAAGC

ATCC

AGGCGCCCCCTGGCTTCGGGTTCTATGTAAACTCCTTCATGCGCCGCTGCCCTGAT

AACA

TCCACCACCGCAGAATAAGCCACACCCAGCCAACCTACACATTCGTTCTGCGAGT

CACAC

ACGGGAGGAGCGGGAAGAGCTGGAAGAACCATGTTTTTTTTTTTATTCCAAAAGA

TTATC

CAAAACCTCAAAATGAAGATCTATTAAGTGAACGCGCTCCCCTCCGGTGGCGTGG

TCAAA

CTCTACAGCCAAAGAACAGATAATGGCATTTGTAAGATGTTGCACAATGGCTTCC

AAAAG

GCAAACGGCCCTCACGTCCAAGTGGACGTAAAGGCTAAACCCTTCAGGGTGAATC

TCCTC

TATAAACATTCCAGCACCTTCAACCATGCCCAAATAATTCTCATCTCGCCACCTTC

TCAA

TATATCTCTAAGCAAATCCCGAATATTAAGTCCGGCCATTGTAAAAATCTGCTCCA

GAGC

GCCCTCCACCTTCAGCCTCAAGCAGCGAATCATGATTGCAAAAATTCAGGTTCCTC

ACAG

ACCTGTATAAGATTCAAAAGCGGAACATTAACAAAAATACCGCGATCCCGTAGGT

CCCTT

CGCAGGGCCAGCTGAACATAATCGTGCAGGTCTGCACGGACCAGCGCGGCCACTT

CCCCG

CCAGGAACCTTGACAAAAGAACCCACACTGATTATGACACGCATACTCGGAGCTA

TGCTA

ACCAGCGTAGCCCCGATGTAAGCTTTGTTGCATGGGCGGCGATATAAAATGCAAG

GTGCT

GCTCAAAAAATCAGGCAAAGCCTCGCGCAAAAAAGAAAGCACATCGTAGTCATG

CTCATG

CAGATAAAGGCAGGTAAGCTCCGGAACCACCACAGAAAAAGACACCATTTTTCTC

TCAAA

CATGTCTGCGGGTTTCTGCATAAACACAAAATAAAATAACAAAAAAACATTTAAA

CATTA

GAAGCCTGTCTTACAACAGGAAAAACAACCCTTATAAGCATAAGACGGACTACG

GCCATG

CCGGCGTGACCGTAAAAAAACTGGTCACCGTGATTAAAAAGCACCACCGACAGCT

CCTCG

GTCATGTCCGGAGTCATAATGTAAGACTCGGTAAACACATCAGGTTGATTCATCG

GTCAG

TGCTAAAAAGCGACCGAAATAGCCCGGGGGAATACATACCCGCAGGCGTAGAGA

CAACAT

TACAGCCCCCATAGGAGGTATAACAAAATTAATAGGAGAGAAAAACACATAAAC

ACCTGA

AAAACCCTCCTGCCTAGGCAAAATAGCACCCTCCCGCTCCAGAACAACATACAGC

GCTTC

CACAGCGGCAGCCATAACAGTCAGCCTTACCAGTAAAAAAGAAAACCTATTAAA

AAAACA

CCACTCGACACGGCACCAGCTCAATCAGTCACAGTGTAAAAAAGGGCCAAGTGC

AGAGCG

AGTATATATAGGACTAAAAAATGACGTAACGGTTAAAGTCCACAAAAAACACCC

AGAAAA

CCGCACGCGAACCTACGCCCAGAAACGAAAGCCAAAAAACCCACAACTTCCTCA

AATCGT

CACTTCCGTTTTCCCACGTTACGTCACTTCCCATTTTAATTAAGAAAACTACAATT

CCCA

ACACATACAAGTTACTCCGCCCTAAAACCTACGTCACCCGCCCCGTTCCCACGCCC

CGCG

CCACGTCACAAACTCCACCCCCTCATTATCATATTGGCTTCAATCCAAAATAAGGT

ATAT

TATTGATGATGATTACCCTGTTAT

SEQ ID NO：50是OV1164序列

CAGGGTAATCATCATCAATAATATACCTTATTTTGGATTGAAGCCAATATGATAAT

GAGG

GGGTGGAGTTTGTGACGTGGCGCGGGGCGTGGGAACGGGGCGGGTGACGTAGTA

GTGTGG

CGGAAGTGTGATGTTGCAAGTGTGGCGGAACACATGTAAGCGACGGATGTGGCA

AAAGTG

ACGTTTTTGGTGTGCGCCGGTGTACACAGGAAGTGACAATTTTCGCGCGGTTTTAG

GCGG

ATGTTGTAGTAAATTTGGGCGTAACCGAGTAAGATTTGGCCATTTTCGCGGGAAA

ACTGA

ATAAGAGGAAGTGAAATCTGAATAATTTTGTGTTACTCATAGCGCGTAATATTTGT

CTAG

GGCCGGGATCTCTGCAGGAATTTGATATCAAGCTTATCGATACCGTCGAAACTTG

TTTAT

TGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAA

GCATT

TTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGT

CTG

GATCCGCTAGCGGCGCGCCGTTTCATCCGGACAAAGCCTGCGCGCGCCCCGCCCC

GCCAT

TGGCCGTACCGCCCCGCGCCGCCGCCCCATCTCGCCCCTCGCCGCCGGGTCCGGC

GCGTT

AAAGCCAATAGGAACCGCCGCCGTTGTTCCCGTCACGGCCGGGGCAGCCAATTGT

GGCGG

CGCTCGGCGGCTCGTGGCTCTTTCGCGGCAAAAAGGATTTGGCGCGTAAAAGTGG

CCGGG

ACTTTGCAGGCAGCGGCGGCCGGGGGCGGAGCGGGATCGAGCCCTCGATGATAT

CAGATC

AAACGATATCACCGGTCGACTGAAAATGAGACATATTATCTGCCACGGAGGTGTT

ATTAC

CGAAGAAATGGCCGCCAGTCTTTTGGACCAGCTGATCGAAGAGGTACTGGCTGAT

AATCT

TCCACCTCCTAGCCATTTTGAACCACCTACCCTTCACGAACTGTATGATTTAGACG

TGAC

GGCCCCCGAAGATCCCAACGAGGAGGCGGTTTCGCAGATTTTTCCCGACTCTGTA

ATGTT

GGCGGTGCAGGAAGGGATTGACTTACTCACTTTTCCGCCGGCGCCCGGTTCTCCG

GAGCC

GCCTCACCTTTCCCGGCAGCCCGAGCAGCCGGAGCAGAGAGCCTTGGGTCCGGTT

TCTAT

GCCAAACCTTGTACCGGAGGTGATCGATCTTACCTGCCACGAGGCTGGCTTTCCA

CCCAG

TGACGACGAGGATGAAGAGGGTGAGGAGTTTGTGTTAGATTATGTGGAGCACCCC

GGGCA

CGGTTGCAGGTCTTGTCATTATCACCGGAGGAATACGGGGGACCCAGATATTATG

TGTTC

GCTTTGCTATATGAGGACCTGTGGCATGTTTGTCTACAGTAAGTGAAAATTATGGG

CAGT

GGGTGATAGAGTGGTGGGTTTGGTGTGGTAATTTTTTTTTTAATTTTTACAGTTTTG

TGG

TTTAAAGAATTTTGTATTGTGATTTTTTTAAAAGGTCCTGTGTCTGAACCTGAGCC

TGAG

CCCGAGCCAGAACCGGAGCCTGCAAGACCTACCCGCCGTCCTAAAATGGCGCCTG

CTATC

CTGAGACGCCCGACATCACCTGTGTCTAGAGAATGCAATAGTAGTACGGATAGCT

GTGAC

TCCGGTCCTTCTAACACACCTCCTGAGATACACCCGGTGGTCCCGCTGTGCCCCAT

TAAA

CCAGTTGCCGTGAGAGTTGGTGGGCGTCGCCAGGCTGTGGAATGTATCGAGGACT

TGCTT

AACGAGCCTGGGCAACCTTTGGACTTGAGCTGTAAACGCCCCAGGCCATAAGGTG

TAAAC

CTGTGATTGCGTGTGTGGTTAACGCCTTTGTTTGCTGAATGAGTTGATGTAAGTTT

AATA

AAGGGTGAGATAATGTTTAACTTGCATGGCGTGTTAAATGGGGCGGGGCTTAAAG

GGTAT

ATAATGCGCCGTGGGCTAATCTTGGTTACATCTGACCTCATGGAGGCTTGGGAGT

GTTTG

GAAGATTTTTCTGCTGTGCGTAACTTGCTGGAACAGAGCTCTAACAGTACCTCTTG

GTTT

TGGAGGTTTCTGTGGGGCTCATCCCAGGCAAAGTTAGTCTGCAGAATTAAGGAGG

ATTAC

AAGTGGGAATTTGAAGAGCTTTTGAAATCCTGTGGTGAGCTGTTTGATTCTTTGAA

TCTG

GGTCACCAGGCGCTTTTCCAAGAGAAGGTCATCAAGACTTTGGATTTTTCCACACC

GGGG

CGCGCTGCGGCTGCTGTTGCTTTTTTGAGTTTTATAAAGGATAAATGGAGCGAAG

AAACC

CATCTGAGCGGGGGGTACCTGCTGGATTTTCTGGCCATGCATCTGTGGAGAGCGG

TTGTG

AGACACAAGAATCGCCTGCTACTGTTGTCTTCCGTCCGCCCGGCGATAATACCGA

CGGAG

GAGCAGCAGCAGCAGCAGGAGGAAGCCAGGCGGCGGCGGCAGGAGCAGAGCCC

ATGGAAC

CCGAGAGCCGGCCTGGACCCTCGGGAATGAATGTTGTACAGGTGGCTGAACTGTA

TCCAG

AACTGAGACGCATTTTGACAATTACAGAGGATGGGCAGGGGCTAAAGGGGGTAA

AGAGGG

AGCGGGGGGCTTGTGAGGCTACAGAGGAGGCTAGGAATCTAGCTTTTAGCTTAAT

GACCA

GACACCGTCCTGAGTGTATTACTTTTCAACAGATCAAGGATAATTGCGCTAATGA

GCTTG

ATCTGCTGGCGCAGAAGTATTCCATAGAGCAGCTGACCACTTACTGGCTGCAGCC

AGGGG

ATGATTTTGAGGAGGCTATTAGGGTATATGCAAAGGTGGCACTTAGGCCAGATTG

CAAGT

ACAAGATCAGCAAACTTGTAAATATCAGGAATTGTTGCTACATTTCTGGGAACGG

GGCCG

AGGTGGAGATAGATACGGAGGATAGGGTGGCCTTTAGATGTAGCATGATAAATAT

GTGGC

CGGGGGTGCTTGGCATGGACGGGGTGGTTATTATGAATGTAAGGTTTACTGGCCC

CAATT

TTAGCGGTACGGTTTTCCTGGCCAATACCAACCTTATCCTACACGGTGTAAGCTTC

TATG

GGTTTAACAATACCTGTGTGGAAGCCTGGACCGATGTAAGGGTTCGGGGCTGTGC

CTTTT

ACTGCTGCTGGAAGGGGGTGGTGTGTCGCCCCAAAAGCAGGGCTTCAATTAAGAA

ATGCC

TCTTTGAAAGGTGTACCTTGGGTATCCTGTCTGAGGGTAACTCCAGGGTGCGCCAC

AATG

TGGCCTCCGACTGTGGTTGCTTCATGCTAGTGAAAAGCGTGGCTGTGATTAAGCAT

AACA

TGGTATGTGGCAACTGCGAGGACAGGGCCTCTCAGATGCTGACCTGCTCGGACGG

CAACT

GTCACCTGCTGAAGACCATTCACGTAGCCAGCCACTCTCGCAAGGCCTGGCCAGT

GTTTG

AGCATAACATACTGACCCGCTGTTCCTTGCATTTGGGTAACAGGAGGGGGGTGTT

CCTAC

CTTACCAATGCAATTTGAGTCACACTAAGATATTGCTTGAGCCCGAGAGCATGTC

CAAGG

TGAACCTGAACGGGGTGTTTGACATGACCATGAAGATCTGGAAGGTGCTGAGGTA

CGATG

AGACCCGCACCAGGTGCAGACCCTGCGAGTGTGGCGGTAAACATATTAGGAACC

AGCCTG

TGATGCTGGATGTGACCGAGGAGCTGAGGCCCGATCACTTGGTGCTGGCCTGCAC

CCGCG

CTGAGTTTGGCTCTAGCGATGAAGATACAGATTGAGGTACTGAAATGTGTGGGCG

TGGCT

TAAGGGTGGGAAAGAATATATAAGGTGGGGGTCTTATGTAGTTTTGTATCTGTTTT

GCAG

CAGCCGCCGCCGCCATGAGCACCAACTCGTTTGATGGAAGCATTGTGAGCTCATA

TTTGA

CAACGCGCATGCCCCCATGGGCCGGGGTGCGTCAGAATGTGATGGGCTCCAGCAT

TGATG

GTCGCCCCGTCCTGCCCGCAAACTCTACTACCTTGACCTACGAGACCGTGTCTGGA

ACGC

CGTTGGAGACTGCAGCCTCCGCCGCCGCTTCAGCCGCTGCAGCCACCGCCCGCGG

GATTG

TGACTGACTTTGCTTTCCTGAGCCCGCTTGCAAGCAGTGCAGCTTCCCGTTCATCC

GCCC

GCGATGACAAGTTGACGGCTCTTTTGGCACAATTGGATTCTTTGACCCGGGAACTT

AATG

TCGTTTCTCAGCAGCTGTTGGATCTGCGCCAGCAGGTTTCTGCCCTGAAGGCTTCC

TCCC

CTCCCAATGCGGTTTAAAACATAAATAAAAAACCAGACTCTGTTTGGATTTGGAT

CAAGC

AAGTGTCTTGCTGTCTTTATTTAGGGGTTTTGCGCGCGCGGTAGGCCCGGGACCAG

CGGT

CTCGGTCGTTGAGGGTCCTGTGTATTTTTTCCAGGACGTGGTAAAGGTGACTCTGG

ATGT

TCAGATACATGGGCATAAGCCCGTCTCTGGGGTGGAGGTAGCACCACTGCAGAGC

TTCAT

GCTGCGGGGTGGTGTTGTAGATGATCCAGTCGTAGCAGGAGCGCTGGGCGTGGTG

CCTAA

AAATGTCTTTCAGTAGCAAGCTGATTGCCAGGGGCAGGCCCTTGGTGTAAGTGTT

TACAA

AGCGGTTAAGCTGGGATGGGTGCATACGTGGGGATATGAGATGCATCTTGGACTG

TATTT

TTAGGTTGGCTATGTTCCCAGCCATATCCCTCCGGGGATTCATGTTGTGCAGAACC

ACCA

GCACAGTGTATCCGGTGCACTTGGGAAATTTGTCATGTAGCTTAGAAGGAAATGC

GTGGA

AGAACTTGGAGACGCCCTTGTGACCTCCAAGATTTTCCATGCATTCGTCCATAATG

ATGG

CAATGGGCCCACGGGCGGCGGCCTGGGCGAAGATATTTCTGGGATCACTAACGTC

ATAGT

TGTGTTCCAGGATGAGATCGTCATAGGCCATTTTTACAAAGCGCGGGCGGAGGGT

GCCAG

ACTGCGGTATAATGGTTCCATCCGGCCCAGGGGCGTAGTTACCCTCACAGATTTG

CATTT

CCCACGCTTTGAGTTCAGATGGGGGGATCATGTCTACCTGCGGGGCGATGAAGAA

AACGG

TTTCCGGGGTAGGGGAGATCAGCTGGGAAGAAAGCAGGTTCCTGAGCAGCTGCG

ACTTAC

CGCAGCCGGTGGGCCCGTAAATCACACCTATTACCGGGTGCAACTGGTAGTTAAG

AGAGC

TGCAGCTGCCGTCATCCCTGAGCAGGGGGGCCACTTCGTTAAGCATGTCCCTGAC

TCGCA

TGTTTTCCCTGACCAAATCCGCCAGAAGGCGCTCGCCGCCCAGCGATAGCAGTTC

TTGCA

AGGAAGCAAAGTTTTTCAACGGTTTGAGACCGTCCGCCGTAGGCATGCTTTTGAG

CGTTT

GACCAAGCAGTTCCAGGCGGTCCCACAGCTCGGTCACCTGCTCTACGGCATCTCG

ATCCA

GCATATCTCCTCGTTTCGCGGGTTGGGGCGGCTTTCGCTGTACGGCAGTAGTCGGT

GCTC

GTCCAGACGGGCCAGGGTCATGTCTTTCCACGGGCGCAGGGTCCTCGTCAGCGTA

GTCTG

GGTCACGGTGAAGGGGTGCGCTCCGGGCTGCGCGCTGGCCAGGGTGCGCTTGAGG

CTGGT

CCTGCTGGTGCTGAAGCGCTGCCGGTCTTCGCCCTGCGCGTCGGCCAGGTAGCATT

TGAC

CATGGTGTCATAGTCCAGCCCCTCCGCGGCGTGGCCCTTGGCGCGCAGCTTGCCCT

TGGA

GGAGGCGCCGCACGAGGGGCAGTGCAGACTTTTGAGGGCGTAGAGCTTGGGCGC

GAGAAA

TACCGATTCCGGGGAGTAGGCATCCGCGCCGCAGGCCCCGCAGACGGTCTCGCAT

TCCAC

GAGCCAGGTGAGCTCTGGCCGTTCGGGGTCAAAAACCAGGTTTCCCCCATGCTTT

TTGAT

GCGTTTCTTACCTCTGGTTTCCATGAGCCGGTGTCCACGCTCGGTGACGAAAAGGC

TGTC

CGTGTCCCCGTATACAGACTTGAGAGGCCTGTCCTCGAGCGGTGTTCCGCGGTCCT

CCTC

GTATAGAAACTCGGACCACTCTGAGACAAAGGCTCGCGTCCAGGCCAGCACGAA

GGAGGC

TAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTG

TGAAG

ACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTGTAGGTGTAGGCC

ACGTG

ACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCA

CTCTC

TTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGGTGAGTACTCCCTCTGAAAA

GCGGG

CATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTC

ACCTG

GCCCGCGGTGATGCCTTTGAGGGTGGCCGCATCCATCTGGTCAGAAAAGACAATC

TTTTT

GTTGTCAAGCTTGGTGGCAAACGACCCGTAGAGGGCGTTGGACAGCAACTTGGCG

ATGGA

GCGCAGGGTTTGGTTTTTGTCGCGATCGGCGCGCTCCTTGGCCGCGATGTTTAGCT

GCAC

GTATTCGCGCGCAACGCACCGCCATTCGGGAAAGACGGTGGTGCGCTCGTCGGGC

ACCAG

GTGCACGCGCCAACCGCGGTTGTGCAGGGTGACAAGGTCAACGCTGGTGGCTACC

TCTCC

GCGTAGGCGCTCGTTGGTCCAGCAGAGGCGGCCGCCCTTGCGCGAGCAGAATGGC

GGTAG

GGGGTCTAGCTGCGTCTCGTCCGGGGGGTCTGCGTCCACGGTAAAGACCCCGGGC

AGCAG

GCGCGCGTCGAAGTAGTCTATCTTGCATCCTTGCAAGTCTAGCGCCTGCTGCCATG

CGCG

GGCGGCAAGCGCGCGCTCGTATGGGTTGAGTGGGGGACCCCATGGCATGGGGTG

GGTGAG

CGCGGAGGCGTACATGCCGCAAATGTCGTAAACGTAGAGGGGCTCTCTGAGTATT

CCAAG

ATATGTAGGGTAGCATCTTCCACCGCGGATGCTGGCGCGCACGTAATCGTATAGT

TCGTG

CGAGGGAGCGAGGAGGTCGGGACCGAGGTTGCTACGGGCGGGCTGCTCTGCTCG

GAAGAC

TATCTGCCTGAAGATGGCATGTGAGTTGGATGATATGGTTGGACGCTGGAAGACG

TTGAA

GCTGGCGTCTGTGAGACCTACCGCGTCACGCACGAAGGAGGCGTAGGAGTCGCGC

AGCTT

GTTGACCAGCTCGGCGGTGACCTGCACGTCTAGGGCGCAGTAGTCCAGGGTTTCC

TTGAT

GATGTCATACTTATCCTGTCCCTTTTTTTTCCACAGCTCGCGGTTGAGGACAAACT

CTTC

GCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTAAGAG

CCTAG

CATGTAGAACTGGTTGACGGCCTGGTAGGCGCAGCATCCCTTTTCTACGGGTAGC

GCGTA

TGCCTGCGCGGCCTTCCGGAGCGAGGTGTGGGTGAGCGCAAAGGTGTCCCTGACC

ATGAC

TTTGAGGTACTGGTATTTGAAGTCAGTGTCGTCGCATCCGCCCTGCTCCCAGAGCA

AAAA

GTCCGTGCGCTTTTTGGAACGCGGATTTGGCAGGGCGAAGGTGACATCGTTGAAG

AGTAT

CTTTCCCGCGCGAGGCATAAAGTTGCGTGTGATGCGGAAGGGTCCCGGCACCTCG

GAACG

GTTGTTAATTACCTGGGCGGCGAGCACGATCTCGTCAAAGCCGTTGATGTTGTGG

CCCAC

AATGTAAAGTTCCAAGAAGCGCGGGATGCCCTTGATGGAAGGCAATTTTTTAAGT

TCCTC

GTAGGTGAGCTCTTCAGGGGAGCTGAGCCCGTGCTCTGAAAGGGCCCAGTCTGCA

AGATG

AGGGTTGGAAGCGACGAATGAGCTCCACAGGTCACGGGCCATTAGCATTTGCAGG

TGGTC

GCGAAAGGTCCTAAACTGGCGACCTATGGCCATTTTTTCTGGGGTGATGCAGTAG

AAGGT

AAGCGGGTCTTGTTCCCAGCGGTCCCATCCAAGGTTCGCGGCTAGGTCTCGCGCG

GCAGT

CACTAGAGGCTCATCTCCGCCGAACTTCATGACCAGCATGAAGGGCACGAGCTGC

TTCCC

AAAGGCCCCCATCCAAGTATAGGTCTCTACATCGTAGGTGACAAAGAGACGCTCG

GTGCG

AGGATGCGAGCCGATCGGGAAGAACTGGATCTCCCGCCACCAATTGGAGGAGTG

GCTATT

GATGTGGTGAAAGTAGAAGTCCCTGCGACGGGCCGAACACTCGTGCTGGCTTTTG

TAAAA

ACGTGCGCAGTACTGGCAGCGGTGCACGGGCTGTACATCCTGCACGAGGTTGACC

TGACG

ACCGCGCACAAGGAAGCAGAGTGGGAATTTGAGCCCCTCGCCTGGCGGGTTTGGC

TGGTG

GTCTTCTACTTCGGCTGCTTGTCCTTGACCGTCTGGCTGCTCGAGGGGAGTTACGG

TGGA

TCGGACCACCACGCCGCGCGAGCCCAAAGTCCAGATGTCCGCGCGCGGCGGTCGG

AGCTT

GATGACAACATCGCGCAGATGGGAGCTGTCCATGGTCTGGAGCTCCCGCGGCGTC

AGGTC

AGGCGGGAGCTCCTGCAGGTTTACCTCGCATAGACGGGTCAGGGCGCGGGCTAGA

TCCAG

GTGATACCTAATTTCCAGGGGCTGGTTGGTGGCGGCGTCGATGGCTTGCAAGAGG

CCGCA

TCCCCGCGGCGCGACTACGGTACCGCGCGGCGGGCGGTGGGCCGCGGGGGTGTCC

TTGGA

TGATGCATCTAAAAGCGGTGACGCGGGCGAGCCCCCGGAGGTAGGGGGGGCTCC

GGACCC

GCCGGGAGAGGGGGCAGGGGCACGTCGGCGCCGCGCGCGGGCAGGAGCTGGTGC

TGCGCG

CGTAGGTTGCTGGCGAACGCGACGACGCGGCGGTTGATCTCCTGAATCTGGCGCC

TCTGC

GTGAAGACGACGGGCCCGGTGAGCTTGAGCCTGAAAGAGAGTTCGACAGAATCA

ATTTCG

GTGTCGTTGACGGCGGCCTGGCGCAAAATCTCCTGCACGTCTCCTGAGTTGTCTTG

ATAG

GCGATCTCGGCCATGAACTGCTCGATCTCTTCCTCCTGGAGATCTCCGCGTCCGGC

TCGC

TCCACGGTGGCGGCGAGGTCGTTGGAAATGCGGGCCATGAGCTGCGAGAAGGCG

TTGAGG

CCTCCCTCGTTCCAGACGCGGCTGTAGACCACGCCCCCTTCGGCATCGCGGGCGC

GCATG

ACCACCTGCGCGAGATTGAGCTCCACGTGCCGGGCGAAGACGGCGTAGTTTCGCA

GGCGC

TGAAAGAGGTAGTTGAGGGTGGTGGCGGTGTGTTCTGCCACGAAGAAGTACATAA

CCCAG

CGTCGCAACGTGGATTCGTTGATATCCCCCAAGGCCTCAAGGCGCTCCATGGCCT

CGTAG

AAGTCCACGGCGAAGTTGAAAAACTGGGAGTTGCGCGCCGACACGGTTAACTCCT

CCTCC

AGAAGACGGATGAGCTCGGCGACAGTGTCGCGCACCTCGCGCTCAAAGGCTACA

GGGGCC

TCTTCTTCTTCTTCAATCTCCTCTTCCATAAGGGCCTCCCCTTCTTCTTCTTCTGGCG

GC

GGTGGGGGAGGGGGGACACGGCGGCGACGACGGCGCACCGGGAGGCGGTCGAC

AAAGCGC

TCGATCATCTCCCCGCGGCGACGGCGCATGGTCTCGGTGACGGCGCGGCCGTTCT

CGCGG

GGGCGCAGTTGGAAGACGCCGCCCGTCATGTCCCGGTTATGGGTTGGCGGGGGGC

TGCCA

TGCGGCAGGGATACGGCGCTAACGATGCATCTCAACAATTGTTGTGTAGGTACTC

CGCCG

CCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGAGAAAG

GCGTCT

AACCAGTCACAGTCGCAAGGTAGGCTGAGCACCGTGGCGGGCGGCAGCGGGCGG

CGGTCG

GGGTTGTTTCTGGCGGAGGTGCTGCTGATGATGTAATTAAAGTAGGCGGTCTTGA

GACGG

CGGATGGTCGACAGAAGCACCATGTCCTTGGGTCCGGCCTGCTGAATGCGCAGGC

GGTCG

GCCATGCCCCAGGCTTCGTTTTGACATCGGCGCAGGTCTTTGTAGTAGTCTTGCAT

GAGC

CTTTCTACCGGCACTTCTTCTTCTCCTTCCTCTTGTCCTGCATCTCTTGCATCTATCG

CT

GCGGCGGCGGCGGAGTTTGGCCGTAGGTGGCGCCCTCTTCCTCCCATGCGTGTGA

CCCCG

AAGCCCCTCATCGGCTGAAGCAGGGCTAGGTCGGCGACAACGCGCTCGGCTAATA

TGGCC

TGCTGCACCTGCGTGAGGGTAGACTGGAAGTCATCCATGTCCACAAAGCGGTGGT

ATGCG

CCCGTGTTGATGGTGTAAGTGCAGTTGGCCATAACGGACCAGTTAACGGTCTGGT

GACCC

GGCTGCGAGAGCTCGGTGTACCTGAGACGCGAGTAAGCCCTCGAGTCAAATACGT

AGTCG

TTGCAAGTCCGCACCAGGTACTGGTATCCCACCAAAAAGTGCGGCGGCGGCTGGC

GGTAG

AGGGGCCAGCGTAGGGTGGCCGGGGCTCCGGGGGCGAGATCTTCCAACATAAGG

CGATGA

TATCCGTAGATGTACCTGGACATCCAGGTGATGCCGGCGGCGGTGGTGGAGGCGC

GCGGA

AAGTCGCGGACGCGGTTCCAGATGTTGCGCAGCGGCAAAAAGTGCTCCATGGTCG

GGACG

CTCTGGCCGGTCAGGCGCGCGCAATCGTTGACGCTCTAGACCGTGCAAAAGGAGA

GCCTG

TAAGCGGGCACTCTTCCGTGGTCTGGTGGATAAATTCGCAAGGGTATCATGGCGG

ACGAC

CGGGGTTCGAGCCCCGTATCCGGCCGTCCGCCGTGATCCATGCGGTTACCGCCCG

CGTGT

CGAACCCAGGTGTGCGACGTCAGACAACGGGGGAGTGCTCCTTTTGGCTTCCTTC

CAGGC

GCGGCGGCTGCTGCGCTAGCTTTTTTGGCCACTGGCCGCGCGCAGCGTAAGCGGT

TAGGC

TGGAAAGCGAAAGCATTAAGTGGCTCGCTCCCTGTAGCCGGAGGGTTATTTTCCA

AGGGT

TGAGTCGCGGGACCCCCGGTTCGAGTCTCGGACCGGCCGGACTGCGGCGAACGGG

GGTTT

GCCTCCCCGTCATGCAAGACCCCGCTTGCAAATTCCTCCGGAAACAGGGACGAGC

CCCTT

TTTTGCTTTTCCCAGATGCATCCGGTGCTGCGGCAGATGCGCCCCCCTCCTCAGCA

GCGG

CAAGAGCAAGAGCAGCGGCAGACATGCAGGGCACCCTCCCCTCCTCCTACCGCGT

CAGGA

GGGGCGACATCCGCGGTTGACGCGGCAGCAGATGGTGATTACGAACCCCCGCGG

CGCCGG

GCCCGGCACTACCTGGACTTGGAGGAGGGCGAGGGCCTGGCGCGGCTAGGAGCG

CCCTCT

CCTGAGCGGTACCCAAGGGTGCAGCTGAAGCGTGATACGCGTGAGGCGTACGTGC

CGCGG

CAGAACCTGTTTCGCGACCGCGAGGGAGAGGAGCCCGAGGAGATGCGGGATCGA

AAGTTC

CACGCAGGGCGCGAGCTGCGGCATGGCCTGAATCGCGAGCGGTTGCTGCGCGAG

GAGGAC

TTTGAGCCCGACGCGCGAACCGGGATTAGTCCCGCGCGCGCACACGTGGCGGCCG

CCGAC

CTGGTAACCGCATACGAGCAGACGGTGAACCAGGAGATTAACTTTCAAAAAAGCT

TTAAC

AACCACGTGCGTACGCTTGTGGCGCGCGAGGAGGTGGCTATAGGACTGATGCATC

TGTGG

GACTTTGTAAGCGCGCTGGAGCAAAACCCAAATAGCAAGCCGCTCATGGCGCAGC

TGTTC

CTTATAGTGCAGCACAGCAGGGACAACGAGGCATTCAGGGATGCGCTGCTAAAC

ATAGTA

GAGCCCGAGGGCCGCTGGCTGCTCGATTTGATAAACATCCTGCAGAGCATAGTGG

TGCAG

GAGCGCAGCTTGAGCCTGGCTGACAAGGTGGCCGCCATCAACTATTCCATGCTTA

GCCTG

GGCAAGTTTTACGCCCGCAAGATATACCATACCCCTTACGTTCCCATAGACAAGG

AGGTA

AAGATCGAGGGGTTCTACATGCGCATGGCGCTGAAGGTGCTTACCTTGAGCGACG

ACCTG

GGCGTTTATCGCAACGAGCGCATCCACAAGGCCGTGAGCGTGAGCCGGCGGCGC

GAGCTC

AGCGACCGCGAGCTGATGCACAGCCTGCAAAGGGCCCTGGCTGGCACGGGCAGC

GGCGAT

AGAGAGGCCGAGTCCTACTTTGACGCGGGCGCTGACCTGCGCTGGGCCCCAAGCC

GACGC

GCCCTGGAGGCAGCTGGGGCCGGACCTGGGCTGGCGGTGGCACCCGCGCGCGCT

GGCAAC

GTCGGCGGCGTGGAGGAATATGACGAGGACGATGAGTACGAGCCAGAGGACGGC

GAGTAC

TAAGCGGTGATGTTTCTGATCAGATGATGCAAGACGCAACGGACCCGGCGGTGCG

GGCGG

CGCTGCAGAGCCAGCCGTCCGGCCTTAACTCCACGGACGACTGGCGCCAGGTCAT

GGACC

GCATCATGTCGCTGACTGCGCGCAATCCTGACGCGTTCCGGCAGCAGCCGCAGGC

CAACC

GGCTCTCCGCAATTCTGGAAGCGGTGGTCCCGGCGCGCGCAAACCCCACGCACGA

GAAGG

TGCTGGCGATCGTAAACGCGCTGGCCGAAAACAGGGCCATCCGGCCCGACGAGG

CCGGCC

TGGTCTACGACGCGCTGCTTCAGCGCGTGGCTCGTTACAACAGCGGCAACGTGCA

GACCA

ACCTGGACCGGCTGGTGGGGGATGTGCGCGAGGCCGTGGCGCAGCGTGAGCGCG

CGCAGC

AGCAGGGCAACCTGGGCTCCATGGTTGCACTAAACGCCTTCCTGAGTACACAGCC

CGCCA

ACGTGCCGCGGGGACAGGAGGACTACACCAACTTTGTGAGCGCACTGCGGCTAAT

GGTGA

CTGAGACACCGCAAAGTGAGGTGTACCAGTCTGGGCCAGACTATTTTTTCCAGAC

CAGTA

GACAAGGCCTGCAGACCGTAAACCTGAGCCAGGCTTTCAAAAACTTGCAGGGGCT

GTGGG

GGGTGCGGGCTCCCACAGGCGACCGCGCGACCGTGTCTAGCTTGCTGACGCCCAA

CTCGC

GCCTGTTGCTGCTGCTAATAGCGCCCTTCACGGACAGTGGCAGCGTGTCCCGGGA

CACAT

ACCTAGGTCACTTGCTGACACTGTACCGCGAGGCCATAGGTCAGGCGCATGTGGA

CGAGC

ATACTTTCCAGGAGATTACAAGTGTCAGCCGCGCGCTGGGGCAGGAGGACACGG

GCAGCC

TGGAGGCAACCCTAAACTACCTGCTGACCAACCGGCGGCAGAAGATCCCCTCGTT

GCACA

GTTTAAACAGCGAGGAGGAGCGCATTTTGCGCTACGTGCAGCAGAGCGTGAGCCT

TAACC

TGATGCGCGACGGGGTAACGCCCAGCGTGGCGCTGGACATGACCGCGCGCAACA

TGGAAC

CGGGCATGTATGCCTCAAACCGGCCGTTTATCAACCGCCTAATGGACTACTTGCAT

CGCG

CGGCCGCCGTGAACCCCGAGTATTTCACCAATGCCATCTTGAACCCGCACTGGCT

ACCGC

CCCCTGGTTTCTACACCGGGGGATTCGAGGTGCCCGAGGGTAACGATGGATTCCT

CTGGG

ACGACATAGACGACAGCGTGTTTTCCCCGCAACCGCAGACCCTGCTAGAGTTGCA

ACAGC

GCGAGCAGGCAGAGGCGGCGCTGCGAAAGGAAAGCTTCCGCAGGCCAAGCAGCT

TGTCCG

ATCTAGGCGCTGCGGCCCCGCGGTCAGATGCTAGTAGCCCATTTCCAAGCTTGAT

AGGGT

CTCTTACCAGCACTCGCACCACCCGCCCGCGCCTGCTGGGCGAGGAGGAGTACCT

AAACA

ACTCGCTGCTGCAGCCGCAGCGCGAAAAAAACCTGCCTCCGGCATTTCCCAACAA

CGGGA

TAGAGAGCCTAGTGGACAAGATGAGTAGATGGAAGACGTACGCGCAGGAGCACA

GGGACG

TGCCAGGCCCGCGCCCGCCCACCCGTCGTCAAAGGCACGACCGTCAGCGGGGTCT

GGTGT

GGGAGGACGATGACTCGGCAGACGACAGCAGCGTCCTGGATTTGGGAGGGAGTG

GCAACC

CGTTTGCGCACCTTCGCCCCAGGCTGGGGAGAATGTTTTAAAAAAAAAAAAGCAT

GATGC

AAAATAAAAAACTCACCAAGGCCATGGCACCGAGCGTTGGTTTTCTTGTATTCCC

CTTAG

TATGCGGCGCGCGGCGATGTATGAGGAAGGTCCTCCTCCCTCCTACGAGAGTGTG

GTGAG

CGCGGCGCCAGTGGCGGCGGCGCTGGGTTCTCCCTTCGATGCTCCCCTGGACCCG

CCGTT

TGTGCCTCCGCGGTACCTGCGGCCTACCGGGGGGAGAAACAGCATCCGTTACTCT

GAGTT

GGCACCCCTATTCGACACCACCCGTGTGTACCTGGTGGACAACAAGTCAACGGAT

GTGGC

ATCCCTGAACTACCAGAACGACCACAGCAACTTTCTGACCACGGTCATTCAAAAC

AATGA

CTACAGCCCGGGGGAGGCAAGCACACAGACCATCAATCTTGACGACCGGTCGCA

CTGGGG

CGGCGACCTGAAAACCATCCTGCATACCAACATGCCAAATGTGAACGAGTTCATG

TTTAC

CAATAAGTTTAAGGCGCGGGTGATGGTGTCGCGCTTGCCTACTAAGGACAATCAG

GTGGA

GCTGAAATACGAGTGGGTGGAGTTCACGCTGCCCGAGGGCAACTACTCCGAGACC

ATGAC

CATAGACCTTATGAACAACGCGATCGTGGAGCACTACTTGAAAGTGGGCAGACAG

AACGG

GGTTCTGGAAAGCGACATCGGGGTAAAGTTTGACACCCGCAACTTCAGACTGGGG

TTTGA

CCCCGTCACTGGTCTTGTCATGCCTGGGGTATATACAAACGAAGCCTTCCATCCAG

ACAT

CATTTTGCTGCCAGGATGCGGGGTGGACTTCACCCACAGCCGCCTGAGCAACTTG

TTGGG

CATCCGCAAGCGGCAACCCTTCCAGGAGGGCTTTAGGATCACCTACGATGATCTG

GAGGG

TGGTAACATTCCCGCACTGTTGGATGTGGACGCCTACCAGGCGAGCTTGAAAGAT

GACAC

CGAACAGGGCGGGGGTGGCGCAGGCGGCAGCAACAGCAGTGGCAGCGGCGCGG

AAGAGAA

TCCAACGCGGCAGCCGCGGCAATGCAGCCGGTGGAGGACATGAACGATCATGC

ATTCG

CGGCGACACCTTTGCCACACGGGCTGAGGAGAAGCGCGCTGAGGCCGAAGCAGC

GGCCGA

AGCTGCCGCCCCCGCTGCGCAACCCGAGGTCGAGAAGCCTCAGAAGAAACCGGT

GATCAA

ACCCCTGACAGAGGACAGCAAGAAACGCAGTTACAACCTAATAAGCAATGACAG

CACCTT

CACCCAGTACCGCAGCTGGTACCTTGCATACAACTACGGCGACCCTCAGACCGGA

ATCCG

CTCATGGACCCTGCTTTGCACTCCTGACGTAACCTGCGGCTCGGAGCAGGTCTACT

GGTC

GTTGCCAGACATGATGCAAGACCCCGTGACCTTCCGCTCCACGCGCCAGATCAGC

AACTT

TCCGGTGGTGGGCGCCGAGCTGTTGCCCGTGCACTCCAAGAGCTTCTACAACGAC

CAGGC

CGTCTACTCCCAACTCATCCGCCAGTTTACCTCTCTGACCCACGTGTTCAATCGCT

TTCC

CGAGAACCAGATTTTGGCGCGCCCGCCAGCCCCCACCATCACCACCGTCAGTGAA

AACGT

TCCTGCTCTCACAGATCACGGGACGCTACCGCTGCGCAACAGCATCGGAGGAGTC

CAGCG

AGTGACCATTACTGACGCCAGACGCCGCACCTGCCCCTACGTTTACAAGGCCCTG

GGCAT

AGTCTCGCCGCGCGTCCTATCGAGCCGCACTTTTTGAGCAAGCATGTCCATCCTTA

TATC

GCCCAGCAATAACACAGGCTGGGGCCTGCGCTTCCCAAGCAAGATGTTTGGCGGG

GCCAA

GAAGCGCTCCGACCAACACCCAGTGCGCGTGCGCGGGCACTACCGCGCGCCCTGG

GGCGC

GCACAAACGCGGCCGCACTGGGCGCACCACCGTCGATGACGCCATCGACGCGGT

GGTGGA

GGAGGCGCGCAACTACACGCCCACGCCGCCACCAGTGTCCACAGTGGACGCGGC

CATTCA

GACCGTGGTGCGCGGAGCCCGGCGCTATGCTAAAATGAAGAGACGGCGGAGGCG

CGTAGC

ACGTCGCCACCGCCGCCGACCCGGCACTGCCGCCCAACGCGCGGCGGCGGCCCTG

CTTAA

CCGCGCACGTCGCACCGGCCGACGGGCGGCCATGCGGGCCGCTCGAAGGCTGGC

CGCGGG

ATTGTCACTGTGCCCCCCAGGTCCAGGCGACGAGCGGCCGCCGCAGCAGCCGCG

GCCAT

TAGTGCTATGACTCAGGGTCGCAGGGGCAACGTGTATTGGGTGCGCGACTCGGTT

AGCGG

CCTGCGCGTGCCCGTGCGCACCCGCCCCCCGCGCAACTAGATTGCAAGAAAAAAC

TACTT

AGACTCGTACTGTTGTATGTATCCAGCGGCGGCGGCGCGCAACGAAGCTATGTCC

AAGCG

CAAAATCAAAGAAGAGATGCTCCAGGTCATCGCGCCGGAGATCTATGGCCCCCCG

AAGAA

GGAAGAGCAGGATTACAAGCCCCGAAAGCTAAAGCGGGTCAAAAAGAAAAAGA

AAGATGA

TGATGATGAACTTGACGACGAGGTGGAACTGCTGCACGCTACCGCGCCCAGGCGA

CGGGT

ACAGTGGAAAGGTCGACGCGTAAAACGTGTTTTGCGACCCGGCACCACCGTAGTC

TTTAC

GCCCGGTGAGCGCTCCACCCGCACCTACAAGCGCGTGTATGATGAGGTGTACGGC

GACGA

GGACCTGCTTGAGCAGGCCAACGAGCGCCTCGGGGAGTTTGCCTACGGAAAGCG

GCATAA

GGACATGCTGGCGTTGCCGCTGGACGAGGGCAACCCAACACCTAGCCTAAAGCCC

GTAAC

ACTGCAGCAGGTGCTGCCCGCGCTTGCACCGTCCGAAGAAAAGCGCGGCCTAAAG

CGCGA

GTCTGGTGACTTGGCACCCACCGTGCAGCTGATGGTACCCAAGCGCCAGCGACTG

GAAGA

TGTCTTGGAAAAAATGACCGTGGAACCTGGGCTGGAGCCCGAGGTCCGCGTGCGG

CCAAT

CAAGCAGGTGGCGCCGGGACTGGGCGTGCAGACCGTGGACGTTCAGATACCCACT

ACCAG

TAGCACCAGTATTGCCACCGCCACAGAGGGCATGGAGACACAAACGTCCCCGGTT

GCCTC

AGCGGTGGCGGATGCCGCGGTGCAGGCGGTCGCTGCGGCCGCGTCCAAGACCTCT

ACGGA

GGTGCAAACGGACCCGTGGATGTTTCGCGTTTCAGCCCCCCGGCGCCCGCGCGGT

TCGAG

GAAGTACGGCGCCGCCAGCGCGCTACTGCCCGAATATGCCCTACATCCTTCCATT

GCGCC

TACCCCCGGCTATCGTGGCTACACCTACCGCCCCAGAAGACGAGCAACTACCCGA

CGCCG

AACCACCACTGGAACCCGCCGCCGCCGTCGCCGTCGCCAGCCCGTGCTGGCCCCG

ATTTC

CGTGCGCAGGGTGGCTCGCGAAGGAGGCAGGACCCTGGTGCTGCCAACAGCGCG

CTACCA

CCCCAGCATCGTTTAAAAGCCGGTCTTTGTGGTTCTTGCAGATATGGCCCTCACCT

GCCG

CCTCCGTTTCCCGGTGCCGGGATTCCGAGGAAGAATGCACCGTAGGAGGGGCATG

GCCGG

CCACGGCCTGACGGGCGGCATGCGTCGTGCGCACCACCGGCGGCGGCGCGCGTCG

CACCG

TCGCATGCGCGGCGGTATCCTGCCCCTCCTTATTCCACTGATCGCCGCGGCGATTG

GCGC

CGTGCCCGGAATTGCATCCGTGGCCTTGCAGGCGCAGAGACACTGATTAAAAACA

AGTTG

CATGTGGAAAAATCAAAATAAAAAGTCTGGACTCTCACGCTCGCTTGGTCCTGTA

ACTAT

TTTGTAGAATGGAAGACATCAACTTTGCGTCTCTGGCCCCGCGACACGGCTCGCG

CCCGT

TCATGGGAAACTGGCAAGATATCGGCACCAGCAATATGAGCGGTGGCGCCTTCAG

CTGGG

GCTCGCTGTGGAGCGGCATTAAAAATTTCGGTTCCACCGTTAAGAACTATGGCAG

CAAGG

CCTGGAACAGCAGCACAGGCCAGATGCTGAGGGATAAGTTGAAAGAGCAAAATT

TCCAAC

AAAAGGTGGTAGATGGCCTGGCCTCTGGCATTAGCGGGGTGGTGGACCTGGCCAA

CCAGG

CAGTGCAAAATAAGATTAACAGTAAGCTTGATCCCCGCCCTCCCGTAGAGGAGCC

TCCAC

CGGCCGTGGAGACAGTGTCTCCAGAGGGGCGTGGCGAAAAGCGTCCGCGCCCCG

ACAGGG

AAGAAACTCTGGTGACGCAAATAGACGAGCCTCCCTCGTACGAGGAGGCACTAA

AGCAAG

GCCTGCCCACCACCCGTCCCATCGCGCCCATGGCTACCGGAGTGCTGGGCCAGCA

CACAC

CCGTAACGCTGGACCTGCCTCCCCCCGCCGACACCCAGCAGAAACCTGTGCTGCC

AGGCC

CGACCGCCGTTGTTGTAACCCGTCCTAGCCGCGCGTCCCTGCGCCGCGCCGCCAG

CGGTC

CGCGATCGTTGCGGCCCGTAGCCAGTGGCAACTGGCAAAGCACACTGAACAGCAT

CGTGG

GTCTGGGGGTGCAATCCCTGAAGCGCCGACGATGCTTCTGAATAGCTAACGTGTC

GTATG

TGTGTCATGTATGCGTCCATGTCGCCGCCAGAGGAGCTGCTGAGCCGCCGCGCGC

CCGCT

TTCCAAGATGGCTACCCCTTCGATGATGCCGCAGTGGTCTTACATGCACATCTCGG

GCCA

GGACGCCTCGGAGTACCTGAGCCCCGGGCTGGTGCAGTTTGCCCGCGCCACCGAG

ACGTA

CTTCAGCCTGAATAACAAGTTTAGAAACCCCACGGTGGCGCCTACGCACGACGTG

ACCAC

AGACCGGTCCCAGCGTTTGACGCTGCGGTTCATCCCTGTGGACCGTGAGGATACT

GCGTA

CTCGTACAAGGCGCGGTTCACCCTAGCTGTGGGTGATAACCGTGTGCTGGACATG

GCTTC

CACGTACTTTGACATCCGCGGCGTGCTGGACAGGGGCCCTACTTTTAAGCCCTACT

CTGG

CACTGCCTACAACGCCCTGGCTCCCAAGGGTGCCCCAAATCCTTGCGAATGGGAT

GAAGC

TGCTACTGCTCTTGAAATAAACCTAGAAGAAGAGGACGATGACAACGAAGACGA

AGTAGA

CGAGCAAGCTGAGCAGCAAAAAACTCACGTATTTGGGCAGGCGCCTTATTCTGGT

ATAAA

TATTACAAAGGAGGGTATTCAAATAGGTGTCGAAGGTCAAACACCTAAATATGCC

GATAA

AACATTTCAACCTGAACCTCAAATAGGAGAATCTCAGTGGTACGAAACTGAAATT

AATCA

TGCAGCTGGGAGAGTCCTTAAAAAGACTACCCCAATGAAACCATGTTACGGTTCA

TATGC

AAAACCCACAAATGAAAATGGAGGGCAAGGCATTCTTGTAAAGCAACAAAATGG

AAAGCT

AGAAAGTCAAGTGGAAATGCAATTTTTCTCAACTACTGAGGCGACCGCAGGCAAT

GGTGA

TAACTTGACTCCTAAAGTGGTATTGTACAGTGAAGATGTAGATATAGAAACCCCA

GACAC

TCATATTTCTTACATGCCCACTATTAAGGAAGGTAACTCACGAGAACTAATGGGC

CAACA

ATCTATGCCCAACAGGCCTAATTACATTGCTTTTAGGGACAATTTTATTGGTCTAA

TGTA

TTACAACAGCACGGGTAATATGGGTGTTCTGGCGGGCCAAGCATCGCAGTTGAAT

GCTGT

TGTAGATTTGCAAGACAGAAACACAGAGCTTTCATACCAGCTTTTGCTTGATTCCA

TTGG

TGATAGAACCAGGTACTTTTCTATGTGGAATCAGGCTGTTGACAGCTATGATCCA

GATGT

TAGAATTATTGAAAATCATGGAACTGAAGATGAACTTCCAAATTACTGCTTTCCA

CTGGG

AGGTGTGATTAATACAGAGACTCTTACCAAGGTAAAACCTAAAACAGGTCAGGA

AAATGG

ATGGGAAAAAGATGCTACAGAATTTTCAGATAAAAATGAAATAAGAGTTGGAAA

TAATTT

TGCCATGGAAATCAATCTAAATGCCAACCTGTGGAGAAATTTCCTGTACTCCAAC

ATAGC

GCTGTATTTGCCCGACAAGCTAAAGTACAGTCCTTCCAACGTAAAAATTTCTGATA

ACCC

AAACACCTACGACTACATGAACAAGCGAGTGGTGGCTCCCGGGTTAGTGGACTGC

TACAT

TAACCTTGGAGCACGCTGGTCCCTTGACTATATGGACAACGTCAACCCATTTAACC

ACCA

CCGCAATGCTGGCCTGCGCTACCGCTCAATGTTGCTGGGCAATGGTCGCTATGTGC

CCTT

CCACATCCAGGTGCCTCAGAAGTTCTTTGCCATTAAAAACCTCCTTCTCCTGCCGG

GCTC

ATACACCTACGAGTGGAACTTCAGGAAGGATGTTAACATGGTTCTGCAGAGCTCC

CTAGG

AAATGACCTAAGGGTTGACGGAGCCAGCATTAAGTTTGATAGCATTTGCCTTTAC

GCCAC

CTTCTTCCCCATGGCCCACAACACCGCCTCCACGCTTGAGGCCATGCTTAGAAACG

ACAC

CAACGACCAGTCCTTTAACGACTATCTCTCCGCCGCCAACATGCTCTACCCTATAC

CCGC

CAACGCTACCAACGTGCCCATATCCATCCCCTCCCGCAACTGGGCGGCTTTCCGCG

GCTG

GGCCTTCACGCGCCTTAAGACTAAGGAAACCCCATCACTGGGCTCGGGCTACGAC

CCTTA

TTACACCTACTCTGGCTCTATACCCTACCTAGATGGAACCTTTTACCTCAACCACA

CCTT

TAAGAAGGTGGCCATTACCTTTGACTCTTCTGTCAGCTGGCCTGGCAATGACCGCC

TGCT

TACCCCCAACGAGTTTGAAATTAAGCGCTCAGTTGACGGGGAGGGTTACAACGTT

GCCCA

GTGTAACATGACCAAAGACTGGTTCCTGGTACAAATGCTAGCTAACTACAACATT

GGCTA

CCAGGGCTTCTATATCCCAGAGAGCTACAAGGACCGCATGTACTCCTTCTTTAGA

AACTT

CCAGCCCATGAGCCGTCAGGTGGTGGATGATACTAAATACAAGGACTACCAACAG

GTGGG

CATCCTACACCAACACAACAACTCTGGATTTGTTGGCTACCTTGCCCCCACCATGC

GCGA

AGGACAGGCCTACCCTGCTAACTTCCCCTATCCGCTTATAGGCAAGACCGCAGTT

GACAG

CATTACCCAGAAAAAGTTTCTTTGCGATCGCACCCTTTGGCGCATCCCATTCTCCA

GTAA

CTTTATGTCCATGGGCGCACTCACAGACCTGGGCCAAAACCTTCTCTACGCCAACT

CCGC

CCACGCGCTAGACATGACTTTTGAGGTGGATCCCATGGACGAGCCCACCCTTCTTT

ATGT

TTTGTTTGAAGTCTTTGACGTGGTCCGTGTGCACCGGCCGCACCGCGGCGTCATCG

AAAC

CGTGTACCTGCGCACGCCCTTCTCGGCCGGCAACGCCACAACATAAGCGATCGCA

GCAGG

TTTCCCCAACTGACACAAAACGTGCAACTTGAAACTCCGCCTGGTCTTTCCAGGTC

TAGA

GGGGTAACACTTTGTACTGCGTTTGGCTCCACGCTCGATCCACTGGCGAGTGTTAG

TAAC

AGCACTGTTGCTTCGTAGCGGAGCATGACGGCCGTGGGAACTCCTCCTTGGTAAC

AAGGA

CCCACGGGGCCAAAAGCCACGCCCACACGGGCCCGTCATGTGTGCAACCCCAGCA

CGGCG

ACTTTACTGCGAAACCCACTTTAAAGTGACATTGAAACTGGTACCCACACACTGG

TGACA

GGCTAAGGATGCCCTTCAGGTACCCCGAGGTAACACGCGACACTCGGGATCTGAG

AAGGG

GACTGGGGCTTCTATAAAAGCGCTCGGTTTAAAAAGCTTCTATGCCTGAATANGT

GACCG

GANGTCGGCACCTTTCCTTTGCAATTAATGACCCTGTATACGCCACCATGGCTATG

ATGG

AGGTCCAGGGGGGACCCAGCCTGGGACAGACCTGCGTGCTGATCGTGATCTTTAC

AGTGC

TCCTGCAGTCTCTCTGTGTGGCTGTAACTTACGTGTACTTTACCAACGAGCTGAAG

CAGA

TGCAGGACAAGTACTCCAAAAGTGGCATTGCTTGTTTCTTAAAAGAAGATGACAG

TTATT

GGGACCCCAATGACGAAGAGAGTATGAACAGCCCCTGCTGGCAAGTCAAGTGGC

AACTCC

GTCAGCTCGTTAGAAAGATGATTTTGAGAACCTCTGAGGAAACCATTTCTACAGT

TCAAG

AAAAGCAACAAAATATTTCTCCCCTAGTGAGAGAAAGAGGTCCTCAGAGAGTAG

CAGCTC

ACATAACTGGGACCAGAGGAAGAAGCAACACATTGTCTTCTCCAAACTCCAAGAA

TGAAA

AGGCTCTGGGCCGCAAAATAAACTCCTGGGAATCATCAAGGAGTGGGCATTCATT

CCTGA

GCAACTTGCACTTGAGGAATGGTGAACTGGTCATCCATGAAAAAGGGTTTTACTA

CATCT

ATTCCCAAACATACTTTCG认TTTCAGGAGGAAATAAAAGAAAACACAAAGAACG

ACAAAC

AAATGGTCCAATATATTTACAAATACACAAGTTATCCTGACCCTATATTGTTGATG

AAAA

GTGCTAGA A ATAGTTGTTGGTCTAAAGATGCAGAATATGGACTCTATTCCATCTAT

CAAG

GGGGAATATTTGAGCTTAAGGAAAATGACAGAATTTTTGTTTCTGTAACAAATGA

GCACT

TAATAGACATGGACCATGAAGCCAGTTTTTTCGGGGCCTTTTTAGTTGGCTAAGTA

TACT

TCGAATGCATGCGATCGCAGAAGCAAGCAACATCAACAACAGCTGCCGCCATGG

GCTCCA

GTGAGCAGGAACTGAAAGCCATTGTCAAAGATCTTGGTTGTGGGCCATATTTTTT

GGGCA

CCTATGACAAGCGCTTTCCAGGCTTTGTTTCTCCACACAAGCTCGCCTGCGCCATA

GTCA

ATACGGCCGGTCGCGAGACTGGGGGCGTACACTGGATGGCCTTTGCCTGGAACCC

GCACT

CAAAAACATGCTACCTCTTTGAGCCCTTTGGCTTTTCTGACCAGCGACTCAAGCAG

GTTT

ACCAGTTTGAGTACGAGTCACTCCTGCGCCGTAGCGCCATTGCTTCTTCCCCCGAC

CGCT

GTATAACGCTGGAAAAGTCCACCCAAAGCGTACAGGGGCCCAACTCGGCCGCCTG

TGGAC

TATTCTGCTGCATGTTTCTCCACGCCTTTGCCAACTGGCCCCAAACTCCCATGGAT

CACA

ACCCCACCATGAACCTTATTACCGGGGTACCCAACTCCATGCTCAACAGTCCCCA

GGTAC

AGCCCACCCTGCGTCGCAACCAGGAACAGCTCTACAGCTTCCTGGAGCGCCACTC

GCCCT

ACTTCCGCAGCCACAGTGCGCAGATTAGGAGCGCCACTTCTTTTTGTCACTTGAAA

AACA

TGTAAAAAATAATGTACTAGAGACACTTTCAATAAAGGCAAATGCTTTTATTTGT

ACACT

CTCGGGTGATTATTTACCCCCACCCTTGCCGTCTGCGCGGTTTAAAAATCAAAGGG

GTTC

TGCCGCGCATCGCTATGCGCCACTGGCAGGGACACGTTGCGATACTGGTGTTTAG

TGCTC

CACTTAAACTCAGGCACAACCATCCGCGGCAGCTCGGTGAAGTTTTCACTCCACA

GGCTG

CGCACCATCACCAACGCGTTTAGCAGGTCGGGCGCCGATATCTTGAAGTCGCAGT

TGGGG

CCTCCGCCCTGCGCGCGCGAGTTGCGATACACAGGGTTGCAGCACTGGAACACTA

TCAGC

GCCGGGTGGTGCACGCTGGCCAGCACGCTCTTGTCGGAGATCAGATCCGCGTCCA

GGTCC

TCCGCGTTGCTCAGGGCGAACGGAGTCAACTTTGGTAGCTGCCTTCCCAAAAAGG

GCGCG

TGCCCAGGCTTTGAGTTGCACTCGCACCGTAGTGGCATCAAAAGGTGACCGTGCC

CGGTC

TGGGCGTTAGGATACAGCGCCTGCATAAAAGCCTTGATCTGCTTAAAAGCCACCT

GAGCC

TTTGCGCCTTCAGAGAAGAACATGCCGCAAGACTTGCCGGAAAACTGATTGGCCG

GACAG

GCCGCGTCGTGCACGCAGCACCTTGCGTCGGTGTTGGAGATCTGCACCACATTTC

GGCCC

CACCGGTTCTTCACGATCTTGGCCTTGCTAGACTGCTCCTTCAGCGCGCGCTGCCC

GTTT

TCGCTCGTCACATCCATTTCAATCACGTGCTCCTTATTTATCATAATGCTTCCGTGT

AGA

CACTTAAGCTCGCCTTCGATCTCAGCGCAGCGGTGCAGCCACAACGCGCAGCCCG

TGGGC

TCGTGATGCTTGTAGGTCACCTCTGCAAACGACTGCAGGTACGCCTGCAGGAATC

GCCCC

ATCATCGTCACAAAGGTCTTGTTGCTGGTGAAGGTCAGCTGCAACCCGCGGTGCT

CCTCG

TTCAGCCAGGTCTTGCATACGGCCGCCAGAGCTTCCACTTGGTCAGGCAGTAGTTT

GAAG

TTCGCCTTTAGATCGTTATCCACGTGGTACTTGTCCATCAGCGCGCGCGCAGCCTC

CATG

CCCTTCTCCCACGCAGACACGATCGGCACACTCAGCGGGTTCATCACCGTAATTTC

ACTT

TCCGCTTCGCTGGGCTCTTCCTCTTCCTCTTGCGTCCGCATACCACGCGCCACTGG

GTCG

TCTTCATTCAGCCGCCGCACTGTGCGCTTACCTCCTTTGCCATGCTTGATTAGCAC

CGGT

GGGTTGCTGAAACCCACCATTTGTAGCGCCACATCTTCTCTTTCTTCCTCGCTGTCC

ACG

ATTACCTCTGGTGATGGCGGGCGCTCGGGCTTGGGAGAAGGGCGCTTCTTTTTCTT

CTTG

GGCGCAATGGCCAAATCCGCCGCCGAGGTCGATGGCCGCGGGCTGGGTGTGCGC

GGCACC

AGCGCGTCTTGTGATGAGTCTTCCTCGTCCTCGGACTCGATACGCCGCCTCATCCG

CTTT

TTTGGGGGCGCCCGGGGAGGCGGCGGCGACGGGGACGGGGACGACACGTCCTCC

ATGGTT

GGGGGACGTCGCGCCGCACCGCGTCCGCGCTCGGGGGTGGTTTCGCGCTGCTCCT

CTTCC

CGACTGGCCATTTCCTTCTCCTATAGGCAGAAAAAGATCATGGAGTCAGTCGAGA

AGAAG

GACAGCCTAACCGCCCCCTCTGAGTTCGCCACCACCGCCTCCACCGATGCCGCCA

ACGCG

CCTACCACCTTCCCCGTCGAGGCACCCCCGCTTGAGGAGGAGGAAGTGATTATCG

AGCAG

GACCCAGGTTTTGTAAGCGAAGACGACGAGGACCGCTCAGTACCAACAGAGGAT

AAAAAG

CAAGACCAGGACAACGCAGAGGCAAACGAGGAACAAGTCGGGCGGGGGGACGA

AAGGCAT

GGCGACTACCTAGATGTGGGAGACGACGTGCTGTTGAAGCATCTGCAGCGCCAGT

GCGCC

ATTATCTGCGACGCGTTGCAAGAGCGCAGCGATGTGCCCCTCGCCATAGCGGATG

TCAGC

CTTGCCTACGAACGCCACCTATTCTCACCGCGCGTACCCCCCAAACGCCAAGAAA

ACGGC

ACATGCGAGCCCAACCCGCGCCTCAACTTCTACCCCGTATTTGCCGTGCCAGAGG

TGCTT

GCCACCTATCACATCTTTTTCCAAAACTGCAAGATACCCCTATCCTGCCGTGCCAA

CCGC

AGCCGAGCGGACAAGCAGCTGGCCTTGCGGCAGGGCGCTGTCATACCTGATATCG

CCTCG

CTCAACGAAGTGCCAAAAATCTTTGAGGGTCTTGGACGCGACGAGAAGCGCGCG

GCAAAC

GCTCTGCAACAGGAAAACAGCGAAAATGAAAGTCACTCTGGAGTGTTGGTGGAA

CTCGAG

GGTGACAACGCGCGCCTAGCCGTACTAAAACGCAGCATCGAGGTCACCCACTTTG

CCTAC

CCGGCACTTAACCTACCCCCCAAGGTCATGAGCACAGTCATGAGTGAGCTGATCG

TGCGC

CGTGCGCAGCCCCTGGAGAGGGATGCAAATTTGCAAGAACAAACAGAGGAGGGC

CTACCC

GCAGTTGGCGACGAGCAGCTAGCGCGCTGGCTTCAAACGCGCGAGCCTGCCGACT

TGGAG

GAGCGACGCAAACTAATGATGGCCGCAGTGCTCGTTACCGTGGAGCTTGAGTGCA

TGCAG

CGGTTCTTTGCTGACCCGGAGATGCAGCGCAAGCTAGAGGAAACATTGCACTACA

CCTTT

CGACAGGGCTACGTACGCCAGGCCTGCAAGATCTCCAACGTGGAGCTCTGCAACC

TGGTC

TCCTACCTTGGAATTTTGCACGAAAACCGCCTTGGGCAAAACGTGCTTCATTCCAC

GCTC

AAGGGCGAGGCGCGCCGCGACTACGTCCGCGACTGCGTTTACTTATTTCTATGCT

ACACC

TGGCAGACGGCCATGGGCGTTTGGCAGCAGTGCTTGGAGGAGTGCAACCTCAAGG

AGCTG

CAGAAACTGCTAAAGCAAAACTTGAAGGACCTATGGACGGCCTTCAACGAGCGCT

CCGTG

GCCGCGCACCTGGCGGACATCATTTTCCCCGAACGCCTGCTTAAAACCCTGCAAC

AGGGT

CTGCCAGACTTCACCAGTCAAAGCATGTTGCAGAACTTTAGGAACTTTATCCTAG

AGCGC

TCAGGAATCTTGCCCGCCACCTGCTGTGCACTTCCTAGCGACTTTGTGCCCATTAA

GTAC

CGCGAATGCCCTCCGCCGCTTTGGGGCCACTGCTACCTTCTGCAGCTAGCCAACTA

CCTT

GCCTACCACTCTGACATAATGGAAGACGTGAGCGGTGACGGTCTACTGGAGTGTC

ACTGT

CGCTGCAACCTATGCACCCCGCACCGCTCCCTGGTTTGCAATTCGCAGCTGCTTAA

CGAA

AGTCAAATTATCGGTACCTTTGAGCTGCAGGGTCCCTCGCCTGACGAAAAGTCCG

CGGCT

CCGGGGTTGAAACTCACTCCGGGGCTGTGGACGTCGGCTTACCTTCGCAAATTTGT

ACCT

GAGGACTACCACGCCCACGAGATTAGGTTCTACGAAGACCAATCCCGCCCGCCAA

ATGCG

GAGCTTACCGCCTGCGTCATTACCCAGGGCCACATTCTTGGCCAATTGCAAGCCAT

CAAC

AAAGCCCGCCAAGAGTTTCTGCTACGAAAGGGACGGGGGGTTTACTTGGACCCCC

AGTCC

GGCGAGGAGCTCAACCCAATCCCCCCGCCGCCGCAGCCCTATCAGCAGCAGCCGC

GGGCC

CTTGCTTCCCAGGATGGCACCCAAAAAGAAGCTGCAGCTGCCGCCGCCACCCACG

GACGA

GGAGGAATACTGGGACAGTCAGGCAGAGGAGGTTTTGGACGAGGAGGAGGAGGA

CATGAT

GGAAGACTGGGAGAGCCTAGACGAGGAAGCTTCCGAGGTCGAAGAGGTGTCAGA

CGAAAC

ACCGTCACCCTCGGTCGCATTCCCCTCGCCGGCGCCCCAGAAATCGGCAACCGGT

TCCAG

CATGGCTACAACCTCCGCTCCTCAGGCGCCGCCGGCACTGCCCGTTCGCCGACCC

AACCG

TAGATGGGACACCACTGGAACCAGGGCCGGTAAGTCCAAGCAGCCGCCGCCGTT

AGCCCA

AGAGCAACAACAGCGCCAAGGCTACCGCTCATGGCGCGGGCACAAGAACGCCAT

AGTTGC

TTGCTTGCAAGACTGTGGGGGCAACATCTCCTTCGCCCGCCGCTTTCTTCTCTACC

ATCA

CGGCGTGGCCTTCCCCCGTAACATCCTGCATTACTACCGTCATCTCTACAGCCCAT

ACTG

CACCGGCGGCAGCGGCAGCGGCAGCAACAGCAGCGGCCACACAGAAGCAAAGGC

GACCGG

ATAGCAAGACTCTGACAAAGCCCAAGAAATCCACAGCGGCGGCAGCAGCAGGAG

GAGGAG

CGCTGCGTCTGGCGCCCAACGAACCCGTATCGACCCGCGAGCTTAGAAACAGGAT

TTTTC

CCACTCTGTATGCTATATTTCAACAGAGCAGGGGCCAAGAACAAGAGCTGAAAAT

AAAAA

ACAGGTCTCTGCGATCCCTCACCCGCAGCTGCCTGTATCACAAAAGCGAAGATCA

GCTTC

GGCGCACGCTGGAAGACGCGGAGGCTCTCTTCAGTAAATACTGCGCGCTGACTCT

TAAGG

ACTAGTTTCGCGCCCTTTCTCAAATTTAAGCGCGAAAACTACGTCATCTCCAGCGG

CCAC

ACCCGGCGCCAGCACCTGTCGTCAGCGCCATTATGAGCAAGGAAATTCCCACGCC

CTACA

TGTGGAGTTACCAGCCACAAATGGGACTTGCGGCTGGAGCTGCCCAAGACTACTC

AACCC

GAATAAACTACATGAGCGCGGGACCCCACATGATATCCCGGGTCAACGGAATCCG

CGCCC

ACCGAAACCGAATTCTCTTGGAACAGGCGGCTATTACCACCACACCTCGTAATAA

CCTTA

ATCCCCGTAGTTGGCCCGCTGCCCTGGTGTACCAGGAAAGTCCCGCTCCCACCACT

GTGG

TACTTCCCAGAGACGCCCAGGCCGAAGTTCAGATGACTAACTCAGGGGCGCAGCT

TGCGG

GCGGCTTTCGTCACAGGGTGCGGTCGCCCGGGCAGGGTATAACTCACCTGACAAT

CAGAG

GGCGAGGTATTCAGCTCAACGACGAGTCGGTGAGCTCCTCGCTTGGTCTCCGTCC

GGACG

GGACATTTCAGATCGGCGGCGCCGGCCGTCCTTCATTCACGCCTCGTCAGGCAAT

CCTAA

CTCTGCAGACCTCGTCCTCTGAGCCGCGCTCTGGAGGCATTGGAACTCTGCAATTT

ATTG

AGGAGTTTGTGCCATCGGTCTACTTTAACCCCTTCTCGGGACCTCCCGGCCACTAT

CCGG

ATCAATTTATTCCTAACTTTGACGCGGTAAAGGACTCGGCGGACGGCTACGACTG

AATGT

TAAGTGGAGAGGCAGAGCAACTGCGCCTGAAACACCTGGTCCACTGTCGCCGCCA

CAAGT

GCTTTGCCCGCGACTCCGGTGAGTTTTGCTACTTTGAATTGCCCGAGGATCATATC

GAGG

GCCCGGCGCACGGCGTCCGGCTTACCGCCCAGGGAGAGCTTGCCCGTAGCCTGAT

TCGGG

AGTTTACCCAGCGCCCCCTGCTAGTTGAGCGGGACAGGGGACCCTGTGTTCTCAC

TGTGA

TTTGCAACTGTCCTAACCTTGGATTACATCAAGATCTTTGTTGCCATCTCTGTGCTG

AGT

ATAATAAATACAGAAATTAAAATATACTGGGGCTCCTATCGCCATCCTGTAAACG

CCACC

GTCTTCACCCGCCCAAGCAAACCAAGGCGAACCTTACCTGGTACTTTTAACATCTC

TCCC

TCTGTGATTTACAACAGTTTCAACCCAGACGGAGTGAGTCTACGAGAGAACCTCT

CCGAG

CTCAGCTACTCCATCAGAAAAAACACCACCCTCCTTACCTGCCGGGAACGTACGA

GTGCG

TCACCGGCCGCTGCACCACACCTACCGCCTGACCGTAAACCAGACTTTTTCCGGA

CAGAC

CTCAATAACTCTGTTTACCAGAACAGGAGGTGAGCTTAGAAAACCCTTAGGGTAT

TAGGC

CAAAGGCGCAGCTACTGTGGGGTTTATGAACAATTCAAGCAACTCTACGGGCTAT

TCTAA

TTCAGGTTTCTCTAGAATCGGGGTTGGGGTTATTCTCTGTCTTGTGATTCTCTTTAT

TCT

TATACTAACGCTTCTCTGCCTAAGGCTCGCCGCCTGCTGTGTGCACATTTGCATTT

ATTG

TCAGCTTTTTAAACGCTGGGGTCGCCACCCAAGATGATTAGGTACATAATCCTAG

GTTTA

CTCACCCTTGCGTCAGCCCACGGTACCACCCAAAAGGTGGATTTTAAGGAGCCAG

CCTGT

AATGTTACATTCGCAGCTGAAGCTAATGAGTGCACCACTCTTATAAAATGCACCA

CAGAA

CATGAAAAGCTGCTTATTCGCCACAAAAACAAAATTGGCAAGTATGCTGTTTATG

CTATT

TGGCAGCCAGGTGACACTACAGAGTATAATGTTACAGTTTTCCAGGGTAAAAGTC

ATAAA

ACTTTTATGTATACTTTTCCATTTTATGAAATGTGCGACATTACCATGTACATGAG

CAAA

CAGTATAAGTTGTGGCCCCCACAAAATTGTGTGGAAAACACTGGCACTTTCTGCT

GCACT

GCTATGCTAATTACAGTGCTCGCTTTGGTCTGTACCCTACTCTATATTAAATACAA

AAGC

AGACGCAGCTTTATTGAGGAAAAGAAAATGCCTTAATTTACTAAGTTACAAAGCT

AATGT

CACCACTAACTGCTTTACTCGCTGCTTGCAAAACAAATTCAAAAAGTTAGCATTAT

AATT

AGAATAGGATTTAAACCCCCCGGTCATTTCCTGCTCAATACCATTCCCCTGAACAA

TTGA

CTCTATGTGGGATATGCTCCAGCGCTACAACCTTGAAGTCAGGCTTCCTGGATGTC

AGCA

TCTGACTTTGGCCAGCACCTGTCCCGCGGATTTGTTCCAGTCCAACTACAGCGACC

CACC

CTAACAGAGATGACCAACACAACCAACGCGGCCGCCGCTACCGGACTTACATCTA

CCACA

AATACACCCCAAGTTTCTGCCTTTGTCAATAACTGGGATAACTTGGGCATGTGGTG

GTTC

TCCATAGCGCTTATGTTTGTATGCCTTATTATTATGTGGCTCATCTGCTGCCTAAAG

CGC

AAACGCGCCCGACCACCCATCTATAGTCCCATCATTGTGCTACACCCAAACAATG

ATGGA

ATCCATAGATTGGACGGACTGAAACACATGTTCTTTTCTCTTACAGTATGATTAAA

TGAG

ACATGATTCCTCGAGTTTTTATATTACTGACCCTTGTTGCGCTTTTTTGTGCGTGCT

CCA

CATTGGCTGCGGTTTCTCACATCGAAGTAGACTGCATTCCAGCCTTCACAGTCTAT

TTGC

TTTACGGATTTGTCACCCTCACGCTCATCTGCAGCCTCATCACTGTGGTCATCGCC

TTTA

TCCAGTGCATTGACTGGGTCTGTGTGCGCTTTGCATATCTCAGACACCATCCCCAG

TACA

GGGACAGGACTATAGCTGAGCTTCTTAGAATTCTTTAATTATGAAATTTACTGTGA

CTTT

TCTGCTGATTATTTGCACCCTATCTGCGTTTTGTTCCCCGACCTCCAAGCCTCAAA

GACA

TATATCATGCAGATTCACTCGTATATGGAATATTCCAAGTTGCTACAATGAAAAA

AGCGA

TCTTTCCGAAGCCTGGTTATATGCAATCATCTCTGTTATGGTGTTCTGCAGTACCA

TCTT

AGCCCTAGCTATATATCCCTACCTTGACATTGGCTGGAACGCAATAGATGCCATG

AACCA

CCCAACTTTCCCCGCGCCCGCTATGCTTCCACTGCAACAAGTTGTTGCCGGCGGCT

TTGT

CCCAGCCAATCAGCCTCGCCCACCTTCTCCCACCCCCACTGAAATCAGCTACTTTA

ATCT

AACAGGAGGAGATGACTGACACCCTAGATCTAGAAATGGACGGAATTATTACAG

AGCAGC

GCCTGCTAGAAAGACGCAGGGCAGCGGCCGAGCAACAGCGCATGAATCAAGAGC

TCCAAG

ACATGGTTAACTTGCACCAGTGCAAAAGGGGTATCTTTTGTCTGGTAAAGCAGGC

CAAAG

TCACCTACGACAGTAATACCACCGGACACCGCCTTAGCTACAAGTTGCCAACCAA

GCGTC

AGAAATTGGTGGTCATGGTGGGAGAAAAGCCCATTACCATAACTCAGCACTCGGT

AGAAA

CCGAAGGCTGCATTCACTCACCTTGTCAAGGACCTGAGGATCTCTGCACCCTTATT

AAGA

CCCTGTGCGGTCTCAAAGATCTTATTCCCTTTAACTAATAAAAAAAAATAATAAA

GCATC

ACTTACTTAAAATCAGTTAGCAAATTTCTGTCCAGTTTATTCAGCAGCACCTCCTT

GCCC

TCCTCCCAGCTCTGGTATTGCAGCTTCCTCCTGGCTGCAAACTTTCTCCACAATCT

AAAT

GGAATGTCAGTTTCCTCCTGTTCCTGTCCATCCGCACCCACTATCTTCATGTTGTTG

CAG

ATGAAGCGCGCAAGACCGTCTGAAGATACCTTCAACCCCGTGTATCCATATGACA

CGGAA

ACCGGTCCTCCAACTGTGCCTTTTCTTACTCCTCCCTTTGTATCCCCCAATGGGTTT

CAA

GAGAGTCCCCCTGGGGTACTCTCTTTGCGCCTATCCGAACCTCTAGTTACCTCCAA

TGGC

ATGCTTGCGCTCAAAATGGGCAACGGCCTCTCTCTGGACGAGGCCGGCAACCTTA

CCTCC

CAAAATGTAACCACTGTGAGCCCACCTCTCAAAAAAACCAAGTCAAACATAAACC

TGGAA

ATATCTGCACCCCTCACAGTTACCTCAGAAGCCCTAACTGTGGCTGCCGCCGCACC

TCTA

ATGGTCGCGGGCAACACACTCACCATGCAATCACAGGCCCCGCTAACCGTGCACG

ACTCC

AAACTTAGCATTGCCACCCAAGGACCCCTCACAGTGTCAGAAGGAAAGCTAGCCC

TGCAA

ACATCAGGCCCCCTCACCACCACCGATAGCAGTACCCTTACTATCACTGCCTCACC

CCCT

CTAACTACTGCCACTGGTAGCTTGGGCATTGACTTGAAAGAGCCCATTTATACAC

AAAAT

GGAAAACTAGGACTAAAGTACGGGGCTCCTTTGCATGTAACAGACGACCTAAACA

CTTTG

ACCGTAGCAACTGGTCCAGGTGTGACTATTAATAATACTTCCTTGCAAACTAAAG

TTACT

GGAGCCTTGGGTTTTGATTCACAAGGCAATATGCAACTTAATGTAGCAGGAGGAC

TAAGG

ATTGATTCTCAAAACAGACGCCTTATACTTGATGTTAGTTATCCGTTTGATGCTCA

AAAC

CAACTAAATCTAAGACTAGGACAGGGCCCTCTTTTTATAAACTCAGCCCACAACT

TGGAT

ATTAACTACAACAAAGGCCTTTACTTGTTTACAGCTTCAAACAATTCCAAAAAGCT

TGAG

GTTAACCTAAGCACTGCCAAGGGGTTGATGTTTGACGCTACAGCCATAGCCATTA

ATGCA

GGAGATGGGCTTGAATTTGGTTCA CCTAATGCACCAAACACAAATCCCCTCAAAA

CAAAA

ATTGGCCATGGCCTAGAATTTGATTCAAACAAGGCTATGGTTCCTAAACTAGGAA

CTGGC

CTTAGTTTTGACAGCACAGGTGCCATTACAGTAGGAAACAAAAATAATGATAAGC

TAACT

TTGTGGACCACACCAGCTCCATCTCCTAACTGTAGACTAAATGCAGAGAAAGATG

CTAAA

CTCACTTTGGTCTTAACAAAATGTGGCAGTCAAATACTTGCTACAGTTTCAGTTTT

GGCT

GTTAAAGGCAGTTTGGCTCCAATATCTGGAACAGTTCAAAGTGCTCATCTTATTAT

AAGA

TTTGACGAAAATGGAGTGCTACTAAACAATTCCTTCCTGGACCCAGAATATTGGA

ACTTT

AGAAATGGAGATCTTACTGAAGGCACAGCCTATACAAACGCTGTTGGATTTATGC

CTAAC

CTATCAGCTTATCCAAAATCTCACGGTAAAACTGCCAAAAGTAACATTGTCAGTC

AAGTT

TACTTAAACGGAGACAAAACTAAACCTGTAACACTAACCATTACACTAAACGGTA

CACAG

GAAACAGGAGACACAACTCCAAGTGCATACTCTATGTCATTTTCATGGGACTGGT

CTGGC

CACAACTACATTAATGAAATATTTGCCACATCCTCTTACACTTTTTCATACATTGC

CCAA

GAATAAAGAATCGTTTGTGTTATGTTTCAACGTGTTTATTTTTCAATTGCAGAAAA

TTTC

AAGTCATTTTTCATTCAGTAGTATAGCCCCACCACCACATAGCTTATACAGATCAC

CGTA

CCTTAATCAAACTCACAGAACCCTAGTATTCAACCTGCCACCTCCCTCCCAACACA

CAGA

GTACACAGTCCTTTCTCCCCGGCTGGCCTTAAAAAGCATCATATCATGGGTAACA

GACAT

ATTCTTAGGTGTTATATTCCACACGGTTTCCTGTCGAGCCAAACGCTCATCAGTGA

TATT

AATAAACTCCCCGGGCAGCTCACTTAAGTTCATGTCGCTGTCCAGCTGCTGAGCC

ACAGG

CTGCTGTCCAACTTGCGGTTGCTTAACGGGCGGCGAAGGAGAAGTCCACGCCTAC

ATGGG

GGTAGAGTCATAATCGTGCATCAGGATAGGGCGGTGGTGCTGCAGCAGCGCGCG

AATAAA

CTGCTGCCGCCGCCGCTCCGTCCTGCAGGAATACAACATGGCAGTGGTCTCCTCA

GCGAT

GATTCGCACCGCCCGCAGCATAAGGCGCCTTGTCCTCCGGGCACAGCAGCGCACC

CTGAT

CTCACTTAAATCAGCACAGTAACTGCAGCACAGCACCACAATATTGTTCAAAATC

CCACA

GTGCAAGGCGCTGTATCCA A AGCTCATGGCGGGGACCACAGAACCCACGTGGCC

ATCATA

CCACAAGCGCAGGTAGATTAAGTGGCGACCCCTCATA A A CACGCTGGACATA A AC

ATTAC

CTCTTTTGGCATGTTGTAATTCACCACCTCCCGGTACCATATA A A CCTCTGATTAA

ACAT

GGCGCCATCCACCACCATCCTAAACCAGCTGGCCAAAACCTGCCCGCCGGCTATA

CACTG

CAGGGAACCGGGACTGGAACAATGACAGTGGAGAGCCCAGGACTCGTAACCATG

GATCAT

CATGCTCGTCATGATATCAATGTTGGCACAACACAGGCACACGTGCATACACTTC

CTCAG

GATTACAAGCTCCTCCCGCGTTAGAACCATATCCCAGGGAACAACCCATTCCTGA

ATCAG

CGTAAATCCCACACTGCAGGGAAGACCTCGCACGTAACTCACGTTGTGCATTGTC

AAAGT

GTTACATTCGGGCAGCAGCGGATGATCCTCCAGTATGGTAGCGCGGGTTTCTGTCT

CAAA

AGGAGGTAGACGATCCCTACTGTACGGAGTGCGCCGAGACAACCGAGATCGTGTT

GGTCG

TAGTGTCATGCCAAATGGAACGCCGGACGTAGTCATATTTCCTGAAGCAAAACCA

GGTGC

GGGCGTGACAAACAGATCTGCGTCTCCGGTCTCGCCGCTTAGATCGCTCTGTGTA

GTAGT

TGTAGTATATCCACTCTCTCAAAGCATCCAGGCGCCCCCTGGCTTCGGGTTCTATG

TAAA

TCCTTCATGCGCCGCTGCCCTGATAACATCCACCACCGCAGAATAAGCCACACC

CAGCC

AACCTACACATTCGTTCTGCGAGTCACACACGGGAGGAGCGGGAAGAGCTGGAA

GAACCA

TGTTTTTTTTTTTATTCCAAAAGATTATCCAAAACCTCAAAATGAAGATCTATTAA

GTGA

ACGCGCTCCCCTCCGGTGGCGTGGTCAAACTCTACAGCCAAAGAACAGATAATGG

CATTT

GTAAGATGTTGCACAATGGCTTCCAAAAGGCAAACGGCCCTCACGTCCAAGTGGA

CGTAA

AGGCTAAACCCTTCAGGGTGAATCTCCTCTATAAACATTCCAGCACCTTCAACCAT

GCCC

AAATAATTCTCATCTCGCCACCTTCTCAATATATCTCTAAGCAAATCCCGAATATT

AAGT

CCGGCCATTGTAAAAATCTGCTCCAGAGCGCCCTCCACCTTCAGCCTCAAGCAGC

GAATC

ATGATTGCAAAAATTCAGGTTCCTCACAGACCTGTATAAGATTCAAAAGCGGAAC

ATTAA

CAAAAATACCGCGATCCCGTAGGTCCCTTCGCAGGGCCAGCTGAACATAATCGTG

CAGGT

CTGCACGGACCAGCGCGGCCACTTCCCCGCCAGGAACCTTGACAAAAGAACCCAC

ACTGA

TTATGACACGCATACTCGGAGCTATGCTAACCAGCGTAGCCCCGATGTAAGCTTT

GTTGC

ATGGGCGGCGATATAAAATGCAAGGTGCTGCTCAAAAAATCAGGCAAAGCCTCG

CGCAAA

AAAGAAAGCACATCGTAGTCATGCTCATGCAGATAAAGGCAGGTAAGCTCCGGA

ACCACC

ACAGAAAAAGACACCATTTTTCTCTCAAACATGTCTGCGGGTTTCTGCATAAACA

CAAAA

TAAAATAACAAAAAAACATTTAAACATTAGAAGCCTGTCTTACAACAGGAAAAA

CAACCC

TTATAAGCATAAGACGGACTACGGCCATGCCGGCGTGACCGTAAAAAAACTGGTC

ACCGT

GATTAAAAAGCACCACCGACAGCTCCTCGGTCATGTCCGGAGTCATAATGTAAGA

CTCGG

TAAACACATCAGGTTGATTCATCGGTCAGTGCTAAAAAGCGACCGAAATAGCCCG

GGGGA

ATACATACCCGCAGGCGTAGAGACAACATTACAGCCCCCATAGGAGGTATAACA

AAATTA

ATAGGAGAGAAAAACACATAAACACCTGAAAAACCCTCCTGCCTAGGCAAAATA

GCACCC

TCCCGCTCCAGAACAACATACAGCGCTTCCACAGCGGCAGCCATAACAGTCAGCC

TTACC

AGTAAAAAAGAAAACCTATTAAAAAAACACCACTCGACACGGCACCAGCTCAAT

CAGTCA

CAGTGTAAAAAAGGGCCAAGTGCAGAGCGAGTATATATAGGACTAAAAAATGAC

GTAACG

GTTAAAGTCCACAAAAAACACCCAGAAAACCGCACGCGAACCTACGCCCAGAAA

CGAAAG

CCAAAAAACCCACAACTTCCTCAAATCGTCACTTCCGTTTTCCCACGTTACGTCAC

TTCC

CATTTTAATTAAGAAAACTACAATTCCCAACACATACAAGTTACTCCGCCCTAAA

ACCTA

CGTCACCCGCCCCGTTCCCACGCCCCGCGCCACGTCACAAACTCCACCCCCTCATT

ATCA

TATTGGCTTCAATCCAAAATAAGGTATATTATTGATGATGATTACCCTGTTAT

SEQ ID NO：51是OV1160序列

AGGGTAATCATCATCAATAATATACCTTATTTTGGATTGAAGCCAATATGATAATG

AGGG

GGTGGAGTTTGTGACGTGGCGCGGGGCGTGGGAACGGGGCGGGTGACGTAGTAG

TGTGGC

GGAAGTGTGATGTTGCAAGTGTGGCGGAACACATGTAAGCGACGGATGTGGCAA

AAGTGA

CGTTTTTGGTGTGCGCCGGTGTACACAGGAAGTGACAATTTTCGCGCGGTTTTAGG

CGGA

TGTTGTAGTAAATTTGGGCGTAACCGAGTAAGATTTGGCCATTTTCGCGGGAAAA

CTGAA

TAAGAGGAAGTGAAATCTGAATAATTTTGTGTTACTCATAGCGCGTAATATTTGTC

TAGG

GCCGGGATCTCTGCAGGAATTTGATATCAAGCTTATCGATACCGTCGAAACTTGTT

TATT

GCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAG

CATTT

TTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTC

TGG

ATCCGCTAGCGGCGCGCCGTTTCATCCGGACAAAGCCTGCGCGCGCCCCGCCCCG

CCATT

GGCCGTACCGCCCCGCGCCGCCGCCCCATCTCGCCCCTCGCCGCCGGGTCCGGCG

CGTTA

AAGCCAATAGGAACCGCCGCCGTTGTTCCCGTCACGGCCGGGGCAGCCAATTGTG

GCGGC

GCTCGGCGGCTCGTGGCTCTTTCGCGGCAAAAAGGATTTGGCGCGTAAAAGTGGC

CGGGA

CTTTGCAGGCAGCGGCGGCCGGGGGCGGAGCGGGATCGAGCCCTCGATGATATC

AGATCA

AACGATATCACCGGTCGACTGAAAATGAGACATATTATCTGCCACGGAGGTGTTA

TTACC

GAAGAAATGGCCGCCAGTCTTTTGGACCAGCTGATCGAAGAGGTACTGGCTGATA

ATCTT

CCACCTCCTAGCCATTTTGAACCACCTACCCTTCACGAACTGTATGATTTAGACGT

GACG

GCCCCCGAAGATCCCAACGAGGAGGCGGTTTCGCAGATTTTTCCCGACTCTGTAA

TGTTG

GCGGTGCAGGAAGGGATTGACTTACTCACTTTTCCGCCGGCGCCCGGTTCTCCGG

AGCCG

CCTCACCTTTCCCGGCAGCCCGAGCAGCCGGAGCAGAGAGCCTTGGGTCCGGTTT

CTATG

CCAAACCTTGTACCGGAGGTGATCGATCTTACCTGCCACGAGGCTGGCTTTCCACC

CAGT

GACGACGAGGATGAAGAGGGTGAGGAGTTTGTGTTAGATTATGTGGAGCACCCC

GGGCAC

GGTTGCAGGTCTTGTCATTATCACCGGAGGAATACGGGGGACCCAGATATTATGT

GTTCG

CTTTGCTATATGAGGACCTGTGGCATGTTTGTCTACAGTAAGTGAAAATTATGGGC

AGTG

GGTGATAGAGTGGTGGGTTTGGTGTGGTAATTTTTTTTTTAATTTTTACAGTTTTGT

GGT

TTAAAGAATTTTGTATTGTGATTTTTTTAAAAGGTCCTGTGTCTGAACCTGAGCCT

GAGC

CCGAGCCAGAACCGGAGCCTGCAAGACCTACCCGCCGTCCTAAAATGGCGCCTGC

TATCC

TGAGACGCCCGACATCACCTGTGTCTAGAGAATGCAATAGTAGTACGGATAGCTG

TGACT

CCGGTCCTTCTAACACACCTCCTGAGATACACCCGGTGGTCCCGCTGTGCCCCATT

AAAC

CAGTTGCCGTGAGAGTTGGTGGGCGTCGCCAGGCTGTGGAATGTATCGAGGACTT

GCTTA

ACGAGCCTGGGCAACCTTTGGACTTGAGCTGTAAACGCCCCAGGCCATAAGGTGT

AAACC

TGTGATTGCGTGTGTGGTTAACGCCTTTGTTTGCTGAATGAGTTGATGTAAGTTTA

ATAA

AGGGTGAGATAATGTTTAACTTGCATGGCGTGTTAAATGGGGCGGGGCTTAAAGG

GTATA

TAATGCGCCGTGGGCTAATCTTGGTTACATCTGACCTCATGGAGGCTTGGGAGTGT

TTGG

AAGATTTTTCTGCTGTGCGTAACTTGCTGGAACAGAGCTCTAACAGTACCTCTTGG

TTTT

GGAGGTTTCTGTGGGGCTCATCCCAGGCAAAGTTAGTCTGCAGAATTAAGGAGGA

TTACA

AGTGGGAATTTGAAGAGCTTTTGAAATCCTGTGGTGAGCTGTTTGATTCTTTGAAT

CTGG

GTCACCAGGCGCTTTTCCAAGAGAAGGTCATCAAGACTTTGGATTTTTCCACACCG

GGGC

GCGCTGCGGCTGCTGTTGCTTTTTTGAGTTTTATAAAGGATAAATGGAGCGAAGA

AACCC

ATCTGAGCGGGGGGTACCTGCTGGATTTTCTGGCCATGCATCTGTGGAGAGCGGT

TGTGA

GACACAAGAATCGCCTGCTACTGTTGTCTTCCGTCCGCCCGGCGATAATACCGAC

GGAGG

AGCAGCAGCAGCAGCAGGAGGAAGCCAGGCGGCGGCGGCAGGAGCAGAGCCCA

TGGAACC

CGAGAGCCGGCCTGGACCCTCGGGAATGAATGTTGTACAGGTGGCTGAACTGTAT

CCAGA

ACTGAGACGCATTTTGACAATTACAGAGGATGGGCAGGGGCTAAAGGGGGTAAA

GAGGGA

GCGGGGGGCTTGTGAGGCTACAGAGGAGGCTAGGAATCTAGCTTTTAGCTTAATG

ACCAG

ACACCGTCCTGAGTGTATTACTTTTCAACAGATCAAGGATAATTGCGCTAATGAG

CTTGA

TCTGCTGGCGCAGAAGTATTCCATAGAGCAGCTGACCACTTACTGGCTGCAGCCA

GGGGA

TGATTTTGAGGAGGCTATTAGGGTATATGCAAAGGTGGCACTTAGGCCAGATTGC

AAGTA

CAAGATCAGCAAACTTGTAAATATCAGGAATTGTTGCTACATTTCTGGGAACGGG

GCCGA

GGTGGAGATAGATACGGAGGATAGGGTGGCCTTTAGATGTAGCATGATAAATATG

TGGCC

GGGGGTGCTTGGCATGGACGGGGTGGTTATTATGAATGTAAGGTTTACTGGCCCC

AATTT

TAGCGGTACGGTTTTCCTGGCCAATACCAACCTTATCCTACACGGTGTAAGCTTCT

ATGG

GTTTAACAATACCTGTGTGGAAGCCTGGACCGATGTAAGGGTTCGGGGCTGTGCC

TTTTA

CTGCTGCTGGAAGGGGGTGGTGTGTCGCCCCAAAAGCAGGGCTTCAATTAAGAAA

TGCCT

CTTTGAAAGGTGTACCTTGGGTATCCTGTCTGAGGGTAACTCCAGGGTGCGCCAC

AATGT

GGCCTCCGACTGTGGTTGCTTCATGCTAGTGAAAAGCGTGGCTGTGATTAAGCAT

AACAT

GGTATGTGGCAACTGCGAGGACAGGGCCTCTCAGATGCTGACCTGCTCGGACGGC

AACTG

TCACCTGCTGAAGACCATTCACGTAGCCAGCCACTCTCGCAAGGCCTGGCCAGTG

TTTGA

GCATAACATACTGACCCGCTGTTCCTTGCATTTGGGTAACAGGAGGGGGGTGTTC

CTACC

TTACCAATGCAATTTGAGTCACACTAAGATATTGCTTGAGCCCGAGAGCATGTCC

AAGGT

GAACCTGAACGGGGTGTTTGACATGACCATGAAGATCTGGAAGGTGCTGAGGTAC

GATGA

GACCCGCACCAGGTGCAGACCCTGCGAGTGTGGCGGTAAACATATTAGGAACCA

GCCTGT

GATGCTGGATGTGACCGAGGAGCTGAGGCCCGATCACTTGGTGCTGGCCTGCACC

CGCGC

TGAGTTTGGCTCTAGCGATGAAGATACAGATTGAGGTACTGAAATGTGTGGGCGT

GGCTT

AAGGGTGGGAAAGAATATATAAGGTGGGGGTCTTATGTAGTTTTGTATCTGTTTT

GCAGC

AGCCGCCGCCGCCATGAGCACCAACTCGTTTGATGGAAGCATTGTGAGCTCATAT

TTGAC

AACGCGCATGCCCCCATGGGCCGGGGTGCGTCAGAATGTGATGGGCTCCAGCATT

GATGG

TCGCCCCGTCCTGCCCGCAAACTCTACTACCTTGACCTACGAGACCGTGTCTGGAA

CGCC

GTTGGAGACTGCAGCCTCCGCCGCCGCTTCAGCCGCTGCAGCCACCGCCCGCGGG

ATTGT

GACTGACTTTGCTTTCCTGAGCCCGCTTGCAAGCAGTGCAGCTTCCCGTTCATCCG

CCCG

CGATGACAAGTTGACGGCTCTTTTGGCACAATTGGATTCTTTGACCCGGGAACTTA

ATGT

CGTTTCTCAGCAGCTGTTGGATCTGCGCCAGCAGGTTTCTGCCCTGAAGGCTTCCT

CCCC

TCCCAATGCGGTTTAAAACATAAATAAAAAACCAGACTCTGTTTGGATTTGGATC

AAGCA

AGTGTCTTGCTGTCTTTATTTAGGGGTTTTGCGCGCGCGGTAGGCCCGGGACCAGC

GGTC

TCGGTCGTTGAGGGTCCTGTGTATTTTTTCCAGGACGTGGTAAAGGTGACTCTGGA

TGTT

CAGATACATGGGCATAAGCCCGTCTCTGGGGTGGAGGTAGCACCACTGCAGAGCT

TCATG

CTGCGGGGTGGTGTTGTAGATGATCCAGTCGTAGCAGGAGCGCTGGGCGTGGTGC

CTAAA

AATGTCTTTCAGTAGCAAGCTGATTGCCAGGGGCAGGCCCTTGGTGTAAGTGTTT

ACAAA

GCGGTTAAGCTGGGATGGGTGCATACGTGGGGATATGAGATGCATCTTGGACTGT

ATTTT

TAGGTTGGCTATGTTCCCAGCCATATCCCTCCGGGGATTCATGTTGTGCAGAACCA

CCAG

CACAGTGTATCCGGTGCACTTGGGAAATTTGTCATGTAGCTTAGAAGGAAATGCG

TGGAA

GAACTTGGAGACGCCCTTGTGACCTCCAAGATTTTCCATGCATTCGTCCATAATGA

TGGC

AATGGGCCCACGGGCGGCGGCCTGGGCGAAGATATTTCTGGGATCACTAACGTCA

TAGTT

GTGTTCCAGGATGAGATCGTCATAGGCCATTTTTACAAAGCGCGGGCGGAGGGTG

CCAGA

CTGCGGTATAATGGTTCCATCCGGCCCAGGGGCGTAGTTACCCTCACAGATTTGC

ATTTC

CCACGCTTTGAGTTCAGATGGGGGGATCATGTCTACCTGCGGGGCGATGAAGAAA

ACGGT

TTCCGGGGTAGGGGAGATCAGCTGGGAAGAAAGCAGGTTCCTGAGCAGCTGCGA

CTTACC

GCAGCCGGTGGGCCCGTAAATCACACCTATTACCGGGTGCAACTGGTAGTTAAGA

GAGCT

GCAGCTGCCGTCATCCCTGAGCAGGGGGGCCACTTCGTTAAGCATGTCCCTGACT

CGCAT

GTTTTCCCTGACCAAATCCGCCAGAAGGCGCTCGCCGCCCAGCGATAGCAGTTCT

TGCAA

GGAAGCAAAGTTTTTCAACGGTTTGAGACCGTCCGCCGTAGGCATGCTTTTGAGC

GTTTG

ACCAAGCAGTTCCAGGCGGTCCCACAGCTCGGTCACCTGCTCTACGGCATCTCGA

TCCAG

CATATCTCCTCGTTTCGCGGGTTGGGGCGGCTTTCGCTGTACGGCAGTAGTCGGTG

CTCG

TCCAGACGGGCCAGGGTCATGTCTTTCCACGGGCGCAGGGTCCTCGTCAGCGTAG

TCTGG

GTCACGGTGAAGGGGTGCGCTCCGGGCTGCGCGCTGGCCAGGGTGCGCTTGAGGC

TGGTC

CTGCTGGTGCTGAAGCGCTGCCGGTCTTCGCCCTGCGCGTCGGCCAGGTAGCATTT

GACC

ATGGTGTCATAGTCCAGCCCCTCCGCGGCGTGGCCCTTGGCGCGCAGCTTGCCCTT

GGAG

GAGGCGCCGCACGAGGGGCAGTGCAGACTTTTGAGGGCGTAGAGCTTGGGCGCG

AGAAAT

ACCGATTCCGGGGAGTAGGCATCCGCGCCGCAGGCCCCGCAGACGGTCTCGCATT

CCACG

AGCCAGGTGAGCTCTGGCCGTTCGGGGTCAAAAACCAGGTTTCCCCCATGCTTTTT

GATG

CGTTTCTTACCTCTGGTTTCCATGAGCCGGTGTCCACGCTCGGTGACGAAAAGGCT

GTCC

GTGTCCCCGTATACAGACTTGAGAGGCCTGTCCTCGAGCGGTGTTCCGCGGTCCTC

CTCG

TATAGAAACTCGGACCACTCTGAGACAAAGGCTCGCGTCCAGGCCAGCACGAAG

GAGGCT

AAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGT

GAAGA

CACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTGTAGGTGTAGGCCA

CGTGA

CCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCAC

TCTCT

TCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGGTGAGTACTCCCTCTGAAAAG

CGGGC

ATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCA

CCTGG

CCCGCGGTGATGCCTTTGAGGGTGGCCGCATCCATCTGGTCAGAAAAGACAATCT

TTTTG

TTGTCAAGCTTGGTGGCAAACGACCCGTAGAGGGCGTTGGACAGCAACTTGGCGA

TGGAG

CGCAGGGTTTGGTTTTTGTCGCGATCGGCGCGCTCCTTGGCCGCGATGTTTAGCTG

CACG

TATTCGCGCGCAACGCACCGCCATTCGGGAAAGACGGTGGTGCGCTCGTCGGGCA

CCAGG

TGCACGCGCCAACCGCGGTTGTGCAGGGTGACAAGGTCAACGCTGGTGGCTACCT

CTCCG

CGTAGGCGCTCGTTGGTCCAGCAGAGGCGGCCGCCCTTGCGCGAGCAGAATGGCG

GTAGG

GGGTCTAGCTGCGTCTCGTCCGGGGGGTCTGCGTCCACGGTAAAGACCCCGGGCA

GCAGG

CGCGCGTCGAAGTAGTCTATCTTGCATCCTTGCAAGTCTAGCGCCTGCTGCCATGC

GCGG

GCGGCAAGCGCGCGCTCGTATGGGTTGAGTGGGGGACCCCATGGCATGGGGTGG

GTGAGC

GCGGAGGCGTACATGCCGCAAATGTCGTAAACGTAGAGGGGCTCTCTGAGTATTC

CAAGA

TATGTAGGGTAGCATCTTCCACCGCGGATGCTGGCGCGCACGTAATCGTATAGTT

CGTGC

GAGGGAGCGAGGAGGTCGGGACCGAGGTTGCTACGGGCGGGCTGCTCTGCTCGG

AAGACT

ATCTGCCTGAAGATGGCATGTGAGTTGGATGATATGGTTGGACGCTGGAAGACGT

TGAAG

CTGGCGTCTGTGAGACCTACCGCGTCACGCACGAAGGAGGCGTAGGAGTCGCGCA

GCTTG

TTGACCAGCTCGGCGGTGACCTGCACGTCTAGGGCGCAGTAGTCCAGGGTTTCCT

TGATG

ATGTCATACTTATCCTGTCCCTTTTTTTTCCACAGCTCGCGGTTGAGGACAAACTCT

TCG

CGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTAAGAGC

CTAGC

ATGTAGAACTGGTTGACGGCCTGGTAGGCGCAGCATCCCTTTTCTACGGGTAGCG

CGTAT

GCCTGCGCGGCCTTCCGGAGCGAGGTGTGGGTGAGCGCAAAGGTGTCCCTGACCA

TGACT

TTGAGGTACTGGTATTTGAAGTCAGTGTCGTCGCATCCGCCCTGCTCCCAGAGCAA

AAAG

TCCGTGCGCTTTTTGGAACGCGGATTTGGCAGGGCGAAGGTGACATCGTTGAAGA

GTATC

TTTCCCGCGCGAGGCATAAAGTTGCGTGTGATGCGGAAGGGTCCCGGCACCTCGG

AACGG

TTGTTAATTACCTGGGCGGCGAGCACGATCTCGTCAAAGCCGTTGATGTTGTGGCC

CACA

ATGTAAAGTTCCAAGAAGCGCGGGATGCCCTTGATGGAAGGCAATTTTTTAAGTT

CCTCG

TAGGTGAGCTCTTCAGGGGAGCTGAGCCCGTGCTCTGAAAGGGCCCAGTCTGCAA

GATGA

GGGTTGGAAGCGACGAATGAGCTCCACAGGTCACGGGCCATTAGCATTTGCAGGT

GGTCG

CGAAAGGTCCTAAACTGGCGACCTATGGCCATTTTTTCTGGGGTGATGCAGTAGA

AGGTA

AGCGGGTCTTGTTCCCAGCGGTCCCATCCAAGGTTCGCGGCTAGGTCTCGCGCGG

CAGTC

ACTAGAGGCTCATCTCCGCCGAACTTCATGACCAGCATGAAGGGCACGAGCTGCT

TCCCA

AAGGCCCCCATCCAAGTATAGGTCTCTACATCGTAGGTGACAAAGAGACGCTCGG

TGCGA

GGATGCGAGCCGATCGGGAAGAACTGGATCTCCCGCCACCAATTGGAGGAGTGG

CTATTG

ATGTGGTGAAAGTAGAAGTCCCTGCGACGGGCCGAACACTCGTGCTGGCTTTTGT

AAAAA

CGTGCGCAGTACTGGCAGCGGTGCACGGGCTGTACATCCTGCACGAGGTTGACCT

GACGA

CCGCGCACAAGGAAGCAGAGTGGGAATTTGAGCCCCTCGCCTGGCGGGTTTGGCT

GGTGG

TCTTCTACTTCGGCTGCTTGTCCTTGACCGTCTGGCTGCTCGAGGGGAGTTACGGT

GGAT

CGGACCACCACGCCGCGCGAGCCCAAAGTCCAGATGTCCGCGCGCGGCGGTCGG

AGCTTG

ATGACAACATCGCGCAGATGGGAGCTGTCCATGGTCTGGAGCTCCCGCGGCGTCA

GGTCA

GGCGGGAGCTCCTGCAGGTTTACCTCGCATAGACGGGTCAGGGCGCGGGCTAGAT

CCAGG

TGATACCTAATTTCCAGGGGCTGGTTGGTGGCGGCGTCGATGGCTTGCAAGAGGC

CGCAT

CCCCGCGGCGCGACTACGGTACCGCGCGGCGGGCGGTGGGCCGCGGGGGTGTCCT

TGGAT

GATGCATCTAAAAGCGGTGACGCGGGCGAGCCCCCGGAGGTAGGGGGGGCTCCG

GACCCG

CCGGGAGAGGGGGCAGGGGCACGTCGGCGCCGCGCGCGGGCAGGAGCTGGTGCT

GCGCGC

GTAGGTTGCTGGCGAACGCGACGACGCGGCGGTTGATCTCCTGAATCTGGCGCCT

CTGCG

TGAAGACGACGGGCCCGGTGAGCTTGAGCCTGAAAGAGAGTTCGACAGAATCAA

TTTCGG

TGTCGTTGACGGCGGCCTGGCGCAAAATCTCCTGCACGTCTCCTGAGTTGTCTTGA

TAGG

CGATCTCGGCCATGAACTGCTCGATCTCTTCCTCCTGGAGATCTCCGCGTCCGGCT

CGCT

CCACGGTGGCGGCGAGGTCGTTGGAAATGCGGGCCATGAGCTGCGAGAAGGCGT

TGAGGC

CTCCCTCGTTCCAGACGCGGCTGTAGACCACGCCCCCTTCGGCATCGCGGGCGCG

CATGA

CCACCTGCGCGAGATTGAGCTCCACGTGCCGGGCGAAGACGGCGTAGTTTCGCAG

GCGCT

GAAAGAGGTAGTTGAGGGTGGTGGCGGTGTGTTCTGCCACGAAGAAGTACATAA

CCCAGC

GTCGCAACGTGGATTCGTTGATATCCCCCAAGGCCTCAAGGCGCTCCATGGCCTC

GTAGA

AGTCCACGGCGAAGTTGAAAAACTGGGAGTTGCGCGCCGACACGGTTAACTCCTC

CTCCA

GAAGACGGATGAGCTCGGCGACAGTGTCGCGCACCTCGCGCTCAAAGGCTACAG

GGGCCT

CTTCTTCTTCTTCAATCTCCTCTTCCATAAGGGCCTCCCCTTCTTCTTCTTCTGGCG

GCG

GTGGGGGAGGGGGGACACGGCGGCGACGACGGCGCACCGGGAGGCGGTCGACA

AAGCGCT

CGATCATCTCCCCGCGGCGACGGCGCATGGTCTCGGTGACGGCGCGGCCGTTCTC

GCGGG

GGCGCAGTTGGAAGACGCCGCCCGTCATGTCCCGGTTATGGGTTGGCGGGGGGCT

GCCAT

GCGGCAGGGATACGGCGCTAACGATGCATCTCAACAATTGTTGTGTAGGTACTCC

GCCGC

CGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGAGAAAGG

CGTCTA

ACCAGTCACAGTCGCAAGGTAGGCTGAGCACCGTGGCGGGCGGCAGCGGGCGGC

GGTCGG

GGTTGTTTCTGGCGGAGGTGCTGCTGATGATGTAATTAAAGTAGGCGGTCTTGAG

ACGGC

GGATGGTCGACAGAAGCACCATGTCCTTGGGTCCGGCCTGCTGAATGCGCAGGCG

GTCGG

CCATGCCCCAGGCTTCGTTTTGACATCGGCGCAGGTCTTTGTAGTAGTCTTGCATG

AGCC

TTTCTACCGGCACTTCTTCTTCTCCTTCCTCTTGTCCTGCATCTCTTGCATCTATCGC

TG

CGGCGGCGGCGGAGTTTGGCCGTAGGTGGCGCCCTCTTCCTCCCATGCGTGTGAC

CCCGA

AGCCCCTCATCGGCTGAAGCAGGGCTAGGTCGGCGACAACGCGCTCGGCTAATAT

GGCCT

GCTGCACCTGCGTGAGGGTAGACTGGAAGTCATCCATGTCCACAAAGCGGTGGTA

TGCGC

CCGTGTTGATGGTGTAAGTGCAGTTGGCCATAACGGACCAGTTAACGGTCTGGTG

ACCCG

GCTGCGAGAGCTCGGTGTACCTGAGACGCGAGTAAGCCCTCGAGTCAAATACGTA

GTCGT

TGCAAGTCCGCACCAGGTACTGGTATCCCACCAAAAAGTGCGGCGGCGGCTGGCG

GTAGA

GGGGCCAGCGTAGGGTGGCCGGGGCTCCGGGGGCGAGATCTTCCAACATAAGGC

GATGAT

ATCCGTAGATGTACCTGGACATCCAGGTGATGCCGGCGGCGGTGGTGGAGGCGCG

CGGAA

AGTCGCGGACGCGGTTCCAGATGTTGCGCAGCGGCAAAAAGTGCTCCATGGTCGG

GACGC

TCTGGCCGGTCAGGCGCGCGCAATCGTTGACGCTCTAGACCGTGCAAAAGGAGAG

CCTGT

AAGCGGGCACTCTTCCGTGGTCTGGTGGATAAATTCGCAAGGGTATCATGGCGGA

CGACC

GGGGTTCGAGCCCCGTATCCGGCCGTCCGCCGTGATCCATGCGGTTACCGCCCGC

GTGTC

GAACCCAGGTGTGCGACGTCAGACAACGGGGGAGTGCTCCTTTTGGCTTCCTTCC

AGGCG

CGGCGGCTGCTGCGCTAGCTTTTTTGGCCACTGGCCGCGCGCAGCGTAAGCGGTT

AGGCT

GGAAAGCGAAAGCATTAAGTGGCTCGCTCCCTGTAGCCGGAGGGTTATTTTCCAA

GGGTT

GAGTCGCGGGACCCCCGGTTCGAGTCTCGGACCGGCCGGACTGCGGCGAACGGG

GGTTTG

CCTCCCCGTCATGCAAGACCCCGCTTGCAAATTCCTCCGGAAACAGGGACGAGCC

CCTTT

TTTGCTTTTCCCAGATGCATCCGGTGCTGCGGCAGATGCGCCCCCCTCCTCAGCAG

CGGC

AAGAGCAAGAGCAGCGGCAGACATGCAGGGCACCCTCCCCTCCTCCTACCGCGTC

AGGAG

GGGCGACATCCGCGGTTGACGCGGCAGCAGATGGTGATTACGAACCCCCGCGGC

GCCGGG

CCCGGCACTACCTGGACTTGGAGGAGGGCGAGGGCCTGGCGCGGCTAGGAGCGC

CCTCTC

CTGAGCGGTACCCAAGGGTGCAGCTGAAGCGTGATACGCGTGAGGCGTACGTGCC

GCGGC

AGAACCTGTTTCGCGACCGCGAGGGAGAGGAGCCCGAGGAGATGCGGGATCGAA

AGTTCC

ACGCAGGGCGCGAGCTGCGGCATGGCCTGAATCGCGAGCGGTTGCTGCGCGAGG

AGGACT

TTGAGCCCGACGCGCGAACCGGGATTAGTCCCGCGCGCGCACACGTGGCGGCCGC

CGACC

TGGTAACCGCATACGAGCAGACGGTGAACCAGGAGATTAACTTTCAAAAAAGCTT

TAACA

ACCACGTGCGTACGCTTGTGGCGCGCGAGGAGGTGGCTATAGGACTGATGCATCT

GTGGG

ACTTTGTAAGCGCGCTGGAGCAAAACCCAAATAGCAAGCCGCTCATGGCGCAGCT

GTTCC

TTATAGTGCAGCACAGCAGGGACAACGAGGCATTCAGGGATGCGCTGCTAAACAT

AGTAG

AGCCCGAGGGCCGCTGGCTGCTCGATTTGATAAACATCCTGCAGAGCATAGTGGT

GCAGG

AGCGCAGCTTGAGCCTGGCTGACAAGGTGGCCGCCATCAACTATTCCATGCTTAG

CCTGG

GCAAGTTTTACGCCCGCAAGATATACCATACCCCTTACGTTCCCATAGACAAGGA

GGTAA

AGATCGAGGGGTTCTACATGCGCATGGCGCTGAAGGTGCTTACCTTGAGCGACGA

CCTGG

GCGTTTATCGCAACGAGCGCATCCACAAGGCCGTGAGCGTGAGCCGGCGGCGCG

AGCTCA

GCGACCGCGAGCTGATGCACAGCCTGCAAAGGGCCCTGGCTGGCACGGGCAGCG

GCGATA

GAGAGGCCGAGTCCTACTTTGACGCGGGCGCTGACCTGCGCTGGGCCCCAAGCCG

ACGCG

CCCTGGAGGCAGCTGGGGCCGGACCTGGGCTGGCGGTGGCACCCGCGCGCGCTG

GCAACG

TCGGCGGCGTGGAGGAATATGACGAGGACGATGAGTACGAGCCAGAGGACGGCG

AGTACT

AAGCGGTGATGTTTCTGATCAGATGATGCAAGACGCAACGGACCCGGCGGTGCGG

GCGGC

GCTGCAGAGCCAGCCGTCCGGCCTTAACTCCACGGACGACTGGCGCCAGGTCATG

GACCG

CATCATGTCGCTGACTGCGCGCAATCCTGACGCGTTCCGGCAGCAGCCGCAGGCC

AACCG

GCTCTCCGCAATTCTGGAAGCGGTGGTCCCGGCGCGCGCAAACCCCACGCACGAG

AAGGT

GCTGGCGATCGTAAACGCGCTGGCCGAAAACAGGGCCATCCGGCCCGACGAGGC

CGGCCT

GGTCTACGACGCGCTGCTTCAGCGCGTGGCTCGTTACAACAGCGGCAACGTGCAG

ACCAA

CCTGGACCGGCTGGTGGGGGATGTGCGCGAGGCCGTGGCGCAGCGTGAGCGCGC

GCAGCA

GCAGGGCAACCTGGGCTCCATGGTTGCACTAAACGCCTTCCTGAGTACACAGCCC

GCCAA

CGTGCCGCGGGGACAGGAGGACTACACCAACTTTGTGAGCGCACTGCGGCTAATG

GTGAC

TGAGACACCGCAAAGTGAGGTGTACCAGTCTGGGCCAGACTATTTTTTCCAGACC

AGTAG

ACAAGGCCTGCAGACCGTAAACCTGAGCCAGGCTTTCAAAAACTTGCAGGGGCTG

TGGGG

GGTGCGGGCTCCCACAGGCGACCGCGCGACCGTGTCTAGCTTGCTGACGCCCAAC

TCGCG

CCTGTTGCTGCTGCTAATAGCGCCCTTCACGGACAGTGGCAGCGTGTCCCGGGAC

ACATA

CCTAGGTCACTTGCTGACACTGTACCGCGAGGCCATAGGTCAGGCGCATGTGGAC

GAGCA

TACTTTCCAGGAGATTACAAGTGTCAGCCGCGCGCTGGGGCAGGAGGACACGGGC

AGCCT

GGAGGCAACCCTAAACTACCTGCTGACCAACCGGCGGCAGAAGATCCCCTCGTTG

CACAG

TTTAAACAGCGAGGAGGAGCGCATTTTGCGCTACGTGCAGCAGAGCGTGAGCCTT

AACCT

GATGCGCGACGGGGTAACGCCCAGCGTGGCGCTGGACATGACCGCGCGCAACAT

GGAACC

GGGCATGTATGCCTCAAACCGGCCGTTTATCAACCGCCTAATGGACTACTTGCATC

GCGC

GGCCGCCGTGAACCCCGAGTATTTCACCAATGCCATCTTGAACCCGCACTGGCTA

CCGCC

CCCTGGTTTCTACACCGGGGGATTCGAGGTGCCCGAGGGTAACGATGGATTCCTC

TGGGA

CGACATAGACGACAGCGTGTTTTCCCCGCAACCGCAGACCCTGCTAGAGTTGCAA

CAGCG

CGAGCAGGCAGAGGCGGCGCTGCGAAAGGAAAGCTTCCGCAGGCCAAGCAGCTT

GTCCGA

TCTAGGCGCTGCGGCCCCGCGGTCAGATGCTAGTAGCCCATTTCCAAGCTTGATA

GGGTC

TCTTACCAGCACTCGCACCACCCGCCCGCGCCTGCTGGGCGAGGAGGAGTACCTA

AACAA

CTCGCTGCTGCAGCCGCAGCGCGAAAAAAACCTGCCTCCGGCATTTCCCAACAAC

GGGAT

AGAGAGCCTAGTGGACAAGATGAGTAGATGGAAGACGTACGCGCAGGAGCACAG

GGACGT

GCCAGGCCCGCGCCCGCCCACCCGTCGTCAAAGGCACGACCGTCAGCGGGGTCTG

GTGTG

GGAGGACGATGACTCGGCAGACGACAGCAGCGTCCTGGATTTGGGAGGGAGTGG

CAACCC

GTTTGCGCACCTTCGCCCCAGGCTGGGGAGAATGTTTTAAAAAAAAAAAAGCATG

ATGCA

AAATAAAAAACTCACCAAGGCCATGGCACCGAGCGTTGGTTTTCTTGTATTCCCCT

TAGT

ATGCGGCGCGCGGCGATGTATGAGGAAGGTCCTCCTCCCTCCTACGAGAGTGTGG

TGAGC

GCGGCGCCAGTGGCGGCGGCGCTGGGTTCTCCCTTCGATGCTCCCCTGGACCCGC

CGTTT

GTGCCTCCGCGGTACCTGCGGCCTACCGGGGGGAGAAACAGCATCCGTTACTCTG

AGTTG

GCACCCCTATTCGACACCACCCGTGTGTACCTGGTGGACAACAAGTCAACGGATG

TGGCA

TCCCTGAACTACCAGAACGACCACAGCAACTTTCTGACCACGGTCATTCAAAACA

ATGAC

TACAGCCCGGGGGAGGCAAGCACACAGACCATCAATCTTGACGACCGGTCGCACT

GGGGC

GGCGACCTGAAAACCATCCTGCATACCAACATGCCAAATGTGAACGAGTTCATGT

TTACC

AATAAGTTTAAGGCGCGGGTGATGGTGTCGCGCTTGCCTACTAAGGACAATCAGG

TGGAG

CTGAAATACGAGTGGGTGGAGTTCACGCTGCCCGAGGGCAACTACTCCGAGACCA

TGACC

ATAGACCTTATGAACAACGCGATCGTGGAGCACTACTTGAAAGTGGGCAGACAG

AACGGG

GTTCTGGAAAGCGACATCGGGGTAAAGTTTGACACCCGCAACTTCAGACTGGGGT

TTGAC

CCCGTCACTGGTCTTGTCATGCCTGGGGTATATACAAACGAAGCCTTCCATCCAGA

CATC

ATTTTGCTGCCAGGATGCGGGGTGGACTTCACCCACAGCCGCCTGAGCAACTTGT

TGGGC

ATCCGCAAGCGGCAACCCTTCCAGGAGGGCTTTAGGATCACCTACGATGATCTGG

AGGGT

GGTAACATTCCCGCACTGTTGGATGTGGACGCCTACCAGGCGAGCTTGAAAGATG

ACACC

GAACAGGGCGGGGGTGGCGCAGGCGGCAGCAACAGCAGTGGCAGCGGCGCGGA

AGAGAAC

TCCAACGCGGCAGCCGCGGCAATGCAGCCGGTGGAGGACATGAACGATCATGCC

ATTCGC

GGCGACACCTTTGCCACACGGGCTGAGGAGAAGCGCGCTGAGGCCGAAGCAGCG

GCCGAA

GCTGCCGCCCCCGCTGCGCAACCCGAGGTCGAGAAGCCTCAGAAGAAACCGGTG

ATCAAA

CCCCTGACAGAGGACAGCAAGAAACGCAGTTACAACCTAATAAGCAATGACAGC

ACCTTC

ACCCAGTACCGCAGCTGGTACCTTGCATACAACTACGGCGACCCTCAGACCGGAA

TCCGC

TCATGGACCCTGCTTTGCACTCCTGACGTAACCTGCGGCTCGGAGCAGGTCTACTG

GTCG

TTGCCAGACATGATGCAAGACCCCGTGACCTTCCGCTCCACGCGCCAGATCAGCA

ACTTT

CCGGTGGTGGGCGCCGAGCTGTTGCCCGTGCACTCCAAGAGCTTCTACAACGACC

AGGCC

GTCTACTCCCAACTCATCCGCCAGTTTACCTCTCTGACCCACGTGTTCAATCGCTTT

CCC

GAGAACCAGATTTTGGCGCGCCCGCCAGCCCCCACCATCACCACCGTCAGTGAAA

ACGTT

CCTGCTCTCACAGATCACGGGACGCTACCGCTGCGCAACAGCATCGGAGGAGTCC

AGCGA

GTGACCATTACTGACGCCAGACGCCGCACCTGCCCCTACGTTTACAAGGCCCTGG

GCATA

GTCTCGCCGCGCGTCCTATCGAGCCGCACTTTTTGAGCAAGCATGTCCATCCTTAT

ATCG

CCCAGCAATAACACAGGCTGGGGCCTGCGCTTCCCAAGCAAGATGTTTGGCGGGG

CCAAG

AAGCGCTCCGACCAACACCCAGTGCGCGTGCGCGGGCACTACCGCGCGCCCTGGG

GCGCG

CACAAACGCGGCCGCACTGGGCGCACCACCGTCGATGACGCCATCGACGCGGTG

GTGGAG

GAGGCGCGCAACTACACGCCCACGCCGCCACCAGTGTCCACAGTGGACGCGGCC

ATTCAG

ACCGTGGTGCGCGGAGCCCGGCGCTATGCTAAAATGAAGAGACGGCGGAGGCGC

GTAGCA

CGTCGCCACCGCCGCCGACCCGGCACTGCCGCCCAACGCGCGGCGGCGGCCCTGC

TTAAC

CGCGCACGTCGCACCGGCCGACGGGCGGCCATGCGGGCCGCTCGAAGGCTGGCC

GCGGGT

ATTGTCACTGTGCCCCCCAGGTCCAGGCGACGAGCGGCCGCCGCAGCAGCCGCGG

CCATT

AGTGCTATGACTCAGGGTCGCAGGGGCAACGTGTATTGGGTGCGCGACTCGGTTA

GCGGC

CTGCGCGTGCCCGTGCGCACCCGCCCCCCGCGCAACTAGATTGCAAGAAAAAACT

ACTTA

GACTCGTACTGTTGTATGTATCCAGCGGCGGCGGCGCGCAACGAAGCTATGTCCA

AGCGC

AAAATCAAAGAAGAGATGCTCCAGGTCATCGCGCCGGAGATCTATGGCCCCCCGA

AGAAG

GAAGAGCAGGATTACAAGCCCCGAAAGCTAAAGCGGGTCAAAAAGAAAAAGAA

AGATGAT

GATGATGAACTTGACGACGAGGTGGAACTGCTGCACGCTACCGCGCCCAGGCGAC

GGGTA

CAGTGGAAAGGTCGACGCGTAAAACGTGTTTTGCGACCCGGCACCACCGTAGTCT

TTACG

CCCGGTGAGCGCTCCACCCGCACCTACAAGCGCGTGTATGATGAGGTGTACGGCG

ACGAG

GACCTGCTTGAGCAGGCCAACGAGCGCCTCGGGGAGTTTGCCTACGGAAAGCGGC

ATAAG

GACATGCTGGCGTTGCCGCTGGACGAGGGCAACCCAACACCTAGCCTAAAGCCCG

TAACA

CTGCAGCAGGTGCTGCCCGCGCTTGCACCGTCCGAAGAAAAGCGCGGCCTAAAGC

GCGAG

TCTGGTGACTTGGCACCCACCGTGCAGCTGATGGTACCCAAGCGCCAGCGACTGG

AAGAT

GTCTTGGAAAAAATGACCGTGGAACCTGGGCTGGAGCCCGAGGTCCGCGTGCGGC

CAATC

AAGCAGGTGGCGCCGGGACTGGGCGTGCAGACCGTGGACGTTCAGATACCCACT

ACCAGT

AGCACCAGTATTGCCACCGCCACAGAGGGCATGGAGACACAAACGTCCCCGGTTG

CCTCA

GCGGTGGCGGATGCCGCGGTGCAGGCGGTCGCTGCGGCCGCGTCCAAGACCTCTA

CGGAG

GTGCAAACGGACCCGTGGATGTTTCGCGTTTCAGCCCCCCGGCGCCCGCGCGGTT

CGAGG

AAGTACGGCGCCGCCAGCGCGCTACTGCCCGAATATGCCCTACATCCTTCCATTG

CGCCT

ACCCCCGGCTATCGTGGCTACACCTACCGCCCCAGAAGACGAGCAACTACCCGAC

GCCGA

ACCACCACTGGAACCCGCCGCCGCCGTCGCCGTCGCCAGCCCGTGCTGGCCCCGA

TTTCC

GTGCGCAGGGTGGCTCGCGAAGGAGGCAGGACCCTGGTGCTGCCAACAGCGCGC

TACCAC

CCCAGCATCGTTTAAAAGCCGGTCTTTGTGGTTCTTGCAGATATGGCCCTCACCTG

CCGC

CTCCGTTTCCCGGTGCCGGGATTCCGAGGAAGAATGCACCGTAGGAGGGGCATGG

CCGGC

CACGGCCTGACGGGCGGCATGCGTCGTGCGCACCACCGGCGGCGGCGCGCGTCGC

ACCGT

CGCATGCGCGGCGGTATCCTGCCCCTCCTTATTCCACTGATCGCCGCGGCGATTGG

CGCC

GTGCCCGGAATTGCATCCGTGGCCTTGCAGGCGCAGAGACACTGATTAAAAACAA

GTTGC

ATGTGGAAAAATCAAAATAAAAAGTCTGGACTCTCACGCTCGCTTGGTCCTGTAA

CTATT

TTGTAGAATGGAAGACATCAACTTTGCGTCTCTGGCCCCGCGACACGGCTCGCGC

CCGTT

CATGGGAAACTGGCAAGATATCGGCACCAGCAATATGAGCGGTGGCGCCTTCAGC

TGGGG

CTCGCTGTGGAGCGGCATTAAAAATTTCGGTTCCACCGTTAAGAACTATGGCAGC

AAGGC

CTGGAACAGCAGCACAGGCCAGATGCTGAGGGATAAGTTGAAAGAGCAAAATTT

CCAACA

AAAGGTGGTAGATGGCCTGGCCTCTGGCATTAGCGGGGTGGTGGACCTGGCCAAC

CAGGC

AGTGCAAAATAAGATTAACAGTAAGCTTGATCCCCGCCCTCCCGTAGAGGAGCCT

CCACC

GGCCGTGGAGACAGTGTCTCCAGAGGGGCGTGGCGAAAAGCGTCCGCGCCCCGA

CAGGGA

AGAAACTCTGGTGACGCAAATAGACGAGCCTCCCTCGTACGAGGAGGCACTAAA

GCAAGG

CCTGCCCACCACCCGTCCCATCGCGCCCATGGCTACCGGAGTGCTGGGCCAGCAC

ACACC

CGTAACGCTGGACCTGCCTCCCCCCGCCGACACCCAGCAGAAACCTGTGCTGCCA

GGCCC

GACCGCCGTTGTTGTAACCCGTCCTAGCCGCGCGTCCCTGCGCCGCGCCGCCAGC

GGTCC

GCGATCGTTGCGGCCCGTAGCCAGTGGCAACTGGCAAAGCACACTGAACAGCATC

GTGGG

TCTGGGGGTGCAATCCCTGAAGCGCCGACGATGCTTCTGAATAGCTAACGTGTCG

TATGT

GTGTCATGTATGCGTCCATGTCGCCGCCAGAGGAGCTGCTGAGCCGCCGCGCGCC

CGCTT

TCCAAGATGGCTACCCCTTCGATGATGCCGCAGTGGTCTTACATGCACATCTCGGG

CCAG

GACGCCTCGGAGTACCTGAGCCCCGGGCTGGTGCAGTTTGCCCGCGCCACCGAGA

CGTAC

TTCAGCCTGAATAACAAGTTTAGAAACCCCACGGTGGCGCCTACGCACGACGTGA

CCACA

GACCGGTCCCAGCGTTTGACGCTGCGGTTCATCCCTGTGGACCGTGAGGATACTG

CGTAC

TCGTACAAGGCGCGGTTCACCCTAGCTGTGGGTGATAACCGTGTGCTGGACATGG

CTTCC

ACGTACTTTGACATCCGCGGCGTGCTGGACAGGGGCCCTACTTTTAAGCCCTACTC

TGGC

ACTGCCTACAACGCCCTGGCTCCCAAGGGTGCCCCAAATCCTTGCGAATGGGATG

AAGCT

GCTACTGCTCTTGAAATAAACCTAGAAGAAGAGGACGATGACAACGAAGACGAA

GTAGAC

GAGCAAGCTGAGCAGCAAAAAACTCACGTATTTGGGCAGGCGCCTTATTCTGGTA

TAAAT

ATTACAAAGGAGGGTATTCAAATAGGTGTCGAAGGTCAAACACCTAAATATGCCG

ATAAA

ACATTTCAACCTGAACCTCAAATAGGAGAATCTCAGTGGTACGAAACTGAAATTA

ATCAT

GCAGCTGGGAGAGTCCTTAAAAAGACTACCCCAATGAAACCATGTTACGGTTCAT

ATGCA

AAACCCACAAATGAAAATGGAGGGCAAGGCATTCTTGTAAAGCAACAAAATGGA

AAGCTA

GAAAGTCAAGTGGAAATGCAATTTTTCTCAACTACTGAGGCGACCGCAGGCAATG

GTGAT

AACTTGACTCCTAAAGTGGTATTGTACAGTGAAGATGTAGATATAGAAACCCCAG

ACACT

CATATTTCTTACATGCCCACTATTAAGGAAGGTAACTCACGAGAACTAATGGGCC

AACAA

TCTATGCCCAACAGGCCTAATTACATTGCTTTTAGGGACAATTTTATTGGTCTAAT

GTAT

TACAACAGCACGGGTAATATGGGTGTTCTGGCGGGCCAAGCATCGCAGTTGAATG

CTGTT

GTAGATTTGCAAGACAGAAACACAGAGCTTTCATACCAGCTTTTGCTTGATTCCAT

TGGT

GATAGAACCAGGTACTTTTCTATGTGGAATCAGGCTGTTGACAGCTATGATCCAG

ATGTT

AGAATTATTGAAAATCATGGAACTGAAGATGAACTTCCAAATTACTGCTTTCCAC

TGGGA

GGTGTGATTAATACAGAGACTCTTACCAAGGTAAAACCTAAAACAGGTCAGGAA

AATGGA

TGGGAAAAAGATGCTACAGAATTTTCAGATAAAAATGAAATAAGAGTTGGAAAT

AATTTT

GCCATGGAAATCAATCTAAATGCCAACCTGTGGAGAAATTTCCTGTACTCCAACA

TAGCG

CTGTATTTGCCCGACAAGCTAAAGTACAGTCCTTCCAACGTAAAAATTTCTGATAA

CCCA

AACACCTACGACTACATGAACAAGCGAGTGGTGGCTCCCGGGTTAGTGGACTGCT

ACATT

AACCTTGGAGCACGCTGGTCCCTTGACTATATGGACAACGTCAACCCATTTAACC

ACCAC

CGCAATGCTGGCCTGCGCTACCGCTCAATGTTGCTGGGCAATGGTCGCTATGTGCC

CTTC

CACATCCAGGTGCCTCAGAAGTTCTTTGCCATTAAAAACCTCCTTCTCCTGCCGGG

CTCA

TACACCTACGAGTGGAACTTCAGGAAGGATGTTAACATGGTTCTGCAGAGCTCCC

TAGGA

AATGACCTAAGGGTTGACGGAGCCAGCATTAAGTTTGATAGCATTTGCCTTTACG

CCACC

TTCTTCCCCATGGCCCACAACACCGCCTCCACGCTTGAGGCCATGCTTAGAAACG

ACACC

AACGACCAGTCCTTTAACGACTATCTCTCCGCCGCCAACATGCTCTACCCTATACC

CGCC

AACGCTACCAACGTGCCCATATCCATCCCCTCCCGCAACTGGGCGGCTTTCCGCG

GCTGG

GCCTTCACGCGCCTTAAGACTAAGGAAACCCCATCACTGGGCTCGGGCTACGACC

CTTAT

TACACCTACTCTGGCTCTATACCCTACCTAGATGGAACCTTTTACCTCAACCACAC

CTTT

AAGAAGGTGGCCATTACCTTTGACTCTTCTGTCAGCTGGCCTGGCAATGACCGCCT

GCTT

ACCCCCAACGAGTTTGAAATTAAGCGCTCAGTTGACGGGGAGGGTTACAACGTTG

CCCAG

TGTAACATGACCAAAGACTGGTTCCTGGTACAAATGCTAGCTAACTACAACATTG

GCTAC

CAGGGCTTCTATATCCCAGAGAGCTACAAGGACCGCATGTACTCCTTCTTTAGAA

ACTTC

CAGCCCATGAGCCGTCAGGTGGTGGATGATACTAAATACAAGGACTACCAACAG

GTGGGC

ATCCTACACCAACACAACAACTCTGGATTTGTTGGCTACCTTGCCCCCACCATGCG

CGAA

GGACAGGCCTACCCTGCTAACTTCCCCTATCCGCTTATAGGCAAGACCGCAGTTG

ACAGC

ATTACCCAGAAAAAGTTTCTTTGCGATCGCACCCTTTGGCGCATCCCATTCTCCAG

TAAC

TTTATGTCCATGGGCGCACTCACAGACCTGGGCCAAAACCTTCTCTACGCCAACTC

CGCC

CACGCGCTAGACATGACTTTTGAGGTGGATCCCATGGACGAGCCCACCCTTCTTTA

TGTT

TTGTTTGAAGTCTTTGACGTGGTCCGTGTGCACCGGCCGCACCGCGGCGTCATCGA

AACC

GTGTACCTGCGCACGCCCTTCTCGGCCGGCAACGCCACAACATAAAGAAGCAAGC

AACAT

CAACAACAGCTGCCGCCATGGGCTCCAGTGAGCAGGAACTGAAAGCCATTGTCAA

AGATC

TTGGTTGTGGGCCATATTTTTTGGGCACCTATGACAAGCGCTTTCCAGGCTTTGTT

TCTC

CACACAAGCTCGCCTGCGCCATAGTCAATACGGCCGGTCGCGAGACTGGGGGCGT

ACACT

GGATGGCCTTTGCCTGGAACCCGCACTCAAAAACATGCTACCTCTTTGAGCCCTTT

GGCT

TTTCTGACCAGCGACTCAAGCAGGTTTACCAGTTTGAGTACGAGTCACTCCTGCGC

CGTA

GCGCCATTGCTTCTTCCCCCGACCGCTGTATAACGCTGGAAAAGTCCACCCAAAG

CGTAC

AGGGGCCCAACTCGGCCGCCTGTGGACTATTCTGCTGCATGTTTCTCCACGCCTTT

GCCA

ACTGGCCCCAAACTCCCATGGATCACAACCCCACCATGAACCTTATTACCGGGGT

ACCCA

ACTCCATGCTCAACAGTCCCCAGGTACAGCCCACCCTGCGTCGCAACCAGGAACA

GCTCT

ACAGCTTCCTGGAGCGCCACTCGCCCTACTTCCGCAGCCACAGTGCGCAGATTAG

GAGCG

CCACTTCTTTTTGTCACTTGAAAAACATGTAAAAATAATTACTTATGACTCGTACT

ATTG

TTATTCATCCAGGCGGTAGGAGGGCCATCATGGCTATGATGGAGGTCCAGGGGGG

ACCCA

GCCTGGGACAGACCTGCGTGCTGATCGTGATCTTTACAGTGCTCCTGCAGTCTCTC

TGTG

TGGCTGTAACTTACGTGTACTTTACCAACGAGCTGAAGCAGATGCAGGACAAGTA

CTCCA

AAAGTGGCATTGCTTGTTTCTTAAAAGAAGATGACAGTTATTGGGACCCCAATGA

CGAAG

AGAGTATGAACAGCCCCTGCTGGCAAGTCAAGTGGCAACTCCGTCAGCTCGTTAG

AAAGA

TGATTTTGAGAACCTCTGAGGAAACCATTTCTACAGTTCAAGAAAAGCAACAAAA

TATTT

CTCCCCTAGTGAGAGAAAGAGGTCCTCAGAGAGTAGCAGCTCACATAACTGGGAC

CAGAG

GAAGAAGCAACACATTGTCTTCTCCAAACTCCAAGAATGAAAAGGCTCTGGGCCG

CAAAA

TAAACTCCTGGGAATCATCAAGGAGTGGGCATTCATTCCTGAGCAACTTGCACTT

GAGGA

ATGGTGAACTGGTCATCCATGAAAAAGGGTTTTACTACATCTATTCCCAAACATA

CTTTC

GATTTCAGGAGGAAATAAAAGAAAACACAAAGAACGACAAACAAATGGTCCAAT

ATATTT

ACAAATACACAAGTTATCCTGACCCTATATTGTTGATGAAAAGTGCTAGAAATAG

TTGTT

GGTCTAAAGATGCAGAATATGGACTCTATTCCATCTATCAAGGGGGAATATTTGA

GCTTA

AGGAAAATGACAGAATTTTTGTTTCTGTAACAAATGAGCACTTAATAGACATGGA

CCATG

AAGCCAGTTTTTTCGGGGCCTTTTTAGTTGGCTAAGCTAGCTACTAGAGACACTTT

CAAT

AAAGGCAAATGCTTTTATTTGTACACTCTCGGGTGATTATTTACCCCCACCCTTGC

CGTC

TGCGCCGTTTAAAAATCAAAGGGGTTCTGCCGCGCATCGCTATGCGCCACTGGCA

GGGAC

ACGTTGCGATACTGGTGTTTAGTGCTCCACTTAAACTCAGGCACAACCATCCGCG

GCAGC

TCGGTGAAGTTTTCACTCCACAGGCTGCGCACCATCACCAACGCGTTTAGCAGGT

CGGGC

GCCGATATCTTGAAGTCGCAGTTGGGGCCTCCGCCCTGCGCGCGCGAGTTGCGAT

ACACA

GGGTTGCAGCACTGGAACACTATCAGCGCCGGGTGGTGCACGCTGGCCAGCACGC

TCTTG

TCGGAGATCAGATCCGCGTCCAGGTCCTCCGCGTTGCTCAGGGCGAACGGAGTCA

ACTTT

GGTAGCTGCCTTCCCAAAAAGGGCGCGTGCCCAGGCTTTGAGTTGCACTCGCACC

GTAGT

GGCATCAAAAGGTGACCGTGCCCGGTCTGGGCGTTAGGATACAGCGCCTGCATAA

AAGCC

TTGATCTGCTTAAAAGCCACCTGAGCCTTTGCGCCTTCAGAGAAGAACATGCCGC

AAGAC

TTGCCGGAAAACTGATTGGCCGGACAGGCCGCGTCGTGCACGCAGCACCTTGCGT

CGGTG

TTGGAGATCTGCACCACATTTCGGCCCCACCGGTTCTTCACGATCTTGGCCTTGCT

AGAC

TGCTCCTTCAGCGCGCGCTGCCCGTTTTCGCTCGTCACATCCATTTCAATCACGTG

CTCC

TTATTTATCATAATGCTTCCGTGTAGACACTTAAGCTCGCCTTCGATCTCAGCGCA

GCGG

TGCAGCCACAACGCGCAGCCCGTGGGCTCGTGATGCTTGTAGGTCACCTCTGCAA

ACGAC

TGCAGGTACGCCTGCAGGAATCGCCCCATCATCGTCACAAAGGTCTTGTTGCTGG

TGAAG

GTCAGCTGCAACCCGCGGTGCTCCTCGTTCAGCCAGGTCTTGCATACGGCCGCCA

GAGCT

TCCACTTGGTCAGGCAGTAGTTTGAAGTTCGCCTTTAGATCGTTATCCACGTGGTA

CTTG

TCCATCAGCGCGCGCGCAGCCTCCATGCCCTTCTCCCACGCAGACACGATCGGCA

CACTC

AGCGGGTTCATCACCGTAATTTCACTTTCCGCTTCGCTGGGCTCTTCCTCTTCCTCT

TGC

GTCCGCATACCACGCGCCACTGGGTCGTCTTCATTCAGCCGCCGCACTGTGCGCTT

ACCT

CCTTTGCCATGCTTGATTAGCACCGGTGGGTTGCTGAAACCCACCATTTGTAGCGC

CACA

TCTTCTCTTTCTTCCTCGCTGTCCACGATTACCTCTGGTGATGGCGGGCGCTCGGG

CTTG

GGAGAAGGGCGCTTCTTTTTCTTCTTGGGCGCAATGGCCAAATCCGCCGCCGAGG

TCGAT

GGCCGCGGGCTGGGTGTGCGCGGCACCAGCGCGTCTTGTGATGAGTCTTCCTCGT

CCTCG

GACTCGATACGCCGCCTCATCCGCTTTTTTGGGGGCGCCCGGGGAGGCGGCGGCG

ACGGG

GACGGGGACGACACGTCCTCCATGGTTGGGGGACGTCGCGCCGCACCGCGTCCGC

GCTCG

GGGGTGGTTTCGCGCTGCTCCTCTTCCCGACTGGCCATTTCCTTCTCCTATAGGCA

GAAA

AAGATCATGGAGTCAGTCGAGAAGAAGGACAGCCTAACCGCCCCCTCTGAGTTCG

CCACC

ACCGCCTCCACCGATGCCGCCAACGCGCCTACCACCTTCCCCGTCGAGGCACCCC

CGCTT

GAGGAGGAGGAAGTGATTATCGAGCAGGACCCAGGTTTTGTAAGCGAAGACGAC

GAGGAC

CGCTCAGTACCAACAGAGGATAAAAAGCAAGACCAGGACAACGCAGAGGCAAAC

GAGGAA

CAAGTCGGGCGGGGGGACGAAAGGCATGGCGACTACCTAGATGTGGGAGACGAC

GTGCTG

TTGAAGCATCTGCAGCGCCAGTGCGCCATTATCTGCGACGCGTTGCAAGAGCGCA

GCGAT

GTGCCCCTCGCCATAGCGGATGTCAGCCTTGCCTACGAACGCCACCTATTCTCACC

GCGC

GTACCCCCCAAACGCCAAGAAAACGGCACATGCGAGCCCAACCCGCGCCTCAACT

TCTAC

CCCGTATTTGCCGTGCCAGAGGTGCTTGCCACCTATCACATCTTTTTCCAAAACTG

CAAG

ATACCCCTATCCTGCCGTGCCAACCGCAGCCGAGCGGACAAGCAGCTGGCCTTGC

GGCAG

GGCGCTGTCATACCTGATATCGCCTCGCTCAACGAAGTGCCAAAAATCTTTGAGG

GTCTT

GGACGCGACGAGAAGCGCGCGGCAAACGCTCTGCAACAGGAAAACAGCGAAAAT

GAAAGT

CACTCTGGAGTGTTGGTGGAACTCGAGGGTGACAACGCGCGCCTAGCCGTACTAA

AACGC

AGCATCGAGGTCACCCACTTTGCCTACCCGGCACTTAACCTACCCCCCAAGGTCAT

GAGC

ACAGTCATGAGTGAGCTGATCGTGCGCCGTGCGCAGCCCCTGGAGAGGGATGCAA

ATTTG

CAAGAACAAACAGAGGAGGGCCTACCCGCAGTTGGCGACGAGCAGCTAGCGCGC

TGGCTT

CAAACGCGCGAGCCTGCCGACTTGGAGGAGCGACGCAAACTAATGATGGCCGCA

GTGCTC

GTTACCGTGGAGCTTGAGTGCATGCAGCGGTTCTTTGCTGACCCGGAGATGCAGC

GCAAG

CTAGAGGAAACATTGCACTACACCTTTCGACAGGGCTACGTACGCCAGGCCTGCA

AGATC

TCCAACGTGGAGCTCTGCAACCTGGTCTCCTACCTTGGAATTTTGCACGAAAACCG

CCTT

GGGCAAAACGTGCTTCATTCCACGCTCAAGGGCGAGGCGCGCCGCGACTACGTCC

GCGAC

TGCGTTTACTTATTTCTATGCTACACCTGGCAGACGGCCATGGGCGTTTGGCAGCA

GTGC

TTGGAGGAGTGCAACCTCAAGGAGCTGCAGAAACTGCTAAAGCAAAACTTGAAG

GACCTA

TGGACGGCCTTCAACGAGCGCTCCGTGGCCGCGCACCTGGCGGACATCATTTTCC

CCGAA

CGCCTGCTTAAAACCCTGCAACAGGGTCTGCCAGACTTCACCAGTCAAAGCATGT

TGCAG

AACTTTAGGAACTTTATCCTAGAGCGCTCAGGAATCTTGCCCGCCACCTGCTGTGC

ACTT

CCTAGCGACTTTGTGCCCATTAAGTACCGCGAATGCCCTCCGCCGCTTTGGGGCCA

CTGC

TACCTTCTGCAGCTAGCCAACTACCTTGCCTACCACTCTGACATAATGGAAGACGT

GAGC

GGTGACGGTCTACTGGAGTGTCACTGTCGCTGCAACCTATGCACCCCGCACCGCT

CCCTG

GTTTGCAATTCGCAGCTGCTTAACGAAAGTCAAATTATCGGTACCTTTGAGCTGCA

GGGT

CCCTCGCCTGACGAAAAGTCCGCGGCTCCGGGGTTGAAACTCACTCCGGGGCTGT

GGACG

TCGGCTTACCTTCGCAAATTTGTACCTGAGGACTACCACGCCCACGAGATTAGGTT

CTAC

GAAGACCAATCCCGCCCGCCAAATGCGGAGCTTACCGCCTGCGTCATTACCCAGG

GCCAC

ATTCTTGGCCAATTGCAAGCCATCAACAAAGCCCGCCAAGAGTTTCTGCTACGAA

AGGGA

CGGGGGGTTTACTTGGACCCCCAGTCCGGCGAGGAGCTCAACCCAATCCCCCCGC

CGCCG

CAGCCCTATCAGCAGCAGCCGCGGGCCCTTGCTTCCCAGGATGGCACCCAAAAAG

AAGCT

GCAGCTGCCGCCGCCACCCACGGACGAGGAGGAATACTGGGACAGTCAGGCAGA

GGAGGT

TTTGGACGAGGAGGAGGAGGACATGATGGAAGACTGGGAGAGCCTAGACGAGGA

AGCTTC

CGAGGTCGAAGAGGTGTCAGACGAAACACCGTCACCCTCGGTCGCATTCCCCTCG

CCGGC

GCCCCAGAAATCGGCAACCGGTTCCAGCATGGCTACAACCTCCGCTCCTCAGGCG

CCGCC

GGCACTGCCCGTTCGCCGACCCAACCGTAGATGGGACACCACTGGAACCAGGGCC

GGTAA

GTCCAAGCAGCCGCCGCCGTTAGCCCAAGAGCAACAACAGCGCCAAGGCTACCG

CTCATG

GCGCGGGCACAAGAACGCCATAGTTGCTTGCTTGCAAGACTGTGGGGGCAACATC

TCCTT

CGCCCGCCGCTTTCTTCTCTACCATCACGGCGTGGCCTTCCCCCGTAACATCCTGC

ATTA

CTACCGTCATCTCTACAGCCCATACTGCACCGGCGGCAGCGGCAGCGGCAGCAAC

AGCAG

CGGCCACACAGAAGCAAAGGCGACCGGATAGCAAGACTCTGACAAAGCCCAAGA

AATCCA

CAGCGGCGGCAGCAGCAGGAGGAGGAGCGCTGCGTCTGGCGCCCAACGAACCCG

TATCGA

CCCGCGAGCTTAGAAACAGGATTTTTCCCACTCTGTATGCTATATTTCAACAGAGC

AGGG

GCCAAGAACAAGAGCTGAAAATAAAAAACAGGTCTCTGCGATCCCTCACCCGCA

GCTGCC

TGTATCACAAAAGCGAAGATCAGCTTCGGCGCACGCTGGAAGACGCGGAGGCTCT

CTTCA

GTAAATACTGCGCGCTGACTCTTAAGGACTAGTTTCGCGCCCTTTCTCAAATTTAA

GCGC

GAAAACTACGTCATCTCCAGCGGCCACACCCGGCGCCAGCACCTGTCGTCAGCGC

CATTA

TGAGCAAGGAAATTCCCACGCCCTACATGTGGAGTTACCAGCCACAAATGGGACT

TGCGG

CTGGAGCTGCCCAAGACTACTCAACCCGAATAAACTACATGAGCGCGGGACCCCA

CATGA

TATCCCGGGTCAACGGAATCCGCGCCCACCGAAACCGAATTCTCTTGGAACAGGC

GGCTA

TTACCACCACACCTCGTAATAACCTTAATCCCCGTAGTTGGCCCGCTGCCCTGGTG

TACC

AGGAAAGTCCCGCTCCCACCACTGTGGTACTTCCCAGAGACGCCCAGGCCGAAGT

TCAGA

TGACTAACTCAGGGGCGCAGCTTGCGGGCGGCTTTCGTCACAGGGTGCGGTCGCC

CGGGC

AGGGTATAACTCACCTGACAATCAGAGGGCGAGGTATTCAGCTCAACGACGAGTC

GGTGA

GCTCCTCGCTTGGTCTCCGTCCGGACGGGACATTTCAGATCGGCGGCGCCGGCCG

TCCTT

CATTCACGCCTCGTCAGGCAATCCTAACTCTGCAGACCTCGTCCTCTGAGCCGCGC

TCTG

GAGGCATTGGAACTCTGCAATTTATTGAGGAGTTTGTGCCATCGGTCTACTTTAAC

CCCT

TCTCGGGACCTCCCGGCCACTATCCGGATCAATTTATTCCTAACTTTGACGCGGTA

AAGG

ACTCGGCGGACGGCTACGACTGAATGTTAAGTGGAGAGGCAGAGCAACTGCGCC

TGAAAC

ACCTGGTCCACTGTCGCCGCCACAAGTGCTTTGCCCGCGACTCCGGTGAGTTTTGC

TACT

TTGAATTGCCCGAGGATCATATCGAGGGCCCGGCGCACGGCGTCCGGCTTACCGC

CCAGG

GAGAGCTTGCCCGTAGCCTGATTCGGGAGTTTACCCAGCGCCCCCTGCTAGTTGA

GCGGG

ACAGGGGACCCTGTGTTCTCACTGTGATTTGCAACTGTCCTAACCTTGGATTACAT

CAAG

ATCTTTGTTGCCATCTCTGTGCTGAGTATAATAAATACAGAAATTAAAATATACTG

GGGC

TCCTATCGCCATCCTGTAAACGCCACCGTCTTCACCCGCCCAAGCAAACCAAGGC

GAACC

TTACCTGGTACTTTTAACATCTCTCCCTCTGTGATTTACAACAGTTTCAACCCAGA

CGGA

GTGAGTCTACGAGAGAACCTCTCCGAGCTCAGCTACTCCATCAGAAAAAACACCA

CCCTC

CTTACCTGCCGGGAACGTACGAGTGCGTCACCGGCCGCTGCACCACACCTACCGC

CTGAC

CGTAAACCAGACTTTTTCCGGACAGACCTCAATAACTCTGTTTACCAGAACAGGA

GGTGA

GCTTAGAAAACCCTTAGGGTATTAGGCCAAAGGCGCAGCTACTGTGGGGTTTATG

AACAA

TTCAAGCAACTCTACGGGCTATTCTAATTCAGGTTTCTCTAGAATCGGGGTTGGGG

TTAT

TCTCTGTCTTGTGATTCTCTTTATTCTTATACTAACGCTTCTCTGCCTAAGGCTCGC

CGC

CTGCTGTGTGCACATTTGCATTTATTGTCAGCTTTTTAAACGCTGGGGTCGCCACC

CAAG

ATGATTAGGTACATAATCCTAGGTTTACTCACCCTTGCGTCAGCCCACGGTACCAC

CCAA

AAGGTGGATTTTAAGGAGCCAGCCTGTAATGTTACATTCGCAGCTGAAGCTAATG

AGTGC

ACCACTCTTATAAAATGCACCACAGAACATGAAAAGCTGCTTATTCGCCACAAAA

ACAAA

ATTGGCAAGTATGCTGTTTATGCTATTTGGCAGCCAGGTGACACTACAGAGTATA

ATGTT

ACAGTTTTCCAGGGTAAAAGTCATAAAACTTTTATGTATACTTTTCCATTTTATGA

AATG

TGCGACATTACCATGTACATGAGCAAACAGTATAAGTTGTGGCCCCCACAAAATT

GTGTG

GAAAACACTGGCACTTTCTGCTGCACTGCTATGCTAATTACAGTGCTCGCTTTGGT

CTGT

ACCCTACTCTATATTAAATACAAAAGCAGACGCAGCTTTATTGAGGAAAAGAAAA

TGCCT

TAATTTACTAAGTTACAAAGCTAATGTCACCACTAACTGCTTTACTCGCTGCTTGC

AAAA

CAAATTCAAAAAGTTAGCATTATAATTAGAATAGGATTTAAACCCCCCGGTCATT

TCCTG

CTCAATACCATTCCCCTGAACAATTGACTCTATGTGGGATATGCTCCAGCGCTACA

ACCT

TGAAGTCAGGCTTCCTGGATGTCAGCATCTGACTTTGGCCAGCACCTGTCCCGCGG

ATTT

GTTCCAGTCCAACTACAGCGACCCACCCTAACAGAGATGACCAACACAACCAACG

CGGCC

GCCGCTACCGGACTTACATCTACCACAAATACACCCCAAGTTTCTGCCTTTGTCAA

TAAC

TGGGATAACTTGGGCATGTGGTGGTTCTCCATAGCGCTTATGTTTGTATGCCTTAT

TATT

ATGTGGCTCATCTGCTGCCTAAAGCGCAAACGCGCCCGACCACCCATCTATAGTC

CCATC

ATTGTGCTACACCCAAACAATGATGGAATCCATAGATTGGACGGACTGAAACACA

TGTTC

TTTTCTCTTACAGTATGATTAAATGAGACATGATTCCTCGAGTTTTTATATTACTGA

CCC

TTGTTGCGCTTTTTTGTGCGTGCTCCACATTGGCTGCGGTTTCTCACATCGAAGTA

GACT

GCATTCCAGCCTTCACAGTCTATTTGCTTTACGGATTTGTCACCCTCACGCTCATCT

GCA

GCCTCATCACTGTGGTCATCGCCTTTATCCAGTGCATTGACTGGGTCTGTGTGCGC

TTTG

CATATCTCAGACACCATCCCCAGTACAGGGACAGGACTATAGCTGAGCTTCTTAG

AATTC

TTTAATTATGAAATTTACTGTGACTTTTCTGCTGATTATTTGCACCCTATCTGCGTT

TTG

TTCCCCGACCTCCAAGCCTCAAAGACATATATCATGCAGATTCACTCGTATATGGA

ATAT

TCCAAGTTGCTACAATGAAAAAAGCGATCTTTCCGAAGCCTGGTTATATGCAATC

ATCTC

TGTTATGGTGTTCTGCAGTACCATCTTAGCCCTAGCTATATATCCCTACCTTGACA

TTGG

CTGGAACGCAATAGATGCCATGAACCACCCAACTTTCCCCGCGCCCGCTATGCTT

CCACT

GCAACAAGTTGTTGCCGGCGGCTTTGTCCCAGCCAATCAGCCTCGCCCACCTTCTC

CCAC

CCCCACTGAAATCAGCTACTTTAATCTAACAGGAGGAGATGACTGACACCCTAGA

TCTAG

AAATGGACGGAATTATTACAGAGCAGCGCCTGCTAGAAAGACGCAGGGCAGCGG

CCGAGC

AACAGCGCATGAATCAAGAGCTCCAAGACATGGTTAACTTGCACCAGTGCAAAA

GGGGTA

TCTTTTGTCTGGTAAAGCAGGCCAAAGTCACCTACGACAGTAATACCACCGGACA

CCGCC

TTAGCTACAAGTTGCCAACCAAGCGTCAGAAATTGGTGGTCATGGTGGGAGAAAA

GCCCA

TTACCATAACTCAGCACTCGGTAGAAACCGAAGGCTGCATTCACTCACCTTGTCA

AGGAC

CTGAGGATCTCTGCACCCTTATTAAGACCCTGTGCGGTCTCAAAGATCTTATTCCC

TTTA

ACTAATAAAAAAAAATAATAAAGCATCACTTACTTAAAATCAGTTAGCAAATTTC

TGTCC

AGTTTATTCAGCAGCACCTCCTTGCCCTCCTCCCAGCTCTGGTATTGCAGCTTCCTC

CTG

GCTGCAAACTTTCTCCACAATCTAAATGGAATGTCAGTTTCCTCCTGTTCCTGTCC

ATCC

GCACCCACTATCTTCATGTTGTTGCAGATGAAGCGCGCAAGACCGTCTGAAGATA

CCTTC

AACCCCGTGTATCCATATGACACGGAAACCGGTCCTCCAACTGTGCCTTTTCTTAC

TCCT

CCCTTTGTATCCCCCAATGGGTTTCAAGAGAGTCCCCCTGGGGTACTCTCTTTGCG

CCTA

TCCGAACCTCTAGTTACCTCCAATGGCATGCTTGCGCTCAAAATGGGCAACGGCC

TCTCT

CTGGACGAGGCCGGCAACCTTACCTCCCAAAATGTAACCACTGTGAGCCCACCTC

TCAAA

AAAACCAAGTCAAACATAAACCTGGAAATATCTGCACCCCTCACAGTTACCTCAG

AAGCC

CTAACTGTGGCTGCCGCCGCACCTCTAATGGTCGCGGGCAACACACTCACCATGC

AATCA

CAGGCCCCGCTAACCGTGCACGACTCCAAACTTAGCATTGCCACCCAAGGACCCC

TCACA

GTGTCAGAAGGAAAGCTAGCCCTGCAAACATCAGGCCCCCTCACCACCACCGATA

GCAGT

ACCCTTACTATCACTGCCTCACCCCCTCTAACTACTGCCACTGGTAGCTTGGGCAT

TGAC

TTGAAAGAGCCCATTTATACACAAAATGGAAAACTAGGACTAAAGTACGGGGCTC

CTTTG

CATGTAACAGACGACCTAAACACTTTGACCGTAGCAACTGGTCCAGGTGTGACTA

TTAAT

AATACTTCCTTGCAAACTAAAGTTACTGGAGCCTTGGGTTTTGATTCACAAGGCAA

TATG

CAACTTAATGTAGCAGGAGGACTAAGGATTGATTCTCAAAACAGACGCCTTATAC

TTGAT

GTTAGTTATCCGTTTGATGCTCAAAACCAACTAAATCTAAGACTAGGACAGGGCC

CTCTT

TTTATAAACTCAGCCCACAACTTGGATATTAACTACAACAAAGGCCTTTACTTGTT

TACA

GCTTCAAACAATTCCAAAAAGCTTGAGGTTAACCTAAGCACTGCCAAGGGGTTGA

TGTTT

GACGCTACAGCCATAGCCATTAATGCAGGAGATGGGCTTGAATTTGGTTCACCTA

ATGCA

CCAAACACAAATCCCCTCAAAACAAAAATTGGCCATGGCCTAGAATTTGATTCAA

ACAAG

GCTATGGTTCCTAAACTAGGAACTGGCCTTAGTTTTGACAGCACAGGTGCCATTAC

AGTA

GGAAACAAAAATAATGATAAGCTAACTTTGTGGACCACACCAGCTCCATCTCCTA

ACTGT

AGACTAAATGCAGAGAAAGATGCTAAACTCACTTTGGTCTTAACAAAATGTGGCA

GTCAA

ATACTTGCTACAGTTTCAGTTTTGGCTGTTAAAGGCAGTTTGGCTCCAATATCTGG

AACA

GTTCAAAGTGCTCATCTTATTATAAGATTTGACGAAAATGGAGTGCTACTAAACA

ATTCC

TTCCTGGACCCAGAATATTGGAACTTTAGAAATGGAGATCTTACTGAAGGCACAG

CCTAT

ACAAACGCTGTTGGATTTATGCCTAACCTATCAGCTTATCCAAAATCTCACGGTAA

AACT

GCCAAAAGTAACATTGTCAGTCAAGTTTACTTAAACGGAGACAAAACTAAACCTG

TAACA

CTAACCATTACACTAAACGGTACACAGGAAACAGGAGACACAACTCCAAGTGCA

TACTCT

ATGTCATTTTCATGGGACTGGTCTGGCCACAACTACATTAATGAAATATTTGCCAC

ATCC

TCTTACACTTTTTCATACATTGCCCAAGAATAAAGAATCGTTTGTGTTATGTTTCA

ACGT

GTTTATTTTTCAATTGCAGAAAATTTCAAGTCATTTTTCATTCAGTAGTATAGCCCC

ACC

ACCACATAGCTTATACAGATCACCGTACCTTAATCAAACTCACAGAACCCTAGTA

TTCAA

CCTGCCACCTCCCTCCCAACACACAGAGTACACAGTCCTTTCTCCCCGGCTGGCCT

TAAA

AAGCATCATATCATGGGTAACAGACATATTCTTAGGTGTTATATTCCACACGGTTT

CCTG

TCGAGCCAAACGCTCATCAGTGATATTAATAAACTCCCCGGGCAGCTCACTTAAG

TTCAT

GTCGCTGTCCAGCTGCTGAGCCACAGGCTGCTGTCCAACTTGCGGTTGCTTAACGG

GCGG

CGAAGGAGAAGTCCACGCCTACATGGGGGTAGAGTCATAATCGTGCATCAGGAT

AGGGCG

GTGGTGCTGCAGCAGCGCGCGAATAAACTGCTGCCGCCGCCGCTCCGTCCTGCAG

GAATA

CAACATGGCAGTGGTCTCCTCAGCGATGATTCGCACCGCCCGCAGCATAAGGCGC

CTTGT

CCTCCGGGCACAGCAGCGCACCCTGATCTCACTTAAATCAGCACAGTAACTGCAG

CACAG

CACCACAATATTGTTCAAAATCCCACAGTGCAAGGCGCTGTATCCAAAGCTCATG

GCGGG

GACCACAGAACCCACGTGGCCATCATACCACAAGCGCAGGTAGATTAAGTGGCG

ACCCCT

CATAAACACGCTGGACATAAACATTACCTCTTTTGGCATGTTGTAATTCACCACCT

CCCG

GTACCATATAAACCTCTGATTAAACATGGCGCCATCCACCACCATCCTAAACCAG

CTGGC

CAAAACCTGCCCGCCGGCTATACACTGCAGGGAACCGGGACTGGAACAATGACA

GTGGAG

AGCCCAGGACTCGTAACCATGGATCATCATGCTCGTCATGATATCAATGTTGGCA

CAACA

CAGGCACACGTGCATACACTTCCTCAGGATTACAAGCTCCTCCCGCGTTAGAACC

ATATC

CCAGGGAACAACCCATTCCTGAATCAGCGTAAATCCCACACTGCAGGGAAGACCT

CGCAC

GTAACTCACGTTGTGCATTGTCAAAGTGTTACATTCGGGCAGCAGCGGATGATCC

TCCAG

TATGGTAGCGCGGGTTTCTGTCTCAAAAGGAGGTAGACGATCCCTACTGTACGGA

GTGCG

CCGAGACAACCGAGATCGTGTTGGTCGTAGTGTCATGCCAAATGGAACGCCGGAC

GTAGT

CATATTTCCTGAAGCAAAACCAGGTGCGGGCGTGACAAACAGATCTGCGTCTCCG

GTCTC

GCCGCTTAGATCGCTCTGTGTAGTAGTTGTAGTATATCCACTCTCTCAAAGCATCC

AGGC

GCCCCCTGGCTTCGGGTTCTATGTAAACTCCTTCATGCGCCGCTGCCCTGATAACA

TCCA

CCACCGCAGAATAAGCCACACCCAGCCAACCTACACATTCGTTCTGCGAGTCACA

CACGG

GAGGAGCGGGAAGAGCTGGAAGAACCATGTTTTTTTTTTTATTCCAAAAGATTAT

CCAAA

ACCTCAAAATGAAGATCTATTAAGTGAACGCGCTCCCCTCCGGTGGCGTGGTCAA

ACTCT

ACAGCCAAAGAACAGATAATGGCATTTGTAAGATGTTGCACAATGGCTTCCAAAA

GGCAA

ACGGCCCTCACGTCCAAGTGGACGTAAAGGCTAAACCCTTCAGGGTGAATCTCCT

CTATA

AACATTCCAGCACCTTCAACCATGCCCAAATAATTCTCATCTCGCCACCTTCTCAA

TATA

TCTCTAAGCAAATCCCGAATATTAAGTCCGGCCATTGTAAAAATCTGCTCCAGAG

CGCCC

TCCACCTTCAGCCTCAAGCAGCGAATCATGATTGCAAAAATTCAGGTTCCTCACA

GACCT

GTATAAGATTCAAAAGCGGAACATTAACAAAAATACCGCGATCCCGTAGGTCCCT

TCGCA

GGGCCAGCTGAACATAATCGTGCAGGTCTGCACGGACCAGCGCGGCCACTTCCCC

GCCAG

GAACCTTGACAAAAGAACCCACACTGATTATGACACGCATACTCGGAGCTATGCT

AACCA

GCGTAGCCCCGATGTAAGCTTTGTTGCATGGGCGGCGATATAAAATGCAAGGTGC

TGCTC

AAAAAATCAGGCAAAGCCTCGCGCAAAAAAGAAAGCACATCGTAGTCATGCTCA

TGCAGA

TAAAGGCAGGTAAGCTCCGGAACCACCACAGAAAAAGACACCATTTTTCTCTCAA

ACATG

TCTGCGGGTTTCTGCATAAACACAAAATAAAATAACAAAAAAACATTTAAACATT

AGAAG

CCTGTCTTACAACAGGAAAAACAACCCTTATAAGCATAAGACGGACTACGGCCAT

GCCGG

CGTGACCGTAAAAAAACTGGTCACCGTGATTAAAAAGCACCACCGACAGCTCCTC

GGTCA

TGTCCGGAGTCATAATGTAAGACTCGGTAAACACATCAGGTTGATTCATCGGTCA

GTGCT

AAAAAGCGACCGAAATAGCCCGGGGGAATACATACCCGCAGGCGTAGAGACAAC

ATTACA

GCCCCCATAGGAGGTATAACAAAATTAATAGGAGAGAAAAACACATAAACACCT

GAAAAA

CCCTCCTGCCTAGGCAAAATAGCACCCTCCCGCTCCAGAACAACATACAGCGCTT

CCACA

GCGGCAGCCATAACAGTCAGCCTTACCAGTAAAAAAGAAAACCTATTAAAAAAA

CACCAC

TCGACACGGCACCAGCTCAATCAGTCACAGTGTAAAAAAGGGCCAAGTGCAGAG

CGAGTA

TATATAGGACTAAAAAATGACGTAACGGTTAAAGTCCACAAAAAACACCCAGAA

AACCGC

ACGGGAACCTACGGCCAGAAACGAAAGCCAAAAAACCCACAACTTCCTCAAATC

GTCACT

TCCGTTTTCCCACGTTACGTCACTTCCCATTTTAATTAAGAAAACTACAATTCCCA

ACAC

ATACAAGTTACTCCGCCCTAAAACCTACGTCACCCGCCCCGTTCCCACGCCCCGCG

CCAC

GTCACAAACTCCACCCCCTCATTATCATATTGGCTTCAATCCAAAATAAGGTATAT

TATT

GATGATGATTACCCT

SEQ ID NO：52是寡核苷酸引物1618.95.1的序列

5′TACCGGGGTACCCAACTCCA

SEQ ID NO：53是寡核苷酸引物1618.95.6的序列

5′GACGCGGCCTGTCCGGCC

SEQ ID NO：54是寡核苷酸引物1618.97.1的序列

5′TACTTATGACTCGTACTATTGTTATTCATCCAGGCGGTAGGAGGGCCATC

ATGAA

SEQ ID NO：55是寡核苷酸引物1618.97.2的序列

5′CCTTTATTGAAAGTGTCTCTAGTAGCTAGCGGGAGGGAGGTCC

SEQ ID NO：56是寡核苷酸引物1618.95.5的序列

5′TACTAGAGACACTTTCAATAAAGG

SEQ ID NO：57是寡核苷酸引物1706.83.1的序列

5′GTT AAC ATG GTT CTG CAG AGC

SEQ ID NO：58是寡核苷酸引物1706.83.2的序列

5′GGC TCG TCC ATG GGA TCC ACC TCA AAA GTC

SEQ ID NO：59是寡核苷酸引物1706.95.1的序列

5′GGA TCC CAT GGA CGA GCC CA

SEQ ID NO：60是寡核苷酸引物1618.116.3的序列

5′CT TAT TAC CGG GGT ACC CAA CTC CTC GAG TAT TT

SEQ ID NO：61是寡核苷酸引物1619.144.1的序列

5′TACAA GTA TAC GCC ACC ATG GCT ATG ATG GAG GTC CAG

SEQ ID NO：62是寡核苷酸引物1619.144.3的序列

3′TTGTA GTA TAC TTA GCC AAC TAA AAA GGC CCC

Claims

1.一种包含转基因编码序列(CDS)的腺病毒载体，其中由嵌合腺病毒前导区表达所述CDS，其中嵌合腺病毒前导区的天然部分选自L1、L2、L3和L4腺病毒前导区。

2.如权利要求1所述的腺病毒载体，其中所述嵌合腺病毒前导区包含分支点和剪接受体位点、转基因CDS和腺病毒CDS。

3.如权利要求1所述的腺病毒载体，其中嵌合腺病毒前导区包含第一腺病毒CDS、分支点、第一剪接受体位点、转基因CDS、第二分支点、第二剪接受体位点和第二腺病毒CDS。

4.如权利要求1所述的腺病毒载体，其中嵌合腺病毒前导区依次包含腺病毒CDS、分支点、剪接受体位点、转基因CDS和多腺苷酸化信号。

5.如权利要求1所述的腺病毒载体，其中嵌合腺病毒前导区依次包含腺病毒CDS、可操作地连接转基因CDS的内部核糖体进入位点和多腺苷酸化信号。

6.如权利要求2所述的腺病毒载体，其中第一剪接受体位点是内源腺病毒剪接受体位点或异源剪接受体位点。

7.如权利要求2所述的腺病毒载体，其中第二剪接受体位点是内源腺病毒剪接受体位点或异源剪接受体位点。

8.如权利要求2所述的腺病毒载体，其中第一分支点是内源腺病毒分支点或异源分支点。

9.如权利要求2所述的腺病毒载体，其中第二分支点是内源腺病毒分支点或异源分支点。

10.如权利要求4所述的腺病毒载体，其中剪接受体位点是异源剪接受体位点。

11.如权利要求4所述的腺病毒载体，其中分支点是异源分支点。

12.如权利要求1所述的腺病毒载体，其中嵌合腺病毒前导区依次包含可操作地连接自加工切割位点的腺病毒CDS和可操作地连接所述自加工切割位点的转基因CDS。

13.如权利要求1所述的腺病毒载体，其中嵌合腺病毒前导区依次包含可操作地连接自加工切割位点CDS的转基因CDS和可操作地连接所述自加工切割位点的腺病毒CDS。

14.如权利要求12所述的腺病毒载体，其中所述自加工切割位点CDS是2A或2A-样序列。

15.如权利要求12所述的腺病毒载体，其中所述自加工切割位点CDS选自SEQ ID NO：1-32。

16.如权利要求1所述的腺病毒载体，其中嵌合腺病毒前导区的天然部分来自L2腺病毒前导区。

17.如权利要求16所述的腺病毒载体，其中嵌合腺病毒前导区依次包含pVII CDS、第一剪接受体位点、转基因CDS、第二剪接受体位点和pV CDS。

18.如权利要求17所述的腺病毒载体，其中所述第一剪接受体位点是内源腺病毒剪接位点，所述第二剪接受体位点是异源剪接位点。

19.如权利要求17所述的腺病毒载体，其中所述第一剪接受体位点是异源剪接位点，所述第二剪接受体位点是内源腺病毒剪接位点。

20.如权利要求16所述的腺病毒载体，其中嵌合腺病毒前导区依次包含五邻体CDS、第一剪接受体位点、转基因CDS、第二剪接受体位点和pVII CDS。

21.如权利要求20所述的腺病毒载体，其中所述第一剪接受体位点是内源腺病毒剪接位点，所述第二剪接受体位点异源剪接位点。

22.如权利要求20所述的腺病毒载体，其中所述第一剪接受体位点是异源剪接位点，所述第二剪接受体位点是内源腺病毒剪接位点。

23.如权利要求16所述的腺病毒载体，其中嵌合腺病毒前导区依次包含Mu CDS、剪接受体位点、转基因CDS和多腺苷酸化信号。

24.如权利要求23所述的腺病毒载体，其中所述多腺苷酸化信号是腺病毒L2多腺苷酸化信号或异源多腺苷酸化信号。

25.如权利要求16所述的腺病毒载体，其中嵌合腺病毒前导区依次包含Mu CDS、内部核糖体进入位点、转基因CDS和多腺苷酸化信号。

26.如权利要求25所述的腺病毒载体，其中所述多腺苷酸化信号是腺病毒L2多腺苷酸化信号或异源多腺苷酸化信号。

27.如权利要求1所述的腺病毒载体，其中嵌合腺病毒前导区的天然部分来自L3腺病毒前导区。

28.如权利要求27所述的腺病毒载体，其中嵌合腺病毒前导区依次包含23K CDS、剪接受体位点、转基因CDS和多腺苷酸化信号。

29.如权利要求28所述的腺病毒载体，其中所述多腺苷酸化信号是腺病毒L3多腺苷酸化信号或异源多腺苷酸化信号。

30.如权利要求29所述的腺病毒载体，其中所述转基因CDS编码人肿瘤坏死因子相关凋亡诱导配体蛋白。

31.如权利要求27所述的腺病毒载体，其中嵌合腺病毒前导区依次包含六邻体CDS、第一剪接受体位点、转基因CDS、第二剪接受体位点和23K CDS。

32.如权利要求31所述的腺病毒载体，其中所述第一剪接受体位点是内源腺病毒剪接位点，所述第二剪接受体位点是异源剪接位点。

33.如权利要求31所述的腺病毒载体，其中所述第一剪接受体位点是异源剪接位点，所述第二剪接受体位点是内源腺病毒剪接位点。

34.如权利要求27所述的腺病毒载体，其中嵌合腺病毒前导区依次包含23K CDS、内部核糖体进入位点、转基因CDS和多腺苷酸化信号。

35.如权利要求35所述的腺病毒载体，其中所述转基因编码人肿瘤坏死因子相关凋亡诱导配体蛋白。

36.一种包含转基因编码序列(CDS)的腺病毒载体，其中由嵌合腺病毒前导区表达所述转基因CDS，其中嵌合腺病毒前导区的天然部分来自L5区，嵌合腺病毒区依次包含第一剪接受体位点、转基因CDS、第二剪接受体位点、尾丝CDS和多腺苷酸化信号。

37.如权利要求36所述的腺病毒载体，其中所述第一剪接受体位点是内源腺病毒剪接位点，所述第二剪接受体位点是异源剪接位点。

38.如权利要求36所述的腺病毒载体，其中所述第一剪接受体位点是异源剪接位点，所述第二剪接受体位点是内源腺病毒剪接位点。

39.一种包含转基因编码序列(CDS)的腺病毒载体，其中由嵌合腺病毒前导区表达所述转基因CDS，其中嵌合腺病毒前导区的天然部分来自L5区，嵌合腺病毒区依次包含第一剪接受体位点、尾丝CDS、第二剪接受体位点、转基因CDS和多腺苷酸化信号。

40.如权利要求39所述的腺病毒载体，其中所述第一剪接受体位点是内源腺病毒剪接位点，所述第二剪接受体位点是异源剪接位点。

41.如权利要求39所述的腺病毒载体，其中所述第一剪接受体位点是异源剪接位点，以及所述第二剪接受体位点是内源腺病毒剪接位点。

42.如权利要求39所述的腺病毒载体，其中所述多腺苷酸化信号是L5多腺苷酸化信号。