新型DNA聚合酶
技术领域
本发明涉及作为遗传工程用试剂有用的DNA聚合酶及其制造方法,以及编码该酶的基因。
技术背景
DNA聚合酶是作为遗传工程用试剂有用的酶,并被广泛用于DNA碱基序列测定、标记、位点特异性诱变等方法。而且,由于近来聚合酶链反应(PCR)方法的发展,耐热DNA聚合酶引起了人们的注意。已经有多种适用于PCR方法的DNA聚合酶得到了发展并获得了商业化。
现在已知的DNA聚合酶根据核苷酸序列的同源性可大体上分为4个家族,其中家族A(pol I型酶)和家族B(α型酶)占大多数。虽然属于各家族的DNA聚合酶一般具有相似的生物化学特征,但详细的比较显示,每种酶在底物特异性、底物类似物的整合、引物延伸性的强度和速度、DNA合成的模式、外切核酸酶活性的伴随、温度、pH等最适反应条件、以及对抑制剂的敏感性等方面都有独特的性质。因此,在相应的实验操作中应在各种现有的DNA聚合酶中选用具有最适性质的DNA聚合酶。
发明公开
本发明的目的是提供不属于上述家族的、且具有现有DNA聚合酶没有的生物化学特性的新型DNA聚合酶。例如,引物延伸活性与3’→5’外切核酸酶活性被认为是相反的特性,现存的DNA聚合酶中具备强的引物延伸活性的酶不具有对合成忠实性起重要校正功能作用的3’→5’外切核酸酶活性。同时校正功能优秀的酶的引物延伸活性弱。因此,开发具有强的3’→5’外切核酸酶活性并且引物延伸活性也很强的DNA聚合酶,对试管内DNA合成是很有意义的。
本发明的另一目的是提供上述新型DNA聚合酶的制造方法。
本发明的另一目的是提供编码本发明的DNA聚合酶的基因。
发明人锐意研究的结果是,在极端嗜热性古细菌激烈热球菌(Pyrococcus furiosus)中发现了新型DNA聚合酶的基因,在克隆之后,弄清楚了只有两种新型蛋白质同时存在时,其新型DNA聚合酶活性才能显示。而且,本发明还制备了导入了上述基因的转化子,并成功地大量生产了这种复合型DNA聚合酶,至此本发明完成。
即,本发明的要点涉及:
(1)具有下列特性的DNA聚合酶:
①在以单链模板DNA与引物退火形成的复合物为底物时,测定的聚合酶活性比以活化的DNA为底物时显示的活性高。
②具有3’→5’外切核酸酶活性。
③在按下述条件以λ-DNA为模板进行聚合酶链反应(PCR)时,能够扩增约20千碱基对的DNA片段。
PCR的条件:
(a)反应液组成:含10mM Tris-盐酸(pH9.2)、3.5mM MgCl2、75mM KCl、400μM dATP、dCTP、dGTP、dTTP、0.01%小牛血清白蛋白、0.1%Triton X-100、5.0ng/50μlλ-DNA、10pmol/50μl引物λ1(序列表的序列号8)、以及引物λ11(序列表的序列号9)、3.7单位/50μl DNA聚合酶。
(b)反应条件:以每循环98℃、10秒~68℃、10分钟进行30个循环的PCR反应。
(2)前面(1)记载的DNA聚合酶,其特征为与Taq DNA聚合酶相比,在DNA合成时的错误频率低;
(3)前面(1)或(2)记载的DNA聚合酶,用凝胶过滤法测得的分子量为约220千道尔顿或约385千道尔顿;
(4)前面(1)~(3)记载的任何DNA聚合酶,其特征为在两种DNA聚合酶组成蛋白(第1种DNA聚合酶组成蛋白和第2种DNA聚合酶组成蛋白)共存时能显示活性;
(5)前面(4)记载的DNA聚合酶,其特征是,第1种DNA聚合酶组成蛋白和第2种DNA聚合酶组成蛋白用SDS-PAGE测得的分子量分别为约90,000道尔顿和约140,000道尔顿;
(6)前面(4)或(5)中记载的DNA聚合酶,其特征为,构成前面(4)或(5)中记载的DNA聚合酶的第1种DNA聚合酶组成蛋白包括序列表的序列号1中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物;
(7)前面(4)或(5)中记载的DNA聚合酶,其特征为,构成前面(4)或(5)中记载的DNA聚合酶的第2种DNA聚合酶组成蛋白包括序列表的序列号3中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物;
(8)前面(4)或(5)中记载的DNA聚合酶,其特征为,构成前面(4)或(5)中记载的DNA聚合酶的第1种DNA聚合酶组成蛋白包括序列表的序列号1中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物;构成前面(4)或(5)中记载的DNA聚合酶的第2种DNA聚合酶组成蛋白包括序列表的序列号3中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物;
(9)构成前面(4)或(5)中记载的DNA聚合酶的第1种DNA聚合酶组成蛋白,包括序列表的序列号1中所示的氨基酸序列,或包括在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换且具有基本相同的活性的功能等价物的氨基酸序列;
(10)构成前面(4)或(5)中记载的DNA聚合酶的第2种DNA聚合酶组成蛋白,包括序列表的序列号3中所示的氨基酸序列,或包括在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换且具有基本相同的活性的功能等价物的氨基酸序列;
(11)含有编码前面(9)中记载的第1种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有编码序列表的序列号1中所示的氨基酸序列的碱基序列的全部或一部分,或者编码含有在序列号1的氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换的氨基酸序列且具有第1种DNA聚合酶组成蛋白的功能的蛋白质;
(12)含有编码前面(9)中记载的第1种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有序列表的序列号2中所示的碱基序列的全部或一部分,或者含有在严格条件下能与该序列杂交的碱基序列;
(13)含有编码前面(10)中记载的第2种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有编码序列表的序列号3中所示的氨基酸序列的碱基序列的全部或一部分,或者编码含有在序列号3的氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换的氨基酸序列且具有第2种DNA聚合酶组成蛋白的功能的蛋白质;
(14)含有编码前面(10)中记载的第2种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有序列表的序列号4中所示的碱基序列的全部或一部分,或者含有在严格条件下能与该序列杂交的碱基序列;
(15)DNA聚合酶的制造方法,其特征为,培养含有编码前面(11)或(12)中记载的第1种DNA聚合酶组成蛋白的基因和编码前面(13)或(14)中记载的第2种DNA聚合酶组成蛋白的基因两者的转化子,从该培养物中收集DNA聚合酶;和
(16)DNA聚合酶的制造方法,其特征为分别培养含有编码前面(11)或(12)中记载的第1种DNA聚合酶组成蛋白的基因的转化子和含有编码前面(13)或(14)中记载的第2种DNA聚合酶组成蛋白的转化子,混合培养物中所含的DNA组成蛋白,收集DNA聚合酶。
附图简述
图1是实施例1中获得的粘粒克隆No.264和粘粒克隆No.491中插入的DNA片段的限制酶切图谱。
图2是质粒pFU1001中插入的XbaI-XbaI DNA片段的限制酶切图谱。
图3是本发明的DNA聚合酶的最适pH的示意图。
图4是本发明的DNA聚合酶的热稳定性示意图。
图5是本发明的DNA聚合酶的3’→5’外切核酸酶活性的示意图。
图6是本发明的DNA聚合酶的引物延伸活性的放射性自显影图。
发明的优选实施方案
(1)本发明的DNA聚合酶及其组成蛋白
本发明的DNA聚合酶的一个例子具有以下性质:
①在以单链模板与引物退火形成的复合物为底物时测定的聚合酶活性,比以活化的DNA(DNase I处理的小牛胸腺DNA)作模板时显示的聚合酶活性高。
②具有3’→5’外切核酸酶活性。
③最适pH:6.5-7.0(磷酸钾缓冲液中、75℃)。
④80℃、30分钟热处理后能显示80%的残存活性。
⑤并且,在以λ-DNA为模板进行聚合酶链反应(PCR)时,能够扩增约20千碱基对的DNA片段而不需要添加其他的酶。PCR的条件如下:
(a)反应液组成:含10mM Tris-盐酸(pH9.2)、3.5mM MgCl2、75mM KCl、400μM dATP、dCTP、dGTP、dTTP、0.01%小牛血清白蛋白(BSA)、0.1%Triton X-100、5.0ng/50μlλ-DNA、10pmol/50μl引物λ1(序列表的序列号8)、以及引物λ11(序列表的序列号9)、3.7单位/50μl DNA聚合酶。在这里,DNA聚合酶的1个单位按如下方法确定。制备50μl含有待测定活性样品的反应液[20mM Tris-盐酸(pH7.7)、15mM MgCl2、2mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP、60nM[3H]dTTP(Amersham公司生产)],在75℃反应15分钟。将此反应液40μl点于DE滤纸(Whatman公司生产),用5%Na2HPO4洗涤5次,然后用液闪计数器测定DE滤纸上残留的放射活性,在30分钟内将10nmol的[3H]dTMP掺入底物DNA的酶量定义为1个单位。
(b)反应条件:以每循环98℃、10秒~68℃、10分钟进行30个循环的PCR反应。
⑥本发明的DNA聚合酶在引物延伸活性、DNA合成的正确性两方面与Taq DNA聚合酶比较都更优秀。即,本发明的DNA聚合酶的DNA合成反应的延伸活性,例如在PCR反应中被扩增DNA的链长,和反应的正确性(DNA合成时错误频率低)与作为耐热性DNA聚合酶代表的Taq DNA聚合酶(例如宝酒造社生产的TaKaRa Taq)相比都更为优秀。
本发明的DNA聚合酶的分子量用凝胶过滤法测定约为220千道尔顿或约385千道尔顿,在SDS-PAGE上显示的是与约90,000道尔顿和约140,000道尔顿相当的两条带,它是由两种蛋白质组成的酶。在本发明中,约90,000道尔顿的蛋白质(相当于下文的0RF3)被称为第1种DNA聚合酶组成蛋白,约140,000道尔顿的蛋白质(相当于下文的ORF4)被称为第2种DNA聚合酶组成蛋白。经过推定,本发明的DNA聚合酶是由第1种DNA聚合酶组成蛋白与第2种DNA聚合酶组成蛋白以1∶1或1∶2的摩尔比通过非共价结合形成的复合体。
构成本发明的DNA聚合酶的第1种DNA聚合酶组成蛋白包括序列表的序列号1中所示的氨基酸序列,或也可以是具有与其基本相同活性的功能等价物,而第2种DNA聚合酶组成蛋白含有序列表的序列号3中所示的氨基酸序列,或也可以是具有与其基本相同活性的功能等价物。
在本说明书中记载的“功能等价物”的含义如下。除了天然存在的蛋白质的编码基因的多形性及变异之外,生成的蛋白质因在体内或纯化中的修饰反应等可在氨基酸序列中引起氨基酸的缺失、插入、附加、置换等变异,但已知某些蛋白质能显示与没有变异的蛋白质基本上相同的生理活性和生物学活性。这种在构造上有差异但在功能和活性上没有发现大的差异的蛋白质就被称为功能等价物。在这里,只要基本上能显示同等的生理学和生物学活性,变异氨基酸的数目没有特别的限制。具体的例子为1个以上,如1个或几个,更具体为1个至约10个变异(缺失、插入、附加、置换等)。
人为地在蛋白质的氨基酸序列中引入上述变异时也一样,在这种情况下,可以制备各种各样的变异体。例如,虽然在大肠杆菌中表达的蛋白质的N末端存在的甲硫氨酸残基在多数情况下用甲硫氨酸氨肽酶来去除。但这种去除是否完全取决于蛋白质的种类,带有或不带有甲硫氨酸的蛋白质两者都可能生成。尽管如此,在大多数情况下,甲硫氨酸残基的有无并不影响蛋白的活性。而且,已经知道白细胞介素2(IL-2)的氨基酸序列中的特定半胱氨酸残基被丝氨酸置换时,仍能保持白细胞介素2的活性[《科学》(Science),第224卷,1431页(1984)]。
此外,在用遗传工程方法进行蛋白质的生产时,常以融合蛋白的形式来进行表达。例如,为了增加目的蛋白的表达量,在目的蛋白的N末端附加来自其他蛋白质N末端的肽链,或在N未端或C末端附加适当的肽链,表达该蛋白,通过使用与此类肽链有亲和性的载体来使目的蛋白的纯化更加容易进行。因此,与本发明的DNA聚合酶有部分氨基酸的差异的DNA聚合酶,只要能显示与本发明的DNA聚合酶基本上相同的活性,该酶作为“功能等价物”也属于本发明的范围内。(2)本发明的DNA聚合酶的基因
编码构成本发明的DNA聚合酶的第1种DNA聚合酶组成蛋白的DNA,可举出含有编码序列表的序列号1中所示氨基酸序列的碱基序列的全部或一部分的DNA,例如,含有序列表的序列号2中所示的碱基序列的全部或一部分的DNA。即,含有编码序列号1中所示氨基酸序列的碱基序列的一部分的DNA,例如,含有序列表的序列号2中所示碱基序列的一部分的DNA,编码具有第1种DNA聚合酶组成蛋白的功能的蛋白质的碱基序列,也在本发明的范围内。并且,还可举出编码包括在序列号1的氨基酸序列中有一个以上如1个或几个氨基酸缺失、插入、附加或置换的氨基酸序列、并具有第1种DNA聚合酶组成蛋白功能的蛋白质的DNA。并且,能与上述序列在严格条件下杂交、并编码具有第1种DNA聚合酶组成蛋白功能的蛋白质的碱基序列,也在本发明的范围内。另外,编码本发明的DNA聚合酶的第2种DNA聚合酶组成蛋白的DNA,可举出含有编码序列表的序列号3中所示氨基酸序列的碱基序列的全部或一部分的DNA,例如,含有序列表的序列号4中所示的碱基序列的全部或一部分的DNA。即,含有编码序列号3中所示氨基酸序列的碱基序列的一部分的DNA,例如,含有序列表的序列号4中所示的碱基序列的一部分的DNA,编码具有第2种DNA聚合酶组成蛋白的功能的蛋白质的碱基序列,也在本发明的范围内。并且,还可举出编码包括在序列号3的氨基酸序列中有一个以上如1个或几个氨基酸缺失、插入、附加或置换的氨基酸序列、并具有第2种DNA聚合酶组成蛋白的功能的蛋白质的DNA。并且,能与上述序列在严格条件下杂交、并编码具有第2种DNA聚合酶组成蛋白功能的蛋白质的碱基序列,也在本发明的范围内。
在这里,“具有第1种DNA聚合酶组成蛋白的功能的蛋白质”或“具有第2种DNA聚合酶组成蛋白的功能的蛋白质”是指这两种蛋白质共存时,能够提供具有前面①~⑥中所示各种理化性质的DNA聚合酶活性。
在这里,“能在严格条件下杂交”是指在含有0.5%SDS、0.1%小牛血清白蛋白(BSA)、0.1%聚乙烯吡咯烷酮、0.1%Ficol 400、0.01%变性鲑精DNA的6×SSC(1×SSC表示0.15M NaCl、0.0015M柠檬酸钠、pH7.0)中与探针在50℃保温12-20小时后,与探针杂交。
在此对本说明书中记载的“含有编码氨基酸序列的碱基序列的DNA”这一用语进行如下说明:已知在基因上指导氨基酸的密码子(3碱基组合)依氨基酸的种类存在1-6种。因此编码氨基酸的DNA根据氨基酸序列可有多种存在方式。在自然界中,基因并不一定稳定存在,基因的碱基序列上发生变异并不少见,有时基因上碱基序列的变异并不引起所编码氨基酸序列的变异(称为无声突变)。在这种情况下,产生了编码相同氨基酸序列的不同基因。因此,即使在已经分离了的编码特定氨基酸序列的基因上,在经过含有此基因的生物传代后,也不能否定编码相同氨基酸的多种基因的可能性。
而且,采用各种遗传工程的方法人工制备编码相同氨基酸的多种基因也不困难。例如,用遗传工程方法生产蛋白质时,编码目的蛋白质的原始基因上使用的密码子在宿主中的使用频率很低,此时蛋白质的表达量也低。在这种情况下,在不引起所编码的氨基酸序列变化的前提下,人工用宿主高频率使用的密码子进行变换,能使目的蛋白高表达(例如,特公平7-102146号公报)。因此人工制备编码特定氨基酸序列的多种基因是可能的,在自然界中也能生成。因此含有与本发明公开的碱基序列相同的碱基序列的基因,以及编码本发明公开的氨基酸序列的基因都包括在本发明中。(3)本发明的DNA聚合酶的制造方法
发明人从极端嗜热性古细菌激烈热球菌中发现了新型DNA聚合酶的基因,通过克隆,清楚了该基因编码新型DNA聚合酶,该基因上的两种蛋白质在共存时能显示活性。可以通过制备导入了这种基因的转化子来大量生产本发明的DNA聚合酶。在这种情况下,可以通过培养含有前面的编码第1种DNA聚合酶组成蛋白的基因和编码第2种DNA聚合酶组成蛋白的基因两者的转化子,从培养物中收集DNA聚合酶的方法来进行。也可以通过分别培养含有编码第1种DNA聚合酶组成蛋白的基因的转化子和含有编码第2种DNA聚合酶组成蛋白的基因的转化子,然后将培养物中所含的DNA聚合酶组成蛋白混合,然后收集DNA聚合酶的方法来进行。
在这里,“含有编码第1种DNA聚合酶组成蛋白的基因和第2种DNA聚合酶组成蛋白的基因两者的转化子”,可以是分别含有相应基因的两种表达载体同时转化而来的转化子,或者是通过将两种基因重组到能分别表达各自蛋白的一个表达载体上而制备的转化子。(4)下面详细说明本发明的DNA聚合酶基因的克隆、所获克隆的分析、表达产物DNA聚合酶的理化性质、活性、对PCR方法的适用性。
本发明使用的菌株没有特别的限制,例如属于热球菌属的激烈热球菌(pyrococcus furiosis)DSM3628,该菌株可由DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH获得。发明人在适当的增殖培养基上培养该菌株,制备培养物的粗抽提物,进行聚丙烯酰胺凝胶电泳时,发现凝胶内存在多条能显示DNA聚合酶活性的蛋白质带,推测也存在各自对应的基因。即,新型DNA聚合酶基因及其产物可按如下举例程序进行克隆。①从激烈热球菌中抽提DNA。②用适当的限制酶消化①的DNA,用质粒、粘粒等作载体制备DNA文库。③将②中制备的文库导入大肠杆菌,外源基因表达后,收集各克隆的粗抽提物制备蛋白文库。④使用③中制备的蛋白文库测定DNA聚合酶活性,从粗抽提物中有活性的大肠杆菌克隆中提取外源DNA。⑤分析提取的质粒或粘粒中所含的激烈热球菌DNA片段,缩小能编码显示DNA聚合酶活性的蛋白质的区域。⑥确定预计编码能显示DNA聚合酶活性的蛋白质的区域,推导蛋白质的一级结构。⑦构建便于在大肠杆菌中表达⑥中推导的蛋白质的表达载体,纯化所产生的蛋白质,并分析其特性。
上述DNA供体激烈热球菌DSM3638是一种极端嗜热性古细菌,将此细菌在95℃厌氧培养。破碎增殖的菌体后抽提、纯化DNA的方法和用限制酶将所获得的DNA切断的方法等都可采用众所周知的方法。这些方法详见1982年冷泉港实验室出版、T.Maniatis等著《分子克隆实验指南》(Molecular Coning,A Laboratory Manual)第75-178页中的记载。
制备DNA文库时,可以使用例如三股螺旋粘粒载体(Stratagene公司生产)。激烈热球菌的DNA用Sau 3AI(宝酒造社生产)部分消化,密度梯度离心所获得的长链DNA片段,与上述载体的BamHI位点连接,然后体外包装。将用此方法制备的DNA文库所获得的转化子分别培养,收集菌体,然后超声波处理以破碎菌体,进行热处理使大肠杆菌含有的DNA聚合酶失活。用离心法可以获得含有耐热性DNA聚合酶的上清。该上清即命名为粘粒蛋白文库。用部分上清测定DNA聚合酶活性,可以获得能表达来自激烈热球菌的DNA聚合酶的克隆。DNA聚合酶活性的测定方法可以采用众所周知的方法,该方法在Harparand Row公司出版、D.R.Davis编辑的《大肠杆菌的DNA聚合酶》(DNApolymerase from Escherichia coli)第263-276页(C.C.Richardson著)中记载。
发明人已经克隆了一种激烈热球菌的DNA聚合酶基因,并清楚了其结构,见《核酸研究》(Nucleic Acids Research)第21卷259-265页(1993)中记载。该基因的翻译产物由775个氨基酸组成,是分子量为90,000道尔顿的多肽,该氨基酸序列明显含有α-型DNA聚合酶的保守序列。实际上,该基因产物所显示的DNA聚合酶活性可被α-型DNA聚合酶的特异性抑制剂蚜栖菌素(aphidi colin)抑制,与本发明的DNA聚合酶不一样。因此,需从所获得的显示耐热性DNA聚合酶活性的克隆中将上述已经存在的基因除去,这可通过消化含有各克隆的粘粒,以上述基因作探针进行杂交,选择不能杂交的克隆来进行。对含有所获得的新型DNA聚合酶基因克隆的消化粘粒中的DNA插入片段作限制酶切图谱。下一步,将插入DNA片段按限制酶切图谱切成各种区域,分别在质粒中亚克隆,导入大肠杆菌后测定所表达的耐热性DNA聚合酶的活性,从而确定该DNA片段聚合酶基因的位置。通过这种方法能够获得含有DNA聚合酶基因的约10千碱基对的XbaI-XbaI DNA片段。
含有整合了该DNA片段的质粒的重组大肠杆菌,其抽提物经90℃、20分钟热处理后仍有足够的DNA合成活性,而没有整合该DNA片段的质粒则没有此活性。因此结论是,在该DNA片段上存在产生耐热性DNA聚合酶的信息,且在大肠杆菌中带有该信息的基因能够表达。该DNA片段整合进载体pTV118N(宝酒造社生产)所得到的质粒被命名为pFU1001,用该质粒转化的大肠杆菌JM109被命名为Escherichia coli JM109/pFU1001。该菌已在1995年8月11日(原始保藏日)按照布达佩斯条约,在日本茨城县つくぼ市东一丁目1番3号(邮编305)的通产省工业技术院生命工学工业技术研究所,以保藏号FERM BP-5579进行了保藏。
质粒pFU1001中所插入的DNA片段的碱基序列,可以用常规方法,例如双脱氧法来测定。并且,通过分析所获得的碱基序列,就可以推导出该碱基序列中编码蛋白质的区域-开放阅读框(ORF)。
质粒pFU1001中所插入的约10千碱基对的XbaI-XbaI DNA片段中8450碱基对的序列在序列表的序列号5中表示。在该碱基序列中存在6个连续的ORF,自5’端依次被命名为ORF1、ORF2、ORF3、ORF4、ORF5、ORF6。图2显示了上述XbaI-XbaI片段的限制酶切图谱,以及在该片段上存在的ORF的位置(自图中左侧,ORF1-ORF6)。
上述6个ORF中没有与已知DNA聚合酶显示同源的序列。但是在ORF1和ORF2中存在与啤酒酵母(Saccharomyces cerevisiae)中发现的CDC6蛋白或粟酒裂殖酵母(Schizosaccharomyces pombe)中发现的CDC18蛋白质同源的序列。CDC6、CDC18据推测是酵母菌在向细胞周期的DNA合成期(S期)转变过程中必要的蛋白质,这两种蛋白质调节DNA复制的起始。而ORF6含有与已知在酵母DNA损伤修复及体细胞分裂期和减数分裂期的重组过程中起作用的RAD51蛋白质及其在减数分裂期中的特异性同源物Dmc1蛋白质同源的序列。已知编码RAD51蛋白质的基因在细胞周期由G1向S期转变时也被诱导表达。对于其他ORF,即ORF3、ORF4、ORF5,没有发现与已知蛋白质有同源性的序列。
可以通过将缺失各区域的DNA片段插入来制备重组质粒,测定用这种质粒转化获得的转化子的耐热聚合酶活性,来调查耐热性DNA聚合酶的活性来自上述哪个ORF。用插入了由上述约10千碱基对的XbaI-XbaI DNA片段中缺失了ORF1、ORF2或ORF5、ORF6的重组质粒转化的转化子,保持了耐热性DNA聚合酶活性,而缺失了ORF3或ORF4则活性丧失。由此可以预测ORF3或ORF4编码DNA聚合酶活性。
ORF3、ORF4究竟哪一个编码DNA聚合酶活性,可以通过将各ORF分别插入来制备重组质粒。然后调查所获得的转化子中的耐热性DNA聚合酶活性的表达来进行调查。令人意外的是,单独含有ORF3或ORF4的转化子获得的粗抽提物中仅检测到极弱的DNA聚合酶活性。而在将两种抽提物混合时,可以得到与含有ORF3、ORF4两者的转化子同样的耐热性DNA聚合酶活性,因此这显示,本发明的新型DNA聚合酶必须有这两种ORF的翻译产物起作用。是这两种蛋白质形成复合体后显示DNA聚合酶活性,还是其中一方修饰另一方转变成有活性的酶,可以通过测定DNA聚合酶的分子量来了解。用凝胶过滤法测定该DNA聚合酶分子量的结果表明,上述两种蛋白质形成复合体。
序列表的序列编号2中显示ORF3的碱基序列,序列编号1中显示由该碱基序列推导的ORF3的翻译产物,即第1种DNA聚合酶组成蛋白的氨基酸序列。而序列表的序列编号4中显示ORF4的碱基序列,序列编号3中显示由该碱基序列推导的ORF4的翻译产物,即第2种DNA聚合酶组成蛋白的氨基酸序列。
本发明的DNA聚合酶可以在常规的培养条件下,例如含有100μg/ml氨苄青霉素的LB培养基(蛋白胨10g/升、酵母抽提物5g/升、NaCl 5g/升、pH7.2)中,培养用整合了ORF3及ORF4的重组质粒转化的转化子,如大肠杆菌JM109/pFU1001,来在菌体进行表达。该聚合酶可以从上述培养的菌体中,采用诸如超声波处理、热处理、以及用阴离子交换柱(RESOURCE Q柱,Pharmacia)、HeparinSepharose柱(HiTrap Heparin,Pharmacia公司生产)、凝胶过滤柱(Superose 6HR,Pharmacia公司生产)等进行色谱,纯化至在SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)上基本上显示两种DNA聚合酶组成蛋白的两条带。而且,也可将单独含有ORF3、ORF4的转化子分别培养后,获得培养菌体,混合其抽提物、或纯化的DNA聚合酶组成蛋白来获得目的DNA聚合酶。在混合两种DNA聚合酶组成蛋白时,不需要特别的操作。可以将相应的两种转化子的抽提物或由其纯化而来的两种蛋白质简单地以适当量混合来获得有活性的DNA聚合酶。
由此获得的本发明的DNA聚合酶在SDS-PAGE上显示与约90,000道尔顿、约140,000道尔顿相当的两条带,分别与第1及第2种DNA聚合酶组成蛋白相对应。
如图3所示,本发明的DNA聚合酶在磷酸钾缓冲液中、75℃时,显示最适pH在pH6.5-7.0附近。而且在不同的温度测定该酶的酶活时,该酶在75-85℃显示最高活性,但由于在高温时,用作活性测定底物的活化DNA的双链结构会被破坏,该酶活性的准确最适温度没有测定。该DNA聚合酶有高热稳定性,图4显示在经过80℃、30分钟的热处理后,仍保持80%以上的残存活性。这种热稳定性使该酶能用于PCR方法。而且,在调查已知的α型聚合酶的特异性抑制剂蚜栖菌素(aphidicolin)的影响时,该DNA聚合酶的活性在2mM蚜栖菌素存在下仍不被抑制。
分析纯化的DNA聚合酶的生物化学活性特性的结果为,本发明的DNA聚合酶在试管内有非常优秀的引物延伸活性,如表1所示,在用引物与单链DNA退火形成的底物(M13-HT引物)测定DNA聚合酶的活性时,能获得比通常活性测定所用的活化DNA(DNAaseI处理的小牛胸腺DNA)高的核苷酸掺入活性。与使用上述M13-HT引物底物的其他DNA聚合酶的引物延伸能力进行比较,本发明的DNA聚合酶能显示与已知的来自激烈热球菌的DNA聚合酶(Pfu DNA聚合酶,Stratagene生产)和来自水生栖热菌(Thermus aquaticus)的TaqDNA聚合酶(TaKaRa Taq,宝酒造社生产)相比更优的延伸活性。更进一步,在反应体系中加入活化DNA作为竞争底物时,上述2种DNA聚合酶的引物延伸活性被强烈抑制,而本发明的DNA聚合酶只被轻微抑制,这表明该酶对引物延伸型底物具有高亲和性(图6)。
表1
底物 |
相对活性 |
本发明的DNA聚合酶 |
PfuDNA聚合酶 |
TaqDNA聚合酶 |
活化DNA |
100 |
100 |
100 |
热变性DNA |
340 |
87 |
130 |
M13-HT引物 |
170 |
23 |
90 |
M13-RNA引物 |
52 |
0.49 |
38 |
poly dA-Oligo dT |
94 |
390 |
290 |
poly A-Oligo dT |
0.085 |
-- |
0.063 |
而且,本发明的DNA聚合酶在用于PCR方法时,能显示极优的性能。PCR方法中频繁使用的、来自水生栖热菌的DNA聚合酶在单独使用时,扩增10千碱基对以上的DNA片段非常困难,在与其他DNA聚合酶组合使用时,也难以扩增20千碱基对以上的DNA片段《美国国家科学院院报》(Proceeding of the National Academy of Sciencesof the USA,第91卷,第2216-2220页(1994))。而且,据报道,使用Pfu DNA聚合酶所能扩增的DNA链长最大为3千碱基对左右。在使用本发明的DNA聚合酶时,在不添加其他酶的情况下,能够单独扩增20千碱基对的DNA片段。
而且,本发明的DNA聚合酶还伴随有3’→5’外切核酸酶活性,相对于DNA聚合酶活性,外切核酸酶活性很强,已知这种活性强因而DNA合成的准确性非常高,在这点上,本发明的DNA聚合酶能与PfuDNA聚合酶的活性相媲美(图5)。而且,经测定本发明的DNA聚合酶在DNA合成反应中引起的误差频率比Taq DNA聚合酶低。上述各种性质显示,本发明的DNA聚合酶作为PCR方法等遗传工程用试剂非常优秀。
而且,本发明的新型DNA聚合酶基因的发现还提供了更有趣的知识。发明人为了了解含有编码新型DNA聚合酶的ORF3、4的基因的区域在细胞内是怎样转录的,用Northern印迹法、RT PCR法以及引物延伸法对由激烈热球菌中制备的RNA部份进行了分析,结果证明,ORF1-ORF6以一条信使RNA(mRNA)从紧接ORF1的上游开始转录。由此可以设想ORF1和ORF2在细胞内的产生与ORF3、4受到同样的控制,同时考虑到ORF1、2、5、6与同酵母的DNA复制起始调节有关的CDC6、CDC18有序列上的同源性,本发明的新型DNA聚合酶很可能是DNA复制过程中重要的DNA聚合酶。而且激烈热球菌属于古细菌,据推测古细菌的DNA复制系统与真核生物非常接近,由此可以预测在真核生物中存在还没有被发现的、与本发明的DNA聚合酶类似的重要的DNA聚合酶。
而且,还可以预期与本发明的DNA聚合酶类似的耐热性DNA聚合酶,可在与激烈热球菌同属于极端嗜热性古细菌的细菌中,例如除激烈热球菌以外属于热球菌属的细菌、热网菌属(Pyrodictium)、热球菌属(Thermococcus)、葡萄嗜热菌属(staphylothermus)等属的细菌内产生。当这些酶与本发明的DNA聚合酶一样由2种DNA聚合酶组成蛋白组成时,可以期待这些酶的一个DNA聚合酶组成蛋白与相当于另一个DNA聚合酶组成蛋白的本发明的DNA聚合酶组成蛋白组合,能够表现同样的DNA聚合酶活性。
可以期待上述极端嗜热性古细菌生产的、与本发明的DNA聚合酶相似的耐热性DNA聚合酶在有关氨基酸序列、及编码其的基因的碱基序列上,与本发明的DNA聚合酶的氨基酸序列、及编码其的基因的碱基序列之间存在同源性。因此,以本发明中分离的基因或其碱基序列的一部分做探针,用杂交的方法从上述嗜热性古细菌中获得DNA片段,将其导入适当的微生物,用前面记载的粘粒文库同样的方法制备热处理裂解液,用适当的方式检测其DNA聚合酶活性,就能够获得与本发明的DNA聚合酶的碱基序列不同,但具有同样酶活性,且与本发明的酶类似的耐热性DNA聚合酶的基因。
上述杂交可以按下列条件进行。即,固定了DNA的膜与探针在含有0.5%SDS、0.1%小牛血清白蛋白(BSA)、0.01%聚乙烯吡咯烷酮、0.1%Ficol 400、0.01%变性鲑精DNA的6×SSC(1×SSC表示0.15MNaCl、0.015M柠檬酸钠、pH7.0)中,50℃温育12-20小时。温育终止后,于含有0.05%SDS的2×SSC中、在37℃开始洗涤,将SSC的浓度变化至0.1×、温度变化至50℃,洗净至来源于固定DNA的信号与背景可以区别。
这样,以本发明中分离的基因或其碱基序列的一部分作引物,以由上述嗜热性古细菌中获得的DNA为模板进行基因扩增,将得到的片段或以该片段为探针进行杂交而从上述嗜热性古细菌中获得的片段导入适当的微生物,按与前面一样的方法检测DNA聚合酶活性,就能够获得与本发明的DNA聚合酶的活性不一样、但具有同一水平的、与本发明的酶类似的耐热性DNA聚合酶基因。
下面说明本发明的实施例,但本发明并不限于下面的实施例。而且,实施例中的%的意思是重量%。
实施例1(1)激烈热球菌基因组DNA的制备
激烈热球菌DSM3638的培养按下面的方法进行:
将组成为蛋白胨1%、酵母抽提物0.5%、可溶性淀粉1%、JarmarinS Solid(Jamarin实验室生产)3.5%、Jarmarin S Liquid(Jamarin实验室生产)0.5%、MgSO4 0.003%、NaCl 0.001%、FeSO4·7H2O 0.0001%、CoSO4 0.0001%、CaCl2·7H2O 0.0001%、ZnSO4 0.0001%、CuSO4·5H2O0.1ppm、KAl(SO4)2 0.1ppm、H3BO3 0.1ppm、NaMoO4·2H2O 0.1ppm、NiCl2·6H2O 0.25ppm的培养基装入2升的培养瓶中,120℃、20分钟灭菌,充入氮气以去除溶解氧后,接种上述细菌,在95℃静置培养16小时,培养后,离心收集菌体。
然后,在4ml含25%蔗糖的0.05M Tris-HCl(pH8.0)中悬浮收集的菌体,在悬浮液中加入0.8ml的溶菌酶[5mg/ml、0.25MTris-HCl(pH8.0)]和2ml的0.2M EDTA,在20℃保温1小时。然后加入24ml的SET溶液[150mM NaCl、1mM EDTA、20mMTris-HCl(pH8.0)],再加入5%的SDS 4ml和蛋白酶K(10mg/ml)400μl,37℃反应1小时。反应终止后,用酚氯仿抽提,接着用乙醇沉淀,制备了约3.2mg的基因组DNA。(2)粘粒蛋白文库的制备
激烈热球菌DSM3638的基因组DNA 400μg用Sau 3A1部分消化,用密度梯度离心分离成35-50kb大小的片段。接着,1μg的三股螺旋粘粒载体(Stratagene公司生产)用XbaI消化,然后用碱性磷酸酶(宝酒造社生产)去磷酸化,并用BamHI消化,与上面分级的30-50kb的DNA 140μg混合,进行连接,使用GIGAPACK GOLD(Stratagene公司生产)按体外包装法将激烈热球菌的基因组DNA片段包装入λ噬菌体颗粒中,制备文库。接着,将所得到的文库的一部分转入大肠杆菌DH5αMCR中。选择几个获得的转化子制备粘粒DNA,在证明有适当大小的插入片段后,另从上述文库中选择500个转化子,分别接种在150ml含有100μg/ml氨苄青霉素的LB培养基(蛋白胨10g/升、酵母抽提物5g/升、NaCl 5g/升、pH7.2)中培养。将该培养物离心,收集的菌体悬浮于1ml的20mM Tris-HClpH8.0中,在100℃热处理10分钟。接着进行超声波处理,然后再次在100℃热处理10分钟。离心后的上清即获得的裂解物作为粘粒的蛋白文库。(3)DNA聚合酶活性的测定
DNA聚合酶活性测定用DNAaseI处理而活化的小牛胸腺DNA(Worthington生产)(活化DNA)作底物。DNA的活化和DNA聚合酶活性的测定按Harpar and Row公司出版、D.R.Davis编辑的《大肠杆菌的DNA聚合酶》(DNA polymerase from Escherichia coli)第263-276页(C.C.Richardson著)中记载的方法进行。
酶活性的测定按下面的方法进行。即,制备50μl含有待测定活性样品的反应液[20mM Tris-盐酸(pH7.7)、15mM MgCl2、2mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP、60nM[3H]dTTP(Amersham公司生产)],在75℃反应15分钟。将此反应液40μl点于DE滤纸(Whatman公司生产),用5%Na2HPO4洗涤5次,然后用液闪计数器测定DE滤纸上残留的放射活性。按上述酶活性测定方法,在30分钟内将10nmol的[3H]dTMP掺入底物DNA的酶量定义为1个单位。(4)含有DNA聚合酶基因的粘粒文库的选择
制备含有20mM Tris-盐酸(pH7.7)、2mM MgCl2、2mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP、60nM[3H]dTTP(Amersham公司生产)的反应液,在45μl此反应液中加入分别来自粘粒文库的5个克隆的抽提物各1μl,即每个反应加入5μl,在75℃反应15分钟后。分别在DE滤纸(Whatman公司生产)点样40μl,用5%Na2HPO4洗涤5次,然后用液闪计数器测定DE滤纸上残留的放射活性。在第一次检测中被确认含有活性的含有5个克隆的一组,接着将5个克隆分成单个克隆进行第二次检测。粘粒文库中含有已知的DNA聚合酶的克隆,这是以该基因为探针进行杂交而推测的,它们分别为克隆No.57、154、162、363。除此之外,还发现5个克隆No.41、153、264、462、491含有DNA合成活性。(5)限制酶切图谱的制备
从上述5个克隆中分离粘粒,分别用BamHI消化,检测电泳图谱,发现几条相同的带。预计5个克隆整合有重叠和轻微错动的区域。因而制作克隆No.264和491的插入DNA片段的限制酶切图谱。从两个克隆制备的粘粒用各种限制酶消化的结果是,KpnI、NotI、PstI、SmaI、XbaI、XhoI(均为宝酒造社生产)都能切出适当大小的片段,其相应的酶切位点确定的结果就获得了图1所示的图谱。(6)DNA聚合酶基因的亚克隆
在图1所示的限制酶切图谱的基础上,由来自克隆264或491的粘粒切下10千碱基对左右的各种DNA片段,亚克隆到pTV118N或pTV119N载体(宝酒造社生产)。对来自所获重组质粒的转化子检测耐热性DNA聚合酶活性的结果,证明约10千碱基对的XbaI-XbaI片段上有能产生强耐热性DNA聚合酶的基因。重组了该XbaI-XbaI片段的pTV118N载体被命名为pFU1001,用该质粒转化的大肠杆菌JM109被命名为Escherichia coli JM109/pFU1001。
实施例2含有新型DNA聚合酶基因的DNA片段的碱基序列的测定
从实施例1中获得的质粒pFU1001中再次用XbaI将含有DNA聚合酶基因的上述XbaI-XbaI片段切出,用DNA平末端化试剂盒(宝酒造社生产)平末端化,然后与用SmaI线性化的新载体pTV118N连接,来制备用于制备缺失突变体的质粒,依插入片段方向的不同,质粒被分别命名为pFU1002和pFU1003。使用这两种质粒,由插入DNA片段的两端开始,顺次制备缺失突变体。制备应用Henikoff的方法(《基因》(Gene)第28卷、第351-359页),并使用kilo-sequence用缺失试剂盒(宝酒造社生产)。3’突出型和5’突出型限制酶分别采用PstI和XbaI。以得到的各种缺失突变体为模板,用BcaBE-ST双脱氧测序试剂盒(宝酒造社生产)按双脱氧法确定插入DNA片段的碱基序列。
序列表的序列号5显示了所获得的碱基序列的8450碱基对的序列。对该碱基序列进行分析的结果发现了6个编码蛋白质的开放阅读框(ORF),分别存在于序列表的序列号5中所示的碱基序列的碱基号123-614、(ORF1)、611-1381(ORF2)、1384-3222(ORF3)、3225-7013(ORF4)、7068-7697(ORF5)、7711-8385(ORF6)的位置。图2中显示了重组在质粒pFU1001中的约10千碱基对的XbaI-XbaI DNA片段的限制酶切图谱和该片段上上述ORF的位置。
此外,用上述各种缺失突变体检测了DNA聚合酶活性,结果显示不管是从上游缺失还是从下游缺失,当ORF3和ORF4区域缺失时,DNA聚合酶的活性都丧失。这显示ORF3和ORF4的翻译产物对DNA聚合酶活性的表达都非常重要。ORF3的碱基序列在序列表的序列号2中显示,由该碱基序列推导的ORF3的翻译产物的氨基酸序列在序列号1中显示。ORF4的碱基序列在序列表的序列号4中显示,由该碱基序列推导的ORF4的翻译产物的氨基酸序列在序列号3中显示。
实施例3
纯化DNA聚合酶标准品的制备
将实施例1中获得的Escherichia coli JM109/pFU1001在含有浓度为100μg/ml的氨苄青霉素的500ml LB培养基(蛋白胨10g/升、酵母抽提物5g/升、NaCl 5g/升、pH7.2)中培养。当培养物的浊度达到0.6 A600时,加入诱导物异丙基-β-D-硫代半乳糖苷(IPTG),培养16小时,收集菌体,然后用37ml的超声缓冲液(50mMTris-HCl、pH8.0、2mM 2-巯基乙醇、10%甘油、2.4mM PMSF(苯甲基磺酰氟)悬浮菌体,用于超声波破碎仪。12000rpm、10分钟离心,回收42ml作为粗抽提物的上清,然后在80℃热处理15分钟。然后再以12000rpm、10分钟离心,获得33ml的热处理酶液。接着将此溶液以800ml缓冲液A(50mM磷酸钾、pH6.5、2mM 2-巯基乙醇、10%甘油)作外液透析2小时×4。透析后的酶液32ml上用缓冲液A平衡的RESOURSE Q柱(Pharmacia公司生产),使用FPLC系统(Pharmacia公司生产)进行色谱。展开用0→500mM线性浓度梯度的NaCl进行。DNA聚合酶活性在340mM NaCl时洗脱。
收集含活性的级分所得到的10ml酶液用超滤进行脱盐、浓缩,溶于缓冲液A+150mM NaCl,得到3.5ml酶液,然后将其上用同样的缓冲液平衡的HiTrap Heparin柱(Pharmacia公司生产),用FPLC系统以150→650mM线性浓度梯度的NaCl进行展开。在400mM NaCl的洗脱级分中获得活性成分。将此级分5ml用超滤反复脱盐、浓缩,使之最后浓缩为120μl含50mM磷酸钾、pH6.5、2mM 2-巯基乙醇、75mM NaCl的溶液。将此溶液上用同一缓冲液平衡的Superose 6凝胶过滤柱(Pharmacia公司生产),并用同一缓冲液进行洗脱,结果,DNA聚合酶活性在保留时间为34.7分钟和38.3分钟的位置洗脱出来。与同一条件下分子量标准的洗脱位置进行比较的结果,预计此活性具有的分子量分别为约385千道尔顿和约220千道尔顿,这些分子量相当于ORF3的翻译产物与ORF4的翻译产物以1∶2的摩尔比形成的复合体以及以1∶1的摩尔比形成的复合体。由于在高分子量时,分子量测定的误差较大,不能否定前者是2种翻译产物以2∶2的摩尔比形成复合体的可能性。
实施例4 (1)DNA聚合酶的生物化学特性
对于实施例3中获得的ORF3和ORF4的翻译产物,即第1种DNA聚合酶组成蛋白和第2种DNA聚合酶组成蛋白以1∶1形成的复合体的DNA聚合酶标准品,首先寻找其最适MgCl2和KCl浓度。在反应体系为20mM Tris-盐酸、pH7.7、2mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP,并存在2mM MgCl2时,KCl的浓度在0-200mM的范围内以20mM进行增加,测定DNA聚合酶活性。结果为在KCl为60mM时显示最大活性。然后用上述反应体系,并在60mM KCl的条件下,这次MgCl2在0.5-25mM范围内每次增加2.5mM进行比较,结果在10mM时显示最大活性,在不含KCl的情况下进行比较时,在17.5mM时显示最大活性。
然后调查最适pH。使用各种pH的磷酸钾缓冲液,制备含有20mM磷酸钾、15mM MgCl2、2mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP、60nM[3H]dTTP的反应液,用来在75℃时测定DNA聚合酶活性。其结果在图3中显示。图中横轴表示pH,纵轴表示掺入高分子DNA的放射活性。图中显示本发明的DNA聚合酶在pH6.5-7.0时显示最大活性,在用Tris-盐酸取代磷酸钾的情况下,在碱性一侧活性较高,在测定所用最高的pH8.02时,显示最大活性。
本发明的DNA聚合酶的热稳定性按以下的方法进行调查,制备含有纯化DNA聚合酶的20mM Tris-盐酸(pH7.7)、2mM 2-巯基乙醇、10%甘油、0.1%小牛血清白蛋白的溶液,在各种温度下保温30分钟,检测残存的DNA聚合酶活性。结果示于图4。图中横轴表示保温温度,纵轴表示残存的活性。图中显示,本发明的酶在80℃、30分钟的热处理后,仍能保持80%以上的残存活性。
为比较抑制剂的抑制模式,使用α型DNA聚合酶的特异性抑制剂蚜栖菌素,将本发明的DNA聚合酶与已知的来自激烈热球菌的α型DNA聚合酶(Pfu DNA聚合酶,Stratagene公司生产)的抑制方式进行比较。在20mM Tris-盐酸(pH7.7)、15mM MgCl2、2mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP存在下,蚜栖菌素从0到2.0mM增加,检测活性的变化,Pfu DNA聚合酶在1.0mM时活性减少至20%,而与之相对,本发明的新型DNA聚合酶在2.0mM时,也完全未被抑制。(2)引物延伸反应
接着,为比较本发明的DNA聚合酶对底物DNA形式的选择性,检测了下面的模板-引物。除常规的活性检测中使用的活化DNA外,制备的底物还包括:85℃热处理5分钟的活化DNA(热变性DNA)、M13噬菌体单链DNA(M13mp18ss DNA,宝酒造社生产)以序列表的序列号6所示序列的45个碱基的合成脱氧核糖寡核苷酸为引物退火的产物(M13-HT引物)、相同的M13噬菌体单链DNA以序列表的序列号7中所示序列的17个碱基的合成脱氧核糖寡核苷酸为引物退火的产物(M13-RNA引物)、聚脱氧腺苷酸(poly dA,Pharmacia公司生产)与寡聚胸苷酸(Oligo dT、Pharmacia公司生产)以20∶1的摩尔比混合(polydA-Oligo dT)的产物、聚腺苷酸(poly A,Pharmacia公司生产)与寡聚脱氧胸苷酸以20∶1的摩尔比混合的产物(polyA-Oligo dT)。
用这些底物代替活化DNA测定DNA聚合酶活性,以底物用活化DNA时所获得的活性为100,表1中显示用各底物时的相对活性。为了比较,对Pfu DNA聚合酶、来自水生栖热菌的Taq DNA聚合酶(TaKaRa Taq,宝酒造社生产)也进行了同样的检测。如表1所示,本发明的新型DNA聚合酶与其他DNA聚合酶相比,在用M13-HT引物而不是以活化DNA为底物时,所得到的活性高,因而对引物延伸反应有特别高的适用性。
接着对引物延伸活性进行更详细的检测。使用M13-HT引物作底物,引物的5’端用[γ-32p]ATP(Amersham公司生产)和T4多聚核苷酸激酶(宝酒造社生产)标记。制备10μl含终浓度为0.05μg/μl的上述底物和在以活化DNA为底物的活性测定中的酶量为0.05单位的各种聚合酶的反应液(20mM Tris-盐酸(pH7.7)、15mM MgCl2、2mM 2-巯基乙醇、270μM dATP、d CTP、dGTP、dTTP),在75℃反应1、2、3、4分钟,反应结束后,加入2μl的反应终止液(95%甲醛、20mM EDTA、0.05%溴酚兰、0.05%二甲苯青),在95℃热变性处理3分钟,然后取2μl反应液用含8M尿素的聚丙烯酰胺进行凝胶电泳,然后制备放射性自显影。并且,为调查在作为竞争底物的活化DNA存在下的引物延伸活性,在上述反应液中加入活化DNA至终浓度为0.4μg/μl,按上面同样的方法制备放射性自显影,所得到的放射性自显影在图6中显示。
在图中,Pol、Pfu、Taq分别表示本发明的DNA聚合酶、Pfu DNA聚合酶、Taq DNA聚合酶所获得的结果,1、2、3、4分别表示反应时间(分钟)。而且,图中的-、+分别代表在活化DNA不存在和存在下所获得的结果。而图左端用G、A、T、C表示的条带是用与上面相同的底物用双脱氧法终止反应所得到的反应物的电泳结果,用来推定延伸反应的长度。图中显示本发明的DNA聚合酶与Pfu DNA聚合酶、TaqDNA聚合酶相比显示更优的引物延伸活性。而且还显示,在活化DNA不存在时显示比较高的引物延伸活性的Taq DNA聚合酶在加入大量过剩的活化DNA时明显被抑制,而与之相对,本发明的DNA聚合酶不被活化DNA抑制。这证明,本发明的DNA聚合酶特别对引物与单链模板退火形成的引物延伸型底物具有高亲和性。(3)伴随外切核酸酶活性的有无
本发明的DNA聚合酶伴随的外切核酸酶活性用下述方法进行调查。5’→3’外切核酸酶活性检测所用的底物是:pUC119载体(宝酒造社生产)用SspI(宝酒造社生产)消化,用琼脂糖凝胶电泳分离所获得的386碱基对的DNA片段,纯化,用[γ-32P]ATP和多聚核苷酸激酶制备5’末端32P标记的DNA片段。3’→5’外切核酸酶活性检测所用的底物是:pUC119载体(宝酒造社生产)用Sau3AI消化,所获得的341碱基对的DNA片段用琼脂糖凝胶电泳分离、纯化,用[γ-32P]CTP(Amersham公司生产)和Klenow片段(宝酒造社生产)进行补平反应制备3’末端32P标记的DNA片段。标记DNA用NICK柱(Pharmacia公司生产)凝胶过滤进行纯化,并用于以下反应。在含有这种标记DNA 1ng的反应液(20mM Tris-盐酸(pH7.7)、15mM MgCl2、2mM2-巯基乙醇)中,加入0.015单位的DNA聚合酶,在75℃反应2.5、5、7.5分钟后,加入乙醇沉淀DNA。上清中存在的放射性活性用液体闪烁计数器进行测定,求出外切核酸酶活性的分解量。在本发明的DNA聚合酶中没有发现5’→3’外切核酸酶活性,而显示带有很强的3’→5’外切核酸酶活性。已知3’→5’外切核酸酶活性很强的Pfu DNA聚合酶也用同样的方法测定3’→5’外切核酸酶活性,其结果一起在图5中显示。
图中横轴表示反应时间,纵轴表示上清中游离的放射性活性在全部反应液的放射性活性中的比例。而图中空心圈表示本发明的DNA聚合酶所测得的结果,实心圈表示Pfu DNA聚合酶所测得的结果。图中显示本发明的DNA聚合酶具有与Pfu DNA聚合酶相同程度的3’→5’外切核酸酶活性,已知由于具有很强的3’→5’外切核酸酶活性的PfuDNA聚合酶的DNA合成的忠实性很高。(4)DNA合成反应的正确性的比较
DNA聚合酶在DNA合成反应中的正确性,以部分单链化的pUC118载体(宝酒造社生产)(开环型双螺旋质粒)为模板来检测。单链pUC118以大肠杆菌MV1184(宝酒造社生产)为宿主,使用辅助噬菌体M13K07(宝酒造社生产),按1989年冷泉港实验室出版、T.Maniatis等编辑、《分子克隆:实验室指南第2版》4.44-4.48中记载的方法,进行制备。而双链DNA用PvuII(宝酒造社生产)消化pUC118载体后,进行琼脂糖凝胶电泳,回收约2.8千碱基对的DNA片段,进行制备。
将上述单链DNA 1μg和双链DNA 2μg混合在180μl的灭菌蒸馏水中,在70℃保温10分钟,然后加入20μl的20×SSC,在60℃静置10分钟。进行乙醇沉淀以回收DNA,取一部分进行琼脂糖凝胶电泳,证明获得了开环型双链质粒。制备含1/10量的所获开环型双链DNA质粒的反应液(10mM Tris-盐酸pH8.5、50mM KCl、10mMMgCl2、1mM dATP、d CTP、dGTP、dTTP)30μl,在70℃保温3分钟后,加入0.5单位的DNA聚合酶,在70℃进行10分钟的DNA合成反应。反应结束后,用10μl的反应液转化大肠杆菌DH5α(BRL公司生产)。在含有100μg/ml氨苄青霉素、0.1mM IPTG、40μg/ml的5-溴-4-氯-3-吲哚-β-D半乳糖苷的LB平板上,于37℃培养18小时。记录平板上出现的白色及青色克隆数。计算DNA合成时由于错误而产生的白色克隆的出现率。结果为,用Taq DNA聚合酶作为DNA聚合酶时的出现率为3.18%,而相应地,用本发明的DNA聚合酶的出现率为较低的数值1.61%。(5)PCR中的应用
在本发明的DNA聚合酶在PCR反应中的性能与Taq DNA聚合酶进行比较时,以λ-DNA为模板进行PCR反应。本发明的DNA聚合酶所用的反应液的组成包括10mM Tris-盐酸(pH9.2)、3.5mM MgCl2、75mM KCl、400μM dATP、d CTP、dGTP、dTTP、0.01%牛血清白蛋白、0.1%Triton X-100,Taq DNA聚合酶所用的反应液的组成包括10mM Tris-盐酸(pH8.3)、1.5mM MgCl2、50mM KCl、400μM dATP、d CTP、dGTP、dTTP。制备50μl含有5.0ng/50μlλ-DNA(宝酒造社生产)、10pmol/50μl引物λ1和引物λ11、3.7单位/50μl DNA聚合酶的反应液。引物λ1和引物λ11的碱基序列分别表示在序列表的序列号8和序列号9中。上述反应液按每循环98℃、10秒~68℃、10分钟进行30个循环的PCR反应,然后取5μl反应液进行琼脂糖凝胶电泳,用溴化乙啶染色来确认扩增的DNA片段。结果证明,在使用Taq DNA聚合酶时没有发现DNA片段的扩增,而用本发明的DNA聚合酶时,有约20千碱基对的DNA片段的扩增。
接着,将引物变为引物λ1和引物λ10进行实验。引物λ10的碱基序列在序列表的序列号10中表示。按上面同样的反应液组成,制备25μl含有2.5ng的λ-DNA、10pmol的引物λ1和引物λ10、3.7单位的DNA聚合酶的反应液。按上面同样的反应条件进行5个循环的反应,取5μl反应液进行琼脂糖凝胶电泳,用溴化乙啶进行染色。结果证明,在使用Taq DNA聚合酶时没有发现特异性扩增,而用发明的DNA聚合酶扩增了约15千碱基对的DNA片段。
实施例5(1)用于单独ORF3翻译产物表达的质粒的构建
以通过将实施例2中记载的质粒pFU1002(在该载体上ORF1-6位于载体上的1ac启动子的下游)中插入DNA片段中ORF3的紧邻下游部分缺失而制备的突变体质粒6-82为模板,用引物M4(宝酒造社生产)及碱基序列示于序列表的序列号11的引物NO3进行PCR反应。并在PCR反应中使用DNA聚合酶的合成反应正确性较高的Pfu DNA聚合酶(Stratagene公司生产)。制备100μl含有1ng模板DNA、各25pmol的两种引物和2.5单位的Pfu DNA聚合酶的PCR反应液[20mM Tris-盐酸、pH8.2、10mM KCl、20mM MgCl2、6mM(NH4)2SO4、0.2mM dATP、dCTP、dGTP、dTTP、1%Triton X-100、0.01%小牛血清白蛋白],以每循环94℃、0.5分钟~55、0.5分钟~72℃、2分钟进行25个循环的PCR反应。所扩增的约2千碱基对的DNA片段用NcoI、SphI(均为宝酒造社生产)消化,然后整合到pTV118N载体(宝酒造社生产)的NcoI-SphI位点间,制备质粒pFU-ORF3。该质粒的插入DNA片段中含有可翻译的单独的ORF3。(2)用于单独ORF4翻译产物表达的质粒的构建
以通过将上述质粒pFU1002中的插入DNA片段中ORF4中央部分的下游部分缺失而制备的突变体质粒6-2为模板,用引物M4及碱基序列示于序列表的序列号12的引物NO4进行PCR反应。除模板DNA变为质粒6-2、引物NO3变为NO4外,按上述实施例5(1)相同的条件进行反应。所扩增的DNA片段用NcoI、NheI(宝酒造社生产)消化,获得约1.6千碱基对的DNA片段,将此片段与由上述质粒pFU1002中分离的约3.3千碱基对的NheI-Sal片段(含有ORF4的后半部分)一起重组到pET15b载体(Novagen公司生产)的NcoI-XhoI位点间,制备质粒pFU-ORF4。该质粒的插入DNA片段中含有可翻译的单独的ORF4。(3)由ORF3、ORF4的翻译产物重新组成DNA聚合酶
分别培养用上述质粒pFU-ORF3转化大肠杆菌JM109所得到的Escherichia coli JM109/pFU-ORF3及用上述质粒pFU-ORF4转化大肠杆菌HMS174所得到的Escherichia coli HMS174/pFU-ORF4,纯化菌体中表达的两种ORF的翻译产物。转化子的培养及粗抽提物的制备按实施例3中记载的方法进行。而两种翻译产物的纯化用RESOURCEQ、Hitrap Heparin、Superose 6等柱进行,并用SDS-PAGE上翻译产物的表现进行确定。已经确认,虽然这样纯化的两种ORF翻译产物单独都不显示DNA聚合酶活性,但将2者混合时,能表现出耐热性DNA聚合酶活性。
工业上的利用可能性
本发明提供具有高的引物延伸活性和3’→5’外切核酸酶活性的新型DNA聚合酶。该酶适用于PCR方法,在遗传工程研究中非常有用。而且该酶可通过遗传工程的方法用编码本发明的DNA聚合酶的基因进行生产。
序列表序列号:1序列长度:613序列类型:氨基酸链型:单链拓扑构型:直链型序列种类:多肽序列:
Met Asp Glu Phe Val Lys Ser Leu Leu Lys Ala Asn Tyr Leu Ile
5 10 15
Thr Pro Ser Ala Tyr Tyr Leu Leu Arg Glu Tyr Tyr Glu Lys Gly
20 25 30
Glu Phe Ser Ile Val Glu Leu Val Lys Phe Ala Arg Ser Arg Glu
35 40 45
Ser Tyr Ile Ile Thr Asp Ala Leu Ala Thr Glu Phe Leu Lys Val
50 55 60
Lys Gly Leu Glu Pro Ile Leu Pro Val Glu Thr Lys Gly Gly Phe
65 70 75
Val Ser Thr Gly Glu Ser Gln Lys Glu Gln Ser Tyr Glu Glu Ser
80 85 90
Phe Gly Thr Lys Glu Glu Ile Ser Gln Glu Ile Lys Glu Gly Glu
95 100 105
Ser Phe Ile Ser Thr Gly Ser Glu Pro Leu Glu Glu Glu Leu Asn
110 115 120
Ser Ile Gly Ile Glu Glu Ile Gly Ala Asn Glu Glu Leu Val Ser
125 130 l35Asn Gly Asn Asp Asn Gly Gly Glu Ala Ile Val Phe Asp Lys Tyr
140 145 150Gly Tyr Pro Met Val Tyr Ala Pro Glu Glu Ile Glu Val Glu Glu
155 160 165Lys Glu Tyr Ser Lys Tyr Glu Asp Leu Thr Ile Pro Met Asn Pro
170 175 180Asp Phe Asn Tyr Val Glu Ile Lys Glu Asp Tyr Asp Val Val Phe
185 190 195Asp Val Arg Asn Val Lys Leu Lys Pro Pro Lys Val Lys Asn Gly
200 205 210Asn Gly Lys Glu Gly Glu Ile Ile Val Glu Ala Tyr Ala Ser Leu
215 220 225Phe Arg Ser Arg Leu Lys Lys Leu Arg Lys Ile Leu Arg Glu Asn
230 235 240Pro Glu Leu Asp Asn Val Val Asp Ile Gly Lys Leu Lys Tyr Val
245 250 255Lys Glu Asp Glu Thr Val Thr Ile Ile Gly Leu Val Asn Ser Lys
260 265 270Arg Glu Val Asn Lys Gly Leu Ile Phe Glu Ile Glu Asp Leu Thr
275 280 285Gly Lys Val Lys Val Phe Leu Pro Lys Asp Ser Glu Asp Tyr Arg
290 295 300Glu Ala Phe Lys Val Leu Pro Asp Ala Val Val Ala Phe Lys Gly
305 310 315Val Tyr Ser Lys Arg Gly Ile Leu Tyr Ala Asn Lys Phe Tyr Leu
320 325 330Pro Asp Val Pro Leu Tyr Arg Arg Gln Lys Pro Pro Leu Glu Glu
335 340 345Lys Val Tyr Ala Ile Leu Ile Ser Asp Ile His Val Gly Ser Lys
350 355 360Glu Phe Cys Glu Asn Ala Phe Ile Lys Phe Leu Glu Trp Leu Asn
365 370 375Gly Asn Val Glu Thr Lys Glu Glu Glu Glu Ile Val Ser Arg Val
380 385 390Lys Tyr Leu Ile Ile Ala Gly Asp Val Val Asp Gly Val Gly Val
395 400 405Tyr Pro Gly Gln Tyr Ala Asp Leu Thr Ile Pro Asp Ile Phe Asp
410 415 420Gln Tyr Glu Ala Leu Ala Asn Leu Leu Ser His Val Pro Lys His
425 430 435Ile Thr Met Phe Ile Ala Pro Gly Asn His Asp Ala Ala Arg Gln
440 445 450Ala Ile Pro Gln Pro Glu Phe Tyr Lys Glu Tyr Ala Lys Pro Ile
455 460 465Tyr Lys Leu Lys Asn Ala Val Ile Ile Ser Asn Pro Ala Val Ile
470 475 480Arg Leu His Gly Arg Asp Phe Leu Ile Ala His Gly Arg Gly Ile
485 490 495Glu Asp Val Val Gly Ser Val Pro Gly Leu Thr His His Lys Pro
500 505 510Gly Leu Pro Met Val Glu Leu Leu Lys Met Arg His Val Ala Pro
515 520 525Met Phe Gly Gly Lys Val Pro Ile Ala Pro Asp Pro Glu Asp Leu
530 535 540Leu Val Ile Glu Glu Val Pro Asp Val Val His Met Gly His Val
545 550 555His Val Tyr Asp Ala Val Val Tyr Arg Gly Val Gln Leu Val Asn
560 565 570Ser Ala Thr Trp Gln Ala Gln Thr Glu Phe Gln Lys Met Val Asn
575 580 585Ile Val Pro Thr Pro Ala Lys Val Pro Val Val Asp Ile Asp Thr
590 595 600Ala Lys Val Val Lys Val Leu Asp Phe Ser Gly Trp Cys
605 610序列号:2序列长度:1839序列类型:核酸链型:双链拓扑构型:直链型序列种类:基因组DNA序列:ATGGATGAAT TTGTAAAATC ACTTCTAAAA GCTAACTATC TAATAACTCC CTCTGCCTAC 60TATCTCTTGA GAGAATACTA TGAAAAAGGT GAATTCTCAA TTGTGGAGCT GGTAAAATTT 120GCAAGATCAA GAGAGAGCTA CATAATTACT GATGCTTTAG CAACAGAATT CCTTAAAGTT 180AAAGGCCTTG AACCAATTCT TCCAGTGGAA ACAAAGGGGG GTTTTGTTTC CACTGGAGAG 240TCCCAAAAAG AGCAGTCTTA TGAAGAGTCT TTTGGGACTA AAGAAGAAAT TTCCCAGGAG 300ATTAAAGAAG GAGAGAGTTT TATTTCCACT GGAAGTGAAC CACTTGAAGA GGAGCTCAAT 360AGCATTGGAA TTGAGGAAAT TGGGGCAAAT GAAGAGTTAG TTTCTAATGG AAATGACAAT 420GGTGGAGAGG CAATTGTCTT TGACAAATAT GGCTATCCAA TGGTATATGC TCCAGAAGAA 480ATAGAGGTTG AGGAGAAGGA GTACTCGAAG TATGAAGATC TGACAATACC CATGAACCCC 540GACTTCAATT ATGTGGAAAT AAAGGAAGAT TATGATGTTG TCTTCGATGT TAGGAATGTA 600AAGCTGAAGC CTCCTAAGGT AAAGAACGGT AATGGGAAGG AAGGTGAAAT AATTGTTGAA 660GCTTATGCTT CTCTCTTCAG GAGTAGGTTG AAGAAGTTAA GGAAAATACT AAGGGAAAAT 720CCTGAATTGG ACAATGTTGT TGATATTGGG AAGCTGAAGT ATGTGAAGGA AGATGAAACC 780GTGACAATAA TAGGGCTTGT CAATTCCAAG AGGGAAGTGA ATAAAGGATT GATATTTGAA 840ATAGAAGATC TCACAGGAAA GGTTAAAGTT TTCTTGCCGA AAGATTCGGA AGATTATAGG 900GAGGCATTTA AGGTTCTTCC AGATGCCGTC GTCGCTTTTA AGGGGGTGTA TTCAAAGAGG 960GGAATTTTGT ACGCCAACAA GTTTTACCTT CCAGACGTTC CCCTCTATAG GAGACAAAAG 1020CCTCCACTGG AAGAGAAAGT TTATGCTATT CTCATAAGTG ATATACACGT CGGAAGTAAA 1080GAGTTCTGCG AAAATGCCTT CATAAAGTTC TTAGAGTGGC TCAATGGAAA CGTTGAAACT 1140AAGGAAGAGG AAGAAATCGT GAGTAGGGTT AAGTATCTAA TCATTGCAGG AGATGTTGTT 1200GATGGTGTTG GCGTTTATCC GGGCCAGTAT GCCGACTTGA CGATTCCAGA TATATTCGAC 1260CAGTATGAGG CCCTCGCAAA CCTTCTCTCT CACGTTCCTA AGCACATAAC AATGTTCATT 1320GCCCCAGGAA ACCACGATGC TGCTAGGCAA GCTATTCCCC AACCAGAATT CTACAAAGAG 1380TATGCAAAAC CTATATACAA GCTCAAGAAC GCCGTGATAA TAAGCAATCC TGCTGTAATA 1440AGACTACATG GTAGGGACTT TCTGATAGCT CATGGTAGGG GGATAGAGGA TGTCGTTGGA 1500AGTGTTCCTG GGTTGACCCA TCACAAGCCC GGCCTCCCAA TGGTTGAACT ATTGAAGATG 1560AGGCATGTAG CTCCAATGTT TGGAGGAAAG GTTCCAATAG CTCCTGATCC AGAAGATTTG 1620CTTGTTATAG AAGAAGTTCC TGATGTAGTT CACATGGGTC ACGTTCACGT TTACGATGCG 1680GTAGTTTATA GGGGAGTTCA GCTGGTTAAC TCCGCCACCT GGCAGGCTCA GACCGAGTTC 1740CAGAAGATGG TGAACATAGT TCCAACGCCT GCAAAGGTTC CCGTTGTTGA TATTGATACT 1800GCAAAAGTTG TCAAGGTTTT GGACTTTAGT GGGTGGTGC 1839序列号:3序列长度:1263序列类型:氨基酸链型:单链拓扑构型:直链型序列种类:多肽序列:Met Glu Leu Pro Lys Glu Ile Glu Glu Tyr Phe Glu Met Leu Gln
5 10 15Arg Glu Ile Asp Lys Ala Tyr Glu Ile Ala Lys Lys Ala Arg Ser
20 25 30Gln Gly Lys Asp Pro Ser Thr Asp Val Glu Ile Pro Gln Ala Thr
35 40 45Asp Met Ala Gly Arg Val Glu Ser Leu Val Gly Pro Pro Gly Val
50 55 60Ala Gln Arg Ile Arg Glu Leu Leu Lys Glu Tyr Asp Lys Glu Ile
65 70 75Val Ala Leu Lys Ile Val Asp Glu Ile Ile Glu Gly Lys Phe Gly
80 85 90Asp Phe Gly Ser Lys Glu Lys Tyr Ala Glu Gln Ala Val Arg Thr
95 100 105Ala Leu Ala Ile Leu Thr Glu Gly Ile Val Ser Ala Pro Leu Glu
110 115 120Gly Ile Ala Asp Val Lys Ile Lys Arg Asn Thr Trp Ala Asp Asn
125 130 135Ser Glu Tyr Leu Ala Leu Tyr Tyr Ala Gly Pro Ile Arg Ser Ser
140 145 150Gly Gly Thr Ala Gln Ala Leu Ser Val Leu Val Gly Asp Tyr Val
155 160 165Arg Arg Lys Leu Gly Leu Asp Arg Phe Lys Pro Ser Gly Lys His
170 175 180Ile Glu Arg Met Val Glu Glu Val Asp Leu Tyr His Arg Ala Val
185 190 195Ser Arg Leu Gln Tyr His Pro Ser Pro Asp Glu Val Arg Leu Ala
200 205 210Met Arg Asn Ile Pro Ile Glu Ile Thr Gly Glu Ala Thr Asp Asp
215 220 225Val Glu Val Ser His Arg Asp Val Glu Gly Val Glu Thr Asn Gln
230 235 240Leu Arg Gly Gly Ala Ile Leu Val Leu Ala Glu Gly Val Leu Gln
245 250 255Lys Ala Lys Lys Leu Val Lys Tyr Ile Asp Lys Met Gly Ile Asp
260 265 270Gly Trp Glu Trp Leu Lys Glu Phe Val Glu Ala Lys Glu Lys Gly
275 280 285Glu Glu Ile Glu Glu Ser Glu Ser Lys Ala Glu Glu Ser Lys Val
290 295 300Glu Thr Arg Val Glu Val Glu Lys Gly Phe Tyr Tyr Lys Leu Tyr
305 310 315Glu Lys Phe Arg Ala Glu Ile Ala Pro Ser Glu Lys Tyr Ala Lys
320 325 330Glu Ile Ile Gly Gly Arg Pro Leu Phe Ala Gly Pro Ser Glu Asn
335 340 345Gly Gly Phe Arg Leu Arg Tyr Gly Arg Ser Arg Val Ser Gly Phe
350 355 360Ala Thr Trp Ser Ile Asn Pro Ala Thr Met Val Leu Val Asp Glu
365 370 375Phe Leu Ala Ile Gly Thr Gln Met Lys Thr Glu Arg Pro Gly Lys
380 385 390Gly Ala Val Val Thr Pro Ala Thr Thr Ala Glu Gly Pro Ile Val
395 400 405Lys Leu Lys Asp Gly Ser Val Val Arg Val Asp Asp Tyr Asn Leu
410 415 420Ala Leu Lys Ile Arg Asp Glu Val Glu Glu Ile Leu Tyr Leu Gly
425 430 435Asp Ala Ile Ile Ala Phe Gly Asp Phe Val Glu Asn Asn Gln Thr
440 445 450Leu Leu Pro Ala Asn Tyr Val Glu Glu Trp Trp Ile Gln Glu Phe
455 460 465Val Lys Ala Val Asn Glu Ala Tyr Glu Val Glu Leu Arg Pro Phe
470 475 480Glu Glu Asn Pro Arg Glu Ser Val Glu Glu Ala Ala Glu Tyr Leu
485 490 495Glu Val Asp Pro Glu Phe Leu Ala Lys Met Leu Tyr Asp Pro Leu
500 505 510Arg Val Lys Pro Pro Val Glu Leu Ala Ile His Phe Ser Glu Ile
515 520 525Leu Glu Ile Pro Leu His Pro Tyr Tyr Thr Leu Tyr Trp Asn Thr
530 535 540Val Asn Pro Lys Asp Val Glu Arg Leu Trp Gly Val Leu Lys Asp
545 550 555Lys Ala Thr lle Glu Trp Gly Thr Phe Arg Gly Ile Lys Phe Ala
560 565 570Lys Lys Ile Glu Ile Ser Leu Asp Asp Leu Gly Ser Leu Lys Arg
575 580 585Thr Leu Glu Leu Leu Gly Leu Pro His Thr Val Arg Glu Gly Ile
590 595 600Val Val Val Asp Tyr Pro Trp Ser Ala Ala Leu Leu Thr Pro Leu
605 610 615Gly Asn Leu Glu Trp Glu Phe Lys Ala Lys Pro Phe Tyr Thr Val
620 625 630Ile Asp Ile Ile Asn Glu Asn Asn Gln Ile Lys Leu Arg Asp Arg
635 640 645Gly Ile Ser Trp Ile Gly Ala Arg Met Gly Arg Pro Glu Lys Ala
650 655 660Lys Glu Arg Lys Met Lys Pro Pro Val Gln Val Leu Phe Pro Ile
665 670 675Gly Leu Ala Gly Gly Ser Ser Arg Asp Ile Lys Lys Ala Ala Glu
680 685 690Glu Gly Lys Ile Ala Glu Val Glu Ile Ala Phe Phe Lys Cys Pro
695 700 705Lys Cys Gly His Val Gly Pro Glu Thr Leu Cys Pro Glu Cys Gly
710 715 720Ile Arg Lys Glu Leu Ile Trp Thr Cys Pro Lys Cys Gly Ala Glu
725 730 735Tyr Thr Asn Ser Gln Ala Glu Gly Tyr Ser Tyr Ser Cys Pro Lys
740 745 750Cys Asn Val Lys Leu Lys Pro Phe Thr Lys Arg Lys Ile Lys Pro
755 760 765Ser Glu Leu Leu Asn Arg Ala Met Glu Asn Val Lys Val Tyr Gly
770 775 780Val Asp Lys Leu Lys Gly Val Met Gly Met Thr Ser Gly Trp Lys
785 790 795Ile Ala Glu Pro Leu Glu Lys Gly Leu Leu Arg Ala Lys Asn Glu
800 805 810Val Tyr Val Phe Lys Asp Gly Thr Ile Arg Phe Asp Ala Thr Asp
815 820 825Ala Pro Ile Thr His Phe Arg Pro Arg Glu Ile Gly Val Ser Val
830 835 840Glu Lys Leu Arg Glu Leu Gly Tyr Thr His Asp Phe Glu Gly Lys
845 850 855Pro Leu Val Ser Glu Asp Gln Ile Val Glu Leu Lys Pro Gln Asp
860 865 870Val Ile Leu Ser Lys Glu Ala Gly Lys Tyr Leu Leu Arg Val Ala
875 880 885Arg Phe Val Asp Asp Leu Leu Glu Lys Phe Tyr Gly Leu Pro Arg
890 895 900Phe Tyr Asn Ala Glu Lys Met Glu Asp Leu Ile Gly His Leu Val
905 910 915Ile Gly Leu Ala Pro His Thr Ser Ala Gly Ile Val Gly Arg Ile
920 925 930Ile Gly Phe Val Asp Ala Leu Val Gly Tyr Ala His Pro Tyr Phe
935 940 945His Ala Ala Lys Arg Arg Asn Cys Asp Gly Asp Glu Asp Ser Val
950 955 960Met Leu Leu Leu Asp Ala Leu Leu Asn Phe Ser Arg Tyr Tyr Leu
965 970 975Pro Glu Lys Arg Gly Gly Lys Met Asp Ala Pro Leu Val Ile Thr
980 985 990Thr Arg Leu Asp Pro Arg Glu Val Asp Ser Glu Val His Asn Met
995 1000 1005Asp Val Val Arg Tyr Tyr Pro Leu Glu Phe Tyr Glu Ala Thr Tyr
1010 1015 1020Glu Leu Lys Ser Pro Lys Glu Leu Val Arg Val Ile Glu Gly Val
1025 1030 1035Glu Asp Arg Leu Gly Lys Pro Glu Met Tyr Tyr Gly Ile Lys Phe
1040 1045 1050Thr His Asp Thr Asp Asp Ile Ala Leu Gly Pro Lys Met Ser Leu
1055 1060 1065Tyr Lys Gln Leu Gly Asp Met Glu Glu Lys Val Lys Arg Gln Leu
1070 1075 1080Thr Leu Ala Glu Arg Ile Arg Ala Val Asp Gln His Tyr Val Ala
1085 1090 1095Glu Thr Ile Leu Asn Ser His Leu Ile Pro Asp Leu Arg Gly Asn
1100 1105 1110Leu Arg Ser Phe Thr Arg Gln Glu Phe Arg Cys Val Lys Cys Asn
1115 1120 1125Thr Lys Tyr Arg Arg Pro Pro Leu Asp Gly Lys Cys Pro Val Cys
1130 1135 1140Gly Gly Lys Ile Val Leu Thr Val Ser Lys Gly Ala Ile Glu Lys
1145 1150 1155Tyr Leu Gly Thr Ala Lys Met Leu Val Ala Asn Tyr Asn Val Lys
1160 1165 1170Pro Tyr Thr Arg Gln Arg Ile Cys Leu Thr Glu Lys Asp Ile Asp
1175 1180 1185Ser Leu Phe Glu Tyr Leu Phe Pro Glu Ala Gln Leu Thr Leu Ile
1190 1195 1200Val Asp Pro Asn Asp Ile Cys Met Lys Met Ile Lys Glu Arg Thr
1205 1210 1215Gly Glu Thr Val Gln Gly Gly Leu Leu Glu Asn Phe Asn Ser Ser
1220 1225 1230Gly Asn Asn Gly Lys Lys Ile Glu Lys Lys Glu Lys Lys Ala Lys
1235 1240 1245Glu Lys Pro Lys Lys Lys Lys Val Ile Ser Leu Asp Asp Phe Phe
1250 1255 1260Ser Lys Arg序列号:4序列长度:3789序列类型:核酸链型:双链拓扑构型:直链型序列种类:基因组DNA序列:ATGGAGCTTC CAAAGGAAAT TGAGGAGTAT TTTGAGATGC TTCAAAGGGA AATTGACAAA 60GCTTACGAGA TTGCTAAGAA GGCTAGGAGT CAGGGTAAAG ACCCCTCAAC CGATGTTGAG 120ATTCCCCAGG CTACAGACAT GGCTGGAAGA GTTGAGAGCT TAGTTGGCCC TCCCGGAGTT 180GCTCAGAGAA TTAGGGAGCT TTTAAAAGAG TATGATAAGG AAATTGTTGC TTTAAAGATA 240GTTGATGAGA TAATTGAGGG CAAATTTGGT GATTTTGGAA GTAAAGAGAA GTACGCTGAA 300CAGGCTGTAA GGACAGCCTT GGCAATATTA ACTGAGGGTA TTGTTTCTGC TCCACTTGAG 360GGTATAGCTG ATGTTAAAAT CAAGCGAAAC ACCTGGGCTG ATAACTCTGA ATACCTCGCC 420CTTTACTATG CTGGGCCAAT TAGGAGTTCT GGTGGAACTG CTCAAGCTCT CAGTGTACTT 480GTTGGTGATT ACGTTAGGCG AAAGCTTGGC CTTGATAGGT TTAAGCCAAG TGGGAAGCAT 540ATAGAGAGAA TGGTTGAGGA AGTTGACCTC TATCATAGAG CTGTTTCAAG GCTTCAATAT 600CATCCCTCAC CTGATGAAGT GAGATTAGCA ATGAGGAATA TTCCCATAGA AATCACTGGT 660GAAGCCACTG ACGATGTGGA GGTTTCCCAT AGAGATGTAG AGGGAGTTGA GACAAATCAG 720CTGAGAGGAG GAGCGATCCT AGTTTTGGCG GAGGGTGTTC TCCAGAAGGC TAAAAAGCTC 780GTGAAATACA TTGACAAGAT GGGGATTGAT GGATGGGAGT GGCTTAAAGA GTTTGTAGAG 840GCTAAAGAAA AAGGTGAAGA AATCGAAGAG AGTGAAAGTA AAGCCGAGGA GTCAAAAGTT 900GAAACAAGGG TGGAGGTAGA GAAGGGATTC TACTACAAGC TCTATGAGAA ATTTAGGGCT 980GAGATTGCCC CAAGCGAAAA GTATGCAAAG GAAATAATTG GTGGGAGGCC GTTATTCGCT 1020GGACCCTCGG AAAATGGGGG ATTTAGGCTT AGATATGGTA GAAGTAGGGT GAGTGGATTT 1080GCAACATGGA GCATAAATCC AGCAACAATG GTTTTGGTTG ACGAGTTCTT GGCCATTGGA 1140ACTCAAATGA AAACCGAGAG GCCTGGGAAA GGTGCAGTAG TGACTCCAGC AACAACCGCT 1200GAAGGGCCGA TTGTTAAGCT AAAGGATGGG AGTGTTGTTA GGGTTGATGA TTACAACTTG 1260GCCCTCAAAA TAAGGGATGA AGTCGAAGAG ATACTTTATT TGGGAGATGC AATCATAGCC 1320TTTGGAGACT TTGTGGAGAA CAATCAAACT CTCCTTCCTG CAAACTATGT AGAGGAGTGG 1380TGGATCCAAG AGTTCGTAAA GGCCGTTAAT GAGGCATATG AAGTTGAGCT TAGACCCTTT 1440GAGGAAAATC CCAGGGAGAG CGTTGAGGAA GCAGCAGAGT ACCTTGAAGT TGACCCAGAA 1500TTCTTGGCTA AGATGCTTTA CGATCCTCTA AGGGTTAAGC CTCCCGTGGA GCTAGCCATA 1560CACTTCTCGG AAATCCTGGA AATTCCTCTC CACCCATACT ACACCCTTTA TTGGAATACT 1620GTAAATCCTA AAGATGTTGA AAGACTTTGG GGAGTATTAA AAGACAAGGC CACCATAGAA 1680TGGGGCACTT TCAGAGGTAT AAAGTTTGCA AAGAAAATTG AAATTAGCCT GGACGACCTG 1740GGAAGTCTTA AGAGAACCCT AGAGCTCCTG GGACTTCCTC ATACGGTAAG AGAAGGGATT 1800GTAGTGGTTG ATTATCCGTG GAGTGCAGCT CTTCTCACTC CATTGGGCAA TCTTGAATGG 1860GAGTTTAAGG CCAAGCCCTT CTACACTGTA ATAGACATCA TTAACGAGAA CAATCAGATA 1920AAGCTCAGGG ACAGGGGAAT AAGCTGGATA GGGGCAAGAA TGGGAAGGCC AGAGAAGGCA 1980AAAGAAAGAA AAATGAAGCC ACCTGTTCAA GTCCTCTTCC CAATTGGCTT GGCAGGGGGT 2040TCTAGCAGAG ATATAAAGAA GGCTGCTGAA GAGGGAAAAA TAGCTGAAGT TGAGATTGCT 2100TTCTTCAAGT GTCCGAAGTG TGGCCATGTA GGGCCTGAAA CTCTCTGTCC CGAGTGTGGG 2160ATTAGGAAAG AGTTGATATG GACATGTCCC AAGTGTGGGG CTGAATACAC CAATTCCCAG 2220GCTGAGGGGT ACTCGTATTC ATGTCCAAAG TGCAATGTGA AGCTAAAGCC ATTCACAAAG 2280AGGAAGATAA AGCCCTCAGA GCTCTTAAAC AGGGCCATGG AAAACGTGAA GGTTTATGGA 2340GTTGACAAGC TTAAGGGCGT AATGGGAATG ACTTCTGGCT GGAAGATTGC AGAGCCGCTG 2400GAGAAAGGTC TTTTGAGAGC AAAAAATGAA GTTTACGTCT TTAAGGATGG AACCATAAGA 2460TTTGATGCCA CAGATGCTCC AATAACTCAC TTTAGGCCTA GGGAGATAGG AGTTTCAGTG 2520GAAAAGCTGA GAGAGCTTGG CTACACCCAT GACTTCGAAG GGAAACCTCT GGTGAGTGAA 2580GACCAGATAG TTGAGCTTAA GCCCCAAGAT GTAATCCTCT CAAAGGAGGC TGGCAAGTAC 2640CTCTTAAGAG TGGCCAGGTT TGTTGATGAT CTTCTTGAGA AGTTCTACGG ACTTCCCAGG 2700TTCTACAACG CCGAAAAAAT GGAGGATTTA ATTGGTCACC TAGTGATAGG ATTGGCCCCT 2760CACACTTCAG CCGGAATCGT GGGGAGGATA ATAGGCTTTG TAGATGCTCT GGTTGGCTAC 2820GCTCACCCCT ACTTCCATGC GGCCAAGAGA AGGAACTGTG ATGGAGATGA GGATAGTGTA 2880ATGCTACTCC TTGATGCCCT ATTGAACTTC TCCAGATACT ACCTCCCCGA AAAAAGAGGA 2940GGAAAAATGG ACGCTCCTCT TGTCATAACC ACGAGGCTTG ATCCAAGAGA GGTGGACAGT 3000GAAGTGCACA ACATGGATGT CGTTAGATAC TATCCATTAG AGTTCTATGA AGCAACTTAC 3060GAGCTTAAAT CACCAAAGGA ACTTGTGAGA GTTATAGAGG GAGTTGAAGA TAGATTAGGA 3120AAGCCTGAAA TGTATTACGG AATAAAGTTC ACCCACGATA CCGACGACAT AGCTCTAGGA 3180CCAAAGATGA GCCTCTACAA GCAGTTGGGA GATATGGAGG AGAAAGTGAA GAGGCAATTG 3240ACATTGGCAG AGAGAATTAG AGCTGTGGAT CAACACTATG TTGCTGAAAC AATCCTCAAC 3300TCCCACTTAA TTCCCGACTT GAGGGGTAAC CTAAGGAGCT TTACTAGACA AGAATTTCGC 3360TGTGTGAAGT GTAACACAAA GTACAGAAGG CCGCCCTTGG ATGGAAAATG CCCAGTCTGT 3420GGAGGAAAGA TAGTGCTGAC AGTTAGCAAA GGAGCCATTG AAAAGTACTT GGGGACTGCC 3480AAGATGCTCG TAGCTAACTA CAACGTAAAG CCATATACAA GGCAGAGAAT ATGCTTGACG 3540GAGAAGGATA TTGATTCACT CTTTGAGTAC TTATTCCCAG AAGCCCAGTT AACGCTCATT 3600GTAGATCCAA ACGACATCTG TATGAAAATG ATCAAGGAAA GAACGGGGGA AACAGTTCAA 3660GGAGGCCTGC TTGAGAACTT TAATTCCTCT GGAAATAATG GGAAGAAAAT AGAGAAGAAG 3720GAGAAAAAGG CAAAGGAAAA GCCTAAAAAG AAGAAAGTTA TAAGCTTGGA CGACTTCTTC 3780TCCAAACGC 3789序列号:5序列长度:8450序列类型:核酸链型:双链拓扑构型:直链型序列种类:基因组DNA序列:CATAACTAAA TTATTACATT TAGTTATATG GATGGGGGAA AAATTAACAA CATGTGTTAT 60GTTTCCTCTG GAAAATTGAT CTATAATAAT CTAGGAGCAC AATTTCCAAT GGAGGGTCAT 120CAATGAACGA AGGTGAACAT CAAATAAAGC TTGACGAGCT ATTCGAAAAG TTGCTCCGAG 180CTAGGAAGAT ATTCAAAAAC AAAGATGTCC TTAGGCATAG CTATACTCCC AAGGATCTAC 240CTCACAGACA TGAGCAAATA GAAACTCTCG CCCAAATTTT AGTACCAGTT CTCAGAGGAG 300AAACTCCATC AAACATATTC GTTTATGGGA AGACTGGAAC TGGAAAGACT GTAACTGTAA 360AATTTGTAAC TGAAGAGCTG AAAAGAATAT CTGAAAAATA CAACATTCCA GTTGATGTGA 420TCTACATTAA TTGTGAGATT GTCGATACTC ACTATAGAGT TCTTGCTAAC ATAGTTAACT 480ACTTCAAAGA TGAGACTGGG ATTGAAGTTC CAATGGTAGG TTGGCCTACC GATGAAGTTT 540ACGCAAAGCT TAAGCAGGTT ATAGATATGA AGGAGAGGTT TGTGATAATT GTGTTGGATG 600AAATTGACAA GTGGTAAAGA AGAGTGGTGA TGAGGTTCTC TATTCATTAA CAAGAATAAA 660TACTGAACTT AAAAGGGCTA AAGTGAGTGT AATTGGTATA TCAAACGACC TTAAATTTAA 720AGAGTATCTA GATCCAAGAG TTCTCTCAAG TTTGAGTGAG GAAGAGGTGG TATTCCCACC 780CTATGATGCA AATCAGCTTA GGGATATACT GACCCAAAGA GCTGAAGAGG CCTTTTATCC 840TGGGGTTTTA GACGAAGGTG TGATTCCCCT CTGTGCAGCA TTAGCTGCTA GAGAGCATGG 900AGATGCAAGA AAGGCACTTG ACCTTCTAAG AGTTGCAGGG GAAATAGCGG AAAGAGAAGG 960GGCAAGTAAA GTAACTGAAA AGCATGTTTG GAAAGCCCAG GAAAAGATTG AACAGGACAT 1020GATGGAGGAG GTAATAAAAA CTCTACCCCT TCAGTCAAAA GTTCTCCTCT ATGCCATAGT 1080TCTTTTGGAC GAAAACGGCG ATTTACCAGC AAATACTGGG GATGTTTACG CTGTTTATAG 1140GGAATTGTGC GAGTACATTG ACTTGGAACC TCTCACCCAA AGAAGGATAA GTGATCTAAT 1200TAATGAGCTT GACATGCTTG GAATAATAAA TGCAAAAGTT GTTAGTAAGG GGAGATATGG 1260GAGGACAAAG GAAATAAGGC TTAACGTTAC CTCATATAAG ATAAGAAATG TGCTGAGATA 1320TGATTACTCT ATTCAGCCCC TCCTCACAAT TTCCCTTAAG AGTGAGCAGA GGAGGTTGAT 1380CTAATGGATG AATTTGTAAA ATCACTTCTA AAAGCTAACT ATCTAATAAC TCCCTCTGCC 1440TACTATCTCT TGAGAGAATA CTATGAAAAA GGTGAATTCT CAATTGTGGA GCTGGTAAAA 1500TTTGCAAGAT CAAGAGAGAG CTACATAATT ACTGATGCTT TAGCAACAGA ATTCCTTAAA 1560GTTAAAGGCC TTGAACCAAT TCTTCCAGTG GAAACAAAGG GGGGTTTTGT TTCCACTGGA 1620GAGTCCCAAA AAGAGCAGTC TTATGAAGAG TCTTTTGGGA CTAAAGAAGA AATTTCCCAG 1680GAGATTAAAG AAGGAGAGAG TTTTATTTCC ACTGGAAGTG AACCACTTGA AGAGGAGCTC 1740AATAGCATTG GAATTGAGGA AATTGGGGCA AATGAAGAGT TAGTTTCTAA TGGAAATGAC 1800AATGGTGGAG AGGCAATTGT CTTTGACAAA TATGGCTATC CAATGGTATA TGCTCCAGAA 1860GAAATAGAGG TTGAGGAGAA GGAGTACTCG AAGTATGAAG ATCTGACAAT ACCCATGAAC 1920CCCGACTTCA ATTATGTGGA AATAAAGGAA GATTATGATG TTGTCTTCGA TGTTAGGAAT 1980GTAAAGCTGA AGCCTCCTAA GGTAAAGAAC GGTAATGGGA AGGAAGGTGA AATAATTGTT 2040GAAGCTTATG CTTCTCTCTT CAGGAGTAGG TTGAAGAAGT TAAGGAAAAT ACTAAGGGAA 2100AATCCTGAAT TGGACAATGT TGTTGATATT GGGAAGCTGA AGTATGTGAA GGAAGATGAA 2160ACCGTGACAA TAATAGGGCT TGTCAATTCC AAGAGGGAAG TGAATAAAGG ATTGATATTT 2220GAAATAGAAG ATCTCACAGG AAAGGTTAAA GTTTTCTTGC CGAAAGATTC GGAAGATTAT 2280AGGGAGGCAT TTAAGGTTCT TCCAGATGCC GTCGTCGCTT TTAAGGGGGT GTATTCAAAG 2340AGGGGAATTT TGTACGCCAA CAAGTTTTAC CTTCCAGACG TTCCCCTCTA TAGGAGACAA 2400AAGCCTCCAC TGGAAGAGAA AGTTTATGCT ATTCTCATAA GTGATATACA CGTCGGAAGT 2460AAAGAGTTCT GCGAAAATGC CTTCATAAAG TTCTTAGAGT GGCTCAATGG AAACGTTGAA 2520ACTAAGGAAG AGGAAGAAAT CGTGAGTAGG GTTAAGTATC TAATCATTGC AGGAGATGTT 2580GTTGATGGTG TTGGCGTTTA TCCGGGCCAG TATGCCGACT TGACGATTCC AGATATATTC 2640GACCAGTATG AGGCCCTCGC AAACCTTCTC TCTCACGTTC CTAAGCACAT AACAATGTTC 2700ATTGCCCCAG GAAACCACGA TGCTGCTAGG CAAGCTATTC CCCAACCAGA ATTCTACAAA 2760GAGTATGCAA AACCTATATA CAAGCTCAAG AACGCCGTGA TAATAAGCAA TCCTGCTGTA 2820ATAAGACTAC ATGGTAGGGA CTTTCTGATA GCTCATGGTA GGGGGATAGA GGATGTCGTT 2880GGAAGTGTTC CTGGGTTGAC CCATCACAAG CCCGGCCTCC CAATGGTTGA ACTATTGAAG 2940ATGAGGCATG TAGCTCCAAT GTTTGGAGGA AAGGTTCCAA TAGCTCCTGA TCCAGAAGAT 3000TTGCTTGTTA TAGAAGAAGT TCCTGATGTA GTTCACATGG GTCACGTTCA CGTTTACGAT 3060GCGGTAGTTT ATAGGGGAGT TCAGCTGGTT AACTCCGCCA CCTGGCAGGC TCAGACCGAG 3120TTCCAGAAGA TGGTGAACAT AGTTCCAACG CCTGCAAAGG TTCCCGTTGT TGATATTGAT 3180ACTGCAAAAG TTGTCAAGGT TTTGGACTTT AGTGGGTGGT GCTGATGGAG CTTCCAAAGG 3240AAATTGAGGA GTATTTTGAG ATGCTTCAAA GGGAAATTGA CAAAGCTTAC GAGATTGCTA 3300AGAAGGCTAG GAGTCAGGGT AAAGACCCCT CAACCGATGT TGAGATTCCC CAGGCTACAG 3360ACATGGCTGG AAGAGTTGAG AGCTTAGTTG GCCCTCCCGG AGTTGCTCAG AGAATTAGGG 3420AGCTTTTAAA AGAGTATGAT AAGGAAATTG TTGCTTTAAA GATAGTTGAT GAGATAATTG 3480AGGGCAAATT TGGTGATTTT GGAAGTAAAG AGAAGTACGC TGAACAGGCT GTAAGGACAG 3540CCTTGGCAAT ATTAACTGAG GGTATTGTTT CTGCTCCACT TGAGGGTATA GCTGATGTTA 3600AAATCAAGCG AAACACCTGG GCTGATAACT CTGAATACCT CGCCCTTTAC TATGCTGGGC 3660CAATTAGGAG TTCTGGTGGA ACTGCTCAAG CTCTCAGTGT ACTTGTTGGT GATTACGTTA 3720GGCGAAAGCT TGGCCTTGAT AGGTTTAAGC CAAGTGGGAA GCATATAGAG AGAATGGTTG 3780AGGAAGTTGA CCTCTATCAT AGAGCTGTTT CAAGGCTTCA ATATCATCCC TCACCTGATG 3840AAGTGAGATT AGCAATGAGG AATATTCCCA TAGAAATCAC TGGTGAAGCC ACTGACGATG 3900TGGAGGTTTC CCATAGAGAT GTAGAGGGAG TTGAGACAAA TCAGCTGAGA GGAGGAGCGA 3960TCCTAGTTTT GGCGGAGGGT GTTCTCCAGA AGGCTAAAAA GCTCGTGAAA TACATTGACA 4020AGATGGGGAT TGATGGATGG GAGTGGCTTA AAGAGTTTGT AGAGGCTAAA GAAAAAGGTG 4080AAGAAATCGA AGAGAGTGAA AGTAAAGCCG AGGAGTCAAA AGTTGAAACA AGGGTGGAGG 4140TAGAGAAGGG ATTCTACTAC AAGCTCTATG AGAAATTTAG GGCTGAGATT GCCCCAAGCG 4200AAAAGTATGC AAAGGAAATA ATTGGTGGGA GGCCGTTATT CGCTGGACCC TCGGAAAATG 4260GGGGATTTAG GCTTAGATAT GGTAGAAGTA GGGTGAGTGG ATTTGCAACA TGGAGCATAA 4320ATCCAGCAAC AATGGTTTTG GTTGACGAGT TCTTGGCCAT TGGAACTCAA ATGAAAACCG 4380AGAGGCCTGG GAAAGGTGCA GTAGTGACTC CAGCAACAAC CGCTGAAGGG CCGATTGTTA 4440AGCTAAAGGA TGGGAGTGTT GTTAGGGTTG ATGATTACAA CTTGGCCCTC AAAATAAGGG 4500ATGAAGTCGA AGAGATACTT TATTTGGGAG ATGCAATCAT AGCCTTTGGA GACTTTGTGG 4560AGAACAATCA AACTCTCCTT CCTGCAAACT ATGTAGAGGA GTGGTGGATC CAAGAGTTCG 4620TAAAGGCCGT TAATGAGGCA TATGAAGTTG AGCTTAGACC CTTTGAGGAA AATCCCAGGG 4680AGAGCGTTGA GGAAGCAGCA GAGTACCTTG AAGTTGACCC AGAATTCTTG GCTAAGATGC 4740TTTACGATCC TCTAAGGGTT AAGCCTCCCG TGGAGCTAGC CATACACTTC TCGGAAATCC 4800TGGAAATTCC TCTCCACCCA TACTACACCC TTTATTGGAA TACTGTAAAT CCTAAAGATG 4860TTGAAAGACT TTGGGGAGTA TTAAAAGACA AGGCCACCAT AGAATGGGGC ACTTTCAGAG 4920GTATAAAGTT TGCAAAGAAA ATTGAAATTA GCCTGGACGA CCTGGGAAGT CTTAAGAGAA 4980CCCTAGAGCT CCTGGGACTT CCTCATACGG TAAGAGAAGG GATTGTAGTG GTTGATTATC 5040CGTGGAGTGC AGCTCTTCTC ACTCCATTGG GCAATCTTGA ATGGGAGTTT AAGGCCAAGC 5100CCTTCTACAC TGTAATAGAC ATCATTAACG AGAACAATCA GATAAAGCTC AGGGACAGGG 5160GAATAAGCTG GATAGGGGCA AGAATGGGAA GGCCAGAGAA GGCAAAAGAA AGAAAAATGA 5220AGCCACCTGT TCAAGTCCTC TTCCCAATTG GCTTGGCAGG GGGTTCTAGC AGAGATATAA 5280AGAAGGCTGC TGAAGAGGGA AAAATAGCTG AAGTTGAGAT TGCTTTCTTC AAGTGTCCGA 5340AGTGTGGCCA TGTAGGGCCT GAAACTCTCT GTCCCGAGTG TGGGATTAGG AAAGAGTTGA 5400TATGGACATG TCCCAAGTGT GGGGCTGAAT ACACCAATTC CCAGGCTGAG GGGTACTCGT 5460ATTCATGTCC AAAGTGCAAT GTGAAGCTAA AGCCATTCAC AAAGAGGAAG ATAAAGCCCT 5520CAGAGCTCTT AAACAGGGCC ATGGAAAACG TGAAGGTTTA TGGAGTTGAC AAGCTTAAGG 5580GCGTAATGGG AATGACTTCT GGCTGGAAGA TTGCAGAGCC GCTGGAGAAA GGTCTTTTGA 5640GAGCAAAAAA TGAAGTTTAC GTCTTTAAGG ATGGAACCAT AAGATTTGAT GCCACAGATG 5700CTCCAATAAC TCACTTTAGG CCTAGGGAGA TAGGAGTTTC AGTGGAAAAG CTGAGAGAGC 5760TTGGCTACAC CCATGACTTC GAAGGGAAAC CTCTGGTGAG TGAAGACCAG ATAGTTGAGC 5820TTAAGCCCCA AGATGTAATC CTCTCAAAGG AGGCTGGCAA GTACCTCTTA AGAGTGGCCA 5880GGTTTGTTGA TGATCTTCTT GAGAAGTTCT ACGGACTTCC CAGGTTCTAC AACGCCGAAA 5940AAATGGAGGA TTTAATTGGT CACCTAGTGA TAGGATTGGC CCCTCACACT TCAGCCGGAA 6000TCGTGGGGAG GATAATAGGC TTTGTAGATG CTCTGGTTGG CTACGCTCAC CCCTACTTCC 6060ATGCGGCCAA GAGAAGGAAC TGTGATGGAG ATGAGGATAG TGTAATGCTA CTCCTTGATG 6120CCCTATTGAA CTTCTCCAGA TACTACCTCC CCGAAAAAAG AGGAGGAAAA ATGGACGCTC 6180CTCTTGTCAT AACCACGAGG CTTGATCCAA GAGAGGTGGA CAGTGAAGTG CACAACATGG 6240ATGTCGTTAG ATACTATCCA TTAGAGTTCT ATGAAGCAAC TTACGAGCTT AAATCACCAA 6300AGGAACTTGT GAGAGTTATA GAGGGAGTTG AAGATAGATT AGGAAAGCCT GAAATGTATT 6360ACGGAATAAA GTTCACCCAC GATACCGACG ACATAGCTCT AGGACCAAAG ATGAGCCTCT 6420ACAAGCAGTT GGGAGATATG GAGGAGAAAG TGAAGAGGCA ATTGACATTG GCAGAGAGAA 6480TTAGAGCTGT GGATCAACAC TATGTTGCTG AAACAATCCT CAACTCCCAC TTAATTCCCG 6540ACTTGAGGGG TAACCTAAGG AGCTTTACTA GACAAGAATT TCGCTGTGTG AAGTGTAACA 6600CAAAGTACAG AAGGCCGCCC TTGGATGGAA AATGCCCAGT CTGTGGAGGA AAGATAGTGC 6660TGACAGTTAG CAAAGGAGCC ATTGAAAAGT ACTTGGGGAC TGCCAAGATG CTCGTAGCTA 6720ACTACAACGT AAAGCCATAT ACAAGGCAGA GAATATGCTT GACGGAGAAG GATATTGATT 6780CACTCTTTGA GTACTTATTC CCAGAAGCCC AGTTAACGCT CATTGTAGAT CCAAACGACA 6840TCTGTATGAA AATGATCAAG GAAAGAACGG GGGAAACAGT TCAAGGAGGC CTGCTTGAGA 6900ACTTTAATTC CTCTGGAAAT AATGGGAAGA AAATAGAGAA GAAGGAGAAA AAGGCAAAGG 6960AAAAGCCTAA AAAGAAGAAA GTTATAAGCT TGGACGACTT CTTCTCCAAA CGCTGACCAC 7020AACTTTTAAG TTCTTTCTTG AGAATAAATT CCCAGGTGGC TTAGAGAATG AAGATTGTGT 7080GGTGTGGTCA TGCCTGCTTC TTGGTGGAGG ATAGGGGGAC TAAGATACTA ATCGATCCAT 7140ACCCAGACGT TGATGAAGAC AGAATAGGCA AGGTCGATTA CATTCTAGTT ACCCACGAGC 7200ACATGGATCA CTACGGTAAG ACCCCACTAA TAGCAAAGCT CAGTGATGCC GAGGTTATAG 7260GGCCGAAAAC AGTTTATCTC ATGGCAATAA GTGATGGGCT AACAAAGGTC AGAGAGATAG 7320AGGTGGGACA GGAAATCGAG CTGGGAGATA TTAGGGTTAG GGCATTTTTC ACAGAGCATC 7380CAACAAGCCA GTATCCCCTG GGATATCTAA TTGAAGGAAG CAAAAGAGTG GCTCACTTGG 7440GAGATACATA CTACAGTCCA GCTTTTACAG AGTTGAGGGG AAAGGTTGAT GTTCTTTTGG 7500TTCCAATAGG TGGGAAGTCC ACCGCTAGTG TAAGGGAGGC TGCGGATATA GTGGAGATGA 7560TAAGGCCCAG GATAGCAGTT CCAATGCACT ATGGAACGTA CAGCGAGGCC GATCCTGAAG 7620AGTTCAAGAA GGAGCTCCAA AAAAGGCGCA TATGGGTTTT AGTAAAGGAT CTTAAGCCCT 7680ATGAGGGTTT TGAAATCTGA AGGTGTTTCA ATGCTAAATA CTGAGCTCTT AACCACTGGA 7740GTCAAGGGGT TAGATGAGCT TTTAGGTGGT GGAGTTGCTA AGGGAGTAAT ACTCCAAGTT 7800TACGGGCCAT TTGCCACCGG GAAGACAACT TTTGCAATGC AGGTTGGATT ATTGAATGAG 7860GGAAAAGTGG CTTATGTTGA TACTGAGGGG GGATTCTCCC CCGAAAGGTT AGCTCAAATG 7920GCAGAATCAA GGAACTTGGA TGTGGAGAAA GCACTTGAAA AGTTCGTGAT ATTCGAACCT 7980ATGGATTTAA ACGAGCAAAG ACAGGTAATT GCGAGGTTGA AAAATATCGT GAATGAAAAG 8040TTTTCTTTAG TTGTGGTCGA CTCCTTTACG GCCCATTATA GAGCGGAGGG GAGTAGAGAG 8100TATGGAGAAC TTTCCAAGCA AGTCCAAGTT CTTCAGTGGA TTGCCAGAAG AAAAAACGTT 8160GCCGTTATAG TTGTCAATCA AGTTTATTAC GATTCAAACT CAGGAATTCT TAAACCAATA 8220GCTGAGCACA CCCTGGGGTA CAAAACAAAG GACATCCTCC GCTTTGAAAG GCTTAGGGTT 8280GGAGTGAGAA TTGCAGTTCT GGAAAGGCAT AGGTTTAGGC CAGAGGGTGG GATGGTATAC 8340TTCAAAATAA CAGATAAAGG ATTGGAGGAT GTAAAAAACG AAGATTAGAG CCTGTCGTAG 8400ACCTCCTGGG CAATCCTCAG CGTTGCCTTA TAGAGCTTCT CACTAATAAT 8450序列号:6序列长度:45序列类型:核酸链型:单链拓扑构型:直链型序列种类:其他核酸(合成DNA)序列:CCGGAACCGC CTCCCTCAGA GCCGCCACCC TCAGAACCGC CACCC 45序列号:7序列长度:17序列类型:核酸链型:单链拓扑构型:直链型序列种类:其他核酸(合成RNA)序列:GUUUUCCCAG UCACGAC 17序列号:8序列长度:23 序列类型:核酸链型:单链拓扑构型:直链型序列种类:其他核酸(合成DNA)序列:GATGAGTTCG TGTCCGTACA ACT 23序列号:9序列长度:22序列类型:核酸链型:单链拓扑构型:直链型序列种类:其他核酸(合成DNA)序列:ACAAAGCCAG CCGGAATATC TG 22序列号:10序列长度:22序列类型:核酸链型:单链拓扑构型:直链型序列种类:其他核酸(合成DNA)序列:TACAATACGA TGCCCCGTTA AG 22序列号:11序列长度:32序列类型:核酸链型:单链拓扑构型:直链型序列种类:其他核酸(合成DNA)序列:CAGAGGAGGT TGATCCCATG GATGAATTTG TA 32序列号:12序列长度:32序列类型:核酸链型:单链拓扑构型:直链型序列种类:其他核酸(合成DNA)序列:TTTAGTGGGT GGTGCCCATG GAGCTTCCAA AG 32