CN1132529A - Dna测序酶 - Google Patents

Dna测序酶 Download PDF

Info

Publication number
CN1132529A
CN1132529A CN94193642A CN94193642A CN1132529A CN 1132529 A CN1132529 A CN 1132529A CN 94193642 A CN94193642 A CN 94193642A CN 94193642 A CN94193642 A CN 94193642A CN 1132529 A CN1132529 A CN 1132529A
Authority
CN
China
Prior art keywords
dna polymerase
anomaly
glu
leu
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN94193642A
Other languages
English (en)
Inventor
迈伦·F·古德曼
琳达·J·雷哈-克兰茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Alberta
University of Southern California USC
Original Assignee
University of Alberta
University of Southern California USC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Alberta, University of Southern California USC filed Critical University of Alberta
Publication of CN1132529A publication Critical patent/CN1132529A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Abstract

本发明提供了没有3′→5′核酸外切酶活性的B族变异型DNA聚合酶。这些变异型聚合酶具有作为DNA测序聚合酶的用途。已经开发了以前不曾使用过的用B族DNA聚合酶和链终止核苷酸完成的DNA测序方法。本发明公开的方法涉及使用迄今为止未知的具有DNA测序用途的B族DNA聚合酶,例如变异型或野生型的T4噬菌体DNA聚合酶或大肠杆菌DNA聚合酶II,以及脱氧核苷酸和链终止核苷酸的新型组合。

Description

DNA测序酶
本发明涉及对F.Sanger研究出的DNA测序方法(Sanger,F.,Nick-len,S.,Coulson,A.R.(1977)Proc.Natl.Acad.Sci.U.S.A.74,5463-5467)的改进以及可用于DNA测序的新酶。Sanger的测序方法是基于在引发的DNA模板、2′-脱氧核苷三磷酸(dNTP,参见图1)以及2′,3′-双脱氧核苷三磷酸(ddNTP,图1)存在下体外DNA的合成反应。当ddNTP被DNA聚合酶引入到多核苷酸链中时,可终止进一步的链的延伸。因此,其DNA产物是与模板互补并且以特定的双脱氧核苷酸为结尾的一系列多核苷酸链。根据大小可将DNA测序产物分离开,从产物的模式特征得出DNA序列。
一般来说,来自各种各样生物体的DNA聚合酶以及各种各样的使链终止的核苷酸应适用于对DNA进行测序。实际上,发现很少DNA聚合酶和使链终止的核苷酸适合于该目的。作为一种DNA测序聚合酶的例子,对噬菌体T7 DNA聚合酶,SequenaceTM的研制进行评述(Tabor,S.,以及Richardson,C.C(1990)J.Biol.Chem.265,8322-8328)。为了获得确切的DNA序列,大多数测序产物必须是由一种双脱氧核苷酸终止的,并且所有测序产物必须是等量的。两种噬菌体T7 DNA聚合酶可降解DNA测序产物,因而为了防止以双脱氧核苷酸结尾的测序产物发生降解必须消除这两种酶的这种活性。通过构建T7 DNA聚合酶的核酸外切酶缺陷型变异体可以去除这种活性,即3′→5′核酸外切酶活性。T7 DNA聚合酶也具有焦磷酸解活性,它能够降解测序产物。加入焦磷酸酶可以降解在DNA测序反应中产生的焦磷酸;没有焦磷酸,就没有焦磷酸解作用。使用Mn2+替代Mg2+可对测序反应进一步优化,这样可使反应产物更均等地分布。虽然对T7 DNA聚合酶开发成为测序聚合酶进行的评述过于简单,但这一评述说明了一个关键问题:为了利用链终止测序方法获得高质量的DNA序列信息,必需对天然DNA聚合酶进行修饰以及优化反应条件。
至今为止还没有取得使用链终止方法的最适DNA测序条件。仍可观察到发生歧义的序列信息,这使得对两条DNA链的DNA序列进行测定是必需的。利用Mn2+替代Mg2+还提高了用于测序反应所需的DNA模板的量。因此,开发可以改进或完善现存测序方法的新方法是有益的。
野生型T4 DNA聚合酶基因已经被克隆了并且表达了蛋白质产物(Lin,T.-C.,Rush,J.R.,Spicer,E.K.和Konigsberg,W.H.(1987)Proc.Natl.Acad.Sci.USA.84,7000-7004;Lin等人的美国专利4,935,361)以及大肠杆菌DNA聚合酶II也已被克隆和表达(Bo-nner,C.A.,Hays,S.,McEntee,K.,和Goodman,M.F.(1990)Proc.Natl.Acad.Sci.u.S.A.87,7663-7667)。已将标准的针对寡核苷酸的诱变技术用于构建新类型的T4 DNA聚合酶以及大肠杆菌DNA聚合酶II。因此,现已存在廉价地大量制备野生型和变异型T4DNA聚合酶以及大肠杆菌DNA聚合酶II的方法。
本发明另一方面使用遗传分析法鉴定具有适用于DNA测序特性的DNA聚合酶。T4 DNA聚合酶是最广泛地进行过遗传学研究的DNA聚合酶之一(Reha-Krantz,L.J.(1993)in Molecular Biology ofBacteriophage T4,ed.Karam J.,American Association forMicrobiology,印刷中);因此,已经鉴定出的某些突变DNA聚合酶可能具有适用于DNA测序的特性,并且可以直接分离新的突变体。用于分离具有适用于DNA测序特性的新的T4 DNA聚合酶的方法是特别有用的。
本发明一方面提供了可用作DNA测序聚合酶的新的酶。这些酶是从B族DNA聚合酶进行遗传突变得到的。这些突变去除了该新的B族DNA聚合酶的3′→5′核酸外切酶活性。
本发明另一方面提供了可以使噬菌体T4 DNA聚合酶和大肠杆菌DNA聚合物II能用作DNA测序聚合酶的方法。可以将噬菌体T4 DNA聚合酶和大肠杆菌DNA聚合酶II转变为DNA测序聚合酶的DNA聚合酶修饰法同样可用于修饰与这两种聚合酶具有蛋白质序列同源性的DNA聚合酶。具有类似于T4 DNA聚合酶和大肠杆菌DNA聚合酶II的蛋白质序列的DNA聚合酶包括,但不限于,一组被称为B族DNA聚合酶的DNA聚合酶(Braithwaite D.K.和Ito,J.(1993)Nucl.Acids Res.21,787-802)。特别相关的是来自T2和T6噬菌体的DNA聚合酶,它们与T4 DNA聚合酶具有广泛的蛋白质序列同源性。这里描述的方法的另一个扩展是其功能类似于T4 DNA聚合酶和大肠杆菌DNA聚合酶II的DNA聚合酶也可用于链终止核苷酸方法和下文公开的方法进行DNA测序。
本发明另一方面提供了鉴别经过修饰的DNA聚合酶的方法,所述DNA聚合酶在蛋白质序列中有一个或多个特定氨基酸替代,这种替代改善了给定的DNA聚合酶在DNA测序方面的应用。
附图简述
图1描绘了用于实施本发明的标准核苷酸和核苷酸类似物的结构。
图2描绘了利用变异的大肠杆菌DNA聚合酶II和T4 DNA聚合酶产生的DNA测序凝胶。
图3描绘了一种DNA测序凝胶,其中与其他标准核苷酸相比所使用的dATP的浓度十分低。
图4描绘了由野生型和突变型T4 DNA聚合酶将引物延伸通过一个模板上的非碱基位点(x)。
通过设计一种新的遗传选择方案可以完成本发明的一方面,即鉴别出具有新的特性的被修饰的DNA聚合酶,所述新特性可改善该被修饰的DNA聚合酶进行DNA测序反应的能力。所述新的遗传选择方案可鉴别出具有良好DNA复制活性的被修饰的DNA聚合酶。已经设计了有关T4 DNA聚合酶的新的遗传选择方案。
如果使用链终止核苷酸的非标准或新的组合,可以将目前还不能用作测序聚合酶的T4 DNA聚合酶(SEQ ID NO.3和4)和大肠杆菌DNA聚合酶(SEQ ID NO.5和6)用作Sanger型反应中的DNA测序聚合酶。除了这一发现外,还发现T4 DNA聚合酶和大肠杆菌DNA聚合酶II中3′→5′核酸外切酶活性失活可以改善所获得的DNA序列信息的质量。又一方面,已经发现另外的聚合酶修饰,当与可减低3′→5′核酸外切酶活性的其他修饰结合时,具有产生一种具良好的DNA测序特性的多重修饰的DNA聚合酶的潜力。由于与T4 DNA聚合酶具有广泛的序列同源性,DNA聚合酶如噬菌体T2(SEQID NO.1和2)以及T6 DNA聚合酶特别适合用于本发明的方法。
如果用阿糖核苷酸(图1),阿糖UTP(araUTP)和阿糖CTP(araCTP)替代标准的链终止核苷酸ddTTp和ddCTP,则可将T4 DNA聚合酶和大肠杆菌DNA聚合酶II用作有效的DNA测序聚合酶。标准的嘌呤双脱氧核苷酸(图1),ddATP和ddGTP,是T4 DNA聚合酶和大肠杆菌DNA聚合酶II的有效的链终止核苷酸。应用T4 DNA聚合酶和大肠杆菌DNA聚合酶II的DNA测序反应不同于标准DNA测序反应,该反应中使用了新组合的链终止核苷酸。虽然原则上讲可使用任何链终止核苷酸,但这些DNA聚合酶在其将这些核苷酸掺入到DNA链中的能力方面明显不同。对于T4 DNA聚合酶和大肠杆菌DNA聚合酶II,它们对ddTTP和ddCTP的低掺入率特性使这些标准链终止核苷酸无法在测序方案中使用。由T4 DNA聚合酶和大肠杆菌DNA聚合酶II能相对有效地掺入另一种可选择的链终止阿糖核苷酸、阿糖CTP和阿糖UTP的这一发现使这些DNA聚合酶可用作测序聚合酶。下文方法I中描述了利用由新组合的链终止核苷酸-阿糖CTP,阿糖UTP,ddATP和ddGTP参与反应的DNA测序方法。
另一发现是,T4 DNA聚合酶和大肠杆菌DNA聚合酶II的3′→5′核酸外切酶活性的丧失或显著降低提高了用方法I测序反应获得的DNA序列信息的质量。通过氨基酸替代(包括但不限于,在该酶中有一个或多个下列氨基酸替代:D112A+E114A,D219A和D324A),可以显著降低T4 DNA聚合酶3′→5′核酸外切酶活性。在本文中使用的上述命名中,使用了代表氨基酸的单字母代码。两个氨基酸的单字母代码中间的数字是密码子的编号。例如,D112A+E114A表示丙氨酸(A)替代了第112位密码子的天冬氨酸(D)。D112A+E114A表示在修饰的DNA聚合酶中有两个氨基酸替代。为了获得这些变异体,使用下列突变:对于D112A,用一个C核苷酸替代第334位的A核苷酸,从而实现了D氨基酸改变为A氨基酸,正如本领域内普通技术人员熟知的,其他核苷酸的变化也能够实现同样的变化;对于E114A,用C核苷酸替代第340位的A核苷酸,正如已知的,其它核苷酸的变化也可实现相同的氨基酸变化;对于D219A,分别用C和G核苷酸替代第655和656位的A和C核苷酸,正如已知的,其它核苷酸变化也可实现相同的氨基酸变化;对于D324A,用C核苷酸替代第970位A核苷酸,正如已知的,其它核苷酸变化也可以实现相同氨基酸变化。通过氨基酸替代(包括但不限于下列氨基酸替代:D156A+E158A),可以显著地降低大肠杆菌DNA聚合酶II3′→5′核酸外切酶活性。为了得到这些突变体,使用下列突变:对于D156A,用C核苷酸替代第467位的A核苷酸,正如已知的,用其他核苷酸变化也可以实现相同的氨基酸变化;对于E158A,用C核苷酸替代473位的A核苷酸,正如已知的,其他核苷酸变化也可以实现相同的氨基酸变化。采用标准的寡核苷酸诱变方法(例如,Kunkle,T.A.,Roberts,J.D.和Zakour,R.A.(1987)Method.Enz.154,367-382)可以构建T4 DNA聚合酶和大肠杆菌DNA聚合酶II的3′→5′核酸外切酶缺陷变异体。
本发明的另一方面可以使用标准DNA测序反应中没有使用的链终止核苷酸来达到。如果用3′氨基-2′,3′-双脱氧核糖核苷酸(3′-NH2dNTP)(图1)替代标准ddNTP,也可以将T4 DNA聚合酶和大肠杆菌DNA聚合酶II用作有效的DNA测序聚合酶。在下文的方法II中描述了该测序方法。在方法II的反应中可使用未经修饰(野生型)T4DNA聚合酶和3′→5′核酸外切酶缺陷变异体;大肠杆菌DNA聚合酶II的3′→5′核酸外切酶缺陷变异体也已被成功地用于方法II的反应中。
如果四种标准dNTP中一种的浓度非常低,T4 DNA聚合酶的3′→5′核酸外切酶缺陷型也可以在没有核苷酸类似物的情况下进行DNA测序。例如dGTP,dCTP和dTTP的浓度为100μM而dATP的浓度为0.1μM-1μM,那么所观察到的测序产物终止于需要掺入dATP之前的一个位置。作为平行进行的反应,使一种dNTP处于低浓度,而其他三种dNTP为高浓度,这样即可测出DNA序列。该测序方法在下文中称为方法III。
通过设计一种用于筛选新DNA聚合酶的新方案而达到了第三个目的,即鉴别具有新特性的变异或经修饰DNA聚合酶,所述新特性增强了该聚合酶的测序特性。对于T4噬菌体已研究出了一种遗传选择类型的新方案。该基础方案是从T4噬菌体毒株开始的,该毒株的DNA聚合酶基因中有一个或多个突变,从而产生一种变异(突变)DNA聚合酶,就DNA复制方面而言该酶部分缺陷。几种DNA聚合酶修饰类型可降低DNA聚合酶有效地复制DNA的能力。例如,DNA聚合酶与DNA模板或dNTP结合能力或者DNA聚合酶在DNA模板上易位能力的变化将降低DNA复制效率。对于T4噬菌体,可容易地鉴别具有降低的DNA复制活性的DNA聚合酶突变体。假如感染中使用的细菌宿主含有optA1突变,具有DNA复制能力部分缺陷的突变DNA聚合酶的T4噬菌体毒株不能合成DNA。换句话说,大肠杆菌optA1宿主限制了具有缺失DNA复制活性的突变DNA聚合酶的T4毒株的生长。所观察到的大肠杆菌optA1毒株限制的原因是产生的降解dGTP的酶的量增加(Wurgler,S.S.,以及Richardson,C.C.(1990)Proc.Natl.Acad.Sci.U.S.A.87,2740-2744)。因此,如果核苷酸总量,尤其dGTP降低,则具有DNA复制活性降低的变异DNA聚合酶的T4噬菌体毒株不能复制DNA并且不能产生子代噬菌体。
为了研究遗传选择方案,已经设定了可用于鉴别缺失DNA复制能力的DNA聚合酶以及用于限制具有这种缺陷型DNA聚合酶的噬菌体产生子代,即限制在感染的大肠杆菌optA1细菌宿主中产生噬菌体子代的条件。下文中描述的这些条件可用于选择具有优良DNA复制能力的进一步修饰(突变)的DNA聚合酶。如果具降低的DNA复制活性的变异DNA聚合酶被进一步修饰,例如通过一个或多个其他氨基酸替代进行修饰,则其他突变/氨基酸替代可以校正或补偿初始缺失的DNA复制活性。因而这些被进一步修饰的DNA聚合酶能够在大肠杆菌optA1宿主中复制DNA而产生子代噬菌体。因此,用前面被限制在宿主中产生子代的噬菌体感染的大肠杆菌optA1宿主中检测子代噬菌体便可以选择出多重突变的DNA聚合酶,该酶具有初始突变(降低DNA复制活性的氨基酸替代)以及一个或多个新的突变,它们编码其他的氨基酸替代,这种替代可以校正或补偿起始DNA复制缺陷。通过利用标准程序(McPheeters,D.S.,Christensen,A.,Young,E.T.,Stormo,G.,以及Gold,L.(1986)Nucleic Acid Res.14,5813-5826;Reha-Krantz,L.J.(1988)J.Mol.Biol.202,711-724)对噬菌体DNA聚合酶基因进行测序可以鉴别新的校正或补偿突变体(在遗传术语中也称为抑制突变)。可将该新的突变导入到噬菌体T4 DNA聚合酶基因或导入到T4 DNA聚合酶表达载体中以便进一步研究。与具有降低的DNA复制能力的初始噬菌体T4 DNA聚合酶相反,该新的变异DNA聚合酶具有良好的DNA复制能力,因为这些变异DNA聚合酶的选择是以其克服、补偿或校正具降低的DNA复制活性的变异DNA聚合酶的缺陷能力为基础的。用于鉴别具良好DNA复制能力的变异DNA聚合酶的遗传方案是高度敏感的,因为可从108-109个噬菌体群体中选出一个具有上述特性的单个噬菌体。
本发明所述的具优良DNA复制活性的变异DNA聚合酶具有利于用作DNA测序聚合酶的特性,例如导致测序产物更均匀分布的被增强的引物延伸以及在由未修饰DNA聚合酶可以阻止或妨碍复制的模板区域增强DNA复制。据预测,具有良好DNA复制能力的T4 DNA聚合酶变异体可以改善方法I,II和III产生的DNA序列信息的质量。
如果这种缺陷型DNA聚合酶可以被鉴定并且如果具校正或补偿突变的变异体可以被选择,则可将本文描述的用于检测具良好DNA复制能力的变异DNA聚合酶的遗传选择方案应用于其它生物体的DNA聚合酶上。
DNA测序方法I
其3′→5′核酸外切酶活性被显著降低的T4 DNA聚合酶,例如具D112A+E114A,D219A或D324A氨基酸替代的变异形式,以及3′→5′核酸外切酶活性显著降低的大肠杆菌DNA聚合酶II,例如具D156A+E158A氨基酸替代的变异形式,可用作使用下列链终止核苷酸:dd-ATP,ddGTP,阿糖CTP和阿糖UTP(图1)的DNA测序聚合酶。
图2显示三个DNA测序凝胶的照片。用方法I获得的DNA测序模式在A和B板,1-4泳道,以及C板。A板显示用大肠杆菌DNA聚合酶II的核酸外切酶缺陷型变异体的DNA测序反应。用ddGTP进行的反应是在泳道1,用ddATP进行的反应是在泳道2,用阿糖CTP进行的反应是在泳道3,以及用阿糖UTP进行的反应是在泳道4。B板显示用T4噬菌体DNA聚合酶的核酸外切酶缺陷型进行的NAA测序反应。泳道1是用ddGTP进行的反应,泳道2是用ddATP进行的反应,泳道3是用阿糖CTP进行的反应,以及泳道4是用阿糖UTP进行的反应。A和B板上的反应具有Mg2+作为二价金属阳离子。也进行了用Mn2+替代Mg2+的测序反应。在C板左边,泳道1-4中显示的是用大肠杆菌DNA聚合酶II的核酸外切酶缺陷型和Mn2+进行的方法I反应;C板右边1-4泳道显示由T4 DNA聚合酶的核酸外切酶缺陷型进行的反应。C板1-4泳道具有与ddGTP(泳道1),ddATP(泳道2),阿糖CTP(泳道3)和阿糖UTP(泳道4)进行的反应。
DNA测序方法II
T4 DNA聚合酶的野生型(未修饰)和3′→5′核酸外切酶缺陷型以及大肠杆菌DNA聚合酶II的3′→5′核酸外切酶缺陷型可用作以3′氨基-2′,3′-双脱氧核糖核苷酸(图1)作为链终止核苷酸的DNA测序聚合酶。图2,A板的5-7泳道显示大肠杆菌DNA聚合物酶II的核酸外切酶缺陷型进行的方法II反应。泳道5显示用3′-氨基-2′,3′-双脱氧GTP进行的反应;泳道6显示用3′氨基-2′,3′-双脱氧ATP进行的反应;泳道7显示用3′氨基-2′,3′-双脱氧TTP进行的反应。在B板泳道5-7中显示了T4 DNA聚合酶的核酸外切酶缺陷型进行的方法II的反应。泳道5,6和7显示分别用3′氨基-2′,3′双脱氧GTP、-ATP和-TTP进行的反应。
这些资料证明,将下列链终止核苷酸:ddGTP或3′氨基-2′,3′-双脱氧GTP;ddATP或3′氨基-2′,3′-双脱氧ATP;阿糖UTP或3′氨基-2′,3′双脱氧-TTP;以及阿糖CTP结合使用,大肠杆菌DNA聚合酶II和T4噬菌体DNA聚合酶的核酸外切酶缺陷型可以产DNA序列信息。鉴于用3′-氨基-2′,3′双脱氧GTP、-ATP和-TTP获得好的序列模式,3′氨基-2′,3′-双脱氧-CTP也可能是一种有效的链终止核苷酸。还没有研究出适用于方法I或II的最佳条件以便获得图2显示的反应具有同等的带强度或者增加可读序列的长度。然而,该测序方法可以提供至少300个碱基的序列信息。对于用3′-氨基-2′,3′-双脱氧核糖核苷三磷酸进行的测序反应并不需要T4 DNA聚合酶的核酸外切酶缺陷型。
方法I和II的模式试验条件(图2)
标记反应
5μl的核酸外切酶缺陷型DNA聚合酶;对于T4 DNA聚合酶或大肠杆菌DNA聚合酶II为300-400单位/ml。1个单位的T4 DNA聚合酶在30℃,30分钟内可催化10 nmol的dTMP掺入到DNA中。1个单位的大肠杆菌DNA聚合酶II在37℃1分钟内可催化1 pmol的dTMP掺入到DNA中。虽然该反应通常是在37℃进行的,但在35℃-约42℃温度范围内也可以完成反应。
15μl引物-M13 DNA复合物,15nM
15μl的标记反应溶液:2μM dGTP,dCTP,dTTP;1μM[α32P]dATP;50mM Tris-HCl(pH 8.5);对于大肠杆菌DNA聚合酶II使用5mM MgCl2或者6mM MnCl2;对于T4 DNA聚合酶使用5mM MgCl2或者0.5mM MnCl2;5mM二硫苏糖醇;50μg/ml牛血清白蛋白。
反应混合物在37℃保温5分钟。
还可以在5′-末端,或者通过包含在延伸反应中的一种标记核苷酸和其他标准方法对该引物进行标记。
延伸反应
4μl标记反应混合物(来自上文所述)
4μl终止溶液:50μM dGTP,dATP,dCTP和dTTP;以及下面列出的终止类似物之一:
方法I:ddGTP,1.6mM;ddATP,0.7mM;阿糖CTP,0.5mM;阿糖UTP,0.5mM。
方法II:3′-氨基-2′,3′-双脱氧GTP,0.5mM;3′-氨基-2′,3′-双脱氧ATP,0.5mM;3′-氨基-2′,3′双脱氧TTP,0.5mM。
反应是在37℃保温5分钟完成的。通过加入甲酰胺/EDTA而终止反应。
DNA测序方法III(图3)
在一种dNTP为低浓度(例如,0.1μM-1μM)以及另外三种dNTP为高浓度(100μM)的反应中,T4 DNA聚合酶的核酸外切酶缺陷型可产生DNA序列信息(图3)。与用核苷酸类似物进行测序反应一样而产生了DNA测序模式,所不同的是由该方法产生的测序产物终止于需要低浓度的dNTP前面的一个位置上。
模式试验条件:
25mM N-2-羟乙基哌嗪-N′-2-乙磺酸(Hepes)(pH 7.5)60mM NaOAc
1mM二硫苏糖醇
100μM dGTP,dCTP和dTTP
0.1μM dATP(对于较长DNA产物用1μM dATP)
0.2mg/ml牛血清白蛋白
7.5nM5′[32P]标记的引物-模板(以3′-引物末端浓度表示)
30nM核酸外切酶缺陷型T4 DNA聚合酶
6mM Mg(OAc)2
图3中显示的反应含有0.1μM dATP并且在30℃保温1分钟。还没有找到获得高数目序列信息的最佳条件;但是,dNTP的低浓度为1μM的反应产生的序列信息大于100个碱基。
具有有利于DNA测序特性的新的T4 DNA聚合酶的分离
在本发明这一方面的第一个步骤是鉴定具有在DNA复制的某些方面有缺陷的变异(突变)DNA聚合酶的T4菌株。选择出含有下文中列出的氨基酸替代的突变DNA聚合酶的T4菌株,但是遗传选择方案的应用并不局限于这些突变体,任一种缺失DNA复制能力的突变DNA聚合酶都可使用。在DNA复制的某些方面部分缺陷的变异(突变)型T4 DNA聚合酶不能在大肠杆菌optA1宿主内复制DNA。
含有具W213S,I417V,A737V或A777V氨基酸替代的突变DNA聚合酶的T4菌株不能在大肠杆菌optA1宿主中复制。为了获得这些变异体,应用下列突变:对于W213S,用C核苷酸替代637位的G核苷酸;对于I417V,用G核苷酸替代1249位的A核苷酸;对于A737V,用T核苷酸替代第2209位的C核苷酸;对于A777V,用T核苷酸替代第2329位的C核苷酸。众所周知,其他核苷酸替代也可以引起同样的氨基酸变化。
第二步骤是选择能在大肠杆菌optA1宿主中复制DNA的T4菌株,即使该DNA聚合酶仍保留了可单独降低DNA复制能力并且阻碍DNA在大肠杆菌optA1宿主中复制的氨基酸替代。通过自发突变或者通过诱变处理而已经获得第二个DNA聚合酶突变(或多个突变)的T4菌株将可以在大肠杆菌optA1宿主中复制DNA并且产生子代噬菌体,所述第二个DNA聚合酶突变编码一种新氨基酸替代,该替代可以校正或补偿由第一个氨基酸替代产生的DNA复制缺陷。由此鉴别出的DNA聚合酶具有至少两个氨基酸替代:初始氨基酸替代以及回复DNA复制活性的一个或多个新氨基酸替代。该遗传选择方案是高度敏感性的。可从108-109噬菌体群体中选出一个带有突变型DNA聚合酶的噬菌体,所述突变型DNA聚合酶含有起始氨基酸替代以及回复DNA复制活性的氨基酸替代。
第三个步骤是鉴别DNA复制回复突变。该步骤利用标准测序程序,在T4 DNA聚合酶基因中寻找新的突变。一旦鉴别到了新的突变,可利用标准程序将该突变导入到噬菌体或者导入到T4 DNA聚合酶表达载体中。与初始的DNA复制缺陷型DNA聚合酶有所不同,带有校正或补偿氨基酸替代的DNA聚合酶具有良好的DNA复制活性。利用上文中描述的遗传选择方案发现的氨基酸替代的模式包括但不限于I50L,G82D,G255S和E743K。为了获得这些突变体,使用下列突变:对于I50L,用C核苷酸替代148位的A核苷酸;对于G82D,用A核苷酸替代244位的G核苷酸;对于G255S,用A核苷酸替代第763位的G核苷酸;对于E743K,用A核苷酸替代第2227位的G核苷酸。众所周知,其他核苷酸替代也可以实现相同氨基酸变化。
具有能提供加强的DNA复制活性的氨基酸替代的变异(突变,经修饰)T4 DNA聚合酶具有有利于DNA测序的新特性。DNA测序中一个经常出现的问题是在测序反应中使用的DNA聚合酶在某些模板位点停止或离解。在链延伸中出现这种过早终止的结果是产生了未以链终止核苷酸结尾的测序产物。另一个问题是模板序列影响DNA聚合酶对核苷酸和链终止核苷酸的掺入,导致序列产物分布不均匀。具有加强的DNA复制活性的新的DNA聚合酶克服了这些问题。在引物延伸检验中已经检测了G82D-T4 DNA聚合酶(也称为T4 mel 62 DNA聚合酶),并且已经发现该新的DNA聚合酶可以延伸不能由野生型T4DNA聚合酶延伸的引物。图4给出了G82D-T4 DNA聚合酶合成的一个实例。
图4描绘了利用三种T4聚合酶复制DNA模板损伤处(一种非碱基损伤-在模板链上缺失了一个碱基,由X表示)。野生型T4聚合酶难以掺入一种与X相对的核苷酸,如由非常浅的带所示。3′-核酸外切酶缺陷T4聚合酶突变体EXO-17能够掺入与X相对的核苷酸(注意X处的强带)并继续在损伤以外合成。T4 mel 62聚合酶是一种突变型酶(它在体内表达一种突变子表现型),它具有明显正常(野生型)水平的3′-核酸外切酶和聚合酶活性。而且它也能够掺入相对于X的核苷酸,并且在X之外继续合成。最有趣的是在X之外没有“停止”带的延续,这表明mel 62 DNA聚合酶保留的与引物模板DNA的结合比EXO-17或者野生型聚合酶更紧密。因此,该酶能够克服模板和底物障碍而合成长的DNA链。
我们设想,将提供良好DNA复制活性的一个或多个氨基酸替代与显著降低3′→5′核酸外切酶活性的一个或多个氨基酸替代相结合,从而制备出多重修饰的新T4 DNA聚合酶,该酶具有有利于用作DNA测序聚合酶的几个特性。
已知可将聚合酶,例如T7噬菌体DNA聚合酶,与其辅助蛋白质一起联用,从而通过降低聚合酶与待测序DNA链相脱离的几率而提高该聚合酶的工作性能。
对于T4聚合酶而言,其辅助蛋白包括但不限于下列T4基因产物:基因产物32,41,45和44/62复合物。对于大肠杆菌DNA聚合酶II而言,辅助蛋白是:β蛋白质;γ蛋白质复合物其中γ复合物是由γ、δ、δ′、χ、ψ组成;和SSB(单链结合蛋白)(注意:β蛋白质和γ复合物是大肠杆菌聚合酶III辅助蛋白质)。利用这些辅助蛋白质可以提高聚合酶在DNA测序中的效率。
在已经阐明和描述本发明的基本新特征后,本领域内技术人员能够进行各种形式上删改、替代和变化而不违背本发明精神。因此本发明仅由下列权利要求限定范围。
序列表
(1)综合资料
  (i)申请人:Coodman,Myron F.
           Reha-Krantz,Linda J.
  (ii)发明名称:DNA测序酶
  (iii)序列数:6
  (iv)通信地址:
      (A)收件人:Robbins,Berliner&Carspm
      (B)街道:201 North Figueroa Street,Fifth Floor
      (C)城市:Los Angeles
      (D)州:California
      (E)国家:U.S.A.
      (F)ZIP:90012-2628
  (v)计算机可读形式:
      (A)媒体类型:软盘
      (B)计算机:IBM PC兼容
      (C)操作系统:PC-DOS/MS-DOS
      (D)软件:PatentIn Release#1.0,Version#1.25
  (vi)现有申请资料
      (A)申请号:
    (B)申请日:
    (C)分类:
(viii)律师/代理人资料
    (A)姓名:Spitals,John P.
    (B)登记号:29,215
    (C)参照/档案号:1920-305
(ix)电信资料:
    (A)电话:(213)977-1001
    (B)传真:(213)977-1003(2)SEQ ID NO:1的资料:
(i)序列特征:
    (A)长度:2760碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线性
(ii)分子类型:DNA(基因组)
(ix)特征:
    (A)名称/关键词:CDS
    (B)位置:1..2760
(xi)序列描述:SEQID NO:1:CGT CAT CTT CAT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT         48Arg His Leu His Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe1               5                  10                  15TTT TTT TTT TTT ATT ATT ATG AAA GAA TTT TAT ATC TCT ATC GAA ACA         96Phe Phe Phe Phe Ile Ile Met Lys Glu Phe Tyr Ile Ser Ile Glu Thr
         20                  25                  30GTC GGA AAT AAT ATT ATT GAA CGT TAT ATT GAT GAA AAC GGA AAG GAA        144Val Gly Asn Asn Ile Ile Glu Arg Tyr Ile Asp Glu Asn Gly Lys Glu
     35                  40                  45CGT ACT CGT GAA GTA GAA TAT CTT CCG ACT ATG TTT AGG CAT TGT AAG        192Arg Thr Arg Glu Val Glu Tyr Leu Pro Thr Met Phe Arg His Cys Lys
 50                  55                  60GAA GAG TCA AAA TAC AAA GAC ATC TAT GGT AAA AAC TGT GCT CCT CAA        240Glu Glu Ser Lys Tyr Lys Asp Ile Tyr Gly Lys Asn Cys Ala Pro Gln65                  70                  75                  80AAA TTT CCA TCA ATG AAA GAT GCT CGA GAT TGG ATG AAG CGA ATG GAA        288Lys Phe Pro Ser Met Lys Asp Ala Arg Asp Trp Met Lys Arg Met Glu
             85                  90                  95GAC ATC GGT CTC GAA GCT CTC GGT ATG AAC GAT TTT AAA CTC GCT TAT        336Asp Ile Gly Leu Glu Ala Leu Gly Met Asn Asp Phe Lys Leu Ala Tyr
        100                 105                 110ATC AGT GAT ACG TAT GGT TCA GAA ATT GTT TAT GAC CGA AAA TTT GTT        384Ile Ser Asp Thr Tyr Gly Ser Glu Ile Val Tyr Asp Arg Lys Phe Val
    115                 120                 125CGT GTA GCT AAC TGT GAC ATT GAG GTT ACT GGT GAT AAA TTT CCT GAC        432Arg Val Ala Asn Cys Asp Ile Glu Val Thr Gly Asp Lys Phe Pro Asp
130                 135                 140CCA ATG AAA GCA GAA TAT GAA ATT GAT GCT ATC ACT CAT TAT GAT TCA        480Pro Met Lys Ala Glu Tyr Glu Ile Asp Ala Ile Thr His Tyr Asp Ser145                 150                 155                 160ATT GAC GAC CGT TTT TAT GTT TTC GAC CTT TTG AAT TCA ATG TAC GGT        528Ile Asp Asp Arg Phe Tyr Val Phe Asp Leu Leu Asn Ser Met Tyr Gly
            165                 170                 175TCA GTA TCA AAA TGG GAT GCA AAG TTA GCT GCT AAG CTT GAC TGT GAA        576Ser Val Ser Lys Trp Asp Ala Lys Leu Ala Ala Lys Leu Asp Cys Glu
        180                 185                 190GGT GGT GAT GAA GTT CCT CAA GAA ATT CTT GAC CGA GTA ATT TAT ATG        624Gly Gly Asp Glu Val Pro Gln Glu Ile Leu Asp Arg Val Ile Tyr Met
    195                 200                 205CCA TTT GAT AAT GAG CGT GAT ATG CTC ATG GAA TAT ATT AAT CTC TGG        672Pro Phe Asp Asn Glu Arg Asp Met Leu Met Glu Tyr Ile Asn Leu Trp
210                 215                 220GAA CAG AAA CGA CCT GCT ATT TTT ACT GGT TGG AAT ATT GAG GGG TTT        720Glu Gln Lys Arg Pro Ala Ile Phe Thr Gly Trp Asn Ile Glu Gly Phe225                 230                 235                 240GAC GTT CCG TAT ATC ATG AAT CGC GTT AAA ATG ATT CTG GGT GAA CGC         768Asp Val Pro Tyr Ile Met Asn Arg Val Lys Met Ile Leu Gly Glu Arg
            245                 250                 255AGT ATG AAA CGT TTC TCT CCA ATC GGT CGG GTA AAA TCT AAA CTA ATT         816Ser Met Lys Arg Phe Ser Pro Ile Gly Arg Val Lys Ser Lys Leu Ile
        260                 265                 270CAA AAT ATG TAC GGT AGC AAA GAA ATT TAT TCT ATT GAT GGC GTA TCT         864Gln Asn Met Tyr Gly Ser Lys Glu Ile Tyr Ser Ile Asp Gly Val Ser
    275                 280                   285ATT CTT GAT TAT TTA GAT TTG TAC AAG AAA TTC GCT TTT ACT AAT TTG         912Ile Leu Asp Tyr Leu Asp Leu Tyr Lys Lys Phe Ala Phe Thr Asn Leu
290                 295                 300CCG TCA TTC TCT TTG GAA TCA GTT GCT CAA CAT GAA ACC AAA AAA GGT         960Pro Ser Phe Ser Leu Glu Ser Val Ala Gln His Glu Thr Lys Lys Gly305                 310                 315                 320AAA TTA CCA TAC GAC GGT CCT ATT AAT AAA CTT CGT GAG ACT AAT CAT         1008Lys Leu Pro Tyr Asp Gly Pro Ile Asn Lys Leu Arg Glu Thr Asn His
            325                 330                 335CAA CGA TAC ATT AGT TAT AAC ATC ATT GAC GTA GAA TCA GTT CAA GCA         1056Gln Arg Tyr Ile Ser Tyr Asn Ile Ile Asp Val Glu Ser Val Gln Ala
        340                 345                 350ATT GAT AAA ATT CGT GGG TTT ATC GAT CTA GTT TTA AGT ATG TCT TAT         1104Ile Asp Lys Ile Arg Gly Phe Ile Asp Leu Val Leu Ser Met Ser Tyr
    355                 360                 365TAT GCT AAA ATG CCT TTT TCT GGT GTA ATG AGT CCT ATT AAA ACT TGG         1152Tyr Ala Lys Met Pro Phe Ser Gly Val Met Ser Pro Ile Lys Thr Trp
370                 375                 380GAT GCT ATT ATT TTT AAC TCA TTG AAA GGT GAA CAC AAG GTT ATT CCT         1200Asp Ala Ile Ile Phe Asn Ser Leu Lys Gly Glu His Lys Val Ile Pro385                 390                 395                 400CAA CAA GGT TCG CAC GTT AAA CAG AGT TTT CCG GGT GCA TTT GTA TTT         1248Gln Gln Gly Ser His Val Lys Gln Ser Phe Pro Gly Ala Phe Val Phe
            405                 410                 415GAA CCT AAA CCA ATT GCT CGT CGA TAC ATT ATG AGT TTT GAC TTG ACG         1296Glu Pro Lys Pro Ile Ala Arg Arg Tyr Ile Met Ser Phe Asp Leu Thr
        420                 425                 430TCT CTG TAT CCG AGC ATT ATT CGC CAG GTT AAC ATT AGT CCT GAA ACT         1344Ser Leu Tyr Pro Ser Ile Ile Arg Gln Val Asn Ile Ser Pro Glu Thr
    435                 440                 445ATT CGT GGT CAG TTT AAA GTT CAT CCA ATT CAT GAA TAT ATC GCA GGA         1392Ile Arg Gly Gln Phe Lys Val His Pro Ile His Glu Tyr Ile Ala Gly
450                 455                 460ACA GCT CCT AAA CCA AGT GAT GAA TAT TCT TGT TCT CCG AAT GGA TGG         1440Thr Ala Pro Lys Pro Ser Asp Glu Tyr Ser Cys Ser Pro Asn Gly Trp465                 470                 475                 480ATG TAT GAT AAG CAT CAA GAA GGT ATC ATT CCA AAG GAA ATC GCT AAA      1488Met Tyr Asp Lys His Gln Glu Gly Ile Ile Pro Lys Glu Ile Ala Lys
            485                 490                 495GTA TTT TTC CAG CGT AAA GAT TGG AAA AAG AAA ATG TTC GCT GAA GAA      1536Val Phe Phe Gln Arg Lys Asp Trp Lys Lys Lys Met Phe Ala Glu Glu
        500                 505                 510ATG AAT GCC GAA GCT ATT AAA AAG ATT ATT ATG AAA GGC GCA GGG TCT      1584Met Asn Ala Glu Ala Ile Lys Lys Ile Ile Met Lys Gly Ala Gly Ser
    515                 520                 525TGT TCA ACT AAA CCA GAA GTT GAA CGA TAT GTT AAG TTC ACT GAT GAT      1632Cys Ser Thr Lys Pro Glu Val Glu Arg Tyr Val Lys Phe Thr Asp Asp
530                 535                 540TTC TTA AAT GAA CTA TCG AAT TAT ACT GAA TCT GTT CTT AAT AGT CTG      1680Phe Leu Asn Glu Leu Ser Asn Tyr Thr Glu Ser Val Leu Asn Ser Leu545                 550                 555                 560ATT GAA GAA TGT GAA AAA GCA GCT ACA CTT GCT AAT ACA AAT CAG CTG      1728Ile Glu Glu Cys Glu Lys Ala Ala Thr Leu Ala Asn Thr Asn Gln Leu
            565                 570                 575AAC CGT AAA ATT CTT ATT AAC AGT CTT TAT GGT GCT CTT GGT AAT ATT      1776Asn Arg Lys Ile Leu Ile Asn Ser Leu Tyr Gly Ala Leu Gly Asn Ile
        580                 585                 590CAT TTC CGT TAC TAT GAT TTA CGA AAT GCT ACT GCT ATC ACA ATT TTT      1824His Phe Arg Tyr Tyr Asp Leu Arg Asn Ala Thr Ala Ile Thr Ile Phe
    595                 600                 605GGT CAA GTT GGT ATT CAG TGG ATT GCT CGT AAA ATT AAT GAA TAT CTG      1872Gly Gln Val Gly Ile Gln Trp Ile Ala Arg Lys Ile Asn Glu Tyr Leu
610                 615                 620AAT AAA GTA TGC GGA ACT AAT GAT GAA GAT TTC ATC GCA GCA GGT GAT      1920Asn Lys Val Cys Gly Thr Asn Asp Glu Asp Phe Ile Ala Ala Gly Asp625                 630                 635                 640ACT GAT TCG GTA TAT GTT TGT GTA GAT AAA GTT ATT GAA AAA GTT GGT      1968Thr Asp Ser Val Tyr Val Cys Val Asp Lys Val Ile Glu Lys Val Gly
            645                 650                 655CTT GAC CGA TTC AAA GAG CAG AAC GAT TTG GTT GAA TTC ATG AAT CAG      2016Leu Asp Arg Phe Lys Glu Gln Asn Asp Leu Val Glu Phe Met Asn Gln
        660                 665                 670TTT GGT AAG AAA AAG ATG GAA CCT ATG ATT GAT GTT GCA TAT CGT GAG      2064Phe Gly Lys Lys Lys Met Glu Pro Met Ile Asp Val Ala Tyr Arg Glu
    675                 680                 685TTA TGT GAT TAT ATG AAT AAC CGC GAG CAT CTG ATG CAT ATG GAC CGT      2112Leu Cys Asp Tyr Met Asn Asn Arg Glu His Leu Met His Met Asp Arg
690                 695                 700GAA GCT ATT TCT TGC CCT CCG CTT GGT TCA AAG GGT GTT GGT GGA TTT      2160Glu Ala Ile Ser Cys Pro Pro Leu Gly Ser Lys Gly Val Gly Gly Phe705                 710                 715                 720TGG AAA GCG AAA AAA CGT TAT GCT CTG AAC GTT TAT GAT ATG GAA GAT      2208Trp Lys Ala Lys Lys Arg Tyr Ala Leu Asn Val Tyr Asp Met Glu Asp
            725                 730                 735AAG CGA TTT GCT GAA CCG CAT CTA AAA ATC ATG GGT ATG GAA ACT CAG      2256Lys Arg Phe Ala Glu Pro His Leu Lys Ile Met Gly Met Glu Thr Gln
        740                 745                 750CAG AGT TCA ACA CCA AAA GCA GTG CAA GAA GCA CTC GAA GAA AGT ATT      2304Gln Ser Ser Thr Pro Lys Ala Val Gln Glu Ala Leu Glu Glu Ser Ile
    755                 760                 765CGT CGT ATT CTT CAG GAA GGC GAA GAG TCT GTC CAA GAA TAT TAC AAG      2352Arg Arg Ile Leu Gln Glu Gly Glu Glu Ser Val Gln Glu Tyr Tyr Lys
770                 775                 780AAC TTC GAG AAA GAA TAT CGT CAA CTT GAC TAT AAA GTT ATT GCT GAA      2400Asn Phe Glu Lys Glu Tyr Arg Gln Leu Asp Tyr Lys Val Ile Ala Glu785                 790                 795                 800GTA AAA ACT GCG AAC GAT ATA GCG AAA TAT GAT GAT AAA GGT TGG CCA      2448Val Lys Thr Ala Asn Asp Ile Ala Lys Tyr Asp Asp Lys Gly Trp Pro
            805                 810                 815GGA TTT AAA TGT CCG TTC CAT ATT CGT GGT GTG CTA ACT TAT CGT CGA      2496Gly Phe Lys Cys Pro Phe His Ile Arg Gly Val Leu Thr Tyr Arg Arg
        820                 825                 830GCT GTT AGT GGT CTG GGT GTA GCT CCA ATT TTG GAT GGA AAT AAA GTA      2544Ala Val Ser Gly Leu Gly Val Ala Pro Ile Leu Asp Gly Asn Lys Val
    835                 840                 845ATG GTT CTT CCA TTA CGT GAA GGA AAT CCG TTT GGT GAT AAG TGC ATT      2592Met Val Leu Pro Leu Arg Glu Gly Asn Pro Phe Gly Asp Lys Cys Ile
850                 855                 860GCT TGG CCA TCG GGT ACA GAA CTT CCA AAA GAA ATT CGT TCT GAT GTA      2640Ala Trp Pro Ser Gly Thr Glu Leu Pro Lys Glu Ile Arg Ser Asp Val865                 870                 875                 880CTA TCT TGG ATT GAC TAC TCA ACT TTG TTC CAA AAA TCG TTT GTT AAA      2688Leu Ser Trp Ile Asp Tyr Ser Thr Leu Phe Gln Lys Ser Phe Val Lys
            885                 890                 895CCG CTT GCG GGT ATG TGT GAA TCG GCA GGT ATG GAC TAT GAG GAA AAA      2736Pro Leu Ala Gly Met Cys Glu Ser Ala Gly Met Asp Tyr Glu Glu Lys
        900                 905                 910GCT TCG TTA GAC TTC CTG TTT GGC                                      2760Ala Ser Leu Asp Phe Leu Phe Gly
    915                 920(2)SEQID NO:2的资料:
(i)序列特征:
    (A)长度:920氨基酸
    (B)类型:氨基酸
    (D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:2:Arg His Leu His Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe1               5                  10                  15Phe Phe Phe Phe Ile Ile Met Lys Glu Phe Tyr Ile Ser Ile Glu Thr
         20                  25                  30Val Gly Asn Asn Ile Ile Glu Arg Tyr Ile Asp Glu Asn Gly Lys Glu
     35                  40                  45Arg Thr Arg Glu Val Glu Tyr Leu Pro Thr Met Phe Arg His Cys Lys
 50                  55                  60Glu Glu Ser Lys Tyr Lys Asp Ile Tyr Gly Lys Asn Cys Ala Pro Gln65                  70                  75                  80Lys Phe Pro Ser Met Lys Asp Ala Arg Asp Trp Met Lys Arg Met Glu
             85                  90                  95Asp Ile Gly Leu Glu Ala Leu Gly Met Asn Asp Phe Lys Leu Ala Tyr
        100                 105                 110Ile Ser Asp Thr Tyr Gly Ser Glu Ile Val Tyr Asp Arg Lys Phe Val
    115                 120                 125Arg Val Ala Asn Cys Asp Ile Glu Val Thr Gly Asp Lys Phe Pro Asp
130                 135                 140Pro Met Lys Ala Glu Tyr Glu Ile Asp Ala Ile Thr His Tyr Asp Ser145                 150                 155                 160Ile Asp Asp Arg Phe Tyr Val Phe Asp Leu Leu Asn Ser Met Tyr Gly
            165                 170                 175Ser Val Ser Lys Trp Asp Ala Lys Leu Ala Ala Lys Leu Asp Cys Glu
        180                 185                 190Gly Gly Asp Glu Val Pro Gln Glu Ile Leu Asp Arg Val Ile Tyr Met
    195                 200                 205Pro Phe Asp Asn Glu Arg Asp Met Leu Met Glu Tyr Ile Asn Leu Trp
210                 215                 220Glu Gln Lys Arg Pro Ala Ile Phe Thr Gly Trp Asn Ile Glu Gly Phe225                 230                 235                 240Asp Val Pro Tyr Ile Met Asn Arg Val Lys Met Ile Leu Gly Glu Arg
            245                 250                 255Ser Met Lys Arg Phe Ser Pro Ile Gly Arg Val Lys Ser Lys Leu Ile
        260                 265                 270Gln Asn Met Tyr Gly Ser Lys Glu Ile Tyr Ser Ile Asp Gly Val Ser
    275                 280                 285Ile Leu Asp Tyr Leu Asp Leu Tyr Lys Lys Phe Ala Phe Thr Asn Leu
290                 295                 300Pro Ser Phe Ser Leu Glu Ser Val Ala Gln His Glu Thr Lys Lys Gly305                 310                 315                 320Lys Leu Pro Tyr Asp Gly Pro Ile Asn Lys Leu Arg Glu Thr Asn His
            325                 330                 335Gln Arg Tyr Ile Ser Tyr Asn Ile Ile Asp Val Glu Ser Val Gln Ala
        340                 345                 350Ile Asp Lys Ile Arg Gly Phe Ile Asp Leu Val Leu Ser Met Ser Tyr
    355                 360                 365Tyr Ala Lys Met Pro Phe Ser Gly Val Met Ser Pro Ile Lys Thr Trp
370                 375                 380Asp Ala Ile Ile Phe Asn Ser Leu Lys Gly Glu His Lys Val Ile Pro385                 390                 395                 400Gln Gln Gly Ser His Val Lys Gln Ser Phe Pro Gly Ala Phe Val Phe
            405                 410                 415Glu Pro Lys Pro Ile Ala Arg Arg Tyr Ile Met Ser Phe Asp Leu Thr
        420                 425                 430Ser Leu Tyr Pro Ser Ile Ile Arg Gln Val Asn Ile Ser Pro Glu Thr
    435                 440                 445Ile Arg Gly Gln Phe Lys Val His Pro Ile His Glu Tyr Ile Ala Gly
450                 455                 460Thr Ala Pro Lys Pro Ser Asp Glu Tyr Ser Cys Ser Pro Asn Gly Trp465                 470                 475                 480Met Tyr Asp Lys His Gln Glu Gly Ile Ile Pro Lys Glu Ile Ala Lys
                     485            490             495Val Phe Phe Gln Arg Lys Asp Trp Lys Lys Lys Met Phe Ala Glu Glu
        500                 505                 510Met Asn Ala Glu Ala Ile Lys Lys Ile Ile Met Lys Gly Ala Gly Ser
    515                 520                 525Cys Ser Thr Lys Pro Glu Val Glu Arg Tyr Val Lys Phe Thr Asp Asp
530                 535                 540Phe Leu Asn Glu Leu Ser Asn Tyr Thr Glu Ser Val Leu Asn Ser Leu545                 550                 555                 560Ile Glu Glu Cys Glu Lys Ala Ala Thr Leu Ala Asn Thr Asn Gln Leu
            565                 570                 575Asn Arg Lys Ile Leu Ile Asn Ser Leu Tyr Gly Ala Leu Gly Asn Ile
        580                 585                 590His Phc Arg Tyr Tyr Asp Leu Arg Asn Ala Thr Ala Ile Thr Ile Phe
    595                 600                 605Gly Gln Val Gly Ile Gln Trp Ile Ala Arg Lys Ile Asn Glu Tyr Leu
610                 615                 620Asn Lys Val Cys Gly Thr Asn Asp Glu Asp Phe Ile Ala Ala Gly Asp625                 630                 635                 640Thr Asp Ser Val Tyr Val Cys Val Asp Lys Val Ile Glu Lys Val Gly
            645                 650                 655Leu Asp Arg Phe Lys Glu Gln Asn Asp Leu Val Glu Phe Met Asn Gln
        660                 665                 670Phe Gly Lys Lys Lys Met Glu Pro Met Ile Asp Val Ala Tyr Arg Glu
    675                 680                 685Leu Cys Asp Tyr Met Asn Asn Arg Glu His Leu Met His Met Asp Arg
690                 695                 700Glu Ala Ile Ser Cys Pro Pro Leu Gly Ser Lys Gly Val Gly Gly Phe705                 710                 715                 720Trp Lys Ala Lys Lys Arg Tyr Ala Leu Asn Val Tyr Asp Met Glu Asp
            725                 730                 735Lys Arg Phe Ala Glu Pro His Leu Lys Ile Met Gly Met Glu Thr Gln
        740                 745                 750Gln Ser Ser Thr Pro Lys Ala Val Gln Glu Ala Leu Glu Glu Ser Ile
    755                 760                 765Arg Arg Ile Leu Gln Glu Gly Glu Glu Ser Val Gln Glu Tyr Tyr Lys
770                 775                 780Asn Phe Glu Lys Glu Tyr Arg Gln Leu Asp Tyr Lys Val Ile Ala Glu785                 790                 795                 800Val Lys Thr Ala Asn Asp Ile Ala Lys Tyr Asp Asp Lys Gly Trp Pro
            805                 810                 815Gly Phe Lys Cys Pro Phe His Ile Arg Gly Val Leu Thr Tyr Arg Arg
        820                 825                 830Ala Val Ser Gly Leu Gly Val Ala Pro Ile Leu Asp Gly Asn Lys Val
    835                 840                 845Met Val Leu Pro Leu Arg Glu Gly Asn Pro Phe Gly Asp Lys Cys Ile
850                 855                 860Ala Trp Pro Ser Gly Thr Glu Leu Pro Lys Glu Ile Arg Ser Asp Val865                 870                 875                 880Leu Ser Trp Ile Asp Tyr Ser Thr Leu Phe Gln Lys Ser Phe Val Lys
            885                 890                 895Pro Leu Ala Gly Met Cys Glu Ser Ala Gly Met Asp Tyr Glu Glu Lys
        900                 905                 910Ala Ser Leu Asp Phe Leu Phe Gly
    915                 920(2)SEQ ID NO:3的资料:
(i)序列特征:
   (A)长度:2760碱基对
   (B)类型:核酸
   (C)链型:单链
   (D)拓扑结构:线性
(ii)分子类型:DNA(基因组)
(ix)特征:
    (A)名称/关键词:CDS
    (B)位置:1..2760
(xi)序列描述:SEQID NO:3:CGT CAT CTT CAT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT          48Arg His Leu His Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe1               5                  10                  15TTT TTT TTT TTT ATT ATT ATG AAA GAA TTT TAT ATC TCT ATT GAA ACA          96Phe Phe Phe Phe Ile Ile Met Lys Glu Phe Tyr Ile Ser Ile Glu Thr
         20                  25                  30GTC GGA AAT AAC ATT GTT GAA CGT TAT ATT GAT GAA AAT GGA AAG GAA         144Val Gly Asn Asn Ile Val Glu Arg Tyr Ile Asp Glu Asn Gly Lys Glu
     35                  40                  45CGT ACC CGT GAA GTA GAA TAT CTT CCA ACT ATG TTT AGG CAT TGT AAG         192Arg Thr Arg Glu Val Glu Tyr Leu Pro Thr Met Phe Arg His Cys Lys
 50                  55                  60GAA GAG TCA AAA TAC AAA GAC ATC TAT GGT AAA AAC TGC GCT CCT CAA         240Glu Glu Ser Lys Tyr Lys Asp Ile Tyr Gly Lys Asn Cys Ala Pro Gln65                  70                  75                  80AAA TTT CCA TCA ATG AAA GAT GCT CGA GAT TGG ATG AAG CGA ATG GAA         288Lys Phe Pro Ser Met Lys Asp Ala Arg Asp Trp Met Lys Arg Met Glu
             85                      90                  95GAC ATC GGT CTC GAA GCT CTC GGT ATG AAC GAT TTT AAA CTC GCT TAT         336Asp Ile Gly Leu Glu Ala Leu Gly Met Asn Asp Phe Lys Leu Ala Tyr
        100                 105                 110ATA AGT GAT ACA TAT GGT TCA GAA ATT GTT TAT GAC CGA AAA TTT GTT         384Ile Ser Asp Thr Tyr Gly Ser Glu Ile Val Tyr Asp Arg Lys Phe Val
    115                 120                 125CGT GTA GCT AAC TGT GAC ATT GAG GTT ACT GGT GAT AAA TTT CCT GAC       432Arg Val Ala Asn Cys Asp Ile Glu Val Thr Gly Asp Lys Phe Pro Asp
130                 135                 140CCA ATG AAA GCA GAA TAT GAA ATT GAT GCT ATC ACT CAT TAC GAT TCA       480Pro Met Lys Ala Glu Tyr Glu Ile Asp Ala Ile Thr His Tyr Asp Ser145                 150                 155                 160ATT GAC GAT CGT TTT TAT GTT TTC GAC CTT TTG AAT TCA ATG TAC GGT       528Ile Asp Asp Arg Phe Tyr Val Phe Asp Leu Leu Asn Ser Met Tyr Gly
            165                 170                 175TCA GTA TCA AAA TGG GAT GCA AAG TTA GCT GCT AAG CTT GAC TGT GAA       576Ser Val Ser Lys Trp Asp Ala Lys Leu Ala Ala Lys Leu Asp Cys Glu
        180                 185                 190GGT GGT GAT GAA GTT CCT CAA GAA ATT CTT GAC CGA GTA ATT TAT ATG       624Gly Gly Asp Glu Val Pro Gln Glu Ile Leu Asp Arg Val Ile Tyr Met
    195                 200                 205CCA TTC GAT AAT GAG CGT GAT ATG CTC ATG GAA TAT ATC AAT CTT TGG       672Pro Phe Asp Asn Glu Arg Asp Met Leu Met Glu Tyr Ile Asn Leu Trp
210                 215                 220GAA CAG AAA CGA CCT GCT ATT TTT ACT GGT TGG AAT ATT GAG GGG TTT       720Glu Gln Lys Arg Pro Ala Ile Phe Thr Gly Trp Asn Ile Glu Gly Phe225                 230                 235                 240GAC GTT CCG TAT ATC ATG AAT CGT GTT AAA ATG ATT CTG GGT GAA CGT       768Asp Val Pro Tyr Ile Met Asn Arg Val Lys Met Ile Leu Gly Glu Arg
            245                 250                 255AGT ATG AAA CGT TTC TCT CCA ATC GGT CGG GTA AAA TCT AAA CTA ATT       816Ser Met Lys Arg Phe Ser Pro Ile Gly Arg Val Lys Ser Lys Leu Ile
        260                 265                 270CAA AAT ATG TAC GGT AGC AAA GAA ATT TAT TCT ATT GAT GGC GTA TCT       864Gln Asn Met Tyr Gly Ser Lys Glu Ile Tyr Ser Ile Asp Gly Val Ser
    275                 280                 285ATT CTT GAT TAT TTA GAT TTG TAC AAG AAA TTC GCT TTT ACT AAT TTG       912Ile Leu Asp Tyr Leu Asp Leu Tyr Lys Lys Phe Ala Phe Thr Asn Leu
290                 295                 300CCG TCA TTC TCT TTG GAA TCA GTT GCT CAA CAT GAA ACC AAA AAA GGT       960Pro Ser Phe Ser Leu Glu Ser Val Ala Gln His Glu Thr Lys Lys Gly305                 310                 315                 320AAA TTA CCA TAC GAC GGT CCT ATT AAT AAA CTT CGT GAG ACT AAT CAT       1008Lys Leu Pro Tyr Asp Gly Pro Ile Asn Lys Leu Arg Glu Thr Asn His
            325                 330                 335CAA CGA TAC ATT AGT TAT AAC ATC ATT GAC GTA GAA TCA GTT CAA GCA       1056Gln Arg Tyr Ile Ser Tyr Asn Ile Ile Asp Val Glu Ser Val Gln Ala
        340                 345                 350ATC GAT AAA ATT CGT GGG TTT ATC GAT CTA GTT TTA AGT ATG TCT TAT       1104Ile Asp Lys Ile Arg Gly Phe Ile Asp Leu Val Leu Ser Met Ser Tyr
    355                 360                 365TAC GCT AAA ATG CCT TTT TCT GGT GTA ATG AGT CCT ATT AAA ACT TGG       1152Tyr Ala Lys Met Pro Phe Ser Gly Val Met Ser Pro Ile Lys Thr Trp
370                 375                 380GAT GCT ATT ATT TTT AAC TCA TTG AAA GGT GAA CAT AAG GTT ATT CCT      1200Asp Ala Ile Ile Phe Asn Ser Leu Lys Gly Glu His Lys Val Ile Pro385                 390                 395                 400CAA CAA GGT TCG CAC GTT AAA CAG AGT TTT CCG GGT GCA TTT GTG TTT      1248Gln Gln Gly Ser His Val Lys Gln Ser Phe Pro Gly Ala Phe Val Phe
            405                 410                 415GAA CCT AAA CCA ATT GCA CGT CGA TAC ATT ATG AGT TTT GAC TTG ACG      1296Glu Pro Lys Pro Ile Ala Arg Arg Tyr Ile Met Ser Phe Asp Leu Thr
        420                 425                 430TCT CTG TAT CCG AGC ATT ATT CGC CAG GTT AAC ATT AGT CCT GAA ACT      1344Ser Leu Tyr Pro Ser Ile Ile Arg Gln Val Asn Ile Ser Pro Glu Thr
    435                 440                 445ATT CGT GGT CAG TTT AAA GTT CAT CCA ATT CAT GAA TAT ATC GCA GGA      1392Ile Arg Gly Gln Phe Lys Val His Pro Ile His Glu Tyr Ile Ala Gly
450                 455                 460ACA GCT CCT AAA CCG AGT GAT GAA TAT TCT TGT TCT CCG AAT GGA TGG      1440Thr Ala Pro Lys Pro Ser Asp Glu Tyr Ser Cys Ser Pro Asn Gly Trp465                 470                 475                 480ATG TAT GAT AAA CAT CAA GAA GGT ATC ATT CCA AAG GAA ATC GCT AAA      1488Met Tyr Asp Lys His Gln Glu Gly Ile Ile Pro Lys Glu Ile Ala Lys
            485                 490                 495GTA TTT TTC CAG CGT AAA GAC TGG AAA AAG AAA ATG TTC GCT GAA GAA      1536Val Phe Phe Gln Arg Lys Asp Trp Lys Lys Lys Met Phe Ala Glu Glu
        500                 505                 510ATG AAT GCC GAA GCT ATT AAA AAG ATT ATT ATG AAA GGC GCA GGG TCT      1584Met Asn Ala Glu Ala Ile Lys Lys Ile Ile Met Lys Gly Ala Gly Ser
    515                 520                 525TGT TCA ACT AAA CCA GAA GTT GAA CGA TAT GTT AAG TTC AGT GAT GAT      1632Cys Ser Thr Lys Pro Glu Val Glu Arg Tyr Val Lys Phe Ser Asp Asp
530                 535                 540TTC TTA AAT GAA CTA TCG AAT TAC ACC GAA TCT GTT CTC AAT AGT CTG      1680Phe Leu Asn Glu Leu Ser Asn Tyr Thr Glu Ser Val Leu Asn Ser Leu545                 550                 555                 560ATT GAA GAA TGT GAA AAA GCA GCT ACA CTT GCT AAT ACA AAT CAG CTG      1728Ile Glu Glu Cys Glu Lys Ala Ala Thr Leu Ala Asn Thr Asn Gln Leu
            565                 570                 575AAC CGT AAA ATT CTC ATT AAC AGT CTT TAT GGT GCT CTT GGT AAT ATT      1776Asn Arg Lys Ile Leu Ile Asn Ser Leu Tyr Gly Ala Leu Gly Asn Ile
        580                 585                 590CAT TTC CGT TAC TAT GAT TTG CGA AAT GCT ACT GCT ATC ACA ATT TTC      1824His Phe Arg Tyr Tyr Asp Leu Arg Asn Ala Thr Ala Ile Thr Ile Phe
    595                 600                 605GGC CAA GTC GGT ATT CAG TGG ATT GCT CGT AAA ATT AAT GAA TAT CTG      1872Gly Gln Val Gly Ile Gln Trp Ile Ala Arg Lys Ile Ash Glu Tyr Leu
610                 615                 620AAT AAA GTA TGC GGA ACT AAT GAT GAA GAT TTC ATT GCA GCA GGT GAT      1920Asn Lys Val Cys Gly Thr Asn Asp Glu Asp Phe Ile Ala Ala Gly Asp625                 630                 635                 640ACT GAT TCG GTA TAT GTT TGC GTA GAT AAA GTT ATT GAA AAA GTT GGT      1968Thr Asp Ser Val Tyr Val Cys Val Asp Lys Val Ile Glu Lys Val Gly
            645                 650                 655CTT GAC CGA TTC AAA GAG CAG AAC GAT TTG GTT GAA TTC ATG AAT CAG      2016Leu Asp Arg Phe Lys Glu Gln Asn Asp Leu Val Glu Phe Met Asn Gln
        660                 665                 670TTC GGT AAG AAA AAG ATG GAA CCT ATG ATT GAT GTT GCA TAT CGT GAG      2064Phe Gly Lys Lys Lys Met Glu Pro Met Ile Asp Val Ala Tyr Arg Glu
    675                 680                 685TTA TGT GAT TAT ATG AAT AAC CGC GAG CAT CTG ATG CAT ATG GAC CGT      2112Leu Cys Asp Tyr Met Asn Asn Arg Glu His Leu Met His Met Asp Arg
690                 695                 700GAA GCT ATT TCT TGC CCT CCG CTT GGT TCA AAG GGC GTT GGT GGA TTT      2160Glu Ala Ile Ser Cys Pro Pro Leu Gly Ser Lys Gly Val Gly Gly Phe705                 710                 715                 720TGG AAA GCG AAA AAG CGT TAT GCT CTG AAC GTT TAT GAT ATG GAA GAT      2208Trp Lys Ala Lys Lys Arg Tyr Ala Leu Asn Val Tyr Asp Met Glu Asp
            725                 730                 735AAG CGA TTT GCT GAA CCG CAT CTA AAA ATC ATG GGT ATG GAA ACT CAG      2256Lys Arg Phe Ala Glu Pro His Leu Lys Ile Met Gly Met Glu Thr Gln
        740                 745                 750CAG AGT TCA ACA CCA AAA GCA GTG CAA GAA GCT CTC GAA GAA AGT ATT      2304Gln Ser Ser Thr Pro Lys Ala Val Gln Glu Ala Leu Glu Glu Ser Ile
    755                 760                 765CGT CGT ATT CTT CAG GAA GGT GAA GAG TCT GTC CAA GAA TAC TAC AAG      2352Arg Arg Ile Leu Gln Glu Gly Glu Glu Ser Val Gln Glu Tyr Tyr Lys
770                 775                 780AAC TTC GAG AAA GAA TAT CGT CAA CTT GAC TAT AAA GTT ATT GCT GAA      2400Asn Phe Glu Lys Glu Tyr Arg Gln Leu Asp Tyr Lys Val Ile Ala Glu785                 790                 795                 800GTA AAA ACT GCG AAC GAT ATA GCG AAA TAT GAT GAT AAA GGT TGG CCA      2448Val Lys Thr Ala Asn Asp Ile Ala Lys Tyr Asp Asp Lys Gly Trp Pro
            805                     810                 815GGA TTT AAA TGC CCG TTC CAT ATT CGT GGT GTG CTA ACT TAT CGT CGA      2496Gly Phe Lys Cys Pro Phe His Ile Arg Gly Val Leu Thr Tyr Arg Arg
        820                 825                 830GCT GTT AGC GGT TTA GGT GTA GCT CCA ATT TTG GAT GGA AAT AAA GTA      2544Ala Val Ser Gly Leu Gly Val Ala Pro Ile Leu Asp Gly Asn Lys Val
    835                 840                 845ATG GTT CTT CCA TTA CGT GAA GGA AAT CCA TTT GGT GAC AAG TGC ATT      2592Met Val Leu Pro Leu Arg Glu Gly Asn Pro Phe Gly Asp Lys Cys Ile
850                 855                 860GCT TGG CCA TCG GGT ACA GAA CTT CCA AAA GAA ATT CGT TCT GAT GTG      2640Ala Trp Pro Ser Gly Thr Glu Leu Pro Lys Glu Ile Arg Ser Asp Val865                 870                 875                 880CTA TCT TGG ATT GAC CAC TCA ACT TTG TTC CAA AAA TCG TTT GTT AAA      2688Leu Ser Trp Ile Asp His Ser Thr Leu Phe Gln Lys Ser Phe Val Lys
            885                 890                 895CCG CTT GCG GGT ATG TGT GAA TCG GCT GGC ATG GAC TAT GAA GAA AAA       2736Pro Leu Ala Gly Met Cys Glu Ser Ala Gly Met Asp Tyr Glu Glu Lys
        900                 905                 910GCT TCG TTA GAC TTC CTG TTT GGC                                       2760Ala Ser Leu Asp Phe Leu Phe Gly
    915                 920(2)SEQID NO:4的资料:
(i)序列特征:
    (A)长度:920氨基酸
    (B)类型:氨基酸
    (D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:4:Arg His Leu His Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe1               5                  10                  15Phe Phe Phe Phe Ile Ile Met Lys Glu Phe Tyr Ile Ser Ile Glu Thr
         20                  25                  30Val Gly Asn Asn Ile Val Glu Arg Tyr Ile Asp Glu Asn Gly Lys Glu
     35                  40                  45Arg Thr Arg Glu Val Glu Tyr Leu Pro Thr Met Phe Arg His Cys Lys
 50                  55                  60Glu Glu Ser Lys Tyr Lys Asp Ile Tyr Gly Lys Asn Cys Ala Pro Gln65                  70                  75                  80Lys Phe Pro Ser Met Lys Asp Ala Arg Asp Trp Met Lys Arg Met Glu
             85                  90                  95Asp Ile Gly Leu Glu Ala Leu Gly Met Asn Asp Phe Lys Leu Ala Tyr
        100                 105                 110Ile Ser Asp Thr Tyr Gly Ser Glu Ile Val Tyr Asp Arg Lys Phe Val
    115                 120                 125Arg Val Ala Asn Cys Asp Ile Glu Val Thr Gly Asp Lys Phe Pro Asp
130                 135                 140Pro Met Lys Ala Glu Tyr Glu Ile Asp Ala Ile Thr His Tyr Asp Ser145                 150                 155                 160Ile Asp Asp Arg Phe Tyr Val Phe Asp Leu Leu Asn Ser Met Tyr Gly
            165                 170                 175Ser Val Ser Lys Trp Asp Ala Lys Leu Ala Ala Lys Leu Asp Cys Glu
        180                 185                 190Cly Gly Asp Glu Val Pro Gln Glu Ile Leu Asp Arg Val Ile Tyr Met
    195                 200                 205Pro Phe Asp Asn Glu Arg Asp Met Leu Met Glu Tyr Ile Asn Leu Trp
210                 215                 220Glu Gln Lys Arg Pro Ala Ile Phe Thr Gly Trp Asn Ile Glu Gly Phe225                 230                 235                 240Asp Val Pro Tyr Ile Met Asn Arg Val Lys Met Ile Leu Gly Glu Arg
            245                 250                 255Ser Met Lys Arg Phe Ser Pro lle Gly Arg Val Lys Ser Lys Leu Ile
        260                 265                 270Gln Asn Met Tyr Gly Ser Lys Glu Ile Tyr Ser Ile Asp Gly Val Ser
    275                 280                 285Ile Leu Asp Tyr Leu Asp Leu Tyr Lys Lys Phe Ala Phe Thr Asn Leu
290                 295                 300Pro Ser Phe Ser Leu Glu Ser Val Ala Gln His Glu Thr Lys Lys Gly305                 310                 315                 320Lys Leu Pro Tyr Asp Gly Pro Ile Asn Lys Leu Arg Glu Thr Asn His
            325                 330                 335Gln Arg Tyr Ile Ser Tyr Asn Ile Ile Asp Val Glu 5er Val Gln Ala
        340                 345                 350Ile Asp Lys Ile Arg Gly Phe Ile Asp Leu Val Leu Ser Met Ser Tyr
    355                 360                 365Tyr Ala Lys Met Pro Phe Ser Gly Val Met Ser Pro Ile Lys Thr Trp
370                 375                 380Asp Ala Ile Ile Phe Asn Ser Leu Lys Gly Glu His Lys Val Ile Pro385                 390                 395                 400Gln Gln Gly Ser His Val Lys Gln Ser Phe Pro Gly Ala Phe Val Phe
            405                 410                 415Glu Pro Lys Pro Ile Ala Arg Arg Tyr Ile Met Ser Phe Asp Leu Thr
        420                 425                 430Ser Leu Tyr Pro Ser Ile Ile Arg Gln Val Asn lle Ser Pro Glu Thr
    435                 440                 445Ile Arg Gly Gln Phe Lys Val His Pro Ile His Glu Tyr Ile Ala Gly
450                 455                 460Thr Ala Pro Lys Pro Ser Asp Glu Tyr Ser Cys Ser Pro Asn Gly Trp465                 470                 475                 480Met Tyr Asp Lys His Gln Glu Gly Ile Ile Pro Lys Glu Ile Ala Lys
            485                 490                 495Val Phe Phe Gln Arg Lys Asp Trp Lys Lys Lys Met Phe Ala Glu Glu
        500                 505                 510Met Asn Ala Glu Ala Ile Lys Lys Ile Ile Met Lys Gly Ala Gly Ser
    515                 520                 525Cys Ser Thr Lys Pro Glu Val Glu Arg Tyr Val Lys Phe Ser Asp Asp
530                 535                 540Phe Leu Asn Glu Leu Ser Asn Tyr Thr Glu Ser Val Leu Asn Ser Leu545                 550                 555                 560Ile Glu Glu Cys Glu Lys Ala Ala Thr Leu Ala Asn Thr Asn Gln Leu
            565                 570                 575Asn Arg Lys Ile Leu Ile Asn Ser Leu Tyr Gly Ala Leu Gly Asn Ile
        580                 585                 590His Phe Arg Tyr Tyr Asp Leu Arg Asn Ala Thr Ala Ile Thr Ile Phe
    595                 600                 605Gly Gln Val Gly Ile Gln Trp Ile Ala Arg Lys Ile Asn Glu Tyr Leu
610                 615                 620Asn Lys Val Cys Gly Thr Asn Asp Glu Asp Phe Ile Ala Ala Gly Asp625                 630                 635                 640Thr Asp Ser Val Tyr Val Cys Val Asp Lys Val Ile Glu Lys Val Gly
            645                 650                 655Leu Asp Arg Phe Lys Glu Gln Asn Asp Leu Val Glu Phe Met Asn Gln
        660                 665                 670Phe Gly Lys Lys Lys Met Glu Pro Met Ile Asp Val Ala Tyr Arg Glu
    675                 680                 685Leu Cys Asp Tyr Met Asn Asn Arg Glu His Leu Met His Met Asp Arg
690                 695                 700Glu Ala Ile Ser Cys Pro Pro Leu Gly Ser Lys Gly Val Gly Gly Phe705                 710                 715                 720Trp Lys Ala Lys Lys Arg Tyr Ala Leu Asn Val Tyr Asp Met Glu Asp
            725                 730                 735Lys Arg Phe Ala Glu Pro His Leu Lys Ile Met Gly Met Glu Thr Gln
        740                 745                 750Gln Ser Ser Thr Pro Lys Ala Val Gln Glu Ala Leu Glu Glu Ser Ile
    755                 760                 765Arg Arg Ile Leu Gln Glu Gly Glu Glu Ser Val Gln Glu Tyr Tyr Lys
770                 775                 780Asn Phe Glu Lys Glu Tyr Arg Gln Leu Asp Tyr Lys Val Ile Ala Glu785                 790                 795                 800Val Lys Thr Ala Asn Asp Ile Ala Lys Tyr Asp Asp Lys Gly Trp Pro
            805                 810                 815Gly Phe Lys Cys Pro Phe His Ile Arg Gly Val Leu Thr Tyr Arg Arg
        820                 825                 830Ala Val Ser Gly Leu Gly Val Ala Pro Ile Leu Asp Gly Asn Lys Val
    835                 840                 845Met Val Leu Pro Leu Arg Gtu Gly Asn Pro Phe Gly Asp Lys Cys Ile
850                 855                 860Ala Trp Pro Ser Gly Thr Glu Leu Pro Lys Glu Ile Arg Ser Asp Val865                 870                 875                 880Leu Set Trp Ile Asp His Set Thr Leu Phe Gln Lys 5er Phe Val Lys
            885                 890                 895Pro Leu Ala Gly Met Cys Glu Ser Ala Gly Met Asp Tyr Glu Glu Lys
        900                 905                 910Ala Ser Leu Asp Phe Leu Phe Gly
    915                 920(2)SEQ ID NO:5的资料:
(i)序列特征:
    (A)长度:2459碱基对
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线性
(ii)分子类型:DNA(基因组)
(ix)特征:
    (A)名称/关键词:CDS
    (B)位置:108..2456
(xi)序列描述:SEQ ID NO:5:AAGCATGGCG CGAAGGCATA TTACGGGCAG TAATGACTGT ATAAAACCAC AGCCAATCAA      60ACGAAACCAG GCTATACTCA AGCCTGGTTT TTTGATGGAT TTTCAGC GTG GCG CAG       116
                                                Val Ala Gln
                                                  1GCA GGT TTT ATC TTA ACC CGA CAC TGG CGG GAC ACC CCG CAA GGG ACA       164Ala Gly Phe Ile Leu Thr Arg His Trp Arg Asp Thr Pro Gln Gly Thr
  5                  10                 15GAA GTC TCC TTC TGG CTG GCG ACG GAC AAC GGG CCG TTG CAG GTT ACG       212Glu Val Ser Phe Trp Leu Ala Thr Asp Asn Gly Pro Leu Gln Val Thr20                  25                  30                  35CTT GCA CCG CAA GAG TCC GTG GCG TTT ATT CCC GCC GAT CAG GTT CCC        260Leu Ala Pro Gln Glu Ser Val Ala Phe Ile Pro Ala Asp Gln Val Pro
             40                  45                  50CGC GCT CAG CAT ATT TTG CAG GGT GAA CAA GGC TTT CGC CTG ACA CCG        308Arg Ala Gln His Ile Leu Gln Gly Glu Gln Gly Phe Arg Leu Thr Pro
         55                  60                  65CTG GCG TTA AAG GAT TTT CAC CGC CAG CCG GTG TAT GGC CTT TAC TGT        356Leu Ala Leu Lys Asp Phe His Arg Gln Pro Val Tyr Gly Leu Tyr Cys
     70                  75                  80CGC GCC CAT CGC CAA TTG ATG AAT TAC GAA AAG CGC CTG CGT GAA GGT        404Arg Ala His Arg Gln Leu Met Asn Tyr Glu Lys Arg Leu Arg Glu Gly
 85                  90                  95GGC GTT ACC GTC TAC GAG GCC GAT GTG CGT CCG CCA GAA CGC TAT CTG        452Gly Val Thr Val Tyr Glu Ala Asp Val Arg Pro Pro Glu Arg Tyr Leu100                 105                 110                 115ATG GAG CGG TTT ATC ACC TCA CCG GTG TGG GTC GAG GGT GAT ATG CAC        500Met Glu Arg Phe Ile Thr Ser Pro Val Trp Val Glu Gly Asp Met His
            120                 125                 130AAT GGC ACT ATC GTT AAT GCC CGT CTG AAA CCG CAT CCC GAC TAT CGT        548Asn Gly Thr Ile Val Asn Ala Arg Leu Lys Pro His Pro Asp Tyr Arg
        135                 140                 145CCG CCG CTC AAG TGG GTT TCT ATA GAT ATT GAA ACC ACC CGC CAC GGT        596Pro Pro Leu Lys Trp Val Ser Ile Asp Ile Glu Thr Thr Arg His Gly
    150                 155                 160GAG CTG TAC TGC ATC GGC CTG GAA GGC TGC GGG CAG CGC ATC GTT TAT        644Glu Leu Tyr Cys Ile Gly Leu Glu Gly Cys Gly Gln Arg Ile Val Tyr
165                 170                 175ATG CTG GGG CCG GAG AAT GGC GAC GCC TCC TCG CTT GAT TTC GAA CTG        692Met Leu Gly Pro Glu Asn Gly Asp Ala Ser Ser Leu Asp Phe Glu Leu180                 185                 190                 195GAA TAC GTC GCC AGC CGC CCG CAG TTG CTG GAA AAA CTC AAC GCC TGG        740Glu Tyr Val Ala Ser Arg Pro Gln Leu Leu Glu Lys Leu Asn Ala Trp
            200                 205                 210TTT GCC AAC TAC GAT CCT GAT GTG ATC ATC GGT TGG AAC GTG GTG CAG        788Phe Ala Asn Tyr Asp Pro Asp Val Ile Ile Gly Trp Asn Val Val Gln
        215                 220                 225TTC GAT CTG CGA ATG CTG CAA AAA CAT GCC GAG CGT TAC CGT CTT CCG        836Phe Asp Leu Arg Met Leu Gln Lys His Ala Glu Arg Tyr Arg Leu Pro
    230                 235                 240CTG CGT CTT GGG CGC GAT AAT AGC GAG CTG GAG TGG CGC GAC GAC GGC        884Leu Arg Leu Gly Arg Asp Asn Ser Glu Leu Glu Trp Arg Asp Asp Gly
245                 250                 255TTT AAA AAC GGC GTC TTT TTT GCC CAG GCT AAA GGT GGG CTA ATT ATC        932Phe Lys Asn Gly Val Phe Phe Ala Gln Ala Lys Gly Gly Leu Ile Ile260                 265                 270                 275GAC GGT ATC GAG GCG CTG AAA TCC GCG TTC TGG AAT TTC TCT TCA TTC        980Asp Gly Ile Glu Ala Leu Lys Ser Ala Phe Trp Asn Phe Ser Ser Phe
            280                 285                 290TCG CTG GAA ACT GTC GCT CAG GAG CTA TTA GGC GAA GGA AAA TCT ATC       1028Ser Leu Glu Thr Val Ala Gln Glu Leu Leu Gly Glu Gly Lys Ser Ile
        295                 300                 305GAT AAC CCG TGG GAT CGA ATG GAC GAA ATT GAC CGC CGT TTC GCC GAA       1076Asp Asn Pro Trp Asp Arg Met Asp Glu Ile Asp Arg Arg Phe Ala Glu
    310                 315                 320GAT AAA CCT GCG CTG GCA ACT TAT AAC CTG AAA GAT TGC GAG CTG GTG       1124Asp Lys Pro Ala Leu Ala Thr Tyr Asn Leu Lys Asp Cys Glu Leu Val
325                 330                 335ACG CAG ATC TTC CAC AAA ACT GAA ATC ATG CCA TTT TTA CTC GAA CGG       1172Thr Gln Ile Phe His Lys Thr Glu Ile Met Pro Phe Leu Leu Glu Arg340                 345                 350                 355GCA ACG GTG AAC GGC CTG CCG GTG GAC CGA CAC GGC GGT TCG GTG GCG       1220Ala Thr Val Asn Gly Leu Pro Val Asp Arg His Gly Gly Ser Val Ala
            360                 365                 370GCA TTT GGT CAT CTC TAT TTT CCG CGA ATG CAT CGC GCT GGT TAT GTC       1268Ala Phe Gly His Leu Tyr Phe Pro Arg Met His Arg Ala Gly Tyr Val
        375                 380                 385GCG CCT AAT CTC GGC GAA GTG CCG CCG CAC GCC AGC CCT GGC GGC TAC       1316Ala Pro Asn Leu Gly Glu Val Pro Pro His Ala Ser Pro Gly Gly Tyr
    390                 395                 400GTG ATG GAT TCA CGG CCA GGG CTT TAT GAT TCA GTG CTG GTG CTG GAC       1364Val Met Asp Ser Arg Pro Gly Leu Tyr Asp Ser Val Leu Val Leu Asp
405                 410                 415TAT AAA AGC CTG TAC CCG TCG ATC ATC CGC ACC TTT CTG ATT GAT CCC       1412Tyr Lys Ser Leu Tyr Pro Ser Ile Ile Arg Thr Phe Leu Ile Asp Pro420                 425                 430                 435GTC GGG CTG GTG GAA GGC ATG GCG CAG CCT GAT CCA GAG CAC AGT ACC       1460Val Gly Leu Val Glu Gly Met Ala Gln Pro Asp Pro Glu His Ser Thr
            440                 445                 450GAA GGT TTT CTC GAT GCC TGG TTC TCG CGA GAA AAA CAT TGC CTG CCG       1508Glu Gly Phe Leu Asp Ala Trp Phe Ser Arg Glu Lys His Cys Leu Pro
        455                 460                 465GAG ATT GTG ACT AAC ATC TGG CAC GGG CGC GAT GAA GCC AAA CGC CAG       1556Glu Ile Val Thr Asn Ile Trp His Gly Arg Asp Glu Ala Lys Arg Gln
    470                 475                 480GGT AAC AAA CCG CTG TCG CAG GCG CTG AAA ATC ATC ATG AAT GCC TTT       1604Gly Asn Lys Pro Leu Ser Gln Ala Leu Lys Ile Ile Met Asn Ala Phe
485                 490                 495TAT GGC GTG CTC GGC ACC ACC GCC TGC CGC TTC TTC GAT CCG CGG CTG       1652Tyr Gly Val Leu Gly Thr Thr Ala Cys Arg Phe Phe Asp Pro Arg Leu500                 505                 510                 515GCA TCG TCG ATC ACC ATG CGT GGT CAT CAG ATC ATG CGG CAA ACC AAA       1700Ala Ser Ser Ile Thr Met Arg Gly His Gln Ile Met Arg Gln Thr Lys
            520                 525                 530GCG TTG ATT GAA GCA CAG GGC TAC GAC GTT ATC TAC GGC GAT ACC GAC       1748Ala Leu Ile Glu Ala Gln Gly Tyr Asp Val Ile Tyr Gly Asp Thr Asp
        535                 540                 545TCA ACG TTT GTC TGG CTG AAA GGC GCA CAT TCG GAA GAA GAA GCG GCG       1796Ser Thr Phe Val Trp Leu Lys Gly Ala His Ser Glu Glu Glu Ala Ala
    550                 555                 560AAA ATC GGT CGT GCA CTG GTG CAG CAC GTT AAC GCC TGG TGG GCG GAA       1844Lys Ile Gly Arg Ala Leu Val Gln His Val Asn Ala Trp Trp Ala Glu
565                 570                 575ACG CTG CAA AAA CAA CGG CTG ACC AGC GCA TTA GAA CTG GAG TAT GAA       1892Thr Leu Gln Lys Gln Arg Leu Thr Ser Ala Leu Glu Leu Glu Tyr Glu580                 585                 590                 595ACC CAT TTC TGC CGT TTT CTG ATG CCA ACC ATT CGC GGA GCC GAT ACC       1940Thr His Phe Cys Arg Phe Leu Met Pro Thr Ile Arg Gly Ale Asp Thr
            600                 605                 610GGC AGT AAA AAG CGT TAT GCC GGA CTG ATT CAG GAG GGC GAC AAG CAG       1988Gly Ser Lys Lys Arg Tyr Ala Gly Leu Ile Gln Glu Gly Asp Lys Gln
        615                 620                 625CGG ATG GTG TTT AAA GGG CTG GAA ACC GTG CGC ACC GAC TGG ACG CCG       2036Arg Met Val Phe Lys Gly Leu Glu Thr Val Arg Thr Asp Trp Thr Pro
    630                 635                 640CTG GCC CAG CAG TTT CAG CAG GAG CTA TAC CTG CGC ATC TTC CGC AAC       2084Leu Ala Gln Gln Phe Gln Gln Glu Leu Tyr Leu Arg Ile Phe Arg Asn
645                 650                 655GAG CCA TAT CAG GAA TAT GTA CGC GAA ACC ATC GAC AAA CTG ATG GCG       2132Glu Pro Tyr Gln Glu Tyr Val Arg Glu Thr Ile Asp Lys Leu Met Ala660                 665                 670                 675GGT GAA CTG GAT GCG CGA CTG GTT TAC CGT AAA CGC CTT CGC CGT CCG       2180Gly Glu Leu Asp Ala Arg Leu Val Tyr Arg Lys Arg Leu Arg Arg Pro
            680                 685                 690CTG AGC GAG TAT CAG CGT AAT GTG CCG CCT CAT GTA CGC GCC GCT CGC       2228Leu Ser Glu Tyr Gln Arg Asn Val Pro Pro His Val Arg Ala Ala Arg
        695                 700                 705CTT GCC GAT GAA GAA AAC CAA AAG CGT GGT CGC CCC TTG CAA TAT CAG       2276Leu Ala Asp Glu Glu Asn Gln Lys Arg Gly Arg Pro Leu Gln Tyr Gln
    710                 715                 720AAT CGC GGC ACC ATT AAG TAC GTA TGG ACC ACC AAC GGC CCG GAG CCG       2324Asn Arg Gly Thr Ile Lys Tyr Val Trp Thr Thr Asn Gly Pro Glu Pro
725                 730                 735CTG GAC TAC CAA CGT TCA CCA CTG GAT TAC GAA CAC TAT CTG ACC CGC       2372Leu Asp Tyr Gln Arg Ser Pro Leu Asp Tyr Glu His Tyr Leu Thr Arg740                 745                 750                 755CAG CTA CAA CCC GTG GCG GAG GGA ATA CTC CCT TTT ATT GAG GAT AAT       2420Gln Leu Gln Pro Val Ala Glu Gly Ile Leu Pro Phe Ile Glu Asp Asn
            760                 765                 770TTT GCT ACA CTT ATG ACC GGG CAA CTT GGG CTA TTT TGA                   2459Phe Ala Thr Leu Met Thr Gly Gln Leu Gly Leu Phe
        775                 780(2)SEQ ID NO:6的资料:
(i)序列特征:
    (A)长度:783氨基酸
    (B)类型:氨基酸
    (D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:6:Val Ala Gln Ala Gly Phe Ile Leu Thr Arg His Trp Arg Asp Thr Pro1               5                  10                  15Gln Gly Thr Glu Val Ser Phe Trp Leu Ala Thr Asp Asn Gly Pro Leu
         20                  25                  30Gln Val Thr Leu Ala Pro Gln Glu Ser Val Ala Phe Ile Pro Ala Asp
     35                  40                  45Gln Val Pro Arg Ala Gln His Ile Leu Gln Gly Glu Gln Gly Phe Arg
 50                  55                  60Leu Thr Pro Leu Ala Leu Lys Asp Phe His Arg Gln Pro Val Tyr Gly65                  70                  75                  80Leu Tyr Cys Arg Ala His Arg Gln Leu Met Asn Tyr Glu Lys Arg Leu
             85                  90                  95Arg Glu Gly Gly Val Thr Val Tyr Glu Ala Asp Val Arg Pro Pro Glu
        100                 105                 110Arg Tyr Leu Met Glu Arg Phe Ile Thr Ser Pro Val Trp Val Glu Gly
    115                 120                 125Asp Met His Asn Gly Thr Ile Val Asn Ala Arg Leu Lys Pro His Pro
130                 135                 140Asp Tyr Arg Pro Pro Leu Lys Trp Val Ser Ile Asp Ile Glu Thr Thr145                 150                 155                 160Arg His Gly Glu Leu Tyr Cys Ile Gly Leu Glu Gly Cys Gly Gln Arg
            165                 170                 175Ile Val Tyr Met Leu Gly Pro Glu Asn Gly Asp Ala Ser Ser Leu Asp
        180                 185                 190Phe Glu Leu Glu Tyr Val Ala Ser Arg Pro Gln Leu Leu Glu Lys Leu
    195                 200                 205Asn Ala Trp Phe Ala Asn Tyr Asp Pro Asp Val Ile Ile Gly Trp Asn
210                 215                 220Val Val Gln Phe Asp Leu Arg Met Leu Gln Lys His Ala Glu Arg Tyr225                 230                 235                 240Arg Leu Pro Leu Arg Leu Gly Arg Asp Asn Ser Glu Leu Glu Trp Arg
            245                 250                 255Asp Asp Gly Phe Lys Asn Gly Val Phe Phe Ala Gln Ala Lys Gly Gly
        260                 265                 270Leu Ile Ile Asp Gly Ile Glu Ala Leu Lys Ser Ala Phe Trp Asn Phe
    275                 280                 285Ser Ser Phe Ser Leu Glu Thr Val Ala Gln Glu Leu Leu Gly Glu Gly
290                 295                 300Lys Ser Ile Asp Asn Pro Trp Asp Arg Met Asp Glu Ile Asp Arg Arg305                 310                 315                 320Phe Ala Glu Asp Lys Pro Ala Leu Ala Thr Tyr Asn Leu Lys Asp Cys
            325                 330                 335Glu Leu Val Thr Gln Ile Phe His Lys Thr Glu Ile Met Pro Phe Leu
        340                 345                 350Leu Glu Arg Ala Thr Val Asn Gly Leu Pro Val Asp Arg His Gly Gly
    355                 360                 365Ser Val Ala Ala Phe Gly His Leu Tyr Phe Pro Arg Met His Arg Ala
370                 375                 380Gly Tyr Val Ala Pro Asn Leu Gly Glu Val Pro Pro His Ala Ser Pro385                 390                 395                 400Gly Gly Tyr Val Met Asp Ser Arg Pro Gly Leu Tyr Asp Ser Val Leu
            405                 410                 415Val Leu Asp Tyr Lys Ser Leu Tyr Pro Ser Ile Ile Arg Thr Phe Leu
        420                 425                 430Ile Asp Pro Val Gly Leu Val Glu Gly Met Ala Gln Pro Asp Pro Glu
    435                 440                 445His Ser Thr Glu Gly Phe Leu Asp Ala Trp Phe Ser Arg Glu Lys His
450                 455                 460Cys Leu Pro Glu Ile Val Thr Asn Ile Trp His Gly Arg Asp Glu Ala465                 470                 475                 480Lys Arg Gln Gly Asn Lys Pro Leu Ser Gln Ala Leu Lys Ile Ile Met
            485                 490                 495Asn Ala Phe Tyr Gly Val Leu Gly Thr Thr Ala Cys Arg Phe Phe Asp
        500                 505                 510Pro Arg Leu Ala Ser Ser Ile Thr Met Arg Gly His Gln Ile Met Arg
    515                 520                 525Gln Thr Lys Ala Leu Ile Glu Ala Gln Gly Tyr Asp Val Ile Tyr Gly
530                 535                 540Asp Thr Asp Ser Thr Phe Val Trp Leu Lys Gly Ala His Ser Glu Glu545                 550                 555                 560Glu Ala Ala Lys Ile Gly Arg Ala Leu Val Gln His Val Asn Ala Trp
            565                 570                 575Trp Ala Glu Thr Leu Gln Lys Gln Arg Leu Thr Ser Ala Leu Glu Leu
        580                 585                 590Glu Tyr Glu Thr His Phe Cys Arg Phe Leu Met Pro Thr Ile Arg Gly
    595                 600                 605Ala Asp Thr Gly Ser Lys Lys Arg Tyr Ala Gly Leu Ile Gln Glu Gly
610                 615                 620Asp Lys Gln Arg Met Val Phe Lys Gly Leu Glu Thr Val Arg Thr Asp625                 630                 635                 640Trp Thr Pro Leu Ala Gln Gln Phe Gln Gln Glu Leu Tyr Leu Arg Ile
            645                 650                 655Pne Arg Asn Glu Pro Tyr Gln Glu Tyr Val Arg Glu Thr Ile Asp Lys
        660                 665                 670Leu Met Ala Gly Glu Leu Asp Ala Arg Leu Val Tyr Arg Lys Arg Leu
    675                 680                 685Arg Arg Pro Leu Ser Glu Tyr Gln Arg Asn Val Pro Pro His Val Arg
690                 695                 700Ala Ala Arg Leu Ala Asp Glu Glu Asn Gln Lys Arg Gly Arg Pro Leu705                 710                 715                 720Gln Tyr Gln Asn Arg Gly Thr Ile Lys Tyr Val Trp Thr Thr Asn Gly
            725                 730                 735Pro Glu Pro Leu Asp Tyr Gln Arg Ser Pro Leu Asp Tyr Glu His Tyr
        740                 745                 750Leu Thr Arg Gln Leu Gln Pro Val Ala Glu Gly Ile Leu Pro Phe Ile
    755                 760                 765Glu Asp Asn Phe Ala Thr Leu Met Thr Gly Gln Leu Gly Leu Phe
770                 775                 780

Claims (34)

1、一种变异型B族DNA聚合酶,其特征在于它没有3′→5′核酸外切酶活性。
2、权利要求1的变异型B族DNA聚合酶,其中所述聚合酶选自变异型T4 DNA聚合酶,变异型大肠杆菌DNA聚合酶II,变异型T2 DNA聚合酶和变异型T6 DNA聚合酶。
3、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酸特征在于,在第50位密码子上的异亮氨酸被亮氨酸替代。
4、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酶的特征在于在密码子82存在的谷氨酸由天冬氨酸替代。
5、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酶的特征在于,在密码子213位存在的色氨酸由丝氨酸替代。
6、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酶的特征在于,在密码子第255位存在的谷氨酸由丝氨酸替代。
7、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酶的特征在于,在密码子417位存在的异亮氨酸由缬氨酸替代。
8、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酶的特征在于,在密码子737位存在的丙氨酸用缬氨酸替代。
9、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酶的特征在于,在密码子743位存在的丙氨酸用缬氨酸替代。
10、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酶的特征在于,在密码子112位存在的天冬氨酸用丙氨酸替代。
11、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酶的特征在于,在密码子114位存在的异亮氨酸用亮氨酸替代。
12、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型T4 DNA聚合酶的特征在于,在密码子219位存在的天冬氨酸用丙氨酸替代。
13、根据权利要求2所述变异型B族DNA聚合酶。其中所述变异型T4 DNA聚合酶的特征在于,在密码子第324位存在的天冬氨酸用丙氨酸替代。
14、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型大肠杆菌DNA聚合酶II的特征在于,在密码子156位的天冬氨酸由丙氨酸替代。
15、根据权利要求2所述变异型B族DNA聚合酶,其中所述变异型大肠杆菌DNA聚合酶II的特征在于,在密码子第158位存在的谷氨酸用丙氨酸替代。
16、一种DNA测序方法,包括下列步骤:在dATP,dGTP,dCTP, dTTP和选自于ddATP和3′-氨基-2′,3′双脱氧-ATP的第一个链终止核苷酸,选自于ddGTP和3′-氨基-2′,3′-双脱氧-GTP的第二个链终止核苷酸,选自于阿糖CTP和3′-氨基-2′,3′双脱氧-CTP的第三个链终止核苷酸以及选自于阿糖UTP和3′-氨基-2′,3′-双脱氧-TTP的第4个链终止核苷酸存在下,将一种聚合酶与待测序的引发DNA链相接触,并且
在保持聚合酶活性的反应条件下使该接触保持足够长时间以便获得测序信息。
17、根据权利要求16所述方法,其中所述第一个链终止核苷酸是ddATP,所述第二个链终止核苷酸是ddGTP,所述第三个链终止核苷酸是阿糖CTP,并且所述第四个链终止核苷酸是阿糖UTP。
18、根据权利要求17所述方法,其中该聚合酶选自于变异型T4聚合酶,变异型大肠杆菌DNA聚合酶II,变异型T2聚合酶和变异型T6聚合酶。
19、根据权利要求18所述方法,其中该聚合酶是变异型T4聚合酶。
20、根据权利要求19所述方法,进一步包括至少一种辅助蛋白,它与所述变异型T4聚合酶形成一种复合物,从而增强了所述变异型T4聚合酶的工作性能。
21、根据权利要求20所述方法,其中该辅助蛋白质选自于T4基因产物32,41,45和44/62复合物。
22、权利要求18的方法,其中,该变异型聚合酶是变异型大肠杆菌DNA聚合酶II。
23、权利要求22的方法,进一步包括至少一种辅助蛋白,它与变异型大肠杆菌DNA聚合酶II形成一个复合物,从而增强了所述变异型大肠杆菌DNA聚合酶II的工作性能。
24、根据权利要求23所述方法,其中所述辅助蛋白质是B蛋白质,γ复合物,和SSB蛋白质的组合。
25、根据权利要求16所述方法,其中所述第一个链终止核苷酸是3′-氨基-2′,3′双脱氧-ATP,所述第二个链终止核苷酸是3′-氨基-2′,3′-双脱氧-GTP,所述第三个链终止核苷酸是3′-氨基-2′,3′双脱氧CTP以及所述第四个链终止核苷酸是3′-氨基-2′,3′双脱氧TTP。
26、权利要求25的方法,其中,该聚合酶选自T4聚合酶,变异型T4聚合酶,大肠杆菌DNA聚合酶II,变异型大肠杆菌DNA聚合酶II,T2聚合酶,变异型T2聚合酶,T6聚合酶和变异型T6聚合酶。
27、根据权利要求26所述方法,其中该聚合酶选自T4聚合酶和变异型T4聚合酶。
28、根据权利要求27所述方法,进一步包括至少一种辅助蛋白,它与T4聚合酶或变异型T4聚合酶形成一种复合物,从而增强了所述T4聚合酶或变异型T4聚合酶的工作性能。
29、根据权利要求28所述方法,其中该辅助蛋白选自T4基因产物32,41,45和44/62复合物。
30、根据权利要求26所述方法,其中该变异型聚合酶是大肠杆菌DNA聚合酶II和变异型大肠杆菌DNA聚合酶II。
31、根据权利要求30所述方法,进一步包括至少一种辅助蛋白,它与大肠杆菌DNA聚合酶II或变异型大肠杆菌DNA聚合酶II形成一种复合物,从而增强了所述大肠杆菌DNA聚合酶II或变异型大肠杆菌DNA聚合酶II的工作性能。
32、根据权利要求31所述方法,其中所述辅助蛋白是β蛋白质,γ复合物和SSB蛋白质的组合。
33、一种DNA测序方法,该方法包括下列步骤:
在标准核苷酸存在下,将变异型T4 DNA聚合酶与待测序的引发DNA链相接触,其中与其他标准核苷酸的浓度相比,一种标准核苷酸的浓度是非常低的;并且
在保持聚合酶活性的反应条件下使所述接触过程保持足够长的时间以便获得测序信息。
34、一种鉴定和分离变异型T4 DNA聚合酶的方法,该方法包括下列步骤:
鉴定出含有在DNA复制的某些方面缺陷的变异型T4 DNA聚合酶的T4毒株;
通过在大肠杆菌optA1宿主中选择而分离所述变异型T4 DNA聚合酶的进一步修饰形式;
分离含有至少有一种其它突变的变异型T4 DNA聚合酶的T4毒株,所述其它突变校正或补偿所述DNA复制能力的缺陷;
鉴定出在所述变异型T4 DNA聚合酶中存在的该校正/补偿突变;以及
将所述鉴定出的校正/补偿突变T4 DNA聚合酶导入到T4噬菌体或T4 DNA聚合酶表达载体中。
CN94193642A 1993-08-02 1994-08-01 Dna测序酶 Pending CN1132529A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/101,593 US5547859A (en) 1993-08-02 1993-08-02 Chain-terminating nucleotides for DNA sequencing methods
US08/101,593 1993-08-02

Publications (1)

Publication Number Publication Date
CN1132529A true CN1132529A (zh) 1996-10-02

Family

ID=22285458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN94193642A Pending CN1132529A (zh) 1993-08-02 1994-08-01 Dna测序酶

Country Status (18)

Country Link
US (3) US5547859A (zh)
EP (1) EP0713535A1 (zh)
JP (1) JPH09509301A (zh)
KR (1) KR960704067A (zh)
CN (1) CN1132529A (zh)
AU (1) AU699498B2 (zh)
BG (1) BG100188A (zh)
BR (1) BR9407403A (zh)
CA (1) CA2168471A1 (zh)
CZ (1) CZ30696A3 (zh)
FI (1) FI960469A (zh)
HU (1) HUT75841A (zh)
LV (1) LV11486B (zh)
NO (1) NO960408L (zh)
NZ (1) NZ269727A (zh)
PL (1) PL312836A1 (zh)
SK (1) SK14196A3 (zh)
WO (1) WO1995004162A2 (zh)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6406855B1 (en) 1994-02-17 2002-06-18 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5614365A (en) * 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
CA2251643A1 (en) * 1996-04-15 1997-10-23 University Of Alberta Synthesis of fluorophore-labeled dna
US5827716A (en) * 1996-07-30 1998-10-27 Amersham Life Science, Inc. Modified Pol-II type DNA polymerases
US6291164B1 (en) 1996-11-22 2001-09-18 Invitrogen Corporation Methods for preventing inhibition of nucleic acid synthesis by pyrophosphate
US6780591B2 (en) * 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
JP3813818B2 (ja) * 1998-05-01 2006-08-23 アリゾナ ボード オブ リージェンツ オリゴヌクレオチドおよびdna分子のヌクレオチド配列の決定方法
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US20040009486A1 (en) 1999-10-29 2004-01-15 Sorge Joseph A. Compositions and methods utilizing DNA polymerases
EP1226255B1 (en) * 1999-10-29 2006-03-29 Stratagene California Compositions and methods utilizing dna polymerases
US6664079B2 (en) * 2000-10-06 2003-12-16 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US7057026B2 (en) * 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
ES2550513T3 (es) 2002-08-23 2015-11-10 Illumina Cambridge Limited Nucleótidos modificados para secuenciación de polinucleótidos
US11008359B2 (en) 2002-08-23 2021-05-18 Illumina Cambridge Limited Labelled nucleotides
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
ATE463584T1 (de) 2004-02-19 2010-04-15 Helicos Biosciences Corp Verfahren zur analyse von polynukleotidsequenzen
US7476734B2 (en) 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
US7635562B2 (en) 2004-05-25 2009-12-22 Helicos Biosciences Corporation Methods and devices for nucleic acid sequence determination
US7220549B2 (en) 2004-12-30 2007-05-22 Helicos Biosciences Corporation Stabilizing a nucleic acid for nucleic acid sequencing
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
GB0517097D0 (en) * 2005-08-19 2005-09-28 Solexa Ltd Modified nucleosides and nucleotides and uses thereof
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
WO2007070642A2 (en) * 2005-12-15 2007-06-21 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
EP2071927A2 (en) 2006-09-28 2009-06-24 Illumina, Inc. Compositions and methods for nucleotide sequencing
DE112007002932B4 (de) 2006-12-01 2015-08-06 The Trustees Of Columbia University In The City Of New York Vierfarben DNA-Sequenzierung mittels Synthese unter Verwendung von abspaltbaren, reversiblen, fluoreszierenden Nucleotidterminatoren
EP4310194A2 (en) 2007-10-19 2024-01-24 The Trustees of Columbia University in the City of New York Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis
US9115163B2 (en) 2007-10-19 2015-08-25 The Trustees Of Columbia University In The City Of New York DNA sequence with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators
US7767441B2 (en) * 2007-10-25 2010-08-03 Industrial Technology Research Institute Bioassay system including optical detection apparatuses, and method for detecting biomolecules
US7811810B2 (en) 2007-10-25 2010-10-12 Industrial Technology Research Institute Bioassay system including optical detection apparatuses, and method for detecting biomolecules
ES2936256T3 (es) 2008-02-01 2023-03-15 Massachusetts Gen Hospital Uso de microvesículas en el diagnóstico, y pronóstico de enfermedades y afecciones médicas
US20130029339A1 (en) 2009-09-09 2013-01-31 The General Hospital Corporation Use of microvesicles in analyzing kras mutations
WO2011031877A1 (en) 2009-09-09 2011-03-17 The General Hospital Corporation Use of microvesicles in analyzing nucleic acid profiles
US20140045915A1 (en) 2010-08-31 2014-02-13 The General Hospital Corporation Cancer-related biological materials in microvesicles
WO2012064993A1 (en) 2010-11-10 2012-05-18 Exosome Diagnosties, Inc. Method for isolation of nucleic acid containing particles and extraction of nucleic acids therefrom
CA2887058C (en) 2012-10-03 2022-02-22 Exosome Diagnostics, Inc. Use of microvesicles in diagnosis, prognosis, and treatment of medical diseases and conditions
CN105377869B (zh) 2013-03-15 2018-07-10 伊鲁米纳剑桥有限公司 修饰的核苷或核苷酸
WO2014144883A1 (en) 2013-03-15 2014-09-18 The Trustees Of Columbia University In The City Of New York Raman cluster tagged molecules for biological imaging
US10451544B2 (en) 2016-10-11 2019-10-22 Genotox Laboratories Methods of characterizing a urine sample

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4666892A (en) * 1984-03-06 1987-05-19 Sloan-Kettering Memorial Cancer Center Method and composition for hepatitis treatment with pyrimidine nucleoside compounds
DE3546374A1 (de) * 1985-12-31 1987-07-02 Max Planck Gesellschaft Verfahren zur sequenzanalyse von dna
CA1340806C (en) * 1986-07-02 1999-11-02 James Merrill Prober Method, system and reagents for dna sequencing
US4935361A (en) * 1986-09-18 1990-06-19 Yale University Cloning and expression of T4 DNA polymerase
US4942130A (en) * 1987-01-14 1990-07-17 President & Fellows Of Harvard College T7 DNA polymerase
US5102785A (en) * 1987-09-28 1992-04-07 E. I. Du Pont De Nemours And Company Method of gene mapping
US4962020A (en) * 1988-07-12 1990-10-09 President And Fellows Of Harvard College DNA sequencing
US5001050A (en) * 1989-03-24 1991-03-19 Consejo Superior Investigaciones Cientificas PHφ29 DNA polymerase
WO1991006679A1 (en) * 1989-10-24 1991-05-16 Stratagene An improved method for hybridizing nucleic acids using single-stranded nucleic acid binding protein
DE4214112A1 (de) * 1991-08-02 1993-02-04 Europ Lab Molekularbiolog Neues verfahren zur sequenzierung von nukleinsaeuren
US5316948A (en) * 1992-09-04 1994-05-31 Life Technologies, Inc. N4 -methyl-2'-deoxycytidine 5'-triphosphate and its use in polymerase-catalyzed nucleic acid syntheses
US5541311A (en) * 1992-12-07 1996-07-30 Third Wave Technologies, Inc. Nucleic acid encoding synthesis-deficient thermostable DNA polymerase
US5436149A (en) * 1993-02-19 1995-07-25 Barnes; Wayne M. Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension

Also Published As

Publication number Publication date
LV11486B (en) 1997-02-20
CZ30696A3 (en) 1996-06-12
BG100188A (en) 1996-12-31
FI960469A0 (fi) 1996-02-01
WO1995004162A3 (en) 1995-06-01
SK14196A3 (en) 1996-06-05
CA2168471A1 (en) 1995-02-09
US5547859A (en) 1996-08-20
PL312836A1 (en) 1996-05-13
NO960408L (no) 1996-03-27
JPH09509301A (ja) 1997-09-22
NZ269727A (en) 1997-11-24
FI960469A (fi) 1996-03-27
WO1995004162A2 (en) 1995-02-09
AU699498B2 (en) 1998-12-03
HUT75841A (en) 1997-05-28
US5928919A (en) 1999-07-27
US5660980A (en) 1997-08-26
BR9407403A (pt) 1996-11-05
KR960704067A (ko) 1996-08-31
AU7408894A (en) 1995-02-28
NO960408D0 (no) 1996-01-31
LV11486A (lv) 1996-08-20
HU9600235D0 (en) 1996-03-28
EP0713535A1 (en) 1996-05-29

Similar Documents

Publication Publication Date Title
CN1132529A (zh) Dna测序酶
CN1185347C (zh) 用于改进体外核酸合成和扩增的提升热稳定dna聚合酶保真性的热稳定酶
CN1154733C (zh) 改进的热稳定dna聚合酶
CN1273611C (zh) 使用突变dna聚合酶的高温逆转录
CN100347291C (zh) 用于发酵制备l-半胱氨酸、l-胱氨酸、n-乙酰丝氨酸或四氢噻唑衍生物的微生物和方法
CN1197962C (zh) 用于测序的改变的热稳定dna聚合酶
CN1633505A (zh) 核酸扩增方法
CN1198943C (zh) 通过裂解脱碱基位点的核酸产生可延伸的上游dna片段而鉴定核酸分子的方法
CN1040025C (zh) 编码可提高耐热性的脱氨基甲酰酶的dna及其用途
CN1415020A (zh) 检测突变和/或多态性的方法
CN1831115A (zh) 嘌呤类物质产生菌及嘌呤类物质的制备方法
CN1384190A (zh) 通过发酵生产l-谷氨酰胺的方法和产生l-谷氨酰胺的细菌
CN1187539A (zh) 用于产生l-赖氨酸的方法
CN100351393C (zh) 核苷酸多态性的检测方法
CN1552869A (zh) 新型dna聚合酶
CN1590543A (zh) 热稳定的Taq聚合酶片断
CN1876843A (zh) 检测突变和/或多态性的方法
CN1823162A (zh) 丝氨酸乙酰转移酶突变体和生产l-半胱氨酸的方法
CN1117860C (zh) 发酵生产l-赖氨酸的方法
CN1308457C (zh) 发酵生产s-腺苷甲硫氨酸的方法
CN1861799A (zh) 一种改进的重叠延伸pcr方法及其所获得的突变基因
CN1641019A (zh) 头孢菌素c酰基转移酶
CN1174098C (zh) Dna片段和含有该dna片段的重组载体以及应用其之后外源基因的表达方法
CN1536072A (zh) 属于芽孢杆菌属的肌苷生产细菌和生产肌苷的方法
CN1250743C (zh) 测定核酸碱基序列的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication