SK14196A3 - Enzymes sequencing dna - Google Patents

Enzymes sequencing dna Download PDF

Info

Publication number
SK14196A3
SK14196A3 SK141-96A SK14196A SK14196A3 SK 14196 A3 SK14196 A3 SK 14196A3 SK 14196 A SK14196 A SK 14196A SK 14196 A3 SK14196 A3 SK 14196A3
Authority
SK
Slovakia
Prior art keywords
variant
dna polymerase
dna
polymerase
lys
Prior art date
Application number
SK141-96A
Other languages
English (en)
Inventor
Myron F Goodman
Linda J Reha-Krantz
Original Assignee
Univ Southern California
Univ Alberta
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Southern California, Univ Alberta filed Critical Univ Southern California
Publication of SK14196A3 publication Critical patent/SK14196A3/sk

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Description

Doterajší stav techniky
Vynález sa týka modifikácií metódy sekvenovania DNA, vyvinutej F. Sangerom (Sanger, F., Nicklen, S., Coulson, A. R. (1977), Proc. Natl. Acad. Sci. U. S. A. 74, 5463-5467) a taktiež nových enzýmov, ktoré je možné použiť pre sekvenovanie DNA. Sangerova metóda sekvenovania je založená na reakciách syntézy DNA in vitro v prítomnosti primérového templátu DNA,X 2'-dezoxyribonukleozidtrifosfátov (dNTP, viď obr. 1) a 2’,3'— didezoxyribonukleozidtrifosfátov (ddNTP, obr. 1). Posledné uvedené pri zabudovaní polymerázou DNA do polynukleotidového reťazca ukončujú ďalšie predlžovanie reťazca. Produkty DNA teda tvoria rad polynukleotidových reťazcov, komplementárnych k templátu a terminovaných špecifickými didezoxynukleotidmi. Produkty sekvenovania DNA je možné rozdeliť podľa veľkosti a schéma produktov potom udáva sekvenciu DNA.
V princípe by mali byt pre sekvenovanie DNA použiteľné DNA polymerázy z rôznych organizmov a rôzne terminačné nukleotidy. V praxi bolo zistené, že pre tento účel je vhodných iba málo DNA polymeráz a terminačných nukleotidov. Ako príklad polymerázy sekvenujúcej DNA je možné uviesť vývoj DNA polymerázy bakteriofága T7, Sequenace (Tábor, S., a Richardson, C. C. (1990), J. Biol. Chem. 265, 8322-8328). Pre získanie jednoznačnej sekvencie DNA je nutné, aby väčšina produktov sekvenovania bola zakončená didezoxynukleotidom a aby všetky produkty sekvenovania boli zastúpené rovnako. Dve aktivity DNA polymerázy fága T7 degradujú produkty sekvenovania DNA, a pre zamedzenie degradácie didezoxynukleotidom terminovaných produktov sekvenovania teda musia byť tieto aktivity eliminované. Jedna z týchto aktivít, aktivita 3'->5' exonukleázy, bola odstránená konštrukciou variantu DNA polymerázy T7 deficitného na exonukleázu. DNA polymeráza T7 má tiež py2 rofosforolytickú aktivitu, ktorá môže degradovať, produkty sekvenovania. Bola pridaná pyrofosfatáza pre degradáciu pyrofosfátu, produkovaného pri reakciách sekvenovania DNA; bez pyrofosfátu nedochádza k pyrofosforolýze. Ďalším zdokonalením sekvenovacích reakcií bolo použitie Mn2+ namiesto Mg2+, ktoré viedlo k rovnomernejšej distribúcii reakčných produktov.
I keď je tento krátky prehľad vývoja DNA polymerázy T7 na sekvenujúcu polymerázu zjednodušujúci, dobre ilustruje skutočnosť, že na získanie vysoko kvalitných informácií o sekvencii DNA s použitím terminačnej metódy sekvenovania je nutná modifikácia prírodnej DNA polymerázy a vývoj reakčných podmienok.
Optimálne podmienky sekvenovania DNA s použitím metódy terminácie reťazca dosiaľ neboli dosiahnuté. Dosiaľ je pozorovaná nejednoznačnosť sekvenčných informácií, ktorá vyžaduje • 7 + stanovenie sekvencie DNA oboch retazcov DNA. Použitie Mn namiesto Mg tiež zvyšuje množstvo templatu DNA nutné pre reakcie sekvenovania. Bolo by teda výhodné vyvinúť nové metódy, ktoré by zlepšili alebo doplnili existujúce postupy sekvenovania .
Gén DNA polymerázy T4 divokého typu bol klonovaný a proteínový produkt bol exprimovaný (Lin, T.-C., Rush, J. R., Spicer, E. K., a Konigsberg, W. H. (1987), Proc. Natl. Acad. Sci. U.S. A. 84, 7000-7004; patent US 4,935.361, autor Lin ad.) a bola klonovaná a exprimovaná DNA polymeráza II E. coli (Bonner, C. A., Hays, S., McEntee, K., a Goodman, M. F. (1990), Proc. Natl. Acad. Sci. U.S.A. 87, 7663-7667). Štandardné techniky oligonukleotidovo riadenej mutagenézy boli použité ku konštrukcii nových foriem DNA polymerázy T4 a DNA polymerázy II E. coli. Existujú teda prostriedky pre ekonomickú prípravu veľkých množstiev divokého typu a variantov DNA polymerázy T4 a DNA polymerázy II E. coli.
Iným aspektom vynálezu je použitie genetickej analýzy na identifikáciu DNA polymeráz s vlastnosťami vhodnými pre sekvenovanie DNA. DNA polymeráza T4 je jedna z najintenzívnejšie geneticky charakterizovaných DNA polymeráz (Reha-Krantz, L. J. (1993), in: Molecular Biology of Bacteriophage T4, ed. Karam J., American Association for Microbiology, v tlači); niektoré už identifikované mutantné DNA polymerázy teda môžu mat vlastnosti vhodné pre sekvenovanie DNA a je možné priamo izolovať nové mutanty. Ďalšiu výhodu by teda priniesol spôsob izolácie nových DNA polymeráz T4 s vhodnými vlastnosťami pre sekvenovanie DNA.
x
Podstata vynálezu
Predmetom vynálezu sú nové enzýmy, ktoré môžu byť použité ako polymerázy sekvenujúce DNA. Tieto enzýmy sa získavajú genetickými mutáciami DNA polymeráz radu B. Tieto mutácie z týchto nových DNA polymeráz radu B eliminujú aktivitu 3'-» 5' exonukleázy.
Ďalej sú predmetom vynálezu spôsoby, ktoré umožňujú používať DNA polymerázu fága T4 a DNA polymerázu II E. coli ako polymerázy sekvenujúce DNA. Modifikácie DNA polymerázy, ktoré prevádzajú DNA polymerázu fága T4 a DNA polymerázu II E. coli na polymerázy sekvenujúce DNA, môžu byť tiež použité na podobnú modifikáciu DNA polymeráz, majúcich proteínovú sekvenčnú homológiu s týmito dvoma polymerázami. DNA polymerázy s podobnosťami proteínovej sekvencie s DNA polymerázou T4 a DNA polymerázou II E. coli zahrnujú, avšak neobmedzujú sa na ne, skupinu DNA polymeráz, ktoré sa nazývajú DNA polymerázy radu B (Braithwaite, D. K. a Ito, J. (1993), Nucl. Acids Res. 21, 787-802). Zvláštny význam 'majú DNA polymerázy z fágov T2 a T6, ktoré majú značnú proteínovú sekvenčnú homológiu s DNA polymerázou T4. Ďalšie rozšírenie tu opísaných metód spočíva v tom, že DNA polymerázy s funkčnými podobnosťami s DNA polymerázou T4 a DNA polymerázou II E. coli môžu byt tiež použité na získanie sekvenčnej informácie DNA s terminačnými nukleotidmi a ďalej opísanými metódami.
Ďalej je predmetom vynálezu spôsob identifikácie modifikácií DNA polymerázy, majúcich jednu alebo viac.špecifických substitúcií aminokyselín v proteínovej sekvencii polymerázy, ktoré zlepšujú danú DNA polymerázu z hľadiska aplikácií pre sekvenovanie DNA.
Prehľad obrázkov na výkresoch
Obr. 1 znázorňuje štruktúru štandardných nukleotidov a analógov nukleotidov použiteľných pri uskutočňovaní vynálezu.
Obr. 2 znázorňuje gély sekvenovania DNA, ktoré vznikli pri použití variantnej DNA polymerázy II E. coli a DNA polymerázy T4 .
Obr. 3 znázorňuje gél sekvenovania DNA, v ktorom je dATP použitý vo veľmi nízkej koncentrácii v porovnaní s ostatnými štandardnými nukleotidmi.
Obr. 4 znázorňuje rozšírenie priméru za abázické miesto templátu (X) divokou a mutantnou DNA polymerázou T4.
Aspekt vynálezu, ktorým je identifikácia modifikovaných DNA polymeráz s novými vlastnosťami, ktoré zlepšujú schopnosť modifikovaných DNA polymeráz uskutočňovať reakcie sekvenovania DNA, je dosahovaný návrhom novej genetickej selekčnej stratégie, ktorá identifikuje DNA polymerázy s vyššou aktivitou replikácie DNA. Táto nová genetická selekčná stratégia bola navrhnutá v súvislosti s DNA polymerázou T4.
DNA polymeráza T4 (SEQ ID NO: 3 a 4) a DNA polymeráza II
E. coli (SEQ ID NO: 5 a 6), ktoré dosiaľ nebolo možné použiť ako sekvenujúce polymerázy, môžu byt použité ako DNA sekvenujúce polymerázy v reakciách Sangerovho typu, ak sa používajú neštandardné alebo nové kombinácie terminačných nukleotidov.
K tomuto objavu sa pripojuje zistenie,, že inaktivácia 3'-? 5' exonukleázovej aktivity v DNA polymeráze T4 a DNA polymeráze II E. coli zlepšuje kvalitu získanej sekvenčnej informácie DNA. V ďalšom aspekte boli objavené ďalšie modifikácie polymeráz, ktoré ak sa skombinujú s inými modifikáciami znižujúcimi 3'-*5' exonukleázovú aktivitu, sú schopné produkovať viacnásobne modifikovanú DNA polymerázu s výhodnými vlastnos-, ťami pre sekvenovanie DNA. Vplyvom značnej sekvenčnej homológie s DNA polymerázou T4 sú DNA polymerázy, ako sú DNA polymerázy fágov T2 (SEQ ID NO: 1 a 2) a T6, zvlášť vhodné pri aplikácii metód podľa vynálezu.
DNA polymeráza T4 a DNA polymeráza II E. coli môžu byť použité ako účinné polymerázy sekvenujúce DNA, ak sa namiesto štandardných terminačných nukleotidov ddTTP a ddCTP použijú arabinonukleotidy (obr. 1) araUTP a araCTP. Štandardné purínové didezoxynukleotidy (obr. 1) ddATP a ddGTP sú účinné terminačné nukleotidy pre DNA polymerázu T4 a DNA polymerázu II E. coli. Reakcie sekvenovania DNA pre DNA polymerázu T4 a DNA polymerázu II E. coli sa líšia od štandardných reakcií sekvenovania DNA v tom, že sa používa nová kombinácia terminačných nukleotidov. I keď môže byt v princípe použitý akýkoľvek terminačný nukleotid, DNA polymerázy sa výrazne líšia schopnosťou začleňovať tieto nukleotidy do reťazca DNA. U DNA polymerázy T4 a DNA polymerázy II E. coli nízke začleňovanie ddTTP a ddCTP týmito enzýmami zabránilo použitiu týchto štandardných terminačných nukleotidov v sekvenčných protokoloch. Zistenie, že alternatívne terminačné arabinonukleotidy araCTP a araUTP môžu byť DNA polymerázou T4 a DNA polymerázou II E. coli začlenené relatívne účinne, umožňuje používať tieto polymerázy ako sekvenujúce polymerázy. Metóda sekvenovania DNA, ktorá používa reakcie s novými kombináciami terminačných nuk6 leotidov - araCTP, araUTP, ddATP a ddGTP - je opísaná ďalej ako metóda I.
Ďalším objavom je, že inaktivácia alebo významná redukcia 3'-t 5' exonukleázovej aktivity DNA polymerázy T4 a DNA polymerázy II E. coli zvyšuje kvalitu sekvenčnej informácie DNA, získanej pomocou sekvenujúcich reakcií metódou I. 3'- 5' exonukleázová aktivita DNA polymerázy T4 môže byť významne redukovaná substitúciou aminokyselín, zahrnujúcou, avšak neobmedzujúcou sa na ne, jednu alebo viac z týchto substitúcií aminokyselín v enzýme: D112A + E114A, D219A a D324A. V tejto nomenklatúre, ktorá sa používa v celom texte, sa pre aminokyse-\ liny používa jednopísmenový kód. Čísla medzi dvoma jednopísmenovými kódmi sú čísla kodónov. Napríklad D112A + E114A označuje substitúciu alanínu (A) za aspartát (D) v polohe kodónu 112. D112A + E114A označuje dve substitúcie aminokyselín v modifikovanej DNA polymeráze. Na uskutočnenie týchto obmien boli použité tieto mutácie: pre D112Ä je nukleotid A v polohe 334 nahradený nukleotidom C, čím dôjde ku zmene aminokyseliny D na aminokyselinu A, pričom ako je známe priemernému odborníkovi, môžu tú istú zmenu uskutočniť aj iné zmeny nukleotidov; pre E114A je nukleotid A v polohe 340 nahradený nukleotidom C, pričom ako je známe, môžu tú istú zmenu aminokyselín uskutočniť aj iné zmeny nukleotidov; pre D219A sú nukleotidy A, resp. C v polohách 655, resp. 656, nahradené nukleotidmi C, resp. G, pričom ako je známe, môžu tú istú zmenu aminokyselín uskutočniť aj iné zmeny nukleotidov; a pre D324A je nukleotid A v polohe 970 nahradený nukleotidom C, pričom ako je známe, môžu tú istú zmenu aminokyselín uskutočniť aj iné zmeny nukleotidov. 3 ’-* 5 ’ exonukleázová aktivita DNA polymerázy II E. coli môže byť významne redukovaná substitúciou aminokyselín, zahrnujúcou, avšak neobmedzujúcou sa na ne, tieto substitúcie aminokyselín: D156A + E158A. Na získanie týchto variantov boli použité nasledujúce mutácie: pre D156A je nukleotid A v polohe 467 nahradený nukleotidom C, pričom ako je známe, môžu tú istii zmenu aminokyselín uskutočniť aj iné zmeny nukleotidov; pre E158A je nukleotid A v polohe 473 nahradený nukleotidom C, pričom ako je známe, môžu tú istú zmenu aminokyselín uskutočniť aj iné zmeny nukleotidov. Konštrukcia variantov DNA polymerázy T4 a DNA polymerázy II E. coli deficitných na 3'-* 5' exonukleázovú aktivitu sa uskutočňuje štandardnými postupmi oligonukleotidovej mutagenézy (napríklad Kunkle, T. A., Roberts, J. D. a Zakour, R. A. (1987), Method. Enz. 154, 367-382).
Ďalší aspekt vynálezu môže byť dosiahnutý použitím terminačných nukleotidov, ktoré sa nepoužívajú pri štandardných reakciách sekvenovania DNA. DNA polymeráza T4 a DNA polymeráza II E. coli môžu byt použité tiež ako účinné polymerázy sekvenujúce DNA, ak sa namiesto štandardných ddNTP použijú 3'-amino-2',3'-didezoxyribonukleotidy (3'-NH2dNTP) (obr. 1). Táto metóda sekvenovania je tu opísaná ako metóda II. Pri reakciách v metóde II môže byt použitá nemodifikovaná DNA polymeráza T4 (divoký typ) a varianty deficitné na 3 *-»- 5 ’ exonukleázu; pri reakciách v metóde II bol taktiež úspešne použitý variant DNA polymerázy II E. coli deficitný na 3 '-» 5' exonukleázu.
Forma DNA polymerázy T4 deficitnej na 3 '-*· 5 ' exonukleázu môže byt taktiež použitá na získanie sekvenčnej informácie DNA bez nukleotidových analógov, ak je koncentrácia jedného zo štyroch štandardných dNTP veľmi nízka. Napríklad ak sú koncentrácie dGTP, dCTP a dTTP 100 μΜ a koncentrácia dATP je 0,1 až 1 μΜ, potom sú pozorované produkty sekvenovania, ktoré sú zakončené o jednu polohu predtým, než je pre včlenenie vyžadovaný dATP. S paralelnými reakciami, pri ktorých je vždy jeden dNTP prítomný v nízkej koncentrácii a ostatné tri dNTP vo vysokých koncentráciách, je možné stanoviť sekvenciu DNA. Táto metóda sekvenovania sa tu označuje ako metóda III.
Tretí cieľ; tj. identifikácia variantných alebo modifikovaných DNA polymeráz s novými vlastnosťami, ktoré umožňujú, sene
s. s aby polymerázy mali zlepšené sekvenujúce vlastnosti, bol dosiahnutý navrhnutím novej stratégie pre selekciu nových DNA polymeráz. Nová stratégia typu genetickej selekcie bola vyvinutá pre fága T4. Základná stratégia vychádza z kmeňa fága T4 , ktorý má v géne DNA polymerázy jednu alebo viac mutácií, vedúcich k variantnej (mutantnej) DNA polymeráze, ktorá je čiastočne defektná v určitom aspekte replikácie DNA. Niektoré typy modifikácií DNA polymerázy môžu znížiť schopnosť DNA polymerázy účinne replikovat DNA. Napríklad zmeny schopnosti DNA polymerázy viazať templát DNA alebo dNTP alebo schopnosti DNA polymerázy premiestňovať sa pozdĺž templátu DNA znížia účinnosť replikácie DNA. U fága T4 je možné ľahko identifikovať mutanty DNA polymerázy so zníženou aktivitou replikácie DNA. Kmene fága T4 s mutantnými DNA polymerázami, ktoré sú čiastočne deficitné v replikácii DNA, nemôžu DNA syntetizovať, ak bakteriálny hostiteľ použitý pri infekcii obsahuje mutáciu optAl. Inými slovami, hostiteľ E. coli optAl obmedzuje rast kmeňov T4 s mutantnými DNA polymerázami deficitnými na replikačnú aktivitu DNA. Dôvodom obmedzenia, pozorovaného u kmeňa E. coli optAl, je skutočnosť, že je produkované zvýktorý degraduje dGTP (Wurgler, C. (1990), Proc. Natl. Acad. Sci.
U. S. A. 87, 2740-2744). Kmene fága T4 s variantnými DNA polymerázami so zníženou replikačnou aktivitou DNA teda nemôžu replikovať DNA a ak sú znížené zásoby nukleotidov, predovšetkým dGTP, produkujú fágové potomstvo.
množstvo enzýmu, , a Richardson, C.
Z hľadiska vývoja stratégie genetickej selekcie boli stanovené podmienky, ktoré je možné použiť na identifikáciu replikačne defektných DNA polymeráz a taktiež na obmedzenie produkcie potomstva z fágov s takto defektnými DNA polymerázami , predovšetkým pre obmedzenú produkciu fágového potomstva pri infekciách bakteriálneho hostiteľa E. coli optAl. Tieto podmienky, opísané ďalej, umožňujú selekciu ďalších modifikovaných (mutovaných) DNA polymeráz s vyššou schopnosťou replikácie DNA. Ak sú variantné DNA polymerázy so zníženou repli9 kačnou aktivitou DNA ďalej modifikované, napríklad jednou alebo viacerými ďalšími substitúciami aminokyselín, môže sa stať, že ďalšie mutácie alebo substitúcie aminokyselín korigujú alebo kompenzujú pôvodný deficit aktivity replikácie DNA. Takto ďalej modifikované DNÁ polymerázy budú teraz schopné replikovat DNA v hostiteľovi E. coli optAl a bude produkované fágové potomstvo. Detekcia fágového potomstva na hostiteľovi E. coli optAl pri infekciách fágom predtým obmedzeným v produkcii potomstva na tomto hostiteľovi teda umožňuje selekciu viacpočetných mutantných DNA polymeráz, ktoré majú počiatočnú mutáciu (substitúcie aminokyselín, ktoré znižujú replikačnú aktivitu DNA) plus jednu alebo viac nových mutácií, ktoré kódujú ďalšie substitúcie aminokyselín, ktoré korigujú alebo kompenzujú počiatočný deficit replikácie DNA. Nové korigujúce alebo kompenzujúce mutácie (v genetickej terminológii tiež nazývané supresorové mutácie) môžu byť identifikované sekvenovaním génu fágovej DNA polymerázy s použitím štandardných postupov (McPheeters, D. S., Christensen, A., Young, E. T., Stormo, G., a Gold, L. (1986), Nucleic Acid Res. 14, 5813-5826; Reha-Krantz, L. J. (1988), J. Mol. Biol. 202, 711-724). Nové mutácie môžu byť pre ďalšie štúdium zavedené do génu DNA polymerázy fága T4 alebo do expresných vektorov DNA polymerázy T4. Na rozdiel od východiskových DNA polymeráz fága T4 so zníženou schopnosťou replikácie DNA majú nové variantné DNA polymerázy vyššiu schopnosť replikácie DNA, pretože tieto variantné DNA polymerázy boli selektované na báze schopnosti prekonávať, kompenzovať alebo korigovať defekty variantnej DNA polymerázy so zníženou replikačnou aktivitou DNA. Genetická stratégia pre identifikáciu variantných DNA polymeráz s vyššou schopnosťou replikácie DNA je vyS 3 soko citlivá, pretože z populácie 10 až 10 fágov je možné selektovať jediného fága s vyššie uvedenými vlastnosťami.
Variantné DNA polymerázy s vyššou replikačnou aktivitou DNA majú vlastnosti, výhodné pre polymerázu sekvenujúcu DNA, ako je zväčšené predĺženie priméru, ktoré produkuje rovnomer10 nejšiu distribúciu produktov sekvenovania a zvýšenú replikáciu DNA v templátových oblastiach, ktoré môžu blokovať alebo zamedzovať replikáciu nemodifikovanými DNA polymerázami. Varianty DNA polymerázy T4 s vyššou schopnosťou replikácie DNA sú určené na zlepšenie kvality sekvenčnej informácie DNA, získanej metódami I, II a III.
Genetická selekčná stratégia, opísaná tu pre detekciu variantných DNA polymeráz s vyššou schopnosťou replikácie DNA, môže byt aplikovaná na DNA polymerázy iných organizmov, ak môžu byť takéto defektné DNA polymerázy identifikované a ak môžu byť selektované varianty s korigujúcimi alebo kompenzu-\ júcimi mutáciami.
Metóda I sekvenovania DNA
DNA polymeráza T4 s významne redukovanou aktivitou 3 '
5' exonukleázy, ako sú variantné formy buď so substitúciami aminokyselín D112A + E114A, D219A alebo D324A a DNA polymeráza II E. coli s významne zníženou aktivitou 3'5' exonukleázy, ako je variantná forma so substitúciami aminokyselín D156A + E158A, môžu byť použité ako polymerázy sekvenujúce DNA s nasledujúcou zostavou terminačných nukleotidov: ddATP, ddGTP, araCTP a araUTP (obr. 1).
Obr. 2 ukazuje fotografie troch gélov sekvenujúcich DNA. Sekvenčné schémy, získané metódou I, sú v paneloch A a B, riadkoch 1 až 4, a v paneli C. Panel A ukazuje reakcie sekvenovania DNA s variantom DNA polymerázy II E. coli deficitným na exonukleázu. Reakcia s ddGTP je v riadku 1, reakcia ddATP je v riadku 2, reakcia s araCTP je v riadku 3 a reakcia s araUTP je v riadku 4. Panel B ukazuje reakcie sekvenovania DNA s formou DNA polymerázy bakteriofága T4, deficitnou na exonukleázu. Riadok 1 opäť obsahuje reakcie s ddGTP, riadok 2 ddATP, riadok 3 araCTP, riadok 4 araUTP. Reakcie v paneloch +
A a B majú ako dvojmocný katión kovu Mg . Sekvenčne schémy sa tiež získavajú s Mn2+ namiesto Mg2+. Reakcie s Mn2+ podľa metódy I s formou DNA polymerázy II E. coli, deficitnej na exonukleázu, sú znázornené na ľavej strane panelu C, riadky 1 až 4; reakcie s formou DNA polymerázy T4, deficitnej na exonukleázu, sú znázornené na pravej strane panelu C, riadky
I až 4. Panel C, riadky 1 až 4, obsahuje reakcie s ddGTP (riadok 1), ddATP (riadok 2), araCTP (riadok 3) a araUTP (riadok 4).
• \
Metoda II sekvenovania DNA
Divoké (nemodifikované) formy DNA polymerázy T4, deficitné na 3 ' -> 5' exonukleázu, a forma DNA polymerázy II E. coli, deficitná na 3'5' exonukleázu, môžu byť použité ako polymerázy sekvenujúce DNA s 3'-amino-23'-didezoxyribonukleotidmi (obr. 1) ako terminačnými nukleotidmi. Reakcie podlá metódy
II pre formu DNA polymerázy II E. coli, deficitnú na exonukleázu, sú znázornené na obr. 2, panel A, riadky 5 až 7. Riadok 5 ukazuje reakciu s 3'-amino-23'-didezoxyGTP, riadok 6 ukazuje reakciu s 3'-amino-2',3'-didezoxyATP, riadok 7 ukazuje reakciu s 3'-amino-2',31-didezoxyTTP. Reakcia podlá metódy II pre formu DNA polymerázy T4, deficitnú na exonukleázu, sú znázornené v paneli B, riadky 5 až 7. Riadky 5, 6a 7 ukazujú reakcie s 3'-amino-23'-didezoxyGTP, -ATP a -TTP.
Tieto údaje demonštrujú, že formy DNA polymerázy II E. coli a DNA polymeráz bakteriofága T4, deficitné na exonukleázu, môžu produkovať sekvenčnú informáciu DNA s použitím nasledujúcej kombinácie terminačných 1 nukleotidov: ddGTP alebo 3'-amino-23'-didezoxyGTP; ddATP alebo 31-amino-23'-didezoxyATP; araUTP alebo 3'-amino-2',3'-didezoxyTTP; a araCTP. Vzhľadom na priaznivé sekvenčné schémy získané s 3 '-amino-23'-didezoxyGTP, -ATP a -TTP je pravdepodobné, že 3'-amino-2',3'-didezoxy-CTP bude tiež účinným terminačným nukleotidom. Nebol urobený pokus optimalizovať podmienky metódy I alebo II za účelom získania rovnakých intenzít pásov alebo zvýšenia dĺžky čitateľnej sekvencie pre reakcie znázornené na obr. 2. Metódy sekvenovania’ však môžu poskytnúť informácie pre aspoň 300 báz. Pre reakcie sekvenovania s 3'-amino-23'-didezoxyribonukleozidtrifosfátmi nie je vyžadovaná forma DNA polymerázy T4, deficitná na exonukleázu.
Experimentálne podmienky vzoriek pre metódy I a II (obr. 2)
Reakcia značenia μΐ DNA polymerázy, deficitnej na exonukleázu; 300 až 400 j/ml pre DNA polymerázu T4 alebo DNA polymerázu II E. coli. Jedna jednotka DNA polymerázy T4 katalyzuje začlenenie 10 nmól dTMP do DNA pri 30 °C za 30 min. Jedna jednotka DNA polymerázy II E. coli katalyzuje začlenenie 1 pmól dTMP do DNA pri 37 °C za 1 min. I keď sa typicky reakcia uskutočňuje pri 37 °C, môže byť uskutočňovaná v teplotnom rozmedzí od asi 35 do asi 42 ’C.
μΐ komplexu primér-M13 DNA, 15 nM μΐ značiaceho roztoku: 2 μΜ dGTP, dCTP, dTTP, 1 μΜ [a32P]dATP; 50 mM Tris-HCl (pH 8,5); 5 mM MgCl2 alebo 6 mM
MnCl2 pre DNA polymerázu II E. coli; 5 mM MgCl2 alebo 0,5 mM MnCl2 pre DNA polymerázu T4; 5 mM ditiotreltol; 50 μ9/ιπ1 hovädzí sérový albumín.
Reakčné zmesi boli inkubované 5 min pri 37 ’C.
Primér môže byť značený tiež na 5'-konci, alebo začlenením značeného nukleotidu do predlžovacej reakcie a inými štandardnými metódami.
Predlžovacia reakcia μΐ značiacej reakčnej zmesi (vyššie uvedenej) μΐ terminačného roztoku: 50 μΜ dGTP, dATP, dCTP a dTTP a jeden z ďalej uvedených terminačných analógov:
Metóda I: ddGTP, 1,6 mM; ddATP, 0,7 mM; araCTP, 0,5 mM; araUTP, 0,5 mM.
Metóda II: 3'-amino-2',3'-didezoxyGTP, 0,5 mM; 3'-amino21,3'-didezoxyATP, 0,5 mM; 3'-amino-2',3'-didezoxyTTP, 0,5 mM.
Reakčné zmesi boli inkubované 5 min pri 37 “C. Reakcie boli zastavené prídavkom formamid/EDTA.
Metóda III sekvenovania DNA (obr. 3)
DNA polymeráza T4, deficitná na exonukleázu, môže produkovať sekvenčnú informáciu DNA v reakciách, kde je jeden dNTP v nízkej koncentrácii (napríklad 0,1 až 1 μΜ) a ostatné tri dNTP vo vysokých koncentráciách (100 μΜ) (obr. 3). Sekvenčné schémy DNA sa získávajú rovnako ako u reakcií sekvenovania s analógmi nukleotidov, avšak s výnimkou, že sekvenčné produkty, vznikajúce touto metódou, sú zakončené jednu polohu predtým, než je vyžadovaný dNTP s nízkou koncentráciou.
Experimentálne podmienky vzoriek:
mM Hepes (pH 7,5) mM NaOAc nM ditiotreitol
100 μΜ dGTP, dCTP a dTTP
0,1 μΜ dATP (1 μΜ dATP pre dlhšie produkty DNA)
0,2 mg/ml hovädzí sérový albumín
7,5 nM 5’[ P]značený primér-templát (vyjadrené ako kon14 centrácia 31-koncov priméru) nM DNA polymeráza T4, deficitná na exonukleázu nM Mn(OAc)2
Reakčná zmes, znázornená na obr. 3, obsahovala 0,1 μΜ dATP a bola inkubovaná 1 min pri 30 ’C. Podmienky neboli optimalizované za účelom získania vysokého množstva sekvenčných informácií; avšak reakčné zmesi, kde nízka koncentrácia dNTP je 1 μΜ, poskytujú sekvenčné informácie väčšie než 100 báz.
Izolácia nových DNA polymeráz T4 s vlastnosťami výhodnými pre sekvenovanie DNA
Prvým stupňom tohoto aspektu vynálezu je identifikácia kmeňov T4 s variantnými (mutantnými) DNA polymerázami, deficitnými v niektorom aspekte replikácie DNA. Boli vybrané kmene T4 s mutantnou DNA polymerázou, ktoré majú ďalej uvedené substitúcie aminokyselín, ale genetická selekčná stratégia nie je obmedzená na tieto mutanty, pretože je možné použiť akúkoľvek mutantnú DNA polymerázu s defektnou schopnosťou replikácie DNA. Variantné (mutantné) DNA polymerázy T4, ktoré sú čiastočne defektné v niektorom aspekte replikácie DNA, nemôžu replikovat DNA v hostiteľovi E. coli optAl.
Kmene T4 s mutantnými DNA polymerázami so substitúciami aminokyselín W213S, I417V, A737V alebo A777V nemôžu replikovat DNA v hostiteľovi E. coli optAl. Na získanie týchto variantov boli použité nasledujúce mutácie: pre W213S je nukleotid G v polohe 637 nahradený nukleotidom C; pre I417V je nukleotid A v polohe 1249 nahradený nukleotidom G; pre A737V je nukleotid C v polohe 2209 nahradený nukleotidom T; pre A777V je nukleotid C v polohe 2329 nahradený nukleotidom T. Ako je známe, rovnaké zmeny aminokyselín môžu vyvolať aj iné náhrady nukleotidov.
Druhým stupňom je selekcia kmeňa T4 , ktorý môže replikovať DNA v hostiteľovi E. coli optAl, aj keď si DNA polymeráza uchováva substitúciu aminokyselín, ktorá sama znižuje schopnosť replikácie DNA a bráni replikácii DNA v hostiteľovi E. coli optAl. Kmene T4, ktoré získali buď spontánnou mutáciou alebo podrobením mutagenéze druhú mutáciu DNA polymerásy (alebo viacnásobné mutácie), ktorá kóduje novú substitúciu aminokyselín, ktorá môže korigovať alebo kompenzovať defekt replikácie DNA, vyvolaný prvou substitúciou aminokyselín, budú schopné replikovať DNA v hostiteľovi E. coli optAl a produkovať fágové potomstvo. Takto identifikované DNA polymerázy^ majú aspoň dvé substitúcie aminokyselín: východiskovú substitúciu aminokyselín a jednu alebo viac nových substitúcií aminokyselín, ktoré obnovujú replikačnú aktivitu DNA. Táto genetická selekčná stratégia je vysoko citlivá. Fág s mutantnou DNA polymerázou, obsahujúcou východiskovú substitúciu aminokyselín a substitúciu aminokyselín, ktorá obnovuje replikačnú aktivitu DNA, môže byt selektovaný z populácie 10° až ICH fagov.
Tretím stupňom je identifikácia mutácií obnovujúcich replikáciu DNA. V tomto stupni sa používajú štandardné metódy sekvenovania pre nájdenie novej mutácie alebo mutácií v géne DNA polymerázy T4. Len čo bola nová mutácia alebo boli nové mutácie identifikované, môže byť mutácia štandardnými metódami zavedená do fága alebo do expresných vektorov DNA polymerázy T4. Na rozdiel od východiskovej DNA polymerázy s deficitom replikácie DNA majú DNA polymerázy s korigujúcimi alebo kompenzujúcimi substitúciami aminokyselín vyššiu replikačnú aktivitu DNA. Vzorka substitúcií aminokyselín, nájdených vyššie opísanou genetickou selekčnou stratégiou, zahrnuje, avšak neobmedzuje sa na ne: I50L, G82D, 'G255S a E743K. Na získanie týchto variantov boli použité nasledujúce mutácie: pre I50L je nukleotid A v polohe 148 nahradený nukleotidom C; pre G82D je nukleotid G v polohe 244 nahradený nukleotidom A; pre G255S je nukleotid G v polohe 763 nahradený nukleotidom A;
a pre E743K je nukleotid G v polohe 2227 nahradený nukleotidom A. Ako je známe, rovnaké zmeny aminokyselín môžu spôsobiť aj iné náhrady nukleotidov.
Variantné (mutantné, modifikované) DNA polymerázy T4 so substitúciami aminokyselín, ktoré dodávajú zvýšenú replikačnú. aktivitu DNA, majú nové vlastnosti, výhodné pre sekvenovanie DNA. Jedným častým problémom sekvenovania je, že DNA polymerázy, používané v reakciách sekvenovania, na niektorých miestach templátu vynechávajú alebo sa odlučujú. V dôsledku tohoto predčasného ukončenia predlžovania reťazca sú produkované sekvenčné produkty, ktoré nie sú zakončené terminačným nukleotidom. Ďalší problém spočíva v tom, že začleňovanie nukleotidov a terminačných nukleotidov DNA polymerázou prebieha podlá templátovej sekvencie, ktorá môže viesť k nerovnomernej distribúcii produktov sekvenovania. Nové DNA polymerázy so zvýšenou replikačnou aktivitou DNA môžu tieto problémy prekonať. DNA polymeráza G82D-T4 (známa tiež ako DNA polymeráza T4 mel 62) bola podrobená testom predlžovania priméru a bolo zistené, že táto nová DNA polymeráza predlžuje priméry, ktoré sú problematické pre DNA polymerázu T4 divokého typu. Príklad syntézy DNA polymerázy G82D-T4 je uvedený na obr. 4.
Obr. 4 zobrazuje použitie troch polymeráz T4 na skopírovanie templátovej lézie DNA (abázická lézia - v reťazci templátu chýba báza, označená ako X). Polymeráza T4 divokého typu má potiaže so začlenením nukleotidového náprotivku X, ako ukazujú velmi svetlé pásy. Mutantná polymeráza T4, deficitná na 3'-exonukleázu, EXO-17, je schopná začleniť nukleotidy proti X (viď intenzívny pás pri X) a pokračovať v syntéze za léziou. Polymeráza T4 mel 62 je mutantný enzým (prenáša mutačný fenotyp in vivo), ktorý má, zjavne normálne (divoké) hodnoty aktivity 3'-exonukleázy a polymerázy. Je však tiež schopný začleniť nukleotidy proti X a pokračovať v syntéze za X. Najzaujímavejšie je, že z absencie vynechávajúcich pásov za X vyplýva, že DNA polymeráza mel 62 zostáva naviazaná na primérovú templátovú DNA pevnejšie než EXO-17 aj než polymerázy divokého typu. Je teda možné, že tento enzým môže byt schopný prekonať prekážky templátu aj substrátu a syntetizovať dlhé úseky DNA.
Predpokladá sa, že jedna alebo viac substitúcií aminokyselín, ktoré vedú k vyššej replikačnej aktivite DNA, bude kombinovaných s jednou alebo viac substitúciami aminokyselín, ktoré významne znižujú 3 '-ŕ 5' exonukleázovú aktivitu, na vytvorenie viacnásobne modifikovanej novej DNA polymerázy T4 s niekoíkými vlastnosťami, ktoré sú výhodné pre polymerázy, sekvenujúce DNA.
Je známe, že polymerázy, ako je DNA polymeráza bakteriofága T7, môžu byt požívané v spojení so sprievodnými proteínmi, čo zvyšuje spracovateľnosť polymerázy znížením rýchlosti odpojovania polymerázy zo sekvenovaného reťazca DNA.
V prípade polymerázy T4 sprievodné proteíny zahrnujú, avšak neobmedzujú sa na ne, nasledujúce produkty génu T4: génový produkt 32, 41, 45 a komplex 44/62. V prípade DNA polymerázy II E. coli sú sprievodné proteíny tieto: β proteín; komplex f proteínu, kde γ komplex je zložený z r, δ, δ', £,ψ ; a SSB (single stranded binding protein) (je treba si povšimnúť, že β proteín a γ komplex sú sprievodné proteíny E. coli pol III). Použitie týchto sprievodných proteínov zvyšuje účinnosť polymeráz pri sekvenovaní DNA.
Boli opísané základné nové znaky vynálezu; je však pochopiteľné, že odborník môže učiniť rôzne vynechávky, náhrady a zmeny v opísaných formách a podrobnostiach, bez toho, aby prekročil ducha vynálezu. Vynález je teda obmedzený iba rozsahom ďalej uvedených patentových nárokov.
ZOZNAM SEKVENCIÍ (1) VŠEOBECNÉ INFORMÁCIE:
(i) PRIHLASOVATEĽ: Goodman, Myron F.
Reha-Krantz, Linda J.
(ii) NÁZOV VYNÁLEZU: NOVÉ ENZÝMY SEKVENUJÚCE DNA
Λ (iii) POČET SEKVENCIÍ: 6
- \ (iv) KOREŠPONDENČNÁ ADRESA:
(A) ADRESÁT: Robbins, Berliner & Carspm (B) ULICA: 201 North Figueroa Street, Fifth Floor (C) MESTO: Los Angeles (D) ŠTÁT: California (E) KRAJINA: USA (F) : POŠTOVÝ KÓD (ZIP): 90012-2628 (v) STROJOVO ČITATEĽNÁ FORMA:
(A) TYP MÉDIA: Floppy disk (B) POČÍTAČ: kompatibilný s IBM PC (C) OPERAČNÝ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1,0, verzia #1,25 (vi) ÚDAJ O TEJTO PRIHLÁŠKE:
(A) ČÍSLO PRIHLÁŠKY:
(B) DÁTUM PODANIA:
(C) KLASIFIKÁCIA:
(viii) ÚDAJ O ZÁSTUPCOVI/AGENTOyi:
(A) MENO: Spitals, John P.
(B) REGISTRAČNÉ ČÍSLO: 29,215 (C) ZNAČKA/ČÍSLO SPISU: 1920-305 (ix) TELEKOMUNIKAČNÉ INFORMÁCIE:
(A) TELEFÓN: (213) 977-1001 (B) TELEFAX: (213) 977-1003 (2) INFORMÁCIA PRE SEQ ID NO:1:
(i) CHARAKTERISTIKA SEKVENCIE:
(A) DĹŽKA: 2760 párov báz (B) TYP: nukleová kyselina (C) REŤAZEC: jednoduchý (D) TÓPOLÓGIA: lineárna (ii) TYP MOLEKULY: DNA (genómová) (ix) ZNAKY:
(A) MENO/KĹÚČ: CDS (B) UMIESTNENIE: 1..2760
(x: i) OPIS SEKVENCIE : SEQ ID N 0:1
CGT CAT CTT CAT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT 48
Arg His Leu His Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe
1 5 10 15
TTT TTT TTT TTT ATT ATT ATG ÄAA GAA TTT TAT ATC TCT ATC GAA ACA 96
Phe Phe Phe Phe íle íle Met Lys Glu Phe Tyr íle Ser íle Glu Thr
20 25 30
GTC GGA AAT AAT ATT ATT GAA CGT TAT ATT GAT GAA AAC GGA AAG GAA 144
Val Gly Asn Asn íle íle Glu Arg Tyr íle Asp Glu Asn Gly Lys Glu
35 40 45
CGT Arg ACT CGT Thr Arg 50 GAA Glu GTA Val GAA TAT CTT CCG ACT ATG TTT AGG CAT TGT AAG 192
Glu Tyr 55 Leu Pro Thr Het Phe 60 Arg His cys Lys
GAA GAG TCA AAA TAC AAA GAC ATC TAT GGT AAA AAC TGT GCT CCT CAA 240
Glu Glu Ser Lys Tyr Lys Asp íle Tyr Gly Lys Asn Cys Ala Pro Gin
65 70 75 80
AAA TTT CCA TCA ATG AAA GAT GCT CGA GAT TGG ATG AAG CGA ATG GAA 288
Lys Phe Pro Ser Het Lys Asp Ala Arg Asp Trp Het Lys Arg Het Glu
85 90 95
GAC ATC GGT CTC GAA GCT CTC GGT ATG AAC GAT TTT AAA CTC GCT TAT, 336
Asp íle Gly Leu Glu Ala Leu Gly Het Asn Asp Phe Lys Leu Ala Tyr
100 105 110
ATC AGT GAT ACG TAT GGT TCA GAA ATT GTT TAT GAC CGA AAA TTT GTT 384
íle Ser Asp Thr Tyr Gly Ser Glu íle Val Tyr Asp Arg Lys Phe Val
115 120 125
CGT G TA GCT AAC TGT GAC ATT GAG GTT ACT GGT GAT AAA TTT CCT GAC 432
Arg Val Ala Asn Cys Asp íle Glu Val Thr Gly Asp Lys Phe Pro Asp
130 135 140
CCA ATG AAA CCA GAA TAT GAA ATT GAT GCT ATC ACT CAT TAT GAT TCA 480
Pro Het Lys Ala Glu Tyr Glu íle Asp Ala íle Thr His Tyr Asp Ser
145 150 155 160
ATT GAC GAC CGT TTT TAT GTT TTC GAC CTT TTG AAT TCA ATG TAC GGT 528
íle Asp Asp Arg Phe Tyr Val Phe Asp Leu Leu Asn Ser Het Tyr Gly
165 170 175
TCA GTA TCA AAA TGG GAT GCA AAG TTA GCT GCT AAG CTT GAC TGT GAA 576
Ser Val Ser Lys Trp Asp Ale Lys Leu Ala Ala Lys Leu Asp Cys Glu
1S0 185 190
GGT GGT GAT GAA GTT CCT CAA GAA ATT CTT GAC CGA GTA ATT TAT ATG 624
Gly Gly Asp Glu Val Pro Gin Glu I le Leu Asp Arg Val íle Tyr Met
195 200 205
CCA TTT GAT AAT GAG CGT GAT ATG CTC ATG GAA TAT ATT AAT CTC TGG 672
Pro Phe Asp Asn Glu Arg Asp Het Leu Met Glu Tyr íle Asn Leu Trp
210 215 220
GAA CAG AAA CGA CCT GCT ATT TTT ACT GGT TGG AAT ATT GAG GGG TTT 720
Glu Gin Lys Arg Pro Ala íle Phe Thr Gly Trp Asn íle Glu Gly Phe
225 230 235 240
GAC GTT CCG TAT ATC ATG AAT CGC GTT AAA ATG ATT CTG GGT GAA CGC 768
Asp Val Pro Tyr íle Met Asn Arg Val Lys Met íle Leu Gly Glu Arg
245 250 255
AGT ATG AAA CGT TTC TCT CCA ATC GGT CGG GTA AAA TCT AAA CTA ATT 816
Ser Met Lys Arg Phe Ser Pro íle Gly Arg Val Lys Ser Lys Leu íle
260 265 270
CAA AAT ATG TAC GGT AGC AAA GAA ATT TAT TCT ATT GAT GGC GTA TCT 864
Gin Asn Met Tyr Gly Ser Lys Glu íle Tyr Ser I le Asp Gly Val Ser
275 280 285
ATT CTT GAT TAT TTA GAT TTG TAC AAG AAA TTC GCT TTT ACT AAT TTG 912
íle Leu Asp Tyr Leu Asp Leu Tyr Lys Lys Phe Ala Phe Thr Asn Leu
290 295 300
CCG TCA TTC TCT TTG GAA TCA GTT GCT CAA CAT GAA ACC AAA AAA GGT 960
Pro Ser Phe Ser Leu Glu Ser Val Ala Gin His Glu Thr Lys Lys Gly
305 310 315 320
AAA TTA CCA TAC GAC GGT CCT ATT AAT AAA CTT CGT GAG ACT AAT CAT 1008
Lys Leu Pro Tyr Asp Gly Pro lle Asn Lys Leu Arg Glu Thr Asn His
325 330 335
CAA CCA TAC Tyr ATT I le 340 AGT TAT AAC ATC ATT GAC GTA GAA TCA GTT CAA CCA 1056
Gin Arg Ser Tyr Asn íle íle 345 Asp Val Glu Ser Val 350 Gin Ala
ATT GAT AAA ATT CGT GGG TTT ATC GAT CTA GTT TTA AGT ATG TCT TAT 1104
íle Asp Lys íle Arg Gly Phe íle Asp Leu Val Leu Ser Met Ser Tyr
355 360 365
TAT GCT AAA ATG CCT TTT TCT GGT GTA ATG AGT CCT ATT AAA ACT TGG 1152
Ty r Ala Lys Het Pro Phe Ser Gly Val Het Ser Pro íle Lys Thr Trp
370 375 380
GAT GCT ATT ATT TTT AAC TCA TTG AAA GGT GAA CAC AAG GTT ATT CCT 1200
Asp Ala lle íle Phe Asn Ser Leu Lys Gly Glu His Lys Val lle Pro
385 390 395 400
CAA CAA GGT TCG CAC GTT AAA CAG AGT TTT CCG GGT GCA TTT GTA TTT 1248
Gin Gin Gly Ser His Val Lys Gin Ser Phe Pro Gly Ala Phe Val Phe
405 410 415
GAA CCT AAA CCA ATT GCT CGT CGA TAC ATT ATG AGT TTT GAC TTG ACG 1296
Glu Pro Lys Pro íle Ala Arg Arg Tyr íle Met Ser Phe Asp Leu Thr
420 425 430
TCT CTG TAT CCG AGC ATT ATT CGC CAG GTT AAC ATT AGT CCT GAA ACT 1344
Ser Leu Tyr Pro Ser íle íle Arg Gin Val Asn lle Ser Pro Glu Thr
435 440 445
ATT CGT GGT CAG TTT AAA GTT CAT CCA ATT CAT GAA TAT ATC GCA GGA 1392
íle Arg Gly Gin Phe Lys Val His Pro lle His Glu Tyr íle Ala ciy
450 455 460
ACA GCT CCT AAA CCA AGT GAT GAA TAT TCT TGT TCT CCG AAT GGA TGG 1440
Thr Ala Pro Lys Pro Ser ASp Glu Tyr Ser cys Ser Pro Asn Gly Trp
465 470 475 480
ATG TAT GAT AAG CAT CAA GAA GGT ATC ATT CCA AAG GAA ATC GCT AAA 1488
Met Tyr Asp Lys His Gin Glu Gly íle íle Pro Lys Glu íle Ala Lys
485 490 495
GTA TTT TTC CAG CGT AAA GAT TGG AAA AAG AAA ATG TTC GCT GAA GAA 1536
Val Phe Phe Gin Arg Lys Asp Trp Lys Lys Lys Met Phe Ala Glu Glu
500 505 510
ATG AAT GCC GAA GCT ATT AAA AAG ATT ATT ATG AAA GGC GCA GGG TCT 15B4
Met Asn Ala Glu Ala íle Lys Lys íle íle Het Lys Gly Ala ciy Ser
515 520 525
TGT TCA ACT AAA CCA GAA GTT GAA CGA TAT GTT AAG TTC ACT GAT GAT 1632
Cys Ser Thr Lys Pro Glu Val Glu Arg Tyr Val Lys Phe Thr Asp Asp
530 535 540
TTC TTA AAT GAA CTA TCG AAT TAT ACT GAA TCT GTT CTT AAT AGT CTG 1680
Phe Leu Asn Glu Leu Ser Asn Tyr Thr Glu Ser Val Leu Asn Ser Leu
545 550 555 560
ATT GAA GAA TGT GAA AAA GCA GCT ACA CTT GCT AAT ACA AAT CAG CTG 1728
íle Glu Glu Cys Glu Lys Ala Ala Thr Leu Ala Asn Thr Asn Gin Leu
565 570 575
AAC CGT AAA ATT CTT ATT AAC AGT CTT TAT GGT GCT CTT GCT AAT ATT 1776
Asn Arg Lys íle Leu íle Asn Ser Leu Tyr Gly Ala Leu Gly Asn íle
580 585 590
CAT TTC CGT TAC TAT GAT TTA CGA AAT GCT ACT GCT ATC ACA ATT TTT 1824
His Phe Arg Tyr Tyr Asp Leu Arg Asn Ala Thr Ala íle Thr íle Phe
595 600 605
GGT CAA GTT GGT ATT CAG TCG ATT GCT CGT AAA ATT AAT GAA TAT CTG 1872
Gly Gin Val Gly íle Gin Trp íle Ala Arg Lys íle Asn Glu Tyr Leu
610 615 620
ΑΛΤ ΑΑΑ GTA TCC GGA ACT AAT GAT GAA GAT TTC ATC CCA GCA GGT GAT 1920
Asn 625 Lys Val Cys ciy Thr 630 Asn Asp Glu Asp Phe 635 íle Ala Ala Gly Asp 640
ACT GAT TCG GTA TAT CTT TGT GTA GAT AAA GTT ATT GAA AAA GTT GGT 1968
Thr Asp Ser Val Tyr Val Cys Val Asp Lys Val íle Glu Lys Val Gly
645 650 655
CTT GAC CGA TTC AAA GAG CAG AAC GAT TTG GTT GAA TTC ATG AAT CAG 2016
Leu Asp Arg Phe Lys Glu Gin Asn Asp Leu Val Glu Phe Het Asn Gin
660 665 670
TTT GGT AAG AAA AAG ATG GAA CCT ATG ATT GAT GTT GCA TAT CGT GAG 2064
Phe Gly Lys Lys Lys Het Glu Pro Het íle Asp Val Ala Tyr Arg Glu
675 680 685
TTA TGT GAT TAT ATG AAT AAC CGC GAG CAT CTG ATG CAT ATG GAC CGT 2112
Leu Cys Asp Tyr Het Asn Asn Arg Glu His Leu Met His Met Asp Arg
690 695 700
GAA GCT ATT TCT TGC CCT CCG CTT GGT TCA AAG GGT GTT GGT GGA TTT 2160
Glu Ala íle Ser Cys Pro Pro Leu Gly Ser Lys Gly Val Gly Gly Phe
705 710 715 720
TGG AAA GCG AAA AAA CGT TAT GCT CTG AAC GTT TAT GAT ATG GAA GAT 2208
Trp Lys Ala Lys Lys Arg Tyr Ala Leu Asn Val Tyr Asp Met Glu Asp
725 730 735
AAG CCA TTT GCT GAA CCG CAT CTA AAA ATC ATG GGT ATG GAA ACT CAG 2256
Lys Arg Phe Ala Glu Pro His Leu Lys íle Het Gly Het Glu Thr Gin
740 745 750
CAG AGT TCA ACA CCA AAA GCA GTG CAA GAA GCA CTC GAA GAA AGT ATT 2304
Gin Ser Ser Thr Pro Lys Ala Val Gin Glu Ala Leu Glu Glu Ser íle
755 760 765
CGT CGT ATT CTT CAG GAA GGC GAA GAG TCT GTC CAA GAA TAT TAC AAG 2352
Arg Arg íle Leu Gin Glu Gly Glu Glu Ser Val Gin Glu Tyr Tyr Lys
770 775 780
AAC TTC GAG AAA GAA TAT CGT CAA CTT GAC TAT AAA GTT ATT GCT GAA 2400
Asn Phe Glu Lys Glu Tyr Arg Gin Leu Asp Tyr Lys Val íle Ala Glu
785 790 795 800
GTA AAA ACT GCG AAC GAT ATA GCG AAA TAT GAT GAT AAA GGT TGG CCA 2448
Val Lys Thr Ala Asn Asp íle Ala Lys Tyr Asp Asp Lys Gly Trp Pro
805 810 815
GGA TTT AAA TGT CCG TTC CAT ATT CGT GGT GTG CTA ACT TAT CGT CGA 2496
Gly Phe Lys cys Pro Phe His íle Arg Gly Val Leu Thr Tyr Arg Arg
820 825 830
GCT GTT AGT GGT CTG GGT GTA GCT CCA ATT TTG GAT GGA AAT AAA GTA 25-14
Ala Val Ser Gly Leu Gly Val Ala Pro íle Leu Asp Gly Asn Lys Val
835 840 845
ATG GTT CTT CCA TTA CGT GAA GGA AAT CCG TTT GGT GAT AAG TGC ATT 2592
Met Val Leu Pro Leu Arg Glu Gly Asn Pro Phe Gly Asp Lys Cys íle
850 855 860
GCT TGG CCA TCG GGT ACA GAA CTT CCA AAA GAA ATT CGT TCT GAT GTA 2640
Ala Trp Pro Ser Gly Thr Glu Leu Pro Lys Glu íle Arg Ser Asp Val
865 870 875 880
CTA TCT TGG ATT GAC TAC TCA ACT TTG TTC CAA AAA TCG TTT GTT AAA 2688
Leu Ser Trp íle Asp Tyr Ser Thr Leu Phe Gin Lys Ser Phe Val Lys
885 890 895
CCG CTT GCG GGT ATG TGT GAA TCG GCA GGT ATG GAC TAT GAG GAA AAA 2736
Pro Leu Ala Gly Het Cys Glu Ser Ala Gly Het Asp Tyr Glu Glu Lys
900 905 910
CCT TCG TTA GAC TTC CTG TTT GGC Ala Ser Leu Asp Phe Leu Phe Gly
915 920 (2) INFORMÁCIA PRE SEQ ID NO:2:
(i) CHARAKTERISTIKA SEKVENCIE:
(A) DĹŽKA: 920 aminokyselín (B) TYP: aminokyselina (D) TOPOLÓGIA: lineárna (ii) TYP MOLEKULY: proteín (xi) OPIS SEKVENCIE: SEQ ID NO:2:
2760
Arg His 1 Leu His Phe Phe 5 Phe Phe Phe Phe Phe Phe Phe Phe Phe Phe
10 15
Phe Phe Phe Phe íle I le Het Lys Glu Phe Tyr lle Ser íle Glu Thr
20 25 30
Val cty Asn Asn íle íle Glu Arg Tyr íle Asp Glu Asn Gly Lys Glu
35 40 45
Arg Thr Arg Glu Val Glu Tyr Leu Pro Thr Met Phe Arg His cys Lys
50 55 60
Glu Glu Ser Lys Tyr Lys Asp íle Tyr Gly Lys Asn cys Ala Pro Gin
65 70 75 80
Lys Phe Pro Ser Met Lys Asp Ala Arg Asp Trp Het Lys Arg Het Glu
85 90 95
Asp íle Gly Leu Glu Ala .Leu Gly Het Asn Asp Phe Lys Leu Ala Tyr
100 105 110
íle Ser Asp Thr Tyr Gly Ser Glu íle Val Tyr Asp Arg Lys Phe Val
115 120 125
Arg Val Ala Asn cys Asp íle Glu Val Thr Gly Asp Lys Phe Pro Asp
130 135 140
Pro Met tys Ala Glu Tyr Glu íle Asp Ala íle Thr His Tyr Asp Ser
145 150 155 160
I le Asp Asp Arg Phe Tyr Val Phe Asp Leu Leu Asn Ser Het Tyr Gly
165 170 175
Ser Val Ser Lys Trp Asp Ala Lys Leu Ala Ala Lys Leu Asp Cys Glu
180 185 190
Gly Gly Asp Glu Val Pro Gin Glu íle Leu Asp Arg Val íle Tyr Het
195 200 205
Pro Phe Asp Asn Glu Arg Asp Het Leu Met Glu Tyr íle Asn Leu Trp
210 215 220
Glu Gin Lys Arg Pro Ala íle Phe Thr Gly Trp Asn íle Glu ciy Phe
225 230 235 240
Asp Val Pro Tyr íle Met Asn Arg Val Lys Met íle Leu Gly Glu Arg
245 250 255
Ser Met Lys Arg Phe Ser Pro íle Gly Arg Val Lys Ser Lys Leu íle
260 265 270
Gin Asn Met Tyr Gly Ser Lys Glu íle Tyr Ser lle Asp Gly Val Ser
275 280 285 íle Leu Asp Tyr Leu Asp Leu Tyr Lys Lys Phe Ala Phe Thr Asn Leu 290 295 300
Pro Ser Phe Ser Leu Clu Ser Val Ala Gin His Glu Thr Lys Lys Gly 320
305 310 315
Lys Leu Pro Tyr Asp Gly Pro íle Asn Lys Leu Arg Glu Thr Asn H i s
325 330 335
Gin Arg Tyr íle Ser Tyr Asn íle íle Asp Va l Glu Ser Val Gin Ala
340 345 350
11 e Asp Lys íle Arg Gly Phe íle Asp Leu Val Leu Ser Het Ser Tyr
355 360 365
Tyr Ala Lys Het Pro Phe Ser Gly Val Het Ser Pro íle Lys Thr Trp
370 375 380
Asp Ala íle íle Phe Asn Ser Leu Lys Gly Glu His Lys Val íle Pro
3S5 390 395 400
Gin Gin Gly Ser His Val Lys Gin Ser Phe Pro Gly Ala Phe Val Phe
405 410 415
Clu Pro Lys Pro íle Ala Arg Arg Tyr íle Het Ser Phe Asp Leu Thr
420 425 430
Ser Leu Tyr Pro Ser íle íle Arg Gin Val Asn íle Ser Pro Glu Thr
435 440 445
íle Arg Gly Gin Phe Lys Val His Pro íle His Glu Tyr íle Ala Gly
450 455 460
Thr Ala Pro Lys Pro Ser Asp Glu Tyr Ser Cys Ser Pro Asn Gly Trp
465 470 475 480
Met Tyr Asp Lys His Gin Glu Gly íle íle Pro Lys Glu íle Ala Lys
485 490 495
Val Phe Phe Gin Arg Lys Asp Trp Lys Lys Lys Met Phe Ala Glu Glu
500 505 510
Het Asn Ala Glu Ala íle Lys Lys íle íle Het Lys Gly Ala Gly Ser
515 520 525
Cys Ser Thr Lys Pro Glu Val Glu Arg Tyr Val Lys Phe Thr Asp Asp
530 535 540
Phe Leu Asn Glu Leu Ser Asn Tyr Thr Glu Ser Val Leu Asn Ser Leu
545 550 555 560
íle Glu Glu Cys Glu Lys Ala Ala Thr Leu Ala Asn Thr Asn Gin Leu
565 570 l 575
Asn Arg Lys íle Leu íle Asn Ser Leu Tyr Gly Ala Leu Gly Asn íle
580 585 590
His Phe Arg Tyr Tyr Asp Leu Arg Asn Ala Thr Ala íle Thr íle Phe
595 600 605
G ly Gin Val Gly íle Gin Trp íle Ala Arg Lys I le Asn Glu Tyr Leu
610 615 620
Asn Lys Val Cys Gly Thr Asn Asp Glu Asp Phe íle Ala Ala Gly Asp
625 630 635 640
Thr Asp Ser Val Tyr Val Cys Val Asp Lys Val íle Glu Lys Val Gly
645 650 655
Leu Asp Arg Phe Lys Glu Gin Asn Asp Leu Val Glu Phe Het Asn Gin
660 665 670
Phe Gly Lys. Lys Lys Het Glu Pro Het I le Asp Val Ala Tyr Arg Glu
675 680 685
Leu Cys Asp 690 Tyr Met Asn Asn Arg Glu His Leu Met His Het Asp Arg
695 700
Glu Ala 11 e Ser cys Pro Pro Leu Gly Ser Lys Gly Val Gly Gly Phe
705 710 715 720
Trp Lys Ala Lys Lys Arg Tyr Ala Leu Asn Val Tyr Asp Het Glu Asp
725 730 735
Lys Arg Phe Ala Glu Pro His Leu Lys lle Met Gly Met Glu Thr Gin
740 745 750
Gin Ser Ser Thr Pro Lys Ala Val Gin Glu Ala Leu Glu Glu Ser íle
755 760 765
Arg Arg íle Leu Gin Glu Gly Glu Glu Ser Val Gin Glu Tyr Tyr Lys
770 775 780
Asn Phe Glu Lys Glu Tyr Arg Gin Leu Asp Tyr Lys Val íle Ala Glu
785 790 795 800
Val Lys Thr Ala Asn Asp íle Ala Lys Tyr Asp Asp Lys Gly Trp Pro
805 810 815
Gly Phe Lys Cys Pro Phe His íle Arg Gly Val Leu Thr Tyr Arg Arg
820 825 830
Ala Val Ser Gly Leu Gly Val Ala Pro íle Leu Asp Gly Asn Lys Val
835 840 845
Met Val Leu Pro Leu Arg Glu Gly Asn Pro Phe Gly Asp Lys cys íle
850 855 660
Ala Trp Pro Ser Gly Thr Glu Leu Pro Lys Glu íle Arg Ser Asp Val
865 870 875 880
Leu Ser Trp lle Asp Tyr Ser Thr Leu Phe Gin Lys Ser Phe Val Lys
885 890 895
Pro Leu Ala Gly Met Cys Glu Ser Ale Gly Het Asp Tyr Glu Glu Lys
900 905 910
Ala Ser Leu Asp Phe Leu Phe Gly
915 920 (2) INFORMÁCIA PRE SEQ ID NO:3:
(i) CHARAKTERISTIKA SEKVENCIE:
(A) DÉŽKA: 2760 párov báz (B) TYP: nukleová kyselina (C) REŤAZEC: jednoduchý (D) TOPOLÓGIA: lineárna (ii) TYP MOLEKULY: DNA (genómová) (ix) ZNAKY:
(A) MENO/KĽÚČ: CDS (B) UMIESTNENIE: 1..2760 (xi) OPIS SEKVENCIE: SEQ ID NO:3 :
CGT Arg 1 CAT CTT His Leu CAT TTT TTT TTT Phe Phe TTT TTT TTT TTT TTT TTT TTT TTT TTT 48
His Phe 5 Phe Phe Phe 10 Phe Phe Phe Phe Phe 15 Phe
TTT TTT TTT TTT ATT ATT ATG AAA GAA TTT TAT ATC TCT ATT GAA ACA 96
Phe Phe Phe Phe I le íle Met Lys Glu Phe Tyr íle Ser íle Glu Thr
20 25 30
CTC GCA AAT AAC ATT GTT Val GAA Glu CCT TAT Arg Tyr 40 ATT GAT GAA AAT GGA AAG GAA 144
Val Gly Asn 35 Asn íle íle Asp Glu Asn 45 Gly Lys Glu
CGT ACC CGT GAA GTA GAA TAT CTT CCA ACT ATG TTT AGG CAT TGT AAG 192
Arg Thr Arg Glu Val Glu Tyr Leu Pro Thr Het Phe Arg HiS Cys Lys
50 55 60
GAA GAG TCA AAA TAC AAA GAC ATC TAT GGT AAA AAC TGC GCT CCT CAA 240
Glu Glu Ser Lys Tyr Lys Asp Íle Tyr Gly Lys Asn Cys Ala Pro Gin
65 70 75 80
AAA TTT CCA TCA ATG AAA GAT GCT CGA GAT TGG ATG AAG CGA ATG GAA 288
Lys Phe Pro Ser Met Lys Asp Ala Arg Asp Trp Met Lys Arg Het Glu
85 90 95
GAC ATC GGT CTC GAA GCT CTC GGT ATG AAC GAT TTT AAA CTC GCT TAT 336
Asp I le Gly Leu Glu Ala Leu Gly Het Asn Asp Phe Lys Leu Ala Tyr
100 105 110
ATA AGT GAT ACA TAT GGT TCA GAA ATT GTT TAT GAC CGA AAA TTT GTT 384
íle Ser Asp Thr Tyr Gly Ser Glu íle Val Tyr Asp Arg Lys Phe Val
115 120 125
CGT GTA GCT AAC TGT GAC ATT GAG GTT ACT GGT GAT AAA TTT CCT GAC 432
Arg Val Ala Asn Cys Asp l le Glu Val Thr Gly Asp Lys Phe Pro Asp
130 135 140
CCA ATG AAA GCA GAA TAT GAA ATT GAT GCT ATC ACT CAT TAC GAT TCA 480
Pro Met Lys Ala Glu Tyr Glu I le Asp Ala íle Thr His Tyr Asp Ser
145 150 155 160
ATT GAC GAT CGT TTT TAT GTT TTC GAC CTT TTG AAT TCA ATG TAC GGT 528
íle Asp Asp Arg Phe Tyr Val Phe Asp Leu Leu Asn Ser Het Tyr Gly
165 170 175
TCA GTA TCA AAA TGG GAT GCA AAG TTA GCT GCT AAG CTT GAC TGT GAA 576
Ser Val Ser Lys Trp Asp Ala Lys Leu Ala Ala Lys Leu Asp Cys Glu
180 185 190
GGT GGT GAT GAA GTT CCT CAA GAA ATT CTT GAC CGA GTA ATT TAT ATG 624
Gly Gly Asp Glu Val Pro Gin Glu íle Leu Asp Arg Val íle Tyr Het
195 200 205
CCA TTC GAT AAT GAG CGT GAT ATG CTC ATG GAA TAT ATC AAT CTT TGG 672
Pro Phe Asp Asn Glu Arg Asp Met Leu Het Glu Tyr íle Asn Leu Trp
210 215 220
GAA CAG AAA CCA CCT GCT ATT TTT ACT GGT TGG AAT ATT GAG GGG TTT 720
Glu Gin Lys Arg Pro Ala íle Phe Thr Gly Trp Asn íle Glu Gly Phe
225 230 235 240
GAC GTT CCG TAT ATC ATG AAT CGT GTT AAA ATG ATT CTG GGT GAA CGT 768
Asp Val Pro Tyr I le Met Asn Arg Val Lys Het íle Leu Gly Glu Arg
245 250 255
AGT ATG AAA CGT TTC TCT CCA ATC GGT CGG GTA AAA TCT AAA CTA ATT 816
Ser Met Lys Arg Phe Ser Pro I le Gly Arg Val Lys Ser Lys Leu Íle
260 265 270
CAA AAT ATG TAC GGT AGC AAA GAA ATT TAT TCT ATT GAT GGC GTA TCT .364
Gin Asn Met Tyr Gly Ser Lys Glu íle Tyr Ser íle Asp Gly Val Ser
275 280 285
ATT CTT GAT TAT TTA GAT TTG TAC AAG AAA TTC GCT TTT ACT AAT TTG 912
l le Leu Asp Tyr Leu Asp Leu Tyr Lys Lys Phe Ale Phe Thr Asn Leu
290 295 300
CCG TCA TTC TCT TTG GAA TCA GTT GCT CAA CAT GAA ACC AAA AAA GGT 960
Pro Ser Phe Ser Leu Glu Ser Val Ala Gin His Glu Thr Lys Lys Gly
305 310 315 320
AAA T ΤΑ CCA TAC GAC GGT Gly CCT ATT AAT AAA CTT CGT GAG ACT AAT CAT 1008
Lys Leu Pro Tyr Asp 325 Pro íle Asn lys Leu 330 Arg Glu Thr Asn 335 His
CAA CGA TAC ATT AGT TAT AAC ATC ATT GAC GTA GAA TCA GTT CAA GCA 1056
Gin Arg Tyr I le Ser Tyr Asn íle lle Asp Val Glu Ser Val Gin Ala
340 345 350
ATC GAT AAA ATT CGT GGG TTT ATC GAT CTA GTT TTA AGT ATG TCT TAT 1104
I le Asp Lys I le Arg Gly Phe íle Asp Leu Val Leu Ser Het Ser Tyr
355 360 365
TAC GCT AAA ATG CCT TTT TCT GGT GTA ATG AGT CCT ATT AAA ACT TGG 1152
Tyr Ala Lys Met Pro Phe Ser Gly Val Het Ser Pro íle Lys Thr Trp
370 375 380
GAT GCT ATT ATT TTT AAC TCA TTG AAA GGT GAA CAT AAG GTT ATT CCT 1200
Asp Ala I le lle Phe Asn Ser Leu Lys Gly Glu His Lys Val íle Pro
385 390 395 400
CAA CAA GGT TCG CAC GTT AAA CAG AGT TTT CCG GGT GCA TTT GTG TTT 1248
Gin Gin Gly Ser His Val Lys Gin Ser Phe Pro Gly Ala Phe Val Phe
405 410 415
GAA CCT AAA CCA ATT GCA CGT CGA TAC ATT ATG AGT TTT GAC TTG ACC 1296
Glu Pro Lys Pro íle Ala Arg Arg Tyr íle Met Ser Phe Asp Leu Thr
420 425 430
TCT CTG TAT CCG AGC ATT ATT CGC CAG GTT AAC ATT AGT CCT GAA ACT 1344
Ser Leu Tyr Pro Ser íle lle Arg Gin Val Asn íle Ser Pro Glu Thr
435 440 445
ATT CGT GGT CAG TTT AAA GTT CAT CCA ATT CAT GAA TAT ATC GCA GGA 1392
íle Arg Gly Gin Phe Lys Val His Pro íle His Glu Tyr íle Ala Gly
450 455 460
ACA GCT CCT AAA CCG AGT GAT GAA TAT TCT TGT TCT CCG AAT GGA TGG 1440
Thr Ala Pro Lys Pro Ser Asp Glu Tyr Ser cys Ser Pro Asn Gly Trp
465 470 475 480
ATG TAT GAT AAA CAT CAA GAA GGT ATC ATT CCA AAG GAA ATC GCT AAA 1488
Met Tyr Asp Lys His Gin Glu Gly íle íle Pro Lys Glu íle Ala Lys
485 490 495
GTA TTT TTC CAG CGT AAA GAC TGG AAA AAG AAA ATG TTC GCT GAA GAA 1536
Val Phe Phe Gin Arg lys Asp Trp lys Lys Lys Met Phe Ala Glu Glu
500 505 510
ATG AAT GCC GAA GCT ATT AAA AAG ATT ATT ATG AAA GGC GCA GGG TCT 15.34
Met Asn Ala Glu Ala íle Lys Lys íle íle Met Lys Gly Ala ciy Ser
515 520 525
TGT TCA ACT AAA CCA GAA GTT GAA CGA TAT GTT AAG TTC AGT GAT GAT 1632
Cys Ser Thr Lys Pro Glu Val Glu Arg Tyr Val Lys Phe Ser Asp Asp
530 535 540
TTC TTA AAT GAA CTA TCG AAT TAC ACC GAA TCT GTT CTC AAT AGT CTG 1680
Phe Leu Asn Glu Leu Ser Asn Tyr Thr Glu Ser Val Leu Asn Ser Leu
545 550 555 560
ATT GAA GAA TGT GAA AAA GCA GCT ACA CTT GCT AAT ACA AAT CAG CTG 1728
lle Glu Glu cys Glu iys Ala Ala Thr Leu Ala Asn Thr Asn Gin Leu
565 570 575
AAC CGT AAA ATT CTC ATT AAC AGT CTT TAT GGT GCT CTT GGT AAT ATT 1776
Asn Arg Lys lle Leu íle Asn Ser Leu Tyr Gly Ala Leu Gly Asn I le
580 585 590
CAT TTC CGT TAC TAT GAT TTG CGA AAT GCT ACT GCT ATC ACA ATT TTC 1824
H i s Phe Arg Tyr Tyr Asp Leu Arg Asn Ala Thr Ala íle Thr íle Phe
595 600 605
ccc CAA GTC GGT ATT CAG TGG ATT GCT CGT AAA ATT AAT GAA TAT CTG 1872
G l y Gin 610 Val Gly íle Gin Trp 615 íle Ala Arg Lys íle 620 Asn Glu Tyr Leu
AAT AAA GTA TGC GGA ACT AAT GAT GAA GAT TTC ATT GCA GCA GGT GAT 1920
Asn 625 Lys Val Cys Gly Thr 630 Asn Asp Glu Asp Phe 635 1 le Ala Ala Gly Asp 640
ACT GAT TCG GTA TAT GTT TGC GTA GAT AAA GTT ATT GAA AAA GTT GGT 1968
Thr Asp Ser Val Tyr 645 Val Cys Val Asp Lys 650 Val íle Glu Lys Val 655 cty
CTT GAC CGA TTC AAA GAG CAG AAC GAT TTG GTT GAA TTC ATG AAT CAG 2016
Leu Asp Arg Phe 660 Lys Glu Gin Asn Asp 665 Leu Val Glu Phe Het 670 Asn Gin
TTC GCT AAG AAA AAG ATG GAA CCT ATG ATT GAT GTT GCA TAT CGT GAG 2064
Phe Gly Lys 675 Lys Lys Het Glu Pro 680 Het íle Asp Val Ala 685 Tyr Arg Glu
TTA TGT GAT TAT ATG AAT AAC CGC GAG CAT CTG ATG CAT ATG GAC CGT 2112
Leu cys 690 Asp Tyr Het Asn Asn 695 Arg Glu HÍS Leu Met 700 His Het Asp Arg
GAA GCT ATT TCT TGC CCT CCG CTT GGT TCA AAG GGC GTT GGT GGA TTT 2160
Glu 705 A l a l le Ser cys Pro 710 Pro Leu ciy Ser Lys 715 Gly Val Gly Gly Phe 720
TGG AAA GCG AAA AAG CGT TAT GCT CTG AAC GTT TAT GAT ATG GAA GAT 2208
Trp Lys Ala Lys Lys 725 Arg Tyr Ala Leu Asn 730 Val Tyr Asp Het Glu 735 Asp
AAG CGA TTT GCT GAA CCG CAT CTA AAA ATC ATG GGT ATG GAA ACT CAG 2256
Lys Arg Phe Ala 740 Glu Pro H i s Leu Lys 745 íle Met Gly Met Glu 750 Thr Gin
CAG AGT TCA ACA CCA AAA GCA GTG CAA GAA GCT CTC GAA GAA AGT ATT 2304
Gin Ser Ser 755 Thr Pro Lys Ala Val 760 Gin Glu Ala Leu Glu 765 Glu Ser íle
CGT CGT ATT CTT CAG GAA GGT GAA GAG TCT GTC CAA GAA TAC TAC AAG 23 5 2
Arg Arg 770 íle Leu Gin Glu Gly 775 Glu Glu Ser Val Gin 780 Glu Tyr Tyr Lys
AAC TTC GAG AAA GAA TAT CGT CAA CTT GAC TAT AAA GTT ATT GCT GAA 2400
Asn 785 Phe Glu Lys Glu Tyr 790 Arg Gin Leu Asp Tyr 795 Lys Val íle Ala Glu 800
GTA AAA ACT GCG AAC GAT ATA GCG AAA TAT GAT GAT AAA GGT TGG CCA 2448
Val Lys Thr Ala Asn 805 Asp íle Ala Lys Tyr 810 Asp Asp Lys Gly Trp 815 Pro
GGA TTT AAA TGC CCG TTC CAT ATT CGT GGT GTG CTA ACT TAT CGT CGA 2496
Gly Phe Lys Cys 820 Pro Phe His íle Arg 825 Gly Val Leu Thr Tyr 830 Arg Arg
GCT GTT AGC GGT TTA GGT GTA GCT CCA ATT TTG GAT GGA AAT AAA GTA 25 44
Ala Val Ser 835 Gly Leu Gly Val Ala 840 Pro íle Leu Asp Gly 845 Asn Lys Val
ATG GTT CTT CCA TTA CGT GAA GGA AAT CCA TTT GGT GAC AAG TGC ATT 259 2
Het Val 850 Leu Pro Leu Arg Glu 855 ciy Asn Pro Phe Gly 860 Asp Lys Cys l le
GCT TGG CCA TCG GGT ACA GAA CTT CCA AAA GAA ATT CGT TCT GAT GTG 2640
Ala 865 Trp Pro Ser Gly Thr 870 Glu Leu Pro Lys Glu 875 íle Arg Ser Asp Val 880
CTA TCT TGG ATT GAC CAC TCA ACT TTG TTC CAA AAA TCG TTT GTT AAA 2683
Leu Ser Trp íle Asp 885 H i S Ser Thr Leu Phe 890 Gin Lys Ser Phe Val 895 Lys
CCG CTT GCG GGT ATG TGT GAA TCG GCT GGC ATG GAC TAT GAA GAA AAA 2736
Pro Leu Ala Gly Met cys Glu Ser Ala Gly Het ASp Tyr Glu Glu Lys
900 905 910
GCT TCG TTA GAC TTC CTG TTT GGC 2760
Ala Ser Leu Asp Phe Leu Phe Gly
915 920
(2) INFORMÁCIA PRE SEQ ID NO:4:
(i) CHARAKTERISTIKA SEKVENCIE:
(A) DĹŽKA: 920 aminokyselín (B) TYP: aminokyselina (D) TOPOLÓGIA: lineárna (ii) TYP MOLEKULY: protein
(xi ·) ' OPIS SEKVENCIE: SEQ ID NO:4:
Arg 1 His Leu Hís Phe 5 Phe Phe Phe Phe Phe Phe 10 Phe Phe Phe Phe Phe 15
Phe Phe Phe Phe íle 20 lle Het Lys Glu Phe Tyr 25 1 le Ser Ile Glu Thr 30
Val Gly Asn 35 Asn íle Val Glu Arg Tyr íle Asp 40 Glu Asn Gly Lys Glu 45
Arg Thr 50 Arg Glu Val Glu Tyr Leu Pro Thr Het 55 Phe Arg His Cys Lys 60
Glu 65 Glu Ser Lys Tyr Lys Asp íle Tyr Gly Lys 70 75 Asn Cys Ala Pro Gin 80
Lys Phe Pro Ser Met 85 Lys Asp Ala Arg Asp Trp 90 Met Lys Arg Het Glu 95
Asp íle Gly Leu Glu 100 Ala Leu Gly Met Asn Asp 105 Phe Lys Leu Ala Tyr 110
íle Ser Asp 115 Thr Tyr Gly Ser Glu íle Val Tyr 120 Asp Arg Lys Phe Val 125
Arg Val 130 Ala Asn Cys Asp íle Glu Val Thr Gly Asp Lys Phe Pro Asp 135 140
Pro 145 Met Lys Ala Glu Tyr Glu íle Asp Ala lle 150 155 Thr His Tyr Asp Ser 160
I le Asp Asp Arg Phe 165 Tyr Val Phe Asp Leu Leu 170 Asn Ser Met Tyr Gly 175
Ser Val Ser Lys Trp 180 Asp Ala Lys Leu Ala Ala 185 Lys Leu Asp Cys Glu 190
Gly Gly Asp 195 Glu Val Pro Gin Glu íle Leu Asp 200 Arg Val íle Tyr Het 205
Pro Phe 210 Asp Asn Glu Arg Asp Met Leu Met Glu 215 Tyr lle Asn Leu Trp 220
Glu 225 Gin Lys Arg Pro Ala Ile Phe Thr Gly Trp 230 235 Asn Ile Glu Gly Phe 240
Asp Val Pra Tyr lle 245 Met Asn Arg Val Lys Met 250 lle Leu Gly Glu Arg 255
Ser Met Lys Arg Phe 260 Ser Pro lle Gly Arg Val 265 Lys Ser Lys Leu íle 270
Gin Asn Met Tyr Gly Ser Lys Glu íle Tyr Ser íle Asp Gly Val Ser 275 280 285
I le Leu Asp 290 Tyr Leu Asp Leu Tyr Lys Lys Phe Ala Phe Thr Asn Leu
295 300
Pro Ser Phe Ser Leu Glu Ser Val Ala Gin His Glu Thr Lys Lys Gly
305 310 315 320
Lys Leu Pro Tyr Asp Gly Pro íle Asn Lys Leu Arg Glu Thr Asn His
325 330 335
Gin Arg Tyr íle Ser Tyr Asn íle íle Asp Val Glu Ser val Gin Ala
340 345 350
íle Asp Lys íle Arg Gly Phe íle Asp Leu Val Leu Ser Het Ser Tyr
355 360 365
Tyr Ale Lys Met Pro Phe Ser Gly Val Het Ser Pro íle Lys Thr Trp
370 375 380
Asp Als íle íle Phe Asn Ser Leu Lys Gly Glu His Lys Val íle Pro
385 390 395 400
Gin Gin Gly Ser H í s Val Lys Gin Ser Phe Pro Gly Ala Phe Val Phe
405 410 415
Glu Pro Lys Pro íle Ala Arg Arg Tyr íle Het Ser Phe Asp Leu Thr
420 425 430
Ser Leu Tyr Pro Ser íle íle Arg Gin Val Asn I le Ser Pro Glu Thr
435 440 445
íle Arg ciy Gin Phe Lys Val His Pro íle His Glu Tyr íle Ala Gly
450 455 460
Thr Ala Pro Lys Pro Ser Asp Glu Tyr Ser Cys Ser Pro Asn Gly Trp
465 470 475 480
Met Tyr Asp Lys His Gin Glu Gly íle íle Pro Lys Glu íle Ala Lys
485 490 495
Val Phe Phe Gin Arg Lys Asp Trp Lys Lys Lys Met Phe Ala Glu Glu
500 505 510
Met Asn Ala Glu Ala íle Lys Lys íle íle Het Lys Gly Ala Gly Ser
515 520 525
Cys Ser Thr Lys Pro Glu Val Glu Arg Tyr Val Lys Phe Ser Asp Asp
530 535 540
Phe Leu Asn Glu Leu Ser Asn Tyr Thr Glu Ser Val Leu Asn Ser Leu
545 550 555 560
íle Glu Glu Cys Glu Lys Ala Ala Thr Leu Ala Asn Thr Asn Gin Leu
565 570 575
Asn Arg Lys I le Leu íle Asn Ser Leu Tyr Gly Ala Leu Gly Asn íle
580 585 590
Hi s Phe Arg Tyr Tyr Asp Leu Arg Asn Ala Thr Ala He Thr íle Phe
595 600 605
Gly Gin Val Gly lle Gin Trp íle Ala Arg Lys íle Asn Glu Tyr Leu
610 615 620
Asn Lys Val Cys Gly Thr Asn Asp Glu Asp Phe íle Ala Ala Gly Asp
625 630 635 640
Thr Asp Ser Val Tyr Val Cys Val Asp Lys Val íle Glu Lys Val Gly
645 650 655
Leu Asp Arg Phe Lys Glu Gin Asn Asp Leu Val Glu Phe Het Asn Gin 660 665 670
Phe Gly Lys Lys Lys Het Glu Pro Met íle Asp Val Ale Tyr Arg Glu
675 680 685
Leu Cys Asp Tyr Het Asn Asn Arg Glu His Leu Het His Met Asp Arg
690 695 700
Glu Ala r t e Ser Cys Pro Pro Leu Gly Ser Lys Gly Val Gly Gly Phe
705 710 715 720
Trp Lys Ala Lys Lys Arg Tyr Ala Leu Asn Val Tyr Asp Met Glu Asp
725 730 735
Lys Arg Phe Ala Glu Pro His Leu Lys íle Met Gly Het Glu Thr Gin
740 745 750
Gin Ser Ser Thr Pro Lys Ala Val Gin Glu Ala Leu Glu Glu Ser íle
755 760 765
Arg Arg íle Leu Gin Glu Gly Glu Glu Ser Val Gin Glu Tyr Tyr Lys
770 775 780
Asn Phe Glu Lys Glu Tyr Arg Gin Leu Asp Tyr Lys Val íle Ala Glu
7S 5 790 795 800
Val Lys Thr Ala Asn Asp íle Ala Lys Tyr Asp Asp Lys Gly Trp Pro
805 810 815
Gly Phe Lys Cys Pro Phe His íle Arg Gly Val Leu Thr Tyr Arg Arg
820 825 830
Ala Val Ser Gly Leu Gly Val Ala Pro íle Leu Asp Gly Asn Lys Val
835 840 845
Het Val Leu Pro Leu Arg Glu Gly Asn Pro Phe Gly Asp cys Cys íle
850 855 860
Ala Trp Pro Ser Gly Thr Glu Leu Pro Lys Glu íle Arg Ser Asp Val
865 870 875 880
Leu Ser Trp I le Asp His Ser Thr Leu Phe Gin Lys Ser Phe Val Lys
885 890 895
Pro Leu Ala Gly Het Cys Glu Ser Ala Gly Het Asp Tyr Glu Glu Lys
900 905 910
Ala Ser Leu Asp Phe Leu Phe Gly
915 920
(2) INFOR .MÁ' CIA P RE SEQ ID NO i:5
(i) CHARAKTERISTIKA SEKVENCIE:
(A) DĹŽKA: 2459 párov báz (B) TYP: nukleová kyselina (C) REŤAZEC: jednoduchý (D) TOPOLÓGIA: lineárna (ii) TYP MOLEKULY: DNA (genómová) (ix) ZNAKY:
(A) MENO/KĹÚČ: CDS (B) UMIESTNENIE: 108..2456 (xi) OPIS SEKVENCIE: SEQ ID NO:5:
AAGCATCGCG CGAAGGCATA TTACGGGCAG TAATGACTGT ATAAAACCAC AGCCAATCAA 60
ACGAAACCAG GCTATACTCA AGCCTGGTTT TTTGATGGAT TTTCAGC GTG GCG CAG 116
Val Ala Gin
CCA Ata GGT TTT ATC íle TTA ACC CGA CAC TGG CCG GAC ACC CCG CAA GGG ACA Thr 164
Gly 5 Phe Leu Thr Arg 10 H i s Trp Arg Asp Thr 15 Pro Gin Gly
GAA GTC TCC TTC TGG CTG GCG ACG GAC AAC GGG CCG TTG CAG GTT ACG 212
Glu Val Ser Phe Trp Leu Ala Thr Asp Asn Gly Pro Leu Gin Val Thr
20 25 30 35
CTT GCA CCG CAA GAG TCC GTG GCG TTT ATT CCC GCC GAT CAG GTT CCC 260
Leu Ala Pro Gin Glu Ser Val Ala Phe íle Pro Ala Asp Gin Val Pro
40 45 50
CGC GCT CAG CAT ATT TTG CAG GGT GAA CAA GGC TTT CGC CTG ACA CCG 308
Arg Ala Gin H i S Íle Leu Gin Gly Glu Gin Gly Phe Arg Leu Thr Pro
55 60 65
CTG GCG T TA AAG GAT TTT CAC CGC CAG CCG GTG TAT CGC CTT TAC TGT 356
Leu Ala Leu Lys Asp Phe H i S Arg Gin Pro Val Tyr Gly Leu Tyr Cys
70 75 80
CGC GCC CAT CGC CAA TTG ATG AAT TAC GAA AAG CGC CTG CGT GAA GGT 404
Arg Ala Kis Arg Gin Leu Met Asn Tyr GlU lys Arg Leu Arg Glu Gly
85 90 95
GGC GTT ACC GTC TAC GAG GCC GAT GTG CGT CCG CCA GAA CGC TAT CTG 452
Gly Val Thr Val Tyr Glu Ala Asp Val Arg Pro Pro Glu Arg Tyr Leu
100 105 110 115
ATG GAG CGG TTT ATC ACC TCA CCG GTG TGG GTC GAG GGT GAT ATG CAC 500
Met Glu Arg Phe íle Thr Ser Pro Val Trp Val Glu Gly Asp Met His
120 125 130
AAT GGC ACT ATC GTT AAT GCC CGT CTG AAA CCG CAT CCC GAC TAT CGT 548
Asn Gly Thr íle Val Asn Ala Arg Leu iys Pro His Pro Asp Tyr Arg
135 140 145
CCG CCG CTC AAG TGG GTT TCT ATA GAT ATT GAA ACC ACC CGC CAC GGT 596
Pro Pro Leu Lys Trp Val Ser íle Asp íle Glu Thr Thr Arg His Gly
150 155 160
GAG CTG TAC TGC ATC GGC CTG GAA GGC TGC GGG CAG CGC ATC GTT TAT 644
Glu Leu Tyr Cys íle Gly Leu Glu Gly cys Gly Gin Arg íle Val Tyr
165 170 175
ATG CTG GGG CCG GAG AAT GGC GAC GCC TCC TCG CTT GAT TTC GAA CTG 692
Met Leu Gly Pro Glu Asn Gly Asp Ala Ser Ser Leu Asp Phe Glu Leu
180 185 190 195
GAA TAC GTC GCC AGC CGC CCG CAG TTG CTG GAA AAA CTC AAC GCC TGG 740
Glu Tyr Val Ala Ser Arg Pro Gin Leu Leu Glu lys Leu Asn Ala Trp
200 205 210
TTT GCC AAC TAC GAT CCT GAT GTG ATC ATC GGT TGG AAC GTG GTG CAG 788
Phe Ala Asn Tyr Asp Pro Asp Val íle íle Gly Trp Asn Val Val Gin
215 220 225
TTC GAT CTG CGA ATG CTG CAA AAA CAT GCC GAG CGT TAC CGT CTT CCG 836
Phe Asp Leu Arg Met Leu Gin lys H i S Ala Glu Arg Tyr Arg Leu Pro
230 235 240
CTG CGT CTT GGG CGC GAT AAT AGC GAG CTG GAG TGG CGC GAC GAC GGC 884
Leu Arg Leu Gly Arg Asp Asn Ser Glu Leu Glu Trp Arg Asp Asp Gly
245 250 255
TTT AAA AAC GGC GTC TTT TTT GCC CAG GCT AAA GGT GGG CTA ATT ATC 932
Phe Lys Asn Gly Val Phe Phe Ala Gin Ala Lys Gly ciy Leu lle lle
260 265 270 275
GAC GGT ATC GAG GCG CTG AAA TCC GCG TTC TGG AAT TTC TCT TCA TTC 980
Asp Gly I le Glu Ala Leu Lys Ser Ala Phe Trp Asn Phe Ser Ser Phe
280 285 290
TCG CTG GAA Glu ACT Thr 295 GTC GCT CAG GAG CTA TTA GGC GAA GGA AAA TCT ATC 1028
Ser Leu Val Ala Gin Glu Leu 300 Leu Gly Glu Gly Lys 305 Ser I le
GAT AAC CCG TGG GAT CGA ATG GAC GAA ATT GAC CGC CGT TTC GCC GAA 1076
Asp Asn Pro Trp Asp Arg Het Asp Glu lle Asp Arg Arg Phe Ala Glu
310 315 320
GAT AAA CCT GCG CTG GCA ACT TAT AAC CTG AAA GAT TGC GAG CTG GTG 1124
Asp Lys Pro Ala Leu Ala Thr Tyr Asn Leu Lys Asp Cys Glu Leu Val
325 330 335
ACG CAG ATC TTC CAC AAA ACT GAA ATC ATG CCA TTT TTA CTC GAA CGG ' 1172
Thr Gin íle Phe His Lys Thr Glu íle Met Pro Phe Leu Leu Glu Arg
340 345 350 355
CCA ACG GTG AAC GGC CTG CCG GTG GAC CGA CAC GGC GGT TCG GTG GCG 1220
Ala Thr Val Asn Gly Leu Pro Val Asp Arg His Gly Gly Ser Val Ala
360 365 370
GCA TTT GGT CAT CTC TAT TTT CCG CGA ATG CAT CGC GCT GGT TAT GTC 1268
Ala Phe Gly H i s Leu Tyr Phe Pro Arg Het His Arg Ala Gly Tyr Val
375 330 385
GCG CCT AAT CTC GGC GAA GTG CCG CCG CAC GCC AGC CCT GGC GGC TAC 1316
Ala Pro Asn Leu Gly Glu Val Pro Pro His Ala Ser Pro Gly Gly Tyr
390 395 400
GTG ATG GAT TCA CGG CCA GGG CTT TAT GAT TCA GTG CTG GTG CTG GAC 1364
Val Het Asp Ser Arg Pro Gly Leu Tyr Asp Ser Val Leu Val Leu Asp
405 410 415
TAT AAA AGC CTG TAC CCG TCG ATC ATC CGC ACC TTT CTG ATT GAT CCC 1412
Tyr Lys Ser Leu Tyr Pro Ser lle I le Arg Thr Phe Leu lle Asp Pro
420 425 430 435
GTC GGG CTG GTG GAA GGC ATG GCG CAG CCT GAT CCA GAG CAC AGT ACC 1460
Val Gly Leu Val Glu Gty Met Ala Gin Pro Asp Pro Glu His Ser Thr
440 445 450
GAA GGT TTT CTC GAT GCC TGG TTC TCG CGA GAA AAA CAT TGC CTG CCG 1508
Glu Gly Phe Leu Asp Ala Trp Phe Ser Arg Glu Lys His cys Leu Pro
455 460 465
GAG ATT GTG ACT AAC ATC TGG CAC GGG CGC GAT GAA GCC AAA CGC CAG 1556
Glu íle Val Thr Asn íle Trp His Gly Arg Asp Glu Ala Lys Arg Gin
470 475 480
GGT AAC AAA CCG CTG TCG CAG GCG CTG AAA ATC ATC ATG AAT GCC TTT 1604
Gly Asn Lys Pro Leu Ser Gin Ala Leu Lys íle íle Met Asn Ala Phe
485 490 495
TAT GGC GTG CTC GGC ACC ACC GCC TGC CGC TTC TTC GAT CCG CGG CTG 1652
Tyr Gly Val Leu Gly Thr Thr Ala Cys Arg Phe Phe Asp Pro Arg Leu
500 505 510 515
GCA TCG TCG ATC ACC ATG CGT GGT CAT CAG ATC ATG CGG CAA ACC AAA 1700
Ala Ser Ser lle Thr Met Arg Gly His Gin íle Met Arg Gin Thr Lys
520 525 530
GCG TTG ATT GAA GCA CAG GGC TAC GAC GTT ATC TAC GGC GAT ACC GAC 1748
Ala Leu I le Glu Ala Gin Gly Tyr Asp Val íle Tyr Gly Asp Thr Asp
535 540 545
TCA ACG TTT GTC TGG CTG AAA GGC GCA CAT TCG GAA GAA GAA GCG GCG 1796
Ser Thr Phe Val Trp Leu Lys Gly Ala His Ser Glu Glu Glu Ala Ala
550 555 560
AAA ATC GGT CGT GCA CTG GTG CAG CAC GTT AAC GCC TGG TGG GCG GAA 1844
Lys I le Gly Arg Ala Leu Val Gin His Val Asn Ala Trp Trp Ala Glu
565 570 575
ACG CTG CAA AAA CAA CGG CTG ACC AGC CCA TTA GAA CTG GAG TAT GAA Glu 595 1892
Thr 580 Leu Gin Lys Gin Arg 5S5 Leu Thr Ser Ala Leu 590 Glu Leu Clu Tyr
ACC CAT TTC TGC CGT TTT CTG ATG CCA ACC ATT CGC GGA GCC GAT ACC 1960
Thr His Phe cys Arg Phe Leu Het Pro Thr íle Arg Gly Ala Asp Thr
600 605 610
CGC AGT AAA AAG CGT TAT GCC GGA CTG ATT CAG GAG GGC GAC AAG CAG 1988
Gly Ser Lys Lys Arg Tyr Ala Gly Leu íle Gin Glu Gly Asp Lys Gin
615 620 625
CGG ATG CTG TTT AAA GGG CTG GAA ACC GTG CGC ACC GAC TGG ACG CCG ' 2036
Arg Het Val Phe Lys Gly Leu Glu Thr Val Arg Thr Asp Trp Thr Pro
630 635 660
CTG GCC CAG CAG TTT CAG CAG GAG CTA TAC CTG CGC ATC TTC CGC AAC 2086
Leu Ala Gin Gin Phe Gin Gin Glu Leu Tyr Leu Arg íle Phe Arg Asn
665 650 655
GAG CCA TAT CAG GAA TAT GTA CGC GAA ACC ATC GAC AAA CTG ATG GCG 2132
Glu Pro Tyr Gin Glu Tyr Val Arg Glu Thr íle Asp Lys Leu Het Ala
660 665 670 675
GGT GAA CTG GAT GCG CGA CTG GTT TAC CGT AAA CGC CTT CGC CGT CCG 2180
Gly Glu Leu Asp Ala Arg Leu Val Tyr Arg Lys Arg Leu Arg Arg Pro
680 685 690
CTG AGC GAG TAT CAG CGT AAT GTG CCG CCT CAT GTA CGC GCC GCT CGC 2228
Leu Ser Glu Tyr Gin Arg Asn Val Pro Pro His Val Arg Ala Ala Arg
695 700 705
CTT GCC GAT GAA GAA AAC CAA AAG CGT GGT CGC CCC TTG CAA TAT CAG 2276
Leu Ala Asp Glu Glu Asn Gin Lys Arg Gly Arg Pro Leu Gin Tyr Gin
710 715 720
AAT CGC GGC ACC ATT AAG TAC GTA TGG ACC ACC AAC GGG CCG GAG CCG 2326
Asn Arg Gly Thr I le Lys Tyr Val Trp Thr Thr Asn Gly Pro Glu Pro
725 730 735
CTG GAC TAC CAA CGT TCA CCA CTG GAT TAC GAA CAC TAT CTG ACC CGC 2372
Leu Asp Tyr Gin Arg Ser Pro Leu Asp Tyr Glu His Tyr Leu Thr Arg
760 765 750 755
CAG CTA CAA CCC GTG GCG GAG GGA ATA CTC CCT TTT ATT GAG GAT AAT 2620
Gin Leu Gin Pro Val Ala Glu Gly íle Leu Pro Phe íle Glu Asp Asn
760 765 770
TTT GCT ACA CTT ATG ACC GGG CAA CTT GGG CTA TTT TGA 2659
Phe Ala Thr Leu Met Thr Gly Gin Leu Gly Leu Phe
775 780
(2) INFORMÁCIA PRE SEQ ID NO:6:
(i) CHARAKTERISTIKA SEKVENCIE:
(A) DĹŽKA: 783 aminokyselín (B) TYP: aminokyselina (D) TOPOLÓGIA: lineárna (ii) TYP MOLEKULY: proteín (xi) OPIS SEKVENCIE: SEQ ID NO:6:
Val 1 Ala Gin Ala Gly Phe íle Leu Thr Arg His Trp Arg Asp Thr 15 Pro
5 10
Gin Gly Thr Glu Val Ser Phe Trp Leu Ala Thr Asp Asn Gly Pro Leu
20 25 30
Gin Val Thr Leu Ala Pro Gin Glu Ser Val Ala Phe I le Pro Ala Asp
35 60 65
Gin Val Pro Arg Ala Gin His íle Leu Gin Gly Glu Gin Gly Phe Arg
50 55 60
Leu Thr Pro Leu Ala Leu Lys Asp Phe His Arg Gin Pro Val Tyr Gly
65 70 75 80
Leu Tyr Cys Arg Ala His Arg Gin Leu Met Asn Tyr Glu Lys Arg Leu
85 90 95
Arg Glu Gly Gly Val Thr Val Tyr Glu Ala Asp Val Arg Pro Pro Glu
100 105 110
Arg Tyr Leu Het Glu Arg Phe íle Thr Ser Pro Val Trp Val Glu Gly
115 120 125
Asp Het His Asn Gly Thr íle Val Asn Ala Arg Leu Lys Pro His Pro
130 135 140
Asp Tyr Arg Pro Pro Leu Lys Trp Val Ser íle Asp I le Glu Thr Thr
145 150 155 160
Arg His Gly Glu Leu Tyr Cys íle Gly Leu Glu Gly Cys Gly Gin Arg
165 170 175
íle Val Tyr Met Leu Gly Pro Glu Asn Gly Asp Ala Ser Ser Leu Asp
180 185 190
Phe Glu Leu Glu Tyr Val Ala Ser Arg Pro Gin Leu Leu Glu Lys Leu
195 2Ó0 205
Asn Ala Trp Phe Ala Asn Tyr Asp Pro Asp Val íle lle Gly Trp Asn
210 215 220
Val Val Gin Phe Asp Leu Arg Het Leu Gin Lys His Ala Glu Arg Tyr
225 230 235 240
Arg Leu Pro Leu Arg Leu Gly Arg Asp Asn Ser Glu Leu Glu Trp Arg
245 250 255
Asp Asp Gly Phe Lys Asn Gly Val Phe Phe Ala Gin Ala Lys Gly Gly
260 265 270
Leu Íle íle Asp Gly íle Glu Ala Leu Lys Ser Ala Phe Trp Asn Phe
275 280 285
Ser Ser Phe Ser Leu Glu Thr Val Ala Gin Glu Leu Leu Gly Glu Gly
290 295 300
Lys Ser íle Asp Asn Pro Trp Asp Arg Het Asp Glu íle Asp Arg Arg
305 310 315 320
Phe Ala Glu Asp Lys Pro Ala Leu Ala Thr Tyr Asn Leu Lys Asp cys
325 330 335
Glu Leu Val Thr Gin íle Phe His Lys Thr Glu íle Met Pro Phe Leu
340 345 350
Leu Glu Arg Ala Thr Val Asn Gly Leu Pro Val Asp Arg His Gly Gly
355 360 365
Ser Val Ala Ala Phe Gly His Leu Tyr Phe Pro Arg Het His Arg Ala
370 375 380
Gly Tyr Val Ala Pro Asn Leu Gly Glu Val Pro Pro His Ala Ser Pro
385 390 395 400
Gly Gly Tyr Val Met Asp Ser Arg Pro Gly Leu Tyr Asp Ser Val Leu
405 410 415
Val Leu Asp Tyr Lys Ser Leu Tyr Pro Ser íle íle Arg Thr Phe Leu
420 425 430
Ile Asp Pro 435 Val Gly Leu Val Glu Gly Het Ala Gin Pro Asp Pro Glu
440 445
His Ser Thr Glu Gly Phe Leu Asp Ala Trp Phe Ser Arg Glu Lys His
450 455 460
Cys Leu Pro Glu Íle Val Thr Asn Íle Trp His Gly Arg Asp Glu Ala
465 470 475 480
Lys Arg Gin Gty Asn Lys Pro Leu Ser Gin Ala Leu Lys íle lle Met
485 490 495
Asn Ala Phe Tyr Gly Val Leu Gly Thr Thr Ala Cys Arg Phe Phe ASP
500 505 510
Pro Arg Leu Ala Ser Ser Íle Thr Het Arg Gly His Gin íle Het Arg
515 520 525
Gin Thr Lys Ala Leu I le Glu Ala Gin Gly Tyr Asp Val íle Tyr Gly
530 535 540
Asp Thr Asp Ser Thr Phe Val Trp Leu Lys Gly Ala His Ser Glu Glu
545 550 555 560
Glu Ala Ala Lys I le Gly Arg Ala Leu Val Gin His Val Asn Ala Trp
565 570 575
Trp Ala Glu Thr Leu Gin Lys Gin Arg Leu Thr Ser Ala Leu Glu Leu
580 585 590
Glu Ty r Glu Thr His Phe Cys Arg Phe Leu Het Pro Thr íle Arg Gly
595 600 605
Ala Asp Thr Gly Ser Lys Lys Arg Tyr Ala Gly Leu íle Gin Glu Gly
610 615 620
Asp Lys Gin Arg Met Val Phe Lys Gly Leu Glu Thr Val Arg Thr Asp
625 630 635 640
Trp Thr Pro Leu Ala Gin Gin Phe Gin Gin Glu Leu Tyr Leu Arg íle
645 650 655
Phe Arg Asn Glu Pro Tyr Gin Glu Tyr Val Arg Glu Thr lle Asp Lys
660 665 670
Leu Met Ala Gly Glu Leu Asp Ala Arg Leu Val Tyr Arg Lys Arg Leu
675 680 685
Arg Arg Pro Leu Ser Glu Tyr Gin Arg Asn Val Pro Pro His Val Arg
690 695 700
Ala Ala Arg Leu Ala Asp Glu Glu Asn Gin Lys Arg Gly Arg Pro Leu
705 710 715 720
Gin Tyr Gin Asn Arg Gly Thr íle Lys Tyr Val Trp Thr Thr Asn Gly
725 730 735
Pro Glu Pro Leu Asp Tyr Gin Arg Ser Pro Leu Asp Tyr Glu His Tyr
740 745 750
Leu Thr Arg Gin Leu Gin Pro Val Ala Glu Gly íle Leu Pro Phe íle
755 760 765
Glu Asp Asn Phe Ala Thr Leu Met Thr Gly Gin Leu Gly Leu Phe
770 775 780

Claims (31)

1. Variantná DNA polymeráza radu B, ktorá nemá 3'-»- 5' exonukleázovú aktivitu, vybraná zo skupiny zahrnujúcej variantnú DNA polymerázu T4 , variantnú DNA polymerázu II E. coli, variantnú DNA polymerázu T2 a variantnú DNA polymerázu T6.
2. Variantná DNA polymeráza radu B podľa nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je izoleucin, prítomný v polohe kodónu 50, nahradený leucínom.
3. Variantná DNA polymeráza radu B podlá nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je glutámová kyselina, prítomná v polohe kodónu 82, nahradená asparágovou kyselinou.
4. Variantná DNA polymeráza radu B podlá nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je tryptofán, prítomný v polohe kodónu 213, nahradený serínom.
5. Variantná DNA polymeráza radu B podlá nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je glutámová kyselina, prítomná v polohe kodónu 255, nahradená serínom.
6. Variantná DNA polymeráza radu B podlá nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je izoleucin, prítomný v polohe kodónu 417, nahradený valínom.
7. Variantná DNA polymeráza radu B podlá nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je alanín, prítomný v polohe kodónu 737, nahradený valínom.
8. Variantná DNA polymeráza radu- B podľa nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je alanín, prítomný v polohe kodónu 743, nahradený valínom.
9. Variantná DNA polymeráza radu B podľa nároku l, kde v uvedenej variantnej DNA polymeráze T4 je asparágová kyselina, prítomná v polohe kodónu 112, nahradená alanínom.^
10. Variantná DNA polymeráza radu B podľa nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je izoleucín, prítomný v polohe kodónu 114, nahradený leucínom.
11. Variantná DNA polymeráza radu B podľa nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je asparágová kyselina, prítomná v polohe kodónu 219, nahradená alanínom.
12. Variantná DNA polymeráza radu B podľa nároku 1, kde v uvedenej variantnej DNA polymeráze T4 je asparágová kyselina, prítomná v polohe kodónu 324, nahradená alanínom.
13. Variantná DNA polymeráza radu B podľa nároku 1, kde v uvedenej variantnej DNA polymeráze II E. coli je asparágová kyselina, prítomná v polohe kodónu 156, nahradená alanínom.
14. Variantná DNA polymeráza radu B podľa nároku 1, kde v uvedenej variantnej DNA polymeráze II E. coli je glutámová kyselina, prítomná v polohe kodónu 158, nahradená alanínom.
15. Spôsob sekvenovania DNA, vyznačujúci sa tým, že zahrnuje, stupne:
uvedenia polymerázy, vybranej zo skupiny zahrnujúcej variantnú polymerázu T4, variantnú DNA polymerázu II E. coli, variantnú polymerázu T2 a variantnú polymerázu T6, do styku s primárovým reťazcom DNA pre sekvenovanie v prítomnosti dATP, dGTP, dCTP, dTTP a prvého terminačného nukleotidu, vybraného zo skupiny zahrnujúcej ddATP a 31-amino-2',3'-didezoxy-ATP, druhého terminačného nukleotidu, vybraného zo skupiny zahrnujúcej ddGTP a 3'-amino-2',3'-didezoxy-GTP, tretieho terminačného nukleotidu, vybraného zo skupiny zahrnujúcej araCTP a 3'-amino-2',3'-didezoxy-CTP, a štvrtého terminačného nukleotidu, vybraného zo skupiny zahrnujúcej araUTP a 3'-amino-2',3'-didezoxy-TTP, a umožnenia, aby tento styk prebiehal za reakčných podmienok pre udržanie polymerázovej aktivity po dobu dostatočnú na získanie sekvenčnej informácie.
16. Spôsob podlá nároku 15, vyznačujúci sa tým, že uvedený prvý terminačný nukleotid je ddATP, uvedený druhý terminačný nukleotid je ddGTP, uvedený tretí terminačný nukleotid je araCTP a uvedený štvrtý terminačný nukleotid je araUTP.
17. Spôsob podlá nároku 15, vyznačujúci sa tým, že polymerázou je variantná polymeráza T4.
18. Spôsob podľa nároku 17, vyznačujúci sa tým, že ďalej zahrnuje aspoň jeden sprievodný proteín, ktorý tvorí komplex s uvedenou variantnou polymerázou T4, čím zvyšuje spracovateľnost uvedenej variantnej polymerázy T4.
19. Spôsob podľa nároku 18, vyznačujúci sa tým, že sprievodný proteín je vybraný zo skupiny zahrnujúcej T4 génové produkty 32, 41, 45 a komplex 44/62.
20. Spôsob podlá nároku 15, vyznačujúci sa tým, že variantnou^ polymerázou je variantná DNA polymeráza II E. coli.
21. Spôsob podľa nároku 20, vyznačujúci sa tým, že ďalej zahrnuje aspoň jeden sprievodný proteín, ktorý tvorí komplex s variantnou DNA polymerázou II E. coli, čím zvyšuje spracovateľnost uvedenej variantnej DNA polymerázy II E. coli.
22. Spôsob podlá nároku 21, vyznačujúci sa tým, že uvedený sprievodný proteín je kombináciou β proteínu, γ komplexu a SSB proteínu.
23. Spôsob podlá nároku 15, vyznačujúci sa tým, že uvedený prvý terminačný nukleotid je 3'-amino-2',3'-didezoxy-ATP, uvedený druhý terminačný nukleotid je 3'-amino-2 1 ,3'didezoxy-GTP, uvedený tretí terminačný nukleotid je 3'-amino-2’,3'-didezoxy-CTP a uvedený štvrtý terminačný nukleotid je 3'-amino-2',3'-didezoxy-TTP.
24. Spôsob podľa nároku 23, vyznačujúci sa tým, že polymeráza je vybraná zo skupiny zahrnujúcej polymerázu T4 a variantnú polymerázu T4.
25. Spôsob podlá nároku 24, vyznačujúci sa tým, že ďalej zahrnuje aspoň jeden sprievodný proteín, ktorý tvorí komplex s polymerázou T4 alebo variantnou polymerázou T4, čím zvyšuje spracovatelnost uvedenej polymerázy T4 alebo variantnej polymerázy T4.
26. Spôsob podlá nároku 25, vyznačujúci sa tým, že sprievodný proteín je vybraný zo skupiny zahrnujúcej T4 génové produkty 32, 41, 45 a komplex 44/62.
27. Spôsob podlá nároku 23, vyznačujúci sa tým, že variantnou polymerázou je DNA polymeráza II E. coli a variantná DNA polymeráza II E. coli.
28. Spôsob podlá nároku 27, vyznačujúci sa tým, že ďalej zahrnuje aspoň jeden sprievodný proteín, ktorý tvorí komplex s DNA polymerázou II E. coli alebo variantnou DNA polymerázou II E. coli, čím zvyšuje spracovatelnost uvedenej DNA polymerázy II E. coli alebo variantnej DNA polymerázy II E. coli.
29. Spôsob podlá nároku 28, vyznačujúci sa tým, že uvedený sprievodný proteín je kombináciou β proteínu, y komplexu a SSB proteínu.
30. Spôsob sekvenovania DNA, vyznačujúci sa tým, že zahrnuje stupne:
uvedenia variantnej DNA polymerázy T4, ktorá nemá aktivitu 3'-> 5' exonukleázy, do styku s primérovým reťazcom DNA pre sekvenovanie v prítomnosti štandardných nukleotidov, pričom koncentrácia jedného zo štandardných nukleotidov je velmi nízka v porovnaní s ostatnými štandardnými nukleotidmi, a umožnenia, aby tento styk prebiehal za reakčných podmienok na udržanie polymerázovej aktivity po dobu dostatočnú na získanie sekvenčnej informácie.
31. Spôsob identifikácie a izolácie variantnej DNA polymerázy T4, vyznačujúci sa tým, že zahrnuje stupne: identifikácie kmeňov T4, obsahujúcich variantné DNA polymerázy T4, defektne v niektorom aspekte replikácie DNA, izolácie ďalej modifikovaných foriem uvedených variantných DNA polymeráz T4 selekciou v hostiteľovi E. coli optÄl, izolácie kmeňov T4, ktoré obsahujú variantné DNA polymerázy T4 s aspoň jednou ďalšou mutáciou, ktorá koriguje alebo kompenzuje uvedený defekt replikácie DNA, identifikácie ďalších korigujúcich/kompenzujúcich mutácií v uvedených variantných DNA poiymerázach T4 a zavedenia uvedených identifikovaných korigujúcich/kompenzujúcich mutácií v DNA poiymerázach T4 do fága T4 alebo expresných vektorov DNA polymerázy T4.
ŠTRUKTÚRY NUKLEOTIDOV
2'-dezoxyribonukleozidtrifosfáty (dNTP) dC7P dATP dGTP
2', 3'-didezoxyribonukleozidtrifosfáty (ddNTP)
SK141-96A 1993-08-02 1994-08-01 Enzymes sequencing dna SK14196A3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/101,593 US5547859A (en) 1993-08-02 1993-08-02 Chain-terminating nucleotides for DNA sequencing methods
PCT/US1994/008610 WO1995004162A2 (en) 1993-08-02 1994-08-01 Dna sequencing enzymes

Publications (1)

Publication Number Publication Date
SK14196A3 true SK14196A3 (en) 1996-06-05

Family

ID=22285458

Family Applications (1)

Application Number Title Priority Date Filing Date
SK141-96A SK14196A3 (en) 1993-08-02 1994-08-01 Enzymes sequencing dna

Country Status (18)

Country Link
US (3) US5547859A (sk)
EP (1) EP0713535A1 (sk)
JP (1) JPH09509301A (sk)
KR (1) KR960704067A (sk)
CN (1) CN1132529A (sk)
AU (1) AU699498B2 (sk)
BG (1) BG100188A (sk)
BR (1) BR9407403A (sk)
CA (1) CA2168471A1 (sk)
CZ (1) CZ30696A3 (sk)
FI (1) FI960469A (sk)
HU (1) HUT75841A (sk)
LV (1) LV11486B (sk)
NO (1) NO960408L (sk)
NZ (1) NZ269727A (sk)
PL (1) PL312836A1 (sk)
SK (1) SK14196A3 (sk)
WO (1) WO1995004162A2 (sk)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6406855B1 (en) 1994-02-17 2002-06-18 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5614365A (en) * 1994-10-17 1997-03-25 President & Fellow Of Harvard College DNA polymerase having modified nucleotide binding site for DNA sequencing
WO1997039150A1 (en) * 1996-04-15 1997-10-23 University Of Southern California Synthesis of fluorophore-labeled dna
US5827716A (en) * 1996-07-30 1998-10-27 Amersham Life Science, Inc. Modified Pol-II type DNA polymerases
US6291164B1 (en) 1996-11-22 2001-09-18 Invitrogen Corporation Methods for preventing inhibition of nucleic acid synthesis by pyrophosphate
CA2330673C (en) * 1998-05-01 2009-05-26 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and dna molecules
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
US20040009486A1 (en) 1999-10-29 2004-01-15 Sorge Joseph A. Compositions and methods utilizing DNA polymerases
WO2001032887A1 (en) * 1999-10-29 2001-05-10 Stratagene Compositions and methods utilizing dna polymerases
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
EP3034627B1 (en) 2000-10-06 2019-01-30 The Trustees of Columbia University in the City of New York Massive parallel method for decoding dna and rna
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
US7057026B2 (en) * 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US11008359B2 (en) 2002-08-23 2021-05-18 Illumina Cambridge Limited Labelled nucleotides
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
ES2407681T3 (es) 2002-08-23 2013-06-13 Illumina Cambridge Limited Nucleótidos modificados para la secuenciación de polinucleótidos.
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US7981604B2 (en) 2004-02-19 2011-07-19 California Institute Of Technology Methods and kits for analyzing polynucleotide sequences
US7476734B2 (en) 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
JP2008512084A (ja) 2004-05-25 2008-04-24 ヘリコス バイオサイエンシーズ コーポレイション 核酸の配列決定のための方法およびデバイス
US7220549B2 (en) 2004-12-30 2007-05-22 Helicos Biosciences Corporation Stabilizing a nucleic acid for nucleic acid sequencing
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
GB0517097D0 (en) 2005-08-19 2005-09-28 Solexa Ltd Modified nucleosides and nucleotides and uses thereof
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
WO2007070642A2 (en) * 2005-12-15 2007-06-21 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
US8399188B2 (en) 2006-09-28 2013-03-19 Illumina, Inc. Compositions and methods for nucleotide sequencing
US7883869B2 (en) 2006-12-01 2011-02-08 The Trustees Of Columbia University In The City Of New York Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
US9115163B2 (en) 2007-10-19 2015-08-25 The Trustees Of Columbia University In The City Of New York DNA sequence with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators
EP4310194A2 (en) 2007-10-19 2024-01-24 The Trustees of Columbia University in the City of New York Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis
US7767441B2 (en) * 2007-10-25 2010-08-03 Industrial Technology Research Institute Bioassay system including optical detection apparatuses, and method for detecting biomolecules
US7811810B2 (en) 2007-10-25 2010-10-12 Industrial Technology Research Institute Bioassay system including optical detection apparatuses, and method for detecting biomolecules
ES2936256T3 (es) 2008-02-01 2023-03-15 Massachusetts Gen Hospital Uso de microvesículas en el diagnóstico, y pronóstico de enfermedades y afecciones médicas
US20130029339A1 (en) 2009-09-09 2013-01-31 The General Hospital Corporation Use of microvesicles in analyzing kras mutations
EP2475988B1 (en) 2009-09-09 2018-11-14 The General Hospital Corporation Use of microvesicles in analyzing nucleic acid profiles
US20140045915A1 (en) 2010-08-31 2014-02-13 The General Hospital Corporation Cancer-related biological materials in microvesicles
US20130295574A1 (en) 2010-11-10 2013-11-07 Exosome Diagnostics, Inc. Method for Isolation of Nucleic Acid Containing Particles and Extraction of Nucleic Acids Therefrom
CA2887058C (en) 2012-10-03 2022-02-22 Exosome Diagnostics, Inc. Use of microvesicles in diagnosis, prognosis, and treatment of medical diseases and conditions
DK2970356T3 (en) 2013-03-15 2018-08-27 Illumina Cambridge Ltd Modified nucleosides or nucleotides
WO2014144883A1 (en) 2013-03-15 2014-09-18 The Trustees Of Columbia University In The City Of New York Raman cluster tagged molecules for biological imaging
US10451544B2 (en) 2016-10-11 2019-10-22 Genotox Laboratories Methods of characterizing a urine sample

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4666892A (en) * 1984-03-06 1987-05-19 Sloan-Kettering Memorial Cancer Center Method and composition for hepatitis treatment with pyrimidine nucleoside compounds
DE3546374A1 (de) * 1985-12-31 1987-07-02 Max Planck Gesellschaft Verfahren zur sequenzanalyse von dna
CA1340806C (en) * 1986-07-02 1999-11-02 James Merrill Prober Method, system and reagents for dna sequencing
US4935361A (en) * 1986-09-18 1990-06-19 Yale University Cloning and expression of T4 DNA polymerase
US4942130A (en) * 1987-01-14 1990-07-17 President & Fellows Of Harvard College T7 DNA polymerase
US5102785A (en) * 1987-09-28 1992-04-07 E. I. Du Pont De Nemours And Company Method of gene mapping
US4962020A (en) * 1988-07-12 1990-10-09 President And Fellows Of Harvard College DNA sequencing
US5001050A (en) * 1989-03-24 1991-03-19 Consejo Superior Investigaciones Cientificas PHφ29 DNA polymerase
WO1991006679A1 (en) * 1989-10-24 1991-05-16 Stratagene An improved method for hybridizing nucleic acids using single-stranded nucleic acid binding protein
DE4214112A1 (de) * 1991-08-02 1993-02-04 Europ Lab Molekularbiolog Neues verfahren zur sequenzierung von nukleinsaeuren
US5316948A (en) * 1992-09-04 1994-05-31 Life Technologies, Inc. N4 -methyl-2'-deoxycytidine 5'-triphosphate and its use in polymerase-catalyzed nucleic acid syntheses
US5541311A (en) * 1992-12-07 1996-07-30 Third Wave Technologies, Inc. Nucleic acid encoding synthesis-deficient thermostable DNA polymerase
US5436149A (en) * 1993-02-19 1995-07-25 Barnes; Wayne M. Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension

Also Published As

Publication number Publication date
FI960469A0 (fi) 1996-02-01
CA2168471A1 (en) 1995-02-09
AU7408894A (en) 1995-02-28
FI960469A (fi) 1996-03-27
CN1132529A (zh) 1996-10-02
CZ30696A3 (en) 1996-06-12
KR960704067A (ko) 1996-08-31
AU699498B2 (en) 1998-12-03
PL312836A1 (en) 1996-05-13
US5547859A (en) 1996-08-20
US5928919A (en) 1999-07-27
WO1995004162A2 (en) 1995-02-09
LV11486B (en) 1997-02-20
EP0713535A1 (en) 1996-05-29
HU9600235D0 (en) 1996-03-28
NO960408D0 (no) 1996-01-31
HUT75841A (en) 1997-05-28
US5660980A (en) 1997-08-26
NZ269727A (en) 1997-11-24
WO1995004162A3 (en) 1995-06-01
NO960408L (no) 1996-03-27
BR9407403A (pt) 1996-11-05
LV11486A (lv) 1996-08-20
BG100188A (en) 1996-12-31
JPH09509301A (ja) 1997-09-22

Similar Documents

Publication Publication Date Title
SK14196A3 (en) Enzymes sequencing dna
US5945312A (en) Synthesis of fluorophore-labeled DNA
US5939292A (en) Thermostable DNA polymerases having reduced discrimination against ribo-NTPs
EP0866796B1 (en) Improvements in or relating to mutagenesis of nucleic acids
US4994372A (en) DNA sequencing
US4795699A (en) T7 DNA polymerase
US7501237B2 (en) Polymerases for analyzing or typing polymorphic nucleic acid fragments and uses thereof
EP1934339B1 (en) Thermostable viral polymerases and methods of use
EP0265293A2 (en) T7 DNA polymerase
EP0854196B1 (en) Method for the uncoupled, direct, exponential amplification and sequencing of DNA molecules with the addition of a second thermostable DNA polymerase and its application
US20030215857A1 (en) Method for the direct, exponential amplification and sequencing of DNA molecules and its application
US20120184017A1 (en) Mutant dna polymerases and uses therof
JP2018530320A (ja) ポリメラーゼ酵素
EP1546355B1 (en) Methods of use for thermostable rna ligases
US20190249239A1 (en) Convertible adapters
US6867027B1 (en) RNA polymerase
US20120083018A1 (en) Thermostable dna polymerases and methods of use
AU3893899A (en) Method for identifying nucleic acid molecules
US20240018490A1 (en) Polymerase mutants and use with 3'-oh unblocked reversible terminators
JP2004135628A (ja) Dnaの変異導入法