SK158599A3 - Grapevine leafroll virus (type 2) proteins and their uses - Google Patents

Grapevine leafroll virus (type 2) proteins and their uses Download PDF

Info

Publication number
SK158599A3
SK158599A3 SK1585-99A SK158599A SK158599A3 SK 158599 A3 SK158599 A3 SK 158599A3 SK 158599 A SK158599 A SK 158599A SK 158599 A3 SK158599 A3 SK 158599A3
Authority
SK
Slovakia
Prior art keywords
protein
polypeptide
dna molecule
isolated
seq
Prior art date
Application number
SK1585-99A
Other languages
English (en)
Inventor
Hai-Ying Zhu
Kai-Shu Ling
Dennis Gonsalves
Original Assignee
Cornell Res Foundation Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cornell Res Foundation Inc filed Critical Cornell Res Foundation Inc
Publication of SK158599A3 publication Critical patent/SK158599A3/sk

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8283Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for virus resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56961Plant cells or fungi
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/00022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/005Assays involving biological materials from specific organisms or of a specific nature from viruses
    • G01N2333/08RNA viruses

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Virology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Cell Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Description

Táto žiadosť si nárokuje úžitok U.S. Provisional Patent Application (provizórnej patentovej žiadosti) číslo série 60/047,194 podanej 20. mája 1997. Táto práca bola podporená U. S. Department of Agriculture Cooperative Grant č. 58-23499-01. Vláda USA môže mať určité nároky na tento vynález.
Oblasť techniky
Tento vynález sa týka proteinov vírusu zvinutky viniča, molekúl DNA kódujúcich tieto proteíny a ich použitia.
Doterajší stav techniky
Vo svete najrozšírenejšie ovocie, hrozno (Vitis sp.) je pestované na všetkých kontinentoch okrem Antarktídy. Hlavné centrá produkcie hrozna sú v európskych krajinách (Taliansko, Španielsko a Francúzsko), ktoré predstavujú približne 70 % svetovej produkcie hrozna (Mullins a spol. Biology of the Grapevine, Cambridge, U.K.: University Press (1992)). Spojené štáty s 300 000 hektármi viníc, sú ôsmym najväčším producentom hrozna na svete. Hoci hrozno má široké použitie, hlavná časť produkcie hrozna (~ 80 %) sa používa pre výrobu vína. Oproti obilninám, väčšina viníc používa tradičné kultivary, ktoré pretrvávajú po storočia vegetatívnym rozmnožovaním. Vela dôležitých vírusov viniča a vírusom podobných chorôb, ako je zvinutka viniča, vrásčitosť dreva a Rupestries, je prenášaných a šírených používaním infikovaného rozmnožovaného materiálu. Preto rozmnožovanie certifikovaných, bezvírusových materiálov, je jedným a najdôležitejším spôsobom kontroly chorôb. Tradičné pestovanie viniča rezistentného voči chorobám je ťažké z dôvodu vysoko heterozygotnej povahy množenia viniča, a z dôvodu polygénneho charakteru dedičnosti. Okrem toho uvedenie nových kultivarov môže byť zakázané zvykom alebo zákonom. Súčasný vývoj biotechnológie umožnil zavedenie špeciálnych vlastností, ako je rezistencia voči ochoreniu, do existujúcich kultivarov bez zmeny ich ovocinárskych vlastností.
Mnohé rastlinné patogény, ako huby, baktérie, fytoplazmy, vírusy a nematody môžu infikovať vinič a výsledné choroby môžu spôsobiť významnú stratu produkcie (Pearson a spol., Compendium of Grape Diseases, American Phytopatological Society Press (1988)). Medzi týmito ochoreniami vírusové ochorenia predstavujú hlavnú prekážku výnosného pestovania viniča. Bolo izolovaných a charakterizovaných asi 34 vírusov viniča. Hlavné vírusové ochorenia viniča sú rozdelené do skupín: (1) degenerácia viniča spôsobená nepovírusom listu, inými európskymi nepovírusmi a americkými nepovírusmi, (2) komplexom zvinutky a (3) komplexom vrásčitosti dreva (Martelli, vyd., Graft Transmissible Diseases of Grapevines, Handbook for Detection and Diagnosis, FAO, UN, Rome, Italy (1993)) .
Spomedzi vírusových ochorení je vo svete najrozšírenejším komplex zvinutky viniča. Podľa Goheena („Grape Leafroll v Frazier a spol., vyd., Virus Diseases of Small Fruits and Grapevines (A Handbook), University of California, Division of Agricultural Sciences, Berkley, Calif, USA, str. 209-212 (1970) („Goheen (1970)), ochorenie zvinutka viniča bolo popísané už v roku 1850 v nemeckej a francúzskej literatúre. Avšak vírusová povaha ochorenia bola po prvýkrát dokázaná Scheu-om (Scheu, „Die Rollkrankheit des Rebstockes (Leafroll of grapevine), D.D. Weinbau 14:222-358 (1935) („Scheu (1935)))· V roku 1946 Harmon a Snyder (Harmon a spol., „Investigations and Occurence, Transmission, Spread and Effect of „White Fruit Colour in the Emperor Grape, Proc. Am. Soc. Hort. Sci. 74:190-194 (1946)) stanovili vírusový charakter White Emperor disease v Kalifornii. Toto bolo neskôr potvrdené Goheen-om a spol. (Goheen a spol. „Leafroll (White Emperor Disease) of Grapes in California, Phytopathology, 48:51-54 (1958) („Goheen (1958))), a potvrdilo sa, že ochorenia zvinutka viniča a White Emperor disease boli tie isté a zachoval sa len názov „zvinutka viniča.
Zvinutka viniča je závažné vírusové ochorenie viniča a vyskytuje sa všade, kde sa pestuje vinič. Velké rozšírenie ochorenia umožnilo množenie chorých rastlín viniča. Choroba pôsobí na všetky pestované odrody koreňov Vitis. Hoci ochorenie nie je smrteľné, spôsobuje stratu úrody a pokles v obsahu cukru. Scheu stanovil v roku 1936, že 80 % všetkých viničov rastúcich v Nemecku je infikovaných (Scheu, Mein Winzerbuch, Berlín: Reichsnahrstand-Verlags (1936)). V mnohých kalifornských viniciach výskyt zvinutky viniča (založený na štúdii symptómov uskutočnenej v 1959) súhlasí s Scheu-ovým pôvodným pozorovaním vo viniciach Nemecka (Goheen a spol., „Studies of Grape Leafroll in California, Amer. J. Enol. Vitie., 10:7884 (1959)). Súčasný stav chorobnosti na zvinutku viniča sa nezdá byť lepši (Goheen, „Diseases Caused by Viruses and Viruslike Agents, The American Pathophysiological Society, St. Paul, Minnesota:APS Press, 1:47-54 (1988) („Goheen (1988)). Goheen tiež stanovil, že ochorenie spôsobuje ročnú stratu asi 5 až 20 % z celkovej ročnej úrody hrozna (Goheen (1970) a Goheen (1988)). Množstvo cukru v jednotlivých strapcoch infikovaného viniča predstavuje len asi 1/2 až 1/3 množstva cukru z neinfikovaného viniča (Goheen (1958)).
Symptómy ochorenia zvinutky viniča sa významne líšia v závislosti od kultivaru, prostredia a ročného obdobia. U tmavých odrôd je na jeseň najčastejšie stočenie listov do vnútra a medzicievne sčervenanie zrelých listov; tieto symptómy sa nevyskytujú na jar, alebo v skorom lete. U svetlých odrôd sú však symptómy menej zjavné, listy sú zvyčajne skrútené do vnútra a súčasne je prítomná medzicievna chloróza. Avšak vela kultivarov nevykazuje žiadne symptómy. V takom prípade je choroba zvyčajne diagnostikovaná pomocou indikátora indexu dreva, použitím Vitis vivifera cv. Carbernet Franc (Goheen (1988)).
Aj keď Scheu dokázal, že zvinutka viniča je prenosná štepom, predpokladala sa vírusová etiológia ochorenia (Scheu (1935)). Z viničov napadnutých ochorením zvinutky viniča bolo izolovaných niekoľko typov vírusových častíc. Sú to častice podobné potyvírusu (Tanne a spol., „Purification and Characterization of a Virus Associated with the Grapevine Leafroll Disease, Phytopathology, -67:442-447 (1977)), častice podobné izometrickým vírusom (Castellano a spol., „Virus-like Particles and Ulatrastructural Modification in the Phloem of Leafroll-affected Grapevines, Vitis, 22:23-29 (1983)) („Castellano (1983)) a Nambera a spol. „A Small Spherical Virus Associated with the Ajinashika Disease of Koshu Grapevine, Ann. Phytopathol. Soc. Japan, 45:70-73 (1979)), a častice podobné klosterovírusom (Namba, „Grapevine Leafroll Virus, a Possible Member of Closteroviruses, Ann. Phytopathol. Soc. Japan 45:497-502 (1979)). V súčasnosti však dlhé flexibilné klosterovírusy veľkosti od 1 400 do 2 200 nm boli konzistentnejšie spojené s ochorením zvinutky viniča (Obrázok 1) (Castellano (1983), Faoro a spol., „Association of a Possible Closterovirus with Grapevine Leafroll in Northern Italy,
Riv. Patol. Veg., Ser IV, 17 :183-189 (1981), Gugerli a spol., „L'enroulement de la vigne: mise en évidence de particules virales et développement d'une méthode immuno-enzymatique pour le diagnostic rapide (Grapevine Leafroll: Presence of Virus Particle and Development of an Immuno-enzyme method for Diagnosis and Detection), Rev. Suisse Viticult. Ärboricult. Hort., 16:299-304 (1984) („Gugerli (1984)), Hu a spol., „Characterization of Closterovirusis-like Particles Associated with Grapevine Leafroll Disease, J. Phytopathol., 128:114 (1990) („Hu (1990)), Milne a spol., „Closterovirus-like Particles of Two Types Associated with Diseased Grapevines, Phytopathol. Z., 110:360-368 (1984), Zee a spol., „Cytopathology of Leafroll-diseased Grapevines and the Purification and Serology of Associated Closteroviruslike Particles, Phytopathology, 77:1427-1434 (1987) („Zee (1987)) a Zimmermann a spol., „Characterization and Serological Detection of Four Closteroviruses-like Particles Associated with Leafroll Disease on Grapevine, J. Phytopathol., 130:205-218 (1980) („Zimmermann (1990)). Tieto klosterovirusy sa vzťahujú k vírusom spojeným so zvinutkou viniča („GLRaV). Z viničov napadnutých ochorením zvinutka viniča (Tabulka 1) bolo izolovaných najmenej šesť sérologicky rozdielnych typov GLRaV (GLRaV 1 až 6) (Boscia a spol., „Nomenclature of Grapevine Leafroll-associated Putative Closteroviruses, Vitis, 34:171175 (1995) („Boscia (1995)) a (Martelli, „Leafroll, str. 37-44 v Martelli, vyd., Graft Transmissible Diseases of Grapevines, Handbook for the Detection and Diagnosis, FAO, Rome, Italy, (1993) („Martelli I)).Prvých päť typov bolo potvrdených na 10th Meeting of the International Council for the Study of Virus and Virus Diseases of the Grapevine) („ICVG) (Volos, Grécko, 1990).
Tabuľka 1
Typ dĺžka častice (nm) Povrchový proteín Mr (xlO3) Citácia
GLRaV-l 1 400-2 200 39 Gugerli (1984)
GLRaV-2 1 400-1 800 26 Gugerli (1984)
GLRaV-3 1 400-2 200 43 Zee (1987)
GLRaV-4 1 400-2 200 36 Hu (1990)
GLRaV-5 1 400-2 200 36 Zimmermann (1990)
GLRaV-6 1 400-2 200 36 Gugerli (1993)
Použitím monoklonálnych protilátok však pôvodný GLRaV II popísaný v Gugerli (1984) bolo zistené, že je zmesou najmenej dvoch zložiek, Ha a Ilb (Gugerli a spol., „Grapevine Leafroll Associated Virus II Analyzed by Monoclonal Antibodies, llth Meeting of the International Council for the Study of Viruses and Virus Diseases of the Grapevine, Montreux, Switzerland, str. 23-24 (1993) („Gugerli (1993))). Nedávny výskum pomocou porovnávacích sérologických stanovení (Boscia (1995)) ukázal, že Ilb zložka cv. Chasselas 8/22 je rovnaká ako GLRaV-2 izolát z Francie (Zimmermann (1990)), ktorý tiež obsahuje izoláty klosterovírusov spojených s ochorením vrásčitého dreva viniča z Talianska (GCBaV-BA) (Boscia (1995)) a zo Spojených štátov (GCBaV-NY) (Namba a spol., „Purification and Properties of Closterovirus-like Particles Associated with Grapevine Corky Bark Disease, Phytopathology, 81:964970 (1991) („Namba (1991))). Zložka Ha cv.Chasselas 8/22 bola provizórne nazvaná vírus 6 spojený so zvinutkou viniča (GLRaV-6). Okrem toho antisérum voči CA-5 izolátu z GLRaV-2 pripravené Bosciom a spol., (Boscia a spol., „Characterization of Grape Leafroll Associated Closterovirus (GLRaV) Serotype II and Comparison with GLRaV Serotype III, Phytopa7 thology, 80:117 (1990)) ukázalo, že obsahuje proti-látky voči obidvom GLRaV-2 a GLRaV-1, s prevahou protilátky voči GLRaV-1 (Boscia (1995)).
Virióny GLRaV-2 sú ohybné, filamentné častice dlhé asi 1 400 až 1 800 nm (Gugerli a spol., „Ľenroulement de la Vigne: Mise en Evidence de Particles Virales et Development d'une Methode Immuno-enzymatique Pour le Diagnostic Rapide (Grapevine Leafroll: Presence of Virus Particles and Development of an Immuno-enzyme Method for Diagnosis and Detect i on), Rev. Suisse Viticult. Arboricult. Horticult. 16:299304 (1984)). Z tkanív infikovaných GLRaV-2 bola konštantné izolovaná dvojvláknitá RNA (dsRNA) veľkosti približne 15 kb (Goszcynski a spol., „Detection of Two Strains of Grapevine Leafroll-Associated Virus 2, Vitis 35:133-35 (1996)). Povrchový proteín z GLRaV-2 je asi 22~26 kDa (Zimmermann a spol., „Characterization and Serological Detection of Four Closterovirus-like Particles Associated with Leafroll Disease on Grapevine, J. Phytopathology 130:205-18 (1990); Gugerli a Ramel, Rozšírené abstrakty: „Grapevine Leafroll Associated Virus II Analyzed by Monoclonal Antibodies, llth ICVG at Montreux, Švajčiarsko, Gugerli, vyd., Federal Agricultural Research Station of Changins, CH-1260, Nyon, Švajčiarsko, str. 23-24 (1993); Boscia a spol., „Nomenclature of Grapevine Leafroll-Associated Putative Closteroviruses, Vitis 34:17175 (1995)), ktorý je značne menší ako iné povrchové proteíny z GLRaV (35~43 kDa) (Zee a spol., „Cytopathology of LeafrollDiseased Grapevines and the Purification and Serology of Associated Closterovirus Like Particles, Phytopathology 77:1427-34 (1987); Hu a spol., „Characterization of Closterovirus-Like Particles Associated with Grapevine Leafroll Disease, J. of Phytopathology 128:1-14 (1990); Ling a spol., „The Coat Protein Gene of Grapevine Leafroll Associated Closterovirus-3: Cloning, Nucleotide Sequencing and Expression in Transgenic Plants, Árch, of Virology 142:1101-16 (1997)). GLRaV-2 bol na základe morfológie a cytopatológie klasifikovaný ako člen rodu Closterovirus (Martelli, Circular of ICTV-Plant Virus Subcommittee Study Group on Closterolike Viruses (1996)), jeho molekulárne a biochemické vlastnosti nie sú dobre charakterizované.
Zo skupiny klosterovírusov bolo nedávno sekvenovaných niekoľko vírusov. Čiastočné alebo úplné genómové sekvencie pre vírus žltnutia repy (Agranovsky a spol., „Nucleotide Sequence of the 3'-Terminál Half of Beet Yellows Closterovirus RNA Genome (Jnique Arrangement of Eight Virus Genes, J. General Virology 72:15-24 (1991); Agranovski a spol., „Beet Yellows Closterovirus: Complete Genome Structure and Identification of a Papain-like Thiol Protease, Virology 198:31124 (1994), zakrpatený vírus žltnutia repy (BYSV) (Karasev a spol., „Organization of the 3'-Terminál Half of Beet Yellow Stunt Virus Genome and Implications for the Evolution of Closteroviruses, Virology 221:199-207 (1996)), vírus citrus tristeza (CTV) (Pappu a spol. „Nucleotide Sequence and Organization of Eight 3'0pen Reading Frames of the Citrus Tristeza Closterovirus Genome, Virology 199:35-46 (1994); Karasev a spol., „Complete Sequence of the Citrus Tristeza Virus RNA Genome, Virology 208:511-20 (1950)), vírus infekčného žltnutia šalátu (LIYV) (Klaassen a spol., „Partial Characterization of the Lettuce Infectious Yellows Virus Genomic RNAs, Identification of the Coat Protein Gene and Comparison of its Amino Acid Sequence With Those of Other Filamentous RNA Plánt Viruses, J. General Virology 75:152533 (1994); Klaassen a spol. „Genome Structure and Phylogene9 tie Analysis of Lettuce Infectious Yellows Vírus, a WhiteflyTransmitted, Bipartite Closterovirus, Virology 208:99-110 (1995)), vírus malej višne (LChV) (Keim a Jelkmann, „Genome Analysis of the 3'-Terminál Part of the Little Cherry Disease Associated dsRNA Reveals a Monopartite Clostero-Like Vírus, Árch. Virology 141:1437-51 (1996); Jelkmann a spol., „Complete Genome Structure and Phylogenetic Analysis of Little Cherry Virus, a Mealybug-Transmissible Closterovirus, J. General Virology 78:2067-71 (1997) a GLRaV-3 (Ling a spol., „Nucleotide Sequence of the 3' Terminál Two-Thirds of the Grapevine Leafroll Associated Virus-3 Genome Reveals a Typical Monopartite Closterovirus, J. Gen. Virology 79(5):12891301 (1998) odhalili niekoľko spoločných znakov klosterovírusov, ako je prítomnosť HSP70 chaperónového proteínu tepelného šoku a duplikátu génu pre povrchový protein (Agranovsky „Principles of Molecular Organization, Expression, and Evolution of Closteroviruses: Over the Barriers, Adv. in Virus Res. 47:119-218 (1996); Dolja a spol. „Molecular Biology and Evolution of Closteroviruses: Sophisticated Build-up of Large RNA Genomes, Annual Rev. Phytopathology 32:261-85 (1994); Boyko a spol., „Coat Protein Gene Duplication in a Filamentous RNA Virus of Plants, Proc. Natl. Äcad. Sci. USA 89:9156-60 (1992)). Charakterizácia organizácie genómu v GLRaV by poskytla molekulárnu informáciu o sérologicky rozdielnych klosterovírusoch, ktoré spôsobujú u viniča podobné symptómy ako zvinutka viniča.
Z viničov bolo izolovaných niekoľko kratších klosterovírusov (veľkosť častice dĺžky 800 nm). Zistilo sa, že jeden z nich, nazývaný vírus A viniča („GVA) je tiež spojený, i keď nedôsledne, s chorobou zvinutky viniča (Agran a spol., „Occurance of Grapevine Virus A (GVA) and Other Closteroviru10 ses in Tunisian Grapevines Affected by Leafroll Disease, Vitis, 29:43-48 (1990), Conti a spol., „Closterovirus Associated with Leafroll and Stem Pitting in Grapevine, Phytopathol. Mediterr., 24:110-113 (1985) a Conti a spol., „A Closterovirus from Stem-pitting-diseased Grapevine, Phytopathology, 70:394-399)). Etiológia GVA nie je v skutočnosti známa; zdá sa však, že je dôsledne spojená s vrásčitosťou dreva sensu lato (Rosciglione a spol., „Maladies de ľenroulement et du bois strié de la vigne: analyse microscopique et sérologique (Leafroll and Stem Pitting of Grapevine: Microscopical and Serological Analysis), Rev. Suisse Vitie Arboric. Hortic., 18:207-211 (1986) („Rosciglione (1986)) a Zimmermann (1990)) . Z viničov napadnutých vrásčitosťou dreva bol izolovaný a charakterizovaný iný klosterovírus (dlhý 800 nm) nazvaný vírus B viniča („GVB) (Boscia a spol., „Properties of a Filamentous Virus Isolated from Grapevines Affected by Corky Bark, Árch, Virol., 130:109-120 (1993) a Namba (1991)).
Ako predpokladá Martelli I, symptómy zvinutky viniča môžu byť indukované viacerými ako jedným vírusom, alebo môžu byť jednoducho všeobecnou fyziologickou odpoveďou rastliny na napadnutie floému vírusmi. V posledných 15 rokoch sa nahromadili dôkazy, ktoré silne podporujú myšlienku, že zvinutka viniča je spôsobená jedným (alebo komplexom) z dlhých klosterovírusov (dĺžka častice 1 400 až 2 200 nm).
Zvinutka viniča je prenášaná kontaminovanými štepmi a koreňovými odnožami. Ukázalo sa však, že podľa pôdnych podmienok je veľa druhov hmyzu z rodu Pseudococus (mealybug) nosičom zvinutky viniča (Engelbrecht a spol., „Transmission of Grapevine Leafroll Disease and Associated Closteroviruses by the Vine Mealybug Planococcus-fieus, Phytophylactica,
22:341-346 (1990), Rosciglione a spol., „Transmission of Grapevine Leafroll Disease and an Associated Closterovirus to Healthy Grapevine by the Mealybug Planococcus ficus, (Abstrakt), Phytoparasitica, 17:63-63, (1989) a Tanne „Evidence for the Transmission by Mealybugs to Healthy Grapevines of a Closter-like Particle Associated with Grapevine Leafroll Disease, Phytoparasitica, 16:288 (1988). V rôznych častiach sveta je prírodné šírenie zvinutky viniča hmyzím nosičom rýchle. Na Novom Zélande pozorovania v troch vinohradoch ukázali, že počet infikovaných viničov sa skoro zdvojnásobil v priebehu jedného roka (Jordán a spol., „Spread of Grapevine Leafroll and its Associated Virus in New Zealand Vineyards, llth Meeting of the International Council for the Study of
Viruses and Virus Diseases of the Grapevine, Montreux, Švajčiarsko, str. 113-114 (1993)). Jeden vinohrad bol na 90 % infikovaný po piatich rokoch od prvého pozorovania GLRa-3. Prevalenia zvinutky viniča vo svete môže vzrásť, nakolko chemická kontrola hmyzu (mealybugs) sa stáva ťažšou v dôsledku nedostupnosti účinných insekticídov.
Z pohľadu vážneho rizika postihnutia vinohradov vírusom zvinutky viniča a absenciou jej účinného liečenia, existuje naďalej potreba prevencie tohoto ochorenia. Tento vynález chce prekonať tento nedostatok v odbore.
Podstata vynálezu
Tento vynález sa týka izolovaného proteínu alebo polypeptidu, ktorý sa zhoduje s proteínom alebo polypeptidom vírusu zvinutky viniča (typ 2) . Sú tiež uvedené kódujúce molekuly RNA a DNA, buď v izolovanej forme alebo inkorporované do expresného systému, hostiteľskej bunky, transgénneho štepu, koreňovej odnože kultivaru Vitis alebo citrus, alebo transgénnej rastliny Nicotiana alebo rastliny repy.
Iné hľadisko tohoto vynálezu sa týka spôsobu prenosu rezistencie voči vírusu zvinutky viniča (typ 2) do štepu alebo koreňových odnoží kultivarov Zifcis, alebo rastlín Nicotiana ich transformáciou pomocou molekuly DNA, ktorá kóduje protein alebo polypeptid zhodný s proteínom alebo polypeptidom vírusu zvinutky viniča (typ 2) . Iné hľadiská tohoto vynálezu sa týkajú spôsobu prenosu rezistencie voči vírusu žltnutia repy do rastlín repy a spôsob prenosu rezistencie voči tristeza vírusu do štepu alebo koreňových odnoží kultivarov citrusu, transformáciou rastlín alebo kultivarov pomocou molekuly DNA, ktorá kóduje protein alebo polypeptid zhodný s proteínom alebo polypeptidom vírusu zvinutky viniča (typ 2).
Tento vynález sa tiež týka protilátky alebo jej väzobnej časti alebo sondy, ktorá rozpoznáva protein alebo polypeptid.
Transgénne obmeny bežných obchodných kultivarov viniča a koreňov viniča, ktoré sú rezistentné voči vírusu zvinutky viniča, umožňujú viac kompletnú kontrolu vírusu pri zachovaní znakov odrôd špecifických kultivarov. Okrem toho tieto obmeny umožňujú kontrolu GLRaV-2 prenášaného buď kontaminovanými štepmi alebo koreňovými odnožami alebo doteraz necharakterizovaným hmyzím nosičom. Čo sa týka posledného spôsobu prenosu, tento vynález obmedzuje zvýšené používanie pesticídov, ktoré sťažilo chemickú kontrolu hmyzu. Tento vynález je užitočný z hľadiska ochrany životného prostredia a hospodárnosti pestovania viniča a výroby vína.
Popis obrázkov
Obrázky IA a 1B zaznamenávajú porovnanie profilu dvojvláknitej RNA (dsRNA) (Obrázok IA) z GLRaV-2 a Northern analýzou jej hybridizácie (Obrázok 1B). Obrázok IA: dráha M, lambda Hind III DNA marker; a dráha 1, dsRNA vzorka v 1 % agarózovom géli zafarbená etidium bromidom. Obrázok 1B je Nortern hybridizácia dsRNA vysokej molekulovej hmotnosti izolovanej z GLRaV-2 so sondou pripravenou 32P [a-dATP] označeným inzertom cDNA z GLRaV-2 špecifickou cDNA klónu TC1. Dráha 1, dsRNA vysokej molekulovej hmotnosti z GLRaV-2. Dráha 2, celková RNA extrahovaná zo zdravého viniča.
Obrázok 2 zaznamenáva organizáciu genómu v GLRaV-2 a jeho sekvenčnú stratégiu. Rámčeky predstavujú ORF kódované predpokladanými sekvenciami aminokyselín z GLRaV-2, očíslované čiary predstavujú nukleotidové súradnice so začiatkom na 5' zakončení RNA v kilobázach (kb) . Čiary pod GLRaV-2 RNA genómu predstavujú cDNA klóny použité pre stanovenie nukleotidových sekvencii.
Obrázok 3A až 3D zaznamenáva porovnanie medzi ORFla/ORFlb z GLRaV-2 a BYV. Obrázok 3A až 3D ukazuje konzervatívne domény dvoch proteáz podobných papaínu (P-PRO), metyltransferázu (MT/MTR), helikázu (HEL) a RNA-závislú RNA polymerázu (RdRP). Výkričníky vyznačujú predpokladané katalytické zvyšky proteáz podobných papaínu; čiary naznačujú predpokladané miesta štiepenia. Konzervatívne motívy MT, HEL a RdRP domén sú zvýraznené čiarami nad ktorými sú príslušné písmená. Usporiadanie bolo vypracované pomocou programu MegAlign v DNASTAR.
Obrázky 4A a 4B zaznamenávajú zloženie nukleotidov (Obrázok 4A) a predpokladanú sekvenciu aminokyselín (Obrázok 4B) v ORFla/ORFlb prekrývajúcich sa oblastí v GLRaV-2, BYV, BYST a CTV. Rovnaké nukleotidy a aminokyseliny sú súhlasné. GLRaV2 predpoladané +1 miesto rámcového posunu (TAGC) a jeho príslušné miesta v BYV (TAGC) a BYSV (TAGC) a CTV (CGGC) v nukleotide a sekvenciách aminokyselín sú zvýraznené podčiarknutím.
Obrázok 5 zaznamenáva usporiadanie sekvencie aminokyselín proteínu HSP70 z GLRaV-2 a BYV. Konzervatívne motívy (A až H) sú označené čiarami, nad ktorými sú príslušné písmená. Usporiadanie bolo možné pomocou programu MegAli z DNASTAR.
Obrázok 6A je porovnanie povrchového proteínu (CP) a duplikátu povrchového proteínu (CPd) z GLRaV-2 s inými klosterovírusmi. Aminokyselinová sekvencia CP a CPd z GLRaV-2 je uvedená spolu s CP a CPd z BYV, BYSV a CTV. Konzervatívne zvyšky aminokyselín sú zvýraznené a je vyznačená zhoda. Sekvenčné usporiadanie a fylogenetický strom boli skonštruované pomocou Clustal Method v programe MegAlign z DNASTAR. Obrázok 6B je provizórny fylogenetický strom CP a CPd z GLRaV-2, BYV, BYSV, CTV, LIYV, LChV a GLRaV-3. Pre uľahčenie usporiadania bolo použitých len 250 aminokyselín z C-zakončenia CP a CPd z LIYV, LChV a GLRaV-3. Stupnica pod fylogenetickým stromom predstavuje vzdialenosť medzi sekvenciami. Jednotky znamenajú počet substitúcií.
Obrázok 7 zaznamenáva porovnanie organizácie genómu z GLRaV-2, BYV, BYSV, CTV, LIYV, LChV a GLRaV-3. P-Pro, proteázy podobné papaínu; MT/MTR, metyltransferáza, HEL, helikáza; RdRP, RNA-závislá RNA polymeráza; HSP70, protein tepelného šoku 70; CP, povrchový protein; CPd, duplikát povrchového proteínu.
Obrázok 8 je provizórny fylogenetický strom, ktorý zaznamenáva vzťah medzi RdRP z GLRaV-2 a príslušnými BYV, BYSV, CTV a LIYV. Fylogenetický strom bol skonštruovaný pomocou Clustal metódy programu MagAlign v DNASTAR.
Obrázok 9 zaznamenáva usporiadanie sekvencie aminokyselín HSP90 proteínu z GLRaV-2 vzhľadom k iným klosterovírusom, BYS, BYSV a CTV, Najviac konzervatívne motívy (I až II) sú označené výraznými čiarami a príslušnými písmenami.
Obrázok 10 zaznamenáva usporiadanie sekvencie nukleotidu v 3'koncovej nepreloženej (untranslated) oblasti z GLRaV-2 vzhľadom ku klosterovírusom BYV (Agranovsky a spol., „Beet Yellows Closteroviruses: Complete Genome Structure and Identification of Papain-like Thiol Protease, Virology 198:311-24 (1994), uvedené v citáciách), BYSV (Karasev a spol., „Organization of the 3'-Terminál Half of Beet Yellow Stunt Virus Genome and Implications for the Evolution of Closteroviruses, Virology 221:199-207 (1996), uvedené v citáciách), a CTV (Karasev a spol., „Complete Sequence of the Citrus Tristeza Virus RNA Genome, Virology 208:511-20 (1995) , uvedené v citáciách) . Ukázané sú súhlasné sekvencie a je vyznačená vzdialenosť k 3'-zakončeniu. Komplementárna oblasť schopná tvorby „vlasovej štruktúry je podčiarknutá.
Obrázky 11A a 11B sú genetické mapy transformačných vektorov pGA482GG/EPT8CP-GLRaV-2 a pGA482G/EPT8CP-GLRaV-2. Ako je ukázané na obrázkoch 11A a 11B, expresná kazeta rastliny (EPT8CP-GLRaV-2), ktorá obsahuje 35S-zvýrazňovač dvojitého mozaikového vírusu karfiolu (CaMV), CaMV 35S-promótor, 5' počiatočnú sekvenciu RNA4 alfalfa mozaikového vírusu (ALMV), gén povrchového proteínu z GLRaV-2 (CP-GLRaV-2) a CaMV 35S 3' nepreloženej oblasti ako zakončenie, bola klónovaná do transformačného vektora pomocou EcoR I reštrikčného miesta. CP z GLRaV-2 bol klónovaný do rastlinného expresného vektora pomocou Nco I reštrikčného miesta.
Obrázok 12 je PCR analýza DNA molekúl extrahovaných z listov pokusných transgénnych rastlín použitím špecifických primérov CP génu z GLRaV-2 a NPT II génu. Gély farbené etidium bromidom ukazujú 720 bp amplifikovaný fragment DNA pre NPT II gén a 653 bp fragment DNA pre celú kódujúcu sekvenciu CP génu. Dráha 1, Ol74/Hae III DNA Marker; dráhy 2 až 6, transgénne rastliny z rôznych línií; dráha 7, cp gén z GLRaV2 ako pozitívnej kontroly; dráha 8, NPT II gén ako pozitívna kontrola.
Obrázok 13 zaznamenáva porovnanie rezistentných (tri rastliny vpravo) a citlivých (tri rastliny vľavo) transgénnych rastlín Nicotiana benthamiana. Rastliny sú 48 dní po inokulácii GLRaV-2.
Obrázok 14 je Northern blot analýza transgénnych rastlín Nicotiana benthamiana. Časť z 10 g celkovej RNA extrahovanej z pokusných transgénnych rastlín bola denaturovaná a nanesená na 1 % agarózový gél s obsahom formaldehydu. Rozdelené RNA boli prenesené na Gene Screen Plus membránu a hybridizované 32P-označenou DNA sondou obsahujúcou 3' jednu tretinu génovej sekvencie CP. Dráhy 1, 3 a 4 zaznamenávajú netransformované kontrolné rastliny bez expresie RNA. Zostávajúce dráhy sú pre transgénne rastliny z rôznych línií: dráha 2, 14 až 17 a 22 až 27 sú rastliny s vysokou expresiou RNA, ktoré sú citlivé na GLRaV-2; ostatné pruhy predstavujú rastliny s nedetekovatelnou alebo nízkou expresiou RNA, ktoré sú rezistentné voči GLRaV-2.
Podrobný popis vynálezu
Tento vynález sa týka izolovaných molekúl DNA, ktoré kódujú proteíny alebo polypeptidy vírusu zvinutky viniča (typ 2). Bola sekvenovaná podstatná časť genómu vírusu zvinutky viniča (typ 2) („GLRaV-2). V genóme je vela čítacích rámcov („ORFs) a 3' neprepísaná oblasť („UTR), každá obsahuje molekuly DNA v súhlase s týmto vynálezom. Molekula DNA, ktorá tvorí podstatnú časť genómu GLRaV-2 obsahuje nasledujúcu nukleotidovú sekvenciu zodpovedajúcu SEQ.ID.No 1:
Molekula DNA, ktorá tvorí podstatnú časť genómu GLRaV-2 má nasledujúcu sekvenciu nukleotidov SEQ.ID.No.l:
TAAACATTGC GAGAGAACCC CATTAGCGTC TCCGGGGTGA ACTTGGGAAG GTCTGCCGCC 60
GCTCAGGTTA TTTATTTCGG CAGTTTCACG CAGCCCTTCG CGTTGTATCC GCGCCAAGAG 120
AGCGCGATCG TAAAAACGCA ACTTCCACCG GTCAGTGTAG TGAAGGTGGA GTGCGTAGCT 180
GCGGAGGTAG CTCCCGACAG GGGCGTGGTC GACAAGAAAC CTACGTCTGT TGGCGTTCCC 240
CCGCAGCGCG GTGTGCTTTC TTTTCCGACG GTGGTTCGGA ACCGCGGCGA CGTGATAATC 300
ACAGGGGTGG TGCATGAAGC CCTGAAGAAA ATTAAAGACG GGCTCTTACG CTTCCGCGTA 360
GGCGGTGACA TGCGTTTTTC GAGATTTTTC TCATCGAACT ACGGCTGCAG ATTCGTCGCG 420
AGCGTGCGTA CGAACACTAC AGTTTGGCTA AATTGCACGA AAGCGAGTGG TGAGAAATTC 480
TCACTCGCCG CCGCGTGCAC GGCGGATTAC GTGGCGATGC TGCGTTATGT GTGTGGCGGG 540
AAATTTCCAC TCGTCCTCAT GAGTAGAGTT ATTTACCCGG ATGGGCGCTG TTACTTGGCC 600
CATATGAGGT ATTTGTGCGC CTTTTACTGT CGCCCGTTTA GAGAGTCGGA TTATGCCCTC 660
GGAATGTGGC CTACGGTGGC GCGTCTCAGG GCATGCGTTG AGAAGAACTT CGGTGTCGAA 720
GCTTGTGGCA TAGCTCTTCG TGGCTATTAC ACCTCTCGCA ATGTTTATCA CTGTGATTAT 780
GACTCTGCTT ATGTAAAATA TTTTAGAAAC CTTTCCGGCC GCATTGGCGG TGGTTCGTTC 840
GATCCGACAT CTTTAACCTC CGTAATAACG GTGAAGATTA GCGGTCTTCC AGGTGGTCTT 900
CCTAAAAATA TAGCGTTTGG TGCCTTCCTG TGCGATATAC GTTACGTCGA ACCGGTAGAC 960
TCGGGCGGCA TTCAATCGAG CGTTAAGACG AAACGTGAAG ATGCGCACCG AACCGTAGAG 1020
GAACGGGCGG CCGGCGGATC GGTCGAGCAA CCGCGACAAA AGAGGATAGA TGAGAAAGGT 1080
TGCGGCAGAG TTCCTAGTGG AGGTTTTTCG CATCTCCTGG TCGGCAACCT TAACGAAGTT 1140
AGGAGGAAGG TAGCTGCCGG ACTTCTACGC TTTCGCGTTG GCGGTGATAT GGATTTTCAT 1200
CGCTCGTTCT CCACCCAAGT GGGCCACCGC TTGCTGGTGT GGCGCCGCTC GAGCCGGAGC 1260
GTGTGCCTTG AACTTTACTC ACCATCTAAA AACTTTTTGC GTTACGATGT CTTGCCCTGT 1320
TCTGGAGACT ATGCAGCGAT GTTTTCTTTC GCGGCGGGCG GCCGTTTCCC TTTAGTTTTG 1380
ATGACTAGAA TTAGATACCC GAACGGGTTT TGTTACTTGG CTCACTGCCG GTACGCGTGC 1440
GCGTTTCTCT TAAGGGGTTT TGATCCGAAG CGTTTCGACA TCGGTGCTTT CCCCACCGCG 1500
GCCAAGCTCA GAAACCGTAT GGTTTCGGAG CTTGGTGAAA GAAGTTTAGG TTTGAACTTG 1560
TACGGCGCAT ATACGTCACG CGGCGTCTTT CACTGCGATT ATGACGCTAA GTTTATAAAG 1620
GATTTGCGTC TTATGTCAGC AGTTATAGCT GGAAAGGACG GGGTGGAAGA GGTGGTACCT 1680
TCTGACATAA CTCCTGCCAT GAAGCAGAAA ACGATCGAAG CCGTGTATGA TAGATTATAT 1740
GGCGGCACTG ACTCGTTGCT GAAACTGAGC ATCGAGAAAG ACTTAATCGA TTTCAAAAAT 1800
GACGTGCAGA GTTTGAAGAA AGATCGGCCG ATTGTCAAAG TGCCCTTTTA CATGTCGGAA 1860
GCAACACAGA ATTCGCTGAC GCGTTTCTAC CCTCAGTTCG AACTTAAGTT TTCGCACTCC 1920
TCGCATTCAG ATCATCCCGC CGCCGCCGCT TCTAGACTGC TGGAAAATGA AACGTTAGTG 1980
CGCTTATGTG GTAATAGCGT TTCAGATATT GGAGGTTGTC CTCTTTTCCA TTTGCATTCC 2040
AAGACGCAAA GACGGGTTCA CGTATGTAGG CCTGTGTTGG ATGGCAAGGA TGCGCAGCGT 2100
CGCGTGGTGC GTGATTTGCA GTATTCCAAC GTGCGTTTGG GAGACGATGA TAAAATTTTG 2160
GAAGGGCCAC GCAATATCGA CATTTGCCAC TATCCTCTGG GCGCGTGTGA CCACGAAAGT 2220
AGTGCTATGA TGATGGTGCA GGTGTATGAC GCGTCCCTTT ATGAGATATG TGGCGCCATG 2280
ATCAAGAAGA AAAGCCGCAT AACGTACTTA ACCATGGTCA CGCCCGGCGA GTTTCTTGAG 2340
GGACGCGAAT GCGTCTACAT GGAGTCGTTA GACTGTGAGA TTGAAGTTGA TGTGCACGCG 2400
GACGTCGTAA TGTACAAATT CGGTAGTTCT TGCTATTCGC ACAAGCTTTC AATCATCAAG 2460
GACATCATGA CCACTCCGTA CTTGACACTA GGTGGTTTTC TATTCAGCGT GGAGATGTAT 2520
GAGGTGCGTA TGGGCGTGAA TTACTTCAAG ATTACGAAGT CCGAAGTATC GCCTAGCATT 2580
AGCTGCACCA AGCTCCTGAG ATACCGAAGA GCTAATAGTG ACGTGGTTAA AGTTAAACTT 2640
CCACGTTTCG ATAAGAAACG TCGCATGTGT CTGCCTGGGT ATGACACCAT ATACCTAGAT 2700
TCGAAGTTTG TGAGTCGCGT TTTCGATTAT GTCGTGTGTA ATTGCTCTGC CGTGAACTCA 2760
AAAACTTTCG AGTGGGTGTG GAGTTTCATT AAGTCTAGTA AGTCGAGGGT GATTATTAGC 2820
GGTAAAATAA TTCACAAGGA TGTGAATTTG GACCTCAAGT ACGTCGAGAG TTTCGCCGCG 2880
GTTATGTTGG CCTCTGGCGT GCGCAGTAGA CTAGCGTCCG AGTACCTTGC TAAGAACCTT 2940
AGTCATTTTT CGGGAGATTG CTCCTTTATT GAAGCCACGT CTTTCGTGTT GCGTGAGAAA 3000
ATCAGAAACA TGACTCTGAA TTTTAACGAA AGACTTTTAC AGTTAGTGAA GCGCGTTGCC 3060
TTTGCGACCT TGGACGTGAG TTTTCTAGAT TTAGATTCAA CTCTTGAATC AATAACTGAT 3120
TTTGCCGAGT GTAAGGTAGC GATTGAACTC GACGAGTTGG GTTGCTTGAG AGCGGAGGCC 3180
GAGAATGAAA AAATCAGGAA TCTGGCGGGA GATTCGATTG CGGCTAAACT CGCGAGCGAG 3240
ATAGTGGTCG ATATTGACTC TAAGCCTTCA CCGAAGCAGG TGGGTAATTC GTCATCCGAA 3300
AACGCCGATA AGCGGGAAGT TCAGAGGCCC GGTTTGCGTG GTGGTTCTAG AAACGGGGTT 3360
GTTGGGGAGT TCCTTCACTT CGTCGTGGAT TCTGCCTTGC GTCTTTTCAA ATACGCGACG 3420
GATCAACAAC GGATCAAGTC TTACGTGCGT TTCTTGGACT CGGCGGTCTC ATTCTTGGAT 3480
TACAACTACG ATAATCTATC GTTTATACTG CGAGTGCTTT CGGAAGGTTA TTCGTGTATG 3540
TTCGCGTTTT TGGCGAATCG CGGCGACTTA TCTAGTCGTG TCCGTAGCGC GGTGTGTGCT 3600
GTGAAAGAAG TTGCTACCTC ATGCGCGAAC GCGXGCGTTT CTAAAGCCAA GGTTATGATT 3660
ACCTTCGCAG CGGCCGTGTG TGCTATGATG TTTAATAGCT GCGGTTTTTC AGGCGACGGT 3720
CGGGAGTATA AATCGTATAT ACATCGTTAC ACGCAAGTAT TGTTTGACAC TATCTTTTTT 3780
GAGGACAGCA GTTACCTACC CATAGAAGTT CTGAGTTCGG CGATATGCGG TGCTATCGTC 3840
ACACTTTTCT CCTCGGGCTC CTCCATAAGT TTAAACGCCT TCTTACTTCA AATTACCAAA 3900
GGATTCTCCC TAGAGGTTGT CGTCCGGAAT GTTGTGCGAG TCACGCATGG TTTGAGCACC 3960
ACAGCGACCG ACGGCGTCAT ACGTGGGGTT TTCTCCCAAA TTGTGTCTCA CTTACTTGTT 4020
GGAAATACGG GTAATGTGGC TTACCAGTCA GCTTTCATTG CCGGGGTGGT GCCTCTTTTA 4080
GTTAAAAAGT GTGTGAGCTT AATCTTCATC TTGCGTGAAG ATACTTATTC CGGTTTTATT 4140
AAGCACGGAA TCAGTGAATT CTCTTTCCTT AGTAGTATTC TGAAGTTCTT GAAGGGTAAG 4200
CTTGTGGACG AGTTGAAATC GATTATTCAA GGGGTTTTTG ATTCCAACAA GCACGTGTTT 4260
AAAGAAGCTA CTCAGGAAGC GATTCGTACG ACGGTCATGC AAGTGCCTGT CGCTGTAGTG 4320
GATGCCCTTA AGAGCGCCGC GGGAAAAATT TATAACAATT TTACTAGTCG ACGTACCTTT 4380
GGTAAGGATG AAGGCTCCTC TAGCGACGGC GCATGTGAAG AGTATTTCTC ATGCGACGAA 4440
GGTGAAGGTC CGGGTCTGAA AGGGGGTTCC AGCTATGGCT TCTCAATTTT AGCGTTCTTT 4500
TCACGCATTA TGTGGGGAGC TCGTCGGCTT ATTGTTAAGG TGAAGCATGA GTGTTTTGGG 4560
AAACTTTTTG AATTTCTATC GCTCAAGCTT CACGAATTCA GGACTCGCGT TTTTGGGAAG 4620
AATAGAACGG ACGTGGGAGT TTACGATTTT TTGCCCACGG GCATCGTGGA AACGCTCTCA 4680
TCGATAGAAG AGTGCGACCA AATTGAAGAA CTTCTCGGCG ACGACCTGAA AGGTGACAAG 4740
GATGCTTCGT TGACCGATAT GAATTACTTT GAGTTCTCAG AAGACTTCTT AGCCTCTATC 4800
GAGGAGCCGC CTTTCGCTGG ATTGCGAGGA GGTAGCAAGA ACATCGCGAT TTTGGCGATT 4860
TTGGAATACG CGCATAATTT GTTTCGCATT GTCGCAAGCA ATGGTTCGAA ACGACCTTTA 4920
TTTCTTGCTT TCGCCGAACT CTCAAGCGCC CTTATCGAGA AATTTAAGGA GTTTTTCCCT 4980
CGTAAGAGCC AGCTCGTCGC TATCGTGCGC GAGTATACTC AGAGATTCCT CCGAAGTCGC 5040
ATGCGTGCGT TGGGTTTGAA TAACGAGTTC GTGGTAAAAT CTTTCGCCGA TTTGCTACCC 5100
GCATTAATGA AGCGGAAGGT TTCAGGTTGG TTCTTAGCTA GTGTTTATCG CCCACTTAGA 5160
GGTTTCTCAT ATATGTGTGT TTCAGCGGAG CGACGTGAAA AGTTTTTTGC TCTCGTGTGT 5220
TTAATCGGGT TAAGTCTCCC TTTCTTCGTG CGCATCGTAG GAGCGAAAGC GTGCGAAGAA 5280
CTCGTGTCCT CAGCGCGTCG CTTTTATGAG CGTATTAAAA TTTTTCTAAG GCAGAAGTAT 5340
GTCTCTCTTT CTAATTTCTT TTGTCACTTG TTTAGCTCTG ACGTTGATGA CAGTTCCGCA 5400
TCTGCAGGGT TGAAAGGTGG TGCGTCGCGA ATGACGCTCT TCCACCTTCT GGTTCGCCTT 5460
GCTAGTGCCC TCCTATCGTT AGGGTGGGAA GGGTTAAAGC TACTCTTATC GCACCACAAC 5520
TTGTTATTTT TGTGTTTTGC ATTGGTTGAC GATGTGAACG TCCTTATCAA AGTTCTTGGG 5580
GGTCTTTCTT TCTTTGTGCA ACCAATCTTT TCCTTGTTTG CGGCGATGCT TCTACAACCG 5640
GACAGGTTTG TGGAGTATTC CGAGAAACTT GTTACAGCGT TTGAATTTTT CTTAAAATGT 5700
TCGCCTCGCG CGCCTGCACT ACTCAAAGGG TTTTTTGAGT GCGTGGCGAA CAGCACTGTG 5760
TCAAAAACCG TTCGAAGACT TCTTCGCTGT TTCGGAAGA TGCTCAAACT TCGAAAAGGG 5820
CGAGGGTTGC GTGCGGATGG TAGGGGZCTC CATCGGCAGA AAGCCGTACC CGTCATACCT 5880
TCTAATCGGG TCGTGACCGA CGGGGTTGAA AGACTTTCGG TAAAGATGCA AGGACTTGAA 5940
GCGTTGCGTA CCGAATTGAG AATCTTAGAA GATTTAGATT CTGCCGTGAT CGAAAAACTC 6000
AATAGACGCA GAAATCGTGA CACTAATGAC GACGAATTTA CGCGCCCTGC TCATGAGCAG 6060
ATGCAAGAAG TCACCACTTT CTGTTCGAAA GCCAACTCTG CTGGTTTGGC CCTGGAAAGG 6120
GCAGTGCTTG TGGAAGACGC TATAAAGTCG GAGAAACTTT CTAAGACGGT TAATGAGATG 6180
GTGAGGAAAG GGAGTACCAC GAGCGAAGAA GTGGCCGTCG CTTTGTCGGA CGATGAAGCC 6240
GTGGAAGAAA TCTCTGTTGC TGACGAGCGA GACGATTCGC CTAAGACAGT CAGGATAAGC 6300
GAATACCTAA ATAGGTTAAA GTGAAGCTTC GAATTCCCGA AGCCTATTGT TGTGGACGAC 6360
AACAAGGATA CCGGGGGTCT AACGAACGCC GTGAGGGAGT TTTATTATAT GCAAGAACTT 6420
GCTCTTTTCG AAATCCACAG CAAACTGTGC ACCTACTACG ATCAACTGCG CATAGTCAAC 6480
TTCGATCGTT CCGTAGCACC ATGCAGCGAA GATGCTCAGC TGTACGTACG GAAGAACGGC 6540
TCAACGATAG TGCAGGGTAA AGAGGTACGT TTGCACATTA AGGATTTCCA CGATCACGAT 6600
CACGACAACC TCGCGTTCTT GGCGAGTAAT TTGTTCTTAG CCGGCTACCC CTTTTCAAGG 6660
CACGACAACC TCGCGTTCTT GGCGAGTAAT TTGTTCTTAG CCGGCTACCC CTTTTCAAGG 6720
AGCTTCGTCT TCACGAATTC GTCGGTCGAT ATTCTCCTCT ACGAAGCTCC ACCCGGAGGT 6780
GGTAAGACGA CGACGCTGAT TGACTCGTTC TTGAAGGTCT TCAAGAAAGG TGAGGTTTCC 6840
ACCATGATCT TAACCGCCAA CAAAAGTTCG CAGGTTGAGA TCCTAAAGAA AGTGGAGAAG 6900
GAAGTGTCTA ACATTGAATG CCAGAAACGT AAAGACAAAA GATCTCCGAA AAAGAGCATT 6960
TACACCATCG ACGCTTATTT AATGCATCAC CGTGGTTGTG ATGCAGACGT TCTTTTCATC 7020
GATGAGTGTT TCATGGTTCA TGCGGGTAGC CTACTAGCTT GCATTGAGTT CACGAGGTGT 7080
CATAAAGTAA TGATCTTCGG GGATAGCCGG CAGATTCACT ACATTGAAAG GAACGAATTG 7140
GACAAGTGTT TGTATGGGGA TCTCGACAGG TTCGTGGACC TGCAGTGTCG GGTTTATGGT 7200
AATATTTCGT ACCGTTGTCC ATGGGATGTG TGCGCTTGGT TAAGCACAGT GTATGGCAAC 7260
CTAATCGCCA CCGTGAAGGG TGAAAGCGAA GGTAAGAGCA GCATGCGCAT TAACGAAATT 7320
AATTCAGTCG ACGATTTAGT CCCCGACGTG GGTTCCACGT TTCTGTGTAT GCTTCAGTCG 7380
GAGAAGTTGG AAATCAGCAA GCACTTTATT CGCAAGGGTT TGACTAAACT TAACGTTCTA 7440
ACGGTGCATG AGGCGCAAGG TGAGACGTAT GCGCGTGTGA ACCTTGTGCG ACTTAAGTTT 7500
GAGGAGGATG AACCCTTTAA ATCTATCAGG CACATAACCG TCGCTCTTTC TCGTCACACC 7560
GACAGCTTAA CTTATAACGT CTTAGCTGCT CGTCGAGGTG ACGCCACTTG CGATGCCATC 7620
CAGAAGGCTG CGGAATTGGT GAACAAGTTT CGCGTTTTTC CTACATCTTT TGGTGGTAGT 7680
GTTATCAATC TCAACGTGAA GAAGGACGTG GAAGATAACA GTAGGTGCAA GGTTCGTCG 7740
GCACCATTGA GCGTAATCAA CGACTTTTTG AACGAAGTTA ATCCCGGTAC TGCGGTGATT 7800
GATTTTGGTG ATTTGTCCGC GGACTTCAGT ACTGGGCCTT TTGAGTGCGG TGCCAGCGGT 7860
ATTGTGGTGC GGGACAACAT CTCCTCCAGC AACATCACTG ATCACGATAA GCAGCGTGTT 7920
TAGCGTAGTT CGGTCGCAGG CGATTCCGCG TAGAAAACCT TCTCTACAAG AAAATTTGTA 7980
TTCGTTTGAA GCGCGGAATT ATAACTTCTC GACTTGCGAC CGTAACACAT CTGCTTCAAT 8040
GTTCGGAGAG GCTATGGCGA TGAACTGTCT TCGTCGTTGC TTCGACCTAG ATGCCTTTTC 8100
GTCCCTGCGT GATGATGTGA TTAGTATCAC ACGTTCAGGC ATCGAACAAT GGCTGGAGAA 8160
ACGTACTCCT AGTCAGATTA AAGCATTAAT GAAGGATGTT GAATCGCCTT TGGAAATTGA 8220
CGATGAAATT TGTCGTTTTA AGTTGATGGT GAAGCGTGAC GCTAAGGTGA AGTTAGACTC 8280
TTCTTGTTTA ACTAAACACA GCGCCGCTCA AAATATCATG TTTCATCGCA AGAGCATTAA 8340
TGCTATCTTC TCTCCTATCT TTAATGAGGT GAAAAACCGA ATAATGTGCT GTCTTAAGCC 8400
TAACATAAAG TTTTTTACGG AGATGACTAA CAGGGATTTT GCTTCTGTTG TCAGCAACAT 8460
GCTTGGTGAC GACGATGTGT ACCATATAGG TGAAGTTGAT TTCTCAAAGT ACGACAAGTC 8520
TCAAGATGCT TTCGTGAAGG CTTTTGAAGA AGTAATGTAT AAGGAACTCG GTGTTGATGA 8580
AGAGTTGCTG GCTATCTGGA TGTGCGGCGA GCGGTTATCG ATAGCTAACA CTCTCGATGG 8640
TCAGTTGTCC TTCACGATCG AGAATCAAAG GAAGTCGGGA GCTTCGAACA CTTGGATTGG 8700
TAACTCTCTC GTCACTTTGG GTATTTTAAG TCTTTACTAC GACGTTAGAA ATTTCGAGGC 8760
GTTGTACATC TCGGGCGATC ATTCTTTAAT TTTTTCTCGC AGCGAGATTT CGAATTATGC 8820
CGACGACATA TGCACTGACA TGGGTTTTGA GACAAAATTT ATGTCCCCAA GTGTCCCGTA 8880
CTTTTGTTCT AAATTTGTTG TTATGTGTGG TCATAAGACG TTTTTTGTTC CCGACCCGTA 8940
CAAGCTTTTT GTCAAGTTGG GAGCAGTCAA AGAGGATGTT TCAATGGATT TCCTTTTCGA 9000
GACTTTTACC TCCTTTAAAG ACTTAACCTC CGATTTTAAC GACGAGCGCT TAATTCAAAA 9060
GCTCGCTGAA CTTGTGGCTT TAAAATATGA GGTTCAAACC GGAACACCA CCTTGGCGTT 9120
AAGTGTGATA CATTGTTTGC GTTCGAATTT CCTCTCGTTT AGCAAGTTAT ATCCTCGCGT 9180
GAAGGGATGG CAGGTTTTTT ACACGTCGGT TAAGAAAGCG CTTCTCAAGA GTGGGTGTTC 9240
TCTCTTCGAC AGTTTCATGA CCCCTTTTGG TCAGGCTGTC ATGGTTTGGG ATGATGAGTA 9300
GCGCTAACTT GTGCGCAGTT TCTTTGTTCG TGACATACAC CTTGTGTGTC ACCGTGCGTT 9360
TATAATGAAT CAGGTTTTGC AGTTTGAATG TTTGTTTCTG CTGAATCTCG CGGTTTTTGC 9240
TGTGACTTTC ATTTTCATTC TTCTGGTCTT CCGCGTGATT AAGTCTTTTC GCCAGAAGGG 9480
TCACGAAGCA CCTGTTCCCG TTGTTCGTGG CGGGGGTTTT TCAACCGTAG TGTAGTCAAA 9540
AGACGCGCAT ATGGTAGTTT TCGGTTTGGA CTTTGGCACC ACATTCTCTA CGGTGTGTGT 9600
GTACAAGGAT GGACGAGTTT TTTCATTCAA GCAGAATAAT TCGGCGTACA TCCCCACTTA 9660
CCTCTATCTC TTCTCCGATT CTAACCACAT GACTTTGGT TACGAGGCCG AATCACTGAT 9720
GAGTAATCTG AAAGTTAAAG GTTCGTTTTA TAGAGATTTA AAACGTTGGG TGGGTTGCGA 9780
TTCGAGTAAC CTCGACGCGT ACCTTGACCG TTTAAAACCT CATTACTCGG TCCGCTTGGT 9840
TAAGATCGGC TCTGGCTTGA ACGAAACTGT TTCAATTGGA AACTTCGGGG GCACTGTTAA 9900
GTCTGAGGCT CATCTGCCAG GGTTGATAGC TCTCTTTATT AAGGCTGTCA TTAGTTGCGC 9960
GGAGGGCGCG TTTGCGTGCA CTTGCACCGG GGTTATTTGT TCAGTACCTG CCAATTATGA 10020
TAGCGTTCAA AGGAATTTCA CTGATCAGTG TGTTTCACTC AGCGGTTATC AGTGCGTATA 10080
TATGATCAAT GAACCTTCAG CGGCTGCGCT ATCTGCGTGT AATTCGATTG GAAAGAAGTC 10140
CGCAAATTTG GCTGTTTACG ATTTCGGTGG TGGGACCTTC GACGTGTCTA TCATTTCATA 10200
CCGCAACAAT ACTTTTGTTG TGCGAGCTTC TGGAGGCGAT CTAAATCTCG GTGGAAGGGA 10260
TGTTGATCGT GCGTTTCTCA CGCACCTCTT CTCTTTAACA TCGCTGGAAC CTGACCTCAC 10320
TTTGGATATC TCGAATCTGA AAGAATCTTT ATCAAAAACG GACGCAGAGA TAGTTTACAC 10380
TTTGAGAGGT GTCGATGGAA GAAAAGAAGA CGTTAGAGTA AACAAAAACA TTCTTACGTC 10440
GGTGATGCTC CCCTACGTGA ACAGAACGCT TAAGATATTA GAGTCAACCT TAAAATCGTA 10500
TGCTAAGAGT ATGAATGAGA GTGCGCGAGT TAAGTGCGAT TTAGTGCTGA TAGGAGGATC 10560
TTCATATCTT CCTGGCCTGG CAGACGTACT AACGAAGCAT CAGAGCGTTG ATCGTATCTT 10620
AAGAGTTTCG GATCCTCGGG CTGCCGTGGC CGTCGGTTGC GCATTATATT CTTCATGCCT 10680
CTCAGGATCT GGGGGGTTGC TACTGATCGA CTGTGCAGCT CACACTGTCG CTATAGCGGA 10740
CAGAAGTTGT CATCAAATCA TTTGCGCTCC AGCGGGGGCA CCGATCCCCT TTTCAGGAAG 10800
CATGCCTTTG TACTTAGCCA GGGTCAACAA GAACTCGCAG CGTGAAGTCG CCGTGTTTGA 10860
AGGGGAGTAC GTTAAGTGCC CTAAGAACAG AAAGATCTGT GGAGCAAATA TAAGATTTTT 10920
TGATATAGGA GTGACGGGTG ATTCGTACGC ACCCGTTACC TTCTATATGG ATTTCTCCAT 10980
TTCAAGCGTA GGAGCCGTTT CATTCGTGGT GAGAGGTCCT GAGGGTAAGC AAGTGTCACT 11040
CACTGGAACT CCAGCGTATA ACTTTTCGTC TGTGGCTCTC GGATCACGCA GTGTCCGAGA 11100
ATTGCATATT AGTTTAAATA ATAAAGTTTT TCTCGGTTTG CTTCTACATA GAAAGGCGGA 11160
TCGACGAATA CTTTTCACTA AGGATGAAGC GATTCGATAC GCCGATTCAA TTGATATCGC 11220
GGATGTGCTA AAGGAATATA AAAGTTACGC GGCCAGTGCC TTACCACCAG ACGAGGATGT 11280
CGAATTACTC CTGGGAAAGT CTGTTCAAAA AGTTTTACGG GGAAGCAGAC TGGAAGAAAT 11340
ACCTCTCTAG GAGCATAGCA GCACACTCAA GTGAAATTAA AACTCTACCA GACATTCGAT 11400
TGTACGGCGG TAGGGTTGTA AAGAAGTCCG AATTCGAATC AGCACTTCCT AATTCTTTTG 11460
AACAGGAATT AGGACTGTTC ATACTGAGCG AACGGGAAGT GGGATGGAGC AAATTATGCG 11520
GAATAACGGT GGAAGAAGCA GCATACGATC TTACGAATCC CAAGGCTTAT AAATTCACTG 11580
CCGAGACATG TAGCCCGGAT GTAAAAGGTG AAGGACAAAA ATACTCTATG GAAGACGTGA 11640
TGAATTTCAT GCGTTTATCA AATCTGGATG TTAACGACAA GATGCTGACG GAACAGTGTT 11700
GGTCGCTGTC CAATTCATGC GGTGAATTGA TCAACCCAGA CGACAAAGGG CGATTCGTGG 11760
CTCTCACCTT TAAGGACAGA GACACAGCTG ATGACACGGG TGCCGCCAAC TGTTAATGTC 11820
GCGTGGGCGA CRATCTAGTT TACGCTATGT CCCTGTTTGA GCAGAGGACC CAAAAATCGC 11880
AGTCTGGCAA CATCTCTCTG TACGAAAAGT ACTGTGAATA CATCAGGACC TACTTAGGGA 11940
GTACAGACCT CTTCTTCACA GCGCCGGACA GGATTCCGTT ACTTACGGGC ATCCTATACG 12000
ATTTTTGTAA GGAATACAAC GTTTTCTACT CGTCATATAA GAGAAACGTC GATAATTTCA 12060
GATTCTTCTT GGCGAATTAT ATGCCTTTGA TATCTGACGT CTTTGTCTTC CAGTGGGTAA 12120
AACCCGCGCC GGATGTTCGG CTGCTTTTTG AGTTAAGTGC AGCGGAACTA ACGCTGGAGG 12180
TTCCCACACT GAGTTTGATA GATTCTCAAG TTGTGGTAGG TCATATCTTA AGATACGTAG 12240
AATCCTACAC ATCAGATCCA GCCATCGACG CGTTAGAAGA CAAACTGGAA GCGATACTGA 12300
AAAGTAGCAA TCCCCGTCTA TCGACAGCGC AACTATGGGT TGGTTTCTTT TGTTACTATG 12360
GTGAGTTTCG TACGGCTCAA AGTAGAGTAG TGCAAAGACC AGGCGTATAC AAAACACCTG 12420
ACTCAGTGGG TGGATTTGAA ATAAACATGA AAGATGTTGA GAAATTCTTC GATAAACTTC 12480
AGAGAGAATT GCCTAATGTA TCTTTGCGGC GTCAGTTTAA CGGAGCTAGA GCGCATGAGG 12540
CTTTCAAAAT ATTTAAAAAC GGAAATATAA GTTTCAGACC TATATCGCGT TTAAACGTGC 12600
CTAGAGAGTT CTGGTATCTG AACATAGACT ACTTCAGGCA CGCGAATAGG TCCGGGTTAA 12660
CCGAAGAAGA AATACTCATC CTAAACAACA TAAGCGTTGA TGTTAGGAAG TTATGCGCTG 12720
AGAGAGCGTG CAATACCCTA CCTAGCGCGC AGCGCTTTAG TAAAAATCAT AAGAGTAATA 12780
TACAATCATC ACGCCAAGAG CGGAGGATTA AAGACCCATT GGTAGTCCTG AAAGACACTT 12840
TATATGAGTT CCAACACAAG CGTGCCGGTT GGGGGTCTCG AAGCACTCGA GACCTCGGGA 12900
GTCGTGCTGA CCACGCGAAA GGAAGCGGTT GATAAGTTTT TTAATGAACT AAAAAACGAA 12960
AATTACTCAT CAGTTGACAG CAGCCGATTA AGCGATTCGG AAGTAAAAGA AGTGTTAGAG 13020
AAAAGTAAAG AAAGTTTCAA AAGCGAACTG GCCTCCACTG ACGAGCACTT CGTCTACCAC 13080
ATTATATTTT TCTTAATCCG ATGTGCTAAG ATATCGACAA GTGAAAAGGT GAAGTACGTT 13140
GGTAGTCATA CGTACGTGGT CGACGGAAAA ACGTACACCG TTCTTGACGC TTGGGTATTC 13200
AACATGATGA AAAGTCTCAC GAAGAAGTAC AAACGAGTGA ATGGTCTGCG TGCGTTCTGT 13260
TGCGCGTGCG AAGATCTATA TCTAACCGTC GCACCAATAA TGTCAGAACG CTTTAAGACT 13320
AAAGCCGTAG GGATGAAAGG TTTGCCTGTT GGAAAGGAAT ACTTAGGCGC CGACTTTCTT 13380
TCGGGAACTA GCAAACTGAT GAGCGCTCAC GACAGGGCGG TCTCCATCGT TGCAGCGAAA 13340
AACGCTGTCG ATCGTAGCGC TTTCACGGGT GGGGAGAGAA AGATAGTTAG TTTGTATGAT 13500
CTAGGGAGGT ACTAAGCACG GTGTGCTATA GTGCGTGCTA TAATAATAAA CACTAGTGCT 13560
TAAGTCGCGC AGAAGAAAAC GCTATGGAGT TGATGTCCGA CAGCAACCTT AGCAACCTGG 13620
TGATAACCGA CGCCTCTAGT CTAAATGGTG TCGACAAGAA GCTTTTATCT GCTGAAGTTG 13680
AAAAAATGTT GGTGCAGAAA GGGGCTCCTA ACGAGGGTAT AGAAGTGGTG TTCGGTCTAC 13740
TCCTTTACGC ACTCGCGGCA AGAACCACGT CTCCTAAGGT TCAGCGCGCA GATTCAGACG 13800
TTATATTTTC AAATAGTTTC G GAGAGAG GA ATGTGGTAGT AACAGAGGGT GACCTTAAGA 13860
AGGTACTCGA CGGGTGTGCG CCTCTCACTA GGTTCACTAA TAAACTTAGA ACGTTCGGTC 13920
GTACTTTCAC TGAGGCTTAC GTTGACTTTT GTATCGCGTA TAAGCACAAA TTACCCCAAC 13980
TCAACGCCGC GGCGGAATTG GGGATTCCAG CTGAAGATTC CTACTTAGCT GCAGATTTTC 14040
TGGGTACTTG CCCGAAGCTC TCTGAATTAC AGCAAAGTAG GAAGATGTTC GCGAGTATGT 14100
ACGCTCTAAA AACTGAAGGT GGAGTGGTAA ATACACCAGT GAGCAATCTG CGTCAGCTAG 14160
GTAGAAGGGA AGTTATGTAA TGGAAGATTA CGAAGAAAAA TCCGAATCGC TCATACTGCT 14220
ACGCACGAAT CTGAACACTA TGCTTTTAGT GGTCAAGTCC GATGCTAGTG TAGAGCTGCC 14280
TAAACTACTA ATTTGCGGTT ACTTACGAGT GTCAGGACGT GGGGAGGTGA CGTGTTGCAA 14340
CCGTGAGGAA TTAACAAGAG ATTTTGAGGG CAATCATCAT ACGGTGATCC GTTCTAGAAT 14400
CATACAATAT GACAGCGAGT CTGCTTTTGA GGAATTCAAC AACTCTGATT GCGTAGTGAA 14460
GTTTTTCCTA GAGACTGGTA GTGTCTTTTG GTTTTTCCTT CGAAGTGAAA CCAAAGGTAG 14520
AGCGGTGCGA CATTTGCGCA CCTTCTTCGA AGCTAACAAT TTCTTCTTTG GATCGCATTG 14580
CGGTACCATG GAGTATTGTT TGAAGCAGGT ACTAACTGAA ACTGAATCTA TAATCGATTC 14640
TTTTTGCGAA GAAAGAAATC GTTAAGATGA GGGTTATAGT GTCTCCTTAT GAAGCTGAAG 14700
ACATTCTGAA AAGATCGACT GACATGTTAC GAAACATAGA GAGTGGGGTC TTGAGCACTA 14760
AAGAATGTAT CAAGGCATTC TCGACGATAA CGCGAGACCT ACATTGTGCG AAGGCTTCCT 14820
ACCAGTGGGG TGTTGACACT GGGTTATATC AGCGTAATTG CGCTGAAAAA CGTTTAATTG 14880
ACACGGTGGA GTCAAACATA CGGTTGGCTC AACCTCTCGT GCGTGAAAAA GTGGCGGTTC 14940
ATTTTTGTAA GGATGAACCA AAAGAGCTAG TAGCATTCAT CACGCGAAAG TACGTGGAAC 15000
TCACGGGCGT GGGAGTGAGA GAAGCGGTGA AGAGGGAAAT GCGCTCTCTT ACCAAAACAG 15060
TTTTAAATAA AATGTCTTTG GAAATGGCGT TTTACATGTC ACCACGAGCG TGGAAAAACG 15120
CTGAATGGTT AGAACTAAAA TTTTCACCTG TGAAAATCTT TAGAGATCTG CTATTAGACG 15180
TGGAAACGCT CAACGAATTG TGCGCCGAAG ATGATGTTCA CGTCGACAAA GTAAATGAGA 15240
ATGGGGACGA AAATCACGAC CTCGAACTCC AAGACGAATG TTAAACATTG GTTAAGTTTA 15300
ACGAAAATGA TTAGTAAATA ATAAATCGAA CGTGGGTGTA TCTACCTGAC GTATCAACTT 15360
AAGCTGTTAC TGAGTAATTA AACCAACAAG TGTTGGTGTA ATGTGTATGT TGATGTAGAG 15420
AAAAATCCGT TTGTAGAACG GTGTTTTTCT CTTCTTTATT TTTAAAAAAA AAATAAAAAA 15480
AAAAAAAAAA AAGCGGCCGC 15500
Iná molekula DNA podľa tohoto vynálezu (GLRaV-2 ORFla) obsahuje nukleotidy 4-7923 zo SEQ.ID.No.l a verí sa, že kóduje polypeorvín vírusu závitky viniča s obsahom konzervatívnych znakov domén pre papaínu podobné proteázy, metyltransferázu a helikázu. Táto molekula DNA obsahuje nasledujúcu nukleotidovú sekvenciu, ktorá zodpovedá SEQ.ID.No.2:
ACATTGCGAG AGAACCCCT TAGCGTCTCC GGGGTGAACT TGGGAAGGTC TGCCGCCGCT 60
CAGGTTATTT ATTTCGGCAG TTTCACGCAG CCCTTCGCGT TGTATCCGCG CCAAGAGAGC
120
GCGATCGTAA AAACGCAACT TCCACCGGTC AGTGTAGTA AGGTGGAGTG CGTAGCTGCG 180
GAGGTAGCTC CCGACAGGGG CGTGGTCGAC AAGAAACCTA CGTCTGTTGG CGTTCCCCCG 240
CAGCGCGGTG TGCTTTCTTT TCCGACGGTG GTTCGGAACC GCGGCGACGT GATAATCACA 300
GGGGTGGTGC ATGAAGCCCT GAAGAAAATT AAAGACGGGC TCTTACGCTT CCGCGTAGGC 360
GGTGACATGC GTTTTTCGAG ATTTTTCTCA TCGAACTACG GCTGCAGATT CGTCGCGAGC 420
GTGCGTACGA ACACTACAGT TTGGCTAAAT TGCACGAAAG CGAGTGGTGA GAAATTCTCA 480
CTCGCCGCCG CGTGCACGGC GGATTACGTG GCGATGCTGC GTTATGTGTG TGGCGGGAAA 540
TTTCCACTCG TCCTCATGAG TAGAGTTATT TACCCGGATG GGCGCTGTTA CTTGGCCCAT 600
ARGAGGTATT TGTGCGCCTT TTACTGTCGC CCGTTTAGAG AGTCGGATTA TGCCCTCGGA 660
ATGTGGCCTA CGGTGGCGCG TCTCAGGGCA TGCGTTGAGA AGAACTTCGG TGTCGAAGCT 720
TGTGGCATAG CTCTTCGTGG CTATTACACC TCTCGCAATG TTTATCACTG TGATTATGAC 780
TCTGCTTATG TAAAATATTT TAGAAACCTT TCCGGCCGCA TTGGCGGTGG TTCGTTCGAT 840
CCGACATCTT TAACCTCCGT AATAACGGTG AAGATTAGCG GTCTTCCAGG TGGTCTTCCT 900
AAAAATATAG CGTTTGGTGC CTTCCTGTGC GATATACGTT ACGTCGAACC GGTAGACTCG 960
GGCGGCATTC AATCGAGCGT TAAGACGAAA CGTGAAGATG CGCACCGAAC CGTAGAGGAA 1020
CGGGCGGCCG GCGGATCCGT CGAGCAACCG CGACAAAAGA GGATAGATGA GAAAGGTTGC 1080
GGCAGAGTTC CTAGTGGAGG TTTTTCGCAT CTCCTGGTCG GCAACCTTAA CGAAGTTAGG 1140
AGGAAGGTAG CTGCCGGACT TCTACGCTTT CGCGTTGGCG GTGATATGGA TTTTCATCGC 1200
TCGTTCTCCA CCCAAGCGGG CCACCGCTTG CTGGTGTGGC GCCGCTCGAG CCGGAGCGTG 1260
TGCCTTGAAC TTTACTCACC ATCTAAAAAC TTTTTGCGTT ACGATGTCTT GCCCTGTTCT 1320
GGAGACTATG CAGCGATGTT TTCTTTCGCG GCGGGCGGCC GTTTCCCTTT AGTTTTGATG 1380
ACTAGAATTA GATACCCGAA CGGGTTTTGT TACTTGGCTC ACTGCCGGTA CGCGTGCGCG 1440
TTTCTCTTAA GGGGTTTTGA TCCGAAGCGT TTCGACATCG GTGCTTTCCC CACCGCGGCC 1500
AAGCTCAGAA ACCGTATGGT TTCGGAGCTT GGTGAAAGAA GTTTAGGTTT GAACTTGTAC 1560
GGCGCATATA CGTCACGCGG CGTCTTTCAC TGCGATTATG ACGCTAAGTT TATAAAGGAT 1620
TTGCGTCTTA TGTCAGCAGT TATAGCTGGA AAGGACGGGG TGGAAGAGGT GGTACCTTCT 1680
GACATAACTC CTGCCATGAA GCAGAAAACG ATCGAAGCCG TGTATGATAG ATTATATGGC 1740
GGCACTGACT CGTTGCTGAA ACTGAGCATC GAGAAAGACT TAATCGATTT CAAAAATGAC 1800
GTGCAGAGTT TGAAGAAAGA TCGGCCGATT GTCAAAGTGC CCTTTTACAT GTCGGAAGCA 1860
ACACAGAATT CGCTGACGCG TTTCTACCCT CAGTTCGAAC TTAAGTTTTC GCACTCCTCG 1920
CATTCAGATC ATCCCGCCGC CGCCGCTTCT AGACTGCTGG AAAATGAAAC GTTAGTGCGC 1980
TTATGTGGTA ATAGCGTTTC AGATATTGGA GGTTGTCCTC TTTTCCATTT GCATTCCAAG 2040
ACGCAAAGAC GGGTTCACGT ATGTAGGCCT GTGTTGGATG GCAAGGATGC GCAGCGTCGC 2100
GTGGTGCGTG ATTTGCAGTA TTCCAACGTG CGTTTGGGAG ACGATGATAA aattttggaa 2160
GGGCCACGCA ATATCGACAT TTGCCACTAT CCTCTGGGCG CGTGTGACCA CGAAAGTAGT 2220
GCTATGATGA TGGTGCAGGT GTATGACGCG TCCCTTTATG AGATATGTGG CGCCATGATC 2280
AAGAAGAAAA GCCGCATAAC GTACTTAACC ATGGTCACGC CCGGCGAGTT TCTTGACGGA 2340
CGCGAATGCG TCTACATGGA GTCGTTAGAC TGTGAGATTG AAGTTGATGT GCACGCGGAC 2400
GTCGTAATGT ACAAATTCGG TAGTTCTTGC TATTCGCACA AGCTTTCAAT CATCAAGGAC 2460
ATCATGACCA CTCCGTACTT GACACTAGGT GGTTTTCTAT TCAGCGTGGA GATGTATGAG 2520
GTGCGTATGG GCGTGAATTA CTTCAAGATT ACGAAGTCCG AAGTATCGCC TAGCATTAGC 2580
TGCACCAAGC TCCTGAGATA CCGAAGAGCT AATAGTGACG TGGTTAAAGT TAAACTTCCA 2640
CGTTTCGATA AGAAACGTCG CATGTGTCTG CCTGGGTATG ACACCATATA CCTAGATTCG 2700
AAGTTTGTGA GTCGCGTTTT CGATTATGTC GTGTGTAATT GCTCTGCCGT GAACTCAAAA 2760
ACTTTCGAGT GGGTGTGGAG TTTCATTAAG TCTAGTAAGT CGAGGGTGAT TATTAGCGGT 2820
AAAATAATTC ACAAGGATGT GAATTTGGAC CTCAAGTACG TCGAGAGTTT CGCCGCGGTT 2880
ATGTTGGCCT CTGGCGTGCG CAGTAGACTA GCGTCCGAGT ACCTTGCTAA GAACCTTAGT 2940
CATTTTTCGG GAGATTGCTC CTTTATTGAA GCCACGTCTT TCGTGTTGCG TGAGAAAATC 3000
AGAAACATGA CTCTGAATTT TAACGAAAGA CTTTTACAGT TAGTGAAGCG CGTTGCCTTT 3060
GCGACCTTGG ACGTGAGTTT TCTAGATTTA GATTCAACTC TTGAATCAAT AACTGATTTT 3120
GCCGAGTGTA AGGTAGCGAT TGAACTCGAC GAGTTGGGTT GCTTGAGAGC GGAGGCCGAG 3180
AATGAAAAAA TCAGGAATCT GGCGGGAGAT TCGATTGCGG CTAAACTCGC GAGCGAGATA 3240
GTGGTCGATA TTGACTCTAA GCCTTCACCG AAGCAGGTGG GTAATTCGTC ATCCGAAAAC 3300
GCCGATAAGC GGGAAGTTCA GAGGCCCGGT TTGCGTGGTG GTTCTAGAAA CGGGGTTGTT 3360
GGGGAGTTCC TTCACTTCGT CGTGGATTCT GCCTTGCGTC TTTTCAAATA CGCGACGGAT 3420
CAACAACGGA TCAAGTCTTA CGTGCGTTTC TTGGACTCGG CGGTCTCATT CTTGGATTAC 3480
AACTACGATA ATCTATCGTT TATACTGCGA GTGCTTTCGG AAGGTTATTC GTGTATGTTC 3540
GCGTTTTTGG CGAATCGCGG CGACTTATCT AGTCGTGTCC GTAGCGCGGT GTGTGCTGTG 3600
AAAGAAGTTG CTACCTCATG CGCGAACGCG AGCGTTTCTA AAGCCAAGGT TATGATTACC 3660
TTCGCAGCGG CCGTGTGTGC TATGATGTTT AATAGCTGCG GTTTTTCAGG CGACGGTCGG 3720
GAGTATAAAT CGTATATACA TCGTTACACG CAAGTATTGT TTGACACTAT CTTTTTTGAG 3780
GACAGCAGTT ACCTACCCAT AGAAGTTCTG AGTTCGGCGA TATGCGGTGC TATCGTCACA 3840
CTTTTCTCCT CGGGCTCGTC CATAAGTTTA AACGCCTTCT TACTTCAAAT TACCAAAGGA 3900
TTCTCCCTAG AGGTTGTCGT CCGGAATGTT TGTCGAGTCA CGCATGGTTT GAGCACCACA 3960
GCGACCGACG GCGTCATACG TGGGGTTTTC TCCCAAATTG TGTCTCACTT ACTTGTTGGA 4020
AATACGGGTA ATGTGGCTTA CCAGTCAGCT TTCATTGCCG GGGTGGTGCC TCTTTTAGTT 4080
AAAAAGTGTG TGAGCTTAAT CTTCATCTTG CGTGAAGATA CTTATTCCGG TTTTATTAAT 4140
CACGGAATCA GTGAATTCTC TTTCCTTAGT AGTATTCTGA AGTTCTTGAA GGGTAAGCTT 4200
GTGGACGAGT TGAAATCGAT TATTCAAGGG GTTTTTGATT CCAACAAGCA CGTGTTTAAA 4260
GAAGCTACTC AGGAAGCGAT TCGTACGACG GTCATGCAAG TGCCTGTCGC TGTAGTGGAT 4320
GCCCTTAAGA GCGCCGCGGG AAAAATTTAT AACAATTTTA CTAGTCGACG TACCTTTGGT 4380
AAGGATGAAG GCTCCTCTAG CGACGGCGCA TGTGAAGAGT ATTTCTCATG GGACGAAGGT 4440
GAAGGTCCGG GTGTGAAAGG GGGTTCCAGC TATGGCTTCT CAATTTTAGC gttcttttca 4500
CGCATTATGT GGGGAGCTCG TCGGCTTATT GTTAAGGTGA AGCATGAGTG TTTTGGGAAA 4560
CTTTTTGAAT TTCTATCGCT CAAGCTTCAC GAATTCAGGA CTCGCGTTTT TGGGAAGAAT 4620
AGAACGGACG TGGGAGTTTA CGATTTTTG AAAACGGGCA TCGTGGAAAC GCTCTCATCG 4680
ATAGAAGAGT GCGACCAAAT TGAAGAACTT CTCGGCGACG ACCTGAAAGG TGACAAGGAT 4740
GCTTCGTTGA CCGATATGAA TTACTTTGAG TTCTCAGAAG ACTTCTTAGC ATATATCGAG 4800
GAGCCGCCTT TCGCTGAATT GCGAGGAGGT AGCAAGAACA TCGCGATTTT GGCGATTTTG 4860
GAATACGCGC ATAATTTGTT TCGCATTGTC GCAAGCAAGT GTTCGAAACG ACCTTTATTT 4920
CTTGCTTTCG CCGAACTCTC AAGCGCCCTT ATCGAGAAAT TTAAGGAGGT TTTCCCTCGT 4980
AAGAGCCAGC TCGTCGCTAT CGTGCGCGAG TATACTCAGA GATTCCTCCG AAGTCGCATG 5040
CGTGCGTTGG GTTTGAATAA CGAGTTCGTG GTAAAATCTT TCGCCGATTT GCTACCCGCA 5100
TTAATGAAGC GGAAGGTTTC AGGTTCGTTC TTAGCTAGTG TTTATCGCCC ACTTAGAGGT 5160
TTCTCATATA TGTGTGTTTC AGCGGAGCGA CGTGAAAAGT TTTTTGCTCT CGTGZGTTTA 5220
ATCGGGTTAA GTCTCCCTTT CTTCGTGCGC ATCGTAGGAG CGAAAGCGTG CGAAGAACTC 5280
GTGTCCTCAG CGCGTCGCTT TTATGAGCGT ATTAAAATTT TTCTAAGGCA GAAGTATGTC 5340
TCTCTTTCTA ATTTCTTTTG TCACTTGTTT AGCTCTGACG TTGATGACAG TTCCGCATCT 5400
GCAGGGTTGA AAGGTGGTGC GTCGCGAATG ACGCTCTTCC ACCTTCTGGT TCGCCTTGCT 5460
AGTGCCCTCC TATCGTTAGG GTGGGAAGGG TTAAAGCTAC TCTTATCGCA CCACAACTTG 5520
TTATTTTTGT GTTTTGCATT GGTTGACGAT GTGAACGTCC TTATCAAAGT TCTTGGGGGT 5580
CTTTCTTTCT TTGTGCAACC AATCTTTTCC TTGTTTGCGG CGATGCTTCT ACAACCGGAC 5640
AGGTTTGTGG AGTATTCCGA GAAACTTGTT ACAGCGTTTG AATTTTTCTT AAAATGTTCG 5700
CCTCGCGCGC CTGCACTACT CAAAGGGTTT TTTGAGTGCG TGGCGAACAG CACTGTGTCA 5760
AAAACCGTTC GAAGACTTCT TCGCTGTTTC GTGAAGATGC TCAAACTTCG AAAAGGGCGA 5820
GGGTTGCGTG CGGATGGTAG GGGTCTCCAT CGGCAGAAAG CCGTACCCGT CATACCTTCT 5880
AATCGGGTCG TGACCGACGG GGTTGAAAGA CTTTCGGTAA AGATGCAAGG AGTTGAAGCG 5940
TTGCGTACCG AATTGAGAAT CTTAGAAGAT TTAGATTCTG CCGTGATCGA AAAACTCAAT 6000
AGACGCAGAA ATCGTGACAC TAATGACGAC GAATTTACGC GCCCTGCTCA TGAGCAGATG 6060
CAAGAAGTCA CCACTTTCTG TTCGAAAGCC AACTCTGCTG GTTTGGCCCT GGAAAGGGCA 6120
GTGCTTGTGG AAGACGCTAT AAAGTCGGAG AAACTTTCTA AGACGGTTAA TGAGATGGTG 6180
AGGAAAGGGA GTACCACCAG CGAAGAAGTG GCCGTCGCTT TGTCGGACGA TGAAGCCGTG 6240
GAAGAAATCT CTGTTGCTGA CGAGCGAGAC GATTCGCCTA AGACAGTCAG GATAAGCGAA 6300
TACCTAAATA GGTTAAACTC AAGCTTCGAA TTCCCGAAGC CTATTGTTGT GGACGACAAC 6360
AAGGATACCG GGGGTCTAAC GAACGCCGTG AGGGAGTTTT ATTATATGCA AGAACTTGCT 6240
CTTTTCGAAA TCCACAGCAA ACTGTGCACC TACTACGATC AACTGCGCAT ATGCAACTTC 6480
GATCGTTCCG TAGCACCATG CAGCGAAGAT GCTCAGCTGT ACGTACGGAA GAACGGCTCA 6540
ACGATAGTGC AGGGTAAAGA GGTACGTTTG CACATTAAGG ATTTCCACGA TCACGATTTC 6600
CTGTTTGACG GAAAAATTTC TATTAACAAG CGGCGGCGAG GCGGAAATGT TTTATATCAC 6660
GACAACCTCG CGTTCTTGGC GAGTAATTTG TTCTTAGCCG GCTACCCCTT TTCAAGGAGC 6720
TTCGTCTTCA CGAATTCGTC GGTCGATATT CTCCTCTACG AAGCTCCACC CGGAGGTGGT 6780
AAGACGACGA CGCTGATTGA CTCGTTCTTG AAGGTCTTCA AGAAAGGTGA GGTTTCCACC 6840
ATGATCTTAA CCGCCAACAA AAGTTCGCAG GTTGAGATCC TAAAGAAAGT GGAGAAGGAA 6900
GTGTCTAACA TTGAATGCCA GAAACGTAAA GACAAAAGAT CTCCGAAAAA GAGCATTTAC 6960
ACCATCGACG CTTATTTAAT GCATCACCGT GGTTGTGATG CAGACGTTCT TTTCATCGAT 7020
GAGTGTTTCA TGGTTCATGC GGGTAGCGTA CTAGCTTGCA TTGAGTTCAC GAGGTGTCAT 7080
AAAGTAATGA TCTTCGGGGA TAGCCGGCAG ATTCACTACA TTGAAAGGAA CGAATTGGAC 7140
AAGTGTTTGT ATGGGGATCT CGACAGGTTC GTGGACCTGC AGTGTCGGGT TTATGGTAAT 7200
ATTTCGTACC GTTGTCCATG GGATGTGTGC GCTTGGTTAA GCACAGTGTA TGGCAACCTA 7260
ATCGCCACCG TGAAGGGTGA AAGCGAAGGT AAGAGCAGCA TGCGCATTAA CGAAATTAAT 7320
TCAGTCGACG ATTTAGTCCC CGACGTGGGT TCCACGTTTC TGTGTATGCT TCAGTCGGAG 7380
AAGTTGGAAA TCAGCAAGCA CTTTATTCGC AAGGGTTTGA CTAAACTTAA CGTTCTAACG 7440
GTGCATGAGG CGCAAGGTGA GACGTATGCG CGTGTGAACC TTGTGCGACT TAAGTTTCAG 7500
GAGGATGAAC CCTTTAAATC TATCAGGCAC ATAACCGTCG CTCTTTCTCG TCACACCGAC 7560
AGCTTAACTT ATAACGTCTT AGCTGCTCGT CGAGGTGACG CCACTTGCGA TGCCATCCAG 7620
AAGGCTGCGG AATTGGTGAA CAAGTTTCGC GTTTTTCCTA CATCTTTTGG TGGTAGTGTT 7680
ATCAATCTCA ACGTGAAGAA GGACGTGGAA GATAACAGTA GGTGCAAGGC TTCGTCGGCA 7740
CCATTGAGCG TAATCAACGA CTTTTTGAAC GAAGTTAATC CCGGTACTGC GGTGATTGAT 7800
TTTGGTGATT TGTCCGCGGA CTTCAGTACT GGGCCTTTTG AGTGCGGTGC CAGCGGTATT 7860
GTGGTGCGGG ACAACATCTC CTCCAGCAAC ATCACTGATC ACGATAAGCA GCGTGTTTAG 7920
Velký polyproteín (papaínu podobné proteázy, metyl transferáza a helikáza) majú nasledujúcu sekvenciu aminokyselín SEQ.ID.No.3:
Thr 1 Leu Arg Glu Asn 5 Pro íle Ser Val Ser 10 Gly Val Asn Leu Gly 15 Arg
Ser Ala Ala Ala 20 Gin Val íle Tyr Phe 25 Gly Ser Phe Thr Gin 30 Pro Phe
Ala Leu Tyr 35 Pro Arg Gin Glu Ser 40 Ala íle Val Lys Thr 45 Gin Leu Pro
Pro Val 50 Ser Val Val Lys Val 55 Glu Cys Val Ala Ala 60 Glu Val Ala Pro
Asp 65 Arg Gly Val Val Asp 70 Lys Lys Pro Thr Ser 75 Val Gly Val Pro Pro 80
Gin Arg Gly Val Leu Ser Phe Pro Thr Val Val Arg Asn Arg Gly Asp
85 90 95
Val íle íle Thr Gly Val Val His Glu Ala Leu Lys Lys íle Lys Asp
100 105 110
Gly Leu Leu Arg Phe Arg Val Gly Gly Asp Met Arg Phe Ser Arg Phe
115 120 125
Phe Ser Ser Asn Tyr Gly Cys Arg Phe Val Ala Ser Val Arg Thr Asn
130 135 140
Thr Thr Val Trp Leu Asn Cys Thr Lys Ala Ser Gly Glu Lys Phe Ser
145 150 155 160
Leu Ala Ala Ala Cys Thr Ala Asp Tyr Val Ala Met Leu Arg Tyr Val
165 170 175
Cys Gly Gly Lys Phe Pro Leu Val Leu Met Ser Arg Val íle Tyr Pro
180 185 190
Asp Gly Arg Cys Tyr Leu Ala His Met Arg Tyr Leu Cys Ala Phe Tyr
195 200 205
Cys Arg Pro Phe Arg Glu Ser Asp Tyr Ala Leu Gly Met Trp Pro Thr
210 215 220
Val Ala Arg Leu Arg Ala Cys Val Glu Lys Asn Phe Gly Val Glu Ala
225 230 235 240
Cys Gly íle Ala Leu Arg Gly Tyr Tyr Thr Ser Arg Asn Val Tyr His
245 250 255
Cys Asp Tyr Asp Ser Ala Tyr Val Lys Tyr Phe Arg Asn Leu Ser Gly
260 265 270
Arg íle Gly Gly Gly Ser Phe Asp Pro Thr Ser Leu Thr Ser Val íle
275 280 285
Thr Val Lys íle Ser Gly Leu Pro Gly Gly Leu Pro Lys Asn íle Ala
290 295 300
Phe Gly Ala Phe Leu Cys Asp íle Arg Tyr Val Glu Pro Val Asp Ser
305 310 315 320
Gly Gly íle Gin Ser Ser Val Lys Thr Lys Arg Glu Asp Ala His Arg
325 330 335
Thr Val Glu Glu Arg Ala Ala Gly Gly Ser Val Glu Gin Pro Arg Gin
340 345 350
Lys Arg íle Asp Glu Lys Gly Cys Gly Arg Val Pro Ser Gly Gly Phe
355 360 365
Ser His Leu Leu Val Gly Asn Leu Asn Glu Val Arg Arg Lys Val Ala
370 375 380
Ala Gly Leu Leu Arg Phe Arg Val Gly Gly Asp Met Asp Phe His Arg
385 390 395 400
Ser Phe Ser Thr Gin 405 Ala Gly His Arg Leu 410 Leu Val Trp Arg Arg 415 Ser
Ser Arg Ser Val 420 Cys Leu Glu Leu Tyr 425 Ser Pro Ser Lys Asn 430 Phe Leu
Arg Tyr Asp 435 Val Leu Pro Cys Ser 440 Gly Asp Tyr Ala Ala 445 Met Phe Ser
Phe Ala 450 Ala Gly Gly Arg Phe 455 Pro Leu Val Leu Met 460 Thr Arg íle Arg
Tyr 465 Pro Asn Gly Phe Cys 470 Tyr Leu Ala His Cys 475 Arg Tyr Ala Cys Ala 480
Phe Leu Leu Arg Gly 485 Phe Asp Pro Lys Arg 490 Phe Asp íle Gly Ala 495 Phe
Pro Thr Ala Ala 500 Lys Leu Arg Asn Arg Met 505 Val Ser Glu Leu Gly 510 Glu
Arg Ser Leu Gly Leu Asn Leu Tyr Gly Ala Tyr Thr Ser Arg Gly Val
515 520 525
Phe His 530 Cys Asp Tyr Asp Ala 535 Lys Phe íle Lys Asp 540 Leu Arg Leu Met
Ser 545 Ala Val íle Ala Gly 550 Lys Asp Gly Val Glu 555 Glu Val Val Pro Ser 560
Asp íle Thr Pro Ala 565 Met Lys Gin Lys Thr 570 íle Glu Ala Val Tyr 575 Asp
Arg Leu Tyr Gly 580 Gly Thr Asp Ser Leu 585 Leu Lys Leu Ser íle 590 Glu Lys
Asp Leu íle 595 Asp Phe Lys Asn Asp 600 Val Gin Ser Leu Lys 605 Lys Asp Arg
Pro íle 610 Val Lys Val Pro Phe 615 Tyr Met Ser Glu Ala 620 Thr Gin Asn Ser
Leu 625 Thr Arg Phe Tyr Pro 630 Gin Phe Glu Leu Lys 635 Phe Ser His Ser Ser 640
His Ser Asp His Pro 645 Ala Ala Ala Ala Ser 650 Arg Leu Leu Glu Asn 655 Glu
Thr Leu Val Arg 660 Leu Cys Gly Asn Ser 665 Val Ser Asp íle Gly 670 Gly Cys
Pro Leu Phe 675 His Leu His Ser Lys 680 Thr Gin Arg Arg Val 685 His Val Cys
Arg Pro 690 Val Leu Asp Gly Lys 695 Asp Ala Gin Arg Arg 700 Val Val Arg Asp
Leu 705 Gin Tyr Ser Asn Val 710 Arg Leu Gly Asp Asp Asp 715 Lys íle Leu Glu 720
Gly Pro Arg Asn íle 725 Asp íle Cys His Tyr 730 Pro Leu Gly Ala Cys 735 Asp
His Glu Ser Ser 740 Ala Met Met Met Val 745 Gin Val Tyr Asp Ala 750 Ser Leu
Tyr Glu íle 755 Cys Gly Ala Met íle 760 Lys Lys Lys Ser Arg 765 íle Thr Tyr
Leu Thr 770 Met Val Thr Pro Gly 775 Glu Phe Leu Asp Gly 780 Arg Glu Cys Val
Tyr 785 Met Glu Ser Leu Asp 790 Cys Glu íle Glu Val 795 Asp Val His Ala Asp 800
Val Val Met Tyr Lys 805 Phe Gly Ser Ser Cys 810 Tyr Ser His Lys Leu 815 Ser
íle íle Lys Asp 820 íle Met Thr Thr Pro 825 Tyr Leu Thr Leu Gly 830 Gly Phe
Leu Phe Ser 835 Val Glu Met Tyr Glu 840 Val Arg Met Gly Val 845 Asn Tyr Phe
Lys íle 850 Thr Lys Ser Glu Val 855 Ser Pro Ser íle Ser 860 Cys Thr Lys Leu
Leu 865 Arg Tyr Arg Arg Ala 870 Asn Ser Asp Val Val 875 Lys Val Lys Leu Pro 880
Arg Phe Asp Lys Lys 885 Arg Arg Met Cys Leu 890 Pro Gly Tyr Asp Thr 895 íle
Tyr Leu Asp Ser 900 Lys Phe Val Ser Arg 905 Val Phe Asp Tyr Val 910 Val Cys
Asn Cys Ser 915 Ala Val Asn Ser Lys 920 Thr Phe Glu Trp Val 925 Trp Ser Phe
íle Lys 930 Ser Ser Lys Ser Arg 935 Val íle íle Ser Gly 940 Lys íle íle His
Lys 945 Asp Val Asn Leu Asp 950 Leu Lys Tyr Val Glu 955 Ser Phe Ala Ala Val 960
Met Leu Ala Ser Gly 965 Val Arg Ser Arg Leu 970 Ala Ser Glu Tyr Leu 975 Ala
Lys Asn Leu Ser 980 His Phe Ser Gly Asp 985 Cys Ser Phe íle Glu 990 Ala Thr
Ser Phe Val 995 Leu Arg Glu Lys íle Arg 1000 Asn Met Thr Leu Asn 1005 Phe Asn
Glu Arg Leu Leu Gin Leu Val Lys Arg Val Ala Phe Ala Thr Leu Asp
1010 1015 1020
Val Ser Phe Leu Asp Leu Asp Ser Thr Leu Glu Ser íle Thr Asp Phe 1025 1030 1035 1040
Ala Glu Cys Lys Val Ala 1045 íle Glu Leu Asp Glu 1050 Leu Gly Cys Leu Arg 1055
Ala Glu Ala Glu Asn Glu Lys íle Arg Asn Leu Ala Gly Asp Ser íle
1060 1065 1070
Ala Ala Lys Leu Ala Ser Glu íle Val Val Asp íle Asp Ser Lys Pro
1075 1080 1085
Ser Pro Lys Gin Val Gly Asn Ser Ser Ser Glu Asn Ala Asp Lys Arg
1090 1095 1100
Glu Val Gin Arg Pro Gly Leu Arg Gly Gly Ser Arg Asn Gly Val Val
1105 1110 1115 1120
Gly Glu Phe Leu His Phe Val Val Asp Ser Ala Leu Arg Leu Phe Lys
1125 1130 1135
Tyr Ala Thr Asp Gin Gin Arg íle Lys Ser Tyr Val Arg Phe Leu Asp
1140 1145 1150
Ser Ala Val Ser Phe Leu Asp Tyr Asn Tyr Asp Asn Leu Ser Phe íle
1155 1160 1165
Leu Arg Val Leu Ser Glu Gly Tyr Ser Cys Met Phe Ala Phe Leu Ala
1170 1175 1180
Asn Arg Gly Asp Leu Ser Ser Arg Val Arg Ser Ala Val Cys Ala Val
1185 1190 1195 1200
Lys Glu Val Ala Thr Ser Cys Ala Asn Ala Ser Val Ser Lys Ala Lys
1205 1210 1215
Val Met íle Thr Phe Ala Ala Ala Val Cys Ala Met Met Phe Asn Ser
1220 1225 1230
Cys Gly Phe Ser Gly Asp Gly Arg Glu Tyr Lys Ser Tyr íle His Arg
1235 1240 1245
Tyr Thr Gin Val Leu Phe Asp Thr íle Phe Phe Glu Asp Ser Ser Tyr
1250 1255 1260
Leu Pro íle Glu Val Leu Ser Ser Ala íle Cys Gly Ala íle Val Thr
1265 1270 1275 1280
Leu Phe Ser Ser Gly Ser Ser íle Ser Leu Asn Ala Phe Leu Leu Gin
1285 1290 1295
íle Thr Lys Gly Phe Ser Leu Glu Val Val Val Arg Asn Val Val Arg
1300 1305 1310
Val Thr His Gly Leu Ser Thr Thr Ala Thr Asp Gly Val íle Arg Gly
1315 1320 1325
Val Phe Ser Gin íle Val Ser His Leu Leu Val Gly Asn Thr Gly Asn
1330 1335 1340
Val Ala Tyr Gin Ser Ala Phe íle Ala Gly Val Val Pro Leu Leu Val 1345 1350 1355 1360
Lys Lys Cys Val Ser 1365 Leu íle Phe íle Leu Arg 1370 Glu Asp Thr Tyr 1375 Ser 1
Gly Phe íle Lys His 1380 Gly íle Ser Glu Phe 1385 Ser Phe Leu Ser Ser 1390 íle
Leu Lys Phe Leu Lys 1395 Gly Lys Leu Val Asp 1400 Glu Leu Lys Ser íle 1405 íle
Gin Gly Val Phe Asp 1410 Ser Asn Lys His Val 1415 Phe Lys Glu Ala Thr 1420 Gin
Glu Ala íle Arg Thr Thr Val Met Gin Val Pro Val Ala Val Val Asp
1425 1430 1435 1440
Ala Leu Lys Ser Ala Ala Gly Lys íle Tyr Asn Asn Phe Thr Ser Arg
1445 1450 1455
Arg Thr Phe Gly Lys 1460 Asp Glu Gly Ser Ser 1465 Ser Asp Gly Ala Cys 1470 Glu
Glu Tyr Phe Ser Cys 1475 Asp Glu Gly Glu Gly 1480 Pro Gly Leu Lys Gly 1485 Gly
Ser Ser Tyr Gly Phe 1490 Ser íle Leu Ala Phe 1495 Phe Ser Arg íle Met 1500 Trp
Gly Ala Arg Arg Leu íle Val Lys Val Lys His Glu Cys Phe Gly Lys
1505 1510 1515 1520
Leu Phe Glu Phe Leu Ser Leu Lys Leu His Glu Phe Arg Thr Arg Val
1525 1530 1535
Phe Gly Lys Asn Arg 1540 Thr Asp Val Gly Val 1545 Tyr Asp Phe Leu Pro 1550 Thr
Gly íle Val Glu Thr 1555 Leu Ser Ser íle Glu 1560 Glu Cys Asp Gin íle 1565 Glu
Glu Leu Leu Gly Asp 1570 Asp Leu Lys Gly Asp 1575 Lys Asp Ala Ser Leu 1580 Thr
Asp Met Asn Tyr Phe Glu Phe Ser Glu Asp Phe Leu Ala Ser íle Glu
1585 1590 1595 1600
Glu Pro Pro Phe Ala Gly Leu Arg Gly Gly Ser Lys Asn íle Ala íle
1605 1610 1615
Leu Ala íle Leu Glu 1620 Tyr Ala His Asn Leu 1625 Phe Arg íle Val Ala 1630 Ser
Lys Cys Ser Lys Arg 1635 Pro Leu Phe Leu Ala 1640 Phe Ala Glu Leu Ser 1645 Ser
Ala Leu íle Glu Lys 1650 Phe Lys Glu Val Phe 1655 Pro Arg Lys Ser Gin 1660 Leu
Val Ala íle Val Arg Glu Tyr Thr Gin Arg Phe Leu Arg Ser Arg Met
1665 1670 1675 1680
Arg Ala Leu Gly Leu Asn Asn Glu Phe Val Val 1690 Lys Ser Phe Ala Asp 1695
1685
Leu Leu Pro Ala Leu Met Lys Arg Lys Val Ser Gly Ser Phe Leu Ala
1700 1705 1710
Ser Val Tyr Arg Pro Leu Arg Gly Phe Ser Tyr Met Cys Val Ser Ala
1715 1720 1725
Glu Arg Arg Glu Lys Phe Phe Ala Leu Val Cys Leu íle Gly Leu Ser
1730 1735 1740
Leu Pro Phe Phe Val Arg íle Val Gly Ala Lys Ala Cys Glu Glu Leu
1745 1750 1755 1760
Val Ser Ser Ala Arg Arg Phe Tyr Glu Arg íle Lys íle Phe Leu Arg
1765 1770 1775
Gin Lys Tyr Val Ser Leu Ser Asn Phe Phe Cys His Leu Phe Ser Ser
1780 1785 1790
Asp Val Asp Asp Ser Ser Ala Ser Ala Gly Leu Lys Gly Gly Ala Ser
1795 1800 1805
Arg Met Thr Leu Phe His Leu Leu Val Arg Leu Ala Ser Ala Leu Leu
1810 1815 1820
Ser Leu Gly Trp Glu Gly Leu Lys Leu Leu Leu Ser His His Asn Leu
1825 1830 1835 1840
Leu Phe Leu Cys Phe Ala Leu Val Asp Asp Val Asn Val Leu íle Lys
1845 1850 1855
Val Leu Gly Gly Leu Ser Phe Phe Val Gin Pro íle Phe Ser Leu Phe
1860 1865 1870
Ala Ala Met Leu Leu Gin Pro Asp Arg Phe Val Glu Tyr Ser Glu Lys
1875 1880 1885
Leu Val Thr Ala Phe Glu Phe Phe Leu Lys Cys Ser Pro Arg Ala Pro
1890 1895 1900
Ala Leu Leu Lys Gly Phe Phe Glu Cys Val Ala Asn Ser Thr Val Ser
1905 1910 1915 1920
Lys Thr Val Arg Arg Leu Leu Arg Cys Phe Val Lys Met Leu Lys Leu
1925 1930 1935
Arg Lys Gly Arg Gly Leu Arg Ala Asp Gly Arg Gly Leu His Arg Gin
1940 1945 1950
Lys Ala Val Pro Val íle Pro Ser Asn Arg Val Val Thr Asp Gly Val
1955 1960 1965
Glu Arg Leu Ser Val Lys Met Gin Gly Val Glu Ala Leu Arg Thr Glu
1970 1975 1980
Leu Arg íle Leu Glu Asp Leu Asp Ser Ala Val íle Glu Lys Leu Asn 1985 1990 1995 2000
Arg Arg Arg Asn Arg Asp Thr Asn Asp Asp Glu Phe Thr Arg Pro Ala 2015
2005 2010
His Glu Gin Met Gin Glu Val Thr Thr Phe Cys Ser Lys Ala Asn Ser
2020 2025 2030
Ala Gly Leu Ala Leu Glu Arg Ala Val Leu Val Glu Asp Ala íle Lys
2035 2040 2045
Ser Glu Lys Leu Ser Lys Thr Val Asn Glu Met Val Arg Lys Gly Ser
2050 2055 2060
Thr Thr Ser Glu Glu Val Ala Val Ala Leu Ser Asp Asp Glu Ala Val
2065 2070 2075 2080
Glu Glu íle Ser Val Ala Asp Glu Arg Asp Asp Ser Pro Lys Thr Val
2085 2090 2095
Arg íle Ser Glu Tyr Leu Asn Arg Leu Asn Ser Ser Phe Glu Phe Pro
2100 2105 2110
Lys Pro íle Val Val Asp Asp Asn Lys Asp Thr Gly Gly Leu Thr Asn
2115 2120 2125
Ala Val Arg Glu Phe Tyr Tyr Met Gin Glu Leu Ala Leu Phe Glu íle
2130 2135 2140
His Ser Lys Leu Cys Thr Tyr Tyr Asp Gin Leu Arg íle Val Asn Phe
2145 2150 2155 2160
Asp Arg Ser Val Ala Pro Cys Ser Glu Asp Ala Gin Leu Tyr Val Arg
2165 2170 2175
Lys Asn Gly Ser Thr íle Val Gin Gly Lys Glu Val Arg Leu His íle
2180 2185 2190
Lys Asp Phe His Asp His Asp Phe Leu Phe Asp Gly Lys íle Ser íle
2195 2200 2205
Asn Lys Arg Arg Arg Gly Gly Asn Val Leu Tyr His Asp Asn Leu Ala
2210 2215 2220
Phe Leu Ala Ser Asn Leu Phe Leu Ala Gly Tyr Pro Phe Ser Arg Ser
2225 2230 2235 2240
Phe Val Phe Thr Asn Ser Ser Val Asp íle Leu Leu Tyr Glu Ala Pro
2245 2250 2255
Pro Gly Gly Gly Lys Thr Thr Thr Leu íle Asp Ser Phe Leu Lys Val
2260 2265 2270
Phe Lys Lys Gly Glu Val Ser Thr Met íle Leu Thr Ala Asn Lys Ser
2275 2280 2285
Ser Gin Val Glu íle Leu Lys Lys Val Glu Lys Glu Val Ser Asn íle
2290 2295 2300
Glu Cys Gin Lys Arg Lys Asp Lys Arg Ser Pro Lys Lys Ser íle Tyr
2305 231C ) 2315 2320
Thr íle Asp Ala Tyr Leu 2325 Met His His Arg Gly Cys Asp Ala Asp Val
2330 2335
Leu Phe íle Asp Glu Cys Phe Met Val His Ala Gly Ser Val Leu Ala
2340 2345 2350
Cys íle Glu Phe Thr Arg Cys His Lys Val Met íle Phe Gly Asp Ser
2355 2360 2365
Arg Gin íle His Tyr íle Glu Arg Asn Glu Leu Asp Lys Cys Leu Tyr
2370 2375 2380
Gly Asp Leu Asp Arg Phe Val Asp Leu Gin Cys Arg Val Tyr Gly Asn
2385 2390 2395 2400
íle Ser Tyr Arg Cys Pro Trp Asn Val Cys Ala Trp Leu Ser Thr Val
2405 2410 2415
Tyr Gly Asn Leu íle Ala Thr Val Lys Gly Glu Ser Glu Gly Lys Ser
2420 2425 2430
Ser Met Arg íle Asn Glu íle Asn Ser Val Asp Asp Leu Val Pro Asp
2435 2440 2445
Val Gly Ser Thr Phe Leu Cys Met Leu Gin Ser Glu Lys Leu Glu íle
2450 2455 2460
Ser Lys His Phe íle Arg Lys Gly Leu Thr Lys Leu Asn Val Leu Thr
2465 2470 2475 2480
Val His Glu Ala Gin Gly Glu Thr Tyr Ala Arg Val Asn Leu Val Arg
2485 2490 2495
Leu Lys Phe Gin Glu Asp Glu Pro Phe Lys Ser íle Arg His íle Thr
2500 2505 2510
Val Ala Leu Ser Arg His Thr Asp Ser Leu Thr Tyr Asn Val Leu Ala
2515 2520 2525
Ala Arg Arg Gly Asp Ala Thr Cys Asp Ala íle Gin Lys Ala Ala Glu
2530 2535 2540
Leu Val Asn Lys Phe Arg Val Phe Pro Thr Ser Phe Gly Gly Ser Val
2545 2550 2555 2560
íle Asn Leu Asn Val Lys Lys Asp Val Glu Asp Asn Ser Arg Cys Lys
2565 2570 2575
Ala Ser Ser Ala Pro Leu Ser Val íle Asn Asp Phe Leu Asn Glu Val
2580 2585 2590
Asn Pro Gly Thr Ala Val íle Asp Phe Gly Asp Leu Ser Ala Asp Phe
2595 2600 2605
Ser Thr Gly Pro Phe Glu Cys Gly Ala Ser Gly íle Val Val Arg Asp
2610 2615 2620
Asn íle Ser Ser Ser Asn íle Thr Asp His Asp Lys Gin Arg Val 2625 2630 2635 a má molekulovú hmotnosť od 290 až 300 kDa, výhodne 294 kDa.
Iná takáto molekula DNA (GLRaV-2 OFRlb)obsahuje nukleotidy 7922-9301 v SEQ.ID.No.l a kóduje RNA-závislú RNA polymerázu (RdRP) vírusu RNA zvinutky viniča. Táto molekula DNA obsahuje nasledujúcu sekvenciu nukleotidov,SEQ.ID.No.4:
AGCGTAGTTC
TCGTTTGAAG
TTCGGAGAGG
TCCCTGCGTG
CGTACTCCTA
GATGAAATTT
TCTTGTTTAA
GCTATCTTCT
AACATAAAGT
CTTGGTGACG
CAAGATGCTT
GAGTTGCTGG
CAGTTGTCCT
AACTCTCTCG
TTGTACATCT
GACGACATAT
TTTTGTTCTA
AAGCTTTTTG
ACTTTTACCT
CTCGCTGAAC
AGTGTGATAC
AAGGGATGGC
CTCTTCGACA
GGTCGCAGGC GATTCCGCGT AGAAAACCTT CTCTACAAGA AAATTTGTAT 60
CGCGGAATTA TAACTTCTCG ACTTGCGACC GTAACACATC TGCTTCAATG 120
CTATGGCGAT GAACTGTCTT CGTCGTTGCT TCGACCTAGA TGCCTTTTCG 180
ATGATGTGAT TAGTATCACA CGTTCAGGCA TCGAACAATG GCTGGAGAAA 240
CTCAGATTAA AGCATTAATG AAGGATGTTG AATCGCCTTT GGAAATTGAC 300
GTCGTTTTAA GTTGATGGTG AAGCGTGACG CTAAGGTGAA GTTAGACTCT 360
CTAAACACAG CGCCGCTCAA AATATCATGT TTCATCGCAA GAGCATTAAT 420
CTCCTATCTT TAATGAGGTG AAAAACCGAA TAATGTGCTG TCTTAAGCCT 480
TTTTTACGGA GATGACTAAC AGGGATTTTG CTTCTGTTGT CAGCAACATG 540
ACGATGTGTA CCATATAGGT GAAGTTGATT TCTCAAAGTA CGACAAGTCT 600
TCGTGAAGGC TTTTGAAGAA GTAATGTATA AGGAACTCGG TGTTGATGAA 660
CTATCTGGAT GTGCGGCGAG CGGTTATCGA TAGCTAACAC TCTCGATGGT 720
TCACGATCGA GAATCAAAGG AAGTCGGGAG CTTCGAACAC TTGGATTGGT 780
TCACTTTGGG TATTTTAAGT CTTTACTACG ACGTTAGAAA TTTCGAGGCG 840
CGGGCGATGA TTCTTTAATT TTTTCTCGCA GCGAGATTTC GAATTATGCC 900
GCACTGACAT GGGTTTTGAG ACAAAATTTA TGTCCCCAAG TGTCCCGTAC 960
AATTTGTTGT TATGTGTGGT CATAAGACGT TTTTTGTTCC CGACCCGTAC 1020
TCAAGTTGGG AGCAGTCAAA GAGGATGTTT CAATGGATTT CCTTTTCGAG 1080
CCTTTAAAGA CTTAACCTCC GATTTTAACG ACGAGCGCTT AATTCAAAAG 1140
TTGTGGCTTT AAAATATGAG GTTCAAACCG GCAACACCAC CTTGGCGTTA 1200
ATTGTTTGCG TTCGAATTTC CTCTCGTTTA GCAAGTTATA TCCTCGCGTG 1260
AGGTTTTTTA CACGTCGGTT AAGAAAGCGC TTCTCAAGAG TGGGTGTTCT 1320
GTTTCATGAC CCCTTTTGGT CAGGCTGTCA TGGTTTGGGA TGATGAGTAG 1380
RNA - závislá RNA polymeráza má nasledujúcu sekvenciu ami nokyselín SEQ.ID.No.5:
Ser 1 Val Val Arg Ser 5 Gin Ala íle Pro Arg 10 Arg Lys Pro Ser Leu 15 Gin
Glu Asn Leu Tyr 20 Ser Phe Glu Ala Arg 25 Asn Tyr Asn Phe Ser 30 Thr Cys
Asp Arg Asn 35 Thr Ser Ala Ser Met 40 Phe Gly Glu Ala Met 45 Ala Met Asn
Cys Leu 50 Arg Arg Cys Phe Asp 55 Leu Asp Ala Phe Ser 60 Ser Leu Arg Asp
Asp 65 Val íle Ser íle Thr 70 Arg Ser Gly íle Glu 75 Gin Trp Leu Glu Lys 80
Arg Thr Pro Ser Gin 85 íle Lys Ala Leu Met 90 Lys Asp Val Glu Ser 95 Pro
Leu Glu íle Asp 100 Asp Glu íle Cys Arg 105 Phe Lys Leu Met Val 110 Lys Arg
Asp Ala Lys 115 Val Lys Leu Asp Ser 120 Ser Cys Leu Thr Lys 125 His Ser Ala
Ala Gin 130 Asn íle Met Phe His 135 Arg Lys Ser íle Asn 140 Ala íle Phe Ser
Pro 145 íle Phe Asn Glu Val 150 Lys Asn Arg íle Met 155 Cys Cys Leu Lys Pro 160
Asn íle Lys Phe Phe 165 Thr Glu Met Thr Asn 170 Arg Asp Phe Ala Ser 175 Val
Val Ser Asn Met 180 Leu Gly Asp Asp Asp 185 Val Tyr His íle Gly 190 Glu Val
Asp Phe Ser 195 Lys Tyr Asp Lys Ser 200 Gin Asp Ala Phe Val 205 Lys Ala Phe
Glu Glu 210 Val Met Tyr Lys Glu 215 Leu Gly Val Asp Glu 220 Glu Leu Leu Ala
íle 225 Trp Met Cys Gly Glu 230 Arg Leu Ser íle Ala 235 Asn Thr Leu Asp Gly 240
Gin Leu Ser Phe Thr 245 íle Glu Asn Gin Arg 250 Lys Ser Gly Ala Ser 255 Asn
Thr Trp íle Gly Asn Ser Leu Val Thr Leu Gly íle Leu Ser Leu Tyr
260 265 270
Tyr Asp Val Arg Asn Phe Glu Ala Leu Tyr íle Ser Gly Asp Asp Ser 275 280 285
Leu íle 290 Phe Ser Arg Ser Glu íle 295 Ser Asn Tyr Ala Asp 300 Asp íle Cys
Thr Asp Met Gly Phe Glu Thr Lys Phe Met Ser Pro Ser Val Pro Tyr
305 310 315 320
Phe Cys Ser Lys Phe Val Val Met Cys Gly His Lys Thr Phe Phe Val
325 330 335
Pro Asp Pro Tyr Lys Leu Phe Val Lys Leu Gly Ala Val Lys Glu Asp
340 345 350
Val Ser Met Asp Phe Leu Phe Glu Thr Phe Thr Ser Phe Lys Asp Leu
355 360 365
Thr Ser Asp Phe Asn Asp Glu Arg Leu íle Gin Lys Leu Ala Glu Leu
370 375 380
Val Ala Leu Lys Tyr Glu Val Gin Thr Gly Asn Thr Thr Leu Ala Leu
385 390 395 400
Ser Val íle His Cys Leu Arg Ser Asn Phe Leu Ser Phe Ser Lys Leu
405 410 415
Tyr Pro Arg Val Lys Gly Trp Gin Val Phe Tyr Thr Ser Val Lys Lys
420 425 430
Ala Leu Leu Lys Ser Gly Cys Ser Leu Phe Asp Ser Phe Met Thr Pro
435 440 445
Phe Gly Gin Ala Val Met Val Trp Asp Asp Glu
450 455
a má molekulovú hmotnosť od 50 do 54 kDa, výhodne 52 kDa.
Iná takáto molekula DNA (GLRaV-2 ORF2) obsahuje nukleotidy 9365-9535 v SEQ.ID.No.l a kóduje malý hydrofóbny proteín alebo polypeptid vírusu zvinutky viniča. Táto molekula DNA obsahuje nasledujúcu sekvenciu nukleotidov SEQ.ID.No.6:
ATGAATCAGG TTTTGCAGTT TGAATGTTTG TTTCTGCTGA ATCTCGCGGT TTTTGCTGTG 60
ACTTTCATTT TCATTCTTCT GGTCTTCCGC GTGATTAAGT CTTTTCGCCA GAAGGGTCAC 120
GAAGCACCTG TTCCCGTTGT TCGTGGCGGG GGTTTTTCAA CCGTAGTGTA G 171
Malý hydrofóbny proteín alebo polypeptid má nasledujúcu
sekvenciu aminokyselín SEQ.ID.No.7:
Met Asn Gin Val Leu Gin Phe Glu Cys Leu Phe Leu Leu Asn Leu Ala
1 5 10 15
Val Phe Ala Val Thr Phe íle Phe íle Leu Leu Val Phe Arg Val íle
20 25 30
Lys Ser Phe Arg Gin Lys Gly His Glu Ala Pro Val Pro Val Val Arg 35 40 45
Gly Gly Gly Phe Ser Thr Val Val 50 55 a má molekulovú hmotnosť od 5 do 7 kDa, výhodne 6 kDa.
Iná takáto molekula DNA (GLRaV-2 ORF3) obsahuje nukleotidy 9551-11350 v SEQ.ID.No.l a kóduje proteín tepelného šoku 70 vírusu zvinutky viniča. Táto molekula DNA má nasledujúcu sekvenciu nukleotidov SEQ.ID.No.8:
ATGGTAGTTT
GGACGAGTTT
TTCTCCGATT
AAAGTTAAAG
CTCGACGCGT
TCTGGCTTGA
CATCTGCCAG
TTTGCGTGCA
AGGAATTTCA
GAACCTTCAG
GCTGTTTACG
ACTTTTGTTG
GCGTTTCTCA
TCGAATCTGA
GTCGATGGAA
CCCTACGTGA
ATGAATGAGA
CCTGGCCTGG
GATCCTCGGG
GGGGGGTTGC
CATCAAATCA
TACTTAGCCA
TCGGTTTGGA CTTTGGCACC ACATTCTCTA CGGTGTGTGT GTACAAGGAT 60
TTTCATTCAA GCAGAATAAT TCGGCGTACA TCCCCACTTA CCTCTATCTC 120
CTAACCACAT GACTTTTGGT TACGAGGCCG AATCACTGAT GAGTAATCTG 180
GTTCGTTTTA TAGAGATTTA AAACGTTGGG TGGGTTGCGA TTCGAGTAAC 240
ACCTTGACCG TTTAAAACCT CATTACTCGG TCCGCTTGGT TAAGATCGGC 300
ACGAAACTGT TTCAATTGGA AACTTGGGG GCACTGTTAA GTCTGAGGCT 360
GGTTGATAGC TCTCTTTATT AAGGCTGTCA TTAGTTGCGC GGAGGGCGCG 420
CTTGCACCGG GGTTATTTGT TCAGTACCTG CCAATTATGA TAGCGTTCAA 480
CTGATCAGTG TGTTTCACTC AGCGGTTATC AGTGCGTATA TATGATCAAT 540
CGGCTGCGCT ATCTGCGTGT AATTCGATTG GAAAGAAGTC CGCAAATTTG 600
ATTTCGGTGG TGGGACCTTC GACGTGTCTA TCATTTCATA CCGCAACAAT 660
TGCGAGCTTC TGGAGGCGAT CTAAATCTCG GTGGAAGGGA TGTTGATCGT 720
CGCACCTCTT CTCTTTAACA TCGCTGGAAC CTGACCTCAC TTTGGATATC 780
AAGAATCTTT ATCAAAAACG GACGCAGAGA TAGTTTACAC TTTGAGAGGT 840
GAAAAGAAGA CGTTAGAGTA AACAAAAACA TTCTTACGTC GGTGATGCTC 900
ACAGAACGCT TAAGATATTA GAGTCAACCT TAAAATCGTA TGCTAAGAGT 960
GTGCGCGAGT TAAGTGCGAT TTAGTGCTGA TAGGAGGATC TTCATATCTT 1020
CAGACGTACT AACGAAGCAT GAGAGCGTTG ATCGTATCTT AAGAGTTTCG 1080
CTGCCGTGGC CGTCGGTTGC GCATTATATT CTTCATGCCT CTCAGGATCT 1140
TACTGATCGA CTGTGCAGCT CACACTGTCG CTATAGCGGA CAGAAGTTGT 1200
TTTGCGCTCC AGCGGGGGCA CCGATCCCCT TTTCAGGAAG CATGCCTTTG 1260
GGGTCAACAA GAACTCGCAG CGTGAAGTCG CCGTGTTTGA AGGGGAGTAC 1320
GTTAAGTGCC CTAAGAACAG AAAGATCTGT GGAGCAAATA TAAGATTTTT TGATATAGGA 1380
GTGACGGGTG ATTCGTACGC ACCCGTTACC TTCTATATGG ATTTCTCCAT TTCAAGCGTA 1440
GGAGCCGTTT CATTCGTGGT GAGAGGTCCT GAGGGTAAGC AAGTGTCACT CACTGGAACT 1500
CCAGCGTATA ACTTTTCGTC TGTGGCTCTC GGATCACGCA GTGTCCGAGA ATTGCATATT 1560
AGTTTAAATA ATAAAGTTTT TCTCGGTTTG CTTCTACATA GAAAGGCGGA TCGACGAATA 1620
CTTTTCACTA AGGATGAAGC GATTCGATAC GCCGATTCAA TTGATATCGC GGATGTGCTA 1680
AAGGAATATA AAAGTTACGC GGCCAGTGCC TTACCACCAG ACGAGGATGT CGAATTACTC 1740
CTGGGAAAGT CTGTTCAAAA AGTTTTACGG GGAAGCAGAC TGGAAGAAT ACCTCTCTAG 1800
Verí sa, že proteín tepelného šoku 70 má funkciu chaperónového proteínu a má nasledujúcu sekvenciu aminokyselín SEQ.ID.No.9:
Met 1 Val Val Phe Gly 5 Leu Asp Phe Gly Thr 10 Thr Phe Ser Thr Val 15 Cys
Val Tyr Lys Asp 20 Gly Arg Val Phe Ser 25 Phe Lys Gin Asn Asn 30 Ser Ala
Tyr íle Pro 35 Thr Tyr Leu Tyr Leu 40 Phe Ser Asp Ser Asn 45 His Met Thr
Phe Gly 50 Tyr Glu Ala Glu Ser 55 Leu Met Ser Asn Leu 60 Lys Val Lys Gly
Ser 65 Phe Tyr Arg Asp Leu 70 Lys Arg Trp Val Gly 75 Cys Asp Ser Ser Asn 80
Leu Asp Ala Tyr Leu 85 Asp Arg Leu Lys Pro 90 His Tyr Ser Val Arg 95 Leu
Val Lys íle Gly 100 Ser Gly Leu Asn Glu 105 Thr Val Ser íle Gly 110 Asn Phe
Gly Gly Thr Val 115 Lys Ser Glu Ala 120 His Leu Pro Gly Leu 125 íle Ala Leu
Phe íle 130 Lys Ala Val íle Ser 135 Cys Ala Glu Gly Ala 140 Phe Ala Cys Thr
Cys 145 Thr Gly Val íle Cys 150 ser Val Pro Ala Asn 155 Tyr Asp Ser Val Gin 160
Arg Asn Phe Thr Asp 165 Gin Cys Val Ser Leu 170 Ser Gly Tyr Gin Cys 175 Val
Tyr Met íle Asn Glu Pro Ser Ala Ala Ala Leu Ser Ala Cys Asn Ser
180 185 190 íle Gly Lys Lys Ser Ala Asn Leu Ala Val Tyr Asp Phe Gly Gly Gly 195 200 205
Thr Phe 210 Asp Val Ser íle íle 215 Ser Tyr Arg Asn Asn 220 Thr Phe Val Val
Arg 225 Ala Ser Gly Gly Asp 230 Leu Asn Leu Gly Gly 235 Arg Asp Val Asp Arg 240
Ala Phe Leu Thr His 245 Leu Phe Ser Leu Thr 250 Ser Leu Glu Pro Asp 255 Leu
Thr Leu Asp íle 260 Ser Asn Leu Lys Glu 265 Ser Leu Ser Lys Thr 270 Asp Ala
Glu íle Val 275 Tyr Thr Leu Arg Gly 280 Val Asp Gly Arg Lys 285 Glu Asp Val
Arg Val 290 Asn Lys Asn íle Leu 295 Thr Ser Val Met Leu 300 Pro Tyr Val Asn
Arg 305 Thr Leu Lys íle Leu 310 Glu Ser Thr Leu Lys 315 Ser Tyr Ala Lys Ser 320
Met Asn Glu Ser Ala 325 Arg Val Lys Cys Asp 330 Leu Val Leu íle Gly 335 Gly
Ser Ser Tyr Leu 340 Pro Gly Leu Ala Asp 345 Val Leu Thr Lys His 350 Gin Ser
Val Asp Arg 355 íle Leu Arg Val Ser 360 Asp Pro Arg Ala Ala 365 Val Ala Val
Gly Cys Ala Leu Tyr Ser Ser Cys Leu Ser Gly Ser Gly Gly Leu Leu
370 375 380
Leu 385 íle Asp Cys Ala Ala 390 His Thr Val Ala íle 395 Ala Asp Arg Ser Cys 400
His Gin íle íle Cys 405 Ala Pro Ala Gly Ala 410 Pro íle Pro Phe Ser 415 Gly
Ser Met Pro Leu 420 Tyr Leu Ala Arg Val 425 Asn Lys Asn Ser Gin 430 Arg Glu
Val Ala Val 435 Phe Glu Gly Glu Tyr 440 Val Lys Cys Pro Lys 445 Asn Arg Lys
íle Cys 450 Gly Ala Asn íle Arg 455 Phe Phe Asp íle Gly 460 Val Thr Gly Asp
Ser 465 Tyr Ala Pro Val Thr 470 Phe Tyr Met Asp Phe 475 Ser íle Ser Ser Val 480
Gly Ala Val Ser Phe 485 Val Val Arg Gly Pro 490 Glu Gly Lys Gin Val 495 Ser
Leu Thr Gly Thr 500 Pro Ala Tyr Asn Phe 505 Ser Ser Val Ala Leu 510 Gly Ser
Arg Ser Val Arg Glu Leu His íle Ser Leu Asn Asn Lys Val Phe Leu 515 520 525
Gly Leu Leu Leu His Arg Lys Ala Asp Arg Arg íle Leu Phe Thr Lys 530 535 540
Asp Glu Ala íle Arg Tyr Ala Asp Ser íle Asp íle Ala Asp Val Leu
545 550 555 560
Lys Glu Tyr Lys Ser Tyr Ala Ala Ser Ala Leu Pro Pro Asp Glu Asp
565 570 575
Val Glu Leu Leu Leu Gly Lys Ser Val Gin Lys Val Leu Arg Gly Ser 580 585 590 a má molekulovú hmotnosť od 63 do 67 kDa, výhodne 65 kDa.
Iná takáto molekula DNA (GLRaV-2 ORF4) obsahuje nukleotidy 11277-12932 v SEQ.ID.No.l a kóduje predpokladaný proteín tepelného šoku 90 vírusu zvinutky viniča. Táto molekula DNA má nasledujúcu sekvenciu nukleotidov SEQ.ID.No.10:
ATGTCGAATT ACTCCTGGGA AAGTCTGTTC AAAAAGTTTT ACGGGGAAGC AGACTGGAAG 60
AAATACCTCT CTAGGAGCAT AGCAGCACAC TCAAGTGAAA TTAAAACTCT ACCAGACATT 120
CGATTGTACG GCGGTAGGGT TGTAAAGAAG TCCGAATTCG AATCAGCACT TCCTAATTCT 180
TTTGAACAGG AATTAGGACT GTTCATACTG AGCGAACGGG AAGTGGGATG GAGCAAATTA 240
TGCGGAATAA CGGTGGAAGA AGCAGCATAC GATCTTACGA ATCCCAAGGC TTATAAATTC 300
ACTGCCGAGA CATGTAGCCC GGATGTAAAA GGTGAAGGAC AAAAATACTC TATGGAAGAC 360
GTGATGAATT TCATGCGTTT ATCAAATCTG GATGTTAACG ACAAGATGCT GACGGAACAG 420
TGTTGGTCGC TGTCCAATTC ATGCGGTGAA TTGATCAACC CAGACGACAA AGGGCGATTC 480
GTGGCTCTCA CCTTTAAGGA CAGAGACACA GCTGATGACA CGGGTGCCGC CAACGTGGAA 540
TGTCGCGTGG GCGACTATCT AGTTTACGCT ATGTCCCTGT TTGAGCAGAG GACCCAAAAA 600
TCGCAGTCTG GCAACATCTC TCTGTACGAA AAGTACTGTG AATACATCAG GACCTACTTA 660
GGGAGTACAG ACCTGTTCTT CACAGCGCCG GACAGGATTC CGTTACTTAC GGGCATCCTA 720
TACGATTTTT GTAAGGAATA CAACGTTTTC TACTCGTCAT ATAAGAGAAA CGTCGATAAT 780
TTCAGATTCT TCTTGGCGAA TTATATGCCT TTGATATCTG ACGTCTTTGT CTTCCAGTGG 840
GTAAAACCCG CGCCGGATGT TCGGCTGCTT TTTGAGTTAA GTGCAGCGGA ACTAACGCTG 900
GAGGTTCCCA GACTGAGTTT GATAGATTCT CAAGTTGTGG TAGGTCATAT CTTAAGATAC 960
GTAGAATCCT ACACATCAGA TCCAGCCATC GACGCGTTAG AAGACAAACT GGAAGCGATA 1020
CTGAAAAGTA GCAATCCCCG TCTATCGACA GCGCAACTAT GGGTTGGTTT CTTTTGTTAC 1080
TATGGTGAGT TTCGTACGGC TCAAAGTAGA GTAGTGCAAA GACCAGGCGT ATACAAAACA 1140
CCTGACTCAG TGGGTGGATT TGAAATAAAC ATGAAAGATG TTGAGAAATT CTTCGATAAA 1200
CTTCAGAGAG AATTGCCTAA TGTATCTTTG CGGCGTCAGT TTAACGGAGC TAGAGCGCAT 1260
GAGGCTTTCA AAATATTTAA AAACGGAAAT ATAAGTTTCA GACCTATATC GCGTTTAAAC 1320
GTGCCTAGAG AGTTCTGGTA TCTGAACATA GACTACTTCA GGCACGCGAA TAGGTCCGGG 1380
TTAACCGAAG AAGAAATACT CATCCTAAAC AACATAAGCG TTGATGTTAG GAAGTTATGC 1440
GCTGAGAGAG CGTGCAATAC CCTACCTAGC GCGAAGCGCT TTAGTAAAAA TCATAAGAGT 1500
AATATACAAT CATCACGCCA AGAGCGGAGG ATTAAAGACC CATTGGTAGT CCTGAAAGAC 1560
ACTTTATATG AGTTCCAACA CAAGCGTGCC GGTTGGGGGT CTCGAAGCAC TCGAGACCTC 1620
GGGAGTCGTG CTGACCACGC GAAAGGAAGC GGTTGA 1656
Proteín tepelného šoku selín SEQ.ID.No.il:
má nasledujúcu sekvenciu aminoky-
Met 1 Ser Asn Tyr Ser 5 Trp Glu Ser Leu Phe 10 Lys Lys Phe Tyr Gly 15 Glu
Ala Asp Trp Lys 20 Lys Tyr Leu Ser Arg 25 Ser íle Ala Ala His 30 Ser Ser
Glu íle Lys 35 Thr Leu Pro Asp íle 40 Arg Leu Tyr Gly Gly 45 Arg Val Val
Lys Lys 50 Ser Glu Phe Glu Ser 55 Ala Leu Pro Asn Ser 60 Phe Glu Gin Glu
Leu 65 Gly Leu Phe íle Leu 70 Ser Glu Arg Glu Val 75 Gly Trp Ser Lys Leu 80
Cys Gly íle Thr Val 85 Glu Glu Ala Ala Tyr 90 Asp Leu Thr Asn Pro 95 Lys
Ala Tyr Lys Phe 100 Thr Ala Glu Thr Cys 105 Ser Pro Asp Val Lys 110 Gly Glu
Gly Gin Lys 115 Tyr Ser Met Glu Asp 120 Val Met Asn Phe Met 125 Arg Leu Ser
Asn Leu 130 Asp Val Asn Asp Lys 135 Met Leu Thr Glu Gin 140 Cys Trp Ser Leu
Ser 145 Asn Ser Cys Gly Glu 150 Leu íle Asn Pro Asp 155 Asp Lys Gly Arg Phe 160
Val Ala Leu Thr Phe 165 Lys Asp Arg Asp Thr 170 Ala Asp Asp Thr Gly 175 Ala
Ala Asn Val Glu 180 Cys Arg Val Gly Asp 185 Tyr Leu Val Tyr Ala 190 Met Ser
Leu Phe Glu 195 Gin Arg Thr Gin
Tyr Glu 210 Lys Tyr Cys Glu Tyr 215
Leu 225 Phe Phe Thr Ala Pro 230 Asp
Tyr Asp Phe Cys Lys 245 Glu Tyr
Asn Val Asp Asn 260 Phe Arg Phe
Ser Asp Val 275 Phe Val Phe Gin
Leu Leu 290 Phe Glu Leu Ser Ala 295
Leu 305 Ser Leu íle Asp Ser 310 Gin
Val Glu Ser Tyr Thr 325 Ser Asp
Leu Glu Ala íle Leu Lys Ser
340
Leu Trp Val 355 Gly Phe Phe Cys
Ser Arg 370 Val Val Gin Arg Pro 375
Gly 385 Gly Phe Glu íle Asn 390 Met
Leu Gin Arg Glu Leu 405 Pro Asn
Ala Arg Ala His 420 Glu Ala Phe
Phe Arg Pro 435 íle Ser Arg Leu
Asn íle 450 Asp Tyr Phe Arg His 455
Glu 4 65 íle Leu íle Leu Asn 470 Asn
Ala Glu Arg Ala Cys Asn Thr
Lys 200 Ser Gin Ser Gly Asn 205 íle Ser Leu
íle Arg Thr Tyr Leu 220 Gly Ser Thr Asp
Arg íle Pro Leu 235 Leu Thr Gly íle Leu 240
Asn Val Phe 250 Tyr Ser Ser Tyr Lys 255 Arg
Phe Leu 265 Ala Asn Tyr Met Pro 270 Leu íle
Trp 280 Val Lys Pro Ala Pro 285 Asp Val Arg
Ala Glu Leu Thr Leu 300 Glu Val Pro Thr
Val Val Val Gly 315 His íle Leu Arg Tyr 320
Pro Ala íle 330 Asp Ala Leu Glu Asp 335 Lys
Ser Asn 345 Pro Arg Leu Ser Thr 350 Ala Gin
Tyr 360 Tyr Gly Glu Phe Arg 365 Thr Ala Gin
Gly Val Tyr Lys Thr 380 Pro Asp Ser Val
Lys Asp Val Glu 395 Lys Phe Phe Asp Lys 400
Val Ser Leu 410 Arg Arg Gin Phe Asn 415 Gly
Lys íle 425 Phe Lys Asn Gly Asn 430 íle Ser
Asn 440 Val Pro Arg Glu Phe 445 Trp Tyr Leu
Ala Asn Arg Ser Gly 460 Leu Thr Glu Glu
íle Ser Val Asp 475 Val Arg Lys Leu Cys 480
Leu Pro Ser Ala Lys Arg Phe Ser Lys
490 495
Asn His Lys Ser Asn íle Gin Ser Ser Arg Gin Glu Arg Arg íle Lys 500 505 510
485
Asp Pro Leu Val Val Leu Lys Asp Thr Leu Tyr Glu Phe Gin His Lys
515 520 525
Arg Ala Gly trp Gly Ser Arg Ser Thr Arg Asp Leu Gly Ser Arg Ala
530 535 540
Asp His ala Lys Gly Ser Gly
545 550 a má molekulovú hmotnosť od 61 do 65 kDa, výhodne 63 kDa.
Ešte iná takáto molekula DNA podlá tohoto vynálezu (GLRaV-2 ORF5) má nukleotidy 12844-13515 v SEQ.ID.No.l a kóduje divergentný povrchový proteín. Táto molekula DNA má nasledujúcu sekvenciu nukleotidov SEQ.ID.No.12:
ATGAGTTCCA ACACAAGCGT GCCGGTTGGG GGTCTCGAAG CACTCGAGAC CTCGGGAGTC 60
GTGCTGACCA CGCGAAAGGA AGCGGTTGAT AAGTTTTTTA ATGAACTAAA AAACGAAAAT 120
TACTCATCAG TTGACAGCAG CCGATTAAGC GATTCGGAAG TAAAAGAAGT GTTAGAGAAA 180
AGTAAAGAAA GTTTCAAAAG CGAACTGGCC TCCACTGACG AGCACTTCGT CTACCACATT 240
ATATTTTTCT TAATCCGATG TGCTAAGATA TCGACAAGTG AAAAGGTGAA GTACGTTGGT 300
AGTCATACGT ACGTGGTCGA CGGAAAAACG TACACCGTTC TTGACGCTTG GGTATTCAAC 360
ATGATGAAAA GTCTCACGAA GAAGTACAAA CGAGTGAATG GTCTGCGTGC GTTCTGTTGC 420
GCGTGCGAAG ATCTATATCT AACCGTCGCA CCAATAATGT CAGAACGCTT TAAGACTAAA 480
GCCGTAGGGA TGAAAGGTTT GCCTGTTGGA AAGGAATACT TAGGCGCCGA CTTTCTTTCG 540
GGAACTAGCA AACTGATGAG CGATCACGAC AGGGCGGTCT CCATCGTTGC AGCGAAAAAC 600
GCTGTCGATC GTAGCGCTTT CACGGGTGGG GAGAGAAAGA TAGTTAGTTT GTATGATCTA 660
GGGAGGTACT AA 672
Divergentný povrchový proteín má nasledujúcu sekvenciu ami-
nokyselín zodpovedajúcu SEQ.ID.No.13:
Met Ser Ser 1 Asn Thr Ser Val 5 Pro Val Gly Gly Leu Glu Ala Leu Glu 10 15
Thr Ser Gly Val Val Leu Thr 20 Thr Arg Lys Glu Ala Val Asp Lys Phe 25 30
Phe Asn Glu 35 Leu Lys Asn Glu Asn Tyr Ser Ser Val Asp Ser Ser Arg 40 45
Leu Ser Asp 50 Ser Glu Val Lys 55 Glu Val Leu Glu Lys ser Lys Glu Ser 60
Phe Lys 65 Ser Glu Leu Ala Ser Thr Asp Glu His Phe Val Tyr His íle 80
70 75
íle Phe Phe Leu íle Arg Cys Ala Lys íle 85 90 Ser Thr Ser Glu Lys 95 Val
Lys Tyr Val Gly Ser His Thr Tyr Val Val 100 105 Asp Gly Lys Thr Tyr 110 Thr
Val Leu Asp Ala Trp Val Phe Asn Met Met 115 120 Lys Ser Leu Thr Lys 125 Lys
Tyr Lys 130 Arg Val Asn Gly Leu Arg Ala Phe 135 Cys Cys 140 Ala Cys Glu Asp
Leu Tyr 145 Leu Thr Val Ala Pro íle Met Ser 150 Glu 155 Arg Phe Lys Thr Lys 160
Ala Val Gly Met Lys Gly Leu Pro Val Gly 165 170 Lys Glu Tyr Leu Gly 175 Ala
Asp Phe Leu Ser Gly Thr Ser Lys Leu Met 180 185 Ser Asp His Asp Arg 190 Ala
Val Ser íle Val Ala Ala Lys Asn Ala Val 195 200 Asp Arg Ser Ala Phe 205 Thr
Gly Gly 210 Glu Arg Lys íle Val Ser Leu Tyr 215 Asp Leu 220 Gly Arg Tyr
a má molekulovú hmotnosť od 23 do 27 kDa, výhodne 25 kDa
Iná takáto molekula DNA (GLRaV-2 ORF6) obsahuje nukleotidy 13584-14180 v SEQ.ID.No.l a kóduje povrchový proteín vírusu zvinutky viniča. Táto molekula DNA obsahuje nasledujúcu sekvenciu nukleotidov SEQ.ID.No.14:
ATGGAGTTGA TGTCCGACAG CAACCTTAGC AACCTGGTGA TAACCGACGC CTCTAGTCTA 60
AATGGTGTCG ACAAGAAGCT TTTATCTGCT GAAGTTGAAA AAATGTTGGT GCAGAAAGGG 120
ACCACGTCTC CTAAGGTTCA GCGCGCAGAT TCAGACGTTA TATTTTCAAA TAGTTTCGGA 180
ACCACGTCTC CTAAGGTTCA GCGCGCAGAT TCAGACGTTA TATTTTCAAA TAGTTTCGGA 240
GAGAGGAATG TGGTAGTAAC AGAGGGTGAC CTTAAGAAGG TACTCGACGG GTGTGCGCCT 300
CTCACTAGGT TCACTAATAA ACTTAGAACG TTCGGTCGTA CTTTCACTGA GGCTTACGTT 360
GACTTTTGTA TCGCGTATAA GCACAAATTA CCCCAACTCA ACGCCGCGGC GGAATTGGGG 420
ATTCCAGCTG AAGATTCGTA CTTAGCTGCA GATTTTCTGG GTACTTGCCC GAAGCTCTCT 480
GAATTACAGC AAAGTAGGAA GATGTTCGCG AGRATGTACG CTCTAAAAAC TGAAGGTGGA 540
GTGGTAAATA CACCAGTGAG CAATCTGCGT CAGCTAGGTA GAAGGGAAGT TATGTAA
597
Povrchový protein má nasledujúcu sekvenciu aminokyselín SEQ.ID.No.15:
Met 1 Glu Leu Met Ser 5 Asp Ser Asn Leu Ser 10 Asn Leu Val íle Thr 15 Asp
Ala Ser Ser Leu 20 Asn Gly Val Asp Lys 25 Lys Leu Leu Ser Ala 30 Glu Val
Glu Lys Met 35 Leu Val Gin Lys Gly 40 Ala Pro Asn Glu Gly 45 íle Glu Val
Val Phe 50 Gly Leu Leu Leu Tyr 55 Ala Leu Ala Ala Arg 60 Thr Thr Ser Pro
Lys 65 Val Gin Arg Ala Asp 70 Ser Asp Val íle Phe 75 Ser Asn Ser Phe Gly 80
Glu Arg Asn Val Val 85 Val Thr Glu Gly Asp 90 Leu Lys Lys Val Leu 95 Asp
Gly Cys Ala Pro 100 Leu Thr Arg Phe Thr 105 Asn Lys Leu Arg Thr 110 Phe Gly
Arg Thr Phe 115 Thr Glu Ala Tyr Val 120 Asp Phe Cys íle Ala 125 Tyr Lys His
Lys Leu 130 Pro Gin Leu Asn Ala 135 Ala Ala Glu Leu Gly 140 íle Pro Ala Glu
Asp 145 Ser Tyr Leu Ala Ala 150 Asp Phe Leu Gly Thr 155 Cys Pro Lys Leu Ser 160
Glu Leu Gin Gin Ser 165 Arg Lys Met Phe Ala 170 Ser Met Tyr Ala Leu 175 Lys
Thr Glu Gly Gly 180 Val Val Asn Thr Pro 185 Val Ser Asn Leu Arg 190 Gin Leu
Gly Arg Arg Glu Val Met 195 a má molekulovú hmotnosť od 20 až 24 kDa, výhodne 22 kDa.
Iná takáto molekula DNA (GLRaV-2 ORF7) obsahuje nukleotidy 14180-14665 v SEQ.ID.No.l a kóduje druhý protein alebo polypeptid vírusu zvinutky viniča. Táto molekula DNA má nasledujúcu sekvenciu nukleotidov SEQ.ID.No.16:
ATGGAAGATT ACGAAGAAAA ATCCGAATCG CTCATACTGC TACGCACGAA TCTGAACACT 60
ATGCTTTTAG TGGTCAAGTC CGATGCTAGT GTAGAGCTGC CTAAACTACT AATTTGCGGT 120
TACTTACGAG TGTCAGGACG TGGGGAGGTG ACGTGTTGCA ACCGTGAGGA ATTAACAAGA 180
GATTTTGAGG GCAATCATCA TACGGTGATC CGTTCTAGAA TCATACAATA TGACAGCGAG 240
TCTGCTTTTG AGGAATTCAA CAACTCTGAT TGCGTAGTGA AGTTTTTCCT AGAGACTGGT 300
AGTGTCTTTT GGTTTTTCCT TCGAAGTGAA ACCAAAGGTA GAGCGGTGCG ACATTTGCGC 360
ACCTTCTTCG AAGCTAACAA TTTCTTCTTT GGATCGCATT GCGGTACCAT GGAGTATTGT 420
TTGAAGCAGG TACTAACTGA AACTGAATCT ATAATCGATT CTTTTTGCGA AGAAAGAAAT 480
CGTTAA 486
Druhý nedefinovaný proteín alebo polypeptid vírusu zvinutky viniča má predpokladanú nasledujúcu sekvenciu aminokyselín SEQ.ID.No.17:
Met 1 Glu Asp Tyr Glu 5 Glu Lys Ser Glu Ser 10 Leu íle Leu Leu Arg 15 Thr
Asn Leu Asn Thr 20 Met Leu Leu Val Val 25 Lys Ser Asp Ala Ser 30 Val Glu
Leu Pro Lys 35 Leu Leu íle Cys Gly 40 Tyr Leu Arg Val Ser 45 Gly Arg Gly
Glu Val 50 Thr Cys Cys Asn Arg 55 Glu Glu Leu Thr Arg 60 Asp Phe Glu Gly
Asn 65 His His Thr Val íle 70 Arg Ser Arg íle íle 75 Gin Tyr Asp Ser Glu 80
Ser Ala Phe Glu Glu 85 Phe Asn Asn Ser Asp 90 Cys Val Val Lys Phe 95 Phe
Leu Glu Thr Gly 100 Ser Val Phe Trp Phe 105 Phe Leu Arg Ser Glu 110 Thr Lys
Gly Arg Ala 115 Val Arg His Leu Arg 120 Thr Phe Phe Glu Ala 125 Asn Asn Phe
Phe Phe 130 Gly Ser His Cys Gly 135 Thr Met Glu Tyr Cys 140 Leu Lys Gin Val
Leu 145 Thr Glu Thr Glu Ser 150 íle íle Asp Ser Phe 155 Cys Glu Glu Arg Asn 160
Arg a má molekulovú hmotnosť od 17 až 21 kDa, výhodne 19 kDa.
Ešte iná takáto molekula DNA (GLRaV-2 0RF8) obsahuje nukleotidy 14667-15284 v SEQ.ID.No.l a kóduje tretí nedefi52 novaný protein alebo polypeptid vírusu zvinutky viniča. Táto molekula DNA má nasledujúcu sekvenciu nukleotidov SEQ. ID.No.18:
ATGAGGGTTA TAGTGTCTCC TTATGAAGCT GAAGACATTC TGAAAAGATC GACTGACATG 60
TTACGAAACA TAGACAGTGG GGTCTTGAGC ACTAAAGAAT GTATCAAGGC ATTCTCGACG 120
ATAACGCGAG ACCTACATTG TGCGAAGGCT TCCTACCAGT GGGGTGTTGA CACTGGGTTA 180
TATCAGCGTA ATTGCGCTGA AAAACGTTTA ATTGACACGG TGGAGTCAAA CATACGGTTG 240
GCTCAACCTC TCGTGCGTGA AAAAGTGGCG GTTCATTTTT GTAAGGATGA ACCAAAAGAG 300
CTAGTAGCAT TCATCACGCG AAAGTACGTG GAACTCACGG CGTGGGAGT GAGAGAAGCCG 360
GTGAAGAGGG AAATGCGCTC TCTTACCAAA ACAGTTTTAA ATAAAATGTC TTTGGAAATG 420
GCGTTTTCA TGTCACCACG AGCGTGGAAA AACGCTGAAT GGTTAGAACT AAAATTTTCA 480
CCTGTGAAAA TCTTTAGAGA TCTGCTATTA GACGTGGAAA CGCTCAACGA ATTGTGCGCC 540
GAAGATGATG TTCACGTCGA CAAAGTAAAT GAGAATGGGG ACGAAAATCA CGACCTCGAA 600
CTCCAAGACG AATGTTAA 618
Tretí nedefinovaný protein alebo polypeptid má predpokladanú nasledujúcu sekvenciu aminokyselín SEQ.ID.No.19:
Met Arg 1 Val íle Val 5 Ser Pro Tyr Glu Ala Glu Asp íle Leu Lys Arg
10 15
Ser Thr Asp Met Leu Arg Asn íle Asp Ser Gly Val Leu Ser Thr Lys
20 25 30
Glu Cys íle Lys Ala Phe Ser Thr íle Thr Arg Asp Leu His Cys Ala
35 40 45
Lys Ala Ser Tyr Gin Trp Gly Val Asp Thr Gly Leu Tyr Gin Arg Asn
50 55 60
Cys Ala Glu Lys Arg Leu íle Asp Thr Val Glu Ser Asn íle Arg Leu
65 70 75 80
Ala Gin Pro Leu Val Arg Glu Lys Val Ala Val His Phe Cys Lys Asp
85 90 95
Glu Pro Lys Glu Leu Val Ala Phe íle Thr Arg Lys Tyr Val Glu Leu
100 105 110
Thr Gly Val Gly Val Arg Glu Ala Val Lys Arg Glu Met Arg Ser Leu
115 120 125
Thr Lys Thr Val Leu Asn Lys Met Ser Leu Glu Met Ala Phe Tyr Met 130 135 140
Thr Lys Thr Val Leu Asn Lys Met Ser Leu Glu Met Ala Phe Tyr Met
130 135 140
Ser Pro Arg Ala Trp Lys Asn Ala Glu Trp Leu Glu Leu Lys Phe Ser
145 150 155 160
Pro Val Lys íle Phe Arg Asp Leu Leu Leu Asp Val Glu Thr Leu Asn
165 170 175
Glu Leu Cys Ala Glu Asp Asp Val His Val Asp Lys Val Asn Glu Asn
180 185 190
Gly Asp Glu Asn His Asp Leu Glu Leu Gin Asp Glu Cys
195 200 205
a má molekulová hmotnosť od 22 do 26 kDa, výhodne 24 kDA.
Iná molekula DNA podlá tohoto vynálezu (GLRaV-2 3' UTR) obsahuje nukleotidy 15285 až 15500 zo SEQ.ID.No 1 a obsahuje obsahuje nasledovnú sekvenciu zodpovedajúcu SEQ.ID.No. 23:
ACATTGGTTA AGTTTAACGA AAATGATTAG TAAATAATAA ATCGAACGTG GGTGTATCTA 60
CCTGACGTAT CAACTTAAGC TGTTACTGAG TAATTAAACC AACAAGTGTT GGTGTAATGT 120
GTATGTTGAT GTAGAGAAAA ATCCGTTTGT AGAACGGTGT TTTTCTCTTC TTTATTTTTA 180
AAAAAAAAAT AAAAAAAAAA AAAAAAAAGC GGCCGC 216
Tento vynález tiež zahrňuje fragmenty molekúl DNA. Vhodné fragmenty schopné prenosu rezistencie voči zvinutke viniča do rastliny viniča sú vytvorené použitím príslušných reštrikčných miest, zistených pomocou sekvencie molekuly DNA, k: (i) inzertu interpozónu (Felley a spol., „Interposon Mutagenesis of Soil and Water Bacteria: a Family of DNA Fragments Designed for in vitro Insertion Mutagenesis of Gram-negative Bacteria, Gene, 52:147-15 (1987), uvedené v citáciách) tak, že môžu byť vytvorené neúplné formy polypeptidu alebo proteínu vírusu zvinutky viniča, ktorým chýbajú rôzne dlhé úseky na C-zakončení, alebo (ii) môžu byť deletované rôzne vnútorné časti proteínu. Podobne môže byť sekvencia použitá na amplifikáciu ktorejkoľvek časti kódujúcej oblasti tak, že môže byť klonovaná do vektora podporujúceho transkripčné a translačné signály.
Vhodné molekuly DNA sú tie, ktoré hybridizujú s DNA molekulou obsahujúcou nukleotidovú sekvenciu najmenej 15 súvislých báz zo SEQ.ID.No. 1 za prísnych podmienok charakterizovaných hybridizačným pufrom s obsahom 0,9 M citrátu sodného („SSC) pri teplote 37 °C a pretrvávajúcou väzbou po premývaní s SSC pufrom pri 37 °C; a výhodne v hybridizačnom pufri s obsahom 20 % formamidu v 0,9 M soľnom/0,9 M SSC pufri pri teplote 42 °C a pretrvávajúcou väzbou po premývaní 0,2 x SSC pufrom pri teplote 42 °C.
Obmeny môžu byť tiež ľubovoľne modifikované, napríklad, delécia alebo pridanie nukleotidov ktoré majú minimálny vplyv na vlastnosti, sekundárnu štruktúru a hydropatickú povahu kódovaného polypeptidu. Napríklad, nukleotidy kódujúce polypeptid môžu byť konjugované so signálom (alebo počiatočnou) sekvenciou na N-zakončení proteínu, ktorý ko-translančne alebo post-translančne riadi prenos proteínu. Nukleotidová sekvencia môže byť tiež zmenená tak, že kódovaný polypeptid je konjugovaný s linkérom alebo inou sekvenciou pre ulahčenie syntézy, čistenia, alebo identifikáciu polypeptidu.
Proteín alebo polypeptid podľa tohoto vynálezu je výhodne pripravený konvenčnými technikami v čistej forme (výhodne najmenej asi 80 %, výhodnejšie 90 %, čistý). Typicky je proteín alebo polypeptid podľa tohoto vynálezu izolovaný lýzou a sonikáciou. Po premytí je lyzát resuspendovaný v Tris-HCl pufri. Počas dialýzy sa vytvorí z tohoto roztoku proteínov zrazenina. Roztok je centrifugovaný a potom je pelet premytý a resuspendovaný v Tris-HCl pufri. Proteíny sú rozdelené elektroforézou na SDS 12 % polyakrylamidovom géli.
Molekula DNA kódujúca proteín alebo polypeptid vírusu zvinutky viniča (typ 2) podľa tohoto vynálezu môže byť vložená do buniek pomocou konvenčných rekombinančných postupov.
Všeobecne to predstavuje inzerciu molekuly DNA do expresného systému, ku ktorému je molekula DNA heterológna (t.zn. nie je normálne prítomná). Heterológna molekula DNA je vložená do expresného systému alebo vektoru vhodnou orientáciou a správnym čítacím rámcom. Vektor obsahuje potrebné prvky pre transkripciu a transláciu sekvencie inzertu kódujúceho protein.
U.S. Patent č. 4,237,224 Cohena a Boyera, ktorý je uvedený v citáciách, popisuje vytvorenie expresného systému vo forme rekombinantných plazmidov použitím reštrikčného štiepiaceho enzýmu a ligácie pomocou DNA ligázy. Tieto rekombinantné plazmidy sú potom vložené transformáciou a replikované v jednobunkových kultúrach prokaryotických organizmov alebo eukaryotických bunkách, ktoré rastú v kultúrach.
Rekombinanté gény môžu byť vložené tiež do vírusov, ako je vaccinia vírus. Rekombinantné vírusy môžu byť vytvorené transfekciou plazmidov do buniek infikovaných vírusom.
Vhodné vektory sú, ale nie sú vymedzené, nasledovné vírusové vektory ako lambda vektorový systém gtll, gt WES.tB, Charon 4 a plazmidové vektory ako pBR322, pBR325, pACYC177, pACYC184, pUC8, pUC9, pUC18, pUC19, pLG339, pR290, pKC37, pKCIOl, SV 40, pBluescript II SK +/- alebo KS +/- (pozri „Stratagene Cloning Systems Katalóg (1993) zo Stratagene, La Jolla, Calif., uvedené v citáciách), pQE, pIH821, pGEX, pET série (pozri Studier a spol., „Use of T7 RNA Polymerase to Direct Expression of Cloned Genes, Gene Expression Technology zv. 185 (1990), uvedené v citáciách) a akékoľvek ich deriváty. Rekombinantné molekuly môžu byť vložené do buniek transformáciou, transdukciou, konjugáciou, mobilizáciou alebo elektroporáciou. Sekvencie DNA sú klónované do vektora použitím štandardných postupov v odbore, ako je popísané Maniatis om a spol. Molecular Cloning: A Laboratory Manual, Cold Springs Laboratory, Cold Springs Harbor, New York (1982), uvedené v citáciách.
Pre expresiu sekvencie (sekvencii) kódujúcej protein môžu byť použité rôzne systémy hostiel-vektor. Po prvé, vektorový systém musí byť kompatibilný s použitou hostitelskou bunkou. Hostitel-vektorové systémy sú, ale nie sú vymedzené nasledujúcim vymenovaním: baktérie transformované bakteriofágovou DNA, plazmidovou DNA, alebo cosmid DNA; mikroorganizmy ako kvasinky obsahujúce kvasinkové vektory; cicavčie bunkové systémy infikované vírusom (napr. vaccina vírus, adenovírus, atdj ; bunkové systémy hmyzu infikované vírusom (napr. baculovirus) a rastlinné bunky infikované baktériou alebo transformované bombardovaním častíc („biolistic). Expresné prvky týchto vektorov sa líšia svojou silou a špecificitou. V závislosti na použitom systéme hostiel-vektor, môžu byť použité ktorékoľvek z velkého množstva vhodných transkripčných a translačných prvkov.
Rôzne genetické signály úpravy ich spracovania kontrolujú vela stupňov expresie génu (napr. transkripciu DNA a transláciu messenger RNA („mRNA)).
Transkripcia DNA je závislá na prítomnosti promótora, čo je sekvencia DNA, ktorá riadi väzbu RNA polymerázy a tak zahajuje syntézu mRNA. Sekvencie DNA eukaryotických promótorov sa líšia od prokaryotických promótorov. Okrem toho eukaryotické promótory a sprievodné genetické signály nemusia byť rozpoznané, alebo nemusia byť funkčné v prokaryotickom systéme a ďalej prokaryotické promótory nie sú rozpoznané a nie sú funkčné v eukaryotických bunkách.
Podobne translácia mRNA v prokaryontoch závisí na prítomnosti vhodných prokaryotických signálov, ktoré sú rozdielne ako signály eukaryontov. Účinná translácia mRNA v prokaryontoch si vyžaduje sekvenciu pre ribozomálne väzobné miesto, nazývané Shine-Dalgarno („SD) na mRNA. Táto sekvencia je krátka nukleotidová sekvencia na mRNA, ktorá sa nachádza pred štartovacím kodónom, zvyčajne AUG, ktorý kóduje metionín na aminokyselinovom zakončení proteínu. SD sekvencie sú komplementárne k 3'-zakončeniu 16S rRNA (ribozomálna RNA) a pravdepodobne podporujú väzbu mRNA na ribozómy pomocou vytvorenia duplexu s rRNA, čím sa umožní správna poloha ribozómu. Prehlad o spôsoboch maximálnej expresie génu uvádza Roberts a Lauer, Methods in Enzymology, 68:473 (1979), uvedené v citáciách.
Promótory sa líšia svojou „silou (t. zn. schopnosťou podporovať transkripciu). Pre účely expresie klónovaného génu je žiadúce použiť silné promótory, aby sa tak dosiahla vysoká úroveň transkripcie a preto expresia génu. V závislosti na použitom hostiteľskom bunkovom systéme môže byť použitý ktorýkoľvek z veľkého množstva vhodných promótorov. Napríklad, pri klónovaní E. coli, jej bakteriofágov, alebo plazmidov, môžu byť použité promótory ako T7 fágový promótor, lac promótor, trp promótor, recA promótor, ribozomálny RNA promótor, PR a PL promótory kolifágu lambda a iné, vrátane ale nie vymedzené na IacUV5, ompF, bla, lpp a podobne, ktoré riadia vysoký stupeň transkripcie susedných segmentov DNA. K transkripcii inzertovaného génu môže byť tiež použitý hybrid trplacUV5 (tac) promótor, alebo iné promótory E. coli vytvorené rekombinantnou DNA alebo inými postupmi syntézy DNA.
Môžu byť vybrané také kmene bakteriálnych hostitelských buniek a expresné vektory, ktoré inhibujú pôsobenie promótora pokiaľ nie je promótor špecificky indukovaný. Pre účinnú transkripciu inzertovanej DNA je potrebné v niektorých operónoch pridať špecifické inducery. Napríklad, lac operón je indukovaný pridaním laktózy alebo IPTG (izopropyltio-beta-Dgalaktozidu) . Rôzne iné operóny, ako trp, pro, atď. sú pod inou kontrolou.
Pre účinnú transkripciu a transláciu génu v prokaryotických bunkách sú tiež potrebné špecifické iniciačné signály. Tieto transkripčné a translačné iniciačné signály sa môžu líšiť svojou „silou čo sa hodnotí množstvom génovej špecifickej messenger RNA a množstvom syntetizovaného proteínu. DNA expresný vektor, ktorý obsahuje promótor, môže tiež obsahovať akúkoľvek kombináciu rôzne „silných transkripčných a/alebo translačných iniciačných signálov. Napríklad, účinná translácia v E. coli si pre poskytnutie väzobného miesta pre ribozóm vyžaduje Shine-Dalgarno („SD) sekvenciu asi 7 až 9 báz 5' k iniciačnému kodónu („ATG). Takže môže byť použitá akákoľvek kombinácia SD-ATG, taká, ktorá môže byť využitá ribozómami hostiteľskej bunky. Takéto kombinácie sú, ale nie sú vymedzené, SD-ATG kombinácia z cro génu alebo N gén colifágu lambda, alebo z E. coli tryptofán E, D, C, alebo A gény. Okrem toho môže byť použitá akákoľvek SD-ATG kombinácia vytvorená rekombinantnou DNA alebo inými postupmi zahrňujúcimi inkorporáciu syntetických nukleotidov.
Keď boli izolované molekuly DNA kódujúce rôzne proteíny alebo polypeptidy vírusu zvinutky viniča (typ 2) , ako je popísané vyššie, naklónované do expresného systému, sú tieto pripravené na inkorporáciu do hostiteľskej bunky. Takáto inkorporácia sa môže uskutočniť rôznymi formami transformácie uvedenými vyššie, v závislosti na vektor/hostitel bunkovom systéme. Vhodné hostiteľské bunky sú, ale nie sú vymedzené, baktérie, vírusy, kvasnice, cicavčie bunky, hmyz, rastlina a podobne.
Tento vynález sa tiež týka molekúl DNA, ktoré kódujú proteíny alebo polypeptidy vírusu zvinutky viniča (typ 2) popísaných vyššie. Transkripty môžu byť syntetizované použitím hostiteľských buniek podľa tohoto vynálezu ktorýmkoľvek kon59 venčným postupom. Translácia mRNA môže byť uskutočnená buď in vitro alebo in vivo. Bezbunkové systémy sú pšeničné klíčky alebo extrakty retikulocytov. Napríklad in vivo translácia môže byť uskutočnená mikroinjekciou do žabích oocytov.
Jedným hľadiskom tohoto vynálezu je použitie jednej alebo viac molekúl DNA, ktoré kódujú rôzne proteíny alebo polypeptidy vírusu zvinutky viniča (typ 2) pre transformáciu rastlín viniča tak, aby bola prenesená rezistencia voči zvinutke viniča do rastliny. Nie je známy mechanizmus, ktorým je rezistencia prenesená. Jeden predpokladaný mechanizmus je založený na tom, že transformovaná rastlina môže exprimovať proteín alebo polypeptid vírusu zvinutky viniča (typ 2) a keď transformovaná rastlina je inokulovaná vírusom zvinutky viniča, ako GLRaV-1, GLRaV-2, GLRaV-3, GLRaV-4, GLRaV-5, GLRaV-6, alebo ich kombináciou, exprimovaný proteín alebo polypeptid zabráni translácii vírusovej DNA.
Z tohoto hľadiska predmetná molekula DNA inkorporovaná do rastliny môže byť podľa tohoto vynálezu konštitutívne exprimovaná. Expresia môže byť tiež regulovaná promótorom, ktorý je aktivovaný prítomnosťou vírusu zvinutky viniča. Pre tieto účely sú vhodné promótory exprimované génmi ako odpoveď na infiltráciu vírusu zvinutky viniča.
Izolované molekuly DNA podlá tohoto vynálezu môžu byť použité na prenos rezistencie voči vírusu zvinutky viniča do mnohých odrôd rastlín viniča. Molekuly DNA sú zvlášť dobre upravené pre prenos rezistencie do štepu alebo koreňovej odnože kultivarov Vitis. Štepy kultivarov, ktoré môžu byť ochránené sú bežné stolové alebo hrozienkové viniče ako Alden, Almeria, Anab-E-Shahi, Autumn Black, Beauty Seedless, Black Corinth, Black Damascus, Black Malvoise, Black Prince, Blackrose, Bronx Seedless, Burgrave, Calmeria, Campbell
Early, Canner, Cardinal, Catawba, Christmas, Concord, Dattier, Delight, Diamond, Dizmar, Duchess, Early Muscat, Emeerald Seedless, Emperor, Exotic, Ferdinand de Lesseps, Fiesta, Fláme sedless, Fláme Tokay, Gasconade, Gold, Himrod, Hunisa, Hussiene, Isabella, Italia, July Muscat, Khandahar, Katta, Kourgane, Koshmishi, Loose Perlette, Malaga, Monukka, Muscat of Alexandria, Muscat Fláme, Muscat Hamburg, New York Muškát, Niabell, Niagara, Olivette blanche, Ontario, Pierce, Queen, Red Malaga, Ribier, Rish Baba, Romulus, Ruby Seedless, Schuyler, Seneca, Suavis (IP 365), Thompson seedless, Thomuscat. Môžu to byť tiež odrody používané pre výrobu vína ako Aleatico, Alicante Bouschet, Aligote, Alvarelhao, Aramon, Baco blane (22A), Burger, Cabernet franc, Cabernet Sauvignon, Calzin, Carignane, Charbono, Chardonnay, Chasselas dore, Chenin blane, Clairette blanche, Early Burgundy, Emerald Riesling, Feher Szagos, Fernao Pires, Flóra, French Colombard, Fresia, Furmint, Gamay, Gewurztraminer, Grand noir, Gray Riesling, Green Hungarian, Green Veltliner, Grenache, Grillo, Helena, Inzolia, Lagrein, Lambrusco de Salamino, Malbec, Malvasia bianca, Mataro, Melón, Merlot, Meunier, Mission, Montua de Pilas, Muscadelle du Bordelais, Muscat blane, Muscat Ottonel, Muscat Saint-Vallier, Nebbiolo, Nebbiolo fino, Nebbiolo Lampia, Orange Muscat, Palomino, Pedro Ximenes, Petit Bouschet, Petite Sirah, Peverella, Pinot noir, Pinot Saint-George, Primitivo di Gioa, Red Veltliner, Refosco, Rkatsiteli, Royalty, Rubired, Ruby Cabernet, SaintEmilion, Saint Macaire, Salvador, Sangiovese, Sauvignon blane, Sauvignon gris, Sauvignon vert, Scarlet, Seibel 5279, Seibel 9110, Seibel 13053, Semillon, Servant, Shiraz, Souzao, Sultana Crimson, Sylvaner, Tannat, Teroldico, Tinta Madeira, Tinto cao, Touriga, Traminer, Trebbiano, Toscano, Trousseau, Valdepenas, Viognier, Walschriesling, White Riesling, Zinfandel. Kultivary koreňových odnoží, ktoré môžu byť ochránené sú Courderc 1202, Courderc 1613, Courderc 1616, Courderc 3309, Dog Ridge, Foex 33 EM, Freedom, Ganzin 1 (A x
R #1), Harmony, Kober 5BB, LN33, Millardet & de Grasset 41B, Millardet & de Grasset 420A, Millardet & de Grasset 101-14, Oppenheim 4 (SO4), Paulsen 775, Paulsen 1045, Paulsen 1103, Richter 99, Richter 110, Riparia Gloire, Ruggeri 225, SaintGeorge, Sált Creek, Teleki 5A, Vitis rupestris Constantia, Vitis california a Vitis girdiana.
Existuje velká podobnosť v hsp70-podobných sekvenčných oblastiach v GLRaV-2 a v iných klosterovírusoch, ako tristeza vírus a vírus žltnutia repy. GLRaV-2 hsp-70 podobný gén môže byť potom použitý pre vytvorenie transgénnych rastlín alebo kultivarov iných ako vinič, ako je citrus alebo cukrová repa, ktoré sú rezistentné voči iným klosterovírusom ako je zvinutka viniča, tristeza vírus a vírus žltnutia repy.
Vhodné citrusové kultivary sú citrón, limeta, pomaranč, grapefruit, ananás, tangerinka a podobne, ako Joppa, Maltaise Ovale, Parson (Parson Brown), Pera, Pineapple, Queen, Shamouti, Valencia, Tenerife, Imperiál Doblefina, Washington Sanguine, Moro, Sanguinello Moscato, Spanish Sanguinelli, Tarocco, Atwood, Australian, Bahia, Baiana, Cram, Dalmau, Eddy, Fisher, Frost Washington, Gillette, LengNavelina, Washington, Satsuma Mandarín, Dancy, Robinson, Ponkan, Duncan, Marsh, Pink Marsh, Ruby Red, Red Seedless, Smooth Seville, Orlando Tangelo, Eureka, Lisbon, Meyer Lemon, Rough Lemon, Sour Orange, Persian Lime, West India Lime, Bearss, Sweet Lime, Troyer Citrange, Citrus Trifoliata. Každý z týchto citrusových kultivarov je vhodný pre prípravu transgénnych citrusových rastlín rezistentných voči tristeza vírusu.
Ekonomicky výhodným druhom cukrovej repy je Beta vulgaris L., ktorá má štyri dôležité typy kultivarov: cukrová repa, stolová repa, kŕmna repa a Swiss chard. Každý z týchto repných kultivarov je vhodný pre prípravu transgénnych rast62 lín repy rezistentných voči vírusu žltnutia repy, ako je popísané vyššie.
Pretože je známe, že GLRaV-2 infikuje rastliny tabaku (napr. Nicotiana benthamiana), je tiež žiadúca príprava transgénnych tabakových rastlín, ktoré sú rezistentné voči vírusom zvinutky viniča, ako GLRaV-2.
Rastlinné tkanivo vhodné pre transformáciu je tkanivo listu, koreňové tkanivo, byl, zygotické a somatické embryá a tyčinky. Zvlášť je výhodné použiť embryo získané z kultúr tyčiniek.
Pri vhodných podmienkach, podľa tohoto vynálezu, môže byť použitý expresný systém na transformáciu prakticky ktoréhokoľvek rastlinného tkaniva. Tkanivové bunky transformované v súhlase s predkladaným vynálezom môžu rásť in vitro vo vhodnom médiu a prenášať rezistenciu voči vírusu zvinutky viniča. Transformované bunky môžu byť regenerované na celé rastliny tak, že proteín alebo polypeptid udeľuje rezistenciu voči vírusu zvinutky viniča intaktným transgénnym rastlinám. V každom prípade, rastlinné bunky transformované expresným systémom rekombinantnej DNA podľa predkladaného vynálezu rastú a exprimujú túto molekulu DNA a tvoria jeden z vyššie popísaných proteínov alebo polypeptidov vírusu zvinutky viniča, a tým prenášajú rezistenciu voči vírusu zvinutky viniča.
Pri príprave transgénnych rastlín, DNA konštrukt vo vyššie popísanom vektore, môže byť mikroinjekčne vložený priamo do rastliny pomocou mikropipiet na mechanický prenos rekombinantnej DNA. Crossway, Mol. Gen. Genetics, 202:179-85 (1985), uvedené v citáciách. Genetický materiál môže byť tiež prenesený do rastlinnej bunky pomocou polyetylén glykolu. Krens a spol., Náture, 296:72-74 (1982), uvedené v citáciách.
Inou technológiou transformácie rastlín molekulami DNA v súhlase s týmto vynálezom je kontakt tkaniva takýchto rastlín s inokulom baktérií s transformovaným vektorom, ktorý obsahuje gén podlá tohoto vynálezu, a ktorý prenáša rezistenciu voči zvinutke viniča. Všeobecne tento postup pozostáva z inokulácie rastlinného tkaniva suspenziou baktérií a inkubácie tkaniva počas 48 až 72 hodín v regeneračnom médiu bez antibiotík pri teplote 15 až 38 °C.
Na transformáciu rastlinných buniek môžu byť použité baktérie z rodu Agrobacterium. Vhodné druhy takýchto baktérií sú Agrobacterium tumefaciens a Agrobacterium rhizogenes. Agrobacterium tumefaciens (napr. kmene C58, LBA4404, alebo EHA105) a sú zvlášť užitočné pre ich velmi dobrú schopnosť transformovať rastliny.
Heterológne genetické sekvencie môžu byť vložené do príslušných rastlinných buniek pomocou Ti plazmidu z A. tumefaciens alebo Ri plazmidu z A. rhizogenes. Ti alebo Ri plazmid je prenesený do rastlinných buniek infikovaním Agrobacterium a je stabilne integrovaný do rastlinného genómu. J. Schell, Science, 237:1176-83 (1987), uvedené v citáciách.
Po transformácii musia byť transformované bunky regenerované.
Regeneráciu rastliny z protoplastov v kultúre popisuje Evans a spol., Handbook of Plánt Celí Cultures, zv. 1: (MacMillan Publishing Co., New York, 1983); a Vasil I.R. (ed.), Celí Culture and Somatic Celí Genetics of Plants, Acad. Press, Orlando, zv. I, 1984 a zv. III (1986), ktoré sú uvedené v citáciách.
Je známe, že prakticky všetky rastliny môžu byť regenerované z bunkových kultúr alebo z tkanivových kultúr, vrátane ale nie vymedzené, všetky hlavné druhy cukrovej trstiny, cukrovej repy, bavlny, ovocných stromov a zeleniny.
Spôsoby regenerácie sa menia v závislosti na druhu rastlín, ale všeobecne najskôr sa pripraví suspenzia transformovaných protoplastov na Petriho miske. Vytvorí sa kalusové tkanivo a z kalusu môžu byť indukované výhonky, ktoré sú následne zakorenené. Alternatívne môže byť indukované vytvorenie embrya v kalusovom tkanive. Tieto embryá sa vyvíjajú ako prirodzené embryo pri tvorbe rastliny. Všeobecne kultivačné médium obsahuje rôzne aminokyseliny a hormóny, ako auxin a cytokiníny. Je tiež výhodné pridať do média kyselinu glutámovú a prolín. Účinnosť regenerácie bude závisieť na médiu, na genotype a histórii rastliny. Keď tieto tri premenné sú kontrolované, regenerácia je zvyčajne reprodukovateľná a opakovatelná.
Keď je expresná kazeta stabilne inkorporovaná do transgénnej rastliny, môže byť prenesená do iných rastlín pohlavným krížením. Môžu byť použité ktorékoľvek z mnohých štandardných spôsobov množenia, v závislosti na druhu, ktorý má byť krížený.
Po vytvorení transgénnej rastliny tohoto druhu, rastliny samotné môžu byť pestované bežným spôsobom tak, že konštrukt DNA je prítomný vo výsledných rastlinách. Alternatívne sa z transgénnych rastlín získajú transgénne semená. Tieto semená môžu byť zasiate do pôdy a pestované bežnými spôsobmi čím sa dopestujú transgénne rastliny.
Iný prístup pre transformáciu rastlinných buniek génom prenášajúcim rezistenciu voči patogénom je bombardovanie časticami (tiež známe ako biolistická transformácia) hostiteľskej bunky. Toto sa môže uskutočniť jedným alebo viacerými spôsobmi. Prvý spôsob predstavuje vyvolanie pohybu inertných alebo aktívnych častíc na bunkách. Tento spôsob je popísaný v U.S. Patentoch č. 4,945,050; 5,036,006 a 5,100,972 Sanforda a spol., a v Emerschad a spol., „Somatic Embryogenesis and
Plánt Development from Immature Zygotic Embryos of Seedless Grapes (Vitis vinifera), Plánt Celí Reports, 14:6-12 (1995) („Emerschad (1995)), ktoré sú uvedené v citáciách. Všeobecné tento postup je založený na privedení inertných alebo biologicky aktívnych častíc na bunky v podmienkach účinných pre penetráciu cez vonkajší povrch bunky a inkorporáciu do jej vnútra. Keď sa použijú inertné častice, vektor môže byť vložený do bunky pokrytím častíc vektorom obsahujúcim heterológnu DNA.
Alternatívne cieľová bunka môže byť obkolesená vektorom tak, že vektor je vnesený do bunky „vzbudenou časticou. Biologicky aktívne častice (napr. vysušené bakteriálne bunky obsahujúce vektor a heterológnu DNA), môžu byť tiež vnesené do buniek pohybom.
Po tom, ako je rastlinné tkanivo transformované, citrusové rastlinné tkanivo, rastlinné tkanivo repy alebo rastlinné tkanivo tabaku, podľa predkladaného vynálezu, je transformované tkanivo regenerované a je vytvorená transgénna rastlina. Všeobecne sa regenerácia uskutočňuje kultiváciou transformovaného tkaniva v médiu s obsahom vhodných rastových regulátorov a živín, čo umožní iniciáciu výhonkových meristémov. Pre selekciu vývoja transformovaných buniek a na zastavenie rastu Agrobacterium, sa pridajú do regeneračného média vhodné antibiotiká. Po iniciácii výhonkov sa výhonky ponechajú rásť a vytvoriť tkanivovú kultúru, ktorá je selektovaná podľa aktivity markera génu.
Molekuly DNA podľa tohoto vynálezu môžu byť schopné transkripcie na messenger RNA, ktorá hoci kóduje protein alebo polypeptid vírusu zvinutky viniča (typ 2), nie je schopná translácie na protein. Toto je známe ako RNA-sprostredkovaná rezistencia. Keď štep alebo koreňová odnož kultivaru Vitis, alebo kultivar citrusu, repy alebo tabaku, je transformovaný takouto molekulou DNA, molekula DNA môže byť prepísaná v podmienkach účinných pre udržanie messenger RNA v rastlinnej bunke na nízkej čítacej úrovni. Výhodná je hustota čítania medzi 15 a 50 pri použití Hewlet ScanJet and Image Analysis Program.
Môže byť použitá časť jednej alebo viacerých molekúl DNA podlá tohoto vynálezu, rovnako ako iné molekuly DNA v transgénnej rastline viniča, citrusovej rastline, rastline repy alebo tabaku v súhlase s U.S. Patentovou žiadosťou číslo série č. 09/025,635, uvedenou v citáciách.
Proteín alebo polypeptid vírusu zvinutky viniča (typ 2) podlá tohoto vynálezu môže byť tiež použitý pri tvorbe protilátok alebo ich väzobných častí, alebo sond. Protilátky môžu byť monoklonálne alebo polyklonálne.
Tvorba monoklonálnych protilátok môže byť uskutočnená spôsobmi dobre známymi v odbore. V zásade spôsob predstavuje najprv získanie imúnnych buniek (lymfocytov) zo sleziny cicavca (napr. myši), ktorý bol vopred imunizovaný príslušným antigénom buď in vivo alebo in vitro. Lymfocyty sekretujúce antilátku sú potom fúzované s (myšími) myelómovými bunkami alebo transformovanými bunkami, ktoré sú schopné sa nekonečne replikovať v bunkovej kultúre, a tým tvoriť nesmrteľnú imunoglobulín-sekretujúcu bunkovú líniu. Výsledné fúzované bunky, alebo hybridómy, sú kultivované a výsledné kolónie sú testované pre produkciu príslušných monoklonálnych protilátok. Kolónie produkujúce takéto protilátky sú klónované a pre produkciu veľkých množstiev protilátok rastú buď in vivo alebo in vitro. Popis teoretického základu a praktických postupov pre fúziu takýchto buniek je uvedený v Kohler a Milstein, Náture, 256:495 (1975), uvedené v citáciách.
Cicavčie lymfocyty sú imunizované in vivo imunizáciou zvieraťa (napr. myši) proteínom alebo poplypeptidom podľa predkladaného vynálezu. Takéto imunizácie sú podľa potreby opakované v intervaloch niekoľkých týždňov tak, aby sa získalo dostatočné množstvo protilátok. Po poslednej dávke antigénu sú zvieratá usmrtené a odstráni sa slezina.
Fúzia s cicavčími myelómovými bunkami alebo inými partnermi schopnými nekonečnej replikácie v bunkových kultúrach je účinná štandardnými a dobre známymi postupmi, napríklad použitím polyetylén glykolu („PEG) alebo iných látok podporujúcich fúziu. (Pozri Milstein a Kohler, Eur. J. Immunol., 6:511 (1976), uvedené v citáciách). Takouto nesmrtelnou bunkovou líniou je výhodne murine bunková línia, ale môže byť tiež odvodená od buniek iných cicavčích druhov, vrátane ale neobmedzene na potkany a ľudí, sú vybraté bunky, ktorým chýbajú enzýmy potrebné pre utilizáciu niektorých živín, ktoré sú schopné rýchleho rastu a majú dobrú schopnosť fúzie. Odborníci poznajú veľa takýchto bunkových línií a iné sú riadne popísané.
Postupy pre tvorbu polyklonálnych protilátok sú dobre známe. Typicky môžu byť takéto protilátky tvorené po subkutánnom podaní proteínu alebo polypeptidu podľa tohoto vynálezu New Zealand bielym králikom, ktorým bola vopred odobratá krv aby sa získalo sérum pred imunizáciou. Antigény môžu byť injikované v celkovom objeme 100 μΐ na jedno miesto, celkovo na šiestich miestach. Každý injikovaný materiál obsahuje syntetické povrchovo aktívne adjuvantné pluronické polyoly, alebo práškový akrylamidový gél s obsahom proteínu alebo polypeptidu po SDS-polyakrylamidovej gélovej elektroforéze. Králikom je odobratá krv po dvoch týždňoch a rovnaký antigén je opakovane podaný trikrát, každých šesť týždňov. Vzorka séra je odobratá 10 dní po každom podaní antigénu. Polyklonálne protilátky sú získané zo séra pomocou afinitnej chromatografie za použitia príslušného antigénu na vychytanie protilátky. Nakoniec sú králiky usmrtené intravenóznym podaním pentobarbitál v dávke 150 mg/kg. Tento postup a iné postupy pre prípravu polyklonálnych protilátok sú popísané v Harlow a spol., vyd., Antibodies: A Laboratory Manual (1988), uvedené v citáciách.
Okrem použitia celých protilátok, môžu byť použité väzobné časti týchto protilátok. Takéto väzobné časti sú Fab fragmenty, F(ab')2 fragmenty a Fv fragmenty. Tieto fragmenty protilátok môžu byť pripravené konvenčnými postupmi, ako proteolytická fragmentácia, ktorú popísal Goding, Monoclonal Antibodies: Principles and Practice, New York: Academic Press, str. 98-118 (1983), uvedené v citáciách.
Tento vynález sa tiež týka sond nájdených buď v prírode alebo pripravených synteticky pomocou rekombinantnej DNA alebo inými biologickými postupmi. Vhodné sondy sú molekuly, ktoré sa viažu na antigény vírusu zvinutky viniča (typ 2) rozpoznávané monoklonálnymi protilátkami podlá tohoto vynálezu. Napríklad takýmito sondami môžu byť proteíny, peptidy, lektíny alebo nukleové kyseliny.
Protilátky alebo ich väzobné časti, alebo sondy môžu byť podané do štepu alebo koreňovej odnože kultivarov infikovaných vírusom zvinutky viniča. Alternatívne najmenej väzobné časti týchto protilátok môžu byť sekvenované a môže byť syntetizovaná kódujúca DNA. Molekula kódujúcej DNA môže byť použitá pre transformáciu rastlín spolu s promótorom, ktorý zahajuje expresiu kódovanej protilátky, keď je rastlina infikovaná vírusom zvinutky viniča. V každom prípade sa bude protilátka alebo jej väzobná časť, alebo sonda viazať na vírus a tým zabráni zvyčajnú odpoveď zvinutky.
Protilátky pripravené voči GLRaV-2 proteínom alebo polypeptidom podlá tohoto vynálezu, alebo väzobné časti týchto protilátok môžu byť použité pre detekciu vírusu zvinutky vo vzorke tkaniva, ako je tkanivo (napr. štep, alebo koreňová odnož) z rastliny viniča alebo rastliny tabaku. Protilátky alebo ich väzobné časti vhodné pre použitie pri detekcii sú tie, ktoré boli vytvorené voči helikáze, metyltransferáze a papaínu-podobnej proteáze, RNA-závislej RNA polymeráze, proteínu 70 tepelného šoku, proteínu 90 tepelného šoku, rozvetvenému povrchovému proteínu, alebo iným proteínom a polypeptidom v súhlase s týmto vynálezom. Zaznamená sa akákoľvek reakcia vzorky s protilátkou pomocou systému, ktorý indikuje prítomnosť vírusu zvinutky vo vzorke. Môžu byť použité rôzne systémy ako sú enzymatická imunosorbčná analýza, rádioimunoanalýza, analýza gélovo difúznej precipitačnej reakcie, fluorescenčná imunoanalýza, A imunoanalýza, alebo imunoelektroforetická analýza.
Vírus zvinutky viniča môže byť detekovaný v týchto vzorkách použitím nukleotidovej sekvencie molekuly DNA, alebo jej fragmentu, ktorý kóduje proteín alebo polypeptid podľa tohoto vynálezu. Nukleotidová sekvencia je potom sondou pri hybridizácii nukleovej kyseliny alebo pri detekcii amplifikácie génu (napr. použitím metódy polymerázovej reťazovej reakcie). Sondy nukleovej kyseliny podľa tohoto vynálezu môžu byť použité v ktoromkoľvek systéme pre hybridizáciu nukleovej kyseliny, vrátane ale nie obmedzené, Southern bloty (Southern, E.M., „Detection of Specific Sequences Among DNA Fragments Separated by Gel Electrophoresis, J. Mol. Biol., 98:503-17 (1975), uvedené v citáciách), Northern bloty (Thomas, P.S., „Hybridiztion of Denaturated RNA and Small DNA Fragments Transferred to Nitrocellulose, Proc. Natl. Acad. Sci. USA,
77:5201-05 (1980), uvedené v citáciách) a „Colony bloty (Grunstein, M. a spol., „Colony Hybridization: A Method for the Isolation of Cloned cDNAs that Contain a Specific Gene, Proc. Natl. Acad. Sci. USA, 72:3961-65 (1975), uvedené v citáciách) . Sondy môžu byť tiež použité pri detekcii amplifikácie génu (napr. polymerázová reťazová reakcia). Erlich,
H. A. a spol., „Recent Advances in the Polymerase Chain Reaction, Science 252:1643-51 (1991), uvedené v citáciách, Zaznamená sa akákolvek reakcia so sondou, ktorá naznačí prítomnosť vírusu zvinutky viniča vo vzorke. Detekcia je uľahčená tým, že sa označí sonda podľa tohoto vynálezu. Vhodným označením je rádioaktívna zlúčenina, fluorescenčná zlúčenina, chemiluminiscenčná zlúčenina, enzymatická zlúčenina a iné rovnocenné označenia nukleových kyselín.
V závislosti na cieli detekcie je možné použiť sondy s nukleotidovými sekvenciami, ktoré zodpovedajú konzervatívnym alebo variabilným oblastiam ORF alebo UTR. Napríklad, pre rozlíšenie vírusu zvinutky viniča od iných podobných vírusov (napr. klosterovírusov), je želateľné použiť sondy s obsahom nukleotidových sekvencii, ktoré zodpovedajú konzervatívnejším sekvenciám vo všetkých vírusoch zvinutky viniča. Pre rozlíšenie rôznych vírusov zvinutky viniča (napr. GLRaV-2 od GLRaVI, GLRaV-3, GLRaV-4, GLRaV-5 a GLRaV-6) je želateľné použiť sondy obsahujúce nukleotidové sekvencie ktoré zodpovedajú sekvenciám menej konzervatívnym medzi rôznymi vírusmi zvinutky viniča.
Sondy nukleovej kyseliny (DNA alebo RNA) podlá tohoto vynálezu budú hybridizovať s komplementárnou GLRaV-2 nukleovou kyselinou za určitých vymedzených podmienok. Vymedzené podmienky sú teplota asi o 50 ° C nižšia ako je bod topenia (Tm) pre špecifickú sekvenciu pri definovanej iónovej sile a pH. Tm je teplota (pri definovanej iónovej sile a pH), pri ktorej 50 % cielovej sekvencie hybridizuje s presne zhodnou sondou. Tm je závislá na roztoku a základnej zlúčenine sondy a môže byť vypočítaná pomocou nasledujúcej rovnice:
Tm = 79,8 °C + (18,5 x Log[Na+l]) + (58.4 °C x % [G+C])
- (820/#bp v duplexe)
- (0,5 x % formamidu)
Nešpecifická väzba môže byť tiež skontrolovaná použitím jedného z mnohých spôsobov ako napríklad blokovanie membrány roztokom s obsahom proteínov, pridaním heterológnej RNA, DNA a SDS do hybridizačného pufra a pôsobením RNázy. Podmienky premývania nie sú také prísne. Pri hybridizácii nukleovej kyseliny alebo pri detekcii amplifikácie génu sú podmienky prísne, tak ako je uvedené vyššie. Viac-menej, môžu byť tiež vybrané prísne podmienky.
Príklady uskutočnenia vynálezu
Nasledujúce príklady ilustrujú podstatu tohoto vynálezu, ale nie sú mienené, že obmedzujú jeho ciel.
Príklad 1 - Northern hybridizácia
Špecificita vybraných klónov bola potvrdená Northern hybridizáciou. Northern hybridizácia bola uskutočnená po elektroforéze dsRNA z GLRaV-2 v 10 % agarózovom nedenaturačnom géli. Agarózový gél bol denaturovaný namočením do 50 mM NaOH s obsahom 0,4 M NaCl počas 30 minút a potom bol gél neutralizovaný 0,1 M Tris-HCl (pH 7,5) s obsahom 0,5 M NaCl počas ďalších 30 minút. RNA bola sendvičovo blotovaná na Genescreen™ plus membráne (Dupont NEN Research Product) v 10 x SSC pufri a hybridizovaná podlá pokynov výrobcu (Dupont, NEN) .
Príklad 2 - Sekvenovanie a počítačom riadená sekvenčná analýza nukleotidov a aminokyselín
Inzerty DNA boli sekvenované v pBluescript SK+ použitím univerzálnych primérov T3 a T7 pre terminálnu oblasť a ďalších oligonukleotidových primérov pre známu sekvenciu ich vnútornej oblasti. Čistenie plazmidovej DNA bolo uskutočnené modifikáciou postu precipitácie mini alkalickej-lýzy/PEG popísanej výrobcom (Applied Biosystems, Inc.). Nukleotidová sekvencia na oboch vláknach cDNA bola hodnotená ABI TaqDyeDeoxy Terminátor Cycle Sequencing Kit (Applied Biosystems, Inc) . Pre automatické sekvenovanie sa použil ABI373 Automated Sequencer (Applied Biosystems, Inc.) v Cornellovej univerzite, Geneva, NY.
Boli zostrojené nukleotidové sekvencie GLRaV-2 a boli analyzované EditSeq a SeqMan programami DNASTAR (Madison, WI). Sekvencie aminokyselín odvodené zo sekvencií nukleotidov a ich kódujúcich otvorených čítacích rámcov boli získané pomocou MapDraw programu. Použitím Clustal metódy programu MegAlin bolo získaných veľa sekvencií aminokyselín, identifikovali sa súhlasné sekvencie aminokyselín a vytvoril sa fylogenetický strom. Pomocou Entrez programu boli získané sekvencie nukleotidov a aminokyselín pre iné klosterovírusy; porovnanie sekvencií s nie nadbytočnými databázami bolo uskutočnené pomocou Blast programu z Národného strediska pre biotechnologické informácie (National Center for Biotechnology Information).
Príklad 3 - Izolácia dsRNA
Zdrojom pre izoláciu dsRNA a klonovanie cDNA bolo niekoľko viničov Vitis vinifera cv Pinot Noir pochádzajúcich z oblasti centrálnych viníc New Yorku infikovaných GLRaV-2.
dsRNA bola extrahovaná z tkaniva floému infikovaného viniča podľa metódy popísanej Hu a spol., „Characterization of Closterovirus-Like Particles Associated with Grapevine Leafroll Disease, J. Phytopathology 128:1-14 (1990), uvedené v citáciách. Čistenie dsRNA vysokej molekulovej hmotnosti (asi 15 kb) sa uskutočnilo pomocou elektroforetického delenia celkovej dsRNA na 0,7 % agarózovom géli s nízkym bodom topenia a extrakciou fenol/chloroformom podľa metódy popísanej Sambrookom a spol., Molecular Cloning: A Laboratory Manual, 2. Vydanie, Cold Spring Harbor Laboratory Press, New York (1989), uvedené v citáciách. Koncentrácia dsRNA bola stanovená meraním UV fluorescencie prúžku dsRNA po zafarbení etidium bromidom a porovnaní so známou koncentráciou DNA markeru.
Príklad 4 - Syntéza a klónovanie cDNA
Syntéza cDNA bola uskutočnená podľa metódy pôvodne popísanej Jelkmanom a spol., „Cloning of Four Plánt Viruses From Small Quantities of Double-Stranded RNA, Phytopathology 79:1250-53 (1989) a modifikovanej Lingom a spol., „The Coat Protein Gene of Grapevine Leafroll Associated Closterovirus3: Cloning, Nucleotide Sequencing and Expression in Transgenic Plants Árch. Virology 142:1101-16 (1997), obe uvedené v citáciách. Asi 100 ng dsRNA vysokej molekulovej hmotnosti, prečistenej na agarózovom géli s nízkym bodom topenia, bolo denaturovaných v 20 mM hydroxide metylortuťnatom a inkubovaných pri laboratórnej teplote 10 minút s 350 ng náhodných primérov. Prvé vlákno cDNA bolo syntetizované pomocou reverznej transkriptázy vtáčieho myeloblastického vírusu (AMV). Druhé vlákno cDNA bolo získané pomocou RNAázy H a E. coli DNA polymerázy I. Dvoj vláknitá cDNA bola naslepo ukončená T4 DNA polymerázou a ligovaná s EcoR I adaptérmi. cDNA, ktorá mala na zakončení EcoR I adaptéry, bola aktivovaná kinázovou reakciou a ligovaná do Lambda ZAP II/EcoR I pripravených ramienok podľa návodu výrobcu (Stratagene). Rekombinantná DNA bola potom zvinutá in vitro do Gigapack® II extraktu (Stratagene). Zvinuté fágové častice boli amplifikované a titrované podľa návodu výrobcu.
Pre identifikáciu GLRaV-2 špecifických klónov boli použité dva druhy sond z knižnice. Jeden typ bol pripravený zo zosyntetizovanej cDNA, ktorá bola amplifikovaná PCR po ligácii so špecifickými EcoR I Uni-Amp™ adaptérmi (Clontech); a druhý typ DNA inzertov alebo produktov PCR bol už zo sekvenovaných klónov. Klóny z knižnice cDNA boli vybraté „colonylifting hybridizáciou na colony/plaque Screen membráne (NEN Research Product) so sondou popísanou vyššie. Sonda bola pripravená označením 32P(a-dATP] použitím Klenow-ovho fragmentu DNA polymerázy I z E. coli. Prehybridizácia, hybridizácia a premývanie sa uskutočnili pri teplote 65 °C podľa návodu výrobcu (Dupont, NEN Research Product). Vybraté plaky boli premenené na rekombinantný pBluescript in vivo vystrihnutím podľa návodu výrobcu (Stratagene).
Pre získanie klónov predstavujúcich krajné 3'-zakončenie v GLRaV-2, dsRNA bola polyadenylovaná kvasnicovou poly(A) polymerázou. Použitím poly(A)-dsRNA ako templátu, bola cDNA amplifikovaná RT-PCR s oligo(dľ)18 a špecifickým primérom, CP1/T7R, ktorý je odvodený z klónu CP-1 a má nasledovnú nukleotidovú sekvenciu SEQ. ID. No. 20:
TGCTGGAGCT TGAGGTTCTG C 21
Výsledný produkt PCR (3'-PCR) bol klónovaný do TA vektora (Invitrogen) a bol sekvenovaný.
Ako ukazuje obrázok 1A, dsRNA vysokej molekulovej hmotnosti približne 15 kb bola konzistentne identifikovaná z viničov infikovaných GLRaV-2, ale nie zo zdravých viničov. Okrem toho, v infikovanom tkanive bolo detekovaných niekolko dsRNA nízkej molekulovej hmotnosti. Výťažok dsRNA z GLRaV-2 bol 5 až 10 ng/15 g tkaniva floému, čo bolo oveľa menej ako výťažok z GLRaV-3 (Hu a spol., „Characterization of Closterovirus-Like Particles Associated with Grapevine Leafroll Disease, J. Phytopathology 128:1-14 (1990), uvedené v citáciách) . Pre syntézu cDNA, klónovanie a stanovenie Lambda/ZAP II cDNA knižnice bola použitá len dsRNA vysokej molekulovej hmotnosti, ktorá bola čistená na agarózovom géli s nízkym bodom topenia.
Pre vyhľadávanie cDNA knižnice boli použité dva druhy sond. Pôvodné klóny boli identifikované pomocou hybridizácie s Uni-Amp™ PCR-amplifikovanou cDNA ako sondou. Ako ukazuje obrázok 1B, špecificita týchto sond (napr. TC-1) v rozsahu velkosti 200 až 1 800 bp bola potvrdená Northern hybridizáciou s dsRNA z GLRaV-2. Okrem toho po hybridizácii so sondami z GLRaV-2 špecifických cDNA klónov alebo z PCR produktov bolo identifikovaných viac ako 400 rôznych klónov velkosti 800 až 7 500 bp. Na oboch reťazcoch bolo potom sekvenovaných viac ako 40 klónov (Obrázok 2).
Príklad 5 - Expresia povrchového proteínu v E. coli a imunoblot
Pre stanovenie, že ORF6 bol gén povrchového proteínu GLRaV-2, kompletná molekula ORF6 DNA bola subklónovaná z PCR produktu a inzertovaná do expresného vektora fúzneho proteínu pMAL-C2 (New England Biolabs, Inc.). Pre PCR reakciu boli po76 užité špecifické priméry CP-96F a CP-96R, ktoré obsahovali pre uľahčenie klónovania EcoR I a BamH miesta. CP-96F predstavuje štartovací kodón v CP a obsahuje nasledujúcu nukleotidovú sekvenciu SEQ. ID. No. 21:
CGGAATTCAC CATGGAGTTG ATGTCCGACA G 31
CP-96R obsahoval 66 nukleotidov v smere od stop kodónu v CP a obsahuje nasledujúcu nukleotidovú sekvenciu SEQ. ID. No. 22:
AGCGGATCCA TGGCAGATTC GTGCGTAGCA GTA 33
Povrchový proteín bol exprimovaný ako proteín fúzovaný s proteínom viažucim maltózu (MBP) z E. coli pod kontrolou „tac promótora a potlačený „lacrepresorom. MBP-CP fúzny proteín bol indukovaný pridaním 0,3 mM izopropyl-B-D-tio-galaktopyranozidu (IPTG) a prečistený jednostupňovou afinitnou chromatografiou na kolóne podlá návodu výrobcu (New England, Biolabs, Inc.). MBP-CP fúzny proteín alebo povrchový proteín odštiepený z fúzneho proteínu bol testovaný reakciou so špecifickým antisérom z GLRaV-2 (láskavo poskytnuté Dr. Charlesom Greif-om z INRA, Colmar, Francúzsko) na Western blote podľa metódy popísanej Hu a spol., „Characterization of Closterovirus-Like Particles Associated with Grapevine Leafroll Disease, J. Phytopathology 128:1-14 (1990), uvedené v citáciách. Nerekombinantné plazmidy alebo neindukované bunky nereagovali s antisérom z GLRaV-2.
Príklad 6 - Analýza sekvencie a organizácia genómu v GLRaV-2
Celkovo bolo sekvenovaných 15 500 bp RNA genómu v GLRaV-2 a tieto boli uložené v GenBank (prístupové číslo AF039204). Zistilo sa, že asi 85 % z celkového genómu RNA bolo v dvoch rozdielnych klónoch. Sekvencia oblasti génu pre povrchový protein bola stanovená a potvrdená viacerými prekrývajúcimi klónmi. Organizácia genómu v GLRaV-2, zaznamenaná na Obrázku 2, obsahuje deväť otvorených čítacích rámcov (napr. ORFla, lb-8).
ORFla a ORFlb: Analýza sekvencie aminokyselín časti z Nzakončenia v GLRaV-2 ORFla kódovanom produkte ukázala dve predpokladané papaínu podobné proteázové domény, čo poukázalo na významnú podobnosť s papaínu-podobnou vedúcou proteázou v BYV (Agranovsky a spol., „Beet Yellows Closterovirus: Complete Genome Structure and Identification of Papain-Like Thiol Protease, Virology 198:311-24 (1994), uvedené v citáciách) . Toto umožnilo predpokladať katalytické zvyšky cysteínu a histidínu pre predpokladanú GLRaV-2 proteázu. Po porovnaní sekvencie papaínu podobnej proteázy z BYV so sekvenciou z GLRaV-2, miesto štiepenia na zvyškoch Gly-Gly (aminokyseliny 588 až 589) z BYV, zodpovedalo príslušnému alanínglycín (Ala-Gly) a Gly-Gly dipeptidu z GLRaV-2 (Obrázok 3A). Štiepenie na tomto mieste by vytvorilo vedúci protein a fragment C-zakončenia obsahujúci MT a HEL domény veľkosti 234 kDa (2 090 aminokyselín). Avšak oblasť domény papaínu podobnej proteázy v GLRaV-2 neukázala podobnosť s príslušnou oblasťou BYV. Okrem toho, bola prítomná variabilita vo zvyškoch nachádzajúcich sa na šiepiacej väzbe (Gly v BYV a Ala v GLRaV-2). Podobná rôznosť zvyšku štiepiaceho miesta v P-PRO doméne bola popísaná v LChV (Jelkmann a spol., „Complete Genome Structure and Phylogenetic Analysis of Little Cherry Virus, a Mealybug-Trasmissible Closterovirus, J. General Virology 78:2067-71 (1997), uvedené v citáciách).
Vyladávanie v databáze pre sekvenciu aminokyselín odvodených od ORFla/lb kódovaného proteínu poukázalo na významnú podobnosť s MT, HEL a PdRP doménami iných klosterovírusov. Oblasť za P-PRO štiepacim miestom vykazuje významnú podobnosť (57,4 % zhoda v 266 zvyškoch) s predpokladanou metyltransferázovou doménou v BYV a obsahovala všetky konzervatívne motívy, typické pozitívne rameno RNA vírusového typu I MT (Obrázok 3B) . Časť C-zakončenia v ORFla bola identifikovaná ako helikázová doména, ktorej sekvencia ukázala vysokú podobnosť (57,1 % zhoda v 315 zvyškoch) s helikázovou doménou v BYV a obsahovala sedem znakov konzervatívnych motívov pozitívneho ramena RNA vírusov pre Superrodinu I helikázy (Obrázok 3C) (Hodgman, „A New Superfamily of Replicative Proteins, Náture 333:22-23 (1988); Koonin a Dolja, „Evolution and Taxonomy of Positive-strand RNA Viruses: Implications of Comparative Analysis of Amino Acid Sequences, Crit. Rev, in Biochem. and Mol. Biol. 28:375-430 (1993), obe uvedené v citáciách).
ORFlb kódoval 460 aminokyselinový polypeptid s molekulovou hmotnosťou 52 486 Da, počítané z miesta rámcového posunu. Vyladávanie v databáze pre RdRP poukázalo na významnú podobnosť s RdRP doménami pozitívneho reťazca RNA vírusov. Porovnanie RdRP domén z GLRaV-2 a BYV poukázalo na prítomnosť osem konzervatívnych motívov v RdRP (Obrázok 3D).
Ako je ukázané na Obrázku 8, provizorný fylogenetický strom pre RdRP z GLRaV-2 vzhľadom k iným klosteroví rusom je v úzkom vzťahu k monopartitným klosterovírusom BYV, BYSV a CTV.
Bolo navrhnuté, že v klosterovírusoch sa uplatňuje mechanizmus +1 rámcového posunu pri expresii ORFlb, ako veľkého fúzneho proteínu s ORFla (Agranovsky a spol., „Beet Yellows Closterovirus: Complete Genome Structure and Identification of a Papain-like Thiol Protease, Virology 198:311-24 (1994);
Karasev a spol., „Complete Sequence of the Citrus Tristeza Vírus RNA Genome, Virology 208:511-20 (1995); Klaasen a spol., „Genome Structure and Phylogenetic Analysis of Lettuce Infectious Yellows Virus, a Whitefly-Transmitted, Bipartite Closterovirus, Virology 208:99-110 (1995); Karasev a spol., „Organization of the 3'-Terminál Half of Beet Yellow Stunt Virus Genome and Implications for the Evolution of Closteroviruses, Virology 221:199-207 (1996); Jelkmann a spol., „Complete Genome Structure and Phylogenetic Analysis of the Little Cherry Virus, a Mealybug-Transmissible Closterovirus, J. General Virology, 78:2067-71 (1997), všetky uvedené v citáciách) . Verí sa, že v prekrývajúcej ORFla/lb oblasti v BYV, prešmykovacia sekvencia GGGUUUA a dve vlasové štruktúry (slučka a pseudouzol), vytvárajú +1 rámcový posun (Agranovsky a spol., „Beet Yellows Closterovirus: Complete Genome Structure and Identification of Papain-like Thiol Protease, Virology 198:311-24 (1994), uvedené v citáciách). Žiadna z týchto štruktúr nie je konzervovaná v CTV a BYSV (Karasev a spol., „Complete Sequence of the Citrus Tristeza Virus RNA Genome Virology 208:511-20 (1995); Karasev a spol., „Organization of the 3'-Terminál Half of Beet Yellow Stunt Virus Genome and Implications for the Evolution of Closteroviruses, Virology 221:199-207 (1996), obe uvedené v citáciách) v ktorých bola navrhnutá ribozomálna medzera na zakončení alebo vzácnom kodóne tak, aby vykonávali rovnakú funkciu. Porovnanie nukleotidovej sekvencie v oblasti C-zakončenia helikázy a oblasti N-zakončenia RdRP v GLRaV-2 s rovnakou oblasťou iných klosterovírusov ukázalo významnú podobnosť s BYV, BYSV a CTV. Ako je ukázané na Obrázku 4, terminačné UAG na konci C'-koncovej helikázy v GLRaV-2 súhlasí s koncovým UAG z BYV a BYSV a arginín GGG kodónom z CTV.
ORF2 kóduje malý proteín tvorený 171 bp (57 aminokyselín) molekulovej hmotnosti 6 297 Da. Podlá predpokladu, odvo80 dená sekvencia aminokyselín obsahuje oblasť nepolárnych aminokyselín a predpokladá sa, že tvoria transmembránový helix. Malý hydrofóbny analógny proteín je tiež prítomný v BYV, BYSV, CTV, LIYV a LChV (Agranovsky a spol., „Nucleotide sequence of the 3'-Terminál Half of Beet Yellows Closterovirus RNA Genome Unique Arrangement of Eight Virus Genes, J. General Virology 72:15-24 (1991); Karasev a spol., „Organization of the 3'Terminál Half of the Beet Yellow Stunt Virus Genome and Implications for the Evolution of Closteroviruses , Virology 221:199-207 (1996); Pappu a spol., „Nucleotide Sequence and Organization of Eight 3' Open Reading Frames of the Citrus Tristeza Closterovirus Genome, Virology 199:35-46 (1994); Klaasen a spol., „Partial Characterization of the Lettuce Infectious Yellows Virus Genomic RNAs, Identification of the Coat Protein Gene and Comparison of its Amino Acid Sequence With Those of Other Filamentous RNA Plánt Viruses, J. General Virology, 75:1525-33 (1994); Jelkmann a spol., „Complete Genome Structure and Phylogenetic Analysis of the Little Cherry Virus, a Mealybug-Transmissible Closterovirus, J. General Virology, 78:2067-71 (1997), všetky uvedené v citáciách).
ORF3 kóduje 600 aminokyselinový polypeptid molekulovej hmotnosti 65 111 Da, ktorý je homológny s HSP70 bunkovým proteínom tepelného šoku. V klosterovírusoch je HSP70 vysoko konzervatívny a je pravdepodobne zapojený do ATP aktivity a zúčastňuje sa interakcie proteín - proteín pre chaperónovú aktivitu (Agranovsky a spol., „The Beet Yellows Closterovirus p65 Homologue of HSP70 Chaperones has ATPase Activity Associated with its Conserved N-terminal Domain but Interact with Unfolded Protein Chains, J. General Virology 78:353-42 (1997); Agranovsky a spol., „Bacterial Expression and Some
Properties of the p65, a Homologue of Celí Heat Shock Protein HSP70 Encoded in RNA Genome of Beet Yellows Closterovirus, Doklady Akadémii Náuk 340:416-18 (1995); Karasev a spol., „HSP70-Related 65-kDa Protein of Beet Yellows Closterovirus is a Microtubule-Binding Protein, FEBS Letters 304:12-14 (1992), všetko uvedené v citáciách).
Ako zaznamenáva Obrázok 5, porovnanie úplného ORF3 z GLRaV-2 s HSP70 homológom z BYV ukázalo na prítomnosť ôsmych konzervatívnych motívov. Percento podobnosti HSP70 medzi GLRaV-2 a BYV, BYSV. CTV, LIYVa LChV je 47,8 %, 47,2 %, 38,6 %, 20,9 % a 17,7 %.
ORF4 kóduje 551 aminokyselinový proteín molekulovej hmotnosti 63 349 Da. Vyhladávanie v databáze pre proteínový produkt ORF4 nezistilo podobné proteíny s výnimkou jeho náprotivných proteínov v klosterovírusoch, BYV (P64), BYSV (P61), CTV (P61), LIYV (P59) a LChV (P61). Verí sa, že tento proteín je predpokladaný proteín tepelného šoku 90. Ako je ukázané na Obrázku 9, boli prítomné dva konzervatívne motívy v BYV (Agranovsky a spol., „Nucleotide Sequence of the 3'Terminál Half of Beet Yellows Closterovirus RNA Genome Unique Arrangement of Eight Virus Genes, J. General Virology, 72:15-24 (1991) a CTV (Pappu a spol., „Nucleotide Sequence and Organization of Eight 3'0pen Reading Frames of the Citrus Tristeza Closterovirus Genome, Virology 199:36-46 (1994), uvedené v citáciách) boli tiež identifikované v ORF4 z GLRaV-2.
ORF5 a ORF6 kódujú polypeptidy molekulovej hmotnosti 42 803 Da a 21 661 Da. Počiatočný kodón pre oba ORF má výhodné predpoklady pre transláciu. Na základe porovnania sekvencie s inými klosterovírusmi bol ORF6 identifikovaný ako gén pre povrchový proteín v GLRaV-2. Vypočítaná molekulová hmotnosť proteínového produktu ORF6 (21 662 Da) súhlasí s predtým stanovenou hmotnosťou 22~26 kDa na základe SDS-PAGE elektroforézy (Zimmermann a spol., „Characterization and Serological Detection of Four Closterovirus-like Particles Associated with Leafroll Disease on Grapevine, J. Phytopathology 130:205-18 (1990); Boscia a spol., „Nomenclature of Grapevine Leafroll-Associated Putative Closteroviruse, Vitis 34:171-75 (1995), uvedené v citáciách).
Predpokladaná sekvencia aminokyselín odvodená od ORF6 v GLRaV-2 bola vyhľadávaná v databáze a ukázala sa podobnosť s povrchovými proteínmi klosterovírusov, BYV, BYSV, CTV, LIYV, LChV a GLRaV-3. Na úrovni nukleotidov, najvyššie percento podobnosti bolo s povrchovým proteínom v BYSV (34,8 %); na úrovni aminokyselín najvyššie percento podobnosti bolo s povrchovými proteínmi v BYV (32,7 %) a BYSV (32,7 %) . Ako je ukázané na Obrázku 6A, orientácia sekvencie aminokyselín povrchového proteínu a duplikátu povrchového proteínu v GLRaV-2 vzhľadom k iným klosterovírusom ukázali, že v ORF5 a ORF6 z GLRaV-2 boli prítomné nezmenené aminokyselinové zvyšky (N. R. G. D.). Verí sa, že dva z týchto aminokyselinových zvyškov (R a D) sú zapojené do stabilizácie molekúl tvorbou soľných mostíkov a vhodným zložením naj konzervatívnejšej centrálnej oblasti povrchových proteínov všetkých filamentných rastlinných vírusov (Dolja a spol., „Phylogeny of Capsid Proteins of Rod-Shaped and Filamentous RNA Plánt Viruses Two Families With Distinct Patterns of Sequence and Probably Structure Conservation, Virology 184:79-86 (1981), uvedené v citáciách).
Identifikácia ORF6 ako génu pre povrchový proteín bola ďalej potvrdená Western blotom po expresii fúzneho proteínu skladajúceho sa z 22 kDa proteínu z ORF6 CP a 42 kDa proteínu viažuceho maltózu, tvoreného transformovanými E. coli tak, ako je popísané v Príklade 5 vyššie. Ako je zaznamenané na Obrázku 6B, predpokladaný fylogenetický strom pre povrchový proteín a duplikát povrchového proteínu v GLRaV-2 a pre iné klosterovírusy ukázalo, že GLRaV-2 je viac bližší k hmyzom prenášaným klosterovírusom (BYV, BYSV a CTV) (Candresse, „Closteroviruses and Clostero-like Elongated Plánt Viruses, Encyclopedia of Virology, str. 242-48, Webster and Granoff, vyd., Academic Press, New York (1994), uvedené v citáciách), ako ku klosterovírusom prenášaným whitefly (LIYV, muška z Aleyrodidae) alebo mealybug prenášaným klosterovírusom (rod Pseudococcus) (LChV a GLRaV-3) (Raine a spol., „Transmission of the Agent Causing Little Cherry Disease by the Apple Mealybug Phenacoccus aceris and the Dodder Cuscuta Lupuliformis, Canadian J. Plánt Pathology 8:6-11 (1986);, Jelkmann a spol., „Complete Genome Structure and Phylogenetic Analysis of Little Cherry Virus, a Mealybug-Transmissible Closterovirus, J. General Virology 78:2067-71 (1997); Rosciglione a Gugerli, „Transmission of Grapevine Leafroll Disease and an Associated Closterovirus to Healthy Grapevine by the Mealybug Planococcus ficus, Phytoparasitica 17:63 (1989); Engelbrecht a Kasdorf, „Transmission of Grapevine Leafroll Disease and Associated Closteroviruses by the Vine Mealybug Planococcusficus, Phytophlactica, 22:341-46 (1990); Cabaleiro a Segura, 1997; Petersen a Charles, „Transmission of Grapevine Leafroll-Associated Closteroviruses by Pseudococcus longispinus and P. calceolariae. Plánt Pathology 46:509-15 (1997), všetko uvedené v citáciách.
ORF7 kóduje 162 aminokyselinový polypeptid molekulovej hmotnosti 18 000 Da a ORF8 kóduje 206 aminokyselinový polypeptid molekulovej hmotnosti 23 659 Da. Vyhľadávanie v databáze pre polypeptidy kódované ORF7 a ORF8 neukázalo významnú podobnosť so žiadnymi proteínmi. Avšak tieto gény mali podobnú veľkosť a lokalizáciu ako gény zistené v sekvenciách iných klosterovírusov, BYV (P20, P21) , BYSV (P18, P22) , a LChV (P21, P27) (Obrázok 27) . Konzervatívne oblasti však neboli zistené v ORF7 alebo ORF8 a v čítacích rámcoch ORF7 a ORFV8 v BYV, BYSV a LChV.
3' terminálna nepreložená ( untranslated) oblasť (3'UTR) obsahuje 216 nukleotidov. Analýza sekvencie nukleotidov ukázala dlhý oligo(A) úsek v blízkosti zakončenia genómu v GLRaV-2, ktorý je podobný genómu zistenému v BYV a BYSV (Agranovsky a spol., „Nucleotide sequence of the 3'-Terminál Half of Beet Yellows Closterovirus RNA Genome Unique Arrangement of Eight Virus Genes, J. General Virology 72:15-24 (1991); Karasev a spol., „Organization of the 3'-Terminál Half of Beet Yellow Stunt Virus Genome and Implication for the Evolution of Closteroviruses, Virology 221:199-207 (1996) uvedené v citáciách). Genóm v BYV je zakončený CCC, v BYSV a CTD je zakončený CC s dodatočnými G alebo A v dvojvláknitej replikačnej forme v BYSV (Karasev a spol., „Organization of the 3'-Terminál Half of Beet Yellow Stunt Virus Genome and Implications for the Evolution of Closteroviruses, Virology 221:199-207 (1996) uvedené v citáciách) a CTV (Karasev a spol., „Complete Sequence of the Citrus Tristeza Virus RNA Genome, Virology 208:211-20 (1995), uvedené v citáciách). GLRaV-2 má CGC na 3' zakončení genómu. Nedávno bol identifikovaný konzervatívny cis-element v 3'-UTR v troch monopartitných klosterovírusoch, čo predstavuje hlavnú os a slučku štruktúry (Karasev a spol., 1996). Ako zaznamenáva Obrázok 10, porovnanie orientácie 3'-UTR sekvencie v GLRaV-2 s tými istými oblasťami v BYV, BYSV a CTV ukazuje na prítomnosť rovnakej konzervatívnej 60 nt oblasti. Napriek tomuto cis-elementu, konzervatívne sekvencie neboli nájdené v 3'UTR v GLRaV-2, BYV, BYSV a CTV.
Doposiaľ študované klosterovírusy (napr. BYV, BYSV, CTV, LIYV, LChV a GLRaV-3) majú zjavnú podobnosť v organizácii genómu, čo sa týka replikačných génov MT, HEL a RdRP s konzervatívnymi doménami a výnimočného usporiadania piatich génov pre klosterovírusy (Dolja a spol., „Molecular Biology and
Evolution of Closteroviruses: Sophisticated Built-up of Large RNA Genome s, Annual Rev. Photopathology 32:261-85 (1994); Agranovsky „Principles of Molecular Organization, Expression, and Evolution of Closteroviruses: Over the Barriers, Adv. in Virus Res. 47:119-218 (1996); Jelkmann a spol., „Complete Genome Structure and Phylogenetic Analysis of Little Cherry Virus, a Mealybug-Transmissible Closterovirus, J. General Virology 78:2067-71 (1997); Ling a spol., „Nucleotide Sequence of the 3' Terminál Two-Third of the Grapevine Leafroll Associated Virus-3 Genome Reveals a Typical Monopartite Closterovirus, J. General Virology 79(5):1289-1301 (1998), všetko uvedené v citáciách).
Vyššie uvedené údaje jasne ukazujú, že GLRaV-2 je klosterovírus. V genóme GLRaV-2 boli identifikované dve papaínu podobné proteázy a predpokladalo sa autoproteolytické štiepenie. Boli tiež identifikované proteíny spojené s replikáciou obsahujúce konzervatívne motívy MT, HEL a RdRP, ktoré sú fylogenetický v blízkom vzťahu k proteínom spojených s replikáciou v iných klosterovírusoch. V GLRaV-2 bolo tiež zachované výnimočné genetické usporiadanie, vrátane malého hydrofóbneho transmembránového proteínu, HSP70 homológu, HSP90 homológu, divergentného CP a CP. Okrem toho, vypočítaná molekulová hmotnosť (21 661 Da) povrchového proteínu (ORF6) v GLRaV-2 dobre súhlasí s molekulovou hmotnosťou iných klosterovírusov (22 až 28 kDa) (Martelli a Bar-Joseph, „Closteroviruses: Classification and Nomenclature of Víruse s , Fifth Report of the International Committee on Taxonomy of Viruses, Francki a pol., vyd., Springer-Verlag Wein, New York, str. 345-47 (1991); Candresse a Martelli „Genus Closterovirus, v Virus Taxonomy, Report of the International Committee on Taxonomy of Viruses, Murphy a spol., vyd.,
Springer-Verlag., NY, str. 461-63 (1995) uvedené v citáciách).
Dva ORF v smere nadol po vlákne v CP majú rovnakú veľkosť a umiestnenie ako v genóme BYV. Okrem toho, neprítomnosť poly(A) na 3' zakončení v GLRaV-2 tiež dobre súhlasí s inými klosterovírusmi. Uvažuje sa o tom, že podobne ako vo všetkých ostatných klosterovírusoch, sa expresia ORF1 uskutočňuje cez +1 ribozomálny rámcový posun a 3' proximálne ORF sú pravdepodobne exprimované cez tvorbu zhlukov subgenómových RNA. Keďže prešmykovacia sekvencia, os-slučka a pseudouzlova štruktúra obsiahnuté v rámcovom posune BYV chýbajú v GLRaV-2, +1 rámcový posun v GLRaV-2 môže byť ten istý ako sa predpokladá pre CTV (Karasev a spol., „Complete Sequence of the Tristeza Virus RNA Genome, Virology 208:211-20 (1995), uvedené v citáciách) a BYSV (Karasev a spol., „Organization of the 3'-Terminál Half of Beet Yelow Stunt Virus Genome and Implications for the Evolution of Closteroviruses, Virology 221:199-207 (1996), uvedené v citáciách).
GLRaV-2 je v bližšom vzťahu k monopartitným klosterovírusom BYV, BYSV a CTV ako ku GLRaV-3 (Obrázok 7) (Ling a spol., „Nucleotide Sequence of the 3' Terminál Two-Thirds of Grapevine Leafroll Associated Virus-3 Genome Reveals a Typical Monopartite Closterovirus, J. General Virology 79(5): 1289-1301 (1998), uvedené v citáciách), dokonca aj keď GLRaV3 spôsobuje podobné symptómy ako zvinutka viniča (Rosciglione a Gugerli, „Maladies de 1'Enroulement et du Bois Strie de la Vigne: Analyse Microscopique et Serologique (Leafroll and Stem Pitting of Grapevine: Microscopical and Serological Analysis), Rev. Suisse Viticult Arboricult Horticulture 18:207-11 (1986); Hu a spol., „Characterization of Closterovirus-Like Particles Associated with Grapevine Leafroll Disease, J. Phytopathology 128:1-14 (1990), uvedené v citáciách).
Klosterovírusy tvoria rôznu skupinu s komplexnou a heterológnou organizáciou genómov. Doteraz je GLRaV-2 jediným klosterovírusom, ktorý má podobnú organizáciu genómu ako BYV, typický člen rodu Closterovirus. Okrem toho, genómová RNA v GLRaV-2 má približne rovnakú veľkosť ako genómová RNA v BYV; avšak prenosný vektor v GLRaV-2 nie je známy. Organizácia genómu v GLRaV-2 je bližšia ku klosterovírusom prenášaných hmyzom (BYV a CTV) ako ku „whitefly (LIYV) alebo ku klosterovírusom prenášaných „mealybug (LChV a GLRaV-3). Je teda možné, že GLRaV-2 je prenášaný hmyzom. Pokusy s GLRaV-2 prenášaným hmyzom by mali poskytnúť informáciu, ktorá by mohla pomôcť vyvinúť spôsoby pre ďalšiu kontrolu GLRaV-2.
Celkovo bolo klónovaných a sekvenovaných 15 500 nukleotidov čo je viac ako 95 % zo stanoveného genómu GLRaV-2. GLRaV-2 a GLRaV-3 (Ling a spol., „Nucleotide Sequence of the 3' Terminál Two-Thirds of the Grapevine Leafroll Associated Virus-3 Genome Reveals a Typical Monopartite Closterovirus, J. General Virology 79(5):1289-1301 (1998), uvedené v citáciách) sú prvé klosterovírusy spojené so zvinutkou viniča, ktoré boli temer úplne sekvenované. Vyššie uvedené údaje jasne potvrdzujú zaradenie GLRaV-2 do rodu Closterovirus. Okrem toho, informácia týkajúca sa genómu GLRaV-2 poskytne lepšie pochopenie GLRaV-2 a podobných vírusov a rozšíri základné vedomosti o skupine klosterovírusov.
Príklad 7 - Konštrukcia CP génu v GLRaV-2 v rastlinnom expresnom vektore
Viniče Vitis vinifera, cv Pinoi Noir z viníc centrálnej oblasti štátu New York, boli infikované GLRaV-2 a použité na izoláciu vírusu, z ktorého bol identifikovaný cp gén GLRaV-2. Na základe informácie o sekvencií, boli navrhnuté dva oligonukleotidové priméry. Primér so zmyslom CP-96F (SEQ. ID. No. 21) začína od ATG iniciačného kodónu génu pre povrchový protein a komplementárny primér CP-96R (SEQ. ID. No. 22) začína od 56 nukleotidov v smere nadol po vlákne od stop kodónu CP génu. Na uľahčenie klónovania je vložené na začiatok oboch primérov Nco I reštrikčné miesto (11 bp v SEQ. ID. No. 21 a 13 bp v SEQ. ID. No. 22). Gén pre povrchový proteín v GLRaV-2 bol amplifikovaný z dsRNA extrahovanej z GLRaV-2 infikovaných viničov použitím reverznej transkripčnej polymerázovej reťazovej reakcie (RT-PCR). PCR-amplifikovaný CP produkt bol prečistený na agarózovom géli s nízkym bodom topenia, netrávený Nco I a klónovaný do expresného vektora pEPT8 tej istej rastliny po natrávení enzýmom (Obrázku 11) . Po vyhodnotení bola skontrolovaná orientácia rekombinantného konštruktu pomocou interného reštrikčného miesta CP génu a CP gén bol priamo sekvenovaný. Rekombinantný konštrukt translatovatelnej (sense) plnej dĺžky génu pre povrchový protein, pEPT8CP-GLRaV-2 sa podrobil ďalšiemu klónovaniu. Rastlinná expresná kazeta, ktorú tvoril 35S-zosilovač dvojitého mozaikového vírusu karfiolu (CaMV), CaMV 35S-promótor, 5' vedúca sekvencia alfalfa mozaikového vírusu (ALMV) RNA4, gén pre povrchový protein v GLRaV-2 (CP-GLRaV-2) a 3'nepreložená oblasť CaMV ako terminátor, bola rozstrihaná použitím EcoR I reštrikčného enzýmu, izolované na agarózovom géli s nízkym bodom topenia a klónované po pôsobení rovnakého reštrikčného enzýmu do binárneho vektora pGA482GG alebo pGA482G (derivát pGA482, (An a spol. „Binary Vectors, v Plánt Molecular Biology Manual, str. A3:1-19, Belvin a Schilperoot, vyd., Kinwer Academic Publishers, Dordrecht, Holandsko (1988), uvedené v citáciách) . Výsledné rekobinantné konštrukty sú pGA482GG/ EPT8CP-GLRaV-2 (uvedené na Obrázku 11A), ktoré obsahujú neomycín fosfotransferázu (npt II) a β-glukuronidázu (GUS) vo vnútornej oblasti T-DNA, a pGA482G/EPT8CP-GLRaV-2 (zaznamenané na Obrázku 11B) bez GUS. Tieto rekombinantné konštrukty boli samostatne vložené elektroporáciou do nevirulentného kmeňa Agrobacterium tumefaciens C58Z707. Agrobacterium tumefaciens obsahujúce vektor boli použité na infikovanie listových diskov napadnutých Nicotiana benthamiana postupom, ktorý popísal Horsch a spol., „A Simple and General Method for Transferring Genes into Plants, Science 277:1229-1231 (1985), uvedené v citáciách.
Príklad 8 - Analýza transgénnych rastlín Nicotiana benthamiana a CP génom v GLRaV-2
NPT II-ELISA: pre detekciu npt II enzýmu bola použitá imunosorbčná enzymatická analýza s dvojitou protilátkou sendvičového enzýmu pomocou kitu NPT II-ELISA (5' prime to 3' prime, Inc., Boulder, Co).
Nepriama ELISA: Boli použité polyklonálne protilátky voči GLRaV-2, ktoré boli pripravené z povrchového proteínu exprimovaného v E. coli. Platničky boli pokryté homogenátom vzoriek v extrakčnom pufri (1:10, hmotnosť/objem) (fosfátový soľný pufer s obsahom 0,05 % Tween 20 a 2 % polyvinyl pyrolidonu) a boli inkubované cez noc pri teplote 4 °C. Po premytí fosfátovým soľným pufrom s obsahom 0,05 % Tween 20 (PBST) boli platničky blokované blokovacím pufrom (fosfátový soľný pufer s obsahom 2 % BSA) a inkubované pri laboratórnej teplote 1 hodinu. Po premytí s PBST bol pridaný anti-GLRaV-2 IgG v koncentrácii 2 pg/ml. Po inkubácii počas 4 hodín pri teplote 30 °C boli platničky premyté PBST a bol pridaný kozí anti-králiči IgG konjugovaný s alkalickou fosfatázou (Sigma) v zriedení 1:10 000. Absorbancia bola meraná pri 405 nm na prístroji MicroELISA AutoReader. Okrem toho sa vykonala Western blot analýza podľa metódy popísanej Hu a spol., „Characterization of Closterovirus-like Particle Associated Grapevine Leafrol Disease, J. Phytophathology 128:1-14 (1990), uvedené v citáciách.
PCR analýza: Genómová DNA bola extrahovaná z listov predpokladaných transgénnych a netransgénnych rastlín podlá metódy popísanej Cheungom a spol., „A Simple and Rapid DNA Microextraction Method for Plants, Animal and Insect Suitable for RAPD and other PCR analysis, PCR Methods and Applications 3:69 (1966), uvedené v citáciách. Extrahovaná celková DNA bola templátom pre PCR reakciu. Pre PCR analýzu boli použité priméry CP-96F a CP-96R (SEQ. ID. No. 21 a 22) pre CP gén v GLRaV-2, rovnako ako npt II 5'- a 3'- priméry. PCR reakcia sa uskutočnila pri teplote 94 °C x 3 min pre jeden cyklus, po ktorom nasledovalo 30 cyklov pri teplote 94 °C x 1 min, pri teplote 50 °C x 1 min a pri teplote 72 °C x 2:30 min s dodatočným predĺžením 10 min pri teplote 72 °C. Produkt PCR bol analyzovaný na agarózovom géli.
Po transformácii sa získalo celkovo 42 kanamycín rezistentných línii (Ro) Nicotiana benthamiana, ktorých vzorky listov boli testované na aktivitu NPT II enzýmu. Medzi nimi bolo 37 línií NPT II pozitívnych, stanovené pomocou ELISA, čo predstavovalo asi 88 % zo všetkých transformovaných rastlín. Avšak medzi vybratými kanamycín rezistentnými rastlinami boli aj niektoré NPT II negatívne rastliny. Všetky transgénne rastliny boli samoopelené v skleníku a semená týchto transgénnych línií sa nechali vyklíčiť pre ďalšie analýzy.
Tvorba GLRaV-2 CP v transgénnych rastlinách bola detekovaná nepriamou ELISA pred inokuláciou a výsledky ukázali, že expresia génu GLRaV-2 CP nebola detekovatelná vo všetkých testovaných transgénnych rastlinách. Tento výsledok bol potom potvrdený Western blotom. Pomocou protilátky voči GLRaV-2 nebola detekovaná tvorba CP v transgénnych a netransgénnych, kontrolných rastlinách. Avšak proteín očakávanej veľkosti (~22 kDa) bol detekovaný v GLRaV-2 infikovaných pozitívnych kontrolných rastlinách. Tento výsledok súhlasil s výsledkom
ELISA. Prítomnosť CP génu z GLRaV-2 v transgénnych rastlinách bola detekovaná z celkovej genómovej DNA extrahovanej z tkaniva rastlín PCR analýzou (Obrázok 12) . Produkt DNA očakávanej velkosti (653 bp) bol amplifikovaný z dvadsiatich testovaných transgénnych línií, ale nie z netransgénnych rastlín. Výsledok naznačuje, že CP gén z GLRaV-2 bol prítomný v transgénnych líniách, čo bolo tiež potvrdené Northern blotom.
Príklad 9 - Ri a R2 transgénne rastliny Nicotiana banthamiana sú rezistentné voči GLRaV-2
Inokulácia transgénnych rastlín: Ako inokulum bol použitý GLRaV-2 izolát 94/970, ktorý bol pôvodne identifikovaný a prenesený z viniča do Nicotiana benthamiana v Južnej Afrike (Goszczynski a spol., „Detection of Two Strains of Grapevine Leafroll-Associated Virus 2, Vitis 35:133-35 (1996), uvedené v citáciách). CP gén z izolátu 94/970 bol sekvenovaný; a je identicky s CP génom použitým pri konštrukcii. Nicotiana benthamiana je pokusným hostitelom pre GLRaV-2. Infikovanie rastliny spôsobuje chlorózne a prípadne nekrotické lézie s nasledovným zosvetlením ciev. Zosvetlenie ciev predchádza nekróze ciev. Infikované rastliny môžu prípadne uhynúť, v smere od vrchu dole.
Vo vývojovom štádiu piatich až siedmich listov, boli dva najmladšie apikálne listy infikované GLRaV-2 izolátom 94/970. Inokulum bolo pripravené rozdrvením 1,0 g GLRaV-2 infikovaných tkanív listov z Nicotiana benthamiana v 5 ml fosfátového pufru (0,01 M K2HPO4, pH 7,0). Testované rastliny boli rozdrvené na prášok pomocou karbidu kremíka a bolo pridané pripravené inokulum. Súčasne boli inokulované netrasformované rastliny tak, ako je uvedené vyššie. U rastlín sa sledoval vývoj symptómov každý druhý deň počas 60 dní po inokulácii. Rezistentné R1 transgénne rastliny boli zdrojom R2 generácie, ktorá bola ďalej hodnotená.
Rastlinné potomstvá z 20 Ro línií boli počiatočné hodnotené pre rezistenciu voči GLRaV-2 po inokulácii GLRaV-2 izolátom 94/970. Semená transgénnych rastlín (NPT II pozitívne) a netransformovaných kontrolných rastlín boli inokulované GLRaV-2. Po inokulácii boli reakcie testovaných rastlín rozdelené do troch typov: vysoko citlivé (odpovedatelné) (t. zn. typické symptómy boli pozorované dva až štyri týždne po inokulácii) ; tolerantné (t. zn. žiadne symptómy sa nevyvinuli v skorom štádiu a typické symptómy sa ukázali štyri až osem týždňov po inokulácii); a rezistentné (t. zn. zostávajú asymptomatické osem týždňov po inokulácii). Na základe reakcie rastliny, rezistentné rastliny boli získané zo štrnástich rôznych línií (uvedené v tabulke nižšie). V rastlinách každej z týchto štrnástich línii nebol detekovaný žiaden vírus po 6 týždňoch od inokulácie pomocou ELISA. Naproti tomu GLRaV-2 bol detekovaný v symptomatických rastlinách pomocou nepriamej ELISA. V iných šiestich líniách bolo niekoľko rastlín s určitým posunom vo vývoji symptómov, všetky inokulované transgénne rastliny zahynuli po troch až šiestich týždňoch od inokulácie. Na základe počiatočných výsledkov, bolo vybratých pre ďalšie analýzy päť reprezentačných línií, tvorených troma rezistentnými líniami (1, 4 a 19) a dvoma citlivými líniami (12 a 13) .
Tabuľka 1
č. línie č. Reakcia HS testovaných T rastlín HR
línia 1 39 14 3 22
línia 2 36 7 6 23
línia 3 38 11 4 23
línia 4 31 4 5 22
línia 5 33 6 13 14
línia 6 36 4 16 16
línia 7 32 5 9 18
línia 8 37 22 9 6
línia 9 36 9 12 15
línia 10 14 13 1 0
línia 11 13 11 2 0
línia 12 17 16 1 0
línia 13 16 14 0 0
línia 14 17 17 0 0
línia 15 32 30 2 0
línia 16 33 6 13 14
línia 17 12 0 1 11
línia 19 15 0 0 15
línia 20 19 3 0 16
línia 21 14 1 3 10
kontrola 15 15 0 0
č. línie: predstavuje transgénne línie a netransformované
kontroly;
č.: počet transgénnych a netransformovaných rastlín;
HS: vysoko citlivé, typické symptómy boli pozorované dva až štyri týždne po inokulácii;
T: tolerantné, symptómy boli pozorované päť až osem týždňov po inokulácii;
HR: rastliny bez symptómov po ôsmych týždňoch od inokulácie.
Tabuľka 2 nižšie zaznamenáva vývoj symptómov v transgénnych rastlinách v porovnaní s netransgénnymi rastlinami u piatich vybraných línií z rôznych pokusov. Netransgénne kontrolné rastliny boli infikované dva až šesť týždňov po inokulácii a vykazovali typické GLRaV-2 symptómy u Nicotiana benthamiana, vrátane chlorózy a lokálnych lézií s nasledovným zosvetlením ciev a cievnou nekrózou na listoch. Tri z testovaných línií (1, 4 a 19) vykazujú rezistenciu, ktorá sa prejavila buď neprítomnosťou alebo oddialením vývoja symptómov. Dve ďalšie línie, 12 a 13, vyvinuli symptómy temer súčasne ako netransformované kontrolné rastliny. Zhora nadol, listy infikovaných rastlín postupne žltli, slabli, vyschýnali a prípadne uhynuli celé rastliny. Nezávisle na tom, kedy sa infekcia vyskytla, prípadný výsledok bol rovnaký. Šesť týždňov po inokulácii uhynuli všetky netransgénne rastliny a citlivé rastliny. Niektoré tolerantné rastliny začali hynúť. Naproti tomu asymptomatické rastliny kvitli normálne a tvorili peľ tak, ako neinokulované zdravé kontrolné rastliny (Obrázok 13) .
Tabuľka 2
č. línie č. Reakcia HS testovaných T rastlín HR
línia 1 19 5 6 8
línia 4 15 9 1 5
línia 12 16 14 2 0
línia 13 18 13 5 0
línia 19 13 10 0 3
netransgénna 24 23 1 0
č. línie: predstavuje transgénne línie a netransformované kontroly;
č.: počet transgénnych a netransformovaných rastlín;
HS: vysoko citlivé, typické symptómy boli pozorované dva až štyri týždne po inokulácii;
T: tolerantné, symptómy boli pozorované päť až osem týždňov po inokulácii;
HR: rastliny bez symptómov po ôsmych týždňoch od inokulácie.
ELISA analýza pre testovanie GLRaV-2 replikácie v rastlinách bola uskutočnená 6 týždňov po inokulácii. Zvýšená hladina CP odrážala replikáciu vírusu. Výsledok ukázal, že absorbancia v symptomatických rastlinách dosiahla hodnotu (OD) 0,7 až 3,2, na rozdiel od hodnoty (OD) 0,10 až 0,13 pred inokuláciou. Naproti tomu GLRaV-2 nebol detekovaný v asymptomatických rastlinách, ktorých hodnota absorbancie bola rovnaká alebo skoro rovnaká ako pre zdravé netransformované kontrolné rastliny. Výsledky potvrdili, že vírus sa replikoval v symptomatických rastlinách, ale nie v asymptomatických rastlinách. Replikácia GLRaV-2 bola potlačená v asymptomatických rastlinách. Tento výsledok naznačuje, že na vzniku rezistencie sa zúčastňuje iný mechanizmus ako CP-sprostredkovaná rezistencia.
Tri R2 potomstvá odvodené od transgénnych rezistentných rastlín z línií 1, 4 a 19 rástli a bola v nich hodnotená stabilná transmisia a či je zachovaná rezistencia v R2 generácia. Tieto výsledky zaznamenáva Tabuľka 3 nižšie. NPT II analýza ukázala, že R2 potomstvá boli stále oddelené. Expresia CP v R2 potomstve bola stále nedetekovatelná. Po inokulácii všetky netransgénne rastliny boli infikované a vykazovali GLRaV-2 symptómy na listoch 24 dní po inokulácii. Naproti tomu inokulované transgénne R2 potomstvo vykazovalo rozdielnu úroveň rezistencie v porovnaní s citlivými a vysoko rezistentnými rastlinami. Tolerantné a rezistentné rastliny sa prejavili oddialením vývoja symptómov a neprítomnosťou symptómov. 6 týždňov po inokulácii bol GLRaV-2 detekovaný v tolerantných symptomatických infikovaných rastlinách nepriamou ELISA; ale nie v asymptomatických rastlinách. Tento výsledok znamená, že replikácia vírusu bola potlačená v týchto rezistentných rastlinách, čo bolo potvrdené Western blotom. Tieto rezistentné rastliny zostali asymptomatickými osem týždňov po inokulácii, kvitli a tvorili peľ.
Tabuľka 3
č. línie počet NPT poz/neg HS Reakcia rastlín
T HR
línia 1/22 12 12/20 3 3 6
línia 1/30 11 8/3 7 2 2
línia 1/31 11 10/1 6 3 2
línia 1/35 10 10/0 4 6 0
línia 1/41 8 7/1 2 2 4
línia 4/139 12 11/1 4 4 3
línia 4/149 10 7/3 4 5 1
línia 4/152 10 8/2 9 0 1
línia 4/174 9 8/1 4 0 4
línia 19/650 11 10/1 7 0 2
línia 19/657 12 12/0 6 2 4
línia 19/659 12 8/4 5 2 5
línia 19/660 10 8/2 3 6 1
netransform. 12 0/12 12 0 0
CK
HS: vysoko citlivé, typické symptómy boli pozorované dva až
štyri týždne po inokulácii;
T: tolerantné, symptómy boli pozorované päť až osem týždňov po inokulácii;
HR: rastliny zostávajú bez symptómov v ôsmom týždni od inokulácie.
Príklad 10 - Dôkaz SNA-sprostredkovanej ochrany v transgénnych rastlinách
Northern blot analýza: Celková RNA bola extrahovaná z listov pred inokuláciou podlá metódy popísanej Napoli a spol., Plánt Celí 2:279-89 (1990), uvedené v citáciách. Koncentrácia extrahovanej RNA bola meraná spektrofotometricky pri OD 260. Asi 10 g celkovej RNA bolo použitých pre každú vzorku. Použitá sonda bola 3'jedna tretina GLRaV-2 CP génu, ktorá bola označená 32P(a-dATP) za použitia Klenow-ovho fragmentu DNA polymerázy I.
Následné použitie DNA zodpovedajúcej 3' jednej tretine CP génu ako sondy, po Northern hybridizácii ukázalo jeden prúžok RNA extrahovanej z citlivých rastlín R1 potomstva línií 5, 12 a 13. Nebol detekovaný žiaden alebo slabý signál v transgénnych rastlinách R1 potomstva línií 1, 4 a 19. Táto RNA nie je prítomná v netransformovaných, kontrolných rastlinách. Veľkosť hybridizačného signálu bola stanovená približne 0,9 kb nukleových kyselín, čo bola približne rovnaká veľkosť ako vypočítaná (Obrázok 14). V R2 potomstve línií 1, 4 a 19 bola úroveň rovnovážneho stavu expresie RNA nízka. Tieto údaje ukazujú, že citlivé rastliny z línií 12 a 13 majú vysokú hladinu mRNA a všetky transgénne rastliny z línií 1, 4 a 19 majú nízku hladinu mRNA.
Príklad 11 - Transformácia a analýza transgénneho viniča s CP génom z GLRaV-2
Rastlinný materiál: Boli použité zakorenené kultivary Couderc 3309 (3309C) [V. riparia x V. rupestris), Vitis riparia „Gloire de Montpellier (Gloire), Teleki 5C (5C) (V. berlandieri x V. riparia), Millardet et De Grasset 101-14 (101-14 MGT) (V. riparia x V. rupestris) a Richter 110 (HOR) (V. rupestris x V. berlandieri). Pôvodné embryogenické cali z
Gloire boli od Mozsar a Sule (Plánt Protection Inštitúte, Hungarian Academy of Science, Budapešť). Všetok ostatný rastlinný materiál pochádzal z viníc štátu New York, Agricultural Experiment Station, Geneva, NY. Zo zhlukov boli odobraté púčky a boli povrchovo sterilizované v 70 % etanole 1 až 2 minúty. Púčky (zo skleníka a póla) boli prenesené do 1 % hypochloridu sodného na 15 minút, potom opláchnuté trikrát sterilnou, dvakrát destilovanou vodou. Z kvetných púčkov boli aseptický odobraté tyčinky pomocou streomikroskopu. Peľ na mikroskopickom sklíčku pod krycím sklíčkom bol zafarbený acetokarmínom, čo umožnilo určiť cytologický stav. Toto sa uskutočňovalo pre to, aby sa stanovilo najvýhodnejšie štádium pre indukciu kalusu.
Somatická embryogenéza a regenerácia: V aseptických podmnienkach bolo 40 až 50 tyčiniek umiestnených na Petriho misku s priemerom 9 cm s obsahom MSE. Petriho misky boli inkubované pri 28 °C za tmy. Bol iniciovaný kalus a po 60 dňoch boli indukované embryá, ktoré boli pre diferenciáciu prenesené do HMG média bez hormónov. Embryá v torpédovom štádiu boli potom prenesené z HMG média do MGC média, čo umožnilo vývoj embryí. Kultúry boli udržiavané v tme pri teplote 26 až 28 °C a prenesené do čerstvého média v 3 až 4-týždňových intervaloch. Predĺžené embryá boli prenesené do zakoreňovacieho média v malých nádobkách (5 až 8 embryí v nádobke). Embryá rástli v miestnosti pre tkanivové kultúry pri teplote 25 °C a 16 hodinovom svetelnom režime (76:mol.s), čo umožňovalo tvorbu výhonku a koreňa. Po tom, ako rastliny vyvinuli korene, boli zasadené do zeme v sklenníku.
Transformácia: Použitý protokol pre transformáciu bol modifikovanou metódou pôvodne popísanou Scorza a spol., „Transformation of Grape (Vitis vinifera) Zygotic-derived Somatic Embryos and Regeneration of Transgenic Plants, Plánt
Celí Rpt. 14:589-92 (1995), uvedené v citáciách. Kultúry kmeňa Agrobacteriuia C58Z707 alebo LBA4404 rástli cez noc v LB médiu pri teplote 28 °C v inkubátore za pohybu. Baktérie boli centrifugované 5 minút pri 3 000 až 5 000 rpm a potom boli resuspendované v MS kvapalnom médiu (OD 1,0 pri A600 nm). Kalusy s embryami boli ponorené do bakteriálnej suspenzie na 15 až 30 minút, blotované za sucha a prenesené do HMG média s- alebo bez- acetosyringonu (100 μΜ). Embryonálne kalusy boli kultivované spolu s baktériami 48 hodín v tme pri teplote 28 °C. Potom bol rastlinný materiál premytý 2 až 3 krát MS kvapalinou s obsahom cefotaximu (300 mg/ml) a carbenicillinu (200 mg/ml). Pre selekciu transgénnych embryí bol materiál prenesený do HMG média s obsahom buď 20 alebo 4 0 mg/L kanamycínu, 300 mg/L cefotaximu a 200 mg/L carbenicillinu. Po spoločnej kultivácii môžu byť embryonálne kalusy prenesené do iniciačného MSE média s obsahom 25 mg/L kanamycínu a tých istých antibiotík, ako je uvedené vyššie. Všetok rastlinný materiál bol inkubovaný za pretrvávajúcej tmy pri teplote 28 °C. Po 3-mesačnom raste v selektívnom médiu boli embryá prenesené do HMG média alebo MGC média bez kanamycínu, čím sa podporil rast emryí. Embryá boli potom prenesené do zakoreňovacieho média bez antibiotík. Netransformované kalusy rástli v rovnakom médiu s- alebo bez-kanamycínu, čím sa potvrdila účinnosť selekcie kanamycínom.
Hoci vynález bol popísaný podrobne pre ilustračné účely, rozumie sa, že takéto podrobnosti sú výlučne len pre tieto účely a ich obmeny môžu byť uskutočnené odborníkmi bez toho, aby sa opustila myšlienka a ciel vynálezu, ktoré sú definované nasledujúcimi patentovými nárokmi.
100
ZOZNAM SEKVENCIÍ (1) VŠEOBECNÉ INFORMÁCIE:
(i) ŽIADATEĽ: Cornell Research Foundation, Inc.
(ii) NÁZOV VYNÁLEZU: Proteíny vírusu zvinutky viniča typu 2 a ich použitie (iii) POČET SEKVENCIÍ: 23 (iv) KONTAKTNÁ ADRESA:
(A) ADRESA: Nixon, Hargrave, Devans&Doyle LLP (B) ULICA: Clinton Square, P.O.Box 1051 (C) MESTO: Rochester (D) ŠTÁT: New York (E) KRAJINA: U.S.A.
(F) POŠTOVÉ SMEROVÉ ČÍSLO: 14603 (v) POČÍTAČOVÉ VYBAVENIE:
(A) TYP MÉDIA: flopy disk (B) POČÍTAČ: IBM PC kompatibilný (C) OPERAČNÝ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1,0, verzia #1,30 (vi) BEŽNÉ APLIKAČNÉ ÚDAJE:
(A) APLIKAČNÉ ČÍSLO:
(B) DÁTUM PODANIA:
(C) KLASIFIKÁCIA:
(vii) ÚDAJE O ŽIADOSTI:
t (A) ČÍSLO ŽIADOSTI: US 60/047 194 (B) DÁTUM PODANIA: 20. mája 1997 (viii) INFORMÁCIE O ZÁSTUPCOVI:
(A) MENO: Goldman Michael L.
(B) REGISTRAČNÉ ČÍSLO: 30 727 (C) REFERENČNÉ ČÍSLO: 19603/1632 (ix) TELEKOMUNIKAČNÁ INFORMÁCIA:
(A) TELEFÓN: (716) 263 1304 (B) FAX: (716) 263 1600
101 (2) Informácia pre SEQ.ID.No.l:
(i) (ii) (xi)
TAAACATTGC
GCTCAGGTTA
AGCGCGATCG
GCGGAGGTAG
CCGCAGCGCG
ACAGGGGTGG
GGCGGTGACA
AGCGTGCGTA
TCACTCGCCG
AAATTTCCAC
CATATGAGGT
GGAATGTGGC
GCTTGTGGCA
GACTCTGCTT
GATCCGACAT
CCTAAAAATA
TCGGGCGGCA
GAACGGGCGG
TGCGGCAGAG
AGGAGGAAGG
CGCTCGTTCT
GTGTGCCTTG
TCTGGAGACT
Vlastnosti sekvencie:
(A) Dĺžka: 15 500 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna Typ molekuly: cDNA
Popis sekvencie: SEQ.ID.No.: 1:
GAGAGAACCC CATTAGCGTC TCCGGGGTGA ACTTGGGAAG GTCTGCCGCC 60
TTTATTTCGG CAGTTTCACG CAGCCCTTCG CGTTGTGTCC GCGCCAAGAG 120
TAAAAACGCA ACTTCCACCG GTCAGTGTAG TGAAGGTGGA GTGCGTAGCT 180
CTCCCGACAG GGGCGTGGTC GACAAGAAAC CTACGTCTGT TGGCGTTCCC 240
GTGTGCTTTC TTTTCCGACG GTGGTTCGGA ACCGCGGCGA CGTGATAATC 300
TGCATGAAGC CCTGAAGAAA ATTAAAGACG GGCTCTTACG CTTCCGCGTA 360
TGCGTTTTTC GAGATTTTTC TCATCGAACT ACGGCTGCAG ATTCGTCGCG 420
CGAACACTAC AGTTTGGCTA AATTGCACGA AAGCGAGTGG TGAGAAATTC 480
CCGCGTGCAC GGCGGATTAC GTGGCGATGC TGCGTTATGT GTGTGGCGGG 540
TCGTCCTCAT GAGTAGAGTT ATTTACCCGG ATGGGCGCTG TTACTTGGCC 600
ATTTGTGCGC CTTTTACTGT CGCCCGTTTA GAGAGTCGGA TTATGCCCTC 660
CTACGGTGGC GCGTCTCAGG GCATGCGTTG AGAAGAACTT CGGTGTCGAA 720
TAGCTCTTCG TGGCTATTAC ACCTCTCGCA ATGTTTATCA CTGTGATTAT 780
ATGTAAAATA TTTTAGAAAC CTTTCCGGCC GCATTGGCGG TGGTTCGTTC 840
CTTTAACCTC CGTAATAACG GTGAAGATTA GCGGTCTTCC AGGTGGTCTT 900
TAGCGTTTGG TGCCTTCCTG TGCGATATAC GTTACGTCGA ACCGGTAGAC 960
TTCAATCGAG CGTTAAGACG AAACGTGAAG ATGCGCACCG AACCGTAGAG 1020
CCGGCGGATC CGTCGAGCAA CCGCGACAAA AGAGGATAGA TGAGAAAGGT 1080
TTCCTAGTGG AGGTTTTTCG CATCTCCTGG TCGGCAACCT TAACGAAGTT 1140
TAGCTGCCGG ACTTCTACGC TTTCGCGTTG GCGGTGATAT GGATTTTCAT 1200
CCACCCAAGC GGGCCACCGC TTGCTGGTGT GGCGCCGCTC GAGCCGGAGC 1260
AACTTTACTC ACCATCTAAA AACTTTTTGC GTTACGATGT CTTGCCCTGT 1320
ATGCAGCGAT GTTTTCTTTC GCGGCGGGCG GCCGTTTCCC TTTAGTTTTG 1380
102
ATGACTAGAA TTAGATACCC GAACGGGTTT TGTTACTTGG CTCACTGCCG GTACGCGTGC 1440
GCGTTTCTCT TAAGGGGTTT TGATCCGAAG CGTTTCGACA TCGGTGCTTT CCCCACCGCG 1500
GCCAAGCTCA GAAACCGTAT GGTTTCGGAG CTTGGTGAAA GAAGTTTAGG TTTGAACTTG 1560
TACGGCGCAT ATACGTCACG CGGCGTCTTT CACTGCGATT ATGACGCTAA GTTTATAAAG 1620
GATTTGCGTC TTATGTCAGC AGTTATAGCT GGAAAGGACG GGGTGGAAGA GGTGGTACCT 1680
TCTGACATAA CTCCTGCCAT GAAGCAGAAA ACGATCGAAG CCGTGTATGA TAGATTATAT 1740
GGCGGCACTG ACTCGTTGCT GAAACTGAGC ATCGAGAAAG ACTTAATCGA TTTCAAAAAT 1800
GACGTGCAGA GTTTGAAGAA AGATCGGCCG ATTGTCAAAG TGCCCTTTTA CATGTCGGAA 1860
GCAACACAGA ATTCGCTGAC GCGTTTCTAC CCTCAGTTCG AACTTAAGTT TTCGCACTCC 1920
TCGCATTCAG ATCATCCCGC CGCCGCCGCT TCTAGACTGC TGGAAAATGA AACGTTAGTG 1980
CGCTTATGTG GTAATAGCGT TTCAGATATT GGAGGTTGTC CTCTTTTCCA TTTGCATTCC 2040
AAGACGCAAA GACGGGTTCA CGTATGTAGG CCTGTGTTGG ATGGCAAGGA TGCGCAGCGT 2100
CGCGTGGTGC GTGATTTGCA GTATTCCAAC GTGCGTTTGG GAGACGATGA TAAAATTTTG 2160
GAAGGGCCAC GCAATATCGA CATTTGCCAC TATCCTCTGG GCGCGTGTGA CCACGAAAGT 2220
AGTGCTATGA TGATGGTGCA GGTGTATGAC GCGTCCCTTT ATGAGATATG TGGCGCCATG 2280
ATCAAGAAGA AAAGCCGCAT AACGTACTTA ACCATGGTCA CGCCCGGCGA GTTTCTTGAC 2340
GGACGCGAAT GCGTCTACAT GGAGTGGTTA GACTGTGAGA TTGAAGTTGA TGTGCACGCG 2400
GACGTCGTAA TGTACAAATT CGGTAGTTCT TGCTATTCGC ACAAGCTTTC AATCATCAAG 2460
GACATCATGA CCACTCCGTA CTTGACACTA GGTGGTTTTC TATTCAGCGT GGAGATGTAT 2520
GAGGTGCGTA TGGGCGTGAA TTACTTCAAG ATTACGAAGT CCGAAGTATC GCCTAGCATT 2580
AGCTGCACCA AGCTCCTGAG ATACCGAAGA GCTAATAGTG ACGTGGTTAA AGTTAAACTT 2640
CCACGTTTCG ATAAGAAACG TCGCATGTGT CTGCCTGGGT ATGACACCAT ATACCTAGAT 2700
TCGAAGTTTG TGAGTCGCGT TTTCGATTAT GTCGTGTGTA ATTGCTCTGC CGTGAACTCA 2760
AAAACTTTCG AGTGGGTGTG GAGTTTCATT AAGTCTAGTA AGTCGAGGGT GATTATTAGC 2820
GGTAAAATAA TTCACAAGGA TGTGAATTTG GACCTCAAGT ACGTCGAGAG TTTCGCCGCG 2880
GTTATGTTGG CCTCTGGCGT GCGCAGTAGA CTAGCGTCCG AGTACCTTGC TAAGAACCTT 2940
AGTCATTTTT CGGGAGATTG CTCCTTTATT GAAGCCACGT CTTTCGTGTT GCGTGAGAAA 3000
ATCAGAAACA TGACTCTGAA TTTTAACGAA AGACTTTTAC AGTTAGTGAA GCGCGTTGCC 3060
TTTGCGACCT TGGACGTGAG TTTTCTAGAT TTAGATTCAA CTCTTGAATC AATAACTGAT 3120
TTTGCCGAGT GTAAGGTAGC GATTGAACTC GACGAGTTGG GTTGCTTGAG AGCGGAGGCC 3180
103
GAGAATGAAA AAATCAGGAA TCTGGCGGGA GATTCGATTG CGGCTAAACT CGCGAGCGAG 3240
ATAGTGGTCG ATATTGACTC TAAGCCTTCA CCGAAGCAGG TGGGTAATTC GTCATCCGAA 3300
AACGCCGATA AGCGGGAAGT TCAGAGGCCC GGTTTGCGTG GTGGTTCTAG AAACGGGGTT 3360
GTTGGGGAGT TCCTTCACTT CGTCGTGGAT TCTGCCTTGC GTCTTTTCAA ATACGCGACG 3420
GATCAACAAC GGATCAAGTC TTACGTGCGT TTCTTGGACT CGGCGGTCTC ATTCTTGGAT 3480
TACAACTACG ATAATCTATC GTTTATACTG CGAGTGCTTT CGGAAGGTTA TTCGTGTATG 3540
TTCGCGTTTT TGGCGAATCG AGGCGACTTA TCTAGTCGTG TCCGTAGCGC GGTGTGTGCT 3600
GTGAAAGAAG TTGCTACCTC ATGCGCGAAC GCGAGCGTTT CTAAAGCCAA GGTTATGATT 3660
ACCTTCGCAG CGGCCGTGTG TGCTATGATG TTTAATAGCT GCGGTTTTTC AGGCGACGGT 3720
CGGGAGTATA AATCGTATAT ACATCGTTAC ACGCAACTAT TGTTTGACAC TATCTTTTTT 3780
GAGGACAGCA CTTACCTACC CATAGAAGTT CTGAGTTCGG CGATATGCGG TGCTATCGTC 3840
ACACTTTTCT CCTCGGGCTC GTCCATAAGT TTAAACGCCT TCTTACTTCA AATTACCAAA 3900
GGATTCTCCC TAGAGGTTGT CGTCCGGAAT GTTGTGCGAG TCACGCATGG TTTGAGCACC 3960
ACAGCGACCG ACGGCGTCAT ACGTGGGGTT TTCTCCCAAA TTGTGTCTCA CTTACTTGTT 4020
GGAAATACGG GTAATGTGGC TTACCAGTCA GCTTTCATTG CCGGGGTGGT GCCTCTTTTA 4080
GTTAAAAAGT GTGTGAGCTT AATCTTCATC TTGCGTGAAG ATACTTATTC CGGTTTTATT 4140
AAGCACGGAA TCAGTGAATT CTCTTTCCTT AGTAGTATTC TGAAGTTCTT GAAGGGTAAG 4200
CTTGTGGACG AGTTGAAATC GATTATTCAA GGGGTTTTTG ATTCCAACAA GCACGTGTTT 4260
AAAGAAGCTA CTCAGGAAGC GATTCGTACG ACGGTCATGC AAGTGCCTGT CGCTGTAGTG 4320
GATGCCCTTA AGAGCGCCGC GGGAAAAATT TATAACAATT TTACTAGTCG ACGTACCTTT 4380
GGTAAGGATG AAGGCTCCTC TAGCGACGGC GCATGTGAAG AGTATTTCTC ATGCGACGAA 4440
GGTGAAGGTC CGGGTCTGAA AGGGGGTTCC AGCTATGGCT TCTCAATTTT AGCGTTCTTT 4500
TCACGCATTA TGTGGGGAGC TCGTCGGCTT ATTGTTAAGG TGAAGCATGA GTGTTTTGGG 4560
AAACTTTTTG AATTTCTATC GCTCAAGCTT CACGAATTCA GGACTCGCGT TTTTGGGAAG 4620
AATAGAACGG ACGTGGGAGT TTACGATTTT TTGCCCACGG GCATCGTGGA AACGCTCTCA 4680
TCGATAGAAG AGTGCGACCA AATTGAAGAA CTTCTCGGCG ACGACCTGAA AGGTGACAAG 4740
GATGCTTCGT TGACCGATAT GAATTACTTT GAGTTCTCAG AAGACTTCTT AGCCTCTATC 4800
GAGGAGCCGC CTTTCGCTGG ATTGCGAGGA GGTAGCAAGA ACATCGCGAT TTTGGCGATT 4860
TTGGAATACG CGCATAATTT GTTTCGCATT GTCGCAAGCA AGTGTTCGAA ACGACCTTTA 4920
TTTCTTGCTT TCGCCGAACT CTCAAGCGCC CTTATCGAGA AATTTAAGGA GGTTTTCCCT 4980
104
CGTAAGAGCC AGCTCGTCGC TATCGTGCGC GAGTATACTC AGAGATTCCT CCGAAGTCGC 5040
ATGCGTGCGT TGGGTTTGAA TAACGAGTTC GTGGTAAAAT CTTTCGCCGA TTTGCTACCC 5100
GCATTAATGA AGCGGAAGGT TTCAGGTTCG TTCTTAGCTA GTGTTTATCG CCCACTTAGA 5160
GGTTTCTCAT ATATGTGTGT TTCAGCGGAG CGACGTGAAA AGTTTTTTGC TCTCGTGTGT 5220
TTAATCGGGT TAAGTCTCCC TTTCTTCGTG CGCATCGTAG GAGCGAAAGC GTGCGAAGAA 5280
CTCGTGTCCT CAGCGCGTCG CTTTTATGAG CGTATTAAAA TTTTTCTAAG GCAGAAGTAT 5340
GTCTCTCTTT CTAATTTCTT TTGTCACTTG TTTAGCTCTG ACGTTGATGA GAGTTCCGCA 5400
TCTGCAGGGT TGAAAGGTGG TGCGTCGCGA ATGACGCTCT TCCACCTTCT GGTTCGCCTT 5460
GCTAGTGCCC TCCTATCGTT AGGGTGGGAA GGGTTAAAGC TACTCTTATC GCACCACAAC 5520
TTGTTATTTT TGTGTTTTGC ATTGGTTGAC GATGTGAACG TCCTTATCAA AGTTCTTGGG 5580
GGTCTTTCTT TCTTTGTGCA ACCAATCTTT TCCTTGTTTG CGGCGATGCT TCTACAACCG 5640
GACAGGTTTG TGGAGTATTC CGAGAAACTT GTTACAGCGT TTGAATTTTT CTTAAAATGT 5700
TCGCCTCGCG CGCCTGCACT ACTCAAAGGG TTTTTTGAGT GCGTGGCGAA CAGCACTGTG 5760
TCAAAAACCG TTCGAAGACT TCTTCGCTGT TTCGTGAAGA TGCTCAAACT TCGAAAAGGG 5820
CGAGGGTTGC GTGCGGATGG TAGGGGTCTC CATCGGCAGA AAGCCGTACC CGTCATACCT 5880
TCTAATCGGG TCGTGACCGA CGGGGTTGAA AGACTTTCGG TAAAGATGCA AGGAGTTGAA 5940
GCGTTGCGTA CCGAATTGAG AATCTTAGAA GATTTAGATT CTGCCGTGAT CGAAAAACTC 6000
AATAGACGCA GAAATCGTGA CACTAATGAC GACGAATTTA CGCGCCCTGC TCATGAGCAG 6060
ATGCAAGAAG TCACCACTTT CTGTTCGAAA GCCAACTCTG CTGGTTTGGC CCTGGAAAGG 6120
GCAGTGCTTG TGGAAGACGC TATAAAGTCG GAGAAACTTT CTAAGACGGT TAATGAGATG 6180
GTGAGGAAAG GGAGTACCAC CAGCGAAGAA GTGGCCGTCG CTTTGTCGGA CGATGAAGCC 6240
GTGGAAGAAA TCTCTGTTGC TGACGAGCGA GACGATTCGC CTAAGACAGT CAGGATAAGC 6300
GAATACCTAA ATAGGTTAAA CTCAAGCTTC GAATTCCCGA AGCCTATTGT TGTGGACGAC 6360
AACAAGGATA CCGGGGGTCT AACGAACGCC GTGAGGGAGT TTTATTATAT GCAAGAACTT 6420
GCTCTTTTCG AAATCCACAG CAAACTGTGC ACCTACTACG ATCAACTGCG CATAGTCAAC 6480
TTCGATCGTT CCGTAGCACC ATGCAGCGAA GATGCTCAGC TGTACGTACG GAAGAACGGC 6540
TCAACGATAG TGCAGGGTAA AGAGGTACGT TTGCACATTA AGGATTTCCA CGATCACGAT 6600
TTCCTGTTTG ACGGAAAAAT TTCTATTAAC AAGCGGCGGC GAGGCGGAAA TGTTTTATAT 6660
CACGACAACC TCGCGTTCTT GGCGAGTAAT TTGTTCTTAG CCGGCTACCC CTTTTCAAGG 6720
AGCTTCGTCT TCACGAATTC GTCGGTCGAT ATTCTCCTCT ACGAAGCTCC ACCCGGAGGT 6780
105
GGTAAGACGA CGACGCTGAT TGACTCGTTC TTGAAGGTCT TCAAGAAAGG TGAGGTTTCC 6480
ACCATGATCT TAACCGCCAA CAAAAGTTCG CAGGTTGAGA TCCTAAAGAA AGTGGAGAAG 6900
GAAGTGTCTA ACATTGAATG CCAGAAAGT AAAGACAAAA GATCTCCGAA AAAGAGCATT 6960
TACACCATCG ACGCTTATTT AATGCATCAC CGTGGTTGTG ATGCAGACGT TCTTTTCACT 7020
GATGAGTGTT TCATGGTTCA TGCGGGTAGC GTACTAGCTT GCATTGAGTT CACGAGGTGT 7080
CATAAAGTAA TGATCTTCGG GGATAGCCGG CAGATTCACT ACATTGAAAG GAACGAATTG 7140
GACAAGTGTT TGTATGGGGA TCTCGACAGG TTCGTGGACC TGCAGTGTCG GGTTTATGGT 7200
AATATTTCGT ACCGTTGTCC ATGGGATGTG TGCGCTTGGT TAAGCACAGT GTATGGCAAC 7260
CTAATCGCCA CCGTGAAGGG TGAAAGCGAA GGTAAGAGCA GCATGCGCAT TAACGAAATT 7320
AATTCAGTCG ACGATTTAGT CCCCGACGTG GGTTCCACGT TTCTGTGTAT GCTTCAGTCG 7380
GAGAAGTTGG AAATCAGCAA GCACTTTATT CGCAAGGGTT TGACTAAACT TAACGTTCTA 7440
ACGGTGCATG AGGCGCAAGG TGAGACGTAT GCGCGTGTGA ACCTTGTGCG ACTTAAGTTT 7500
CAGGAGGATG AACCCTTTAA ATCTATCAGG CACATAACCG TCGCTCTTTC TCGTCACACC 7560
GACAGCTTAA CTTATAACGT CTTAGCTGCT CGTCGAGGTG ACGCCACTTG CGATGCCATC 7620
CAGAAGGCTG CGGAATTGGT GAACAAGTTT CGCGTTTTTC CTACATCTTT TGGTGGTAGT 7680
GTTATCAATC TCAACGTGAA GAAGGACGTG GAAGATAACA GTAGGTGCAA GGCTTCGTCG 7740
GCACCATTGA GCGTAATCAA CGACTTTTTG AACGAAGTTA ATCCCGGTAC TGCGGTGATT 7800
GATTTTGGTG ATTTGTCCGC GGACTTCAGT ACTGGGCCTT TTGAGTGCGG TGCCAGCGGT 7860
ATTGTGGTGC GGGACAACAT CTCCTCCAGC AACATCACTG ATCACGATAA GCAGCGTGTT 7920
TAGCGTAGTT CGGTCGCAGG CGATTCCGCG TAGAAAACCT TCTCTACAAG AAAATTTGTA 7980
TTCGTTTGAA GCGCGGAATT ATAACTTCTC GACTTGCGAC CGTAACACAT CTGCTTCAAT 8040
GTTCGGAGAG GCTATGGCGA TGAACTGTCT TCGTCGTTGC TTCGACCTAG ATGCCTTTTC 8100
GTCCCTGCGT GATGATGTGA TTAGTATCAC ACGTTCAGGC ATCGAACAAT GGCTGGAGAA 8160
ACGTACTCCT AGTCAGATTA AAGCATTAAT GAAGGATGTT GAATCGCCTT TGGAAATTGA 8220
CGATGAAATT TGTCGTTTTA AGTTGATGGT GAAGCGTGAC GCTAAGGTGA AGTTAGACTC 8280
TTCTTGTTTA ACTAAACACA GCGCCGCTCA AAATATCATG TTTCATCGCA AGAGCATTAA 8340
TGCTATCTTC TCTCCTATCT TTAATGAGGT GAAAAACCGA ATAATGTGCT GTCTTAAGCC 8400
TAACATAAAG TTTTTTACGG AGATGACTAA CAGGGATTTT GCTTCTGTTG TCAGCAACAT 8460
GCTTGGTGAC GACGATGTGT ACCATATAGG TGAAGTTGAT TTCTCAAAGT ACGACAAGTC 8520
TCAAGATGCT TTCGTGAAGG CTTTTGAAGA AGTAATGTAT AAGGAACTCG GTGTTGATGA 8580
106
AGAGTTGCTG GCTATCTGGA TGTGCGGCGA GCGGTTATCG ATAGCTAACA CTCTCGATGG 8640
TCAGTTGTCC TTCACGATCG AGAATCAAAG GAAGTCGGGA GCTTCGAACA CTTGGATTGG 8700
TAACTCTCTC GTCACTTTGG GTATTTTAAG TCTTTACTAC GACGTTAGAA ATTTCGAGGC 8760
GTTGTACATC TCGGGCGATG ATTCTTTAAT TTTTTCTCGC AGCGAGATTT CGAATTATGC 8820
CTTTTGTTCT AAATTTGTTG TTATGTGTGG TCATAAGACG TTTTTTGTTC CCGACCCGTA 8940
CAAGCTTTTT GTCAAGTTGG GAGCAGTCAA AGAGGATGTT TCAATGGATT TCCTTTTCGA 9000
GACTTTTACC TCCTTTAAAG ACTTAACCTC CGATTTTAAC GACGAGCGCT TAATTCAAAA 9060
GCTCGCTGAA CTTGTGGCTT TAAAATATGA GGTTCAAACC GGCAACACCA CCTTGGCGTT 9120
AAGTGTGATA CATTGTTTGC GTTCGAATTT CCTCTCGTTT AGCAAGTTAT ATCCTCGCGT 9180
GAAGGGATGG CAGGTTTTTT ACACGTCGGT TAAGAAAGCG CTTCTCAAGA GTGGGTGTTC 9240
TCTCTTCGAC AGTTTCATGA CCCCTTTTGG TCAGGCTGTC ATGGTTTGGG ATGATGAGTA 9300
GCGCTAACTT GCGCGCAGTT TCTTTGTTCG TGACATACAC CTTGTGTGTC ACCGTGCGTT 9360
TATAATGAAT CAGGTTTTGC AGTTTGAATG TTTGTTTCTG CTGAATCTCG CGGTTTTTGC 9420
TGTGACTTTC ATTTTCATTC TTCTGGTCTT CCGCGTGATT AAGTCTTTTC GCCAGAAGGG 9480
TCACGAAGCA CCTGTTCCCG TTGTTCGTGG CGGGGGTTTT TCAACCGTAG TGTAGTCAAA 9540
AGACGCGCAT ATGGTAGTTT TCGGTTTGGA CTTTGGCACC ACATTCTCTA CGGTGTGTGT 9600
GTACAAGGAT GGACGAGTTT TTTCATTCAA GCAGAATAAT TCGGCGTACA TCCCCACTTA 9660
CCTCTATCTC TTCTCCGATT CTAACCACAT GACTTTTGGT TACGAGGCCG AATCACTGAT 9720
GAGTAATCTG AAAGTTAAAG GTTCGTTTTA TAGAGATTTA AAACGTTGGG TGGGTTGCGA 9780
TTCGAGTAAC CTCGACGCGT ACCTTGACCG TTTAAAACCT CATTACTCGG TCCGCTTGGT 9840
TAAGATCGGC TCTGGCTTGA ACGAAACTGT TTCAATTGGA AACTTCGGGG GCACTGTTAA 9900
GTCTGAGGCT CATCTGCCAG GGTTGAGAGC TCTCTTTATT AAGGCTGTCA TTAGTTGCGC 9960
GGAGGGCGCG TTTGCGTGCA CTTGCACCGG GGTTATTTGT TCAGTACCTG CCAATTATGA 10020
TAGCGTTCAA AGGAATTTCA CTGATCAGTG TGTTTCACTC AGCGGTTATC AGTGCGTATA 10080
TATGATCAAT GAACCTTCAG CGGCTGCGCT ATCTGCGTGT AATTCGATTG GAAAGAAGTC 10140
CGCAAATTTG GCTGTTTACG ATTTCGGTGG TGGGACCTTC GACGTGTCTA TCATTTCATA 10200
CCGCAACAAT ACTTTTGTTG TGCGAGCTTC TGGAGGCGAT CTAAATCTCG GTGGAAGGGA 10260
TGTTGATCGT GCGTTTCTCA CGCACCTCTT CTCTTTAACA TCGCTGGAAC CTGACCTCAC 10320
TTTGGATATC TCGAATCTGA AAGAATCTTT ATCAAAAACG GACGCAGAGA TAGTTTACAC 10380
TTTGAGAGGT GTCGATGGAA GAAAAGAAGA CGTTAGAGTA AACAAAAACA TTCTTACGTC 10440
107
GGTGATGCTC CCCTACGTGA ACAGAACGCT TAAGATATTA GAGTCAACCT TAAAATCGTA 10500
TGCTAAGAGT ATGAATGAGA TGTCGCGAGT TAAGTGCGAT TTAGTGCTGA TAGGAGGATC 10560
TTCATATCTT CCTGGCCTGG CAGACGTACT AACGAAGCAT CAGAGCGTTG ATCGTATCTT 10620
AAGAGTTTCG GATCCTCGGG CTGCCGTGGC CGTCGGTTGC GCATTATATT CTTCATGCCT 10680
CTCAGGATCT GGGGGGTTGC TACTGATCGA CTGTGCAGCT CACACTGTCG CTATAGCGGA 10740
CAGAAGTTGT CATCAAATCA TTTGCGCTCC AGCGGGGGCA CCGATCCCCT TTTCAGGAAG 10800
CATGCCTTTG TACTTAGCCA GGGTCAACAA GAACTCGCAG CGTGAAGTCG CCGTGTTTGA 10860
AGGGGAGTAC GTTAAGTGCC CTAAGAACAG AAAGATCTGT GGAGCAAATA TAAGATTTTT 10920
TGATATAGGA GTGACGGGTG ATTCGTACGC ACCCGTTACC TTCTATATGG atttctccat 10980
TTCAAGCGTA GGAGCCGTTT CATTCGTGGT GAGAGGTCCT GAGGGTAAGC AAGTGTCACT 11040
CACTGGAACT CCAGCGTATA ACTTTTCGTC TGTGGCTCTC GGATCACGCA GTGTCCGAGA 11100
ATTGCATATT AGTTTAAATA ATAAAGTTTT TCTCGGTTTG CTTCTACATA GAAAGGCGGA 11160
TCGACGAATA CTTTTCACTA AGGATGAAGC GATTCGATAC GCCGATTCAA TTGATATCGC 11220
GGATGTGCTA AAGGAATATA AAAGTTACGC GGCCAGTGCC TTACCACCAG ACGAGGATGT 11280
CGAATTACTC CTGGGAAAGT CTGTTCAAAA AGTTTTACGG GGAAGCAGAC TGGAAGAAAT 11340
ACCTCTCTAG GAGCATAGCA GCACACTCAA GTGAAATTAA AACTCTACCA GACATTCGAT 11400
TGTACGGCGG TAGGGTTGTA AAGAAGTCCG AATTCGAATC AGCACTTCCT AATTCTTTTG 11460
AACAGGAATT AGGACTGTTC ATACTGAGCG AACGGGAAGT GGGATGGAGC AAATTATGCG 11520
GAATAACGGT GGAAGAAGCA GCATACGATC TTACGAATCC CAAGGCTTAT AAATTCACTG 11580
CCGAGACATG TAGCCCGGAT GTAAAAGGTG AAGGACAAAA ATACTCTATG GAAGACGTGA 11640
TGAATTTCATGCGTTTATCA AATCTGGATG TTAACGACAA GATGCTGACG GAACAGTGTT 11700
GGTCGCTGTC CAATTCATGC GGTGAATTGA TCAACCCAGA CGACAAAGGG CGATTCGTGG 11760
CTCTCACCTT TAAGGACAGA GACACAGCTG ATGACACGGG TGCCGCCAAC GTGGAATGTC 11820
GCGTGGGCGA CTATCTAGTT TACGCTATGT CCCTGTTTGA GCAGAGGACC CAAAAATCGC 11880
AGTCTGGCAA CATCTCTCTG TACGAAAAGT ACTGTGAATA CATCAGGACC TACTTAGGGA 11940
GTACAGACCT GTTCTTCACA GCGCCGGACA GGATTCCGTT ACTTACGGGC ATCCTATACG 12000
ATTTTTGTAA GGAATACAAC GTTTTCTACT CGTCATATAA GAGAAACGTC GATAATTTCA 12060
GATTCTTCTT GGCGAATTAT ATGCCTTTGA TATCTGACGT CTTTGTCTTC CAGTGGGTAA 12120
AACCCGCGCC GGATGTTCGG CTGCTTTTTG AGTTAAGTGC AGCGGAACTA ACGCTGGAGG 12180
TTCCCACACT GAGTTTGATA GATTCTCAAG TTGTGGTAGG TCATATCTTA AGATACGTAG 12240
108
AATCCTACAC ATCAGATCCA GCCATCGACG CGTTAGAAGA CAAACTGGAA GCGATACTGA 12300
AAAGTAGCAA TCCCCGTCTA TCGACAGCGC AACTATGGGT TGGTTTCTTT TGTTACTATG 12360
GTGAGTTTCG TACGGCTCAA AGTAGAGTAG TGCAAAGACC AGGCGTATAC AAAACACCTG 12420
AXTCAGTGGG TGGATTTGAA ATAAACATGA AAGATGTTGA GAAATTCTTC GATAAACTTC 12480
AGAGAGAATT GCCTAATGTA TCTTTGCGGC GTCAGTTTAA CGGAGCTAGA GCGCATGAGG 12540
CTTTCAAAAT ATTTAAAAAC GGAAATATAA GTTTCAGACC TATATCGCGT TTAAACGTGC 12600
CTAGAGAGTT CTGGTATCTG AACATAGACT ACTTCAGGCA CGCGAATAGG TCCGGGTTAA 12660
CCGAAGAAGA AATACTCATC CTAAACAACA TAAGCGTTGA TGTTAGGAAG TTATGCGCTG 12720
AGAGAGCGTG CAATACCCTA CCTAGCGCGA AGCGCTTTAG TAAAAATCAT AAGAGTAATA 12780
TACAATCATC ACGCCAAGAG CGGAGGATTA AAGACCCATT GGTAGTCCTG AAAGACACTT 12840
TATATGAGTT CCAACACAAG CGTGCCGGTT GGGGGTCTCG AAGCACTCGA GACCTCGGGA 12900
GTCGTGCTGA CCACGCGAAA GGAAGCGGTT GATAAGTTTT TTAATGAACT AAAAAACGAA 12960
AATTACTCAT CAGTTGACAG CAGCCGATTA AGCGATTCGG AAGTAAAAGA AGTGTTAGAG 13020
AAAAGTAAAG AAAGTTTCAA AAGCGAACTG GCCTCCACTG ACGAGCACTT CGTCTACCAC 13080
ATTATATTTT TCTTAATCCG ATGTGCTAAG ATATCGACAA GTGAAAAGGT GAAGTACGTT 13140
GGTAGTCATA CGTACGTGGT CGACGGAAAA ACGTACACCG TTCTTGACGC TTGGGTATTC 13200
AACATGATGA AAAGTCTCAC GAAGAAGTAC AAACGAGTGA ATGGTCTGCG TGCGTTCTGT 13260
TGCGCGTGCG AAGATCTATA TCTAACCGTC GCACCAATAA TGTCAGAACG CTTTAAGACT 13320
AAAGCCGTAG GGATGAAAGG TTTGCCTGTT GGAAAGGAAT ACTTAGGCGC CGACTTTCTT 13380
TCGGGAACTA GCAAACTGAT GAGCGATCAC GACAGGGCGG TCTCCATCGT TGCAGCGAAA 13440
AACGCTGTCG ATCGTAGCGC TTTCACGGGT GGGGAGAGAA AGATAGTTAG TTTGTATGAT 13500
CTAGGGAGGT ACTAAGCACG GTGTGCTATA GTGCGTGCTA TAATAATAAA CACTAGTGCT 13560
TAAGTCGCGC AGAAGAAAAC GCTATGGAGT TGATGTCCGA CAGCAACCTT AGCAACCTGG 13620
TGATAACCGA CGCCTCTAGT CTAAATGGTG TCGACAAGAA GCTTTTATCT GCTGAAGTTG 13680
AAAAAATGTT GGTGCAGAAA GGGGCTCCTA ACGAGGGTAT AGAAGTGGTG TTCGGTCTAC 13740
TCCTTTACGC ACTCGCGGCA AGAACCACGT CTCCTAAGGT TCAGCGCGCA GATTCAGACG 13800
TTATATTTTC AAATAGTTTC GGAGAGAGGA ATGTGGTACT AACAGAGGGT GACCTTAAGA 13860
AGGTACTCGA CGGGTGTGCG CCTCTCACTA GGTTCACTAA TAAACTTAGA ACGTTCGGTC 13920
GTACTTTCAC TGAGGCTTAC GTTGACTTTT GTATCGCGTA TAAGCACAAA TTACCCCAAC 13980
TCAACGCCGC GGCGGAATTG GGGATTCCAG CTGAAGATTC GTACTTAGCT GCAGATTTTC 14040
109
TGGGTACTTG CCCGAAGCTC TCTGAATTAC AGCAAAGTAG GAAGATGTTC GCGAGTATGT 14100
ACGCTCTAAA AACTGAAGGT GGAGTGGTAA ATACACCAGT GAGCAATCTG CGTCAGCTAG 14160
GTAGAAGGGA AGTTATGTAA TGGAAGATTA CGAAGAAAAA TCCGAATCGC TCATACTGCT 14220
ACGCACGAAT CTGAACACTA TGCTTTTAGT GGTCAAGTCC GATGCTAGTG TAGAGCTGCC 14280
TAAACTACTA ATTTGCGGTT ACTTACGAGT GTCAGGACGT GGGGAGGTGA CGTGTTGCAA 14340
CCGTGAGGAA TTAACAAGAG ATTTTGAGGG CAATCATCAT ACGGTGATCC GTTCTAGAAT 14400
CATACAATAT GACAGCGAGT CTGCTTTTGA GGAATTCAAC AACTCTGATT GCGTAGTGAA 14460
GTTTTTCCTA GAGACTGGTA GTGTCTTTTG GTTTTTCCTT CGAAGTGAAA CCAAAGGTAG 14520
AGCGGTGCGA CATTTGCGCA CCTTCTTCGA AGCTAACAAT TTCTTCTTTG GATCGCATTG 14580
CGGTACCATG GAGTATTGTT TGAAGCAGGT ACTAACTGAA ACTGAATCTA TAATCGATTC 14640
TTTTTGCGAA GAAAGAAATC GTTAAGATGA GGGTTATAGT GTCTCCTTAT GAAGCTGAAG 14700
ACATTCTGAA AAGATCGACT GACATGTTAC GAAACATAGA CAGTGGGGTC TTGAGCACTA 14760
AAGAATGTAT CAAGGCATTC TCGACGATAA CGCGAGACCT ACATTGTGCG AAGGCTTCCT 14820
ACCAGTGGGG TGTTGACACT GGGTTATATC AGCGTAATTG CGCTGAAAAA CGTTTAATTG 14880
ACACGGTGGA GTCAAACATA CGGTTGGCTC AACCTCTCGT GCGTGAAAAA GTGGCGGTTC 14940
ATTTTTGTAA GGATGAACCA AAAGAGCTAG TAGCATTCAT CACGCGAAAG TACGTGGAAC 15000
TCACGGGCGT GGGAGTGAGA GAAGCGGTGA AGAGGGAAAT GCGCTCTCTT ACCAAAACAG 15060
TTTTAAATAA AATGTCTTTG GAAATGGCGT TTTACATGTC ACCACGAGCG TGGAAAAACG 15120
CTGAATGGTT AGAACTAAAA TTTTCACCTG TGAAAATCTT TAGAGATCTG CTATTAGACG 15180
TGGAAACGCT CAACGAATTG TGCGCCGAAG ATGATGTTCA CGTCGACAAA GTAAATGAGA 15240
ATGGGGACGA AAATCACGAC CTCGAACTCC AAGACGAATG TTAAACATTG GTTAAGTTTA 15300
ACGAAAATGA TTAGTAAATA ATAAATCGAA CGTGGGTGTA TCTACCTGAC GTATCAACTT 15360
AAGCTGTTAC TGAGTAATTA AACCAACAAG TGTTGGTGTA ATGTGTATGT TGATGTAGAG 15420
AAAAATCCGT TTGTAGAACG GTGTTTTTCT CTTCTTTATT TTTAAAAAAA AAATAAAAAA 15480
AAAAAAAAAA AAGCGGCCGC 15500
(2) Informácia pre sekvenciu ID.No.2:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 7 920 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna
110 (ii) Typ molekuly: cDNA (xi) Popis sekvencie: SEQ.ID.No.:2
ACATTGCGAG AGAACCCCAT TAGCGTCTCC GGGGTGAACT TGGGAAGGTC TGCCGCCGCT 60
CAGGTTATTT ATTTCGGCAG TTTCACGCAG CCCTTCGCGT TGTATCCGCG CCAAGAGAGC 120
GCGATCGTAA AAACGCAACT TCCACCGGTC AGTGTAGTGA AGGTGGAGTG CGTAGCTGCG 180
GAGGTAGCTC CCGACAGGGG CGTGGTCGAC AAGAAACCTA CGTCTGTTGG CGTTCCCCCG 240
CAGCGCGGTG TGCTTTCTTT TCCGACGGTG GTTCGGAACC GCGGCGACGT GATAATCACA 300
GGGGTGGTGC ATGAAGCCCT GAAGAAAATT AAAGACGGGC TCTTACGCTT CCGCGTAGGC 360
GGTGACATGC GTTTTTCGAG atttttctca TCGAACTACG GCTGCAGATT CGTCGCGAGC 420
GTGCGTACGA ACACTACAGT TTGGCTAAAT TGCACGAAAG CGAGTGGTGA GAAATTCTCA 480
CTCGCCGCCG CGTGCACGGC GGATTACGTG GCGATGCTGC GTTATGTGTG TGGCGGGAAA 540
TTTCCACTCG TCCTCATGAG TAGAGTTATT TACCCGGATG GGCGCTGTTA CTTGGCCCAT 600
ATGAGGTATT TGTGCGCCTT TTACTGTCGC CCGTTTAGAG AGTCGGATTA TGCCCTCGGA 660
ATGTGGCCTA CGGTGGCGCG TCTCAGGGCA TGCGTTGAGA AGAACTTCGG TGTCGAAGCT 720
TGTGGCATAG CTCTTCGTGG CTATTACACC TCTCGCAATG TTTATCACTG TGATTATGAC 780
TCTGCTTATG TAAAATATTT TAGAAACCTT TCCGGCCGCA TTGGCGGTGG TTCGTTCGAT 840
CCGACATCTT TAACCTCCGT AATAACGGTG AAGATTAGCG GTCTTCCAGG TGGTCTTCCT 900
AAAAATATAG CGTTTGGTGC CTTCCTGTGC GATATACGTT ACGTCGAACC GGTAGACTCG 960
GGCGGCATTC AATCGAGCGT TAAGACGAAA CGTGAAGATG CGCACCGAAC CGTAGAGGAA 1020
CGGGCGGCCG GCGGATCCGT CGAGCAACCG CGACAAAAGA GGATAGATGA GAAAGGTTGC 1080
GGCAGAGTTC CTAGTGGAGG TTTTTCGCAT CTCCTGGTCG GCAACCTTAA CGAAGTTAGG 1140
AGGAAGGTAG CTGCCGGACT TCTACGCTTT CGCGTTGGCG GTGATATGGA TTTTCATCGC 1200
TGCCTTGAAC TTTACTCACC ATCTAAAAAC TTTTTGCGTT ACGATGTCTT GCCCTGTTCT 1320
GGAGACTATG CAGCGATGTT TTCTTTCGCG GCGGGCGGCC GTTTCCCTTT AGTTTTGATG 1380
ACTAGAATTA GATACCCGAA CGGGTTTTGT TACTTGGCTC ACTGCCGGTA CGCGTGCGCG 1440
TTTCTCTTAA GGGGTTTTGA TCCGAAGCGT TTCGACATCG GTGCTTTCCC CACCGCGGCC 1500
AAGCTCAGAA ACCGTATGGT TTCGGAGCTT GGTGAAAGAA GTTTAGGTTT GAACTTGTAC 1560
GGCGCATATA CGTCACGCGG CGTCTTTCAC TGCGATTATG ACGCTAAGTT TATAAAGGAT 1620
TTGCGTCTTA TGTCAGCAGT TATAGCTGGA AAGGACGGGG TGGAAGAGGT GGTACCTTCT 1680
GACATAACTC CTGCCATGAA GCAGAAAACG ATCGAAGCCG TGTATGATAG ATTATATGGC 1740
111
GGCACTGACT CGTTGCTGAA ACTGAGCATC GAGAAAGACT TAATCGATTT CAAAAATGAC 1800
GTGCAGAGTT TGAAGAAAGA TCGGCCGATT GTCAAAGTGC CCTTTTACAT GTCGGAAGCA 1860
ACACAGAATT CGCTGACGCG TTTCTACCCT CAGTTCGAAC TTAAGTTTTC GCACTCCTCG 1920
CATTCAGATC ATCCCGCCGC CGCCGCTTCT AGACTGCTGG AAAATGAAAC GTTAGTGCGC 1980
TTATGTGGTA ATAGCGTTTC AGATATTGGA GGTTGTCCTC TTTTCCATTT GCATTCCAAG 2040
ACGCAAAGAC GGGTTCACGT ATGTAGGCCT GTGTTGGATG GCAAGGATGC GCGCGTCGC 2100
GTGGTGCGTG ATTTGCAGTA TTCCAACGTG CGTTTGGGAG ACGATGATAA AATTTTGGAA 2160
GGGCCACGCA ATATCGACAT TTGCCACTAT CCTCTGGGCG CGTGTGACCA CGAAAGTAGT 2220
GCTATGATGA TGGTGCAGGT GTATGACGCG TCCCTTTATG AGATATGTGG CGCCATGATC 2280
AAGAAGAAAA GCCGCATAAC GTACTTAACC ATGGTCACGC CCGGCGAGTT TCTTGACGGA 2340
CGCGAATGCG TCTACATGGA GTCGTTAGAC TGTGAGATTG AAGTTGATGT GCACGCGGAC 2400
GTCGTAATGT ACAAATTCGG TAGTTCTTGC TATTCGCACA AGCTTTCAAT CATCAAGGAC 2460
ATCATGACCA CTCCGTACTT GACACTAGGT GGTTTTCTAT TCAGCGTGGA GATGTATGAG 2520
GTGCGTATGG GCGTGAATTA CTTCAAGATT ACGAAGTCCG AAGTATCGCC TAGCATTAGC 2580
TGCACCAAGC TCCTGAGATA CCGAAGAGCT AATAGTGACG TGGTTAAAGT TAAACTTCCA 2640
CGTTTCGATA AGAAACGTCG CATGTGTCTG CCTGGGTATG ACACCATATA CCTAGATTCG 2700
AAGTTTGTGA GTCGCGTTTT CGATTATGTC GTGTGTAATT GCTCTGCCGT GAACTCAAAA 2760
ACTTTCGAGT GGGTGTGGAG TTTCATTAAG TCTAGTAAGT CGAGGGTGAT TATTAGCGGT 2820
AAAATAATTC ACAAGGATGT GAATTTGGAC CTCAAGTACG TCGAGAGTTT CGCCGCGGTT 2880
ATGTTGGCCT CTGGCGTGCG CAGTAGACTA GCGTCCGAGT ACCTTGCTAA GAACCTTAGT 2940
CATTTTTCGG GAGATTGCTC CTTTATTGAA GCCACGTCTT TCGTGTTGCG TGAGAAAATC 3000
AGAAACATGA CTCTGAATTT TAACGAAAGA CTTTTACAGT TAGTGAAGCG CGTTGCCTTT 3060
GCGACCTTGG ACGTGAGTTT TCTAGATTTA GATTCAACTC TTGAATCAAT AACTGATTTT 3120
GCCGAGTGTA AGGTAGCGAT TGAACTCGAC GAGTTGGGTT GCTTGAGAGC GGAGGCCGAG 3180
AATGAAAAAA TCAGGAATCT GGCGGGAGAT TCGATTGCGG CTAAACTCGC GAGCGAGATA 3240
GTGGTCGATA TTGACTCTAA GCCTTCACCG AAGCAGGTGG GTAATTCGTC ATCCGAAAAC 3300
GCCGATAAGC GGGAAGTTCA GAGGCCCGGT TTGCGTGGTG GTTCTAGAAA CGGGGTTGTT 3360
GGGGAGTTCC TTCACTTCGT CGTGGATTCT GCCTTGCGTC TTTTCAAATA CGCGACGGAT 3420
CAACAACGGA TCAAGTCTTA CGTGCGTTTC TTGGACTCGG CGGTCTCATT CTTGGATTAC 3480
AACTACGATA ATCTATCGTT TATACTGCGA GTGCTTTCGG AAGGTTATTC GTGTATGTTC 3540
112
GCGTTTTTGG CGAATCGCGG CGACTTATCT AGTCGTGTCC GTAGCGCGGT GTGTGCTGTG 3600
AAAGAAGTTG CTACCTCATG CGCGAACGCG AGCGTTTCTA AAGCCAAGGT TATGATTACC 3660
TTCGCAGCGG CCGTGTGTGC TATGATGTTT AATAGCTGCG ATTTTTCAGG CGACGGTCGG 3720
GAGTATAAAT CGTATATACA TCGTTACACG CAAGTATTGT TTGACACTAT CTTTTTTGAG 3780
GACAGCAGTT ACCTACCCAT AGAAGTTCTG AGTTCGGCGA TATGCGGTGC TATCGTCACA 3840
CTTTTCTCCT CGGGCTCGTC CATAAGTTTA AACGCCTTCT TACTTCAAAT TACCAAAGGA 3900
TTCTCCCTAG AGGTTGTCGT CCGGAATGTT GTGCGAGTCA CGCATGGTTT GAGCACCACA 3960
GCGACCGACG GCGTCATACG TGGGGTTTTC TCCCAAATTG TGTCTCACTT ACTTGTTGGA 4020
AATACGGGTA ATGTGGCTTA CCAGTCAGCT TTCATTGCCG GGGTGGTGCC TCTTTTAGTT 4080
AAAAAGTGTG TGAGCTTAAT CTTCATCTTG CGTGAAGATA CTTATTCCGG TTTTATTAAG 4140
CACGGAATCA GTGAATTCTC TTTCCTTAGT AGTATTCTGA AGTTCTTGAA GGGTAAGCTT 4200
GTGGACGAGT TGAAATCGAT TATTCAAGGG GTTTTTGATT CCAACAAGCA GGTGTTTAAA 4260
GAAGCTACTC AGGAAGCGAT TCGTACGACG GTCATGCAAG TGCCTGTCGC TGTAGTGGAT 4320
GCCCTTAAGA GCGCCGCGGG AAAAATTTAT AACAATTTTA CTAGTCGACG TACCTTTGGT 4380
AAGGATGAAG GCTCCTCTAG CGACGGCGCA TGTGAAGAGT ATTTCTCATG CGACGAAGGT 4440
GAAGGTCCGG GTCTGAAAGG GGGTTCCAGT TATGGCTTCT CAATTTTAGC gttcttttca 4500
CGCATTATGT GGGGAGCTCG TCGGCTTATT GTTAAGGTGA AGCATGAGTG TTTTGGGAAA 4560
CTTTTTGAAT TTCTATCGCT CAAGCTTCAC GAATTCAGGA CTCGCGTTTT TGGGAAGAAT 4620
AGAACGGACG TGGGAGTTTA CGATTTTTTG CCCACGGGCA TCGTGGAAAC GCTCTCATCG 4680
GCTTCGTTGA CCGATATGAA TTACTTTGAG TTCTCAGAAG ACTTCTTAGC CTCTATCGAG 4800
GAGCCGCCTT TCGCTGGATT GCGAGGAGGT AGCAAGAACA TCGCGATTTT GGCGATTTG 4860
GAATACGCGC ATAATTTGTT TCGCATTGTC GCAAGCAAGT GTTCGAAACG ACCTTTATTT 4920
CTTGCTTTCG CCGAACTCTC AAGCGCCCTT ATCGAGAAAT TTAAGGAGGT TTTCCCTCGT 4980
AAGAGCCAGC TCGTCGCTAT CGTGCGCGAG TATACTCAGA GATTCCTCCG AAGTCGCATG 5040
CGTGCGTTGG GTTTGAATAA CGAGTTCGTG GTAAAATCTT TCGCCGATTT GCTACCCGCA 5100
TTAATGAAGC GGAAGGTTTC AGGTTCGTTC TTAGCTAGTG TTTATCGCCC ACTTAGAGGT 5160
TTCTCATATA TGTGTGTTTC AGCGGAGCGA CGTGAAAAGT TTTTTGCTCT CGTGTGTTTA 5220
ATCGGGTTAA GTCTCCCTTT CTTCGTGCGC ATCGTAGGAG CGAAAGCGTG CGAAGAACTC 5280
GTGTCCTCAG CGCGTCGCTT TTATGAGCGT ATTAAAATTT TTCTAAGGCA GAAGTATGTC 5340
TCTCTTTCTA ATTTCTTTTG TCACTTGTTT AGCTCTGACG TTGATGACAG TTCCGCATCT 5400
113
GCAGGGTTGA AAGGTGGTGC GTCGCGAATG ACGCTCTTCC ACCTTCTGGT TCGCCTTGCT 5460
AGTGCCCTCC TATCGTTAGG GTGGGAAGGG TTAAAGCTAC TCTTATCGCA CCACAACTTG 5520
TTATTTTTGT GTTTTGCATT GGTTGACGAT GTGAACGTCC TTATCAAAGT TCTTGGGGGT 5580
CTTTCTTTCT TTGTGCAACC AATCTTTTCC TTGTTTGCGG CGATGCTTCT ACAACCGGAC 5640
AGGTTTGTGG AGTATTCCGA GAAACTTGTT ACAGCGTTTG AATTTTTCTT AAAATGTTCG 5700
CCTCGCGCGC CTGCACTACT CAAAGGGTTT TTTGAGTGCG TGGCGAACAG CACTGTGTCA 5760
AAAACCGTTC GAAGACTTCT TCGCTGTTTC GTGAAGATGC TCAAACTTCG AAAAGGGCGA 5820
GGGTTGCGTG CGGATGGTAG GGGTCTCCAT CGGCAGAAAG CCGTACCCGT CATACCTTCT 5880
AATCGGGTCG TGACCGACGG GGTTGAAAGA CTTTCGGTAA AGATGCAAGG AGTTGAAGCG 5940
TTGCGTACCG AATTGAGAAT CTTAGAAGAT TTAGATTCTG CCGTGATCGA AAAACTCAAT 6000
AGACGCAGAA ATCGTGACAC TAATGACGAC GAATTTACGC GCCCTGCTCA TGAGCAGATG 6060
CAAGAAGTCA CCACTTTCTG TTCGAAAGCC AACTCTGCTG GTTTGGCCCT GGAAAGGGCA 6120
GTGCTTGTGG AAGACGCTAT AAAGTCGGAG AAACTTTCTA AGACGGTTAA TGAGATGGTG 6180
AG GAAAG G GA GTACCACCAG CGAAGAAGTG GCCGTCGCTT TGTCGGACGA TGAAGCCGTG 6240
GAAGAAATCT CTGTTGCTGA CGAGCGAGAC GATTCGCCTA AGACAGTCAG GATAAGCGAA 6300
TACCTAAATA GGTTAAACTC AAGCTTCGAA TTCCCGAAGC CTATTGTTGT GGACGACAAC 6360
AAGGATACCG GGGGTCTAAC GAACGCCGTG AGGGAGTTTT ATTATATGCA AGAACTTGCT 6240
CTTTTCGAAA TCCACAGCAA ACTGTGCACC TACTACGATC AACTGCGCAT AGTCAACTTC 6480
GATCGTTCCG TAGCACCATG CAGCGAAGAT GCTCAGCTGT ACGTACGGAA GAACGGCTCA 6540
ACGATAGTGC AGGGTAAAGA GGTACGTTTG CACATTAAGG ATTTCCACGA TCACGATTTC 6600
CTGTTTGACG GAAAAATTTC TATTAACAAG CGGCGGCGAG GCGGAAATGT TTTATATCAC 6660
GACAACCTCG CGTTCTTGGC GAGTAATTTG TTCTTAGCCG GCTACCCCTT TTCAAGGAGC 6720
TTCGTCTTCA CGAATTCGTC GGTCGATATT CTCCTCTACG AAGCTCCACC CGGAGGTGGT 6780
AAGACGACGA CGCTGATTGA CTCGTTCTTG AAGGTCTTCA AGAAAGGTGA GGTTTCCACC 6840
ATGATCTTAA CCGCCAACAA AAGTTCGCAG GTTGAGATCC TAAAGAAAGT GGAGAAGGAA 6900
GTGTCTAACA TTGAATGCCA GAAACGTAAA GACAAAAGAT CTCCGAAAAA GAGCATTTAC 6960
ACCATCGACG CTTATTTAAT GCATCACCGT GGTTGTGATG CAGACGTTCT TTTCATCGAT 7020
GAGTGTTTCA TGGTTCATGC GGGTAGCGTA CTAGCTTGCA TTGAGTTCAC GAGGTGTCAT 7080
AAAGTAATGA TCTTCGGGGA TAGCCGGCAG ATTCACTACA TTGAAAGGAA CGAATTGGAC 7140
AAGTGTTTGT ATGGGGATCT CGACAGGTTC GTGGACCTGC AGTGTCGGGT TTATGGTAAT 7200
114
ATTTCGTACC GTTGTCCATG GGATGTGTGC GCTTGGTTAA GCACAGTGTA TGGCAACCTA 7260
ATCGCCACCG TGAAGGGTGA AAGCGAAGGT AAGAGCAGCA TGCGCATTAA CGAAATTAAT 7320
TCAGTCGACG ATTTAGTCCC CGACGTGGGT TCCACGTTTC TGTGTATGCT TCAGTCGGAG 7380
AAGTTGGAAA TCAGCAAGCA CTTTATTCGC AAGGGTTTGA CTAAACTTAA CGTTCTAACG 7440
GTGCATGAGG CGCAAGGTGA GACGTATGCG CGTGTGAACC TTGTGCGACT TAAGTTTCAG 7500
GAGGATGAAC CCTTTAAATC TATCAGGCAC ATAACCGTCG CTCTTTCTCG TCACACCGAC 7560
AGCTTAACTT ATAACGTCTT AGCTGCTCGT CGAGGTGACG CCACTTGCGA TGCCATCCAG 7620
AAGGCTGCGG AATTGGTGAA CAAGTTTCGC GTTTTTCCTA CATCTTTTGG TGGTAGTGTT 7680
ATCAATCTCA ACGTGAAGAA GGACGTGGAA GATAACAGTA GGTGCAAGGC TTCGTCGGCA 7740
CCATTGAGCG TAATCAACGA CTTTTTGAAC GAAGTTAATC CCGGTACTGC GGTGATTGAT 7800
TTTGGTGATT TGTCCGCGGA CTTCAGTACT GGGCCTTTTG AGTGCGGTGC CAGCGGTATT 7860
GTGGTGCGGG ACAACATCTC CTCCAGCAAC ATCACTCATC ACGATAAGCA GCGTGTTTAG 7920
(2) Informácia pre sekvenciu ID.No.3:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 2639 aminokyselín (B) Typ: aminokyselina (C) Typ vlákna:
(D) Topológia: lineárna (ii) Molekula typu: protein
(xi) Popi s sekvencie: SEQ. , ID. No. :3
Thr 1 Leu Arg Glu Asn Pro íle Ser 5 Val Ser 10 Gly Val Asn Leu Gly Arg 15
Ser Ala Ala Ala 20 Gin Val íle Tyr Phe 25 Gly Ser Phe Thr Gin Pro Phe 30
Ala Leu Tyr Pro 35 Arg Gin Glu Ser 40 Ala íle Val Lys Thr Gin Leu Pro 45
Pro Val Ser Val 50 Val Lys Val Glu 55 Cys Val Ala Ala Glu Val Ala Pro 60
Asp 65 Arg Gly Val Val Asp Lys Lys 70 Pro Thr Ser 75 Val Gly Val Pro Pro 80
Gin Arg Gly Val Leu Ser Phe Pro 85 Thr Val 90 Val Arg Asn Arg Gly Asp 95
Val íle íle Thr 100 Gly Val Val His Glu 105 Ala Leu Lys Lys íle Lys Asp 110
115
Gly Leu Leu Arg Phe Arg Val Gly Gly Asp Met Arg Phe Ser Arg Phe
115 120 125
Phe Ser Ser Asn Tyr Gly Cys Arg Phe Val Ala Ser Val Arg Thr Asn
130 135 140
Thr Thr Val Trp Leu Asn Cys Thr Lys Ala Ser Gly Glu Lys Phe Ser
145 150 155 160
Leu Ala Ala Ala Cys Thr Ala Asp Tyr Val Ala Met Leu Arg Tyr Val
165 170 175
Cys Gly Gly Lys Phe Pro Leu Val Leu Met Ser Arg Val íle Tyr Pro
180 185 190
Asp Gly Arg Cys Tyr Leu Ala His Met Arg Tyr Leu Cys Ala Phe Tyr
195 200 205
Cys Arg Pro Phe Arg Glu Ser Asp Tyr Ala Leu Gly Met Trp Pro Thr
210 215 220
Val Ala Arg Leu Arg Ala Cys Val Glu Lys Asn Phe Gly Val Glu Ala
225 230 235 240
Cys Gly íle Ala Leu Arg Gly Tyr Tyr Thr Ser Arg Asn Val Tyr His
245 250 255
Cys Asp Tyr Asp Ser Ala Tyr Val Lys Tyr Phe Arg Asn Leu Ser Gly
260 265 270
Arg íle Gly Gly Gly Ser Phe Asp Pro Thr Ser Leu Thr Ser Val íle
275 280 285
Thr Val Lys íle Ser Gly Leu Pro Gly Gly Leu Pro Lys Asn íle Ala
290 295 300
Phe Gly Ala Phe Leu Cys Asp íle Arg Tyr Val Glu Pro Val Asp Ser
305 310 315 320
Gly Gly íle Gin Ser Ser Val Lys Thr Lys Arg Glu Asp Ala His Arg
325 330 335
Thr Val Glu Glu Arg Ala Ala Gly Gly Ser Val Glu Gin Pro Arg Gin
340 345 350
Lys Arg íle Asp Glu Lys Gly Cys Gly Arg Val Pro Ser Gly Gly Phe
355 360 365
Ser His Leu Leu Val Gly Asn Leu Asn Glu Val Arg Arg Lys Val Ala
370 375 380
Ala Gly leu Leu Arg Phe Arg Val Gly Gly Asp Met asp Phe His Arg
385 390 395 400
Ser Phe Ser Thr Gin Ala Gly His Arg Leu Leu Val Trp Arg Arg Ser
405 410 415
Ser Arg Ser Val Cys Leu Glu Leu Tyr Ser Pro Ser Lys Asn Phe Leu
420 425 430
116
Arg Tyr Asp 435 Val Leu Pro Cys Ser 440 Gly Asp Tyr Ala Ala 445 Met Phe Ser
Phe Ala 450 Ala Gly Gly Arg Phe 455 Pro leu Val Leu Met 460 Thr Arg íle Arg
Tyr 465 Pro Asn Gly Phe Cys 470 Tyr leu Ala His Cys 475 Arg Tyr Ala Cys Ala 480
Phe Leu Leu Arg Gly 485 Phe Asp Pro Lys Arg 490 Phe Asp íle Gly Ala 495 Phe
Pro Thr Ala Ala 500 Lys Leu Arg Asn Arg 505 Met Val Ser Glu Leu 510 Gly Glu
Arg Ser Leu 515 Gly Leu Asn Leu Tyr 520 Gly Ala Tyr Thr Ser 525 Arg Gly val
Phe His 530 Cys Asp Tyr Asp Ala 535 Lys Phe íle Lys Asp 540 Leu Arg Leu Met
Ser 545 Ala Val íle Ala Gly 550 Lys Asp Gly Val Glu 555 Glu Val Val Pro Ser 560
Asp íle Thr Pro Ala 565 Met Lys Gin Lys Thr 570 íle Glu Ala Val Tyr 575 Asp
Arg Leu Tyr Gly 580 Gly Thr Asp Ser Leu 585 Leu Lys Leu Ser íle 590 Glu Lys
Asp Leu íle 595 Asp Phe Lys Asn Asp 600 Val Gin Ser Leu Lys 605 Lys Asp Arg
Pro íle 610 Val Lys Val Pro Phe 615 Tyr Met Ser Glu Ala 620 Thr Gin Asn Ser
Leu 625 Thr Arg Phe Tyr Pro 630 Gin Phe Glu Leu Lys 635 Phe Ser His Ser Ser 640
His Ser Asp His Pro 645 Ala Ala Ala Ala Ser 650 Arg Leu Leu Glu Asn 655 Glu
Thr Leu Val Arg 660 Leu Cys Gly Asn Ser 665 Val Ser Asp íle Gly 670 Gly Cys
Pro Leu Phe 675 His Leu His Ser Lys 680 Thr Gin Arg Arg Val 685 His Val Cys
Arg Pro 690 Val Leu Asp Gly Lys 695 Asp Ala Gin Arg Arg 700 Val Val Arg Asp
Leu 705 Gin Tyr Ser Asn Val 710 Arg Leu Gly Asp Asp 715 Asp Lys íle Leu Glu 720
Gly Pro Arg Asn íle 725 Asp íle Cys His Tyr 730 Pro Leu Gly Ala Cys 735 Asp
His Glu Ser Ser 740 Ala Met Met Met Val 745 Gin Val Tyr Asp Ala 750 Ser Leu
117
Tyr Glu íle Cys 755 Gly Ala Met íle Lys 760 Lys Lys Ser Arg 765 íle Thr Tyr
Leu Thr Met Val 770 Thr Pro Gly Glu Phe 775 Leu Asp Gly 780 Arg Glu Cys Val
Tyr 785 Met Glu Ser Leu Asp Cys Glu íle 790 Glu Val 795 Asp Val His Ala Asp 800
Val Val Met Tyr Lys Phe Gly Ser Ser 805 Cys 810 Tyr Ser His Lys Leu 815 Ser
íle íle Lys Asp 820 íle Met Thr Thr Pro 825 Tyr Leu Thr Leu Gly 830 Gly Phe
Leu Phe Ser val 835 Glu Met Tyr Glu Val 840 Arg Met Gly Val 845 Asn Tyr Phe
Lys íle Thr Lys 850 Ser Glu Val Ser Pro 855 Ser íle Ser 860 Cys Thr Lys Leu
Leu 865 Arg Tyr Arg Arg Ala Asn Ser Asp 870 Val Val 875 Lys Val Lys Leu Pro 880
Arg Phe Asp Lys Lys Arg Arg Met Cys 885 Leu 890 Pro Gly Tyr Asp Thr 895 íle
Tyr Leu Asp Ser 900 Lys Phe Val Ser Arg 905 Val Phe Asp Tyr Val 910 Val Cys
Asn Cys Ser Ala 915 Val Asn Ser Lys Thr 920 Phe Glu Trp Val 925 Trp Ser Phe
íle Lys Ser Ser 930 Lys Ser Arg Val íle 935 íle Ser Gly 940 Lys íle íle His
Lys 945 Asp Val Asn Leu Asp Leu Lys Tyr 950 Val Glu 955 Ser Phe Ala Ala Val 960
Met Leu Ala Ser Gly Val Arg Ser Arg 965 Leu 970 Ala Ser Glu Tyr Leu 975 Ala
Lys Asn Leu Ser 980 His Phe Ser Gly Asp 985 Cys Ser Phe íle Glu 990 Ala Thr
Ser Phe Val Leu 995 Arg Glu Lys íle Arg 1000 Asn Met Thr Leu Asn 1005 Phe Asn
Glu Arg Leu Leu 1010 Gin Leu Val Lys Arg 1015 Val Ala Phe Ala 1020 Thr Leu Asp
Val Ser Phe Leu 1025 Asp Leu Asp Ser Thr 1030 Leu Glu Ser 1035 íle Thr Asp Phe 1040
Ala Glu Cys Lys Val Ala íle Glu Leu 1045 Asp Glu 1050 Leu Gly Cys Leu Arg 1055
Ala Glu Ala Glu Asn Glu Lys íle Arg Asn 1060 1065 Leu Ala Gly Asp Ser 1070 íle
118
Ala Ala Lys Leu 1075 Ala Ser Glu íle Val 1080 Val Asp íle Asp Ser 1085 Lys Pro
Ser Pro Lys Gin Val Gly Asn Ser Ser Ser Glu Asn Ala Asp Lys Arg
1090 1095 1100
Glu Val Gin Arg Pro Gly Leu Arg Gly Gly Ser Arg Asn Gly Val Val
1105 1110 1115 1120
Gly Glu Phe Leu His Phe Val Val Asp Ser Ala Leu Arg Leu Phe Lys
1125 1130 1135
Tyr Ala Thr Asp Gin Gin Arg íle Lys Ser Tyr Val Arg Phe Leu Asp
1140 1145 1150
Ser Ala Val Ser Phe Leu Asp Tyr Asn Tyr Asp Asn Leu Ser Phe íle
1155 1160 1165
Leu Arg Val Leu Ser Glu Gly Tyr Ser Cys Met Phe Ala Phe Leu Ala
1170 1175 1180
Asn Arg Gly Asp Leu Ser Ser Arg Val Arg Ser Ala Val Cys Ala Val
1185 1190 1195 1200
Lys Glu Val Ala Thr Ser Cys Ala Asn Ala Ser Val Ser Lys Ala Lys
1205 1210 1215
Val Met íle Thr Phe Ala Ala Ala Val Cys Ala Met Met Phe Asn Ser
1220 1225 1230
Cys Gly Phe Ser Gly Asp Gly Arg Glu Tyr Lys Ser Tyr íle His Arg
1235 1240 1245
Tyr Thr Gin Val Leu Phe Asp Thr íle Phe Phe Glu Asp Ser Ser Tyr
1250 1255 1260
Leu Pro íle Glu Val Leu Ser Ser Ala íle Cys Gly Ala íle Val Thr
1265 1270 1275 1280
Leu Phe Ser Ser Gly Ser Ser íle Ser Leu Asn Ala Phe Leu Leu Gin
1285 1290 1295
íle Thr Lys Gly Phe Ser Leu Glu Val Val Val Arg Asn Val Val Arg
1300 1305 1310
Val Thr His Gly Leu ser Thr Thr Ala Thr Asp Gly Val íle Arg Gly
1315 1320 1325
Val Phe Ser Gin íle Val Ser His Leu Leu Val Gly Asn Thr Gly Asn
1330 1335 1340
Val Ala Tyr Gin Ser Ala Phe íle Ala Gly Val Val Pro Leu Leu Val
1345 1350 1355 1360
Lys Lys Cys Val Ser Leu íle Phe íle Leu Arg Glu Asp Thr Tyr Ser
1365
1370
1375
Gly Phe íle Lys His Gly íle Ser Glu Phe Ser Phe Leu Ser Ser íle 1380 1385 1390
119
Leu Lys Phe Leu Lys Gly Lys 1395 Leu Val Asp Glu 1400 Leu Lys Ser íle 1405 íle
Gin Gly Val Phe Asp Ser Asn Lys His Val Phe Lys Glu Ala Thr Gin
1410 1415 1420
Glu Ala íle Arg Thr Thr Val Met Gin Val Pro Val Ala Val Val Asp
1425 1430 1435 1440
Ala Leu Lys Ser Ala Ala Gly Lys íle Tyr Asn Asn Phe Thr Ser Arg
1445 1450 1455
Arg Thr Phe Gly Lys Asp Glu Gly Ser Ser Ser Asp Gly Ala Cys Glu
1460 1465 1470
Glu Tyr Phe Ser Cys Asp Glu Gly Glu Gly Pro Gly Leu Lys Gly Gly
1475 1480 1485
Ser Ser Tyr Gly Phe Ser íle Leu Ala Phe Phe Ser Arg íle Met Trp
1490 1495 1500
Gly Ala Arg Arg Leu íle Val Lys Lys Val His Glu Cys Phe Gly Lys
1505 1510 1515 1520
Leu Phe Glu Phe Leu Ser Leu Lys Leu His Glu Phe Arg Thr Arg Val
1525 1530 1535
Phe Gly Lys Asn Arg Thr Asp Val Gly Val Tyr Asp Phe Leu Pro Thr
1540 1545 1550
Gly íle Val Glu Thr Leu Ser Ser íle Glu Glu Cys Asp Gin íle Glu
1555 1560 1565
Glu Leu Leu Gly Asp Asp Leu Lys Gly Asp Lys Asp Ala Ser Leu Thr
1570 1575 1580
Asp Met Asn Tyr Phe Glu Phe Ser Glu Asp Phe Leu Ala Ser íle Glu
1585 1590 1595 1600
Glu Pro Pro Phe Ala Gly Leu Arg Gly Gly Ser Lys Asn íle Ala íle
1605 1610 1615
Leu Ala íle Leu Glu tyr Ala His Asn Leu Phe Arg íle Val Ala Ser
1620 1625 1630
Lys Cys Ser Lys Arg Pro Leu Phe Leu Ala Phe Ala Glu Leu Ser Ser
1635 1640 1645
Ala Leu íle Glu Lys Phe Lys Glu Val Phe Pro Arg Lys Ser Gin Leu
1650 1655 1660
Val Ala íle Val Arg Glu Tyr Thr Gin Arg Phe Leu Arg Ser Arg Met
1665 1670 1675 1680
Arg Ala Leu Gly Leu Asn Asn Glu Phe Val Val Lys Ser Phe Ala Asp
1685 1690 1695
Leu Leu Pro Ala Leu Met Lys Arg Lys Val Ser Gly Ser Phe Leu Ala 1700 1705 1710
120
Ser Val Tyr Arg Pro Leu Arg Gly Phe Ser Tyr Met Cys Val 1725 Ser Ala
1715 1720
Glu Arg Arg Glu Lys Phe Phe Ala Leu Val Cys Leu íle Gly Leu Ser
173C 1 1735 1740
Leu Pro Phe Phe Val Arg íle Val Gly Ala Lys Ala Cys Glu Glu Leu
1745 1750 1755 1760
Val Ser Ser Ala Arg Arg Phe Tyr Glu Arg íle Lys íle Phe Leu Arg
1765 1770 1775
Gin Lys Tyr Val Ser Leu Ser Asn Phe Phe Cys His Leu Phe Ser Ser
1780 1785 1790
Asp Val Asp Asp Ser Ser Ala Ser Ala Gly Leu Lys Gly Gly Ala Ser
1795 1800 1805
Arg Met Thr Leu Phe His Leu Leu Val Arg Leu Ala Ser Ala Leu Leu
181C 1 1815 1820
Ser Leu Gly Trp Glu Gly Leu Lys Leu Leu Leu Ser His His Asn Leu
1825 1830 1835 1840
Leu Phe Leu Cys Phe Ala Leu Val Asp Asp Val Asn Val Leu íle Lys
1845 1850 1855
Val Leu Gly Gly Leu Ser Phe Phe Val Gin Pro íle Phe Ser Leu Phe
1860 1865 1870
Ala Ala Met Leu Leu Gin Pro Asp Arg Phe Val Glu Tyr Ser Glu Lys
1875 1880 1885
Leu Val Thr Ala Phe Glu Phe Phe Leu Lys Cys Ser Pro Arg Ala Pro
189C 1 1895 1900
Ala Leu Leu Lys Gly Phe Phe Glu Cys Val Ala Asn Ser Thr Val Ser
1905 1910 1915 1920
Lys Thr Val Arg Arg Leu Leu Arg Cys Phe Val Lys Met Leu Lys Leu
1925 1930 1935
Arg Lys Gly Arg Gly Leu Arg Ala Asp Gly Arg Gly Leu His Arg Gin
1940 1945 1950
Lys Ala Val Pro Val íle Pro Ser Asn Arg Val Val Thr Asp Gly Val
1955 1960 1965
Glu Arg Leu Ser Val Lys Met Gin Gly Val Glu Ala Leu Arg Thr Glu
197C l 1975 1980
Leu Arg íle Leu Glu Asp Leu Asp Ser Ala Val íle Glu Lys Leu Asn
1985 1990 1995 2000
Arg Arg Arg Asn Arg Asp Thr Asn Asp Asp Glu Phe Thr Arg Pro Ala
2005 2010 2015
His Glu Gin Met Gin Glu Val Thr Thr Phe Cys Ser Lys Ala Asn Ser 2020 2025 2030
121
Ala Gly Leu Ala 2035 Leu Glu Arg Ala Val 2040 Leu Val Glu Asp Ala 2045 íle Lys
Ser Glu Lys Leu Ser Lys Thr Val Asn Glu Met Val Arg Lys Gly Ser
2050 2055 2060
Thr Thr Ser Glu Glu Val Ala Val Ala Leu Ser Asp Asp Glu Ala Val
2065 2070 2075 2080
Glu Glu íle Ser Val Ala Asp Glu Arg Asp Asp Ser Pro Lys Thr Val
2085 2090 2095
Arg íle Ser Glu Tyr Leu Asn Arg Leu Asn Ser Ser Phe Glu Phe Pro
2100 2105 2110
Lys Pro íle Val Val Asp Asp Asn Lys Asp Thr Gly Gly Leu Thr Asn
2115 2120 2125
Ala Val Arg Glu Phe Tyr Tyr Met Gin Glu Leu Ala Leu Phe Glu íle
2130 2135 2140
His Ser Lys Leu Cys Thr Tyr Tyr Asp Gin Leu Arg íle Val Asn Phe
2145 2150 2155 2160
Asp Arg Ser Val Ala Pro Cys Ser Glu Asp Ala Gin Leu Tyr Val Arg
2165 2170 2175
Lys Asn Gly Ser Thr íle Val Gin Gly Lys Glu Val Arg Leu His íle
2180 2185 2190
Lys Asp Phe His Asp His Asp Phe Leu Phe Asp Gly Lys íle Ser íle
2195 2200 2205
Asn Lys Arg Arg Arg Gly Gly Asn Val Leu Tyr His Asp Asn Leu Ala
2210 2215 2220
Phe Leu Ala Ser Asn Leu Phe Leu Ala Gly Tyr Pro Phe Ser Arg Ser
2225 2230 2235 2240
Phe Val Phe Thr Asn Ser Ser Val Asp íle Leu Leu Tyr Glu Ala Pro
2245 2250 2255
Pro Gly Gly Gly Lys Thr Thr Thr Leu íle Asp Ser Phe Leu Lys Val
2260 2265 2270
Phe Lys Lys Gly Glu Val Ser Thr Met íle Leu Thr Ala Asn Lys Ser
2275 2280 2285
Ser Gin Val Glu íle Leu Lys Lys Val Glu Lys Glu Val Ser Asn íle
2290 2295 2300
Glu Cys Gin Lys Arg Lys Asp Lys Arg Ser Pro Lys Lys Ser íle Tyr
2305 2310 2315 2320
Thr íle Asp Ala Tyr Leu Met His His Arg Gly cys Asp Ala Asp Val
2325 2330 2335
Leu Phe íle Asp Glu Cys Phe Met Val His Ala Gly Ser Val Leu Ala 2340 2345 2350
122
Cys íle Glu Phe 2355 Thr Arg Cys His Lys Val Met íle Phe Gly Asp Ser
2360 2365
Arg Gin íle His Tyr íle Glu Arg Asn Glu Leu Asp Lys Cys Leu Tyr
2370 2375 2380
Gly Asp Leu Asp Arg Phe Val Asp Leu Gin Cys Arg Val Tyr Gly Asn
2385 2390 2395 2400
íle Ser Tyr Arg Cys Pro Trp Asp Val Cys Ala Trp Leu Ser Thr Val
2405 2410 2415
Tyr Gly Asn Leu íle Ala Thr Val Lys Gly Glu Ser Glu Gly Lys Ser
2420 2425 2430
Ser Met Arg íle Asn Glu íle Asn Ser Val Asp Asp Leu Val Pro Asp
2435 2440 2445
Val Gly Ser Thr Phe Leu Cys Met Leu Gin Ser Glu Lys Leu Glu íle
2450 2455 2460
Ser Lys His Phe íle Arg Lys Gly Leu Thr Lys Leu Asn Val Leu Thr
2465 2470 2475 2480
Val Lys Glu Ala Gin Gly Glu Thr Tyr Ala Arg Val Asn Leu Val Arg
2485 2490 2495
Leu Lys Phe Gin Glu Asp Glu Pro Phe Lys Ser íle Arg His íle Thr
2500 2505 2510
Val Ala Leu Ser Arg His Thr Asp Ser Leu Thr Tyr Asn Val Leu Ala
2515 2520 2525
Ala Arg Arg Gly Asp Ala Thr Cys Asp Ala íle Gin Lys Ala Ala Glu
2530 2535 2540
Leu Val Asn Lys Phe Arg Val Phe Pro Thr Ser Phe Gly Gly Ser Val
2545 2550 2555 2560
íle Asn Leu Asn Val Lys Lys Asp Val Glu Asp Asn Ser Arg Cys Lys
2565 2570 2575
Ala Ser Ser Ala Pro Leu Ser Val íle Asn Asp Phe Leu Asn Glu Val
2580 2585 2590
Asn Pro Gly Thr Ala Val íle Asp Phe Gly Asp Leu Ser Ala Asp Phe
2595 2600 2605
Ser Thr Gly Pro Phe Glu Cys Gly Ala Ser Gly íle Val Val Arg Asp
2610 2615 2620
Asn íle Ser Ser Ser Asn íle Thr Asp His Asp Lys Gin Arg Val
2625 2630 2635
(2) Informácia pre sekvenciu ID.No.4:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 1380 párov báz
123 (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.:4
AGCGTAGTTC GGTCGCAGGC GATTCCGCGT AGAAAACCTT CTCTACAAGA AAATTTGTAT 60
TCGTTTGAAG CGCGGAATTA TAACTTCTCG ACTTGCGACC GTAACACATC TGCTTCAATG 120
TTCGGAGAGG CTATGGCGAT GAACTGTCTT CGTCGTTGCT TCGACCTAGA TGCCTTTTCG 180
TCCCTGCGTG ATGATGTGAT TAGTATCACA CGTTCAGGCA TCGAACAATG GCTGGAGAAA 240
CGTACTCCTA GTCAGATTAA AGCATTAATG AAGGATGTTG AATCGCCTTT GGAAATTGAC 300
GATGAAATTT GTCGTTTTAA GTTGATGGTG AAGCGTGACG CTAAGGTGAA GTTAGACTCT 360
TCTTGTTTAA CTAAACACAG CGCCGCTCAA AATATCATGT TTCATCGCAA GAGCATTAAT 420
GCTATCTTCT CTCCTATCTT TAATGAGGTG AAAAACCGAA TAATGTGCTG TCTTAAGCCT 480
AACATAAAGT TTTTTACGGA GATGACTAAC AGGGATTTTG CTTCTGTTGT CAGCAACATG 540
CTTGGTGACG ACGATGTGTA CCATATAGGT GAAGTTGATT TCTCAAAGTA CGACAAGTCT 600
CAAGATGCTT TCGTGAAGGC TTTTGAAGAA GTAATGTATA AGGAACTCGG TGTTGATGAA 660
GAGTTGCTGG CTATCTGGAT GTGCGGCGAG CGGTTATCGA TAGCTAACAC TCTCGATGGT 720
CAGTTGTCCT TCACGATCGA GAATCAAAGG AAGTCGGGAG CTTCGAACAC TTGGATTGGT 780
AACTCTCTCG TCACTTTGGG TATTTTAAGT CTTTACTACG ACGTTAGAAA TTTCGAGGCG 840
TTGTACATCT CGGGCGATGA TTCTTTAATT TTTTCTCGCA GCGAGATTTC GAATTATGCC 900
GACGACATAT GCACTGACAT GGGTTTTGAG ACAAAATTTA TGTCCCCAAG TGTCCCGTAC 960
TTTTGTTCTA AATTTGTTGT TATGTGTGGT CATAAGACGT TTTTTGTTCC CGACCCGTAC 1020
AAGCTTTTTG TCAAGTTGGG AGCAGTCAAA GAGGATGTTT CAATGGATTT CCTTTTCGAG 1080
ACTTTTACCT CCTTTAAAGA CTTAACCTCC GATTTTAACG ACGAGCGCTT AATTCAAAAG 1140
CTCGCTGAAC TTGTGGCTTT AAAATATGAG GTTCAAACCG GCAACACCAC CTTGGCGTTA 1200
AGTGTGATAC ATTGTTTGCG TTCGAATTTC CTCTCGTTTA GCAAGTTATA TCCTCGCGTG 1260
AAGGGATGGC AGGTTTTTTA CACGTCGGTT AAGAAAGCGC TTCTCAAGAG TGGGTGTTCT 1320
CTCTTCGACA GTTTCATGAC CCCTTTTGGT CAGGCTGTCA TGGTTTGGGA TGATGAGTAG 1380
(2) Informácia pre sekvenciu ID.No.5:
(i) Vlastnosti sekvencie:
124 (A) Dĺžka: 459 aminokyselín (B) Typ: aminokyselina (C) Typ vlákna:
(D) Topológia: lineárna (ii) Molekula typu: proteín (xi) Popis sekvencie: SEQ.ID.No.5:
Ser 1 Val Val Arg Ser 5 Gin Ala íle Pro Arg 10 Arg Lys Pro Ser Leu 15 Gin
Glu Asn Leu Tyr 20 Ser Phe Glu Ala Arg 25 Asn Tyr Asn Phe Ser 30 Thr Cys
Asp Arg Asn 35 Thr Ser Ala Ser Met 40 Phe Gly Glu Ala Met 45 Ala Met Asn
Cys Leu 50 Arg Arg Cys Phe Asp 55 Leu Asp Ala Phe Ser 60 Ser Leu Arg Asp
Asp 65 Val íle Ser íle Thr 70 Arg Ser Gly íle Glu 75 Gin Trp Leu Glu Lys 80
Arg Thr Pro Ser Gin 85 íle Lys Ala Leu Met 90 Lys Asp Val Glu Ser 95 Pro
Leu Glu íle Asp 100 Asp Glu íle Cys Arg 105 Phe Lys Leu Met Val 110 Lys Arg
Asp Ala Lys 115 Val Lys Leu Asp Ser 120 Ser Cys Arg Phe Lys 125 His Ser Ala
Ala Gin 130 Asn íle Met Phe His 135 Arg Lys Ser íle Asn 140 Ala íle Phe Ser
Pro 145 íle Phe Asn Glu Val 150 Lys Asn Arg íle Met 155 Cys Cys Leu Lys Pro 160
Asn íle Lys Phe Phe 165 Thr Glu Met Thr Asn 170 Arg Asp Phe Ala Ser 175 Val
Val Ser Asn Met 180 Leu Gly Asp Asp Asp 185 Val Tyr His íle Gly 190 Glu Val
Asp Phe Ser 195 Lys Tyr Asp Lys Ser 200 Gin Asp Ala Phe Val 205 Lys Ala Phe
Glu Glu 210 Val Met Tyr Lys Glu 215 Leu Gly Val Asp Glu 220 Glu Leu Leu Ala
íle 225 Trp Met Cys Gly Glu 230 Arg Leu Ser íle Ala 235 Asn Thr Leu Asp Gly 240
Gin Leu Ser Phe Thr 245 íle Glu Asn Gin Arg 250 Lys Ser Gly Ala Ser 255 Asn
125
Thr Trp íle Gly Asn 260 Ser Leu Val Thr Leu Gly íle Leu Ser Leu Tyr
265 270
Tyr Asp Val Arg Asn Phe Glu Ala Leu Tyr íle ser Gly Asp Asp Ser
275 280 285
Leu íle Phe Ser Arg Ser Glu íle Ser Asn Tyr Ala Asp Asp íle Cys
290 295 300
Thr Asp met Gly Phe Glu Thr Lys Phe Met Ser Pro Ser Val Pro Tyr
305 310 315 320
Phe Cys Ser Lys Phe Val Val Met Cys Gly His Lys Thr Phe Phe Val
325 330 335
Pro Asp Pro Tyr Lys Leu Phe Val Lys Leu Gly Ala Val Lys Glu Asp
340 345 350
Val Ser Met Asp Phe Leu Phe Glu Thr Phe Thr Ser Phe Lys Asp Leu
355 360 365
Thr Ser Asp Phe Asn Asp Glu Arg Leu íle Gin Lys Leu Ala Glu Leu
370 375 380
Val Ala Leu Lys Tyr Glu Val Gin Thr Gly Asn Thr Thr Leu Ala Leu
385 390 395 400
Ser Val íle His Cys Leu Arg Ser Asn Phe Leu Ser Phe Ser Lys Leu
405 410 415
Tyr Pro Arg Val Lys Gly Trp Gin Val Phe Tyr Thr Ser Val Lys Lys
420 425 430
Ala Leu Leu Lys Ser Gly Cys Ser Leu Phe Asp Ser Phe Met Thr Pro
435 440 445
Phe Gly Gin Ala Val Met Val Trp Asp Asp Glu
450 455 (2) Informácia pre sekvenciu ID.No.6:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 171 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.6:
ATGAATCAGG TTTTGCAGTT TGAATGTTTG TTTCTGCTGA ATCTCGCGGT TTTTGCTGTG
ACTTTCATTT TCATTCTTCT GGTCTTCCGC GTGATTAAGT CTTTTCGCCA GAAGGGTCAC
GAAGCACCTG TTCCCGTTGT TCGTGGCGGG GGTTTTTCAA CCGTAGTGTA G
120
171
126 (2) Informácia pre sekvenciu ID.No.7:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 56 aminokyselín (B) Typ: aminokyselina (C) Typ vlákna:
(D) Topológia: lineárna (ii) Molekula typu: proteín (xi) Popis sekvencie: SEQ.ID.No.7:
Met 1 Asn Gin Val Leu 5 Gin Phe Glu Cys Leu 10 Phe Leu Leu Asn Leu 15 Ala
Val Phe Ala Val 20 Thr Phe íle Phe íle 25 Leu Leu Val Phe Arg 30 Val íle
Lys Ser Phe 35 Arg Gin Lys Gly His 40 Glu Ala Pro Val Pro 45 Val Val Arg
Gly Gly 50 Gly Phe Ser Thr Val 55 Val
(2) Informácia pre sekvenciu ID.No.8:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 1800 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.8:
ATGGTAGTTT TCGGTTTGGA CTTTGGCACC ACATTCTCTA CGGTGTGTGT GTACAAGGAT 60
GGACGAGTTT TTTCATTCAA GCAGAATAAT TCGGCGTACA TCCCCACTTA CCTCTATCTC 120
TTCTCCGATT CTAACCACAT GACTTTTGGT TACGAGGCCG AATCACTGAT GAGTAATCTG 180
AAAGTTAAAG GTTCGTTTTA TAGAGATTTA AAACGTTGGG TGGGTTGCGA TTCGAGTAAC 240
CTCGACGCGT ACCTTGACCG TTTAAAACCT CATTACTCGG TCCGCTTGGT TAAGATCGGC 300
TCTGGCTTGA ACGAAACTGT TTCAATTGGA AACTTCGGGG GCACTGTTAA GTCTGAGGCT 360
CATCTGCCAG GGTTGATAGC TCTCTTTATT AAGGCTGTCA TTAGTTGCGC GGAGGGCGCG 420
TTTGCGTGCA CTTGCACCGG GGTTATTTGT TCAGTACCTG CCAATTATGA TAGCGTTCAA 480
AGGAATTTCA CTGATCAGTG TGTTTCACTC AGCGGTTATC AGTGCGTATA TATGATCAAT 540
GAACCTTCAG CGGCTGCGCT ATCTGCGTGT AATTCGATTG GAAAGAAGTC CGCAAATTTG 600
127
GCTGTTTACG ATTTCGGTGG TGGGACCTTC GACGTGTCTA TCATTTCATA CCGCAACAAT 660
ACTTTTGTTG TGCGAGCTTC TGGAGGCGAT CTAAATCTCG GTGGAAGGGA TGTTGATCGT 720
GCGTTTCTCA CGCACCTCTT CTCTTTAACA TCGCTGGAAC CTGACCTCAC TTTGGATATC 780
TCGAATCTGA AAGAATCTTT ATCAAAAACG GACGCAGAGA TAGTTTACAC TTTGAGAGGT 840
GTCGATGGAA GAAAAGAAGA CGTTAGAGTA AACAAAAACA TTCTTACGTC GGTGATGCTC 900
CCCTACGTGA ACAGAACGCT TAAGATATTA GAGTCAACCT TAAAATCGTA TGCTAAGAGT 960
ATGAATGAGA GTGCGCGAGT TAAGTGCGAT TTAGTGCTGA TAGGAGGATC TTCATATCTT 1020
CCTGGCCTGG CAGACGTACT AACGAAGCAT CAGAGCGTTG ATCGTATCTT AAGAGTTTCG 1080
GATCCTCGGG CTGCCGTGGC CGTCGGTTGC GCATTATATT CTTCATGCCT CTCAGGATCT 1140
GGGGGGTTGC TACTGATCGA CTGTGCAGCT CACACTGTCG CTATAGCGGA CAGAAGTTGT 1200
CATCAAATCA TTTGCGCTCC AGCGGGGGCA CCGATCCCCT TTTCAGGAAG CATGCCTTTG 1260
TACTTAGCCA GGGTCAACAA GAACTCGCAG CGTGAAGTCG CCGTGTTTGA AGGGGAGTAC 1320
GTTAAGTGCC CTAAGAACAG AAAGATCTGT GGAGCAAATA TAAGATTTTT TGATATAGGA 1380
GTGACGGGTG ATTCGTACGC ACCCGTTACC TTCTATATGG ATTTCTCCAT TTCAAGCGTA 1440
GGAGCCGTTT CATTCGTGGT GAGAGGTCCT GAGGGTAAGC AAGTGTCACT CACTGGAACT 1500
CCAGCGTATA ACTTTTCGTC TGTGGCTCTC GGATCACGCA GTGTCCGAGA ATTGCATATT 1560
AGTTTAAATA ATAAAGTTTT TCTCGGTTTG CTTCTACATA GAAAGGCGGA TCGACGAATA 1620
CTTTTCACTA AGGATGAAGC GATTCGATAC GCCGATTCAA TTGATATCGC GGATGTGCTA 1680
AAGGAATATA AAAGTTACGC GGCCAGTGCC TTACCACCAG ACGAGGATGT CGAATTACTC 1740
CTGGGAAAGT CTGTTCAAAA AGTTTTACGG GGAAGCAGAC TGGAAGAAAT ACCTCTCTAG 1800
(2) Informácia pre sekvenciu ID.No.9:
(i) Vlastnosti sekvencie:
(A) DÍžka: 599 aminokyselín (B) Typ: aminokyselina (C) Typ vlákna:
(D) Topológia: lineárna (ii) Molekula typu: proteín (xi) Popis sekvencie: SEQ.ID.No.9:
Met Val Val Phe Gly Leu Asp Phe Gly Thr Thr Phe Ser Thr Val Cys 15 10 15
Val Tyr Lys Asp Gly Arg Val Phe Ser Phe Lys Gin Asn Asn Ser Ala 20 25 30
128
Tyr íle Pro 35 Thr Tyr Leu Tyr Leu 40 Phe Ser Asp Ser Asn 45 His Met Thr
Phe Gly 50 Tyr Glu Ala Glu Ser 55 Leu Met Ser Asn Leu 60 Lys Val Lys Gly
Tyr íle Pro 35 Thr Tyr Leu Tyr Leu 40 Phe Ser Asp Ser Asn 45 His Met Thr
Phe Gly 50 Tyr Glu Ala Glu Ser 55 Leu Met Ser Asn Leu 60 Lys Val Lys Gly
Ser 65 Phe Tyr Arg Asp Leu 70 Lys Arg Trp Val Gly 75 Cys Asp Ser Ser Asn 80
Leu Asp Ala Tyr Leu 85 Asp Arg Leu Lys Pro 90 His Tyr Ser Val Arg 95 Leu
Val Lys íle Gly Ser Gly Leu Asn Glu Thr Val Ser íle Gly Asn Phe
100 105 110
Gly Gly Thr 115 Val Lys Ser Glu Ala 120 His Leu Pro Gly Leu 125 íle Ala Leu
Phe íle 130 Lys Ala Val íle Ser 135 Cys Ala Glu Gly Ala 140 Phe Ala Cys Thr
Cys 145 Thr Gly Val íle Cys 150 Ser Val Pro Ala Asn 155 Tyr Asp Ser Val Gin 160
Arg Asn Phe Thr Asp 165 Gin Cys Val Ser Leu 170 Ser Gly Tyr Gin Cys 175 Val
Tyr Met íle Asn 180 Glu Pro Ser Ala Ala 185 Ala Leu Ser Ala Cys 190 Asn Ser
íle Gly Lys 195 Lys Ser Ala Asn Leu 200 Ala Val Tyr Asp Phe 205 Gly Gly Gly
Thr Phe 210 Asp Val Ser íle íle 215 Ser Tyr Arg Asn Asn 220 Thr Phe Val Val
Arg 225 Ala Ser Gly Gly Asp 230 Leu Asn Leu Gly Gly 235 Arg Asp Val Asp Arg 240
Ala Phe Leu Thr His 245 Leu Phe Ser Leu Thr 250 Ser Leu Glu Pro Asp 255 Leu
Thr Leu Asp íle 260 Ser Asn Leu Lys Glu 265 Ser Leu Ser Lys Thr 270 Asp Ala
Glu íle Val 275 Tyr Thr Leu Arg Gly 280 Val Asp Gly Arg Lys 285 Glu Asp Val
Arg Val 290 Asn Lys Asn íle Leu 295 Thr Ser Val Met Leu 300 Pro Tyr Val Asn
Arg Thr Leu Lys íle Leu Glu Ser Thr Leu Lys Ser Tyr Ala Lys Ser 305 310 215 320
129
Met Asn Glu Ser Ala Arg Val Lys 325 Cys Asp Leu Val Leu íle Gly Gly
330 335
Ser Ser Tyr Leu Pro Gly Leu Ala Asp Val Leu Thr Lys His Gin Ser
340 345 350
Val Asp Arg íle Leu Arg Val Ser Asp Pro Arg Ala Ala Val Ala Val
355 360 365
Gly Cys Ala Leu Tyr Ser Ser Cys Leu Ser Gly Ser Gly Gly Leu Leu
370 375 380
Leu íle Asp Cys Ala Ala His Thr Val Ala íle Ala Asp Arg Ser Cys
385 390 395 400
His Gin íle íle Cys Ala Pro Ala Gly Ala Pro íle Pro Phe Ser Gly
405 410 415
Ser Met Pro Leu Tyr Leu Ala Arg Val Asn Lys Asn Ser Gin Arg Glu
420 425 430
Val Ala Val Phe Glu Gly Glu Tyr Val Lys Cys Pro Lys Asn Arg Lys
435 440 445
íle Cys Gly Ala Asn íle Arg Phe Phe Asp íle Gly Val Thr Gly Asp
450 455 460
Ser Tyr Ala Pro Val Thr Phe Tyr met Asp Phe Ser íle Ser Ser Val
465 470 475 480
Gly Ala Val Ser Phe Val Val Arg Gly Pro Glu Gly Lys Gin Val Ser
485 490 495
Leu Thr Gly Thr Pro Ala Tyr Asn Phe Ser Ser Val Ala Leu Gly Ser
500 505 510
Arg Ser Val Arg Glu Leu His íle Ser Leu Asn Asn Lys Val Phe Leu
515 520 525
Gly Leu Leu Leu His Arg Lys Ala Asp Arg Arg íle Leu Phe Thr Lys
530 535 540
Asp Glu Ala íle Arg Tyr Ala Asp Ser íle Asp íle Ala Asp Val Leu
545 550 555 560
Lys Glu Tyr Lys Ser Tyr Ala Ala Ser Ala Leu Pro Pro Asp Glu Asp
565 570 575
Val Glu Leu Leu Leu Gly Lys Ser Val Gin Lys Val Leu Arg Gly Ser
580 585 590
Arg Leu Glu Glu íle Pro Leu
595 (2) Informácia pre sekvenciu ID.No.10:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 1656 párov báz
130 (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.10:
ATGTCGAATT ACTCCTGGGA AAGTCTGTTC AAAAAGTTTT ACGGGGAAGC AGACTGGAAG 60
AAATACCTCT CTAGGAGCAT AGCAGCACAC TCAAGTGAAA TTAAAACTCT ACCAGACATT 120
CGATTGTACG GCGGTAGGGT TGTAAAGAAG TCCGAATTCG AATCAGCACT TCCTAATTCT 180
TTTGAACAGG AATTAGGACT CTTCATACTG AGCGAACGGG AAGTGGGATG GAGCAAATTA 240
TGCGGAATAA CGGTGGAAGA AGCAGCATAC GATCTTACGA ATCCCAAGGC TTATAAATTC 300
ACTGCCGAGA CATGTAGCCC GGATGTAAAA GGTGAAGGAC AAAAATACTC TATGGAAGAC 360
GTGATGAATT TCATGCGTTT ATCAAATCTG GATGTTAACG ACAAGATGCT GACGGAACAG 420
TGTTGGTCGC TGTCCAATTC ATGCGGTGAA TTGATCAACC CAGACGACAA AGGGCGATTC 480
GTGGCTCTCA CCTTTAAGGA CAGAGACACA GCTGATGACA CGGGTGCCGC CAACGTGGAA 540
TGTCGCGTGG GCGACTATCT AGTTTACGCT ATGTCCCTGT TTGAGCAGAG GACCCAAAAA 600
TCGCAGTCTG GCAACATCTC TCTGTACGAA AAGTACTGTG AATACATCAG GACCTACTTA 660
GGGAGTACAG ACCTGTTCTT CACAGCGCCG GACAGGATTC CGTTACTTAC GGGCATCCTA 720
TACGATTTTT GTAAGGAATA CAACGTTTTC TACTCGTCAT ATAAGAGAAA CGTCGATAAT 780
TTCAGATTCT TCTTGGCGAA TTATATGCCT TTGATATCTG ACGTCTTTGT CTTCCAGTGG 840
GTAAAACCCG CGCCGGATGT TCGGCTGCTT TTTGAGTTAA GTGCAGCGGA ACTAACGCTG 900
GAGGTTCCCA CACTGAGTTT GATAGATTCT CAAGTTGTGG TAGGTCATAT CTTAAGATAC 960
GTAGAATCCT ACACATCAGA TCCAGCCATC GACGCGTTAG AAGACAAACT GGAAGCGATA 1020
CTGAAAAGTA GCAATCCCCG TCTATCGACA GCGCAACTAT GGGTTGGTTT CTTTTGTTAC 1080
TATGGTGAGT TTCGTACGGC TCAAAGTAGA GTAGTGCAAA GACCAGGCGT ATACAAAACA 1140
CCTGACTCAG TGGGTGGATT ZGAAATAAAC ATGAAAGATG TTGAGAAATT CTTCGATAAA 1200
CTTCAGAGAG AATTGCCTAA TGTATCTTTG CGGCGTCAGT TTAACGGAGC TAGAGCGCAT 1260
GAGGCTTTCA AAATATTTAA AAACGGAAAT ATAAGTTTCA GACCTATATC GCGTTTAAAC 1320
GTGCCTAGAG AGTTCTGGTA TCTGAACATA GACTACTTCA GGCACGCGAA TAGGTCCGGG 1380
TTAACCGAAG AAGAAATACT CATCCTAAAC AACATAAGCG TTGATGTTAG GAAGTTATGC 1440
GCTGAGAGAG CGTGCAATAC CCTACCTAGC GCGAAGCGCT TTAGTAAAA TCATAAGAGT 1500
131
AATATACAAT CATCACGCCA AGAGCGGAGG ATTAAAGACC CATTGGTAGT CCTGAAAGAC 1560
ACTTTATATG AGTTCCAACA CAAGCGTGCC GGTTGGGGGT CTCGAAGCAC TCGAGACCTC 1620
GGGAGTCGTG CTGACCACGC GAAAGGAAGC GGTTGA 1656
(2) Informácia pre sekvenciu ID.No.ll:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 551 aminokyselín (B) Typ: aminokyselina (C) Typ vlákna:
(D) Topológia: lineárna (ii) Molekula typu: protein (xi) Popis sekvencie: SEQ.ID.No.il:
Met 1 Ser Asn Tyr Ser 5 Trp Glu Ser Leu Phe 10 Lys Lys Phe Tyr Gly 15 Glu
Ala Asp Trp Lys 20 Lys Tyr Leu Ser Arg 25 Ser íle Ala Ala His 30 Ser Ser
Glu íle Lys 35 Thr Leu Pro Asp íle 40 Arg 'Leu Tyr Gly Gly 45 Arg Val Val
Lys Lys 50 Ser Glu Phe Glu Ser 55 Ala Leu Pro Asn Ser 60 Phe Glu Gin Glu
Leu 65 Gly Leu Phe íle Leu 70 Ser Glu Arg Glu Val 75 Gly Trp Ser Lys Leu 80
Cys Gly íle Thr Val 85 Glu Glu Ala Ala Tyr 90 Asp Leu Thr Asn Pro 95 Lys
Ala Tyr Lys Phe 100 Thr Ala Glu Thr Cys 105 Ser Pro Asp Val Lys 110 Gly Glu
Gly Gin Lys 115 Tyr Ser Met Glu Asp 120 Val Met Asn Phe Met 125 Arg Leu Ser
Asn Leu 130 Asp Val Asn Asp Lys 135 Met Leu Thr Glu Gin 140 Cys Trp Ser Leu
Ser 145 Asn Ser Cys Gly Glu 150 Leu íle Asn Pro Asp 155 Asp Lys Gly Arg Phe 160
Val Ala Leu Thr Phe 165 Lys Asp Arg Asp Thr 170 Ala Asp Asp Thr Gly 175 Ala
Ala Asn Val Glu 180 Cys Arg Val Gly Asp 185 Tyr Leu Val Tyr Ala 190 Met Ser
Leu Phe Glu Gin Arg Thr Gin Lys Ser Gin Ser Gly Asn íle Ser Leu 195 200 205
132
Tyr Glu 210 Lys Tyr Cys Glu Tyr íle Arg Thr Tyr Leu Gly Ser Thr Asp
215 220
Leu Phe Phe Thr Ala Pro Asp Arg íle Pro Leu Leu Thr Gly íle Leu
225 230 235 240
Tyr Asp Phe Cys Lys Glu Tyr Asn Val Phe Tyr Ser Ser Tyr Lys Arg
245 250 255
Asn Val Asp Asn Phe Arg Phe Phe Leu Ala Asn Tyr Met Pro Leu íle
260 265 270
Ser Asp Val Phe Val Phe Gin Trp Val Lys Pro Ala Pro Asp Val Arg
275 280 285
Leu Leu Phe Glu Leu Ser Ala Ala Glu Leu Thr Leu Glu Val Pro Thr
290 295 300
Leu Ser Leu íle Asp Ser Gin Val Val Val Gly His íle Leu Arg Tyr
305 310 315 320
Val Glu Ser Tyr Thr Ser Asp Pro Ala íle Asp Ala Leu Glu Asp Lys
325 330 335
Leu Glu Ala íle Leu Lys Ser Ser Asn Pro Arg Leu Ser Thr Ala Gin
340 345 350
Leu Trp Val Gly Phe Phe Cys Tyr Tyr Gly Glu Phe Arg Thr Ala Gin
355 360 365
Ser Arg 370 Val Val Gin Arg Pro 375 Gly Val Tyr Lys Thr 380 Pro Asp Ser Val
Gly 385 Gly Pro Glu íle Asn 390 Met Lys Asp Val Glu 395 Lys Phe Phe Asp Lys 400
Leu Gin Arg Glu Leu 405 Pro Asn Val Ser Leu 410 Arg Arg Gin Phe Asn 415 Gly
Ala Arg Ala His 420 Glu Ala Phe Lys íle 425 Phe Lys Asn Gly Asn 430 íle Ser
Phe Arg Pro 435 íle Ser Arg Leu Asn 440 Val Pro Arg Glu Phe 445 Trp Tyr Leu
Asn íle 450 Asp Tyr Phe Arg His 455 Ala Asn Arg Ser Gly 460 Leu Thr Glu Glu
Glu 465 íle Leu íle Leu Asn 470 Asn íle Ser Val Asp 475 Val Arg Lys Leu Cys 480
Ala Glu Arg Ala Cys 485 Asn Thr Leu Pro Ser 490 Ala Lys Arg Phe Ser 495 Lys
Asn His Lys Ser 500 Asn íle Gin Ser Ser 505 Arg Gin Glu Arg Arg 510 íle Lys
Asp Pro Leu 515 Val Val Leu Lys Asp 520 Thr Leu Tyr Glu Phe 525 Gin His Lys
133
Arg Ala Gly Trp Gly Ser Arg Ser Thr Arg Asp Leu Gly Ser Arg Ala 530 535 540
Asp His Ala Lys Gly Ser Gly (2) Informácia pre SEQ. ID.No.12:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 672 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.12:
ATGAGTTCCA ACACAAGCGT GCCGGTTGGG GGTCTCGAAG CACTCGAGAC CTCGGGAGTC 60
GTGCTGACCA CGCGAAAGGA AGCGGTTGAT AAGTTTTTTA ATGAACTAAA AAACGAAAAT 120
TACTCATCAG TTGACAGCAG CCGATTAAGC GATTCGGAAG TAAAAGAAGT GTTAGAGAAA 180
AGTAAAGAAA GTTTCAAAAG CGAACTGGCC TCCACTGACG AGCACTTCGT CTACCACATT 240
ATATTTTTCT TAATCCGATG TGCTAAGATA TCGACAAGTG AAAAGGTGAA GTACGTTGGT 300
AGTCATACGT ACGTGGTCGA CGGAAAAACG TACACCGTTC TTGACGCTTG GGTATTCAAC 360
ATGATGAAAA GTCTCACGAA GAAGTACAAA CGAGTGAATG GTCTGCGTGC GTTCTGTTGC 420
GCGTGCGAAG ATCTATATCT AACCGTCGCA CCAATAATGT CAGAACGCTT TAAGACTAAA 480
GCCGTAGGGA TGAAAGGTTT GCCTGTTGGA AAGGAATACT TAGGCGCCGA CTTTCTTTCG 540
GGAACTAGCA AACTGATGAG CGATCACGAC AGGGCGGTCT CCATCGTTGC AGCGAAAAAC 600
GCTGTCGATC GTAGCGCTTT CACGGGTGGG GAGAGAAAGA TAGTTAGTTT GTATGATCTA 660
GGGAGGTACT AA 672
(2) Informácia pre SEQ. ID.No.13:
(i) Vlastnosti sekvencie:
(A) DÍžka: 223 aminokyselín (B) Typ: aminokyselina (C) Typ vlákna:
(D) Topológia: lineárna (ii) Molekula typu: protein (xi) Popis sekvencie: SEQ.ID.No.13:
Met Ser Ser Asn Thr Ser Val Pro Val Gly Gly Leu Glu Ala Leu Glu 15 10 15
134
Thr Ser Gly Val 20 Val Leu Thr Thr Arg 25 Lys Glu Ala Val Asp 30 Lys Phe
Phe Asn Glu 35 Leu Lys Asn Glu Asn 40 Tyr Ser Ser Val Asp 45 Ser Ser Arg
Leu Ser 50 Asp Ser Glu Val Lys 55 Glu Val Leu Glu Lys 60 Ser Lys Glu Ser
Phe 65 Lys Ser Glu Leu Ala 70 Ser Thr Asp Glu His 75 Phe Val Tyr His íle 80
íle Phe Phe Leu íle 85 Arg Cys Ala Lys íle 90 Ser Thr Ser Glu Lys 95 Val
Lys Tyr Val Gly 100 Ser His Thr Tyr Val 105 Val Asp Gly Lys Thr 110 Tyr Thr
Val Leu Asp 115 Ala Trp Val Phe Asn 120 Met Met Lys Ser Leu 125 Thr Lys Lys
Tyr Lys 130 Arg Val Asn Gly Leu 135 Arg Ala Phe Cys Cys 140 Ala Cys Glu Asp
Leu 145 Tyr Leu Thr Val Ala 150 Pro íle Met Ser Glu 155 Arg Phe Lys Thr Lys 160
Ala Val Gly Met Lys 165 Gly Leu Pro Val Gly 170 Lys Glu Tyr Leu Gly 175 Ala
Asp Phe Leu Ser 180 Gly Thr Ser Lys Leu 185 Met Ser Asp His Asp 190 Arg Ala
Val Ser íle 195 Val Ala Ala Lys Asn 200 Ala Val Asp Arg Ser 205 Ala Phe Thr
Gly Gly Glu Arg Lys íle Val Ser Leu Tyr Asp Leu Gly Arg Tyr
210 215 220 (2) Informácia pre SEQ. ID.No.14:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 597 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.14:
ATGGAGTTGA TGTCCGACAG CAACCTTAGC AACCTGGTGA TAACCGACGC CTCTAGTCTA 60
AATGGTGTCG ACAAGAAGCT TTTATCTGCT GAAGTTGAAA AAATGTTGGT GCAGAAAGGG 120
GCTCCTAACG AGGGTATAGA AGTGGTGTTC GGTCTACTCC TTTACGCACT CGCGGCAAGA 180
135
ACCACGTCTC CTAAGGTTCA GCGCGCAGAT TCAGACGTTA TATTTTCAAA TAGTTTCGGA 240
GAGAGGAATG TGGTAGTAAC AGAGGGTGAC CTTAAGAAGG TACTCGACGG GTGTGCGCCT 300
CTCACTAGGT TCACTAATAA ACTTAGAACG TTCGGTCGTA CTTTCACTGA GGCTTACGTT 360
GACTTTTGTA TCGCGTATAA GCACAAATTA CCCCAACTCA ACGCCGCGGC GGAATTGGGG 420
ATTCCAGCTG AAGATTCGTA CTTAGCTGCA GATTTTCTGG GTACTTGCCC GAAGCTCTCT 480
GAATTACAGC AAAGTAGGAA GATGTTCGCG AGTATGTACG CTCTAAAAAC TGAAGGTGGA 540
GTGGTAAATA CACCAGTGAG CAATCTGCGT CAGCTAGGTA GAAGGGAAGT TATGTAA 597
(2) Informácia pre SEQ. ID.No.15:
(i) Vlastnosti sekvencie:
(A) DÍžka: 198 aminokyselín (B) Typ: aminokyselina (C) Typ vlákna:
(D) Topológia: lineárna (ii) Molekula typu: protein (xi) Popis sekvencie: SEQ.ID.No.15:
Met 1 Glu Leu Met Ser 5 Asp Ser Asn Leu Ser 10 Asn Leu Val íle Thr 15 Asp
Ala Ser Ser Leu 20 Asn Gly Val Asp Lys 25 Lys Leu Leu Ser Ala 30 Glu Val
Glu Lys Met 35 Leu Val Gin Lys Gly 40 Ala Pro Asn Glu Gly 45 íle Glu Val
Val Phe 50 Gly Leu Leu Leu Tyr 55 Ala Leu Ala Ala Arg 60 Thr Thr Ser Pro
Lys 65 Val Gin Arg Ala Asp 70 Ser Asp Val íle Phe 75 Ser Asn Ser Phe Gly 80
Glu Arg Asn Val Val 85 Val Thr Glu Gly Asp 90 Leu Lys Lys Val Leu 95 Asp
Gly Cys Ala Pro 100 Leu Thr Arg Phe Thr 105 Asn Lys Leu Arg Thr 110 Phe Gly
Arg Thr Phe 115 Thr Glu Ala Tyr Val 120 Asp Phe Cys íle Ala 125 Tyr Lys His
Lys Leu 130 Pro Gin Leu Asn Ala 135 Ala Ala Glu Leu Gly 140 íle Pro Ala Glu
Asp 145 Ser Tyr Leu Ala Ala 150 Asp Phe Leu Gly Thr 155 Cys Pro Lys Leu Ser 160
136
Glu Leu Gin Gin Ser 165 Arg Lys Met Phe Ala 170 Ser Met Tyr Ala Leu 175 Lys
Thr Glu Gly Gly Val Val Asn Thr Pro Val Ser Asn Leu Arg Gin Leu
180 185 190
Gly Arg Arg Glu Val Met
195 (2) Informácia pre SEQ. ID.No.16:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 486 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.16:
ATGGAAGATT ACGAAGAAAA ATCCGAATCG CTCATACTGC TACGCACGAA TCTGAACACT 60
ATGCTTTTAG TGGTCAAGTC CGATGCTAGT GTAGAGCTGC CTAAACTACT AATTTGCGGT 120
TACTTACGAG TGTCAGGACG TGGGGAGGTG ACGTGTTGCA ACCGTGAGGA ATTAACAAGA 180
GATTTTGAGG GCAATCATCA TACGGTGATC CGTTCTAGAA TCATACAATA TGACAGCGAG 240
TCTGCTTTTG AGGAATTCAA CAACTCTGAT TGCGTAGTGA AGTTTTTCCT AGAGACTGGT 300
AGTGTCTTTT GGTTTTTCCT TCGAAGTGAA ACCAAAGGTA GAGCGGTGCG ACATTTGCGC 360
ACCTTCTTCG AAGCTAACAA TTTCTTCTTT GGATCGCATT GCGGTACCAT GGAGTATTGT 420
TTGAAGCAGG TACTAACTGA AACTGAATCT ATAATCGATT CTTTTTGCGA AGAAAGAAAT 480
CGTTAA 486
(2) Informácia pre SEQ. ID.No.17:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 161 aminokyselín (B) Typ: aminokyselina (C) Typ vlákna:
(D) Topológia: lineárna (ii) Molekula typu: proteín (xi) Popis sekvencie: SEQ.ID.No.17:
Met Glu Asp Tyr Glu Glu Lys Ser Glu Ser Leu íle Leu Leu Arg Thr 15 10 15
137
Asn Leu Asn Thr 20 Met Leu Leu Val Val 25 Lys Ser Asp Ala Ser 30 Val Glu
Leu Pro Lys 35 Leu Leu íle Cys Gly 40 Tyr Leu Arg Val Ser 45 Gly Arg Gly
Glu Val 50 Thr Cys Cys Asn Arg 55 Glu Glu Leu Thr Arg 60 Asp Phe Glu Gly
Asn 65 His His Thr Val íle 70 Arg Ser Arg íle íle 75 Gin Tyr Asp Ser Glu 80
Ser Ala Phe Glu Glu 85 Phe Asn Asn Ser Asp 90 Cys Val Val Lys Phe 95 Phe
Leu Glu Thr Gly 100 Ser Val Phe Trp Phe 105 Phe Leu Arg Ser Glu 110 Thr Lys
Gly Arg Ala 115 Val Arg His Leu Arg 120 Thr Phe Phe Glu Ala 125 Asn Asn Phe
Phe Phe 130 Gly Ser His Cys Gly 135 Thr Met Glu Tyr Cys 140 Leu Lys Gin Val
Leu 145 Thr Glu Thr Glu Ser 150 íle íle Asp Ser Phe 155 Cys Glu Glu Arg Asn 160
Arg (2) Informácia pre SEQ. ID.No.18:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 618 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.18:
ATGAGGGTTA TAGTGTCTCC TTATGAAGCT GAAGACATTC TGAAAAGATC GACTGACATG 60
TTACGAAACA TAGACAGTGG GGTCTTGAGC ACTAAAGAAT GTATCAAGGC ATTCTCGACG 120
ATAACGCGAG ACCTACATTG TGCGAAGGCT TCCTACCAGT GGGGTGTTGA CACTGGGTTA 180
TATCAGCGTA ATTGCGCTGA AAAACGTTTA ATTGACACGG TGGAGTCAAA CATACGGTTG 240
GCTCAACCTC TCGTGCGTGA AAAAGTGGCG GTTCATTTTT GTAAGGATGA ACCAAAAGAG 300
CTAGTAGCAT TCATCACGCG AAAGTACGTG GAACTCACGG GCGTGGGAGT GAGAGAAGCG 360
GTGAAGAGGG AAATGCGCTC TCTTACCAAA ACAGTTTTAA ATAAAATGTC TTTGGAAATG 420
GCGTTTTACA TGTCACCACG AGCGTGGAAA AACGCTGAAT GGTTAGAACT AAAATTTTCA 480
138
CCTGTGAAAA TCTTTAGAGA TCTGCTATTA GACGTGGAAA CGCTCAACGA ATTGTGCGCC
GAAGATGATG TTCACGTCGA CAAAGTAAAT GAGAATGGGG ACGAAAATCA CGACCTCGAA
CTCCAAGACG AATGTTAA (2) Informácia pre SEQ. ID.No.19:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 205 aminokyselín (B) Typ: aminokyselina (C) Typ vlákna:
(D) Topológia: lineárna (ii) Molekula typu: protein
540
600
618 (xi) Popis sekvencie: SEQ.ID.No.19:
Met Arg 1 Val íle Val 5 Ser Pro Tyr Glu Ala Glu Asp íle Leu Lys Arg
10 15
Ser Thr Asp Met Leu Arg Asn íle Asp Ser Gly Val Leu Ser Thr Lys
20 25 30
Glu Cys íle Lys Ala Phe Ser Thr íle Thr Arg Asp Leu His cys Ala
35 40 45
Lys Ala Ser Tyr Gin Trp Gly Val Asp Thr Gly Leu Tyr Gin Arg Asn
50 55 60
Cys Ala Glu Lys Arg Leu íle Asp Thr Val Glu Ser Asn íle Arg Leu
65 70 75 80
Ala Gin Pro Leu Val Arg Glu Lys Val Ala Val His Phe Cys Lys Asp
85 90 95
Glu Pro Lys Glu Leu Val Ala Phe íle Thr Arg Lys Tyr Val Glu Leu
100 105 110
Thr Gly Val gly Val Arg Glu Ala Val Lys Arg Glu Met Arg Ser Leu
115 120 125
Thr Lys Thr Val Leu Asn Lys Met Ser Leu Glu Met Ala Phe Tyr Met
130 135 140
Ser Pro Arg Ala Trp Lys Asn Ala Glu Trp Leu Glu Leu Lys Phe Ser
145 150 155 160
Pro Val Lys íle Phe Arg Asp Leu Leu Leu Asp Val Glu Thr Leu Asn
165 170 175
Glu Leu Cys Ala Glu Asp Asp Val His Val Asp Lys Val Asn Glu Asn
180 185 190
Gly Asp Glu Asn His Asp Leu Glu Leu Gin Asp Glu Cys
195 200 205
(2) Informácia pre SEQ. ID.No.20:
139 (i) Vlastnosti sekvencie:
(A) Dĺžka: 21 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.20:
TGCTGGAGCT TGAGGTTCTG C 21 (2) Informácia pre SEQ. ID.No.21:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 31 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.21:
CGGAATTCAC CATGGAGTTG ATGTCCGACA G 31 (2) Informácia pre SEQ. ID.No.22:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 33 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.22:
AGCGGATCCA TGGCAGATTC GTGCGTAGCA GTA 31 (2) Informácia pre SEQ. ID.No.23:
(i) Vlastnosti sekvencie:
(A) Dĺžka: 216 párov báz (B) Typ: nukleová kyselina (C) Typ vlákna: jedno vlákno (D) Topológia: lineárna (ii) Molekula typu: cDNA (xi) Popis sekvencie: SEQ.ID.No.23:
140
ACATTGGTTA AGTTTAACGA AAATGATTAG TAAATAATAA ATCGAACGTG GGTGTATCTA 60
CCTGACGTAT CAACTTAAGC TGTTACTGAG TAATTAAACC AACAAGTGTT GGTGTAATGT 120
GTATGTTGAT GTAGAGAAAA ATCCGTTTGT AGAACGGTGT TTTTCTCTTC TTTATTTTTA 180
AAAAAAAAAT AAAAAAAAAA AAAAAAAAGC GGCCGC 216

Claims (78)

  1. PATENTOVÉ NÁROKY
    1. Izolovaný proteín alebo polypeptid zodpovedajúci proteínu alebo polypeptidu vírusu zvinutky viniča (typ 2).
  2. 2. Izolovaný proteín alebo polypeptid podlá nároku 1, vyznačujúci sa tým, že proteín alebo polypeptid je vybraný zo skupiny obsahujúcej polyproteín, RNA-závislú RNA polymerázu, proteín tepelného šoku 70, proteín tepelného šoku 90, divergentný povrchový proteín a povrchový proteín.
  3. 3. Izolovaný proteín alebo polypeptid podlá nároku 2, vyznačujúci sa tým, že proteín alebo polypeptid je polyproteín.
  4. 4. Izolovaný proteín alebo polypeptid podľa nároku 3, vyznačujúci sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No.3.
  5. 5. Izolovaný proteín alebo polypeptid podľa nároku 2, vyznačujúci sa tým, že proteín alebo polypeptid je RNA-závislá RNA polymeráza molekulovej hmotnosti od 50 do 54 kDa.
  6. 6. Izolovaný proteín alebo polypeptid podľa nároku 5, vyznačujúci sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 5.
    142
  7. 7. Izolovaný proteín alebo polypeptid podlá nároku 2, vyznačujúci sa tým, že proteín alebo polypeptid je proteín tepelného šoku 70 molekulovej hmotnosti od 63 do 67 kDa.
  8. 8. Izolovaný proteín alebo polypeptid podlá nároku 7, vyznačujúci sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 9.
  9. 9. Izolovaný proteín alebo polypeptid podlá nároku 2, vyznačujúci sa tým, že proteín alebo polypeptid je proteín tepelného šoku 90 molekulovej hmotnosti od 61 do 65 kDa.
  10. 10. Izolovaný proteín alebo polypeptid podlá nároku 9, vyznačujúci sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 11.
  11. 11. Izolovaný proteín alebo polypeptid podľa nároku 2, vyznačujúci sa tým, že proteín alebo polypeptid je povrchový proteín molekulovej hmotnosti od 20 do 24 kDa.
  12. 12. Izolovaný proteín alebo polypeptid podľa nároku 11, vyznačujúci sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 15.
  13. 13. Izolovaný proteín alebo polypeptid podľa nároku 2, vyznačujúci sa tým, že proteín alebo polypeptid je divergentný povrchový proteín molekulovej hmotnosti od 23 do 27 kDa.
    143
  14. 14. Izolovaný proteín alebo polypeptid podlá nároku 13, vyznačujúci sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 13.
  15. 15. Izolovaný proteín alebo polypeptid podlá nároku 1, vyznačujúci sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 7.
  16. 16. Izolovaný proteín alebo polypeptid podlá nároku 1, vyznačujúci sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 17.
  17. 17. Izolovaný proteín alebo polypeptid podlá nároku 1, vyznačujúci sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 19.
  18. 18. Izolovaný proteín alebo polypeptid podlá nároku 1, vyznačujúci sa tým, že proteín alebo polypeptid je prečistený.
  19. 19. Izolovaný proteín alebo polypeptid podlá nároku 1, vyznačujúci sa tým, že proteín alebo polypeptid je rekombinantný.
  20. 20. Izolovaná molekula RNA kódujúca proteín alebo polypeptid podlá nároku 1.
    144
  21. 21. Izolovaná molekula RNA podlá nároku 20, vyznačujúca sa tým, že proteín alebo polypeptid je vybraný zo skupiny obsahujúcej polyproteín, RNA-závislú RNA polymerázu, proteín tepelného šoku 70, proteín tepelného šoku 90, divergentný povrchový proteín a povrchový proteín.
  22. 22. Izolovaná molekula DNA kódujúca proteín alebo polypeptid podľa nároku 1.
  23. 23. Izolovaná molekula DNA podlá nároku 22, vyznačujúca sa tým, že proteín alebo polypeptid je vybraný zo skupiny obsahujúcej polyproteín, RNA-závislú RNA polymerázu, proteín tepelného šoku 70, proteín tepelného šoku 90, divergentný povrchový proteín a povrchový proteín.
  24. 24. Izolovaná molekula DNA podľa nároku 23, vyznačujúca sa tým, že proteín alebo polypeptid obsahuje konzervatívne oblasti helikázy, papaínu podobnej proteázy a metyltransferázy.
  25. 25. Izolovaná molekula DNA podľa nároku 24, vyznačujúca sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 3.
  26. 26. Izolovaná molekula DNA podlá nároku 25, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 2.
  27. 27. Izolovaná molekula DNA podľa nároku 23, vyznačujúca sa tým, že proteín alebo polypeptid je RNAzávislá RNA polymeráza molekulovej hmotnosti od 50 do 54 kDa.
    145
  28. 28. Izolovaná molekula DNA podľa nároku 27, vyznačujúca sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 5.
  29. 29. Izolovaná molekula DNA podlá nároku 28, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 4.
  30. 30. Izolovaná molekula DNA podía nároku 23, vyznačujúca sa tým, že proteín alebo polypeptid je proteín tepelného šoku 70 molekulovej hmotnosti od 63 do 67 kDa.
  31. 31. Izolovaná molekula DNA podía nároku 30, vyznačujúca sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 9.
  32. 32. Izolovaná molekula DNA podía nároku 31, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 8.
  33. 33. Izolovaná molekula DNA podľa nároku 23, vyznačujúca sa tým, že proteín alebo polypeptid je proteín tepelného šoku 90 molekulovej hmotnosti od 61 do 65 kDa.
  34. 34. Izolovaná molekula DNA podía nároku 33, vyznačujúca sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 11.
  35. 35. Izolovaná molekula DNA podľa nároku 34, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 10.
    146
  36. 36. Izolovaná molekula DNA podlá nároku 23, vyznačujúca sa tým, že proteín alebo polypeptid je povrchový proteín molekulovej hmotnosti od 20 do 24 kDa.
  37. 37. Izolovaná molekula DNA podlá nároku 36, vyznačujúca sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 15.
  38. 38. Izolovaná molekula DNA podlá nároku 37, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 14.
  39. 39. Izolovaná molekula DNA podlá nároku 23, vyznačujúca sa tým, že proteín alebo polypeptid je divergentný povrchový proteín molekulovej hmotnosti od 23 do 27 kDa.
  40. 40. Izolovaná molekula DNA podlá nároku 39, vyznačujúca sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 13.
  41. 41. Izolovaná molekula DNA podlá nároku 40, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 12.
  42. 42. Izolovaná molekula DNA podlá nároku 22, vyznačujúca sa tým, že proteín alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 7.
  43. 43. Izolovaná molekula DNA podlá nároku 42, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 6.
    147
  44. 44. Izolovaná molekula DNA podlá nároku 22, vyznačujúca sa tým, že protein alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 17.
  45. 45. Izolovaná molekula DNA podlá nároku 44, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 16.
  46. 46. Izolovaná molekula DNA podlá nároku 22, vyznačujúca sa tým, že protein alebo polypeptid má sekvenciu aminokyselín zodpovedajúcu SEQ. ID. No. 19.
  47. 47. Izolovaná molekula DNA podlá nároku 46, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 18.
  48. 48. Izolovaná molekula DNA podlá nároku 22, vyznačujúca sa tým, že molekula DNA má nukleotidovú sekvenciu zodpovedajúcu SEQ. ID. No. 23.
  49. 49. Expresný systém obsahujúci molekulu DNA podlá nároku 22 vo vektore heterológnom k molekule DNA.
  50. 50. Expresný systém podlá nároku 49, vyznačuj ú c i sa t ý m, že protein alebo polypeptid je vybraný zo skupiny obsahujúcej polyprotein, RNA-závislú RNA polymerázu, protein tepelného šoku 70, protein tepelného šoku 90, divergentný povrchový protein a povrchový protein.
  51. 51. Hostiteľská bunka transformovaná heterológnou molekulou DNA podlá nároku 22.
    148
  52. 52. Hostiteľská bunka podľa nároku 51, vyznačujúca sa tým, že hostiteľská bunka je vybraná zo skupiny obsahujúcej Agrobacterium vitis a Agrobacterium tumefaciens.
  53. 53. Hostiteľská bunka podľa nároku 51, vyznačujúca sa tým, že hostiteľská bunka je vybraná zo skupiny obsahujúcej bunku viniča, bunku citrusu, bunku repy a bunku tabaku.
  54. 54. Hostiteľská bunka podľa nároku 51, vyznačujúca sa tým, že protein alebo polypeptid je vybraný zo skupiny obsahujúcej polyproteín, RNA-závislú RNA polymerázu, protein tepelného šoku 70, protein tepelného šoku 90, divergentný povrchový protein a povrchový protein.
  55. 55. Transgénny rastlinný kultivar obsahujúci molekulu DNA podľa nároku 22.
  56. 56. Transgénny rastlinný kultivar podľa nároku 55, vyznačujúci sa tým, že rastlinný kultivar je vybraný zo skupiny obsahujúcej rastlinný kultivar viniča, rastlinný kultivar citrusu, rastlinný kultivar repy a rastlinný kultivar tabaku.
  57. 57. Transgénny rastlinný kultivar podľa nároku 55, vyznačujúci sa tým, že protein alebo polypeptid je vybraný zo skupiny obsahujúcej polyproteín, RNA-závislú RNA polymerázu, protein tepelného šoku 70, protein tepelného šoku 90, divergentný povrchový protein a povrchový protein.
    149
  58. 58. Spôsob prenosu rezistencie voči zvinutke viniča do štepu alebo koreňovej odnože kultivaru Vitis alebo kultivaru Nicotiana obsahujúci:
    transformáciu štepu alebo koreňovej odnože kultivaru Vitis alebo kultivaru Nicotiana molekulou DNA podlá nároku 22.
  59. 59. Spôsob podlá nároku 58, vyznačujúci sa tým, že proteín alebo polypeptid je vybraný zo skupiny obsahujúcej polyproteín, RNA-závislú RNA polymerázu, proteín tepelného šoku 70, proteín tepelného šoku 90, divergentný povrchový proteín a povrchový proteín.
  60. 60. Spôsob podlá nároku 58, vyznačujúci sa tým, že vírus zvinutky viniča je GLRaV-2.
  61. 61. Spôsob podľa nároku 58, vyznačujúci sa tým, že uvedená transformácia je sprostredkovaná Agrobacterium.
  62. 62. Spôsob podlá nároku 58, vyznačujúci sa tým, že uvedená transformácia obsahuje:
    zavedenie častíc do rastlinných buniek tabaku alebo tabaku za podmienokh účinných pre prestup častíc do vnútra bunky a vloženie expresného vektora obsahujúceho molekulu DNA do vnútra bunky.
  63. 63. Spôsob prenosu rezistencie voči vírusu žltnutia repy do kultivaru repy obsahujúci:
    transformáciu kultivaru repy molekulou DNA podľa nároku
    22.
    150
  64. 64. Spôsob podlá nároku 63, vyznačujúci sa tým, že proteín alebo polypeptid je vybraný zo skupiny obsahujúcej polyproteín, RNA-závislú RNA polymerázu, proteín tepelného šoku 70, proteín tepelného šoku 90, divergentný povrchový proteín a povrchový proteín.
  65. 65. Spôsob podlá nároku 63, vyznačujúci sa tým, že uvedená transformácia je sprostredkovaná Agrobacterium.
  66. 66. Spôsob podlá nároku 63, vyznačujúci sa tým, že uvedená transformácia obsahuje:
    zavedenie častíc do rastlinných buniek repy za podmienok účinných pre prestup častíc do vnútra bunky a vloženie expresného vektora obsahujúceho molekulu DNA do vnútra bunky.
  67. 67. Spôsob prenosu rezistencie voči tristeza vírusu do štepu alebo koreňovej odnože kultivaru citrusu obsahujúci:
    transformáciu štepu alebo koreňovej odnože kultivaru citrusu molekulou DNA podľa nároku 22.
  68. 68. Spôsob podľa nároku 67, vyznačujúci sa tým, že proteín alebo polypeptid je vybraný zo skupiny obsahujúcej polyproteín, RNA-závislú RNA polymerázu, proteín tepelného šoku 70, proteín tepelného šoku 90, divergentný povrchový proteín a povrchový proteín.
  69. 69. Spôsob podľa nároku 67, vyznačujúci sa tým, že uvedená transformácia je sprostredkovaná Agrobacterium.
    151
  70. 70. Spôsob podľa nároku 67, vyznačujúci sa tým, že uvedená transformácia obsahuje:
    zavedenie častíc do rastlinných buniek citrusu za podmienok účinných pre prestup častíc do vnútra bunky a vloženie expresného vektora obsahujúceho molekulu DNA do vnútra bunky.
  71. 71. Protilátka alebo jej väzobná časť, alebo sonda rozpoznávajúca proteín alebo polypeptid podlá nároku 1.
  72. 72. Protilátka alebo jej väzobná časť, alebo sonda podľa nároku 71, vyznačujúca sa tým, že proteín alebo polypeptid je vybraný zo skupiny obsahujúcej polyproteín, RNA-závislú RNA polymerázu, proteín tepelného šoku 70, proteín tepelného šoku 90, divergentný povrchový proteín a povrchový proteín.
  73. 73. Spôsob detekcie vírusu zvinutky viniča vo vzorke, uvedená metóda sa skladá z:
    použitia protilátky alebo jej väzobnej časti rozpoznávajúcej proteín alebo polypeptid podľa nároku 1;
    pridania protilátky alebo jej väzobnej časti ku vzorke; určenia reakcie, ktorá indikuje prítomnosť vírusu zvinutky viniča vo vzorke použitím systému stanovenia.
  74. 74. Spôsob podlá nároku 73, vyznačujúci sa tým, že systém pre stanovenie je vybraný zo skupiny enzymatické imunoabsorbčné stanovenie, rádioimunostanovenie, stanovenie pomocou gélovej difúznej precipitačnej reakcie, imunodifúzne stanovenie, aglutinačné stanovenie, fluorescenčné imunostanovenie, proteín A imunostanovenie a imunoelektroforetické stanovenie.
    152
  75. 75. Spôsob detekcie vírusu zvinutky viniča vo vzorke, táto metóda sa skladá z:
    použitia DNA molekuly s nukleotidovou sekvenciou podľa nároku 22 ako sondy pri hybridizácii nukleovej kyseliny;
    pridania sondy ku vzorke;
    určenia reakcie, ktorá indikuje prítomnosť vírusu zvinutky viniča vo vzorke.
  76. 76. Spôsob podľa nároku 75, vyznačujúci sa tým, že spôsob hybridizácie nukleovej kyseliny je vybraný zo skupiny dot blot hybridizácia, tkanivový printing, Southern hybridizácia a northern hybridizácia.
  77. 77. Spôsob detekcie vírusu zvinutky viniča vo vzorke: použitie DNA molekuly nukleotidovej sekvencie podľa nároku 22 ako sondy pri detekcii amplifikácie génu;
    pridanie sondy ku vzorke;
    určenie reakcie, ktorá indikuje prítomnosť vírusu zvinutky viniča vo vzorke.
  78. 78. Spôsob podľa nároku 77, vyznačujúci sa tým, že spôsob detekcie amplifikácie génu je vybraný zo skupiny polymerázová reťazová reakcia a immunocapture polymerázová reťazová reakcia.
SK1585-99A 1997-05-20 1998-05-20 Grapevine leafroll virus (type 2) proteins and their uses SK158599A3 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US4719497P 1997-05-20 1997-05-20
PCT/US1998/010313 WO1998053055A1 (en) 1997-05-20 1998-05-20 Grapevine leafroll virus (type 2) proteins and their uses

Publications (1)

Publication Number Publication Date
SK158599A3 true SK158599A3 (en) 2000-06-12

Family

ID=21947574

Family Applications (1)

Application Number Title Priority Date Filing Date
SK1585-99A SK158599A3 (en) 1997-05-20 1998-05-20 Grapevine leafroll virus (type 2) proteins and their uses

Country Status (16)

Country Link
US (3) US6197948B1 (sk)
EP (1) EP0986641A4 (sk)
AR (1) AR011740A1 (sk)
AU (1) AU746187B2 (sk)
BG (1) BG103906A (sk)
BR (1) BR9809450A (sk)
CA (1) CA2290551A1 (sk)
DE (1) DE986641T1 (sk)
ES (1) ES2146193T1 (sk)
HU (1) HUP0003327A3 (sk)
IL (1) IL132975A0 (sk)
MD (1) MD20000034A (sk)
SK (1) SK158599A3 (sk)
TR (1) TR199902852T2 (sk)
WO (1) WO1998053055A1 (sk)
ZA (1) ZA984232B (sk)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA9610721B (en) * 1995-12-21 1998-06-19 Cornell Res Foundation Inc Grapevine leafroll virus proteins and their uses.
ZA984232B (en) 1997-05-20 1998-12-01 Cornell Res Foundation Inc Grapevine leafroll virus type 2 proteins coding sequences and methods
AU6224000A (en) * 1999-07-19 2001-02-05 Agritope, Inc. Grapevine leafroll-associated virus proteins
AU2003287622A1 (en) * 2002-11-06 2004-06-03 Fraunhofer Usa Expression of foreign sequences in plants using trans-activation system
US7692063B2 (en) * 2002-11-12 2010-04-06 Ibio, Inc. Production of foreign nucleic acids and polypeptides in sprout systems
US7683238B2 (en) * 2002-11-12 2010-03-23 iBio, Inc. and Fraunhofer USA, Inc. Production of pharmaceutically active proteins in sprouted seedlings
WO2004070016A2 (en) * 2003-02-03 2004-08-19 Fraunhofer Usa Inc. System for expression of genes in plants
CA2555230A1 (en) * 2004-02-20 2005-09-09 Fraunhofer Usa Inc. Systems and methods for clonal expression in plants
CN101978051A (zh) * 2008-01-31 2011-02-16 俄勒冈州高教委暨俄勒冈州大学 线形病毒组载体及方法
US8629334B2 (en) * 2008-07-16 2014-01-14 University Of Florida Research Foundation, Inc. Viral-based transient-expression vector system for trees
CN111298923B (zh) * 2018-12-11 2021-11-30 中国食品药品检定研究院 破碎离心一体装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4358535A (en) 1980-12-08 1982-11-09 Board Of Regents Of The University Of Washington Specific DNA probes in diagnostic microbiology
US4480040A (en) 1981-12-03 1984-10-30 The United States Of America As Represented By The Secretary Of Agriculture Sensitive and rapid diagnosis of viroid diseases and viruses
US5288611A (en) 1983-01-10 1994-02-22 Gen-Probe Incorporated Method for detecting, identifying, and quantitating organisms and viruses
US5322770A (en) 1989-12-22 1994-06-21 Hoffman-Laroche Inc. Reverse transcription with thermostable DNA polymerases - high temperature reverse transcription
US5106727A (en) 1989-04-27 1992-04-21 Life Technologies, Inc. Amplification of nucleic acid sequences using oligonucleotides of random sequences as primers
US5043272A (en) 1989-04-27 1991-08-27 Life Technologies, Incorporated Amplification of nucleic acid sequences using oligonucleotides of random sequence as primers
US5196305A (en) 1989-09-12 1993-03-23 Eastman Kodak Company Diagnostic and amplification methods using primers having thymine at 3' end to overcome primer-target mismatch at the 3' end
US5104792A (en) 1989-12-21 1992-04-14 The United States Of America As Represented By The Department Of Health And Human Services Method for amplifying unknown nucleic acid sequences
CA2031659A1 (en) 1990-01-26 1991-07-27 John B. Findlay Water-insoluble reagent, nucleic acid probe, test kit and diagnostic and purification methods
ES2044784B1 (es) 1992-06-12 1994-09-01 Inia Procedimiento para la deteccion e identificacion de patogenos virales y subvirales.
US5872241A (en) 1995-01-25 1999-02-16 The Trustees Of Columbia University In The City Of New York Multiple component RNA catalysts and uses thereof
US5990388A (en) 1995-06-07 1999-11-23 Research Corporation Technologies, Inc. Resistance to viruses and viroids in transgenic plants and animals expressing dsRNA-binding protein
US5965355A (en) * 1995-09-21 1999-10-12 Agritope, Inc. Antibodies and proteins useful for assaying virus infection in grape plants
ZA9610721B (en) 1995-12-21 1998-06-19 Cornell Res Foundation Inc Grapevine leafroll virus proteins and their uses.
ZA984232B (en) 1997-05-20 1998-12-01 Cornell Res Foundation Inc Grapevine leafroll virus type 2 proteins coding sequences and methods
WO1999055880A1 (en) 1998-04-29 1999-11-04 Cornell Research Foundation, Inc. Grapevine leafroll virus proteins and their uses

Also Published As

Publication number Publication date
HUP0003327A2 (hu) 2001-02-28
ES2146193T1 (es) 2000-08-01
AU7583198A (en) 1998-12-11
CA2290551A1 (en) 1998-11-26
MD20000034A (ro) 2000-09-30
ZA984232B (en) 1998-12-01
EP0986641A4 (en) 2001-04-25
WO1998053055A1 (en) 1998-11-26
EP0986641A1 (en) 2000-03-22
DE986641T1 (de) 2000-09-14
AU746187B2 (en) 2002-04-18
BG103906A (en) 2000-06-30
US6197948B1 (en) 2001-03-06
AR011740A1 (es) 2000-08-30
IL132975A0 (en) 2001-03-19
US6858426B1 (en) 2005-02-22
TR199902852T2 (xx) 2001-09-21
US20050183165A1 (en) 2005-08-18
HUP0003327A3 (en) 2002-09-30
BR9809450A (pt) 2002-02-13

Similar Documents

Publication Publication Date Title
Sochor et al. Sharka: the past, the present and the future
US6558953B1 (en) Grapevine leafroll virus proteins and their uses
Chen et al. A chlorotic spot disease on calla lilies (Zantedeschia spp.) is caused by a tospovirus serologically but distantly related to Watermelon silver mottle virus
Minafra et al. Grapevine vitiviruses
US6197948B1 (en) Grapevine leafroll virus (type 2) proteins and their uses
Verchot et al. Evidence that soilborne wheat mosaic virus moves long distance through the xylem in wheat
Meng et al. Antiserum to recombinant virus coat protein detects Rupestris stem pitting associated virus in grapevines
Mandal et al. Properties, diagnosis and management of Cucumber green mottle mosaic virus
MXPA99010661A (en) Grapevine leafroll virus (type 2) proteins and their uses
He et al. Serological characterization of the 3′-proximal encoded proteins of beet yellows closterovirus
Brand Viruses implicated in the woodiness disease of South African passionfruit, and the molecular characterization of a new potyvirus
AU762038B2 (en) Grapevine leafroll virus proteins and their uses
CA2290779A1 (en) Rupestris stem pitting associated virus nucleic acids, proteins, and their uses
AU727208C (en) Grapevine leafroll virus proteins and their uses
WO1998044803A9 (en) Dna molecule encoding tomato ringspot virus proteins and uses thereof
WO1998044803A1 (en) Dna molecule encoding tomato ringspot virus proteins and uses thereof
Ebrahimi et al. Development of a polyclonal antibody against the coat protein of Prunus necrotic ring spot virus
Anfoka et al. Detection and molecular characterization of grapevine virus A in Jordan
Straathof et al. Influence of temperature, inoculum concentration and time course in a scale test for Fusarium resistance in Lilium
Rothmann An assessment of the mutation patterns in South African isolates of Potato leafroll virus and the expression of recombinant viral coat protein genes in Escherichia coli
LAzAr et al. Grapevine virus diseases and clean grape stock program in Hungary
Robbins Molecular characterization of the interaction between cucumber necrosis virus and zoospores of the fungal vector olpidium bornovanus
Veliceasa Serological and genomic characterization of two plant RNA viruses: Barley Mild Mosaic Virus (BaMMV) and a potential cryptic virus from pine (Pinus sylvestris)
Fazeli Molecular detection of grapevine leafroll-associated closteroviruses (GLRaVs) and the genome organisation of GLRaV-1
Rampitsch The complete nucleotide sequence of prune dwarf ilarvirus RNA1 and virus detection by reverse transcription PCR and triple-antibody sandwich ELISA