PL186242B1 - Polinukleotyd kodujący zrekombinowane białko i zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom - Google Patents

Polinukleotyd kodujący zrekombinowane białko i zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom

Info

Publication number
PL186242B1
PL186242B1 PL96321212A PL32121296A PL186242B1 PL 186242 B1 PL186242 B1 PL 186242B1 PL 96321212 A PL96321212 A PL 96321212A PL 32121296 A PL32121296 A PL 32121296A PL 186242 B1 PL186242 B1 PL 186242B1
Authority
PL
Poland
Prior art keywords
seq
protein
dna
photorhabdus
sodium
Prior art date
Application number
PL96321212A
Other languages
English (en)
Other versions
PL321212A1 (en
Inventor
Jerald C. Ensign
David J. Bowen
James Petell
Raymond Fatig
Sue Schoonover
Richard H. Ffrench-Constant
Thomas A. Rocheleau
Michael B. Blackburn
Timothy D. Hey
Donald J. Merlo
Gregory L. Orr
Jean L. Roberts
James A. Strickland
Lining Guo
Todd A. Ciche
Original Assignee
Wisconsin Alumni Res Found
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wisconsin Alumni Res Found filed Critical Wisconsin Alumni Res Found
Publication of PL321212A1 publication Critical patent/PL321212A1/xx
Publication of PL186242B1 publication Critical patent/PL186242B1/pl

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • C12N5/12Fused cells, e.g. hybridomas
    • C12N5/14Plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01GHORTICULTURE; CULTIVATION OF VEGETABLES, FLOWERS, RICE, FRUIT, VINES, HOPS OR SEAWEED; FORESTRY; WATERING
    • A01G13/00Protecting plants
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/50Isolated enzymes; Isolated proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pest Control & Pesticides (AREA)
  • Environmental Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Agronomy & Crop Science (AREA)
  • Insects & Arthropods (AREA)
  • Dentistry (AREA)
  • Botany (AREA)
  • Toxicology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

1. Polinukleotyd funkcjonalnie zwiazany z heterologicznym promotorem, który koduje bialko o aktywnosci toksycznej przeciwko szkodliwym owadom, znamienny tym, ze czasteczka nukleotydowa kodujaca to bialko utrzymuje hybrydyzacje z komplementarna sekwencja kwasu nukleinowego, po hybrydyzacji w 25°C, w 0,45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym se- kwencja kwasu nukleinowego jest wybrana z grupy obejmujacej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO:11, SEQ ID N0:60, SEQ ID NO:36 i SEQ ID NO:46. 10. Komórka rosliny transgenicznej zawierajaca polinukleotyd i/lub w której zachodzi ekspresja polinu- kleotydu funkcjonalnie zwiazanego z heterologicznym promotorem, który koduje bialko o aktywnosci toksycz- nej przeciwko szkodliwym owadom, znamienna tym, ze czasteczka nukleotydowa kodujaca to bialko utrzy- muje hybrydyzacje z komplementarna sekwencja kwasu nukleinowego, po hybrydyzacji w 25°C, w 0,45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja kwasu nukleinowego jest wybrana z grupy obejmujacej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO:11, SEQ ID NO :60, SEQ ID NO:36 i SEQ ID NO:46. 11. Zrekombinowane bialko o aktywnosci toksycznej przeciwko szkodliwym owadom, znamienne tym, ze sekwencja nukleotydowa kodujaca to bialko utrzymuje hybrydyzacje z sekwencja kwasu nukleinowego po hybrydyzacji w 25°C, w 0.45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja kwasu nukleinowego jest wybrana z grupy obejmujacej: SEQ ID NO:33, SEQ ID N O :31, SEQ ID NO:11, SEQ ID NO :60, SEQ IDNO:36 i SEQ ID NO:46. PL PL PL PL PL

Description

Przedmiotem wynalazku jest polinukleotyd kodujący zrekombinowane białko, komórka rośliny transgenicznej zawierająca ten polinukleotyd i zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom oraz zastosowanie jako środków owadobójczych.
Wiele owadów uważa się powszechnie za szkodniki przez właścicieli domów, osoby na piknikach, ogrodników, rolników i inne osoby, których inwestycje na produkty rolnicze są często niszczone lub obniżone w wyniku szkód w uprawach polnych spowodowanych przez owady. Szczególnie tam gdzie sezon wzrostu jest krótki, znaczne szkody spowodowane przez owady mogą oznaczać dla hodowców stratę wszelkich zysków i dramatyczne zmniejszenie zbiorów. Niedobory w dostawach określonych produktów rolnych powodują zwykle wyższe koszty dla producentów żywności, a następnie dla końcowych konsumentów roślin wykorzystywanych jako żywność i produktów otrzymywanych z tych roślin.
Zapobieganie szkodom powodowanym przez owady w uprawach i kwiatach, i usuwanie zagrożeń powodowanych przez szkodliwe owady polega zwykle na stosowaniu silnych organicznych środków do zwalczania szkodników i środków owadobójczych o szerokiej gamie toksyczności. Te produkty syntetyczne są ogólnie nie akceptowane przez społeczeństwo, ponieważ są zbyt niebezpieczne dla środowiska i dla osób wystawionych na ich działanie. Podobnie, w obszarach nierolniczych, właściciele domów woleliby, aby owady omijały ich domy lub posiłki na dworze bez konieczności zabijania owadów.
Szerokie stosowanie chemicznych środków owadobójczych ze względu na ochronę środowiska i ochronę zdrowia, spowodowało zastrzeżenia kierowane do rolników, firm produkujących środki owadobójcze, agencji rządowych, grup interesów publicznych i społeczeństwa w ogóle. Opracowanie mniej agresywnych strategii zwalczania szkodników jest wymuszane, zarówno przez wymagania dotyczące ochrony środowiska, jak i przez opracowywanie narzędzi biologicznych, które wykorzystuj ą mechanizmy zwalczania owadów. Biologiczne środki zwalczania owadów stanowią obiecującą alternatywę w stosunku do chemicznych środków owadobójczych.
Organizmy na każdym poziomie rozwoju ewolucyjnego same znalazły sposoby zwiększania swego powodzenia i możliwości przeżycia. Stosowanie biologicznych cząsteczek do obrony i ataku jest znane w całym świecie zwierzęcym i roślinnym. Ponadto, stosunkowo nowe narzędzia inżynierii genetycznej umożliwiają wprowadzenie zmian do biologicznych środków owadobójczych i dają konkretne rozwiązania szczegółowych problemów.
Jeden z takich środków, Bacillus thuringiensis (Bt) jest skutecznym środkiem owadobójczym i jest stosowany na dużą skalę. W rzeczywistości, środek owadobójczy z bakterii Bt jest białkiem, które ma ograniczoną toksyczność i może być stosowany na uprawach do spożycia dla ludzi nawet w dniu zbiorów tych upraw. Dla organizmów, na które toksyna Bt nie działa, jest ona ulegającym trawieniu, nietoksycznym białkiem.
Inną znaną klasę biologicznych środków owadobójczych stanowią niektóre rodzaje nicieni, znane jako nosiciele owadobójczych bakteryjnych symbiontów. Nicienie zawierające bakterie owadobójcze atakują larwy owadów. Następnie bakterie te zabijają larwy, a nicienie rozmnażają się w zwłokach larw. Potomstwo nicieni następnie wyjada zwłoki od środka.
186 242
Wytworzone przy tym potomstwo nicieni zawierające bakterie może następnie atakować kolejne larwy.
W przeszłości, nicienie owadobójcze rodzajów Steinernema i Heterorhabditis stosowano jako środki owadobójcze. Pomimo, że nicienie te są skutecznymi środkami owadobójczymi, lecz obecnie, ich wytwarzanie, przechowywanie i rozprowadzanie nicieni do zwalczania owadów jest trudne, drogie i niewydajne.
Oczywiście, każdy rodzaj nicienia jest gospodarzem szczególnego gatunku bakterii. W przypadku nicieni rodzaju Heterorhabditis symbiotyczną bakterią jest Photorhabdus luminescens.
Innym źródłem są kliniczne próbki pobierane z ran u ludzi. Te szczepy saprofityczne są zdeponowane w American Type Culture Collection (Rockville, MD) ATCC o nr 43948, 43949, 43950, 43951 i 43952, którą włącza się jako odnośnik.
Szczególną cechą Photorhabdus jest bioluminescencja. Rodzaj Photorhabdus jest określony taksonomicznie jako należący do rodziny Enterobacteriaceae, jakkolwiek ma on pewne cechy nietypowe dla tej rodziny. Szczepy tego rodzaju na przykład dają ujemny wynik przy redukcji azotanem, wytwarzają żółty i czerwony pigment i wykazują bioluminescencję. Ta ostatnia cecha jest poza tym nieznana u innych Enterobacteriaceae. Photorhabdus został ostatnio opisany jako rodzaj różniący się od Xenorhabdus (Boemare i in., 1993, Int. J. Syst. Bacteriol. 43, 249-255). Zróżnicowanie to opiera się na badaniach hybrydyzacji DNA-DNA, na różnicach fenotypowych [na przykład obecności (Photorhabdus) lub na nieobecności (Xenorhabdus) katalazy i bioluminescencji] i rodzinach gospodarzy nicieni (Xenorhabdus; Steinermetidae, Photorhabdus; Heterorhabditidae). Porównawcze analizy komórkowych kwasów tłuszczowych (Janse i in. 1990, Lett. Appl. Microbiol 10 131-135; Suzuki in. 1990, J. Gen. Appl. Microbiol., 36, 393-401) potwierdzają wydzielenie Photorhabdus z Xenorhabdus. (Farmer, 1984 Bergey's Manual of Systemic Bnacteriol.,t.1, str. 510-511; Akhurst i Boemare 1988, J. Gen. Microbiol. 134, str. 1835-1845; Boemare i in., 1993 Int. J. Syst. Bacteriol. 43, str. 249-255, które włącza się jako odnośniki).
Obecnie, rodzaj bakteryjny Photorhabdus składa się z pojedynczego zdefiniowanego gatunku Photorhabdus luminescens (Szczep typu ATCC #29999, Poinar i in., 1977, Nematologica 23, 97-102). Różne spokrewnione szczepy opisano w literaturze (na przykład, Akhurst i in., 1988 J. Gen. Microbiol., 134, 1835-1845; Boemare i in. 1993 Int. J. Syst. Bacteriol. 43, str.249-255; Putz i in., 1990, Appl. Environ. Microbiol., 56, 181-186).
Wiadomo, że z Photorhabdus luminescens można wyodrębnić owadobójczą toksynę, która jest aktywna jedynie po wstrzyknięciu jej do larw owadów Lepidoptera i Coleoptera. Uniemożliwia to skuteczne wykorzystanie właściwości owadobójczych nicienia lub jego symbiontu bakteryjnego. Byłoby przydatne, bardziej praktyczne i mniej pracochłonne szerokie zastosowanie takiej toksyny owadobójczej, która zachowywałaby swoje właściwości biologiczne po jej dostarczeniu. Byłoby także bardzo pożądane odkrycie toksyn o aktywności doustnej wytwarzanych przez rodzaj, Photorhabdus. Wyodrębnienie i zastosowanie tych toksyn jest pożądane ze względu na ich wydajność. Do czasu odkryć dokonanych przez niniejszych zgłaszających, toksyny takie nie były wyodrębnione lub scharakteryzowane.
Rodzime toksyny są kompleksami białkowymi wytwarzanymi i wydzielanymi przez rosnące komórki bakterii rodzaju Photorhabdus, natomiast interesujące nas białka są wytwarzane przez gatunek Photorhabdus luminescens. Kompleksy białkowe o ciężarze cząsteczkowym około 1000 kDa mogą być rozdzielane na liczne białka składowe metodą analizy w żelu SDSPAGE. Toksyny nie wykazują aktywności hemolizyny, lipazy, fosfolipazy typu C lub nukleazy. Toksyny wykazują znaczną toksyczność po podawaniu ich przez ekspozycję różnym owadom.
Przedmiotem niniejszego wynalazku jest polinukleotyd funkcjonalnie związany z heterologicznym promotorem, który koduje białko o aktywności toksycznej przeciwko szkodliwym owadom. Istotą wynalazku jest cząsteczka nukleotydowa kodująca to białko, która utrzymuje hybrydyzację z komplementarną sekwencją kwasu nukleinowego, po hybrydyzacji w 25°C, w 0.45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja kwasu nukleinowego jest wybrana z grupy
186 242 obejmującej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO:11, SEQ ID NO:60, SEQ ID NO:36 i SEQ ID NO:46.
Korzystnie przemywanie prowadzone jest w 0,9 M chlorku sodu i 0,09 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu w 65°C, albo w 0,0375 M chlorku sodu i 0,00375 M cytrynianie sodu pH 7,0, i 0,2% dodecylosiarczanie sodu w 68°C.
W innym rozwiązaniu polinukleotyd jest zmodyfikowany tak, że zawiera kodon do ekspresji i produkcji białka w gospodarzu innym niż gospodarz naturalny.
Przedmiotem wynalazku jest również polinukleotyd funkcjonalnie związany z heterologicznym promotorem, który koduje białko o aktywności toksycznej przeciwko szkodliwym owadom, przy czym polinukleotyd ten utrzymuje hybrydyzację z komplementarną sekwencją kwasu nukleinowego po hybrydyzacji w 25°C, w 0,45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja kwasu nukleinowego jest wybrana z grupy obejmującej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO:11, SEQ ID NO:60, SEQ ID NO:36 i SEQ ID NO:46.
Przemywanie korzystnie prowadzone jest w 0,9 M chlorku sodu i 0,09 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu w65°C albo w 0,0375 M chlorku sodu i 0,00375 M cytrynianie sodu pH 7,0, i 0,2% dodecylosiarczanie sodu w 68°C.
W korzystnym rozwiązaniu polinukleotyd zawiera sekwencję nukleotydową kodującą sekwencję aminokwasową wybraną z grupy obejmującej: SEQ ID NO:34, SEQ ID NO:32, SEQ ID NO: 12, SEQ ID NO:61, SEQ ID NO:37 i SEQ ID NO:47.
Przedmiotem wynalazku jest również polinukleotyd kodujący białko o aktywności toksycznej przeciwko szkodliwym owadom, który koduje sekwencję aminokwasową wybraną z grupy obejmującej: SEQ ID NO:34, SEQ ID NO:32, SEQ ID NO: 12, SEQ ID NO:61, SEQ ID NO:37 i SEQ ID NO:47 i jest funkcjonalnie połączony z heterologicznym promotorem.
W innej odmianie przedmiotem wynalazku jest komórka rośliny transgenicznej zawierająca polinukleotyd i/lub, w której zachodzi ekspresja polinukleotydu funkcjonalnie związanego z heterologicznym promotorem, który koduje białko o aktywności toksycznej przeciwko szkodliwym owadom, przy czym cząsteczka nukleotydową kodująca to białko utrzymuje hybrydyzację z komplementarną sekwencją kwasu nukleinowego, po hybrydyzacji w 25°C, w 0,45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja kwasu nukleinowego jest wybrana z grupy obejmującej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO: 11, SEQ ID NO:60, SEQ ID NO:36 i SEQ ID NO:46.
W kolejnej odmianie przedmiotem wynalazku jest zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom. Sekwencja nukleotydową kodująca to białko utrzymuje hybrydyzację z sekwencją kwasu nukleinowego po hybrydyzacji w 25°C, w 0,45 M chlorku sodu i 0,045 M cytrynianie sodu, pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja kwasu nukleinowego jest wybrana z grupy obejmującej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO:11, SEQ ID NO:60, SEQ ID NO:36 i SEQ ID NO:46.
Korzystnie przemywanie prowadzone jest w 0,9 M chlorku sodu i 0,09 M cytrynianie sodu pH 7,0, i 0,1 % dodecylosiarczanie sodu w65°C albo w 0,0375 M chlorku sodu i 0,00375 M cytrynianie sodu pH 7,0, i 0,2% dodecylosiarczanie sodu w 68°C.
Przedmiotem wynalazku jest również zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom, które obejmuje sekwencję aminokwasową wybraną z grupy obejmującej: SEQ ID NO:34, SEQ ID NO:32, SEQ ID NO:12, SEQ ID NO:61, SEQ ID NO:37 i SEQ ID NO:47.
Przedmioty, zalety i cechy niniejszego wynalazku staną się oczywiste na podstawie poniższego opisu. Wynalazek został przedstawiony na rysunku, na którym: fig. 1 przedstawia połączenie izolatów klonowanego DNA stosowanych jako część genów sekwencyjnych toksyny według niniejszego wynalazku; fig. 2 - jest mapą trzech plazmidów stosowanych w procesie sekwencjonowania; fig. 3 - jest mapą przedstawiającą współzależność kilku częściowych fragmentów DNA; fig. 4 - analizę homologiczną pomiędzy sekwencjami białek TcbAii i TcaBii fig. 5 - jest fenogramem szczepów Photorhabdus. Zależność dla szczepów Photorhabdus określono metodą rep-PCR; Górna oś na fig. 5 - określa procentowe podobieństwo szczepów opartych na zliczaniu produktów rep-PCR (to jest od 0,0 - brak podobieństwa, do 1,0 - 100 procentowe po6
186 242 dobieństwo). Liczby i litery przy prawej osi wskazują różne zbadane szczepy: 14=W-14, Hm=Hm, H9=H9, 7=WX-7, 1=WX-1, 2=WX-2, 88=HP88, NC-1=NC-1, 4=WX-4, 9=WX-9, 8=WX-8, 10=WX-10, WIR=WIR, 3=WX-3, 11=WX-11, 5=WX-5, 6=WX-6, 12=WX-12, x!4=WX-14, 15=WX-15, Hb=Hb, B2=B2, 48 do 52 = ATCC 43948 do ATCC 43952. Linie pionowe oddzielające linie poziome wskazują na stopień zależności (odczytywany na podstawie ekstrapolowanego przecięcia linii pionowej z górną osią) pomiędzy szczepami lub grupą szczepów, przy podstawie linii poziomych (na przykład, szczep W-14 jest w około 60 % podobny do szczepów H9 i Hm); fig. 6 przedstawia mapy genomowe szczepu W-14;
Przedmiotem wynalazków jest szczególna klasa owadobójczych toksyn białkowych rodzaju Photorhabdus, które mają doustną toksyczność przeciwko owadom. Photorhabdus można wyodrębniać z różnych źródeł. Jest możliwe, że mogą być inne źródła bakterii Photorhabdus, które wytwarzają toksyny owadobójcze. Takie źródła w środowisku mogą występować zarówno na ziemi jak i w wodzie.
W celu ustalenia, czy kolekcja szczepów ujawniona w niniejszym opisie zawiera szczepy Photorhabdus, scharakteryzowano te szczepy na podstawie rozpoznanych cech, które charakteryzują Photorhabdus i odróżniają je od innych gatunków Enterobacteriaceae i Xenorhabdus. Zbadano następujące cechy: negatywne barwienie Grama pałeczek, wielkość organizmu, pigmentacja kolonii, ciała inkluzyjne, obecność katalazy, zdolność do redukowania azotanu, bioluminescencja, pobieranie barwnika, hydroliza żelatyny, wzrost na selektywnych pożywkach, temperatura wzrostu, przeżycie w warunkach beztlenowych i ruchliwość. Analizę kwasów tłuszczowych zastosowano w celu potwierdzenia, że wszystkie niniejsze szczepy należą do jednego rodzaju Photorhabdus.
Liczne szczepy Photorhabdus zostały scharakteryzowane. Takie szczepy są wymienione w tabeli 18, w przykładach. Ponieważ obecnie w rodzaju Photorhabdus jest zdefiniowany tylko jeden gatunek (luminescens), to cechy gatunku Phi. luminescens użyto do scharakteryzowania szczepów w niniejszym opisie. Jak widać na fig. 5, szczepy te znacznie się różnią między sobą. Można przewidywać, że w przyszłości mogą także zostać zidentyfikowane inne gatunki Photorhabdus, które będą miały pewne cechy gatunku Phi. luminescens, a także pewne odróżniające właściwości, które obecnie są nie zdefiniowane jako cecha Photorhabdus luminescens. Jednakże przedmiotem niniejszego wynalazku jest dowolny gatunek lub szczepy Photorhabdus wytwarzające białka, które mają funkcyjną aktywność jako środki owadobójcze, niezależnie od innych ich cech i właściwości.
Ponadto, jako pokazano w niniejszym opisie, bakterie rodzaju Photorhabdus wytwarzają białka, które mają funkcyjną aktywność określoną w niniejszym opisie. Szczególnie interesujące są białka wytwarzane przez gatunek Photorhabdus luminescens. Wynalazki ujawnione w niniejszym opisie nie powinny być w żaden sposób ograniczone do szczepów w nim ujawnionych. Te szczepy ujawniają po raz pierwszy, że białka wytwarzane przez różne izolaty Photorhabdus są toksyczne przy działaniu na owady. Tak więc, wynalazki podane w niniejszym opisie odnoszą się do wymienionych szczepów i ich dowolnych mutantów, a także do dowolnych szczepów lub gatunków rodzaju Photorhabdus, które mają aktywność funkcyjną podaną w niniejszym opisie.
Kilka określeń stosowanych w niniejszym opisie ma szczególne znaczenie, a mianowicie:
„Aktywność funkcyjna” oznacza, że toksyny białka działają jako środki owadobójcze, przy czym białka te są albo aktywne doustnie, albo mają działanie toksyczne, albo mogą przerywać przyjmowanie pokarmu lub odstraszać od przyjmowania pokarmu, co ewentualnie może powodować śmierć owada. Gdy owad styka się ze skuteczną ilością toksyny dostarczanej w wyniku ekspresji przez transgeniczne rośliny, przygotowanej(ych) kompozycji białka, kompozycji białka do rozpylania, matrycy przynęty lub innego układu dostarczania, to powoduje zwykle śmierć owada, albo owady nie spożywają źródła, które powoduje, że toksyny są dostępne dla owadów.
Omawiane w niniejszym opisie toksyny białkowe są określane zwykle jako „środki owadobójcze”. Przez środki owadobójcze rozumie się w niniejszym opisie, że toksyny białkowe mają „funkcyjną aktywność” określoną powyżej i że są stosowane jako środki do zwalczania owadów.
186 242
Określenie „oligonukleotydy” oznacza makrocząsteczkę zawierającą krótki łańcuch nukleotydowy, albo RNA albo DNA. Taka długość powinna wynosić co najmniej 1 nukleotyd, ale zwykle występuje od około 10 do około 12 nukleotydów. Oznaczanie długości oligonukleotydu może być wykonane z łatwością przez fachowca i nie stanowi ograniczenia. Zatem, oligonukleotydy mogą być także mniejsze od 10 lub większe od 12.
Stosowane w niniejszym określenie „toksyczny” lub „toksyczność” oznacza, że toksyny wytwarzane przez Photorhabdus mają „funkcyjną aktywność” określoną powyżej.
Stosowane w niniejszym określenie „materiał genetyczny” obejmuje wszystkie geny, kwas nukleinowy, DNA i RNA.
Buliony fermentacyjne z wybranych szczepów podanych w tabeli 18 zastosowano do określenia wielkości produkcji toksyny owadobójczej przez rodzaj Photorhabdus i zakresu owadobójczego tych toksyn oraz do dostarczenia materiału źródłowego do oczyszczania kompleksów toksyn. Wykazano, że szczepy scharakteryzowane w niniejszym opisie wykazują doustną toksyczność przeciwko różnym rzędom owadów. Te rzędy owadów obejmują między innymi Coleoptera, Homoptera, Lepidoptera, Diptera, Acarina, Hymenoptera i Dictyoptera.
Podobnie jak w przypadku innych toksyn bakteryjnych, znaczna szybkość mutacji bakterii w populacji powoduje, że powstaje kolejno wiele spokrewnionych toksyn, nieznacznie różniących się pomiędzy sobą. Toksynami interesującymi według wynalazku są te, które podczas ekspozycji na różne owady wytwarzają kompleksy białkowe toksyczne, jak to podano w niniejszym opisie. Toksyny korzystnie są aktywne przeciwko Lepidoptera, Coleoptera, Homoptera, Diptera, Hymenoptera, Dictyoptera i Acarina. Niniejsze wynalazki obejmują także toksyny białkowe homologiczne do toksyn białkowych wytwarzanych przez podane szczepy i dowolne ich pochodne, a także toksyny białkowe wytwarzane przez Photorhabdus. Te homologiczne toksyny mogą różnić się pod względem sekwencji, ale nie różnią się działaniem od toksyn opisanych w niniejszym opisie. Homologiczne toksyny są to kompleksy białkowe o ciężarze cząsteczkowym od 300 kDa do 2000 kDa i zawierające co najmniej dwie podjednostki, przy czym podjednostką jest białko, które może być takie samo lub różne od innej podjednostki. Zidentyfikowano i podano w przykładach różne podjednostki białka. Podjednostki białka zwykle mają masę cząsteczkową od 18 kDa do około 230 kDa; od około 160 kDa do około 230 kDa; od około 100 kDa do około 160 kDa; od około 80 kDa do około 100 kDa; i od około 50 kDa do około 80 kDa.
Stosowane określenie „toksyna Photorhabdus” oznacza dowolne białko wytworzone przez szczep mikroorganizmu Photorhabdus, który ma funkcyjną aktywność przeciwko owadom, przy czym toksyna Photorhabdus może być w postaci rozpylanej kompozycji, być wytwarzana przez roślinę transgeniczną, w postaci matrycy przynęty, może być dostarczana poprzez Baculovirus lub dostarczana poprzez dowolnego innego odpowiedniego gospodarza lub układ dostarczania.
Jak omówiono powyżej, niektóre szczepy Photorhabdus można wyizolować z nicieni. Niektóre nicienie, wydłużone cylindryczne pasożytnicze robaki typu Nematoda, rozwinęły zdolność wykorzystywania larw owadów jako korzystnego środowiska wzrostu. Larwy owadów stanowią źródło pokarmu rosnących nicieni i środowisko, w którym się one rozmnażają. Dramatycznym skutkiem inwazji larw przez pewne nicienie jest śmierć larw. Śmierć larw jest spowodowana przez obecność, w pewnych nicieniach, bakterii, które wytwarzają toksynę owadobójczą, hamującą wzrost larw i ich funkcję pokarmowe.
Jest interesujące, że jak się wydaje, każdy rodzaj nicienia pasożytującego na owadach jest gospodarzem określonego rodzaju bakterii dostosowanego do symbiotycznego wzrostu z tym nicieniem. W czasie, od kiedy zaczęto prowadzić te badania, wykonano przeklasyfikowanie rodzaju bakterii o nazwie Xenorhabdus na Xenorhabdus i Photorhabdus. Bakterie rodzaju Photorhabdus charakteryzują się tym, że są symbiontami nicieni Heterorhabditus, podczas gdy gatunki Xenorhabdus są symbiontami z gatunkami Steinernema. Ta zmiana w nomenklaturze jest przyjęta w niniejszym opisie, lecz nie powinna ona w żadnej mierze zmieniać przedmiotu opisanych tu wynalazków.
Białka i geny ujawnione w niniejszym opisie są nazywane zgodnie z wytycznymi opublikowanymi ostatnio w Journal of Bacteriology „Instructions to Authors”, str. i-xii (styczeń
186 242
1996), który włącza się jako odnośnik. Następujące białka i geny wyodrębniono ze szczepu W-14 Photorhabdus.
Nomenklatura białek/genów Kompleks toksyny (Te)
Nazwa białka Nazwa genu Sekwencja wg patentu ID#
Region genomowy tea
TcaA tcaA 12
TcaA„i tcaA 4
TcaB, tcaB 3(19, 20)
TcaB„ tcaB 5
TcaC tcaC 2
Region genomowy teb
TcbA tcbA 16
TcbAi tcbA (probiałko)
TcbAii tcbA 1(21,22, 23,24)
TcbA„i tcbA 40
Region genomowy tcc
TccA tccA 8
TccB tccB 7
Region genomowy ted
TcdA tcdA (probiałko)
TcdAii tcdA 13(38,39, 17, 18)
TcdAiii tcdA 41(42, 43)
TcdB tcdB 14
(sekwencja w nawiasie wskazuje wewnętrzną sekwencję aminokwasu otrzymaną przez trawienia trypsyną).
Podane powyżej sekwencje są zgrupowane według regionu genomowego. Gen tcbA ulegał ekspresji w E. coli jako dwa fragmenty białka TcbA i TcbAii jak to przedstawiono w przykładach. Może być korzystne uzyskanie cięcia proteolitycznego pewnych sekwencji w celu uzyskania większej aktywności toksyn w handlowych zastosowaniach transgenicznych.
Opisane w niniejszym opisie toksyny są wyjątkowe pod tym względem, że toksyny te mają funkcyjną aktywność, która stanowi klucz do opracowania strategii zwalczania owadów. Podczas opracowania strategii zwalczania owadów można opóźnić lub obejść proces degradacji białka przez wstrzykiwanie białka bezpośrednio do organizmu z pominięciem przewodu trawiennego. W takich przypadkach, białko podawane do organizmu zachowuje swą funkcję, dopóki nie ulegnie denaturacji, niespecyficznej degradacji lub eliminacji przez układ odpornościowy w wyższych organizmach. Wstrzykiwanie toksyny owadobójczej może mieć zastosowanie jedynie w laboratorium, a nawet tylko w przypadku dużych owadów, które można z łatwością nastrzykiwać. Stwierdzenie, że owadobójcze toksyny białkowe opisane w niniejszym wynalazku, mają toksyczną aktywność po ich podawaniu doustnym lub w wyniku kontaktu, umożliwia opracowanie planu zwalczania owadów opierającego się jedynie na wprowadzeniu toksyn białkowych do pokarmu owadów. Wynikiem takiego planu może być wytwarzanie przynęt owadzich.
Toksyny Photorhabdus mogą być podawane owadom w postaci oczyszczonej. Toksyny te mogą być podawane w ilościach od około 1 do około 100 mg/l bulionu. Ilość ta może się zmieniać w zależności od stanu kompozycji, stanu źródła szczepionki, sposobów wyodrębniania toksyny itp. Toksyny można podawać w postaci wydzieliny lub w postaci białka komórkowego z początkową ekspresją w heterologicznym gospodarzu prokariotycznym lub eukariotycznym. Gospodarzami, w których białka są produkowane, są zwykle bakterie. Gospodarzami eukariotycznymi mogą być między innymi rośliny, owady i drożdże. Alternatywnie, toksyny mogą być wytwarzane w bakteriach lub roślinach transgenicznych na polu lub w samym owadzie za pomocą wektora bakulowirusowego. Toksyny zwykle wprowadza się do owada przez dodanie jednej lub kilku toksyn do pokarmu owadów.
186 242
Całkowita śmiertelność odżywianych w ten sposób owadów jest przydatna, ale nie jest konieczna do uzyskania użytecznej toksyczności. Jeśli owady unikają toksyny lub zaprzestają przyjmowania pokarmu, to może to być użyteczne w pewnych zastosowaniach, nawet, jeśli efekty nie są letalne. Gdy, na przykład, pożądane są transgeniczne rośliny uprawne odporne na owady, to odmowa pobierania pokarmu przez owady na roślinach jest tak samo przydatna, jak letalna toksyczność względem owadów, ponieważ ostatecznym celem jest raczej ochrona roślin, a nie zabijanie owadów.
Istnieje wiele innych sposobów wprowadzania toksyn do pokarmu owadów. Można, na przykład, zanieczyścić źródło pokarmu larw za pomocą toksycznego białka przez spryskiwanie pokarmu roztworem białka, jak to ujawniono w niniejszym opisie. Alternatywnie, oczyszczone białko może być wprowadzone genetycznie do nieszkodliwego białka, które można następnie hodować w pożywce i albo wprowadzać do źródła pokarmu, albo pozostawić w glebie, tam gdzie jest pożądane wytępienie owadów. Białko można także wprowadzić genetycznie bezpośrednio do źródła pokarmu owadów. Głównym źródłem pokarmu wielu larw owadów jest materiał roślinny.
W wyniku wprowadzenia materiału genetycznego, który koduje właściwości owadobójcze toksyn Photorhabdus w genomie rośliny zjadanej przez danego owadziego szkodnika, dorosły owad lub larwy zginą po zjedzeniu rośliny którą żywiły. Liczne rośliny z rodzajów jednoliściennych i dwuliściennych były transformowane. Transgeniczne uprawy rolnicze, jak również owoce i warzywa mają handlowe zastosowanie. Takimi uprawami są, na przykład, kukurydza, ryż, soja, lucerna siewna, sorgo, pszenica, bawełna, orzeszki ziemne, pomidory, ziemniaki itp. Istnieje kilka technik wprowadzania obcego materiału genetycznego do komórek roślinnych i otrzymywania roślin, które trwale zachowują i prowadzą ekspresję wprowadzonego genu. Takie techniki obejmują przyspieszanie materiału genetycznego powleczonego na mikrocząstkach bezpośrednio do komórek'. Rośliny można transformować przy użyciu technologii Agrobacterium. Inną technologią transformacji jest technologia whiskersów1. Do transformowania roślin zastosowano także technologię elektroporacji'v. Oprócz licznych technologii transformowania roślin może także być różny rodzaj tkanki, który styka się z obcymi genami. Taką tkanką może być między innymi tkanka zarodkowa, tkanka przyranna typu I i II, kolanko podliścieniowe, tkanka twórcza itp. Prawie wszystkie tkanki roślinne mogą być transformowane podczas różnicowania przy użyciu odpowiednich technik znanych fachowcom.
Inną zmiennąjest wybór markera do selekcji. Wybór konkretnego markera zależy od fachowca, lecz można zastosować dowolny z następujących markerów do selekcji, razem z dowolnym innym genem nie wymienionym w niniejszym opisie, który może działać jako marker selekcyjny. Takimi markerami selekcyjnymi są między innymi gen kodujący fosfotransferazę aminoglikozydową transpozonu Tn5 (Aph II), który koduje odporność na antybiotyki kanamycynę, neomycynę i G418, jak również na te geny, które kodują odporność lub tolerancję na glifozat; na hydromycynę; metotreksat, fosfmotrycynę (bialofos); imidazolinony, sulfonylomoczniki i herbicydy triazolopirymidynowe, takie jak chlorosulfuron; bromoksynil, dalapon itp.
Oprócz markera selekcyjnego może być pożądane stosowanie genu reporterowego.
W pewnych przypadkach gen reporterowy może być stosowany bez markera selekcyjnego. Genami reporterowymi są geny, które zwykle nie występują lub nie ulegają ekspresji w przyjmującym organizmie lub tkance. Gen reporterowy zwykle koduje białko, które powoduje pewną zmianę fenotypową lub nadaje właściwość enzymatycznąv. Korzystnym genem reporterowym jest gen glukuronidazy (GUS).
Niezależnie od techniki transformacji korzystnie wprowadza się gen do wektora przenoszącego gen, który ulega ekspresji i otrzymuje się toksynę Photorhabdus w komórce rośliny w wyniku włączenia promotora roślinnego do wektora. Oprócz promotorów roślinnych, w celu uzyskania ekspresji obcych genów w komórkach roślin można stosować skutecznie promotory z różnych źródeł. Można stosować, na przykład, promotory pochodzenia bakteryjnego, takie jak promotor syntazy oktopinowej, promotor syntazy nopalinowej, promotor syntazy manopinowej; promotory pochodzenia wirusowego, takie jak wirus mozaiki kalafiorowej (35S i 19S) itp. Promotorami roślinnymi są między innymi mała podjednostka (ssu) karbok10
186 242 sylazy rybulozo-1,6-bisfosforanowej (RUPB), promotor beta-konglicyniny, promotor fazeoliny, promotor ADH, promotory szoku cieplnego i specyficzne promotory tkankowe. Promotory mogą także zawierać pewne elementy enhancera sekwencji, które mogą poprawiać wydajność transkrypcji.Typowymi enhancerami są między innymi Adh-intron 1 i Adh-intron 6. Można stosować promotory konstytutywne. Promotory konstytutywne kierują ciągłą ekspresją genów we wszystkich rodzajach komórek i w ciągu całego czasu (na przykład - aktyna, ubikwityna, CaMV 35S). Promotory specyficzne dla tkanki odpowiadają za ekspresję genów w specyficznych rodzajach komórek lub tkanek, takich jak liście lub nasiona (na przykład zeiny, oleozyny, napiny, ACP) i te promotory mogą być także stosowane. Promotory mogą być także aktywne podczas pewnego etapu rozwoju roślin, a także w tkankach i organach roślin. Jako przykłady takich promotorów można między innymi wymienić promotory specyficzne dla pyłku, specyficzne dla embrionu, specyficzne dla włókna bawełny, specyficzne dla korzeni, specyficzne dla endospermy nasion itp.
W pewnych warunkach może być pożądane stosowanie indukowalnego promotora. Indukowalny promotor odpowiada za ekspresję genów w odpowiedzi na specyficzny sygnał, taki jak bodziec fizyczny (geny szoku cieplnego); światło (karboksylaza RUPB); hormon (Em); metabolity i szok. Inne pożądane elementy transkrypcji i translacji, które działają w roślinach, mogą być także użyte. W technice znane są liczne wektory do przenoszenia genów specyficzne dla roślin.
Ponadto wiadomo, że aby uzyskać dużą ekspresję genów bakteryjnych w roślinach, korzystne jest poddanie genów bakteryjnych obróbce genetycznej, dzięki której dają one bardziej wydajną ekspresję w cytoplazmie roślin. Kukurydza jest rośliną, w przypadku której, w celu zwiększenia poziomu ekspresji toksyny w roślinie, korzystne jest poddanie obróbce genetycznej genu/genów bakteryjnych przed transformacją. Jednym z powodów takiego działania jest bardzo mała zawartość G+C w rodzimych genach bakteryjnych (i w konsekwencji przesunięcie w kierunku dużej zawartości A+T). Powoduje to generowanie sekwencji naśladujących lub powtarzających sekwencje kontroli genów w roślinach, o których wiadomo, że są bardzo bogate w A+T. Obecność pewnych bogatych w A+T sekwencji genu/genów w DNA wprowadzonych do roślin (na przykład sekwencje TATA znajdujące się zwykle w promotorach genów) może powodować odbiegającą od normy transkrypcję genu/genów. Z drugiej strony, obecność innych regulacyjnych sekwencji w transkrybowanym mRNA (na przykład sekwencji sygnału poliadenylacji - AAUAA) lub sekwencji komplementarnych do małych jądrowych RNA biorących udział w splicingu pre-mRNA) może powodować niestabilność RNA. Dlatego jednym z celów projektowania genu/genów bakteryjnych poddanych obróbce genetycznej, korzystniej określanych jako optymalizowane geny roślinne, jest generowanie sekwencji DNA o większej zawartości G+C i korzystnie zbliżonych do genów roślinnych kodujących enzymy metaboliczne. Innym celem projektowania optymalizowanych genów roślinnych jest generowanie sekwencji DNA, która nie tylko ma większą zawartość G+C, lecz modyfikacja zmian sekwencji powinna być tak wykonana, aby nie ograniczała translacji.
Przykładem rośliny o dużej zawartości G+C jest kukurydza. Poniższa tabela pokazuje, jak duża jest zawartość G+C w kukurydzy. Uważa się, że zawartość G+C w innych roślinach jest także duża, podobnie jak w kukurydzy.
Tabela 1
Kompilacja zawartości G+C regionów kodujących białko w genach kukurydzy
Klasa białka3 Zakres G+C, % Średnia zawartość G+C b, %
1 2 3
Enzymy metaboliczne (40) 44,5-75,3 59,0 (8,0)
Białka zapasowe
Grupa I (23) 46.0-51,9 48,1 (1,3)
Grupa II (13) 60,4-74,3 67,5 (3,2)
186 242 ciąg dalszy tabeli 1
1 2 3
Grupa I + II (36) 46,0-74,3 55,1 (9,6) c
Białka strukturalne (18) 48,6-70,5 63,6 (6,7)
Białka regulacyjne (5) 57,2-68,9 62,0 (4,9)
Białka nie charakteryzowane (9) 41,5-70,3 64,3 (7,2)
Wszystkie białka (108) 44,4-75,3 60,8 (5,2)
a Liczba genów w klasie podana w nawiasach b Odchylenia standardowe podane w nawiasach c Łączną średnią grupową pominięto w obliczaniu ogólnej średniej
Dla danych w tabeli 1, regiony kodujące genów uzyskano z wpisów w banku genów (komunikat 71), a składy zasad obliczono przy użyciu programu MacVector™ (IBI, New Haven, CT). W obliczeniach pominięto sekwencje intronowe. Sekwencje genów białka zapasowego grupy I i II rozróżniono na podstawie znacznej różnicy w składzie zasad.
Dzięki plastyczności wynikającej z nadmiarowości kodu genetycznego (to znaczy, że pewne aminokwasy odpowiadają więcej niż jednemu kodonowi), ewolucja genomów różnych organizmów lub klas organizmów spowodowała zróżnicowane wykorzystanie nadmiarowych kodonów. To „odchylenie kodonowe” ujawnia się w średnim składzie regionów kodujących białko. Na przykład, organizmy o stosunkowo małej zawartości G+C stosują kodony mające A lub T w trzeciej pozycji nadmiarowych kodonów, podczas gdy organizmy o większej zawartości G+C stosują kodony mające G lub C w trzeciej pozycji. Uważa się, że obecność „rzadziej występujących” kodonów w mRNA genu może zmniejszać bezwzględną szybkość translacji tego mRNA, zwłaszcza wtedy, gdy względna 'ilość naładowanego tRNA odpowiadającego rzadziej występującemu kodonowi jest mała. Z tego faktu wynika to, że zmniejszenie szybkości translacji przez poszczególne rzadziej występujące kodony powinno być co najmniej addytywne dla wielokrotnych rzadziej występujących kodonów. Z tego powodu, mRNA mające duże względne zawartości rzadziej występujących kodonów miałyby odpowiednio niskie szybkości translacji. Taka szybkość ujawniłaby się w syntezie małych ilości kodowanego białka.
W celu poddania obróbce genetycznej bakteryjnego genu/genów, oznaczono odchylenie kodonu rośliny. Odchylenie kodonu rośliny jest statystycznym rozkładem kodonów, które roślina stosuje do kodowania swych białek. Po oznaczeniu odchylenia, oznacza się procentową częstotliwość występowania kodonów w interesującym nas genie/genach. Powinny być oznaczone główne kodony wykorzystywane przez roślinę, a także drugi i trzeci wybór stosowanych kodonów. Sekwencja aminokwasowa danego białka jest poddawana odwrotnej translacji, dzięki czemu otrzymana sekwencja kwasu nukleinowego koduje takie samo białko, jak rodzimy gen bakteryjny, ale otrzymana sekwencja kwasu nukleinowego odpowiada głównym kodonom wykorzystywanym przez daną roślinę. Nową sekwencję analizuje się pod kątem miejsc cięcia enzymów restrykcyjnych, które mogłyby być wytworzone w wyniku modyfikacji. Zidentyfikowane miejsca są dodatkowo modyfikowane przez zastąpienie kodonów za pomocą drugiego i trzeciego wyboru kodonów stosowanych przez roślinę. Innymi miejscami w sekwencji, które mogłyby wpływać na transkrypcję lub translację danego genu, są połączenia egzon:intron 5' lub 3', sygnały addycji poli A lub sygnały terminacji polimerazy RNA. Sekwencję analizuje się dalej i modyfikuje w celu zmniejszenia częstotliwości dubletów TA lub GC. Poza dubletami, sekwencje bloków G lub C, które mają więcej niż około 4 reszt, które są takie same, mogą wpływać na transkrypcję sekwencji. Z tego powodu, także te bloki są modyfikowane przez zastąpienie kodonów pierwszego lub drugiego wyboru itd. następnym wybranym kodonem. Jest korzystne, aby optymalizowane geny rośliny zawierały około 63 % kodonów (głównych) pierwszego wyboru, od około 22 % do około 37 % kodonów drugiego wyboru i od 15 % do 0 % kodonów trzeciego wyboru, przy czym całkowita zawartość wynosi 100 %. Najkorzystniejsze optymalizowane geny rośliny zawierają około 63 % kodonów pierwszego wyboru, co najmniej około 22 % kodonów drugiego wyboru, około 7,5 % kodo12
186 242 nów trzeciego wyboru i około 7,5 % kodonów czwartego wyboru, przy czym całkowita ich zawartość wynosi 100 %. Opisany powyżej sposób pozwala fachowcowi modyfikować gen/geny, obce dla danej rośliny, tak aby geny ulegały optymalnej ekspresji w roślinachv\
Tak więc, w celu zaprojektowania zoptymalizowanych genu(ów) rośliny, sekwencję aminokwasową toksyn poddaje się odwrotnej translacji do sekwencji DNA, stosując nienadmiarowy kod genetyczny określony na podstawie tabeli odchylenia kodonu zestawionego dla sekwencji genu DNA danej rośliny poddawanej transformacji. Otrzymana sekwencja DNA, która jest całkowicie jednorodna pod względem stosowanych kodonów, jest dalej modyfikowana w celu określenia sekwencji DNA, która oprócz posiadania większego stopnia różnorodności kodonu, zawiera także strategicznie rozmieszczone miejsca rozpoznawania enzymu restrykcyjnego, pożądany skład zasad i nie ma takich sekwencji, które mogłyby przeszkadzać w transkrypcji lub translacji wytworzonego mRNA.
Przyjmuje się, że geny bakteryjne mogą ulegać łatwiej ekspresji w roślinach wtedy, gdy geny bakteryjne ulegają ekspresji w plastydach. Tak więc, może być wtedy możliwe uzyskanie ekspresji genów bakteryjnych w roślinach bez optymalizacji genów do ekspresji roślinnej i uzyskanie dużej ekspresji białka™.
Jednym z zagadnień związanych z handlowym wykorzystaniem roślin transgenicznych jest kierowanie ich odpornością. Dotyczy to szczególnie toksyn Bacillus thuringensis. Liczne firmy wykorzystują handlowo Bacillus thuringensis i duże zaniepokojenie wywołał fakt odporności na toksyny Bt. Jedna strategia opracowania kontrolowania odporności owadów polegałaby na połączeniu toksyn wytwarzanych przez Photorhabdus z toksynami, takimi jak Bt, wegetatywnymi białkami owadów (Ciba Geigy) lub z innymi toksynami. Te połączenia mogłyby być komponowane do natrysku lub mogłyby być mieszaninami cząsteczkowymi. Rośliny mogłyby być transformowane genami Photorhabdus, które wytwarzają toksyny owadobójcze i inne geny toksyn owadobójczych, takich jak Bt z innymi genami toksyn owadobójczych, takimi jak Bt.
Może być przeprowadzona transformacja 2 Bt w roślinie, którymi mogą być dowolne 2 genyV. Innym sposobem wytwarzania rośliny transgenicznej, która zawiera więcej niż jeden gen odporności na owady, byłoby wytworzenie dwóch roślin, przy czym każda z nich zawierałaby gen odporności na owady. Rośliny te mogłyby być skrzyżowane wzajemnie przy zastosowaniu tradycyjnych technik hodowli roślin w celu wytworzenia rośliny zawierającej więcej niż jeden gen odporny na owady.
Poza wytwarzaniem transformowanej rośliny zawierającej optymalizowane geny roślinne istnieją także inne układy dostarczania, w których mogłoby być pożądane poddanie obróbce genetycznej genu/genów bakteryjnych. Według takich samych zasad można wytworzyć, metodą obróbki genetycznej, łatwo izolowaną toksynę białkową przez fuzję cząsteczki atrakcyjnej dla owadów jako źródło pokarmu i toksyny o aktywności owadobójczej, ulegającej ekspresji w bakteriach lub w komórkach eukariotycznych przy użyciu standardowych znanych technik. Po oczyszczeniu w laboratorium taki czynnik toksyczny z „wbudowaną” przynętą mógłby być wprowadzany do standardowych pułapek na owady.
Inny schemat dostarczania polega na wprowadzeniu materiału genetycznego toksyn do wektora bakulowirusowego. Bakulowirusy zarażają poszczególnych gospodarzy owadzich, włącznie z gospodarzami będącymi celem toksyn Photorhabdus. Infekcyjny bakulowirus zwierający konstrukt ekspresyjny do ekspresji toksyn Photorhabdus, mógłby być wprowadzony na obszary zarażone owadami, aby w ten sposób zatruć lub wytruć zarażone owady.
Przenoszenie właściwości owadobójczych wymaga użycia sekwencji kwasów nukleinowych kodujących sekwencje aminokwasowe toksyn Photorhabdus włączone do wektora ekspresji białka odpowiedniego dla gospodarza, w którym będzie znajdował się wektor. Jeden ze sposobów uzyskania sekwencji kwasu nukleinowego kodującego białko o właściwościach owadobójczych polega na izolowaniu rodzimego materiału genetycznego, który wytwarza toksyny z Photorhabdus. stosując informację wyprowadzoną z sekwencji aminokwasowej toksyny, której duże części określono w tekście poniżej. Jak opisano poniżej, ujawniono także sposoby oczyszczania białek odpowiedzialnych za toksyczną aktywność.
186 242
Przy użyciu danych dotyczących sekwencji aminokwasowej końca N, takich, jak podane poniżej, można skonstruować oligonukleotydy komplementarne do wszystkich lub do części zasad DNA, które kodują pierwsze aminokwasy toksyny. Te oligonukleotydy mogą być znakowane radioaktywnie i zastosowane jako sondy cząsteczkowe w celu wyodrębnienia materiału genetycznego z banku genów genetycznej zbudowanej z materiału genetycznego wyodrębnionego ze szczepów Photorhabdus. Bank genów może być klonowany do wektorów plazmidowych, kosmidowych, fagowych lub fagemidowych. Bankiem może być transformowana Escherichia coli i przeszukiwana pod względem wytwarzania toksyn przez transformowane komórki przy użyciu przeciwciał skierowanych przeciwko toksynie lub za pomocą bezpośrednich prób na toksyczność owadobójczą.
Takie podejście wymaga wytworzenia serii oligonukleotydów, ponieważ degeneracyjny kod genetyczny umożliwia kodowanie aminokwasu przez DNA przez dowolną z kilku kombinacji trzech nukleotydów. Aminokwas arginina może być, na przykład, kodowany tripletami kwasu nukleinowego CGA, CGC, CGG, CGT, AGA i AGG. Ponieważ nie można przewidzieć, który triplet jest zastosowany w genie toksyny w danych pozycjach, trzeba przygotować oligonukleotydy z każdym możliwym tripletem. Więcej niż jedna cząsteczka DNA odpowiadająca podjednostce białka może być potrzebna do skonstruowania wystarczającej liczby sond oligonukleotydowych w celu uzyskania wszystkich podjednostek białka potrzebnych do uzyskania doustnej toksyczności.
Z sekwencji aminokwasowej oczyszczonego białka, materiały genetyczne odpowiedzialne za wytwarzanie toksyn można z łatwością wyodrębnić i klonować, w całości lub częściowo, do wektora ekspresji stosując dowolny z kilku sposobów znanych fachowcom w dziedzinie biologii molekularnej. Typowym wektorem ekspresyjnym jest plazmid DNA, jakkolwiek można stosować także inne środki przenoszenia, takie jak między innymi kosmidy, fagemidy i fagi. Poza cechami wymaganymi lub pożądanymi do replikacji plazmidu, takimi jak początek replikacji i odporność na antybiotyki lub inną postać markera selekcyjnego, takiego jak gen bar Streptomyces hygroscopicus lub St. viridochromogenes, wektory ekspresji białka zwykle wymagają kasety ekspresyjnej, która zawiera sekwencje działające w pozycji cis, konieczne do transkrypcji i translacji interesującego genu. Działające w pozycji cis, wymagane do ekspresji w prokariotach sekwencje różnią się od sekwencji wymaganych w eukariotach i roślinach.
Eukariotyczna kaseta ekspresyjna wymaga promotora transkrypcyjnego w górę (5') od danego genu, transkrypcyjnego regionu terminacji, takiego jak miejsce addycji poli A i miejsca wiązania rybosomu w górę od kodonu pierwszego genu. W komórkach bakteryjnych, użytecznym promotorem transkrypcyjnym, który mógłby być wprowadzony do wektora, jest promotor wiążący polimerazę T7 RNa. Wiadomo, że promotory opisane powyżej skutecznie promują transkrypcję mRNA. Także w górę od danego genu. wektor może zawierać sekwencję nukleotydu kodującą sekwencję sygnałową, o której wiadomo, że kieruje kowalencyjnie związane białko do określonego przedziału komórek gospodarza, takich jak powierzchnia komórki.
Wiadomo, że wirusy owadów, czyli bakulowirusy, zarażają i wpływają niekorzystnie na pewne owady. Wpływ wirusów na owady jest powolny i wirusy nie zatrzymują przyjmowania pokarmu przez owady. Tak więc, wirusy nie są uważane za środki użyteczne do zwalczania owadów. Połączenie genów toksyn Photorhabdus z wektorem bakulowirusa może być skutecznym sposobem przenoszenia toksyn i zwiększenia śmiertelności wirusa. Ponadto, ponieważ różne bakulowirusy są specyficzne względem różnych owadów, to może być możliwe stosowanie szczególnej toksyny do selektywnego celowania na szczególne szkodniki. Szczególnie użytecznym wektorem dla genów toksyn jest wirus jądrowej polihedrozy. Wektory przenoszenia wykorzystujące ten wirus zostały opisane i są obecnie wektorami z wyboru do przenoszenia obcych genów do owadów. Rekombinantowy gen kodujący toksynę - wirus może być skonstruowany w postaci przenoszonej doustnie. Bakulowirusy normalnie zarażają owady będące ich ofiarami poprzez jelitową błonę śluzową jelita cienkiego. Gen toksyny wprowadzony do silnego promotora białka otoczki wirusowej uległaby ekspresji i powinien szybko uśmiercać zarażone owady.
186 242
Poza układem dostarczania toksyn białkowych według niniejszego wynalazku za pomocą wirusa owadów lub bakulowirusa lub transgenicznej rośliny, białka mogą być otoczkowane przy użyciu technologii otoczkowania za pomocą Bacillus thuringiensis*
Innym układem dostarczania toksyn białkowych według niniejszego wynalazku jest preparat białka w matrycy przynęty, który może być następnie użyty w nad ziemnych lub pod ziemnych pułapkach z przynętą dla owadów*.
Jak opisano powyżej, może się okazać konieczne modyfikowanie sekwencji kodującej białko, gdy ulega ono ekspresji w gospodarzu innym niż rodzimy, ponieważ preferencje kodonowe innych gospodarzy mogą różnić się od preferencji Photorhabdus. W takim przypadku translacja w nowym gospodarzu może być zupełnie niewydajna, o ile nie zostaną wykonane kompensujące modyfikacje sekwencji kodującej. Ponadto, mogą być pożądane modyfikacje sekwencji aminokwasowej, aby uniknąć hamującej krzyżowej reaktywności z białkami nowego gospodarza lub aby ulepszyć właściwości owadobójcze białka w nowym gospodarzu. Genetycznie modyfikowany gen może kodować toksynę, wykazującą, na przykład, zwiększoną lub zmniejszoną toksyczność, zmienioną odporność na owady, zmienioną trwałość lub modyfikowaną specyficzność względem gatunku docelowego.
Oprócz genów Photorhabdus kodujących toksyny, przedmiotem niniejszego wynalazku są pokrewne sekwencje kwasu nukleinowego, które kodują biopolimery aminokwasowe homologiczne z białkami toksyn i które zachowują po podawaniu doustnym działanie toksyczne białek Photorhabdus w gatunkach owadów.
Wydaje się, że toksyny stosowane według niniejszego wynalazku, na przykład, najpierw hamują przyjmowanie pokarmu przez larwy przed ich śmiercią. Przez manipulację sekwencją kwasów nukleinowych kodującą toksyny Photorhabdus lub przez kontrolę sekwencji metodą obróbki genetycznej można umieścić gen kodujący toksynę w roślinach i modulować jego siłę lub sposób działania, a więc, na przykład, utrzymywać aktywność hamowania przyjmowania pokarmu z jednoczesnym eliminowaniem bezwzględnej toksyczności względem larw. Taka zmiana może umożliwić przetrwanie transformowanej rośliny do zbiorów, bez wywierania na ekosystem zbytecznego dramatycznego efektu związanego z usunięciem wszystkich docelowych owadów. Wszystkie takie modyfikacje genu kodującego toksynę lub białka kodowanego przez gen wchodzą w zakres niniejszego wynalazku.
Inne ujawnione zmiany kwasu nukleinowego polegają na wprowadzaniu sekwencji docelowych w celu kierowania toksyny do określonych części larw owadów w celu poprawienia jej skuteczności.
Szczepy ATCC 55397, 43948, 43949, 43950, 43951 i 43952 złożono do depozytu w American Type Culture Collection, 12301 Parklawn Drive, Rockville, MD 20852 USA. Dane dotyczące sekwencji aminokwasów i nukleotydów dla rodzimej toksyny W-14 (ATCC 55397) przedstawiono poniżej. Podano także przykład wyodrębnienia genomowego dNa dla toksyn z gospodarzy bakteryjnych.
Następujące skróty zastosowano w przykładach: Tris = Tris(hydroksymetylo) aminometan; EDTA = kwas etylenodiaminotetraoctowy, IPTG = izopropylotio-B-galktozyd, X-gal = 5-bromo-4-chloro-3-indoilo-B-D-galaktozyd, CTAB = bromek cetylotrimetyloamoniowy; kbp = pary kilozasad; dATP, dCTP, dGTP, dTPP, I = 5'- trifosforany 2'-dezoksynukleozydu, odpowiednio, adeniny, cytozyny, guaniny, tyminy i inozyny; ATP = 5'-trifosforan adenozyny.
Przykład I. Oczyszczanie toksyny z P. luminescens i wykazywanie toksyczności po doustnym podawaniu toksyny
Owadobójczą toksynę białkową według mniejszego wynalazku oczyszczano z P. luminescens, szczep W-14, Numer dostępu ATCC 55397. Hodowle macierzyste P. luminescens przygotowywano na szalkach Petriego zawierających 2% peptonu proteozy nr 3 (to jest PP3, Difco Laboratories, Detroit, MI) w 1,5-proc. agarze, inkubowano w temperaturze 25°C i przenoszono co tydzień. Kolonie pierwotnej postaci bakterii szczepiono w 200 ml bulionu PP3 uzupełnionego 0,5 % monostearynianem sorbitu poli(tlenku etylenu) (Tween 60, Sigma Chemical Company, St. Louis, MO) w 1-litrowej kolbie. Hodowle bulionowe hodowano w ciągu 72 h w temperaturze 30°C na obrotowej wytrząsarce. Białka toksyny mogą być odzyskiwane z hodowli otrzymywanych w obecności lub przy braku Tween; jednakże brak Tween
186 242 może wpływać na formę hodowanych bakterii i profil białek wytwarzanych przez bakterie. Przy braku Tween występuje przesunięcie wariantowe, przy czym masa cząsteczkowa co najmniej jednej zidentyfikowanej podjednostki toksyny przesuwa się od około 200 kDa do około 185 kDa.
Po 72 h wirowano hodowle przy 10000 g wciągu 30 minut w celu usunięcia komórek i resztek. Frakcję nadsączu, która miała aktywność owadobójczą, zdekantowano i wprowadzono do 50 mM K.2HPO4 przez dodanie odpowiedniej objętości 1,0 Μ K2HPO4. Nastawiono pH 8,6 za pomocą wodorotlenku potasu. Tę frakcję nadsączu zmieszano następnie z DEAE-Sephacel (Pharmacia LKB Biotechnology), którą uprzednio zrównoważono za pomocą 50 mM R2HPO4. Frakcja o aktywności toksycznej była adsorbowana przez żywicę DEAE. Tę mieszaninę wprowadzono następnie do kolumny 2,6 x 40 cm i przemywano 50 mM K2HPO4 w temperaturze pokojowej przy szybkości przepływu 30 ml/h, tak długo, aż wyciek uzyskał stałą absorbancję UV przy linii podstawowej 280 nm. Następnie kolumnę przemywano 150 mM KCl, aż wyciek uzyskał ponownie stałą adsorbancję UV przy linii podstawowej 280 nm. W końcu przemyto kolumnę za pomocą 300 nM KCl i zebrano frakcje.
Frakcje zawierające toksynę zebrano i sterylizowano na sączku przy użyciu filtru membranowego o wielkości porów 0,2 mikrona. Następnie zatężono toksynę i równoważono do 100 nM KPO4, pH 6,9, stosując membranę do ultrafiltracji o odcięciu masy cząsteczkowej przy 100 kDa, w temperaturze 4°C (Centriprep 100, Amicon Division-W.R. Grace and Company). 3-ml próbkę koncentratu toksyny naniesiono od góry na kolumnę filtracyjną o wymiarach 2,6 x 95 cm z żelem Sephacryl S-400 HR (Pharmacia LKB Biotechnology). Jako bufor eluentu stosowano 100 mM KPO4 pH 6,9, który przepływał z szybkością 17 ml/h w temperaturze 4 °C. Wyciek monitorowano przy 280 nm.
Zebrano frakcje i zbadano ich aktywność toksyczną. Toksyczność frakcji chromatograficznych zbadano w próbie biologicznej przy użyciu larw Manduca sexta. Frakcje albo wprowadzano bezpośrednio do pokarmu owada (pokarm z zarodków pszenicy dla brudnicy nieparki, ICN Biochemicals Division - ICN Biomedicals, Inc.) lub podawano za pomocą zastrzyku wewnątrzkomórkowego 5 μΐ próbki przez pierwszą przednią nóżkę larwy w IV lub V stadium, przy użyciu igły 30. Notowano wagę każdej larwy w grupie w odstępach 24 h. Przyjmowano, że występuje toksyczność, jeśli owad zaprzestał przyjmowania pokarmu i ginął w ciągu kilku dni pobierania pokarmu poddanego obróbce lub, jeśli śmierć następowała w ciągu 24 h po zastrzyku frakcji.
Toksyczne frakcje gromadzono i zatężano przy użyciu Centriprep-100 i następnie analizowano metodą HPLC przy użyciu 7,5 mm x 60 cm kolumny do chromatografii żelowej TSK-GEL G-4000 SW za pomocą 100 mM fosforanu potasu, pH 6,9, przepływ buforu eluentu 0,4 ml/min. Ta analiza ujawniła, że białko toksyny jest zawarte w pojedynczym ostrym piku, wymywanym z kolumny przy czasie retencji około 33,6 minut. Czas retencji odpowiadał ocenionej masie cząsteczkowej 1000 kDa. Frakcję piku zebrano do dalszego oczyszczania, natomiast odrzucono frakcje nie zawierające tego białka. Wymywany pik z HPLC absorbuje światło UV przy 218 i 280 nm, lecz nie absorbuje go przy 405 nm. Wykazano, że absorbancja przy 405 nm jest cechą związków antybiotycznych Xenorhabdin.
Elektroforeza zebranych frakcji pików w nie denaturującym żelu agarozowym (Metaphor Agarose, FMC BioProducts) wykazała, że w piku znajdują się dwa kompleksy białkowe. Materiał piku, buforowany w 50 mM Tris-HCl, pH 7,0 rozdzielono na 1,5 % gromadzącym żelu agarozy buforowanym za pomocą 100 mM Tris-HCl przy pH 7,0 i na 1,9 % rozdzielającym żelu agarozy buforowanym za pomocą 200 mM Tris-boranu przy pH 8,3 w standardowych warunkach buforowania (bufor anodowy 1 M Tris-HCl, pH 8,3; bufor katodowy 0,025 M Tris, 0,192 M glicyna). Pracowano z żelami przy stałym prądzie 13 mA w temperaturze 15°C, aż wskaźnikowy barwnik czerwieni fenolowej doszedł do końca żelu. Przy użyciu wybarwienia błękitem jaskrawym Coomassie wykazano obecność 2 pasm białkowych.
Wolniej migrujące pasmo nazwano „pasmem 1 białka”, a szybciej migrujące pasmo nazwano „pasmem 2 białka”. Oba pasma białkowe występowały w przybliżeniu w takich samych ilościach. Wybarwione za pomocą barwnika Coomassie żele agarozowe stosowano jako wskaźnik do dokładnego wycięcia obu pasm białkowych z nie wybarwionych części żelu.
186 242
Wycięte części zawierające pasma białkowe macerowano i dodawano małą ilość sterylnej wody. Jako próbę kontrolną, wycinano także część żelu nie zawierającą białka i poddawano ją takiej samej obróbce, jak części żelu zawierające białko. Białko odzyskiwano z części żelu metodą elektroelucji do 100 mM Tris-boranu, pH 8,3, przy 100 V (napięcie stałe) w ciągu 2 h. Alternatywnie, białko wymywano pasywnie z części żelu przez dodawanie równej objętości 50 mM Tris-HCl, pH 7,0 do tej części żelu i następnie inkubowano w temperaturze 30°C w ciągu 16 h. Umożliwiło to dyfuzję białka z żelu do buforu, który następnie zbierano.
Wyniki prób toksyczności na owadach przy użyciu toksyny oczyszczonej metodą HPLC (pik 33,6 minut) i toksyny oczyszczonej na żelu agarozowym wykazały toksyczność obu ekstraktów. Zastrzyk 1,5 pg białka oczyszczonego na HPLC zabija wciągu 24 h. Oba pasma białka, pasmo 1 i pasmo 2, odzyskane z żelów agarozowych metodą pasywnego wymywania lub elektroelucji, powodowały śmierć po zastrzyku. Stężenie białka ocenione dla tych próbek było mniejsze od 50 ng/larwę. Porównanie przyrostu masy i śmiertelności grup larw, którym wstrzykiwano białko pasma 1 lub białko pasma 2 pokazało, że białko pasma 1 jest bardziej toksyczne w przypadku dostarczenia w zastrzyku.
Gdy do pokarmu larw wprowadzono toksynę oczyszczoną metodą HPLC o stężeniu 7,5 pgdarwę, powodowało to zatrrymanie prr\yostu masy 1 arw (Tatiano 24· larwy).Larwy zzczynają przyjmować pokarm, ale po zjedzeniu tylko małej części tego pokarmu zawierającego toksynę zaczynały wykazywać objawy chorobowe wywołane przez toksynę i przestawały przyjmować pokarm. Odchody larw traciły znbarwieoie i większość larw miała objawy biegunki. Wyraźna śmiertelność owadów występowała, gdy kilka 5 pg dawek toksyny wprowadzono do pokarmu w ciągu od 7 do 10 dni.
Pasmo 1 białka, wydzielone w agarozie, wyraźnie hamowało przyrost wagi larw przy dawce 200 ng/larwę. Larwy karmione podobnymi stężeniami białka pasma 2 nie wykazywały hrmownoia i przybierały na wadze z taką samą szybkością, jak larwy kontrolne. 12 larw karmiono białkiem wymywanym, a 45 larw karmiono częściami ngnroay zawierającymi białko. Te dwa zestawy danych wskazują, że białko pasma 1 było doustnie toksyczne dla Manduca sexta. W tym samym doświadczeniu okazało się, że białko pasma 2 nie było toksyczne dla Manduca sexta.
Dodatkowa analiza białek pasm 1 i 2 metodą SDS-PAGE w warunkach denaturujących wykazała, że każde pasmo składało się z kilku mniejszych poOjednostek białkowych. Białka uwidaczniano przez wybarwianie błękitem jaskrawym Coomassie, a następnie wybarwianiem aadtaoem srebra w celu osiągnięcia maksymalnej czułości.
Podjedodstke białkowe w obu pasmach były bardzo podobne. Białkowe pasmo 1 zawiera 8 poOjedoostek białka o 25,1, 56,2, 60,8, 65,6, 166, 171, 184 i 208 kDa. Białkowe pasmo 2 białka miało identyczny profil, z tą różnicą, że brak było białek o 25,1, 60,8 i 65,6 kDa. Białka o 56,2, 60,8, 65,6 i 184 kDa występowały w kompleksie białkowego pasma 1 w przybliżeniu w równych stężeniach i odpowiadają 80% lub więcej, w przeliczeniu na całkowitą zawartość białka w tym kompleksie.
Rodzimą toksynę oczyszczoną metodą HPLC scharakteryzowano dodatkowo, jak następuje. Toksyna była nie d0poroa na ogrzewanie i po ogrzewaniu wciągu 15 minut w temperaturze 60°C traciła zdolność zabijania lub hamowania wzrostu wagi po zastrzykach lub po karmieniu larw M. Sexta. Wykonano próby w celu wykrycia aktywności lipazy, fosfolipray typu C, nukleazy lub hemolizy czerwonych ciałek krwi przy użyciu oczyszczonej toksyny. Nie stwierdzono yystęodwnnin żadnej z tych aktywności. Wykonano także próby oznaczenia zakresu hamowania antyaiotyczoego, przy czym oczyszczona toksyna nie hnmdwnłn wzrostu bakterii Gram-ujemnych lub Gram-dodrtoich, drożdży lub włóknistych grzybów, co wskazywało, że substancja toksyczna nie jest antybiotykiem Xenorhabdin.
Rodzimą toksynę oczyszczoną metodą HPLC aaadano na jej zdolność uśmiercania owadów innych niż Manduca sexta. W tabeli 2 oddaoo owady uśmiercane w tym badaniu przez toksynę P. luminescens oczyszczoną metodą HPLC.
186 242
Tabela 2
Owady zabijane przez toksynę P. luminescens
Nazwa pospolita Rząd Rodzaj i gatunek Sposób dostarczania
Zmierzchnica Lepidoptera Manduca sexta doustnie i zastrzyk
Mączniak młynarek Coleoptera Tenebrio molitor doustnie
Mrówka faraona Hymenoptera Monomorium pharaonis doustnie
Prusak Dictyoptera Blattella germanica doustnie i zastrzyk
Komar Diptera Aedes aegypti doustnie
Przykład II. Przydatność owadobójcza
Scharakteryzowano dodatkowo przydatność i toksyczność Photorhabdus luminescens. Bulion hodowlany Photorhabdus luminescens wytworzono w sposób następujący. Pożywką produkcyjną był 2% Bacto Proteose Peptone® Nr 3 (PP3, Difco Laboratories, Detroit, Michigan) w dejonizowanej wodzie Milli-Q®. Kolby do hodowli wyjściowej zawierające 175 ml pożywki umieszczonej w 500-ml kolbie z trzema przegrodami z szyjką Delong, z zamknięciem Kaput, autoklawowano wciągu 20 minut w temperaturze 120°C (250°F). Kolby produkcyjne zawierały 500 ml w 2,8-litrowej kolbie z trzema przegrodami z szyjką Delong zamkniętą pianką silikonową Shin-etsu. Autoklawowano je wciągu 45 minut, 120°C (250°F). Hodowlę zalążków inkubowano w temperaturze 28°C przy 150 obr./min w obrotowym inkubatorze-wytrząsarce z amplitudą wytrząsania 5 cm (2 cale). Po 16 h wzrostu, 1% hodowlę do szczepienia umieszczono w kolbie produkcyjnej i pozostawiono na 24 h przed zbiorem. Wydaje się, że wytwarzanie toksyny odbywa się podczas fazy logarytmicznej wzrostu. Bulion mikrobowy przeniesiono do 1-litrowej butelki wirówkowej i osadzano biomasę komórkową (30 minut przy 2500 obr./min w temperaturze 4°C (R.C.F. = —1600) wirówka HG-4L Rotor RC3 Sorval, Dupont, Wilmington, Delaware). Pierwotny bulion chłodzono w temperaturze 4°C wciągu 8-16 h i powtórnie wirowano w ciągu, co najmniej 2 h (warunki jak powyżej) w celu dodatkowego sklarowania bulionu przez usunięcie domniemanego mukopolisacharydu, który wytrącał się podczas stania. (W alternatywnym sposobie przerobu połączono oba te etapy i zastosowano wirowanie klarujące w ciągu 16 h w warunkach podanych powyżej). Bulion ten przechowywano następnie w temperaturze 4°C przed użyciem do testowania biologicznego lub przed sączeniem.
Bulion hodowlany Photorhabdus i toksyna/toksyny białka oczyszczonego z tego i bulionu wykazywały aktywność (śmiertelność i/lub hamowanie wzrostu, ograniczone wychodzenie z poczwarek) w stosunku do wielu owadów. W szczególności stwierdzono aktywność w stosunku do takich owadów, jak: kukurydziana stonka korzeniowa (larwy i dorosły), stonka ziemniaczana i pędraki torfowe, które są przedstawicielami rzędu owadów Coleoptera. Innymi przedstawicielami Coleoptera są larwy sprężykowatych, słodyszek rzepakowiec, pchełki, chrząszcze i ryjkowcowate. Stwierdzono także aktywność w stosunku do skoczka, który jest przedstawicielem rzędu Homoptera. Innymi przedstawicielami Homoptera są skoczki roślinne, miodówka gruszowa, miodówka jabłoniowa, czerwcowate, mączlikowate i kraskowate, jak również liczne gatunki mszyc specyficzne dla gospodarza. Bulion i oczyszczone frakcje są także aktywne względem sówki buraczanej, mszycy kapuścianej, sówkowatych, motyla szkodnika tytoniu, omacnicy prosowianki, słonecznicy orężówki i owocówki jabłoniowej, które są przedstawicielami rzędu Lepidoptera. Innymi typowymi przedstawicielami tego rzędu są: mól, omacnica spichrzanka, zwijarki liści, rzepnik, słonecznica orężówka, koszówkowate, szkodnik drzew liściastych Malacosoma americana, wachlarzyk i oprzędnica jesienna. Stwierdzono także aktywność w stosunku do larw nasionnicowatych i larw komara, które są przedstawicielami rzędu Diptera. Innymi przedstawicielami rzędu Diptera są paciomica grochowianka, połyśnica marchwianka, śmietka kapuściana, śmietka cebulówka, koziułkowate, mucha domowa i różne gatunki komara. Stwierdzono aktywność
186 242 w stosunku do mrówki gmachówki i mrówki argentyńskiej, które są przedstawicielami rzędu obejmującego także mrówki Selenopsis geminata, mrówki domowe i małe czarne mrówki.
Bulion/frakcja jest przydatna do zmniejszania populacji owadów i była stosowana w sposobie hamowania populacji owadów. Sposób może obejmować stosowanie w miejscu występowania owadów skutecznej, dezaktywującej ilości środka aktywnego. Wyniki przedstawiono w tabeli 3.
Aktywność w stosunku do larw kukurydzianej stonki korzeniowej zbadano w następujący sposób. Sterylizowany na filtrze bulion hodowlany Photorhabdus, nie zawierający komórek lub oczyszczone metodą HPLC frakcje nakładano bezpośrednio na powierzchnię (~1,5 cm2) 0,25 ml sztucznego pokarmu w 30 pl porcjach po rozcieńczeniu w pożywce kontrolnej lub, odpowiednio, wlO mM buforze fosforanu sodu, pH 7,0. Szalki pokarmowe wysuszono w sterylnym powietrzu i dołki zakażano pojedynczym nowonarodzonym Diabrotica undecimpunctata howardi (południowa kukurydziana stonka korzeniowa, SCR), które wylęgły się ze sterylizowanych jaj, z SCR na II stadium i hodowanym na sztucznym pokarmie lub Diabrotica virgifera virgifera (zachodnia kukurydziana stonka korzeniowa, WCR) hodowanym na sadzonkach kukurydzy w Metromix®. Larwy II stadium ważono przed wprowadzeniem do pokarmu. Szalki zamykano szczelnie, umieszczano w nawilżonej komorze wzrostowej i utrzymywano w temperaturze 27°C w ciągu odpowiedniego okresu czasu (4 dni dla nowonarodzonych i dorosłych kukurydzianych stonek korzeniowych SCR, 2-5 dni dla larw WCR, 7-14 dni dla larw II stadium). Oznaczano śmiertelność i wagę, jak wskazano. Ogólnie w każdej próbie stosowano po 16 owadów. Kontrolne wartości śmiertelności były następujące: nowonarodzone larwy < 5 %, dojrzałe chrząszcze 5 %.
.Aktywność w stosunku do stonki ziemniaczanej zbadano w sposób następujący: bulion hodowlany Photorhabdus lub pożywkę kontrolną nakładano na powierzchnię (~2,0 cm2) 1,5 ml standardowego sztucznego pokarmu przechowywanego w dołkach 24-dołkowej szalki do hodowli tkankowej. Do każdego dołka wprowadzano 50 pl próbki i pozostawiano do wyschnięcia na powietrzu. Następnie na pokarmie umieszczano poszczególne larwy II stadium stonki ziemniaczanej (Leptinotarsa decemlineata, CPB) i oceniano śmiertelność po 4 dniach. W każdej próbie stosowano 10 larw. Kontrolna śmiertelność wynosiła 3,3 %.
Aktywność w stosunku do pędraków i chrząszczy popilii japońskiej badano, jak następuje. Z porażonych przez szkodniki trawników zbierano pędraki popilii japońskiej (Popillia japonica, stadium II - III ) i przechowywano w laboratorium w mieszaninie gleba/torf z dodatkiem płatków marchwi jako dodatkowego pokarmu. Pędraki torfowe zwabiano miejscowo do pułapek feromonowych i przechowywano w laboratorium w pojemnikach plastikowych z liśćmi klonowymi jako pokarmem. Po zastosowaniu nierozcieńczonego bulionu pożywki Photorhabdus lub kontrolnej pożywki sztucznego pokarmu kukurydzianej stonki korzeniowej (30 pl/1,54 cm2, chrząszcze) lub płatków marchwi (larwy), oba stadia umieszczano pojedynczo w dołku pokarmowym i obserwowano śmiertelność i przyjmowanie pokarmu. W obu przypadkach stwierdzono wyraźne zmniejszenie ilości przyjmowanego pokarmu i wytwarzania odchodów.
Aktywność w stosunku do larw komara zbadano w sposób następujący: próbę wykonano na 96-dołkowej szalce do mikromiareczkowania. Każdy dołek zawierał 200 pl wodnego roztworu (bulion pożywki Photorhabdus, pożywka kontrolna lub woda) i około 20 jednodniowych larw komara. Stosowano 6 dołków w każdej próbie. Wyniki odczytywano po 2 h od porażenia i nie zmieniały się w ciągu 3 dni obserwacji. Nie stwierdzono śmiertelności próbki kontrolnej.
Aktywność w stosunku do nasionnicowatych (muszki owocówki) badano w sposób następujący. Pożywkę dla Drosophila melanogaster przygotowano, stosując 50% suchej pożywki i 50% cieczy: wody, pożywki kontrolnej lub bulionu hodowlanego Photorhabdus. Wykonano to przez umieszczenie 8,0 ml suchej pożywki w każdej z trzech fiolek na jedną próbę i dodanie 8,0 ml odpowiedniej cieczy. Następnie do każdej fiolki wprowadzono 10 larw Drosophila melanogaster na późnym stadium. Probówki przechowywano na stole laboratoryjnym w temperaturze pokojowej z fluorescencyjnym oświetleniem sufitowym. Po 3, 7 i 10 dniach próby zliczano poczwarki i dorosłe osobniki. Dodawanie bulionu hodowlanego Photorhabdus do pożywek pokarmowych dla larw nasionnicowatych powodowało niewielkie (17 %), lecz
186 242 znaczące, zmniejszenie 10-dniowego wychodzenia z poczwarki w porównaniu z pożywką wodną i z próbką kontrolną (3 % zmniejszenie).
Aktywność w stosunku do skoczka badano w sposób następujący. Próba wchłaniania przez skoczka (Macrosteles severini) była tak zaprojektowana, aby umożliwić wchłanianie substancji aktywnej bez żadnego innego zewnętrznego kontaktu. Pojemnik na roztwór substancji aktywnej/„pokarm” przygotowano przez wykonanie dwóch otworów w środku dna szalki Petriego o wymiarach 35 x 10 mm. Kwadrat o boku 5 cm (2 cali) z Parafilmu M® umieszczono na wierzchu szalki i przytrzymano pierścieniem w kształcie litery O. Następnie porażono kubek plastikowy o pojemności 1 uncji przy użyciu około 7 skoczków i pojemnik umieszczono na wierzchu kubka, Parafilmem ku dołowi. Następnie przez otwory wprowadzono badany roztwór do pojemnika. W próbach z zastosowaniem nie rozcieńczonego bulionu hodowlanego Photorhabdus dializowano bulion i ^pożywkę kontrolną względem wody, w celu zmniejszenia śmiertelności próbki kontrolnej. Śmiertelność określano drugiego dnia, gdy wystąpiła śmiertelność 26,5% próbki kontrolnej. W próbach z zastosowaniem oczyszczonych frakcji (200 mg białka/ml) stosowano końcowe stężenie 5% sacharozy we wszystkich próbkach, aby poprawić przeżywalność skoczków. Próbkę trzymano w inkubatorze w temperaturze 28°C, przy 70% wilgotności względnej, z okresem naświetlania 16/8. Oceniano śmiertelność próbki po 72 h. Kontrolna śmiertelność wynosiła 5,5 %.
Aktywność w stosunku do mrówek argentyńskich badano w sposób następujący. 1,5-ml porcję 100 % bulionu hodowlanego Photorhabdus, pożywki kontrolnej lub wody pipetowano do 2,0-ml fiolek z przezroczystego szkła. Fiolki zamykano kawałkiem waty dentystycznej zwilżonej właściwym roztworem. Każdą fiolkę umieszczono w osobnej szalce Petriego, o wymiarach 60 x 16 mm, z od 8 do 12 dorosłymi mrówkami argentyńskimi (Linepithema humile). Każdą próbę powtarzano trzykrotnie. Szalki do oceny biologicznej trzymano na stole laboratoryjnym w temperaturze pokojowej z górnym oświetleniem fluoroscencyjnym. Odczyty śmiertelności wykonywano po 5 dniach próby. Śmiertelność kontrolna wynosiła 24%.
Aktywność w stosunku do mrówki gmachówki badano w sposób następujący. Czarne robotnice mrówki gmachówki (Camponotus pennsylramcus) zbierano z drzew na posiadłości DowElanco w Indianapolis, IN. Próby z bulionem kultury Photorhabdus wykonywano w sposób następujący. Każdy pojemnik plastikowy do próby biologicznej (7 1/8” x 3) zawierał 15 robotnic, wstawkę papierową i 10 ml bulionu lub pożywki kontrolnej w naczyniu plastikowym. Za pomocą waty dostarczono mrówkom preparat przez otwór w pokrywie naczynia. Wszystkie preparaty zawierały 5% sacharozy. Próby biologiczne trzymano w ciemności w temperaturze pokojowej i oceniano po 19 dniach. Śmiertelność kontrolna wynosiła 9 %. W próbach z dostarczaniem oczyszczonych frakcji stosowano sztuczny pokarm mrówek zmieszany z badanym preparatem (oczyszczoną frakcją lub roztworem kontrolnym) w ilości 0,2 ml/2,0 g pokarmu w probówce plastikowej. Końcowe stężenie białka w oczyszczonej frakcji było mniejsze niż 10 pg/g pokarmu. 10 mrówek na jedną próbę, wodę, siedlisko i badany pokarm umieszczono w zamkniętych pojemnikach plastikowych i trzymano w ciemności w temperaturze 27°C w nawilżonym inkubatorze. Śmiertelność oceniano po 10 dniach. Nie stwierdzono śmiertelności kontrolnej.
Aktywność w stosunku do różnych larw motyli Lepidoptera badano w sposób następujący. Bulion hodowlany Photorhabdus lub oczyszczone frakcje nanoszono bezpośrednio na powierzchnię (~1,5 cm2) 0,25 ml standardowego sztucznego pokarmu w porcjach po 30 pl, z następnym rozcieńczaniem, odpowiednio, w pożywce kontrolnej lub w 10 mM buforze fosforanu sodu o pH 7,0. Szalki pokarmowe suszono w sterylnym przepływie powietrza i dołki porażano pojedynczymi, nowonarodzonymi larwami. Ze źródeł handlowych dostarczono jajeczka omacniny prosowianki (Ostrinia nubilalis) i słonecznicy orężówki (Helicoverpa zea) i wylęgano je, podczas gdy larwy sówki buraczanej (Spodoptera exigua), mszycy kapuścianej (Trichoplusia ni), motyla szkodnika tytoniu (Heliothis virescens), owocówki jabłkówki (Laspeyresia pomonella) i sówkowatych (Agrotis Ipsilon) dostarczano wewnętrznie. Po porażeniu larwami zamykano szalki z pokarmem, umieszczano je w nawilżonej komorze wzrostowej i trzymano w ciemności w temperaturze 27°C w ciągu właściwego okresu czasu. Oznaczenia śmiertelności i wagi wykonywano po 5-7 dniach dla bulionu pożywki Photorhabdus i po 4-7
186 242 dniach dla oczyszczonej frakcji. W każdym badaniu stosowano zwykle po 16 owadów na jedną próbę. Kontrolna śmiertelność była w zakresie od 4 do 12,5 % dla pożywki kontrolnej i poniżej 10 % dla buforu fosforanowego.
Tabela 3
Wpływ bulionu hodowlanego Photorhabdus luminescens (szczep W-14) i oczyszczonej frakcji toksyny na_śmiertelność i hamowanie wzrostu różnych rzędów/gatunków owadów
Rząd/gatunek owada Bulion Oczyszczona frakcja
% śmiert. % G.I. % śmiert. % G.I.
Coleoptera Kukurydziana stonka korzeniowa Południowy/nowe larwy 100 na 100 na
Południowy/Ii stadium na 38,5 nt nt
Południowy/dorosły 45 nt nt nt
Zachodni/II stadium na 35 nt nt
Stonka ziemniaczana II stadium 93 a.f. nt nt
Pędrak torfowy na a.f. nt nt
Dorosły, III Stadium na a.f. nt nt
Diptera Nasionnicowate (wyjście 17 nt nt nt
dorosłego owada) Larwy komara 100 na nt nt
Homoptera Skoczek 96,5 na 100 na
Hymenoptera Mrówka argentyńska 75 na nt na
Mrówka gmachówka 71 na 100 na
Lepidoptera Sówka buraczana 12,5 36 18,75 41,4
Sówkowate nt nt 0 71,2
Mszyca kapuściana nt nt 21,9 66,8
Owocówka jabłkówka nt nt 6,25 45,9
Słonecznica orężówka 56,3 94,2 97,9 na
Omacnica prosowianka 96,7 98,4 100 na
Motyl, szkodnik tytoniu 13,5 52,5 19,4 85,6
śmiert. = śmiertelność, G.I. = hamowanie wzrostu, na = nie dotyczy, nt = nie badano, a.f. = brak aktywności pokarmowej
186 242
Przykład III. Użyteczność insektycydu podawanego doglebowo.
Wykazano, że hodowla Photorhabdus luminescens była aktywna wobec kukurydzianej stonki korzeniowej, gdy podawano ją bezpośrednio doglebowo lub do mieszanki glebowej (Metromix™). Aktywność wobec larw SCR i WCR w podłożu Metromix™ badano w sposób przedstawiony w tabeli 4. W przeprowadzonym teście używano siewek kukurydzy (United Agriseeds lini CL614), które kiełkowano na świetle na wilgotnej bibule filtracyjnej przez 6 dni. Gdy korzenie osiągnęły długość 3-6 cm pojedyncze sadzonki sadzono do 591 ml czystego plastikowego kubka zawierającego 50 g suchego podłoża Metromix™. Następnie dwadzieścia larw kukurydzianej stonki korzeniowej SCR lub WCR umieszczano bezpośrednio na korzeniach sadzonek, które przykrywano Metromixem™. Po zarażeniu sadzonki podlewano 50 ml rozcieńczonej pożywki. Po podlaniu kubki szczelnie zamykano i pozostawiano w temperaturze pokojowej w oświetlonym miejscu na 7 dni. Następnie celem całkowitego usunięcia Mctromixu™ sadzonki płukano, a następnie odcinano i ważono korzenie. Aktywność określano jako procent pozostałych korzeni określany w stosunku do roślin kontrolnych i jako stopień zniszczenia liści w wyniku żerowania. Zniszczenie liści szacowano przez ogląd i oceniano jako -, +,++ lub +++ przy czym - określa brak uszkodzeń, a +++ odpowiada rozległym uszkodzeniom.
Aktywność względem larw kukurydzianej stonki korzeniowej SCR w glebie badano w sposób opisany poniżej (tabela 5). Testy wykonywano stosując siewki kukurydzy (United Agnseeds lini CL614), które kiełkowano na świetle na wilgotnej bibule filtracyjnej przez 6 dni. Gdy korzenie osiągały 3-6 cm długości pojedynczą sadzonkę wysadzano do 591 ml czystego plastikowego kubka zawierającego 150 ml ziemi z pól Libanu, w której w poprzednim roku uprawiano kukurydzę. Ziemia nie była uprzednio traktowana insektycydem. Następnie dwadzieścia larw kukurydzianej stonki korzeniowej SCR umieszczano bezpośrednio na korzeniach, które przykrywano ziemią. Po zarażeniu szkodnikami siewki podlewano całkowitą objętością 50 ml rozcieńczonego podłoża. Po podlaniu niezamknięte kubki inkubowano w komorze o wysokiej względnej wilgotności (80%) w temp. 25°C (78°F). Następnie celem całkowitego usunięcia ziemi sadzonki płukano, a korzenie odcinano i ważono. Aktywność oznaczano jako procent pozostałych po infekcji korzeni liczony względem roślin kontrolnych i jako stopień uszkodzenia liści wywołany żerowaniem. Stopień zniszczenia szacowano wzrokowo i oceniano jako -, +, ++ lub +-H- przy czym - odpowiada brakowi uszkodzeń, a +++ odpowiada rozległym uszkodzeniom.
Tabela 4
Wpływ bulionu hodowlanego Photorhabdus luminescens (szczep W-14) na larwy korzeniowe po podlaniu po infekcji (Metromix™)
Traktowanie Larwy Uszkodzenia liści Masa korzeni (w g) %
Południowa kukurydziana stonka korzeniowa
woda - - 0,4916±0,023 100
Pożywka (2,0% v/v) - - 0,4416±0,029 100
Podłoże (6,25% v/v) - - 0,4641 ±0,081 100
woda + +++ 0,1410±0,006 28,7
Pożywka (2,0% v/v) + +++- 0,1345±0,028 30,4
Podłoże (1,56% v/v) + - 0,4830±0,031 104
Zachodnia kukurydziana stonka korzeniowa
woda - - 0,4446±0,019 100
Podłoże (2,0% v/v) - - 0,4069±0,026 100
woda + - 0,2202±0,015 49
Podłoże (2,0% v/v) + - 0.3879±0,013 95
186 242
Tabela 5
Wpływ bulionu hodowlanego Photorhabdus luminescens (szczep W-14) na larwy robaka korzeniowego po infekcji i podlaniu (ziemia)
Traktowanie Larwy Zniszczenie liści Masa korzeni (w g) %
woda - - 0,2148±0,014 100
Podłoże (50% v/v) - - 0,2260±0,016 103
woda + +++ 0,0916±0,009 43
Pożywka (50% v/v) + - 0,2428±0,032 113
W testach przeprowadzonych w sposób opisany poniżej obserwowano aktywność bulionu hodowlanego Photorhabdus luminescens (szczep W-14) dodawanego do Metromixu™ wobec pędraków torfowych (tabela 6). W przybliżeniu 50 g Metromixu™ dodawano do czystych plastikowych kubków o pojemności 591 ml. Metromix™ nasączano całkowitą objętością 50 ml 50% (v/v) rozcieńczenia pożywki z hodowli Photorhabdus. Rozcieńczenie nie oczyszczanej pożywki przeprowadzono wodą przy czym 50% roztwór otrzymano przez dodanie do 25 ml nieoczyszczonej pożywki 25 ml wody do całkowitej objętości 50 ml. Jako roztwór kontrolny stosowano 1% roztwór proteazowanego peptonu #3 (PP3), który jest 50% rozcieńczeniem normalnie stosowanego roztworu. Po podlaniu pięć pędraków torfowych umieszczano na powierzchni nasączonego Metromixu™. Zdrowe pędraki torfowe zakopywały się szybko w Metromixie™. Larwy, które nie zakopywały się w ciągu 1 godz. w podłożu usuwano i zastępowano świeżymi larwami. Kubki zamykano i umieszczano w inkubatorze o temperaturze 28°C w ciemności. Po siedmiu dniach larwy usuwano z Metromixu™ i obliczano ich śmiertelność. Aktywność oszacowywano jako procentową śmiertelność liczoną względem grupy kontrolnej.
Tabela 6
Wpływ bulionu hodowlanego Photorhabdus luminescens (szczep W-14) na pędraki torfowe przy podlewaniu przed zarażeniem (Metromix™)
Traktowanie Śmiertelność* Śmiertelność %
Woda 7/15 47
Roztwór kontrolny
(1,0% w/v) 12/19 63
Podłoże
(50% v/v) 17/20 85
*wyrażona jako stosunek larw martwych do żywych
Przykład IV. Stosowanie insektycydu przez podawanie dolistne.
Aktywność bulionu hodowlanego Photorhabdus przeciwko Pyrausta nubilis obserwowano gdy bulion nanoszono bezpośrednio na powierzchnię liści kukurydzy (tabela 7). W oznaczeniu tym podłoże z hodowli Photorhabdus rozcieńczono 100-krotnie pożywką hodowlaną i ręcznie nanoszono na powierzchnię odciętych liści w ilości ~6,0 pl/cm2 powierzchni liścia. Liście po wysuszeniu na powietrzu cięto na kawałki o zbliżonej wielkości wynoszącej około 5x5 cm (2x2 cala). Liście zwijano, zabezpieczano papierowymi spinaczami i umieszczano na szklanym lejku shota którego dno pokryto 0,625 cm (0,25 calową) warstwa 2% agaru celem utrzymania wilgotności. Dwanaście larw Pyrausta nubilis umieszczano na zwiniętych liściach, po czym zamykano kubek. Po inkubacji trwającej 5 dni w ciemności przy temperaturze 27°C próbki badano z uwagi na zniszczenia spowodowane żerowaniem larw i liczbę larw, które przeżyły.
186 242
Tabela 7
Wpływ bulionu hodowlanego Photorhabdus luminescens (lioin W-14) na larwy Pyrausta nubilis aastosowaoegd przed zarażeniem na wycinki z liści kukurydzy
Traktowanie Zniszczenie liści Larwy, które przeżyły Mnsa (mg)
Wodr rozległe 55/120 0,42 mg
Podłoże kontrolne rozległe 40/120 0,50 mg
Pożywka (1,0% v/v) śladowe 3/120 0,15 mg
Aktywność bulionu hodowlanego względem gąsienic sówki (Heliothis virescens) wykazano stosując technikę zanurzonych liści. Z roślin bawełny obcinano świeże liście z których wycinakiem do korków o średnicy 18,5 mm wykrawano krążki. Poszczególne krążki indywidualnie zanurzano w pożywce kontrolnej (PP3) lub podłożu z hodowli Photorhabdus luminescens (linia W-14) które uprzednio dziesięciokrotnie z-tężono przy pomocy stożkowego systemu filtracyjnego Proflux M12 firmy Amicon (Beverly, MA) wyposażonego w filtr o odcięciu 10 kDa. Nadmiar płynu usuwano a na środku krążka umieszczano rozprostowany papierowy spinacz. Następnie spinacz zaklioowywnoo w plastiku w naczyniu ze szkła Szota o objętości 28,5 ml (1 uncji) zawierającym około 2,0 ml 1 % agaru. Wykonano to aby zawiesić krążek wycięty z liścia ponad agarem. Po wysuszeniu krążka wyciętego z liścia umieszczano na nim pojedynczą gąsienicę sówki i zamykano kubek. Następnie kubek umieszczano w plastikowym woreczku, który szczelnie zamykano po czym umieszczano na 5 dni w ciemności w temperaturze 27°C. Po upływie tego czasu pozostałe przy życiu larwy oraz niezjeOzdne liście ważono oraz określano stopień ich zniszczenia.
Tabela 8
Wpływ bulionu hodowlanego Photorhabdus luminescens (szczep W-14) na gąsienice sówki w oznaczeniu typu - namoczone liście bawełny
Traktowanie Krążki liściowe Końcowa mnsa lnrw (mg)
Liść kontrolny 55,7±1,3 np.*
Pożywka kontrolna 34,0±2,9 4,3±0,9
bulion hodowlany
Photorhabdus 54,3±1,4 0,0*’
* - nie po0awrod, ** - nie znaleziono żywych larw
Przykład V. Część A. Charakteryzowanie składników toksycznych polipeptydów.
W przeprowadzonym bndnoiu pdOjedoostki toksyny białkowej obecnej w paśmie wyizolowanym jak opisnod w przykładzie I rozdzielano w 7% żelu polinkrylrmidowym o stosunku 30:0,8 (nkrylnmid : biy-rkrylnmiO). Żel taki wykazywał zdolność lepszego rozdziału większych białek. Żel użyty w przykładzie I do oszacowania mas cząsteczkowych Pasma 1 i Pasma 2 był 18% żelem o stosunku 38:0,18 (akrylnmid: biy-nkrylnmid) co pozwalało o- zgrubny rozdział z uwagi na wielkość cząsteczek lecz mniejszą rozdzielczość skłnOników o większej masie cząsteczkowej.
W obecnej analizie wyodrębniono 10, r nie 8 pasm białkowych. Tnbela 9 pokazuje obliczoną masę cząsteczkową 10 wydzielonych pasm i bezpośrednio porównuje mnsę cząsteczkową dsaacdwmą dla tych pasm w tym oraz poprzednio opisanym doświadczeniu. Nie jest zaskakującym iż wykryto dodatkowe prsmn stosując odmienne warunki rozdziału jakie wykorzystano w tym przykładzie. Również należy się spodziewać różnic w wyznaczonych masach cząsteczkowych w poprzednim i obecnie opisywanym eksperymencie, gdyż związane są one z odmiennymi warunkami prowa0zdoej analizy. Oznaczenia wykonane w obecnie opisywanym doświadczeniu są bardziej 0dkłrdoe niż te otrzymane' w przykładzie I, gdyż są one efektem udoskonalenia warunków rozdziału. Jednakże dokonane szacunki oparte są na aorlizie
186 242
SDS PAGE która typowo nie charakteryzuje się analityczną dokładnością i szacowana wielkość peptydów może ulec w przyszłości zmianie w zależności od post-translacyjnych i współtranslacyjnych modyfikacji jakim mogą one ulegać.
Oznaczono sekwencje aminokwasowe dla N-końcowych części z pośród 10 rozdzielonych peptydów. W tabeli 9 zestawiono masy cząsteczkowe białek z oznaczoną dla nich sekwencją aminokwasową. W SEQ ID NO:2 szczegółowa analiza sugeruje, że prolina będąca 5 aminokwasem w rzeczywistości może być asparaginą (asn). W przypadku SEQ ID NO:3 dokładniejsza analiza sugeruje że aminokwasy w pozycji 13 i 14 oba są argininami (arg). W SEQ ID NO:4, dokładniejsza analiza sugeruje, że aminokwas w pozycji 6 może być alaniną (ala) lub seryną (ser). W SEQ ID NO:5, dokładniejsza analiza sugeruje że aminokwas w pozycji 3 może być kwasem asparaginowym (asp).
Tabela 9
Przykład 1
Oszacowanie Nowe oszacowanie Wyróżnienie sekwencji
208 200,2 kDa SEQ ID NO:1
184 175,0 kDa SEQ ID NO:2
65,6 68,1 kDa SEQ ID NO:3
60,8 65,1 kDa SEQ ID NO:4
56,2 58,3 kDa SEQ ID NO:5
25,1 23,2 kDa SEQ ID NO: 15
Nowe oszacowanie oparte jest na SDS-PAGE a nie sekwencji nukleotydowej genu. SDS- PAGE nie charakteryzuje się dokładnością analityczną.
Przykład V, Część B. Charakteryzowanie toksycznych składników peptydowych.
Otrzymano nową N-końcową sekwencję SEQ ID NO: 15 Ala Gln Asp Gly Asn Gln Asp Thr Phe Phe Ser Gly Asn Thr dzięki dalszemu sekwencjonowaniu N-końcowych rejonów peptydów wyizolowanych z oczyszczonej przez HPLC natywnej toksyny jak opisano to powyżej w części A przykładu V. Peptyd ten jest wynikiem ekspresji genu tcaA. Peptyd oznaczony jako TcaAi, rozpoczyna się w pozycji 254 i ciągnie do pozycji 491 gdzie rozpoczyna się peptyd TcaAjjj, SEQ ID NO:4. Wielkość peptydu oszacowana w oparciu o sekwencje genu wynosi 25 240 Da.
Przykład VI. Charakteryzowanie składników peptydowych toksyny.
W dalszych badaniach kompleks białkowy toksyny ponownie wyodrębniono z pożywki, w której hodowano Photorhabdus luminescens (po hodowli w podłożu bez Tween) przez wysałanie 10% - 80% siarczanem amonu, po czym prowadzono chromatografię jonowymienną (Mono Q), a następnie dwa kolejne sączenia molekularne.
Warunki w jakich prowadzono oczyszczanie peptydów były zgodne z zastosowanymi w przykładzie I. W czasie pierwszego sączenia molekularnego maksimum aktywności biologicznej obserwowano przy 100 ± 10 kDa. Opierając się na pomiarze białka określono, że frakcja ta była 20 - 50 razy mniej aktywna niż największy lub pierwotny pik aktywności związany z frakcją o wielkości 860 ±100 kDa (natywna). W trakcie izolacji stwierdzono również obecność mniejszego piku aktywności dla około 325 ± 50 kDa zawierający znaczącą ilość początkowego materiału biologicznego. Jest prawdą, że pik 325 kDa jest związany lub jest pochodną piku 860 kDa.
W analizie tej uzyskano również białko 56 kDa. N-końcowa sekwencja tego białka jest przedstawiona w sekwencji SEQ ID N0:6. Jest godnym odnotowania, że białko to wykazuje duże podobieństwo i jest konserwowane względem SEQ ID NO:5 na obszarze N-końca, co sugeruje, że oba one mogą być kodowane przez różnych przedstawicieli tej samej rodziny genów i że białkowe produkty ekspresji tych genów mogą być dostatecznie podobne do siebie by oba działały w kompleksie toksyny owadobójczej.
186 242
Drugie z dominujących białek o wielkości 185 kDa było zawsze obecne w ilości porównywalnej do białka 3 z tabeli 9 i być może jest tym samym białkiem lub jego fragmentem. N-końcową sekwencję tego 185 kDa białka przedstawiono jako SEQ ID NO:7.
Dodatkowe N-końcowe sekwencje aminokwasowe otrzymano również dla wyizolowanych białek. Żadna z określonych sekwencji aminokwasowych N-końców nie okazała się identyczną z białkami zidentyfikowanymi w tabeli 9 w otrzymanych preparatach były obecne odmienne białka. Jedno z tych białek miało masę cząsteczkową oszacowaną na 108 kDa i sekwencję aminokwasową N-końca przedstawioną jako SEQ ID NO:8. Kolejne takie białko miało masę cząsteczkową oszacowaną na 80 kDa i sekwencję aminokwasową N-końca przedstawionąjako SEQ ID nO:9.
Gdy analizowano pod względem wielkości białkowe składniki piku aktywności 325 kDa obserwowano pasma o wielkości 51, 31,28 i 22 kDa. Jak we wszystkich przypadkach w których masę cząsteczkową określano poprzez analizę ruchliwości elektroforetycznej, tak i w tym przypadku masa cząsteczkowa była obarczona błędem w wyniku stosowania buforów różniących się siłą jonową, różnic w natężeniu pola elektrycznego i tym podobnych różnic w warunkach elektroforezy. Każdy dysponujący podstawową wiedzą rozumie, że rzeczywistej masy cząsteczkowej nie można określić tą standardową metodą i każde z oznaczeń wykazuje odchylenie od wartości rzeczywistej. Przypuszczano, że białka tej wielkości są produktami degradacji większych białek (o wielkości wynoszącej w przybliżeniu 200 kDa), które obserwowano w większym pierwotnym kompleksie toksyny.
Ostatecznie szereg preparatyk zawierało białko o sekwencji aminokwasowej N-końca przedstawionej w SEQ ID NO: 10. Sekwencja ta wykazywała wysokie podobieństwo do znanych sekwencji białek chaperonin, pomocniczych białek o których funkcji wiadomym było, że biorą udział w składaniu większych kompleksów białkowych. Chociaż przesłanki nie mogą dowieść funkcji związanej ze składaniem względem białka zidentyfikowanego w SEQ ID NO: 10 to były one w zgodzie z istnieniem opisanego białkowego kompleksu toksyny do którego złożenia mogłoby być wymagane białko chaperoniny. Co więcej, chociaż takim białkom nie przypisuje się bezpośredniej aktywności toksyny to białko to może być ważnym dla określenia nadrzędnej struktury przestrzennej toksyny, a tym samym może wspomagać toksyczną aktywność lub stabilność kompleksu in vivo po podaniu doustnym.
Podjęto bardziej szczegółową analizę stabilności białkowego kompleksu toksyny wobec proteinazy K. Określono, że po 24 godzinnej inkubacji kompleksu wobec 10-krotnego molarnego nadmiaru proteinazy K jego aktywność ulega znaczącemu ograniczeniu (śmiertelność po podaniu doustnym spada do około 5%). Dane te potwierdzają białkowy charakter toksyny. Toksyczna aktywność nie przenikała przez błony dializacyjne ponownie potwierdzając, że natywny kompleks toksyny ma duże rozmiary.
Przykład VII. Wyizolowanie, charakteryzowanie i częściowe oznaczanie sekwencji aminokwasowej toksyny z Photorhabdus.
Wyizolowanie i ustalanie N-końcowej sekwencji aminokwasowej: w serii doświadczeń prowadzonych równolegle do przykładów V i VI przeprowadzano wysalanie siarczanem amonu białek Photorhabdus przez doprowadzanie bulionu hodowlanego Photorhabdus, zazwyczaj 2-3 litrów, do końcowego stężenia siarczanu amonu 10 lub 20% przez powolne dodawanie krystalicznego siarczanu amonu. Po mieszaniu przez 1 godzinę w temp. 4°C materiał odwirowywano przy 12000 x g przez 30 minut. Nadsącz doprowadzano krystalicznym siarczanem amonu do 80% stężenia, mieszano przez 1 godzinę w 4°C i wirowano przez 60 minut przy 12000 x g. Osad zawieszano w jednej dziesiątej objętości 10 mM Na2PO4 pH 7,0 i dializowano przez noc w 4°C wobec buforu fosforanowego o takim samym stężeniu. Przed chromatografią jonowymienną otrzymany po dializie materiał wirowano przez 1 godzinę przy 12000 x g.
Kolumnę jonowymienną zawierającą HR 16/50 Q Sepharose (Pharmacia) równoważono 10 mM Na2PO4, pH 7,0. Odwirowany i poddany dializie osad otrzymany przez wysolenie siarczanem amonu nanoszono na kolumnę z Q Sepharosą przy czym szybkość nanoszenia wynosiła 1,5 ml/min, płukano obficie buforem do równoważenia przy prędkości przepływu wynoszącej 3 ml/min, aż do momentu gdy absorbancja (OD przy 280 nm) wynosiła mniej niż
186 242
0,100. Następnie wymywano z kolumny przez 60 min gradientem NaCl w zakresie od 0 do
1,5 M przy prędkości przepływu wynoszącej 3 ml/min, lub gradientem schodkowym stosując roztwory NaCl o stężeniach 0,1, 0,4, i ostatecznie 1,0 M przy czym każdy z roztworów by nanoszony na kolumnę przez 60 minut. Frakcje połączono i zatężano stosując CentricepWO. Alternatywnie białka mogły być wymywane z kolumny 0,4M NaCl z pominięciem wymywania 0,1 M NaCl.
Dwu mililitrowe odważki zatężonego na Q Sepharose roztworu nanoszono przy prędkości przepływu 0,5 ml/min, na sito molekularne HR 16/50 Supharose 12 (Pharmacia) które zrównoważono 10 mM Na2PO4 pH 7,0. Kolumnę płukano tym samym buforem przez 240 min przy szybkości przepływu 0,5 ml/min, zbierając frakcje co 2 min. Materiał zebrany w objętości pustej zbierano i zatężano stosując Centriprep 100. Dwa mililitry roztworu zatężonego na złożu Supharose 12 nanoszono przy szybkości 0,5 ml/min, na kolumnę ze złożem do sączenia molekularnego HR 16/50 Sepharose 4B-CL (Pharmacia) zrównoważonego 10mM Na2PO4, pH 7,0. Kolumnę płukano tym samym buforem przez 240 min przy prędkości przepływu wynoszącej 0,5 ml/min, i zbierano próbki co 2 min.
Wymyta bogata w białka frakcja poddana była kolejnemu frakcjonowaniu w wyniku naniesienia jej na kolumnę ze złożem do filtracji, którym była żywica Sepharose CL-4B rozdzielająca białka w zakresie od ~ 30 kDa do 1000 kDa. Frakcja ta dawała dwa piki z których mniejszy wymywał się w objętości pustej (>1000 kDa), a większy wymywany był jako frakcja o masie cząsteczkowej około 860 kDa. Poszczególne próbki poddane sączeniu po upływie ponad tygodnia ujawniały stopniowo obecność trzeciego piku absorbancji, (odpowiadającego frakcji o masie cząsteczkowej około 325 kDa), którego udział w preparacie był znaczący, a który wydaje się, że powstawał z głównej frakcji w wyniku ograniczonej proteolizy. Oznaczenie biologiczne przeprowadzone dla tych trzech frakcji pokazało, że frakcja wypłukiwana w objętości zerowej nie wykazywała aktywności podczas gdy frakcja zawierająca kompleks toksyny o masie 860 kDa była wysoce aktywna, a frakcja 325 kDa była mniej aktywna lecz nadal całkiem silną. Analizy SDS-PAGE którym poddano oczyszczone na Sepharose CL-4B kompleksy toksyny z różnych frakcji będące produktami różnych procesów fermentacyjnych ujawniły dwa odmienne składy peptydowe oznaczone jako „P” i „S”. Frakcje te różniły się w sposób znaczący z uwagi na masy cząsteczkowe i stężenia tworzących je peptydów. Wzór „S” wytwarzany najczęściej, składa się z czterech peptydów o wysokiej masie cząsteczkowej (>150 kDa) podczas gdy wzór „P” składa się z trzech peptydów o wysokiej masie cząsteczkowej. Dodatkowo stwierdzono, że frakcja peptydowa „S” posiada 2-3 krotnic wyższą aktywność względem Pyrausta nubilis. Przesunięcie to może by związane ze zmianami w ekspresji białek związanymi z wiekiem inokulum i/lub innymi czynnikami związanymi z warunkami wzrostu i starszych wiekiem hodowli.
Miligramowe ilości białek kompleksu toksyny z poszczególnych pików dla których oznaczono wzory jako „P” lub „S” były przedmiotem preparatywnej techniki SDS-PAGE i przeniesienia w buforze Tris-glicyna (Seprabuff™) na filtr PVDF (ProBlott™, Applied Biosystems) przez 3-4 godziny. Bioty wysyłano celem oznaczenia składu aminokwasowego i analizy N-końcowej sekwencji aminokwasowej odpowiednio do Harvard MicroChem i Cambridge ProChem. Trzy peptydy o wzorze „S” miały unikalną N-końcową sekwencję aminokwasową w porównaniu do sekwencji zidentyfikowanych w poprzednim przykładzie. Peptyd o masie cząsteczkowej 201 kDa (TcdAi) ujawniony tu jako SEQ ID NO: 13 wykazywał 33% zgodność i 50% podobieństwo do sekwencji sEq ID NO:1 (TcbAu) (tabela 10, w tabeli 10 pionowe linie oznaczają identyczne aminokwasy podczas gdy kropki oznaczają zachowanie substytucję konserwowanych aminokwasów). Kolejny peptyd o masie cząsteczkowej 197 kDa, SEQ ID NO:14 (TcdB) był w 42% identyczny i w 58% homologiczny z SEQ ID NO:2 (TcaC). Ostatecznie trzeci polipeptyd o masie cząsteczkowej 205 kDa oznaczono jako TcdAi. Dodatkowo ograniczona N-końcowa aminokwasowa sekwencja SEQ ID NO: 16 (TcbAl), peptydu o masie cząsteczkowej 235 kDa była homologiczna z sekwencją aminokwasowi SeQ ID NO: 12, opracowaną na podstawie sklonowanego genu (TcbA), SEQ ID NO:11, zawierająca wydedukowaną sekwencję aminokwasową odpowiadającą SEQ ID NO:1 (TcbAj,). Wskazuje to, że duży polipeptyd o masie cząsteczkowej wyższej niż 235 kDa był
186 242 w czasie fermentacji proteolitycznie przekształcany do peptydu o masie cząsteczkowej 201 kDa, prawdopodobnie prowadząc do aktywacji cząsteczki. W jeszcze innej sekwencji, która oryginalnie określona była jako SEQ ID NO:5 (TcaBii) w przykładzie V, powyżej okazała się zawierać raczej resztę kwasu asparaginowego (Asp) w pozycji trzeciej niż glicyny (Gly) i dwa dodatkowe aminokwasy Gly i Asp odpowiednio w pozycjach osiem i dziewięć. Dalej, uzyskano dwie kolejne sekwencje aminokwasowe SEQ ID NO:2 (TcaC) i SEQ ID NO:3 (TcaB). Wykonano oznaczenie densytometryczne próbek, które były identyczne z preparatami „S” wysłanymi dla analizy N-końca. Analiza ta wykazała, że białka 201 kDa i 197 kDa stanowią odpowiednio 7,0% i 7,2% wszystkich barwiących się błękitem Coomassie brillant białek obecnych w preparacie o wzorze „S” w ilościach podobnych do ilości innych wielu peptydów. Spekuluje się, że peptydy te mogą reprezentować homologi białek, analogicznie do tego co stwierdzono dla innych toksyn bakteryjnych takich jak toksyna Cry I Bt. Białka te wykazują homologie w zakresie 40-90% w obszarze swoich N-końcowych sekwencji aminokwasowych poprzedzających toksyczne fragmenty.
Wewnętrzne sekwencje aminokwasowe: dla ułatwienia klonowania genów kodujących peptydy toksyn, otrzymano wewnętrzne sekwencje aminokwasowe wybranych peptydów w następujący sposób. Miligramowe ilości frakcji piku 2A dla których określono czy mają wzór peptydowy „P” czy „S” poddano preparatywnej technice SDS-PAGE i przenoszono w buforze Tris-glicyna Se*prabuff™ na filtry PVDF (ProBlott™, Applied Biosystems) przez 3-4 godziny. Bioty wysyłano celem oznaczenia składu aminokwasowego i N-końcowej sekwencji aminokwasowej odpowiednio do Harvard MicroChem i Cambridge ProChem. Trzy peptydy określone jako TcbAii (zawierający SEQ ID NO:1), TcdAii, i TcaB (zawierający SEQ ID NO:31) były przedmiotem trawienia trypsyną przeprowadzonego przez Harvard MicroChem po którym prowadzono rozdział chromatograficzny HPLC celem rozdzielenia poszczególnych peptydów. Analizy N-końcowych sekwencji aminokwasowych dokonywano na wyselekcjonowanych fragmentach peptydu po traktowaniu trypsyną. Dla peptydu TcaBi sekwencjonowano dwa wewnętrzne peptydy, (peptyd 205 kDa) określony jako TcaB;-PT111 (SEQ ID NO:17) i TcaBj-PT79 (SEQ iD nO: 18). Dwa wewnętrzne peptydy zsekwencjonowane dla peptydu TcaBi (peptyd 68 kDa) ujawniony jako TcaBi-PTl 58 (SEQ ID NO:19 i TcaBj-PT108 (SEQ ID NO:20). Cztery wewnętrzne peptydy zsekwencjonowano dla peptydu TcbAii (peptyd 201 kDa) określonego jako TCBAII-PT103 (SEQ ID NO:21), TcbAii-PT56 (SEQ ID NO:22), TcbA„ -PT81(a) (SEQ ID NO:23) i TcbAjj -PT81(b) (SEQ ID NO:24).
Tabela 10
N-końcowe sekwencje aminokwasowe 201 kDa (33% identyczności i 50% podobieństwa do SEQ ID NO. 1) LIG YNNQF SG*A SEQIDNO:13
FIQGYSDLFG N-A SEQIDNO:2 197 kDa (42% identyczności i 58% podobieństwa SEQ ID NO.2) MQNSQTFSVGEL SEQIDNO.14 I I : I I : : I
MQDSPEVS I TTL SEQ ID NO.2
Przykład VIII. Konstrukcja biblioteki kosmidowej dla · genomowego DNA z Photorhabdus luminescens szczepu W-14 i jej przeszukiwanie celem wyizolowania genu kodującego peptydy tworzące preparat toksycznego białka.
Jako wstępnie wymagania do wytwarzania toksycznego dla owadów białka z Photorhabdus i do innych zastosowań koniecznym jest wyizolowanie i scharakteryzowanie genów kodujących te peptydy. Cele te zrealizowano równolegle. Jednym z podejść, opisanym
186 242 później, było uzyskanie przeciwciał monoklonalnych przeciw oczyszczonej toksynie, które z kolei można było użyć do izolacji klonów z biblioteki ekspresyjnej. Inne podejście, opisane w tym przykładzie, opierało się na wykorzystaniu danych uzyskanych dla N-końcowych i wewnętrznych sekwencji aminokwasowych i w oparciu o nie zaprojektowaniu oligonukleotydów celem użycia ich w reakcji amplifikacji PCR. Obie te metody mogą być użyte do identyfikacji klonów DNA przenoszących geny 'kodujące peptydy jak również umożliwić izolację odpowiedniego genu i określenie jego sekwencji nukleotydowej.
Wyizolowanie genomowego DNA: Photorhabdus luminescens szczep W-14 (ATCC numer 55397) hodowano na 2% agarze proteazowanego peptonu #3 (Difco Laboratories, Detroit, MI) sprawdzając zdolność do wytwarzania owadobójczej toksyny przez powtarzane testy biologiczne, przeprowadzane po przeszczepieniach w sposób opisany powyżej w przykładzie I. 50 ml hodowle prowadzono przez wytrząsanie podłoża składającego się z 2% proteazowanego peptonu #3 w 175 ml kolbach stożkowych w temp. 28°C przy 150 obrotach na min przez około 24 godziny. 15 ml porcje hodowli osadzano i zamrażano w oryginalnej pożywce w -20°C aż do momentu kiedy była potrzebna do izolacji DNA. Rozmrożoną hodowlę wirowano (700 x g, 30 min) i usuwano pływający pomarańczowy mukopolisacharyd. Pozostały materiał komórkowy wirowano (25,000 x g, 15 min) aby osadzić komórki bakteryjne oraz oddzielić i usunąć pożywkę.
Genomowy DNA wyizolowano stosując zaadaptowaną metodę CTABX1 ( modyfikacje obejmowały szok osmotyczny i 10-krotne zwiększenie objętości wszystkich roztworów). Osadzone bakterie zawieszano w buforze TE (10 mM Tris-HCl, 1 mM EDTA, pH 8,0) w końcowej objętości 10 ml, następnie dodawano 12 ml 5M NaCl; otrzymaną mieszaninę wirowano przez 20 min przy 15 000 x g. Otrzymany osad zawieszano w 5,7 ml TE następnie dodawano 300 ml 10% dodecylosiarczanu sodu i 60 ml proteinazy K o stężeniu 20 mg/ml (Gibco BRL Products, Grand Island, NY; w jałowej wodzie destylowanej). Mieszaninę tę inkubowano w 37°C przez 1 godzinę następnie dodawano około 10 mg lizozymu (Worthington Biochemical Corp., Freehold, NJ). Po kolejnych 45 min dodawano 1 ml 5 M NaCl i 800 ml roztworu CTAB/NaCl (10% w/v CTAB, 0,7 M NaCl). Następnie preparat inkubowano przez 10 min w 65°C po czym delikatnie go wymieszano i przez następne 20 min naprzemian preparat delikatnie mieszano i inkubowano doprowadzając do upłynnienia materiału komórkowego. Dodawano równą objętość mieszaniny chloroform/alkohol izoamylowy (24:1, v/v) dokładnie mieszano i wirowano. Po dwóch ekstrakcjach równymi objętościami PCI (fenol:chloroform:alkohol izoamylowy, 50:49:1, v/v/v; zrównoważony 1 M Tris-HCl, pH 8,0; Intermountain Scientific Corporation, Kaysville, UT), DNA wytrącano 0,6 objętością izopropanolu. Wytrącony DNA delikatnie wyjmowano przy pomocy szklanej bagietki, płukano 70% etanolem, suszono i rozpuszczano w 2 ml STE (10 mM Tris-HCl pH 8,0, 10 mM NaCl, 1 mM EDTA). Preparat ten zawiera
2,5 mg/ml DNA, co oznaczono przez densytometryczny pomiar przy 260 nm (OD260)·
Zakres wielkości wyizolowanych cząsteczek DNA oceniano z uwagi na użyteczność preparatu do konstrukcji biblioteki genów. Przeprowadzano analizę CHEF w 1,5% żelu agarozowym (Seakem® LE, FMC BioProducts, Rockland, ME) w buforze 0,5 X TBE (44,5 mM Tris-HCl pH 8,0, 44,5 mM H3BO4, 1 mM EDTA) w aparacie BioRad cHeF-DR stosując zasilacz Pulsewave 760 Switcher (Bio-Rad Laboratories, mc., Richmond, CA). Parametry rozdziału były następujące: początkowy czas A 3 sek końcowy czas A 12 sek; 200 volt; temperatura rozdziału 4-18°C; czas rozdziału 16,5 godz. Barwienie bromkiem etydyny i wizualizacja w zalecanym dla DNA świetle ultrafioletowym wykazała obecność cząsteczek DNA o wielkości 30-250 tyś. par zasad.
Konstrukcja biblioteki. Preparat genomowego DNA z Photorhabdus poddano niekompletnemu trawieniu Sau3A. Metoda opierała się na opisie z rozdziału 3.1.3 Ausubel (supra.). Adaptacje obejmowały przeprowadzenie reakcji na mniejszą skalę w różnych warunkach, aż do momentu gdy otrzymano niemal optymalny wynik. Przeprowadzono szereg reakcji na większą skalę, a ich wyniki analizowano w żelach przez elektroforezę CHEF i dalej posługiwano się tylko najlepszymi preparatami. W optymalnym przypadku użyto 200 pg genomowego DNA który inkubowano z 1,5 jednostką Sau3A 1 (New England Biolabs, „NEB”, Beverly, MA) przez 15 min w 37°C w całkowitej objętości 2 ml buforu IX NEB (dostarczonego przez
186 242 producenta jako 10 x stężony). Reakcję hamowano przez dodanie 2 ml PCI i wirowanie przy 8000 x g przez 10 min. Do nadsączu dodawano 200 pl 5 M NaCl i 6 ml lodowato zimnego etanolu. Osad schładzano przez 30 min w -20°C po czym wirowano przy 12,000 x g przez 15 min. Nadsącz usuwano, a osad suszono w piecu próżniowym w temperaturze 40°C po czym zawieszano go w 400 ml STE. Spektrofotometryczne oznaczenie wykazało, że odzyskiwano ponad 40% początkowego DNA. Strawiony DNA frakcjonowano wielkościowo w gradiencie sacharozowym zgodnie z rozdziałem 5.3.2 z CPMB. W probówkach Ultra-Clear™ (Beckman Instruments. Inc., Palo Alto, CA) przygotowano liniowy gradient sacharozowy w zakresie od 10% do 40% ze znacznikiem gradientu i nanoszono próbki DNA na jego powierzchnię. Po wirowaniu (26,000 obrotów na min 17 godz., rotor Beckman SW41, 20°C) , począwszy od najwyższego gradientu zbierano kolejne frakcje (750 pl) i analizowano je poprzez elektroforetyczny rozdział w żelu zgodnie z metodą CHEF (jak opisano wcześniej). Selekcjonowano frakcje zawierające fragmenty Sau3A o wielkościach w zakresie 20-40 tys. par zasad, otrzymany DNA wytrącano stosując modyfikację (objętość wszystkich roztworów zwiększono 6,3 razy) metody opisanej w rozdziale 5.3.3 z Ausubel. Po całonocnym wytrącaniu DNA zbierano przez wirowanie (17 000 x g, 15 min), suszono i ponownie zawieszano w TE łącząc do końcowej objętości 80 pl, ponownie wytrącano przez dodanie 8 ml 3 M octanu sodu i 220 pl etanolu. Osad zbierano przez wirowanie prowadzone w sposób opisany powyżej i ponownie zawieszano w 12 pl TE. Stężenie DNA określano przez barwienie Hoechst 33258 (Polysciences, Inc.,Warrington, PA) i pomiar fluorometryczny w fluorometrze Hoefer TKO100 (Hoefer Scientific Instruments, San Francisco, 25 CA). Odzyskiwano około 2,5 pg DNA rozdzielonego na frakcje pod względem wielkości.
Trzydzieści pg DNA kosmidu pWE15 (Stratagene, La Jolla, CA) strawiono całkowicie 100 jednostkami enzymu restrykcyjnego BamH1 (NEB) w buforze dostarczanym przez producenta (końcowa objętość 200 pl, 37°C, 1 godz.). Reakcję ekstrahowano 100 pl PCI, a DNA wytrącano z fazy wodnej przez dodanie 20 pl 3M octanu sodu i 550 pl etanolu absolutnego o temp -20°C. Po 20 min inkubacji w -70°C DNA zbierano przez wirowanie (17 000 x g, 15 min), suszono pod próżnią i zawieszano w 180 μ l 10 mM Tris-HCl, pH 8,0. Do próbek dodawano 20 pl 10X buforu CiP (100 mM Tris-HCl, pH 8,3; 10 mM ZnCh; 10 mM MgCĘ), i 1 pl (0,25 jednostki) rozcieńczonej 1:4 cielęcej alkalicznej fosfatazy jelitowej (Boehringer Mannheim Corporation, Indianapolis, IN). Po 37 min inkubacji w 37°C dodawano następujące odczynniki: 2 pl 0,5 M EDTA, pH 8,0, 10 pl 10% dodecylosiarczan sodu; 0,5 pl proteinazy K o stężeniu 20 mg/ml (jak wyżej), następnie inkubowano w 55°C przez 30 min. Następnie prowadzono kolejne ekstrakcje 100 ml PCI i 100 ml fenolu. (Intermountain Scientific Corporation, zrównoważonego 1 M Tris-HCl, pH 8,0), zdefosforylowany DNA wytrącano przez dodanie 72 pl
7,5 M octanu amonu i 550 pl etanolu o temp -20°C, inkubowano 30 min w lodzie i wirowano w sposób opisany powyżej. Osadzony DNA płukano 500 pl 70% etanolu o temp -20°C, suszono pod próżnią i zawieszano w 20 ml buforu TE.
Ligację rozdzielonych frakcji pod względem wielkości fragmentów Sau3A 1 z trawionym BamH1-i zdefosforylowanym wektorem pWE15 przeprowadzono stosując ligazę T4 (NEB) wprowadzając modyfikacje (przykładowo stosowano uprzednio zmieszany 10X bufor do ligacji dostarczany przez producenta) do protokołu z rozdziału 3.33 z Ausubel. Ligację prowadzono przez noc w całkowitej objętości 20 ml w 15°C po czym przechowywano w -20°C.
Cztery pl mieszaniny ligacyjnej z kosmidowym DNA, zawierającej około 1 pg DNA wprowadzono do bakteriofaga lambda używając komercyjnie dostępnego ekstraktu do otoczkowania (Gigapack® III Gold Packaging Extract, Stratagene), postępując zgodnie z zaleceniami producenta. Otoczkowany preparat przechowywano w 4°C aż do momentu użycia. Otoczkowany kosmidowy DNA używano do infekowania komórek Escherichia coli szczepu XL1 Blue MR (Stratagene) zgodnie z protokołami Gigapack® IIIGold („Titering the Cosmid Library”),w następujący sposób. Komórki XL1 Blue MR hodowano na pożywce LB (g/L: Bacto-tryptone, 10; Bacto-yeast extract, 5; Bacto-agar, 15; NaCl, 5; [Difco Laboratories, Detroit, MI]) zawierającej 0,2% (w/v) maltozy i 10mM MgSO4, w 37°C. Po 5 godzinach wzrostu komórki osadzano przy 700 x g (15 min) i zawieszano w 6 ml 10 mM MgSO4. Gęstość hodowli ustalano przez dodanie 10 mM MgSO4 do OD600= 0,5. Wprowadzona bibliote30
186 242 ka kosmidowa była rozcieńczana 1:10 lub 1:20 sterylną pożywką SM (0,1 M NaCl, 10 mM MgSO4 50mM Tris-HCl pH 7,5, 0,01% w/v żelatyna) i 25 ml rozcieńczonego preparatu mieszano z 25 ml rozcieńczonych komórek XL1 Blue MR. Mieszaninę inkubowano w 25°C przez 30 min (bez wytrząsania), następnie dodawano 200 ml pożywki LB kontynuowano inkubację przez około 1 godzinę od czasu do czasu delikatnie wstrząsając. Próbkę (20-40 ml) hodowli wysiano na szalkę z LB agarem zawierającym 100 mg/L ampicyliny (np. LB-Amp) i inkubowano ją w 37°C przez noc. Dla przechowywania biblioteki bez amplifikacji pojedyncze kolonie zawieszano i szczepiono nimi pojedyncze dołki w 96- dołkowej szalce immunologicznej; każdy dołek zawierała 75 ml Terrific (pożywka TR: 12 g/L Bacto-tryptone, 24 g/L Bacto-yeast extract, 0,4% v/v glicerol, 17 mM KH2PO4 72 mM KH2PO4 z uzupełnieniem ampicylina do stężenia 100 mg/l (TB-Ainpi,x)) i inkubowano (bez wytrząsania) przez noc w 37°C. Po zreplikowaniu 96-dołkowej szalki na szalkę pochodną której dołki wypełniono 75 ml/dołek wyjałowionej przez filtrowanie pożywki TB:glicerol (1:1, v/v; z lub bez ampicyliny o stężeniu 100 mg/l), szalkę krótko wytrząsano w 37°C przy 100 obr. na min zamykano Parafilmem® (American National Can, Greenwich, CT) i umieszczano w -70°C w lodówce dla przechowania. Z płytką kopią postępowano w identyczny sposób jak z płytką wyjściową. Łącznie przygotowano 40 szalek (i ich kopii).
Przeszukiwanie biblioteki radioaktywnymi sondami DNA: Celem przygotowania filtra z koloniami do hybrydyzacji z radioaktywnie wyznakowanymi sondami dziesięć 96dołkowych szalek przenoszono do 25°C (stół roboczy o temperaturze pokojowej). Do zaszczepienia nowej 96-dołkowej szalki, której dołki zawierały 75 ml/dołek TB-AmpD0 użyto replikatora z 96 końcówkami. Skopiowaną szalkę hodowano przez noc (bez wytrząsania) w 37°C, a następnie wytrząsano przez 30 min w 37°C przy 100 obr./min. Z uwagi na to, że niektóre izolaty nie rosły wszystkie szalki zawierały 800 kolonii. Do wykonania odzwierciedlenia 96-dołkowej szalki na filtry nylonowe Magna NT (MSI, Westboro, MA) (0,45 mikronowy 220 x 250 mm) umieszczone na stałym podłożu LB-Ampoo (100 ml/szalkę) wylanym na szalkę plastykową typu Bio-assay (Nunc, 243 x 243 x 18 mm; Curtin Mathison Scientific. Inc., Wood Dale, IL) posłużono się replikatorem. Kolonie hodowano na filtrach przez około 3 godz. przy 37°C.
Na oddzielnym filtrze nylonowym Magna NT (Nunc. 0,45 mikrona. 82 mm krążek) położonym na pożywce LB uzupełnionej chloramfenikolem do stężenia 35 mg/l (LB-Cam35) i poddanym obróbce równolegle do filtrów zawierających kolonie z biblioteki genów hodowano kolonie będące kontrolą pozytywną (klony bakteryjne przenoszące wstawkę będącą sekwencją GZ4, patrz poniżej). Kolonie bakterii na filtrze lizowano, a ich DNA denaturowano i zobojętniano zgodnie z protokołem zaczerpniętym z Genius™ System User's Guide wersja 2.0 (Boehringer Mannheim, Indianapolis. IN). W celu /denaturowania filtry umieszczano koloniami do góry na bibule filtracyjnej nasączonej 0,5 N NaOH z 1,5 M NaCl na 15 min, w celu zneutralizowania umieszczano je na bibule filtracyjnej nasączonej 1 M Tris-HCl pH 8,0, 1,5 M NaCl na 15 min. Po usieciowaniu z filtrem przy pomocy aparatu Scratagene UV Stratalinker filtry przechowywano w stanie suchym w 25°C aż do momentu użycia. Filtry cięto na paski, tak aby każdy z nich zawierał zduplikowane odzwierciedlenie pojedynczej 96dołkowej szalki, następnie płukano ekstensywnie zgodnie z metodą z rozdziału 6.4.1 z CPMB: 3 godziny przy 25 °C w 0,45 M chlorek sodu i 0,045 M cytrynian sodu pH 7,0 (3X SSC), 0,1% (w/v) dodecylosiarczan sodu, a następnie w tym samym roztworze przez 1 godzinę w 65°C, dalej płukano 2X SSC (0,3 M NaCl, 0,03 M cytrynian sodu pH 7,0) przygotowując do procedury hybrydyzacji (20X SSC = 3 M NaCl, 0,3 M cytrynian sodu pH 7,0)
Amplifikacja specyficznych fragmentów genomowych zawierających gen TcaC.
W oparciu o N-końcowe sekwencje aminokwasowe określone dla oczyszczonych peptydów TcaC (ujawnionej tu jako SEQ ID NO:2), stosując standardową technologię β-cyjanoetylową na aparacie Applied BioSystem ABI394 dNa/RNA Synthesizer (Perkin Elmer, Foster City, CA) zsyntetyzowano pulę zdegenerowanych oligonukleotydów (pula S4Psh). Oligonukleotydy odblokowywano przez 8 godzin w 55°C, rozpuszczano w wodzie, spektrofotometrycznie mierzono ich ilość i rozcieńczano do użycia. Pula ta odpowiadała ustalonej sekwencji aminokwasowej N-końca peptydu TcaC. Określoną aminokwasową sekwencję odpowiadającą zdegene186 242 rowanej sekwencji DNA poOsoo poniżej przy czym A,C,G i T ddpdwiaOnją standartowym nukleotydom, - I oznacz- inozynę.
Aminokwas Met Gln Asp Ser Pro Glu Val
S4Psh 5'ATG CA(A/G) GA(T/C) (T/A)(C/G)(T/A) CCI GA(A/G) GT3'
Kolejny zestaw zdegeoerowroych oligonukleotydów został zsyotetyzowaoy (pula P2.3.5R), tak że jest komplementarny do nici kodującej oznaczoną sekwencję -miodkwasową SEQ ID NO:17;
Aminokwas Al- Phe Aso Ile Asp Asp Vnl
Kodony 5'GCN AT(T/C) >A/(T/C/ AT(AA/C) GA(A3G/ GA/T/C) GT 3'
P2.3.5R 3OG(G/C/AA)AA(jGG)TA(A/A) TA(A/A/G/ CT)A/G/ CTCA/G/ CA5'
OligonukledtyOów tych użyto j-ko starterów w polimer-zowej renkcji łańcuchowej (PCR®, Roche Molecular Systems, Brnnchburg, NJ) w celu znmplifikdwaoin specyficznych fragmentów DNA z genomowego DNA Photorhabdus szczepuW-14 (zobacz powyżej). Typowa reakcjn (50 pl) znwierała 125 pmdla każdej z pul starterów P2Psh i P2.3.SR, 253 ng matrycy będącej genomowym DNA, 10 omoli każdego z nukleotydów dATP, dCTP, dGTP, i dTTP, 1X bufor od PCR GeneAmp® i 2,5 jednostki polimernzy DNA AmpliTną® (wszystko z Roche Molecular Systems; 10X GeneAmp® bufor 100 mM Tris-HCl pH 8,3, 500 mM KCl 0,01% w/v żelatynę). Amplifikację prowa0zdOd w -pnracie Perkin Elmer Cetus DNA Thermal Cycler (Perkin Elmer, Foscer City, CA) stosując 35 cykli o następującym przebiegu: 94°C (1,0 min), 55°C (2,0 min), 72°C (3,0 min), po których stosowano etap wydrążani- przez 7,0 min w 72°C. Produkty amplifikacji nnnlizownoo przez elektroforezę w 2% w/v NuSieve® 3:1 żelu -garozowym (FMC BioProducts) w buforze TAE (40 mM Tris-dctno, 2 mM EDTA, pH 8.0). Po wybarwieniu w bromku etyOyny (0,5 pg/ml) żel nonlizownoo w świetle ultrafioletowym obserwując pomiędzy innymi licznymi produktami amolifikacμ specyficzny produkt, którego wielkość dszncdwnnd na 250 par z-s-O.
Obsznr żelu znwiernjący produkt o wielkości około 250 par zas-0 wycinnno, - niewielki bloczek (o średnicy 0,5 mm) przenoszono i używano jako Onwcę matrycy dl- renkcji PCR (40 cykli). Reakcja (50 fil) znwierała te same komponenty jnk to dpisroo wyżej pozn genomowym DNA. Po amplifikacji końce fragmentów przeprowadzono w tępe końce i fosfdryldwnoo przez inkubację w 25°C przez 20 min z 1 jednostką polimer-zy T4 DNA (NEB), 1 nmol ATP i 2,15 jednostkami kinnzy T4 (Pharmacia Biotech iOc., Piscatawny, NJ). Czyszczono w żelu z agarozy GTG® (FMC) w buforze TEA. Wycionoo pnski żelu z-wier-jące fragmenty o pożądanej wielkości 250 p-r znsad i ekstrahowano DNA przy pomocy zestawu Qinex (Qiagen Inc., Chatsworth, CA).
Wyekstrahowane fragmenty DNA ligdwaod z wektorem plazmidowym pBC KS(+) (Strat-gene) całkowicie strawionym enzymem restrykcyjnym SmnI i wyekstr-how-nym w sposób podobny do opisanego powyżej dla DNA pWE15. Typowa renkcjn ligacji (16,3 ml) znwiernłn 100 ng strawionego DNa pBC KS(+), 70 ng fragmentu DNA o wielkości 250 par znsaO, 1 nmol [CoCN^^Ch i 3,9 jednostek Weiss- T4 DNA ligazy (Coll-bor-twe Biomedical Products, Bedford, MA), w 1X buforze do ligacji (50 mM Tris-HCl, pH 7,4; 10 mM MgCf; 10 mM Oitiotreitiol, 1mM spermidyna, 1mM ATP, 100mg/ml albuminy z surowicy wołu). Po ligacji ordwndzooej przez noc w 14°C jej produktami trnoyfdrmdwnno zamrożone kompetentne komórki Escherichia coli szczepu DH5a (Gibco BRL) zgodnie z zaleceniami dostawcy i wysiewano na szalkę LB-Cam35 zawierającą IPTG (119 pg/ml) i X-gnl (50 pg/ml). Wybierano pojedyncze bi-łe kolonie i izdlowrod plazmidowy DNA stosując zmodyfikowaną lizę alkaliczną połączoną z wytrącaniem PEG (protokół do zestawu PRISM™ Rendy Renction DyeDeoxy™ Terminator Cycle Seąuencmg; ABI/Perkm Elmer). Określono sekwencję nukleotydowąobu nici wbudowanego fragmentu DNA, używ-no startera T7 [pBC KS(+) nukleotyOy 601-623: TAAAACGACGGCCAGTGAGCGCG) i startera LacZ [pBC KS(+) nukleotydy 792-816: ATGACCATGATTACGCCAAGCGCGC) i protokół załączony do zestawu do sekweocjdoowanir PRISM™ (ABI/Perkm Elmer). Niewbudowaoe skoniugow-ne z barwnikiem
186 242 didezoksyrybonukleotydy usuwano przez przepuszczanie przez Centri-Sep 100 (Princeton Separations, Inc., Adelphia, NJ) zgodnie z zaleceniami producenta. Sekwencję dNa otrzymywano przez analizę próbek przy pomocy aparatu ABI Model 373A DNA Sequencer (ABI:/Perkin Elmer). Ustaloną sekwencję nukleotydową dwóch izolatów G24 i HB14 przedstawiono na fig. 1.
Sekwencje obrazują następujące właściwości: 1) nukleotydy 1-20 odpowiadają jednej z 64 możliwych sekwencji zdegenerowanych oligonukleotydów S4Psh, ii) sekwencja aminokwasów 1-3 i 6-12 dokładnie odpowiada sekwencji określonej dla N-końca TcaC (załączonej jako SEQ ID NO:2), iii) czwartym kodowanym aminokwasem jest raczej cysteina niż seryna. Różnica ta jest kodowana w obrębie degeneracji dla kodonu serynowego (patrz powyżej, iv) piątym aminokwasem jest prolina, odpowiadająca sekwencji N-końca TcaC przedstawionej jako SEQ ID NO:2, v) nukleotydy 257-276 kodują jedną ze 192 możliwych sekwencji zaprojektowanych dla zdegenerowanej puli, vi) terminacyjny kodon TGA pojawiający się jako nukleotydy 268-270 jest efektem komplementamości do zdegenerowanych oligonukleotydów z puli wbudowanych w odpowiednie miejsce i nie wykazuje skrócenia ramki odczytu dla analizowanego genu.
Znakowanie sondy specyficznej dla genu kodującego peptyd TcaC. Fragmenty DNA odpowiadające powyższym 276 nukleotydom amplifikowano (35 cykli) metodą PCR® w objętości 100 pl mieszaniny reakcyjnej z wykorzystaniem 100 pmoli każdego ze starterów P2Psh i P2.3.5R, 10 ng plazmidów GZ4 lub HB14 jako matryc, 20 nmol każdego z nukleotydów dATP, dCTP, dGTP, i dTTP, 5 jednostek polimerazy dNa AmpliTAq® i 1X stężonego buforu GeneAmp®, w tych samych warunkach termicznych, które opisano powyżej. Produkty amplifikacji ekstrahowano z 1% żelu z agarozy GTG® przy pomocy zestawu Qiaex i oznaczano fluorometrycznie.
Wyekstrahowane produkty amplifikacji uzyskane z matrycy plazmidu HB14 (w przybliżeniu 400ng) podzielono na pięć porcji i znakowano 32P-dCTP posługując się High Prime Labeling Mix (Boehririger Mannheim) zgodnie z zaleceniami producenta. Niewbudowany izotop usuwano przez przepuszczanie próbek przez kolumny NucTrap® Próbę Purification Columns (Stratagene), zgodnie z instrukcjami dostawcy. Aktywność speecyficzną produktów znakowania radioaktywnego określano przez pomiar scyntylacji i wynosiła ona 3,1 1x108 dpm/pg. Tak wyznakowany DNA użyto jako sondę do hybrydyzacji z przygotowanymi z biblioteki genomowej 800 koloniami.
Przeszukiwanie sondą specyficzną dla genu kodującego peptyd TcaC. Znakowaną sondę HB14 gotowano przez około 10 min, a następnie dodano ją do roztworu do „minimalnej hybrydyzacji* . Roztwór do „minimalnej hybrydyzacji” zawiera 10% w/v PEG (glikol polietylenowy o masie cząsteczkowej około 8000, 7% w/v dodecylosiarczan sodu; 0,9 M chlorek sodu i 0,09 M cytrynian sodu pH 7,0 (6X SSC), 10 mM sodowy bufor fosforanowy (przygotowany z 1M koncentratu zawierającego 95 g/l NaH2PO4· 1H2O i 84,5 g/l Na2HPO4 · 7H2O), 5 mM EDTA, i 100 mg/ml zdenaturowanego DNA ze spermy łososia. Filtry blotowano, krótko suszono, a następnie bez wstępnej hybrydyzacji 5 pasków filtrów umieszczano każdy w jednym z dwóch plastikowych pudełek zawierających 75 ml roztworu do „minimalnej hybrydyzacji” i 2,6 ng/ml wyznakowanej radioaktywnie sondy HB14. Następnie inkubowano je przez noc przy powolnym wytrząsaniu (50 obr./min) w 60°C. Filtry płukano trzykrotnie przez około 10 min, za każdym razem, w 25°C w „roztworze do płukania dla hybrydyzacji minimalnej” (0,25X SSC, 0,2% dodecylosiarczan sodu), po których następowały dwa 30 min płukania w tym samym roztworze przy wolnym wytrząsaniu w temp. 60°C. Filtry umieszczone na papierze przykrywano folią polietylenową - Saran Wrap® (Dow Brands, Indianapolis, IN) i umieszczano w światłoszczelnej kasecie wyposażonej w dwa ekrany wzmacniające DuPont Cronex Lighting-Plus Cl (Sigma Chemicals Co., St. Louis, MO) do autoradiografii naświetlając przez 4 godz. w -70°C wobec kliszy rentgenowskiej X-Omat (Kodak, Rochester, NY). Po wywołaniu (standardowa procedura fotograficzna), na obu kopiach pomiędzy wieloma słabymi sygnałami tła o niepowtarzalnej intensywności pojawiały się znaczące sygnały jednoznaczne na obu kopiach. Filtry ponownie płukano przez około 4 godziny w 68°C w „roztworze do płukania do hybrydyzacji minimalnej” i ponownie umieszczano w kasecie do całonocnego naświetlania
186 242 w -70°C wobec kliszy. Zidentyfikowano 12 prawdopodobnie pozytywnych klonów opierając się na silnych sygnałach obserwowanych przy koloniach z obu odwzorowań 96-dołkowych szalek. Nie obserwowano sygnału dla kolonii będących kontrolami negatywnymi (kolonie komórek XL1 Blue MR przenoszących pWE15), w przypadku kontroli pozytywnych (komórki DH5<a zawierające izolat GZ4 będący produktem PCR) który był poddany obróbce równolegle z próbkami eksperymentalnymi.
Dwanaście przypuszczalnie pozytywnie hybrydyzujących kolonii odzyskano z zamrożonych 96-dołkowych szalek tworzących bibliotekę hodowano je przez noc w 37°C na stałym podłożu LB-AmpiOo· Następnie szczepiono je maźnięciami (3/szalkę wraz z trzema kontrolami negatywnymi: komórki XL1 Blue MR zawierające wektor pWE15) na stałą pożywkę LBAmpioo. Do hybrydyzacji przygotowano dwa zestawy filtrów (Magna NT nylon, 0,45 mikrona). Pierwszy zestaw przygotowywano przez nakładanie filtrów bezpośrednio na bakterie wysiane maźnięciami na szalkę po czym filtry zdejmowano wraz z przyklejonymi do nich komórkami bakterii i obrabiano w sposób opisany poniżej. W drugim zestawie filtry układano na szalkach zawierających pożywkę LB-Ampioo i zaszczepiano komórkami przeniesionymi z szalek szczepionych maźnięciami. Bakterie hodowano przez noc w 37°C po czym filtry usuwano z szalek i poddawano dalszej obróbce.
Komórki bakterii na filtrach lizowano i DNA denaturowano układając filtr koloniami bakteryjnymi do góry na kropli (1,0 ml) 0,5 N NaOH umieszczonej na plastikowej szalce przez 3 min. Filtry suszono na papierowych ręcznikach, a następnie powtarzano czynność ze świeżym 0,5 N NaOH. Po podsuszeniu filtry zobojętniano przez umieszczenie ich na 1,0 ml kropli 1 M Tris-HCl pH 7,5 przez 3 min, suszono i ponownie zobojętniano świeżym buforem. Dalej wykonano dwa podobne przemycia (5 min każde) w kroplach 0,5 M Tris-HCl pH 7,5 z 1,5 M NaCl. Po wysuszeniu biotów DNA przyłączano do filtrów przez naświetlenie UV (jak wyżej) po czym filtry płukano (25°C, 100 obr./min) w 100 ml 0,45 M chlorek sodu i 0,045 M cytrynian sodu pH 7,0 (3X SSC) z 0,1% (w/v) (4 razy 30 min każde za każdym razem w świeżej porcji roztworu). Następnie umieszczano je w minimalnej objętości roztworu do wstępnej hybrydyzcji (0,9 M chlorek sodu i 0,09 M cytrynian sodu pH 7,0 (6X SSC) z 1% w/v fikolu 400 (Pharmacia), poliwinylopirolidonu (przybliżona masa cząsteczkowa 360 000, Sigma) i albuminy z bydlęcej surowicy frakcji V (Sigma) przez 2 godz. w 65°C i 50 obr./min. Roztwór do wstępnej hybrydyzcji usuwano i zastępowano go 32P-znakowaną sodą HB14, którą zachowano z poprzedniej hybrydyzacji, w której sprawdzano przedstawicieli biblioteki i która była denaturowana w 95°C przez 5 min. Hybrydyzację prowadzono w 60°C przez 16 godz. przy 50 obr./min.
Po usunięciu roztworu z wyznakowaną sondą filtr płukano 3 razy w 25°C (50 obr./ min) w 0,45 M chlorek sodu i 0,045 M cytrynian sodu pH 7,0 (3X SSC) (około 150 ml dla każdego płukania). Następnie płukano przez 3 godz. w 68°C (50 obr./min) w 0,0375 M chlorek sodu i 0,00375 M cytrynian sodu pH 7,0 (0,25X SSC) z 0,2% dodecylosiarczan sodu (minimalny roztwór do płukania po hybrydyzacji) i eksponowane wobec filmu rentgenowskiego jak to opisano powyżej przez 1,5 godz. w25°C (bez ekranów wzmacniających). Ekspozycja ta ujawniła bardzo silne sygnały hybrydyzacyjne względem wyizolowanych kosmidów oznaczonych jako 22G12, 25A10, 26A5 i 26B10 i bardzo słaby sygnał dla kosmidu 8B10. Nie zaobserwowano sygnału w przypadku kolonii będących kontrolą negatywną (pWE 15), a bardzo silny sygnał był widoczny w przypadku komórek kontroli pozytywnej (DH5a przenoszące wydzielony przez PCR produkt GZ4), którą poddawano obróbce równolegle z próbkami eksperymentalnymi.
Amplifikacja specyficznego fragmentu genomowego genu tcaB.
W oparciu o N-końcową sekwencję aminokwasową oznaczoną dla oczyszczonej frakcji peptydu TcaB, (ujawniona tutaj jako SEQ ID NO:3) zsyntetyzowano pulę zdegenerowanych oligonukleotydów (pula P8F) w sposób opisany dla peptydu TcaC. Określona sekwencja aminokwasowa i odpowiadające jej zdegenerowane sekwencje DNA przedstawiono poniżej, gdzie A,C,G i T oznaczają standardowe nukleotydy w DNA, a I oznacza inozynę:
186 242
Aminokwas Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg
P8F 5' TTT ACI CA(A/G) ACI (CT)TI AAA GAA GCI (A/C)G 3' (C/T)T1
Kolejny zestaw zdegenerowanych oligonukleotydów zsyntetyzowano (pula P8.108.3R), tak aby reprezentowały nić komplementarną do nici kodującej dla oznaczonej sekwencji aminokwasowej wewnętrznego peptydu TcaBj-FT108 (ujawniona tutaj jako SEQ ID NO:20): Aminokwas Met Tyr Tyr Ile Gln Ala Gln Gln kodony ATG TA(T/C) TA(T/C) ΑΉΤ/Ο/Λ) CA(A/G) GC((AC/G/T) CA(/AG) CA(A/G)
P8.108.3R 3' AT(A/G) AT(A/G) TA(A/GΛΓ( GT(T/C) CGI GTTT/CC GT5'
TAC
Oligonukleotydy te użyto jako startery dla PCR® z użyciem HotStart 50 Tubes™ (Molecular Bio-Produets, Inc., San Diego, CA) dla zamplifikowania specyficznego fragmentu DNA z DNA genomowego wyizolowanego ze szczepu W-14 Photorhabdus (patrz wyżej). Typowa reakcja (50 pl) zawierała (dolna warstwa) 25 pmoli każdej z pul starterów P8F i P8.108.3R i 2 nM każdego z nukleotydów dATP, dCTP, dGTP i dTTP w IX buforze GeneAmp® PCR i (górna warstwa) 230 ng matrycy będącej genomowym DNA 8 nmoli każdego z nukleotydów dATP, dCTP, dGTP i dTTP i 2,5 jednostki polimerazy DNA AmpliTaq® w IX GeneAmp® buforze do PCR.
W trakcie amplifikacji wykonano, 35 cykli tak jak opisano to dla peptydu TcaC. Produkty amplifikacji analizowano poprzez elektroforezę w 0,7% w/v agarozie SeaKem® LE (FMC) w buforze TEA. Obserwowano powstawanie specyficznego produktu o wielkości 1600 par zasad.
Połączono cztery takie reakcje, a zamplifikowany DNA ekstrahowano z 1,0% żelu SeaKem® LE przy pomocy zestawu Qiaex w sposób opisany dla peptydu TcaC. Wydzielony DNA był bezpośrednio używany jako matryca dla oznaczenia sekwencji (zestaw do oznaczania sekwencji PRISM™) przy wykorzystaniu pul starterów P8F i P8.108.3R. Każda z reakcji zawierała około 100 ng matrycowego DNA i 25 pmol każdej z pul starterów i była prowadzona zgodnie z typowym protokołem w sposób opisany dla peptydu TcaC. Analiza sekwencji otrzymanej przy użyciu starterów P8F ujawniła krótką sekwencję DNA (kodującą sekwencję aminokwasową):
GAT GCA TTG NTT GCT
Asp Ala Leu (Val) Ala która odpowiada części N-końcowej sekwencji peptydowej opisanej jako SEQ ID NO:3 (TcaBj).
Znakowanie sondy specyficznej dla genu kodującego peptyd TcaBj.
Około 50 ng oczyszczonego w żelu fragmentu DNA TcaBi znakowano 32 P-dCTP w sposób opisany powyżej, a niewbudowane radioaktywne nukleotydy usuwano przepuszczając próbkę przez kolumnę NICK Column (Pharmacia). Radioaktywność specyficzną znakowanego DNA określono na 6 x 109 dpm/pg. Tak wyznakowany DNA używano jako sondę w hybrydyzacji kolonijnej z filtrami przygotowanymi dla reprezentantów biblioteki genomowej które hybrydyzowały z sondą specyficzną dla peptydu TcaC.
Filtry zawierające 12 kolonii zidentyfikowanych w trakcie przeszukiwania biblioteki sondą specyficzną dla peptydu TcaC (patrz powyżej) odpłukiwano ze znaku specyficznego dla TcaCprzez dwukrotne 30 min gotowanie w 1 1 0,015 M chlorku sodu i 0,0015 M cytrynianie sodu pH 7,0 (0, 1X SSC) z 0,1 % dodecylosiarczan sodu. Usunięcie znakowania sprawdzano przez 6 godzinne naświetlanie kliszy. Następnie odpłukany filtr inkubowano w sondzie specyficznej dla peptydu TcaBj przygotowanej w wyżej opisany sposób. Znakowany DNA denaturowano przez 10 min gotowanie i dodawano do filtrów uprzednio inkubowanych przez 1 godzinę w 100 ml roztworu do „minimalnej hybrydyzacji” w 60°C. Po całonocnej hybrydyzacji prowadzonej w tej temperaturze usuwano sondę, a filtr płukano w następujący sposób (wszystko w 0,0,45 M chlorek sodu i 0,045 M cytrynian sodu pH 7,0 (3X SSC) z 0,1% dodecylosiarczan sodu): raz przez 5 min w 25°C, raz przez 1 godz. w 60aC w świeżym roztworze
186 242 raz przez 1 godz. w 63°C w świeżym roztworze. Po 1,5 godzinnym naświetlaniu kliszy rentgenowskiej prowadzonym wg. standardowej procedury obserwowano cztery silnie hybrydyzujące kolonie. Były to podobnie jak w przypadku sondy specyficznej dla TcaC izolaty 22G12, 25 A10, 26A5 i 26B10.
Ten sam roztwór sondy TcaBi rozcieńczano równą objętością (około 100 ml) roztworu do „minimalnej hybrydyzacji”, a następnie użyto do przeszukania filtrów zawierających 800 reprezentantów biblioteki genomowej. Po hybrydyzacji płukano i prowadzono naświetlanie kliszy rentgenowskiej w sposób opisany powyżej, silną hybrydyzację z tą sondą stwierdzono jedynie w przypadku czterech klonów kosmidowych 22G12, 25A10, 26A5 i 26B10.
Wyizolowanie subklonów zawierających geny kodujące peptydy TcaC i TcaB, i określenie ich sekwencji nukleotydowej.
Trzy hybrydyzujące pozytywnie kosmidy przenoszone przez szczep XL1 Blue MR hodowano z wytrząsaniem przez noc (200 obr. /min) w 30a C w 100 ml TB- Ampioo· Następnie komórki zbierano przez wirowanie i sporządzano kosmidowy DNA używając komercyjnie dostępnego zestawu (BIGprep™, 5 Prime 3 Prime, Inc., Boulder, CO postępując zgodnie z protokołem dostarczonym przez producenta. Stosując tą procedurę z powodzeniem wyizolowano tylko jeden kosmid 26A5. Po trawieniu enzymem restrykcyjnym EcoRl (NEB) i analizowaniu przez elektroforezę w żelu wykryto fragmenty o wielkości około 14, 10, 8 (wektor), 5, 3,3 2,9 i 1,5 tyś. par zasad. Druga próba wyizolowania kosmidowego DNA z tych samych trzech szczepów (8 ml hodowle; TB-Ampooi, 30°C metodą gotowanych minipreparatówxui. Metodą tą z powodzeniem wyizolowano tylko jeden kosmid 25A10. Gdy strawiono enzymem restrykcyjnym EcoRI (NEB), a następnie analizowaniu techniką elektroforezy w żelu kosmid miał wzór fragmentów identyczny z wcześniej obserwowanym dla kosmidu 26A5.
0,15 pg próbkę DNA kosmidu 26A5 użyto do transformacji 50 ml komórek E. coli szczepu DH5a (Gibco BRL) zgodnie z protokołem dostarczonym przez producenta. Pojedynczą kolonią izolowaną z tego szczepu zaszczepiano 4 ml pożywki TB-Ampioo i hodowano przez 8 godz. w 37°C. Dodawano chloramfenikol (detreomycyna) do końcowego stężenia 225 pg/ml i kontynuowano inkubację przez dalsze 24 godz, następnie komórki zbierano przez wirowanie i zamrażano w -20°C. Wyizolowanie DNA kosmidu 26A5 prowadzono przez standardową minipreparatykę lizy alkalicznej (Maniatis i wsp. opis cyt. str. 382) zmodyfikowaną przez zwiększenie wszystkich objętości o 50% i mieszanie na mieszadle magnetycznym lub delikatne mieszanie zamiast gwałtownego mieszania przy użyciu Vortexu, w każdym etapie. Po przemyciu osadu 70% etanolem rozpuszczono go w TE zawierającym 25 pg/ml rybonukleazy a (Boehringer Mannheim).
Wyizolowanie fragmentów EcoRI hybrydyzujących z sondami pochodną GZ4 i TcaBi. Około 0,4 pg kosmidu 25A10 (z komórek XL Blue MR) i około 0,5 pg kosmidu 26A5 (zamplifikowanych na chloramfenikolu komórek Di 15«) trawiono około 15 jednostkami EcoRI (NEB), zamrażano na noc, a następnie podgrzewano do 65°C przez pięć minut i rozdzielano elektroforetycznie w 0,7% żelu agarozowym (Seakem® LE, 1X TEA, 8Q wolt, 90 min). DNA barwiono bromkiem etydyny w sposób opisany wyżej i fotografowano w świetle ultrafioletowym. W przypadku próbki 25A10 trawienie EcoRl było kompletne lecz dla próbki kosmidu 26A5 w tych warunkach jedynie częściowe. Żel agarozowy zawierający fragmenty DNA poddano depurynacji, denaturacji i zobojętnieniu po którym próbki DNA przenoszono techniką Southerna na filtr nylonowy Magna NT stosując przepis z zastosowaniem wysokiego stężenia soli (20X SSC) jak opisano w rozdziale 2,9 Ausubel i wsp. (CPMB. opis cyt.). Przeniesiony DNA następnie, tak jak poprzednio, usieciowano z filtrem poprzez UV.
Specyficzny wobec peptydu TcaC fragment DNA odpowiadający wstawce wyizolowanego plazmidu GZ4 amplifikowano przez PCR® w objętości reakcji 100 ml w sposób uprzednio opisany. Produkty trzech reakcji amplifikacji łączono i ekstrahowano z 1% agarozowego żelu GTG® zestawem Qiaex, w sposób opisany powyżej, następnie oznaczano jego ilość fluorometrycznie. Oczyszczony w żelu DNA (100 ng) znakowano 32P-dCTP używając High Prime Labeling Mix (Boehringer Mannheim) w sposób opisany powyżej do radioaktywności specyficznej 6.34 x 108 dpm/pg.
186 242
Znakowaną P sondę GZ4 gotowano przez 10 min, a następnie dodawano ją do buforu do „hybrydyzacji minimalnej” (do stężenia 1ng/ml) do którego dodawano filtr, na który metodą Southema przeniesiono otrzymane w wyniku trawienia fragmenty kosmidowego DNA, a następnie inkubowano przez 4 godz. w 60°C z delikatnym wytrząsaniem przy 50 obr./min. Następnie filtr płukano 3 razy w 25°C za każdym razem przez około 5 min (roztwór hybrydyzacji minimalnej do płukania) po czym dwukrotnie za każdym razem przez 10 min w temp. 60°C. Błotem naświetlano kliszę (z ekranami wzmacniającymi) przez około 30 min. w -70°C. Sonda GZ4 hybrydyzowała silnie, zarówno w przypadku kosmidu 26A5 jak i 25A10, z fragmentem EcoRI o wielkości 5,0 tys. par zasad (wielkość jednoznaczna).
Filtry odmywano z radioaktywności przez gotowanie w 0,015 M chlorek sodu i 0,0015 M cytrynian sodu pH 7,0 (O,1X SSC) z 0,1% dodecylosiarczan sodu przez 30 min, a brak radioaktywności sprawdzano naświetlanie kliszy. Następnie hybrydyzowano w 60°C przez 3,5 godz. z (zdenaturowaną) sondą TcaBi w buforze do „minimalnej hybrydyzacji” wcześniej używanego do wyszukiwania na filtrze kolonii (wyżej) odpłukiwano w sposób opisany powyżej i naświetlano kliszę przez 40 min w -70°C stosując ekrany wzmacniające. W przypadku obu kosmidów sonda TcaBj hybrydyzowała słabo z fragmentem EcoRI o wielkości 5,0 tys. par zasad i mocno z fragmentem o wielkości około 2,9 tys. par zasad.
Wcześniej opisane próbki DNA kosmidu 26A5 (z komórek DI15a) użyto jako źródła DNA do subklonowania interesującego fragmentu. DNA (2,5 pg) trawiono około 3 jednostkami EcoRI (NEB) w całkowitej objętości 30 pl przez 1,5 godz. celem otrzymania częściowego trawienia, co potwierdzono przez elektroforezę w żelu. Dziesięć ng DNa pBC KS (+) (Stratagene) trawiono przez 1,5 godz. 20 jednostkami EcoRI w całkowitej objętości 20 pl co prowadziło do całkowitego strawienia co potwierdzano przez elektroforezę w żelu. Oba trawione EcoRI preparaty DNA rozcieńczano do 50 pl wodą, do każdego z nich dodano równą objętość PCI, zawiesinę delikatnie wymieszano żwirowano w mikrowirówce i zebrano wodną fazę nadsączu. DNA wytrącano 150 pL etanolu, a mieszaninę umieszczano w -20°C na noc. Po odwirowaniu i wysuszeniu strawiony EcoRI pBC KS (+) rozpuszczano w 100 pl TE, częściowo strawiony 26A5 rozpuszczano w 20 pl TE. Uzyskane DNA sprawdzano fluorometrycznie.
W niezależnych reakcjach w przybliżeniu 60 ng DNA pBC KS (+) trawionego EcoRI ligowano z około 180 ng lub 270 ng częściowo strawionego DNA kosmidu 26A5. Ligację prowadzono w 20 pl w 15°C przez 5 godzin używając T4 ligazy i buforu z New England BioLabs. Mieszaninę ligacyjną rozcieńczoną do 100 pl jałowym TE używano do transformacji zamrożonych kompetentnych komórek DH5a (Gibco BRL) zgodnie z instrukcją dostawcy. Różne ilości (25-200 pl) stransformowanych komórek wysiewano na świeżo przygotowane szalki ze stałym podłożem LB-Cam35 z 1 mM IPTG i 50 mg/1 X-gal. Szalki inkubowano w 37°C przez około 20 godzin, po czym schłodzono w ciemności na około 3 godziny w celu otrzymania intensywnego zabarwienia pozwalającego na selekcję. Wybierano białe kolonie przeszczepiając je maźnięciami na szalkę z takim samym podłożem i inkubowano przez noc w 37°C. ,
Dwie kolonie wybrano z każdej szalki selekcyjnej i postępowano z nimi jak niżej. Po przeszczepieniu białych kolonii na świeże szalki przyciskano okrągłe filtry nylonowe Magna NT do szalek z bakteriami wysianymi w postaci maźnięć, filtry podnoszono i poddawano denaturacji, zobojętnianiu i usieciowywaniu przez UV w sposób wyżej opisany dla kolonii filtrów z koloniami biblioteki. Usieciowane kolonie intensywnie płukano w tym również usuwano resztki ścian komórkowych bibułką. Jeden zestaw hybrydyzowano z roztworem sondy GZ4(TcaC), który opisano wcześniej, a drugi z roztworem sondy TcBi, zgodnie z protokołem dla „minimalnej hybrydyzacji”, po czym płukano i naświetlano kliszę jak opisano to dla filtrów z koloniami biblioteki.
Kolonie wykazujące hybrydyzację tylko z sondą GZ4 jak i z oboma sondami GZ4 i TcaBi lub tylko z sondą TcaBi selekcjonowano do dalszej pracy i komórki szczepiono celem wyselekcjonowania pojedynczych kolonii na podłoże LB-Cam35 z IPTG i X-gal jak uprzednio. W przybliżeniu 35 pojedynczych kolonii wybierano do płynnej pożywki LB-Cam35 i hodowano przez noc w 37°C; komórki zbierano przez wirowanie po czym izolowano z nich
186 242 plazmidowy DNA poprzez minipreparatykę lizy alkalicznej zgodnie z Maniatis i wsp. (opis. cyt. str. 368). Osadzony DNA rozpuszczano w TE + 25 pg/ml rybonukleazy
A i fluorometrycznie oznaczano stężenie DNA. Wzór trawienia EcoRI analizowano poprzez elektroforezę w żelu. Następujące izolaty zachowywano jako użyteczne. Izolat A17.2 zawiera wyłącznie religowany DNA pBC KS(+) i był użyteczny jako kontrola (negatywna). Izolaty D38.3 iC44.1 każdy zawierał jedynie fragment 2,9 tys. par zasad - hybrydyzujący EcoRI fragment wbudowany do pBC KS(+). Plazmidy te nazwane odpowiednio pDAB2000 i pDAB2001 zostały izilustrowaane na fig. 2.
Izolat A35.3 zawierał tylko fragment o przybliżonej wielkości 5 tyś par zasad, fragment EcoRI hybrydyzujący z GZ4 wbudowany do pBC KS(+). Plazmid ten nazwano pDAB2002 (również na fig.2). Izolaty te dostarczyły matryc do sekwencjonowania DNA. Plazmidy pDAB2000 i pDAB2001 oczyszczano używając jak poprzednio zestawu BIGprep™. Hodowle (30 ml) prowadzono przez noc w TB-Cam35 do wartości OD ponad 2, następnie plazmid izolowano zgodnie z zaleceniami producenta. Osady DNA ponownie rozpuszczano w 100 ml TE każdy i jednorodność próbek sprawdzano przez trawienie EcoRI i analizę elektroforetyczną w żelu.
Reakcje sekwencjonowania prowadzono w duplikatach przy czym jedną matrycę stanowił DNA pDAB2000, a drugą matrycę DNA pDAB2001. Reakcję prowadzono posługując się metodą sekwencjonowania przez cykliczne wbudowywanie znakowanych barwnikami didezoksynukleotydów w sposób opisany powyżej dla sekwencjonowania DNA GZ4/HB14. Początkowe sekwencjonowania wykorzystywały jako startery LacZ i T7 opisane powyżej, plus startery oparte na określonej sekwencji produktu ampliflkacji
TcaBj (TH 1 =ATTGCAGACTGCCAATCGCTTCGG,
TH 12 = GAGAGTATCCAGACCGCGGATGATCTG).
Po porównaniu i edycji każdego z wyników sekwencjonowania każdy z wyników był urwany pomiędzy 250 a 350 zasadą w zależności od kompletności danych chromatograficznych interpretowanych przez program Perkin Elmer Applied Biosystems Division SeqEd 675. Poszczególne „etapy” sekwencjonowania prowadzono przez wyselekcjonowywanie odpowiednich nowych starterów. Z kilkoma wyjątkami startery (syntetyzowane jak opisano powyżej) miały długość 24 nukleotydów i 50% zawartości par G+C. Sekwencjonowanie tą metodą prowadzono dla obu nici fragmentu EcoRI o przybliżonej długości 2,9 tyś par zasad.
Do dalszego sekwencjonowania jako matrycę do sekwencjonowania użyto DNA izolatu plazmidowego pDAB2002, przygotowywano zestawem BIGprep™. Reakcję sekwencjonowania przeprowadzano i analizowano jak opisano powyżej. Początkowo starter T3 (pBS SK (+) nukleotydy 774-796: CGCGCAATTAACCCTCACTAAAG) i starter T7 (pBS KS (+) nukleotydy 621-643: GCGCGTAATACGACTCACTATAG) używano do zapoczątkowywania reakcji sekwencjonowania z otaczających wstawkę sekwencji wektora i kierowaną do wewnątrz wrekombinowanego DNA. Kolejny zestaw starterów (GZ4F: GTATCGATTACAACGCTGTCACTTCCC;
TH13: GGGAAGTGACAGCGTTGTAATCGATAC;
TH 14 : ATGTTGGGTGCGTCGGCTAATGGACATAAC; i
LWI - 204: GGGAAGTGACAGCGTTGTAATCGATAC) przygotowano do rozpoczynania reakcji z wewnętrznych sekwencji, które zostały wcześniej określone poprzez sekwencjonowanie z wykorzystaniem zdegenerowanych oligonukleotydów subklonowanych produktów PCR dla peptydu TcaC. Z danych uzyskanych w trakcie początkowych przebiegów sekwencjonowania, zaprojektowany został nowy zestaw starterów użytych do przejścia (kroczenia po) całej długości wewnętrznego fragmentu o długości ~ 5 tyś. par zasad. Łącznie użyto jako starterów 55 oligonukleotydów co pozwoliło zidentyfikować łącznie całą liczącą 4832 zasad ciągłą sekwencję.
Gdy połączono sekwencje fragmentu EcoRI wbudowanego do pDAB2002 z częścią sekwencji określonej dla izolatów pDAB2000/pDAB2001 otrzymano ciągłą sekwencję o łącznej długości 6005 par zasad (ujawniona tutaj jako SEQ ID NO:25). Gdy długą otwartą ramkę odczytu przepisano na odpowiadającą im sekwencję aminokwasową sekwencja ta jasno pokazała, że N-końcowy peptyd (ujawniony tutaj jako SEQ ID NO:3), kodowany jest przez
186 242 nukleotydy 19-75 bezpośrednio następujące po metioninie (start translacji)). Wcześniej zlokalizowane jest potencjalne miejsce wiązania rybosomu (nukleotydy 1-9) a poniżej, nukleotydy 166-228 kodowany jest wewnętrzny peptyd TcaB - PTI 58 (ujawniony tutaj jako SEQ ID NO: 19). Poniżej w tej samej ramce odczytu, nukleotydy 1738-1773, występuje sekwencja kodująca wewnętrzny polipeptyd TcaBjj-PT108 (ujawniony tutaj jako SEQ ID NO:20). Również w tej samej ramce odczytu, nukleotydy 1897-1923 kodują N-końcowy polipeptyd TcaB,, (ujawniony tutaj jako SEQ ID NO:5), po czym otwarta ramka odczytu ciągnie się nieprzerwanie, aż do kodonu terminacji translacji przy nukleotydach 3586-3588.
Brak w ramce kodonów stop pomiędzy końcem sekwencji kodującej TcaBj-PT108 a startem rejonu kodującego TcaBii i brak wyróżnialnych miejsc wiązania rybosomów bezpośrednio przed rejonem kodującym TcaBii wskazują, że peptydy TcaBii i TcaBi są kodowane przez jedną otwartą ramkę odczytu złożoną z 3567 par zasad, zaczynającą się od nukleotydu 16 wSEQ ID NO:25 i najprawdopodobniej pochodzącą z jednego pierwotnego transkryptu zbudowanego z 1189 aminokwasów (131,586 daltonów, ujawniona tutaj jako SEQ ID NO:26) w wyniku po-translacyjnego cięcia. Jeśli aminokwas bezpośrednio poprzedzający N-końcowy polipeptyd TcaBii jest C-końcowym aminokwasem peptydu TcaB; to przewidywana masa TcaBii (627 aminokwasów) wynosi 70 814 daltonów (ujawniony tutaj SEQ ID NO:28), nieco więcej niż obserwowana wielkość w analizie SDS-PAGe (68 kDa). Peptyd ten będzie kodowany przez nieprzerwany ciąg 1881 par zasad (ujawniony tutaj jako SEQ ID NO:27). Uważa się, że natywny C-koniec TcaB; leży nieco bliżej do C-końca TcaBi-PT108. Masa cząsteczkowa PT108 [3 438 kDa; określona analizą sekwencji aminokwasowej tego peptydu] przewidywała jego wielkość na 30 aminokwasów. Posługując się wielkością tego peptydu do określenia C-końca regionu kodującego TcaBi (Glu w pozycji 604 w SEQ ID NO:28] otrzymano wielkość TcaB; wynoszącą 604 aminokwasy lub 68 463 daltony wysoce zgodnie z obserwacjami eksperymentalnymi.
Translacja rejonu o długości 1686 par zasad kodującego peptyd TcaBii (ujawniony tutaj jako SEQ ID NO:29) daje białko o 562 aminokwasach (ujawnione tutaj jako SEQ ID NO:30) z przewidywaną masą 60 789 daltonów w znacznej mierze zgoodną z obserwowaną masą 61 kDa.
Przypuszczalne miejsce wiązania rybosomu (zasady 3633-3638) znaleziono 48 par zasad przed kodonem stop dla otwartej ramki odczytu dla tcaB. Zasady 3645-3677 kodują Nkoniec peptydu TcaC (ujawniona jako SEQ ID NO.2). Otwarta ramka odczytu rozpoczynająca się tym N-końcowym peptydem ciągnie się nieprzerwanie do zasady 6005 (2361 par zasad, ujawniona tutaj jako pierwsze 2361 par zasad SEQ ID NO.31). Gen (tcaC) kodujący cały peptyd TcaC (przybliżona wielkość ~165 kDa; ~1500 aminokwasów) obejmowałaby około 4500 par zasad.
Kolejny izolat zawierający sklonowane fragmenty EcoRI z kosmidu 26A5, E20.6 był również zidentyfikowany przez jego homologię do wcześniej wspomnianych sond GZ4 i TcaBji Analiza w żelu agarozow^ym po trawieniu EcoRI DNA plazmidu przenoszonego przez ten szczep (pDAB2004, fig. 2), ujawniła wbudowane fragmenty o oszacowanej wielkości 2,9, 5 i 3,3 tyś. par zasad. Analiza sekwencji DNA zapoczątkowywana ze starterów zaprojektowanych w oparciu o sekwencję plazmidu pDAB2002 ujawniła, że 3,3 tyś par zasad fragmentu EcoRI pDAB2004 jest zlokalizowana w sąsiedztwie fragmentu EcoRI o wielkości 5 tyś. par zasad obecnego w pDAB200)2. Licząca 2361 par zasad otwarta ramka odczytu odkryta w pDAB2002 ciągnie się nieprzerwanie przez kolejnych 2094 zasad w pDAB2004 (ujawnione tutaj jako pary zasad 2362 do 4458 w SEQ ID nO:31). Analiza sekwencji DNA z użyciem jako matrycy DNA wyjściowego kosmidu 26A5 potwierdziła ciągłość otwartej ramki odczytu. Podsumowując otwarta ramka odczytu (TcaC SEQ ID NO:31) zawiera 4455 par zasad i koduje białko (TcaC) o 1485 aminokwasach (ujawnione tutaj jako SEQ ID NO:32). Obliczona masa cząsteczkowa 166,214 daltonów jest w zgodzie z oszacowaną wielkością peptydu TcaC (165 kDa), również otrzymana sekwencja aminokwasowa pasuje dokładnie do ujawnionej dla TcaC sekwencji N-końcowej (SEQ ID NO:2).
Brak wśród odkrytych sekwencji aminokwasowych sekwencji odpowiadającej SEQ ID NO: 17; użytej do projektowania zdegenerowanej puli oligonukleotydów na startery wykazuje że wytwarzanie produktów PCR® znalezionych w izolatach GZ4 i HB14, które zostały użyte
186 242 jak sondy w początkowym badaniu biblioteki były szczęśliwie wytworzone dzięki inicjowaniu przez jeden ze zdegenerowanych starterów syntezy komplementarnej nici w kierunku przeciwnym niż oczekiwano. Co więcej pochodna sekwencja białka nie zawiera wewnętrznego fragmentu ujawnionego tutaj jako SEQ ID NO: 18. Sekwencje te ujawniają, że plazmid pDAB2004 zawiera kompletny region kodujący peptyd TcaC.
Przykład IX
Przeszukiwanie biblioteki genów Photorhabdus w poszukiwaniu genów kodujących peptyd TcbAii.
Przykład ten opisuje metody wykorzystane do identyfikacji klonów DNA zawierających geny kodujące peptyd TcbAjj, izolację tego genu i częściowe określanie jego sekwencji DNA.
Startery i reakcje PCR.
Polipeptyd TcbAi wchodzący w skład aktywnego preparatu przeciw owadziego ma masę ok. 206 kDa. Sekwencja aminokwasowa N-końca tego peptydu jest załączona do opisu wynalazku jako SEQ ID NO 1. Zaprojektowano i zsyntezowano cztery pule zdegenerowanych starterów oligonukleotydowych (tzw. „zgodne startery”: TH-4, TH5, TH-6 i TH-7), odpowiadających części opisanej sekwencji aminokwasowej. Syntezę prowadzono metodami opisanymi w Przykładzie VIII, sekwencję zaprojektowanych starterów przedstawiono poniżej.
Tabela 11
Aminokwas Phe Ile Gln Gly Tyr Ser Asp Leu Phe
TH-4 5'-TT(T/C) ATI CA(AG) GGI TA(T/C) TCI GA(T/C) CTI TT-3'
TH-5 5'-TT(T/C) ATI CA(AG) GGI TA(T/C) AG(T/C) GA(T/C) CTI TT-3'
TH-6 5'-TT(T/C) ATI CA(AG) GGI TA(T/C) TCI GA(T/C) TT(A/G) TT-3'
TH-7 5'-TT(T/C) ATI CA(AG) GGI TA(T/C) AG(T/C) GA(T/C) TT(AG) TT-3'
Dodatkowo określono pierwszorzędową („a”) i drugorzędową („b”) sekwencję wewnętrznych fragmentów peptydu (TcbAii - PT81), sekwencje te umieszczono w opisie wynalazku odpowiednio jako SeQ ID NO 23 i sEq ID NO 24. Podobnie zaprojektowano i zsyntetyzowano cztery pule zdegenerowanych oligonukleotydów (tzw. „Odwrotne startery”: TH-8, TH-9, TH-10 iTH-11), których sekwencje nukleotydowe są komplementarne w stosunku do sekwencji nukleotydowych kodujących fragment peptydu, opisany tu jako SEQ ID NO 23. Sekwencję aminokwasową oraz sekwencję nukleotydową zaprojektowanych starterów przestawia poniższa tabela.
Tabela 12
Amino- kwas Thr Tyi· Leu Thr Ser Phe Glu Gln Val Ala Asn
TH-8 3'-TG] AT(AG) GAI TGI AGI AA(A/G) CT(T/C) GT(T/C) CAI CGI TT(G/A)-5'
TH-9 3'-TG] AT(AG) TT(AG) TGI AGI AA(AG) CT(T/C) GT(T/C) CAI CGI TT(G/A)-5'
TH-10 3'-TG] AT(AG) GAI TGI TC(G/A) AA(A/G) CT(T/C) GT(T/C) CAI CGI TT(G/A)-5'
TH-11 3'-TG] AT(AG) TT(AG) TGI TC(G/A) AA(A/G) CT(T/C) GTIT(T/C) CAI CGI TT(G/A)-5'
Zestawy tych starterów używano w reakcjach PCR®, mających na celu amplifikację fragmentów genu kodującego TcbAii pochodzącego z DNA genomowego Photorhabdus luminescens W-14, przygotowanego jak podano w Przykładzie VI. Wszystkie reakcje PCR przeprowadzano techniką „gorącego startu”, przy użyciu AmpliWax™ oraz innych odczynników i protokołów firmy Perkin Elmer. Standardowo, mieszaninę (objętość całkowita 11 pl) MgCl2, dNTP, 10 x bufor II GeneAmp® PCR i starterów dodawano do probówki zawierającej pojedynczą kulkę parafinową. (10 x bufor II GeneAmp® PCR składa się ze 100 mM Tris40
186 242
HCl, pH 8,3 i 500 mM KCl). Probówki podgrzewano do 80°C przez 2 min. i pozostawiono do schładzania. Po schłodzeniu, na wierzchnią warstwę parafiny nakładano roztwór zawierający 10 x bufor II GeneAmp PCR, matrycę DNA i polimerazę DNA AmpliTag®. Cykliczne zmiany temperatury powodowały stopienie warstwy parafiny i wymieszanie wszystkich składników mieszaniny, ostatecznie warunki reakcji były następujące (objętość 50 pl): 10 mM TrisHCl; pH 8,3; 50 mM KCl; 2,5 mM MgCL; 200 pM każdy z nukleotydów: dATP, dCTP, dGTP, dTTP; 1,25 mM puli starterów zgodnych i 1,25 mM puli starterów odwrotnych; 1,25 jednostek polimerazy DNA AmpliTaq i 170 ng matrycy DNA; całkowita objętość 50 pl.
Mieszaniny reakcyjne umieszczono w urządzeniu do cyklicznych zmian temperatury (jak w przykładzie VIII) i przeprowadzono następujący program reakcji PCR:
Tabela 13
Temperatura Czas Ilość cykli
94 °C 2 minuty 1x
94°C 15 sekund
55-65°C 30 sekund 30x
72°C 1 minuta
72°C 7 minut 1x
15°C Stały
Kolejne serie amplifikacji przeprowadzano używając pul zdegenerowanych starterów przy trzech różnych temp. połączenia starterów z matrycą (annealing) (55°C, 60°C, 65°C). W reakcjach, gdzie temp. annealingu wynosiła 65°C nie zaobserwowano, stosując elektroforezę w żelu agarozowym, powstawania jakichkolwiek produktów amplifikacji. W reakcjach, gdzie temp. annealingu wynosiła 60°C i użyto pul starterów TH-5 i TH-10 zaobserwowano powstawanie produktu amplifikacji 2,9 kpz. Mniejsza ilość produktu 2,9 kpz powstawała w mieszaninie reakcyjnej z udziałem starterów TH-7 i TH-10 w tych samych warunkach reakcji. Gdy temp. annealingu była równa 55°C, obecność w mieszaninie reakcyjnej tych samych par starterów prowadziła do powstania większej ilości produktu 2,9 kpz; ten sam produkt powstawał również w mieszaninach reakcyjnych, gdzie zastosowano pary starterów TH-5 i TH-8 oraz TH-5 i TH-11. Dodatkowo bardzo słabe pasma 2,9 kpz obserwowano gdy, podczas amplifikacji jako startery, zastosowano pary TH-7 z TH-8 lub TH-9, lub TH-10 lub TH-11.
Aby uzyskać ilość DNA wystarczającą do klonowania i sekwencjonowania przeprowadzono 10 odrębnych reakcji PCR, w których użyto starterów TH-5 i TH-10, warunki reakcji były takie jak opisano powyżej, temp. annealingu wynosiła 55°C. Wszystkie mieszaniny reakcyjne połączono, produkt 2,9 kpz wyizolowano z żelu agarozowego i oczyszczono zestawem Qiaex, metodą opisaną powyżej.
Dodatkowo określono sekwencje aminokwasowe wewnętrznych fragmentów peptydu TcbAi, przedstawione w opisie wynalazku jak SEQ ID NO 21 i SEQ ID NO 22. Jak opisano powyżej zaprojektowano i zsyntetyzowano pule zdegenerowanych nukleotydów (Odwrotne startery: tH-17 i TH-18), które są komplementarne w stosunku do sekwencji kodujących fragmentów sekwencji aminokwasowych tych peptydów.
186 242
Tabela 14
OO SEQ ID NO 21
Aminokwas Met Glu Thr Tln Asn Ile Tln Alu Pro
CH-17 3'-ΑΝΑ ACC/A ATI GTT/A TCA/G cni TCC/A TTC/A TG-5'
Tabela 15
Od SEQ ID NO 22
Aminokwas Asn Pro Ile Asn Ile Asn Chr Gly Ile Asp
CH-18 agi ATI TT(T/T) ani AA3N/G) agi CCI cni AC3Ν/G/-5'
ZOegeoerownoe dligonukledtyOy GH-18 iTH-17 wykorzystano w trakcie amplifikncji, gdzie jako matrycy użyto DNA Photorhabdus luminescens W-14 i starterów GH-4, TH-5, TH6 lub TH-7 t -ako 5'. ^>^^^<οΟτΝ)( starterów. W wyniku tych re^al^cji oh-zym-noo proolukty o wielkości odpowiednio około 4 kpz i 4,5 kpz. Otrzymane w wyniku amplifikacji DNA przenoszono z żeli -g-rozowych na filtry nylonowe i hyarydyzownod z wyznakowaną ^P sondą (metoda jnk opisano powyżej) przygotowaną z 2,9 kpz produktu uzyskanego w wyniku reakcji amplifikacji z zastosowaniem pary starterów GH-5 i gH-10. Ob- produkty, zarówno 4 kpz, jrk i 4,5 kpz silnie hybrydyzow-ły z sondą 2,9 kpz. Wyniki otrzymane w tych doświadczeniach wykorzystano do konstrukcji mapy przedstawiającej sekwencję DNA wewnętrznego fragmentu peptydu TcbA„ mnpn jest przedstawiona na fig. 3. Przybliżone odległości między starterami są określone ilością nukleotydów na fig. 3.
Sekwencja 2,9 kpz fragmentów DNA kodującego TcbA,,.
Około 200 ng oczyszczonego fragmentu 2,9 kpz (uzyskanego jak dpiynoo powyżej) strącono etanolem i rozpuszczono w 17 pl wody. Połowa tego preparatu została użyta j-ko matryca do sekweocjdodwania, jako startery zastosowano pulę starterów TH-5, - druga połowa preparatu posłużył- j-ko matryca do reakcji yekweocjdodwroia, gdzie starterem był- TH-10. Reakcje sekwencjdndwnnia przeprowadzono jak opisano w przykładzie VIII. W reakcji z pulą starterów TH-10 nie uzyskano jakiejkolwiek wiarygodnej sekwencji, ale w renkcji z pulą starterów TH-5 otrzymano sekwencję podaną poniżej:
AATCGTGTTG atgcctatac CGNGCCGGGT TCGGTGG/tTT CGATGTCCTC a/ggaaaaag^ 61 ta/ang aggg antmgtccg tgaagaccaa aaatgaaaag aaaaaaaatt antcaatcac 121 CT AG AT A A AC GTCGCCCGGT TCAAGGNNGT IAANTAATTG GGCAGGAAAT Ί///!?!/'/GA
131 gannttccac cgttagttct cacaattagc tatagtaaaa g aaaattcga antannncm n
241 aganncaaac naaccangac gatggactcc cagcaaact atcacccnaa cagagaann n
301 cattaccaac ncgacaacan ncagatccaa aannccaccc ataaacgcan nccnaaactn 361 GGAGATTGG
Na podstawie tej sekwencji zaprojektowano starter sekwencyjny (TH-21, 5'ACAGAgGcCGTTTATCTAGA-3'), który miał odwrócić komplementarne zasady 120-139 i umożliwił zapoczątkowanie polimeryzacji w kierunku 5' (tj. TH-5 koniec) fragmentu 2,9 kpz oczyszczonego w żelu, kodującego TcbCj, (uzyskanego w wyniku PCR). Określona sekwencja startera jest przedstawiona poniżej i jest pdróworoa Oo uzyskanej w wyniku analizy biochemicznej sekwencji N-końca peptyOu TcbAjj, SEQ ID NO 1.
Potwierdzenie sekwencji 2,9 aoz fragmentu TcbC^,, uzyskanego w renkcji PCR.
(Podkreślone aminokwasy = aminokwasy kodowane przez zOegenerowane oukledtyOy/ SEQ ID TO 1 FIOGYSDLF G - - A
I I I I I I I I I I I
2,9 kpz sekw AC ATG CAG GGG ATT TGT GTC ATG TTT GGT AAT AGT GCT
MQGYSDLFGMRA
186 242
Z homologii pomiędzy przewidywaną sekwencją aminokwasową, a sekwencją określoną metodami biochemicznymi, pewne jest, że fragment 2,9 kpz, uzyskany w reakcji PCR odpowiada regionowi kodującemu TcbAj,. Ten 2,9 kpz fragment został użyty (jako sonda w reakcji hybrydyzacji) do przeszukania biblioteki genomowej Photorhabdus W-14, przygotowanej jak opisano w przykładzie VIII, w poszukiwaniu kosmidu zawierającego gen kodujący TcbAi,.
Przeszukiwanie biblioteki kosmidowej Photorhabdus.
Powstały w wyniku reakcji PCR fragment 2,9 kpz wyizolowano z żelu i wyznakowano 32P używając zestawu do znakowania High Prime firmy Boehringer Mannheim, jak opisano w przykładzie VIII. Filtry, zawierające resztki około 800 kolonii (każdy) pochodzących z biblioteki kosmidowej przeszukiwano jak opisano w przykładzie VIII, klony pozytywne zostały poddane dokładnemu badaniu. W trakcie wielu etapów przeszukiwania i charakteryzacji 3 kolonie dawały wynik pozytywny (8A11, 25G8 i 26D1). Nigdy nie zaobserwowano jakiejkolwiek hybrydyzacji sondy specyficznej dla TcbAii z którymkolwiek spośród 4 kosmidów zidentyfikowanych w przykładzie VIII, które to kosmidy zawierają DNa kodujący geny tcaB i tcaC. dNa z kosmidów 8A11, 25G8 i 26D1 strawiono enzymami restrykcyjnymi Bgl2, EcoRI lub Hind3 (DNA trawiono każdym enzymem pojedynczo lub kombinacją enzymów). Fragmenty DNA powstałe w wyniku trawienia rozdzielono w żelu agarozowym, a następnie przeniesiono na błonę nylonową jak opisano w przykładzie VIII. Błonę tę następnie hybrydyzowano z 4,5 kpz fragmentem, wyznakowanym ^P (fragment 4,5 kpz uzyskano w wyniku amplifikacji genomowego DNA Photorhabdus przy użyciu starterów TH-5 i TH-17). Wyniki hybrydyzacji DNA kosmidów 8A11 i 26D1 były identyczne z wynikami hybrydyzacji tak samo trawionego DNA genomowego rozdzielonego w tym samym żelu i przeniesionego na taką samą błonę. Można zatem stwierdzić, że kosmidy 8A11 i 26D1 zawierają genomowe DNA, w obrębie którego znajduje się lokus kodujący TcbAu. Warto odnotować, iż kosmid 25G8 daje w wyniku trawienia Bgl2 tylko jeden fragment, który jest nieznacznie większy niż fragment powstający w wyniku trawienia DNA genomowego, może to wynikać z orientacji wstawki w obrębie wektora.
Sekwencja DNA genu kodującego tcbA.
Analiza hybrydyzacyjna DNA kosmidu 26D1 z sondą 4,5 kpz, ujawniła, że sonda hybrydyzuje z jednym dużym fragmentem EcoRI (większym, niż 9 kpz). Fragment ten wyizolowano z żelu i zligowano z plazmidem pBC KS (+) w miejscu EcoRI, tak jak opisano w przykładzie VIII, uzyskano w ten sposób plazmid pBC-S1/R1. Określono część sekwencji fragmentu DNA zligowanego z plazmidem, zastosowano tu metodę tzw. „primer walking (spacerowanie startera)”, przy sekwencjonowaniu zastosowano metody opisane w przykładzie VIII. Sekwencjonowanie rozpoczęto używając jako starterów oligonukleotydów komplementarnych do sekwencji wektora znajdujących się bezpośrednio za miejscem EcoRI, w które wligowano wstawkę. W dalszych etapach sekwencjonowania jako startery używano oligonukleotydy zaprojektowane na podstawie sekwencji DNA określonej w poprzednim etapie sekwencjonowania. Po porównaniu sekwencji DNa uzyskanej tą metodą z sekwencją DNA genu tcbA ustaloną innymi metodami (umieszczoną w niniejszym opisie jako SEQ ID NO 11, jak opisano w przykładzie XII, poniżej), stwierdzono istnienie całkowitej homologii między tymi sekwencjami na odcinku od 1 do 272 nukleotydów, od 319 do 826 nukleotydów, od 2578 do 3036 nukleotydów oraz od 3068 do 3540 (całkowita liczba nukleotydów w porównywanych sekwencjach wyniosła 1712). Stwierdzono, że oba te sposoby mogą być użyte do zidentyfikowania fragmentów DNA kodujących peptyd TcbAii.
Analiza przewidywanej sekwencji aminokwasowej kodowanej przez gen tcbA.
Sekwencja fragmentu DNA opisanego jako SEQ ID NO 11 koduje białko, którego przewidywana sekwencja aminokwasowa jest zamieszczona w niniejszym opisie jako SEQ ID NO 12. Szereg właściwości umożliwia identyfikację tego genu jako genu kodującego białko TcbA,,. N-końcowy peptyd TebAjj (SEQ ID No 1; Phe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn Arg Ala) jest kodowany jako aminokwasy od 88 do 100. Wewnętrzny fragment peptydu TcbAii czyli TcbAjj-PT81(a) (SEQ ID NO 23) koduje aminokwasy od 1571 do 1592. Co więcej wewnętrzny fragment TcbA„-PT56 (SEQ ID NO 22) koduje aminokwasy 1474-1488,
186 242 a fragment TcbAi,-PT103 (SEQ ID NO 24) koduje aminokwasy 1614-1639. Jest oczywiste, że gen ten jest z całą pewnością klonem kodującym peptyd TcbA,,, pochodzący z preparatyki owadobójczego białka szczepu W-14 Photorhabdus luminescens.
Białko wyizolowane jako peptyd TcbA,, powstaje na skutek cięcia dłuższego peptydu. Dowodów na to dostarcza stwierdzenie, że nukleotydy kodujące N-koniec peptydu TcbA,, (SEQ ID NO 1) są poprzedzone odcinkami 261 zasad (kodujących 87-mio aminokwasowy Nkoniec) wchodzących w obręb dłuższej otwartej ramki odczytu (SEQ ID NO 11). Ta ramka odczytu rozpoczyna się nukleotydami kodującymi sekwencję aminokwasowa (Met Gln Asn Ser Leu), która odpowiada sekwencji znajdującej się na N-końcu peptydu TcbA i jest umieszczona w niniejszym opisie jako SEQ ID NO 16. Uważamy, iż TcbA jest prekursorem białka TcbA,.
Pokrewieństwo genów tcbA, tcaB i tcaC.
Geny tcaB i tcbA są blisko związane i mogą ulegać translacji w postaci pojedynczego mRNA (przykład VIII). Gen tcbA odnaleziono w obrębie kosmidów, które nie zawierały zespołu genów tcaB i tacC, mimo to porównanie sekwencji aminokwasowej kodowanej przez geny tcaB i tcaC z genem tcbA ujawnia istnienie znacznego stopnia homologii. Przeprowadzone badania mające na celu określenie stopnia konserwowania sekwencji aminokwasowej (Porównanie białek - Protein Alignment Mode w programie komputerowym MacVector™ Sequence Analysis, zapis matrycy (scoring matrix), pam250, wartość szumów = 2; Kodak Scientific Imaging Systems, Rochester, NY), wyniki przedstawia fig. 4. Na każdej linii zapisu fig. 4 znak (A) oznacza homologię lub konserwowanie danej reszty aminokwasowej, znak (Y) oznacza brak homologii.
Analiza ta wykazuje, że sekwencja aminokwasowa peptydu TcbA w obrębie reszt AA 1739 do 1894 jest wysoce homologiczna do sekwencji aminokwasowej peptydu TcaB, na odcinku od 441 do 603 reszt AA (162 spośród wszystkich 627 aminokwasów P8, SEQ ID NO 28). Dodatkowo, sekwencja aminokwasowa TcbA na odcinku od 1932 do 2459 AA jest wysoce homologiczna do sekwencji TcaB, na odcinku od 12 do 531 AA (520 spośród wszystkich 562 AA, SEQ ID NO 30). Biorąc pod uwagę fakt, iż peptyd TcbA (SeQ iD NO 12) składa się z 2505 aminokwasów, spośród których 684 aminokwasów (27%) znajdujących się na C-końcu tego peptydu wykazuje homologię do peptydów TcaB; i TcaB,, homologię te są ułożone współliniowo względem ustawienia domniemanego prepeptydu TcaB (SEQ iD NO 26). Duża przerwa w obrębie homologii TcbA pokrywa się z istniejącym miejscem połączenia między częściami TcaB, i TcaB, w obrębie prepeptydu TcaB. Oczywistym jest, że produkty genów TcbA i TcaB są ewolucyjnie spokrewnione i proponujemy hipotezę, iż spełniają one podobną(e) rolę(e) u Photorhabdus.
Przykład X
Charakterystyka metaloproteaz cynkowych znajdujących się w pożywce hodowlanej Photorhabdus: hamowanie aktywności proteaz, ich klasyfikacja i oczyszczanie.
Badania mające na celu klasyfikację oraz określenie hamowania aktywności proteaz prowadzono wykorzystując jako substrat FITC-kazeinę rozpuszczoną w wodzie (końcowe stężenie w próbie 0,08%). Reakcje proteolizy prowadzono przez 2godz., w temp. 25°C w odpowiednim buforze i z dodatkiem 25 pl podłoża hodowlanego Photorhabdus (końcowa objętość reakcji 150pl). Próbki badano w obecności i przy braku DTT. Po zakończeniu inkubacji do próbki dodawano równą objętość 12% kwasu trójchlorooctowego, aby wytrącić białka, które nie uległy strawieniu. Strącenie prowadzono przez 0,5 godz.. Następnie próbę wirowano, po żwirowaniu z probówki pobierano 100 pl suprenatantu i umieszczano go w szalce mikrotitracyjnej z 96 dołkami, pH roztworu ustalano dodając do próbki równą objętość 4 M NaOH. Następnie obliczano stopień proteolizy przeprowadzając pomiary przy długościach fal: 485 nm (wzbudzenie) i 538 (emisja), stosowano fluorometryczny czytnik płytkowy Fluoroskan II. Aktywność proteaz badano w zakresie pH 5,0 - 10,0 w odstępach co 0,5 jednostki. Używano następujących buforów (stężenie końcowe każdego z nich 50 mM): octan sodu (pH 5,0 -6,5); Tris - HCl (pH 7,0 - 8,0); i bis-Tris propan (pH 8,5 - 10,0). Aby zidentyfikować klasy proteaz obecnych w próbie, pożywkę hodowlaną, nie poddaną wcześniejszej obróbce (tzw. surową), poddawano działaniu szeregu różnych inhibitorów proteaz (stęż. końcowe każdego
186 242 z nich wynosiło 0,5 μg/μl), a następnie badano aktywność proteaz przy pH 8,0, wykorzystując wcześniej opisany substrat. Używane w tym doświadczeniu inhibitory proteaz obejmowały: E-64 (L-trans-eksposkysakcynyloleucyloamido[4-,-guanidyno]-butan), 3,4 dichloroizokumarynę, Leupeptynę, peptsteinę, amastatynę.
Badania na aktywność proteaz przeprowadzone w szerokiej skali pH ujawniły, iż w próbach obecne były proteazy o maksymalnej aktywności przy pH 8,0 (Tabela 16). Dodatek DTT nie miał jakiegokolwiek wpływu na aktywność proteaz. „Surowe” pożywki hodowlane poddano następnie działaniu różnych inhibitorów proteaz (Tabela 17). Wynik tego doświadczenia wskazywał, iż 1,10-fenantrolina powodowała całkowite zahamowanie aktywności wszystkich proteaz, kiedy jej końcowe stężenie wynosiło 50 (tg, IC50 = 5(tg w 100 μ 12 mg/ml roztworu „surowej” pożywki hodowlanej. Wyniki te wskazują, że najliczniej występujące w pożywce hodowlanej Photorhabdus proteazy należą do klasy enzymów określonej jako metaloproteazy cynkowe.
Tabela 16
Wpływ pH na aktywność proteaz badaną po jednodniowej hodowli Photorhabdus luminescens (szczep W-14)
PH Jednostki fluorescencji* Aktywność# Procent
5,0 3013 ±78 17
5,5 7994 ± 448 45
6,0 12965 ±483 74
5,5 14390± 1291 82
7,0 14386± 1287 82
7,5 14135± 198 80
8,0 17582 ±831 100
8,5 16183 ±953 92
9,0 16795 ± 760 96
9,5 16279±1022 93
10,0 15225 ±210 87
* Jednostki fluorescencji (Maksimum ok. 28 000, tło ok. 2200) # Procent aktywności w odniesieniu do aktywności maksymalnej przy pH 8,0.
Tabela 17
Wpływ różnych inhibitorów proteaz na aktywność proteaz przy pH 8,0 po jednodniowej hodowli Photorhabdus luminescens (szczep W-14)
Inhibitor Właściwe jedn. fluorescencji3 Procent hamowaniab
1 2 3
Kontrola 13053 0
E-64 14259 0
1, 10fenantrolinac 15 99
3,4-dichloroizokumarynad 7956 39
Leupeptyn 13074 0
Pepstatync 13441 0
186 242 ciąg dalszy tabeli 17
1 2 3
Amastatyn 12474 4
Kontrola DMSO 12005 8
Kontrola metanolu 12125 7
a. Właściwe jednostki fluorescencji = jednostki fluorescencji - tło (2200 jedn.fluorescencji)
b. Procent hamowania w stosunku do aktywności proteazy przy pH 8,0
c. Inhibitory rozpuszczone w metanolu
d. Inhibitory rozpuszczone w DMSO
Wyizolowanie metaloproteaz cynkowych przeprowadzono nakładając osad uzyskany po strącaniu 10-80% siarczanem amonu, na kolumnę ze złożem Q Sepharose zrównoważoną 50 mM Na2PO4, pH 7,0, jak podano w Przykładzie V dla toksyny Photorhabdus (przed nałożeniem na kolumnę osad poddano dializie). Po intensywnym przemywaniu kolumny, białka toksyny wymywano stosując 0 - 0,5 M gradient NaCl. Większość aktywności biologicznej i białka uległo wymyciu we fakcjach 0,15 - 0,45 M NaCl, aczkolwiek, większość aktywności proteolitycznej było związane z frakcją 0,15 -0,25 M NaCl. Analiza SDS-PAGE frakcji 0,25 - 0,35 M NaCl wykazała istnienie głównego pasma odpowiadającego peptydowi o masie ok. 60 kDa. Frakcja 0,15 - 0,25 M NaCl zawierała to samo pasmo 60 kDa, jednak stężenie tego białka we frakcji było niższe. Następnie frakcję tę poddano filtracji wykorzystując kolumnę Superose 12 HR 16/50. W jej wyniku otrzymano główny sygnał dla białka o masie 57,5 kDa, który zawierał główny prążek (> 90% ogółu wyznakowanego białka) o masie 58,5 kDa, jak wykazała analiza SDS-PAGE. Dodatkowo badanie tej frakcji wykonane z użyciem różnych inhibitorów proteaz, prowadzone jak opisano powyżej, umożliwiło stwierdzenie, iż proteaza zawarta w tej frakcji jest metaloproteazą cynkową. Prawie cała aktywność proteazy obserwowana w jednodniowej pożywce hodowlanej Photorhabdus odpowiadała metaloproteazie cynkowej o masie ok. 58 kDa.
Przeprowadzono również izolację metaloproteaz cynkowych z trzydniowej pożywki hodowlanej Photorhabdus W-14, po izolacji aktywność tych proteaz analizowano wizualnie poprzez elektroforezę w żelu poliakrylamidowym w obecności siarczanu dodecylu (SDSPAGE), żel ten zawiera! żelatynę; elektroforezę prowadzono zgodnie z opisem przedstawionym w Schmidt T.M., Bleakley B i Nealson K.M., 1988. Żele rozdzielające (5,5 x 8 cm) zawierały 12,5% poliakrylamidu (roztwór podstawowy 40% akrylamid/bis-akrylamid, Sigma Chemical Co., St. Louis, MO, USA) do poliakrylamidu dodano żelatynę do stężenia końcowego 0,1%, całość rozpuszczono w wodzie. Żele zagęszczające (1,0 x 8 cm) zawierały 5% poliakrylamid z dodatkiem 0,1% żelatyny. Standardowo 2,5 pg białka, które poddawano elektroforezie rozpuszczono w 0,03 ml buforu SDS-PAGE, bez dodatku DTT i nanoszono na żel. Elektroforezę białek prowadzono w buforze dodecylosiarczanu sodu (Laemmli U.K., 1970, Nature 227, 680) w temp. 0°C, przy natężeniu prądu 8 mA. Po zakończeniu elektroforezy żel płukano przez 2 godziny w 2,5% (v/v) roztworze Tritonu X-100. Po zakończeniu płukania żel inkubowano w roztworze 0,1 M glicyny (pH 8,0) przez 1 godz. w temp. 37°C. Po inkubacji żele utrwalano i barwiono przez noc roztworem 0,1% czerni amidowej rozpuszczonej w mieszaninie metanol:kwas octowy:woda (30:10:60, v/v/v; Sigma Chemical Co.). Aktywność proteazy była widoczna jako świecące miejsca względem ciemnych, czerń amidowa wybarwia tło spowodowane proteolizą i następującą po niej dyfuzją wbudowanej żelatyny. Zaobserwowano co najmniej trzy oddzielne prążki, których pojawienie się jest związane z aktywnością proteolityczną, prążki te mają masę 58,41 i 38 kDa.
Pomiary aktywności różnych proteaz w trzydniowej pożywce hodowlanej szczepu W-14 przeprowadzono wykorzystując jako substrat kazeinę FlTC rozpuszczoną w wodzie (stęż. końcowe 0,02%). Doświadczenia związane badaniem aktywności proteolitycznej w różnych frakcjach białkowych przeprowadzono w 0,1 M Tris-HCl (pH 8,0) w temp. 37°C, przez 0 0,5 godz., objętość całkowita reakcji 0,15 ml. Reakcję kończono dodając do próby równą objętość 12% kwasu trój chlorooctowego (TCA), rozpuszczonego w wodzie. Po inkubacji prowadzonej w temp. pokojowej przez 0,25 godz., próbki wirowano 10 000 x g przez 0,25 godz.
186 242 i z mieszaniny reakcyjnej probioraio próbki po 0,110 im i umieszczzmo w szafie mikrotitracyjnee z 96 dołkami. Mieszaninę reakcyną neutralizowano dodając do niej równą objętość 2 M NaOH, a następnie mierzono fluorescencję używając płytkowego czytnika fluorometrycznego Fluoroskan II, wywołując wzbudzenie falą o długości 485 nm, a emisję 538 nm. Pomiary aktywności prowadzono używając kazeinę FITC i stosując różne stężenie proteazy w mieszaninie reakcyjnej, reakcję prowadzono w temp. 37°C przez 0-10 min. Jako jednostkę aktywności przyjęto ilość enzymu potrzebną do uzyskania 100 jednostek fluorescencji/min, a aktywność specyficzną, określano jako ilość jednostek/mg proteazy.
Badanie aktywności hamowania enzymów przeprowadzono używając dwa związki będące inhibitorami metaloproteaz cynkowych: 1,10 fenantrolinę i N-(aramnopiranozyloksyhydroksyfosfnyl)-Leu-Trp (fosforamidon), roztwory podstawowe tych inhibitorów były przygotowane odpowiednio w 100% etanolu i wodzie. Standardowe roztwory podstawowe to 10 mg/ml dla 1,10 fenantroliny i 5 mg/ml dla fosforamidonu, stęż. końcowe inhibitorów w próbie wynosiło 0,5 - 1,0 mg/ml. Dodanie do pożywki hodowlanej pochodzącej z trzydniowej hodowli W-14 1,10 fenantroliny, inhibitora wszystkich metaloproteaz cynkowych, prowadzi do całkowitego wyeliminowania jakiejkolwiek aktywności proteolitycznej. Podczas gdy dodanie fosforamidonu, inhibitora proteaz zbliżonych do termolizyn*^, prowadziło do obniżenia o ok. 56% aktywności proteolitycznej, pozostała aktywność proteolityczna nie ulegała obniżeniu nawet po dalszym podawaniu fosforamidonu.
Proteazy, pochodzące z pożywki hodowlanej, zebrano po 3 dniach hodowli Photorhabdus W-14, oczyszczono zgodnie z procedurą opisaną poniżej: 4,0 litry pożywki hodowlanej zagęszczono używając spiralnej wkładki ultrafiltracyjnej (spiral ultra filtration cartridge) Typ S1Y100 połączonej z urządzeniem filtrującym Amicon M-12. Przepływający materiał z białkami natywnymi o masie nie większej niż 100 kDa (3,8 litra) zagęszczono do objętości 0,375 l przy użyciu powyżej opisanego urządzenia. Uzyskany w ten sposób materiał zawierał białka o masie 10 - 100 kDa. Materiał ten wprowadzono na kolumnę HR 16/10 firmy Pharmacia, wypełnionej złożem Poros® 50 HQ firmy PerSeptive Biosystem (Framington, MA, USA), jest to złoże będące silnym wymieniaczem jonowym, zrównoważonym 10 mM buforem sodowo-fosforanowym (pH 7,0). Próbkę zawierającą białka wprowadzono na kolumnę z szybkością przepływu 5 ml/min., następnie aby usunąć białka, które nie związały się z kolumną przepłukiwano ją buforem (tym samym, który użyto do jej zrównoważenia), aż do momentu, gdy absorbancja otrzymanej frakcji przy λ, = 200 wynosiła 0.000.Następni e biaHa. które uległy związaniu z kolumną wymywano stosując gradient NaCl: 0 - 1,0 M NaCl przez 40 min i przy szybkości przepływu 7,5 ml/min. Uzyskane frakcje wypływu badano pod kątem aktywności proteaz, te w których zaobserwowano aktywność połączono razem. Połączone frakcje (aktywne proteolitycznie) rozcieńczono 50% (v/v) 10 mM buforem sodowofosforanowym (pH 7,0) i nałożono na kolumnę HR10/10 Mono Q, zrównoważoną 10 mM buforem fosforanu sodu. Po przemyciu kolumny tym samym buforem, aż do momentu, gdy absorpcja wypływu A280 = 0,00, białka wymywano stosując gradient NaCl: 0 - 0,5 M NaCl w ciągu 1 godz. z szybkością przepływu 2,0 ml/min. Otrzymane frakcje wypływające z kolumny badano pod kątem aktywności proteaz. Frakcje charakteryzujące się najwyższą aktywnością proteaz wrażliwych na fosforanidop połączono, wrażliwość na fosforamidon związana jest z obecnością frakcji proteaz 41-38 kDa. Stwierdzono, że frakcje te ulegają wymyciu przy zastosowaniu 0,14 - 0,25 M NaCl. Zebrano również i połączono frakcje charakteryzujące się aktywnością proteazy niewrażliwej na działanie fosforamidonu, jest to proteazą o masie 58 kDa. Stwierdzono, że frakcje te są wymywane przy zastosowaniu 0,25 - 0,35 M NaCl. Frakcje zawierające proteazę wrażliwą na fosforanidop zostały zagęszczone do objętości 0,75 ml przy użyciu filtra Biomax-5K NMW1 w urządzeniu do filtrowania wirówkowego Millipore Ultracfree-15. Tak zagęszczoną frakcję nałożono z szybkością 0,5 ml/min na kolumnę HR 10/30 firmy Pharmacia, która została wypełniona złożem Sephadex G-50 firmy Pharmacia i zrównoważona 10 mM buforem fosforanu sodu (pH 7,0)//0,1 M NaCl. Frakcje mające najwyższą aktywność proteazy wrażliwej na fosforamidon zebrano i żwirowano przy użyciu błony Biomax-5K NMW1 w urządzeniu do filtrowania wirówkowego Millipore Ultracfree-15. Analiza aktywności proteolitycznej wykazała, że frakcja ta charakteryzowała się
186 242 tylko aktywnością proteazy wrażliwej na fosforamidon.. Proteazę o masie 58 kDa uzyskano łącząc frakcje wykazujące aktywność proteaz na fosforamidon i zagęszczając je przy użyciu błony Biomax-5K NMW1 w urządzeniu do filtrowania wirówkowego Millipore Ultracfree-15, a następnie uzyskany w ten sposób materiał poddając rozdziałowi na kolumnie Superdex-75 firmy Pharmacia. Uzyskane z kolumny frakcje zawierające proteazę o masie 58 kDa połączono.
Analiza oczyszczonych proteaz o masie 58 i 41 - 38 kDa ujawniła, że aktywność obu typów proteaz ulegała całkowitemu zahamowaniu w obecności 1,10 fenantroliny, ale tylko frakcja 41-38 kDa ulegała zahamowaniu pod wpływem fosforamidonu. Dalsza analiza pożywki hodowlanej wykazał, że aktywność proteaz obecnych w tej pożywce po jednym dniu hodowli szczepu W-14 stanowi 23% aktywności proteaz 41-38, i wrasta do 44% w pożywce hodowlanej po 3 dniach hodowli W-14.
Przeprowadzono standardową analizę SDS-PAGE aby ustalić czystość białek i określić sekwencję N-końca. Doświadczenie przeprowadzono wykorzystując 4-20% gradient MiniPlus SeprGel firmy Integrated Separation System (Natic, MA, USA). Białka, które miały zostać poddane analizie sekwencji N-końca przeniesiono po oczyszczeniu na błonę PVDF, infra. (ProBlott Membranes; Applied Biosystems, Foster City, CA, USA), wybarwiono przy użyciu 0,1% czerni amidowej, fragmenty błony zawierające białka wycięto i przesłano do zsekwencjonowania do Cambridge Prochem, Cambridge, MA, USA.
Sekwencje N-końca proteazy 58 kDa (SEQ ID NO 45) oraz proteazy 41-38 kDa (SEQ ID NO 44) były następujące: SEQ ID NO 45: DV-GSEKANEKLK i SEQ ID NO 44: DSGDDDKVTNTDIHR. Wszystkie proteazy pochodziły z trzydniowej pożywki hodowlanej.
Sekwencjonowanie proteazy 41-38 kDa ujawniło istnienie szeregu różnych N-końców, każdy z nich miał usunięty na drodze proteolizy aminokwas znajdujący się na N-końcu. Badanie pierwszo-, drugo-, trzecio- i czwartorzędowej struktury polipeptydów 38 i 41 kDa umożliwiło uzyskanie sekwencji przedstawionej powyżej i ujawniło homologię tych dwu proteaz.
Przykład XI, Część A
Przeszukiwanie biblioteki genomowej Photorhabdus z użyciem przeciwciał przeciw genom kodującym peptyd TcbA.
Równolegle z sekwencjonowaniem opisanym powyżej, przeprowadzono odpowiednie wykonywanie sond i sekwencjonowanie oparte na peptydzie TcbAi, (SEQ ID NO 1). Sekwencjonowanie to przeprowadzono przygotowując bakteryjne pożywki hodowlane i oczyszczając znajdującą się w nich toksynę, tak jak opisano w przykładach I i II.
DNA genomowe wyizolowano ze szczepu W-14 Photorhabdus luminescens hodowanego na pożywce Grace'a do hodowli kultur tkankowych. Bakterie hodowano w 5 ml pożywki hodowlanej w 250 ml erlenmayerce w temp. 28°C przez ok. 24 godziny, stosując wstrząsanie 250 obr/min. Komórki bakterii pochodzących ze 100 ml pożywki hodowlanej żwirowano 5000 x g przez 10 min. Supematant odrzucono, a osad komórek bakteryjnych użyto do izolacji DNA genomowego.
DNA genomowe wyizolowano stosując zmodyfikowaną metodę CTAB opisaną w rozdziale 2.4.3 Ausubel (supra.). Izolację prowadzono zgodnie z metodą opisaną w rozdziale pt. „Large Scalę CsCl prep of bacterial genomie DNA” (Preparatyka bakteryjnego genomowego DNA metodą CsCl na dużą skalę), aż do punktu 6. Na tym etapie izolacji przeprowadzono dodatkową ekstrakcję mieszaniną chloroform:alkohol izoamylowy (24:1), następnie ekstrakcję mieszaniną fenol:chloroform:alkohol izoamylowy (25:24:1) i jeszcze raz ekstrakcję mieszaniną chloroform:alkohol izoamylowy (25:2). DNA strącono dodając 0,6 objętości izopropanolu. Strącony DNA nawinięto na koniec szklanej pałeczki, przeniesiono na krótko do 70% etanolu (ostatnie płukanie) i zawieszono w 3 ml buforu TE. Stężenie DNA w roztworze oznaczono mierząc gęstość optyczną roztworu przy długości fali 260/280 nm, wynosiło ono ok. 2 mg/ml.
Wykorzystując tak uzyskane DNA genomowy, skonstruowano bibliotekę genomową. Ok. 50 pg DNA genomowego zostało poddane częściowemu trawieniu przy użyciu enzymu Sau 3AI. Uzyskane w wyniku tego trawienia fragmenty DNA poddano wirowaniu w gradiencie gęstości NaCl. Frakcje zawierające fragmenty DNA o przeciętnej wielkości 12 kpz, lub większe zligowano z plazmidem BluScript, Stratagene, La Jolla, Kalifornia, USA (wielkość fragmentów DNA w danej frakcji sprawdzono elektroforetycznie w żelu agarozowym).
186 242
Tak otrzymane plazmidy z wligowanym DNA genomowym transformowano do komórek E. coli szczepów DH5a lub DHB10. Równolegle uzyskano przeciwciała. Oczyszczone próbki białek przysłano do biotechnologicznego centrum hybrydom w University of Wisconsin, Madison, USA. Posłużyły one do produkcji przeciwciał monoklonalnych skierowanych przeciwko tym białkom. Przesłane próbki zawierały frakcje z prążkami 1 i 2, oczyszczone metodą HPLC, które zostały zdenaturowane w temp. 65°C i których porcję, po 20 pg wstrzyknięto czterem myszom. Stabilne linie komórkowe hybryd produkujących przeciwciała monoklonalne uzyskano po fuzji komórek trzustki pochodzącym z nieimmunizowanych myszy ze stabilną linią komórek szpiczaka. Przeciwciała monoklonalne uzyskiwano z powstałych hybryd.
Równolegle uzyskano przeciwciała poliklonalne immunizując króliki rasy New Zeland przy użyciu białka z prążka 1 (patrz Przykład I) wyizolowanego z żelu agarozowego, krótko ogrzewając agarozę do temp. 65°C i natychmiast uzyskaną tak agarozę mieszając z adjuwantem. Do pierwszych immunizacji używano pełnego adjuwanta Freunda, do następnych 3 dodatkowych wstrzyknięć następujących co miesiąc użyto niepełnego adjuwanta Freunda. Każde podanie białka przeprowadzono następująco: królikowi w okolicę karku podskórnie wstrzykiwano ok. 0,2 ml zemulgowanego prążka 1, zawierającego około 50 do 100 ng białka. Po 10 dniach od ostatniego zastrzyku pobierano surowicę królika, dodatkowe skrawienie przeprowadzano jeszcze przez 3 tygodnie, w odstępach tygodniowych. Surowicę inaktywowano ogrzewając przez 15 min. w temp. 56°C, a następnie przechowując w temp. -20°C.
Tak uzyskane przeciwciała monoklonalne i poliklonalne zostały następnie użyte do przeszukania biblioteki genomowej pod kątem ekspresji antygenów, które mogą być wykryte przez epitopy. Klony dające reakcję pozytywną były wykrywane na filtrach nitrocelulozowych zawierających resztki kolonii. Analizę tych klonów przeprowadzono metodą immunoblotingu.
Analiza klonów przeprowadzona metodą immunoblotingu i biotu Southema doprowadziła do wstępnej identyfikacji 5 klas klonów.
Pierwsza klasa klonów zawierała gen kodujący peptyd oznaczony tu jako TcbA,,. Uzyskano pełną sekwencję DNA tego genu (TcbA). Jest ona opisana jako SEQ ID NO 11. Potwierdzenie, że sekwencja ta (SEQ ID NO 11) koduje w swym obrębie sekwencję oznaczoną jako SEQ ID NO 1 uzyskano wykazując obecność SEQ Id NO 1 od aminokwasu nr 88 w obrębie opisanej sekwencji aminokwasowej stworzonej przez otwartą ramkę odczytu SEQ ID NO. 11. Może być to potwierdzone w odniesieniu do SEQ ID NO 12, która jest opisaną sekwencją aminokwasową stworzoną przez SEQ ID NO 11.
Druga klasa toksycznych peptydów zawiera fragmenty opisane powyżej jako TcaB„ TcaBii i TcaC. Po przeszukaniu biblioteki genomowej przy wykorzystaniu surowicy poliklonalnej, tę drugą klasę genów toksyn zidentyfikowano jako szereg klonów, które produkowały białka o różnych masach cząsteczkowych, jednak wszystkie te białka ulegały reakcji krzyżowej z przeciwciałem poliklonalnym, dodatkowo stwierdzono, stosując błot Southema, że między klonami tymi istnieje duża homologia DNA. Porównanie sekwencji ujawniło, że należały one do kompleksu genomowego opisanego powyżej jako TcaB i TcaC.
Stosując przeciwciała poliklonalne wyizolowano również trzy inne klasy klonów reagujące z przeciwciałami przeciwko toksynom. Klasy te produkowały białka, które ulegały reakcji krzyżowej z przeciwciałem poliklonalnym i również wykazywały homologię DNA, co określono metodą biotu Southema. Klasy te oznaczono jako klasa III, klasa IV i klasa V. Możliwym było również zidentyfikowanie przeciwciał monoklonalnych, które ulegały reakcji krzyżowej z klasą I, II, III, IV, co sugeruje, że istnieją regiony silnej homologii pomiędzy białkami tych klas. Tak więc wydaje się, że geny kodujące białka wydzielane pozakomórkowo przez P.luminescens reprezentują rodzinę genów, które są ze sobą ewolucyjnie spokrewnione. Podążąjąc tym tropem, mogą istnieć ewolucyjnie pokrewne zmiany w obrębie toksycznych peptydów tego organizmu. W celu zbadania innych szczepów P.luminescens pod kątem obecności „pokrewnych” białek zastosowano dwa różne podejścia. Przeprowadzono badanie na drodze amplifikacji metodą PCR DNA genomowego, jak i immunoblotingiem z wykorzystaniem przeciwciał poliklonalnych i monoklonalnych. Uzyskane wyniki wskazują, iż pokrewne białka są produkowane u następujących szczepów P. luminescens: WX-2, WX-3, WX-5, WX-6, WX-7. WX8, WX-11, WX-12, WX-15 i W-14. '
186 242
Przykład XI, Część B
Sekwencja i analiza toksyn klonów klasy III - tcc
Plazmidy wyizolowane z klasy ΙΠ klonów E. coli i jak opisano w przykładzie XI, część A, poddano sekwencjonowaniu. Sekwencja nukleotydowa wykazała istnienie w tym locus genomowym trzech blisko związanych otwartych ramek odczytu. Locus ten określono jako tcc, zawiera on 3 ORF (otwarte ramki odczytu) określone jako tccA, SEQ ID NO 56; tccB, SEQ ID NO 58 i tccC, SEQ ID NO 60 (fig. óB). Sekwencja aminokwasowa określona na podstawie ORF tccA wskazuje, że gen ten koduje białko o masie 105.459 Da. Białko to określono jako TccA. Pierwsze 12 aminokwasów tego białka odpowiada sekwencji N-końca uzyskanej dla białka 108 kDa, SEQ ID NO 7, wcześniej opisanego jako część kompleksu toksycznego.
Sekwencja aminokwasowa określona na podstawie ORF tccB wskazuje, że gen ten koduje białko o masie 175 716 Da. Białko to określono jako TccB. Pierwsze 11 aminokwasów tego białka odpowiada sekwencji N-końca opisanej dla białka o masie cząsteczkowej 185 kDa, SEQ ID NO 8.
Sekwencja aminokwasowa tccC wskazuje, że ta otwarta ramka odczytu koduje białko o masie 111.694 Da, białko to określono jako TccC.
Przykład XII
Charakterystyka szczepów Photorhabdus
Aby potwierdzić, iż kolekcja szczepów opisana w niniejszym zgłoszeniu jest kolekcją szczepów Photorhabdus zbadano szereg cech mikrobiologicznych tych szczepów; cech które są charakterystyczne dla Photorhabdus i odróżniające je od Enterobacteriaceae i Xenorhabdus syp?. Charakterystyka Photorhabdus jest następująca: są to pałeczki nie barwiące się odczynnikiem Grama pojedyncza komórka ma rozmiary 0,5 - 2 pm szerokości i 2-10 pm długości, tworzą kolonie o barwie czerwonej lub żółtej; w komórkach obserwuje się występowanie krystalicznych ciałek inkluzyjnych, zawierają katalazę, są niezdolne do redukcji azotanów, wykazują bioluminescencję, pobierają barwnik z podłoża hodowlanego, wytwarzają proteazy, zakres temperatur w których obserwuje się wzrost jest poniżej 37°C, są zdolne do przeżycia w warunkach beztlenowych; komórki mają zdolność ruchu. Właściwości te podsumowano i przedstawiono w tabeli 18. We wszystkich prowadzonych badaniach jako kontroli używano szczepów Photorhabdus, Xenorhabdus i E. coli. Wyniki testów pozwoliły na stwierdzenie, że wszystkie badane szczepy należały do rodziny Enterobacteriaceae i rodzaju Photorhabdus.
Aby zbadać bioluminescencję każdego szczepu i określić względnie, i ilościowo produkcję światła przeprowadzono pomiary z użyciem luminometru. W doświadczeniu, w którym określono względną produkcję światła, mierzono ilość jednostek światła emitowanych przez hodowlę szczepu (zawierającą zarówno pożywkę hodowlaną jak i komórki bakterii), pomiary prowadzono w 6, 12 i 24 godzinie hodowli (licząc od momentu założenia hodowli płynnej) wyniki porównywano z luminescencją tła (pożywka hodowlana nie zaszczepiona bakteriami i woda). Przed przeprowadzeniem pomiarów emisji światła w każdej z badanych hodowli, określano gęstość hodowli, pomiary prowadzono mierząc absorbancję światła przy długości fali 560 nm używając spektrofotometru Gilford Systems (Oberlin, OH, USA) używając naczynia przepływowego (sipper celi). Po określeniu zagęszczenia komórek bakteryjnych w hodowli przed przystąpieniem do pomiarów luminescencji każdą hodowlę rozcieńczano tak, aby jej gęstość optyczna = 1,0. Następnie z rozcieńczonej hodowli pobierano próbki i umieszczano w kuwetach (po 300 pl), pomiar przeprowadzano przez 45 sek używając luminatora Bio-Orbit 1251 (Bio-Orbit Oy, Twiku, Finland). Podczas pomiaru próbki przez cały czas mieszano zapewniając im w ten sposób ciągłe natlenienie. Za wynik pozytywny tego doświadczenia uważano sytuację gdy luminescencją badanej hodowli była większażrówna od pięciokrotnej wartości luminescencji tła (luminescencją tła 5 - 10 jednostek). Dodatkowo luminescencję kolonii bakteryjnych mierzono używając warstwy klisz fotograficznych. Barwienie każdego szczepu metodą Grama przeprowadzono używając handlowo dostępnych zestawów do znakowania (BBL, Cockeysville, MD, USA), porównując wyniki z obrazami kontrolnymi (Fisher Scientific, Pittsburgh, PA, USA). Badania mikroskopowe prowadzono używając mikroskopu Zeissa (Carl Zeiss, Niemcy), stosowano powiększenie 100 x i obiektywy wymagające oleju immersyjnego (10 x powiększenie okularu i 2 x powiększenie mikroskopu).
186 242
Dokładne badania mikroskopowe komórek każdego szczepu mające na celu ustalenie ich rozmiarów, ich kształtu i występowania ciałek inkluzyjnych przeprowadzono używając preparatów kropli wiszącej (10 x powiększenie okularu i 2 x powiększenie mikroskopu i 40 x powiększenie obiektywu) z użyciem oleju immersyjnego i mikroskopu kontrastu fazowego zaopatrzonego w mikrometr™ w temp. 28°C. Test na obecność katalazy przeprowadzono następująco: kolonię badanego szczepu pobierano małą szpatułką, z powierzchni agaru odżywczego, na której rosły i umieszczano w szklanej probówce, następnie po ściance probówki delikatnie nalewano 1 ml wody utlenionej. Jeżeli kolonia produkowała katalazę, natychmiast lub w ciągu 5 sek. od dodania wody utlenionej obserwowano pojawianie się dużej ilości pęcherzyków gazu (najprawdopodobniej tlen). Jako kontrolę przeprowadzono ten sam test używając agaru odżywczego, na którym nie prowadzono hodowli mikroorganizmów i wody utlenionej. Test na redukcję azotanów: 10 ml pożywki Bacto Nitrate Broth (Difco Laboratories, Detroit, MI, USA), zaszczepiono próbką badanego szczepu. Hodowlę prowadzono przez 24 godziny w temp. 28°C, powstawanie azotynów badano dodając do probówki 2 krople kwasu sulfanilowego i 2 krople alfa-naftylaminy (Difco Manual wyd. X, Difco Laboratories, Detroit MI, USA, 1984). Powstające zabarwienie hodowli na kolor różowy lub czerwony świadczy o powstawaniu azotynów z azotanów. Zdolność każdego szczepu do pobierania barwnika z podłoża hodowlanego badano prowadząc hodowle na następujących podłożach: Bacto agar MacConke/a zawierający czerwień obojętną; Bacto Tergitol-7 agar zawierający błękit bromotymolowy i Bacto EMb Agar zawierający eozynę-Y (agar pochodził z Difco Laboratories, Detroit, MI i przygotowywany był zgodnie z poleceniami producenta). Po zaszczepieniu podłóż hodowlę prowadzono przez 5 dni w temp. 28°C, po tym czasie badano pobieranie barwników. Wzrost na tych podłożach jest cechą charakterystyczną gatunków należących do rodziny Enterobacteriaceae. Ruchliwość komórek każdego szczepu badano wykorzystując pożywkę Bacto Motility Test (Difco Laboratories, Detroit, MI) przygotowywaną zgodnie z poleceniami producenta. Podłoże zaszczepiano nanosząc punktowo niewielkie inokulum badanego szczepu, zdolność do ruchu komórek tego szczepu oceniano makroskopowo, mierząc rozwój strefy wzrostu pochodzącej od miejsca zaszczepienia. W wielu przypadkach zdolność do ruchu komórek badano również mikroskopowo, przygotowując z hodowli płynnej mokry preparat kropli wiszącej. Wymagania pokarmowe każdego szczepu zbadano używając BBL, Enterotube II (Benton, Dickinson, Niemcy). Doświadczenie prowadzono według instrukcji podanej przez producenta, wyjątkiem były zastosowane warunki inkubacji: 28°C, 5 dni. Otrzymane wyniki były całkowicie zgodne z wcześniej publikowanymi danymi uzyskiwanymi dla Photorhabdus. Wydzielanie proteazy sprawdzano określano na postawie hydrolizy żelatyny, zastosowano jako podłoże żelatynę Bacto (Difco Laboratories, Detroit, MI, USA), które przygotowywano zgodnie z zaleceniami producenta. Hodowlę prowadzono przez 5 dni, w temp. 28°C. Aby zbadać wzrost szczepów w różnych temperaturach szalki agarowe (2% pepton albumozy #3 z dodatkiem 2% Bacto-Agaru (Difco Laboratories, Detroit, MI, USA) w wodzie dejonizowanej), zaszczepiono inokulum. Szalki uszczelniono taśmą Nesco® i inkubowano w temp. 20, 28 i 37°C przez 3 tygodnie. Szalki, na których nie obserwowano wzrostu w temp. 37°C przenoszono do temp. 28°C i hodowano przez tydzień, jednak komórki pobrane z tych szalek nie wykazywały jakiejkolwiek zdolności do ruchu. Wymagania tlenowe szczepów Photorhabdus badano zaszczepiając inokulum płynną pożywkę hodowlaną zawierającą tioglikolan (Difco Laboratories, Detroit, MI, USA). Próbki inkubowano w temperaturze pokojowej przez tydzień, po upływie tego czasu określono typ i szybkość wzrostu. W hodowlach zastosowano jako wskaźnik resazurin (Difco Manual, Wydanie X, Difco Laboratories, Detroit, MI, USA), który informuje o poziomie natlenienia pożywki hodowlanej lub występowaniu stref aerobowych (Difco Manual, Wydanie X, Difco Laboratories, Detroit, MI, USA). Wielkości stref wzrostu uzyskane dla poszczególnych szczepów Photorhabdus były podobne do wielkości stref wzrostu charakterystycznych dla fakultatywnych anaerobów.
186 242
Tabela 18
Cechy taksonomiczne szczepów Photorhabdus Zbadane cechy
Szczep A B c D E F G H I J K L M N 0 P Q
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
W-14 - + + + rd S 4- + + + o 4- + + 4- + + 2
WX-1 + + rd S + + + 4- o + + 4- + + + 2
WX-2. + + rd s 4- + + 0 4- + 4- + + + 2
WX-3 - -1- + rd + - 4- + + YT 4- + + + _ + + -
Γ
WX-4 - 4- + rd + - 4- + + YT + + + + + + -
s
WX-5 - + + rd + - + + + LO + + + + + + -
Γ
WX-6 - + + rd + - + + + LY + + + + - - -
- s
WX-7 4- + rd S 4- + + + R + + + + + + -
WX-8 - + + rd + - + + + 0 + + + + + + -
S~
WX-9 + 4- rd + - + + YT + + + + + + -
S
WX-10 - + + rd + - + + 4- Ro + + + + + + -
Ś~
WX-11 - + + rd -i- - + + 4- Ro + + + + + + -
s
WX-12 - + + rd S 4- + + 4“ O + 4- + + 4- + -
WX-14 + + rd + - 4- + + LR -i- 4- 4- 4- + -
- ś~
WX-15 4- 4- rd + - -t- + + LR -t- + 4- + + + -
ś~
H9 - 4- + rd S 4- + -r + LY + + + + 4- +
Hb + + rd + - 4- + + YT + + 4- + + + -
s
Hm - + + rd s 4- + + 4- TY + + + 4- + + -
HP88 - + + rd Ś” + - -l· 4- + LY + + + -h 4- + -
NC-1 + + rd s + - + + + O + 4- + 4- + 4-
186 242 ciąg dalszy tabeli 18
W30 rd
S
YT
WIR
B2
43948
43949
43950 rd rd
S~ rd
S~ rd
S rd s
RO
43951
43952 rd rd
A = barwienie metodą Grama, B = krystaliczne ciałka inkluzyjne, C = bioluminescencja, D = kształt komórki, E = zdolność komórek do ruchu, F = redukcja azotanów, G = produkcja katalazy, H = hydroliza żelatyny, I = pobieranie barwnika, J = kolor kolonii, K = wzrost na agarze EMB, L = wzrost na agarze MacConkeya, M = wzrost na agarze Tergitol-7, N = fakultatywny anaerob, O = wzrost w temp. 20°C, P = wzrost w temp. 28°C, Q = wzrost w temp. 37°C, f +/- = pozytywny lub negatywny wynik testu, rd = pałeczki, s = wielkość komórek mieści się w granicach charakterystycznych dla tego rodzaju, RO = czerwono-pomarańczowa, LR = lekko czerwona, R = czerwona, O = pomarańczowa, Y = żółta, T = brunatna, LY = jasno żółta, YT = żółto-brunatna i LO = jasno pomarańczowa.
Przy charakterystyce bakterii na poziomie rodzajów i gatunków ważną rolę odgrywa analiza komórkowych kwasów tłuszczowych”11, która przyczyniła się do potwierdzenia, że posiadana przez nas kolekcja szczepów należy do tego samego rodzaju. Kultury badanych szczepów przesłano do innego, kontraktowego laboratorium w celu przeprowadzenia analizy estrów metylowych kwasów tłuszczowych (FAME), przy użyciu Microbial ID (MIDI, Newark, DE, USA), Systemu Identyfikacji Mikroorganizmów (Microbial Identification System MIS). System MIS składa się z chromatografu gazowego Hewlett Packard HP5890A posiadającego kolumnę kapilarną, o wymiarach 25 mm x 0,2 mm, wypełnioną 5% metylofentylo silikonem stopionym z krzemionką. Jako gaz nośnikowy stosowany jest wodór i detektor jonizacji płomieniowej w połączeniu z podajnikiem automatycznym, integratorem i komputerem. Komputer porównuje estry metylowe kwasów tłuszczowych w badanej próbce z biblioteką bakteryjnych kwasów tłuszczowych i z mieszaniną kalibracy’ną znanych kwasów tłuszczowych. Zgodnie z zaleceniami laboratorium prowadzącego badania, szczepy przygotowywane do analizy hodowano przez 24 godz. w temp. 28°C na agarze z tryptykazą sojową. Próbki do badania przygotowało laboratorium, w którym wykonywano analizę standardową metodą FAME. Wcześniej przeprowadzona charakterystyka badanych szczepów metodami bezpośrednimi wykluczyła przynależność tych szczepów do jakiejkolwiek innej grupy bakterii luminescencyjnych, poza Photorhabdus. Przeprowadzenie badań, w trakcie których porównano profile kwasów tłuszczowych pochodzących z grupy izolatów, umożliwiło stwierdzenie, że bakterie należały do tej samej rodziny.
Różnorodność ewolucyjną szczepów Photorhabdus należących do naszej kolekcji określono badając „fingerprinting” DNA genomowego z każdego szczepu przeprowadzając analizę metodą PCR (reakcja łańcuchowa polimerazy). Technika ta opiera się na występowaniu w genomie różnych szczepów bakteryjnych rodzin powtarzających się sekwencji DNA™. Uważa się, że trzy z tych sekwencji: repetytywne palindromowe sekwencje pozagenowe (re186 242 petitive extagenic palindromic seqence - REP), enterobakteryjne repetytywne sekwencje zgodności wewnątrzgenowej (enterobacterial repetitive intergenic consensul - ERIC) i elementy BOX odgrywają ważną rolą w organi/.acjj genomu bakteryjnego. Uważa się również, że organizacja jest kształtowana przez selekcję i rozproszenie tych elementów w obrębie genomu i cecha ta może być wykorzystywana do identyfikacji blisko spokrewnionych szczepów bakteryjnych (np. Louws F.J., Fulbright D.W., Stephens C.T. i De Bruijn F.J., 1994, Appl. Emdron. Micro. 60, 2286-2295). Rep-PCR wykorzystując startery oligonukleotydowe komplementarne do tych sekwencji repetytywnych umożliwia namnożenie fragmentów DNA leżących pomiędzy nimi i mających różną wielkość. Powstające w wyniku reakcji PCR produkty są rozdzielane za pomocą elektroforezy, aby ustalić „fingerprint” (odcisk palca) dNa, charakterystyczny dla każdego szczepu.
Aby otrzymać genomowy DNA z badanych szczepów należy: osad komórek zawiesić w buforze TE (10 mM Tris-HCl, 1 mM EDTA, pH 8,0) do objętości końcowej 10 ml i dodać 12 ml 5 M NaCl. Mieszaninę tę należy żwirować 20 min., 15 000 x g. Uzyskany pelet należy zawiesić w 5,7 ml TE i dodać 300 pl 10% dodecylosiarczanu sodu oraz 60 fal proteinazy K o stęż. 20 pg/ml (Gibco BRL Products, Grand Island, NY, USA). Mieszaninę tę należy inkubować w temp. 37°C, przez 1 godz., a następnie dodać ok. 10 mg lizozymu i kontynuować inkubację przez dodatkowe 45 min. Po upływie tego czasu do mieszaniny należy dodać 1 ml 5 M NaCl i 800 pl roztworu NaCl/CTAB (10% w/v CTAB; 0,7 M NaCl), całość inkubować przez 10 min. w temp. 65°C, delikatnie zamieszać, inkubację prowadzić jeszcze przez 20 min., mieszając (aby ułatwić uwolnienie materiału komórkowego). Następnie należy dodać równą objętość mieszaniny chloroform/alkoholizoamylowy (24:1, v/v), delikatnie zamieszać i żwirować. Po żwirowaniu należy przeprowadzić dwie ekstrakcje z równą objętością mieszaniny fenol/chloroform/alkohol izoamylowy (50:49:1). DNA genomowy należy strącić używając 0,6 obj. izopropanolu, strącony DNA należy nawinąć na pałeczkę szklaną, przemyć dwukrotnie 70% etanolem, wysuszyć i rozpuścić w 2 ml STE (10 mM Tris-HCl, pH 8,0; 10 mM NaCl, 1 mM EDTA).Ilość DNA ocenia się mierząc gęstość optyczną roztworu przy długości fali 260 nm. Aby przeprowadzić analizę rep-PCR genomowego DNa Photorhabdus użyto następujące startery: REP1R-I; 5'-IIIICGICGICATCIGGC-3' i REP2-I; 5'-ICGICTTATCIGGCCTAC-3'. Reakcję PCR prowadzono w 25 pl objętości końcowej: 7,75 pl H2O; 2,5 pl buforu 10 x LA (PanVera Corp., Madison, WI, USA); 16 pl mieszaniny dNTP (2,5 mM każdy nukleotyd); 1 pl każdego startera o stęż. 50 pM/pl; 1 pl DMOO; 1 i5 pl NAA genomowego (stężenia o0 0,07- 0,480 pg/pl) i 0,25 pl TaKaRa EX Taq (PanVera Corp., Madison, WI, USA). Reakcje PCR prowadzono w aparacie Perkin Elmer DNA Thermal Cycler (Norwalk, CT, USA), w następujących warunkach: 95°C/7 min., następnie 35 cykli: 94°C/1 min., 44°C/1 min., 65°C/8 min., zakończone 15 min. w temp. 65°C. Po zakończeniu reakcji do 25 pl mieszaniny reakcyjnej dodawano 5 pl 6 x stężonego buforu do nanoszenia próbek na żel (gel loading buffer; 0,25% błękit bromofenalowy; 40% w/v sacharozy w wodzie). Przygotowano 1 % żel agarozowy o wymiarach 15 x 20 cm i przeprowadzono elektroforezę w buforze TBE (0,09 M Tris-boran; 0,002 M EDTA), nanosząc na żel 8 pl każdej mieszaniny reakcyjnej. Elektroforezę prowadzono ok. 16 godz. przy napięciu 45 V. Żele barwiono bromkiem etydyny (20 pg/ml) przez 1 godzinę i odbarwiano w buforze TBE przez ok. 3 godz. Zdjęcia żeli wykonywano aparatem Polaroid po oświetleniu ich światłem UV.
Obecność lub brak prążków charakterystycznych dla każdego szczepu zapisywano z fotografii i wprowadzano jako matryce podobieństwa w programie komputerowym używanym do taksonomii numerycznej NTSYS-pc (Exeter Software, Setauker, NY). Równolegle, również tą metodą uzyskano ”fingerpring” DNA szczepów kontrolnych E. coli szczep HB101 i Xanthomonas oryzae pv. oryzae, który był zgodny z danymi literaturowymi^1. Dane uzyskane ze szczepów Photorhabdus zostały następnie poddane analizie w programach komputerowych: NTSYS-pc; SIMQUAL (Similarity for Qualitative Data), aby uzyskać macierz współczynników podobieństwa (używając współczynnika Jaccarda) i grupowania (z wykorzystaniem UPGMA - Unweighted Pair-Group Method with Arithmetic Averages) SAHN (Sequential, Agglomeratiye, Hierarchical and Nested), które grupują szczepy pokrewne i mogą być przedstawione w postaci fenogramu (fig. 5). Programy COPH (cophenetic values)
186 242 i MXCOMP (mrtrix comparition) wykorzystano do uzyskani- matrycy wartości kofeoetyczne i porównania korelacji pomiędzy tą matrycą a matrycą, na ktiórej oparte było grupowanie. Metodą znormalizowanej statystyki Mnntela uzyskano wartość (r), która jest miarą dopasowania Oo analizy grupowej (r=0,8 - 0,9 oznacza bardzo dobre Odoaydwaoie). W naszym przypadku r = 0,919. Dlatego też nasza kolekcja skł-Oa się z różnorodnej grupy łatwo rozróżnialnych szczepów, które należą do rodzaju Photorhabdus.
Przykład XIII
Owadobójcze zastosowanie toksyn produkowanych przez różne szczepy Photorhabdus
Początkowe kultury „wyjściowe” różnych szczepów Photorhabdus są wytwarzane przez zaszczepianie 175 ml dwuprocentowegd podłoża Proteose Peptone #3 (PP3) (Laboratoria Difco, Detroit, MI) podstawowymi szczepnmi subk^nu w 500 ml ^przegrodowej kolbie wraz z szyjką Delong z zamknięciem Kaput. Inokulum do każdej hodowli wyjściowej otrzymano z pokrytej warstwą oleju hodowli nr skosie agarowym lub z hodowli na sznlknch. Po anszczeoieoiu kolby inkubowano 16 godzin w temperaturze 28°C w wytrząsarce z prędkością 150 obrotów na minutę. Te hodowle wyjściowe są następnie używane jsko uniwersalne źródła szczepów do fermentacji d-nego szczepu. Dodatkowo hodowle wyjściowe w fazie odldgarytmicznej pokryto sterylną naftą, dodano sterylne mieszadło magnetyczne w celu ponownego zawieszenia komórek, i przechowywano w ciemności w temperaturze pokojowej, znpewninjąc w ten sposób długoterminowe zabezpieczenie inokulum w stanie nie naruszającym toksyn. Wyprodukowane buliony są z-szczepi-ne przez dodanie 1% aktywnie rozrastającej się hodowli wyjściowych Oo 2% świeżej pożywki PP3 (np. 1,75 ml nn 175 ml świeżej pożywki). Produkcja bulionów odbywa się również w 500 ml trójdzielnych kolbrch (jw) lub w 2800 ml kolbach przedzielonych i z wypukłym dnem (500 ml sztuka) z zamknięciem z pi-nki silikonowej. Kolby produkcyjne inkubowano przez 24 0o 48 godzin w wyżej opisanych warunkach. Po zakończeniu inkubacji buliony są rozlewane do sterylnych jednolitrowych butelek z polietylenu, wirowane 2600 x g przez 1 godzinę przy 10°C i deknotowane aby oddzielić osad zawierający resztki komórkowe i komórki. Płynny bulion jest następnie filtrowany przez filtry szklane Whatman GF/D (zatrzymywanie 2,7 μΜ) i TF/B (zatrzymywanie 1,0 μΜ) usuwające resztki komórkowe. Dalsze oczyszczanie bulionu osiąga się przy pomocy mikrofiltrującego urządzenia o tangeosdidnlnym przepływie (Pall Filtrom, Tdrthborough. MA) używając filtra otyartd-kanrłdwego 0,5 μΜ. Jeśli zachodzi potrzeba, dodatkowe oczyszczanie może być wykonane przez schłodzenie roztworu (Oo 4°C) i odwirowywanie przez kilka godzin przy 2600 x g. Zgodnie z tą procedurą roztwór jest sterylizowany przy użyciu filtra 0,2 μΜ z nitrocelulozowym filtrem. Sterylne buliony następnie wykorzystano bezpośrednio do prób biologicznych, analiz biochemicznych lub aatężrnd (Oo 15 razy) przy pomocy urządzenia 0o ultrafiltrrcji odcinającego frakcję o masie cząsteczkowej 10 000, M12 (Cmieon, Beverly ΜΝ) lub zatężarki wirówkowej (Milliopre, Bedford, MC i Pall Filtron, Northborough, MA) o wielkości por przepuszczających cząsteczki o masie cząsteczkowej 10 000. W przypadku zatężarki wirówkowej bulion wirow-no przy 2000 x g w przybliżeniu przez 2 godziny. Przesącz o masie cząsteczkowej 10.000 dodano do odpowiedniej zatrzymanej frakcji, aby osiągnąć pożądane stężenie składników powyżej masy cząsteczkowej 10.000. Dezaktywacja po0 wpływem ciepła odbywa się przez podgrzewanie próbek w temperaturze 100°C przez 10 min. w wypełnionych piaskiem blokach.
Bulioo3y) i kompleks(y) toksyn z różnych szczepów Photorhabdus są używane do redukowani- populacji owadów i są stosowane w metodzie powstrzymywania populacji owadów, co obejmuje stosowanie w miejscu występowania owadr skutecznej ilości unieszkodliwiającej owady, określanej jako aktywna. Wykazanie zakresu działania own0oaójezrgo obserwowanego przy użyciu bulionów wybranych grup szczepów Photorhabdus poddanych fermentacji tak jak to zostało opisane wyżej, jest przedstawione w tabeli nr 19. Istnieje możliwość, że mogą zostać wykryte dodatkowe Oziałania owadobójcze tych szczepów w wyniku zwiększenia stężenia bulionu lub przez wykorzystanie innych metod fermentacji. Biorąc pod uwagę fakt, że aktywność owadobójcza roztworu jest związana z białkiem, to aktywność dwn0obójczn wszystkich badanych szczepów jest zależna o0 temperatury (p-trz wyżej).
186 242
Bulion(y) hodowlany^) z różnych szczepów Photorhabdus wykazują zróżnicowany poziom działania owadobójczego (śmiertelność i/lub hamowanie wzrostu, obniżenie pojawiania się dorosłych osobników). Szczególnie obserwowana jest aktywność przeciw larwom kukurydzianej stonki korzeniowej (Diabrotica sp.) i larwom kwieciaka bawełnowca z rzędu Coleoptera. Inni przedstawiciele tego rzędu to larwy sprężykowatych, słodyszek rzepakowiec, pchełka, Bruchidae i stonka ziemniaczana. Zaobserwowano również działanie na skoczka (Macrosteles fascifrons) i żywiący się zbożem Megamelus spp., które należą do rzędu Homoptera. Inni przedstawiciele tego rzędu to skoczki, miodówka gruszowa żółta, miodówka jabłoniowa, owady czerwcowate, mączliwowate, kraskowate (Cercopidae) jak również wiele gatunków mszyc. Buliony i kompleksy oczyszczanych toksyn działają też na szkodnika tytoniu (Heliothis virescens) zmierzchnicy i omacnicy prosowianki (Ostrinia nubilalis), które są przedstawicielami rzędu Lepidoptera.. Innymi typowymi przedstawicielami tego rzędu są szkodnik buraka (Spodoptera exiqua), kapusty (Trichoplusia ni), (Agrotis ipsilon), Heliothis zea, owocówka jabłkówka, mól, zadamica spiżamiapka (Plodia interpunctella), Pyralidae, gąsienice żywiące się kapustą, szkodnika bawełny (Helicoverpa armigera), Thyndopteryx ephemeraeformis. Liszka (Nalacosoma sp.), wachlarzyk (Parapediasia tetrrella) i Spodoptera frugiperda. Zauważalne jest również działanie przeciw owocówkom i larwom komara, które zalicza się do rzędu Diptera. Ini przedstawiciele Diptera to paciomica grochowianka, połyśnica marchwiowa, Delia radicum, mszyca (Delia floralis), śmietka cebulówka, koziułkowate i mucha domowa oraz różne gatunki komarów. Buliony i kompleksy z oczyszczanych toksyn działają też na przędziorka chmielowca Tetranychus urticae, który jest przedstawicielem rzędu Acarina, do którego poza tym należy: Tetranychus turkestani, Polyphagotarsonemus latus, Panonychus citri, Panonychus ulmi, rdza gruszkowa (Epitnmerus pyri i Aculops lycopersici).
Działanie przeciw larwie kukurydzianej stonki korzeniowej (Diabrotica sp.) zostało przetestowane w następujący sposób. Bulion/y) hodowlany(e) zawierający(e) kultury Photorhabdus (0-15 razy zatężone, sterylizowane przez filtrowanie), 2% Proteose Peptone # 3, oczyszczony kompleks (oksyn [0,23 mg/ml] lub 10 mM fosforan sodu, pH 7,0, nanoszono bezpośrednio na powierzchnię (około 1,5 cm2 sztucznej pożywki™, 40 pl porcje. Kompleks toksyn został rozcieńczony w 10 mM fosforanem sodu, pH 7,0. Szalki z pożywką pozostawiono do osuszenia na powietrzu w sterylnej komorze, a dołki zakażono pojedynczym, nowo narodzonym osobnikiem Diabrotica undecimpunctata howardi (południowa kukurydziana stonka korzeniowa - South cora rootworm, SCR), wylęgłym ze sterylizowanych jaj. Szalki szczelnie zamknięto, umieszczono w nawilżanej komorze inkubacyjnej i pozostawione do wzrostu w temperaturze 27°C na okres około 3-5 dni. Następnie mierzono masę larw i ich śmiertelność. Ogółem w czasie badań przy każdej próbie użyto 16 owadów. Śmiertelność w kontroli wyniosła mniej niż 5%.
Działanie przeciw kwieciakowi bawełnowcowi (Anthomonas grandis) zostało sprawdzone jak następuje, stężony (1-10 razy) buliony hodowlane Photorhabdus, pożywkę kontrolną (2% Proteose Peptone # 3), oczyszczony kompleks(y) toksyn(y) [0,23 mg/ml] lub 10 mM fosforanu sodu, pH 7,0, nanoszono na powierzchnię 0,35 g sztucznej pożywki w 60 pl porcjach (pożywka dla motyli Stopeville Yellow) i pozostawiono do wyschnięcia. Pojedyncza larwa kwieciaka bawełniaka w wieku 12-24 godzin została umieszczona na pożywce, dołki szczelnie zamknięto i utrzymywano .w temperaturze 25°C, 50% RH, przez 5 dni. Następnie mierzono masę i śmiertelność larw. Śmiertelność w kontroli była w zakresie 0-13%.
Sprawdzenie działania przeciw larwom komara przebiegało następująco. Próbę przeprowadzono w 96-dołkowej szalce nikrotitracyjpej, która zawierała 200 pl wodnego roztworu (W-krotnie stężony^) buliomjy) hodowlny(e) Photorhabdus, 2% Proteose Peptone #3, oczyszczony(e) kompleks(y) toksyn^) [0,23 mg/ml] lub H2O, 10 mM fosforanu sodu i w przybliżeniu 20 jednodniowych dojrzałych larw (Aedes aegypti). Stosowano 6 dołków na każdą próbę. Wyniki były odczytywane po 3-4 dniach. Śmiertelność w kontroli utrzymała się na poziomie 0-20%.
Działanie przeciw muszkom owocówkom było testowane następująco. Zakupioną pożywkę dla Drosophila melanogaster przygotowano używając 50% suchej pożywki i 50% płynu w tym wody, pożywki kontrolnej (2% Proteoze Peptone #3), zatężonej 10 razy bulio56
186 242 nu(ów) hodowlanego(ych) Photorhabdus), oczyszczonego(nych) kompleksu(ów) toksyn(y) [0,23 mg/ml] lub 10 mM fosforanu sodu, pH 7,0. Przeprowadzono to przez umieszczenie 4,0 ml suchej pożywki w każdej z trzech fiolkach hodowlanych na każdą próbę oraz dodano 4,0 ml właściwego płynu. Dziesięć larw instar Drosophila melanogaster dodano następnie do każdej 25 ml fiolki. Fiolki były przechowywane w laboratorium na stole laboratoryjnym, w temperaturze pokojowej pod sufitowym światłem jarzeniowym. Zliczenie kokonów lub dojrzałych osobników prowadzono po 15 dniach. Pojawianie się osobników dorosłych w porównaniu do pożywki kontrolnej i wody (obniżenie 0-16%).
Zbadanie działania wobec dorosłego skoczka (Macrosteles fascifrons) i nimfy skoczka zbożowego (Peregrinus maidis) było przeprowadzone tak, aby umożliwić pobieranie substancji czynnej, bez innego rodzaju kontaktu zewnętrznego. Zbiornik na roztwór substancji czynnej, „pożywienie” jest wykonany przez zrobienie dwóch otworów po środku dolnej części szalki Petriego o wymiarach 35 x 10 mm. Kwadrat 5 cm (2 cale) Parafilmu M®, umieszczono na wierzchu szalki i zabezpieczono pierścieniem uszczelniającym typu „O”. Następnie plastikowy kubek o poj. 30 ml (1 uncja) zakażono, około 7 skoczkami, a zbiornik umieszczono na górze kubka, Parafilmem do dołu. Następnie przez otwory w zbiorniku wlano roztwór. Do testów użyto 10-krotnie stężony(e) bulion(y) hodowlany(e) Photorhabdus, bulion i pożywkę hodowlaną (2% Proteose Peptone #3), dializowane w 10 mM fosforanu sodu, pH 7,0 i do uzyskanego roztworu dodano sacharozę (do stęż. 5%), aby obniżyć śmiertelność w kontroli. Badano również oczyszczony(e) kompleks(y) toksyn [0,23 mg/ml] lub 10 mM fosforanu sodu, pH 7,0. Śmiertelność określano 3 dnia. Próbę prowadzono w inkubatorze przy temperaturze 28°C, 70% RH przy okresie światła 16/8. Testy zmierzono pod kontem śmiertelności w ciągu 72 godzin. Śmiertelność w kontroli wyniosła mniej niż 6%.
Działanie przeciw larwom Lapidopteran zostało sprawdzone w następujący sposób. Stężony(e) (10 razy) bulion(y) hodowlany(e) Photorhabdus, 2% Proteose Peptone #3, oczyszczony kompleks(y) toksyn(y) [0,23 mg/ml] lub 10 mM fosforanu sodu, pH 7,0 zostało zastosowane bezpośrednio na powierzchnię (-1,5 cm2) standardowej pożywki dla motyli (Stoneville Yellow) w 40 pl porcjach. Szalki z pożywką zostały następnie pozostawione do wyschnięcia w powietrzu w sterylnej komorze. Do każdego dołka włożono pojedynczą larwę omacnicy prosowianki (Ostrinia nubilalis) i jaja zmierzchnicy (Manduca sexta). Te jaja zostały pozyskane ze źródeł komercyjnych i wylęgły się na miejscu, podobnie jak larwy szkodnika tytoniu (Heliothis virescens), które pochodziły z własnej hodowli. Po wprowadzeniu larw szalki z pożywką zostały szczelnie zamknięte, umieszczone w komorze inkubacyjnej z nawilżaniem i pozostawione w temperaturze 27°C przez odpowiedni czas. Następnie piątego dnia zmierzono masę i śmiertelność larw. Ogółem w badaniach używano po 16 owadów w każdej próbie. Śmiertelność w kontroli wahała się 4-12,5 % dla pożywki kontrolnej i była mniejsza niż 10% dla buforu fosforanowego.
Działanie przeciw przędziorkowi chmielowcowi Tetranychus urticea zostało zbadane następująco. Młode, rośliny dyni przycięto pozostawiając pojedynczy liścień i spryskano do spłynięcia 10 krotnie stężonym bulionem hodowlanym, pożywką kontrolną (2% Proteose Peptone #3), oczyszczanym kompleksem toksyn [0,23 mg/ml] lub 10 mM fosforanem sodu, pH 7,0. Po wysuszeniu rośliny zakażono różnymi roztoczami tworzącymi pajęczyny i przechowano w temperaturze i wilgotności, jaka panowała w laboratorium przez 72 godziny. Następnie policzono żywe roztocza, aby ustalić poziomy kontrolne.
Tabela 19
Spektrum działania owadobójczego bulionów z różnych szczepów Photorhabdus
Szczep Photorhabdus Wrażliwe gatunki owadów
1 2
WX-1 3**,4, 5, 6, 7, 8
WX-2 2,4
WX-3 1.4
WX-4 14
186 242 ciąg dalszy tabeli 19
1 2
WX-5 4
WX-6 4
WX-7 3,4, 5, 6, 7,8
WX-8 12,4
WX-9 12,4
WX-10 4
WX-11 12,4
WX-12 2,4, 5, 6, 7,8
WX-14 12,4
WX-15 12,4
W30 3,4, 5,8
NC-1 12, 3,4, 5, 6, 7,8, 9
WIR 2, 3,5, 6,7, 8
HP88 13,4, 5, 7, 8
Hb 3,4, 5,7,8
Hm 1,2, 3, 4, 5,7,8
H9 12, 3,4, 5,6, 7,8
W-14 1,2, 3,4, 5,6, 7,8, 10
ATCC43948 4
ATCC43949 4
ATCC43950 4
ATCC43951 4
ATCC43952 4
* = > 25% śmiertelności i/lub wzrostu zahamowania względem grupy kontrolnej ** = 1; Heliothis virescens, 2; Ostrinia nubilalis, 3; zmierzchnica, 4; południowa kukurydziana stonka korzeniowa, 5; kwieciak bawełniak, 6; komar, 7; muszka owocówka, 8; Macrosteles fascifrons, 9; Macrosteles fascifrons, 10; Tetranychus urticea..
Przykład XIV
Szczepy Photorhabdus inne niż W-14
Oczyszczanie, charakteryzacja i spektrum działania.
Oczyszczanie
Ten protokół jest podobny do protokołu stworzonego na potrzeby oczyszczania W-14 i został opracowany w oparciu o oczyszczanie frakcji, które mają największzą skuteczność wobec południowej kukurydzianej stonki korzeniowej (SCR) jak to zostało dowiedzione w próbach biologicznych (patrz przykład XIII). Typowo otrzymywano 4-20 1, który bulionu przefiltrowano, jak jest to opisane w przykładzie XIII i zatężono przy użyciu naboju spiralnego ultra filtrującego typu Amicon Type S1Y100 podłączonego do urządzenia filtrującego Amicon M-12. Część zatrzymana obejmowała naturalne białka składające się z cząsteczek o wielkości powyżej 100 kDa, podczas gdy materiał przesączu obejmował naturalne białka o wielkości poniżej 100 kDa· Zasadnicza aktywność przeciwko kukurydzianej stonki korze58
186 242 niowej SCR występowała w części zatrzymanej ro wielkości 100 kDa. Część zatrzymaną następnie diafiltrowano z 10 mM fosforanu sodu (pH 7,0) do momentu, gdy przesącz wykazywał wartość A280 < 0,100. Jeśli nie określono inaczej, wszystkie procedury od tej chwili były przeprowadzane w buforze jak zdefiniowano dla 10 mM fosforanu sodu (pH 7,0). Część zatrzymaną następnie zatężono do około 0,20 1 i przefiltrowano używając jednostki do filtrowania sterylizującego 0,45 mm Nalgene Filterware. Przefiltrowany materiał wprowadzono przy 7,5 ml/min na kolumnę Pharmacia HR 1 (6/10, wypełnioną silnie anionowymicnnym podłożem PerSeptive Biosystem Poros® 50 HQ, zrównoważonym buforem używając układu do HPLC PerSeptive Biosystem Sprint®. Po wprowadzeniu materiału, kolumnę przemyto buforem do uzyskania wartości A280 < 0,100. Białka następnie wymywano z kolumny przy 2,5 ml/min używając buforu z 0,4 NaCl przez 20 min do końcowej ilości 50 ml. Kolumnę następnie przemyto buforem z 1,0 M NaCl o tej samej szybkości przepływu przez kolejne 20 min (końcowa objętość 50 ml). Białka wymywane przy 0,4 M i 1,0 M NaCl następnie umieszczono w dwu osobnych woreczkach do dializy (Spectra/ Por® Membrane MWCO:2,000) i pozostawiono do dializy przez noc w temperaturze 4°C w 12 1 buforu. Zasadnicza aktywność przeciwko kukurydzianej stonce korzeniowej SCR odpowiada frakcji 0,4 M. Frakcję 0,4 M następnie oczyszczono naniesienie 20 ml na kolumnę Pharmacia XK 26/100, wypełnioną Sepharose CL4B (Pharmacia) przy szybkości przepływu 0,75 ml/min. Frakcje zostały połączono w oparciu o krzywą pików A280 i zatężono do końcowej wartości 0,75 ml używając urządzenia do filtrowania wirówkowego Millipore Ultrafree®-15, filtr Biomax-50K NMWL. Stężenia białka określono przy użyciu zestawu Biorad Protein Assay Kit z bydlęcą gamma globuliną jako odnośnikiem.
Charakteryzacja
Naturalna masa cząsteczkowa kompleksu toksyny przeciwko kukurydzianej stonce korzeniowej (SCR) została określona przy użyciu kolumny Pharmacia HR 16/50 z wcześniej wprowadzoną Sepharose CL 4B w buforze. Kolumnę następnie kalibrowano przy użyciu białek o znanych wielkościach cząsteczek, umożliwiając policzenie przybliżonej naturalnej cząsteczek toksyn. Jak pokazano w tabeli 20 wielkość cząsteczek z kompleksu toksyn jest w zakresie od 777 kDa dla szczepu Hb do 1,900 kDa dla szczepu WX-14. Wydajność produkcji kompleksu toksyn jest również zmienna, szczep WX-12 produkował 0,8 mg/l a szczep Hb, 7,0 mg/l.
Białka znalezione w kompleksie toksyn były badane pod kątem poszczególnych wielkości polipeptydów przy użyciu analiz SDS-PAGE. Typowo, 20 mg białka z kompleksu toksyn z każdego szczepu wprowadzono do 2-15% żelu poliakrylamidowego (Intergeted Sepatarion Systems) i poddano elektroforezie przy 20mA w buforze SDS-PAGE, Biorad. Po zakończeniu elektroforezy, żele barwiono przez noc w błękicie Coomassie R-250, Biorad (0,2% w metanol:kwas octowy:woda; 40:10:40 v/v/v). Następnie żele odbarwiano w metanolu, kwasie octowym: wodzie; 40:10:40 (v/v/v). Po czym przepłukano wodą przez 15 min. i skanowane przy użyciu densytometru Milecular Dynamics Personal Laser Densitometer®. Ścieżki oznaczano ilościowo i masy cząsteczkowe obliczano w porównaniu do wzorców mas cząsteczkowych Biorad, w zakresie od 200 do 45 kDa.
Wielkości poszczególnych polipeptydów znajdujących się w różnych odmianach kompleksu toksyn przeciwko kukurydzianej stonce (SCR) przedstawiono w tabeli 21. Wielkości poszczególnych polipeptydów wynoszą od 230 kDa dla szczepu WX-1 do 16 kDa dla szczepu WX-7. Każdy szczep, z wyjątkiem Hb, miał polipeptydy obejmujące kompleks toksyn w przedziałach od 160 do 230 kDa, od 100 do 160 kDa i od 50-80 kDa. Te dane wskazują na fakt, że kompleks toksyn może różnić się składem peptydowym i składnikami w zależności od szczepu. Jednak we wszystkich przypadkach właściwości toksyny wydają się związane z dużym, oligomerycznym kompleksem białkowym.
186 242
Tabela 20
Charakteryzacja kompleksu toksyn, z szczepów Photorhabdus innych niż W-14
Szczep Przybliżona natywna masa cząsteczkowa molekuł3 Wydajność Frakcja aktywna (mg/l)b
H9 972 000 1,8
Hb 777 000 7,0
Hm 1,400 000 1,1
HP88 813 000 2,5
NCl 1 092 000 3,3
WIR 979 000 1,0
WX-1 973 000 0,8
WX-2 951 000 2,2
WX-7 1 000 000 1,5
WX-12 898,000 0,4
WX-14 1 900 000 1,9
W-14 860 000 7,5
a naturalna masa cząsteczkowa oznaczona przy użyciu kolumny Pharmacia HR 16/50 z Sepharose CL4B b Ilość kompleksu toksyn w bulionie hodowlanym.
Spektrum działania
Jak przedstawiono w tabeli 21, kompleksy toksyn oczyszczone z szczepów Hm i H9 były badane pod kontem aktywności wobec różnych owadów w porównaniu z kompleksem toksyn ze szczepu W-14. Próbki zostały dobrane tak jak opisano w przykładzie XIII. Kompleks toksyn ze wszystkich trzech szczepów wykazujących aktywność przeciwko ćmie Heliothis virescens, omacnicy prosowianki Ostrinia nubilalis, południowej kukurydzianej stonki korzeniowej (Diabrotica undecimpunctata-howardi) i Macrosteles fascifrons. Dodatkowo kompleks toksyn ze szczepów Hm i W-14 również wykazujący aktywność przeciwko Tetranychus urticae. Ponadto kompleks z W-14 był aktywny przeciwko larwom komara. Te dane dowodzą, że kompleks toksyn, mający pewne podobieństwa pomiędzy pewnymi rzędami owadów, mogą również wykazywać różne aktywności przeciwko innym rzędom insektów.
Tabela 21
Przybliżone wielkości (w kDa) peptydów w oczyszczonych kompleksach toksyn innych Photorhabdus niż z W-14
H9 Hb Hm HP-88 NC-1 WIR WX-1 WX-2 WX-7 WX-12 WX-14 W-14
1 2 3 4 5 6 7 8 9 10 11 12
180 150 170 170 180 170 230 200 200 180 210 190
170 140 140 160 170 160 190 170 180 160 180 180
160 139 100 140 140 120 170 150 110 140 160 170
140 130 81 130 110 110 160 120 87 139 120 160
120 120 72 129 44 89 110 110 75 130 110 150
98 100 68 110 16 79 98 82 43 110 100 130
87 98 49 100 74 76 64 33 92 95 120
186 242 ciąg dalszy tabeli 21
1 2 3 4 5 6 7 8 9 10 11 12
84 88 46 86 62 58 37 28 87 80 110
79 81 30 81 51 53 30 26 80 69 93
72 75 22 77 40 41 23 73 49 90
68 69 20 73 39 35 22 59 41 77
60 60 19 60 37 31 21 56 33 69
57 57 58 33 28 19 51 65
52 54 45 30 24 18 37 63
46 49 39 28 22 16 33 60
40 44 35 27 32 51
37 39 25 26 45
37 23 40
35 39
29
Tabela 22
Zaobserwowane spektrum działania owadobójczego oczyszczanego kompleksu toksyn ze szczepów Photorhabdus
Szczepy Photorbabdus Wrażliwe* gatunki owadów
kompleks toksyn Hm 1**,2, 3, 5, 6, 7,8
kompleks toksyn H9 12, 3,6, 7,8
kompleks toksyn W-14 12, 3,4, 5, 6, 7, 8
- 25% śmiertelności lub wzrost zahamowania ** = 1; ćma Heliothis virescens, 2; omacnica prosowianka Ostrinia nubilalis, 3; południowa kukurydziana stonka korzeniowa (Diabrotica undecimpunctata-howardi), 4; komar, 5; Tetranychus urticae, 6; Macrosteles fascifrons, 7; muszka owocówka, 8; Anthonomous grandis grandis (kwieciak bawełnowiec).
Przykład XV.
Subfrakcjanowanie białka w kompleksie toksyn Photorhabdus
Białkowy kompleks toksyn Photorhabdus wyizolowano jak opisano w przykładzie XIV. Następnie 10 mg toksyny nanoszono na kolumnę Mono Q 5/5 zrównoważoną 20 mM TrisHCl, pH 7,0 przy szybkości przepływu na poziomie 1 ml/min. Kolumnę przemyto 20 mM Tris-HCl, pH 7,0 aż gęstość optyczna 280 nm wróciła do linii zerowej absorbancji. Białka związane z kolumną wymyto gradientem liniowym 0-1,0 M NaCl w 20 mM Tris-HCl, pH 7,0 przy 1 ml/min przez 30 min. 1 ml frakcji zebrano i poddano oznaczeniu biologicznemu na południowej kukurydzianej stonce korzeniowej (SCR) (patrz przykład XIII). Najwyższe aktywności zostały oznaczone przez serię rozcieńczeń każdej frakcji w oznaczeniach biologicznych wobec południowej kukurydzianej stonki korzeniowej (SCR). Zaobserwowano dwa piki aktywności wobec kukurydzianej stonki korzeniowej (SCR) i nazwano je A (wymywanie przy około 0,2-0,3 M NaCl) i B (wymywanie przy około 0,3-0,4 M NaCl) Piki aktywności A i B zebrano oddzielnie i oba następnie oczyszczono stosując trzystopniową procedurę opisaną powyżej.
Stały (NH4)2SO4 dodano do powyższej frakcji białka do końcowego stężenia 1,7 M. Białka nanoszono na kolumnę fenylo-Superose 5/5 zrównoważoną 1,7 M (NH-ibSCO w 50 mM roztworu buforowego fosforanu potasu, pH 7 przy 1 ml/min. Białka związane z kolumną wymyto przy gradiencie liniowym wynoszącym 1,7 M (NH4)SO4, 0% glikol etylenowy, 50 mM
186 242 fosforanu potasu, pH 7,0 do 25% glikolu etylenowego, 25 mM fosforan potasu, pH 7,0 (bez (NH^SO-ł) przy 0,5 ml/min. Frakcje dializowano przez noc w 10 mM roztworze fosforanu sodu, pH 7,0. Aktywność każdej frakcji wobec kukurydzianej stonki korzeniowej (SCR) oznaczono biologicznie. Najbardziej aktywne frakcje zostały połączone i naniesione na kolumnę Mono Q 5/5, zrównoważoną 20 mM Tris-HCl, pH 7,0 przy 1 ml/min. Białka związane z kolumną wymyto przy gradiencie liniowym 0-10 M NaCl w 20 mM Tris-HCl, pH 7,0.
W ostatnim etapie oczyszczania powyższe najbardziej aktywne frakcje (oznaczone w oznaczeniu na SCR) zostały zebrane i podane na kolumnę fenylo-Suserose 5/5. Dodano stały (NHąhSOzi, uzyskując końcowe stężenie 1,7 M. Roztwór następnie naniesiono na kolumnę zrównoważoną 1,7 M (NFLthSCh w 50 mM roztworze buforowego fosforanu potasu, pH 7 przy 1 ml/min. Białka związane z kolumną wymyto gradientem liniowym od 1,7 M (NHąfrSCU, 50 mM roztwór fosforanu potasu, pH 7,0 do 10 mM fosforanu potasu, pH 7,0 przy 0,5 ml/min. Frakcje dializowano przez noc 10 mM roztworem fosforanu sodu, pH 7,0. Aktywność każdej frakcji wobec kukurydzianej stonki korzeniowej (SCR) mierzono oznaczeniem biologicznym.
Ostatecznie oczyszczone powyższą trzystopniową procedurą białko z piku A zostało nazwane toksyną A i oczyszczone białko z piku B zostało nazwane toksyną B. Charakteryzacja i sekwencjonowanie aminokwasów toksyny A i toksyny B. W analizie SDS-PAGE stwierdzono, że obie toksyny A i B obejmują dwa zasadnicze peptydy (90% całego białka wybarwionego Coomassie): 192 kDa (nazwany odpowiednio Al i BI) i 58 kDa (odpowiednio nazwany A2 i B2). Obie toksyny A i B ujawniają tylko jedno główne pasmo w analizie natywnej PAGE, wskazując że Al i A2 sąpodjednostkami jednego kompleksu białkowego i BI i B2 sąpodjednostkami jednego kompleksu białkowego. Ponadto, określono metodą żelowej chromatografii filtrującej, że naturalna masa cząsteczkowa obu toksyn A i B wynosi 860 kDa. Względne stężenia molowe Al do A2 oceniono, że wynoszą 1 do 1 równoważnika jak określono stosując analizę densytometryczną żelu SDS-PAGE. Podobnie, peptydy BI i B2 byty obecne w tym samym stężeniu molowym.
Toksyny A i B były poddane elektroforezie w 10% SDS-PAGE i przeniesiono na filtr PVDF. Bioty przesłano do analizy aminokwasowej i sekwencjonowania aminokwasów Nkońca do Harward MicroChem i do Cambridge ProChem. Stwierdzono, że sekwencja aminokwasów na N-końcu BI jest identyczna z SEQ ID NO: 1, obszar TcbAjj; genu tcbA (SEQ ID NO: 12, pozycje od 87do 99). Wyjątkowa sekwencja N-końca została znaleziona w peptydzie B2 (SEQ ID NO:40). N-końcowa sekwencja aminokwasowa peptydu B2 była identyczna z obszarem TcbAjjj uzyskanej sekwencji aminokwasowej na podstawie genu tcbA (SEQ ID NO: 12, pozycje od 1935 do 1945). Zatem, toksyna B zawierała przeważnie dwa peptydy TcbAjj i TcbA,,,, które jak zaobserwowano można otrzymać z tego samego produktu genu, TcbA.
N-końcowa sekwencja aminokwasowa A2 (SEQ ID NO:41) była niepowtarzalna w porównaniu do peptydu TcbAjjj i innych peptydów. Peptyd A2 oznaczono jako TcdAjjj (patrz przykład XVII). Wyznaczono, że SEQ ID NO:6 jest mieszaniną sekwencji aminokwasowych SEQ ID NO:40 i 41.
Peptydy Al i A2 następnie poddano wewnętrznemu sekwencjonowaniu aminokwasów. Do sekwencjonowania wewnętrznych aminokwasów, 10 μg toksyny A poddano elektroforezie w 10% SDS-PAGE i przeniesione na filtr PVDF. Po wybarwieniu czernią amidową peptydy Al i A2 oznaczone odpowiednio TcdAjj i TcdAjjj wycięto z filtrów i wysłano do Harward MicroChem i do Cambridge ProChem. Peptydy poddano trawieniu trypsyną, a następnie chromatografii HPLC aby wydzielić poszczególne peptydy. Analizę N-końcowych aminokwasów przeprowadzono na wybranych fragmentach peptydów po trawieniu trypsyną. Stwierdzono, że dwie wewnętrzne sekwencje peptydu Al (TcdAjj-PK.71, SEQ ID NO:38 i TcdA„-PK44, SEQ ID NO:39) mają znaczące homologie z wyznaczonymi na podstawie DNA sekwencjami regionu TcbA,, genu tcbA (SEQ ID NO: 12). Podobnie N-końcowa sekwencja SEQ ID NO:41 i dwie wewnętrzne sekwencje peptydu A2 (TcdAj,j-PK57, SEQ ID NO:42 i TcdAj„-PK20, SEQ ID NO: 43) również wykazują homologie z wyznaczonymi na podstawie DNA sekwencjami regionu TcbAj.j genu tcbA (SEQ ID NO: 12),
Podsumowując powyższe wyniki, kompleks toksyn ma co najmniej dwa aktywne kompleksy białek przeciw SCR; toksyna A i toksyna B mają podobne masy cząsteczkowe całko62
186 242 wite i od0jr0odstek, jednakże ich skład peptyOowy jest różny. Toksyna C zawiera jako główne peptydy TcdAii i TcOAiii, a toksyna B zawiera j-ko główne peptydy TcbCii i tcbAjii.
Przykład XVI.
Trawienie i aktywacja peptydu TcbA
W kompleksie toksyny B peptydy TcbCii i TcbCiii pochodzą z pojedynczego produktu genu TcbC (przykład XV). Obróbka peptydu TcbA prowadząca do uzyskania TcbCii i TcbA,,, jest z-ioicjownon przypuszczalnie przez działanie proteo-a3y) Photorhabdus, r najbardziej prawdopodobnie przez metaróprotazy opisane w przykładzie X. W niektórych przypadkach znobserwdwroo, że podczas procesu otrzymywania bulionu Photorhabdus W-14, peptyd TeaG był obecny w kompleksie toksyny B jako główny jej składnik, oprócz peptydów TcbCii i TcbA,,,. Identyczne procedury opisane w przypadku oczyszczania kompleksu toksyny B (przykład XV) są stosowane do wzbogacenia w peptyd TcbA z frakcji kompleksu toksyn w bulionie W- 14. Ostatecznie oczyszczony materiał aoalizownnd w analizie SDS-PCTE o gradiencie 4-20%, a główne peptydy ozonezaoo denyytometryczoie. Ustalono, że TcbA, TcbAii i TcbCiii zawierają odpowiednio 58%, 36% i 6% całego białka. Tożsamość tych orotydów potwierdzono przez ich odpowiednie wielkości cząstek oznaczone metodą SDS-PCTE i analizy Western błot przy użyciu monospecyficzoych przeciwciał. Masa cząsteczkowa naturalnych tej frakcji wynosiła 860 kDa.
Gięcie TcbA oszacowano przez poddanie działaniu powyższego oczyszczonego materiału z oczyszczonymi metnldprotenznmi 38 kDa i 58 kDa z Photorhabdus W-14 (przykład X) oraz trypsynie jako enzymowi kontrolnemu (Sigma, MO). Standardowa renkcjn obejmowała 17,5 pg poww^i^^ziz oezyszczooej Τι^Ι-οΙΚ 1 ,5 j βάοο^Ι^ proteazy y 0 ,1 M baf(fdl TTri pH 8,0 w całkowitej objętości 100 μg. W reakcji kontrolnej prote-zy zostały pominięte. Mieszaniny reakcyjne inkubow-no przez 90 min przy 37°C. Po0 koniec reakcji pobrano 20 μg i gotowano wraz z buforem Oo próbek SDS-PAGE w celu przeprowadzenia natychmiastowej analizy elektroforetycznej w gradiencie 4-20% SDS-PCTE. Określono na podstawie SDS-PCGE, że przy obu protenanch 38 kDa i 58 kDa ilość peptydów AcbG,i i TeaCiii wzrosła 3-krotnie, po0czas gdy ilość TcbC proporcjonalnie spadła (tabela 23). Względne zmniejszenie i zwiększenie ilości wybranych orotydów potwierdzono przez analizy blotingu Westema. Ponadto, filtracja w żelu trawionego materiału pokraaOn, że naturalna masa cząsteczkowa kompleksu jest taka srmn. Po Ozinłrniu trypsyną peptydy TcbA i TcbCii uległy niespecyficznemu trawieniu na małe peptydy. Ao świadczy o tym, że proterzy 38 kDa i 58 kDa Photorhabdus mogą w specyficzny sposób powodować powstanie peptydów TcbAii i TcbAin z TcbT. Kontrole poddane działaniu i nie poddane działaniu proteazy pozostałych 80 μg mieszaniny reakcyjnej poddano kolejnym rozcieńczeniem w 10 mM roztworze fosforanu sodu, pH 7,0 i annliaowaoo oaoacanjąe biologicznie wobec SAR. Przez porówn-nie aktywności kolejnych rozcieńczeń określono, że w przypadku prote-zy 38 kDa aktywność owadobójcza wobec kukurydzianej stonki korzeniowej (SCR) wzrosła około 3-4 razy. Zahamowanie wzrostu tych owadów również było wyższe niż w grupie kontrolnej (tabela 23).
Tabela 23
Przekształcenie i aktywacja peptydu CcbT w peptydy CcbA,, i CcbA,·,, przez działanie protenzą
Kontrola Oziałanie proteazy 38 kDa
S0 (% całkowitej ilości białka) 58 18
S1 (%całkowitej ilości białka) 36 64
S9 (%cnłkowitej ilości białka) 6 18
LD50 Olg białka) 2,1 0,52
masa SAR (mg/owada)* 0,2 0,1
oznaczenie zahamowania wzrostu przez mierzenie średniej masy owadów żywych po 5 dniach odżywiania badana próbą
186 242
Przykład XVII
Przeszukiwanie biblioteki genu kodującego peptyd TcdA,j
Przeprowadzono klonowanie i charakterystykę genu kodującego peptyd TcdA„, opisanego jako SEQ ID NO: 17 (sekwencja N-końcowa peptydu wewnętrznego TcdAii-PT1 11) i SEQ ID NO: 18 (sekwencja N-końcowa peptydu wewnętrznego TcbA„-PT79). Zsyntetyzowano dwa zestawy zdegenerowanych oligonukleotydów zaprojektowanych, aby kodowały sekwencje aminokwasowe SEQ ID NO: 17 (tabela 24) i SEQ ID NO: 18 (tabela 25) i przeciwnie skierowane nici komplementarne tych sekwencji, jak opisano w przykładzie VIII. Sekwencje DNA oligonukleotydów podano niżej:
Tabela 24
Zdegenerowany oligonukleotyd dla SEQ ID NO: 17
P2-PT111 1 2 3 4 5 6 7 8
aminokwas Ala Phe Asn Ile Asp Asp Val Ser
kodony 5'GCN TT(T/C) AA(T/C) AT(T/C/A) GA(T/C) GA(T/C) GTN 3'
P2.3.6.CB 5' GC(A/C/G/T) TT(T/C) AAT ATT GAT GAT GT 3'
P2.2.3.5 5' GC(A/C/G/T) TT(T/C) AA(T/C) AT(T/C/A) GA(T/C) GAT(T/C) GT 3'
P2.3.5R 5 AC (G/A)TC (G/A)TC (T/G/A)AT (G/A)TT (G/A)AA (A/C/G/T)GC 3'
P2.3.5RI 5' ACI TCI TCI ATI TTI AAI GC 3'
P2.3R.CB 5'CAG (AG)CT (A/C)AC ATC ATC AAT ATT AAA 3'
Tabela 25
Zdegenerowapy oligonukleotyd dla SEQ ID NO: 18
P2-PT79 1 2 3 4 5 6 7 8 9 10 11 12 13
Aminokwas Phe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn Asn
Kodony 5'TTY ATH GTN TAY ACN 6 6 GGN GTN AAY CCN AAY AAY 3'
P2.79.2 5'TTY ATY GTK TAT ACY TCI ytr GGY GTK AAT CCR AAT AAT 3'
P2.79.3 5'TTY ATT GTK TAT ACY AGY ytr GGY GTK AAT CCR AAT AAT 3'
P2.79.R1 5'TTY ATT YGG ATT MAC RCC yar RCT RGT ATA MAC AAT AAA 3'
P2.79R.CB 5'TTY ATT YGG ATT MAC ACC cag RCT GGT ATA MAC AAT AAA 3'
zgodnie z kodem IUPAC-IUB nukleotydów, Y = C, lub T,' H = A, ' C lub T, N = A, C, G lub T,K = G lub T, R = A lub G, i M = A lub C
Łańcuchowe reakcje polimerazy (PCR) zasadniczo przedstawiono w przykładzie VIII używając jako zgodnych starterów P2.3.6.CB lub P2.3.5, oraz odwrotnych starterów P2.79.R.1 lub P2.79R.CB we wszystkich zgodnie z kierunkiem transkrypcji i w kierunku przeciwnym kombinacjach stosując DNA Photorhabdus W-14 jako matrycy. W innym zestawie reakcji startery P2.79.2 lub P2.79.3 zostały użyte jako zgodne z kierunkiem, aP2.3.5R, P2.3.5RI i P2.3R.CB jako przeciwne do kierunku we wszystkich kombinacjach zgodnie z kierunkiem i przeciwnie. Tylko w reakcjach zawierających P2.3.6.CB jako zgodne startery w połączeniu z P2.79.R.1 lub P2.79R.CB jako startery odwrotne, obserwowano nieprzypadkowo zanplifikowapy produkt o przybliżonej wielkości 2500 par zasad (ruchliwość w żelach agarowych). Kolejność starterów użytych do uzyskania tego produktu amplifikacji wskazuje, że fragment peptydu TcdA„-PT111 leży amino·) proksynalpie w stosunku do fragmentu TcdA,j-PT79.
Produkty PCR o 2500 parach zasad wligowano do wektora plazmidowego pCR™II (kwitrogem San Diego, CA) zgodnie z instrukcją, a sekwencje DNA między końcami wprowadzonych fragmentów dwóch izolatorów (HS24 i HS27) określono używając startery wska64
186 242 zanych przez producenta i metody sekwencjonowania opisane wcześniej. Sekwencje obydwu izolatorów były jednakowe. Nowe startery syntetyzowano na w oparciu o wyznaczoną sekwencję i użyto do zapoczątkowania dodatkowych reakcji sekwencjonowania, aby otrzymać ogółem 2557 zasad insertu [SEQ ID NO:36]. Translacja częściowego peptydu kodowanego przez SEQ ID NO: 36 prowadził do 845 aminokwasowej sekwencji ujawnionej jako SEQ ID NO:37. Analiza homologii białek tej części fragmentu peptydu TcdA wykazuje zasadniczą homologię aminokwasową (68% podobieństwa, 53% identyczności) do reszt od 542 do 1390 białka TcbA [SEQ ID NO: 12]. Jest więc oczywiste, że gen przedstawiony częściowo przez SEQ ID NO:36 wytwarza białko podobne, ale nie identyczne z białkiem TcbA, które prawdopodobnie ma podobne, ale nie identyczne właściwości biologiczne jak białko TcbA.
W innym przypadku, wyizolowano gen kodujący peptydy TcdTji-PK44 i N-końcowy peptyd 58 kDa TcdA^ opisano jako SEQ ID NO:9 (wewnętrzna sekwencja peptydu TcdA„PK44) i SEQ ID NO:41 (sekwencja N-końcowego peptydu TedA^ 58 kDa). Zsyntetyzowano dwa zestawy zdegenerowanych oligonukleotydów przeznaczonych do kodowania sekwencji aminokwasowych oznaczonych jako SEQ ID NO:39 (tabela 27) i SEQ ID NO:41 (tabela 26) oraz przeciwne komplementy tych sekwencji, jak opisano w przykładzie VIII i ich sekwencje DNA.
Tabela 26
Zdegenerowane oligonukleotydy dla SEQ ID NO:41
Kodon# 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Aminokwas Leu Agr Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln
A2.1 5' YTR OGY AGY GCI AAT ACY YTR ACY GAT YTR TTT YTR OCR CA 3'
A2.2 GCI AAT ACI YTR ACI GAY YTR TTY YTR OCI CA 3'
A2.3.R 5'TG YGG YAR AAA YAR RTC RGT YAR RGT RTT IGC RCT ROG 3'
A2.4.R 5 TG IGG CAG AAA CAG RTC IGT CAG IGT ATT IGC 3'
Tabela 27
Zdegenerowane oligonukleotydy dal SEQ ID NO: 39
Aminokwas # (8) (9) (10) (11) (12) (13) (14) (15) (16)
kodon # 1 2 3 4 5 6 7 8 9
Aminokwas Gly Pro Val Glu Ile Asn Thr Ala Ile
A1.44.1 5'GGY CCR GTK GAA ATT AAT ACC GCI AT 3'
A1.44.1R 5 ATI GCG GTA TTA ATT TCM ACY GGR CC 3'
A1.44.2 5'GGI CCI GTI GAR ATY AAY ACI GCI AT 3'
A1.44.2R 5 ATI GCI GTR TTR ATY TCI ACI 1 GGI CC 3'
Łańcuchowe reakcje polimerazy (PCR) zasadniczo przedstawiono w przykładzie VIII używając jako zgodnych starterów A 1.44.1 lub A1.44.2 oraz odwrotnych starterów A2.3R lub A2.4R we wszystkich zgodnie z kierunkiem transkrypcji i w kierunku przeciwnym kombinacjach stosując DNA Photorhabdus W-14 jako matrycy. W innym zestawie reakcji startery A2.1 lub A2.2 zostały użyte jako zgodne z kierunkiem, a A1.44.1R i A1.44.2R ji&o przeciwne do kierunku we wszystkich kombinacjach zgodnie z kierunkiem i przeciwnie. Tylko w reakcjach zawierających A 1.44.1 lub A 1.44.2 jako zgodne startery w połączeniu z A2.3R jako startery odwrotne, obserwowano nieprzypadkowo zamplifikowany produkt o przybliżonej wielkości 1400 par zasad (ruchliwość w żelach agarowych). Kolejność starterów użytych do uzyskania tego produktu amplifikacji wskazuje, że fragment peptydu TcdAi-PK44 leży amino proksymalnie w stosunku do fragmentu 58 kDa TcdA,,,.
186 242
Produkty PCR o 1400 parach zasad wligowano do wektora plazmidowego pCR™II (Invitrogen, San Diego, CA) zgodnie z instrukcją, a sekwencje DNA między końcami wprowadzonych fragmentów czterech izolatorów określono używając startery wskazanych przez producenta i metody sekwencjonowania opisane wcześniej. Sekwencje wszystkich izolatorów różniły się zgodnie z przewidywaniami, w rejonach odpowiadających sekwencjom zdegenerowanych starterów, lecz sekwencje aminokwasowe wyznaczone na podstawie tych danych były takie same jak rzeczywiste, wcześniej określone, sekwencje aminokwasowe peptydów , (SEQ ID NO:41 i 39).
W wyniku przeszukiwania kosmidowej biblioteki genomowej W-14 jak opisano w przykładzie VIII przy pomocy znakowanej radioaktywnie sondy zawierającej DNA otrzymane powyżej (SEQ iD NO:36) wykryto pięć hybrydyzujących kosmidowych izolatorów nazwanych 17D9, 20B10, 21D2, 27B10 i 26D1. Kosmidy te różniły się od uprzednio zidentyfikowanych za pomocą sond odpowiadających genom opisanym jako SEQ iD NO: 11 lub SEQ ID NO:25. Analiza enzymami restrykcyjnymi i analiza biotów hybrydyzacji DNA wykazała trzy fragmenty EcoRI o przybliżonych wielkościach 3,7, 3,7 i 1,1 tys. par zasad, które obejmowały region zawierający DNA SEQ ID NO:36. W wyniku przeszukiwania kosmidowej biblioteki genomowej W-14 przy użyciu jako sondy znakowanego radioaktywnie 1,4 tys. par zasad fragmentu DNA otrzymanego w tym przykładzie zidentyfikowano pięć takich samych kosmidów (17D9, 20B10, 21D2, 27B10 i 26d1). Bioty hybrydyzacji DnA z DNA kosmidowym trawionym EcoRI pokazują hybrydyzację z tą samą podgrupą fragmentów EcoRI jak obserwowano przy sondzie genu TcdA,,, 2,5 tys. par zasad wskazujących, że oba fragmenty są kodowane przez genomowy DNA.
Określenie sekwencji DNA sklonowanych fragmentów EcoRI pokazało nieprzerwaną ramkę odczytu o 7551 par zasad (SEQ ID NO:46), kodującą białko 282,9 kDa zawierające 2516 aminokwasów (SEQ ID NO:46). Analiza sekwencji aminokwasowej tego białka wykazała wszystkie oczekiwane wewnętrzne fragmenty peptydów TcdAii (SEQ ID NO: 17, 18, 37, 38, 39) i peptyd N-końcowy TcdA^ (SEQ ID NO:41) i wszystkie peptydy wewnętrzne TcdA„, (SEQ ID NO:42 i 43). Peptydy wyizolowane i określone jako TcdA,j i TcdAii są produktem otwartej ramki odczytu, nazwanej tcdA określonej jako SEQ ID NO:46. Następnie SEQ ID NO:47 pokazuje, zaczynając od pozycji 89 sekwencję ujawnioną jako SEQ ID NO: 13, która jest sekwencją N-końcową peptydu o wielkości około 201 kDa, co wskazuje że białko początkowe otrzymywane z SEQ iD NO: 46 jest poddane obróbce w ten sam sposób co opisane wyżej przy sEq ID NO: 12. Dodatkowo białko jest następnie cięte, aby wytworzyć produkt o wielkości 209,2 kDa, kodowany przez SEQ ID NO: 48 i przedstawiony jako SEQ ID NO: 49 (peptyd TcdA„) i produkt o wielkości 63,5 kDa kodowany przez SEQ ID NO:50 i przedstawiony jako SEQ ID NO:51 (białko TcdAi,). Sądzi się więc, że działanie owadobójcze zidentyfikowane jako toksyna A (przykład XV) otrzymywane z produktów SEQ ID NO:46, jakim jest przykładowo białko o pełnej długości 282,9 kDa określone jako SEQ ID NO: 47 jest poddane dalszej obróbce do wytworzenia peptydów określonych jako SEQ ID NO: 49 i 51. Sądzi się więc, że działanie owadobójcze zidentyfikowane jako toksyna B (przykład XV) otrzymywane z produktów SEQ ID NO:11, jakim jest przykładowo białko o pełnej długości 280,6 kDa określone jako SEQ ID NO: 12. To białko jest poddane obróbce proteolitycznej w celu wytworzenia peptydu 207,6 kDa określonego jako SEQ ID NO: 53, który jest kodowany przez SEQ ID NO: 52 i peptydu 62,9 kDa mającego sekwencję N-końcową określoną jako SEQ ID NO: 40, a następnie określoną jako SEQ ID NO:55, która jest kodowana przez SEQ ID NO: 54.
Porównywanie sekwencji aminokwasowych białek określonych jako SEQ ID NO: 12 i SEQ ID NO:47 wykazało, że wykazują one 69% podobieństwa i 54% identyczności. Tak duży stopień pokrewieństwa ewolucyjnego, nie jest jednakowy w obrębie całej sekwencji aminokwasowej tego białka, ale jest wyższy w kierunku końca tego białka, zakończonego grupą karboksylową, gdyż peptydy ujawnione jako SEQ ID NO:51 (otrzymana z SEQ ID NO:47) i SEQ ID NO:55 (z SEQ ID NO: 12) mają 76% podobieństwa i 64% identyczności.
186 242
Przykł-0 XVIII
Kontrola omacnicy prosowi-nki (Ostrinia nubilalis) o0powie0yi-loej za niszczenie liści kukurydzianych prowr0aoo- przez rozpylenie bulionu zawierającego Photorhabdus (d0mison W-14).
Zdolność toks^y) z Photorhabdus do zmniejszenia zniszczenia roślin spowodowanego przez larwy owadów została zademonstrowana przez zmierzenie zniszczenia liścia przez omacnicę prosowi-nkę (Ostrinia nubilalis) umieszczoną na kukurydzy i poddaną działaniu bulionu Photorhabdus. Bulion fermentacyjny szczepu W-14 Photorhabdus wyprodukowano i zatężono około 10krotnie przez ultra filtrowanie (rozmiar por do masy cząst. 10,030) jrk opisano w przykładzie X///. Otrzymany zatężony bulion hodowlany został sterylizowano przez filtrację przy użyciu filtrów z nitrocelulozową membraną 0,2 mikrona. Podobnie przygotowaną próbkę nieyzezeoiooej pożywki 2% Proteose Peptone #3 użyto jako kontroli. Rośliny kukurydzy 3DowElrned zastrzeżona wsobna linia) wyhodowano z nasion do 7 lub 8 stadium wegetacyjnego w pojemnikach zawierających mieszankę bezglebową w szklarni (w dzień 27°C; nocą 22°C, około 50% RH, 54-go0zinoy dzień, podlewana/nawożona zgodnie z potrzebami). Rośliny testowe ułożono w losowo dobranych pełnych blokowych układach (3 pdwtórzrnis/trsktowsnie, 6 rdślin/trnktownoie) w szklarni o temperaturze około 22°C w dzień; nocą 18°C, bez sztucznego oświetlenia i z częściowym zacienieniem, przy około 50% RH podlewanie, nawożenie zgodnie z potrzebami. Pd0dnwnnie działaniu (pożywki oieszczepidne i zatężony bulion hodowlany Photorhabdus) rozpylono, rozpylaczem strzykawkowym, nnooszdnd 2,0 ml bezpośrednio (z około 15 cm (6 cali)) na okółek i dodatkowe 2,0 ml okrężnym ruchem z wysokości około 25 cm (1 stopy) nad okółkiem. Dodatkowo w jednej grupie roślin nie przeprowadzono tego oprysku. Po wyschnięciu oprysków (przez około 30 min.), dwanaście świeżo wylęgłych larw omacnicy prosowi-nki (Ostrinia nubilalis) (jaja pozyskane ze źródeł komercyjnych i wylęgłe w hodowli) nanoszono bezpośrednio na okółek. Po upływie tygodni- zmierzono straty liści u roślin przy użyciu zmodyfikowanej skali Tuthrie'aXXI, a wyniki porównano statystycznie (test C (LSD) P<0,05 i ytudeotyzowanych rang Tukey'n (HSD) Test P < 0,1). Wyniki przedstawiono w tabeli nr 28. W odniesieniu do oznaczeń liczbowych, wynik 1 wskazuje na brak uszkodzeń, wynik 2 wskazuje na drobne uszkodzenia typu „szyba dkiroon” na nie zwiniętym liściu bez uszkodzenie żyłek, r wynik 5 wskazuje nr przedziurawienie liścia z wydłużonymi uszkodzeniami i/lub uszkodzenia środkowego nerwu liścia na co najmniej trzech liściach (uszkodzenia < 2,5 cm). Te dane dowodzą że bulion hodowlany lub inne frakcje zawierające białka mogą zapewnić ochronę przeciw poszczególnym owadom, gdy zostaną dostarczone w postaci preparatu do rozpylania lub kiedy gen lub jego pochodne, kodujące białko lub jego część, są dostarczane przez roślinę transgeoiczoą lub mikroorganizm.
Tabela 28
Wpływ bulionu hodowlanego Photorhabdus nn uszkodzenia liści kukurydzy powodowane przez omacnicę prosowi-nkę (Ostrinia nubilalis)
Traktowanie Przeciętne wyniki Tuthrie'a
Brak traktowania 5.02-
Aieyzearpidoa pożywka 5.15-
bulion hodowlany Photorhabdus 2.24b
Średnie o różnych literach różnią się statystycznie (p < 0,05 lub p < 0,1)
Przykład XIX
Inżynieria genetyczna genów w celu uzyskania ekspresji w E. coli
Podsumowanie konstrukcji.
W celu uzyskania ekspresji genu tcbA Photorhabdus W-14 w Escherichia coli skonstrudwaod serie plrzmidów. Lista plaami0ów jest pokazana w tabeli nr 29. Załączono krótki opis krżOej konstrukcji jak i podsumowanie pozyskanych danych o ekspresji w E. coli.
186 242
Tabela 29
Wyrażenie plazmid dla genu tcbA
Plazmid Gen Wektor/selekcja Przedział
pDAB634 tcbA pBC/Chl W ewnątrzkomórkowo
pAcGP67B/tcbA tcbA PAcGP67B/Amp Wydzielanie, Baculovirus
pDAB635 tcbA pET27b/Kan Okołopazmatycznie
pET15 - tcbA tcbA pET15 - tcbA Wewnątrzkomórkowe»
Skróty: Kan = Kanamycyna, Chi = chloramfenikol, Amp = ampicylina
Konstrukcja pDAB634
W przykładzie IX opisano duży fragment EcoRI, który hybrydyzuje z sondą TcbA, Ten fragment subklonowano z pBC (Stratagene, La Jolla, CA). Analiza sekwencji wykazała, że ten fragment składa się z 8816 par zasad. Fragment obejmuje gen tcbA wraz z początkowym ATG w pozycji 571 i końcowym TAA w pozycji 8086. Ten fragment przenosi zatem 730 par zasad DNa z Photorhabdus powyżej ATG i 730 pary zasad poniżej TAA.
Konstrukcja plazmidu pAcGP67B/tcbA
Gen tcbA amplifikowano metodą PCR stosując następujące startery:
starter 5' (SIAc51) 5' TTT AAA CCA TGG GAA ACT CAT TAT CAA GCA CTA TC
3' i starter 3' (S1Ac31) 5' TTT AAA GCG GCC GCT TAA CGG ATG GTA TAA CGA ATA TG 3'. PCR wykonano stosując zestaw TaKaRa LA PCR z PanVera (Madison, Wisconsin) w następującej reakcji: 57,5 ml wody, 10 ml 10 x bufor LA, 16 ml dNTPs (2,5 mM każdy roztwór wyjściowy), 20 ml każdego startera o stęż 10 pmoli/ml, 300 ng plazmidu pDAB634 zawierającego gen tcbA W-14 i 1 ml polimerazy Taq TaKaRa LA. Warunki cyklicznych zmian były następujące 98°C/20 sek., 68°C/5 min, 72°C/10 min. przez 30 cykli. Produkt PCR o spodziewanej wielkości 7526 par zasad wyizolowano z 0,8% żelu agarowego w buforze TBE (100 mM Tris, 90 mM kwasu borowego, 1 mM EDTA) i oczyszczono stosując zestaw Qiagen II z Qiagen (Chatsworth, Kalifornia). Oczyszczony gen tcbA trawiono Ncol i Notl i wligowany do baculowirusowego wektora transferowego pAcGP67B (PharMingen (San Diego, Kalifornia) i transformowano nim DH5a E. coli. Gen tcbA został następnie wycięto z pAcGP67B i przeniesiono do pET27b aby utworzyć plazmid pDAB635. Mutacja sensu w genie tcbA została naprawiona w pDAB635.
Naprawiony gen tcbA zawierał dwie zmiany w stosunku do sekwencji pokazanej w SEQ ID NO:11, A>G w pozycji 212 zmieniająca resztę asparaginy 71w seryny 71 i G>A w 229 zmieniająca resztę alaniny 77 w treoniny 77. Obie zmiany nastąpiły w górę od omawianego N-końca TcbAjj.
Konstrukcja pET15-tcbA
Kodujący rejon pDAB635 genu tcbA przeniesiono do wektora pET15b. Zostało to dokonane przy użyciu ligacji wielokierunkowej, DNA pocięto enzymami restrykcyjnymi Ncol i Xhol. Uzyskany produkt rekombinacji nazwano pET15-tcbA.
Ekspresja z plazmidu pET15-tcbA, TcbA w E. coli.
Ekspresję tcbA w E. coli uzyskano przez modyfikację znanej metody. Kompetentne komórki E. coli szczep BL21(DE3) transformowano pET15-tcbA i wysiano na pożywce agarowej LB zawierającej 100 pg/ml ampicyliny i 40 mM glukozy. Transformowane komórki wysiano do gęstości kilkuset oddzielnych kolonii na szalkę. Po całonocnej inkubacji w temperaturze 37°C komórki zebrano z szalek i zawieszono w pożywce LB zawierającej 100 pg/ml ampicyliny. Typowe objętości hodowli to 200-500 ml. W czasie zero gęstość hodowli (OD600) wynosiła od 0,05-0,15 zależnie od eksperymentu. Hodowle wytrząsano w jednej z trzech temperatur (22°C, 30°C, 37°C) aż do osiągnięcia gęstości 0,15-0,5 kiedy to podano im 1 mM izopropylotio-P-galaktozę (IPTG). Hodowle inkubowano w określonej temperaturze przez 4-5 godzin, a następnie przeniesiono do 4°C do momentu dalszej obróbki (12-72 godz.)
Oczyszczanie i charakteryzacja TcbA ulegającego ekspresji w E. coli z plazmidu pET15-tcbA.
186 242
Hodowle E. coli prowadzące ekspresję peptydu TcbA poddano następującej obróbce. Komórki zbierano przez wirowanie w 17,000 x g i pożywkę zdekantowano, i zachowano w osobnym pojemniku.
Pożywkę zatężono około 8-krotnie przy użyciu systemu filtrującego M12 (Amicon, Beverly Ma) i filtra zatrzymującego cząsteczki o masie cząsteczkowej 100 kDa. Tak zatężoną pożywkę wprowadzono na kolumnę anionowymienną i związane białka wymyto 1,0 M NaCl. Stwierdzono, że pik wymywania 1,0 NaCl powoduje śmiertelność larw europejskiej kukurydzianej stonki korzeniowej (SCR) (tabela 30). Frakcję 1,0 M NaCl zdializowano przez 10 mM buforowym fosforanem sodu pH 7,0 i poddano filtracji w żelu Sepharose CL-4B (Pharmacia, Piscataway, New Jersey). Obszar wymycia CL-4B odpowiada obliczonej masie cząsteczkowej (około 900 kDa) jako naturalnej dla kompleksu toksyn W-14, który zebrano i zatężono, i przetestowano na larwach. Stwierdzono, że zebrana frakcja 900 kDa ma działanie owadobójcze (patrz tabela 30) podobne do tego jakie powoduje kompleks W-14. Frakcję tę poddano działaniu proteinazy K i obróbce cieplnej, w obu przypadkach aktywność była zniesiona lub obniżona, co świadczy o tym, że ta aktywność ma charakter białkopodobny. Dodatkowo ta aktywna frakcja była immunologicznie pozytywna względem białek TcbA i TcbAu; w analizie immunologicznego przeniesienia na filtr z przeciwciałem monoklonalnym anty-TcbAui (tabela 30).
Tabela 30
Wyniki immunologiczne i Poznaczenia kukurydzianej stonki korzeniowej SCR
Frakcja Działanie przeciwko SCR Test immunologiczny Naturalna wielkość
% śmiertelności % zahamowania wzrostu wykryte białka wielkość oszacowana CL-4B
1,0 M Pożywka TcbA +++ +++ TbcA
Wymiana jonowa +++ +++ TcbA, TcbA,,, ~900 kDa
Pożywka CL-4B TcbA +++ +++ NT
Pożywka CL-4B TcbA + proteinaza K ++ - NT
Pożywka CL-4B TcbA + obróbka cieplna -
Sup. komórk. CL-4B TcbA - +++ NT ~900 kDa
PK = działanie proteinazy K przez 2 godz.; ciepło = 100°C przez 10 min. ND = nie wykryty; NT = nie badany. System oceniania śmiertelności i zahamowania wzrostu w porównaniu z próbkami kontrolnymi; 5-24% = 25-49% = „+ +”, 50-100% = „+ + +”.
Osad komórek ponownie zawieszono w 10 mM buforze fosforanu sodu, pH 7,0, i poddano lizie przez przepuszczanie przez nebulizer komórkowy Bio-Neb™ (Glass-Col Inc., Terra Haute, IN). Osady poddano działaniu DNAzy, aby usunąć DNA i wirowano przy 17,000 x g aby oddzielić osad komórkowy od supematantu komórkowego. Frakcję supematantu zdekantowano i przefiltrowano przez filtr 0,2 mikrona aby usunąć większe cząsteczki, i poddano chromatografii anionowymiennej. Związane białka wymyto 1,0 M NaCl, zdializawana i zatężono przy użyciu koncentratorów Biomax™ (Dillipare Corp, Bedford, MA) z zatrzymaniem cząsteczek o masie cząsteczkowej 50,000 daltonów. Zatężoną frakcję poddano żelowej filtrującej chromatografii przy użyciu podłoża perełkowego Sepharose CL-4B. Dane z oznaczenia biologicz186 242 nego otrzymanego w ten sposób materiału przedstawiono w tabeli nr 30 i określono jako „Sup. komórk. CL-4B TcbA”.
W innym sposobie, w przypadku posługiwania się dużymi ilościami materiału, osady komórkowe ponownie zawieszano w 10 mM buforze fosforanu sodu, pH = 7,0 i całkowicie homogenizowano przez zastosowanie 40 ml młynka do tkanek Kontes Glass Company (Vineland, NJ). Pozostałości komórkowe osadzono przez wirowanie przy 25,000 x g, a supernatant komórkowy zdekantowano, przepuszczono przez filtr 0,2 mikrona i poddano chromatografii anionowymiennej przy użyciu kolumny Pharmacia 10/10 wypełnionej perełkami Poroś HQ 50. Związane białka wymywano gradientem NaCl 0,0 do 1,0 M. Frakcje zawierające białko TcbA połączono i zatężono przy użyciu koncentratora 50 kDa i poddano żelowej filtrującej chromatografii Pharmacia CL-4B ze złożem perełkowym. Frakcje zawierające oligomer TcbA, o masie cząsteczkowej około 900 kDa, zebrano i poddano chromatografii anionowymiennej przy użyciu kolumn Pharmacia Mono Q 10/10 i zrównoważonych buforem 20 mM Tris pH - 7,3. W celu wymycia rekombinowanego białka TcbA zastosowano gradient NaCl od 0,0 do 1,0 M. Zrekombinowane białko wypłukano z kolumny przy NaCl o stężeniu około 0,3 - 0,4 M, przy tym samym stężeniu molowym, przy którym jest wymywany oligomer TcbA z kolumny Mono Q 10/10. Zrekombinowana frakcja TcbA powoduje śmiertelność kukurydzianej stonki korzeniowej SCR w eksperymentach podobnych do tych opisanych w tabeli 30.
1 patenty US nr 4,945,050, dla Cornell i 5,141,131, dla DowElanco “ patenty US nr 5,177,010, dla University of Toledo, 5,104,310, dla Texas A&M, europejskie zgłoszenie patentowe nr 0131624B1, europejskie zgłoszenia patentowe 120516, 159418B1 i 176,112, dla Schilperoot, patenty US nr 5,149,645, 5,469,976, 5,464,763, 4,940,838 i 4,693,976, dla Schilperoot, europejskie zgłoszenia patentowe nr 116718, 290799, 320500, wszystkie dla MaxPlanck, europejskie zgłoszenia patentowe nr 604662 i 627752, dla Japan Tobacco, europejskie zgłoszenia patentowe 0267159 i 0292435 i patent US nr 5,231,019, wszystkie dla Ciba Geigy, patenty US nr 5,463,174 i 4,762,785, oba dla Calgene, i patenty US nr 5,004,863 i 5,159,185, oba dla Agracetus
US 5,302,523 i 5,464,765, oba dla Zeneca 1V WO nr 87/06614, dla Boyce Thompson Institute, 5,472,869 i 5,384,253, oba dla Dekalb, WO nr 9209696 i WO nr 9321335, oba dla PGS v K. Weising i in., w Ann. Rev. Genetics, 22,421 (1998), który włącza się jako odnośnik. v US ot 60/005,405 zarej'estrowarnym w 2dnu 13 paździeiruiki 1195 r., Jkóry włącza się jako odnośnik v“ US rn ot 4,762,785, 5,451,513 i 5,545,817, które wką:za sśę jako coinośiuki vm Europejskie zgłoszenie patentowe nr 0400246A1 i* US nr nr 4,695,455; 4,695,462; 4,861,595, które włącza się. jako odnośniki x Przykłady takiej technologii są podane między innymi w zgłoszeniu patentowym PCT WO nr 93/23998, które włącza się jako odnośnik.
xi część 2.4.1 w Current Protocols in Molecular Biology (Ausubel i wsp. wyd., John Wiley & Sons, 1994 x protokół CERES; „Restriction Fragment Lengch Polymorphism Laboratory Manual version 4.0”, rozdziały 4-40 i 4-47; CERES/NPI, Salt Lake City, UT. NPI obecnie nie istnieje, a jego działającym następcą jest Linkage Genetics x' Evans G. i G. Wahl., 1987, „Cosmid vectors for genomie walking and rapid restriction maping” w Guid to Moleculare Cloning Techniques. Meth. Enzymology, tom 152, S. Berger i A. Yimmel, ed., str. 604-610 xv Weavee L.H.. Keesee W.R. i Matthews B.W.. 1177, J. MoL BioL 111, 119-132 xv Famme 2^. 1194 Berge/' Manuaa of Ssyiemntic BaaCeriology, vd 1. pp 510 · 511; ed. Kreig KR. i Hoii J.G.; Williams & Wilkins, Baltimore.; Akhurst and Boemare, 1988, Boemare i in., 1993 xvi Akhurst R.J. i Boemare N.E., 1990, Entomopathogenic Nematodes in Biological Control; wyd. Gaugler R. i Kaya H.; str. 75-90. CRC Press, Boca Raton, USA; Baghdiguian S., Boyer-Giglio M.H., Thaler J.O., Bonnot G., Boemare N., 1993. Biol. Cell 79, 177 - 185). Zabarwienie kolonii badano po 5 - 7 dniach hodowli na agarze odżwyczym Bacto (Difco Laboratories, Detroit, MI
186 242 'vu Tomabene T.C., 1985, Lipid Analysis and the Relationship to Chemotaxonomy in Methods in Microbiology, vol 18, 209-224; Goodfellow M. i O'Donnell A.G. 1993, Roots of Bacterial Systematics in Handbook of New Bacterial Systematics (ed. Goodfellow M. i O'Donnell A.G.) str. 3-54, Londyn: Academic Press Ltd.), artykuły te są zamieszczone w obrębie odnośników literaturowych mniejszego zgłoszenia χν“ przegląd: Versalovic J., Schneider M., De Bruijn F .J. i Lupski J.R., 1994, Methods Mol. Celi . Biol, , 5), 25410 x“ Versalovic J., Koeuth T. i Lupski J.R., 1991, Nucleic Acids Res. 19, 6823-6831; Vera Cuz; C.M,, HaldaAlija L., Louws F., Skinner D.Z., George M.L., Nelson R.J., De Bruijn F.J., Rice C. iLeach J.E., 1996, Phytopatology (w druku) xx Rosę, R. 1.1 McCabe, J.M. (1973). J.Econ. E^n^t^c^m^ol. 66, (398-400)
K^^^ie:L M.G,. Beland, G.L,, Bosman. C,. Carozzii, N.B,, Crenshaw, R. Crossland, L. Dawson, J.Desai. N. Hill,
M., Kadwell, S. Launis, K., Lewis, K., Maddox, D. McPherson, K., Meghji, M.Z., Merlin, E. Rhodes, R., Warren, G. W., Wright, M. i Evola, S.V. 1993, Bic/Technclcgy, 11, 194-195.
Μη Studier, F.W., Rosenberg, A., Dunn, J., i Dubendorff, J., (1990). Użycie poUmierazy T7 RNA do kierowania wyrażaniem kołowanego genu. Metody Enzymol., 185:60-89.
186 242
Lista sekwencji ( 1 ) Informacje ogólne:
( i )Zgłaszający: Jerald C. Ensign David J. Bowen
James Petell Raymond Fatig Sue Schoonover
Richard ffrench-Constant
Gregory L. Orr
Donald J. Merlo
Jean L. Roberts
Thomas A. Rocheleau
Michael B.Blackburn Timothy D. Hey James A. Strickland (i ) Tytuł wynalazku: „Owadobójcze toksyny białkowe z Photorhabdus” (iii) Liczba sekwencji. 61 (iv) Adres do korespondencji (A) Adresat: Aarlsa & Qardy ( B ) Ulica: 1 South Pinckney Street ( C ) Miasto: Madison (D ) Stan: WI (E) Kraj: USA ( F ) Kod pocztowy: 53703 (v ) Redagowanie komputerowe:
( A ) Nośnik: dyskietka ( B ) Komputer: PC zgodny ze standardem IBM ( C ) System operacyjny: PC-DOS/MS-DOS ( D ) Program: PatentIn 1.0, wersja 1.30
186 242 vi ) Dane dotyczące bieżącego zgłoszenia:
(A) Tumer zgłoszenia:
B ) Data złożenia:
A ) Klasyfikacja:
(vii) Dane dotyczące wcześniejszego zgłoszenia:
(A) Tumer zgłoszenia: US 08/06/655 3 B ) Data złożenia: 18.05.1993 (vii) Dane dotyczące wcześniejszego zgłoszenia: 3 Ν ) Tumer zgłoszenia: US 08/395497 3 B ) Data złożenia: 28.02.1995 vii) Dane dotyczące wcześniejszego zgłoszenia: 3 A ) Tumer zgłoszenia: US 08/007255 3 B ) Data złożenia: 06.11.1995 (vii ) Dane dotyczące wcześniejszego zgłoszenia: 3 Ν ) Tumer zgłoszenia: US 08/608423 (B) Data złożenia: 28.02.1996 (vii ) Dane dotyczące wcześniejszego zgłoszenia: 3 C ) Tumer zgłoszenia: US 08/705484 (B) Data złożenia: 28.08.1996 viii) Dane dotyczące Raeeaoika/PeOodmdcoikn:
C) Imię i nazwisko: Tocholas J. Seny (B ) Tumer rejestru: 27386 3 C ) Referencje: 960296.93804 (ix ) Dane dotyczące łączności telefonicznej: (Ν) Telefon: 001 608 251-5000 (B) Faks: 001 608 251-9166
186 242 ( 2 ) Dane dla sekwencji SEK NR ID: 1;
(i) Charakterystyka sekwencji:
( A) Długość: 11 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici:
( D ) Topologia: liniowa (i) Typ cząsteczki: białko ( v ) Typ fragmentu: N-końcowy ( xi ) Opis sekwencji: SEK NR ID: 1;
Phe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn 1 5 10 ( 2 ) Dane dla sekwencji SEK NR ID: 2;
(i) Charakterystyka sekwencji.
( A) Długość: 12 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici:
( D ) Topologia: liniowa ( i ) Typ cząsteczki: białko (v) Typ fragmentu: N-końcowy ( xi) Opis sekwencji: SEK NR ID: 2;
Met Gln Asp Ser Pro Glu Val Ser Ile Thr Thr Trp 1 5 10 ( 2 ) Dane dla sekwencji SEK NR ID: 3;
(i) sekwencji:
( A ) Długość: 19 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici:
( D ) Topologia: liniowa ( ii) Typ cząsteczki: białko ( v) Typ fragmentu: N-końcowy
186 242 ( xi ) Opis sekwencji: SEK NR ID: 3;
Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg Arg Asp Ala 15 10 15 ( 2 ) Dane dla sekwencji SEK NR ID.4;
(i ) Charakterystyka sekwencji:
( A ) Długość: 14 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici:
( D ) Topologia: liniowa ( ii ) Typ cząsteczki: białko (v) Typ fragmentu: N-końcowy ( xi ) Opis sekwencji: SEK NR ID: 4;
Ala Ser Pro Leu Ser Thr Ser Glu Leu Thr Ser Lys Leu Asn 1 5 10 ( 2 ) Dane dla sekwencji SEK NR ID: 5;
(i) Charakterystyka sekwencji:
( A ) Długość: 9 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici:
( D ) Topologia: liniowa (ii) Typ cząsteczki: białko ( v ) Typ fragmentu: N-końcowy ( xi ) Opis sekwencji: SEK NR ID: 5;
Ala Gly Asp Thr Ala Asn Ile Gly Asp 1 5 ( 2 ) Dane dla sekwencji SEK NR ID: 6;
(i) Charakterystyka sekwencji:
( A ) Długość: 15 aminokwasów ( B ) Typ: aminokwas (C ) Rodzaj nici: pojedyncza
186 242 (D) Topologia: liniowa ( ii ) Typ cząsteczki: białko ( v ) Typ fragmentu: N-końcowy ( xi ) Opis sekwencji: SEK NR ID : 6;
Leu Gly Gly Ala Ala Thr Leu Leu Asp Leu Leu LeuPro Gln Ile 15 10 15 ( 2 ) Dane dla sekwencji SEK NR ID: 7;
(i) Charakterystyka sekwencji:
(A) Długość: 11 aminokwasów (B ) Typ: aminokwas (C ) Rodzaj nici:
(D ) Topologia: liniowa (ii ) Typ cząsteczki: białko ( v ) Typ fragmentu: N-końcowy ( xi ) Opis sekwencji: SEK NR ID: 7;
Met Leu Ser Thr Met Glu Lys Gln Leu Asn Glu 1 5 10 ( 2 ) Dane dla sekwencji SEK NR ID:8;
(i) Charakterystyka sekwencji:
(A ) Długość: 9 aminokwasów (B ) Typ: aminokwas (C ) Rodzaj nici:
( D ) Topologia: liniowa ( ii ) Typ cząsteczki: białko ( v ) Typ fragmentu: N-końcowy ( xi) Opis sekwencji: SEK NR ID: 8;
Met Asn Leu Ala Ser Pro Leu Ile Ssr 1 5
86 242 ( 2 ) Dane dla sekwencji SEK NR ID: 9;
(i) Charakterystyka sekwencji:
( A ) Długość: 16 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici.
(D) Topologia: liniowa (i) Typ cząsteczki: białko (v) Typ fragmentu: N-końcowy ( xi) Opis sekwencji: SEK NR ID: 9;
Met Ile Asn Leu Asp Ile Asn Glu Gln Asn Lys Ile Met Val Val Ser 15 10 15 (2) Dane dla sekwencji SEK NR ID: 10;
(i) Chiarakterystyka sekwencji:
(A ) Długość: 20 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici:
(D) Topologia: liniowa ( ii ) Typ cząsteczki: białko (v) Typ fragmentu. N-końcowy (xi) Opis sekwencji: SEK NR ID: 10;
Ala Ala Lys Asp Val Lys Phe Gly Ser Asp Ala Arg Val Lys Met Leu 15 10 15
Arg Gly Val Asn 20 ( 2 ) Dane dla sekwencji SEK NR ID: 11;
(i) sekwencji:
(A) Długość: 7515 par zasad (B ) Typ: kwas nukleinowy ( C ) Rodzaj nici: podwójna (D) Topologia: liniowa
186 242 (ii ) Typ cząsteczki: Dna ( genomow) (ix) Cechy:
( A ) Nazwa/Klucz: CDS ( B ) Położenie: 1 ..7515 (xi) Opis sekwencji: SEK NR ID: 11;
ATG CAA AAC TCA GTA TCA AGC ACT ATT LAT ACT ATT TCG* LAG GCA Lys 15 LTG Iluj 44
Mec Gln 1 Asn S ee Lse 5 Ser Ser lTr IIu Asp 10 TCr IIu ces Glu
CAA TTA ACT TGT CCC GCG GJd AAT CGT 1115 ^gcc TTT GAT ACC ę-yc 35
Gln Leu Thr Cys Prr Ala Glu IIu Alu Leu Tys Pro pre Act The Phe
20 25 30
CGG GAA .We AAT ccg; TCA ATT CTT LAT LTG cgg; Gźd GGA Aid GCG ery* 144
Arg Glu Lys Thr Arg Gly Met Val Ast Lep Gly Glu Ala Lys Acp IIu
35 40 45
TAT GAA ATA1 GCA CCA GcG Gid CAG GAT CTC CAC CTA CCT CAT GCA CCd 192
Tyr Glu Ile Ala Gln Ala Glu G1u Act CaP Asn Leu Llu His Glu Lys
50 55 60
CGT ATT TTT GGC TAT GGT LAT CCC ccc ccc CATl CCT CGT CGT CCG im 24 T
Arg Ile Phe Ala Tys Alu Asn Prr Lsu Lse Lys TC»n Aia Val Arg Llu
186 242
70 75 30
GGT ACC CGG CAA ATG TTG GGT TTT ATA CAA GGT TAT AGT GAT CTG TTT 283
Gly Thr Arg Gln Mec Leu Gly Phe Ile Gln Gly Tyr Ser Asp Leu Phe
35 90 95
OCrT AAT CGT GCT GAT AAC TAT GCC GCG CCG GGC TCG GTT GCA TCG ATG 335
Gly Asn Arg Ala Asp Asn Tyr Ala Ala Pro Gly Ser Val Ala Ser Mec
100 105 110
Trc TCA CCG gCg GCT TAT TTG ACG GAA TTG TAC CGT GAA GCC AAA AAC 334
Phe Ger Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Lys Asn
115 120 125
TTG CAT GAC AGC AGC TCA ATT TAT TAC CTA GAT AAA CGT CGC CCG GAT 432
Leu His Asp Ser Ser Ser Ile Tyr Tyr Leu Asp Lys Arg Arg Pro Asp
130 135 140
TTA GCA AGC TTA ATG CTC AGC CAG AAA AAT ATG GAT GAG GAA ATT TCA 430
Leu Ala Ger Leu Met Leu Ser Gln Lys Asn Met Asp Glu Glu Ile Ser
145 150 155 160
ACG CTG GCT CTC TCT AAT GAA TTG TGC CTT GCC GGG ATC GAA ACA AAA 523
Thr Leu Ala Leu Ser Asn Glu Leu Cys Leu Ala Gly Ile Glu Thr Lys
155 170 175
ACA GGA AAA TCA CAA GAT GAA GTG ATG GAT ATS TTG TCA ACT TAT CGT 576
Thr Gly Lys Sei Gln Asp Glu Val Met Asp Mec Leu Ser Thr Tyr Arg
130 185 190
TTA AGT GGA GAG ACA CCT TAT CAT CAC GCT TAT GAA ACT GTT CGT GAA 624
Leu Ger Gly Glu Thr Pro Tyr His His Ala Tyr Glu Thr Val Arg Glu
195 200 205
ATC GTT CAT CAA CGT GAT CCA GGA TTT CCT CAT TTG TCA CAG GCA CCC 672
Ile Val His Glu Arg ASp Pro Gly Phe Arg His Leu Ser Gln Ala Pro
210 215 220
ATT GTT GCT GCT AAG CTC GAT CCT V l ACT TTG TTG GGT ATT AGC TCC 720
Ile Val Ala Ala Lys Leu Asp Pro Val Thr Leu Leu Gly Ile Ser Ser
225 230 235 240
CAT ATT TCG CCA GAA CTG TAT AAC TTG CTG ATT CAG GAG ATC CCG GAA 753
His Ile Ser Pro Glu Leu Tyr Asn Leu Leu Ile Glu Glu Ile Pro Glu
245 250 255
AAA GAT GAA GCC GCG CTT GAT ACG CTT TAT AAA ACA AA.C TTT GGC GAT 816
Lys Asp Glu Ala Ala Leu Asp Thr Leu Tyr Lys Thr Asn Phe Gly Asp
260 265 210
ATT ACT ACT GCT CAG TTA ATG TCC CCA AGT TAT CTG GCC CGG TAT TAT 364
Ile Thr Thr Ala Gln Leu Met Ser Pro Ser Tyr Leu Ala Arg Tyr Tyr
275 280 235
GGC GTC TCA CCG GAA GAT ATT GCC TAC GTG ACG ACT TCA TTA TCA CAT 312
Gly Val Ser Pro Glu Asp Ile Ala Tyr Val Thr Thr Ser Leu Ser His
290 295 300
GTT GGA TAT AGC AGT GAT ATT CTG GTT ATT CCG TTG GTC GAT GGT GTG 960
Val Gly Tyr Ser Ser Asp Ile Leu Val Ile Pro Leu Val Asp Gly Val
3 05 310 315 320
CGT AAG ATG GAA GTA GTT CGT GTT ACC CGA ACA CCA TCG GAT AAT TAT 1003
Tly Lys Met Glu Val Val Arg Val Thr Arg Thr Pro Ser Asp Asn Tyr
325 330 335
186 242
ACC Thr AGT Ser CAG Gln ACG AAT TAT Tyc ATT Ile GAG Glu CTG Leu 345 TAT CCA CAG GGT GGC GAC AAT Asn 1056
Thr 34C Asn Tyr Pro Gln Gly Gly 350 Asp
TAT TTG ATC AAA TAC AAT CTA AGC AAT AGT TTT GGT TTG GAT GAT TTT 1104
Tyr Leu Ile 355 Lys Tyr Ąsn Leu Ser 350 Asn Ser rhe Gly Leu 355 Asp Asp Phe
TAT CTG CAA TAT AAA GAT GGT TCC CCT GAT TOG ACT GAG ATT GCC CAT 1152
Tyr Leu 370 Gln r/r Lys ASP Gly 375 Ser Ala Asp Trp Thr 380 Glu Iie Ala His
AAT CCC TAT CCT GAT ATG GTC ATA AAT CAA AAG TAT GAA TCA CAG GCG 1200
Asn 335 Pro Tyr pro Ass Met 390 Val Ile Asn Gln Lys 395 Tyr Glu Ser Gln Ala 400
ACA ATC AAA CGT AGT GAC TCT GAC AAT ATA CTC ACT ATA GGG TTA CAA 1243
Thr Ile Lys Arg ser 405 ASP ser Asp Asn Iie 410 Leu Ser Ile Gly Leu 415 Gln
AGA TGG CAT AGC GGT AGT TAT AAT TTT GCC GCC GCC AAT TTT AAA ATT 1296
Arg Trp HIS Ser 420 Gly ser Tyr Asn Phe 425 Ala Ala Ala Asn Phe 430 Lys Ile
GAC CAA TAC TCC COO AAA GCT TTC CTG CTT AAA ATG AAT AAG GCT ATT 1344
Asp Gln Tyr 435 ser pro Lys Ala Phe 440 Leu Leu Lys Mec Asn 445 Lys Ala Ib
CGG TTG CTC AAA GCT ACC GGC CTC TCT TTT GCT ACG TTG GAG CGT ATT 1392
Arg Leu 450 Leu Lys Ala Thr Gly 455 Leu Ser Phe Ala Thr 460 Leu Glu Arg Ile
GTT GAT AGT GTT AAT AGC ACC AAA TCC ATC ACG GTT GAG GTA TTA AAC 1440
val 465 ASp ser Val Asn Ser 470 Thr Lys Ser Ile Thr 475 Val Glu Cal Leu Asn 430
AAG GTT TAT CGG GTA AAA TTC TAT ATT GAT CGT TAT GGC ATC AGT GAA 1483
Lys val Tyr Arg Val 485 Lys Phe Tyr Ile Asp 490 Arg Tyr Gly Ile Ser 495 Glu
GAG ACA GCC GCT ATT TTG GCT AAT ATT AAT ATC TCT CAG CAA GCT GTT 1535
GlU Thr Ala Ala 500 Ile Leu Ala Asn Ile 505 Asn Ile Ser Gln Gln 510 Ala Val
GGC AAT CAG CTT AGC CAG TTT GAG CAA CTA TTT AAT CAC CCG CCG CTC 1584
Gi/ Asn Gln 515 Leu Ser Gln Phe Glu 520 Gln Leu Phe Asn His 525 Pro Pro Leu
AAT GGT ATT CGC TAT GAA ATC ACT GAG GAC AAC TCC AAA CAT CTT CCT 1632
Asn Gly 530 Ile Arg Tyr Glu Ile 535 Ser Glu Asp Asn Ser 540 Lys His Leu Pro
AA.T CCT GAT CTG AAC CTT AAA CCA GAC AGT ACC GGT GAT GAT CAA ccc 1630
Asn 545 Pro Asp Leu Asn Leu 550 Lys Pro Asp Ser Thr 555 Gly Asp Asp Gln Arg 560
AAG GCG GTT TTA AAA CGC GCG TTT CAG GTT AAC GCC AGT GAG TTG TAT 1723
Lys Ala Val Leu Lys 565 Arg Ala Phe Gln Val 570 Asn Ala Ser Glu Leu 575 Tyr
CAG ATG TTA TTG ATC ACT GAT CGT AAA GAA GAC GCT GTT ATC AAA AAT 1775
Gln Met Leu Leu 530 Ile Thr Asp Arg Lys 535 Glu Asp Gly Val Ile 590 Lys Asn
AAC TTA GAG AAT TTG TCT CAT CTC TAT TTC CTT ACT rrc C*O GCC CAG 1024
Asn Leu Glu Asn Leu Ser Asp Leu Tyr Leu Val Ser Leu Leu Ala Gln
186 242
595 600 605
% CAT -AAC CTG ACT ATT GCT GAA TTG AAC ATT TTG TTG GTG ATT TCT 1872
Ile Hls Asn Leu Thr Ile Ala Glu Leu Asn Ile Leu Leu Val Ile Cys
610 615 620
GGC TAT GGC GAC ACC AAC ATT TAT CAG ATT ACC GAC GAT AAT TTA GCC 1920
Gly Tyr Gly Asp Thr Asn Ile Tyr Gln Ile Thr Asp Asp Asn Leu Ala
625 630 535 540
AAA ATA GTG GAA ACA TTG TTG TGG ATC ACT CAA T Gg TTG AAG ACC CAA 1363
Lys Ile Val Glu Thr Leu Leu Trp Ile Thr Gln Trp Leu Lys Thr Gln
645 650 655
AAA TCG ACA GTT ACC GAC CTG TTT CTG ATG ACC ACG GCC ACT TAC ACC 2016
Lys Trp Thr Val Thr Asp Leu Phe Leu Met Thr Thr Ala Thr Tyr Ser
660 665 67 0
ACC ACT TTA ACG CCA GAA ATT AjGC AAT CTG ACG GCT ACG TTG TCT TCA 2064
Thr Thr Leu Thr Pro Glu Ile Ser Asn Leu Thr Ala Thr Leu Ser Ser
575 530 635
ACT TTG Cm DGC AAA GAG AGT CTG ATT GGG GAA GAT CTG AAA AGA GCA 2112
Thr Leu His Gly Lys Glu Ser Leu Ile Gly Glu Asp Leu Lys Arg Ala
690 595 700
ATG GCG CCT TGC TTC ACT TCG GCT TTG CAT TTG ACT TCT CAA GAA GTT 2160
Mac Ala Pro Cys Phe Thr Ser Ala Leu His Leu Thr Ser Gln Glu Val
705 710 715 720
GCG TAT GAC CTG CTG TTG TGG ATA GAC CAG ATT CAA CCG GCA CAA ATA 2203
Ala Tyr Asp Leu Leu Leu Trp Ile Asp Gln Ile Gln Pro Ala Gln Ile
725 730 735
ACT GTT GAT GGG TTT TGC GAA GAA GTG CAA ACA ACA CCA ACC AGC TTG 2256
Thr Val Asp Gly Phe Trp Glu Glu Val Gln Thr Thr Pro Thr Ser Leu
740 745 750
AAG GTG ATT ACC TTT GCT CAG GTG CTG GCA CAA TTG AGC CTG ATC TAT 2304
Lys Val Ile Thr Phe Ala Gln Val Leu Ala Gln Leu Ser Leu Ile Tyr
755 760 765
CGT CGT ATT GGG TTA AGT GAA ACG GAA CTG TCA CTG ATC GTG ACT CAA 2352
Arg Arg Ile Gly Lau Ser Glu Thr Glu Leu Ser Leu Ile Val Thr Gln
770 775 730
TCT TCT CTG CTA GTG GCA GGC AAA AGC ATA CTG CAT CAC GGT CTG TTA 2400
Ser Ser Leu Leu Val Ala Gly Lys Ser Ile Leu Asp His Gly Leu Leu
735 790 795 300
ACC CTG ATG GCC TTC GAA GGT TTT CAT ACC TGG GTT AAT GGC TTG GGC 2443
Thr Leu Met Ala Leu Glu Gly Phe His Thr Trp Val Asn Gly Leu Gly
305 310 315
CAA CAT GCC TCC TTG ATA TTG GCG GCG TTG AAA GAC GGA GCC TTG ACA 2435
Gln Has Ala Ser Leu Ile Leu Ala Ala Leu Lys Asp Gly Ala Leu Thr
320 325 330
GTT ACC GAT GTA GCA CAA GCT ATG AAT AAG GAG GAA TCT CTC CTA CAA 2544
Val Thr Asp Val Ala Gln Ala Met Asn Lys Glu Glu Ser Leu Leu Gln
335 340 345
ATG GCA GCT AAT CAG GTG GAG AAG GAT CTA ACA AAA CTG ACC AGT TGG 2592
Met Ala Ala Asn Gln Val Glu Lys Asp Leu Thr Lys Leu Thr Ser Trp
350 855 350
186 242
ACA CAG ATT Ile GAC ASp GCT ATT CTG Leu CAA Gln TGG Trp TTA Leu CAG Gin 875 ATG Met TCT Ser TCG Ser GCC Ala .TG Leu 38 0 2540
Thr 865 Gln Ala lle 370
CCG GTT TCT CCA CTG GAT CTG GCA GGG ATG ATG GCC C t j AAA TAT GGG 2633
Ala Val ser Pro Leu 885 ASp Leu Ala Gly Met 890 Met Ala Leu Lys Tyr 895 Gly
ATA GAT CAT AAC TAT GCT GCC TGG CAA GCT GCG GCG GCT GCG CTG ATG 2736
Ile asp MIS Asn 300 Tyr Ala Ala Trp Gln 305 Ala Ala Ala Ala Ala 910 Leu Met
GCT GAT CAT GCT AAT CAG CCA CAG AAA AAA CTG GA.T CAG ACG TTC AGT 2734
Ala Asp His 915 Ala Asn Gln Ala Gln 920 Lys Lys Leu Asp Glu 925 Thr Phe Ser
AAG OCA TTA TGT AAC TAT TAT ATT AAT GCT GTT GTC GAT AGT GCT GCT 2332
Lys Ala 930 Leu Cys Asn Tyr Tyr 935 Ile Asn Ala val val 940 Asp Ser Ala Ala
GCA GTA CCT GAT CGT AAC GGT TTA TAT ACC TAT TTG CTG ATT CAT AAT 2330
Gly 945 Val Arg ASO Arg Asn 950 Gly Leu Tyr Thr Tvr 955 Leu Leu Ile Asp Asn 960
CAG GTT TCT GCC GAT GTG ATC ACT TCA CGT ATT GCA GAA GCT. ATC' GCC 2928
Gln Val ser Ala A5P 955 val Ile Thr ser Arg 970 Ile Ala Glu Ala Ile 975 Ala
GGT ATT CAA CTG TAC GTT AAC CCG GCT TTA AAC CGA GAT GAA GGT CAG 2976
Gly Ile Gln Leu 980 Tyr val Asn Arg Ala 985 Leu Asn Arg Asp Glu 990 Gly Gln
CTT GCA TCG GAC GTT AGT ACC CGT CAG TTC TTC ACT GAC TGG GAA CGT 3024
Leu Ala ser 995 Asp val ser Thr Arg Gln 1000 Phe Phe Thr Asp Trp 1005 Glu Arg
TAC AAT AAA CGT TAC AGT ACT TGG GCT GGT GTC TCT GAA CTG GTC TAT 3072
Tyr Asn Lys 1010 Arg Tyr Ser Thr Trp 1015 Ala Gly Val Ssr Glu 1020 Leu Val Tyr
TAT CCA GAA AAC TAT GTT GAT CCC ACT CAG CGC ATT GGG CAA ACC AAA 3120
Tyr Pro 1025 Glu Asn Tyr Val Asp 1030 Pro Thr Gln Arg Ile 1035 Gly Gln Thr Lys 1040
VTG ATG GAT GCG CTG TTC CAA TCC ATC AAC CAG AGC CAG CTA AAT GCG 3158
Met M«C Asp Ala Leu Leu 1045 Gln Ser Ile Asn Gln 1050 Ser Gln Leu Asn Ala 1055
GAT ACG GTG GAA GAT GCT TTC AAA ACT TAT TTG A.CC AGC TTT GAG CAG 3216
Asp Thr Val Glu Asp 1060 Ala Phe Lys Thr Tyr 1065 Leu Thr Ser Phe Glu 1070 Gln
GTA CCA AAT CTG AAA GTA ATT AGT GCT TAC CAC GAT AAT GTG AAT GTG 3264
Val Ala Asn Leu 1075 Lys Val Ile Ser Ala 1080 Tyr His Asp Asn Val 1085 Asn Val
GAT CAA GGA TTA ACT TAT TTT ATC GGT ATC GAC CAA GCA GCT CCG GGT 3312
Asp Gln Gly 1090 Leu Thr Tyr Phe Ile 1095 Gly Ile Asp Gln Ala 1100 Ala Pro Gly
ACG TAT TAC TGG CGT AGT GTT GAT CAC AGC AAA TGT GAA AAT GGC AAG 3 3 6J
Thr Tyr 1105 Tyr Trp Arg Ser Val 1110 Asp His Ser Lys Cys 1115 Glu Asn Gly Lys 1120
TTT GCC GCT AAT GCT TGG GGT GAG TGT AAT AAA ATT ACC tgt CCT GTC 3408
Phe Ala Ala Asn Ala Trp Gly Glu Trp Asn Lys Ile Thr Cys Ala Val
186 242
1125 1130 1135
AAT Asn CCT TGG Pro Trp AAA AAT Lys Asn 1140 ATC Ile ATC Ile CGT CCG GTT GTT Val TAT ATG Tyr Ket TCC CCC TTA 3456
Arg Pro Val 1145 Ser Arg 1150 Leu
TAT CTG CTA TGG CTG GAG CAG C.AA TCA AAG AAA AGT GAT GAT CGT AAA 3504
Tyr Leu Leu 1155 Trp Leu Glu Gln Gln 1150 ser Lys Lys Ser Asp 1155 Asp Gly Lys
ACC ACG ATT TAT CAA TAT AAC TTA AAA CTG GCT CAT ATT CGT TAC GAC 3352
Thr Thr lle 1170 Tyr Gln Tyr Asn 1175 Leu Lys Leu Ala His Ile 1130 Arg Tyr Asp
GGT AGT TGG AAT ACA CCA TTT ACT TTT GAT GTG ACA GAA AAG GTA AAA 360C
Gly Ser Trp 1135 Asn Thr Pro 119C Phe 1 Thr Phe Asp Cal 1195 Thr Glu Lys Val Lys 1200
AAT TAC ACG TCG AGT ACT GAT GCT GCT GAA TCT TTA GGG TTG TAT TGT 3643
.Asn Tyr Thr Ser ser 1205 Thr Asp Ala Ala Glu 1210 Ser 1 Leu Gly Leu Tyr 1215 cys
ACT GGT TAT CAA GGG GAA GAC ACT CTA TTA GTT ATG TTC TAT TCG ATG 3695
Thr Gly Tyr Gln Gly 1220 Glu Asp Thr Leu Leu 1225 Val Met Phe Tyr Ser 1230 Mec
CAG AGT AGT TAT ACC TCC TAT ACC GAT AAT AAT GCG CCG GTC ACT GGG 3744
Gin Ser Ser Tyr Ser 1235 Ser Tyr Thr Asp Asn 1240 Asn Ala Pro cal Thr 1245 Gly
CTA TAT ATT TTC GCT GAT ATG TCA TCA GAC AAT ATG ACG AAT GCA CAA 3792
Leu Tyr Ile 1250 Phe Ala Asp Mec Ser 1255 Ser Asp Asn Met Thr 1250 Asn Ala Gln
GCA ACT AAC TAT TGG AAT AAC AGT TAT CCG CAA TTT GAT ACT GTG ATG 3340
Ala Thr Asn 1255 Tyr Trp Asn Asn 1270 ser Tyr Pro Gln Phe Asp 1275 Thr Val Mec 1280
GCA GAT CCG GAT AGC GAC AAT AAA AAA GTC ATA ACC AGA AGA GTT AAT 3888
Ala Asp Pro Asp Ser Asp 1285 Asn Lys Lys Val Ile 1290 Thr Arg Arg val Asn 1295
AAC CGT TAT GCG GAG GAT TAT GAA ATT CCT TCC TCT GTG ACA ACT AAC 3935
Asn Arg Tyr Ala Glu 1300 Asp Tyr Glu Ile Pro 1305 ser Ser Val Thr Ser 1310 Asn
AGT AAT TAT TCT TGG GGT GAT CAC AGT TTA ACC ATG CTT TAT GGT GGT 3984
Ser Asn Tyr Ser Trp 1315 Gly Asp His Ser Leu 1320 Thr Met Leu Tyr Gly 1325 Gly
AGT GTT CCT AAT ATT ACT TTT GAA TCG GCG GCA GAA GAT TTA AGG CTA 4032
ser Val Pro 1330 Asn Ile Thr Phe Glu 1335 Ser Ala Ala Glu Asp 1340 Leu Arg Leu
TCT ACC AAT ATG GCA TTG AGT ATT ATT CAT AAT GGA TAT GCG GGA ACC 4080
Ser Thr Asn 1345 Mec Ala Leu Ser 13S0 Ile Ile His Asn Gly Tyr 1355 Ala Gly Thr 1360
CGC CGT ATA CAA TGT AAT CTT ATG AAA CAA TAC GCT TCA TTA GGT GAT 4128
Arg Arg Ile Gln Cys Asn 1365 Leu Met Lys Gln Tyr 1370 Ala Ser Leu Gly Asp 1375
AAA TTT ATA ATT TAT GAT TCA TCA TTT GAT GAT GCA AAC CGT TTT AAT 417 5 Lys Phe Ile Ile Tyr Asp Ser Ser Phe Asp Asp Ala Asn Arg Phe Asn
1380 1385 1390
186 242
CTG Leu GTT CCA TTC TTT AAA TTC CCA Gly 1400 AAA Lys ) CAC Asp CAC Glu AAC Asn TCA CAT Ser Asp 1405 GAT Asp AGT Ser 422 4
”al Pro Leu 1395 Phe Lys Phe
ATT TGT ATA TAT AAT CAA AAC CCT TCC tct CAA CAT AAG AAG TGG TAT 42_2
Ile Cys Ile Tyr 1410 Asn Glu Asn Pro 1415 Sar Ser Glu Asp Lys Lys 1420 Trp Tyr
TTT TCT TCG AAA GAT GAC AAT AAA ACA GCC CAT TAT AAT GCT CCA ACT 432'
Phe jer 1425 Ser Lys Asp Asp Asn 1430 Lys Thr Ala .Asp 1435 Tyr Asn Gly Gly Thr 1440
CAA TGT ATA GAT GCT GCA ACC ACT AAC AAA GAT TTT TAT TAT AAT CTC 436-
Gln Cys Ile Asp Ala Gly 1445 Thr Ser Asn Lys Asp 1453 Phe Tyr Tyr Asn Leu 1455
CAG GAG ATT CAA CTA ATT ACT CTT ACT cct CCC TAT TOG TCG AGT TAT 4416
Gln Glu Ile Glu Val 1460 Ile Ser Val Thr Gly 1465 Gly Tyr Trp Ser Ser 1470 Tyr
AAA ATA TCC AAC CCG ATT AAT ATC AAT ACC GOC ATT CAT ACT GCT AAA 446 4
Lys Ile Ser Asn 1475 Pro Ile Asn Ile 143C Asn 1 Thr Gly Ile Asp Ser 1435 Ala Lys
GTA AAA CTC ACC CTA AAA CCS CCT CCT CAC CAT CAA ATC ttT ACT GCT 4 512
Val Lys Val Thr 1490 Val Lys Ala Gly 1495 Gly Asp Asp Gln Ile Phe 1500 Thr Ala
GAT AAT AGT ACC TAT CTT CCT CAC CAA CCC CCA CCC AGT TTT GAG GAG 4560
Asp Asn 1505 Ser Thr Tyr Val Pro 1510 Gin Gln Pro Ala 1515 Pro Ser Phe Glu Glu 1520
ATC ATT TAT CAG TTC AAT AAC CTG ACA ATA GAT TGT AAG AAT TTA AAT 4603
Mec Ile Tyr Gin Phe Asn 1525 Asn Leu Thr Ile Asp 1530 Cys Lys Asn Leu Asn 1535
TTC ATC GAC AAT CAG GCA CAT ATT GAG ATT GAT TTC ACC GCT ACG GCA 4 656
Phe Ile Asp Asn Gln 1540 Ala His Ile Glu Ile 1545 Asp Phe Thr Ala Thr 1550 Ala
CAA GAT GGC CGA TTC TTG GGT GCA GAA ACT TTT ATT ATC CCG GTA ACT 47C4
Gln Asp Gly Arg 1555 Phe Leu Gly Ala Glu 1560 Thr Phe Ile Ile Pro 1565 Val Thr
AAA AAA GTT CTC GGT ACT GAG AAC GTG ATT GCG TTA TAT AGC GAA AAT 4752
Lys Lys Val Leu 1570 Gly Thr Glu Asn 1575 Yal Ile Ala Leu Tyr Ser 1580 Glu Asn
AAC GGT GTT CAA TAT ATG CAA ATT GGC GCA TAT CGT ACC CGT TTG AAT 4300
Asn Gly 1535 Val Gln Tyr Mec Gln 1590 Ile Gly Ala Tyr Arg 1595 Thr Arg Leu Asn 1600
ACG TTA TTC GCT CAA CAG TTG GTT ACC CCT GCT AAT CGT GGC ATT GAT 4343
Thr Leu Phe Ala Gln Gln 1605 Leu Val Ser Arg Ala 1510 Asn Arg Gly Ile Asp 1615
GCA GTG CTC AGT ATG GAA ACT CAG AAT ATT CAC GAA CCG CAA TTA GGA 4396
Ala Val Leu Ser Mec 1620 Glu Thr Gln Asn Ile 1625 Gln Glu Pro Gln Leu 1630 Gly
GCG GGC ACA TAT GTG CAG CTT GTG TTG GAT AAA TAT GAT GAG TCT ATT 4944
Ala Gly Thr Tyr 1535 Val Gln Leu Val Leu 1640 Asp Lys Tyr Asp Glu 1645 Ser Ile
CAT GGC ACT AAT AAA AGC TTT GCT ATT GAA TAT GTT GAT ATA TTT AAA 4992
His Gly Thr Asn Lys Ser Phe Ala Ile Glu Tyr Val Asp Ile Phe Lys
186 242
1650 1655
/» » <* Λ » ** ΛΛ'- Glu Asn 1665 GAT AGT Asp Ser TTT Phe GTG Val 157C ATT Ile 1 TAT CAA GGA GAA CTT AGC Ser GAA Glu ACA Thr AGT Ser 1530 5040
Tyr Gin Gly Glu 1675 Leu
CAA ACT CTT GTG AAA GTT —Τ' TTA TCC TAT TTT ATA GAG GCG ACT GGA 5033
Cln Thr Va1 Va1 Lys Val 1635 Phe Leu Ser Tyr 1690 Phe 1 Ile Glu Ala Thr 1695 Gly
A--tT AAG AAC CAC TTA TGG GTA CGT GCT AAA TAC CAA AAG GAA ACG ACT 5135
as n L.y s Asn His Leu 1700 Trp 7al Arg Ala 1705 Lys Tyr Gln Lys Glu 171C Thr 1 Thr
GAT AAG ATC TTG TTC GAC CGT ACT GAT CAG AAA GAT CCG CAC GGT TGG 5184
Asp Lys Ile Leu 1715 Phe Asp Arg Thr Asp 1720 Glu Lys Asp Pro 1725 His Gly Trp
TTT CTC AGC GAC GAT CAC AAG ACC TTT AGT GGT CTC TCT TCC GCA CAG 5232
Phe Leu Ser Asp 1730 Asp His Lys Thr 1735 Phe Ser Gly Leu Ser 1740 Ser Ala Gln
GCA TTA AAG AAC GAC AGT GAA CCG ATG GAT TTC TCT GGC GCC AAT GCT 5230
Ala Leu L745 Lys Asn Asp Ser Glu 1750 Pro Mec Asp Phe Ser 1755 Gly Aia Asn Aia 1750
CTC TAT TTC TGG GAA CTG TTC TAT TAC ACG CCG ATG ATG ATC GCT CAT 5323
Leu Tyr Phe Trp Glu Leu 1765 Phe Tyr Tyr Thr Pro 1770 Met Met Met Ala 1775 His
CGT TTC TTG CAG GAA CAG AAT TTT GAT GCG GCG AAC CAT TGG TTC CGT 5376
Arg Leu Leu Gln Glu 1780 Gln Asn Phe Asp Ala 1785 Ala Asn His Trp Phe 1790 Arg
TAT GTC TGG AGT CCA TCC GGT TAT ATC GTT GAT GGT AAA ATT GCT ATC 5424
Tyr 7ai Trp Ser 1795 Pro ser Gly Tyr ile 1800 val Asp Gly Lys Ile 1805 Ala He
TAC CAC TGG AAC GTG CCA CCC CTG GAA GAA GAC ACC AGT TGG AAT GCA 5472
Tyr His Trp Asn 1810 Val Arg Pro Leu 1815 Glu Glu Asp Thr ser 1820 Trp Asn Ala
CAA CAA CTG GAC TCC ACC GAT CCA GAT GCT GTA ccc CAA GAT GAT CCG 5520
Gln Gln 1825 Leu Asp Ser Thr Asp 1830 Pro Asp Ala Val Ala 1335 Gln Asp Asp Pro 1840
ATG CAC TAC AAG GTG GCT ACC TTT ATG GCG ACG TTG GAT CTG CTA ATG 5543
Met His Tyr Lys Val Ala 1845 Thr Phe Met Ala Thr 1850 Leu Asp Leu Leu Mec 1855
GCC CGT GGT GAT GCT GCT TAC CGC CAG TTA CAG CGT GAT ACG TTG GCT 56 i 6
Ala Arg Gly Asp Ala 1860 Ala Tyr Arg Cln Leu 1865 Glu Arg Asp Thr Leu 1870 Ala
GAA GCT AAA ATG TGG TAT ACA CAG GCG CTT AAT CTG TTG GGT GAT GAG 5664
Glu Ala Lys Met 1375 Trp Tyr Thr Gln Ala 1380 Leu Asn Leu Leu Gly 1885 Asp Glu
CCA CAA GTG ATG CTG AGT ACG ACT TCG CCT AAT CCA ACA TTG CGT AAT 5712
Pro Gln Val Mer 1890 Leu Ser Thr Thr 1895 Trp Ala Asn Pro Thr 1900 Leu Gly Asn
CCT CCT TCA AAA ACC ACA CAG CAG GTT CGT CAG CAA GTG CTT ACC CAG 57 60
Ala Ala Ser Lys Thr Thr Gln Gln Val Arg Gin Gln Val Leu Thr Gln
1305 1910 1915 1920
186 242
TTC Leu CGT Arg CTC Leu AAT Asn AGC agg Ser Arg 1925 GTA Val AAA Lys ACC Thr CCG TTC Pro Leu 1930 CTA Leu GGA Gly ACA Thr GCC .AAT Ala Asn 1935 5 88
TCC CTG ACC GCT <i—r * ttcTTA i A - CTG CCG CAG GAA AAT AGC AAG CTC AAA GGC 5356
Ser Leu Thr Ala Leu Phe 1940 Leu Pro Gln Glu Asn 1945 Ser Lys Leu Lya Gly 1950
TAC TGG CGG ACA CTG GCG CAG CGT » TH TG TTT AAT TTA CGT CAT AAT CTG 5904
Tyr Trp Arg Thr 1955 Leu Ala Gln Arg Mec 1960 Phe Acn Leu Arg 1965 His Asn Leu
TCG ATT GAC GGC CAG CCG CTC TCC TTG CCG CTG TAT GCT AAA CCG GCT 5952
Ser Ile Asp 1970 Gly Gln Pro Leu Ser 1975 Leu Pro Leu Tyr Ala 1980 Lys Pro Ala
GAT CCA AAA GCT TTA CTG AGT GCG GCG GTT TCA GCT TCT CAA GGG GGA 6000
Asp Pro 1985 Lys Aia Leu Leu Ser 1990 Ala Ala Val Ser Ala 1995 Ser Gln Gly Gly 2000
GCC GAC TTG <<* «*·«»* ‘c CG AAG GCG «·<«··« CTG ACT ATT CAC CGC TTC CCT CAA ATG 6048
Ala Asp Leu Pro Lys Ala 2005 Pro Leu Thr Ile His 2010 Arg Phe Pro gln Mec 2015
CTA GAA GGG GCA CGG GGC TTG GTT AAC CAG CTT ATA CAG TTC GGT ACT 6096
Leu Glu Gly Ala Arg Gly 2020 Leu Val Asn Gln Leu 2025 Ile Gln Phe Gly ser 2030
TCA CTA TTG GGG TAC AGT GAG CGT CAG GAT GCG GAA GCT ATG AGT CAA 6144
Ser Leu Leu Gly 2035 Tyr Ser Glu Ar? Cln 2040 Asp Ala Glu Ala Mec 2045 Ser Gln
CTA CTG CAA ACC CAA GCC AGC GAG TTA ATA CTG ACC AGT ATT CGT ATG 6192
Leu Leu Gln 2050 Thr Gln Ala Ser Glu 2055 Leu lle Leu Thr Ser 2060 lle Arg Met
CAG GAT AAC CAA TTG GCA GAG CTG GAT TCG GAA AAA ACC GCC TTG CAA 6240
Gln Acp 2055 Asn cln Leu Ala Glu 2070 Leu Asp Set Glu Lys 2075 Thr Ala Leu Gln 2080
GTC TCT TTA GCT GGA GTG CAA CAA CGG TTT GAC AGC TAT AGC CAA CTG 5288
Val Ser Leu Ala Gly Val 2085 Gln Gln Arg Phe Asp 2090 Ser Tyr Ser Gln Leu 2095
TAT GAG GAG AAC ATC AAC GCA GGT GAG CAG CCA GCG CTG GCG TTA CGC 6335
Tyr Glu Glu Asn Ile Asn 2100 Ala Gly Glu Gln Arg 2105 Ala Leu Ala Leu Arg 2110
TCA GAA TCT GCT ATT GAG TCT CAC GGA GCG CAG ATT TCC CGT ATG GCA 6384
Ser Glu Ser Ala 2115 Ile Glu ser Gln Gly 2120 Ala Gln Ile Ser Arg 2125 Met Ala
GGC GCG GGT GTT GAT ATG GCA CCA AAT ATC TTC GGC CTG GCT GAT GGC 6432
Gly Ala Gly 2130 Val Asp Met Ala Pro 2135 Asn Ile Phe Gly Leu 2140 Ala Asp Gly
GGC ATG CAT TAT GGT GCT ATT GCC TAT GCC ATC GCT GAC GGT ATT GAG 6480
Gly Met 2145 His Tyr Gly Ala Ile 2150 Ala Tyr Ala Ile Ala 2155 Asp Gly Ile Glu 2160
TTC AGT GCT TCT GCC AAG ATG GTT GAT GCG GAG AAA GTT GCT CAG TCG 6528
Leu ser Ala Ser Ala Lys 2165 Met Val Asp Ala Glu 2170 Lys Val Ala Gln Ser 2175
GAA ATA TAT CGC CCT CGC CGT CAA GAA TGG AAA ATT CAG CGT GAC AAC 637 6
Glu Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys Ile Gln Arg Asp Asn
186 242
2180 2135 2190
GCA CAA GCG GAG ATT AA— Asn CAG TTA AAC GCG CAA Gln CiO Leu GAA TCA Giu Ser 2205 CTG Leu TCT Ser 6624
Ala Gln Ala Glu 2195 Ile Gln Leu Asn Ala 2200
ATT — G — CGT GAA GCC GCT GAA ATG CAA AAA GAG TAC cgt aaa ACC G* M 5572
Iie Arg Arg Glu 2210 Ala Ala Glu 2215 Met Gln Ly s Glu Tyr 2220 Leu Lys 1 Thr Gln
CAA GCT CAG TAT CAG GCA CAA CTT ACT TTC TTA AGA A GC a * * TTC TTC AGT 6720
Gln Ala 2225 Gln Ala Gln Ala Gln 2230 Leu Thr Fha Lea 2235 Arg Ser Lys Phe Ser 2240
AAT CAA GCG TTA TAT AGT TGG TTA CGA GGG CGT TTG TCA TTA ATT TAT 6753
Asn Gln Ala Leu Tyr ser 2245 Trp Leu Arg Gly 225C Arg 1 Leu ser Gly Ile 2255 Tyr * J -
TTC CAG TTC TAT GAC TTG GCC GTA TCA CGT TGC CTG ATG GCA GAG CAA 6815
Phe Gln Phe Tyr Asp 2260 Leu Ala Val Ser Arg 2265 —ys Leu Met Ala 227C Glu 1 Gln
tcc TAT CAA TGG GAA GCT AAT GAT AAT TCC ATT AGC TTT GTC AAA CCG 6864
Ser Tyr Gln Trp 2275 Glu Ala Asn Asp A.sn Ser 2280 Ile Ser Phe Val 2285 Lys Pro
GGT GCA TGG CAA GGA ACT TAC GCC GGC TTA TTG TGT GGA GA.A GCT TTG 6912
Gly Ala Trp Gln 2290 Giy Thr Tyr Ala Gly Leu 2295 Leu Cys Gly Glu 2300 Ala Leu
ATA CAA AAT CTG GCA CAA ATG GAA GAG GCA TAT CTG AAA TGG GAA TCT 6960
Ile 2305 Gln Asn Leu Ala Gln Met 2310 Glu Glu Ala Tyr Leu 2315 Lys Trp Glu Ser 2320
CGC GCT TTG GAA GTA GAA CGC ACG GTT TCA TTG GCA CTG GTT TAT GAT 7005
Arg Ala Leu Glu Val Glu 2325 A.rg Thr Val Ser Leu 2330 Ala Val Val Tyr Asp 2335
TCA CTG GAA GGT AAT GAT CGT TTT AAT TTA GCG GAA CAA ATA CCT GCA 7056
Ser Leu Glu Gly Asn 2340 Asp Arg Phe Asn Leu 2345 Ala Glu Gln Ile Pro 2350 Ala
TTA TTG GAT AAG GGG GAG GGA ACA GCA GGA ACT AAA GAA AAT GGG TTA 7104
Leu Leu Asp Lys 2355 Gly Glu Gly Thr Ala Gly 2360 Thr Lys Glu Asn 2365 Gly Leu
TCA TTG GCT AAT GCT ATC CTG TCA GCT TCG GTC AAA TTG TCC GAC TTG 7152
Ser Leu Ala Asn 2370 Ala Ile Leu Ser Ala Ser 2375 Val Lys Leu Ser 2380 Asp Leu
AAA CTG GGA ACO GAT TAT CCA GAC AGT ATC GTT GGT AGC AAC AAG GTT 7200
Lys Leu 2335 Gly Thr Asp Ty! Pro 2390 Asp Ser Ile Val Gly 2395 Ser Asn Lys Val 2400
CGT CGT ATT AAG CAA ATC AGT GTT TCG CTA CCT GCA TTG GTT GGG CCT 7248
Arg Arg Ile Lys Gln Ile 2405 ser Val Ser Leu Pro 2410 Ala Leu Val Gly Pro 2415
TAT CAG GAT GTT CAG GCT ATG CTC AGC TAT GGT GGC AGT ACT CAA TTG 72?5
Tyr Gln Asp Val Gln 2420 Ala Met Leu Ser Tyr 2425 Gly Gly Ser Thr 243 Gln 0 Leu
CCG AAA GGT TCT TCA GCG TTG GCT GTG TCT CAT GGT ACC AAT GAT AG i 7344
Pro Lys Gly Cys 2435 Ser Ala Leu Ala Val Ser 2440 His Gly Thr Asn 2445 Asp Ser
186 242
GGT Gly CAG TTC Gln Phe 2450 CAG Gln TTG Leu CAT Asp TTC AAT Phe Asn 2455 GAC Asp GGC Gly AAA Lys TAC CTG Tyr Leu 2460 CCA Pro TTT Phe GAA Glu ”332
GGT ATT GCT CTT GAT GAT CAG GGT ACA CTG AAT CTT CAA TTT CCG AAT 7440
Gly Ile Ala Leu Asp Asp Gln Gly Thr Leu Asn Leu Gln Phe Pro Asn
2465 2470 2475 2430
GCT ACC GAC AAG CAG AAA GCA ATA TTG CAA ACT ATG AGC GAT ATT ATT 7433
Ala Thr Asp Lys Gln Lys Ala Ile Leu Gln Thr «ec Ser Asp Ile Ile
2435 2490 2495
TTG CAT ATT CGT TAT ACC ATC CGT TAA 7515
Leu His Ile Arg Tyr Thr Ile Arg *
2500 2505 (2) Dane dla sekwencji SEK NR ID: 12;
(i) Charakterystyka sekwencji:
(A) Długość: 2505 aminokwasów (B) Typ: aminokwas (D) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEK NR ID: 12,
Mac 1 Cln Asn Ser Lau 5 Ser ser Thr Ile Asp Thr 10 Ile cys Gln Lys 15 Lau
Gln Leu Thr Cys 20 pro Ala Glu Ile Ala 25 Leu Tyr Pro Phe Asp 30 Thr Phe
Arg Glu Lys 35 Thr Arg Gly Met Val 40 Asn Trp Gly Glu Ala 45 Lys Arg Ile
Tyr Glu 50 Ile Ala Gln Ala Glu 55 Gln Asp Arg Asn Lau 60 Lau His Glu Lys
Arg 65 Ile Phe Ala Tyr Ala 70 Asn Pro Lau Lau Lys 75 Asn Ala Val Arg Leu 80
Gly Thr Arg Gln Mt 85 Lau Gly Phe Ile Gln Gly 90 Tyr ser Asp Leu 95 Phe
Gly Asn Arg Ala 100 Asp Asn Tyr ALa Ala 105 Pro Gly Ser Val Ala 110 Ser Mec
Phe S«r Pro 115 Ala ALa Tyr Leu Tir 120 Glu Lau Tyr Arg Glu 125 Ala Lys Asm
Leu His 130 Asp 5er Set Set Ile 135 Tyr Tyr Leu Asp Lys 140 Arg Arg Pro Asp
Leu 145 Ala ser Leu Met Leu 150 ser Gin Lys Asn Mec 155 Asp Glu Glu Ile Ser 160
Thr Leu Ala Leu Ser Asn Glu Lau Cys Lau Ala Gly Ile Glu Thr Lys
165 170 175
Thr Gly Lys Ser Gln Asp Glu Val Met Asp Met Leu Ser Thr Tyr Arg 180 185 190
186 242
Leu Ser 1 « t •Ji/ 195 Glu Thr pro Pyr His His Ala 200 Tyr Glu Thr 205 'lal Arg Glu
Ile ‘.'al His Glu Arg Asp Pro Gly Phe Arg His Leu Ser Gln Ala Pro
210 215 220
Ile Val Ala Ala Lys Leu Asp Pro Val Thr Leu Leu Gly Ile Ser Ser
225 230 235 240
His Ila Sar Pro Clu Leu Pyr Asn Leu Leu Ile Glu Glu ile Pm Glu
245 250 255
Lys Asp Glu Ala Ala Leu Asp Thr Leu Tyr Lys Thr Asn Phe Gly Asp
260 265 270
Ile Thr Thr Ala Gln Leu Met Ser Pro Ser Pyr Leu Ala Arg Tyr Pyr
275 280 285
Gly 7al Ser Pro Glu Asp Ile Ala Tyr Val Thr Thr Ser Leu ser His
290 295 300
Val Cly Tyr Sar Ser Acp Ile Leu Val Ile Pre Leu Val Asp cly Val
305 310 315 320
Gly Lys Mec GlU Val Val Arg Val Thr Arg Thr Pro Ser Asp Asn Tyr
325 330 335
Thr ser Gln Thr Asn Tyr Ile Glu Leu Tyr Pro Gln Gly Gly Asp Asn
340 345 350
Pyr Leu Ile Lys Tyr Asn Leu Ser Asn Ser Phe Gly Leu Asp Asp Phe
355 360 365
Tyr Leu Cln Tyr Lys Asp Cly ser Ala Asp Trp Thr Glu Ile Ala His
370 375 380
Asn Pro Tyr Pro Asp Met Val Ile Asn Gln Lys Tyr Glu ser Gln Ala
38S 390 395 400
Thr Ile Lys Arg Ser Asp Ser Asp Asn Ile Leu Ser Ile Cly Leu Gln
405 410 415
Arg Trp His Ser Gly Ser Tyr Asn Phe Ala Ala Ala Asn Phe Lys Ile
420 425 430
Asp Gln Tyr Ser Pro Lys Ala Phe Leu Leu Lys Met Asn Lys Ale Ile
435 440 445
Arg Leu Leu Lys Ala Thr Gly Leu Ser Phe Ala Thr Leu Clu Arg Ile
450 455 460
Val Asp Ser Val Asn Ser Thr Lys ser Ile Thr val Glu Val Leu Asn
465 470 475 480
Lys Val Tyr Arg Val Lys phe Tyr Ile Asp Arg Pyr Gly Ile ser Glu
485 490 495
Glu Thr Ala Ala Ile Leu Ala Asn Ile Asn Ile Ser Gln Cln Ala Val
500 505 510
Gly Asn Gln Leu Ser Gln Phe Glu Gln Leu Phe Asn His Pro Pro Leu
515 520 525
Asn Gly Ile Arg 'T'» *1 L Glu Ile Ser Glu Asp Asn Ser Lys His Leu Pro
530 S35 540
186 242
Asn 545 Pro Asp Leu Asn L«u 550 Lys Pro Asp Ser Thr 555 Gly Asp Asp Gln Arg 560
Lys Ala Val Lau Lys 565 Arg Ala Phe Gln Val 570 Asn Ala Ser Glu Leu 575 Tyr
Gin Mec Leu Leu 580 Ile Thr Asp Arg Lys 585 Glu Asp Gly Val Ile 590 Lys Asn
Asn Leu Glu 555 Asn Leu Ser Asp Leu 600 Tyr Leu val Ser Leu 605 Lau Ala Gln
Ile His 610 Ann Leu Thr Ile Ala 615 Glu Leu Asn Ile Leu 620 Leu Val I 3a Cys
Gly 625 Tyr Gly Asp Thr Asn 630 Ile Tyr Gln Ile Thr 635 Asp Asp Asn Leu Ala 640
Lys Ile Val Glu Thr 645 Leu Lau Trp Ile Thr 650 Gln Trp Lau Lys Thr 655 Gln
Lys Trp Thr Val 660 Thr Asp Leu Phe Leu 665 Met Thr Thr Ala Thr 670 Tyr Ser
Tnr Tnr Leu 675 Thr pro Glu Ile Ser 680 Asn Leu Thr Ala Thr 685 Leu Ser Ser
Thr Lau 690 His Gly Lys Glu Ser 695 Leu Ile Gly Glu Asp 700 Leu Lys Arg Ala
Met 705 Ala Pro Cys Phe Thr 710 Ser Ala Leu His Leu 715 Thr Ser Gln Glu Val 720
Ala Tyr Asp Lau Leu 725 Leu Trp Ile Asp Gln 730 Ile Gln Pro Ala Gln 735 Ile
Tnr val Asp Gly 740 Phe Trp Glu Glu val 745 Gin Thr Thr Pro Thr 750 ser Leu
Lys Val Ile 755 Thr Phe Ala Gln Val 760 Leu Ala Gln Lau Ser 765 Lau Ile Tyr
Arg Arg 770 Ile Gly Leu Ser Glu 775 Thr Glu Lau Ser Lau 780 Ile Val Thr Gln
Ser 785 Ser Lau Lau val Ala 790 Gly Lys Ser Ile Lau 795 Asp His Gly Lau Leu 800
Thr Leu Mec Ala Leu 805 Glu Gly Phe His Thr 810 Trp Val Asn Gly Leu 815 Gly
Gln His Ala Ser 820 Leu Ile Leu Ala Ala 825 Leu Lys Asp Gly Ala 830 Leu Thr
Val Thr Asp 835 Val Ala Gln Ala Met 840 Asn Lys Glu Glu Ser 845 Leu Leu Gln
Met Ala aso Ala Asn Gin Val Glu 355 Lys Asp Lau Thr Ly’s 860 Leu Thr Ser Trp
Thr 865 Gln Ile Asp Ala Ile 870 Lau Gln Trp Lau Gln 875 Mat Ser Ser Ala Leu 880
Aa Val Ser Pro Leu 885 Asp Leu Ala Gly Met 890 Met Ala Leu Lys Tyr 895 Gly
186 242
Ile Asp His Asn 900 Tyr Ala Ala Trp Gin Ala Ala -Ala Ala Ala Leu Mec
905 910
Ala Asp His 915 Ala Asn Gln Ala Gln 920 Lys Lys Leu Asp Glu Thr Phe Ser 525
Lys Ala Leu 930 Cys Asn T/r Tyr 935 Ile Asn Ala Val Val Asp Ser Ala Ala 940
Gly 945 Vai Arg A*p Arg Asn aly 950 Leu Tyr Thr Tyr 955 Leu Leu Ile Asp Asn 960
Gln val Sar Ala Asp Val Ile 965 Thr Ser Arg Ile 970 Ala Glu Aia Ile Ala 975
Gly Ile Gln Leu 980 Tyr Val Asn Arg Ala Leu Asn 985 Arg Asp Glu Gly Gin 990
Leu Ala ser 995 Asp Val Ser Thr Arg Gln Phe Phe 1000 Thr Asp Trp Glu Arg 1005
Tyr Asn Lys 1010 Arg Tyr ser Thr Trp 1015 Ala Gly Val Ser Glu Leu Val Tyr 1020
Tyr Pro Glu 1025 Asn Tyr Val Asp 1030 Pro Thr Gin Arg Ile Gly Gin Thr Lys 1035 1040
Mec Mec Asp Ala Leu Leu Gln 1045 ser Ile ten Gln 1050 Ser Gln Leu Asn Ala 1055
Asp Thr Val Glu Asp Ala Phe 1060 Lys Thr Tyr Leu 1065 Thr Ser Phe Glu Gln 1070
Val Ala ^n Leu 1075 Lys Val Ile Ser Ala Tyr His 1080 Asp Asn Val ten val 1085
Asp Gln Gly 1090 Leu Thr Tyr Phe Ile 1095 Gly Ile Asp Gln Ala Ala Pro Gly 1100
Thr Tyr Tyr 1105 Trp Arg Ser Val 1110 Asp His Ser Lys Cys Glu Asn Gly Lys 1115 1120
Phe Ala Ala Asn Ala Trp Gly 1125 Glu Trp Asn Lys 113 0 Ile Thr Cys Ala Val 1135
Asn Pro Trp Lys ten He He 1140 Arg Pro Val Val 1145 Tyr Met Ser Arg Leu 1150
Tyr Leu Leu Trp 1155 Leu Glu Gln Gln Ser Lys Lys 1160 Ser Asp Asp Gly Lys 1165
Thr Thr Ile 1170 Tyr Gln Tyr Asn Leu 1175 Lys Leu Ala His Ile Arg Tyr Asp 1180
Gly Ser Trp 1135 Asn Thr Pro Phe 1190 Thr Phe Asp Val Thr Glu Lys Val Lys 1195 1200
Asn Tyr Thr Ser Ser Thr Asp 1205 Ala Ala Glu Ser 1210 Leu Gly Leu Tyr Cys 1215
Thr Gly T/r Gln Gly Glu Asp 1220 Thr Leu Leu Val 1225 Mec Phe Tyr Ser Mec 1230
Gln ser Ser Tyr Ser Ser Tyr Thr Asp Asn Asn Ala Pro Val Thr Gly 1235 1240 1245
186 242
Leu Tyr Ile 1250 Phe Ala Asp Mec Ser 1255 Ser Asp Asn Met Thr 1260 Asn Ala Gln
Ala Thr Asn Tyr Trp Asn Asn Ser Tyr Pro Gln Phe Asp Thr Val Met
1265 127! 3 1275 1230
Ala Asp Pro Asp Ser Asp Asn Lys Lys Val Ile Thr Arg Arg Val Asn
1235 129 0 1295
Asn Arg Tyr Ala Glu Asp Tyr Glu Ile Pro ser Ser Val Thr Sar Asn
1300 1305 1310
Ser Asn Tyr· Ser Trp Gly Asp His Ser Leu Thr Mec Leu Tyr Gly Gly
1315 1320 1325
Ser Val Pro Asn Ile Thr Phe Glu Ser Ala Ala Glu Asp Leu Arg Leu
1330 1335 1340
Ser Thr Asn Met Ala Leu Ser Ile Ile His Asn Gly Tyr Ala Gly Thr
1345 1350 1355 1350
Arg Arg Ile Gln Cys Asn Leu Met Lys Gln Tyr Ala Ser Leu Gly Asp
1365 1370 1375
Lys Phe Ile Ile Tyr Asp Ser Ser Phe Asp Asp Ala Asn Arg Phe Asn
1330 1335 1390
Leu Val Pro Leu Phe Lys Phe Gly Lys Asp Glu Asn Ser Asp Asp Ser
1395 1400 1405
Ile Cys Ile Tyr Asn Glu Asn Pro Ser Ser Glu Asp Lys Lys Trp Tyr
1410 1415 1420
Phe Ser Ser Lys Asp Asp Asn Lys Thr Ala Asp Tyr Asn Gly Gly Thr
1425 1430 1435 1440
Gln Cys Ile Asp Ala Gly Tnr Ser ten Lys Asp Phe Tyr Tyr Asn Leu
1445 1450 1455
Gln Glu Ile Glu Val Ile Ser Val Thr Gly Gly Tyr Trp Ser Ser Tyr
1460 1465 1470
Lys Ile ser Asn Pro Ile Asn Ile Asn Thr Gly Ile Asp Ser Ala Lys
1475 1430 14S5
Val Lya Val Thr Val Lys Ala Gly Gly Asp Asp Gln Ile Phe Thr Ala
1490 1495 1500
Asp Asn ser Thr Tyr Val Pro Gln Gin pro Ala Pro ser Phe Glu Glu
1505 1510 1515 1520
Mec Ile Tyr Gln Phe Asn ten Leu Thr Ile tep Cys Lys ten Leu Asn
1525 1530 1535
Phe Ile Asp Asn Gln Ala Hs Ile Glu Ile Asp Phe Thr Ala Thr Ala
1540 1545 1550
Gln Asp Gly Arg Phe Leu Gly Ala Glu Thr Phe Ile Ile Pro Val Thr
1555 1560 1555
Lys Lys Val Leu Gly Thr Glu Asn Ile Ala Leu Tyr Set Glu Asn
1570 1575 1530
Asn Gly Val Gln Tyr Mec Gln Ile Gly Ala Tyr Arg Thr Arg Leu Asn
1535 1590 1595 1600
186 242
Thr Leu Phe Ala Gln Gln 1605 Leu Val Ser Arg Aia Asn Arg Gly 1610 Ile 1015 Asp
Ala Val Leu Ser Met Glu Thr Gln Asn Ile Gln Hu Pro Cln Leu Gly
1620 1625 i 1630
Ala Gly Thr Tyr Val Gln Leu Val Leu Asp Lys Tyr Asp Glu Ser Ile
1635 1640 1645
His Gly Thr Asn Lys Ser Phe Ala Ile Glu Tyr Val Asp Ile Phe Lys
1650 1655 1660
Glu Asn Asp Ser Phe Val Ile Tyr Gln Gly Glu Leu Ser Glu Thr Ser
1665 1670 1675 1530
Gln Thr Val Val Lys Val Phe Leu Ser Tyr Phe Ile Glu Ala Thr Gly
1585 1690 1695
Asn Lys Asn His Leu Trp Val Arg Ala Lys Tyr Gln Lys Glu Thr Thr
1700 1705 i 1710
Asp Lys Ile Leu Phe Asp Arg Thr Asp Glu Lys Asp Pro His Gly Trp
1715 1720 1725
Phe Leu Ser Asp Asp His Lys Thr Phe ser Gly Leu Ser Ser Ala Gln
1730 1735 1740
Ala Leu Lys Asn Asp Ser Glu Pro Met Asp Phe Ser Gly Ala Asn Ala
1745 1750 1755 1760
Leu Tyr Phe Trp Glu Leu Phe Tyr Tyr Thr Pro Met Met Met Ala His
1765 1770 1775
Arg Leu Leu Gln Glu Gln Phe Asp Ala Ala Asn His Trp Phe Arg
1780 1785 1790
Tyr Val Trp Ser Pro Ser Gly Tyr Ile Val Asp Gly Lys Ile Ala Ile
1795 1800 1805
Tyr His Trp Asn Val Arg Pro Leu Glu Glu Asp Thr Ser Trp Asn Ala
1810 1815 1820
Gln Gln Leu Asp Ser Thr Asp Pro Asp Ala Val Ala Gln Asp Asp Pro
1825 1830 1835 1840
Met His Tyr Lys Val Ala Thr Phe Met Ala Thr Leu ^p Leu Leu Met
1845 1850 1855
Ala Arg Gly Asp Ala Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Ala
1860 1865 1870
Glu Ala Lys Met Trp Tyr Thr Gln Ala Leu Asn Leu Leu Gly Asp Glu
1875 1880 1885
Pro Gln Val Met Leu Ser Thr Thr Trp Ala Asn Pro Thr Leu Gly Asn
1890 1895 1900
Ala Ala ser Lys Thr Thr Gln Gln Val Arg Gln Gln Val Leu Thr Cln
1905 1910 1915 1920
Leu Arg Leu Asn Ser Arg Val Lys Thr Pro Leu Leu Gly Thr Ala Asn
1925 1930 1935
Ser Leu Thr Ala Leu Phe Leu Pro Gln Glu Asn Ser Lys Leu Lys Gly
1940 1945 1950
186 242
Tyr Trp Arg Thr Leu Ala Gln Arg Mec 1360 Phe Asn Leu Arg His 1965 As M
1955
Ser Ile Asp Gly Gln Pro Leu Ser Leu Pro Leu Tyr Ala Lys Pro Ala
1970 1975 1930
Asp Pro Lys Ala Leu Leu Ser Ala Ala Val Ser Ala Ser Gln Gly Gly
1935 1990 1995 2000
Ala Asp Leu Pro Lys Ala Pro Leu Thr Ile His Arg Phe Pro Gln Mec
2005 2010 2015
Leu Glu Gly Ala Arg Gly Leu Val Asn Gln Leu Ile Gln Phe Gly Ser
2020 2025 2030
Ser Leu Leu Gly Tyr Ser Glu Arg Gln Asp Ala Glu Ala Mec Ser Gln
2035 2040 2045
Leu Leu'Gln Thr Gln Ala Ser Glu Leu lle Leu Thr Ser Ile Arg Mec
2050 2055 2060
Gln Asp Asm O!m Leu Ala Glu Leu Asp Ser Glu Lys Thr Ala Leu Gln
2065 2070 2075 2030
Val Ser Leu Ala Gly Val Gln Gln Arg Phe Asp Ser Tyr Ser Gln Leu
2035 2090 2095
Tyr Glu Glu Asm Ile Asm Ala Gly Glu Gln Arg Ala Leu Ala Leu Arg
2100 2105 2110
Ser Glu Ser Ala Ile Glu ser Gln Gly Ala Gln Ile Ser Arg Mec Ala
2115 2120 2125
Gly Ala Gly Val Asp Mec Ala Pro Asn Ile Phe Gly Leu Ala Asp Gly
2130 2135 2140
Gly Mec His Tyr Gly Ala Ile Ala Tyr Ala Ile Ala Asp Gly Ile Glu
2145 i 2150 2155 2160
Leu Ser Ala Ser Ala Lys Mec Val Asp Ala Glu Lys Val Ala Gln Ser
2165 2170 2175
Glu Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys Ile Gln Arg Asp Asn
2130 2135 2190
Ala Gln Ala Glu Ile Asm GlM Leu Asn Ala Gln Leu Glu Ser Leu Ser
2195 2200 2205
Ile Arg Arg Olu Ala Ala Glu Mec GlM Lys Glu Tyr Leu Lys Thr Gln
2210 2215 2220
Gln Ala Gln Ala Gln Ala GlM Leu Thr Phe Leu Arg Ser Lys Phe Ser
2225 2230 2235 2240
Asn Gln Ala Leu Tyr Ser Trp Leu Arg Gly Arg Leu Ser Gly Ile Tyr
2245 2250 2255
Phe Gln Phe Tyr Asp Leu Ala Val Ser Arg Cys Leu Mec Ala Glu Gln
2260 2265 2270
Ser Pyr Gln Trp Glu Ala Asn Asp Asm Ser Ile Ser Phe Val Lys Pro
2275 2230 2235
Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu Cys Gly Glu Ala Leu
2290 2295 2300
186 242
Ile Cln Asn 2305 Leu Aid Gin Mec 2310 Glu Glu Aid Pyr Leu Lys 2315 Trp GlU Ser 2320
Arg Ala Leu Glu Val Glu Arg 2325 Thr Val Ser Leu Ala Val 2330 val Tyr 2335 Asp
Ser Leu Clu Gly Asn 2340 Asp Arg Phe Asn Leu 2345 Aid. Giu Gin Ile Pro 2350 Ala
Leu Leu Asp 2355 Lys cly Glu Cly Thr Ala 2360 Gly Thr Lys Glu Asn 2365 Gly Leu
Ser Leu Ala 2370 Asn Ala Ile Leu 2375 Ser Ala Ser Val Lys Leu 2380 Ser Asp Leu
Lys Leu Gly 2385 Thr Asp Pyr Pro 2390 Asp Ser Ile Val Gly Ser 2395 Asn Lys Val 2400
Arg Arg Ile Lys Gln 2405 Ile Ser Val Ser Leu 2410 Pro Ala Leu 1 VaL cly 2415 Pro 1
Tyr Gln Asp Val Gln 2420 Ala Mec Leu Ser Tyr 2425 Gly Gly Ser Thr Gln 2430 Leu
Pro Lys cly cys 2435 Ser Ala Leu Ala Val 2440 Ser His Gly Thr Asn 2445 Asp Ser
Gly Gln Phe 2450 Gln Leu Asp Phe Asn 2455 Asp Gly Lys Pyr Leu 2460 Pro Phe Glu
Gly Ile Ala 2465 Leu ASp Asp Gln 2470 Gly Thr Leu Asn Leu Gln 2475 Phe Pro Asn 2480
Ala Thr Asp Lys Gln Lys Ala 2485 Ile Leu Gln Thr Met Ser 2490 Asp Ile Ile 2495
Leu His Ile Arg Tyr Thr Ile Arg *
2500 2505 ( 2) Dane dla sekwencji SEK NR ID: 13;
(i) Charakterystyka sekwencji:
( A ) Długość: 12 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza (D) Topologia: liniowa ( ii) Typ cząsteczki: peptyd ( xi ) Opis sekwencji: SEK NR ID: 13;
Leu Ile Gly Tyr Asn Asn Głn Phe Ser Gły Xaa Ala 1 5 10 ( 2) Dane dla sekwencji SEK NR ID: 14;
(i) Charakterystyka sekwencji:
( A ) Długość: 12 aminokwasów (B ) Typ: aminokwas ( C ) Rodzaj nici, pojedyncza (D ) Topologia: liniowa
186 242 ( ii ) Typ cząsteczki: peptyd ( xi ) Opis sekwencji: SEK NR ID: 14;
Met Gln Asn Ser Gln Thr Phe Ser Val Gly Glu Leu 1 5 10 ( 2 ) Dane dla sekwencji SEK NR ID: 15;
(i ) Charakterystyka sekwencji:
( A ) Długość: 9 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza ( D ) Topologia: liniowa (ii) Typ cząsteczki: peptyd (xi) Opi sekkwencj i: SEK NR ID: 15;
Ala Gln Asp Gly Asn Gln Asp Tir F^ł^e Phe Ser Gly Asn TTrr 1 5 10 ( 2 ) Dane dla sekwencji SEK NR ID: 16;
( i ) Charakterystyka sekwencji:
( A ) Długość: 5 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza ( D ) Topologia: liniowa ( c ) Typ cząsteczki: peptyd (xi) Opis sekwencji: SEK NR ID: 16;
Met Gln Asn Ser Leu 1 5 ( 2 ) Dane dla sekwencji SEK NR ID: 17;
(i ) Charakterystyka sekwencji:
( A ) Długość: 10 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza ( D ) Topologia: liniowa (ii ) Typ cząsteczki: peptyd ( xi ) Opis sekwencji: SEK NR ID: 17;
Ala Phe Asn Ile Asp Asp Val Ser Leu Phe
5 10
186 242 ( 2 ) Dane dla sekwencji SEK NR ID: 18;
(i) Charakterystyka sekwencji:
( A ) Długość: 16 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza ( D ) Topologia: liniowa (i) Typ cząsteczki: peptyd (xi) Opis sekwencji: SEK NR ID: 18,
Phe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn Asn Ser Ser Asn 15 10 15 (2 ) Dane dla sekwencji SEK NR ID: 19;
(i) Charakterystyka sekwencji:
(A) Długość: 21 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza (D) Topologia: liniowa (i ) Typ cząsteczki: peptyd (xi) Opis sekwencji: SEK NR ID: 19;
Ile Ser Asp Leu Val Thr Thr Ser Pro Leu Ser Glu Ala Ile Gly Ser 15 10 15 ( 2 ) Dane dla sekwencji SEK NR ID: 20;
(i) Charakterystyka sekwencji:
( A ) EDługoć: 12 aa:ύnoCwasów ( B ) Typ: aminokwas ( C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (i) Typ cząsteczki: peptyd ( xi ) Opis sekwencji: SEK NR ID: 20;
Met Tyr Tyr Ile Gln Ala Gln Gln Leu Leu Gly Pro 1 5 10 ( 2 ) Dane dla sekwencji SEK NR ID:21;
(i) Charakterystyka sekwencji:
( A ) Długość: 26 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza ( D ) Topologia: liniowa
186 242 (ii ) Typ cząsteczki: peptyd ( xi ) Opis sekwencji: SEK NR ID: 21;
Gly Ile Asp Ala Val Leu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro 15 10 15 ( 2 ) Dane dla sekwencji SEK NR ID:22;
(i) Charakterystyka sekwencji:
(A) Długość: 15 aminokwasów (B) Typ: aminokwas ( C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii ) Typ cząsteczki: peptyd ( xi) Opis sekwencji: SEK NR ID: 22;
Ile Ser Asn Pro Ile Asn De Asn Thr Gly Ile Asp Ser Ala Lys 15 10 15 ( 2 ) Dane dla sekwencji SEK NR ID:23;
(i ) Charakterystyka sekwencji:
(A) Długość: 13 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: peptyd ( xi) Opis sekwencji: SEK NR ID: 23;
Thr Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys 1 5 10 ( 2 ) Dane dla sekwencji SEK NR ID: 24;
(i) Charakterystyka sekwencji:
( A ) Długość: 22 aminokwasów ( B ) Typ: aminokwas (C) Rodzaj nici: pojedyncza ( D ) Topologia: liniowa (ii) Typ cząsteczki: peptyd ( xi ) Opis sekwencji: SEK NR ID: 24;
Val Leu Gly Thr Glu Asn Val Ile Ala Leu Tyr Ser Glu Asn Asn Gly 1 5 10 15
Val Gln Tyr Met Gln Ile
186 242 (2) Dane dla sekwencji SEK NR ID: 25;
(i ) Charakterystyka sekwencji:
( A) Długość: 6005 par zasad ( B ) Typ: kwas nukleinowy (C ) Rodzaj nici: podwójna ( D ) Topologia: liniowa (ii ) Typ cząsteczki: DNA ( genomowy ) (Cc) Cechy:
(A) Nazwa/Klucz: RBS (B) Położenie: 1..9 (lx ) Cechy:
(A) Nazwa/Klucz: CDS ( B ) Położenie: 16.. 3585 ( D ) Inne dane: /produkt = „P8” ( xi) Opis sekwencji: SEK NR ID: 25;
AAGAAGGAAT TGATT ATC TCT GAA TCT TTA TTT ACA CAA ACG TTG AAA GAA 51
Mec Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu
10
GCG Ala CGC CGT GAT GCA TTG GTT GCT CAT TAT ATT GCT ACT CAG GTG Ile Ala Thr Gin Val 25 CCC Pro 99
Arg Arg Asp 15 Ala Leu Val Ala 20 His Tyr
GCA GAT TTA AAA GAG AGT ATC CAG ACC GCG CAT CAT CTG TAC GAA TAT 147
Ala Asp Leu Lys Glu ser Ile Gln Thr Aia Asp Asp Leu Tyr Glu Tyr
30 35 40
CTG TTG CTG GAT ACC AAA ATT AGC CAT CTC GTT ACT ACP TCA CCG CTG 195
Leu Leu Leu Asp Thr Lys Ile Ser Asp Leu Val Thr Thr Ser Pro Leu
45 50 55 60
TCC GAA GCG ATT CCC AGT CTG CAA TTC TTT ATT CAT CGT GCG ATA GAG 243
Ser Glu Ala Ile Gly Ser Leu Gln Leu Phe Ile His Arg Ala Ile <31u
65 70 75
CGC TAT GAC GGC ACG CTG GCA GAC TCA GCA AAA CCC TAT TTT GCC CAT 291
Gly Tyr tep Gly Thr Leu Ala Asp Ser Ala Lys Pro Tyr Phe Ala Asp
80 85 90
GAA CAG TTT TTA TAT AAC TGG GAT ACT TTT AAC CAC CGT TAT AGC ACT 339
Olu Gin Phe Leu Tyr Asn Trp Asp Ser Phe Asn His Arg Tyr Ser Thr
95 100 105
TGG GCT GGC AAG GAA CGG TTG AAA TTC TAT GCC GGG GAT TAT ATT GAT 387
Trp Ala dy Lys Glu Arg Leu Lys Phe Tyr Ala Gly Asp Tyr Ile Asp
110 115 120
CCA ACA TTC CGA TTG AAT AAG ACC GAG ATA TTT ACC GCA TTT GAA CAA 435
Pro Thr Leu Arg Leu Asn Lys Thr Glu Ile Phe Thr Ala Phe du Gln
125 130 135 140
186 242
CCT Gly ATT Ile TCT Ser C7_—_A OOO Gln Gly 145 AAA Lys TTA AAA AGT GAA TTA CTC GAA TCT AAA TTA Leu 433
Leu Lys 5er Glu 150 Leu val Glu Ser Lys 155
CGT GAT TAT CTA ATT AGT TAT GAC ACT TTA CCC ACC CTT GAT TAT ATT 531
Arg Asp Tyr Leu Ile Ser Tyr Asp Thr Leu Ala Thr Leu ASP Tyr ile
160 165 170
ACT GCC TGC CAA GGC AAA GAT AAT AAA ACC ATC TTC TTT ATT CGC CGT 57 9
Thr r\ia cys Gln Gly Lys Asp Asn Lys Thr Ile Phe Phe Ile Gly Arg
175 180 185
ACA CAG AAT GCA CCC TAT GCA TTT TAT TGG CGA AAA TTA ACT TTA GTC 627
Thr Gln Asn Ala Pro Tyr Ala Phe Tyr Trp Arg Lys Leu Thr Leu Vai
190 195 200
ACT CAT GGC GGT AAG TTG AAA CCA GAT CAA TGG TCA CAG TGC CGA GCA 675
Thr Asp Gly Gly Lys Leu Lys pro ASP Gln Trp ser clu Trp Arg Ala
205 210 215 220
ATT AAT GCC GGG ATT AGT GAG GCA TAT TCA GGG CAT GTC GAC CCT TTC 723
Ile Asn Ala Gly Ile ser GlU Ala Tyr Ser Gly His Val Glu Pro Phe
225 230 23 5
TCG GAA AAT AAC AAG CTG CAC ATC CGT TGG TTT KCT ATC TCG AAA GAA 771
Trp Glu Asn Asn Lys Leu His Ile Arg Trp Phe Thr Ile Ser Lya Glu
240 245 250
GAT AAA ATA GAT TTT GTT TAT AAA AAC ATC TCG CTG ATG AGT AGC CAT 819
Asp Lys 11« Asp Phe Val Tyr Lys Asn Ile Trp Val Met Ser Ser Asp
255 260 265
TAT ACC TCG GCA TCA AAG AAA AAA ATC TTG GAA CTT TCT TTT ACT GAC 367
Tyr Ser Trp Ala Ser Lys Lys Lya Ile Leu Clu Leu Ser Phe Thr Asp
270 275 280
TAC AAT AGA GTT GGA GCA ACA GGA TCA TCA AGC CCG ACT CAA GTA CCT 915
tyr Asn Arg Val Gly Ala Thr Gly Ser Ser Ser Pro Thr Glu Wal Ala
28S 290 295 300
TCA CAA TAT GGT TCT GAT GCT CAG ATG AAT ATT TCT GAT CAT GGC ACT 963
Sar Gln Tyr Gly Ser Asp Ala cln Met Asn Ile Ser Asp Asp Cly Thr
305 310 315
GTA CTT ATT TTT CAG AAT GCC GGC GGA GCT ACT CCC ACT ACT CGA GTC 1011
Val Leu Ile Phe Gln Asn Ala Gly Giy Ala Thr Pro Ser Thr Gly V*1
320 325 330
ACG TTA TGT TAT GAC TCT GGC AAC GTG ATT AAG AAC CTA TCT AGT ACA 1059
Thr Leu Cys Tyr Asp Ser Cly Asn VAl Ile Lys Asn Leu Ser Ser Thr
335 340 345
GGA AGT GCA AAT TTA TCC TCA AAG CAT TAT GCC ACA ACT AAA TTA CGC 1107
Gly Ser Ala Asn Leu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu Arg
350 355 360
ATG TGT CAT GCA CAA ACT TAC AAT CAT AAT AAC TAC TGC AAT TTT ACA 1155
Met cys HiS Gly Gln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr
365 370 375 330
CTC TCT ATT AAT ACA ATA GAA TTC ACC TCC TAC GGC ACA TTC TCA TCA 1203
Leu Ser Ile Asn Thr Ile Glu Phe Thr Ser Tyr Gly Thr Phe ser Ser
385 390 395
GAT GGA AAA CAA TTT ACA CCA CCT TCT GGT TCT GCC ATT GAT TTA CAC 12 51
ASP Giy Lys Gln Phe Thr Pro Pro Ser Cly Ser Ala Ile Asp Leu His
100
186 242
400 405 410
CTC CCT AAT TAT GTA GAT CTC AAC GCG CTA TTA GAT ATT AGC CTC GAT 1299
Lau Pro Asn 415 Tyr Val Asp Leu Asn 420 Ala Leu Leu Asp Ile 425 Ser Leu Asp
TCA CTA CTT AAT TAT GAC GTT CAG GGG CAG TTT GGC GCA TCT AAT 1347
Ser Leu 430 Leu Asn Tyr Asp Val 435 Gln Cly Gln Phe Gly 440 Gly Ser Asn Pro
GTT GAT AAT TTC ACT GCT CCC TAT GGT ATT TAT CTA TGC GAA ATC TTC 1395
Val 445 Asp Asn Phe Ser Gly 450 Pro Tyr Gly Ile Tyr 455 Leu Trp Glu Ile Phe 460
TTC CAT ATT CCG TTC CTT GTT ACG GTC CGT ATG CAA ACC GAA CAA CGT 1443
Phe His Ile Pro Phe 465 Leu Val Thr Val Arg 470 Met Gln Thr Glu Gln 475 Arg
TAC CAA GAC GCG GAC ACT TGC TAC AAA TAT ATT TTC CGC AGC GCC GGT 1491
Tyr Glu Asp Ala 430 Asp Thr Trp Tyr Lys 435 Tyr Ile Phe Arg Ser 490 Ala Gly
TAT CGC GAT GCT AAT GGC CAC CTC ATT ATG GAT GGC ACT AAA CCA CGT 1539
Tyr Arg Asp 495 Ala Asn Gly Gln Leu 500 Ile Met Asp Cly Ser 505 Lys Pro Arg
TAT TGG AAT GTC ATC CCA TTG CAA CTG GAT ACC GCA TGC GAT ACC ACA 1537
Tyr Trp 510 Asn Val Met Pro Leu 515 Gln Leu Asp Thr Ala 520 Trp Asp Thr Thr
CAG CCC GCC ACC ACT GAT CCA GAT GTC ATC GCT ATG GCG GAC CCC ATG 1535
Gln 525 Pro Ala Thr Thr Asp 530 Pro Asp Val Ile Ala 535 Mac Ala Asp Pro Met 540
CAT TA.C AAG CTC GCC ATA TTC CTG CAT ACC CTT GAT CTA TTG ATT GCC 1633
His Tyr Lys Leu Ala 545 Ile Phe Leu His Thr 550 Leu Asp Leu Leu Ile 555 Ala
CGA GGC GAC ACC GCT TAC CCT CAA CTT CAA CGC GAT ACT CTA GTC GAA 1731
Arg Gly Asp Ser 560 Ala Tyr Arg cin Leu 565 Glu Arg Asp Thr Leu 570 val Glu
GCC AAA ATO TAC TAC ATT CAG OCA CAA CAG CTA CTC GCA CCG CGC CCT 1779
Ala Lys Met 575 Tyr Tyr Ile Gln Ala 580 Gln Gln Leu Leu Gly 585 Pro Arg Pro
GAT ATC CAT ACC ACC AAT ACT TGC CCA AAT CCC ACC TTC AGT AAA GAA 1327
Asp Ile 590 His Thr Thr Asn Thr 595 Trp Pro Asn Pro Thr 600 Leu Ser Lys Glu
GCT GGC GCT ATT GCC ACA CCG ACA TTC CTC ACT TCA CCC GAC CTG ATG 1375
Ala 605 Gly Ala Ile Ala Thr 610 Pro Thr Phe Leu Ser 615 ser Pro Glu Val Met 620
ACC TTC CCT CCC TGC CTA ACC GCA GGC CAT ACC GCA AAT ATT CCC CAC 1923
Thr Phe Ala Ala Trp 625 Leu Ser Ala Gly Asp 630 Thr Ala Asn Ile Gly 635 Asp
GGT GAT TTC TTC CCA CCG TAC AAC CAT GTA CTA CTC GGT TAC TGG GAT 1971
Gly Asp Phe Leu 640 Pro Pro Tyr Asn Asp 645 Val Leu Leu Gly Tyr 650 Trp Asp
AAA CTT GAC TTA CGC CTA TAC AAC CTG CGC CAC AAT CTC AGT CTG GAT 2013
Lys Leu Clu 655 Leu Arg Leu Tyr Asn 660 Leu Arg His Asn Leu 665 Ser Leu Asp
186 242
101
GGT CAA CCG CTA AAT Asn CTG Leu CCA Pro 675 CTG TAT GCC ACG CCG GTA GAC CCG AAA 20ó~
Gly Gln 670 Pro Lau Leu Tyr Ala Thr Pro 680 Val Asp Pro Lys
ACC CTG CAA CGC CAG CAA GCC GGA GGG GAC GGT ACA GGC AGT AGT CCG 2115
Thr 685 Leu Gln Arg Gln Gln 690 Ala Gly Gly Asp Gly 695 Thr Gly Ser Ser Pro 700
GCT GGT GGT CAA GGC AGT GTT C.-.G GGC TGG CGC TAT CCG TTA TTG GTA 2153
Ala dy dy Gln Gly 705 Ser Val Gln Gly Trp 710 Arg Tyr Pro Leu Leu 715 Val
GAA CGC GCC CGC TCT GCC GTG AGT TTG TTG ACT CAG TTC GGC AAC AGC 2211
Glu Arg Ala Arg 720 Ser Ala Val ser Leu 725 Leu Thr dn Phe Gly 730 Asn Ser
TTA CAA ACA ACG TTA GAA CAT CAG GAT AAT GAA AAA ATG ACG ATA CTG 2259
Leu Gln Thr 735 Thr Leu du His Gln Asp 740 ten Glu Lys Met 745 Thr Ile Leu
TTG CAG ACT CAA CAG GAA GCC ATC CTG AAA CAT CAG CAC GAT ATA CAA 2307
Leu Cln 750 Thi Gln Gln Glu Ala 755 Ile Leu Lys His Gln 760 His Asp Ile Gln
CAA AAT AAT CTA AAA GGA TTA CAA CAC AGC CTG ACC GCA TTA CAG GIT 2355
Gln 765 Asn Asn Leu Lys Gly 770 Leu Gln His Ser Leu 775 Tit Ala Leu Gln Ala 730
AGC CGT CAT GGC GAC ACA TTG CGG CAA AAA CAT TAC AGC GAC CTG ATT 2403
Ser Arg Asp dy Asp 785 Thr ^au Arg Gln Lys 790 His Tyr Ser Asp Leu 795 Ile
AAC GGT GGT CTA TCT GCG GCA GAA ATC GCC GTT CTG ACA CTA CGC AGC 2451
Asn Gly Gly Leu 800 Ser Ala Ala Glu Ile 805 Ala dy Leu Thr Leu 810 Arg Ser
ACC GCC ATG ATT ACC AAT GGC GTT GCA ACG GGA TTG CTG ATT GCC GGC 2499
Thr Ala Mec 815 Ile Thr Asn Giy Val Ala 820 Thr Gly Leu Leu 823 Ile Ala dy
GGA ATC GCC AAC GCG GTA CCT AAC GTC TTC GGG CTG GCT AAC GGT GGA 2547
Gly Ile 830 Ala Asn Ala val Pro 835 ten Val Phe Gly Leu 840 Ala Asn dy Gly
TCG GAA TGG GGA GCG CCA TTA ATT GGC TCC GGG CAA GCA ACC CAA GTT 2595
Ser 845 Glu Trp Gly Ala Pro 850 Leu Ile Gly Ser dy 855 Cln Ala Thr dn Val 860
GGC GCC GGC ATC CAG GAT CAG AGC GCG GGC ATT TCA GAA GTG ACA CGCA 2643
Gly Ala Gly He Gln 865 tep Gln Ser Ala dy 870 Ile Ser Glu Val Thr 875 Ala
GGC TAT CAG CGiT CGT CAG GAA GAA TOG GCA TTG CAA CGG GAT ATT GCT 2691
Gly Tyr Gln Arg 830 Arg Gln Glu Glu Trp 885 Ala Leu Gln Arg tep 890 Ile Ala
GAT AAC GAA ATA ACC CAA CTG CAT GCC CAG ATA CAA AGC CTG CAA GAG 2739
tep Asn Glu 895 Ile Thr Gln Leu tep Ala 900 Gln Ile Gln Ser 905 Leu Gln du
CAA ATC ACG ATG GCA CAA AAA CAG ATC ACG CTC TCT GAA ACC GAA CAA 2737
Gln Ile 910 Thr Mec Ala Gln Lys 915 Gln Ile Thr Leu Ser 920 Glu Thr Glu Gln
GCG AAT GIC CAA GIG ATT TAT GAC CTG CAA ACC ACT CGT ttt ACC GGG 2835
Ala Asn Ala Gln Ala Ile Tyr Asp Leu Gln Thr Thr Arg Phe Thr Gly
102
186 242
525 930 935 940
CAG GCA CTG TAT AAC TGG ATG GCC GGT CGT CTC TCC GCG CTC TAT TAC 2333
Gln Ala Leu Tyr Asn Trp Mec Ala Gly Arg Leu Ser Ala Leu Tyr Tyr
945 950 955
CAA ATG TAT GAT TCC ACT CTG CCA ATC TGT CTC CAG CCA AAA GCC GCA 2931
Gln Mec Tyr Asp Ser Thr Leu Pro Ile C/s Leu Gln Pro Lys Aia Ala
960 965 970
TTA GTA CAG GAA TTA GGC GAG AAA GAG AGC GAC AGT CTT TTC CAG GTT 2979
Leu Val Gln Glu Leu Gly Glu Lys Glu ser Asp ser Leu Phe Gln val
975 980 985
CCG GTG TGG AAT GAT CTG TGG CAA GGG CTG TTA GCA GGA GAA GG TTA 3027
pro Val Trp Asn ^p Leu Trp Gln Gly Leu Leu Ala Gly Glu dy Leu
990 995 1000
AGT TCA GAG CTA CAG AAA CTG GAT GCC ATC TGG CTT GCA CGT GGT GGT 3075
Ser Ser Glu Leu Gln Lys Leu Asp Ala Ile Trp Leu Ala Aieg Cly dy
1005 1010 1015 1020
ATT GGG CTA GAA GCC ATC CGC ACC GTG TCG CTG GAT ACC CTG TTT GCC 3123
Ile Gly Leu Clu Ala Ile Arg Thr Val Ser Leu Mp Thr Leu Phe Gly
1025 1030 1035
ACA GGG ACG TTA AGT GAA AAT ATC AAT AAA GTG CTT AAC GGG GAA ACG 3171
Thr dy Thr Lau Ser Glu Mn Ile ^n Lys Val Leu Asn Gly Glu Thr
1040 1045 1050
GTA TCT CCA TCC GGT GGC GTC ACT CTG GCG CTG ACA GGG GAT ATC TTC 3219
Val Ser Pro Ser dy Gly Val Thr Leu Ala Leu Thr Gly Mp Ile Phe
1055 1060 1065
CAA GCA ACA CTG GAT TTG ACT CAG CTA GGT TTG GAT AAC TCT TAC AAC 3267
Gln Ala Thr Leu Asp Leu Ser Gln Leu Gly Asn Mn Ser Tyr Mn
1070 1075 1080
TTG GTT AAC GAG AAG AAA CGT CGT ATT AAA CGT ATC GCC GTC ACC CTG 3315
Leu Gly Asn Glu Lys Lys Arg Ma Ile Lys Arg Ile Ala Val Thr Leu
1085 1090 1095 1100
CCA ACA CTT CTG GGC CCA TAT CAA GAT CTT GAA GCC ACA CTG GTA ATG 3363
Pro Thr Leu Leu Gly Pro Tyr Gln Mp Leu Glu Ala Thr Leu Val Mec
1105 1110 1115
GGT GCG GAA ATC GCC GCC TTA TCA CAC GGT GTG AAT GAC GGA GCC CGG 3411
Gly Ala Glu Ile Ala Ala Leu Ser His Gly Val Asn Asp Gly Gly Arg
1120 1125 1130
TTT GTT ACC GAC TTT AAC GAC AGC CGT TTT CTG CCT m CAA GGT CGA 3459
Phe Val Thr ^p Phe Asn Mp Ser Arg Phe Leu Pro Phe Glu Gly Arg
1135 1140 1145
GAT GCA ACA ACC GGC ACA CTG GAG CTC AAT ATT TTC CAT GCG CTT AAA 3507
Asp Ala Thr Thr dy Thr Leu Glu Leu Mn Ile Phe His Ala Gly Lys
1150 1155 1160
GAG GGA ACG CAA CAC GAG TTG GTC GCG AAT CTG AGT GAC ATC ATT GTG 3555
du Gly Thr Gln His Glu Leu Vai Ala Asn Leu Ser Mp Ile Ile Val
1165 1170 1175 1180
CAT CTG AAT TAC ATC ATT CGA GAC GCG TAA ArriLTrriT TTTCTCGJ^TT .5 6 Ul
Hls Leu Asn Tyr Ile He Arg Asp Ala *
1185 1190
186 242
103
ACAa-λ-» AAGCT atcaggggcc TCTTATTAAG GACTACTTAA TCCAGGATTC ACCAGAACTA 3 665
TCGATTACAA CGCTGTCACT TCCCAAAGCT ggcggtgcta TCAATGGCAT GGGAGAAGCA 3715
CTGAATGCTG CCGGCCCTGA TGGAATGGCC TCCCTATCTC TGCCATTACC CCTTTCGACC 3785
GGCAGAGGGA CGGCTCCTGG ATTATCGCTG ATTTACAGCA ACAGTGCAGG TAATGGGCCT 3845
TTCGGCATCG GCTGGCAATG CGGTGTTATG TCCATTAGCC GACGCACCCA ACATGGCATT 3905
CCACAATACG GTAATGACGA CACGTTCCTA TCCCCACAAG GCGAGGTCAT GAATATCGCC 3S55
CTGAATGACC AAGGGCAACC TGATATCCGT CAAGACGTTA AAACGCTGCA AGGCGTTACC 4025
TTGCCAATTT CCTATACCGT GACCCGCTAT CAAGCCCGCC AGATCCTGGA TTTCACTAAA 4085
ATCGAATACT GGCAACCTGC CTCCGCTCAA GAAGGACGCG CTTTCTGGCT GATATCGACA 4145
CCCGACCCCC ATCTACACAT CTTAGGGAAA ACCGCGCAGG CTGJTCTGGC AAATCCGCAA 4205
AATGACCAAC AAATCGCCCA GTGGTG5CIG GAAGAAACGG TGACGCCAGC CGGTGAACAT 4265
CTCACCTATC AATATCGAGC CGAAGATGAA GCCCATTGTG ACGACAATGA AAAAACCGCT 4325
CATCCCAATG TTACCGCACA GCGCTATCTG GTACAGGTGA ACTACAGGCA ACATCAAACC 4385
ACAACCCAGC CVGTTCGTAC TGGATAACGC ACCTCCCGCA CCGGAAGAGT GgcTgTT tca 4445
TCTGGTCTTT GACCACGGTG AGCGCGTACC TCACTTCATA CCGTGCCAAC ATGGGATGCA 4505
GGTACAGCGC AATGGTCTGT ACGCCCGGAT ATCTTCTCTC GCTATGAATA TGGTTTTGAA 4565
GTGCGTACTC GCCGCTTATG TCAACAAGTG CTGATGTTTC ACCGCACCGC GCTCATGGCC 4625
GGAGAAGCCA GTACCAATGA CGCCCCGGAA CTGGTTGGAC GCTTAATACT GGAATATGAC 4685
AAAAACGCCA GCGTCACCAC CTTGATTACC ATCCGTCAAT TAAGCCATGA ATCGGACGGG 4745
AGGCCAGTCA CCCAGCCACC ACTAGAACTA GCCTGGCAAC GGTTTGATCT GGAGAAAATC 4805
CCGACATGGC AACGCTTTGA CGCACTAGAT AATTTTAACT CGCAGCAACG TTATCAACTG 4865
GTTGATCTGC GGGGAGAAGG GTTOCCAGGT ATGCTGTATC AAGATCGAGG CGCTTGCTGG 4925
TATAAAGCTC CGCAACGTCA GGAAGACGGA GACAGCAATG CCGTCACTTA CGACAAAATC 4985
GCCCCACTCC CTACCCTACC CAATTTGCAG GATAATGCCT CATTGATGGA TATCAACGGA 5045
gacggccaac TGGATTGGGT TGTTACCGCC TCCGGTATTC GCGGATACCA TAGTCAGCAA 5105
CCCGATGGAA AGTGGACGCA CTTTACGCCA ATCAATGCCT TGCCCGTGGA ATATTTTCAT 5165
CCAAGCATCC AGTTCGCTGA CCTTACCGGG GCAGGCTTAT CTGATTTAGT GTTGATCGGG 5225
CCGAAAAGCG TGCGTCTATA TCCCAACCAG CGAAACGGCT GGCGTAAAGG AGAAGATGTC 5235
CCCCAATCCA CAGGTATCAC CCTGCCTGTC ACAGGGACCG ATGCCCGCAA ACTGGTGGCT 5345
TTCAGTGATA TGCTCGGTTC CGGTCAACAA CATCTGGTGG AAATCAAGGG TAATCGCGTC 5405
ACCTCTGGCC CGAATCTAGG GCATGGCCGT TTCGGTCAAC CACTAACTCT GTCAGGATTT 5465
AGCCAGCCCC AAAATAGCTT CAATCCCGAA CGGCTGTTTC TGGCGGATAT CGACGGCTCC 5525
GGCACCACCG ACCTTATCTA TGCGCAATCC GGCTCTTTGC TCATTTATCT cAACCAAAgi 5585
104
186 242
GGTAATCACT TTτΛTTGGT TTTTAGATTA CC3TTCCCAC AAGCCGTACA d* ΓlGCccc.- 5645
ACTTGCCAAC TTCACGTCGC 'GGC'^τlCGGGC TAGCCAG^TT GATTCTGCCT
CTGCCACATA TCGCGCCCCC TCACTTGCTT TGTGACCTGT ACCCTCCTTC 5765
TTGAATCTAA CCGGCGCGCA CCTCCCACGC TACATTATCG TACTTCGTCG 5825
CAATTCTGGT TGGCTGACCA ATTACAGCTC CCCACAGCCG GCCCCTCTCC GGCTTCTTAT 5335
CTGCCGTTTC C.A^TG^.^TTT TCTATTGTAT cccGccA·rτc COGATGCAAT CCGCGCcccC 5945
CGGCTCCCCC σ'TσλAGTCcc CTACAGCCAC GGCGTCPGGJ CTGGTCCCGA GCGGGAATTC 5005
(2) Dane dla sekwencji SEK NR ID: 12, (i) Charakterystyka sekwencji:
(A) Długość: 1190 aminokwasów (B) lyp: aminokwas (D) Topologia: liniowa ( ii ) Typ cząsteczki · hiałkn ( xi) Opis sekwencji: SEK NR ID: 26;
Mec 1 Ser Glu Ser Leu 5 Phe Thr Gln Thr Leu 10 Lys Glu Ala Arg Arg 15 Asp
Ala Leu val da 20 His Tyr He da Thr 2S Gin Val Pro da Asp 30 Leu Lys
Giu Ser Ile 35 Gln Thr Ala Asp Asp 40 Leu Tyr Glu Tyr Leu 45 Leu Leu Asp
Thr Lye 50 Ha Ser Asp Leu Val 55 Thr Thr Ser Pro Leu 60 Ser Glu ALa Ile
Gly 65 Ser Leu Gln Leu Phe 70 Ile His Arg da Ile 75 Glu Gly Tyr Asp Gly 80
Thr: Leu da Asp Ser 85 da Lys Pro Tyr Phe 90 da Asp Glu Gln Phe 95 Leu
Tyr Asn Trp Asp 100 Ser Phe Asn His Arg 105 Tyr Ser Thr Trp da 110 Gly Lys
Glu Arg Leu 11S Lys Phe Tyr da Gly 120 Asp Tyr Ile Asp Pro 125 Thr Leu Arg
Leu Asn 130 Lys Thr Glu Ile Phe 135 Thr da Phe Glu Gln 140 Gly He Ser Gln
Cly 145 Lys Leu Lys Ser Glu 150 Leu val Glu ser Lys 155 Leu Arg Asp Tyr Leu 160
Ile Ser Tyr Asp Thr 155 Leu da Thr Leu Asp 170 Tyr He Thr da cys 175 Gln
Gly Lys Asp Asn 130 Lys Thr He Phe Phe 185 Ile Gly Arg Thr Gln 190 Asn Ala
Pro Tyr Ala 195 Phe Tyr Trp Arg Lys 200 Leu Thr Leu Val Thr 205 Asp Gly Gly
186 242
105
Lys Leu 210 tys Pro ASP Gln Trp 215 Ser Glu Trp Arg Ala 220 Ile Asn Ala Gly
Ile 225 Ser Glu Ala Tyr Ser 230 cly His Val Glu Pro 235 Phe Trp Clu Asn Asn 240
Lys Leu His Ile Arg 245 Trp Phe Thr Ile Ser 250 Lys Glu Asp Lys Ile 255 Asp
Phe Val Tyr Lys 260 Asn Ile Trp val Mec 265 Ser Ser Asp Tyr ser 270 Trp Ala
Ser Lys Lys 275 Lys Ile Leu Glu Leu 230 Ser Phe Thr Asp Tyr 285 Asn Arg Val
Gly Ala 290 Thr Gly Ser Ser ser 295 Pro Thr Glu Val Ala 300 Ser Gln Tyr Gly
Ser 305 Asp Ala Gln Met Asn 310 ile ser Asp ASP Gly 315 Thr Val Leu Ile Phe 320
Gln Asn Ala Gly Gly 325 Ala Thr Pro Ser Thr 330 Gly Val Thr Leu cys 335 Tyr
Asp ser Gly Asn 340 Val Ile Lys Asn Leu 345 Ser Ser Thr Gly Ser 350 Ala Asn
Leu Ser Ser 355 Lys Asp Tyr Ala Thr 360 Thr Lys Leu Arg Met 365 Cys His Gly
Gln Sar 370 Tyr Asn Asp Asn Asn 375 Tyr cys Asn Phe Thr 380 Leu Ser ile Asn
Thr 385 I-le Glu Phe Thr Ser 390 Tyr Gly Thr Phe Ser 395 Ser Asp Gly Lys Gln 400
Phe Thr Pro Pro Ser 405 Gly Ser Ala Ile Asp 410 Leu His Leu Pro Asn 415 Tyr
Val Asp Leu Asn 420 Ala Leu Leu Asp Ile 425 Ser Leu Asp Ser Leu 430 Leu Asn
Tyr ASP Val 435 Cln Gly Cln Phe Cly 440 Cly Ser Asn Pro Val 445 Aap Asn Phe
Ser Gly 450 Pro Tyr Cly Ile Tyr 455 Leu Trp Glu Ile Phe 460 Phe His Ile Pro
Phe 465 Leu Val Thr Val Arg 470 Mec Gln Thr Glu Gln 475 Arg Tyr Glu Asp Ala 480
Asp Thr Trp Tyr Lys 485 Tyr Ile Phe Arg Ser 490 Ala Gly Tyr Arg Asp 495 Ala
Asn Gly Gln Leu 500 Ile Mec Asp Gly Ser 505 Lys Pro Arg Tyr Trp 510 Asn Val
Met Pro Leu 515 Gln Leu Asp Thr Ala 520 Trp Asp Thr Thr Cln 525 Pro Ala Thr
Thr Asp 530 Pro Asp Val Ile Ala 535 M«C Ala Asp Pro Ket 540 His Tyr Lys Leu
Aia 545 Ile Phe Leu His Thr 550 Leu Asp Leu Leu Ile 555 Ala Arg Gly Asp Ser 560
106
186 242
Ala Tyr Arg Gln Leu 555 Glu Arg Asp Thr Leu 570 Val Glu Ala Lys Met 575 Tyr
Tyr Ile Gln Ala 530 Gln Gln Leu Leu Gly 585 Pro .Arg Pro Asp Ile 590 His Thr
Thr Asn Thr 595 Trp Pro Asn Pro Thr 600 Leu Ser Lys du Ala 605 Gly Ala Ile
Ala Thr 610 Pro Thr Phe Leu Ser 615 Ser Pro du Val Mec 620 Thr Phe Ala Ala
Trp 625 Leu Ser Ala Gly Asp 630 Thr Ala Asn Ile Gly 635 Asp Gly Asp Phe Lau 640
Pro Pro Tyr Asn Asp 645 Val Leu Leu Gly Tyr 650 Trp Asp Lys Leu du 655 Leu
Arg L«u Tyr Asn 660 Leu Arg His Asn Leu 665 Ser Leu Asp dy dn 670 Pro Leu
Asn Lwu Pro 675 Leu Tyr Ala Thr Pro 680 Val Asp Pro Lys Thr 685 Leu Gln Arg
Gln Gln 690 Ala dy dy Asp dy 695 Thr dy Ser Ser Pro 700 Ala Gly Gly Gln
Gly 705 Ser Val dn Ο,γ Trp 710 Arg Tyr Pro Leu Leu 715 Val Glu Arg Aia Arg 720
Ser Ala Val Ser Leu 725 Leu Thr Gln Phe dy 730 Asn Ser Leu Gln Thr 735 Thr
Leu Glu His Gln 740 Acp Asn du Lys Met 745 Thr Ile Leu Leu Gln 750 Thr Gln
Gln Glu Ala 755 Ile Leu Lys His Gln 760 His Ap Ile Gln Gln 765 Asn Asn Leu
Lys dy 770 Leu dn His Ser Leu 775 Thr Ala Leu Gln Ala 780 Ser Arg Asp Gly
Asp 785 Thr Lau Arg dn Lys 790 His Tyr Ser Asp Leu 795 Ile ten dy Gly Leu 800
Ser Ala Ala Glu Ile 805 Ala dy Leu Thr Leu 810 Arg Ser Thr Ala Mec 815 Ile
Thr Asn dy Val 820 Ala Thr Gly Leu Leu 825 Ile Ala Gly Gly Ile 830 Aia ten
Ala Val Pro 835 Asn Val Ph· dy Leu 840 Ala Asn Gly Gly Ser 845 du Trp dy
Ala Pro 550 Lau Ile Gly Ser dy 855 Gln Ala Thr Gln Val 860 Gly Ala dy Ile
Gln 365 Asp dn Ser Aia dy 870 Ile Ser du Val Thr 875 Ala Gly Tyr Gln Arg 380
Airg Gln du du Trp 885 Ala Lau Gln Arg Asp 890 Ile Ala Asp Asn Glu 895 Ile
Thr Gln Leu Asp 900 Ala Gln Ile Gln Ser 905 Leu Cln du Gln Ile 910 Thr Mer
186 242
107
Ala Cln Lys Gln Ile Thr Leu Ser 920 Glu Thr Glu Cln Ala 325 Asn Ala Cln
915
Ala Ile Tyr Asp 93 0 Leu Cln Thr 935 Thr Arg Phe Thr Cly 940 Hn Ala Leu Tyr
Asn 945 Trp Met Ala Gly Ar? 950 Leu Ser Ala Leu Tyr 955 Tyr Cln Met Tyr Asp 960
Ser Thr Leo Pro Il« Cys 965 Leu Cln Pro Lys 970 Ala Ala Leu Gln 975 Glu
Leu Gly Glu Lys 980 Glu Ser Asp Ser Leu 985 Phe Gln Val Pro Val 990 Trp Asn
Asp Leu Trp Gln 995 Gly Leu Leu Ala Cly 1000 Clu Cly Leu Ser Ser 1005 Glu Leu
Gln Lys Leu Asp 1010. Ala Ile Trp Leu 1015 Ala Arg Cly Cly Ile 1020 Gly L«u Glu
Ala He Arg Thr 1025 Val Ser Leu 1030 top Thr Leu Phe Cly 1035 Thr Gly Thr Leu 1040
Ser Glu ton Ile ton Lys 1045 Val Leu Asn Gly Glu 1050 Thr Val Ser Pro Ser 1055
Gly Gly Val Thr Leu Ala 1060 Leu Thr Gly top 1065 Ile Phe Gln Ala Thr 1070 Leu
top Leu Ser Gln 1075 Leu Gly Leu Asp Asn 1080 Ser Tyr Asn Leu Gly 1085 Asn Glu
Lys Lys Arg Arg 1090 Ile Lys tog Ile 1095 Ala Val Thr Leu Pro 1100 Thr Leu Leu
Gly 1105 Pro Tyr Gln top Leu Glu 1110 Ala Thr Leu Val Mec 1115 Gly Ala Glu Ile 1120
Ala Ala Leu Ser His Gly 1125 Val Asn Asp Gly Gly 1130 Arg Phe Val Thr Asp 1135
Phe ton top Ser 1140 Arg Phe 1 Leu Pro Phe Clu 1145 Gly Arg Asp Ala Thr 1150 Thr
Gly Thr Glu 1155 Leu ton Ile Phe His 1160 Ala Gly Lys Glu Gly 1165 Thr Gln
His Ile Glu Leu Val 1170 He tog Asp Ala Asn Ala * Leu Ser 1175 top lie Ile Val His 1130 Leu Asn Tyr
1135 1190 ( 2 ) Dane dla sekwencji SEK NR ID: 27;
(i ) Charakterystyka sekwencji:
(A) Długość: 1881 parzasad (B) Typ: kwas nukleinowy ( C ) Rodzaj nici: podwójna ( D ) Topologia· liniowa (ii) Typ cząsteczki: DNA (genomowy)
108
186 242 (i) Cechy:
(A) Nazwa/Klucz: CDS (b) Powożenie: 1..1881 (C) Inne informacje: produkt = P8 ( xi) Opis sekwencji: SEK NR ID: 27;
ATG TCT GAA TCT TTA TTT ACA CAA ACG TTG AAA G.AA GCG CGC CCT CAT 43
Mec 1 Ser Glu Ser Leu 5 Phe Thr Gln Thr Leu 10 Lys du Ala Arg Arg 15 Asp
GCA TTG GTT GCT CAT TAT .ATT GCT ACT CAG GTG CCC GCA GAT TTA AAA 96
da Leu Val Ala 20 His Tyr Ile Ala Tnr 25 Gln Val Pro da ASP 30 Leu Lys
GAG ACT ATC CAG ACC GCG GAT GAT CTO TAC GAAA TAT CTG TTG CTG GAT 144
du Ser Ile 35 Gln Tłu. da Asp Aep 40 Leu Tyr du Tyr Leu 45 Leu Leu Asp
ACC AAA ATT ACC GAT CTG GTT ACT ACT TCA CCG CTG TCC GAA GCG ATT 192
Thr Lys 50 Ile Ser Asp Lau Val 55 Thr Thr Ser Pro Leu 60 Ser Glu da Ile
GGC ACT CTG CAA TTG TTT ATT CAT CGT GCG ATA GAG GGC TAT GACGGC 240
Gly 65 Ser Leu Gln Leu Pha 70 Ile Hic Arg Ala ile 75 Glu Gly Tyr Asp dy 80
ACG CTG CCA GAC TCA GCA AAA CCC TAT TTT GCC GAT CAA CAG TTT TTA 288
Thr Leu da Asp Ser 35 da Lys Pro Tyr Phe 90 da Asp Glu Gln Phe 95 Leu
TAT AAC TGG GAT ACT TTT AAC CAC CGT TAT AGC ACT TGG GCT GGC AAG 335
Tyr Asn Trp Asp 100 Ser Phe Asn His Arg 105 'tyr Ser Thr Trp da 110 Gly Lys
GAA CGG TTG AC TTC TAT GCC GGG GAT TAT ATT GAT CCA ACA TTG CGA 334
du Arg Lau 115 Lys Phe Tyr da Gly 120 Asp tyr Ile Asp Pro 125 Thr Leu Arg
TTC AAT AAG ACC GAG ATA TTT ACC GCA TTT CAA GGT ATT TCT CA* 432
Leu Asn 130 Lys Thr Glu Ile Phe 135 Thr Ala Phe du Gln 140 Gly Ile Ser Gln
GGG AAA TTA AC ACT GJAA TTA GTC GAA TCT AJAA TTA CGT CAT TAT CTA 430
Gly 145 Lys Leu Lys Ser Glu 130 Leu Val Glu Ser Lys 155 Leu Arg Asp Tyr Leu 160
ATT ACT TAT GAC ACT TTA GCC ACC CTT GAT TAT ATT ACT GCC TGC CAA 528
Ile Ser Tyr Asp Thr 165 Leu da Thr Leu Asp 170 Tyr Ile Thr ALa Cys 175 Gln
GGC A?A GAT AAT AAA ACC ATC TTC TTT ATT GGC CGT ACA CAG AAT GCA 576
Gly Lys Asp Asn 180 Lys Thr Ile Phe Phe 185 Ile dy Arg Thr Gln 190 Asn da
CCC TAT GCA TTT TAT TGG CGA AAA TTA ACT TTA GTC ACT GAT GGC GGT 624
Pro Tyr da 195 Phe Tyr Trp Arg Lys 200 Leu Thr Leu Val Thr 205 Asp Gly Gly
.AAG TTG AAA CCA GAT C.AA TGG TCA GAG TGG CCA GCA ATT AAT GCC GGG 672
Lys Leu 210 Lys Pro Asp Gln Trp 215 Ser Glu Trp Arg Ala 220 Ile Asn da dy
186 242
109
ATT Ile 225 AGT GAG CCA TAT Tyr TCA GCG CAT GTC GAG CTT TTC T GG Trp CAA -AAT AAC -;·
Ser Glu Ala Ser 230 Gly His Val Glu Pro 235 Phe C lu Asn Asn 240
AAG CTG CAC ATC CGT TGG TTT ACT e TCC AAA GAA CAT AAA ATA GAT 7 68
L','s His Ile Ar? Trp Phe Thr Ile Ser Lys Glu Asp Lys Ile Asp
245 250 255
TTT CTT TAT AAA AAC ATC TGG GTG ATG AGT AGC GAT TAT AGC TGG GCA 816
Phe val Tyr Lys Asn Ile Trp val Met Ser Ser Asd Tyr Ser Trp Ala
260 265 270
TCA AAG AAA AAA ATC TTG CAA. CTT TCT TTT ACT GAC TAC AAT ACA GTT 854
Ser Lys Lys Lys Ile Leu Glu Leu Ser Phe Thr Asp Tyr Asn Arg Val
275 280 285
GGA GCA ACA GGA TCA TCA AGC CCS ACT GAA GTA GCT TCA CAA TAT GGT 912
Gly Ala Thr Gly Ser Ser Ser Pro Thr Clu Val Ala Ser Gln Tyr Gly
250 295 300
TCT GAT CCT CAG ATG AAT ATT TCT GAT GAT CGG ACT GTA CTT ATT TTT 960
Ser Asp Ala Gln Met Asn Ile Ser Asp Asp Gly Thr Val Leu Ile Phe
3 OS 310 315 320
CAG AAT GCC GGC CGA GCT ACT CCC AGT ACT GGA GTG ACG TTA TGT TAT 1008
Gln Asn Ala Gly Gly Ala Thr Pro Ser Thr Gly Val Thr Leu Cys Tyr
325 330 335
GAC TCT GGC AAC GTG ATT AAG AAC CTA TCT AGT ACA GGA AGT GCA AAT 1056
Asp Ser Cly Asn Val Ile Lys Asn Leu Ser Ser Thr Gly ser Ala Asn
340 345 350
TTA TCG TCA AAG CAT TAT GCC ACA ACT AAA TTA CGC ATC TGT CAT GGA 1104
Leu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu Arg Met Cys His Gly
355 360 365
CAA AGT TAC AAT GAT AAT AAC TAC TGC AAT TTT ACA CTC TCT ATT AAT 1152
Gln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr Leu ser Ile Asn
370 375 360
ACA ATA CAA TTC ACC TCC TAC GGC ACA TTC TCA TCA GAT GGA AAA CAA 1200
Thr Ile Glu Phe Thr Ser Tyr Gly Thr Phe Ser ser Asp Cly Lys Gln
385 390 395 400
TTT ACA CCA CCT TCT GGT TCT GCC ATT GAT TTA CAC CTC CCT AAT TAT 1248
Phe Thr Pro Pro ser Gly Ser Ala Ile Asp Leu His Leu Pro Asn Tyr
405 410 415
GTA CAT CTC AAC GCG CTA TTA GAT ATT ACC CTC GAT TCA CTA CTT AAT 1296
Val Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu Asp Ser Leu Leu Asn
420 425 430
TAT CAC GTT CAG CGG CAC ttt GGC GGA TCT AAT CCG GTT GAT AAT TTC 1344
Tyr Asp Val Gln Gly Gln Phe Gly Gly Ser Asn Pro Val Asp Asn Phe
435 440 445
ĄGT CGT CCC TAT GGT ATT TAT CTA TGG GAA ATC TTC TTC CAT ATT CCG 1392
Ser Gly Pro Tyr Gly Ile Tyr Leu Trp Glu Ile Phe Phe His Ile Pro
450 455 460
TTC CTT GTT ACG GTC CGT ATG CAA ACC GAA CAA CGT TAC GAA GAC CCG 1440
Phe Leu Val Thr Val Arg Met Gln Thr Glu Gln Arg Tyr Clu Asp Ala
465 470 475 480
GAC ACT TGG TAC AAA TAT ATT TTC CGC AGC GCC GGT TAT CGC GAT GCT 1488
110
186 242
Asp Thr Trp Tyr Lys 436 Tyr Ila Phe Arg Ser 490 Ala Gly Tyr Arg Asp 435 Ala
AAT CGC cag ATT ATC GAT GGC AGT AAA CCA CGT TAT TCG AAT CTG 1535
Asn Gly Gln Leu Ile Met Asp Gly Ser Lys Pro Arg Tyr Trp Asn Val
500 505 510
ATG CCA TTG CAA CTC GAT ACC GCA TGG GAT ACC AGA CAG CCC GCC ACC 1584
Met Pro Leu Gln Leu Asp Thr Ala Trp Asp Thr Thr Gln Pro Ala Thr
515 520 525
ACT GAT CCA GAT GTG ATC GCT ATG GCG GAC CCG ATG CAT TAC AAG CTG 1632
Thr Asp Pro Asp Val Ile Ala Met Ala Asp Pro Met His Tyr Lys Leu
S30 535 540
GCG ATA TTC CTG CAT ACC CTT GAT CTA TTG ATT GCC CGA GGC CAC AGC 1680
Ala Ile Phe Leu His Thr Leu Asp Leu Leu Ile Ala Arg Gly Asp Ser
545 550 555 560
GCT TAC COT CAA CTT CAA. CGC GAT ACT CTA GTC CAA GCC AAA ATG TAC 1728
Ala Tyr Arg Gin Leu Glu Arg Asp Thr Leu Val Glu Ala Lys Met Tyr
565 570 575
TAC ATT CAG GCA CAA CAG CTA CTC GGA CCG CGC CCT GAT ATC CAT ACC 1776
Tyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Arg Pro Asp Ile Hi? Thr
580 585 590
ACC AAT ACT TCG CCA AAT CCC ACC TTG ACT AAA GAA CGT GGC GCT ATT 1824
Thr Asn mr Trp Pro Asn Pro Thr Leu ser Lys Glu Ala Gly Ala Ile
595 600 605
GCC ACA CCG ACA TTC CTC ACT TCA CCG GAG GTG ATG ACG TTC GCT GCC 1872
Ala Thr Pro Thr Phe Leu Ser Ser Pro Glu val Met Thr Phe Ala Ala
610 615 620
TGG CTA AGC 1831
Trp Lau Ser
625 (2 ) Dane dla sekwencji SEK NR ID: 28;
(i) Chatakterystykasekwencji:
(A) Długość: 627 aminokwasów (B) Typ: aminokwas (D) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEK NR ID' 28;
Met 1 Ser Glu Ser Leu 5 Phe Thr Gln Thr Leu 10 Lys Glu Ala Arg Arg 15 Asp
Ala Leu Val Ala 20 His Tyr Ile Ala Thr 25 Gln Val Pro Ala Asp 30 Leu Lys
Glu Ser Ile 35 Gln Thr Ala Asp Asp 40 Leu Tyr Glu Tyr Leu 45 Leu Leu Asp
Thr Lys 50 Ile Ser Asp Leu Val 55 Thr Thr Ser Pro Leu 60 Ser Glu Ala Ile
Gly Ser Leu Gln Leu Phe Ile His Arg Ala Ile Glu Gly Tyr Asp Gly
186 242
111
65 70 75 30
Thr Lea A.la Asp Ser 35 Ala Lys Pro Tyr Phe 90 Ala Asp Glu Gin Phe 95 Leu
Tyr Asn Trp Asp 100 Ser Phe Asn His Arg 105 Tyr Ser Thr Trp Ala 110 Gly Lys
Glu Arg Leu 115 Lys Phe Tyr Ala Cly 120 Asp Tyr Ile Asp Pro 125 Thr Leu Arg
Lau Asn 130 Lys Thr Glu Ile Phe 135 Thr Ala Phe Clu Cln 140 Cly Ile Ser Gln
Gly 145 Lys Leu Lys Ser Clu 150 Leu Val Glu Ser Lys 155 Leu Arg Asp Tyr Leu 160
Ile Ser Tyr Asp Thr 165 Leu Ala Thr Leu Asd 170 Tyr Ile Thr Ala Cys 175 Gln
Gly Lys Asp Asn 130 Lys Thr He Phe Phe 135 Ile Gly Arg Thr Gln 190 Asn Ala
Pro Tyr Ala 195 Phe Tyr Trp Arg Lys 200 Leu Thr Leu Val Thr 205 Asp Gly Gly
Lys Leu 210 Lys Pro Asp Gln Trp 215 Ser Glu Trp Arg Ala 220 Ile Asn Ala Gly
Ile 225 Ser Glu Ala Tyr Ser 230 Gly His Val Glu Pro 235 Phe Trp Glu Asn Asn 240
Lys Leu His Ile Arg 245 Trp Phe Thr Ile Ser 250 Lys Clu Asp Lys Ile 255 Asp
Phe Val Tyr Lys 260 Asn Ile Trp Val Met 265 Ser Ser Asp Tyr Ser 270 Trp Ala
Ser Lys Lys 275 Lys He Leu Clu Leu 230 Ser Phe Thr Asp Tyr 235 Asn Arg Val
Gly Ala 290 Thr Gly Ser Ser Ser 295 Pro Thr Glu Val Ala 300 Ser Gln Tyr Cly
Ser 305 Asp Ala Cln Met Asn 310 Ile Ser Asp Asp Gly 315 Thr Val Leu Ile Phe 320
Cln Asn Ala Gly Cly 325 Ala Thr Pro Ser Thr 330 Gly val Thr Leu Cys 335 Tyr
Asp Ser Cly Asn 340 Val He Lys Asn Leu 345 ser Ser Thr Gly Ser 350 Ala Asn
Leu Ser Ser 355 Lys Asp Tyr Ala Thr 3 60 Thr Lys Leu Arg Met 365 cys His Gly
Gln Ser 370 Tyr Asn Asp Asn Asn 375 Tyr Cys Asn Phe Thr 330 Leu Ser Ile Asn
Thr 335 Ile Clu Phe Thr Ser 390 Tyr Cly Thr Phe Ser 395 Ser Asp Gly Lys Gln 400
Phe Thr Pro Pro ser 405 Cly Ser Ala Ile Asp 410 Leu His Leu Pro Asn 415 Tyr
'.'al Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu Asp Ser Leu Leu Asn
112
186 242
420 425 430
Tyr CTp Val 435 Gln cus cln ret clv 440 cls Ser CTn rro Val 445 Ctp Asn ?hs
Ser dy ero Tsr Giy ile Tsr Leu Trp Clu Ile me ree HST Ile rro
450 455 450
Phe Leu Val eer Val crg Met Cln eer Clu Cln Arg Tsp Glu Atp Cla
465 470 47S 43C
CTp Ter Trp T/r Lst Tzr Ile rhe Crg Sep cla cl? Tsr Cpg Ctp Ala
485 490 495
ATn Gly Gln Leu Ile Mec. cer GlY Ser L'st rro Cpg Tyr hpp ATn Val
500 505 510
Mec rro Leu Gin Leu CTp Thr Cla erp Ctp eer eer Cln Pro Ala eer
515 520 525
Thr Asp Pro Asp Val Ile Ala Met Ala Mp Pro Met His T/r Lys Leu
530 535 540
Ala Ile Phe Leu His Thr Leu Mp Leu Leu Ile Cla Arg Gly Atp Sep
545 550 555 550
Ala Tyr Arg Gln Leu Glu Mg Asp Thr Leu Val Glu Ala Lys Mec Tyr
565 570 575
Tyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Mg Pro Mp Ile His Thr
580 585 590
Thr Asn Thr Trp Pro Mn Pro Tir Leu Ser Lys Glu Ala Gly Cla Ile
595 600 605
Ala Thr Pro Thr Phe Leu Ser Ser Pro Glu Val Mec Thr Phe Cla Ala
610 615 620
Trp Leu ser
625
( 2 ) Dane dla sekwencji SEK NR ID: 29;
(i) Charakterystyka sekwencji:
(A) Długość: 1689 par zasad (B) Typ: kwas nukleinowy (C ) Rodzaj nici: podwójna (D) Topologia: liniowa ( ii ) Typ cząsteczki: DNA (genomowy) (ix) Cechy:
(A) Nazwa/Klucz: CDS (b) Pałażenie.: 1..1689 (D ) Inne informacje: /produkt + S8 ( xi) Opis sekwencji: SEK NR ID: 29;
GCA GC GAT ACC GA AAT ATT GGC GAC G7T GAT TTC TTG CCA CCG TAC
Ala Gly Asp Thr Ala Asn Ile Gly Asp Gly Asp Phe Leu Pro Pro Tyr l 5 10 15
186 242
AAC Asn GAT Asp GTA Vai CTA Lau 20 CTC Leu GgT Gly TAC Tyr T*G Trp 3AT Asp 25 AAA t -·» CTT Leu GAG Glu TTA Leu CGC Arg 30 CTA Lau TAC Tyr 9 5
AAC CTG CGC CAC AAT CTG tT / CTG ttA GGT CAA CCG CTA AAT GTG CCA 144
Asn Leu Arg 35 His Asn Leu Ser Lsu 40 Asp dy Gln Pro Leu 43 Asn Leu Pro
CTG TAT GCC ACG CCG GTA GAC CCG AAA ACC CTG CAA ATA CAG CAA GCC 132
Leu Tyr 50 Ala Thr Pro Val Asp 55 Pro Lys Thr Leu Gln 60 Arg Gln Gin Ala
GA GGG GAC GGT ACA GGC ACT ACT CCG GCT GGT GGT CAA GGC AGT GTT 240
Giy 65 Gly Asp Gly Thr Gly 70 Ser Ser Pro Ala Gly 75 Giy Gln Gly Ser Val 80
CAG CGC TGG CGC TAT CCG TTA TTC GTA GAA CGC GCC CGC TCT GCC T/t 288
Gln Gly Trp teg Tyr 35 Pro Leu Leu Val Glu 90 Arg Ala Arg Ser Ala 95 Val
AST TTG TTC ACT CAG TTC GGC AAC AGC TTA CAA ACA ACG TTA GAA CAT 336
Ser Leu Leu Thr 100 Gln Phe Gly ten Ser 105 Leu Gln Thr Thr Leu 110 Glu His
CAG GAT AAT GAA AAA ATG ACG ATA CTG TTC CAG ACT CAA CAG GAA GCC 334
Gln Asp Asn 115 du Lys Mac Thr Ile 120 Leu Leu Gln Thr dn 125 Gln Glu Ala
ATC CTG AAA CAT CAG CAC GAT ATA CAA CAA AAT AAT CTA AAA GGA TTA 432
Ile Leu 130 Lys His Gln His Asp 135 Ile Gln Gln ten ten 140 Leu Lys Gly Leu
CAA CAC AGC CTG ACC GCA TTA CAG GCT AGC CGT CAT GGC GAC ACA TTC 480
Gin 143 His Ser Leu Thr Ala 150 Gln Ala Ser teg 155 Asp Gly Asp Thr Leu 160
CGG CAA AAA CAT TAC AGC GAC CTG ATT AAC GGT GGT CTA TCT GCG GCA 523
Arg Gln Lys His Tyr 165 Ser tep Leu Ile Asn 170 dy Gly Leu Ser Ala 175 Aia
GAA ATC GCC CGT CTG ACA CTA CGC AGC ACC GCC ATG ATT ACC AAT GGC 576
du Ile Ala Gly 180 Leu Thr Leu Arg Ser 185 Thr Ala Mec Ile Thr 190 Asn Gly
GTT GCA ACG TTA TTG CTC ATT GCC GGC GGA ATC GCC AAC GCG GTA CCT 624
Val Ala Thir Gly 195 Leu Leu Ile Ala 200 Gly Gly Ile Ala Asn 205 Ala Val Pro
AAC GTC TTC GGG CTG GT AAC GGT GGA TCG GAA TGG Go- GCG CCA TTA 672
Asn Val 210 Phe Gly Leu Ala Asn 215 Gly Gly Ser Glu Trp 220 dy Ala Pro Leu
ATT CGC TCC GGG CAA GCA ACC CAA GTT GGC GCC GGC ATC CAG CAT CAG 720
Ile 225 Gly Ser Gly Gln ALa 230 Thr Gln Val Gly Ala 235 Gly Ile Gln Asp Gln 240
AGC GCG GGC ATT TCA GAA GTG ACA GCA GGC TAT CAG CGT CGT CAG GAA 763
Ser Ala Gly Ile Ser 245 Glu val Thr Ala Gly 250 tyr Gln Arg teg Gln 255 Glu
GAA TGG GCA TTG CAA CGG GAT ATT GCT GAT AAC GAA ATA ACC CAA CTG 816
Glu Trp Ala Leu 260 Gln Arg Asp Ile Ala 265 Asp ten Glu Ile Thr 270 dn Leu
GAT GCC CAG ATA CAA AGC CTG CAA GAG CAA ATC ACG ATC GCA CAA AAA 354
114
186 242
Asp AU Gin 275 zie Gln Ser Leu Gln 280 Glu Gln His Thr Met 235 Ala Gln l/5
CAG ATC ACG TCT GAA ACC GAA CAA GCG AAT GCC CAA GCG ATT TAT 912
Gln Ile 290 Thr Leu Ser Glu Thr 295 Glu Gln Ala Asn Ala 300 Gln Ala Ile Tyr
GAC CTG CAA ACC ACT ·- i TTT ACC GGG CAG GCA CGG TAT AAC TGG ATG 960
Asp 305 Leu Gln Thr Thr Arg 310 Phe Thr Gly Gln Ala 3 15 Leu Tyr Asn Trp Mec 320
GCC GGT CGT ctc TCC GCG CTC TAT TAC CAA AGG TAT GAT Tcc ACT CTG 1008
Ala Gly Arg Leu Ser 325 Ala Leu Tyr Tyr Gln 330 Mec Tyr Asp Ser Thr 335 Leu
CCA ATC TGT CTC CAO CCA AAA GCC GCA TTA GTA CAG GAA TTA GGC GAC 1056
Pro Ile Cys Leu 340 Gln Pro Lys Ala Ala 345 Leu Val Gln Glu Leu 350 Gly Glu
AAA GAG AGC GAC AGT CTT TTC CAG GTT CCG CTG TCG AAT GAT CTG TGG 1104
Lys Glu Ser 355 Asp Ser Leu Phe Gln 360 Val Pro Val Trp Asn 365 Asp Leu Trp
CAA GGG CTG TTA CCA GGA GAA GGT TTA AGT TCA GAG CTA CAG AAA CTG 1152
Gln Gly 370 Leu Leu Ala Gly Glu 375 Gly Leu Ser Ser Glu 380 Leu Gln Lys Leu
GAT GCC ATC TGG CTT GCA CGT GGT GGT ATT GGG CTA GAA GCC ATC CGC 1200
Asp 385 Ala Ile Trp Leu Ala 390 Arg Gly Gly Ile Gly 395 Leu Glu Ala Ile Arg 400
ACC GTG TCG CTG GAT ACC CTC TTT GGC ACA GGG ACG TTA AGT GAA AAT 1248
Thr Val Ser Leu Asp 405 Thr Leu Phe Gly Thr 410 Gly Thr Leu Ser Glu 415 Asn
ATC AAT AAA GTG CTT AAC GGG GAA ACG CTA TCT CCA TCC GGT GGC GTC 1296
Ile Asn Lys Val 420 Lau Asn Gly Glu Thr 425 Val Ser Pro Ser Gly 430 Gly Val
ACT CTO GCG CTC ACA GGG GAT ATC TTC CAA GCA ACA CTC GAT TTC AGT 1344
Thr Leu Ala 435 Lau Thr Gly Asp Ile 440 Phe Gln Ala Thr Leu 445 Asp Leu Ser
CAG CTA GGT TTO GAT AAC TCT TAC AAC TTC GGT AAC GAG AAG AAA CGT 1392
Gln Leu 450 Gly Leu Asp Asn ser 455 Tyr Asn Leu Gly Asn 460 Glu Lys Lys Arg
CGT ATT AAA CGT ATC GCC GTC ACC CTG CCA ACA CTT CTC GGG CCA TAT 1440
Arg 465 Ile Lys Arg Ile Ala 470 Val Thr Leu Pro Thr 475 Leu Leu Gly Pro Tyr 480
CAA GAT CTT GAA GCC ACA CTC GTA ATG GGT GCG GAA ATC GCC GCC TTA 1488
Gln Asp Leu Glu Ala 485 Thr Leu Val Hec Gly 490 Ala Glu Ile Ala Ala 495 Leu
TCA CAC GGT GTC AAT GAC GGA GGC CGG TTT GTT ACC GAC TTT AAC GAC 1535
Ser His Gly Val 500 Asn Asp Gly Gly Arg 505 Phe Val Thr Asp Phe 510 Asn Asp
ACC CGT TTT CTC CCT TTT GAA GGT CGA GAT GCA ACA ACC GGC ACA CTG 1534
Ser Arg Phe 515 Leu Pro Phe Glu Gly 520 Arg Asp Ala Thr Thr 525 Gly Thr Leu
GAG ctc AAT ATT TTC CAT GCG GGT AAA GAG GGA ACG CAA CAC GAG TTG 1632
Glu Leu 530 Asn Ile Phe His Ala 535 Gly Lys Glu Gly Thr 540 Gln His Glu Leu
186 242
115
GTC GCG AAT CTG AGT GAC aC λ ΓΤ C AAa TAC ATC ATT CGA 15 i ) Ars 3ćÓ
val 545 Ala Asn Leu 5er Asp 550 Ile Ile Val His Leu 355 Asn Tyr Ile Ile
GAC GCG TAA 1613
Asp Ala
( 2 ) Dane dla sekwencji SEK NR ID. 30:
(i) Charakterystyka sekwencji: (A) Długość: 563aminokwasów ( D ) Typ aminokwas (D) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEK NR ID: 30;
Aia Gly Asp Thr Ala Asn 1 5 Ile Gly Asp Gly Asp Pne Leu Pro pro Tyr 10 15
Asn Asp Val Leu Leu Gly 20 Tyr Trp Asp Lys Leu Glu Leu Arg Leu Tyr 25 30
Asn Leu Arg His Asn Leu 35 Ser Leu Asp Giy Gln Pro Leu Asn Leu Pro 40 45
Leu Tyr Ala Thr Pro '/al 50 Asp Pro Lys Thr Leu Gln Arg Gln Gln Ala 55 80
Gly Gly Asp Gly Thr Gly 65 70 ser ser pro Ala Gly Gly Gln Gly ser vai 75 30
Oln Gly Trp Arg Tyr Pro 85 Leu Leu val Glu Arg Ala Arg Ser Ala Val 90 93
Ser Leu Leu Thr Cln Ph· 100 Gly Asn ser Leu Gln Thr Thr Leu Glu His 105 110
Gln Asp Asn Glu Lys Met 115 Thr Ile Leu Leu Gln Thr Gin Gln Glu Ala 120 125
Ile Leu Lys His Gln Kis 130 Asp Ile Gln Gin Asn Asn Leu Lys Gly Leu 135 140
Gln His ser Leu Thr Ala 145 150 Leu cln Ala ser Arg Asp Cly Asp Thr Leu 155 160
Arg Gln Lys His Tyr ser 165 Asp Leu Ile Asn Gly Gly Leu Ser Ala Ala 170 175
Glu Ile Ala Gly Leu Thr 180 Leu Arg ser Thr Ala Mec ile Thr Asn Gly 185 190
Val Ala Thr Gly Leu Leu 195 Ile Ala Gly Gly Ile Ala Asn Ala Val Pro 200 205
Asn Val Phe Gly Leu Ala 210 Asn Gly Gly ser Glu Trp Gly Ala Pro Lau 213 220
Ile Gly Ser Gly Gln Ala Thr Cln Val Gly Ala Gly II· Gln Asp Gln
116
186 242
225 2J0 235 240
Sec Aia Gly na ser 245 Glu Val Thr Ala dy 250 Tyr Gln Arg Arg dn 255 Glu
Glu Trp Ala Leu 260 Gln Arg Mp Ile Ala 265 Asp Asn Giu Ile Thr 270 G ln Leu
Asp Ala Gln 275 Ile Gln Ser Leu Cln 280 Glu Gln Ile Thr Mec 235 Ala Gln Lys
Gln Ile 290 Thr Leu Ser Glu Thr 295 Glu Gln Ala Asn Ala 300 Gln Ala Iie Tyr
Mp 305 Leu Gln Thr Thr Mg 310 Phe Thr dy Gln Ala 315 Leu Tyr Asn Trp Mec 320
Ala Gly Mg Leu Ser 325 Ala Leu Tyr Tyr Gln 330 Mec Tyr Mp Ser Thr 335 Leu
Pro Ile Cys Lau 340 Gln Pro Lys Ala Aia 345 Leu Val Gln Glu Leu 350 dy Glu
Lys Glu Ser 335 Mp Ser Leu Phe Gln 360 Val Pro val Trp Asn 3 65 Asp Leu Trp
Gln Gly 370 Leu Leu Ala dy du 375 dy Leu Ser Ser Glu 380 Leu Gln Lys Leu
Asp 385 Ala Ile Trp Leu Ala 390 Arg Gly dy Ile dy 335 Leu du Ala Ile Arg 400
Thr V al Ser Leu Asp 405 Thr Leu Phe dy TUr 410 Gly Th: Lau Ser du 415 Mn
Ile Asn Lys Val 420 Leu Mn Gly Glu Thr 425 Val Ser Pro Ser Gly 430 dy Val
Thr Lau Ala 435 Leu Thr Gly Asp Ile 440 Pha Gln Ala Thr Leu 445 Mp Leu Ser
Gln Leu 450 Gly Leu Asp Mn Ser 455 Tyr Mn Leu Gly Mn 460 Glu Lys Lys Arg
Arg 455 Ile Lys Acg Ile Ala 470 Val Thr Leu Pro Thr 475 Lau Leu dy Pro Tyr 480
Gln Mp Leu Glu Ala 485 mr Leu Val Gly 490 Ala Glu Ile Ala Ala 495 Leu
Ser Hls Gly Val 500 Mn Mp Gly dy Mg 505 Pha Val Thr Asp Phe 510 Asn Asp
Ser Arg Phe 515 Leu Pro Phe Glu Gly 520 Mg Mp Ala Thr Thr 525 dy Thr Leu
Glu Leu 530 Mn Ile Pha His Ala 535 dy Lys du dy Thr 540 Gln His du Leu
Vel 545 Ala Asn Leu Ser Mp 550 Ile Ile Val HS Leu 555 Mn T/r Ile Ile Arg 560
Asp Ala
186 242
117 ( 2 ) EOne dla sekwencji SEK NR HZ): 31;
(i) Charakterystyka sekwencji:
( A ) Długość: 4458 par zasad ( B ) Typ: kwas nukleinowy ( C ) Rodzaj nici: podwójna ( D ) Topologia: liniowa ( n ) Typ cząsteczki: DNA (genomowy) (ix ) Cechy:
(A) Nazwa/Klucz: CDS (B) Położenie: 1.. 4458 (xi) Opis sekwencji: SEK NR ID' 31;
ATG Met 1 CAG Gln GAT Asp TCA Ser CCA GAA GTA TCG ATT ACA ACG CTG TCA CTT CCC Pro 15 AAA Lys 43
Pro 5 Glu Val Sar Ile Thr 10 Thr Leu Ser Leu
3GT GGC GGT GCT ATC AAT GGC ATG GGA GAA GCA CTG AAT GCT GCC CGC
Gly Gly Gly Ala 20 Ile Asn Gly Met Gly 25 Glu Ala Leu Asn Ala 30 Ala Gly
GAT GGA ATG GCC TCC CTA TCT CTG CCA rfA CCC CTT TCG ACC CGC 144
Pro Asp Gly 35 Met Ala Ser Lau Ser 40 Lau Pro Leu Pro Leu 45 Ser Thr Gly
AGA GGG ACG GCT CCT GGA TTA TCG CTG ATT TAC AGC AAC AGT GCA CGT 192
Arg Gly 50 Thr Ala Pro Gly Leu 55 ser Leu Ile Tyr Ser 60 Aan Ser Ala Gly
AAT GGG CCT TTC GGC ATC GGC TCG CAA TGC GGT GTT ATG TCC ATT AGC 240
Asn 65 Gly Pro Phe Gly Ile 70 Gly Trp Gln Cys Gly 75 Val Met ser Ile ser 30
CCA CGC ACC CAA CAT GGC ATT CCA CAA TAC GGT AAT GAC GAC ACG TTC 238
Arg Arg Thr Gln His 85 Gly Ile Pro Gln Tyr 90 Gly Asn Asp Asp Thr 95 Phe
CTA TCC CCA CAA GGC GAG GTC ATG AAT ATC GCC CTG AAT GAC CAA GGG 336
Leu Ser Pro Gln 100 Gly Glu Val Met Asn 105 Ile Ala Leu Asn Asp 110 Gln Gly
CAA CCT GAT ATC CGT CAA GAC GTT AAA ACG CTG CAA GGC GTT ACC TTC 33 4
Cln pro Asp 113 Ile Arg Gln ASP Val 120 Lys Thr Leu Gln Gly 125 Val Thr Leu
CCA ATT (CC TAT ACC GTG ACC CGC TAT CAA GCC CGC cag ATC CTC GAT 432
Pro Ile 130 Ser Tyr Thr Val Thr 135 Arg Tyr Gln Ala Arg 140 Gln Ile Leu Asp
TTC AGT AAA ATC GAA TAC TGG CAA CCT GCC TCC GGT CAA GAA GGA CCC 430
?ne 145 ser Lys Ile Glu Tyr 150 Trp Gln Pro Ala Ser 155 Gly Gln Glu Gly Arg 160
gCT TTC TGG CTG ATA TCG ACA CCG GAC GGG CAT CTA CAC ATC TTA gGg 528
Ala Phe Trp Leu Ile 1S5 Ser Thr pro Asp Gly 170 His Leu His Ile Leu 175 g ’♦ t '-»±S
AAA Λ - — GCG CAG GCT TGT CTG GCA .AAT *— 00 CAA AAT GAC CAA CAA ATC 57 5
Lys Thr Ala Gln Ala Cys Leu Ala Asn Pro Gln Asn Asp Gln Gln Ile
118
186 242
130 135 190
-·/» ~ — Ala CAG Gin « -4^ Trp 135 Leu cTC Leu Glu GAaA Glu ACT Thr 200 GTG V a 1 .nw g Thr CCA Pro gCC Ala GCT Gly 205 GAA Glu CAT His GTc Val 524
AGG TAT CAA TAT CGA CCC gAA gAT GAA GCC CAT TCT GAC GAC AAT GAA
Ser ’ 1 · Gln Tyr Arg Ala Clu Asp Glu Ala His Cys Asp Asp Asn Glu
210 215 220
AAA ACC TAT CGG AAT GTT ACC GCA CAG TAT CTG GTA CAG GTC 20
Lys Thr Ala His Pro Asn Val Thr Ala Gln Arg Tyr Leu Val Gln Val
225 230 235 240
AAC TAC GGC AAC ATC AAA CCA CAA GCC AGC CTG TTC GTA CTG GAT AAG 63
Asn Tyr Gly Asn Ile Ly:s Pro Gln Ala Ser Leu Phe Val Leu Asp Asn
245 250 255
GCA CCT CCT GCA CCG GAA GAG TGG CTG TTT CAT CTG GTC TTT GAC CAC 315
Aid Pro Pro Ala Pro GlU Glu Trp Leu Phe His Leu Val Phe Asp His
260 265 270
GGT GAG CGC GAT ACC TCA CTT CAT ACC GTG CCA ACA TGG GAT GCA GGT 364
Gly Glu Arg Asp Thr Ser Leu His Thr Val Pro Thr Trp Asp Ala Gly
275 230 235
ACA GGG CAA TGG TCT GTA CGC CCG GAT ATC TTC TCT CGC TAT GAA TAT 912
Thr Ala Gln Trp Ser Val Arg Pro Asp Ile Phe Ser Arg Tyr Clu Tyr
290 295 300
GGT TTT GAA GTG CGT ACT CGC CGC TTA TGT CAA CAA GTC CTG ATG TTT 950
Gly Phe Glu Val Arg Thr Arg Arg Leu Cys Cln Cln val Leu Met Phe
305 310 315 320
CAC CGC ACC GCG CTC ATG CCC CCA GAA GCC AGT ACC AAT GAC CCC CCC 1003
His Arg Thr Ala Leu Mec Ala Cly Glu Ala Ser Thr Asn Asp Ala Pro
325 330 335
GAA CTG GTT GCA CGC TTA ATA CTG GAA TAT GAC AAA AAC GCC AGC CTC 105 6
Glu Leu Val Gly Arg Leu Ile Leu Glu Tyr Asp Lys Asn Ala Ser Val
340 345 350
ACG ACG TTG ATT ACC ATC CGT CAA TTA AGC CAT GAA TCG CAC GGC AGG 1104
Thr Thr Leu Ile Thr Ile Arg Cln Leu Ser His Glu Ser Asp Gly Arg
355 360 365
CCA GTC ACC CAC CCA CCA CTA GAA CTA GCC TGC CAA CGC TTr GAT CTC 1152
Pro val Thr Gln fro Pro Leu Clu Lau Ala Trp Gln Arg Phe Asp Leu
370 375 330
GAG AAA ATC CCG ACA TGG CAA CGC TTT GAC GCA CTA GAT AAT TTT AAC 1200
Glu Lys Ile Pro Thr Trp Gln Arg Phe Asp Ala Leu Asp Asn Phe Asn
3 35 390 395 400
TCG CAG CAA CGT TAT CAA CTG GTT CAT CTG CGG GGA GAA GGG TTG CCA 1243
Ser Gln Gln Arg Tyr 405 Gln Leu Val Asp Leu 410 Arg Gly Glu Cly Leu 415 Pro
CGT ATG CTG TAT CAA GAT CGA GGC GCT TGG TGG TAT AAA GCT CCG CAA 1295
G ’y lllj* Met Leu Tyr 420 Gln Asp Arg Cly Ala 425 Trp Trp Tyr Lys Ala 430 Pro Gln
CGT CAG GAA GAC GGA GAC AGC AAT GCC GTC ACT TAC GAC AAA ATC GCC 12 44
Arg Gln Glu Asp Gly Asp Ser Asn Ala Val Thr Tyr Asp Lys Ile Ala
435 440 445
186 242
119
. --C AEC c-A AAT TTG CAG GAT AAT gCC - cA TTG ATG GA. i
Pro Leu 450 Pro Thr LAU Pro Asn 455 Leu Gin Asb Asn Ala 460 Ser Leu Met Asp-
ATC AAC GGA GAC GGC CAA CTG GAT TGG GTT GTT ACC GCC TCC Gg 1 ATT 1440
Ele Asn 465 Gly Asp Gly Gln 470 Leu Asp Trp Val Val 475 Thr Ala Ser Gly Ile 430
«'•yC vwA TAC CAT AGT CAG CAA CCC CAT GGA AAG TGG ACG CAC TTT ACG 1488
Arg Gly Tyr Hi 3 Ser 485 Gln Gln Pro Asp Gly 490 Lys Trp Thr His Phe 495 Thr
CCA ATC AAT GCC TTG ccc CTG CAA TAT TTT CAT CCA AGC ATC CAG T>T*C 1553
Pro Ile Asn Ala. 500 Leu Pro val Glu Tyr 505 Phe His Pro Ser Ile 510 Gln Phe
GCT GAC CTT ACC GGG GGG GCA GGC TTA TCT GAT TTA GTG TTG ATC GGG rm 1584
Ala Asp Leu 515 Thr Gly Ala Cly Leu 520 Ser Asp Leu Val Lau 525 Ile Gly Pro
AAA -AGC GTG CGT CTA TAT CCC AAC CAC CGA AAC GGC TGC CGT AAA GGA 1632
Lys Ser 530 Val Arg Leu Tyr Ala 535 Asn Cln Arg Asn Gly 540 Trp Arg Lys Gly
CAA GAT GTC CCC CAA TCC ACA CGT ATC ACC CTG CCT GTC ACA GGG ACC 1680
Glu Asp 545 val Pro Gln ser 550 Thr Gly Ile Thr Leu 555 Pro Val Thr Gly Thr 560
GAT GCC CGC AAA CTG GTG GCT TTC AGT GAT ATG CTC GGT TCC GGT CAA 1723
Asp Ala Arg Lys Leu 565 Val Ala Phe Ser Asp 570 Met Lau Gly Ser Gly 575 Gln
CAA CAT CTG GTG GAA ATC AAC CGT AAT CGC GTC ACC TGT TGG CcG AAT 177 6
Gln His Lau Val 580 Glu Ile Lys Gly Asn 585 Arg val Thr cys Trp 590 Pro Asn
CTA GGG CAT GGC CGT TTC GGT CAA CCA CTA ACT CTG TCA GGA TTT AGC 1324
Leu Gly His 595 Gly Arg Phe Gly Gln 600 Pro Leu Thr Leu Ser 605 Gly Phe Ser
CAG cCC GAA AAT ACC TTC AAT CCC GAA CGG CTG TTT CTG GCG CAT ATC 1372
Gln Pro 510 Glu Asn Ser Phe Asn 615 Pro Glu Arg Lau Phe 620 Lau Ala Asp Ile
GAC GGC TCC GGC ACC ACC GAC CTT ATC TAT CCG CAA TCC GGC TCT TTG 1920
Asp Gly 625 Ser Gly Thr Thr 630 Asp Leu Ile Tyr Ala 635 Gln Ser Gly Ser Leu 640
CTC ATT TAT CTC' AAC CAA ACT GGT AAT CAC TTT GAT GCC CCG TTG ACA 19 68
Leu Ile Tyr Leu Asn 645 Gln Ser Gly Asn Gln 650 Phe Asp Ala pro Leu 655 Thr
TTA GCG TTG CCA GAA CGC GTA CAA TTT GAC AAC ACT TCC CAA CTT CAA 2015
Leu Ala Leu Pro 660 Glu Gly Val Gln Phe 665 Asp Asn Thr cys Gln 670 Lau Gln
GTC GCC GAT ATT CAG GGA TTA GGG ATA GCC ACC TTG ATT CTG ACT GTG 2064
Val Ala Asp 575 Ile Gln Gly Leu Gly 680 Ile Ala Ser Leu Ile 635 Leu Thr Val
CCA CAT ATC GCG CCA CAT CAC TGG CGT TGT GAC CTG TCA CTG ACC AAA 2112
Pro His 690 Ile Ala Pro His His 695 Trp Arg Cys Asp Leu 700 Ser Leu Thr Lys
C TGG TTC TTG AAT GTA ATG AAC AAT AAC CCG GGC GCA CAT CAC ACG 216 0
?ro Trp Leu Leu Asn Val Mee Asn Asn Asn Arg Gly Ala His His Thr
120
186 242
765
710
715
720
CTA Leu CAT His TAT Tyr CGT Arg ACT Ser 725 TTC Ser Ala C.AA Gln Phe • Al Trp 730 Leu Asp Glu Lys Leu 735 Gln 2209
CTC ACC AAA GCA GGC AAA TCT W GCT TGT TAT cTG cCG TTT CCA ATG 2256
Leu Thr Lys Ala 740 Gly Lys Ser Pro Ala 745 cys Tyr Leu Pro Phe 75u Pro Mec
CAT TTG GTA TTG TAT ACC CAA ATT CAG CAT GAA ATC AGC GGC AAC CGG 2334
His Leu Leu 755 Trp Tyr Thr Glu Ile 760 GlM Asp Glu Ile Ser 765 Gly Asn Arg
CTC ACC AGT CAA CTC AAC TAC AGC CAC GGC GTC TGG CAT GGT AAA GAG 2352
Leu Thr 770 Ser Glu Val Asm Tyr 775 Ser His Gly Val Trp 730 Asp Gly Lys Glu
CGG GAA. TTC ACA CCA ttt TCC ATC AAA CAG ACA GAT ACC ACA AGO 2400
Arg 7θ5 Glu Phe Arg Gly Phe 790 Gly Cys Ile Lys Gin 795 Thr Asp Thr Thr Thr 300
T*”!* TCT CAC CCC ACC CCC CCC CAA CAG GCG GGA CCG TCO CTG ACT ATT 2443
Phe Ser His Gly Thr 305 Ala Pro Glu Gln Ala 310 Ala Pro Ser Leu Ser 315 Ile
AGC TOG TTT CCC ACC CCC ATG GAT CAA GTA GAC AGC CAA TTA GGT A.CG 2496
Ser Trp Phe Ala 320 Thr Gly mcc Asp Glu 325 Val Asp Ser Gln Leu 330 Ala Thr
GAA TAT TGG CAG GCA GAC ACS CAA GGT TAT AGC GGA TTT CAA ACC CGT 2544
Glu Tyr Trp 335 GlM Ala Asp Thr Gln 340 Ala Tyr Ser Gly Phe 345 Glu Thr -Arg
TAT ACC GTC TGG GAT CAC ACC AAC CAG ACA GAC CAA GCA TTT ACC CCC 2592
Tyr Thr 350 Val Trp Asp His Thr 355 Asm Gln Thr Asp Gln 360 Ala Phe Thr Pro
AAT GAC ACA CAA CGT AAC TGG CTG ACG CGA GCG CTT AAA GGC CAA CTC 2640
Asn 365 Glu Thr Gln Arg Asn 370 Trp Leu Thr Arg Ala 375 Leu Lys Gly GlM Leu 330
CTA CGC ACT GAG CTC TAC GCT cTg GAC CGA ACA GAT AAG CAA ACA GTG 2633
Leu Arg Thr Glu Leu 335 Tyr Gly Leu Asp Gly 390 Thr Asp Lys Gln Thr β95 Val
CCT TAT ACC GTC AGT GAA TCG CGC TAT CAG GTA CGC TCT ATT CCC GTA 2736
Pro Tyr Thr Val 900 Ser Glu Ser Arg Tyr 905 GlM val Arg Ser Ile 910 Pro Val
AAT AAA CAA ACT CAA TTA TCT CCC TCC GTG ACT CCT ATT CAA AAT CGC 2”34
Asn Lys Glu 915 Thr Glu Leu ser Ala 920 Trp val Thr Ala Ile 925 Glu Asn Arg
AGC TA C T.n<L CAC TAT CAA ccT ATC ATC ACT GAC CCA CAG TTC AGC CAG AGT 2332
Ser tyr 930 His Tyr Glu Arg Ile 935 Ile Thr Asp Pro Gln 940 Phe Ser GlM 5er
ATC AAG TTG CAA CAC GAT ATC TTT GGT GAA TCA CTG CAA ACT GTC CAT 2330
Ile 945 Lys Leu GlM His Asp 950 Ile Phe Gly Gln Ser 955 Leu Gln Ser val Asp 553
ATT GCC TCG CCG CGC CCC CAA AAA CCA CCA .AAT CCC TAC CCC CCT 2923
Ile Ala Trp Pro Arg 965 Arg Glu Lys Pro Ala 370 Val Asn Pro Tyr Pro ?ro 975
186 242
121
ACG Thr CTG Leu CCG Pro GAA Glu 980 Thr CTA Leu 7TT Phe GAC Asp Ser 335 Λ A C Ser TAT T «r GAT Asp Asp CAA Gln 990 Gln TAA Gln ” * -
CTA TTA cGT CTG GTC Aga. CAA AAA AAT AGC TGG CAT c Ac CTT ACT GAT 3024
Leu Leu Arg 995 Leu Val Arg Gin Lys Asn 1000 Ger Trp His His Leu 1005 Thr Asp
G GG GAA AAC TGG CCA TTA GCT TTA AAT GCA CAA CCC CGT GAT CTT 3072
Tly Ciu Asn 1010 Trp Arg Leu Cly Leu 1015 Pro Asn Ala Cln 102« Arg 0 Arg Asp
TAT Λ · * • Afc GAC ACC AAA ATT CCA ACC CAA GGG ATT TV(- CTT TAA 3 120
Tyr 102' Thr 5 Tyr Asp Arg Ser Lys 1030 Ile Pro Thr Clu Cly 1035 Ile ser Leu G3‘J 1040
ATC TTC CTG AAA G A T 1 CAT CGC C»GC V. ()G CTA CCA GAT CAA AAA GCG CCC Gi » 3156
Ile Leu Leu Lys Asp 104* Asp y Cly Leu Leu Ala . Asp 1050 Clu Lys Ala Ala 1055 Vai
TAT CTC tgA C.AA CAA CAG ACG ΤΓΓ TAC ACC CCC CGT CAA GCG GAA GTC 3216
Tyr Leu Cly Gln Gln 1060 Cln Thr Phe Tyr Thr 1065 Ala Gly Gln Ala Glu 1070 Val
ACT CTA CAA AAA ccc ACC TTA CAA GCA CTG CTC CCG TTC CAA GAA ACC 3264
Thr Leu Clu Lys 1075 Pro Thr Leu Gln Ala 1080 Leu Val Ala Phe Gln 1085 Glu Thr
GCC AS. ‘w ATC ATG GAC GAT ACC TCA TTA CAG GCC TAT GAA GGC GTT ATT G · * -ΙΛΛ 33 12
Aid Met Met 1090 Asp Asp Thr Ser Leu 1095 Gln Ala Tyr Glu Cly 1100 Val Ile Clu
GAG CAA GAC TTG AAT ACC CCG CTC ACA CAG GCC GGT TAT CAG CAA GTC 3360
Glu Gln 1105 Glu Leu Asn Thr Ala 1110 Leu Thr Cln Ala Cly 1115 Tyr Gln Gln vai 1120
GCG CCG TTG TTT AAT ACC AGA TCA CAA ACC CCC GTA TCG CCG CCA CGG 3408
Ala Arg Leu Phe Asn 1125 Thr Arg Ser Clu Ser 1130 Pro 1 Val Trp Ala Ala 1135 Arg
CAA GGT TAT ACC CAT TAC CGT CAC CCC CCA CAC TTC TGG CGG CCT CAG 3456
Gln Cly Tyr Thr 1140 Asp 1 Tyr Cly Asp Ala 1145 Ala Gln Phe Trp Arg Pro 1150 Gln
CCT CAG CGT AAC TCC TTG CTG ACA CGG AAA ACC ACA CTC ACC TC CAT 3504
AU Cln Arg 1155 Asn Ser Lau Leu Thr Cly 1160 Lys Thr Thr Leu Thr 1165 Trp Asp
ACC CAT CAT TCT GTA ATA ATA CAG ACT CAA CAT GCC GCT GGA TTA ACG 3552
Thr His 1170 His 1 Cys Val Ile Ile 1175 Gin Thr Gln Asp Ala Ala 1130 Gly Leu Thr
AcT CAA GCC CAT TAC CAT TAT CGT TTC ctt ACA CCG GTA CAA CTG ACA 3600
Thr 1135 Gln Ala His Tyr Asp Tyr 1190 Arg Phe Leu Thr Pro 1195 Val Gin Leu Thr 1200
GAT ATT AAT GAT AAT CAA CAT ATT GTG ACT CTG CAC GCG CTA CGT CGC 3648
Asp Ile Asn Asp Asn 1205 Gln His Ile val Thr 1210 Leu 1 Asp Ala Leu Cly 1215 Arg
CTA ACC ACC ACC CCC TTC TGG GGC ACA GAG CCA GGA CAA CCC GCA TGC 3656
Val Thr Thr Ser 1220 Arg Phe Trp Cly Thr 1225 Glu Ala Gly Gin Ala 1230 Ala 1 Gly
TAT T»C G i\AC CAG ccc TTC ACA CCA CCC GAC TCC (TTA CAT AAA GCG GTG 3~44
T.r i, r Ser Asn Gln Pro Phe Thr Pro Pro Asp Ser Vłl Asp Lys Ala Leu
122
186 242
HA? 1245
5-ZA Aid 1 TA ACC Leu Thr 1250 GGC Cly ‘SC A Aid CT7 Leu ΣΤΤ ‘jTT Pro Tal 1255 Ala CAA Gln TGT Cys *.λ 3TC Leu Tal 12 50 TA* T/r — V Aid ί' Vdl ' - ’
CAT AGC TCC ATG CwG fc — J TTA TCT TTG wy CAG CAC TCA CAA 3840
Asp Ser Trp 1265 Mec Pro Ser 12~< Leu Ser 3 Leu Ser Gln Leu Ser 1275 Gln Ser Cln 1230
JC-P A jrtA CTA TGG GCG CAA CTC CGT GCC GCT CAT rt ATT •aaa
du du Ala Slu Ala Leu i ;as Trp Ala Gln Leu Arg 1290 Ala Ala HlS Mec 123: Ile
ACC GAA GAT GGG AAA GTG TGT GCG TTA AGC GCG AAA CGA GGA ACA AGC 3936
Thr Glu Asp Gly Lys 1300 Val Cys Ala Leu Ser 1305 Cly Lys Arg Gly Thr 1310 Ser
CAT CAC AAC CTG ACG ATT CAA CTT ATT TCG CTA TTC GCA AGT ATT CCC 3534
His Gln Asn Leu 1315 Thr Ile Gln Leu Iie 1320 Ser Leu Leu Ala Ser 132S Ile Pro
CGT TTA CCG CCA CAT GTA CTG GGG ATC ACC ACT GAT CGC TAT GAT 4032
Arg Leu Pro 1330 Pro His Tal Leu Gly 1335 ile Thr Thr Asp Arg 1340 T/r Asp Sar
CAT CCC CAA CAG CAG s.AC CAA CAG ACG GTG AGC TTT AGT GAC GGT •TT 4030
Asp pro Gin 1345 Gln Gin His Gln Gln 1350 Thr val Ser Phe Ser 1355 Asp Gly Phe 1360
CCC CGG TTA CTC CAG AGT TCA GCT CCT CAT GAG TCA GGT GAT GCC TCC 4123
cly Arg Leu Leu Gln Ser 1365 Ser Ala Arg His Glu 1370 Ser Gly Asp Ala 1375 Trp
CAA CGT AAA GAG GAT GGC CCG CTG GTC GTC GAT GCA AAT GCC CTT CTC 4176
Gln Arg Lys Glu Asp 1380 Gly Gly Leu val val 1385 ASP Ala Asn Gly Val 1390 Leu
CTC AGT GCC CCT ACA GAC ACC CGA TGC GCC GTT TCC GGT CGC ACA GAA 4224
al ser Ala Pro 1395 Thr Asp Thr Arg Trp 1400 Aid Val Ser Gly Arg 1405 Thr Glu
TAT CAC CAC AAA GGC CAA CCT GTG CGT ACT TAT CAA CCC TAT TTT CTA 4272
Tyr Asp Asp 1410 Lys Gly Gln Pro Val 1415 Arg Thr T/r Gln pro 1420 Tyr Phe Lau
AAT CAC TGG CGT TAC GTT AGT GAT CAC AGC GCA CGA GAT GAC CTG TTT 4320
Asn Asp Trp 1425 Arg Tyr val Ser Asp 1430 ASP Ser Ala Arg Asp 1435 ASP Leu Phe 1440
CCC CAT ACC CAC CTT TAT GAT CCA TTC GGA CGG GAA TAC AAA CTC ATC 4363
Ala Asp Thr HIS Leu Tyr 1445 Asp Pro Leu Gly Arg 1450 Glu T/r Lys Val Ile 1455
ACT GCT AAG AAA TAT TTG CCA GAA AAG CTC TAC ACC CCG TCG TTT ATT 44 1 o
Thr Aia Lys Lys T/r 1460 Leu Arg Glu Lys Leu 1465 T/r Thr Pro Trp 147; Phe 0 Ile
GTC AGT GAG GAT GAA AAC GAT ACA GCA TCA AGA ACC CCA TAC '/al Ser clu Asp Glu Asn Asp Thr Aia Ser Arg Thr Pro *
1475 1430 1435
4453
186 242
123 (2) Dane dla sekwencji SEK NR ID: 32;
(i) Charakterystyka sekwencji:
(A) Długość: 1486 aminokwasów (B) Typ: nmiodkyay (D) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEK NR ID: 32;
Mec 1 Gln Asp Ser Pro 5 Glu Val Ser Ile Thr 10 Thr Lau Ser Leu Pro 15 Lys
Gly Gly Gly Ala 20 Ile Asn Gly Mec Gly 25 Glu Ala Leu Asn Ala 30 Ala Cly
Pro Asp Gly 35 Mec Ala Ser Leu Ser 40 Lau Pro Lau Pro Leu 45 Ser Thr Gly
Arg Gly 50 Thr Ala Pro Gly Lau 55 Sar Leu Ile Tyr Ser 60 Asn Ala Gly
Asn 65 Gly Pro Phe Gly Ile TO Gly Trp Gln —ys Gly 75 Val Mec Ser Ile Ser 80
Arg Arg Thr Gln His 85 Gly Ile Pro Gln Tyr 90 Gly Asn Asp Asp Thr 95 Phe
Leu Ser Pro Gln 100 Gly Glu Val Mec Asn 105 Ile Ala Leu Asn Asp 1i0 Gln Gly
Gln Pro Asp 115 ile Arg Gln Asp Val 120 Lys Thr Lau Cln Gly 125 Val Thr Leu
Pro Ile 130 ser Tyr Thr Val Thr 135 Arg Tyr Gln Ala Arg 140 Gln Ile Lau -Asp
Phe 145 Ser Lys Ile Glu Tyr 150 Trp Gln Pro Ala ser 155 Gly Gln Glu Gly Arg 160
Ala Phe Trp Leu Ile 165 Ser Thr Pro Asp Gly 170 His Lau His Ile Lau 175 Gly
Lys Thr Ala Gln 130 Ala Cys Leu Ala Asn 185 Pro Gln Asn Asp Gln 150 Gln Ile
Ala Gln Trp 195 Leu Leu Glu Glu Thr 200 Val Thr Pro Ala Gly 205 Glu His Val
Ser Tyr 210 Gln Tyr Arg Ala Glu 215 Asp Glu Ala His Cys 220 Asp Asp Asn Glu
Lys 225 Thr Ala His Pro Asn 230 Val Thr Ala Gln Arg 235 Tyr Leu Val Gln Val 240
Asn Tyr Gly Asn Ile 245 Lys Pro Gln Ala Ser 250 Leu Phe Val Leu Asp 255 Aan
Aid Pro Pro Ala 260 Pro Glu Glu Trp Leu 26 5 Phe His Lau Val Phe 270 Asp His
Gly G lu Arg 275 Asp Thr Ser Leu His 230 Thr Val Pro Thr Trp 235 Asp Ala Gly
Thr As Gln Trp ser Val Arg Pro Asp Ile Phe Ser Arg Tyr Glu Tyr
124
186 242
290 295 300
G ly 305 ?ha Glu Val Arg Thr 310 Arg Arg Leu Cys Gln 3 15 Gin Val Lau Mac Pha 323
His Arg Thr Ala Lau 325 Met Ala Gly Glu Ala 330 3er Thr Asn Asp Ala 335 Pro
Glu Leu Val Gly 3 4 0 Arg Lau Ile Leu Glu 3 45 Tyr Asp Lys Asn Ala 350 Ser Val
Thr Thr Lau 355 Ile Thr Ile Arg Gln 360 Lau Ser His Glu Ser 355 Asp Gly Arg
Pro Val 370 Thr Gln Pro Pro Leu 375 Glu Leu Ala Trp Gln 380 Arg Phe A.sp Lau
Glu 335 Lys Ile Pro Thr Trp 390 Gln Arg Phe Asp Ala 355 Lau Asp Asn Phe Asn 400
Sar Gln Gln Arg Tyr 405 Gln Leu Val Asp Lau 410 Arg Gly Glu Gly Lau 415 Pro
Gly Mec Lau Tyr 420 Gln Asp Arg Gly Ala 425 Trp Trp Tyr Lys Ala 430 Pro Gln
Arg Gln Glu 435 Asp Gly Asp Ser Asn 440 Ala Val Thr Tyr Asp 445 Lys Ile Ala
Pro Lau 450 Pro Thr Lau Pro Asn 455 Lau Gln Asp> Asn Ala 460 Ser Leu Mac Asp
Ile 465 Asn Gly Asp Gly Gln 470 Lau Asp Trp val val 475 Thr Ala Ser Gly Ile 480
Arg Cly Tyr His Ser 485 Gln Gln Pro Asp Gly 490 Lys Trp Thr His Phe 495 Thr
Pro Ile Asn Ala 500 Leu Pro Val Glu Tyr 505 Phe His Pro Ser Ile 510 Gln Phe
Ala Asp Leu 515 Thr Gly Ala Gly Lau 520 Sar Asp Lau Val Leu 525 Ile Gly Pro
Lys Ser 530 Val Arg Lau Tyr Ala 535 Asn Gln Arg Asn Gly 540 Trp Arg Lys Gly
Glu 545 Asp Val Pro Gln Ser 550 Thr Gly Ile Thr Leu 555 Pro Val Thr Gly Thr 500
Asp Ala Arg Lys Lau 565 Val Ala Phe Ser Asp 570 Mec Leu Gly Ser Gly 575 Gln
Gln His Lau Val 580 Glu Ile Lys Gly Asn 535 Arg Val Thr Cys Trp 590 Pro Asn
Leu Gly His 555 Gly Arg Phe Gly Gln 600 Pro Lau Thr Lau Ser 605 Gly Phe Ser
Gln Pro 610 Glu Asn Ser Phe Asn 615 Pro Glu Arg Lau Phe 620 Lau Ala Asp Ile
Asp 625 Gly Ser Gly Thr Thr 630 Asp Lau Ile Tyr Ala 535 Gln Ser Gly Ser Lau 640
Leu Ile Tyr Lau Asn Gln Ser Gly Asn Gln Phe Asp Ala Pro Leu Thr
186 242
125
645 650 655
Leu Ala Leu Pro 660 Glu Gly Val GlO =ha 665 Asp asm Thr cys Gln 670 Leu Gln
Val Ala Asp 675 Ile Gin Gly Lau Gly 630 Ile Ala Ser Leu Ile 635 Leu Thr Val
Pro His 690 Ile Ala Pro His His 695 Trp Arg Cys Asp Lau 700 Sar Leu Thr Lys
Pro 705 Trp Lau Lau Asn Val 710 Mac Asm Asn Asm Arg 715 Gly Ala His His Thr ’20
Lau His Tyr Arg Ser 725 Ser Ala Gln Phe Trp 730 Leu Asp Glu Lys Lau 735 Gln
Leu Thr Lys Ala 740 Gly Lys Ser Pro Ala 745 Cys Tyr Leu Pro Phe 750 Pro Mac
His Lau Lau 755 Trp Tyr Thr Glu Ile 760 GlM Asp Glu Ile Ser 765 Gly Asn Arg
Lau Thr 770 Ser Glu Val Asm Tyr 775 Ser His Gly Vdl Trp 730 Asp Gly Lys Glu
Arg 735 Glu Phe Arg Gly Phe 790 Gly cys Ile Lys Gln 795 Thr Asp Thr Thr Thr 300
Phe Ser His Cly Thr β05 Ala Pro Glu GlM Ala 310 Ala Pro Ser Lau Ser 315 Ile
Sar Trp Phe Ala 320 Thr Gly Mac Asp Glu 325 Val Asp Ser Gln Leu 330 Ala Thr
Glu Tyr Trp 335 GlM Ala Asp Thr GlM 340 Ala Tyr Ser Gly Phe 345 Glu Thr Arg
Tyr Thr 350 Val Trp Asp His Thr 355 asm Gln Thr Asp Gln 360 Ala Phe Thr Pro
Asn 365 Glu Thr Gln Arg asm 370 Trp Lau Thr •Arg Ala 375 Lau Lys Gly GlM Leu 330
Lau Arg Thr Glu Lau β35 Tyr Gly Lau Asp Gly 390 Thr Asp Lys GlM Thr 395 Val
Pro_ Tyr Thr Val 900 Ser Glu Ser Arg Tyr 905 Gln Val Arg Ser Ile 910 Pro Val
Asn Lys Glu 915 Thr Glu Leu Ser Ala 920 Trp Val Thr Ala Ile 925 Glu Asn Arg
Ser Tyr 930 His Tyr Glu Arg Ile 935 Ile Thr Asp Pro gIm 940 Phe Ser Gln Ser
Ile 945 Lys Leu GlM His Asp 950 Ile Phe Gly Gln Ser 955 Lau Gln Ser Val Asp 960
Ile Ala Trp Pro Arg 965 Arg Glu Lys Pro Ala 970 Val Asn Pro Tyr Pro 975 Pro
Thr Leu Pro Glu 980 Thr Lau Phe Asp Ser 935 Ser Tyr Asp Asp Gin 990 Gin Gln
Lau Lau Αι» Leu Val Arg Gin Lys Asn Ser Trp His His Leu Thr Asp
126
186 242
995 1000 1005
Gly Glu Asn Trp A.rg Leu C lv Lau Pro Asn Ala Gln Arg Arg Asp Val
101( 3 101i ś 1021 3
Tyr Thr Tyr Asp Arg Ser Lys Ile Pro Thr Glu Gly Ile Ser Lau Glu
1025 1030 1035 1040
Ile Leu Leu Lys Asp Asp Gly i.045 Leu Lau Ala Asp Glu 1050 Lys Ala Ala Val 1055
Tyr Lau Cly Gln Gin Gln Thr 1060 Phe Tyr Thr Ala Gly 1065 Gln Ala Glu Val 1070
Thr Leu Glu Lys pro Thr Lau 1075 Gln Ala Lau Val Ala 1030 Phe Gln Glu Thr 1035
Ala Met Met Asp Asp Thr Ser Leu Gln Ala Tyr Clu Cly Val Ile Clu
1050 1095 i 1100
Glu Gln Glu Leu Asn Thr Ala Leu Thr Gln Ala Cly Tyr Gln Cln Val
1105 1110 1115 1120
Ala Arg Leu Phe Asn Thr Arg 1125 Ser Glu Ser Pro Val 113C Trp Ala Ala Arg 1135
Gln Gly Tyr Thr Asp Tyr Gly 1140 Asp Ala Ala Gln Phe 1145 Trp Arg Pro Cln 1150
Ala Gln Arg Asn Ser Lau Lau 1155 Thr Gly Lys Thr Thr 1160 Lau Thr Trp Asp 1165
Thr His His Cys Val Ile Ile Gln Thr Cln Asp Ala Ala Gly Lau Thr
1170 1175 1130
Thr Gln Ala His Tyr Asp Tyr Arg Phe Leu Thr Pro Val Cln Lau Thr
1135 1190 1195 1200
Asp Ile Asn Asp Asn Gln Mis 1205 Ile Val Thr Lau Asp 1210 Ala Lau Gly Arg 1215
Val Thr Thr Ser Arg Phe Trp 1220 Gly Thr Glu Ala Gly 1225 Gln Ala Ala Cly 1230
Tyr Ser Asn Gln Pro Phe Thr 1235 Pro Pro Asp Ser Val 1240 Asp Lys Ala Lau 1245
Ala Leu Thr Gly Ala Leu Pro Val Ala Gln Cys Lau Val Tyr Ala Val
1250 1255 1260
Asp Ser Trp Mec Pro Ser Leu Ser Leu Ser Gln Lau Ser Gln Ser Gln
1255 1270 1275 1230
Glu Glu Ala Glu Ala Lau Trp 1235 Ala Cln Lau Arg Ala 1290 Ala His Met Ile 1255
Thr Clu Asp Gly Lys Val Cys 1300 Ala Lau Ser Gly Lys 1305 Arg Gly Thr Ser 1310
His Gln Asn Lau Thr Ile Gln 1315 Leu Ile Ser Lau Lau 1320 Ala ser Ile Pro 1325
Arg Leu Pro Pro His Val Leu Gly Ile Thr Thr Asp Arg Tyr Asp Ser
1330 1335 1340
Asp Pro Gln Gln Cln His Gln Gln Thr Val Ser ?he Ser Asp Gly Phe
186 242
127
Li45 1350 1355 .190
Gly Arg Leu Leu Gln Ser Ser Ala Arg His Clu Ser Gly -Asp Ali Trp
1365 1370 13~5
Gln Arg Lys Glu Asp Gly Gly Leu Val Val Asp Ala Asn Gly Val Leu
1330 1385 1390
'.al Ser Ala Pro Thr Asp Thr Arg Trp Ale ’Val Ser Gly Arg Thr Siu
1395 1400 1405
Tyr Asp Asp Lys Cly Gln Pro Val Arg Thr Tyr Gln Pro Tyr Phe Leu
1410 1415 1420
Asn Asp Trp Arg Tyr Val Ser top Asp Ser Ala Arg Asp Asp Leu Pha
1425 1430 1435 1440
Ala Asp Thr His Leu Tyr Asp Pro Leu Gly Arg Glu Tyr Lys Vai ile
1445 1450 1455
Thr Ala Lys Lys Tyr Leu Arg Glu Lys Leu Tyr Thr Pro Trp Phe Ile
1460 146S 1470
Val Ser Glu Asp Glu Asn Asp Thr Ala Ser Arg Thr Pro
1475 1430 1485
( 2) Dane dla sekwencji SEK NR ID: 33;
(i) Charakterystyka sekwencji:
(A) Długość: 3288 par zasad (B) Typ: kwas nukleinowy ( C ) RodZaj nici: podwójna (d) Topologia: liniowa (ii) Typ cząsteczki: DNA (genomowy) (xi) Cpńs sekwencji: SEK NR Di: 33;
ATG Met 1 GTG Val ACT GTT ATG Mac 5 CAA AAT AAA ATA TCA TTT TTA TCA GGT ACA TCC Ser 48
Thr Val Gln ton Lys Ile Ser 10 Phe Leu Ser Gly Thr 15
CAA CAG CCC CTG CTT GAC GCC GGT TAT CAA AAC GTA TTT GAT ATC GCA 96
Glu Gln Pro Leu 20 Leu Asp Aia Gly Tyr 25 Gln Asn Val Phe Asp 30 Ile Ala
TCA ATC AGC CGG GCT ACT TTC OTT CAA TCC GTT CCC ACC CTG ccc GTT 144
Ser Ile Ser 35 Arg Ala Thr Phe Val 40 Gln Ser Val Pro Thr 45 Leu Pro Val
AAA GAG GCT CAT ACC CTC TAT CGT CAG GCG CGG CAA CGT GCG CAA AAT 132
Lys Glu 50 Ala His Thr Val Tyr 55 Arg Glń Ala Arg Gln 80 Arg Ala Glu Asn
CTC AAA TCC CTC TAC CGA GCC TGG CAA TTG CGT CAG GAG GTT ATT 240
Leu 65 Lys Ser LSu Tyr Arg 70 Ala Trp Gln Leu Arg 75 Gln Glu Pro Val Ile 30
AAA GGG CTG GCT AAA CTT AAC CTA CAA TCC AAC GTT TCT CTG CTT CAA 238
Lys Gly Leu Ala Lys 35 Leu Asn Leu Gln Ser 90 Asn Val Ser Val Leu 95 Cln
/-· » GA. CTW 1 TTG GTA GAG AAT ATT CCC GGT GAT GGG GAT TTC AGC 1 TTA 334
-Asp Ala Lau Val Glu Asn Ile Cly Gly Asp Gly Asp Phe Ser Asp Leu
128
186 242
100 105 110
rec CCC CGT TCT CAA TTT z*.—··» Wl'* · GaC GC 1 1 a ATT CAA TCC ctt 384
e.ec CTn Cpg Ala Sep Gin Tsr Ala Ctp Ala Ala Stp Ile Cun Str Lau
115 120 125
tct TCC k_ Łajk. _ -1 4 ctt i Λ 1 GCT TCC gcC CTC TAC TGT GTT WM λ TAC a 432
ree Sep rro r* g · Gls Crg Tsp Cla Stp Tla Lau h/p Arg Val Aid L/t Ctp
130 135 140
CTC ctT Α.Λ 1 crc TCC CCT TCC CCT TTG CAT ATT GTT TAT CGC GC* Giy -.n- 430
Leu Hit Lst Sap Ctp Stp Sep Stu Hst Ile CTp ATn Trg Crg Ala ATp
145 150 155 160
C*TG — * J ACC CTT CTG TTC TTA TGC CCC TCC TCC CTC TAT CAA GCC CTC ACT 523
LSU Lst CTp Lau Ile lau Sep Clu eer cep Mec CTn L/T Glu Val Tlig
165 170 175
TCC CTT CCT CTC TTC TTC CCT GTC CTA CAC ACC GGC CGT AAA GAT ccc 576
Sar Leu Trp Il· Ltu Lau Ctp Val Stu Gln LyT Gly Cly L/t Atp Ila
tao 185 190
CCT gaG CTG TCC GCC GCC TTC TTC CCA ATG ACG TTC CCT TAT GCC GAT 624
Ter Clu Leu Sep Gls Tla ree rtie rro etc cep Lau rro T/r ATp Trp
195 200 205
CTT CTC TCG CCA CTC CAT TCC GCT TTA TCC GCC CCA GCC CGA CCG CTG 672
Hst Leu StP Gln Ila Ctp Stp Tla Lau Stp Ala Gln Ala Agg yer Lau
210 215 220
TAC CCT CTC TCG CAT CCT TTC CCC CAT ACC TCG GCA CCA CCC CTT TCA 720
CTn cly Val Trp CTn yer Lau eep CTp cer Tep Ala Gln aIi Val Stp
225 230 235 240
CCA CCA CCC ACT ACT CCC CCT CCC CGC AAA CTG TTC CCT CCC CAA GCT 7 68
Clu Cln yep Ser CTn yep CTn Tbp Arg L/t Lau ret Tla Ala Gln crp
245 250 255
GGT CAT CCC CCT CCA TTT TTT TCC GCA TAC ACT TTT TCT TTC AAA GCC 816
Gl/ CTn cln Trp Tep ret rń® Sep Cly CTn eer ree Tyr ree L/T Cla
260 265 270
GTC GCA TTC CGC GCC CCC CCT ATG GTT ccc CTG TCA CAG TAC ACC CGC 364
'.'al Cl-s ree Sep Gls Cln rro Mec Val T/r Lau Ser Gin Tyr eer Stp
275 280 285
GCG CCC CCC CTT CTC GGC CCA CCC TTC ccc CCA CCT TAT CCA CAC CCA 912
Gls CTn Gly Ile Val Cly Cla Cln Lau Ile Tla Gly CTn rro TTp Gin
290 295 300
CCC GCC GCC GCC CTA CTC CCA CCC TTC TAA CTC ACT TCC TCA CTC GCC 960
Cla Cla Cla Cla Ile Val Cla rro Lau L/T Ltu eer ypp Sar Mec Cla
305 310 315 320
.AAA CCG TCT TCC TAC CPC GTC GCT ccc CCT CGT CCA CCC CTG GGA GAC 1008
L/t Cln C/t Tsp Tsp Lau Val Tla rro atp Cly Ter eer Mac cly Trp
325 330 335
GCT ATT GTT CTC CCC CCC TGT TTC TTA TCA CGC CAC TGC CCA TCT AAC 1056
Gls CTn Val stu yep Gls cyt ree Lau Trg Gls ATn Sep rro Ter rrn
340 345 350
MM W CCT CCA CCC UkJ * CTT eee CCT CTC CTT CCC TAC CCA TCA Ctgc. ACT 1104
rro CTp Lst CTp Gls Ile ret CU Gln Val Ala CTn L/T Ser cly SaP
355 360 365
186 242
129
ACT CAG CCT TTG CCA AGC TTC CAT CTG CCG GTC ACA CTG GAA CAC AGC 1152
Ahr Tin 370 Pro 'L«u Pro Ser Phe 375 His Leu Pro Val Thr 380 Leu Glu His Ser
GAG AAT AAA GAT CAG TAC TAT CTG AAA ACA GAG CAG GTT TAT ATC ACG 1200
Glu 385 Asn Lys Asp Gln Tyr 390 Tyr Leu Lys Thr Glu 395 dn Gly Tyr Ile Thr 400
GTA GAT AGT TCC Ga- CAG TCA AAT TGG AAA AAC GCG C^ CTT ATC AAT 1248
Val Asp Ser Ser dy 405 dn Ser Asn Trp Lys 410 Asn Ala Leu Val .He 415 Asn
GG3 ACA AAA GAC AAG GGG CTG TTA TTA. ACC TTT TCC AGC GAT AGC TCA 1296
Gly Thr Lys Asp 420 Lys dy Leu Leu Leu 425 Thr Phe Cys Ser tep 430 Ser Ser
GGC ACT CCG ACA AAC CCT CAT GAT GTG ATT cct CCC GCT ATC AAT GAT 1344
Gly Thr· Pro 435 Thr Asn Pro Asp Asp 440 Val Ile Pro Pro Ala 445 Ile Asn Asp
ATT CCA TCG CCG CCA GCC CGC GAA ACA CTG TCA CTG ACG CCG GTC AGT 1392
Ile Pro 450 Ser Pro Pro Ala Arg 455 Glu Thr Leu Ser Leu 460 Thr Pro Val Ser
TAT CAA TTG ATG ACC AAT CCG GCA CCG ACA GAA GAT GAT ATT ACC AAC 1440
Tyr 465 Gln Lea Thr Asn 470 Pro Ala Pro Thr Glu 475 Asp Asp Ile Thr Asn 480
CAT TAT GGT TTT AAC GCC <3ct AGC TTA CGG GCT TCT CCA TTG TCA ACC 1488
His Tyr dy Phe ten 485 Gly Ala Ser Leu Arg 490 Ala Ser Pro Leu Ser 495 Thr
AGC GAG TTG ACC ACC AAA CTG AAT TCT ATC GAT ACT TTC TCT GAG AAG 1535
Ser Glu Leu Thr 500 Ser Lys Asn Ser 505 Ile Asp Thr Phe Cys 510 Glu Lys
ACC CGG TTA AGC TTC AAT CAG TTA ATG GAT TTG ACC GCT CAG CAA TCT 1584
Thr Arg Leu 515 Ser Phe ten Gln Leu 520 Met Asp Leu Thr Ala 525 Gln dn Ser
TAC AGT CAA AGC AGC ATT GAT GCG AAA GCA GCC AGC CGC TAT GTT CGT 1632
Tyr Ser 530 Gln Ser Ser Ile tep 535 Ala Lys Ala Ala Ser 540 Arg Tyr Val Arg
TTT GGG GAA ACC ACC CCA ACC CGC GTC AAT GTC TAC GGT GCC GCT TAT 1680
Phe 545 Gly Glu Thr Thr Pro 550 Thr Arg Val ten Val 555 Tyr dy Ala Ala Tyr 560
CTG AAC AGC ACA CTG GCA GAC GCG GCT GAT GGT CAA TAT CTG TGG ATT 1728
Leu Asn Ser Thr Leu 565 Ala Asp Ala Ala tep 570 Gly dn Tyr Leu Trp 575 Ile
CAG ACT GAT GGC AAG AGC CTA AAT TTC ACT GAC GAT ACG GTA GTC GCC 1776
Gln Thr Asp Gly 580 Lys Ser Leu Asn Phe 585 Thr Asp Asp Thr Tal 590 Val Ala
TTA GCC GCT CGC GCT GAA AAG CTG GTA CGT TTA TCA TCC CAG ACC GGG 1824
Leu Ala dy 595 Arg Ala Glu Lys Leu 600 Val Arg Leu ser Ser 505 Gln Thr dy
CTA TCA TTT GAA GAA TTG GAC TGG CTG ATT GCC AAT GCC AGT CGT AGT 1872
Leu Ser □ 10 Phe Glu Glu Leu Asp 615 Trp Leu Iie Ala ten 620 Ala Ser Arq Ser
GTG CCG GAC CAC CAC GAC AAA ATT GTG CTG GAT AAC CCG GTC CTT GAA 1920
Val Pro Asp His HIS tep Lys Ile Val Leu Asp Lys Pro Val Leu Glu
130
186 242
625 630
TCA C . CCA CAG TAT TTC AGC CTA AAA
Ala Leu aia Glu Tyr 645 VAl Ser Leu Lys
AA? ACC Τ'Τ'Τ* CCG ACC TTC ATT ACT CCA
Asn Thr Phe Aid 660 Thr Phe Ile Ser Ala 665
CAT Ac A ACT TTC TAT CAA ACC CCT
Gln Thr Pro 575 5er Phe r/r Glu Thr 680 AlA
CAT CTC ATT GCC CTA GGT ACA GAC CTC
His •Mi 690 Ile Ala Leu Gly Thr 695 Glu VAl
CAT GAG TTA GCC CCC ATA TCC TCC AAA
Asp 70S Glu Leu Ala Ala Ile 710 Cys cys Lys
CAA CTG CTC CCT ATT GCT CCC TAT TCC
Olu Leu Leu Arg I la 72S Gly Arg Tyr cys
ACC TTC CAT CAA TAT ACC GCC ACT CAC
Thr Leu Asp Glu 740 Tyr Thr Ala Ser Gln 745
CCC CCT TTG TTT CGC CTC ACA TTT GCC
Pro Arg Leu 755 Phe Cly Leu Thr Phe 760 Ala
CTC ATG GAA TCC CCA AAA CAT ATC TTA
Leu Mac 770 Glu cly Gly Lys Asp 775 Ile Leu
AAA TCC CTT CAA CCA CTG GCT ATT TTA
L/C 785 Ser Lau Cln Pro Leu 790 Ala Ile Leu
CAT TGG ATC TCC TCC CTA AAT CTA ACT
Asp Trp Met Ser Ser 305 Val Asn Leu Ser
GTA ACT ACC CAA TCC AGC GCT ACC GCC
Val Ser Thr Gln 820 Trp 5er Gly Thr Ala 825
TTC GAA AAC'TGTT TCT GAC AGC CTC AAT
Leu Clu Asn 835 Val Cys Asp Ser Val 840 Asn
ACA ATC GAT TCC GCC TTA CAG CAG AAA
Thr Met 850 Asp Ser Ala Leu Cln 855 Cln Lys
TGT TTC GGC ATT AAC AGC AAT CTG ATC
Gly 365 Phe Gly Ile Lys Ser 370 Asn Val Met
GAG AAA ATC ACA ATC GGT ACT GAT AAT
Clu Lys Ile Thr Ile 885 Gly Ser Asp Asn
635 640
CAG cln 650 Arg TAT Tyr Kg Tly Leu TAT Asd 655 TCC Ala
CTA AAT CCT TAT ACG CCA GAT 2012
Val Asn Pro Tyr Thr 670 Pro Asp
TTC CCC TCT GAC TGT AAT 2064
Phe Arg ser Ala 685 Asp Gly Asn
AAA TAT GCA CAA AAT GAG CAG 2112
Lys Tyr Ala 700 Glu Asn Glu Gln
GCA TTC GCT GTC ACC ACT TAT 2160
Ala Leu 715 Gly VAl Thr Ser Asp 720
TTC CCT AAT GCA CGC ACT TTT 2208
Phe 730 cly Asn Ala Gly Ser 735 Phe
TTC TAT CGC TTC GGC CCC ATT 2256
Leu Tyr Arg Phe Gly 750 Ala Ile
CAA GCC GAA ATT TTA TCG CCT 2304
Gln Ala Glu Ile 765 Leu Trp Arg
TTC CAA CAG TTA GCT CAG TCA 2352
Leu Gln Gln 780 Leu Gly Gln AlA
CCC CGT ACC CAG CAG CTG CTG 2400
Arg Arg 795 Thr Glu Gln val Leu 300
CTG ACT TAT CTC CAA GGC ATG 2443
Leu 810 Thr Tyr Leu Gln cly Met 815
ACC CCT GAC ATC TTC AAT TTC 2496
Thr Ala clu Met Phe 830 Asn Phe
AGT CAA GCT GCC ACT AAA GAA 2544
Ser Gln Ala AlA 845 Thr Lys Glu
ctc CTC CCC GCC CTA ACC CCC 2592
Val Leu Arg 860 Ala Leu Ser Ala
CGT ATC GTC ACC TTC TCG CTC 2640
Gly Ile 875 Val Thr Phe Trp Leu 980
CCT TTT ACA TTC CCA AAC TAC 26aa
Pro 890 Phe Thr Leu Ala Asn 395 Tyr
186 242
131
TGG Trp .Cis Asp ATi 9 0 0 C ln AC c Thr CTG Leu tTt Phe AurV- 5er 905 CAT His GAC Asp AAT Asn Ala ACG Thr 910 ttA Leu CAG JA U
zzz TTA CAA ACC GAC ACT TCT CTG GTA ATT GCT ACT CAG CAA ctt AGC 2784
Ser Leu Gln Thr Asp Thr 5er Leu Val Ile Ala Thr Gin Gln Lau Ser
915 920 925
CAG CTA CTG TTA ATT GTC AAA TCG CTG AGC CTG ACC GAG CAG gAT CTG 2732
Gln Leu Val Leu Ile Val Lys Trp Leu Ser Leu Thr Glu Gln Asp Lau
930 935 940
CAA TTA CTG ACA ACC TAT ccc GAA CCT TTA ATC AAC GGC ATC ACG AAT 2880
Gln Leu Leu Thr Thr Tyr Pro Glu Arg Lau Ile Asn Gly Ile Thr Asn
945 950 955 960
GTT GCT GTA CCC AAT CCG GAG CTA TTA CTC ACG CTA TCA CGT AAG 2928
Val Pro Val Pro Asn Pro Glu Lau Leu Leu Thr Lau Ser Arg Phe Lys
965 970 975
CAG TCG GAA ACT CAA GTC ACC GTT TCC CCT GAT GAA GCG ATG CGC TCT 2976
Gin Trp Glu Thr Gin Val Thr VaL Ser Arg Asp Glu Ala Mac Arg cys
980 985 990
rcr GAT CAA TTA AAT GCC AAT GAT ATG ACG ACT GAA AAT GCA GGT TCA 3024
Phe Asp Gln Leu Asn Ala Asn Asp Mec Thr Thr Glu Asn Ala Gly Ser
995 1000 1005
CTG ATC GCC ACA TTG TAT GAG ATG GAT AAA GGT ACC GCA GCG CAA GTT 3072
Leu Ile Ala Thr Leu Tyr Glu Mec Asp Lys Gly Thr Gly Ala Gln Val
1010 1015 1020
AAT ACC TTG CTA TTA GGT GAA AAT AAC TGG CCC AAA AGT TTT ACC TCT 3120
Asn Thr Leu Lau Leu Gly Glu Asn Asn Trp Pro Lys Ser Phe Thr Ser
1025 1030 1035 1040
CTC TCC CAA CTT CTG ACC TGG TTA CGC GTC GK CAA AGA CTG AAT GTC 3168
Leu Trp Gin Lau Leu Thr Trp Lau Arg Val Gly Gln Arg Leu Asn Val
1045 1050 1055
GGT ACT ACC ACT CTG GGC AAT CTG TTG TCC ATG ATG CAA GCA GAC CCT 3216
Gly Ser Thr Thr Leu Gly Asn Lau Leu Ser Mec Mac Gln Ala Asp pro
1060 1065 1070
GCT GCC GAG ACT AGC GCT TTA TTG GCA TCA GTA CCC CAA AAC TTA ACT 3264
Ala Ala Glu Ser Ser Ala Leu Lau Ala Ser Val Ala Gln Asn Leu ser
1075 1080 1085
GCC GCA ATC AGC AAT CCT CAG TAA 3285
Ala Ala Ile Ser Asn Arg Gln . · ·
1090 1095 ( 2) Dane dla sekwencji SEK NR ID: 34;
(i) Charakterystyka sekwencji:
(A) Długość: 1095 amυ]mekkasók (B) Typ: aminokwas (D) Topologia: llmioka (ii) Typ cząsteczki: białko (xi) Opis sekwencji: Cechy od
254
254
SEK NR ID. 34; do opis
267 SEK NR ID' 15
492 TctA A pepeyd
132
186 242
Met 1 Va l Thr Val Met Gln Asn Lys Ile □er 10 Phe Lau Ser Cly Thr 15 Ser
Glu Gln Prą Lau 20 Leu Asp .Ala Gly Tyr 25 Gln Asn Val Phe Asp 20 Ile Ala
Sar Ile Ser 35 Arg Ala Thr Phe Val 40 Gln Ser Val Pro Thr 45 Lau Pro Val
Lys Glu 50 Ala His Thr Val Tyr 55 Arg Gln Ala Arg Gin 60 Arg Ala Glu Asn
Leu 65 Lys Sar Leu Tyr Arg 70 Ala Trp Gln Leu Arg 75 Gln Clu Pro Val Ile 30
Lys Gly Leu Ala Lys 35 Leu Asn Leu Gln Ser 90 Asn Val Ser Val Leu 95 Gln
Asp Ala Leu val 100 Glu Asn Ile Cly Gly 105 Asp Gly Asp Phe Ser 110 Asp Leu
Mac Asn Arg 115 Ala Ser Gln Tyr Ala 120 Asp Ala Ala Ser Ile 125 Gln Ser Leu
Phe Ser 130 Pro Gly Arg Tyr Ala 135 Ser Ala Lau Tyr Arg 140 Val Ala Lys Asp
Lau 145 His Lys Ser Asp Ser 150 Ser Leu His Ile Asp 155 Asn Arg Arg Ala Asp 160
Leu Lys A3P Leu Ile 165 Leu Ser Glu Thr Thr 170 Met Asn Lys Glu Val 175 Thr
Ser Lau Asp ILe 130 Leu Leu Asp Val Leu 135 Gln Lys Gly Gly Lys Asp 190 Ile
Thr Glu Leu 195 Ser Cly Ala Phe Phe 200 Pro Mac Thr Leu Pro 205 Tyr Asp Asp
His Leu 210 Ser Gin Ile Asp Ser 215 Ala Leu Ser Ala Gln 220 Ala Arg Thr Leu
Asn 225 Gly Val Trp Asn Thr 230 Lau Thr Asp Thr Thr 235 Ala Gln Ala Val Ser 240
Glu Gln Thr Ser Asn 245 Thr Asn Thr Arg Lys 250 Leu Phe Ala Ala Gln 255 Asp
Gly Asn Gln Asp 260 Thr Phe Phe Ser Gly 265 Asn Thr Phe Tyr Phe 270 Lys AI*
Val Gly Phe 275 Ser Gly Cln Pro Met 230 val Tyr Leu Ser Gln 235 Tyr Thr Ser
Gly Asn 290 Gly Ile Val Gly Ala 295 Gin Lau Ile Ala Gly 300 Asn Pro Asp Gln
Ala 305 Ala Ala Ala Ile Val 310 Ala Pro Leu Lys Leu 315 Thr Trp Ser Met Ala 320
Lys Cln Cys Tyr Tyr Leu Val Ala Pro Asp Cly Thr Thr Met Cly Asp
Gly Asn Val Leu Thr Cly Cys Phe Leu Arg Gly Asn Ser Pro Thr Asn
325 330 335
186 242
133
340 345 350
Pro Asp Lys Asp Gly Ile ?he Ala Gln Val Ala Asn Lys Ser Gly Ser
355 360 365
Thr Tin Pro Leu Pro Ser Phe His Leu Pro Val Thr Lau Glu His Ser
370 375 330
Glu Asn Lys Asp Gln Tyr Tyr Leu Lys Thr Glu Gln Gly Tyr Ile Thr
335 390 395 400
Val Asp Ser Sar Gly Gln Ser Asn Trp Lys Asn Ala Leu Val Ile Asn
405 410 415
Gly Thr Lys Asp Lys Gly Leu Lau Leu Thr Phe Cys Ser Asp Ser Ser
420 425 430
Gly Thr pro Tnr Asn pro Asp Asp Val ile pro pro Ala Ile Asn Asp
435 440 445
Ile Pro Ser Pro Pro Ala Arg Glu Thr Lau ser Leu Thr Pro Val Ser
450 455 460
Tyr Gin Leu Mec Thr Asn Pro Ala Pro Thr Glu Asp Asp Ile Thr Asn
465 470 475 430
His Tyr Gly Phe Asn Gly Ala ser Leu Arg Ala ser Pro Leu Ser Thr
435 490 W4 » 495
Ser Glu Leu Thr Ser Lys Leu Asn Ser Ile Asp Thr Phe Cys Glu Lys
500 505 510
Thr Arg Leu Ser Phe Asn GiM Leu Mec Asp Leu Thr Ala Gln Gln Ser
515 520 525
Tyr Ser Gin Ser Ser Ile Asp Ala Lys Ala Ala Ser Arg Tyr Val Arg
530 535 540
Phe Gly Glu Thr Thr Pro Thr Arg Val Asm Val Tyr Gly Ala Ala Tyr
545 550 555 560
Leu Asn Ser Thr Lau Ala Asp Ala Ala Asp Gly Gln Tyr Leu Trp Ile
565 570 575
Gin Thr Asp Gly Lys Ser Leu Asm Phe Thr Asp Asp Thr Val Val Ala
530 535 590
Leu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu Ser Ser Gln Thr Gly
595 600 605
Leu ser Phe Glu Glu Leu Asp Trp Leu Ile Ala Asn Ala Ser Arg Ser
610 615 520
Val Pro Asp His His Asp Lys Ile Val Leu Asp Lys Pro val Leu Glu
625 630 635 640
Ala Leu Ala Glu Tyr Val Ser Leu Lys Gin Arg Tyr Gly Leu Asp Ala
645 650 655
Asm Thr Phe Ala Thr Phe Ile Ser Ala Val Asm Pro Tyr Thr Pro Asp
660 665 570
GiM Thr Pro Ser Phe Tyr Glu Thr Ala Phe Arg Ser Ala Asp Gly Asn
675 630 63 5
HIS val ile Ala Leu Gly Thr Glu val Lys Tyr Ala Glu as M Glu Gln
134
186 242
695
700
Asp 705 Glu Leu Ala Ala Ile 710 Cys cys Lys Ala Lau 715 Gly Val Thr Ser Asp 20
Clu Leu Leu Arg Ile 725 Cly Arg Tyr cys Phe 730 Gly Asn Ala Gly Ser 735 Phe
Thr Leu Asp Clu 740 Tyr Thr Ala Ser Gln 745 Leu Tyr Arg Phe Gly 750 Ala Ile
Pro Arg Leu 755 Phe Cly Leu Thr Phe 760 Ala Cln Ala Clu Ile 765 Leu Trp Arg
Leu Met 770 Clu Cly Gly Lys Asp Ile 775 Lau Leu Cin Cln 780 Leu Cly Gln Ala
Lys 735 Ser Lau Gln Pro Lau 790 Ala Ile Leu Arg Ara 795 Thr Glu Gln Val Leu 800
Asp Trp Met 3er Ser 305 Val Asn Lau Ser Lau 810 Thr Tyr Leu Cln Cly Mbc 815
V a l Ser Thr Gln 820 Trp Ser Cly Thr Ala 825 Thr Ala Clu Met Phe 830 Asn Phe
Lau Clu Asn 835 Val cys Asp Ser Val 840 Asn Ser Cln Ala Ala 845 Thr Lys Glu
Thr Mac 850 Asp Ser Ala Lau Gln Gln 855 Lys Val Leu Arg 860 Ala Leu Ser Ala
Cly 8 65 Phe Gly Ile Lys Ser 870 Asn Val Met Cly Ile 875 Val Thr Phe Trp Leu 380
Glu Lys Ile Thr Ile 885 Gly Ser Asp Asn Pro 890 Phe Thr Lau Ala Asn 895 Tyr
Trp His ASP Ile 900 Gln Thr Lau Phe Ser 905 His Asp Asn Ala Thr 910 Lau Clu
Ser Leu Gln 915 Thr Asp Thr Ser Lau 920 Val Ile Ala Thr Gln 925 Cln Lau Ser
Gln Lau 930 Val Lau Ile Val Lys Trp 935 Leu Ser Leu Thr 940 Glu Gln Asp Lau
Gln 945 Lau Leu Thr Thr Tyr 950 Pro Glu Arg Lau Ile 955 Asn Cly Ila Thr Asn 960
Val Pro Val Pro Asn 965 Pro Glu Lau Leu Lau 970 Thr Leu Ser Arg Phe 975 Lys
Gln Trp Glu Thr 980 Cln Val Thr Val Ser 985 Arg Asp Clu Ala Met 990 Arg cys
Phe Asp Cln 995 Lau Asn Ala Asn Asp Met 1000 Thr Thr Clu Asn Ala 1005 Gly Ser
Leu Ile Ala 1010 Thr Leu Tyr Glu Mac 1015 Asp Lys Gly Thr Cly 1020 Ala Gln Val
Asn Thr Leu Lau Leu Gly Clu Asn Asn Trp Pro Lys Ser Phe Thr Ser
1025
1030
1035
1040
Leu Trp Gln Lau Leu Thr Trp Leu Arg Val Gly Gln Arg Leu .Asn Val
135
186 242
10-15 1050 1055
Ser Thr Thr Leu Gly Asn Leu Leu Ser Mac Met Sin Ala Asp Pro 10~0
1060 1065
Ala Ala Glu Ser Ser Ala Leu Leu Ala Ser Val Aia GLn Asn Leu Ser
1075 1030 1085
aJ.S Ala Ile Ser Asn Arg cln --·
1090 1095
(2) Dane dla sekwencji SEK NR ID: 35;
(i) Charakterystyka sekwencji:
( A ) Długość: 603 aminokwasy ( B ) Typ: aminokwas ( D ) Topologia: liniowa (ii) Typ cząsteczki: białko ( xi) Opis sekwencji: SEK NR ID: 35;
Pro 1 Lau Ser Thr Ser 5 Glu Lau Thr Ser Lys 10 Leu Asn Ser Ile Asp 15 Thr
Phe cys Clu Lys 20 Thr Arg Leu Ser Phe 25 Asn Gin Lau Mac Asp 30 Leu Thr
Ala Gln Gln 35 Ser Tyr Ser Gln Sar 40 Ser Ile Asp Ala Lys 45 Ala Ala Ser
Arg Tyr 50 Val Arg Ph· Gly Glu 55 Thr Thr Pro Thr Arg 60 Val Asn Val Tyr
Cly 65 Ala Ala Tyr Lau Asn 70 Ser Thr Leu Ala Asp 75 Ala Ala Asp Gly Tln 30
Tyr Leu Trp Ile Gin 85 Thr top Gly Lys Ser 90 Leu Asn Phe Thr Asp 95 Asp
Thr VAl VAl Ala 100 Lau Ala Gly Arg Ala 105 Glu Lys Lau Val Arg 110 Lau Ser
Ser Gln Thr 115 Cly Leu Ser Phe Clu 120 Clu Lau Asp Trp Leu 125 Hle Ala Asn
Ala Ser 130 Arg Ser Val Pro Asp 13 5 His His Asp Lys Ile 140 Val Lau Asp Lys
Pro 145 Val Leu Clu Ala Leu 150 AlA Glu Tyr Val Ser 155 Leu Lys Gin Arg ryr i 10
Gly Leu Asp Ala Asn 165 Thr Phe Ala Thr Phe 170 Ile Ser Ala Val Asn 175 Pro
Tyr Thr Pro Asp 180 Gln Thr Pro Ser Phe 135 Tyr Glu Thr Α1Λ Phe 190 Arg Ser
Ala Asp Gly 195 Asn His Val Ile Ala 200 Leu Tly Thr Glu Val 205 Lys Tyr AiS
Clu Asn 210 Glu cln Asp Glu Lau 215 Ala Ala Ile Cys Cys 220 Lys Ala Leu cly
136
186 242
Val 225 Thr Ser Asp Glu Leu 330 Leu Arg Ile Gly Arg 235 Tyr Cys Phe Cly Asn 240
Ala Gly Arg Phe Thr 245 Leu Asp Clu Tyr Thr 250 Ala Ser Gln Leu Tyr 255 Arg
Phe Gly Ala Ile 250 Pro Arg Leu Phe Gly 265 Leu Thr Phe Ala Gln 270 Alid Clu
Ile X J-δ uću Trp 275 Arg Leu Met Glu Gly 230 Gly Lys Asp Ile Leu 235 Leu Gln Cln
XXX Gly 290 Gln Ala Lys Ser Leu 295 Gln Pro Leu Ala Ile 300 Leu Arg Arg Thr
Glu 305 Gln Val Leu Asp Trp 310 Met Ser Pro Val Asn 315 Leu Ser Leu Thr Tyr 320
Leu Gln Gly Met Val 325 Ser Thr Gln Trp Ser 330 Gly Thr Ala Thr Ala 335 Clu
Mec Phe Asn Phe 340 Leu Glu Asn Val Cys 345 Asp Ser Val Asn Ser 350 Gln Ala
Xxx Thr Lys 355 Glu Thr Met Asp ser 360 Ala Leu Gln Gln Lys 365 Val Leu Arg
Ala Leu 370 Ser Ala Gly Phe Gly 375 Ile Lys Ser Asn Val 330 Met Gly Ile Val
Thr 335 Phe Trp Leu Glu Lys 390 Ile Thr Ile Gly Aro 395 Asp Asn Pro Phe Thr 400
Leu Ala Asn Tyr Trp 405 His Asp Ile Gln Thr 410 Leu Phe Ser His Asp 415 Asn
Ala Thr Leu Glu 420 Ser Leu Gln Thr Asp 425 Thr ser Leu Val Ile 430 Ala Thr
Cln Gln Leu 435 ser Gln Leu Val Leu 440 Ile Val Lys Trp Val 445 Ser Leu Thr
Clu Cln 450 Asp Leu Gln Leu Leu 455 Thr Thr Tyr Pro Glu 460 Arg Leu Ile Asn
Gly 465 Ile Thr Asn Val Pro 470 Val Pro Asn Pro Glu 475 Leu Leu Leu Thr Leu 430
Ser Arg Phe Lys Gln 4B5 Trp Glu Thr Gln Val 490 Thr val Ser Arg Asp 495 Glu
Ala Met Arg Cys 500 Phe Asp Cln Leu Asn 505 Ala Asn Asp Met Thr 510 Thr Glu
Asn Ala Gly 515 Ser Leu Ile Ala Thr 520 Lau Tyr Glu Met Asp 525 Lys Cly Thr
Gly Ala 530 Gln Val Asn Thr Leu 535 Leu Leu Gly Clu Asn 540 Asn Trp Pro Lys
Ser 545 Phe Thr Ser Leu Trp 550 Gln Leu Leu Thr Trp 555 Leu Arg Val Cly Gln 560
Arg Leu Asn Val Gly 565 Ser Thr Thr Leu Gly 570 Asn Leu Leu Ser Met 575 Met
186 242
137
Gln Ala Asp Pro Aii Ala Glu 3er Sse Ala Leu Leu Ala 5-er Val Aia
580 558 590
Gln Asn Leu Ser Ala Ala I le Ser Asn Arg Gln *
595 600
(2) Dane dla sekwencji SEK NR ID: 36;
(i) Charakterystyka sekwencji (A) Długość: 2557 par zasad (B) Typ: kwas nukleinowy (D) Topologia: liniowa (ii) Typ cząsteczki: DNA ( genomowy ) (xi ) Opis sekwencji: SEK NR ID: 36;
GASTTCGTCT TTCGTTTAAT ATTGATCATG TCTCGCTCTT CCGCCTGCTT sAAATTACCG SCCATTSTAS TAAATA.TGTS SSSATTAASS ATAACCTSAS GASTCTTTCC SATTTSTSTA TTCGAAAATT SCTGGCSGAT ATTCATCAAT TAACCATTCA TGSSCTGGST TTATTACTGA TTGCCGTAGG TTASTTSSSS ACTAATTTST CCTCTATCAT TTATAAGCAA TTCCCTACCC TGATCASGASA ACTCASTACT ASTTCCAOCT GTCTSCATAC ACAGSATTGT SGTGTATTCC AGCTATTTAT catgacctcc accagctata acaaaacgct aacgcctcaa sttastastt TGCTGTATAC CGTCTACCAC GGTTTACAAC GTTTTGATAA AGACAAAGCA GATTTGCTAC ATGTCATGGC GCCCTATATT GCGGCCACCT TCCAATTATC ATCGGAAAAT GTCGCCCACT CGGTACTCCT TTGGGCAGAT AAGTTACAGC CCGGCGACGG CGCSATTACS CCAGAGGGAN TCTGGGACTG GTTGAATACT AAGTATACCC CGGGTTCATC CGAAGCCGTA GAAACiTAGG SSCSTSTCGT TCAGTATTGT CAGGCTCTGG CACAATTGGA AATGCTTTAC CATTCCACCG GCATCSACGA AAACGCCTTC CGTCTATTTG TGACAAAACC AGAGATGTTT GCCGCTCCSA CTGCAGCACC GCCCGCGCAT GATGCCCTTT CSCTGATTST GCTOACACOT TTTClCAGATT GGGTGAACGC ACTAGGCCAA SAAGCGTCCT CGGTGCTAGC GCCATTTGAA GCTAACTCGT TAACGGCAGA acaactggct gatcccatga atcttgatcc taatttgcts ttgcaagcca GTATTCAAGC ACAAAATCAT CAACATCTTC CCCCSGTASC TCCAGAAAAT GCGTTCTCCT GTTGGACATC TATCSATACT STCCTCCAAT GGCTTAATCT CGCACAACAA TTGSAATGTC GCCCCACAGT GCGTTTCCGC TTTGGTCGGG CTTGATTATS TTCAATCAAT TASATAGACA CCGACCTATG CCCAGTCTTS SAACGCGGCS GGCGTATTAA CCOCCCTTTT GASTTCSACA ACAGCCTAAT ACATTACAAC GCTTTTCTGT ATTSATCTCG CAGTOCCGCA TTAAGCACCT ACTATATCCC TCAACTCCCC SAGCCACCGG CGTCTATTAA SACCCSTGAT CACTTCTATC AATACTTACT GATTCSTSAT CATCTTTCTT CGGCAATAAA AACCACCCGT ATCGCCGAAT CCATTGCCSC TSTTCAACTG TACGTCAACC GGGCSTTGTA AAATGTGGAAA GAAASTGCCA ATTCGGGCGT TATCAGCCGC CAATTCTTTA TCGACTGGTA CAAATACAAT AASCGCTACA GCACTTCGGC GGTTGTTTCT CAATTAGTTT ACTSCCCGGA SAACTATATT GATCCGACCA TTCGTATCGT SCSASCCSAS ATCATTGACC CATTACTGCA ATCCGTCAGC CAAAGCCAAT TAAACGCCCA TACCGTCGAA GATGCCTTTA TGTCTTATCT GACATCCTTT GAACAAGTTG CTAATCTTAA STTTSTTAGC GCATATCACG ATAATATTAA TAACGATCAA GGTCTGACCT ATTTTATCCG ACTCSCTGAA ACTCATGCCG GTGAATATTA TTCCCTCAGT CTCCATCACS GTAAATTCAA CGACGGTAAA TTCTCCGCTA ATCCCTSGAG TGAATTGCAT AAAATTGATT GTCCAATTAA CCCTTATAAA ATCACTATCC GTCCAGTTAT ATATAAATCC CGCCTGTATC όΰ
120
130
240
00
360
420
480
540
Ó00
660
720
780
840
900
960
1020
1C80
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1300
1360
138
186 242
((/mg /TUT')1 GGTTCTATAG G AGTTCTCCT TTC TGTCTGC TATTTGTTTA G - 1320
TTTCTCTAAC G3TTTTTCCT TTTCAACTTA AATTCGCCCA TTTCCOCTTT 3TTGGCλTTT 1980
GoTATTCCCC TTTCTCCTTT GTTCTCATTT TAATTTTATC CGTGCTTTTA ((GGττTττA 1640
TTTGAKGCC C3GACTCTTT TGTGCCGGTT TTCTAGCTGT AGATTCGTTG CTCGTGTTCT 2100
TTTTTTACCT TCTAGACTCA CTAG^TAGTT TTTTATACGC TTCTATCCTT GGTC TAT AT T 2160
TCTTTGCTCT TTTCGCTTCC .ATTGATTTCT CCCCTGAACT GTGC.ATTGTT T.aTCcht τ T 2220
TT.TGCTTTCT TCTATTTGTT TCCTATTTTC TCAGArGAUT GTTTTTCCGC TTTGCTGTCC 2280
TTTATGTGTT TCCTTCTTCG GTTAGTTGCC GTATTGACTT TCGTTCCCCT GATTATTACC 2340
TCACCATGCT ATATAACGGA GATATTCCAA CTATCAATTA CAAAGCCTCA TCAAGTGATT 2400
TAAAAATTTA TATTTCACCA AAATTAAGAA TTATTCATAA TGGATATGAA GGACTGJAGC 2460
GCAATCAATC CAATTTGATG AATAAATATG GCAAACTAGG TGATAAATTT ATTSTGTATA 2520
CCACCCTGGG CGTTAATCCG AATAATAAGC CGAATTC 2550
(2) Dane dla sekwencji SEK NR ED: 37 (i) Charakterystyka sekwencji:
(A) Długość. 845 aminokwasów (B) Typ: aminokwas (D) Topologia: liniowa (ii ) Typ cząsteczki: białko ( częściowo ) (X) Opis sekwencji: SEK NR ID: 37;
Aid 1 Phe Asn Ile Asp 5 Asp Val Ser Leu Phe 10 Arg Leu Leu Lys Ile 15 Thr
Asp His Asp Asn 20 Lys Asp Gly Lys Ile 25 Lys Asn Asn Leu Lys 30 Asn Leu
Ser Asn Leu 35 Tyr Ile Gly Lys Leu 40 Leu Ale Asp Ile His 45 Gln Leu Thr
Ile Asp 50 Glu Leu Asp Leu Leu 55 Leu Ile Ala VAl Cly 60 Glu Gly Lys Thr
Asn 65 Leu Sar Ale Ile Ser 70 Asp Lys Gln Leu AlA 75 Thr Leu Ile Arg Lys 80
Leu Asn Thr Ile Thr 85 Ser Trp Leu His Thr 90 Gln Lys Trp Ser Val 95 Phe
Gin L«u Phe Ile 100 Met Thr Ser Thr ser 105 Tyr Asn Lys Thr Leu 110 Thr Pro
Tlu Ile Lys 115 Asn Leu Leu Asp Thr 120 VAl Tyr His Gly Leu 125 Gln Gly Phe
Asp Lys 130 Asp Lys Ala Asp Leu 135 Leu His Val Met Ale 140 Pro Tyr Ile Ala
Ala 145 Thr Leu Gln Leu ser 150 Ser Glu Asn VAl Ale 155 His Ser Vel Leu Leu 160
Trp Ale Asp Lys Leu 165 Gln Pro Gly Asp Gly 17 0 Ala Met Thr Ala Glu 175 Gly
Phe Trp Asp Trp Leu Asn Thr Lys Tyr Thr Pro Gly Ser Ser Clu Ala
186 242
139
130
135
190
vai Glu Thr 195 Gln Glu His Ile Yal 200 Gln T/r lys Gln Ala 205 Leu Ala Gln
Leu Glu 210 Mec Yal Tyr His Ser 215 Thr Gly Ile A3n Glu 220 Asn Ala Phe -Arg
Leu 225 Phe Yal Thr Lys Pro 230 GlU Met Pha Gly Ala 235 Ala Thr Gly Aia Ala 240
Pro Ala HlS Asp Ala 245 Leu Ser Leu Ile Mec 250 Leu Thr Arg Pha Ala 235 Asp
Trp Yal Asn Ala 260 Lau Gly Glu Lys Ala 265 Sar Ser Val Leu Ala 270 Ala Phe
Glu Aia Asn 275 Ser Leu Thr Ala Glu 280 Gln Leu Ala Asp Ale 285 Mec Asn Leu
Asp Ala 290 Asn Leu Leu Leu Gln 295 Ala Ser Ile Gln Ala 300 Gln Asn His Gln
His 305 Lau Pro Pro Yal Thr 310 Pro Glu Asn Ala Pha 315 Sar cys Trp Thr Ser 320
Ile Asn Thr Ile Lau 325 Gln Trp Val Asn Val 330 Ala Gln Gln Leu Lys 335 Cys
Arg Pro Thr Gly 340 Arg Phe Arg Phe Gly 345 Arg Ala Gly Leu Tyr 350 Ser lla
Asn Glu Arg 355 Asp Thr Asp Lau cys 360 Pro Val Gly Lys Arg 365 Gly Arg Arg
Ile Asn 370 Arg Arg Val Glu Pha 375 Asn Asn Arg Lau Ile 330 His Tyr Asn Ala
Phe 385 Leu Asp Glu Ser Arg 390 ser Ala Ala Leu Ser 395 Thr Tyr Tyr Ile Arg 400
Gln Val Ala Lys Ala 405 Ala Ala Ala Ile Lys 410 Ser Arg Asp ASP Lau 415 Tyr
Gln Tyr Lau Lau 420 Ile Asp Asn Gln Val 425 Sar Ala Ala Ile Lys 430 Thr Thr
Arg lla Ala 435 Glu Ala Ile Ala Ser 440 Ile Gln Leu Tyr Yal 445 Asn Arg Ala
Leu Glu 450 Asn Val Glu Glu Asn 455 Ala Asn Ser Gly Yal 460 Ile Ser Arg Gln
Phe 4 55 Phe Ile Asp Trp Asp 470 Lys Tyr Asn Lys Arg 475 Tyr Ser Thr Trp Ala 430
Gly Val Ser Gln Leu 485 Val Tyr Tyr Pro Glu 490 Asn Tyr Ile Asp Pro 495 Thr
Mec Arg Ile Cly 500 Gln Thr Lys Mec Mec 505 Asp Ala Lau Leu Gln 510 Ser Yal
Ser Gln ser 515 Gln Leu Asn Ala Asp 520 Thr Yal GlU Asp Ala 525 Phe Mec ser
Tyr Leu Thr Ser Phe Glu Gln Yal Ala Asn Leu Lys Yal Ile Ser Ala
140
186 242
530 535 540
T/r Hst Crp Crn I la csn Asn csp Gln Gl/ Leu cep T/p rtie Ila Cly
545 550 555 560
Leu Sap Clu cep Arp Ala Cl/ Glu Typ T/p Trp Crg Sep Val Asp Hsr
565 570 575
Sar Lyr ret Csn Arp Gl/ Lys ree Cla T l a Csn Cla ypp Sar Glu Trp
580 585 550
Hst L/T Ilt Arp cyr rro Ila Asn rro Tyr Lys Ser cep Ilt Arg rro
595 600 505
Tal Ile Tyr L/t Sar crg Ltu T/r Ltu Leu Trp Ltu Clu Gln- L/T Clu
610 613 620
Ile eer Lys Cln cep cly Crn Sar Lys Arp Gly Tyr Gln eer Glu cer
525 630 635 640
cTp T/r Arg T/r Glu Ltu L/s Ltu Cla His Ila crg Tyr ATp Gl/ eer
645 650 655
Trp CTn eer rro Ilt cer ret Asp Va| Asn Lys Lys Ile Ser Clu Leu
660 665 67 0
L/t Ltu Glu L/t Crn Crg Cla rro Gly Leu T/p C/T cla- -Gly Tyr Cln
675 680 685
Cly Clu Arp cer Ltu Ltu Val Mat rbe Typ Csn Cln Cln csp eer Ltu
690 695 700
Trp Ser Tyr Lyr Crn Ala Ser Mat Gln Cly Leu Tyr Ilt rb« Cla Arp
705 710 715 720
Mat Ala Ser Lyr Arp Met hep rro clu Cln Str Csn Val Tyr Crg Asp
725 730 735
Asn Ser Typ Gln Cln re® Trp eer Asn Asn Val Arg Arg ViI Crn Arn
740 745 750
Arg T/r Ala Glu Asp Typ Glu Ile rro Str Ser Val Sep Sar Arg Lys
755 760 765
Crp Typ Gly Trp Gly Asp Tyr Tyr Lau Ser Met Val T/P Csn Cly Asp
770 775 780
Ile rro TbP Ilt csn Tyr L/T Ala Ala Sep Sar Arp Lau Lys Ile T/r
785 790 795 800
11« Sar rpo Lyr Lau crg Ila Ilt His Asn Gly T/p Clu Cly Cln L/t
805 810 815
Crg Crn Gln Cyr Csn Ltu Mec Asn L/T T/r Gly L/T Lau Cly Crp L/T
820 825 830
ret Ila Val Typ Ter Ser Leu Gly Val Arn rpo Crn Csn
835 840 345 ( 2 ) Dane dla sekwencji SEK NR ID: 38, (i) Charakterystyka sekwenq'i:
( A ) Długość: 16 aminokwasów (B) Typ: aminokwas (C ) Rodzaj nici: pojedyncza (D) Topologia, liniowa
186 242
141 ( ii ) Typ cząsteczki: białko (v ) Typ fragmentu: N-końcowy ( xi) Opis sekwencji: SEK NR ID: 38;
Arg Tyr Tyr Asn Leu Ser Asp Glu Glu Leu Ser Gln Phe Ile Gly Lys 15 10 15 (2) Dane dla sekwencji SEK NR ID:39;
(i) Charakterystyka sekwencji:
(A) Długość: 20 aminokwasów ( B ) Typ: aminokwas (C ) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii ) Typ cząsteczki: białko (v) Typ fragmentu: N-końcowy (xi) Opis sekwencji: SEK NR ID: 39;
Gly Thr Ala Thr Asp Val Ser Gly Pro Val Glu He Asn Thr Ala 15 10 15
De Ser Pro Ala Lys ( 2 ) Dane dla sekwencji SEK NR ED:40;
(i) Charakterystyka sekwencji:
(A) Długość: 11 aminokwasów (B) Typ: aminokwas (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: białko ( v ) Typ fragmentu: N-końcowy ( xi) Opis sekwencji: SEK NR ID: 40;
Ala Asn Ser Leu Tyr Ala Leu Phe Leu Pro Gln 1 5 10 ( 2 ) Dane dla sekwencji SEK NR ID:41;
(i) Charakterystyka sekwencji:
( A) Długość: 14 aminokwasów ( B ) Typ: aminokwas
142
186 242
C ) Rodzaj nici: pojedyncza 3 D ) Topologia: liniowa ii ) Typ cząsteczki: białko v ) Typ fragmentu: T-końcowy xi ) Opis sekwencji: SEK NR ID: 41;
Leu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln 1 5 10
2 ) Dane dla sekwencji SEK NR ID: 42;
i) Charakterystyka sekwencji:
(Ν) Długość: 19 aminokwasów 3 B ) Typ: aminokwas 3 A ) Rodzaj nici: pojedyncza 3 D) Topologia: liniowa
i) Typ cząsteczki: birłko
v) Typ fragmentu: T-końcowy
X ) Opis sekwencji: SEK NR ID: 42;
Arg Cla Leu Glu Vnl Glu Arg Thr Vnl Ser Leu Ala Alu Vnl Ayr 15 10 15
Cla Tly Leu Alu
2) Dane dla sekwencji SEK NR ID: 43;
i) Charakterystyka sekwencji:
Ν ) Długość: 11 aminokwasów 3 B ) Typ: aminokwas 3 C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: białko (v) Typ fragmentu: T-końcowy ( X ) Opis sekwencji: SEK NR ID: 43;
De Arg Alu Asp Tyr Pro Ala Ser Leu Tly Lys 1 5 10 (2) Dane dla sekwencji SEK NR ID:44, (i) Charakterystyka sekwencji:
Ν ) Długość: 16 aminokwasów (B ) Typ: aminokwas 3 C ) Rodzaj nici: pojedyncza (D ) Topologia: liniowa
186 242
143 ( u ) Typ cząsteczki: białko ( v ) Typ fragmentu: N-końcowy ( x ) Cpis sekwencji: SEK NR ID: 44;
Asp Asp Ser Gly Asp Asp Asp Lys Val Thr Asn Thr Asp Ile His Arg 15 10 15 (2) Dane dla sekwencji SEK NR ID:45;
(i) Charakterystyka sekwencji:
(A) Długość: 13 aminokwasów ( B ) Typ: aminokwas (C ) Rodzaj nici: pojedyncza (D) Topologia: liniowa ( u ) Typ cząsteczki: białko (v) Typ fragmentu: N-końcowy ( x ) Cpis sekwencji: SEK NR ID: 45;
Asp Val Xaa Gly Ser Glu Lys Ala Asn Glu Lys Leu Lys 1 5 10 (2) Dane dla sekwencji SEK NR ID:46;
( i) Charakterystyka sekwencji:
(A) Długość: 7551 par zasad ( B ) Typ: Kwas nukleinowy ( C ) Rodzaj nici: podwójna (D) Topologia: liniowa ( u ) Typ cząsteczki: DNA ( genomowy ) ( xi) Cpis sekwencji: SEK NR ID: 46; (tcdA )
ATC Met 1 AAC GAG TCT GTA Val 5 AAA Lys GAG ATA CCT GAT GTA TTA AAA AGC CAG Gln 15 TCT cys 43
Asn Glu s«r Clu Ile Pro Asp 10 Val Leu Lys Ser
GGT TTT AAT TCT CTG ACA GAT ATT AGC CAC AGC TCT TTT AAT GAA TTT 96
Gly Phe Asn cys Leu Thr Asp Ile Ser His Ser Ser Phe Asn Glu Phe
20 25 30
CCC CAG CAA GTA TCT GAG CAC CTC TCC TCG TCC CAA ACA CAC GAC TTA 144
Arg Gln Gln Val Ser Glu His Leu Ser Trp ser Glu Thr His Asp Leu
35 40 45
TAT CAT GAT GCA CAA CAG GCA CAA AAG GAT AAT CwC CTC TAT GAA GCG 192
Tyr His Asp Ala Gln Gln Ala Gln Lys Asp Asn Arg Leu Tyr Glu Ala
50 55 60
CGT ATT CTC AAA CGC GCC AAT CCC CAA TTA CAA AAT GCG GTG AT CTT 240
Arg Ile Leu Lys Arg Ala Asn Pro Gln Leu Cln Asn Ala Val His Leu
óó 70 75 30
144
186 242
GCC Ala ATT Ile CTC Leu GCT CCC AAT Asn .Ala SAA Giu CTC Leu ATA Ile JO GGC dy TAT Tyr AAC Asn AAT Asn ΙΑΛ Gln 35 TTT Phe 2&3
Aa a Pr: 35
AGC GCT AGA AGT C.AA ·— * m i-ii GTT WUfeł X ACC GTT TCT TCC ATG 33 5
Ser Gly Arg Ala 100 Ser Gln T/r Val Ala 105 Pro Thr Val Ger 110 Ser Mec
TTC TCC ccc GCC GCT TAT TTG ACT GAA CTT TAT CGT GAA GCA w'av AA x 334
Phe Ser Pro 115 Ala Ala Tyr Leu Thr 120 Glu Leu T/r Arg Glu 125 Ala Arg Asn
TTA CAC GCA AGT GAC TCC ctt TAT TAT CTG GAT ACC CGC CGC CCA GAT 432
Leu His 130 Ala Sar Asp Ser Val 135 Tyr Tyr Leu Asp Thr 140 Arg Arg Pro Asp
CTC AAA TCA ATG GCG CTC AGT CAG CAA .AAT ATG GAT ATA CAA TTA Tor 480
Leu 145 Lys ser Mer Ala Lau 150 Ser Gln Gln Asn Mec 155 Asp Ile du Leu Ser 150
ACA CTC TCT TTG TCC AAT GAG CTG TTA TTG GAA AGC ATT AAA ACT GAA 523
Thr Lau Sar Lau Ser 165 Asn □ lu Leu Leu Leu 170 Glu ser Ile Lys Thr 175 Glu
TCT AAA CTG GAA AAC TAT ACT AAA GTG ATC GAA ATG CTC TCC ACT TTC 57 6
Ser Lys Leu Glu 130 Asn Tyr Thr Lys Val 135 Mec Clu Mec Leu Ser 190 Ttur Pha
CGT CCT TCC uw GCA ACG CCT TAT CAT GAT GCT TAT GAA AAT CGT 624
Arg Pro Ser 195 Gly Ala Thr Pro Tyr 200 His Asp Ala Tyr Glu 205 Asn Val Arg
GAA GTT ATC s* « /W CTA CAA GAT CCT GGA CTT GAG CAA CTC AAT CCA TCA 672
Glu Val 210 Ile Gln Leu Gln Asp 215 Pro Gly Leu Glu Gln 220 Leu Asn Ala Ser
CCG GCA ATT GCC GGC TTG ATG CAT CAA GCC TCC CTA TTG GGT ATT AAC 720
Pro 225 Ala Ile Ala Cly Leu 230 Mec His Gln Ala Ser 235 Leu Leu Giy Ile Asn 240
GCT TCA ATC TCG CCT GAG CTA TTT AAT ATT CTG ACG GAG GAG ATT ACC 753
Ala Ser Ile ser Pro 245 Glu Lau Ph* Asn Ile 250 Leu Thr Glu Glu Iie 255 Thr
GAA GGT AAT GCT GAG GAA CTT TAT AAG AAA AAT TTT GGT AAT ATC GAA 316
GlU Gly Asn Ala 260 Glu Glu Lau Tyr Lys 265 Lys Asn Phe Gly Asn 270 Ile Glu
CCG GCC TCA TTG GCT ATG CCG GAA TAC CTT AAA CGT TAT TAT AAT TTA 364
Pro Ala Ser 275 Leu Ala Mec Pro Glu 2ao Tyr Lau Lys Arg Tyr 235 Tyr Asn Leu
AGC GAT GAA GAA CTT AGT CAG TTT ATT GGT AAA GCC AGC AAT •T»TWł» GGT 912
Ser Asp 290 Glu Glu Leu Ser Gln 295 Phe Ile Gly Lys Ala 300 Ser Asn Phe Gly
CAA CAG GAA TAT AGT AAT AAC CAA CTT ATT ACT CCG GTA GTC AAC AGC 960
Gln 305 Gln Glu Tyr Ser Asn 310 Asn Gln Leu Iie Thr 315 Pro Val Val Asn Ser 320
ACT CAT GGC ACG GTT AAG GTA TAT CGG ATC ACC CGC GAA TAT ACA ACC 1003
Ser Asp Cly Thr Val 325 Lys Val Tyr Arg He 330 Thr Arg Glu Tyr Thr 335 Thr
AAT GCT TAT CAA ATG GAT GTG GAC CTA TTT ccc TTC GGT CGT GAG AAT 1055
Asn Ala Tyr Gln 340 Mec Asp Val Glu Leu 345 Phe Pro Phe Gly Gly 350 Glu Asn
TAT CCG TTA GAT TAT AAA TTC AAA AAT TTT TAT AAT GCC <TV-rrt i V, L TAT TTA 1104
r/r arg Leu Asp Tyr Lys Phe Lys Asn Phe T/r Asn Ala Ser Τ'/r Lau
355 350 355
145
186 242
TCC Ser ATC Hs 370 AAC Lys TTA Leu
CCT Pro 385 CAA Gln GTC Vel AAT Asn
CAT Asp ATC Ile AGT Ser CAA Gln
CGT TCT TGG CCA
AAT Asn CAT Asp AAA Lys 375 .AGA Arg GAA clu
ATA CAA TAC TGC GCA
Ile Clu 390 Tyr Ser Ala
CGT· et· TTT CGA ACT
Leu Val Arg 380 Thr
-AAT ATC ACA TTA
CAA GGC GCT 11S2 Tlu GGy Ala
1200
1248
1255
1344
1392
1440
1488
1536
1584
1532
1680
1728
1776
1324
1372
1320
1968
AAT ACC GCT Asn Ile Thr Leu Asn Thr Ale 395 400
CCT TTT GAA ATT CCC CTC TCT CGT GTA CTT CGT TCC
Pro Phe Glu Ile Gly Leu Thr Arg Val Leu Pro 5·γ
405 410 415
TAT GCC GCC GCA AAA TTT ACC GTT GAA GAG TAT TTC
Gly ser Trp .Ala Tyr Ale Ale Ale Lys Phe Thr Val Clu Clu Tyr Asn
420 425 430
CAA TAC TCT TTT CTG CTA AAA CTT AAC AAG GCT ATT CGT CTA TCA CGT
Gln Tyr Ser 435 Phe Leu Leu Lys Leu 440 Asn Gys Ale He Arg 445 Leu Ser Arg
TCG ACA GAA TTC TCA CCC ACC ATT CTG GAA CGC ATT GTG CCC AGT TTT
Ala Thr 450 Glu Leu Ser Pro Thr 455 I te Leu Glu Gly Ile 460 Vel Arg 3er Val
AAT CTA CAA CTG GAT ATC AAC ACA GAC GTA TTA GGT AAA GTT « - a CTG’ k. a <9
Asn 465 Leu Cln Leu Asp Ile 470 Asn Thr Asp Val Leu 475 Gly Lys VAl Phe Lau 480
ACT AAA TAT TAT ATC CAG CGT TAT GCT ATT CAT GCT GAA ACT GCO· CTG
Thr Lys Tyr Tyr Mec 485 Gln Arg Tyr Ale Ile 490 His Ale Glu Thr Ala 435 _ Leu
ATA CTA TCC AAC GCG CCT ATT TCA CAA CGT TCA TAT GAT AAT CAA CCT
Ile Leu C3 Asn 500 Ala Pro Ile Ser Gln 505 Arg Ser Tyr Asp Asn 510 Gln Pro
AGC CAT TTT CAT CGC CTG TTT AAT ACG CCA TTA CTG AAC GGA CAA TAT
Ser Gln Phe 515 Asp Arg Leu Phe Asn 520 Thr Pro Leu Leu Asn 525 Gly Gln Tyr
TTT TCT ACC GGC GAT GAG GAG ATT GAT TTA AAT TCA GGT AGC ACC TGC
Phe ser 530 Thr Gly Asp Glu Glu 535 Ile Asp Leu Asn Ser 540 Gly Ser Thr Gly
CAT TCG CGA AAA ACC ATA CTT AAG CGT GCA TTT AAT ATT GAT GAT GTC
Asp 545 Trp Arg Lys Thr Ile 550 Leu Lys Arg Ale Phe 555 Asn Ile Asp Asp Val 560
TCC CTC TTC CGC CTG CTT AAA ATT ACC GAC CAT GAT AAT AAA GAT GGT
Ser Leu Phe Arg Leu 565 Leu Lys Ile Thr Asp 570 His Asp Asn Lys Asp 575 Gly
AAA ATT AAA AAT AAC CTA AAG AAT CTT TCC AAT TTA TAT ATT CGA AAA
Lys Ile Lys Asn 580 Asn Leu Lys Asn Leu 585 Ser Asn Leu Tyr Ile 590 Gly Lys
TTA ctc GCT CAT ATT CAT CAA TTT TCC TTT GTT GAA CTG GAT TTA TTA
Leu Leu Ale 595 Asp Ile His Gln Leu 600 Thr Ile Asp GlU Leu 605 Asp Leu Leu
CTG ATT GCC GTA GCT GAA CGA AAA ACT AAT TTA TCC GCT ATC AGT GAT
Leu Ile 610 Tla Val Gly Glu Gly 615 Lys Thr Asn Leu Ser 620 Ale Ile Ser Tsp
.TAG CTT TTG GCT TCC CTG ATC AGA AAA CTC AAT ACT ATT TTC TCC TCC
Lys 325 cn Leu Ale Thr Leu 630 Ile Arg Lys Leu Asn 635 Thr I le Thr Ser Trp 640
CTT CTT TCT CAG AAG TGG TGT GTA TTC CTG CTA TTT ATC ATC ACC tcc
Leu His Thr Gin Lys Trp Ser Val Phe Gin Lau Phe Ile Met Thr Ser
146
186 242
645 550 jS5
ACT Thr AGC Ser Tyr AAC Asn 6 60 AAA Lys ACC Thr CTA Leu ACG CCT GAA Glu ATT Ila AAG Lys AAT Asn L Lau 670 C TG Leu Z· » w.-i I Asp 2016
Thr Pro 665
ACC . V. TAC CAC GGT eea « a a.-k CAA GGT TTT GAT AA.A GAC AAA GCA GAT TTG 2064
Thr Val Tyr 675 His Gly Leu Gln Gly 630 Phe Asp Lys Asp Lys 635 Ala Asp Leu
CTA CAT GTC ATG GCG CCC TAT ATT GCG TCC ACC TTG CAA TTA TCA TCT 2112
Leu His 690 val Mec Ala Pro Tyr 695 Ile Ala Ala Thr Leu 700 Gln Leu Ser Ser
CAA AAT TTC GCC CAC TCG CTA CTC CTT TGG GCA GAT AAG TTA CAG Z-·/—Λ 2160
Tlu 705 Asn Val Ala HlS Ser 710 Val Leu Lau Trp Ala 715 Asp Lys Lau Gln Pro 720
TGC GAC GGG GCA ATC ACA GCA CAA AAA TTC TGG GAC TCG TTC AAT ACT 2203
Tly Asp Gly Ala Mec 725 Thr Ala Glu Lys Phe 730 Trp Asp Trp Leu Asn 735 Thr
AAC TAT ACG CCT GGT TCA TCG CAA GCC GTA GAA ACC CAG GAA CAT ATC 2256
L/s Tyr Thr Pro 740 Gly Ser 5er Glu Ala 745 Val Glu Thr Gln Tlu 750 His Ile
TTT CAG TAT TCT CAG GCT CTG GCA CAA TTC CAA ATG GTT TAC CAT TCC 2304
Val Gln Tyr 755 Cys Gln Ala Leu Ala 760 Gln Lau Glu Mec Val 765 Tyr His Ser
ACC GGC ATC AAG GAA AAC GCC TTC CGT CTA TTT CTG ACA AAA CCA CAG 2352
Thr Gly 770 Ile Asn Glu Asm Ala 775 Phe Arg Lau Phe Val 730 Thr Lys Pro Tlu
ATT TTT TGG GCT GGA AGT GGA GCA CCC CCC CCC CAT GAT GCC GTT TCA 2400
Mec 735 Phe Gly Ala Ala Thr 790 Gly Ala Ala Pro Ala 795 His ASP Ala Leu Ser 300
CTG ATT ATG CTG ACA CCT TTT GCT GAT TCC CTG AAC GCA CTA GGC CAA 2443
Leu Ile mcc Leu Thr 305 Arg Phe Ala Asp Trp 310 Val Asn Ala Lau Gly 315 Tlu
AAA GGG TGC TCC GTC CTA GCG TCA TTT CAA GCT AAC TCG TTA ACG GCA 2196
Lyc Ala Ser Ser 320 Val Leu Ala Ala Phe 325 Glu Ala Asn Ser Leu 330 Thr Ala
TAA CAA CTG GCT CAT GGC ATG AAT CTT CAT TCT AAT TTG CTG TTC CAA 2544
Glu Gln Leu 335 Ala Asp Ala Mac Asm 340 Leu Asp Ala Asn Leu 345 Leu Lau Gln
GCC AGT ATT CAA GGA CAA AAT CAT CAA CAT CTT CCC CCA GTA ACT CCA 2592
Ala Ser 350 Ile Gln Ala Gln Asn 355 His Gln His Leu Pro 360 Pro Val Thr Pro
CAA AAT GCG TTC TGC TGT TCC ACA TCT ATC AAT ACT ATC CTC CAA TCC 2640
Glu 365 Asm Ala Phe Ser Cys 370 Trp Thr Sar Ile Asn 375 Thr Ile Leu GlM Trp aso
TTT AAT TTG GGA CAA CAA TTG AAT GTG CCC CCA CAG TGC TTT TCC GCT 2633
Val Asn Val Ala Gln 335 Gln Lau Asn Val Ala 390 Pro Gln Tly Val Ser 395 Ala
TTG GTC TGG CTC GAT TAT ATT CAA TCA ATT AAA CAG ACA CCG ACC TAT 2735
Lau Val Gly Leu 900 Asp Tyr Ile GlM ser 905 Mec Ly3 Tlu Thr Pro 910 Thr Tyr
CCC CAG TGG GAA AAC CGG TCA GGC GTA TTA ACC CCC GGG TTG AAT TCA 2734
Ala GlM Trp 915 Glu Asm Ala Ala Gly 920 Val Lsu Thr Ala Gly 925 Lau Asn 5er
C.AA CAT CGT AAT ACA TTA CAC GCT TTT CTC GAT TAA TCT CTC AGT GCC 2332
186 242
147
Cln Cln 930 Ala Asn Thr Leu His 935 Ala Phe Leu Asp Glu 940 Ser Arg Ser Ala
CCA TTA ACC AGG TAG tAT ATG CCT GAA CTG GGG AAG CGA gcG 2330
Ala 545 Leu Ser Thr Tyr Tyr 950 Ile Arg Cln '-'al Ala 955 Lya Ala Ala Ala Axd 5g0
A X * AAA AGG CGT CAT CAG TTC TAT GAA TAG TTA GTG ATT AAT CAG 292a
Ile Lya Ser Arg ASP 965 Asp Leu Tyr Gln Tyr 970 Lau Leu Ile Asp Asn 975 Cln
GTT TCT GGA ATA AAA AGC AGG CGG ATC GGG CAA GGC ATT CCC « ywaat ΠΛ_» χ 2976
Val Ser Ala Ala 930 Ile Lys Thr Thr Arg 935 Ile Ala Clu Ala Ile 990 Ala Ser
ATT GAA CTC TAG CTC AAG GCG CGA TTC CAA AAT GTC GAA GAA AAT GGC 3021
Ile Gln Leu 995 Tyr Val Asn Arg Ala Leu 1000 Glu Asn Val Glu Clu 1005 Asn Ala
AAT TGG GCG CTT ATG AGG CGG CAA TTC TTT ATG CAG TCC GAC AAA TAG 3072
Asn Ser Gly 1010 Val Ile Ser Arg Cln 1015 Phe Phe Ile Asp Trp 1020 Asp Lys Tyr
AAT AAA CGC TAG ACC ACT TCC CGG GGT CTT TCT CAA TTA GTT TAG TAG 3120
Asn Lys 1025 Arg Tyr Ser Thr Trp 103C Ala Cly Val Ser Cln 1035 Leu Val Tyr Tyr 1040
GGG GAA AAC TAT ATT GAT CGG ACC ATC CGT ATC GGA GAA AGG -AAA ATG 3163
Pro Clu Aan Tyr Ile Asp 1045 Pro Thr Met Arg Ile 10SC Cly Gln Thr Lys Met 1055
ATC GAG GCA TTA GTC CAA TCC GTG AGG GAA AGG GAA TTA AAG GCC GAT 3216
Met Asp Ala Leu Leu 1060 Cln Ser Val Ser Cln 1065 Ser Cln Lau Asn Ala 1070 Asp
ACC GTG CAA GAT CCC TTT ATC TGT TAT CTG AGA TGC TTT GAA GAA GTG •3264
Thr Val Glu 1075 Asp Ala Phe Met Ser Tyr 1080 Leu Thr Ser Phe 1035 Glu Gln Val
GGT AAT CTT AAA GTT ATT ACG GGA TAT GAG GAT AAT ATT AAT AAC GAT 3312
Ala Asn 1090 Leu 1 Lys Val Ile Ser Ala 1035 Tyr His Asp Asn Ile 1100 Asn Asn Asp
CAA GCG CTG AGG TAT TTT ATG GGA CTG ACT CAA ACT GAT GGG GGT GAA 3360
Gln 1105 Gly 1 Leu Thr Tyr Phe Ile 1110 Gly Leu Ser Clu Thr 11X5 Asp Ala Gly Glu 1120
TAT TAT TCG GCG AGT GTG GAT CAG ACT AAA TTG AAC CAG GGT AAA TTG 3403
Tyr Tyr Trp Arg Ser Val 1125 Asp His Ser Lys Phe 113C Asn Asp Gly Lys Phe 1135
GGC GCT AAT GGC TCC AGT GAA TCC GAT AAA ATT CAT TCT GCA ATT AAG 3456
Ala Ala Asn Ala Trp 114C Ser Clu Trp His Lys 1145 Ile ASP Cys Pro Ile 1150 Asn
CGT TAT AAA ACG ACT ATG GGT CGA CTG ATA TAT AAA TCC GGG CTC TAT 3504
Pro Tyr Lys 1155 Ser Thr Ile Arg Pro Val 1160 Ile Tyr Lys Ser Arg 1165 Leu Tyr
CTG CTC TGC TTC CAA GAA AAC CAC ATG AGG .AAA GAC ACA GCA AAT AGT 3552
Leu Leu Trp 1170 Leu Clu Cln Lys Glu 1175 Ile Thr Lys Cln Thr iiao Gly Asn Ser
AAA GAT Ccc TAT GAA AGT GAA ACC CAT TAT CCT TAT GAA GTA AAA TTG 3600
Lys 1135 Asp Gly Tyr Cln Thr Clu 1190 Thr Asp Tyr Arg Tyr 1195 Clu Leu Lys Leu 1200
CCG CAT ATG GcG TAT CAT GCG AGT TCC AAT ACC GCA ATC ACG TTT un x 3643
Ala His Ile Arg Tyr Asp Cly Thr Trp Asn Thr Pro Ile Thr Phe Asp
1205 1210 1215
148
186 242
CTC Val AUT Asn AUA Lys UUA ATU L/S I le 1220 Tcc Ser CUC Clu CTA Leu UAA CTG Lys Leu 1225 caU du UAA Lys UAT Usn UCA GCG Arg Ula 1230 CCC Pirs 3636
CGA CTC TUT TGT G0C GCT TAT CAA CGT CUA CAT A'*, w TTG cTG CTC ATC 3744
c ly Leu Tyr Cys Ala Cly Tyr Cln Gly Glu usp Thr Lau Leu Val Met
1235 1240 1245
TTT TUT AAC CUA CUA CAC UCA CTA GAT AGT TAT UAU AlC CCT TCA ATC 3792
Phe Tyr Usn Cln C.n Usp Thr Lau Usp Ser Tyr Lys Usn Ula Ser Mec
1255 1230
CAA CGA CTA TUT ATC TTT GCT CAT ATG GCA TCC UAA CAT ATC ACC CCA 3840
Cln Cly Leu Tyr Ile Phe Ala Asp Met Ala Ser Lys usp Met Thr Pro
1265 1270 1275 1230
CUA CUG AGC UAT GTT TAT CGG GAT AUT AGC TAT CAA CAA TTT CAT ACC 3333
Clu Cln Ser Asn Val Tyr Arg Asp Asn Ser Tyr Cln Cln Phe Asp Thr
1285 1290 1295
AAT AAT GTC AGA AGA GTG AUT AAC CGC TAT CCA CAC CAT TUT CUG ATT 3936
usn Usn Val Arg Arg Val Asn Asn Arg Tyr Ala Glu Asp Tyr Clu Ile
1300 1305 1310
CCT TCC TCG CTA ACT ACC CCT AAA CAC TAT CCT TGG CCA CAT TAT TAC 3984
Pro Ser Ser Val Ser Ser Urg Lys Asp Tyr Cly Trp Cly usp Tyr Tyr
1315 1320 1325
CTC AGC ATG GTA TAT AUC GGA GAT ATT CCA UCT ATC AUT TAC UAA CCC 4032
Leu Ser Met Val Tyr Asn Cly Asp He Pro Thr Ile Asn Tyr Cys Ala
1330 1335 1340
CCA TCA ACT GAT TTA UAA ATC TAT ATC TCA CCA AAA TTA UGA ATT ATT 4080
ula Ser Ser Asp Lau Lys Hla Tyr Ile Ser Pro Lys Lau Arg Ile ILe
1345 1350 1355 1360
CAT AAT GCA TAT GAA GGA CAG AAG CGC AAT CAA TCC UAT CTC ATC UAT 412a
His Asn Gly Tyr Glu Gly Gln Lys Arg Asn Cln Cys Usn Leu Met Usn
1365 1370 1375
UAA TAT GGC AAA CTA GGT GAT AUA TTT ATT CTT TAT UCT ACC TTC GCC 4176
L'/S Tyr Gly Lys Leu Gly Asp Lys Phe Ile val Tyr Thr Ser Lau Cly
1380 1385 1390
CTC AAT CCA UAT AAC TCC TCA UAT AUG CTC ATG TTT TAC CCC CTC TAT 4224
Val Asn Pro Asn Asn Ser Ser Asn Lys Leu Met Phe Tyr Pro Val Tyr
1395 1400 1405
CAA TAT AGC GGA UAC ACC AGT CGA CTC AUT CAA CCC ACA CTA CTA TTC 4272
Cln Tyr Ser Gly Asn Thr Ser Gly Lei Asn Cln Cly Arg Lau Leu Phe
1410 1415 1420
cuc CCT CAC-ACC ACT TAT CCA TCT AAA GTA CAA CCT TGC ATT CCT CCA 4320
His Arg Asp Thr Thr Tyr Pro Ser Lys Val Clu Ala Trp Ile Pro Cly
1425 1430 1435 1440
CCA UAA CGT TCT CTA UCC AAC CUA AUT GCC CCC ATT GGT CAT GAT TAT 4368
ula Lys Arg Ser Leu Thr Asn Gln Asn Ala Ala Ile Cly Asp Usp Tyr
1445 1450 1455
GCT ACA GAC TCT CTC UAT UAA CCG GAT GAT CTT AAG CUA TAT ATC TTT 4416
Ula Nar Asp Ser Leu Usn Lys Pro Asp Usp Lau Lys Gln Tyr Ile Phe
1460 1465 1470
ATG ACT GAC AGT AAA CGG ACT GCT ACT CAT CTC TCA CGC CCA CTU CAG 4464
Mec Thr Asp Ser Lys Cly Thr ula Thr Usp Val Ser Gly pro Val Clu'
1475 1480 1485
ATT AUT ACT GCA ATT TCT CCA GCU AUA GTT CAC ATU ATA CTC UAA cCC 4512
•le Asn Thr Ala Ile Ser Pro Ula Lys Val Cln Ile ila Val Lys Ala
1490 1495 1500
186 242
149
4 GWM Cl/ Gly 1505 TAC L/T GAC Clu cAA Gln act Ter 151 TCC rea 0 TC C eer GCC Cla CCT csp .CAA Lys 1515 CAT Csp 5 GhC /al yoc Stp ACT Ila ocG Gln 1520 4560
CCA TCA CCT CCC TTT CAT GAC ATC CCC CCC CAA TTT TAC GCC CTC GAA 4608
rpo Sep rpo Sap re® Asp Glu Mat Asn h/r Gln re® Csn Ala Leu Glu
1525 1530 1535
X Λ W.—.<· CCT cct GCT ccc TAC TTT CCC TAC AC-C CCC CCC CGT CCC GA 1 4655
Ha Asp Cl/ StP Cl/ Lau Csn re® Ila Asn Csn Sap CIi Sep 11® .A3C
1540 1545 1550
CTT ACT ctt CCC CCA T**? CCC SCC CAC GCC CCC CAC CCG GGC CAC GAA 4704
/al eer rbe eer Ala re® Cla Clu Csp cl/ Crg L/s Liu Gl/ Typ Glu
1555 1560 1565
AGT TTC ACT CTT CCT cct CCC CTC CAC CTC CGT CCC CCC CAC CCC CTC 4752
śer ree Sep lift ppo /al eer Lau Lys /al Sar Ter Asp Csn Cla Lau
1570 1575 1590
ACC CTG CAC CCT atc G.AA AAC CGT CCG CCA CAC ATC CCA TGG CAA 4 w 4800
yer LSU Hls His csn Clu csn Cl/ cla cln T/r Mat Cln hpp Cln Sar
1585 1590 1595 1600
TAT CCT ccr CCC CTG AAT CCT CTC hCT CCC CCC CCC CTG CCC GCA MGM 4343
Tyr Crg cer Apg Lau Csn cer Leu re® Cla cpg Cln Ltu /al Ala Crg
1605 1610 1615
CCC CCC ACC CCA ccc GCT ACC ATT CTC AGC CCC GAA ACC CCG TAC CCT 4396
Ala eer eer Cly Ila Csp yer Ilt Lau Str Mac Clu eer Cln Csn Ile
1620 1625 1630
CAC CCT CCG CAG TTA CGC CAA CGT CTC CAT CGT CCG TCC CTG ACA CCT 4944
Cln Glu rro Gln Lau Cly Lys Cly re® Tyr Ala eer re® /al Ilt rro
1635 1640 1645
CCC TAT AAG CTA TCA ACT CAC CCT GAT CAC CGT CGG TCT CAG CTC CAC 4992
rro T/r Asn Lau Sep eer Hst cl/ Asp Clu Crg Tpp re® L/S Leu T/r
1650 1655 1660
ATC AAA CAT cct CTT GAT AAC CAT TCC CAC CTT ACC TAT CCA GGC CAG 5040
Ilt Lys His /al /al Csp Asn Csn Sep His Ilt Ila Typ Sep Cly Cln
1655 1670 1675 1080
CTA ACA CAT CCA AAT CTA TAC CCC ACA TCA CTC ACT CCT CTT CAT GAC 5088
Lau eer Asp Ter Asn Ilt Asn Ile eer Lau re® Ila rro Lau Csp Csp
1685 1690 1695
GTC CCA TTG CAT CAC CAC TAC CAC GCC ACC CTT CCT CTG CCC TTC CCG 5136
/al rro Leu Csn Cln Csp Cyr HiS Cla L/s /al T/p Muc eer re® L/s
1700 1705 1710
ACA TCA CCA ecA CAT GGT CCC CGG CCC CCC CCT CCC TTC GTC AGA GAC 5134
L/s Sep rro Ser Csp Gly eep Crp Tpp Gly rro HiS re® /al Arg CSr
1715 1720 1725
CCT AAA CCA CTA CTC CCA CCA CAC CCT CAA T00 ATT CTC CCC CAT CCT 5232
Asp Lys Gly Ilt /al Cer Ilt Asn rro Lys Sep Ile Leu eer Hss re®
1730 1735 1740
GCG CGg CTC CAT CTC CCG CAT ACC ATT CCC ACC CCA CCA CTC CAC TTC 5280
clu Sep /al Csn /al Leu Asn Asn Ila Ser Sar Clu rro Mat Csp re®
1745 1750 1755 1760
CCC CCC CCT CAC ACC CTC TAC ttc TCC GAT CCO TCC CCC CAT ACC CCG 5323
Ser Cly Ala Asn Stp Lau Tyr re® Crp Clu Lau re® T/r C/P cep rro
17 65 1770 1775
CTC CTC CTT CCT CAC CCT CTG CCG CCC GAA CAG AAC TCh GAT CCA CC? 5 3 7 6
Mac Lau /al Ala Cln Crg Ltu Lau Hst Clu Gln Asn rea Csp Glu Ala
150
186 242
1730 1735 1750
AAC Asn Arg TTG CTG Trp Leu 1735 AAA Lys TAT Tyr TTG Val TGG AGT Trp Ser 1300 GG · Pro TCC Ser GGT Gly TAT ATT Tyr Ile 1305 GTG Val CAC His 5421
CGC CAG ATT CAG AAC TAC CAG TGG AAC GTC CGG C cG TTA CTG CAA TAC 54^2
^^y Gln Ile cln 1810 Asn Tyr Tln Trp Asn 1315 val Arg Pro Leu Leu 1320 Clu Asp
ACC ACT TCC ATC ACT GAT CCT TTG GAT tcc GTG GAT CCT GAC GcG CTA 5520
Thr Ser 1825 Trp Asn Ser Asp Pro 1830 Leu Asp Ser Vel Asp 1335 Pro Asp Ala Val 1340
GCA CAG CAC GAT CCA ATG CAG TAC AAA CTT TCA ACT TTT ATG CGT ACC 5568
Ala Cln His Asp Pro Mec 1845 His Tyr Lys Val Ser 1850 Thr Phe Mec Arg 1355 Thr i
TTG GAT CTA TTG ATA CGA CGC GGC GAG CAT GGT TAT CGG CAA CTG GAA 5616
Leu Asp Leu Leu Ile 1360 Ala Arg Gly Asp His 1365 Ale Tyr Arg Gln Leu 1870 Clu
CCA GAT ACA CTC AAC GAA GCG AAG ATG TGG TAT ATG CAA GGG CTC GAT 5664
Arg Asp Thr Leu 1375 Asn Glu Ale Lyo ma· 1830 Trp Tyr Met cm Ala 1335 Lau His
CTA TTA GGT GAC AAA CCT TAT CTA GCG CTC AGT AGG ACA TGG AGT GAT 5712
Leu Leu Cly Asp 1390 Lys Pro Tyr Leu Pro 1895 Leu ser Thr Thr Trp 1900 Ser Asp
CCA CCA CTA GAC AGA GGG GCG GAT ATG ACT AGC CAA AAT CGT CAC CAC 5760
Pro Arg 1905 Leu Asp Arg Ale Ale 1910 Asp Ile Thr Thr Gin 1915 Asn Ala His Asp 1320
ATC GCA ATA GTC GGT CTG GGG CAG AAT ATA GGT AGA CCG CCA CCT TTA 5303
Ser Ale Ile VAl Ale Leu 1925 Arg Gin Asn Ile Pro 1930 Thr Pro Ale Pro Leu 1935
TCA TTG CGC ATC GCT AAT ACC CTG ACT GAT CTG TTG CTG CCG CAA ATC 5355
Ser Leu Arg Ser Ala 1940 Asn Thr Leu Thr Asp 1945 Leu Phe Leu Pro Gln 1950 Ile
AAT GAA GTG ATG ATG AAT TAG TGG CAG ACA TTA GGT CAG ACA CTA TAC 5904
Asn Glu Vel Met 1955 Met Asn Tyr Trp Gln 1960 Thr Leu Ale Cln Arg 1965 Vel Tyr
AAT CTG GGT CAT AAC CTC TCT ATC GAC GGG GAG CCG TTA TAT CTG CCA 5952
Asn Leu Arg His 1970 Asn Leu Ser Ile Asp 1975 Gly Gln Pro Leu Tyr 1930 Leu Pro
ATC TAT GGC AGA GGG GGC GAT CCG AAA GGG TTA GTG ACC CCC CGC GTT 6000
Ile Tyr 1985 Ale Thr Pro Ala Asp 1990 Pro Lys Ala Leu Leu 1995 Ser Ala Ala Vel 2000
ACC ACT TGT CAA GGT GGA CCC AAC CTA CCG GAA TGA TTT ATC TCC CTG 6043
Ale Thr ser Gin Gly Gly 2005 Gly Lys Leu Pro Glu 2010 Ser Phe Mec Ser Leu 2015
TCG CCT ttg cce cac ATG CTT GAA AAT GGG CGG CGG ATG GTT AGG CAG 6096
Trp Arg Phe Pro His 2020 Het Leu Glu Asn Ale 2025 Arg Gly Mec Vel Ser 2030 Gin
CTC ACC CAG TTG GGC TCC AGG TTA CAA AAT ATT ATC GAA CGT CAG GAC 6144
Leu Thr Gin Phe 2035 Gly Ser Thr Leu Gin 2040 Asn Ile Ile Glu Arg 2045 Gin Asp
GCG GAA GCG GTG AAT GGG TTA TTA CAA AAT CAG GGC CCl GAG CTG ATA 6192
Ala Glu Ale Leu 2050 Asn Ala Leu Leu Gin 2055 Asn Gln Ale Ala clu 2060 Leu Ile
TTG ACT .AAG GTG AGC ATT CAG GAC AAA ACC ATT CAA CAA TTG CAT 6240
151
186 242
Leu 2C6 ΓΚΓ Asn L~u Ser Iie Gin 2073 ASP Lys Thr iie 207’ Glu e Glu Lau A3p Aia 2080
CAG AAA ACC CTC TTO GAA AAA 7CC AAA GCj •CCA CCA CAA TCG TTT 62 3 3
Glu Lys Thr Tai Leu Glu 2035 Lys Ser tys Ala Gly 2090 Ala Gln Ser Arg Phe 2095
CAT AGC TAC CGC AAA TCj TAC CAT GAG AAT ATC AAC CCC cct CAA AAC 5336
Asp ser Tyr Gly Lys 2100 Leu Tyr Asp Glu Asn 2105 Ile Asn Ala Gly Glu 2110 Asn
C.AA GCC ATC rvCG CTA CGA T**C GCC CGG CTT ACC ACC CCA CTT 63 34
Cln Aid Mec Thr 2115 Leu Arg Ala Ser Ala 2120 Aid Gly Leu Thr Thr 2125 Ala Val
CAG GCA TCC CGT CTG GCC GGT GCG GCG GCT GAT CTG GTG CCT AAC ATC 6432
Cln Ala Ser 2130 Arg Leu Aid Gly Ala 2135 Aia Ala Asp Leu Val 2140 Pro Asn Ile
TTC GGC TTT GCC GGT GGC AGC CGT T>—«-» • ww GGC GCT ATC GCT GAG CCG 5430
Phe Gly 2145 Phe Ala Gly 2150 Ser Arg Trp Gly Ala 2155 Ile Aia Glu Ala 2160
ACA CCT TAT CTG ATC CAA TTC TCC ccc AAT CTT ATC AAC ACC CAA ccc □ 5 2 0
Thr Gly Tyr val Mec 2155 Glu Phe Ser Ala Asn 217C Tal l Mec Asn Thr Clu 2175 Ala
CAT AAA ATT ACC CAA TCT CAA ACC TAC CCT CCT CCC CGT CAC gAC TCC 55~5
Asp Lys Ile Ser 218C Gin 1 Ser Glu Thr Tyr Arg 2185 Arg Arg Arg Gln Glu 2190 Trp
GAC ATC CAC CGG AAT AAT CCC GAA GCC GAA TTC AAG CAA ATC CAT GCT 5524
Glu Ile Gln Arg 2195 Asn Asn Ala Glu Ala 2200 Glu Leu Lys Gln 2205 Ile ASP Ala
CAG CTC AAA TCA CTC CCT GTA CGC CCC GAA GCC ccc CTA TTG CAG AAA 55~2
Gln Leu Lys 2210 Ser Leu Ala Val Arg 2215 Arg Clu Ala Ala Val 2220 Leu Cln Lyc
ACC ACT CTC AAA ACC CAA CAA GAA CAG ACC CAA TCT CAA TTG GCC TTC 520
Thr 2225 Ser Leu Lys Thr Gin Gin 2230 Clu Gln Thr Cln Ser 2235 Cln Leu Ala Phe 2240
CTG CAA CCT AAG TTC AGC AAT CAG GCG TTA TAC AAC TGG CTG CCT CGT 6 b8
Leu Cln Arg Lys Phe Ser 2245 Asn Cln Ala Leu Tyr 2250 Asn Trp Leu Arg Gly 2255
CGA CTG GCG GCG ATT TAC TTC CAG TTC TAC GAT TTG GCC GTC GCG * 6316
Arg Leu Ala Ala Ile 2260 Tyr Phe Cln Phe Tyr 2265 Asp Leu Ala Val Ala 2270 Arg
TCC CTG ATG GCA CAA CAA CCT TAC CGT TGG GAA CTC AAT GAT GAC TCT 6354
Cys Leu Mec Al* 2275 Glu Cin Ala Tyr Arg 2280 Trp Clu Leu Asn Asp 2285 Asp Ser
ucc kr«-*C TTC ATT AAA CCG GGC GCC TGG CAC GGA ACC TAT GCC GCT CTG 5912
Ala Arg Phe 2290 Ile Lys Pro Gly Ala 2295 Trp Gln GLy Thr Tyr 2300 Ala Cly Leu
CTT GCA GGT GAA ACC TTC ATG CTG AGT CTG GCA CAA ATG GAA GAC CCT 5960
Leu Ala 2305 Gly Glu Thr Leu Mec 2310 Leu Ser Leu Ala Gln 2315 Mec Glu Asp Ala 2320
CAT CTG AAA CGC GAT AAA CGC GCA TTA GAG GTT GAA CGC ACA GTA TCC 7003
His Leu Lys Arg Asp Lys 232S Arg Ala Leu Glu Val 2330 GlU Arg Thr Val Ser 2335
CTG GCC GAA GTT TAT GCA GGA TTA CCA AAA GAT AAC GGT CCA TTT TCC 7055
Leu Ala Glu Val Tyr 2340 Ala cly Lau Pro Lys 2345 Asp Asn Gly Pro Phe 2350 Ser
152
186 242
CTC Leu GCT Αία CAG GAA Gln Glu 2355 ATT Ile GAC Asp Lys CTG Leu 23ńi GTG Val 3 AG T 5er CaA Tln Tly TCA AAA Ser Tly 2365 AGT Ser GCg Aia 7194
GGC AGT GGT AAT AAT AAT TTG GCg TTC GG— cCC GGC ACG GAC TCA AAA 7152
Gly Ser Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr Lys
2370 2375 2330
AC— TCT TTG CAG GCA TCA GTT TCA TTC GCT GAT TTC AAA ATT CGT GAA 7200
Thr Ser Leu Aln Ala Ser Val Ser Phe Ala Asp Leu Lys Tle Trg Clu
2385 2390 2395 2400
GAT TAC AAT GCA TCG CTT GGC AAA ATT CGA CGT ATC AAA CAG ATC AGC 7248
Asp Ayr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile Ser
2405 2410 2415
GTC ACT TTG CCC GCG CTA CTG CGA CCG TAT CAG GAT GTA CAG GCA ATA 7296
Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ile
2120 2425 2430
TTG TCT TAC GGC GAT AAA GC GGA TTA GCT AAC GGC TGT GAA GCG CTG 7344
Leu Ser Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala Leu
2435 2440 2445
A GTT TCT CAC GGT ATC AAT GAC ACC GCC CAA TTC CAG CTC GAT TTC 7392
Tle Val Ser His Gly Met Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe
2450 2455 2460
.AAC CAT GGC AAA TTC CTG CCA TTC CAA GGC ATC GCC CAA GAT CAA GGC 7440
Tsn Asp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln Gly
2465 2470 2475 24ao
ACC CTC ACA CTC ACC TTC CCA AAT CCA TCT ATG CCG CAG AAA GCT AAA 7483
Thr Leu Thr Leu Ser Phe Pro Asn Ala Ser Met Pro Glu Lys Gly Lys
2485 249A 2495
CAA AAA ACT ATC TTA AAA ACC CTG AAC GAT ATC ATT TTG CAT ATT CGC 7536
Gln Ala Thr Met Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile Arg
2500 2505 2510
TAC ACC ATT .AAA TAA 7551
Tyr Thr Ile Lys • ee
2516
(2) Dane dla sekwencji SEK NR ID: 47;
(i) ΑΗ-τ-Ηπ^^Ιη sekwencji:
(A) Długość: 2516 rmmokwayry (B) Typ: aminokwas ( C) Rodzaj nici :
(D ) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEK NR ID: 47 (AcdN);
Cechy Od Do Opis
Peptyd 1 2516 białka AcdC
Peptyd 89 1937 peptyd AcdCii
Fragment 89 100 S2 T-końcowy 3 SEK TR ID: 13 )
Fragment 284 299 3 SEK NR ID: 38 )
Fragment 554 563 (SEK NR ID: 17)
Fragment 1080 1092 (SEK NR ID: 23, 12/13)
Fragment 1385 1400 (SEK NR ID: 18)
Fragment 1478 1497 (SEK NR ID· 39)
Fragment 1620 1642 (SEK NR ID: 21; 19/23)
Fragment 1938 2516 ( SEK NR ID: 41 )
Peptyd 1938 2516 peptyd AcdTiii
Fragment 2327 2345 ( SEK NR ID: 42 )
Fragment 2398 2408 ( SEK NR ID : 43 )
186 242
153
Mec 1 Asn Glu □er Val Lys Glu Ile Pro Aso 10' Val Leu Lys Ser Gln 15 cys
Gly Phe Asn Cys 20 Leu Thr Asp Ile Ser 25 His Ser Ser Phe Asn 30 Glu Phe
Arg Gln GlM 35 Val Ser Glu His Leu 40 Ser Trp Ser Glu Thr 45 His Asp Leu
Tyr His 50 Asp Ala Gln GlM Ala 55 Gln L/s Asp Asn Arg 60 Lau Tyr Tlu Ala
Arg 65 Ile Leu Lys Arg Ala 70 Asm Pro GlM Lau Gln 75 Asn Ala Val His Lau 30
Ala Ile Leu Ala Pro 35 Asm Ala Tlu Lau Ile 90 Gly Tyr Asn asm GlM 55 Phe
Ser Gly Arg Ala 100 Ser Gln Tyr Val Ala 105 Pro Gly Thr Val Ser 110 Ser Mec
Phe Ser Pro 115 Ala Ala T/r Leu Thr 120 Glu Leu Tyr Arg Glu 125 Ala Arg Asn
Leu His 130 Ala Ser Asp Ser Val 135 Tyr Tyr Leu Asp Thr 140 Arg Arg Pro Asp
Lau 145 Lys Ser Mec Ala Leu 150 Ser Gln Gln Ajsn Mec 155 Asp Ile Glu Leu Ser 160
Thr Lau Ser Leu Ser 165 Asn Glu Leu Lau Lau 170 Glu 5er Ile Lys Thr 175 Glu
Ser Lys Lau Glu 130 Asn Tyr Thr Lys Val 135 Mec Glu Mec Lau Ser 190 Thr Phe
Arg Pro Ser 195 Tly Ala Thr Pro Tyr 200 His Asp Ala Tyr Glu 205 Asm Val Arg
Glu Val 210 Ile Gln _eu Gln Asp 215 Pro Gly Leu Glu Gln 220 Leu Asn Ala Ser
Pro 225 Ala Ile Ala Gly Leu 23 0 Mec His Gln Ala Ser 235 Leu Leu Gly Ile Asn 240
Ala Ser Ile Ser Pro 245 Glu Leu Phe Asn Ile 250 Leu Thr Glu Glu Ile 255 Thr
Glu Gly Asn Ala 2S0 Glu Glu Leu Tyr Lys 26S Lys Asm Phe Gly Asn 270 Ile Glu
Pro Ala Ser 275 Leu Ala Mec Pro Glu 280 Tyr Leu Lys Arg Tyr 235 Tyr Asn Leu
Ser Asp 290 Glu Glu Leu Ser Gln 295 Phe Ile Gly Lys Ala 300 Ser Asn Phe Gly
Gln 305 Gln Glu Tyr Ser Asm 310 Asn Gln Leu Ile Thr 315 Pro Val Val Asn Ser 320
Ser Asp Gly Thr Val 325 Lys Val Tyr Arg Ile 330 Thr Arg Glu Tyr Thr 335 Thr
Asn Ala Tyr Gln 340 Mec Asp Val Glu Leu 3 45 Phe Pro Phe Gly Gly 350 Glu Asn
Tyr Arg Leu 355 Asp Tyr Lys Phe L/s 3 60 Asn Phe Tyr Asm Ala 365 Ser Tyr Lau
Ser Ile Lys Leu Asn Asp Lys Arg Tlu Leu Val Arg Thr Glu Tly Ala
154
186 242
370 375 330
Pro Cln Val Asn Ile Glu Tyr Ser Ala Asn Ile Thr Leu Asn Thr Ala
385 390 395 400
Asp Ile Ser cln Pro Phe Clu Ile Gly Leu Thr Arg Val Leu Pro Ser
405 410 415
51-y Ser Trp Ale Tyr Ale Ale Ala Lys Phe Thr Val Glu Glu ryr Asn
420 425 430
Gln Tyr Ser Phe Leu Leu Lys Leu .Asn Lys Ala Ile Arg Leu Ser •Arg
433 440 445
Ala Thr Clu Leu Ser Pro Thr Ile Leu Glu Gly Ile Vel Arg Ser Val
450 455 460
Asn Leu Gln Lau Asp Ile Asn Thr Asp Vel Leu Cly Lys Val Phe Leu
465 470 475 480
Thr Lys Tyr Tyr Met Gln Arg Tyr Ale Ile His Ala Clu Thr Ala Leu
485 490 495
Ile Leu Cys Asn Ala Pro Ile Ser Gln Arg Ser Tyr Asp Asn Gin Pro
500 505 510
Ser Gln Phe Asp Arg Lau Phe Asn Thr Pro Leu Leu Asn Gly Gln Tyr
515 520 525
Phe Ser Thr Cly Asp Glu Glu He Asp Leu Asn Ser Cly Ser Thr Gly
530 535 540
Asp Trp Arg Lys Thr Ile Leu Lys Arg Ale Phe Asn Ile Asp Asp Val
545 550 555 560
Ser Lau Phe Arg Leu Lau Lys He Thr Asp His Asp Asn Lys Asp Cly
565 570 575
Lys Ile Lys Asn Asn Leu Lys Asn Leu Ser Asn Leu Tyr Ile Gly Lys
580 585 590
Leu Lau Ale Asp Ile His Gln Leu Thr Ile Asp Clu Leu Asp Leu Leu
595 600 605
Leu Ile Ala Vel Cly Glu Gly Lys Thr Asn Leu Sec Ala Ile Ser Asp
610 615 620
Lys Gln Leu Ale Thr Leu Ile Arg Lys Leu Asn Thr Ile Thr Ser Trp
625 630 535 640
Leu His Thr Gin Lys Trp Ser Vel Phe Cln Leu Phe Ile Mec Thr Ser
645 650 655
Thr Ser Tyr Asn Lys Thr Leu Thr Pro Glu Ile Lys Asn Leu Leu Asp
660 665 670
Thr Val Tyr His cly Leu cln Cly Phe Asp Lys Asp Lys Ale Asp Leu
675 680 685
Leu His Val Met Ale Pro Tyr Ile Ala Ale Thr Leu Gln Leu Ser Ser
690 695 700
Clu Asn Val Ala His Ser VAl Leu Leu Trp Ala Asp Lys Leu Gln Pro
705 710 715 720
cly Asp Gly Ale Met Thr Ala Glu Lys Phe Trp Asp Trp Leu Asn Thr
725 730 735
Lys Tyr Thr pro Gly Ser Ser Clu Ala val Glu Thr Gln Glu His Ile
740 745 750
186 242
155
Val Gln Tyr Cys 735 Gln Ala Leu Ala 760 Gln Leu Mac Val 765 Tyr His Ser
Thr Gly Ile Asn Glu Asn Ala Phe Arg Leu Phe Val Thr Lys Pro Glu
770 775 780
Met Phe Gly Ala Ala Thr Gly Ala Ala Pro Ala His Asp Ala Leu Ser
735 790 795 300
Leu Ile Mec Leu Thr Arg Phe Ala Asp Trp Val Asn Ala Leu Gly Glu
305 310 3l5
Lys Ala Ser Ser Val Leu Ala Ala Phe Glu Ala Asn Ser Leu Thr Ala
320 325 330
Glu Gln Leu Ala Asp Ala Met Asn Leu Aso Ala Asn Leu Lau Leu Gln
335 340 345
Ala Ser Ile Gln Ala Gln Asn His Gln His Leu Pro Pro Val Thr Pro
850 855 860
Glu Asn Ala Phe Ser Gys Trp Thr Ser Ile Asn Thr Ile Leu Gln Trp
365 370 375 330
Val Asn Val Ala Gln Gln Leu Asn Val Ala Pro Gln Gly Val Ser Ala
385 890 395
Leu Val Gly Leu Asp Tyr Ile Gln Ser Met Lys Glu Thr Pro Thr Tyr
900 905 910
Ala Gln Trp Glu Asn Ala Ala Gly Val Leu Thr Ala Gly Lau Asn Ser
915 920 925
Gln Gln Ala Asn Thr Leu His Ala Phe Leu Asp Glu Ser Arg Ser Ala
930 935 940
Ala Leu Ser Thr Tyr Tyr Ile Arg Gln val Ala Lys Ala Ala Ala Ala
945 950 955 960
Ile Lys Ser Arg Asp Asp Lau Tyr Gln Tyr Leu Leu Ile Asp Asn Gln
965 970 975
Val ser Ala Ala Ile Lys Thr Thr Arg Ile Ala Glu Ala Ile Ala Ser
980 935 990
Ile Gln Leu Tyr Val Asn Arg Ala Leu Glu Asn Val Glu Glu Asn Ala
995 1000 1005
Asn Ser Gly Val Ile Ser Arg Gln Phe Phe Ile Asp Trp Asp Lys Tyr
1010 1012 1020
Asn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Gln Leu Val Tyr Tyr
1025 1030 1035 1040
Pro Glu Asn Tyr Ile Asp Pro Thr Met Arg Ile Gly Gln Thr Met
1045 1050 1055
Met Asp Ala Leu Leu Gln ser Val Ser Gln Ser Gln Leu Asn Ala Asp
1060 1065 107C
Thr Val Glu Asp Ala Phe Met Ser Tyr Lau Thr Ser Phe Glu Gln Val
1075 1080 1085
Ala Asn Leu Lys Val Ile Ser Ala Tyr His Asp Asn Ile Asn Asn Asp
1090 1095 1100
Gln Gly Leu Thr Tyr Phe Ile Gly Lau Ser Glu Thr Asp Ala Gly Glu
1105 1110 1115 1120
Tyr Tyr Tro Aro Ser Val Asp His Ser Lys Phe Asn Asp Gly Lys Phe
1125 1130 113 5
156
186 242
Ula Ula Asn Ula Trp 1140 Ser Clu Trp His Lys 1145 Ha Usp cys Pro He 115 0 Asn
Pro Tyr Lys Ser Thr ii· Urg Pro Val Ile Tyr Lys Ser Arg lsu Tyr
1155 11ó0 1165
Leu Leu Trp Leu Clu Cln Lys Clu Ile Thr Lys Cln Thr Cly Usn Ser
1170 1175 1130
Lys Usp Cly Tyr Cln Thr Clu Thr Asp Tyr Urg Tyr Clu Lau Lys Leu
1185 1190 1195 1200
Ula His Ila Arg Tyr Usp Cly Thr Trp usn Thr Pro ii· Thr Phe Asp
1205 1210 1213
Val Usn Lys Lys Ile Ser Glu Leu Lys Leu Clu Lys Asn Arg Ala Pro
1220 1225 1230
Cly Leu Tyr cys Ula Cly Tyr Cln Cly Clu Asp Thr Leu Lau Val Mec
1235 1240 1245
Phe Tyr Usn Cln Cln Usp Thr Lsu Usp ser Tyr Lys Usn Ala Ser Mec
1250 1255 1260
Gln Cly Leu Tyr Ile Phe Ula usp Mat Ala Ser Lys Usp mcc Thr Pro
1265 1270 1275 1280
Clu Cln Ser Asn Val Tyr Arg Asp Asn Ser Tyr Cln Cln Phe Usp Thr
1285 1290 1295
Asn Asn Val Arg Urg Val Asn Asn Arg Tyr Ala Clu Usp Tyr Clu Ha
1300 1305 1310
Pro Ser Ser Val Ser Ser Arg Lys usp Tyr Cly Trp Cly Asp Tyr Tyr
1315 1320 1325
Leu Ser Met Val Tyr Usn Gly Usp Ile Pro Thr Hle Asn Tyr Lys Ala
1330 1335 1340
Ala Ser Ser Asp Leu Lys Ile Tyr Ile ser Pro Lys Leu Arg Hle Hle
1345 1J50 1355 1360
His Usn Cly Tyr Clu Cly Cln Lys Arg Asn Cln Cys Asn Leu Met Asn
1365 1370 1375
Lys Tyr Cly Lys Leu Cly Asp Lys Phe Ile Val Tyr Thr ser Leu Cly
1380 1385 1390
val Usn Pro Asn Usn Ser Ser Usn Lys Leu Mat Phe Tyr Pro Val Tyr
1395 1400 1405
Cln . Tyr . Ser Cly Asn Thr Ser Cly Leu Asn Gln Gly Urg Leu Lau Phe
1410 1415 1420
His Urg Usp Thr Thr Tyr Pro Ser Lys Val Clu Ala Trp Ila Pro Cly
1425 1430 1435 1440
Ala Lys ura Ser Leu Thr Asn Cln Asn Ala Ula Ile Cly Usp Usp Tyr
1445 1450 1455
Ala Thr Usp Ser Leu Asn Lys Pro Asp Asp Leu Lys Cln Tyr He Pha
1460 1465 1470
Met Thr Usp Ser Lys Gly Thr Ula Thr Asp Val Ser Cly Pro Val Clu
1475 1480 1485
Ile lsn Thr Ula Ile Ser Pro Ula Lys Val Cln Ile Ile Val Lys Ula
1490 1495 1500
Cly Cly Lys Clu Cln Thr Phe Thr Ula Usp Lys Usp Val Ser Ile Cln
186 242
157
1565 1510 1515 1520
Pro Ser Pro Jer Phe Asp Clu Mer Asn Tyr Gln Pha Asn Ala Lau Glu
1525 1530 1535
Ile Asp Cly Ser Gly Lau Asn Phe Ile Asn Asn Ser A.la Ser Ile Asp
1540 154? 1550
'.'al Thr Phe Thr Ala Phe Ala Glu Asp Gly Arg Lys Leu Gly T/r Glu
1555 1560 1565
Sec Phe Ser Ila Pro 7al Thr Leu L/s Tal Ser Thr ASS Asn Ala Leu
x573 1575 1580
Thr Leu His His Asn Glu Asn Gly Ala Gln Τ'- Mec cln Trp Gln Ser
1535 1590 1595 1600
T/r Arg Thr Arg Leu Asn Thr Leu Phe Ala Arg Gln Leu Vai Ala Arg
1605 1610 1615
Ala Thr Thr Gly Ile Asp Thr Ile Leu Sar Met Glu Thr Gln Asn Ile
1620 1625 1630
Cln Glu Pro Gln Leu Gly Lys Gly Phe Tyr Ala Thr Phe Val Ile Pro
1635 1640 1645
Pro T/r Asn Leu Ser Thr His Gly Asp Glu Arg Trp Phe Lys Leu T/r
1550 1655 1660
Ile L/s His Vai ’/ai Asp Asn Asn Ser His rie Ile T/r Ser Cly Cln
1665 1670 1675 1630
Leu Thr Asp Thr Asn Ile Asn Ile Thr Leu Phe Ile Pro Leu Asp Asp
1685 1690 1695
Val Pro Leu Asn Gln Asp Tyr His Ala Lys Val Tyr Mec Thr Phe Lys
1700 1705 1710
L/s Ser Pro Ser Asp Gly Thr Trp Trp Cly Pro His Phe val Arg Asp
1715 1720 1725
Asp L/s Gly Ile Val Thr Ile Asn Pro Lys Ser Ile Leu Thr His Phe
1730 1735 1740
Glu Ser Val Asn Val Leu Asn Asn Ile Ser Ser Glu Pro Mec Asp Phe
1745 1750 1755 1760
Ser Gly Ala Asn Ser Leu T/r Phe Trp Glu Leu Phe T/r T/r Thr Pro
1765 1770 1775
Met Leu Vai Ala Gln Arg Leu Leu His Glu Gin Asn Phe Asp Glu Ala
1780 1785 1790
Asn Arg Trp Leu Lys Tyr Val Trp Ser Pro Ser Gly Tyr Ile vai His
17 ?5 1800 1305
Gly Gln Ile Gln Asn Tyr Gln Trp Asn val Arg Pro Leu Leu Glu Asp
1310 1815 1320
Thr ser Trp Asn Ser Asp Pro Leu Asp ser Val Asp Pro Asp Ala Val
1325 1830 1335 1340
Ala cln His Asp Pro Mec His T/r Lys val ser Thr Phe Mec Arg Thr
184S 1350 1855
Leu Asp Leu Leu Ile Ala Arg Gly Asp His Aia Tyr Arg Gln Leu Glu
1860 1365 1870
Arg Asp Thr Leu Asn Glu Ala Lys Mec Trp T/r Mec Gln Ala Leu His
1375 1880 1335
158
186 242
Leu Uy ig30 Asp Lys Pro Tyr Leu 1395 Pro Leu Ser Thr Thr 1900 Trp Ser Asp
Pro Arg Leu Asp Arg Ala Ale Asp Ile Thr Thr Tln Asn Ala His Asp
1905 1910 191: 1920
Ser Ala Ile Val Ala Leu Arc Tln Asn Ile Pro Thr Pro Ala Pro Leu
1925 1930 3 1935
Ser Leu Arg Ser A La Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln Ile
1940 1945 1950
Asn Glu Val Met Met Asn Tyr Trp Cln Thr Leu Ala Gln Arg Val Tyr
1955 1960 1965
Asn Leu Arg His Asn Leu Ser Ile Asp Cly Gln Pro Leu Tyr Leu Pro
1970 1975 1980
Ele Tyr .Ala Thr Pro Ala Asp Pro Lys Ale Leu Leu Ser Ala Ala VAl
1985 1990 1995 2000
Ala Thr Ser Gln Cly Gly Cly Lys Leu Pro Clu Ser Phe Met ser Leu
2005 2010 2015
Trp Arg Phe Pro His Met Leu clu Asn Ale Arg Gly Met Val Ser cm
2020 2025 2030
Leu rhr Glu Phe Oly Ser Thr Leu cln Asn Ile Ile Glu Arg Gln Asp
2035 2040 2045
Ale Clu Ale Leu Asn Ala Leu Leu Gln Asn Cln Ala Ala Glu Leu Ile
2050 2055 2060
Leu Thr Asn Leu Ser Ile Gln Asp Lys Thr Ile Glu Glu Leu Asp Ala
2065 2070 2075 2080
Glu Lys Thr Vel Leu Clu Lys Ser Lys Ale Tly Ala Cln Ser Arg Phe
2085 2090 2095
Asp Ser Tyr Gly Lys Leu Tyr Asp Clu Asn Ile Asn Ala Cly Glu Asn
2100 2105 2110
Cln Ala Met Thr Leu Arg Ale Ser Ala Ala Gly Leu Thr Thr Ale VAl
2115 2120 2125
Cln Ala Ser Arg Leu Ale Gly Ale Ale AlA Asp Leu Vel Pro Asn Ile
2130 2135 2140
Phe Gly Phe Ale Gly Gly cly Ser Arg Trp Cly Ale Ile Ale Glu Ale
2145 2150 2155 2160
Thr Cly Tyr Vel Met Glu Phe Ser Ala Asn VAl Met Asn Thr Glu Ale
2165 2170 2175
Asp Lys Ile Ser Cln Ser Clu Thr Tyr Arg Arg Arg Arg Gln Clu Trp
2180 2185 2190
Clu Ile Gln Arg Asn Asn Ale Clu Ale Glu Leu Lys Gln Ile Asp Ale
2195 2200 2205
Cln Leu Lys Ser Leu Ala Val Arg Arg Glu Ala Ala Val Leu Gln Lys
2210 2215 2220
Thr Ser Leu Lys Thr Cln Gln Glu cln Thr Cln Ser Gln Leu Ale Phe
2225 2230 2235 2240
Leu Cln Arg Lys Phe Ser Asn Gln Ala Leu Tyr Asn Trp Leu Arg Cly
2245 2250 2255
•Arg Leu Ala Ala Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ala Arg
2260 2265 2270
159
186 242
cys Leu Mec 227 Ala 5 Glu Gln Ala Tyr Arg 2230 Trp Glu Leu Asn Asp 2235 Asp Ser
Ala Arg Phe I la Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu
2290 2255 2300
Leu Ala Gly Glu Thr Lau Mec Leu Ser Leu Ala Gln Mec Glu Asp Ala
230 c 2310 2315 2320
His Leu Lys Arg -Asp Lys Arg Ala Leu Glu Val Glu Arg Thr Val Ser
2325 2330 2335
Leu Ala Giu Val Tyr Ala Gly Lau Pro Lys Asp Asn Gly Pro Phe Ser
2340 2345 2350
Leu Ala Gln Glu Ile Asp Lys Leu Val Ser Gln Gly Ser Gly Ser Ala
2355 2360 2365
Gly Ser Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr Lys
2370 2375 2380
Thr Ser Leu Gln Ala Sar Val Ser Phe Ala Asp Lau Lys Ile Arg Glu
23Θ5 2390 2395 240ę
Asp Tyr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile Sar
2405 2410 2415
Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ha
2420 2425 2430
Leu Ser Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala Leu
2435 2440 2445
Ala Val Ser His Gly Mec Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe
2450 2455 2460
Asn Asp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln Gly
2465 2470 2475 2480
Thr Leu Thr Leu Ser Phe Pro Asn Ala Ser Mec Pro Glu Lys Gly Lys
2485 2490 2495
GlM Ala Thr Mac Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile Arg
2500 2505 2510
Tyr Thr Ile Lys
2516
( 2 ) Dane dla sekwencji SEK NR ID: 48;
(i) Charakterystyka sekwencji:
( A ) Długość: 5547 par zasad ( B ) Typ: kwas nukleinowy ( C ) Rodzaj nici: podwójna ( D ) Topologia: liniowa (ii) Typ cząsteczki: DNA ( genomowa ) ( xi) Opis sekwencji: SEK NR ID: 48 (TcdAii obszar kodowania);
CTG lSu t ATA Ile GGC Gly TAT Tyr AAC Asn 5 •AAT Asn CAA Gln TTT Phe AGC Ser GGT Gly 10 AGA GCC AGT Ser CAA Gln TAT Tyr 15 GTT Val 48
Arg Ala
GCC CCG GGT ACC GTT TCT TCC ATG TTC TCC CCC GCC GCT TAT TTC ACT 9 6
Aia Pro Gly Thr 20 Val Sar Ser Mec Phe 25 Ser Pro Ala Ala Tyr 30 Leu Thr
160
186 242
TTA Alu AAA Leu TTT Ayr 35 Trg T.-uA Tłu taT Tia — Grg GGA Asn 40 TAT LeU ATA His TAC Tla GTA TCA Gsp 45 AAA Ser TCA Val TAT Ayr Hi
TTA ACG TTC TAA ATA TTT ATA <— k 'm. GGG TAA CTT TAT ACA TTA CAG 19 2
Ayr Leu 50 Asp Chr Grg Grg Pro 55 Asp Leu Lys Ser Mec 60 Gla Leu Ser A i n
—aa TCC TCT TTC CCT TCC TAC AAA TAC CAA TCT CAA GAA TG.T i 240
Tln o 5 Tsn Mec Asp Iie Alu 10 Leu Ser Ahr Leu ser 75 Leu Ser Tsn Tlu Leu 3 A
ACT TAG TAT TTA CAA / / / .-ΧΛΛ TAA TAT TCT ATT ATA TTG •AGA CCA CAC ΛΛΛ 233
Leu Leu Alu Ser Ile 85 Lys Ahr Alu Ser Lys 90 Leu Tlu Tsn Tyr Chr 95 L'y 3
TTT TCT TTC TTT AAA CAA CAC TTC ATA AAC CAA TTC TAC GAT AAA TTC 3 3 5
Val Mec TIu Mec 100 Leu Ser Chr Phe Grg 105 Pro Ser Tly Gla Chr 110 Pro Ayr
ATA TCA TAA CCC TTA CCC TAA ATA TTA TTA TAC ACT ACC AAG TCC AAC 334
His Asp Tla 115 Ayr Alu Gsn v-i Grg 120 Tlu Val Ile Tin Leu 125 Tln Asp Pro
Tac AAA TTT AAC AAA GGT GAG CAC AAT AAG CTA TAA TAT TAT TCT GAT Χ-Λ 1 432
Tly Leu 130 TIu Tin Leu Tsn Gla 135 Ser Pro Ala Ile Tla 140 Tly Leu Met His
ATC TAC CAA ACA TAT ATA TAA TCA TAA TCG CCA AAT AAC TGT AAA TAA 480
Tin 145 Tia Ser Leu Leu Tly 150 Ile Asn Gla Ser Ile 155 Ser Pro Tlu Leu Phe 160
TAC TCA AAT CAT TCT TCG ATA CAA TGA TAA ATA TCC TGT TCG AAA CTA 528
Tsn Ile Leu Chr TIu 165 Tlu Ile Chr Tlu Tly 170 Gsn Gla Tlu Tlu Leu 175 Ayr
TCT tan CTC TAA TGA CCA GAC TCC AAT TCA AAC TAT TAC CAG AAT TGT 57 6
Lys Lys A.sn Phe 180 Tly ten Ile Tlu Pro 185 Cla Ser Leu Cla Mec 190 Pro Alu
TTA A AAł Lii CTC ATA ACA ATA GAC TAC GTA TGC TGC TGA ACA CTA ACT T/T 624
Ayr Leu Lys 195 Grg Ayr Ayr Tsn Leu 200 Ser Asp Tlu Tlu Leu 205 Ser Tln Phe
TTC TTA CCC TAA CGA GGA TAA GGT ACG ACT TGC ACC TTA AGA TAA ACC 672
Ile Tly 210 Lys Cla Ser ten Phe 215 Tly Tin Tin Tlu Ayr 220 Ser Gsn G:n Tln
ATA CAA CAA AAT TAC TAA GGA TTC CTA TTC TTC GAT TCA TAG TAC CCC 720
Lau 225 Ile Chr Pro Val Vsl 230 Gsn Ser Ser Asp Tly 235 Ahr Val Lys Val Ayr 240
CTG TAA TCA ATA TCA TCA GCG CAA GGA TAA AGA CGG CCT TCA TCG TCT 768
Trg Ile Chr Grg Alu 245 Tyr Thr Ahr Tsn Ala 250 Ayr Tin Mec Asp Val 255 Tlu
CCC TAA AAA TAA ATT TGA TCT CCA CCA ATG TAT TGA ACC AGT TAA TAC 315
Leu Phe Pro Phe 260 Tly Tly Tlu Tsn Tyr 265 Grg Leu Gsp Ayr Lys 270 Phe Lys
.ngc TAA CTC AGA TAA TAA CGA TAT AAA CCA ATT TAG GTA TGA TGG CAT 364
Tsn Phe Ayr 275 Tsn Cla Ser Tyr Leu 280 Ser Ile Lys Leu Tsn 285 Gsp Lys Grg
>τ/.·λ«Λ TAA ATC TCA TTA TTA TAA AAA ATA TAA ATA CCG TCG AAA AAA 912
A .Lu Leu 290 V.al Trg Chr Tlu Tly 295 Tla Pro Tin Vsl Gsn 300 Ile Alu Ayr Ser
TAT gna TCA TAT TAT TCA TAA AA f-D i TTC TTA CTA ATA AAC TTG TTC 9 60
Tl a Tsn Ile Thr Leu Tsn Thr Ala Asp 11 s Ser Tln Pro Phe Tlu Ile
186 242
161
05
L0
20
Gly CTC Leu ACA Thr CGA Arg GTA Va l 325 CTT Leu CCT Pro TCC Ser GGT Gly TCT Ser 330 TGG Trp GCA Ala TAT Tyr GCC Ala GCC Aia 335 Ala 1003
AAA TTT 1 ACC GTT GAA GAG TAT AAC CAA TAC TCT TTT CTG CTA AAA CTT 1056
Lys Phe Thr Vai 340 Glu Glu T/r Asn Gln 345 Tyr Ser Phe Lau Leu 350 Lys Leu
AAC AAG GCT ATT CGT CTA TCA CGT GCG ACA GAA TTG TCA CCC aCG ATT 1104
Asn Lys Ala 355 Ile .Arg Leu Ser Arg 350 Ala Thr Glu Leu Ser 365 Pro Thr Ile
CTC GAA GGC ATT GTG CGC AGT GTT AAT CTA CAA CTG GAT ATC AAC ACA i i 5 2
Leu Glu 370 Gly Iie Val Arg Ser 375 Val Asn Leu Gln Leu 3ao Asp Ile .Asn Thr
GAC GTA TTA GGT AAA GTT TTT CTG ACT AAA TAT TAT ATG CAG CGT TAT 1200
Asp 385 Val Leu Gly Lys Val 390 Phe Leu Thr Lys Tyr 395 Tyr Mec Gin Arg Tyr 400
GCT ATT CAT GCT GAA ACT GCC CTG ATA CTA TGC AAC GCG CCT ATT TCA 1248
Ala Ile His Aia Glu 405 Thr Ala Leu Ile Leu 410 cys Asn Ala Pro Ile 415 Ser
CAA CGT TCA TAT GAT AAT CAA CCT AGC CAA TTT GAT CGC CTG TTT AAT 1296
Gln Arg Ser Tvr 420 Asp Asn Gln Pro Ser 425 Gln Phe Asp Arg Leu 430 Phe Asn
ACG CCA TTA CTG AAC gGA CAA TAT TTT TCT ACC GGC GAT GAG GAG ATT 1344
Thr Pro Leu 435 Leu Asn Gly Gin Tyr 440 Phe Ser Thr Gly Asp 445 Glu Glu Ile
GAT TTA AAT TCA GGT AGC ACC GGC GAT TGG CGA AAA ACC ATA CTT AAG 1392
-Asp Leu 450 Asn Ser Gly Ser Thr 455 Gly tep Trp Arg Lys 460 Thr Ile Leu Lys
CGT GCA TTT AAT ATT GAT GAT GTC TCG CTC TTC CGC CTG CTT AAA ATT 1440
Arg 4 85 Ala. Phe Asn Ile Asp 470 Asp Val Ser Leu Phe 475 Arg Leu Lau Lys Ile 480
ACC GAC CAT GAT AAT AAA GAT GGA AAA ATT AAA AAT .AAC CTA AAG AAT 1488
Thr Asp His tep Asn 485 Lys Asp Gly Lys Ile 490 Lys Asn ten Leu Lys 495 .Asn
CTT TCC AAT TTA TAT ATT GGA AAA TTA CTG GCA GAT ATT CAT CAA TTA 1536
Leu Ser Asn Leu 500 Tyr Ile Gly Lys Leu 505 Leu Ala Asp Ile His 510 Gln Leu
ACC ATT GAT GAA CTG GAT TTA TTA CTG ATT GCC GTA GGT GAA GGA AAA 1584
Thr Ile Asp 515 Clu Leu Asp Leu Lau 520 Leu Ile Ala Val Gly 525 Glu Gly Lys
ACT AAT TTA TCC GCT ATC AGT GAT AAG CAA TTG GCT ACC CTG ATC AGA 1632
Thr Asn 530 Leu Ser Ala Ile Ser 535 Asp Lys Gln Leu Ala 540 Thr Leu Ile Arg
AAA CTC .AAT ACT ATT ACC AGC TGG CTA CAT ACA CAG AAG TGG AGT GTA 1680
Lys 545 Lau Asn Thr Ile Thr 550 Ser Trp Leu His Thr 555 Gln Lys Trp Ser Val 560
ttc CAG CTA TTT ATC ATG ACC TCC ACC AGC TAT AAC AAA ACG CTA ACG 1728
?he Gln Leu Phe Ile Mec Thr Ser Thr Ser Tyr Asn Lys Thr Leu Thr
565 570 575
CCT GAA ATT AAG AAT TTG CTG u AT ACC GTC TAC CAC GGT TTA CAA GGT 1/76
Pro Glu Ile Lys 580 Asn Leu Leu Asp Thr 585 Val Tyr His Gly Leu 590 Gln Gly
TTT gAT AAA GAC AAA GCA GAT TTG CTA CAT GTc ATG GCG CCC TAT ATT 1324
162
186 242
Phe Asp Lys 252 .Asp Lys Tla Asp Leu 6 00 Leu His Vsl Met Tla 60 5 Pro Tyr Ile
GCG GCC TCC TTG c.-A —A * . GAT ATT GTC OG ·— CTC TCG GTT CTC 3~2
Tla Ala 6 10 Thr Lau Gln Leu Ser 615 5er Glu Tsn Vsl Tla 620 His ser Vsl Leu
3 77 TG. GCT GTT A-.G TTT CTG CCC gog GAG ioy GCT ATG TCT GG Λ GTT 1.520
Leu Trp Tla Tsp Lys Leu 6 3 0 G Ln Pro Gly Tsp Gly 63 5 Ala Met Thr Tla G l u 6 4 0
A-A TTC TGG GTC TGG TTG .ATT TCT ATG TTT k Λ i CCG GGT TCT TCG GAT 3ÓD
— 4 ·=> Phe Trp Tsp Trp 64 5 Leu Tsn Thr Lys Tyr 650 Thr Pro Gly Ser Ser 62 2 Glu
077 GTT GTT tCg CTG GAT CTT TTC GTT CTG TTT TGT CTG GCT CTG 'ggT 2016
Ala Cal Glu Thr 660 Gln Glu His Ile Cal 6 55 Gln Tyr Cys Gln Aia 67 0 Leu Tla
( .“-“V TTG GTT TTG GTT TTC CTT TCC TCC Gcg TTC TTC GTT ATC .CC TTC 2064
. In. Leu Glu 575 Mec Vsl Tyr His Ser 630 Thr Giy Ile Tsn Glu 535 Tsn Tla Phe
777 GTA -rvp»T GTG TcT AAT CCT GTG TTG TTT GGG GCT GCT TCT GGT GCT 2112
Trg Leu 6 9 0 Phe Vsl Thr Lys Pro 595 Glu Met Phe Gly Tla 700 Tla Thr Gly Tla
UL kj (CC GCG CTT GTT GCC CTT TCT CTG TTT TTG CTG TCT CGT TTT G( LJ 2160
Tia 7 05 Pro Ala His Tsp Ala 710 Leu Ser Leu Ile Met 715 Leu Thr Arg Phe .Ala 720
gtT TGG GTG ATC GcT CTT LAJU GAT AAT GCG TCC TCG GTG CTT GCG GCT 2203
Tsp Trp V<sl Tsn Tla 725 Leu Gly Glu Lys Tla 730 Ser Ser Val Leu Ala 73 5 Tia
TTT GAT GCT TTC TCG TTT TCG GCT GTT CTT CTG GCT GTT GCC TTG ATT 2256
?he Glu Tla Tsn 740 Ser Leu Thr Tla Glu 745 Gln Leu Tla Tsp Tla 750 Met Tsn
(T) GTT GCT ATT TTG CTG TTG CTT GCC TGT ATT CTA GCT CTT ATT CTT 2304
Leu Tsp Tla 755 Tsn Leu Leu Leu Gln 760 Tla Ser Ile Gln Ala 765 Gln ton His
CTT CTT CTT CCC CCT GTT TCT CCT GTT AAT GCG TTC TCC TGT TGG TCT 2352
Gin His 770 Leu Pro Pro Val Thr 775 Pro Glu Tsn -Tla Phe 730 Ser Cys Trp Thr
TCT TTC ATT TCT TTC CTG CAT TGG GTT ATT GTC GCA CAT CTA TTG TTT 2400
Ser 735 Ile· -Tsn Thr Ile Leu 790 Gln Trp Val Tsn Vsl 795 Tla Gln Gln Leu Asn 800
CTC GCC CCT CTG GGC GTT TCC GCT TTG GTC GGG CTG GTT TTT TTT CTT 2443
Cal Tla Pro Gln Gly 805 Vsl Ser Tla Leu Val 810 Gly Leu top Tyr Ile 315 Gln
ta TTG AAT GTG TCT CCG TCC TTT GCC CTG TGG GAT ATC GCG GCT CGC 2496
Ser Mec Lys Glu 820 Thr Pro Thr Tyr Ala 825 Gln Trp Glu ton Tla 830 Tla Gly
G 1 Λ TTT TCC G cg GGG kj(Jd TTG ATT TCT CTA CTG GCT ATT TCT TTT CTC GCT 2544
Cal Leu Thr 335 Tla Gly Leu Tsn Ser 340 Gin Gin Tla Tsn Thr 345 Leu His Ala
TTT » (tG GTT GTT TCT CGC TGT GCC GCT TTT TGC TCC TTC TTT A TC I K ( G 1 2592
Phe Leu 350 Tsp Glu Ser -Arg Ser 855 Ala Tla Leu Ser Thr 360 Tyr TS , V Ile -Arg
'12. GCG G ~ C( — ATG GC.T Lj((» GGG GCT ATT TGC CGT GTT GTC TTG 8 80 .A 4 2640»
Gln vSl Ala Lys Tl a Tla 8A Tla .Ala i le Lys Ser 375 .Arg .Asp Tsp Leu Tyr 330
186 242
163
Gln Cyr TCC Ltu CCC Ltu CCT I x a 835 GCC Asp A_Ah Csn * AG Gin GCT /al CCC □ 890 GMG Cla GCC CIi ACC Ile L/T CCC eep 8-95 CCC 213 8 cep
CCG CCC GGC GAA CCC ACT CCC AGT CCT CCA CTC CAC GTC CAC GGg CGC 2“35
Crg Ile Ala Glu 900 Cla Il®. CIi Sap Ilt 905 Gin Ltu Tyr /al Csn 910 Arg Cla
CTC GAT .CCT GTC CCA GAT TAC GGC CAT CCG gGg CTC CCC CCC CCC CAT 1 “ 3 -1’
L.t?u Clu Csn 515 /al Clu Glu Asn Cla 920 Csn Sap Gly /al Ilt 92.5 Crg CnH
CTC CTT CCG CAG CGG GCC CAA TAC CAC AAA CGG TAC CGG CGT CCG CGC 2332
re® re® 930 Ilt Csp Crp Csp L/T 935 Cyr Csn L/s crg Typ 940 Sar cer Crp Ala
CGC GTT CCT CTC CTC CCT CAC CAC CCG GAA CAG TAC CCT CCC GCC CCC 2 880
Cl/ 945 /al Ser Cln Ltu /al 950 Cyr Tyr rro Glu Asn 955 Typ Ile Csp rpo eer 960
CCG CCT ACG CGA CAT CCC AAA CCC CCC GCC GGA CTA CCC CAC CCC CTG 2928
Mac Arg Ilt Gly Cln eer Lys Mec Mec Asp CIi Lau Ltu Cln Stp /al
965 970 575
CCC Sep GAT CGC CAT CTA ACC CCC CCT CCC eer 985 CCC GCA /al Glu GAC Asp CGC Cla CCT re® 990 A TC Λ * G Muc CCC Str 2 976
Gin Ser Gln 980 Leu Csn Cla Csp
CAC CTG CCA TCC CTT GCA CCA GCG CGC CAC GTT TAA GCT CCT ACC GM Λ 3024
Cyr Ltu Ter Sep re® Clu Cln /al Cla Asn Leu Lys /al Ila Sap Ala
995 1000 1005
CCC CAG GAT CAT ACT TAC AAG GAT CAA GGG GTG ACG CAC TCT CCC GGA 3072
T/r Hss Csp Asn Ile Csn Csn Csp Gln Gl/ Leu Ter Tyr re® Ila Gly
1010 1015 1020
CTG AGT GAA CGT CAC CGC GGC CTA TAT TAC TGG GCG ACT CTC CAT CAC 3 120
Ltu Ser Clu eer Csp Cla Cly Clu Cyr Tyr Tpp Arg Str /al Csp Hst
1025 1030 1035 1040
CCT TAC CTC TCG GAG CGT AAA CTG GCG GCT AAT GCC CGG CGT GAT CGC 3168
StP Lys ree Asn Csp Cl/ Lys re® Ala Ala Asn Ala Crp Sar Clu Crp
1045 1050 1055
CAT CAA CTT GAT CCT CCA CCT TAC CCT CAC ACT AGG ACT CCC CGC GCA 3216
Hss Lys Ile Asp Cys rpo Ila Csn rro Tyr Lys Sep cer Ile Arg rpo
1060 1065 1070
CTG CTA CTT CTA CCG CCC CCC CAC CCG CTG TGG CTC GAA CAA CAG GAG 3264
/al Ile Typ Lys Sep Apg Ltu Cyr Leu Lau Trp Leu Clu Cin Lys c lu
1075 1080 1085
CTG CGG CAA GAG CGA CCA TAC CCT CAA CAC GGC CAT CCA CCT CAA AGG 33 12
Ilt eep L/s Gln eer Cl/ Asn Ser Lys Csp Gly Tyr Cln eer Clu eer
1090 1095 1100
CAT CAT CCT CAT CCA CCC CAA CCG CCG CCC ATG CGC CCC GAT CGC ACT 3 360
Csp Tyr Arg Cyr Glu Lau Lys Lau Ala Hst Ile Arg Cyr Csp Cly eer
1105 1110 1115 1120
CGG ATT ACC GGA ATC CCC CTT CAC CCC CAC Aaa AAA ACA CCG GAG CTA 3408
ypp Csn Ter rro Ila cer re® Csp /al Csn Lys Lys Ilt Sar Clu Ltu
1125 1130 1135
ATT CTG GAA .TAA CAC AGA GCG CCC GGA CCC TAT CGT CCG CGT CAC CAA 2 456
Lys Leu Glu L/s Asn Arg Cla Pro Gly Lau Tyr C/s Tla Gly Tyr Gln
1140 1145 1150
gGT GAA GAT CGC CTG CCC GTG CCC CCC CAC GAA CAA GCG ACA CTA. 3504
Giy Clu Asp cep Ltu Leu /al Mac re® Typ csn Cln Cin Csp eer Lau
1155 1160 1165
164
186 242
» 't' ^»Λ X Asp ' ACT TAT Ser Tyr 1170 ’ UAU Lys . AAC Usn CCT Ala TCA Sar 117 ATC Mcc 5 cuu Cln CcU Cly CTA Lau TAT ATC Tyr ile 1130 TTT Phe CCT Ala CAT Asp 3552
ATC CCA TCC AAA CAT ATC ACC CCA CAA CAC AGC AUT CTT TAT CCC CAT 3600
Mcc Ala Sar 1135 Lys Asp Mcc Thr 1190 Pro Clu Cln Ser Usn Val 1195 Tyr Arg Asp 1200
UAT UGC TAT CAA CAA TTT GAT ACC A A T .-.Ί4 UAT CTC aCU UCA CTC AAT UAC 3 648
Asn Sar Tyr Cln Cln Ph· 1205 Asp Thr Asn Asn Val 1210 Arg .Urg Val Asn Asn 1215
CCC TAT CCA GAC CAT TAT CAG ATT CCT TCC TCC CTA AGT ACC CCT AAA 3 096
Arg Tyr Ala Clu Asp 1220 Tyr Clu Ila Pro Sar 1225 Ser Val Ser Ser Arg 1230 Lys
CAC TAT CGT TCG CGA CAT TAT TAC CTC AGC ATC CTA TUT AAC CGA GAT 3744
Asp Tyr Cly Trp 1235 Cly Asp Tyr Tyr Lau 1240 Ser Mcc Val Tyr Asn 1245 Cly Asp
ATT CCA ACT ATC AAT TAC UAA GCC GCA TCA AGT CAT TTA AUA ATC TAT 3792
ila Pro Thr 1250 Ila Asn Tyr Lys Ala 1255 Ala Sar Ser Asp Lau 1260 Lys Ile Tyr
ATC TCA CCA AAA TTA AGA ATT ATT CAT AUT GCA TAT GUU GGA CAC AAG 3840
Ila Ser Pro 1265 Lys Lau Arg Il· 1270 il· His Asn Gly Tyr Clu 1275 Cly Gln Lys 1280
CCC AAT CAA TGC AAT CTG ATG AUT AAA TAT CCC UUA CTA CCT CUT AAU 3333
Arg Asn Gln Cys Asn Leu 1285 Met Asn Lys Tyr Cly 1290 Lys Lcu Gly Asp Lys 1295
TTT ATT GTT TAT ACT AGC TTG GCC GTC AUT CCA UAT UAC TCC TCU AAT 3936
Phe Ile Val Tyr Thr 1300 Ser Leu Gly Val Asn 1305 Pro Asn Usn Ser Ser 1310 Asn
AAC CTC ATC TTT TAC CCC CTC TUT CAA TAT AGC GGU AAC ACC AGT GCA 3934
Lys Lau Mec 1315 Phe Tyr Pro Val Tyr Cln 1320 Tyr Ser Cly Asn Thr 1325 Ser Cly
CTC AAT CAA GCC AGA CTA CTU TTC CAC CCT CAC ACC ACT TAT CCA TCT 4032
Lau Asn Gln 1330 Gly Arg Leu Leu Ph· 1335 His Arg Asp Thr Thr 1340 Tyr Pro Ser
.AUA CTA GAA CCT TCC ATT CCT CCA GCA AAU CCT TCT CTA ACC AAC CAA 4080
Lys 1345 Val Glu Ala Trp Ile Pro 1350 Gly Ala Lys Arg 1355 Ser Leu Thr Asn Gln 1360
AAT GCC GCC ATT CCT GUT GAT TAT GCT ACA CAC TCT CTC AUT AAU CCC 4128
Asn Ala Ala Il· Cly 1365 Asp Asp Tyr Ala Thr 137C Asp 1 Ser Leu Asn Lys 1375 Pro
GAT CAT CTT UAC CAA TAT ATC TTT ATC ACT GAC ACT UUU CGC ACT GCT 4176
Asp Asp Leu' Lys 1380 Cln 1 Tyr Ile Phe Mec 1385 Thr Asp Ser Lys Cly Thr 13 90 Ala
ACT CAT CTC TCA CCC CCA GTU GAG ATT AAT ACT CCA ATT TCT CCA GCA 4224
Thr Asp Val 1395 Ser Cly Pro Val Clu 1400 Ila Asn Thr Ala il· 1405 Ser Pro Ala
AAA GTT CAG ATA ATA CTC AAA GCG CCT CCC AAG GAG CAA ACT TTT ACC 42~2
Lys Val Cln 1410 Il· Ile Val Lys 1415 Ala 1 Gly cly Lys Glu Gln 1420 Thr Ph· Thr
CCA CAT UAA GAT CTC TCC ATT CAC CCA TCA CCT ACC TTT CAT GAA ATC 4320
Ala 1425 Asp Lys Asp Val Ser 1430 Ile Cln Pro Sar Pro 1435 Sar Phe Asp Clu Met 1440
UAT TAT CAA TTT UAT CCC CTT GAA ATA CAC CGT TCT CGT CTG AAT TTT 4368
Usn Tyr Cln Pha Usn Ala Lau Clu ila Asp Cly Sar Cly Lau As n Pha
165
186 242
1445 1450 1455
ATT I le AAC Asn AAC .Asn TCA Ser 146 GGC Ala 0 AGT Ser ATT Ile GAT Asp GTT Val 146 AGT Thr 5 TTT Phe AGC Thr GCA Ala Ili Phe Ala 1470 GAG Glu 4416
CAT GCG CGG AAA CTG GGT TAT GAA AGT TTG AGT ATT GCT GTT AGC CTC 44 64
Asp Gly Arg Lys 1475 Leu Gly Tyr Glu Ser 1430 Phe Ser Ile Pro Val Thr 1435 Leu
.'„Λ'-) GTA AGT AGG GAT AAT GCC GTG AGC CTG -GAG CAT AAT GAA AAT ccT 4512
Lys Val Ser 1490 Thr Asp Asn Ala Leu 1495 Thr Leu His His Asn 1500 Glu Asn Gly
GCG CAA TAT ATG GAA TGG CAA TGC TAT GGT ACC CGG GTG .AAT ACT GTA 4560
Ala Gin 1505 Tyr Met Gln Trp Gln 1510 Ser Tyr Arg Thr Arg 1515 Leu Asn Thr Leu 1520
TTT GCC CGC CAG TTG GTT GGA CGG GGG AGC ACC GGA ATG GAT ACA ATT 4603
Phe Ala Arg Gln Leu Val 1525 Ala Arg Ala Thr Thr 1530 Gly Ile Asp Thr Ile 1535
GTG AGT ATG GAA ACT GAG AAT ATT CAG GAA CCG CAG TTA GGG AAA GGT 4656
Leu Ser Mec Glu Thr 1540 Gln Asn Ile Gln Glu 1545 Pro Gln Leu Gly Lys 1550 Gly
TTC TAT GGT AGG TTG GTG ATA GGT GGG TAT AAG CTA TGA AGT CAT GGT 4704
Phe Tyr Ala Thr 1555 Phe Val Ile Pro Pro 1560 Tyr Asn Leu Ser Thr His 1565 Gly
GAT GAA CGT TGG TTT AAG CTT TAT ATG AAA CAT GTT GTT GAT AAT AAT 4752
•Asp Glu Arg 1570 Trp Phe Lys Leu Tyr 1575 Ile Lys His Val Val 1530 Asp Asn Asn
TGA CAT ATT ATG TAT TCA ' GGG CAG GTA ACA GAT AGA AAT ATA AAG ATG 4300
Ser His 1535 Ile Ile Tyr Ser Gly 1590 Gln Leu Thr Asp Thr 1595 Asn Ile Asn Ile 1600
ACA TTA TTT ATT GCT CTT GAT GAT GTG CGA TTG AAT GAA GAT TAT GAG 4343
Thr Leu Phe Ile Pro Leu 1505 Asp Asp Val Pro Leu 1610 Asn Gln Asp Tyr His 1615
GCC AAG GTT TAT ATG AGG TTG AAG AAA TGA GCA TGA GAT GGT AGC TGG 4396
Ala Lys Val Tyr 1620 Mec 1 Thr Phe Lys Lys 1625 Ser Pro Ser Asp Gly Thr 163C Trp
TGG GGG CCT CAG TTT GTT AGA GAT GAT AAA GGA ATA GTA ACA ATA AAG 4944
Trp Gly Pro 1635 His Phe Val Arg Asp Asp 1640 Lys Gly Ile Val 1645 Thr Ile Asn
GGT AAA TGG ATT TTG AGC GAT TTT GAG AGG GTG AAT GTG CTG AAT AAT 4992
Pro Lys 1650 Ser 1 Ile Leu Thr His 1655 Phe Glu Ser Val Asn Val 1660 Leu Asn Asn
ATT AGT AGG GAA CGA ATG GAT TTG AGG GGC GCT AAG AGG CTG TAT TTG 5040
Ile 1665 Ser Ser Glu Pro Met 1670 Asp 1 Phe Ser Gly Ala 1675 Asn Ser Leu Tyr Phe 1630
TGG GAA GTG TTC TAG TAT ACC GCG ATG CTG GTT GGT CAA CGT TTG CTG 5033
Trp Glu Leu Phe Tyr 1635 Tyr Thr Pro Met Leu 1690 Val Ala Gln Arg Leu 1655 Leu
GAT GAA CAG AAG TTC GAT GAA GGC AAG GGT TGG CTG AAA TAT GTG TGG 5136
His Glu Gln Asn 1700 Phe Asp Glu Ala Asn 1705 Arg Trp Leu Lys Tyr Val 1710 Trp
AGT GGA TGG GGT TAT ATT GTC GAG GGG GAG ATT GAG AAC TAC CAG TGG 5134
Ser Pro Ser 1715 Gly Tyr Ile Val His 1720 Gly Gln Ile Gln Asn 1725 Tyr Gln Trp
AAC GTG
CGC CCG TTA CTG
GAC ACC AGT TGG AAG AGT GAT CCT TTC 5232
166
186 242
Asn Yal 173 Arg 0 Pro Lau Leu Glu 173' Asp Thr OcT Trp Asn Sgt 1740 Asp Pro Lau
<jAT TCC GTC GAT CCT GAC GCG GTA Iju Λ CAG CAC GAT CCA ATG Ak- TAC 5230
Asp Sar Yal Asp Pro Asp Ala Yal Ala Gln His Asp Pro Mec His T/r
1745 1750 1755 17 60
AAA GTT TCA ACT TTT ATG CGT ACC TTG GAT CTA TTG ATA GCA CGC GGC 5323
Lys Yal Sar Thr Phe Mec Arg Thr Lau Asp Leu Lau Ile Ala Arg Gly
176' 1770 177: =
GAC CAT GCT TAT CGC CAA CTG GAA CGA GAT ACA CTC AAC GAA GCG AAG 537 6
Asp His Ala Tyr Arg Gln Lau Glu Arg •Asp Thr Lau .Asn Glu Ala. Lys
1730 1785 1790
ATG TGG TAT ATG CAA GCG CTG CAT CTA TTA GGT GAC AAA CCT TAT CTA 5424
Mec Trp Tyr Mec Gln Ala Leu His Leu Lau Gly Asp Lys Pro Tyr Leu
1795 1300 1305
CCG CTG AGT ACG ACA TGG AGT GAT CCA CGA CTA GAC AGA GCC GCG GAT 5472
Pro Lau Ser Thr Thr Trp Ser Asp Pro Arg Leu Asp Arg Ala Ala Asp
1310 1815 1820
ATC ACT ACC CAA AAT GCT CAC GAC AGC GCA ATA GTC GCT CTG CGG CAG 5520
Ile Thr Thr Gln Asn Ala His Asp Ser Ala Ile Yal Ala Leu Arg Gln
1325 1330 1335 1340
AAT ATA CCT ACA CCG GCA CCT TTA TCA 5547
Asn Ile Pro Thr Pro Ala Pro Lau Ser
1845 1349
( 2 ) Dane dla sekwencji SEK NR ID: 49;
(i) Charakterystyka sekwencji:
( A) Długość: 1849 aminokwasów (B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza (D ) Topologia: liniowa (ii ) Typ cząsteczki: białko
( xi) Opis sekwencji: SEK NR ID: 49 (TcdAii);
Cechy Od Do Opis
Peptyd 1 1849 peptyd TcdAii
Fragment 1 12 S2 N-końcowy ( SEK NR E
Fragment 196 211 ( SEK NR ID: 38 )
Fragment 466 475 ( SEK NR ID: 17 )
Fragment 993 1004 ( SEK NR ID: 23; 12/13 )
Fragment 1297 1312 ( SEK NR ID: 18 )
Fragment 1390 1409 ( SEK NR ID: 39 )
Fragment 1532 1554 ( SEK NR ID: 21; 19/23 )
Leu 1 Ile Gly Tyr Asn 5 Asn Gln Phe Ser Gly 10 Arg Ala Sar Gln Tyr 15 Val
Aid. Pro Gly Thr 20 Val Ser Ser Mec Phe 25 Ser Pro Ala Ala Tyr 30 Leu Thr
Glu Leu Tyr 35 Arg Glu Ala Arg Asn 40 Leu His Ala Ser Asp 45 Ser Val Tyr
Tyr Leu 50 Asp Thr Arg Arg Pro 55 Asp Leu Lys Ser Mec ó0 Ala Leu Ser Gln
Gln 65 Asn Mec Asp Ile Glu 70 Lau Ser Thr Leu Ser 75 Lau Sar Asn Glu Lau 30
Lau Lau Glu Sar Ila Lys Thr Glu Ser Lys Lau Glu Asn T/r Thr Lys
186 242
167
50 95
Val . Met Clu , Mee 100 Leu i Ser • Thr Phe Arg 105 Pro Ser Cly Ale Thr 110 Pro Tyr
His ; Asp i Ala 115 . Tyr Clu . Asn Val Arg 120 Clu Val Ile Gln Leu 125 Gln Asp Pro
Cly Leu 130 Glu Gln Leu Asn Ala 135 Ser Pro Ale Ile Ala 140 Gly Leu Mee His
Gln 145 Ala Ser Leu Leu Cly 150 Ile Asn Ale Ser Ile 155 Ser Pro Clu Leu Phe 160
Asn Ile Leu Thr Glu 165 Clu Ile Thr Glu Cly 170 Asn Ala Glu Glu Leu 175 Tyr
Lys Lys Asn Phe 130 Gly Asn Ile Glu Pro 185 Ala Ser Leu Ale Mac 190 Pro Clu
Tyr Leu Lys 195 Arg Tyr Tyr Asn Leu 200 Ser Asp Glu Clu Leu 205 Ser Gln Phe
Ile Gly 210 Lys Ale Ser Asn Phe 215 Gly Cln Cln Glu Tyr 220 Ser Asn Asn Cln
Lau 225 Ile Thr Pro Vel Val 230 Asn Ser Ser Asp Gly 235 Thr VAl Lys Vel Tyr 240
Arg Ile Thr Arg Glu 245 Tyr Thr Thr Asn Ala 250 Tyr Gln Met Asp Vel 255 Clu
Leu Phe Pro Phe 260 Gly Gly Glu Asn Tyr 265 Arg Leu Asp Tyr Lys 270 Phe Lys
Asn Phe Tyr 275 Asn Ale Ser Tyr Leu 280 Ser Ile Lys Leu Asn 285 Asp Lys Arg
Glu Leu 290 Val Arg Thr Glu Gly 295 Ale Pro Cln VAl Asn 300 Ile Glu Tyr Ser
Ala 305 Asn Ile Thr Leu Asn 310 Thr Ale Asp Ile Ser 315 Gln Pro Phe Glu Ile 320
Cly Leu Thr Arg Val 325 Leu Pro Ser Cly Ser 330 Trp Ale Tyr Ala Ale 335 Ale
Lys Phe Thr VAl 340 Glu Glu Tyr Asn Gln 345 Tyr Ser Phe Leu Leu 350 Lys Leu
Asn Lys Ala 355 Ile Arg Leu Ser Arg 360 Ale Thr Glu Leu Ser 365 Pro Thr Ile
Leu Glu 370 Gly Ile Vel Arg Ser 375 Vel Asn Leu Gln Leu 380 Asp Ile Asn Thr
Asp 335 Vel Leu Gly Lys Vel 390 Phe Leu Thr Lys Tyr 395 Tyr Met Gln Arg Tyr 400
Ale Ile His Ala Glu 405 Thr Ala Leu Ile Leu 410 Gys Asn Ala Pro Ile 415 Ser
Cln Arg Ser Tyr 420 Asp Asn Gln Pro Ser 425 Cln Phe Asp Arg Leu 430 Phe Asn
Thr Pro Lau 435 Leu Asn Gly Cln Tyr 440 Phe Ser Thr Gly Asp 445 Glu Glu Ile
Tsp Leu 450 Asn Ser Cly Ser Thr 455 Cly Asp Trp Arg Lys 4 60 Thr Ile Leu Lys
168
186 242
Arg 465 Ala Phe Asn Ile Asp 470 Asp Yal Ser Leu Phe 475 Arg Lau Leu Lys Iie 430
Thr Asp His Asp Asm 435 Lys Asp Gly Lys Ile 430 L/s Asn Asn Lau Lys 495 Asn
Leu Ser Asn Leu 500 Tyr Ile Tly L/s Leu 505 Leu Ala Asp Ile His 510 GlM Leu
Thr Ile Asp 515 Glu Leu Asp Leu Leu 520 Leu Ile Ala Vai Gly 525 Glu Gly Lys
Thr Asn 530 Leu Ser Ala Ile Ser 535 Asp Lys Gln Leu Ala 540 Thr Leu Ile Arg
Lys 545 Leu Asn Thr Ile Thr 550 Ser Trp Leu His Thr 555 GIm Lys Trp Ser Vai 560
Phe Gln Leu Phe Ile 565 Mec Thr Ser Thr Ser 570 Tyr Asn Lys Thr Leu 575 Thr
Pro Tlu Ile Lys 5δ0 Asn Leu Leu Asp Thr 5δ5 Val Tyr His Gly Leu 590 GIm Giy
Phe Asp Lys 595 Asp Lys Ala Asp Leu 600 Leu His Val Mec Aia 605 Pro Tyr Iie
Ala Ala 510 Thr Leu GlM Leu Ser 615 Ser Glu Asm Val Aia 620 His Ser Val Leu
Leu 625 Trp Ala Asp Lys Leu 630 Gln Pro Gly Asp Gly 635 Aia Mec Thr Ala Giu 640
Lys Phe Trp Asp Trp 645 Leu Asm Thr Lys Tyr 650 Thr Pro Gly Ser Ser 655 Giu
Ala Val Glu Thr 660 GlM Glu His Ile Val 665 GlM Tyr cys Gin Aia 670 Leu Aia
Gln Leu Glu 675 Mac Val Tyr His Ser 630 Thr Gly Ile Asn Glu 635 Asn Aia Phe
Arg Leu 690 Phe Val Thr Lys Pro 695 Glu Mec Phe Gly Aia 700 Aia Thr Giy Ala
Ala 705 Pro Ala His Asp Ala 710 Leu Ser Leu Ile Mec 715 Leu Thr Arg Phe Aia 720
Asp Trp Val Asn Ala 725 Leu Gly Glu Lys Ala 730 Ser Ser Val Leu Aia 735 Ala
Phe Glu Ala. Asm 740 Ser Leu Thr Ala Glu 745 GlM Leu Aia Asp Aia 750 Mec Asn
Leu Asp Ala 755 Asn Leu Leu Leu Gln 760 Ala Ser Ile Gin Ala 765 Gln Asm His
Gln His 770 Leu Pro Pro Val Thr 775 Pro Glu Asn Ala Phe 730 Ser Cys Trp Thr
Ser 735 Ile Asn Thr Ile Leu 790 GlM Trp Val Asm Vai 795 Aia Gln Gin Leu Asm 300
Val Ala Pro Gln Gly 305 Val Ser Ala Leu Val 310 Gly Leu Asp Tyr Ile 315 Gln
Ser Mec Lys Glu Θ20 Thr Pro Thr Tyr Ala 325 GlM Trp Giu Asn Aia 330 Aia Gly
Vai Leu Thr 335 Ala Gly Leu Asn Ser 340 Gin Gln Ala Asm Thr 345 Lau His Aia
169
186 242
re® Lau 350 Csp G X ul Sap Ara Sap 3 3 3 Cla Ala Leu Sap cer 360 h/r Cyr I l t Crg '
Gln /al Ala Lys Tla Cla Tla Tla Ile Lys 3®P Crg Tsp Asp Leu Typ
365 370 375 330
j i n Typ Lau Lau Ila Asp Tsn Cln /al Sar Ala Ala Ilt Lys eep Ter
335 390 895
Arg τ i a Cla Clu CIi Ila Ala Sap Ilt Gln Leu h/r /al Tsn Arg Ala
900 905 910
Lau Glu Asn /al Glu Clu Asn Cla Asn Sar Gly /al Ilt Ser Arg Gln
915 920 925
ree ree Ile Asp Crp Tsp Lys T/r Asn Lys Crg Typ Sap eer Crp Ala
930 935 940
cl·/ /al Str Gln Lau /al T/r h/r rro Clu Csn Typ Ile Csp rro Ter
945 950 955 960
Mac Arg Ile Gly Gln Ter Lys Met Met Csp Cla Leu Ltu Gln Sep Van
965 970 975
Str Gln Ser Gln Ltu Asn Tla Tsp eer /al Glu Csp Ala ree Met Sep
980 985 990
T/P Lau Tep Ser ree Clu Gln /al Ala Tsn Leu Lys /al Ile Ser Ala
995 1000 1005
Cyr His Asp Asn Ilt Csn Asn Csp Gln Cly Leu Ter Tyr ree Ilt Gly
1010 1015 1020
Leu Str Glu Ter Asp Cla Gly Glu Tyr Tyr Trp Arg Ser /al Asp His
1025 1030 1035 1040
Sep Lys re® Asn Asp Gly Lys re® Ala Ala Asn Ala Crp Sep Glu Trp
1045 1050 1055
Hss Lys Ile Asp Gys rro Ilt Csn rro Cyr L/s Ser eer Ile Crg rpo
1060 1065 1070
/al Ile Typ Lys Ser Arg Leu Typ Leu Ltu Trp Leu Glu Gln Lys Glu
1075 1080 1085
Ile Ter Lys Gln Ter Gly Asn Ser Lys Asp Gly Cyr Gln Ter Glu Ter
1090 1095 1100
Tsp Typ Arg Tyr Glu Leu L/s Ltu Ala His Ilt Arg Tyr Asp Gly Ter
1105 1110 1115 1120
Crp Asn Ter rro Ile eer re® Asp /al Csn Lys L/s Ilt Ser Glu Leu
1125 1130 1135
Lys Lau Glu Lys Asn Arg Ala rro Gly Leu Cyr Cys Ala Gly Tyr Gln
1140 1145 1150
Cly Glu Csp Ter Leu Ltu /al Mat ree Cyr Asn Gln Gln Asp Ter Ltu
1155 1160 1165
Csp Sap Tyr Lys Asn Cla Ser Mee Gln Gly Ltu Tyr Ilt ree Ala Asp
1170 1175 1180
Mat Ala Sar Lys Asp Mat cer rro Glu Cln Ser Asn /al h/r Arg Asp
1185 1190 1195 1200
Tsn Sap h/r Gln Gln re® Csp cer Csn Tsn /al Crg Trg /al Csn Csn
1205 1210 1215
crg Typ Ala Glu Csp T/r Glu Ila rro Sar Ser /al Ser Ser Arg L/s
1220 1225 1230
170
186 242
Asp Tyr Gly Trp Gly Aso Tyr Tyr Leu Ser Met Val Tyr Asn Gly Asp
123 5 124( 3 124'
Ile Pro Thr 1250 Ile Asn Tyr Lys Ala 1255 Ala Ser Ser Asp Leu 12 = 0 Lys Ile Tyr
Ile Ser Pro Lys Leu Arg Ile Iie Us Asn Gly Tyr Glu Gly Gin Lys
12 0 5 1270 1275 1280
Arg Asn Gln Cys Asn Leu Mec Asn 1285 Lys lyr Gly Lys Leu 1290 Gly Ssp Lys 1295
Phe Ile Val Tyr Thr Ser Leu Gly 1300 Val Ssn Pro Asn Asn 1305 Ser Ser Ssn 1310
Lys Leu Mec Phe Tyr Pro Val Tyr Gln Tyr Ser Gly Asn Thr Ser Gly
1315 1320 1325
Leu Asn Gln 1330 Gly Arg Leu Leu Phe 1335 His Arg Asp Thr Thr 1340 Tyr Pro Ser
Lys Val Glu Ala Trp Ile Pro Gly Ala Lys Arg Ser Leu Thr Asn Gln
1345 1350 1355 1360
Asn Ala Ala Ile Gly Asp Asp Tyr 1365 Ala Thr Ssp Ser Leu 1370 Ssn Lys Pro 1375
Asp Asp Leu Lys Tln Tyr Ile Phe 1380 Mec Thr Ssp Ser Lys 1385 Gly Thr Sla 1390
Thr Asp Val Ser Gly Pro Val Glu 1395 1400 He Ssn Thr Ala He 1405 Ser Pro Ala
Lys Val Gln 1410 Ile Ile Val Lys Ala 1415 Gly Gly Lys Glu Tin 1420 Thr Phe Thr
Ala Asp Lys Asp Val Ser Ile Tln Pro Ser Pro Ser Phe Ssp Glu Mec
1425 1430 1435 1440
Asn Tyr Gln Phe Asn Ala Leu Glu 1445 Ile Asp Gly Ser Gly 1450 Leu Asn Phe 1455
Ile Asn Asn Ser Ala Ser Ile Asp 1460 Val Thr Phe Thr Sla 1465 Phe Sla Glu 1470
Asp Gly Arg Lys Leu Tly Tyr Glu Ser Phe Ser Ile Pro Val Thr Leu
1475 1480 1 1485
Lys Val Ser 1490 Thr Ssp Asn Ala Leu 1495 Thr Leu His His Ssn 1500 Tlu Asn Gly
Ala Gln Tyr Mec Tin Trp Tln Ser Tyr Srg Thr Srg Leu Ssn Thr Leu
1505 1510 1515 1520
Phe Ala Arg Tln Leu Val Sla Arg 1525 Ala Thr Thr Gly Ile 1530 Ssp Thr Ile 1535
Leu Ser Mec Glu Thr Tln Asn Ile 1540 Gln Glu Pro Tln Leu 1545 Gly Lys Tly 1550
Phe Tyr Ala Thr Phe Val Ile Pro Pro Tyr Asn Leu Ser Thr His Tly
1555 1560 i 1565
Asp Glu Arg 1570 Trp Phe Lys Leu Tyr 1575 Ile Lys His Val Val 1580 Ssp Asn Asn
Ser His Ile Ile Tyr Ser Gly Gln Leu Thr Ssp Thr Ssn He Asn Ile
1585 1590 1595 1600
Thr Leu Phe Ile Pro Leu Asp Asp Val Pro Leu Asn Tln Asp Tyr His
186 242
171
1605 1610 1615
Ala Lys Val Tyr 162 msc 0 Thr Phe Lys Lys Ser 1625 Pro Ser Asp Gly Thr Trp 1630
Trp Gly Pro His Phe Val Arg Asp .Asp Lys Gly Hle Val Thr He asp
1635 1640 1645
Pro L-/s Ser Ile Leu Thr His Phe Glu Ser Val Asn Val Leu Asm Asn
1650 1655 1660
Ile Ser Ser Glu Pro Met Asp Phe Ser Cly Ala Asn Ser Leu Tyr Phe
1655 1670 1675 1680
Trp Clu Leu Phe Tyr Tyr Thr Pro Met Leu Val Ala Gln .Arg Leu Leu
1635 1690 1655
His Glu Gln. Asn Phe Asp Glu Ala Asn Arg Trp Leu Lys Tyr Val Trp
1700 1705 1710
Ser Pro Ser Gly Tyr Ile Val His Gly Gln Ile Gln Asn Tyr Glm Trp
1715 1720 1725
Asn Va l Arg Pro Leu Leu Glu Asp Thr Ser Trp Asn Ser Asp Pro Leu
1730 1735 1740
Asp Ser Val Asp Pro Asp Ala Val Ala Gln Hus Asp Pro Mec His Tyr
1745 175C 1755 1760
Lys val ser Thr Phe Met Arg Thr Leu Asp Leu Leu He Ala Arg Gly
1765 1770 1775
Asp His Ala Tyr Arg Gln Leu Glu Arg top Thr Leu ton Glu Ala Lys
1780 1785 1790
Mec Trp Tyr Mee Gln Ala Leu HLs Leu Leu Gly top Lys Pro Tyr Leu
1795 1800 1305
Pro Leu Ser Thr Thr Trp Ser Asp Pro Arg Leu Asp Arg Ala Ala Asp
1810 1815 1820
Ile Thr Thr Gln Asn Ala His Asp Ser Ala Ile Val Ala Leu Arg Gln
1825 1330 1835 1840
Asn Ile Pro Thr Pro Ala Pro Leu Ser
1845 1849
( 2 ) Dane dla sekwencji SEK NR ID: 50;
(i) Charakterystyka sekwencji:
(A) Długość: 1740 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: podwójna (D) Topologia: liniowa (ii) Typ cząsteczki: DNA (genomowi) (X ) Opis sekwencji: SEK NR ID: 50 ( TcdAiii obszar kodowania);
TTG Leu CCC Arg AGC Ser GCT Ala AAT Asm 5 ACC CTC ACT Thr CAT top CTC Leu 10 TTC Phe CTC Leu CCC Pro CAA Glm ATC Ile 15 AAT Asn 48
Thr Leu
GAA GTG ATG ATG AAT TAC TCG CAC ACA TTA GCT CAG AGA GTA TAC AAT 96
Glu Val Mec Mec 20 Asm Tyr Trp Glm Thr 25 Leu Ala Glm Arg Val 30 Tyr Asm
,— 'Τ'Γ' c i sj CGT CAT AAC CTC TCT ATC GAC CCC CAC CCC TTA TAT CTC CCA ATC 144
172
186 242
Leu Arg His 35 Asn Leu Ile Asp 40 c y Gin Pro Leu Tyr 45 Leu Pro i 1 e
TAT 1 GGC ACA GGG GCC GAT CGG ΑΛΛ TTA CTC AGC GGC GGC GTT 1 9 Λ ± ~
Tyr Ala 50 Thr Pro Ala Asp Pro 55 Ala Leu Leu Ser 50 Ala Ala Val Ala
ACT TCT CAA GGT GGA GGC AAG * CCG GaA TCA TTT ATG TGC CTG TGG 240
Thr 55 Ser Gln Gly Gly Gly 70 Lys Leu Pro Glu Ser 75 Phe Met Ser Leu Trp 30
GGT GGG CAG ATG GTG gAA AAT GCG CGC GGG ATG GTT AGG CAG 233
Arg Phe Pro His Mec 35 Leu Glu Asn Ala Arg 90 Gly Mec Val Ser Gln 95 Leu
AGG GAG TTC GGC TCC ACG TTA CAA AAT ATT ATG GAA CGT CAG GAC GCG 3 3 6
Thr Gln Phe Gly 100 Ser Thr Leu Gln Asn 105 Ile Ile Glu Arg Gln 110 Asp Al a
GAA GCG CTG AAT GGG TTA TTA GAA AAT CAG GGG GCC GAG GTG ATA TTG 334
Glu •Ala Leu 115 Asn Ala Leu Leu Gln 120 Asn Gln Ala Ala Glu 125 Leu Ile Leu
ACT AAG CTG AGG ATT CAG GAC .AAA ACC ATT GAA GAA TTG GAT GGC GAG 432
Thr Asn 130 Leu Ser Ile Gln Asp 135 Lys Thr Ile Glu Glu 140 Leu Asp Ala Glu
AAA ACG GTG TTG GAA AAA TGC AAA GCG GGA GCA CAA TCG GGC TTT GAT 430
Lys 145 Thr Val Leu Glu Lys 150 Ser Lys Ala Gly Ala 155 Gln Ser Arg Phe Asp 160
AGG TAG GGC AAA CTG TAC GAT GAG AAT ATG AAG GGC GGT GAA AAG CAA 523
Ser Tyr Gly Lys Leu 165 Tyr Asp Glu Asn Ile 170 Asn Ala Gly Glu Asn 175 Gln
GGC ATG ACG GTA CGA GGG TGG GGC GGC GGG CTT ACC AGG GGA GTT CAG 576
Ala Met Thr Leu 130 Arg Ala Ser Ala Ala 135 Gly Leu Thr Thr Ala 190 Val Gln
GGA TGG GGT GTG GGG GGT GGG GGG GGT GAT CTG GTG CGT AAG ATG TTG 624
Ala Ser Arg 195 Leu Ala Gly Ala Ala 200 Ala Asp Leu Val Pro 205 Asn Ile Phe
GGG TTT GCG GGT GGG GGG AGG CGT TGG GGG GGT ATC GCT GAG GGG AGA 672
Gly Phe 210 Ala Gly Gly Gly Ser 215 Arg Trp Gly Ala Ile 220 Ala Glu Ala Thr
GGT TAT GTG ATG GAA TTC TGC GGG AAT GTT ATG AAC ACC GAA GGG GAT 720
Gly 225 Tyr Val Met Glu Phe 230 Ser Ala Asn Val Mec 235 Asn Thr Glu Ala Asp 240
AAA ATT AGG CAA TGT GAA AGG TAG CGT CGT CGC CGT CAG GAG TGG GAG 763
Lys Ile Ser Gln Ser 245 Glu Thr Tyr Arg Arg 250 Arg Arg Gln Glu Trp 255 Glu
ATG CAG CGG AAT AAT GGC GAA GGG GAA TTG AAG CAA ATG GAT GGT CAG 316
Ile Gln Arg Asn 260 Asn Ala Glu Ala Glu 265 Leu Lys Gln Ile Asp 270 Ala Gln
GTC AAA TGA CTC GCT GTA GGG GGG GAA GGC GGC GTA TTG GAG AAA ACC 364
Leu Lys Ser 275 Leu Ala Val Arg Arg 230 Glu Ala Ala Val Leu 235 Gln Lys Thr
AGT GTG AAA AGG CAA CAA GAA GAG ACG GAA TCT CAA TTG GGC TTG GTG 912
Ser Leu 290 Lys Thr Gln Gln Glu 295 Gln Thr Gln Ser Gln 300 Leu Ala Phe Leu
CAA GGT AAG TTG AGC AAT GAG GGG TTA TAC AAC TGG CTG CGT GGT CGA 950
Gln 305 Arg Lys Phe Ser Asn 310 G ln Ala Leu Tyr Asn 315 Trp Leu Arg Gly Arg 3 20
186 242
173
CTC GCC Leu Ha . Ala ; att Ile Tyr 325 Phe CAG Gin TTC Phe TAC Tyr GA.T Aso 3 30 TGC Leu GCC Ala gTC Val Ala Arg •35 T—C —ys 1C08
CTG ATG : GCA . GAA CAA GCT TAC CGT TGG GAA CTC i i GAT GA.C TCT 1056
Leu Met Ala Glu 340 Gln Ala n. a r g Arg Trp 345 Glu Leu Asn Asp Asp 350 Ser Ala
CGC —r»^P e — ATT AAA CCG GGC GCC TGG CAG tGN ACC TAT GCC GGT CTG CTT 1104
Arg Phe Ile 355 Lys Pro Gly Ala Trp 360 Gln Gly Thr Tyr Ala 365 Gly Leu Leu
GCA GGT GAA ACC TTG ATG CTG AGT CTG GCA CAA ATG GAA GAC GCT CAT 1152
Ala Gly 370 Glu Thr Leu Met Leu 375 Ser Leu Ala Gln Met 330 Glu Asp Ala His
CTG AA_A CGC GAT AAA CGC GCA TTA GAG GTT GAA CGC ACA GTA TCG CTG 1200
Leu 385 Lys Arg Asp Lys Arg 390 Ala Leu Glu Val Glu 395 Arg Thr Val Ser Leu 400
GCC GAA GTT TAT GCA GGA TTA CCA AAA GAT AAC GGT CCA TTT TCC CTG 1248
Ala Glu Val Tyr Ala 405 Gly Leu Pro Lys Asp 410 .Asn Gly Pro Phe Ser 415 Leu
GCT CAG GAA ATT GAC AAG CTG GTG AGT CAA GGT TCA GGC AGT GCC GGC 1296
Ala Gin Glu Ile 420 Asp Lys Leu Val Ser 425 Gln Gly Ser Gly Ser 430 Ala Gly
AGT GGT AAT AAT AAT TTG GCG TTC GGC GCC GGC ACG GAC ACT AAA ACC 1344
Ser Gly Asn 435 Asn Asn Leu Ala Phe 440 Gly Ala Gly Thr Asp 445 Thr Lys Thr
TCT TTG CAG GCA TCA GTT TCA TTC GCT GAT TTG AAA ATT CGT GAA GAT 1392
Ser Leu 450 Gln Ala Ser Val Ser 455 Phe Ala Asp Leu Lys 460 Ile Arg Glu Asp
TAC CCG GCA TCG CTT GGC AAA ATT CGA CGT ATC AAA CAG ATC AGC GTC 1440
Tyr 465 Pro Ala Ser Leu Gly 470 Lys Ile Arg Arg Ile 475 Lys Gln Ile Ser Val 480
ACT TTG CCC GCG CTA CTG GGA CCG TAT CAG GAT GTA CAG GCA ATA TTG 1488
Thr Leu Pro Ala Leu 485 Leu Gly Pro Tyr Gln 490 Asp Val Gln Ala Ile 495 Leu
TCT TAC GGC GAT AAA GCC GGA TTA GCT AAC GGC TGT GAA GCG CTG GCA 1536
Ser Tyr Gly Asp 500 Lys Ala Gly Lau Ala 505 Asn Gly Cys Glu Ala 510 Leu Ala
GTT TCT CAC GGT ATG AAT GAC AGC GGC CAA TTC CAG CTC GAT TTC AAC 1584
Val Ser His 515 Gly Met Asn Asp Ser 520 Gly Gln Phe Gln Leu 525 Asp Phe Asn
GAT GGC AAA TTC CTG CCA TTC GAA GGC ATC GCC ATT GAT CAA GGC ACG 1632
Asp Gly 530 Lys Phe Leu Pro Phe 535 Glu Gly Ile Ala Ile 540 Asp Gln Gly Thr
CTG ACA CTG AGC TTC CCA AAT GCA TCT ATG CCG GAG AAA GGT AAA CAA 1680
Leu 545 Thr Leu Ser Phe Pro 550 Asn Ala Ser Met Pro 555 Glu Lys Gly Lys Gln 560
GCC ACT ATG TTA AAA ACC CTG AAC GAT ATC ATT TTG CAT ATT CGC TA— 1728
Ala Thr Mec Leu Lys 565 Thr Leu Asn Asp Ile 570 Ile Leu His Ile Arg 575 Tyr
ACC ATT AAA TAA 1740 Thr Ile Lys ···
579 ( 2 ) Dane dla sekwencji SEK NR ID: 51;
174
186 242 (i) Charakterystyka sekwencji:
( A ) Długość: 279 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza (D ) Topologia: liniowa (ii) Typ cząsteczki: białko
( x ) Opis sekwencji: SEK NR ID: 51 ( TctdAii);
Leu 1 Arg Ser Ale Asn Thr Leu 5 Thr Asp Leu 10 Phe Leu Pro Gin Ile Asn 15
Tlu Vel Met Mec Asn Tyr Trp 20 Cln Thr Leu 25 Ala Gln Arg Val Tyr Asn 30
Leu Arg His Asn Leu Ser Ile 35 Asp 40 Cly Cln Pro Leu Tyr Leu Pro Ile 45
Tyr Ala Thr Pro Ala Asp Pro 50 55 Lys Ala Leu Leu Ser Ala Ala Vel Ale 60
Thr 65 Ser Gln Cly Gly Gly Lys 70 Leu Pro Glu Ser Phe Mec Ser Leu Trp 75 30
Arg Phe Pro His Mec Leu Glu 35 Asn Ala Arg 90 Gly Mec Vel Ser Gln Leu 95
Thr Cln Phe Cly Ser Thr Leu 100 Gln Asn Ile 105 Ile Glu Arg Cln Asp Ale 110
Glu Ala Leu Asn Ale Leu Leu 115 Cln 120 Asn Gln Ale Ala Glu Leu Ile Leu 125
Thr Asn Leu Ser Ile Gln Asp 130 135 Lys Thr Ile Glu Glu Leu Asp Ale Clu 140
Lys 145 Thr Val Leu Clu Lys Sar 150 Lys Ala Gly Ale Cln Ser Arg Phe Asp 155 160
Ser Tyr Gly Lys Leu Tyr Asp 165 Clu Asn Ile 170 Asn Ala Gly Glu Asn Cln 175
Ala Mec Thr Leu Arg Ala Sar 180 Ale Ale Gly 185 Leu Thr Thr Ala Vel Gln 190
Ale Ser Arg Leu Ala Gly Ala 19 5 Ale 200 Ala Asp Leu Val Pro Asn Ile Phe 205
Cly Phe Ala Gly Gly Gly Ser 210 215 Arg Trp Gly Ala Ile Ale Clu Ale Thr 220
Gly 225 Tyr Val Mac Glu Phe Sar 230 Ale Asn Val Mec Asn Thr Clu Ale Asp 235 240
Lys Ile Ser Gln Ser Glu Thr 245 Tyr Arg Arg 250 Arg Arg Gln Glu Trp Glu 255
Ile Gln Arg Asn Asn Ale Glu 260 Ale Clu Leu 265 Lys Gln Ile Asp Ale Gln 270
Leu Lys Ser Leu Ala Val Arg 275 Arg 280 Clu Ale Ala Vel Leu Gln Lys Thr 285
Ser Leu Lys Thr Gin Gin Glu 290 295 Cln Thr Gin Ser Gln Leu Ale Phe Leu 300
Gin 305 Arg Lys Phe Ser Asn Gln 310 Ala Leu Tyr Asn Trp Leu Arg Gly Arg 315 320
186 242
175
Leu Ala Ala Ile Tyr 325 Phe Gln Phe Tyr Asp 330 Leu Ala Val Ala •Arg 335 Cys
Leu Mer Ala Glu 340 Gln Ala Tyr Arg Trp 345 Glu Leu Asn Asp -Asp 350 Ser Ala
Arg Phe Ile 355 Lys Pro Gly Ala Trp 360 Gln Gly Thr u<· Ala 355 Gly Leu Leu
Ala Gly 370 Glu Thr Leu Mec Leu 375 Ser Leu Ala Gln Mec 330 Glu Asp Ala His
Leu 335 Lys Arg Asp Lys -Arg 390 Ala Leu Glu Val Glu 395 Arg Thr Val Ser Leu 400
Ala Glu Val Tyr Ala 405 Gly Leu Pro Lys Asp 410 ten Gly Pro Phe Ser 415 Leu
Ala Gln Glu Ile 420 Asp Lys Leu Val Ser 425 Gln Gly Ser Gly Ser 430 Ala Gly
Ser Gly As n 435 Asn Asn Leu Ala Phe 440 Gly Ala Gly Thr Asp 445 Thr Lys Thr
Ser Leu 450 Gln Ala Ser Val Ser 455 Phe Ala Asp Leu Lys 460 Ile Arg Glu Asp
Tyr 4ó5 Pro Ala Ser Leu Gly 470 Lys Ile Arg Arg Ile 475 Lys Gln Ile Ser Val 480
Thr Leu Pro Ala Leu 485 Leu Gly Pro Tyr Gln 490 Asp Val Gln Ala Ile 495 Leu
Ser Tyr Gly Asp 500 Lys Ala Gly Leu Ala 505 Asn Gly cys Glu Ala 510 Leu Ala
Val Ser His 515 Gly Mec Asn tep Ser 520 Gly Gln Phe Gln Leu 525 tep Phe Asn
-Asp Gly 530 Lys Phe Leu Pro Phe 535 Glu Gly Ile Ala Ile 540 tep Gln Gly Thr
Leu 545 Thr Leu Ser Phe Pro 550 Asn Ala Ser Mec Pro 555 Glu Lys Gly Lys Gln 560
Ala Thr Mec Leu Lys Thr Leu ten tep Ile Ile Leu His Ile Arg Tyr
565 570 575
Thr Ile Lys ··♦
579 (2 ) Dane dla sekwencji SEK NR ID: 52;
(i) Charakterystyka sekwencji:
(A) Długość: 5532 par zasad ( B ) Typ: kwas nukleinowy ( C ) Rodzaj nici: podwójna ( D ) Topologia: liniowa (ii) Typ cząsteczki: DNA ( genomowa) ( xi) Opis sekwencji: SEK NR ID: 52 (TcdAiii obszar kodowania);
TTT ATA CAA GGT TAT AGT GAT CTG TTT GGT AAT CGT GCT GAT .AAC TAT 43
Phe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn Arg Ala Asp Asn Tyr i 5 10 15
GCC CCG CCG GGC TCG GTT GCA TCG ATG TTC TCA CCG GCG GC g region;:
T TAT TTG 95
176
186 242
Aia . Ala Pro Gly 20 Ser Val Ala Ser Met 25 Phe Ser Pro Ala Ala 3 0 Τ» r• Z - Leu
ACG 'jrA TTG TAC CGT GAA scc AAA aAC TTG Λ*!* GAC AGC AGC TCA 14 4
Thr Glu Leu 35 Tyr Arg Glu Ala Lys 40 Asn Leu His Asp Ser 45 Ser Ser Ile
TAT TAC CTA TAT AAA CGT GAT TTA TCA AGC TTA ATG i-TT· AGC 19 2
Tyr Tyr 50 Leu Asp Lys Arg Arg 55 Pro Asp Leu Aia Ser 50 Leu Mec Leu Ser
CAT AAA AAT ATG TAT GAG tAA ATT TCA ACG CTG GCT CTC TCT AAT TAA 24 C
Tin 6 5 L'ys Asn Mec Asp Glu 70 Giu Iie Ser Thr Leu 75 Ala Leu Ser Asn Giu 30
TTG TGC CTT GCC GGG ATC GAA ACA AAA ACA GGA AAA TCA CAA GAT GAA 233
Leu cys Leu Aia Gly 35 Ile Glu Thr Lys Thr 90 Gly Lys Ser Gin Asp 95 Giu
TTT ATG GAT ATG TTG TCA ACT TAT CGT TTA AGT GGA TAG ACA CCT TAT 335
Vai Mec Asp Mec 100 Leu Ser Thr Tyr Arg 105 Leu Ser Giy Giu Thr 110 Pro Tyr
CAT CAC GCT TAT GAA ACT GTT CGT GAA ATC GTT CAT GAA CGT GAT CCA 384
His His Aia 115 Tyr Glu Thr Vai Arg 120 Giu Iie Vai His Glu 125 Arg Asp Pro
GGA TTT CGT CAT TTG TCA CAG GCA CCC ATT GTT GCT GCT AAG CTC GAT 432
Gly Phe 130 Arg His Leu Ser Gln 135 Aia Pro Ile Vai Aia 140 Aia Lys Leu Asp
CCT GTG ACT TTG TTG GGT ATT AGC TCC CAT ATT TGG CCA TAA CTG TAT 480
Pro 145 Vai Thr Leu Leu Gly 150 Ile Ser Ser His Ile 155 Ser Pro Giu Leu Tyr 160
AAC TTG CTG ATT GAG GAG ATC CCG GAA AAA GAT GAA GCC GCT CTT GAT 523
Asn Leu Leu Ile Giu 165 Giu Iie Pro Giu Lys 170 Asp Glu Aia Aia Leu 175 Asp
ACG CTT TAT AAA ACA AAC TTT GGC GAT ATT ACT ACT GCT CAG TTA ATG 57 6
Thr Leu Tyr Lys 180 Thr Asm Phe Giy Asp 185 Iie Thr Thr Aia GlM 190 Leu Mec
TCC CCA AGT TAT CTG GCC CTG TAT TAT GGC GTC TCA CCG GAA GAT ATT 624
Ser Pro Ser 195 Tyr Leu Aia Arg Tyr 200 Tyr Giy Vai Ser Pro 205 Glu Asp Ile
GCC TAC GTG ACG ACT TCA TTA TCA CAT GTT GGA TAT AGC AGT GAT ATT 672
Ala Tyr 210 Val Thr Thr Ser Leu 215 Ser His Vai Giy Tyr 220 Ser Ser Asp Iie
CTG GTT ATT CCG TTG GTC GAT GGT GTG GGT AAG ATG GAA GTA GTT CGT 720
Leu 225 Val Iie Pro Leu Val 230 Asp Gly Vai Giy Lys 235 Mec Giu Val Vai Arg 240
TTT ACC CGA ACA CCA TCG GAT AAT TAT ACC AGT CAG ACG AAT TAT ATT 7 63
Val Thr Arg Thr Pro 245 Ser Asp ASM Tyr Thr 250 Ser Gin Thr Asn Tyr 255 Iie
GAG CTG TAT CCA CAG GGT GGC GAC AAT TAT TTG ATC AAA TAC AAT CTA 816
Giu Leu Tyr Pro 260 Gin Giy Gly Asp Asm 265 Tyr Leu Iie Lys Tyr 270 Asn Leu
AGC AAT AGT TTT TGT TTG GAT GAT TTT TAT CTG CAA TAT AAA GAT GGT 3 6 4
Ser Asn Ser 275 Phe Gly Leu Asp Asp 280 Phe Tyr Leu Gln Tyr 285 Lys Asp Gly
TCC GCT TAT TTG ACT TAT ATT GCC CAT AAT CCC TAT CCT GAT ATG TTC 912
Ser Aia 290 Asp Trp Thr Giu Ile 295 Aia His Asn Pro Tyr 300 Pro Asp Mec Vai
186 242
177
a A * _.-A AAG - AT a .-A ; aca . ATC 1 AAA . CGT AGT Gac cc T ? s ·:·
Ile Asn dn Lys ; Tyr Gi’J oer Gln i Ala . Thr ' I;a Lys Arg Ser Asp Ser
' ,1 3 10 3 15 320
GAC AAT ATA CTC . AGT ATA • GGG TTA . CAA • AGA . TGG CAT AGC GGT AGT TAT 1003
Asp Asn Iie Leu , Ser Iie • Gly Leu Gln Arg Trp His Ser Giy Ser Tyr
325 330 335
A_AT TTT GCG GCC • GCC .AAT TTT AAA ATT GAC CAA TAC TCC CCG AAA GCT 1056
Asn Phe Ala Ala Ala Asn Phe Lys He Asp Gln Tyr Ser Pro Lys Ala
340 345 350
TTC CTG CTT AAA ATG AAT AAG GCT ATT CGG TTG CTC AAA GCT ACC GGC 1104
Phe Leu Leu Lys Mec Asn Lys Ala Ile Arg Leu Leu Lys Aia Thr Gly
355 360 365
ctc tct cct ACG TTG GAG CGT ATT GTT GAT AGT GTT AAT AGC ACC 1152
Leu Ser Phe Ala Thr Leu Glu Arg Ile Val Asp Ser Val Asn Ser Thr
370 375 380
.AAA TCC ATC ACG GTT GAG GTA TTA AAC AAG GTT TAT CGG GTA AAA TTC 1200
Lcs Ser Ile Thr Val Glu Val Leu Asn Lys Val T/r Arg Val Lys Phe
335 390 395 400
TAT ATT GAT CGT TAT GGC ATC AGT GAA GAG ACA GCC CCT ATT TTG GCT 1243
Ty r Ile Asp Arg Tyr Gly Ile Ser Glu Glu Thr Ala Ala Ile Leu Ala
405 410 415
AAT ATT AAT ATC TCT CAG CAA GCT GTT GGC AAT CAG CTT AGC CAG TTT 1296
Asn Ile Asn He Ser Gln Gln Ala Val Gly Asn Gin Leu Ser Gln Phe
420 425 430
GAG CAA CTA TTT AAT CAC CCG CCG CTC AAT GGT ATT CGC TAT GAA ATC 1344
Glu Gln Leu Phe Asn His Pro Pro Leu Asn Gly Ile Arg Tyr Glu Ile
435 440 445
AGT GAG GAC AAC TCC AAA CAT CTT CCT AAT CCT GAT CTG AAC CTT AAA 1392
Ser Glu Asp Asn Ser Lys His Leu Pro Asn Pro Asp Leu Asn Leu Lys
450 455 460
CCA GAC AGT ACC GGT GAT GAT CAA CGC AAG GCG GTT TTA AAA CGC GCG 1440
Pro Asp Ser Thr Gly Asp Asp Gln Arg Lys Ala Val Leu Lys Arg Ala
465 470 475 480
TTT CAG GTT AAC GCC AGT GAG TTG TAT CAG ATG TTA TTG ATC ACT GAT 1433
Phe Gln Val Asn Ala Ser Glu Leu Tyr Gln Mec Leu Leu Ile Thr Asp
485 490 495
CGT AAA GAA GAC GGT GTT ATC AAA AAT AAC TTA GAG AAT TTG TCT GAT 1536
Arg Lys Glu Asp Gly Val Ile Lys Asn Asn Leu Glu Asn Leu Ser Asp
500 505 510
CTG TAT TTG GTT AGT TTG CTG GCC CAG ATT CAT AAC CTG ACT ATT GCT 1584'
Leu Tyr Leu Val Ser Leu Leu Ala Gln Ile His Asn Leu Thr Ile Ala
515 520 525
GAA TTG AAC ATT TTG TTG GTG ATT TGT GGC TAT GGC GAC ACC AAC ATT 1632
Glu Leu Asn Ile Leu Leu Val Ile Cys Gly Tyr Gly Asp Thr Asn He
530 535 540
TAT CAG ATT ACC GAC GAT AAT TTA GCC AAA ATA GTG GAA ACA TTG TTG 1680
Tyr Gln Ile Thr Asp Asp Asn Leu Ala Lys Iie Val Glu Thr Leu Leu
545 550 555 560
CGG ATC ACT CAA TGG TTG AAG ACC CAA AAA TGG ACA GTT ACC GAC CTG 1728
Trp He Thr Gln Trp Leu Lys Thr Gln Lys Trp Thr Val Thr Asp Leu
565 570 575
TTT CTG ATG ACC ACG GCC ACT TAC AGC ACC ACT TTA ACG CCA GAA ATT : —
Phe Leu Met Thr Thr Ala Thr Tyr Ser Thr Thr Leu Thr Pro Glu He
530 535 590
178
186 242
TGC TTT L . uJ TC. GCT Tc g TTG GG * L ( Λ TCT TTG (T) GGA. TTA GTG 1824
Ser Tsn Leu Thr Tla Thr Leu Ser Ser Thr Leu His G L'/ Lys G Lu Ser
595 600 6 0 5
ctG TTT CGG GAT GTT (TG AAT TgT GCT TTG gA»g CCT TGC 'Twpr· TCT TCG 1872
Leu Ile Gly Glu Asp Leu Lys Trg .Ala Met Tla Pro Cys Phe Thr Ser
610 615 520
GCT TTG CTT TTG TCT TCT CTA GAT GTT GCG TTT GTC CTG CTG TTG TGG 1920
Ala Lrn His Leu Thr Ser Gln Glu Cal Ala Tyr Asp Leu Leu Leu Trp
625 6 3 0 6 3 5 64 0
TTT GAU C TG TTT CTT CCG GCT CAT TTT TCT GTT GTT (GG TTT Af*GG k GG .AT 963
Iii Tsp Gln Ile Gln Pro Ala Gln Ile Thr Val Tsp Gly Phe Trp Glu
645 550 555
GTT GTG CTT TCT TCA CCT TCC TGC TTG ATG GTG TTT TCC TTT GCT CTG 2016
Glu Vsl Gln Thr Thr Pro Thr Ser Leu Lys Val Ile Thr Phe Ala Gln
660 665 670
GTG CTG GCA CTA TTG TGC CTG TTC TTT CGT CGT TTT GGG TTT TGT GAT 2064
Cal Leu Ala Gln Leu Ser Leu Ile Tyr Arg Trg Ile Gly Leu Ser Glu
575 680 685
TCG .TT CTG TCT CTG TTC GTG TCT CTT TCT TCT CTG CTT GTG GCT cgC 2112
Thr Glu Leu Ser Leu Ile Val Thr Gln Ser Ser Leu Leu Val Ala Gl'Z
690 695 700
-ATT TGC TTT CTG GAT CTC GGT CTG TTT TCC CTG TTG GCC TTG GTT cgT 2160
Lys Ser Ile Leu Tsp His Gly Leu Leu Thr Leu Met Tla Leu Glu .ly
705 710 715 20
TTT CTT TCC TGG GTT ATT GGC TTG GGG CTT CTT GCC TCC TTG TTT TTG 2208
Phe His Thr Trp Val Tsn Gly Leu Gly Gln His Tla Ser Leu Ile Leu
725 730 735
GCG GCG TTG ATT GTC GGT GCC TTG TCA GTT TCC GTT GTA GCT CTT GCT 2256
Tla Tla Leu Lys Tsp Gly Tla Leu Thr Val Thr Tsp Val Tla Gln Ala
740 745 750
TTG ATT ATG GTG GAT TCT CTC CTA CTA TTG GCT GCT ATT CTG GTG GTG 2304
Met Tsn Lys Glu Glu Ser Leu Leu Gln Mgt Tla Ala Tsn Gln Val Clu
755 760 765
TTG GTT CTA TCA ATT CTG TCC TGT TGG TCA CTG ATT GAC GCT ATT CTG 2352
Lys Tsp Leu Thr Lys Leu Thr Ser Trp Thr Gln Ile Tsp Ala Ile Leu
770 775 780
CAT TGG TTT CTG TTG TCT TCG GCC TTG GCG GTT TCT CCT CTG GTT CTG 2400
Gln Trp Leu Gln Mec Ser Ser Ala Leu Ala Val Ser Pro Leu Tsp Leu
785 790 795 300
GCT GGG TTG TTG GCC CTG ATT TTT GGG ATT GTT CTT TTC TTT GCT GC ( 2443
Ala Gly Mec Met Tla Leu Lys Tyr Gly Ile Tsp His .Tsn Tyr Tla Tla
805 810 815
TCC CAT GCT GCG GCG GCT GCG CTG TTG GCT GTT CTT GCT ATT CTG GCT 2496
Trp Gln Tla Ala Tla Tla Tla Leu Met Ala Tsp His Ala Tsn Gin Aid
820 825 83 0
CTG TAT TTA CTG GAT GAG TCG TTC TGT TTG GCT TTA TGT TTC TTT TTT 2544
Gln Lys Lys Leu Tsp Glu Thr Phe Ser Lys Ala Leu Cys .Tsn Tyr Tyr
335 840 845
TTT ATT GCT GTT GTC GTT TCT GCT GCT GGT GTT CGT GTT CGT ATC GGT 2592
Ile Tsn Tla Val Val Tsp Ser Tla Tla Gly Vsl Arg Tsp Arg Tsn Gly
350 355 860
TTT TTT TCC TTT GG>G ()G CTG TTT GTT ATT CTg GTT TCT GCC GTT GTG W GG 2540
Leu Tyr Thr Tyr Leu Leu I le Tsp .Tsn Gln Val Ser Tla -Tsp Vsl I.e
186 242
179
8 6 5 870 875 3 3·0
UCT TCA CCT ' ATT CCU GAA . CCT UTC CCC CCT UTT CAA CTC TAC c TT 2 6 88
Thr Ser Arg Ile Ala Clu 885 Ula ile Ula Gly ila Gln Lau Tyr 390 Val Asn 395
CGC CCT TTA UAC CCA GAT gAA GGT CaC cTT CCA TCC CAC CTT AGT UCC 2736
Arg Ala Leu Asn Urg Asp 900 Clu Cly Cln Lau Ala Ser Asp Val 905 910 Ser Thr
CGT CAG TTC TTC UCT GAC TCG CUA CGT TAC AUT AAU CGT TAC AGT ACT 2784
Arg Cin Phe 915 Phe Thr Asp Trp Clu Arg Tyr Asn Lys Arg Tyr 520 925 Ser Thr
TGG CCT GGT CTC TCT CUA CTG CTC TUT TAT CCA GAA AUC TAT GTT CAT 2332
Trp Ala Cly 930 Val Ser Glu Leu Val Tyr Tyr Pro Glu Asn Tyr 935 940 Val Usp
CCC ACT CAG CGC ATT GCG CUA UCC UUU ATC ATG CAT GCG CTG TTC CAA 2880
Pro Thr Cln 945 Arg ile Gly 950 Cln Thr Lys Met Mec Asp Ala Leu ' 955 Leu Gln 960
TCC ATC AAC CUG UCC CAC CTU UAT CCC CAT ACG GTC GAA GUT GCT TTC 2923
Ser Ile Asn Cln Ser Gln 965 Leu Asn Ula Asp Thr Val Glu Asp 970 Ala Phe 975
UAA ACT TAT TTC ACC UGC TTT CAC CUG CTA GCA AAT CTG AUA CTA ATT 2976
Lys Thr Tyr Leu Thr Ser 980 Ph· Clu Gln Val Ala Asn Leu Lys 985 990 Val Il·
AGT CCT TAC CAC GAT AAT CTC AAT CTC CAT CAA GCU TTA ACT TAT TTT 3024
Ser Ala Tyr 995 His Asp Usn Val Asn Val Asp Gln Gly Leu Thr 1000 1005 Tyr Phe
ATC CCT ATC GAC CUA GCA GCT CCG CGT ACG TUT TAC TGG CGT ACT GTT 3072
ile Cly ile 1010 Usp Gln Ala Ala Pro Cly Thr Tyr Tyr Trp Urg 1015 1020 Ser Val
GUT CAC ACC AUA TGT GAA AAT GGC AUC TTT CCC CCT AUT GCT TGG GCT 3120
Asp His Ser 1025 Lys Cys Clu Asn Gly Lys Phe Ala Ala Asn Ula 1030 1035 Trp Gly 1040
CAG TGG AUT AAU ATT ACC TCT GCT CTC AAT CCT TGG AUA AAT UTC UTC 3168
Clu Trp Asn Lys Il· Thr 1045 Cys Ala Val Usn Pro Trp Lys Usn 1050 Ile Il· 1055
CGT CCG CTT CTT TAT UTG TCC CCC TTA TUT CTG CTA TGG CTG GUC CAC 3216
Arg Pro Val Val Tyr Met 1060 Ser Arg Leu Tyr Lau Leu Trp Leu Glu Gln 1065 1070
CAA TCA AAC AAU ACT CAT CUT CCT AAU ACC ACC ATT TAT CUA TAT AAC 3264
Gln Ser Lys 1075 Lys Ser Asp Usp Gly Lys Thr Thr Ile Tyr Cln 1080 1085 Tyr Asn
TTU AAA CTC GCT CAT ATT CGT TAC GAC GGT UGT TCG AAT ACA CCA TTT 3312
Lau Lys Leu 1090 Ala His Ile Urg Tyr Usp Gly Ser Trp Usn Thr 1095 1100 Pro Ph·
ACT TTT CUT GTG ACA CUA UAC CTA AAA AUT TAC ACC TCC ACT ACT CAT 3360
Thr Phe Asp 1105 Val Thr Glu 1110 Lys Val Lys Asn Tyr Thr Ser Ser 1115 Thr Asp 1120
CCT GCT CUA TCT TTU GCG TTG TAT TCT ACT CGT TAT CAA CGG CAA CAC 3403
Ala Ala Clu Sar Leu Gly 1125 Leu Tyr Cys Thr Cly Tyr Gln Cly 1130 Glu Asp 1135
UCT CTA TTA GTT UTG TTC TAT TCG ATG CAC UCT AGT TAT AGC TCC TAT 3456
Thr Leu Leu Val Mac Phe 1140 Tyr Sar Mac Cln Ser Ser Tyr Ser 1145 1150 Sar Tyr 1
ACC CAT AAT AAT CCC CCC CTC ACT GCC CTU TAT ATT TTC CCT GAT UTC 3 504
180
186 242
tu r Ssp Ssn Asn liS5 Sla Pro Val Thr 11 ó i Gly ć Leu Tyr Ile Phe 116 sla 5 Ssp .Mec
tg a . TCA GAC AAT ATG SCG AnT acA CSA GCA SCT ASC TAT TGG AAT Sac 3 7 7 2
Ser Ser Ssp Ssn Mec Thr Acn Ala Gln Sla Thr Ssn Tyr Trp Ssn Asn
1170 1175 1130
SGT TAT CCG CSA TTT GAT ACT GTG ATG GCA GAT CCG GAT AGC GSC SAT 3600
Ser Tyr Pro Gln Phe -Ssp Thr Val Mec Sla Ssp Pro Ssp Ser Ssp Ssn
1135 1190 1195 1200
-SSA AAA GTC STA ACC ATS AGA GTT AAT SSC CGT TAT GCG GST GST TST 3643
Lys Val Ile Thr Srg Arg Val Ssn Asn Srg Tyr Ala Glu Ssp Tyr
1205 1210 1215
GSA STT CCT TCC TCT GTG SCA STT SAC SGT SST TAT TCT TTG GTT GAT 3696
Glu Ile Pro Ser Ser Va 1 Thr Ser Ssn Ser Asn Tyr Ser Trp Gly Ssp
1220 1225 1230
CSC AGT TTA ACC ATG CTT TAT GGT GTT SGT GTT CCT SAT STT ACT TTT 3744
His. Ser Leu Thr Mec Leu Tyr Tly Gly Ser Val Pro Ssn Ile Thr Phe
1235 1240 1245
GSA TCG GCG GCA GSA TAT TTA AGG CTA TCT SCC SAT STG GCS TTG SGT 3792
Glu Ser Sla Ala Glu Asp Leu Arg Leu Ser Thr Asn Mec ma Leu Ser
1250 1255 1260
ATT ATT CAT AST GGA TAT GCT GGA ACC CGC CGT ATA CSA TGT AST CTT 3840
Ile Ile His Ssn Gly Tyr Sla Gly Thr Srg Arg Ile Gln Cys Asn Leu
1265 1270 1275 1280
ATT SAS CAA TAC GCT TCA TTA GGT GAT ASS TTT ATA ATT TAT GAT TCA 3388
Mec Lys Gln Tyr Ala Ser Leu Gly Ssp Lys Phe Ile Ile Tyr Asp Ser
1285 1290 1295
TCA TTT GAT GAT TCA SSC CGT TTT AST CTG GTT CCS TTG TTT SSA TTC 3936
Ser Phe Asp Asp Ala Ssn Arg Phe Asn Leu Val Pro Leu Phe Lys Phe
1300 1305 1310
GGA AAA GAC GAG AAC TCA GAT TAT ATT ATT TGT ATA TAT SAT GAS SAC 3984
Gly Lys Asp Glu Ssn Ser Asp Ssp Ser Ile Cys Ile Tyr Ssn Glu Asn
1315 1320 1325
CCT TCC TCT GAA GAT SAT ASG TTG TAT TTT TCT TCG SSA GST GAC AST 4032
Pro Ser Ser Glu Ssp Lys Lys Trp Tyr Phe Ser Ser Lys Ssp Ssp Asn
1330 1335 1340
SAA ACA GCG GAT TAT SAT GGT GGA ACT CAA TTT ATS GST GCT GGA AC C 4080
Lys Thr Ala Ssp Tyr Ssn Tly Gly Thr Gln Cys Ile Asp Sla Tly Thr
1345 1350 1355 1350
AGT SAC SAS GAT TTT TAT TAT SAT CTC CAG GAT STT GSA GTS ATT AGT 4123
Ser Ssn Lys Ssp Phe Tyr Tyr Asn Leu Gln Glu Ile Glu Val Ile Ser
1365 1370 1375
GTT ACT GGT GTG TAT TGG TCT AGT TAT SSA STA TCC SAC CCG STT AAT 4176
Val Thr Gly Gly Tyr Trp Sar Ser Tyr Lys Ile Ser Ssn Pro Ile Asn
1330 1385 1390
STC AAT ACG GGC ATT GAT ATT GCT ASA GTA SAS GTC ACC GTA SAA GCG 4224
Ile Ssn Thr Gly Ile Asp Ser Ala Lys Val Lys Val Thr Val Lys Sla
1395 1400 1405
GGT GGT GAC GAT CAA ATC TTT ACT GCT GAT AST AGT SCC TAT TTT CCT 4272
Gly Gly Asp Asp Gln Ile Phe Thr Sla Ssp Asn Ser Thr Tyr Val Pro
1410 1415 1420
CSG CAA CCG TCA CCC SGT TTT GAG GAG STG STT TAT CAT TTC SAT AAC 4320
Gin Gln Pro Sla Pro Ser Phe Glu Glu Mec Ile Tyr Gin Phe Ssn Ssn
1425 1430 1435 1440
186 242
181
CTG· GAA GAA GAC ACC .AGT TCG AAT GCA CAA CAA CTG GAC TCC — _ł.-M
Leu Giu Glu Asp Thr Ser Trp Usn Ala Gln Glm Leu Asp Sar Thr Asp
1730 1735 1740
u. A GAT GCT GTA GCC CAA GAT GAT CCG ATG CAC TAC AAG GTG GCT ACC 3233
Pro Asp Ala Val Ala Glm Asp Asp Pro Mec His Tyr Lys Val Ala Thr
1745 1750 1755 1760
ATG GCG ACG TTG GAT CTG CTA ATG GCC CGT GGT GAT GCT GCT TAC 5323
Pme Mec Ala Thr Leu Asp Leu Leu Mec Aia Arg Gly Asp Ala Ala Tyr
1755 1770 17/5
CGC CAG TTA GAG CGT GAT ACG TTG GCT GAA GCT AAA ATG TGG TAT ACA 5376
Arg Glm Leu Glu Arg Asp Thr Leu Ala Glu Ala Lys Mec Trp Tyr Thr
1780 1735 179C
CAG GCG CTT AAT CTG TTG GGT GAT GAG CCA CAA GTG ATG CTG AGT ACG 542 -
Glm Ala Leu Asm Leu Leu Gly Asp Glu Pro Glm Val Mec Leu Ser Thr
1795 1300 1805
.ACT TGG GCT AAT CCA ACA TTG GGT AAT GCT GCT TCA AAA ACC ACA CAG 5472
Thr Trp Ala Asm Pro Thr Leu Gly Asn Ala Ala Ser Lys Thr Thr Glm
1310 1315 1320
CAG GTT CGT CAG CAA GTG CTT ACC CAG TTG CGT CTC AAT AGC AGG GTA 5520
Glm Val Arg Glm Gln Val Leu Thr Gln Leu •Arg Leu Asm Ser .Arg Val
1825 1330 1335 1840
AAA ACC CCG TTG 5532 Lys Thr Pro Leu
1344 ( 2 ) Dame dla sekwencji SEK NR ID: 53;
(i) Charakterystyka sekwencji:
( A ) Długość: 1844 aminokwasów ( B ) Typ: aminokwas ( C ) Rodzaj nici: pojedyncza (D ) Topologia: liniowa ( u ) Typ cząsteczki: białko
( X ) Cpis sekwencji: SEK NR ID: 49 ( TcbAii);
Cechy Cd Do Cpis
Peptyd 1 1844 peptyd TcbAii
Fragment 1 11 ( SEK NR ID: 1 )
Fragment 978 990 ( SEK NR ID: 23 )
Fragment 1387 1401 ( SEK NR ID: 22 )
Fragment 1484 1505 ( SEK NR ID: 24 )
Fragment 1527 1552 ( SEK NR ID: 21 )
Phe i Ile Glm Gly Tyr 5 Ser Asp Leu Phe Gly 10 Asn Arg Ala top Asm 15 Tyr
Ala Ala Pro Gly 20 Ser Val Ala Ser Mec 25 Phe Ser Pro Ala Ala 30 Tyr Leu
Thr Glu Leu 35 Tyr Arg Glu Ala Lys 40 Asn Leu His Asp Sec 45 Ser Ser He
Tyr Tyr 50 Leu Asp Lys •Arg -Arg 55 Pro Asp Leu Ala Ser 50 Leu Mec Leu Ser
Glm 55 Lys Asm Mec Asp Glu 70 Glu Ile Ser Thr Leu 75 Ala Leu Ser Asp. Glu 30
Leu Cys Leu Ala Gly Ile Glu Thr Lys Thr Gly Lys Ser Glm Asp Glu
182
186 242
30 95
Val Mee Asp Met 100 Leu Ser Tyr Arg 105 Leu Ser Gly Glu Thr 110 Pro Tyr
His His Ala 115 Tyr Glu Thr Val Arg 120 Glu Ile Val His Glu 125 Arg Asp Pro
Gly Phe 130 Arg His Leu Ser Gln 135 Ala Pro Ile Val Ala 140 Ala Lys Leu Asp
Pro 145 Val Thr Leu Leu Gly 150 Ile Ser Ser His Ile 155 Ser Pro Glu Leu Ty*· 1S0
Asn Leu Leu Ile Glu 165 Glu Ile Pro Glu Lys 170 Asp Glu Ala Ala Leu 175 Asp
Thr Leu Tyr Lys 130 Thr Asn Phe Gly Asp 135 Ile Thr Thr Ala Gln 190 Leu Mee
Ser Pro Ser 195 Tyr Leu Ala Arg Tyr 200 Tyr Gly Val Ser Pro 205 Glu Asp Ile
Ala Tyr 210 Val Thr Thr Ser Leu 215 Ser His Val Gly Tyr 220 Ser Ser Asp Ile
Leu 225 Val Ile Pro Leu Val 230 Asp Gly Val Gly Lys 235 Met Glu Val Val Arg 240
Val Thr Arg Thr Pro 245 Ser Asp Asn Tyr Thr 250 Ser Gln Thr Asn Tyr 255 Ile
Glu Leu Tyr Pro 260 Gln Gly Gly Asp Asn 265 Tyr Leu Ile Lys Tyr 270 Asn Leu
Ser Asn Ser 275 Phe Gly Leu Asp Asp 230 Phe Tyr Leu Gln Tyr 235 Lys Asp Gly
Ser Ala 290 Asp Trp Thr Glu Ile 295 Ala His Asn Pro Tyr 300 Pro Asp Met Val
Ile 305 Asn Gln Lys Tyr Glu 310 Ser Gln Ala Thr Ile 315 Lys Arg Ser Asp Ser 320
Asp Asn Ile Leu Ser 325 Ile Gly Leu Gln Arg 330 Trp His Ser Gly Ser 335 Tyr
Asn Phe Ala Ala 340 Ala Asn Phe Lys Ile 345 Asp Gln Tyr Ser Pro 350 Lys A.la
Phe Leu Leu 355 Lys Met Asn Lys Ala 360 Ile Arg Leu Leu Lys 365 Ala Thr Gly
Leu Ser 370 Phe Ala Thr Leu Glu 375 Arg Ile Val Asp Ser 330 Val Asn Ser Thr
Lys 335 Ser Ile Thr Val Glu 390 Val Leu Asn Lys Val 395 Tyr Arg Val Lys Phe 400
Tyr Ile Asp Arg Tyr 405 Gly Ile Ser Glu Glu 410 Thr Ala Ala Ile Leu 415 Ala
Asn Ile Asn Ile 420 Ser Gln Gln Ala Val 425 Gly Asn Gln Leu Ser 430 Gln Phe
Glu Gln Leu 435 Phe Asn His Pro Pro 440 Leu Asn Gly Ile Arg 445 Tyr Glu Ile
Ser Glu 450 Asp Asn Ser Lys His 455 Leu Pro Asn Pro Asp 460 Leu Asn Leu Lys
186 242
183
Pro 4 6 5 ' Ser A Ly Asp 470 Nsp G 1 -JA., Crg Lys Tla 475 Vsl Leu Lys Trg Ala 4 8 0
Phe Tl o . Va l Tsn Cla 435 Ser Alu Lnu Ayr Aln 490 Met Leu Leu T 1 - 4. i β Thr 495 Gsp
Crg Lys Tlu Csp 500 Tly Val Ile Lys Tsn 505 Tsn Leu Tlu Gsn Leu 510 Ser Gsp
Leu Ayr Leu 515 Vrl Ser Leu Leu Tla 520 Aln Ile His Gsn Leu 525 Chr Ile Ala
Tlu Leu 530 Tsn Ile Leu Leu Val 535 Ile Cys u./ Ayr Tly 540 Asp Chr Gsn Ile
Ayr 545 Aln Ile Chr Asp Asp 550 Tsn Lau Gla Lys Ile 555 Val Tlu Thr Leu Leu 5 60
Arp Ile Chr Tln Arp 5 65 Leu Lys Ahr Tln Lys 570 Arp Ahr Val Ahr -Gsp 575 Leu
Phe Leu Mer Chr 580 Ahr Cla Ahr Ayr Ser 585 Thr Ahr Leu Ahr Pro 590 Tlu Ile
Ser Gsn Leu 595 Ahr Ala Ahr Leu Ser 600 Ser Thr Lau His Tly 605 Lys Alu Ser
Leu Ile 610 Tly Tlu .Asp Leu Lys 615 Grg Cla Met Cla Pro 620 Ays Phe Ahr Ser
Cla 625 Leu His Leu Ahr Ser 630 Tln Tlu Vłl Tla Ayr 635 Asp Leu Leu Leu Arp 640
Ile Asp Tln Ile Gln 645 Pro Cla Tln Ile Chr 650 Vrl Asp Tly Phe Arp 655 Alu
Alu Vłl Tln Chr 660 Ahr Pro Chr Ser Leu 665 Lys Val Ile Ahr Phe 670 Cla Tln
Vłl Leu Tia 67 5 Tln Leu Ser Leu Ile 630 Ayr Crg Grg Ile Gly 685 Leu Ser Tlu
Chr Alu 690 Leu Ser Leu Ile Vrl 695 Thr Tln Ser Ser Leu 700 Leu Val Gla Tly
Lys 705 Ser Ile Leu Asp His 710 Tly Lau Leu Ahr Leu 715 Met Cla Leu Tlu Tly 720
Phe~ His Ahr Arp Val 725 Gsn Tly Leu Tly Tln 730 His Gla Ser Leu Ile 735 Leu
.Gla Gla Leu Lys 740 Asp Tly Cla Leu Ahr 745 Val Ahr Gsp Val Cla 750 Tln Cla
Met Gsn Lys 755 Alu Tlu Ser Leu Leu 760 Tln Met Cla Cla ten 765 Aln Val Tlu
Lys Csp 770 Leu Ahr Lys Leu Ahr 775 Ser Arp Chr Gln Ile 780 Gsp Gla Ile Leu
Tln 735 Arp Leu Tln Met Ser 790 Ser Gla Leu Cla Val 795 Ser Pro Leu Asp Leu 300
Ala Tly Mec Met Ala 305 Leu Lys Ayr Tly Ile 310 Gsp His A.sn Ayr .Gla 315 Ala
Trp Aln Ala .Ala 320 Gla Gla Gla Leu Met 825 Tla Gsp His Cla Gsn 830 G l n Tla
tIo Lys Lys 335 Lau Gsp Tlu Thr Phe 340 Ser Lys Tia Leu Cys 845 Tsn Ayr Ayr
184
186 242
Ile A.s n 350 Ala /al /al Asp Ser 355 Ala Ala Gly /al •Arg 860 Asp •Arg .-iS n
Leu iy-r Thr Tyr Leu Leu Ile .Asp Asn Gln /a i Ser Aia Asp /al ILe
3 6 5 370 375 880
Thr Ser .Arg Ile Ala Glu Ala I la Ala Gly Ile Gln Leu Tyr /al Asn
885 890 395
.Arg Aia Leu Asn Arg Asp Glu Gly Gln Leu Ala Ser Asp /al Ser Thr
900 905 910
Arg Gln Phe Phe Thr Asp Trp Glu Arg Tyr Asn Lys Arg Tyr Ser Thr
915 920 925
Trp Aia Gly /al Ser Glu Leu /al Tyr Tyr Pro Glu Asn Tyr /al Asp
530 935 940
Pro Thr Gln Arg Ile Gly Gln Thr Lys Mec Met Asp Ala Leu Leu Gln
945 950 955 960
Ser Ile Asn Gln Ser Gln Leu Asn Ala Asp Thr /al Glu Asp Ala Phe
965 970 975
Lys Thr Tyr Leu Thr Ser Phe Glu Gln /al Ala Asn Leu Lys /al Iie
980 985 990
Ser Ala Tyr His -Asp Asn /al Asn /al Asp Gln Gly Leu Thr Tyr Phe
995 1000 1005
Ile Gly Ile Asp Gln Aia Ala Pro Gly Thr Tyr Tyr Trp Arg Ser /al
1010 1015 1020
Asp His Ser Lys Cys Glu Asn Gly Lys Phe Ala Ala Asn Ala Trp Gly
1025 1030 1035 1040
Glu Trp Asn Lys Ile Thr Cys Ala /al Asn Pro Trp Lys Asn Ile Ile
1045 1050 1055
Arg Pro /al /al Tyr Mec Ser Arg Leu Tyr Leu Leu Trp Leu Glu Gln
1060 1065 1070
Gln Ser Lys Lys Ser Asp Asp Gly Lys Thr Thr Ile Tyr Gln Tyr Asn
1075 1080 1085
Leu Lys Leu Ala His Ile Arg Tyr Asp Gly Ser Trp Asn Thr Pro Phe
1090 1095 1100
Thr Phe Asp /al Thr Glu Lys /al Lys Asn Tyr Thr Ser Ser Thr Asp
1105 1110 1115 1120
Ala Ala Glu Ser Leu Gly Leu Tyr Cys Thr Gly Tyr Gln Gly Glu .Asp
1125 1130 1135
Thr Leu Leu /al Met Phe Tyr Ser Mec Gln Ser Ser Tyr Ser Ser Tyr
1140 1145 1150
Thr Asp Asn Asn Ala Pro /al Thr Gly Leu Tyr Ile Phe Ala Asp Mett
1155 1160 1165
Ser Ser Asp Asn Met Thr Asn Ala Gln Ala Thr Asn Tyr Trp Asn Asn
1170 1175 1130
Ser Tyr Pro Gln Phe Asp Thr /al Mec Aia Asp Pro •Asp Ser Asp Asn
1135 1190 1195 1200
Lys Lys /al Ile Thr .Arg Arg /al Asn Asn Arg Tyr Ala Glu .Asp Tyr
1205 1210 1215
Glu Ile Pro Ser Sar /al Thr Ser Asn Ser Asn Tyr Ser Trp Gly Asp
186 242
185
1225 1230
H i s Ser Leu Thr Met Leu Tyr Gly Gly Ser Val Pro Asn ile Thr Phe
123 5 1240 1245
Glu Ser Ala Ala Glu Asp Leu Arg Leu Ser Thr Asn Mec Ala Leu Ser
1250 1255 5 1260
ΐ i — ile His Asn Gly Tyr Ala Gly Thr .Trg Trg Ile Gln Cys Tsn Leu
1 6 5 i u 5 1270 1)5 i. < 5 1230
Mec Lys Gln Tyr .Ala Ser Leu Gly Tsp Lys Phe Ile Ile Tyr top Ser
1235 1290 1295
Ser Phe .Tsp Tsp Ala Tsn Arg Phe Tsn Leu Cal Pro Leu Phe Lys Phe
1300 1305 1310
Gly Lys .Tsp Glu Tsn Ser Tsp Tsp Ser Ile Cys Ile Tyr ton Glu Asn
1315 1320 1325
Pro Ser Ser Glu Tsp Lys Lys Trp Tyr Phe Ser Ser Lys top top ton
1330 1335 1340
Lys Thr Ala Tsp Tyr Tsn Gly Gly Thr Gln Cys Ile top Tla Gly Thr
1345 1350 1355 1360
Ser Tsn Lys Tsp Phe Tyr Tyr Tsn Leu Gln Glu Ile Glu Cal Ile Ser
1365 1370 1375
Cal Thr Gly Gly Tyr Trp Ser Ser Tyr Lys Ile Ser ton Pro Ile ton
1380 1385 1390
Ile Tsn Thr Gly Ile Tsp Ser Ala Lys Val Lys Cal Thr Cal Lys Ala
1395 1400 1405
Gly Gly Tsp Tsp Gln Ile Phe Thr Ala top ton Ser Thr Tyr Cal Pro
1410 1415 1420
Gln Gln Pro Ala Pro Ser Phe Glu Glu Mec Ile Tyr Gln Phe Asn ton
1425 1430 1435 1440
Leu Thr Ile Tsp Cys Lys Tsn Leu ton Phe Ile top ton Gln Ala His
1445 1450 1455
Ile Glu Ile Asp Phe Thr Ala Thr Ala Gln top Gly Arg Phe Leu Gly
1460 1465 1470
Tla Glu Thr Phe Ile Ile Pro Cal Thr Lys Lys Cal Leu Gly Thr Glu
1475 148( 1485
Tsn Cal Ile Ala Leu Tyr Ser Glu Asn Asn Gly Cal Gln Tyr Mec Gln
1490 1495 150(
Ile Gly Ala Tyr Arg Thr Arg Leu Tsn Thr·Leu Phe Ala Gln Gln Leu
1505 1510 1222 i 1520
Cal Ser Arg Ala Tsn Arg Gly Ile top Ala Cal Leu Ser Mec Glu Thr
1525 153 ( 1535
Gln Tsn Ile Gln Glu Pro Gln Leu Gly Tla Gly Thr Tyr Cal Gln Leu
1540 1545 1550
Cal Leu Tsp Lys Tyr Tsp Glu Ser Ile His Gly Thr ton Lys Ser Phe
1222 1560 1565
Tla Ile Glu Tyr Cal Tsp Ile Phe Lys Glu ton top Ser Phe Cal Ile
1570 1575 1580
(yr Gln Gly Glu Leu Ser Glu Thr Ser Gin Thr Cal Cal Lys Cal Phe
285 1590 1595 1600
186
186 242
Ls“ i e r Tyr Phe lle 1Ó0: GLu 5 Al a Thr G i y Asn Lys 1610 A.sn His Leu Trp Val 1615
•Arg Ala Lys Tyr Gln Lys Glu Thr Thr Asp Lys Ie Leu Phe Asp Arg
1520 1625 1630
Thr Asp Glu Lys Asp Pro His Gly Trp Phe Leu Ser Asp Asp His Lys
1535 1640 1645
Thr Phe Ser Gly Leu Ser Ser Ala Gln Ala Leu Lys Asn Asp Ser Glu
i o 5 0 1655 i o 6C 1
Pro Mec Asp Phe Ser Gly Ala Asn .Ala Leu Tyr Phe Trp Glu Leu Phe
1665 157C 1675 1680
Tyr Tyr Thr Pro Mec Mec Mee Ala His Arg Leu Leu Gln Glu Gln Asn
1635 169C 1695
Phe Asp Ala Ala Asn His Trp Phe Arg Tyr Val Trp Sar Pro Ser Gly
1700 1705 1710
Tyr Ile Val Asp Gly Lys Ile Ala Ile Tyr His Trp Asn Val Arg Pro
1715 1720 1725
Leu Glu Glu Asp Thr Ser Trp Asn Ala Gln Gln Leu Asp Ser Thr Asp
1730 1735 1740
Pro Asp Ala Val Ala Gln Asp Asp Pro Mec His Tyr Lys Val Ala Thr
1745 1750 1755 17 60
Phe Mec Ala Thr Leu Asp Leu Leu Mec Ala Arg Gly Asp Ala Ala Tyr
1765 1770 1775
Arg Gln Leu Glu Arg Asp Thr Leu Ala Glu Ala Lys Mec Trp Tyr Thr
1730 1785 1790
Gln Ala Leu Asn Leu Leu Gly Asp Glu Pro Gln Val Mec Leu Ser Thr
1795 1300 1805
Thr Trp Ala Asn Pro Thr Leu Gly Asn Ala Ala Ser Lys Thr Thr Gln
1310 1815 182C
Gln Val Arg Gln Gln Val Leu Thr Gln Leu Arg Leu Asn Ser Arg Val
1325 1330 1835 1340
Lys Thr Pro Leu 1344 ( 2 ) Dane dla sekwencji SEK NR ID: 54;
(i) Charakterystyka sekwencji:
( A ) Długość: 1722 par zasad ( B ) Typ: kwas nukleinowy ( C ) Rodzaj nici: podwójna ( D ) Topologia: liniowa (ii) Typ cząsłeczki: DNA (genomowa) ( xi) Opis sekwencji. SEK NR ID. 54 ( TcbAiii obszar kodowania);
CTA lajA ACA CCC AAT TCC CTG ACC TCT TTA TTC CTG CCG GAA AAT 43
Leu Gly Thr Ala Asn Ser Leu Thr Ala Leu Phe Leu Pro Gln Glu Asn
I 5 10 15
AGC ,-waj CTC AAA aj\jA_ TAC TGG CGG ACA CTG GC*j CAG CGT ATG TTT AAT 96
Ser f · / — 2 3 Leu Lys Gly Tyr Trp Arg Thr Leu Ala Gln •Arg Mec Phe Asn
20 25 30
186 242
187
TTA CCT Leu Arg 3 5 -Χ-. x As n — X -J . Leu ! x — j - Ile j Ir. Pro Lsu 45 X X -J Lsu Pro Lsu X -i -i
• Asp 40 U - i
TAT TCT ' .AAA . CCG GCT GAT CCA AAA J — - TTA CTG Ł GCG GCC -jTT -T»/-' » a 3 £
Τ’.-'Τ .-\id Lys Pro Aia Asp Pro Lys .Aia Leu Leu Ser Ala Ala '/a i Ser
50 55 50
-JM Ł 1^1 C.AA GGG GGA GCC /»λμ TTG CCG AAG /—/—/— —I1.— CGG CTG ACT ATT CAC 240
Ala Ser Gin Gly Giy Ala Asp Leu Pro Lys Axd Pro Leu Thr Ile His
5 5 70 OS 30
CCC TTC CCT CAA ATG CTA GAA GGG GCA CGG TTG GTT AAC CAG CTT 233
Arg Phe Pro Gln Mec Lau Glu Gly Aia Arg Gly Leu Val Asn Gln Leu
35 90 95
ATA CAG TTC GGT AGT TCA CTA TTG GGG TAC AGT GAG CGT CAG GAT GCG 3 3 6
Ile Gln Phe Gly Ser Ser Leu Leu Gly Tyr Ser Giu Arg Gln Asp Ala
100 105 110
GAA GCT ATG AGT C.AA CTA CTG CAA ACC CAA GCC AGC GAG TTA ATA CTG 334
Glu Ala Mec Ser Gln Leu Leu Gln Thr Gin Ala Ser Glu Leu Ile Leu
115 120 125
ACC AGT ATT CGT ATG CAG GAT AAC CAA TTG GCA GAG CTG GAT TCG GAA 432
Thr Ser Ile Arg Mec Gln Asp Asn Gln Leu Ala Glu Leu Asp Ser Glu
130 135 140
.AAA ACC GCC TTG CAA GTC TCT TTA GCT GGA GTG CAA CAA CGG TTT GAC 430
Li’ s Thr Ala Leu Gln Val Ser Leu Ala Gly Val Gln Gln Arg Phe Asp
145 150 155 160
AGC TAT AGC CAA CTG TAT GAG GAG AAC ATC AAC GCA GGT GAG CAG CGA 523
Ser T/r Ser Gln Leu Tyr Glu Glu Asn Ile Asn Ala Gly Glu Gln Arg
165 17 0 175
GCG CTG GCG TTA CGC TCA GAA TCT GCT ATT GAG TCT CAG GGA GCG CAG 57 5
Ala Leu Ala Leu Arg Ser Glu Ser Ala Ile Glu Ser Gln Gly Ala Gln
180 185 190
ATT TCC CGT ATG GCA GGC GCG GGT GTT GAT ATG GCA CCA AAT ATC TTC 624
Ile Ser Arg Mec Ala Gly Ala Gly Val Asp Met Ala Pro Asn Ile Phe
195 200 205
GGC CTG GCT GAT GGC GGC ATG CAT TAT GGT GCT ATT GCC TAT GCC ATC 57 2
Gly Leu Ala Asp Gly Gly Mec His Tyr Gly Ala Ile Ala Tyr Ala Ile
210 215 220
GCT GAC GGT ATT GAG TTG AGT GCT TCT GCC AAG ATG GTT GAT GCG GAG 720
Ala Asp Gly Ile Glu Leu Ser Ala Ser Aia Lys Mec Val Asp Ala Glu
225 230 235 240
AAA GTT GCT CAG TCG GAA ATA TAT CGC CGT CGC CGT CAA GAA TGG AAA 763
Lys Val Ala Gln Ser Glu Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys
245 250 255
ATT CAG CGT GAC AAC GCA CAA GCG GAG ATT AAC CAG TTA AAC GCG CAA 316
Ile Gln Arg Asp Asn Ala Gln Ala Glu Ile Asn Gln Leu Asn Ala Gln
260 265 270
CTG GAA TCA CTG TCT ATT CGC CGT GAA GCC GCT GAA ATG CAA AAA GAG 3 6 4
Leu Glu Ser Leu Ser Ile Arg Arg Glu Ala Ala Glu Mec Gln Lys Glu
275 280 285
TAC CTG AAA ACC CAG CAA GCT CAG GCG CAG GCA CAA CTT ACT TTC TTA 912
T/r Leu Lys Thr Gln Gln Ala Gln Ala Gln Ala Gln Leu Thr Phe Leu
290 295 300
AuA AGC AAA TTC AGT AAT CAA GCG TTA TAT AGT TGG TTA CGA GGG -J 1 5 5 2
Arg Ser Lys Phe Ser Asn Gln Ala Leu » T- *· I - Ser Trp Leu Arg Giy Arg
3 25 3 10 3 15 320
188
186 242
T TG Leu . - .A Sar gGT Cly UTT ile TAT T* -r • l · 325 Pha CAG Cln Phe TAT Tyr CAC Usp 330 TTG Leu CCC Ala ,GTA Val TCA Ser CCT Arg 335 TCC Cys 10 03
CTG ATG CCA CAG CUA TCC TAT CAA TGG CAA GCT UAT CUT AUT TCC ATT 1056
Leu Mec Ala Clu Cln Ser Tyr Gin Trp Clu Ala Asn Asp Asn Ser il·
340 345 350
uCC TTT CTC .UUU CCG CCT CCU TGG CUA CCA ACT TAC GCC GGC TTA TTG 1101
Sar Ph· p . 1 Lys Pro Cly Ala Trp Gln Cly Thr Tyr Ala Gly Lcu Leu
355 360 365
TGT GGA CUA CCT TTG ATA CAA AUT CTG CCA CAA ATG CUA GUC GCA TAT 1152
cys Gly Clu Ala Leu Ile Gln Asn Lcu Ala CLn Mec Glu Clu Ala Tyr
370 375 380
CTG AAA TCC CAU TCT CCC GCT TTC CUA CTU GUA CGC ACC CTT TCA TTC 1200
Lau Lys Trp Glu Ser Arg Ala Leu Glu Val Clu Arg Thr Val Ser Leu
335 390 395 400
GCA GTC CTT TAT GUT TCU CTG GAA CGT AAT GUT CGT TTT AAT TTA GCG 1243
Ala Val Val Tyr Asp Ser Leu Glu Gly Asn Asp Arg Phe Usn Leu Ula
405 410 415
GAA CAA ATU CCT CCU TTA TTG CAT AAG GCG GAG GGA ACA GCA GGA ACT 1296
Clu Cln Ile Pro Ala Leu Leu Usp Lys Cly Glu Cly Thr Ula Gly Thr
420 425 430
AAA CUA AAT CGG TTA TCA TTC GCT AUT CCT ATC CTC TCA GCT TCC CTC 1344
Lys Glu Asn Cly Leu ser Leu Ula Usn Ala Ile Leu Ser Ula Ser Val
435 440 445
UAA TTG TCC GUC TTG AUU CTC GGU UCC GUT TAT CCU GAC UGT UTC GTT 1392
Lys Lcu Ser Asp Lcu Lys Leu Gly Thr Asp Tyr Pro Usp Ser II· Val
450 455 460
CGT UCC AAC AAC GTT CCT CCT UTT UUG CAA UTC ACT GTT TCC CTU CCT 1440
Cly Ser Usn Lys Val Arg Arg II· Lys Gln Ile Ser Val Ser Leu Pro
465 470 475 430
CCA TTG GTT GCG CCT TUT CAC GAT GTT CAC GCT UTC CTC ACC TAT GGT 1488
Ala Leu Val Cly Pro Tyr Cln Usp Val Gln Ala Mec Leu Ser Tyr Cly
485 490 495
CCC UCT ACT CUA TTC CCC AUU GGT TGT TCA GCC TTG GCT GTC TCT CAT 1536
Cly Ser Thr Cln Leu Pro Lys Cly Cys Ser Ula Leu Ala Val Ser His
500 505 510
CCT UCC AAT CAT UGT GCT CAC TTC CAC TTG GAT TTC UAT GAC GCC AAU 1534
Cly Thr Asn Asp Ser Gly Cln Ph· Cln Lau Asp Phe Usn Usp Gly Lys
515 520 525
TAC CTG CCA TTT CUA GCT UTT GCT CTT GAT GAT CUC GGT UCA CTG AAT 1632
Tyr Leu Pro Ph· Clu Gly Il· Ula Leu Asp Asp Cln Gly Thr Leu Usn
530 535 540
CTT CUA TTT CCG AAT GCT UCC GAC AAG CAC AUA GCA ATA TTG CAU ACT 1630
Leu Gln Phe Pro Asn Ula Thr Asp Lys Gln Lys Ala Ile Leu Cln Thr
545 550 555 560
ATG AGC CUT ATT UTT TTG CAT ATT CCT TUT ACC ATC CCT TAA 1722
Mec Ser Asp Ile Ile Leu His Ile Urg Tyr Thr Ile Urg • · ·
565 570 573
( 2 ) Dane dla sekwencji SEK NR ID: 55;
(i) Charakterystyka sekwencji:
( A ) Długość: 573 aminokwasów (B ) Typ: aminokwas
186 242
189 ( C ) Rodzaj nici: pojedyncza ( D ) Topologia: liniowa
(ii) Typ cząsteczki: białko
( xi) Opis sekwencji: SEK NR ID: 55 (TcbAiii);
Leu £ : Gly Thr Tla Tsn Ser 5 Leu Thr Ala Leu Phe Leu Pro Gin Clu Asn 10 15
Ser Lys Leu Lys Cly Tyr 20 Trp Arg Thr Leu A1a Gln Arg Mee Phe Asn 25 30
Leu Arg His Asn Leu Ser 35 Ile Asp Gly Gin Pro Leu Ser Leu Pro Leu 40 45
Tyr Ale Lys Pro Ale Asp 50 Pro Lys Ale Leu Leu Ser Ale A1a Val Ser 55 60
A1a 65 Ser Gln Gly Gly Ala 70 Asp Leu Pro Lys Ale Pro Leu Thr Ile His 75 80
Arg Phe Pro Cln Mee Leu 85 Clu Gly Ale Arg Gly Leu Vel Asn Cln Leu 90 95
Ile Gln Phe Gly Ser Ser 100 Leu Leu Gly Tyr Ser Glu Arg Gln Asp Ala 105 110
Glu A1a Met Ser Gln Leu 115 Leu Cln Thr Cln Ala Ser Glu Leu Ile Leu 120 125
Thr Ser Ile Arg Mat Gln 130 Asp Asn Gln Leu Ale Glu Leu Asp Ser Glu 135 140
Lys 145 Thr Ale Leu Gln Va1 150 Ser Leu Ale Gly Va1 Gln Gln Arg Phe Asp 155 160
Ser Tyr Ser Gln Leu Tyr 155 Glu Glu Asn Ile Asn Ala Gly Glu Gln Arg 170 175
Ala Leu Ale Lau Arg Ser 130 Glu Ser Ala Ile Glu Ser Gln Gly A1a Gln 185 190
Ile Ser Arg Mee Ala Gly 195 Ale Cly Va1 Asp Met Ala Pro Asn Ile Phe 200 205
Gly Leu A1a Asp Gly Gly 210 Met His Tyr Gly A1a Ile A1a Tyr A1a Ile 215 220
Ale 225 Asp Gly Ile Glu Leu 230 Ser A1a Ser A1a Lys Met Va1 Asp Ala Glu 235 240
Lys Va1 A1a Gln Ser Glu 245 Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys 250 255
Ile Gln Arg Asp Asn A1a 260 Gln Ale Glu Ile Asn Gln Leu Asn A1a Gln 265 270
Leu Glu Ser Leu ser Ile 27 5 Arg Arg Glu Ala A1a Glu Met Gln Lys Glu 280 285
Tyr Leu Lys Thr Cln Cln 290 Ale Cln A1a Cln Ale Gln Leu Thr Phe Leu 295 300
Trg 305 Ser Lys Phe Ser Asn 310 Gln Ale Leu Tyr Ser Trp Leu Arg Gly Arg 315 320
Leu Ser Cly Ile Tyr Phe 325 Cln Phe Tyr Asp Leu A1a Vel Ser Arg Gys 330 335
190
186 242
Leu Mec Ala Glu Gln Ser Tyr Gln Trp Glu Ala Asn Asp Asn 350 Ser Ile
340 345
Ser Phe Val Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu
355 360 365
Cys Gly Glu Ala Lau Ile Gln Asn Leu Ala Gln Met Glu Glu Ala Tyr
370 375 330
Lau Lys Trp Glu Ser Arg Ala Leu Glu V<al Glu Arg Thr Val Ser Leu
335 390 395 400
Ala Val Val Tyr Asp Ser Leu Glu Gly Asn Asp Arg Phe Asn Lau Ala
405 410 415
Glu Gln Ile Pro Ala Leu Leu Asp Lys Gly Glu Gly Thr Ala Gly Thr
420 425 430
Lys Glu Asn Gly Leu Ser Leu Ala Asn Ala Ile Leu Ser Ala Ser Val
435 440 445
Lys Leu Ser Asp Leu Lys Leu Gly Thr Asp Tyr Pro Asp Ser Ile Val
450 455 460
Gly Ser Asn Lys Val Arg Arg Ile Lys Gln Ile Ser Val Ser Leu Pro
465 470 475 430
Ala Lau Val Gly Pro Tyr Gln Asp Val Gln Ala Mac Lau Ser Tyr Gly
435 490 495
Gly Ser Thr Gln Leu Pro Lys Gly Cys Ser Ala Leu Ala Val Ser His
500 505 510
Gly Thr Asn Asp Ser Gly Gin Phe Gln Leu Asp Phe Asn Asp Gly Lys
515 520 525
Tyr Lau Pro Phe Glu Gly Ile Ala Lau Asp Asp Gln Gly Thr Leu Asn
530 535 540
Leu Gln Phe Pro Asn Ala Thr Asp Lys Gln Lys Ala Ile Leu Gln Thr
545 550 555 560
Mac Ser Asp Ile Ile Leu His Ile Arg Tyr Thr Ile Arg • « ·
565 570 573
(2 ) Dane dla sekwencji SEK NR ID: 56;
(i) Charakterystyka sekwencji:
(A) Długość: 2898 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: podwójna (D) Topologia: liniowa (ii) Typ cząsteczki: DNA ( genomowa ) (xi) Opis sekwencji: SEK NR ID: 56 (tccA)
ATG AAT GAA CTG GGC AGT GGG CTG ATT TCG CGG ACC GAA GAG ATG GAC 43 1 Mec Asn Gln Leu Ala Ser Pro Lau Ile Ser Arg Thr Glu Glu Ile His 16
49 AAG TTA CCC GGT AAA TTG AGG GAT CTT GGT TAT AGC TGA GTG TTT GAT 9 6
17 Asn Lau Pro Gly Lys Leu Thr Asp Leu Gly Tyr Thr Ser Val Phe Asp 32
97 GTG GTA CGT ATG CCG CGT GAG CGT TTT ATT CGT GAG CAT CGT GCT GAT 144
186 242
191
33 Val Val Arg Mee Pro srg Glu Arg Phe Ile srg Glu His Arg Sla Ssp 4 8
145 CTC : GGG ; cgc ' AGT ’ GCT ' GSA . SAS . ATG TAT ' GAC CTG GCA GTG GGC TAT GCT 192
49 Leu . Gly Srg Ser Als . Glu Lys Mec Tyr Ssp Leu Ala Val Gly Tyr Ala 64
193 CAT ' CAT GTG TTA CAC CAT TTT CGC CGT AST TCT CTT AGT TSA GCT GTT 240
6 5 His Tln Val Leu His HIS Phe Arg Srg Ssn Ser Leu Ser Glu Ala Val 30
241 CAT TTT GGC TTG AGA AGT CCG TTC TCC GTA TCA GGC CCG TAT TAC GCC 233
31 Gln Phe -Gly Leu Arg Ser Pro Phe Ser Val Ser Tly Pro Ssp Tyr Ala 96
289 AAT CSG TTT CTT GST GCA SAC ACG TTT TGG SAS TAT AAA TCA CCA AGT 336
97 Asn Tln Phe Leu Ssp Ala Ssn Thr Tly Trp Lys Ssp Lys Sla Pro Ser » 1 2
337 GGA TCS CCT GSA GCC AST GAT GCT CCG GTA TCC TAT CTT ACT CAT ATT 334
113 Gly Ser Pro Glu Ala Asn Asp Ala Pro Val Ala Tyr Leu Thr His Ile 123
335 TAT CAA TTG GCC CTT GAS CAT GAA SAG SAT GGC GCC ACT ACC STT ATG 432
129 Tyr Gln Leu Ala Leu Glu Tln Tlu Lys Ssn Gly Ala Thr Thr Ile Mec 144
433 SAT SCT CTG TCG GAC CTT CGC CCC GAT CTG GGT GCT TTG TTA ATT SAT 480
145 Asn Thr Leu Ala Glu Srg Arg Pro Asp Leu Tly Ala Leu Leu Ile Ssn 160
431 GST SAA TCS STC AST GAG GTG ATA CCG CAA TTT CAT TTT GTC AST GSA 528
161 Ssp Lys Sla Ile Asn Glu Val Ile Pro Gln Leu Tln Leu Val Asn Glu 175
529 ATT CTG TCC SSA TCT ATT CAG SAG SAA CTG ATT TTT ACT TAT CTG GAA 57 6
177 Ile Leu Ser Lys Sla Ile Tln Lys Lys Leu Ser Leu Thr Ssp Leu Glu 192
577 GCT GTA SAC TCC ATS CTT TCC ACT ACC CGT TAC CCT AST AST CTG CCT 624
193 Ala Val Ssn Sla Srg Leu Sar Thr Thr Srg Tyr Pro Asn Asn Lau Pro 208
525 TST CAT TST GTT CAT CAG CAT ATT CAG ACA TCT CAA TCG GTA TTG GGT 672
209 Tyr His Tyr Tly His Gln Tln Ile Gln Thr Ala Gln Ser Val Leu Tly 224
673 ACT SCG TTG CSA GST ATC ACT TTG CCA CAG ACT CTG GAT CTT CCG CSA 720
225 Thr Thr Leu Gln Ssp Ile Thr Leu Pro Gln Thr Lau Ssp Leu Pro Gln 240
721 SAC TTC TTG GCS ACA TCA SAS GGA SAS CTG AGC TAT ACT ACT GCC AGT 753
241 Asn Phe Trp Ala Thr Ala Lys Tly Lys Leu Ser Asp Thr Thr Ala Ser 256
769 TCT TTG ACC CGA CTG CSA ATC ATT TCT SGT CAG TTT TCT CCA TST CST 816
257 Ala Leu Thr Srg Leu Tln Ile Mec Ala Ser Tln Phe Ser Pro Tlu Gln 272
817 CAT ASA ATC ATT ACG GAT ACT TTC GGT CAG TAT TTC TAT CAT CTT AAC 364
273 Gln Lys Ile Ile Thr Glu Thr Val Tly Gln Asp Phe Tyr Gln Leu Ssn 233
355 TAT TGT GAC AGT TCG CTT ACT TTG AST SGT TTC ATC GAC ATG SCC STA 912
239 Tyr Gly Asp Ser Ser Leu Thr Val Asn Ser Phe Ser Asp Mec Thr Ile Jv4
192
186 242
9 . 3 ATC ACT GAT CGT TCT * G TG τ TTG ACT .TT CSC G * — (AG GTA GAA. CTG Λ i. J TTS 9 - ·?
3C5 Met Thr Asp Arg Thr Ser Leu Thr Vai Pro Gln Val Clu Leu Met —au - - J
961 TCT TCA ACT GTC GGA GGT TCT AGC CTT CTT AAG TCT CAT i »T GTC aGT 1CC3
321 Cys Ser Thr Vel cly Giy Ser Thr Vel Vel Lys Ser Asp Asn Val Ser 3 3 3
1009 TGT GGT GAC AGG ACA CCG ACC CCA TTT GCG TAT CGC CGC CCG TTT ATT 1056
3 3 7 Ser Cly Asp Thr Thr Ala Thr Pro Phe Ale Tyr Cly Ale Arg Phe Ile 3 52
1057 CAT CGG GGT AAG CCG GAG GCG ATT ACG CTG AGT CCC AGT CGT GGG Gag 1104
353 His A1a Giy Lys Pro Glu Ala Ile Thr Leu Ser Arg Ser Giy Ale Giu 3 56
1105 GGC CAT TTT CGT CTG AGC CTT AAG AAT CTG AGA GAT GAC AAG TTG GA0 1152
369 Ale His Phe Ale Leu Thr Vel Asn Asn Leu Thr Asp Asp Lys Leu Asp 3 34
1153 CGT ATT AAC CGG ACA CTG GCC CTG CAA AAA TGG CTG AAT CTG CGT TAT 1200
335 Arg Ile Asn Arg Thr Val Arg Leu Cln Lys Trp Leu Asn Leu Pro Tyr 4 00
1201 GAG GAT ATT GAG CTC TTA CTG AGT TGT GCT ATG GAT GGG GAA ACA CGA 1248
401 Clu Asp Iie Asp Leu Leu Vel Thr Ser Ala Met Asp A1a Clu Thr Gly 416
1249 AAT AGG GCG GTG TGG ATG AAG GAG AAT AGG GTG GGT ATG TTG CGA GTG 1296
417 Asn Thr Ale Leu Ser Met Asn Asp Asn Thr Leu Arg Met Leu Gly Va1 432
1297 TTG AAA GAT TAT GAG CGG AAG TAT CGT CTT AGG GGT AAA CAA TTT CCT 1344
433 Phe Lys His Tyr Cln A1a Lys Tyr Cly Vel Ser A1a Lys Gin Phe Ale 443
1345 GGG TCG GTG GCG GTA CTG GGC GCG TTT CGG ATT AGA CCG CCA AGG GCG 1392
449 Giy Trp Leu Arg Va1 Vel Ala Pro Phe Ala Ile Thr Pro Ala Thr Pro 464
1393 TTT TTA GAG GAA GTG TTT AAG TCG CTG CGG AGG TTT GAT ACA GGG TTT 1440
465 Phe Leu Asp Gln Vel Phe Asn Ser VAl Gly Thr Phe Asp Thr Pro Phe 430
1441 GTC ATA. - GAT AAT GAG GAT TTT GTC TAT AGA TTG AGG ACC CGG CGG GAT 1433
431 Va1 Ile Asp Asn Gln Asp Phe Va1 Tyr Thr Leu Thr Thr Giy Gly Asp 496
1439 GGG CGG GGT GTT AAG GAT ATG AGC AGG CCA GTG CGC CTG AAT GAT GGT 1536
497 Gly A1a Arg Vel Lys His Ile Ser Thr Ale Leu Gly Leu Asn His Arg 512
1537 CAG TTG GTG TTA TTG CGC GAT AAT ATT CGC GGT CAA CAG CGG AAT GTC 1534
513 Cln Phe Leu Leu Leu Ala Asp Asn Ile Ala Arg Gln Cln Giy Asn Va1 523
1535 ACG GAA AGG AGA CTC AAG TCT AAT GTG TTT GTG GTG TCA CCT TTG TAC 1632
529 Thr Gln Ser Thr Leu Asn Gys Asn Leu Phe Vel Va1 Ser Ale Phe Tyr 544
163 3 CCT CTG GGT AAT TTG CCG GGC ACA TTG GGG ATA AAT CCA CAG TCT TTC .330
545 Arg Leu Ale Asn Leu Ale Arg Thr Leu Cly Ile Asn Pro Clu Ser Phe 530
1681 TGT GCC TTG GTT CAT CCA TTA CAT GCA GCT AGA CGG ATC CTG TCG CAG 7 2 3
186 242
193
9 61 Cys Ala Leu Val Asp Arg Leu Asp Ala - 1 , . Gly Thr. Gly 11 o Val ••p Gln 576
1725 —AA TTC GCA Ggg AAA CCC ACA ATC ACC GTA CCA CAA AAA GAT T—C -- - 1776
577 Gln Leu Ala Gly Lys Pro Thr Ile Thr Val Pro Gln Lys Asp Ser Pro 5 9 2
177 7 CTG GCG GCG GAT ATT CTG AGT TTG CTG CAA GCG CTA AGT GCG A.TT GCT
1824
553 Leu Ala Ala Asp Ile Leu Ser Leu Leu Gln Ala Leu Ser Ala Ile Ala 608
1825 CAA TGG CAA CAA CAG CAC GAT TTA GAA TTT TCA GCA —TG CTT TTG CTG 137 2
□ 09 Gln Trp Gln Gln Gln His Asp Leu Glu Phe Ser Ala Leu Leu Leu Leu 624
1373 TTG AGT GAC AAC C—T ATT TCT ACC TCG —AG GGC ACT GAC GAT CAA TTG 1920
625 Leu Ser Asp Asn Pro Ile Ser Thr Ser Gln Gly Thr Asp Asp Gln Leu 640
1921 AAC TTT ATC CGT —AA GTG TGG CAG AAC —TA GGC AGT ACG TTT GTG GGT 1963
641 Asn Phe Ile Arg Gln Val Trp Gln Asn Leu Gly Ser Thr Phe Val Gly 656
1969 GCA ACA TTG TTG T—C CGC AGT GGG GCA —CA TTA GTC GAT ACC AAC GGC 2016
657 Ala Thr Leu Leu Ser Arg Ser Gly Ala Pro Leu Val Asp Thr Asn Gly 67 2
2017 CAC GCT ATT GAC TGG TTT GCT CTG CTC TCA GCA GGT AAT AGT —CG CTT 2064
673 His Ala Ile Asp Trp Phe Ala Leu Leu Ser Ala Gly Asn Ser Pro Leu 638
2065 ATC GAT AAG GTT GGT CTG GTG ACT GAT GCT GGC ATA CAA AGT GTT ATA 2112
689 Ile Asp Lys Val Gly Lau Val Thr Asp Ala Gly Ile Gln Ser Val Ile 704
2113 GCA ACG GTG GTC AAT ACA CAA AGC TTA TCT GAT GAA GAT AAG AAG CTG 2160
705 Ala Thr Val Val Asn Thr Gln Ser Leu Ser Asp Glu Asp Lys Lys Leu 720
2161 GCA ATC ACT ACT CTG ACT AAT ACG TTG AAT CAG GTA CAG AAA ACT CAA 2203
721 Ala Ile Thr Thr Leu Thr Asn Thr Leu Asn Gln Val Gln Lys Thr Gln 736
2209 CAG GGC GTG GCC GTC AGT CTG TTG GCG CAG ACT CTG AAC GTG AGT CAG 2256
737 Gln Gly Val Ala Val Ser Lau Leu Ala Gln Thr Leu Asn Val Ser Gln 752
2257 TCA CTG CCT GCG TTA TTG TTG CGC TGG AGT GGA CAA ACA ACC TAC CAG 2304
753 Ser Lau Pro Ala Leu Leu Lau Arg Trp Ser Gly Gln Thr Thr Tyr Gln 7 63
2305 TGG TTG AGT GCG ACT TGG GCA TTG AAG GAT GCC GTT AAG ACT GCC GCC 2352
769 Trp Leu Ser Ala Thr Trp Ala Leu Lys Asp Ala Val Lys Thr Ala Ala 734
2353 GAT ATT CCC GCT GAC TAT CTG CGT CAA TTA CGT GAA GTG GTA CGC —GC 2400
785 Asp Ile Pro Ala Asp Tyr Leu Arg Gln Leu Arg Glu Val Val Arg Arg 300
2401 T—C TTG TTG ACC CAA —AA TTC A—G CTG AGT CCT GCA ATG GTG CAA AC— 2443
301 Ser Leu Leu Thr Gln Gln Phe Thr Leu Ser Pro Ala Met Val Gln Thr 8 lo
194
186 242
2443 317 4 . sj Leu CTG Leu GAC Asp TAT Tyr CCA Pro JL'- Ala TAT Tyr TTT Phe Gly TCT Ala TCC Ser A Ala GAA Glu AC A Thr d k d Tal Thr 2433 5 j 1
2497 TAT ATC AGT TTG TGG ATT CTT TAT ACC CTG AGC TTT TAT AGC GAT TTA 2544
8 3 3 Asp Ile Ser Leu Trp Mec Leu T/r Thr Leu Ser Cys T/r Ser Asp Leu 343
2545 TTG CTC CAA ATG GGT GAA GCT GGT GGT ACC GAA GAT GAT GTA CTT GCC 2592
849 Lau Leu Gln Mec Giy Glu Aia Giy Gly Thr Giu Asp Asp Vai Leu Aia 864
2593 TAC TTA CGC ACA GCT AAT GCT ACC ACA CCG TTG AGG CAA TCT GAT GGT 2640
865 Tyr Leu Arg Thr Aia Asm Aia Thr Thr Pro Leu Sar GIm Ser Asp Aia 380
2641 GCA CAG ACG TTG GCA ACG CTA TTG GGT TGG GAG GTT AAC GAG TTG CAA 2633
331 Aia GIm Thr Leu Ala Thr Leu Lau Giy Trp Giu Val Asm Giu Leu Gin 396
2639 GCC GCT TGG TCG GTA TTG GGC GGG' ATT GCC AAA ACC ACA CCG CAA CTT 2736
397 Aia Aia Trp Ser Vai Leu Gly Giy Iie Ala Lys Thr Thr Pro GlM Leu 912
2737 GAT GCG CTT CTG CGT TTG CAA CAG GCA CAG AAC CAA ACT GGT CTT GGG 2734
913 Asp Aia Leu Leu Arg Lau Gln GlM Aia GiM Asn Gln Thr Giy Lau Giy 923
2735 GTT ACA CAG CAA CAG CAA GGC TAT CTC CTG ATT CGT GAC AGT GAT TAT 2332
929 Vai Thr Gin GIm Gin Gin Giy Tyr Leu Leu Ser Arg Asp Ser Asp Tyr 944
2833 ACC CTT TGT CAA AGC ACC GGT CAG GGG CTG GTT GCT GTC GTA TCC CAT 2330
945 Thr Lau Trp Gin Ser Thr Giy Gin Ala Leu Val Aia Giy Vai Ser His 960
2331 GTC AAG GGC AGT AAC TTA 2898
961 Val Lys Gly Ser Asn End 966
( 2 ) Dane dla sekwencji SEK NR ID: 57;
(i) 01310^17517^ sekwencji:
( A ) Długość: 965 aminokwasów (B ) Typ: aminokwas (D) Topologia: liniowa (ii) Typ cząsceczki: białko ( xi ) Opis sekwencji: SEK NR ID: 57 ( jpptyd TccA ); Cechy Od Do Opis
1 10 SEK NR ID: 8
I Mec Asm GIm Leu Aia Ser Pro Leu Iie Ser Arg Thr Giu Giu Iie His 16
17 Asm Leu Pro Giy Lys Leu Thr Asp Leu Giy Tyr Thr Ser Vai Phe Asp 32
33 Val Vai Arg Mac Pro Arg Glu Arg Phe Iie Arg Glu His Arg Aia Asp 43
49 Leu Gly Arg Ser Ala Giu Lys Mec Tyr Asp Leu Aia Val Gly Tyr Aia 64
6 5 His Gin Vai Leu His His Phe Arg Arg Asn Ser Leu Ser Giu Aia Vai 30
31 Gin Phe Giy Leu Arg Ser Pro Phe Sar Vai Ser Giy Pro Asp Tyr Ala 3 5
186 242
Asn Gln Phe Lau Asp Ala Asn Thr Gly Trp Lys Asp Lys Ala Pro
Gly Ser Pro Glu Ala Asn Asp Ala Pro Val Ala Tyr Leu Thr His
Tyr Gln Leu Ala Leu Glu Gln Glu Lys Asn Gly Ala Thr Thr Ile
Asn Thr Leu Ala Glu Arg Arg Pro Asp Lau Gly A.la Lau Leu Ile
Asp Lys Ala Ile Asn Glu Val Ile Pro Gln Lau Gln Leu Val Asn
Ile Leu Ser Lys Ala Ila Gln Lys Lys Lau Ser Lau Thr Asp Leu
Ala Val Asn Ala Arg Leu Ser Thr Thr Arg Tyr Pro Asn Asn Leu
Tyr His Tyr Gly His Gln Gln Ile Gln Thr Ala Gln Sar Val Lau
Thr Thr Leu Gin Asp Ila Thr Leu Pro Gin Thr Leu Asp Leu Pro
Asn Phe Trp Ala Thr Ala Lys Gly Lys Leu Ser Asp Thr Thr Ala
Ala Leu Thr Arg Lau Gin Ile Mec Ala Ser Gin Phe Ser Pro Glu
Gin Lys Ile Ile Thr Glu Thr Val Gly Gin Asp Phe Tyr Gin Lau
Tyr Gly Asp Ser Ser Leu Thr Val Asn Ser Phe Ser Asp Mec Thr
Mec Thr Asp Arg Thr Ser Leu Thr Val Pro Gln Val Glu Leu Met
Cys Ser Thr Val Gly Gly Ser Thr Val Val Lys Ser Asp Asn Val
Ser Gly Asp Thr Thr Ala Thr Pro Phe Ala Tyr Gly Ala Arg Phe
His Ala Gly Lys Pro Glu Ala Ile Thr Leu Ser Arg Ser Gly Ala
Ala His Phe Ala Leu Thr Val Asn Asn Leu Thr Asp Asp Lys Lau
Arg Ile Asn Arg Thr Val Arg Lau Gln Lys Trp Leu Asn Leu Pro
Glu Asp Ile Asp Leu Leu Val Thr Ser Ala Met Asp Ala Glu Thr
Asn Thr Ala Leu Ser Mac Asn Asp Asn Thr Lau Arg Mec Leu Gly
Phe Lys His Tyr Gin Ala Lys Tyr Gly Val Sar Ala Lys Gin Phe
Gly Trp Lau Arg Val Val Ala Pro Phe Ala Ile Thr Pro Ala Thr
Phe Lau Asp Gin Val Phe Asn Ser Val Gly Thr Phe Asp Thr Pro
Val Ile Asp Asn Gln Asp Phe Val Tyr Thr Leu Thr Thr Gly Gly
Gly Ala Arg Val Lys His Ile Ser Thr Ala Leu Gly Leu Asn His
Gln Phe Leu Lau Lau Ala Asp Asn Ile Ala Arg Gln Gln Gly Asn
Thr Gln Ser Thr Lau Asn cys Asn Leu Phe Val Val Ser Ala Phe
Arg Leu Ala Asn Leu Ala Arg Thr Leu Gly Ile Asn Pro Glu Ser
Cys Ala Lau Val Asp Arg Leu Asp Ala Gly Thr Gly Ile Val Trp
Gln Leu Ala Gly Lys Pro Thr Ile Thr Val Pro Gln Lys Asp Ser
Leu Ala Ala Asp Ile Lau Ser Leu Leu Gln Ala Lau Ser Ala Ila
Ser
Ile
Mec
Asn
Glu
Glu
Pro
Gly
Gin
Sar
Gin
Asn
Ile
Leu
Ser
Ile
Glu
Asp
Tyr
Gly
Val
Ala
Pro
Phe
Asp
Arg
Val
Tyr
Pha
Gln
Pro
Ala
Gln Trp Gln Gln Gin His Asp Leu Glu Phe Ser Ala Leu Leu Leu Leu
186 242
Leu Ser Asp Asn Pro i l - - i β Ser Thr Ser Gin Gly Thr Asp Asp G l 4* Leu 1 ·» O
Asn Phe Ile Arg Gin Vai Trp Gin Asn Leu Gly Ser Thr Phe Vel CLy 5 55
Ale Thr Leu Leu Ser Arg Ser Giy Aia Pro Leu Vel Asp Thr Asn Gly 6~ Z
His Ala Ile Asp Trp Phe A1a Leu Leu Ser Ale Giy Asn Ser Pro Leu 633
Ile Asp Lys Vel Giy Leu Va1 Thr Asp A1a Gly Ile Gin Ser Vel Ile 704
A1a Thr Vel Val Asn Thr Cln Ser Leu Ser Asp Glu Asp Lys Lys Leu 720
Ala Iie Thr Thr Leu Thr Asn Thr Leu Asn Gln Vel Cln Lys Thr Gin '3 o
Gin Giy Va1 Ala Val Ser Leu Leu A1a Gln Thr Leu Asn Vel Ser Gin 752
Ser Leu Pro Ale Leu Leu Leu Arg Trp Ser Gly Cln Thr Thr Tyr Gin 753
Trp Leu Ser A1a Thr Trp A1a Lau Lys Asp A1a Va1 Lys Thr Ale Ala 734
Asp Ile Pro A1a Asp Tyr Lau Arg Gin Leu Arg Glu Val Vel Arg Arg 300
Ser Leu Leu Thr Gin Gin Phe Thr Leu Ser Pro A1a Mec Vel Gin Thr 316
Leu Leu Asp Tyr Pro Ale Tyr Phe Gly Ala Ser A1a Giu Thr Vel Thr 332
Asp Ile Ser Leu Trp Mec Leu Tyr Thr Leu Ser Gys Tyr Ser Asp Leu 843
Leu Leu Gln Mec Gly Giu A1a Gly Gly Thr Glu Asp Asp Va1 Leu Ale 364
Tyr Leu Arg Thr Ale Asn A1a Thr Thr Pro Leu Ser Gin Sar Asp Ale 830
A1a Gin Thr Leu A1a Thr Leu Leu Gly Trp Clu Va1 Asn Glu Lau Gin 636
A1a Ala Trp Ser Va1 Leu Gly Gly Ile Ale Lys Thr Thr Pro Gin Leu 312
Asp Ale Leu Leu Arg Leu Gin Gln A1a Gln Asn Gln Thr Gly Leu Gly 928
Vel Thr Gln Gln Gln Gln Gly Tyr Leu Leu Sar Arg Asp Ser Asp Tyr 944
Thr Leu Trp Gln Ser Thr Gly Gln A1a Leu Va1 A1a Gly Va1 Ser His 960
Va1 Lys Gly Ser Asn 965
Dane dla sekwencji SEK NR ID: 58;
(i) Charakterystyka sekwencji:
( A) Długość: 4698 par zasad (B) Typ: kwas nukleinowy ( C ) Rodzaj nici: podwójna ( D ) Topologia, liniowa (ii) Typ cząsteczki: DNA ( genomowi) ( xi) Opis sekwencji: SEK NR ID: 56 (tccB )
1 ATG TTA TGC ACA ATG GAA AAA GAA CTG AAT GAA TCC GAG CGT CAT GCC 43
1 Mec Leu Ser Thr Mec Giu Lys Gin Leu Asn Glu Ser Gln Arg Asp Ala 16
49 TTG CTG ACT GGC TAT ATG AAT TTT GTG CGG CCG ACG TTC AAA Gcg TTo 9 6
17 Leu Vai Thr Giy Tyr Mec Asn Phe Val Ala Pro Thr Leu Lys Cly Val ; o
186 242
197
3
tgT CgT CAG CCC GCC TCC GCG «Α GT?* ' * CAG GAA CAC CTG CCC ATT
Sar Gly Cln rro /al yer /al Glu Tsp Lau h/r Clu h/P Ltu Ltu Ile
144
145
CAG CCG GTA CCG CCC GAT GAG CCT CAC ACC CGT CCG CCA GCA CAA CGG
rsp rro Clu /al Cla Tsp Clu /al Clu eep Ser Arg /al Cla Cln Cla
192
193 6 5
241
289
337
113
3a5
129
433
145
431
161
529
177
577
193
625
209
673
225
721
241 ó 9 257
317
273
TCT GGG CCC TCA CCC CCA Cln TAC Typ CCC Mac ACC cer CGT Trg CCG Leu GTC /al .AAG Asn cGC Gl/ TCT Sap GAT clu
Ile Ala Sap Ila Gln
CCG GGG CGT CAG CGG CTG GAC CCT CCT TCA CCT CAG GAT CGG CCC GAC
rpo Gly Apg Gln Ala Mec Glu rpo Str cep AIi Asn Glu Cpp Arg Asp
TAC GAT TAG GCA TAT CCT ATG TCG GGT GCG GGG GCT CAG CTT CCA -TTC
Tsn Csp Csn Gln h/p Cla Ila ypp Cla Tla Cly Ala Glu /al crg Csn
CAC GCT GAA CAC CAC CCT TGC GCC CCG CCG CGG GAG GAA .AAA AGG CAC
Typ Ala Glu Csn Typ Ile Stp rro Ilt hep Arg Gln Glu Lys Ser Hst
CAT TTG CGG GAG CTG GAG ACC CCT CCA CAT CAG TCT GGA CTC GAC CCG
Typ ree Ser Glu Leu Glu Ter cer Lau Asn Gln Asn Arg Leu Csp rro
CAC GGT CCG CAG GAC GGT CTT CTG CCG CAT CTC AAT GAG CTT GTG GCA
Asp Arg /al Gln Csp Ala /al Lau Ala Typ Leu Asn Glu re® Clu Ala
GCG AGT AAT GTA CAT GTG CTG AGC GGT CCT ATT TCT CAG CAT •AAA CTT
/al Ser Asn Leu Tyr /al Leu Ser Gly C/p Ilt Asn Gln Asp Lys re®
GAG GTC GGT ACC CAC TAC TCT ACC CGT CCC AGT ACG ACT AAT CCC TAC
Asp Gln Ala Ilt Cyr C/P re® Ilt Cly Crg eer eer Tep Lys rpo C/p
GGG TAC CAG CGG CGT CAG ATG GAT CCG ACT TAG TTC GCT CAT GAC GGG
Arg Tyr Tyr Trp Arg Cln Mac Csp Lau Sar Lys Asn Arg Cln Asp rro
GCA GGG- AAT GGC GTG ACG CGA AAC CGC CCG CTT GAT CGG CAG CAA ATG
Ala Gly Asn rro /al Tep rpo Asn C/s Crp Tsn Asp Trp Gln Glu Ilt
ACT TTG CCC CTG CGT GGT GAC ACC CCG CCG GAG GAT ACA GTT CGC CCC
Tep Lau rro Leu Sep Gly Asp TIp /al Lau Glu His eer /al Crg rro
GTA TTT CAT TTT CAC GGA GTA TAC GTG CCT TGG GTC GAG GGT GAG CGC
/al ree Tyr Asn Csp Arg Lau Tyr /al Cla Trp /an Glu Arg Asp rro
GGA GTC CAG TTC CAC GCT GAG GGT CAA TAC ATG GGT CAA ACG CAT CGC
Cla /al Cln Lys Asp Ala Asp Cl/ Lys Tsn Ilt Gly Lys Ter HiS CIi
CAC AAG ATA TAG CTT CGT TAC AAA CGC CTT CAT GAT ACT CGG CGA ujC3
h/p Csn Ila L/T re® Gly h/r L/s Arg h/r Asp Asp eep ypp eep Cla
240
288
336
384
123
432
144
430
160
528
176
575
192
624
208
672
224
720
240
68 256
316
364
233
65 CCC TTC AGG ACC AGC CTA ACC ACC CTA CCA GCA GGG GAA AGT CCA CAA 912 239 rpo Csn Cer eep Cer Ltu Mac cep Gln Gln Ala Gly Glu Sup Sep Clu 304
198
186 242
913 305 ACA CAC Thr Cln CCA Arg TCC Ser ACC CTC CTC ATT CAT CAA TCT Ser ACC Ser UCC Thr UCA TTC G»\_ Arg 9 6 0 3 20
Ser Leu Lau ile Usp Glu Thr Lcu
961 CAA CTT AAT CTG TTC CCT ACC UCC CAT TTT ACT ATC CAT CCC ACC CUG loca
321 Cln Val Asn Leu Lau Ala Thr Thr Asp Phe Scr Il· Asp Pro Thr Clu 3 3 6
1009 CAA ACC GAC AGT AAC CCC TAT CCC CCC CTA ATG TTC CCG GTG TTT CTC 105 6
337 Clu Thr Asp Ser Asn Pro Tyr Gly Arg Lau—Mcc Lcu Cly Val Phc Val 352
1057 CCT CAA TTT GAA CGT GUT GCG GCC AAT UGA UUA AAT AUU CCC CTT GTT 1104
353 Arg Gln Ph· Clu Cly Asp Gly Ula Asn Arg Lys Asn Lys Pro Val Val 3 68
1105 TAT CGT TAT CTC TUT TCT GAC TCA GCT TTC UAT CGT CAT GTT CTC UGC 1152
369 Tyr Gly Tyr Lcu Tyr cys Usp Ser Ala Pha Asn Arg His Val Lcu Arg 334
1153 CCC TTA ACT AAC AAC TTT TTG TTC UGT UCT TAC CCT GUT GUA UCG CUT 1200
385 Pro Leu Ser Lys Usn Phe Leu Pha Ser Thr Tyr Arg Asp Glu Thr Usp 400
1201 CGT CAA AAC ACC TTG CAA TTT GCC GTA TAC CAT UAA UAC TAT CTA UTT 1243
401 Cly Gln Asn Ser Leu Cln Phc Ula Val Tyr Usp Lys Lys Tyr Val Ila 416
1249 ACT AAG GTT CTT UCU GCT GCA UCC GUA CUT CCC GUA AAT UCA GGA TCC 1296
417 Thr Lys Val Val Thr Gly Ala Thr Clu Usp Pro Clu Usn Thr Cly Trp 432
1297 CTA UCT AAA GTT GAT CAC TTC AAA CUU CGC ACT ACT GCG GCC TAT GTG 13 44
433 Val Ser Lys Val Asp Asp Lau Lys Gln Cly Thr Thr Gly Ula Tyr Val 448
1345 TAT ATC CAT CAA GAT GGC CTC UCG CTT CAT UTA CAA ACC UCU ACT UAT 13 92
449 Tyr Il· Usp Gln Asp Gly Leu Thr Leu His Il· Cln Thr Thr Thr Usn 4 64
1393 CGG CAT TTT ATT AUC CGT CUT ACG TTT GGU TAT AAC CUT CTT CTA TAT 1440
455 Cly Usp Ph· Ile Usn Urg His Thr Ph· Cly Tyr Asn Usp Lcu Val Tyr 430
1441 GAT TCT AAG TCT CGT TAT GGT TTC ACG TGG TCA CGA UAT CAU GCT TTT 1488
481 Asp Ser Lys Sar Cly Tyr Gly Pha Thr Trp Ser Cly Usn Clu Gly Phe 496
1489 TAT CTG GAT TAC CUT GAT GGA UAT TUT TAC ACC TTT CUT UAT GCA ATA 1536
497 Tyr Leu Asp Tyr His Asp Cly Usn Tyr Tyr Thr Phe His Usn Ala Ile 512
1537 ATC AAC TAC TUT CCC TCT GGU TAT GCT GCT GGA TCT GTT CCT AAT CGU 1584
513 Ile Asn Tyr Tyr Pro Ser Gly Tyr Cly Cly Gly Ser Val Pro Asn Gly 523
1585 ACC TGG CCC TTA CAG CAA AGG ATT UAT CAC CGU TGG GCT ATT GCT CCC 16 32
529 Thr Trp Ala Leu Clu Cln Arg Ile Usn Clu Gly Trp Ula Ilc Ala Pro 544
1533 CTC CTT CAT ACT CTC CUT ACT CTT UCT GTC AAG GGC AGT TAT UTC CCT 15 30
545 Lau Leu Usp Thr Lau His Thr Val Thr Val Lys Gly Ser Tyr de Ula 5 o 0
186 242
199
1 6 8 1 5 0 1 TGg Trp Gsa Glu GGG Gly GAA Glu SCS Thr CCT Pro SCC Thr .ajT Gly TAT T/r SAT Ssn — T*· Ctc Lau TAT Tyr STT Ile CCS Pro 3λΤ Ssp _rc τ my
1729 SCC GTG TTG CTA GST TCG TTT GAT ASA STA SAT TTT GCT STT CTT CTT
577 Thr Val Leu Leu Ssp Trp Phe Ssp Lys Ile Ssn Phe Ala Ile Gly Leu
1177 SAT SAG CTT GAG TCT GTA TTT SCG TCG CCS GAT TGG CCA SCA CTA ACC
553 Ssn L/S Leu Glu Ser Val Phe Thr Ser Pro Ssp Trp Pro Thr Lau Thr
1723
576
177 6 592
1824
608
1325 SCT ATC SAA SAT TTC AGT ASA STC TCC GST SAC CGC ASA TTC TAT CAG
609 Thr Ile Lys Ssn Phe Ser Lys Ile Ala Ssp Ssn Srg Lys Phe Tyr Gln
1373 GAS ATC SAT TCT GAT ACT TCG GAT GGA CGC ASC CTG TTT SAS CCT TAC
625 Glu Ile Ssn Ala Glu Thr Ala Asp Tl/ Srg Ssn Leu Phe L/s Srg T/r
1921 SCT SCT CAA ACT TTC GGA CTT ACC ATC GTT TCT ACT TAT TCT SCA ACT
641 Ser Thr Gln Thr Phe Gly Leu Thr Ser Gl/ Ala Thr Tyr Ser Thr Thr
1969 TAT ACT TTG TCT GAG GCG GAT TTC TCC SCT TAT CCG GAC ASA ASC TAC
657 T/r Thr Lau Ser Glu Sla Ssp Phe Ser Thr Ssp Pro Ssp L/s Ssn Tyr
2017 CTA CAT GTT TTT TTT AST GTC GTT TTG GAT CAT TAT TAC CTC CCG TCA
673 Leu Tln Val Cys Leu Ssn Val Val Trp Ssp His Tyr Asp Arg Pro Ser
2065 GTG ASA SAA TGG GCT TAT TCT TGG TTC AGT SAG TGG TTT SAC TTC TAT
689 Gly L/s Lys Tly Ala Tyr Ser Trp Val Ser Lys Trp Phe Ssn Val T/r
2113 GTT GCT TTG CSA TAT ATC SAS GCT CCT GAT GCC ATT CCT CGA TTA GTT
705 Val Ala Leu Tln Ssp Ser L/s Ala Pro Ssp Ala Ile Pro Srg Leu Val
2161 TCC CTT TAC GAT AGT AAA CGT GGT CTG GTG CAA TAT CTT GAC TTC TTG
721 Ser Arg Tyr Asp Ser L/s Srg Gl/ Leu Val Tln Tyr Leu Ssp Phe Trp
2209 ACC TCA TCA TTA CCC. GCG SAS ACC CGT CTT SAC ACC ACC TTT TTG CGT
737 Thr Ser Ser Leu Pro Sla L/s Thr Arg Leu Asn Thr Thr Phe Val Arg
2257 ACT TTG ATT GAG SAG GCT SAT CTG GGG CTT TAT STT TTG CTG GAT TAC
753 Thr Leu Ile Tlu Lys Ala Asn Leu Tly Leu Ssp Ser Leu Leu Asp Tyr
2305 ACC TTG CSG TCA TST CCT TCT CTG GSA GCS GAT TTA CTG ACT GAC CGC
769 Thr Leu Gln Ala Ssp Pro Ser Leu Tlu Sla Asp Leu Val Thr Asp Gly
2353 SAA ATC GSA CCA ATG GAC TTT SAT TGT TCA ASC GGT CTC TAT TTC TGG
785 L/s Ser Glu Pro Mec Ssp Phe Asn Tly Ser Asn Gly Leu Tyr Phe Trp
2401 CSA TTG TTC TTT CAC CTG CCG TTT TTG TTT GCT ACA CTC TTT CCC SAC
301 Glu Leu Phe Phe His Lau Pro Phe Leu Val Ala Thr Srg Phe Sla Ssn
2449 GSA CAG CSA TTT TCG CCG GCA CSA SAT SGT TTT CAT TAC ATC TTT GAC
317 Glu Gln Gln Phe Ser Pro Sla Gln Lys Ser Leu His T/r Ile Phe Ssp
1372
624
1920
640
1963
656
2016
672
2064
638
2160
720
2208 7 3 6
2256
752
2304 / 63
2352
734
2400
300
443
16
2456
332
2112
704
200
186 242
2457 333 —CG Pro Ala Ala ATG Met ggg Lys AAC Asn GGT Lys —CA Pro CAC His AAT Asn a,*» x» Ala —CG Pro GCT Ala TAT Tyr TGG Trp AAT Asn T . * a « 2644 848
2545 —GT CCG TT— GTT GAA GGA .AAC AGC GAT TTG TCA CGT CAT TTG GAC GA.T -592
849 Arg Pro Leu Val Glu Gly Asn Ser A.sp Leu Ser Arg His Leu Asp Asp 8 84
2993 T—T ATA GAC CCA GAT ACT CAA GCT TAT GCT CAT CCG GTG ATA TAC a.’,U 2 6 4 0
365 Ser Ile Asp Pro Asp Thr Gln Ala Tyr Ala His Pro Val Ile Tyr Gln 880
2641 AAA GCG GTG TTT ATT GCC TAT GTC AGT AAC CTG ATT GCT CAG GGA gAT 2688
881 Lys Ala Val Phe Ile Ala Tyr Val Ser Asn Leu Ile Ala Gln Gly As p 89 0
2589 ATG TGG TAT CGC CAA TTG ACT CGT GAC GGT CTG ACT CAG GCC CGT GTC 2736
897 Met Trp Tyr Arg Gln Leu Thr Arg Asp Gly Leu Thr Gln Ala Arg Val 512
27 37 TAT TAC AAT —TG GCC GCT GAA TTG CTA GGG —CT CGT CCG GAT GTA S e rJ 2734
313 Tyr Tyr Asn Leu Ala Ala. Glu Leu Leu Gly Pro Arg Pro Asp Val Ser 928
2735 —TG AGT AGC ATT TGG ACG CCG CAA AC— CTG GAT ACC TTA GCA GCC GgG 2332
929 Leu Ser Ser Ile Trp Thr Pro Gln Thr Leu Asp Thr Leu Ala Ala Gly 944
2833 —AA AAA GCG GTT TTA CGT GAT TTT GAG CAC CAG TTG GCT AAT AGT GAT 2330
945 Gln Lys Ala Val Lau Arg Asp Phe Glu His Gln Leu Ala Asn Ser Asp 960
2881 ACC GCT TTA CCC GCA TTG CCG GGC CGC AAT GTC AGC TAC TTG AAA —TG -928
961 Thr Ala Leu Pro Ala Leu Pro Gly Arg Asn Val Ser Tyr Leu Lys Leu 976
2929 GCA GAT AAT GGC TAC TTT AAT GAA CCG CTC AAT GTT CTG ATG TTG T—T 2976
977 Ala Asp Asn Gly Tyr Phe Asn Glu Pro Leu Asn Val Leu Met Leu Ser 992
2977 —AC TGG GAT ACG TTG GAT GCA CGG TTA TAC AAT CTG CGT CAT AAC —TG 3024
993 His Trp Asp Thr Leu Asp Ala Arg Leu Tyr Asn Leu Arg His Asn Leu 1008
3025 ACC GTT GAT GGC AAG —CG CTT TCG CTG CCG —TG TAT GCT GCG CCT GTT 3 072
1009 Thr Val Asp Gly Lys Pro Leu Ser Leu Pro Leu Tyr Ala Ala Pro Val 1024
3073 GAT CCG GTA GCG TTG TTG GCT CAG CGT GCT CAG TCC GGC ACG TTG G 3 120
1025 Asp Pro Val Ala Leu Leu Ala Gln Arg Ala Gln Ser Gly Thr Leu Thr 1040
3121 AAT GGC GTC AGT GGC GCC ATG TTG ACG GTG CCG CCA TAC CGT TTC AGC 3158
1041 Asn Gly Val Ser Gly Ala Met Leu Thr Val Pro Pro Tyr Arg Phe Ser 1056
3 169 GCT ATG TTC CCG —GA GCT TAC AGC GCC GTG GGT ACG TTG ACC AGT TTT 3 216
1057 Ala Met Leu Pro Arg Ala Tyr Ser Ala Val Gly Thr Leu Thr Ser Phe 1072
3217 GCT CAG AAC CTG CTT AGT TTG TTG GAA CGT AGC GAA CGA GCC TCT C.-A
1073 Gly Gln Asn Leu Leu Ser Leu Leu Glu Arg Ser Glu Arg Ala Cys — i n 10 86
186 242
201
2 55 GAA GAG TTG GCG GAA CAG C.AA CTG TTG GAT ATG TCC AGC TAT GCC ACC 3 3 22,
1039 Giu Glu Lau Ala Gln Gln Gln Lau Lau Asp Mec Sar Ser Tyr Ala Ha 1164
3 L3 ACG TTG CAA C.AA CAG GCG CTG GAT GGA TTG GCG GCA GAT CGT CTG GCG 3 350
1105 Thr Leu Gln Gln Gln Ala Lau Asp Gly Leu Ala Ala Asp Arg Leu Ala 1123
3 3 51 1121 CTG CTA GCT AGT CAG GCT ACG GCA C.AA CAG CGT CAT GAC CAT TAT TAC 3 403 Lau Lau Ala Ser Gln Ala Thr Aia Gln Gln Arg His Asp His Tyr Tyr 1156
3409 1137 ACT CTG TAT CAG AAC AAC ATC TCC AGT GCG GAA CAA CTG GTG ATG GAC 3 456 Thr Leu Tyr Gln Asn Asn Ile ser Ser Ala Glu Gln Leu Val Mec Asp ii~2
3457 1153 ACC CAA ACG TCA GCA CAA TCC CTG ATT TCT TCT TCC ACT GGT GTA CAA 3 504 Thr Gln Thr Ser Ala Gln Ser Leu Ile Ser Ser Ser Thr Gly Yal Gln 1163
3505 1169 ACT GCC AGT GGG GCA CTG .AAA GTG ATC CCG AAT ATC TTT GGT TTG GCT 3 552 Thr Ala ser Gly Ala Leu Lys Val Ile Pro Asn Ile Phe Gly Leu Ala 1134
3553 1135 GAT GGC GGC TCG CGC TAT GAA GGA GTA ACG GAA GCG ATT GCC ATC GGG 3 600 Asp Gly Gly Ser Arg Tyr Giu Gly Val Thr Glu Ala Ile Ala Ile Gly 1200
3601 1201 TTA ATG GCT GCC GGA CAA GCC ACC AGC GTG GTG GCC GAG CGT CTG GCA 3 643 Leu Mec Ala Ala Gly Gln Ala Thr Ser Val Val Ala Glu Arg Leu Aia 1215
3649 1217 ACC ACG GAG AAT TAC CGC CGC CGC CGT GAA GAG TGG CAA ATC CAA TAC 3 59 6 Thr Thr Glu Asn Tyr Arg Arg Arg Arg Glu Glu Trp Gln Ile Gln Tyr 123 2
3697 1233 CAG CAG GCA CAG TCT GAG GTC GAC GCA TTA CAG AAA CAG TTG GAT GCG 3744 Gln Gln Ala Gln Ser Glu Val Asp Ala Leu Gln Lys Gln Leu Asp Ala 1243
3745 1249 CTG GCA GTG CGC GAG AAA GCA GCT CAA ACT TCC CTG CAA CAG GCG AAG 3 79 2 Leu Ala Val Arg Glu Lys Ala Ala Gln Thr Ser Leu Gln Gln Ala Lys 1264
3793 1265 GCA CAC-CAG GTA CAA ATT CGG ACC ATG CTG ACT TAC TTA ACT ACT CGT 3 340 Ala Gln Gln Val Gln Ile Arg Thr Mec Leu Thr Tyr Leu Thr Thr Arg 1230
3341 1231 TTC ACC CAG GCG ACT CTG TAC CAG TGG CTG AGT GCT CAA TTA TCC GCG 3 333 Phe Thr Gln Ala Thr Leu Tyr Gln Trp Leu Ser Gly Gln Leu Ser Ala 1296
3339 1297 TTG TAT TAT CAA GCG TAT GAT GCC GTG GTT GCT CTC TGC CTC TCC GCC 3 5 3 6 Leu Tyr Tyr Gln Ala Tyr Asp Ala Val Val Ala Leu Cys Leu Ser Ala 1312
3937 1313 CAA GCT TGC TGG CAG TAT GAA TTG GGT GAT TAC GCT ACC ACT TTT ATC 3 934 Gln Ala Cys Trp Gln Tyr Glu Leu Gly Asp Tyr Ala Thr Thr Phe Ile 1323
3935 1329 CAG ACC GGT ACC TGG AAC GAC CAT TAC CGT GGT TTG CAA GTG GGG GAC 4 03 2 Gln Thr Gly Thr Trp Asn Asp His Tyr Arg Gly Leu Gln Yal Gly Glu 1344
4033 1345 ACA CTG CAA CTC AAT TTG CAT CAG ATG GAA GCG GCC TAT TTA GTT CGT 4 03 0 Thr Leu Gln Leu Asn Leu His Gln Mec Glu Ala Ala Tyr Leu Yal Arg i55O
202
186 242
4031 1361 CAC His GAA Glu CGC Arg CTT Arg CTT Leu Asn SJ CtG Ile CTT Arg A Thr TTG Val TCG Ser CTC Leu AAA Lys AGC Ser /“«Τ·» - fc Λ Leu 412 3 1376
4129 TTG GGT GAT TAT TGT TTT GG i aAG TTA AAA ACC TAA GGC AAA GTC 416
1377 Leu Giy Asp Asp Giy Phe Giy Lys Leu Lys Thr Glu Gly Lys Vai Asp 1352
4177 TTT CCA TTA Agc GAA AAG CTG TTT GAC AAC GAC TAT CCG GOT CAC TAT 4224
1393 Phe Pro Leu Ser Giu Lys Leu Phe Asp Asn Asp T/r Pro Gly His T/r 1403
4225 TTG CGC CAG ATT AAA ACT GTT TCA TTG ACG TTG CCG ACG TTA TTC GgG 4272
1409 Leu Arg GIm Iie Lys Thr Val Ser Vai Thr Leu Pro Thr Leu Val Gly 1424
4273 CCG TAT CAA AAC GTT AAG GCA ACG CTC ACT CAG ACC AGC AGG AGT ATA 4320
1425 Pro Tyr GIm Asn Vai Lys Aia Thr Leu Thr GIm Thr Sar Sar Ser Iie 1440
4321 TTG TTA GCA GCA GAT ATC AAT GOT TTT AAA CGT CTG AAT GAT CCG ACA 4363
1441 Leu Leu Aia Aia Asp Iie Asm Giy Vai L/s Arg Leu Asm Asp Pro Thr 1456
4369 GGT AAA GAG TTT GAT GCG ACG CAT ATT GTC ACC AAT CTO CGT GCC AGG 4415
1457 Gly Lys Giu Giy Asp Aia Thr His Iie Val Thr Asm Leu Arg Aia Ser 1472
4417 CAG CAG GTT GCG CTC TCT TGT GOC ATT AAT GAT GCC GOT AGC TTT GAG 4464
1473 GlM Gln Vai Aia Leu Ser Ser Giy Iie Asn Asp Aia Gly Ser Phe Giu 1433
4465 TTT CTT TTG GAA GAT GAG CGC TAT CTA TCA TTT TAG GGT ACT GGA GCT 4512
1439 Leu Arg Leu Giu Asp Giu Arg Tyr Leu Ser Phe Giu Giy Thr Giy Aia 1504
4513 GTT TCC AAA TGG ACT CTT AAC TTC CCG CGT TCT GTG GAT GAG CAT ATT 4550
1505 Vai Ser Lys Trp Thr Leu Asn Phe Pro Arg Sar Val Asp Giu His Ile 1520
4561 GAC GAT AAT ACA TTG AAA GCG GAT GAG ATT CAG GCC GCA CTG TTG GCG 4603
1521 Asp Asp Lys Thr Leu Lys Ala Asp Tiu Mec Gin Aia Ala Leu Leu Ala 1536
4609 AAT ATG GAT GAT GTG CTT GTT CAO TTG CAT TAT ACC GCC TGC GAC GGC 4656
1537 Asn Mec Asp Asp Val Leu Val GIm Vai His Tyr Thr Aia Cys Asp GIy 1552
4657 GGC GCC ATT TTC GCA AAC CAG GTC AAG AAA ACA CTG TCT TAA 4693
1553 Giy Ala Ser Phe Aia Asm Gin Vai Lys Lys Thr Leu Ser End 156 6
( 2 ) Dane dla sekwencji SEK NR ID: 59;
(i) Charakterystyka sekwencji:
( A) Długość: 1665 aminokwasów (B ) Typ: aminokwas ( C ) Topologia: liniowa ( i ) Typ cz^sieczki: białko ( xi) Opis sekwencji SEK NR ID: 57 ( peptyd TccB ); Cechy Od Do Opis
186 242
203
11 SEK NR ID: 7
Mec Leu Ser Thr Mec Giu Lys Gln Leu Asn Glu Ser -j 1 n Arg Asp Aia 1 6
17 Leu Cal Thr Gly T/r Mec Asn Phe Cal Ala Pro Thr Lau Lys Gly Cal - -> —
3 3 Ser Giy Gln Pro Cal Thr Cal Glu Asp Leu Tyr Glu T/r Leu Leu Ile 43
49 Asp Pro Glu Cal Aia Asp Glu Cal Glu Thr Ser Arg Cal Ala Gln Ala 64
ó 5 Ile Ala -Ser Ile Gin Gln Tyr Mec Thr Arg Leu Cal Asn Gly Ser Glu 30
31 Pro Gly Arg Gln Ala Mec Glu Pro Ser Thr Ala Asn Glu Trp Arg Asp 36
97 Asn Asp Asn Gln T/r Ala Ile Trp Ala Ala Gly Ala Glu Cal Arg Asn 112
113 Tyr Ala Glu Asn Tyr Ile Ser Pro Ile Thr Arg Gln Glu Lys Ser His 123
129 Tyr Phe Ser Glu Leu Glu Thr Thr Leu Asn Gln Asn Arg Leu Asp Pro 144
145 Asp Arg Cal Gln Asp Ala cal Leu Ala Tyr Leu Asn Glu Phe Glu Aid 150
1 ó 1 Cal Ser Asn Leu Tyr Cal Leu Ser Gly Tyr Ile Asn Gln Asp Lys Phe 176
177 Asp Gln Ala Ile Tyr Tyr Phe Ile Gly Arg Thr Thr Thr Lys Pro T/r 192
193 Arg Tyr Tyr Trp Arg Gln Mec Asp Leu Ser Lys Asn Arg Gln Asp Pro 203
209 Ala Gly Asn Pro Val Thr Pro Asn Cys Trp Asn Asp Trp Gln Glu Ile 224
225 Thr Leu Pro Leu Ser Gly Asp Thr Cal Leu Glu His Thr Cal Arg Pro 240
241 Cal Phe Tyr Asn Asp Arg Leu Tyr Cal Ala Trp Cal Glu Arg Asp Pro 256
257 Ala Cal Gln Lys Asp Ala Asp Gly Lys Asn Ile Gly Lys Thr His Ala 272
273 Tyr Asn Ile Lys Phe Gly Tyr Lys Arg Tyr Asp Asp Thr Trp Thr Ala 238
289 Pro Asn Thr Thr Thr Leu Mec Thr Gln Gln Ala Gly Glu Ser Ser Glu 304
305 Thr Gln Arg Ser Ser Leu Leu Ile Asp Glu Ser Ser Thr Thr Leu Arg .20
321 Gln Val Asn Leu Leu Ala Thr Thr Asp Phe Ser Ile Asp Pro Thr Glu 3 3 6
337 Glu Thr Asp Ser Asn Pro Tyr Gly Arg Leu Mec Leu Gly Cal Phe Cal 352
353 Arg Gln Phe Glu Gly Asp Gly Ala Asn Arg Lys Asn Lys Pro Cal Val 3 63
369 Tyr Gly Tyr Leu Tyr Cys Asp Ser Ala Phe Asn Arg His Cal Leu Arg 334
385 Pro Leu Ser Lys Asn Phe Leu Phe Ser Thr Tyr Arg Asp Glu Thr Asp 400
401 Gly Gln Asn Ser Leu Gln Phe Ala Cal Tyr Asp Lys Lys Tyr Cal Ile 416
417 Thr Lys Cal Cal Thr Gly Ala Thr Glu Asp Pro Glu Asn Thr cly Trp 432
433 Cal Ser Lys Val Asp Asp Leu Lys Gln Gly Thr Thr Gly Ala Tyr Cal 443
449 Tyr Ile Asp Gln Asp Gly Leu Thr Leu His Ile Gln Thr Thr Thr Asn 4 6 4
465 Gly -Asp Phe Ile Asn Arg His Thr Phe Gly Tyr Asn Asp Lau Cal T/r 430
431 Asp Ser Lys Ser Gly Tyr Gly Phe Thr Trp Ser Gly Asn Glu Gly Phe 4 96
497 Tyr Leu Asp Tyr His Asp Gly Asn Tyr T/r Thr Phe His Asn Aid Ile 512
204
186 242
:1ί Ile Asn Tyr Tyr Pro Ser G Tyr Gly Gly Gly Ser Val Pro Asn Gly 5 2 8
529 Thr Trp Ala Leu Glu Gln Arg Ile Asn Glu Gly Trp Ala Ile Ala Pro 644
5 -i 5 Leu Leu Asp Thr Leu His Thr Val Thr Val Lys Gly Ser Tyr Ile Ala 560
5 61 Trp Glu Gly Glu Thr Pro Thr Gly Tyr Asn Leu Tyr Ile Pro Asp Gly 576
= -- Thr Val Leu Leu Asp Trp Phe Asp Lys Ile Asn Phe Ala He Gly Leu 592,
553 Asn Lys Leu Glu Ser Val Phe Thr Ser Pro Asp Trp Pro Thr Leu Thr 603
605 Thr Ile Lys Asn Phe Ser Lys Ile Ala Asp Asn Arg Lys Phe Tyr Gln 624
625 Glu Ile Asn Ala Glu Thr Ala Asp Gly Arg Asn Leu Phe Lys Arg Tyr 640
541 S<r r Thr Gln Thr Phe Gly Leu Thr Ser Gly Ala Thr Tyr Ser Thr Thr 65 5
657 T/r Thr Leu Ser Glu Ala Asp Phe Ser Thr Asp Pro Asp Lys Asn Tyr 6“2
57 3 Leu Gln Val Cys Leu Asn Val Val Trp Asp His Tyr Asp Arg Pro Ser 633
635 Gly Lys Lys Gly Ala Tyr Ser Trp Val Ser Lys Trp Phe Asn Val Tyr 704
705 Val Ala Leu Gln Asp Ser Lys Ala Pro Asp Ala Ile Pro Arg Leu Val 720
721 Ser Arg Tyr Asp Ser Lys Arg Gly Leu Val Gln Tyr Leu Asp Phe Trp 736
737 Thr Ser Ser Leu Pro Ala Lys Thr Arg Leu Asn Thr Thr Phe Val Arg 752
753 Thr Leu Ile Glu Lys Ala ten Leu Gly Leu Asp Ser Leu Leu Asp Tyr 763
769 Thr Leu Gln Ala Asp Pro Ser Leu Glu Ala Asp Leu Val Thr Asp Gly 734
735 Lys Ser Glu Pro Mec Asp Phe Asn Gly Ser Asn Gly Leu Tyr Phe Trp 300
301 Glu Leu Phe Phe His Leu Pro Phe Leu Val Ala Thr Arg Phe Ala Asn 816
817 Glu Gln Gln Phe Ser Pro Ala Gln Lys Ser Leu His Tyr Ile Phe Asp 332
333 Pro Ala Mec Lys Asn Lys Pro His ten Ala Pro Ala Tyr Trp Asn Val 343
349 Arg Pro Leu Val Glu Gly Asn Ser Asp Leu Ser Arg His Leu Asp Asp 364
365 Ser Ile Asp Pro Asp Thr Gln Ala Tyr Ala His Pro Val Ile Tyr Gln 380
881 Lys Ala Val Phe Ile Ala Tyr Val Ser Asn Leu Ile Ala Gln Gly Asp 396
357 Mec Trp Tyr Arg Gln Leu Thr Arg Asp Gly Leu Thr Gln Ala Arg Val 912
913 Tyr Tyr Asn Leu Ala Ala Glu Leu Leu Gly Pro Arg Pro Asp Val Ser 928
929 Leu Ser Ser Ile Trp Thr Pro Gln Thr Leu Asp Thr Leu Ala Ala Gly 344
945 Gln Lys Ala Val Leu .Arg Asp Phe Glu His Gln Leu Ala Asn Ser Asp 9 60
961 Thr Ala Leu Pro Ala Leu Pro Gly Arg Asn Val Ser Tyr Leu Lys Leu
977 Ala Asp Asn Gly Tyr Phe Asn Glu Pro Leu Asn Val Leu Mec Leu Ser 992
993 His Trp Asp Thr Leu Asp Ala Arg Leu Tyr Asn Leu Arg HiS Asn Leu .00 3
1009 Thr Val Asp Gly Lys Pro Leu Ser Leu Pro Leu Tyr Ala Ala Pro Val * 1 1 • - _ ·4
25 Asp Pro Val Ala Leu Leu Ala Gln Arg Ala Gln Ser Gly Thr Leu Thr .14 0
186 242
205
1041 Asn Gly Val Ser Gly Aia . Mec Leu Thr Tal Pro Pro T/r Arg Phe 3τ=·Γ 1056
105“ Ala Mec Leu Pro Arg Ala T/r Ser Ala ’/al •w i7 Thr LĆU Thr Ser Phe 1072
1073 Gly Gln Asn Leu Leu Ser Leu Leu Glu Arg Ser Glu Arg Ala Gys Gln 10 33
1039 Glu Glu Leu Ala Gln Gln Gln Leu Leu Asp Mec Ser Ser Tyr Aia Ile 1104
1105 Thr Leu Gln Gln Gln Ala Leu Asp Gly Leu Ala Ala Asp Arg Ala 1120
1121 Leu Leu Ala Ser Gln Ala Thr Ala Gln Gin Arg His Asp His Tyr T/r 1135
1137 Thr Lau Tyr Gln Asn Asn Ile Ser Ser Ala Glu Gln Leu Val Mec Asp 1152
1153 Thr Gln Thr Ser Ala Gln Ser Leu Ile Ser Ser Ser Thr Gly 7’a 1 Gln 1163
1169 Thr Ala Ser Gly Ala Leu Lys Val Ile Pro Asn Ile Phe Gly Leu Ala 1134
1135 Asp Gly Gly Ser Arg Tyr Glu Gly Val Thr Glu Ala Ile Ala Ile Gly 1200
1201 Leu Mec Ala Ala Gly Gln Ala Thr Ser Val Val Ala Glu Arg Leu Ala 1215
1217 Thr Thr Glu Asn Tyr Arg Arg Arg Arg Glu Glu Trp Gln Ile Gln Tyr 1232
1233 Gln Gln Ala Gln Ser Glu Val Asp Ala Leu Gln Lys Gln Leu Asp Aia 1243
1249 Leu Ala Val Arg Glu Lys Ala Ala Gln Thr Ser Leu Gln Gln Ala Lys 1264
1265 Ala Gln Gln Val Gln Ile Arg Thr Mec Leu Thr Tyr Leu Thr Thr Arg 1230
1231 Phe Thr Gln Ala Thr Leu T/r Gln Trp Leu Ser Gly Gln Leu Ser Ala 1296
1297 Leu Tyr Tyr Gln Ala Tyr Asp Ala Val Val Ala Leu cys Leu Ser Ala 1312
1313 Gln Ala Cys Trp Gln Tyr Glu Leu Gly Asp Tyr Ala Thr Thr Phe Ile 1323
1329 Gln Thr Gly Thr Trp Asn Asp His Tyr Arg Gly Leu Gln Val Gly Glu 1344
1345 Thr Leu Gln Leu Asn Leu His Gln Mec Glu Ala Aia Tyr Leu val Arg 13 60
1361 His Glu Arg Arg Leu Asn Val Ile Arg Thr Val Ser Leu Lys Ser Leu 1375
1377 Leu Gly Asp Asp Gly Phe Gly Lys Leu Lys Thr Glu Gly Lys Val Asp 1392
1393 Phe Pro Leu Ser Glu Lys Leu Phe Asp Asn Asp Tyr Pro Gly His Tyr 1403
1409 Leu Arg Gln Ile Lys Thr Val Ser Val Thr Leu Pro Thr Lau Val Gly 1424
1425 Pro Tyr Gln Asn Val Lys Ala Thr Leu Thr Gln Thr Ser Ser Ser Ile 1440
1441 Leu Leu Ala Ala Asp Ile Asn Gly Val Lys Arg Leu Asn Asp Pro Thr 1456
1457 Gly Lys Giu Gly Asp Ala Thr His Ile Val Thr Asn Leu Arg Ala Ser 1472
1473 Gln Gln Val Ala Leu Ser Ser Gly Ile Asn Asp Ala Gly Ser Phe Glu 1433
1439 Leu Arg Leu Glu Asp Glu Arg Tyr Leu Ser Phe Glu Gly Thr Gly Aid 1504
1505 7al Ser Lys Trp Thr Leu Asn Phe Pro Arg Ser Val Asp Glu His Ile 1520
1521 Asp Asp Lys Thr Leu Lys Ala Asp Glu Mec Gln Ala Ala Leu Leu ΛΧΛ 15 0 6
1537 Asn Mec Asp Asp '/al Leu /a 1 Gin Val His T/r Thr .Aid cys Asp cly 1511
1553 Gly Ala Ser Phe Ala Asn Gln Val Lys L/s Thr Leu Ser
1565
206
186 242 ( 2 ) Dane dla sekwencji SEK NR ID: 60;
(i) Charakterystyka sekwencji:
(A) Długość: 3132 par zasad ( B ) Typ: kwas nukleinowy ( C ) Rodzaj nici: podwójna ( D ) Topologia: liniowa (ii) Typ cząsteczki: DNA ( genomowa ) ( xi) Opis sekwencji: SEK NR ID: 56 (tccC )
1 ATG AGT CCG TCT GAG ACT ACT CTT TAT ACT CAA ACC CCA ACA GTC AGC 48
i Mec Ser Pro Ser Glu Thr Thr Leu Tyr Thr Gln Thr Pro Thr Val Ser 1 6
49 GTG TTA GAT AAT CGC GGT CTG TCC ATT CGT GAT ATT GGT TTT CAC CGT 9 6
17 Val Leu Asp Asn Arg Gly Leu Ser Ile Arg Asp Ile Giy Phe His Arg 32
97 ATT GTA ATC GGG GGG GAT ACT GAC ACC CGC GTC ACC CGT CAC CAG TAT 144
3 3 Ile Val Ile Gly Gly Asp Thr Asp Thr Arg Val Thr Arg His Gln Tyr 43
145 GAT GCC CGT GGA CAC CTG AAC TAC AGT ATT GAC CCA CGC TTG TAT GAT 192
49 Asp Ala Arg Gly His Leu Asn Tyr Ser Ile Asp Pro Arg Leu Tyr Asp 64
193 GCA AAG CAG GCT GAT AAC TCA GTA AAG CCT AAT TTT GTC TGG CAG CAT 24 0
6 5 Ala Lys Gln Ala Asp Asm Ser Val Lys Pro Asm Phe Val Trp Glm His 80
241 GAT CTG GCC GGT CAT GCC CTG CGG ACA GAG AGT GTC GAT GCT GGT CGT 283
ai Asp Lau Ala Gly His Ala Leu Arg Thr Glu Ser Val Asp Ala Gly Arg 9 5
289 ACT GTT GCA TTG AAT GAT ATT GAA GGT CGT TCG GTA ATG ACA ATG AAT 335
57 Thr Val Ala Leu Asm Asp Ile Glu Gly Arg Ser Val Mec Thr Mec Asm 112
337 GCG ACC GGT GTT CGT CAG ACC CGT CGC TAT GAA GGC AAC ACC TTG CCC 334
113 Ala Thr Gly Val Arg Glm Thr Arg Arg Tyr Glu Gly Asm Thr Leu Pro 128
385 GGT CGC TTG TTA TCT GTG AGC GAG CAA GTT TTC AAC CAA GAG AGT GCT 432
129 Gly Arg Leu Leu Ser Val Ser Glu Gln Val Phe ton Gln Glu Ser Ala 144
433 AAA GTG ACA GAG CGC TTT ATC TGG GCT GGG AAT ACA ACC TCG GAG AAA 430
145 Lys Val Thr Glu Arg Phe Ile Trp Ala Gly ton Thr Thr Ser Glu Lys 160
481 GAG TAT AAC CTC TCC GGT CTG TGT ATA CGC CAC TAC GAC ACA GCG GGA 528
161 Glu Tyr Asm Leu Ser Gly Leu Cys Ile Arg His Tyr top Thr Ala Gly 17 6
529 GTG ACC CGG TTG ATG AGT CAG TCA CTG GCG GGC GCC ATG CTA TCC CAA 5 7 5
177 Val Thr Arg Leu Met Ser Gln Ser Leu Ala Gly Ala Mec Leu Ser Gin 192
577 TCT CAC CAA TTG CTG GCG GAA GGG CAG GAG GCT AAC TGG AGC GGT GAC 524
153 Ser His Glm Leu Leu Aid Giu Gly Glm Glu Aia Asm Trp Ser Gly Asp 2 03
186 242
207
= 25 X TAA t/Α ' TTT CAC » ATA : TAA i AAA ! Ga .A GAA : TTA i TAA AGA TAT 672
2 0 9 Nsp i Tlu . Thr ’ V η 1 Arp t Aln l G(y ' Mec Leu ; Git . Ser Tlu Val /y -r» y u Chr Ahr 224
573 ATT . TAA ' TAA CAT ' TAA GCA aGa TT! TAA AAT GCC AGG Λ'α — TTA TGt 720
22 = Tln . Ser Chr Chr Gsn G la He Aiy Ala Leu Leu Ahr Aln Ahr Gsp Cla 240
721 GGC AAC GCA TCA GgT ATA ACA TAC TGA 1 Λ X ATA GAA AAA AGA ATG AGN 763
241 Lys Tly Tsn Ile Tin Grg Leu Gla Ayr Gsp Iie Gla Gly Tln Leu Lys 2 56
7 5 9 WWW CAA TGG TAA GAT TAG GGG AGA AGG GTA TGG CGG ATA GTA TAA Cna 8 16
257 Giy Ser Trp Leu Ahr Val Lys Gly Tln Ser Tlu Aln Vai Ile Vai Lys 272
317 CAA CAT TAC TAA AAG TAC TAT ATA AGA GGG TAG ATA GGG AgG ACA AAA 3 64
273 Ser Leu Ser Arp Ser Gla Tla Gly His Lys Leu Grg Glu Glu His Gly 288
865 GGA AGA TAG GAA GAA TGG ACA GAA TGA TGA AAG AGA GAA CGA AAA AAA 512
239 .Asn Tly Val Vsl Ahr Tlu Ayr Ser Ayr Tlu Pro Alu Ahr Aln Grg Leu 304
913 GAC AAA CAC CAA GCA AAG CTA ACA TCG TGG GAA ACG AAG AGG AAA GAG 960
305 Ile Gly Ile Ahr Ahr Grg Grg Gla Tlu Tly Ser Gln Ser Gly Cla Grg 320
961 GAC TCT AGA GGA AAG AAA AGA GGG TGA AGA CAG ACG AAG gna AAA GAC 1008
321 Val Leu Tln Asp Leu Grg Ayr Lys Ayr Gsp Pro Val Gly Gsn Val Ile 336
1009 GAC CAC ACC AGA AGA TAC AGG TCA TAA ATA aga TGG CTA gna AGA can 1056
337 Ser Ile His Gsn Gsp Gla Alu Gla Ahr Grg Phe Arp Arg Gsn Tln Lys 352
1057 TCA TAG AAT GAG GGA ATA AGC AAA CGA TGA AAA CAG AGA AAG AAA GAA 1104
353 Val Tlu Pro Alu Gsn Grg Ayr Val Ayr Gsp Ser Leu Ayr Aln Leu Mec 3 63
1105 CTA TCA CAC GGG CTA AGG GAG TCA GGA GAA aaa AGA CTG GAA GAC CTG 1152
369 Ser Cla Ahr Gly Grg Tlu Mac Gla Gsn Ile Tly Gln Gln Ser Gsn Aln 334
1153 AAA AAA TAC CCA AAA GAG AAA AAA AAA GAA GGA AGC GAA GAA ACA GCA 1200
385 Leu Pro Ser Pro Vsl Ile Pro Val Pro Chr Gsp Gsp Ser Ahr Ayr Ahr 400
1201 GAA AAC AAA CTA. GCA AGA GCA AGA TGC ATA GAA AAA GGA AAA TAA ATA 1248
401 Gsn Ayr Leu Arg Ahr Ayr Ahr Ayr Gsp Grg Gly Tly Gsn Leu Val Aln 416
1249 TAA AAA ACA CAA AAG AAC TCT GCA AGG GAA GAA AGC GAA CCA TCA TAA 1296
417 Ile Trg His Ser Ser Pro Gla Chr Tln Gsn Ser Ayr Ahr Ahr Gsp Ile 432
1297 TCA TAA CAC CGA ATA GGA GGA ATG TAT TCC AAA GGA GCG AAA TAA TAG 1344
433 Chr Val Ser Ser Grg Ser A.sn Grg Gla Val Leu Ser Ahr Leu Chr Ahr 4 43
1345 TCA can CAA AAC ACA TGA TAT AAC TAA TGC AAA —C— aga AGA AGG gna 13 92
4 4 9 -Asp Pro Thr Grg Val Gsp Gla Leu Phe Asp Ser Tly Tly His Tin Lys 464
13 9 3 TCT TAT CCT C. A )A ——— AGG GGC AAA TTA TTA GGA GAA ATA AaA Gcg CAT - 4 4 W
208
186 242
455 Mec Leu Ile Pro Gly Gln Asn Leu Asp Trp Asn Tle Arg Gly LeU 4 30
1441 CAA CGA GTC ACA CcG GTG AGC CGT GAA AAT AGC AGT Gac AGT GaA Tgg 1488
431 Gln Arg Yal Thr Pro Yal Ser -Arg Glu Asn Ser Ser Asp Ser Giu Trp 4 5 o
1489 TAT CGC TAT AGC AGT GAT GGC ATG CGG CTG 1 kj CTA AAA GTG AGT GAA 15 3 6
4 5“ Tyr Arg T/r Ser Ser Asp Gly Mec -Arg Leu Leu Lys 'Yal Ser Glu 912
153 7 CAG ACG GGC AAG AGT ACT CAA GTA CAA CGG GTG ACT TAT CTG CCG 1534
513 Gln Thr Gly Asn Ser Thr Gln Yal Gln Arg Yal Thr Tyr Leu Pro Gly 523
1585 TTA GAG CTA CGG ACA ACT GGG GTT GCA GAT AAA ACA ACC GAA GAT TTG 16 3 2
529 Leu Glu Leu •Arg Thr Thr Gly Yal Ala Asp Lys Thr Thr Glu Asp Leu 544
1633 CAG GTG ATT ACG GTA GGT GAA GCG GGT CGC GCA CAG GTA AGG GTA TTG 1630
545 Gln Yal Ile Thr Val Gly Glu Ala Gly -Arg Ala Gln Yal Arg Yal Leu 5 60
1631 CAC TGG GAA AGT GGT .AAG CCG ACA GAT ATT GAC AAC AAT CAG GTG CGC 1723
5 61 His Trp Glu Ser Gly Lys Pro Thr Asp Ile Asp Asn Asn Gln Yal Arg 576
1729 TAC AGC TAC GAT AAT CTG CTT GGC TCC AGC CAG CTT GAA CTG GAT AGC 177 6
577 Tyr Ser Tyr Asp Asn Leu Leu Gly Ser Ser Gln Leu Glu Leu Asp Ser 592
1777 GAA GGG CAG ATT CTC AGT CAG GAA GAG TAT TAT CCG TAT GGC GGT ACG 1324
593 Glu Gly Gln Ile Leu Ser Gln Glu Glu Tyr Tyr Pro Tyr Gly Gly Thr 603
1325 GCG ATA TGG GCG GCG AGA AAT CAG ACA GAA GCC AGC TAC AAA TTT a 1872
609 Ala Ile Trp Ala Ala Arg Asn Gln Thr Glu Ala Ser Tyr Lys Phe Ile 624
1373 CGT TAC TCC GGT AAA GAG CGG GAT GCC ACT GGA TTG TAT TAT TAC GGC 1520
625 Arg Tyr Ser Gly Lys Glu Arg Asp Ala Thr Gly Leu Tyr Tyr Tyr Gly 640
1521 TAC CGT TAT TAT CAA CCT TGG GTG GGT CGA TGG TTG AGT GCT GAT 1563
641 T/r Arg Tyr T/r Gln Pro Trp val Gly Arg Trp Leu Ser Ala Asp Pro 6 56
1969 657 GCG Ala GGA ACC GTG GAT GGG CTG AAT TTG TAC CGA ATG GTG Yal AGG Arg AAT Asn Asn 2016 6“2
Gly Thr Yal Asp Gly Leu Asn Leu Tyr Arg Mec
2017 CCC ATC ACA TTG ACT GAC CAT GAC GGA TTA GCA CCG TCT CCA AAT 2064
67 3 Pro Ile Thr Leu Thr Asp His Asp Gly Leu Ala Pro Ser Pro Asn Arg 633
2065 AAT CGA AAT ACA TTT TGG TTT GCT TCA TTT TTG TTT CGT AAA CCT GAT 2112
639 Asn Arg Asn Thr Phe Trp Phe Ala Ser Phe Leu Phe Arg Lys Pro Asp “04
2113 GAG GGA ATG TCC GCG TCA ATG AGA CGG GGA CAA AAA ATT GGC AGA 216 0
“05 Glu Gly Mee Ser Ala Ser Mec Arg Arg Gly Gln Lys Ile Gly -Arg A. a. 720
2151 ATT GCC GGC GGG ATT GCG ATT GGC GGT CTT GCG GCT ACC ATT GCC 2208
721 Ile Ala Gly Gly Ile Ala Ile Gly Gly Leu .Ala Ala Thr Ile Ala Ala. 7 38
186 242
209
2209 ACC GCT GGC GCG GCT ATC CCC GTC ATT CTG GGG GTT GCG GCC GTA GCG 335 6 737 Thr·Ala Gly Ala Ala ib ?ro (/al Ile Leu Gly 7al Ala Ala Val Gly 753
2257 GCG GGG ATT GCG GCG TTG ATG GGA TAT AAC GTC GGT AGC CTG CTG GAA 2704
753 Ala Gly Ile Gly Ala Leu Mec Gly Tyr Asn Val Gly Ser Lau Leu Glu 768
2305 AAA GGC GGG GCA TTA CTT GCT CGA CTC GTA CAG GGG AAA TCG ACG TTA 2352
769 Lys Gly Gly Ala Leu Leu Ala Arg Leu Val Gln Gly Lys Ser Thr Leu 784
2353 GTA CAG TCG GCG GCT GGC GCG GCT GCC GGA GCG AGT TCA GCC GCG GCT 240C
735 Val Gln Ser Ala Ala Gly Aia Ala Ala Gly Ala Ser Ser Ala ALa Ala 300
2401 TAT GGC GCA CGG GCA CAA GCT GTC GCT GTT GCA TCA GCC GCC GGG GCG 2448
801 Tyr Gly Ala Arg Ala Gln Gly Val Gly Val Ala Ser Ala Ala Gly Ala 816
2449 GTA ACA GGG GCT GTG GGA TCA TGG ATA AAT AAT GCT GAT CGC GGG ATT 2496
817 Val Thr Gly Ala Val Gly Ser Trp Ile Asn Asn Ala Asp Arg Gly Ile 332
2497 GGC GGC GCT ATT GGG GCC GGG AGT GCG GTA GGC ACC ATT GAT ACT ATG 2544
333 Gly Gly Ala Ile Gly Ala Gly Ser Ala val Gly Thr Ile Asp Thr Mec 343
2545 TTA GGG ACT GCC TCT ACC CTT ACC CAT GAA GTC GGG GCA GCG GCG GGT 2592
349 Leu Gly Thr Ala Ser Thr Leu Thr His Glu Val Gly .Ala Ala Ala Gly 364
2593 GGG GCG GCG GCT GGG ATG ATC ACC GGT ACG CAA GGG AGT ACT CGG GCA 2 640
355 Gly Ala Ala Gly Gly Mec Ile Thr Gly Thr Gln Gly Ser Thr Arg Aia 330
2641 GCT ATC CAT GCC GGT ATT GGC ACC TAT TAT GGC TCC TGG ATT GGT TTT 2538
331 Gly Ile His ALa Gly Ha Gly Thr Tyr Tyr Gly Ser Trp Ile Gly Phe 896
2639 GGT TTA GAT GTC GCT AGT AAC CCC GCC GGA CAT TTA GCG AAT TAC GCA 2736
897 Gly Leu Asp Val ALa Ser Asn Pro Ala Gly His Lsu Ala Asn Tyr Ala 912
2737 GTG GGT TAT GCC GCT GGT TTG GGT GCT GAA ATG GCT GTC AAC AGA ATA 2734
913 Val Gly Tyr ALa Ala Gly Leu Gly Ala Glu Mec Ala Val ten Arg Ile 928
2785 ATG GGT GGT GGA TTT TTG AGT AGG CTC TTA GGC CGG GTT GTC AGC CCA 2832
929 Mec Gly Gly Gly Phe Leu Ser Arg Leu Leu Gly Arg Val Val Ssr Pro 944
2333 TAT GCC GCC GGT TTA GCC AGA CAA TTA GTA CAT TTC AGT GTC GCC aga 2330
545 Tyr Ala Ala Gly Leu ALa Arg Gln Leu Val His Phe Ser Val Ala Arg 960
2881 CCT GTC TTT GAG CCG ATA TTT AGT GTT CTC GGC GGG CTT GTC GGT GGT 2928
961 Pro Val Phe Glu Pro Ile Phe Ser Val Lau Gly Gly Leu Val Gly Gly 976
2929 ATT GGA ACT GGC CTG CAC AGA GTG ATG GGA AGA GAG AGT TGG ATT TCC 2975
977 He Gly Thr Gly Leu His .Arg Val Mec Gly Arg Glu Ser Trp Ile Ser 992
977 AGA GCG TTA AGT GCT GCC GGT AGT GGT ATA GAT CAT GTC GCT GGC ATG 3 2 2 4
210
186 242
993 Arg Ala Leu Ser Aia Aid Gly Ser -“I Ile Asp His Val Ala •J — / Net 1115
3 025 ATT GGT .AAT CAG ATC aGA GGC ^G GTC TTG ACC ACA ACC GGG ATC 2j( k 9971
1009 Ile Gly Asn Gln Ile Arg Gly Arg Val Leu Thr Thr Thr Gly Ile Ala 102 4
3O3 AAT GCG ATA CAC TAT CGC ACC AGT GCT GTG gGA CCC CGA CGA C TA GTT 3 120
2922 Asn Ala Iie •Asp Tyr Gly Thr Ser Ala VAi Giy Ala * A A .-i^d Arg Arg Vai 1340
3 121 TTT TCT TTC TAA 3132
1041 Phe Ser Leu End 1043
O O (2) Dane dla sekwencji SEK NR ID: 61;
(i) Charakterystyka sekwencji:
( A ) Długość: 1043 aminokwasów (B ) Typ: aminokwas ( C ) Topologia: liniowa (ii) Typ cząsteczki: białko ( x) Opis sekwencji: SEK NR ID: 61 ( peptydTccC);
1 Mec Ser Pro Ser Giu Thr Thr Leu Tyr Thr Gln Thr Pro Thr Va1 Ser 15
17 Vel Leu Asp Asn Arg Gly Leu Ser Ile Arg Asp Iie Gly Phe His Arg 32
33 Ile Va1 Ile Giy Giy Asp Thr Asp Thr Arg Vel Thr Arg His Cln Tyr 43
49 Asp A1a Arg Gly His Leu Asn Tyr Ser Ile Asp Pro Arg Leu Tyr Asp G 4
65 Ala Lys Cln Ala Asp Asn Ser Va1 Lys Pro Asn Phe Vei Trp Gln His 30
31 Asp Leu A1a Gly His A1a Leu Arg Thr Glu Ser Va1 Asp A1a Cly Arg 96
97 Thr Va1 A1a Leu Asn Asp Ile Glu Gly Arg Ser Vel Mec Thr Mec Asn 112
113 Ala Thr Cly Va1 Arg Gln Thr Arg Arg Tyr Glu Gly Asn Thr Leu Pro 123
129 Giy Arg Leu Leu Ser Va1 Ser Glu Gln Vel Phe Asn Cln Clu Ser Aia 144
145 Lys Val Thr Glu Arg Phe Ile Trp Ala Gly Asn Thr Thr Ser Glu Lys 160
161 Glu Tyr Asn Leu Ser Gly Leu Cys Ile Arg His Tyr Asp Thr Ala Giy 1 6
177 Vel Thr Arg Leu Mec Ser Gln Ser Leu Ala Cly Ala Met Leu Ser Gin 192
193 Ser His Gln Leu Leu AiA Glu Cly Gln Glu Ale Asn Trp Ser Gly Asp 208
209 Asp Glu Thr Vel Trp Gln Gly Mec Leu Ale Ser Glu Vel Tyr Thr Thr 224
225 Gln Ser Thr Thr Asn Ale Ile Gly Ale Leu Leu Thr Gln Thr Asp Aia -40
241 Lys Gly Asn Ile Gln Arg Leu Ale Tyr Asp Ile Ale Gly Gln Leu Lys 256
257 Gly Ser Trp Leu Thr Va1 Lys Giy Gln Ser Ciu Gin Val Ile Vel Ly s
273 Ser Leu Ser Trp Ser A1a Ala Gly His Lys Leu Arg Clu Glu His L'/ 283
289 Asn Gly Va1 Va1 Thr Glu Tyr Ser Tyr Clu Pro clu Thr Cln Arg Leu 3 0 4
305 Ile Giy Iie Thr Thr Arg Arg Ala Glu Giy Ser Gin Ser Giy Ala Trg 32 0
186 242 /al Leu Gln Asp Leu Arg Tyr Lys Tyr
Ser Ile His Asn Asp Ala Glu Ala Thr
Asp Pro /al Gly Asn /al
Arg Phe Trp Arg Asn Gln
/al . Glu 1 Pro G U 1U Asn . Arg Tyr • /al Tyr •Asp Ser Leu Tyr Gln Leu Mec
Ser ' Ala . Thr Gly Arg Glu Mec Ala Asn Ile Gly Gln Gln Ser Asn Gln
Leu Pro Ser rro /al Ile Pro /al Pro Thr Asp Asp Ser Thr Tyr Thr
Asn Tyr Leu Arg Thr Tyr Thr Tyr Asp Arg Gly Gly Asn Leu /al Gln
Ile Arg His Ser Ser Pro Ala Thr Gln Asn Ser Tyr Thr Thr Asp Iie
Thr /al Ser Ser Arg Ser Asn Arg Ala '/al Leu Ser Thr Leu Thr Thr
Asp Pro Thr Arg /al Asp Ala Leu Phe Asp Ser Gly Gly His Gln Lys
Mec Leu Ile Pro Gly Gln Asn Leu ^p Trp Asn Ile Arg Gly Glu Leu
Gln Arg /al Thr Pro /al Ser Arg Glu Asn Ser Ser Asp Ser Glu Trp
Tyr .Arg Tyr Ser Ser Asp Gly Mec •Arg Leu Leu Lys /al Ser Glu Gin
G ln Thr Gly Asn Ser Thr Gln /al Gln •Arg /al Thr Tyr Leu Pro Gly
Leu Glu Leu Arg Thr Thr Gly /al Ala Asp Lys Thr Thr Glu Asp Leu
Gln /al Ile Thr /al Gly Glu Ala Gly Arg Ala Gln /al Arg /al Leu
His Trp Glu Ser Gly Lys Pro Thr Asp Ile Asp Asn Asn Gln /al Arg
Tyr Ser Tyr Asp Asn Leu Leu Gly Ser Ser Gln Leu Glu Leu Asp Ser
Glu Gly Gln Ile Leu Ser Gln Glu Glu Tyr Tyr Pro Tyr Gly Gly Thr
.Ala Ile Trp Ala Ala Arg Asn Gln Thr Glu Ala Ser Tyr Lys Phe Ile
Arg Tyr Ser Gly Lys Glu Arg ^p Ala Thr Gly Leu Tyr Tyr Tyr Gly
Tyr Arg Tyr Tyr Gln Pro Trp /al Gly Arg Trp Leu Ser Ala Asp Pro
Ala Gly Thr /al Asp Gly Leu Asn Leu Tyr Arg Mac /al Arg Asn .A>n
Pro Ile Thr Leu Thr Asp His Asp Gly Leu Ala Pro Ser Pro Asn -Arg
Asn Arg Asn Thr Phe Trp Phe Ala Ser Phe Leu Phe Arg Lys Pro Asp
Glu Gly Mec Ser Ala Ser Mec Arg Arg Gly Gln Lys Ile Gly •Arg Ala
Ile Ala Gly Gly Ile Ala Ile Gly Gly Leu Ala Ala Thr Ile .Ala Ala
Thr Ala Gly Ala Ala Ile Pro /al Ile Leu Gly /al Ala Ala /al Gly
Ala Gly Ile Gly Ala Leu Mec Gly Tyr Asn /al Gly Ser Leu Leu Glu
Lys Gly Gly Ala Leu Leu Ala Arg Leu /al Gln Gly Lys Ser Thr Leu
/al Gln Ser Ala Ala Gly Ala Ala Ala Gly Ala Ser Ser Ala Ala Ala
Tyr Gly Ala Arg Ala Gln Gly /al Gly /al Ala Ser Ala Ala Gly Ala
/al Thr Gly Ala /al Gly Ser Trp Ile Asn Asn Ala Asp Arg Gly Ile
Gly Gly Ala Ile Gly .Ala Gly Sep Ala /al Gly Thr Ile Asp Thr Mec
212
186 242
8 4 9 Leu Gly Thr .Ala Ser Thr Leu Thr His Glu Val Gly Aia Aia Ala Gly (i-i
565 Gly Ala Ala Gly Gly Mee Ile Thr Gly Thr Gln Gly Ser Thr Arg Ala ISO
881 Gly Ile His .Ala kj ly Ile Gly Thr Tyr Tyr Gly Ser Trp Ile Gly Phe 89 6
897 Gly Leu Asp Val Ala Ser Asn Pro Ala Gly His Leu Ala Asn Tyr Ala 912
9 33 Val Gly Tyr Ala Ala Gly Leu Gly Ala Glu Mee Ala Val Asn Arg Ile 92 8
929 Mec Gly Gly Gly Phe Leu Ser Arg Leu Leu Gly -Arg Val Val Ser Pro 944
945 Tyr Ala .Ala Gly Leu Ala Arg Gln Leu Val His Phe Ser Val Ala Arg 960
961 Pro Val Phe Glu Pro Ile Phe Ser Val Leu Gly Gly Leu Val Gly Gly 976
977 Ile Gly Thr Gly Leu His Arg Val Mec Gly Arg Glu Ser Trp Ile Ser 992
993 -Arg Ala Leu Ser Ala Ala Gly Ser Gly Ile Asp His Val Ala Gly Mec 100S
1009 I le Gly Asn Gln Ile Arg Gly Arg Val Leu Thr Thr Thr Gly Ile Aia 1024
1025 Asn Ala Ile Asp Tyr Gly Thr ser Ala Val Gly Ala Ala Arg Arg Val 1040
1041 Phe Ser Leu 1043
186 242 g§s mm Bśs o
Λ* o υ o H rf >. 88o
88® H rf W * v? υ rf UDU rf H 3
Sii
8tS P OO O OO W sa#
2 o o o.
5§5 £ rf H Frf f-· H as e $
<-* < w <h H
8S £4
O
2
U O o. H rf OT sa &
Hrf O.
a m
ga s rf f-· X
Ρί J
953 953 9Bg 893
Si 8· 85S 88 & SB E
U O rf O O O* Hrf H O O rf H rf O H rf «9 O O >, rf F* ·
88£ 88S 883 ga :
g§^ m gga m
883 883 883 m 853 68E gaa es z o O rf rf H rf O. OOP
H rf C O O >, Hrf O O O >W sea 883 88£ 883^
883 m 883 gga
583 88» Si S S83
O O < H < w rfH rf OO O rf H 3 H rf 3 Hrf >. O O M §83 8§3 883 agi
953 88£ 853 883 gas iss ess 68 e rf Η X H rf P rfH OT O O rf rf H O OOC O O M
88£ SP5 aB3
0 3 OO Μ H rf ®
853 aga ss3
595 8§£885 oc wi ri s
LL i O O >» iS8 3
H rf C sea gaa rf Η
O O rf *5 3 es * f~»rf « OOP rfR M sas rf Η X
CD O OT OT CN (D Ok u-» ci cn r- ot cn ,-ł «Μ CN
186 242 co co co
CO
ECOR I (707)
b~ o
b» bw o
b.
cc
CC
O
O
Ul
in
FIG. 2
186 242
ΤΗ-5 (N-term)
3000
FIG. 3
ΤΗ-10 ΤΗ-18 ΤΗ-17 (TcbA-PT81) (TcbA-PT56) (TcbA-PT103)
1000
186 242
TchA
TcaBi
TchA
TcaBi
TchA
TcaBi
TchA
TcaBi
TchA
TcaBii
TchA
TcaBii
TcbA
TcaBii
1740 1750 1760 1770 1780
SSAQALKNDS EPMDFSGANA LYFWELFYYT PMMMAHRLLQ EQNFDAANHW
η I 1
|450 { 460 1 470 480
_gS nPvDFSGpyg iYlWEiFfhi PflvtvRmqt EQryedAdtW>
ΛΑ ΑΑΛΑΛΛΛ
ΛΛΑΛΑΑΛΑ A AA
A A _ A A ___ A A^.A
NR
1790 1800 1810 1820 1830
FRYVWSPSGY IVDGKIAIYH WNVRPLEEDT SWNAQQLDST DPDAVAQDDP rdangąl | | j
490 | 510 520 530 ykYifrsaGY IinDGskprY- WNVmPLqlDT aWdttQpatT DPDviAmaDP>
| A A A Λ A A Λ Λ
ΛΑΛΑ ΑΛΛΛ AAAA
1840 1850 1860 1870 1880
MHYKVATFMA TLDLLMARGD AAYRQLERDT LAEAKMWYTQ ALNLLGDEPQ
I I I I
540 550 560 570 580
MHYKlAiFlh TLDLLiARGD sAYRQLERDT LvEAKMyYiQ AqqLLGprPd>
'w'
1890 1900 1910 1920 1930
VMLSTIWANP TLGNAASKTT QQVRQQVLTQ LR1NSRVKTP LLGTANSLTA
600 ihttnTWpNP TLsk>
1940 1950 1960 1970 1980
LFLPQENSKL KGYWRTLAQR MFNLRHNLSI DGQPLSLPLY AKPADPKALL lilii
30 40 50 60 _FLPpyNdvL lGYWdkLelR lyNLRHNLSl DGQPLnLPLY AtPvDPKtLq>
ΛΛΛΛΛΛΛΛΛΛ Λ Λ Λ Λ Λ Λ Λ Α ~ Λ
1990 2000 2010 2020 2030
SAAVSASQGG ADLPKAPLTI HRFPQMLEGA RGLVNQLIQF GSSLLGYSER
I law
80 | 90 100 110 rqqaggdgtG sspaggqgsv qRyPllvErA RsaVslLtQF GnSLqttlEh>
-v'-νΛν/'-νΛ
Λ ΛΛΛ
A——A AA AAAA.
v—wZk/
2040 2050 2060 2070 2080
QDAEAMSQLL QTQASELILT SIRMQDNQLA ELDSEKTALQ VSLAGVQQRF
120
130
140
150
160
QDnEkMtiLL QTQqeailkh qhdiQqNnLk gLqhslTALQ aSrdGdtlRq> 'ν -ΛΛν-νΛΛ'''' -Λν-ΛνννΛν
FIG. 4A
186 242
TchA
TcaBii
TchA
TcaBii
TchA
TcaBii
TchA
TcaBii
TchA
TcaBii
TchA
TcaBii
TchA
TcaBii
TcbA
TcaBii
2090 2100 2110 2120 2130
DSYSQLYEEN INAGEQRALA LRSESAIESQ GAQISRMAGA GOTMAPNIFG
III a
170 I 180 I 190I 200 | 210 khYSdLingg lsAaEiagLt LRStaml-tn Gvatglliag GinavPNvFG>
ΛΛΛΛνΛ--AAAAAyyAAA AAA_AyA AA Λ---Λ,^Λ,^ΛΛ AAAy_AAA/
2140 2150 2160 2170 2180
LADGGMHYGA IAYAIADGIE LSASAKMTOA EKVAQSE1YR RRRQEWKIQR
220
250
230 I 240
LAnGGsewGA pligsgqatq vgAgiqdqsA gisevtagYq RRqeEWalQR>
Λ Λ Λ Λ _ Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ Λ /
260
2190 2200 2210 2220 2230
ENAQAEZNQL NAQLESLSIR REAAEMQKEY LKTQQAQAQA QLTFLRSKFS
270
300
310
280 I 290
DiAdnEItQL dAQiqSLqeq itmAqkQitl seTeQAnAQA iydlqttrFt>
ΑνΛΛ_ΛΛ_ΛΛ Λ Λ A Λ Λ Λ. Α^Λ Λ Λ Α Λ Λ Λ Λ Λ yy_ Α Λ Λ S.
2240 2250 2260 2270 2280
NQALYSWLRG RLSGIYFQFY DLAVSRCLMA EQSYQWEAND NSISFVKPGA
320 | 330 | 340 | | | 360 | gQALYnWmaG RLSalYyQmY DstlpiCLqp kaalvqEgek eSdSlfqvpv>
„AAAAAAAyA ΛΛΑΛΑΛΑΛ_Λ AyA A AyA AyA AyyyA Λ Λ _ A Λ Λ yy_
2290 2300 2310 2320 2330
WQGTYAGLLC GEALIQNLAQ MEEAYLKWES RALEVERTVS LAWYDSLEG
370
410
380 I 390 I 400 WndlwqGLLa GEgLsseLqk IdaiwLargg igLEaiRTVS Ldtlfgt—G> 'vΛΛΛν
2340 2350 2360 2370 2380
NDRFNLAEQI PALLDKGEGT AGTKKNGLSL ANAILSASVK LSDLKLGTDY
420 | 430 j 440 | 450
---tLsEnl nkvLn-GEtv spsggvtLaL tgdlfgAtld LSqLgLdnsY>
'--AAyA
2390 2400 2410 2420 2430
PDSIVGSNKV ERIKQISVSL PALVGPYQDV QAMLSYGGST QLPKGCSALA
i
480 490 | 500
460 I 470 -n—lGneKk RRIKrIaVtL PtLlGPYQDl eAtLvmGaea aLshGvndgg>
A ---AZXy AAAA---AAA AAAAAAAAAA AAyAyyAA.A _ A A _ A yA _
2440 2450 2460 2470
VSHGTNDSGQ FQLDFNDGKY LPFEGIALDD QGTLNLQFPN
510
520
530 rfvtdfndsr F-LpF-eGrd attgtleLn>
FIG. 4B
186 242 <Λ
Σ3
Ό η
to
α.
$
Ό
Ο.
ω
Ν w
ω c
to
C $
ο
Ο
0.
Xł* Et75
LO
LO
CKI.
e>
8- cc Xf
ΟΟ ο θ CJ *—I -r- CJ ΙΟ »— oj oo ζ <ί· σ» οο —_ κ> «ο ιο co χ ου οο σ> ο -·— oj OO xj- tO UO ΙΟ
FIG. 5
186 242
CJ o
c o
o.
o
ir *
£ ω
y o
I— u:
o.
_i ω
_j <z>
>
UJ
0.
w o
σ
O <o u
łω «
o ł— £0 (0
O f— <
<0 o
H <
(0 o
H io •β
1)
T3
CO £
o •a o
•a &
o •o <u •o ω xn oo s s s
Η- Η H « jS c o IZ IZ 3 3
-o Ό υ w Ό -3 r r !ź ω
UJ μ_
E ω O z co ω
o -»
Ο ω z ω h
sł
< (0 _ Ό < £? cog- < CO o < CO o
o o 8· H
H i O ‘ O.
s o
<
<0 a
H l·—
-Q
O
<
XI o
HCC
H
O
LL o
ω >
O σ
<
-g
FIG. 6A
186 242 ω
□ o
o _J
co υ
o tu
CD
O o
ł<
o o
H
UJ ω
_j
Σ ώ
.8 tu ł—
CC ω
_J
CL ω
H73 υ
4w
O
O <
Ό α
Ł— <
cc o
<
x>
o
H w
u.
Z
Z >
O <
T3 £
<D
o.
7Ξ3 φ O o. I— o
Departament Wydawnictw UP RP. Nakład 70 egz. Cena 6,00 zł.
£ o
-o o
Ό £
O •o υ
Ό
UJ ω
y:
—I >
Q
ą.
UJ ić >
ω
UJ
FIG. 6B

Claims (14)

  1. Zastrzeżenia patentowe
    1. Polinukleotyd funkcjonalnie związany z heterologicznym promotorem, który koduje białko o aktywności toksycznej przeciwko szkodliwym owadom, znamienny tym, że cząsteczka nukleotydowa kodująca to białko utrzymuje hybrydyzację z komplementarną sekwencją kwasu nukleinowego, po hybrydyzacji w 25°C, w 0,45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja kwasu nukleinowego jest wybrana z grupy obejmującej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO:11, SEQ ID NO:60, SEQ ID NO:36 i SEQ ID NO:46.
  2. 2. Polinukleotyd według zastrz. 1, znamienny tym, że przemywanie prowadzone jest w 0,9 M chlorku sodu i 0,09 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu w 65°C.
  3. 3. Polinukleotyd według zastrz. 1, znamienny tym, że przemywanie prowadzone jest w 0,0375 M chlorku sodu i 0,00375 M cytrynianie sodu pH 7,0, i 0,2% dodecylosiarczanie sodu w 68°C.
  4. 4. Polinukleotyd według zastrz. 1, znamienny tym, że jest zmodyfikowany tak, że zawiera kodon do ekspresji i produkcji białka w gospodarzu innym niż gospodarz naturalny.
  5. 5. Polinukleotyd funkcjonalnie związany z heterologicznym promotorem, który koduje białko o aktywności toksycznej przeciwko szkodliwym owadom, znamienny tym, że polinukleotyd ten utrzymuje hybrydyzację z komplementarną sekwencją kwasu nukleinowego po hybrydyzacji w 25°C, w 0,45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja kwasu nukleinowego jest wybrana z grupy obejmującej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO:11, SEQ ID NO:60, SEQ ID NO:36 i SEQ ID NO:46.
  6. 6. Polinukleotyd według zastrz. 5, znamienny tym, że przemywanie prowadzone jest w 0,9 M chlorku sodu i 0,09 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu w 65°C.
  7. 7. Polinukleotyd według zastrz. 5, znamienny tym, że przemywanie prowadzone jest w 0,0375 M chlorku sodu i 0,00375 M cytrynianie sodu pH 7,0, i 0,2% dodecylosiarczanie sodu w 68 °C.
  8. 8. Polinukleotyd według zastrz. 5, znamienny tym, że zawiera sekwencję nukleotydową kodującą sekwencję aminokwasową wybraną z grupy obejmującej: SEQ ID NO:34, SEQ ID NO:32, SEQ ID NO: 12, SEQ ID NO:61, SEQ ID NO:37 i SEQ ID NO:47.
  9. 9. Polinukleotyd kodujący białko o aktywności toksycznej przeciwko szkodliwym owadom, znamienny tym, że koduje sekwencję aminokwasową wybraną z grupy obejmującej: SEQ ID NO:34, SEQ ID NO:32, SEQ ID NO:12, SEQ ID NO:61, SEQ ID NO:37 i SEQ ID NO:47 i jest funkcjonalnie połączony z heterologicznym promotorem.
  10. 10. Komórka rośliny transgenicznej zawierająca polinukleotyd i/lub w której zachodzi ekspresja polinukleotydu funkcjonalnie związanego z heterologicznym promotorem, który koduje białko o aktywności toksycznej przeciwko szkodliwym owadom, znamienna tym, że cząsteczka nukleotydowa kodująca to białko utrzymuje hybrydyzację z komplementarną sekwencją kwasu nukleinowego, po hybrydyzacji w 25°C, w 0,45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja kwasu nukleinowego jest wybrana z grupy obejmującej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO: 11, SEQ ID NO:60, SEQ ID NO:36 i SeQ ID NO:46.
  11. 11. Zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom, znamienne tym, że sekwencja nukleotydowa kodująca to białko utrzymuje hybrydyzację z sekwencją kwasu nukleinowego po hybrydyzacji w 25°C, w 0,45 M chlorku sodu i 0,045 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu, i przemyciu, przy czym sekwencja
    186 242 kwasu nukleinowego jest wybrana z grupy obejmującej: SEQ ID NO:33, SEQ ID NO:31, SEQ ID NO:11, SEQ ID N0:60, SEQ IDNO:36 i SEQ ID NO:46.
  12. 12. Białko według zastrz. 11, znamienne tym, że przemywanie prowadzone jest w 0,9 M chlorku sodu i 0,09 M cytrynianie sodu pH 7,0, i 0,1% dodecylosiarczanie sodu w 65°C.
  13. 13. Białko według zastrz. 11, znamienne tym, że przemywanie prowadzone jest w 0,0375 M chlorku sodu i 0,00375 M cytrynianie sodu pH 7,0, i 0,2% dodecylosiarczanie sodu w 68°C.
  14. 14. Zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom, znamienne tym, że obejmuje sekwencję aminokwasową wybraną z grupy obejmującej: SEQ ID NO:34, SEQ ID NO:32, SEQ ID NO: 12, SEQ ID NO:61, SEQ ID NO:37 i SEQ ID NO:47.
PL96321212A 1995-11-06 1996-11-06 Polinukleotyd kodujący zrekombinowane białko i zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom PL186242B1 (pl)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US725595P 1995-11-06 1995-11-06
US60842396A 1996-02-28 1996-02-28
US70548496A 1996-08-29 1996-08-29
PCT/US1996/018003 WO1997017432A1 (en) 1995-11-06 1996-11-06 Insecticidal protein toxins from photorhabdus

Publications (2)

Publication Number Publication Date
PL321212A1 PL321212A1 (en) 1997-11-24
PL186242B1 true PL186242B1 (pl) 2003-12-31

Family

ID=27358315

Family Applications (1)

Application Number Title Priority Date Filing Date
PL96321212A PL186242B1 (pl) 1995-11-06 1996-11-06 Polinukleotyd kodujący zrekombinowane białko i zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom

Country Status (13)

Country Link
EP (1) EP0797659A4 (pl)
JP (2) JP3482214B2 (pl)
KR (1) KR100354530B1 (pl)
AU (1) AU729228B2 (pl)
BR (1) BR9606889A (pl)
CA (1) CA2209659C (pl)
HU (1) HUP9900768A3 (pl)
IL (1) IL121243A (pl)
MX (1) MX9705101A (pl)
PL (1) PL186242B1 (pl)
RO (1) RO121280B1 (pl)
SK (1) SK93197A3 (pl)
WO (1) WO1997017432A1 (pl)

Families Citing this family (141)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9618083D0 (en) * 1996-08-29 1996-10-09 Mini Agriculture & Fisheries Pesticidal agents
EP0915909B1 (en) * 1997-05-05 2007-06-13 Dow AgroSciences LLC Insecticidal protein toxins from xenorhabdus
AU7974198A (en) * 1997-06-20 1999-01-04 Mycogen Corporation Method to identify pesticidal microbes
AUPO808897A0 (en) * 1997-07-17 1997-08-14 Commonwealth Scientific And Industrial Research Organisation Toxin genes from the bacteria xenorhabdus nematophilus and photohabdus luminescens
US6281413B1 (en) 1998-02-20 2001-08-28 Syngenta Participations Ag Insecticidal toxins from Photorhabdus luminescens and nucleic acid sequences coding therefor
JP2002504336A (ja) * 1998-02-20 2002-02-12 ノバルティス アクチエンゲゼルシャフト フォトラブドゥスからの殺昆虫性毒素
US6174860B1 (en) 1999-04-16 2001-01-16 Novartis Ag Insecticidal toxins and nucleic acid sequences coding therefor
GB9901499D0 (en) * 1999-01-22 1999-03-17 Horticulture Res Int Biological control
AUPP911399A0 (en) * 1999-03-10 1999-04-01 Commonwealth Scientific And Industrial Research Organisation Plants and feed baits for controlling damage
EP1069134A1 (en) * 1999-07-15 2001-01-17 Wisconsin Alumni Research Foundation Photorhabdus luminescens strains
WO2001016305A2 (en) * 1999-09-02 2001-03-08 Agresearch Limited Nucleotide sequences encoding an insectidal protein complex from serratia
FR2803592A1 (fr) 2000-01-06 2001-07-13 Aventis Cropscience Sa Nouveaux derives de l'acide 3-hydroxypicolinique, leur procede de preparation et compositions fongicides les contenant.
US8440880B2 (en) 2000-06-30 2013-05-14 Monsanto Technology Llc Xenorhabdus sp. genome sequences and uses thereof
FR2815969B1 (fr) 2000-10-30 2004-12-10 Aventis Cropscience Sa Plantes tolerantes aux herbicides par contournement de voie metabolique
JP2005536198A (ja) 2002-06-28 2005-12-02 ダウ アグロサイエンス リミテッド ライアビリティー カンパニー ペニバチルス種から得られる殺虫活性タンパク質およびポリヌクレオチド
WO2004067750A2 (en) 2003-01-21 2004-08-12 Dow Agrosciences Llc Xenorhabdus tc proteins and genes for pest control
AR043328A1 (es) 2003-01-21 2005-07-27 Dow Agrosciences Llc Metodo para la inhibicion de insectos
US7319142B1 (en) 2004-08-31 2008-01-15 Monsanto Technology Llc Nucleotide and amino acid sequences from Xenorhabdus and uses thereof
MX2010001980A (es) * 2007-08-31 2010-03-11 Basf Plant Science Gmbh Genes para el control de patogenos y metodos de uso en plantas.
TW201142029A (en) 2009-11-24 2011-12-01 Univ Leuven Kath Banana promoters
BR112012015690A2 (pt) 2009-12-23 2015-08-25 Bayer Intelectual Property Gmbh Plantas tolerantes a herbicidas inibidores de hppd.
EA201290559A1 (ru) 2009-12-23 2013-01-30 Байер Интеллектуэль Проперти Гмбх Растения, устойчивые к гербицидам - ингибиторам hppd
MX2012007358A (es) 2009-12-23 2012-11-06 Bayer Ip Gmbh Plantas tolerantes a herbicidas inhibidores de las hppd.
AU2010334818B2 (en) 2009-12-23 2015-07-09 Bayer Intellectual Property Gmbh Plants tolerant to HPPD inhibitor herbicides
AR079882A1 (es) 2009-12-23 2012-02-29 Bayer Cropscience Ag Plantas tolerantes a herbicidas inhibidores de las hppd
AU2011212538B2 (en) 2010-02-02 2014-12-04 BASF Agricultural Solutions Seed US LLC Soybean transformation using HPPD inhibitors as selection agents
US20120088719A1 (en) 2010-09-20 2012-04-12 Jerald Coleman Ensign Mosquitocidal Xenorhabdus, Lipopeptide And Methods
EP2669373B1 (en) 2010-11-10 2016-06-01 Bayer CropScience AG HPPD variants and methods of use
UA111193C2 (uk) 2011-03-25 2016-04-11 Баєр Інтеллекчуел Проперті Гмбх Застосування n-(тетразол-4-іл)- або n-(триазол-3-іл)арилкарбоксамідів або їх солей для контролю небажаних рослин на площах трансгенних культур, що толерантні до гербіцидів, що є інгібіторами hppd
AU2012234448A1 (en) 2011-03-25 2013-10-17 Bayer Intellectual Property Gmbh Use of N-(1,2,5-Oxadiazol-3-yl)benzamides for controlling unwanted plants in areas of transgenic crop plants being tolerant to HPPD inhibitor herbicides
KR101246707B1 (ko) * 2012-08-01 2013-03-25 ㈜엠알이노베이션 포토랍두스 템프라타 템프라타 균주를 포함하는 뿌리혹선충 방제용 조성물
UA119532C2 (uk) 2012-09-14 2019-07-10 Байєр Кропсайєнс Лп Варіант hppd та спосіб його застосування
US10221429B2 (en) 2013-03-07 2019-03-05 Bayer Cropscience Lp Toxin genes and methods for their use
CA2942171C (en) 2014-03-11 2023-05-09 Bayer Cropscience Lp Hppd variants and methods of use
MX2018003044A (es) 2015-09-11 2018-04-11 Bayer Cropscience Ag Variantes de hppd y metodos de uso.
CA3043493A1 (en) 2016-11-23 2018-05-31 BASF Agricultural Solutions Seed US LLC Axmi669 and axmi991 toxin genes and methods for their use
CN110225974B (zh) 2016-12-22 2024-03-29 巴斯夫农业种子解决方案美国有限责任公司 使用cry14来控制线虫害虫
BR112019014727A2 (pt) 2017-01-18 2020-04-07 BASF Agricultural Solutions Seed US LLC molécula de ácido nucleico, vector, célula, planta, semente, polipeptídeo, composição, métodos para o controle de uma população de pragas, para matar uma praga, para produzir um polipeptídeo, para proteger uma planta e para aumentar o rendimento em uma planta, uso do ácido nucleico e produto de base
US11286498B2 (en) 2017-01-18 2022-03-29 BASF Agricultural Solutions Seed US LLC Use of BP005 for the control of plant pathogens
WO2018165091A1 (en) 2017-03-07 2018-09-13 Bayer Cropscience Lp Hppd variants and methods of use
BR112020008096A2 (pt) 2017-10-24 2020-11-03 Basf Se método para conferir tolerância a um herbicida e planta de soja transgênica
US11279944B2 (en) 2017-10-24 2022-03-22 BASF Agricultural Solutions Seed US LLC Of herbicide tolerance to 4-hydroxyphenylpyruvate dioxygenase (HPPD) inhibitors by down-regulation of HPPD expression in soybean
CN114341116A (zh) 2019-07-22 2022-04-12 拜耳公司 5-氨基取代的吡唑和三唑作为杀虫剂
US20220264880A1 (en) 2019-07-23 2022-08-25 Bayer Aktiengesellschaft Novel heteroaryl-triazole compounds as pesticides
KR20220038403A (ko) 2019-07-23 2022-03-28 바이엘 악티엔게젤샤프트 살충제로서의 신규 헤테로아릴-트리아졸 화합물
EP3701796A1 (en) 2019-08-08 2020-09-02 Bayer AG Active compound combinations
US20220403410A1 (en) 2019-09-26 2022-12-22 Bayer Aktiengesellschaft Rnai-mediated pest control
CA3156302A1 (en) 2019-10-02 2021-04-08 Bayer Aktiengesellschaft COMBINATIONS OF ACTIVE COMPOUNDS INCLUDING FATTY ACIDS
UY38911A (es) 2019-10-09 2021-05-31 Bayer Ag Compuestos de heteroarilo-triazol como pesticidas, formulaciones, usos y métodos de uso de los mismos
WO2021069569A1 (en) 2019-10-09 2021-04-15 Bayer Aktiengesellschaft Novel heteroaryl-triazole compounds as pesticides
KR20220098170A (ko) 2019-11-07 2022-07-11 바이엘 악티엔게젤샤프트 동물 해충 방제를 위한 치환된 술포닐 아미드
WO2021097162A1 (en) 2019-11-13 2021-05-20 Bayer Cropscience Lp Beneficial combinations with paenibacillus
TW202134226A (zh) 2019-11-18 2021-09-16 德商拜耳廠股份有限公司 作為殺蟲劑之新穎雜芳基-三唑化合物
WO2021099271A1 (en) 2019-11-18 2021-05-27 Bayer Aktiengesellschaft Active compound combinations comprising fatty acids
TW202136248A (zh) 2019-11-25 2021-10-01 德商拜耳廠股份有限公司 作為殺蟲劑之新穎雜芳基-三唑化合物
EP4097125A1 (en) 2020-01-31 2022-12-07 Pairwise Plants Services, Inc. Suppression of shade avoidance response in plants
US20230148601A1 (en) 2020-02-18 2023-05-18 Bayer Aktiengesellschaft Novel heteroaryl-triazole compounds as pesticides
EP3708565A1 (en) 2020-03-04 2020-09-16 Bayer AG Pyrimidinyloxyphenylamidines and the use thereof as fungicides
US20230212600A1 (en) 2020-04-16 2023-07-06 Pairwise Plants Services, Inc. Methods for controlling meristem size for crop improvement
WO2021209490A1 (en) 2020-04-16 2021-10-21 Bayer Aktiengesellschaft Cyclaminephenylaminoquinolines as fungicides
JP2023522350A (ja) 2020-04-21 2023-05-30 バイエル・アクチエンゲゼルシヤフト 有害生物防除剤としての2-(ヘタ)アリール-置換縮合ヘテロ環誘導体
TW202208347A (zh) 2020-05-06 2022-03-01 德商拜耳廠股份有限公司 作為殺蟲劑之新穎雜芳基三唑化合物
EP4146628A1 (en) 2020-05-06 2023-03-15 Bayer Aktiengesellschaft Pyridine (thio)amides as fungicidal compounds
US20230180756A1 (en) 2020-05-12 2023-06-15 Bayer Aktiengesellschaft Triazine and pyrimidine (thio)amides as fungicidal compounds
BR112022023550A2 (pt) 2020-05-19 2023-01-03 Bayer Cropscience Ag (tio)amidas azabicíclicas como compostos fungicidas
CA3185017A1 (en) 2020-06-02 2021-12-09 Pairwise Plants Services, Inc. Methods for controlling meristem size for crop improvement
WO2021245087A1 (en) 2020-06-04 2021-12-09 Bayer Aktiengesellschaft Heterocyclyl pyrimidines and triazines as novel fungicides
MX2022015625A (es) 2020-06-10 2023-01-11 Bayer Ag Heterociclos sustituidos con azabiciclilo como nuevos fungicidas.
AR122661A1 (es) 2020-06-17 2022-09-28 Pairwise Plants Services Inc Métodos para el control del tamaño del meristemo para la mejora de cultivos
EP4168404A1 (en) 2020-06-18 2023-04-26 Bayer Aktiengesellschaft 3-(pyridazin-4-yl)-5,6-dihydro-4h-1,2,4-oxadiazine derivatives as fungicides for crop protection
CA3187291A1 (en) 2020-06-18 2021-12-23 Bayer Aktiengesellschaft Composition for use in agriculture
UY39275A (es) 2020-06-19 2022-01-31 Bayer Ag 1,3,4-oxadiazol pirimidinas como fungicidas, procesos e intermediarios para su preparación, métodos de uso y usos de los mismos
WO2021255089A1 (en) 2020-06-19 2021-12-23 Bayer Aktiengesellschaft 1,3,4-oxadiazole pyrimidines and 1,3,4-oxadiazole pyridines as fungicides
UY39276A (es) 2020-06-19 2022-01-31 Bayer Ag Uso de compuestos de 1,3,4–oxadiazol–2–ilpirimidina para controlar microorganismos fitopatógenos, métodos de uso y composiciones.
WO2021255091A1 (en) 2020-06-19 2021-12-23 Bayer Aktiengesellschaft 1,3,4-oxadiazoles and their derivatives as fungicides
EP3929189A1 (en) 2020-06-25 2021-12-29 Bayer Animal Health GmbH Novel heteroaryl-substituted pyrazine derivatives as pesticides
KR20230039665A (ko) 2020-07-02 2023-03-21 바이엘 악티엔게젤샤프트 해충 방제제로서의 헤테로사이클 유도체
WO2022033991A1 (de) 2020-08-13 2022-02-17 Bayer Aktiengesellschaft 5-amino substituierte triazole als schädlingsbekämpfungsmittel
WO2022053453A1 (de) 2020-09-09 2022-03-17 Bayer Aktiengesellschaft Azolcarboxamide als schädlingsbekämpfungsmittel
WO2022058327A1 (en) 2020-09-15 2022-03-24 Bayer Aktiengesellschaft Substituted ureas and derivatives as new antifungal agents
EP3974414A1 (de) 2020-09-25 2022-03-30 Bayer AG 5-amino substituierte pyrazole und triazole als schädlingsbekämpfungsmittel
EP3915971A1 (en) 2020-12-16 2021-12-01 Bayer Aktiengesellschaft Phenyl-s(o)n-phenylamidines and the use thereof as fungicides
CA3205419A1 (en) 2020-12-18 2022-06-23 Bayer Aktiengesellschaft Use of dhodh inhibitor for controlling resistant phytopathogenic fungi in crops
WO2022129196A1 (en) 2020-12-18 2022-06-23 Bayer Aktiengesellschaft Heterobicycle substituted 1,2,4-oxadiazoles as fungicides
WO2022129190A1 (en) 2020-12-18 2022-06-23 Bayer Aktiengesellschaft (hetero)aryl substituted 1,2,4-oxadiazoles as fungicides
WO2022129188A1 (en) 2020-12-18 2022-06-23 Bayer Aktiengesellschaft 1,2,4-oxadiazol-3-yl pyrimidines as fungicides
EP4036083A1 (de) 2021-02-02 2022-08-03 Bayer Aktiengesellschaft 5-oxy substituierte hetereozyklen, als schädlingsbekämpfungsmittel
CA3210785A1 (en) 2021-02-11 2022-08-18 Pairwise Plants Services, Inc. Methods and compositions for modifying cytokinin oxidase levels in plants
WO2022182834A1 (en) 2021-02-25 2022-09-01 Pairwise Plants Services, Inc. Methods and compositions for modifying root architecture in plants
BR112023019400A2 (pt) 2021-03-30 2023-12-05 Bayer Ag 3-(hetero)aril-5-clorodifluorometil-1,2,4-oxadiazol como fungicida
BR112023019788A2 (pt) 2021-03-30 2023-11-07 Bayer Ag 3-(hetero)aril-5-clorodifluorometil-1,2,4-oxadiazol como fungicida
US20240254121A1 (en) 2021-05-06 2024-08-01 Bayer Aktiengesellschaft Alkylamide substituted, annulated imidazoles and use thereof as insecticides
US20240294533A1 (en) 2021-05-12 2024-09-05 Bayer Aktiengesellschaft 2-(het)aryl-substituted condensed heterocycle derivatives as pest control agents
EP4355083A1 (en) 2021-06-17 2024-04-24 Pairwise Plants Services, Inc. Modification of growth regulating factor family transcription factors in soybean
UY39827A (es) 2021-06-24 2023-01-31 Pairwise Plants Services Inc Modificación de genes de ubiquitina ligasa e3 hect para mejorar los rasgos de rendimiento
CN117794358A (zh) 2021-07-01 2024-03-29 成对植物服务股份有限公司 用于增强根系发育的方法和组合物
WO2023019188A1 (en) 2021-08-12 2023-02-16 Pairwise Plants Services, Inc. Modification of brassinosteroid receptor genes to improve yield traits
KR20240039209A (ko) 2021-08-13 2024-03-26 바이엘 악티엔게젤샤프트 활성 화합물 조합물 및 이를 포함하는 살진균제 조성물
AR126798A1 (es) 2021-08-17 2023-11-15 Pairwise Plants Services Inc Métodos y composiciones para modificar genes de histidina quinasa receptores de citoquinina en plantas
IL310966A (en) 2021-08-25 2024-04-01 Bayer Ag Pyrazyl-triazole as pesticidal compounds
CA3230167A1 (en) 2021-08-30 2023-03-09 Pairwise Plants Services, Inc. Modification of ubiquitin binding peptidase genes in plants for yield trait improvement
AR126938A1 (es) 2021-09-02 2023-11-29 Pairwise Plants Services Inc Métodos y composiciones para mejorar la arquitectura de las plantas y los rasgos de rendimiento
EP4144739A1 (de) 2021-09-02 2023-03-08 Bayer Aktiengesellschaft Anellierte pyrazole als schädlingsbekämpfungsmittel
AU2022352997A1 (en) 2021-09-21 2024-04-04 Pairwise Plants Services, Inc. Methods and compositions for reducing pod shatter in canola
CN118434850A (zh) 2021-10-04 2024-08-02 成对植物服务股份有限公司 用于改善小花能育性和种子产量的方法
CN118302434A (zh) 2021-10-07 2024-07-05 成对植物服务股份有限公司 用于改善小花育性和种子产量的方法
WO2023078915A1 (en) 2021-11-03 2023-05-11 Bayer Aktiengesellschaft Bis(hetero)aryl thioether (thio)amides as fungicidal compounds
WO2023099445A1 (en) 2021-11-30 2023-06-08 Bayer Aktiengesellschaft Bis(hetero)aryl thioether oxadiazines as fungicidal compounds
AR127904A1 (es) 2021-12-09 2024-03-06 Pairwise Plants Services Inc Métodos para mejorar la fertilidad de floretes y el rendimiento de semillas
AR128372A1 (es) 2022-01-31 2024-04-24 Pairwise Plants Services Inc Supresión de la respuesta de evitación de la sombra en las plantas
WO2023148028A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests
WO2023148030A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in corn
WO2023148036A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in soybean
WO2023148035A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in rice
WO2023148031A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in cotton
WO2023148029A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in cereals
US20240327858A1 (en) 2022-03-02 2024-10-03 Pairwise Plants Services, Inc. Modification of brassinosteroid receptor genes to improve yield traits
WO2023192838A1 (en) 2022-03-31 2023-10-05 Pairwise Plants Services, Inc. Early flowering rosaceae plants with improved characteristics
WO2023196886A1 (en) 2022-04-07 2023-10-12 Pairwise Plants Services, Inc. Methods and compositions for improving resistance to fusarium head blight
WO2023205714A1 (en) 2022-04-21 2023-10-26 Pairwise Plants Services, Inc. Methods and compositions for improving yield traits
US20230348922A1 (en) 2022-05-02 2023-11-02 Pairwise Plants Services, Inc. Methods and compositions for enhancing yield and disease resistance
WO2023213626A1 (en) 2022-05-03 2023-11-09 Bayer Aktiengesellschaft Use of (5s)-3-[3-(3-chloro-2-fluorophenoxy)-6-methylpyridazin-4-yl]-5-(2-chloro-4-methylbenzyl)-5,6-dihydro-4h-1,2,4-oxadiazine for controlling unwanted microorganisms
WO2023213670A1 (en) 2022-05-03 2023-11-09 Bayer Aktiengesellschaft Crystalline forms of (5s)-3-[3-(3-chloro-2-fluorophenoxy)-6-methylpyridazin-4-yl]-5-(2-chloro-4-methylbenzyl)-5,6-dihydro-4h-1,2,4-oxadiazine
US20230416767A1 (en) 2022-05-05 2023-12-28 Pairwise Plants Services, Inc. Methods and compositions for modifying root architecture and/or improving plant yield traits
AR129709A1 (es) 2022-06-27 2024-09-18 Pairwise Plants Services Inc Métodos y composiciones para modificar el escape a la sombra en plantas
AR129749A1 (es) 2022-06-29 2024-09-25 Pairwise Plants Services Inc Métodos y composiciones para controlar el tamaño del meristemo para el mejoramiento de cultivos
WO2024006792A1 (en) 2022-06-29 2024-01-04 Pairwise Plants Services, Inc. Methods and compositions for controlling meristem size for crop improvement
US20240043857A1 (en) 2022-08-04 2024-02-08 Pairwise Plants Services, Inc. Methods and compositions for improving yield traits
US20240060081A1 (en) 2022-08-11 2024-02-22 Pairwise Plants Services, Inc. Methods and compositions for controlling meristem size for crop improvement
WO2024054880A1 (en) 2022-09-08 2024-03-14 Pairwise Plants Services, Inc. Methods and compositions for improving yield characteristics in plants
WO2024068520A1 (en) 2022-09-28 2024-04-04 Bayer Aktiengesellschaft 3-(hetero)aryl-5-chlorodifluoromethyl-1,2,4-oxadiazole as fungicide
WO2024068517A1 (en) 2022-09-28 2024-04-04 Bayer Aktiengesellschaft 3-(hetero)aryl-5-chlorodifluoromethyl-1,2,4-oxadiazole as fungicide
WO2024068519A1 (en) 2022-09-28 2024-04-04 Bayer Aktiengesellschaft 3-(hetero)aryl-5-chlorodifluoromethyl-1,2,4-oxadiazole as fungicide
WO2024068518A1 (en) 2022-09-28 2024-04-04 Bayer Aktiengesellschaft 3-heteroaryl-5-chlorodifluoromethyl-1,2,4-oxadiazole as fungicide
EP4295688A1 (en) 2022-09-28 2023-12-27 Bayer Aktiengesellschaft Active compound combination
EP4385326A1 (en) 2022-12-15 2024-06-19 Kimitec Biogorup Biopesticide composition and method for controlling and treating broad spectrum of pests and diseases in plants
WO2024137438A2 (en) 2022-12-19 2024-06-27 BASF Agricultural Solutions Seed US LLC Insect toxin genes and methods for their use
KR20240100589A (ko) * 2022-12-22 2024-07-02 주식회사 남보 포토랍두스 시네리아 nb-yg4-3 균주, 이를 포함하는 방제용 조성물 및 이를 이용한 방제 방법
US20240279673A1 (en) 2023-02-16 2024-08-22 Pairwise Plants Services, Inc. Methods and compositions for modifying shade avoidance in plants
US20240294933A1 (en) 2023-03-02 2024-09-05 Pairwise Plants Services, Inc. Methods and compositions for modifying shade avoidance in plants
WO2024186950A1 (en) 2023-03-09 2024-09-12 Pairwise Plants Services, Inc. Modification of brassinosteroid signaling pathway genes for improving yield traits in plants

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1986001509A1 (en) * 1984-09-05 1986-03-13 Biotechnology Australia Pty. Ltd. Xenocoumacins
US5254799A (en) * 1985-01-18 1993-10-19 Plant Genetic Systems N.V. Transformation vectors allowing expression of Bacillus thuringiensis endotoxins in plants
US5039523A (en) * 1988-10-27 1991-08-13 Mycogen Corporation Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin
AU675335B2 (en) * 1993-06-25 1997-01-30 Commonwealth Scientific And Industrial Research Organisation Toxin gene from xenorhabdus nematophilus
WO1995003695A1 (en) * 1993-07-27 1995-02-09 Agro-Biotech Corporation Novel fungicidal properties of metabolites, culture broth, stilbene derivatives and indole derivatives produced by the bacteria xenorhabdus and photorhabdus spp.
GB9618083D0 (en) * 1996-08-29 1996-10-09 Mini Agriculture & Fisheries Pesticidal agents

Also Published As

Publication number Publication date
KR19980701244A (ko) 1998-05-15
PL321212A1 (en) 1997-11-24
WO1997017432A1 (en) 1997-05-15
JP3657593B2 (ja) 2005-06-08
JP2002509424A (ja) 2002-03-26
JP3482214B2 (ja) 2003-12-22
SK93197A3 (en) 1998-05-06
CA2209659C (en) 2008-01-15
AU1050997A (en) 1997-05-29
HUP9900768A3 (en) 2002-10-28
RO121280B1 (ro) 2007-02-28
EP0797659A1 (en) 1997-10-01
IL121243A (en) 2010-05-31
BR9606889A (pt) 1997-10-28
AU729228B2 (en) 2001-01-25
KR100354530B1 (ko) 2003-01-06
HUP9900768A2 (hu) 1999-06-28
EP0797659A4 (en) 1998-11-11
IL121243A0 (en) 1998-01-04
JP2004089189A (ja) 2004-03-25
CA2209659A1 (en) 1997-05-15
MX9705101A (es) 1997-10-31

Similar Documents

Publication Publication Date Title
PL186242B1 (pl) Polinukleotyd kodujący zrekombinowane białko i zrekombinowane białko o aktywności toksycznej przeciwko szkodliwym owadom
SK24699A3 (en) Insecticidal protein toxins from photorhabdus
US6379946B1 (en) Insecticidal protein toxins from Xenorhabdus
US9546378B2 (en) Hemipteran-and coleopteran active toxin proteins from Bacillus thuringiensis
US7569748B2 (en) Nucleic acid encoding an insecticidal protein toxin from photorhabdus
US6528484B1 (en) Insecticidal protein toxins from Photorhabdus
ES2348509T5 (es) Nuevas proteínas insecticidas de Bacillus thuringiensis
AU9712501A (en) Insecticidal protein toxins from photorhabdus
UA82485C2 (uk) Інсектицидні білкові токсини з photorhabdus
MXPA99001288A (en) Insecticidal protein toxins from xenorhabdus
AU2013273706A1 (en) Hemipteran- and Coleopteran- active toxin proteins from Bacillus thuringiensis

Legal Events

Date Code Title Description
LAPS Decisions on the lapse of the protection rights

Effective date: 20101106