PL188612B1 - Oczyszczony i wyizolowany DNA, chimeryczny polinukleotyd, wektor ekspresyjny i komórka gospodarza transformowana tym wektorem - Google Patents

Oczyszczony i wyizolowany DNA, chimeryczny polinukleotyd, wektor ekspresyjny i komórka gospodarza transformowana tym wektorem

Info

Publication number
PL188612B1
PL188612B1 PL96361105A PL36110596A PL188612B1 PL 188612 B1 PL188612 B1 PL 188612B1 PL 96361105 A PL96361105 A PL 96361105A PL 36110596 A PL36110596 A PL 36110596A PL 188612 B1 PL188612 B1 PL 188612B1
Authority
PL
Poland
Prior art keywords
icam
seq
ala
leu
sequence
Prior art date
Application number
PL96361105A
Other languages
English (en)
Inventor
Patrick D. Kilgannon
W.Michael Gallatin
Original Assignee
Icos Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Icos Corp filed Critical Icos Corp
Publication of PL188612B1 publication Critical patent/PL188612B1/pl

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/70525ICAM molecules, e.g. CD50, CD54, CD102
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • C07K16/2821Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against ICAM molecules, e.g. CD50, CD54, CD102
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • G01N33/6896Neurological disorders, e.g. Alzheimer's disease
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/01Animal expressing industrially exogenous proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/24Immunoglobulins specific features characterized by taxonomic origin containing regions, domains or residues from different species, e.g. chimeric, humanized or veneered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/55Fab or Fab'
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2799/00Uses of viruses
    • C12N2799/02Uses of viruses as vector
    • C12N2799/021Uses of viruses as vector for the expression of a heterologous nucleic acid
    • C12N2799/026Uses of viruses as vector for the expression of a heterologous nucleic acid where the vector is derived from a baculovirus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Neurosurgery (AREA)
  • Veterinary Medicine (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Food Science & Technology (AREA)
  • Toxicology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Neurology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Semiconductor Memories (AREA)
  • Treatment And Processing Of Natural Fur Or Leather (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Glass Compositions (AREA)

Abstract

1. Oczyszczony i wyizolowany DNA zawierajacy regulatorowa, tran skry pcyjna se- kwencje promotorowa dla DNA kodujacego ICAM-4, jak podano na Id. Sekw. nr 27. PL PL PL

Description

Przedmiotem wynalazku jest oczyszczony i wyizolowany DNA, chimeryczny polinukleotyd, wektor ekspresyjny i komórka gospodarza transformowana tym wektorem. W ogólności wynalazek odnosi się do komórkowych cząsteczek adhezyjnych, a bardziej szczegółowo obejmuje metody klonowania oraz ekspresji DNA kodującego nieznany dotychczas polipeptyd określany jako „ICAM-4”, wykazujący strukturalne podobieństwo do innych międzykomórkowych cząsteczek adhezyjnych ICAM-1, ICAM-2 i ICAM-R.
Zgłoszenie jest kontynuacją w części zgłoszenia patentowego USA nr 08/481130 zgłoszonego 7 czerwca 1995, będącego kontynuacją w części zgłoszenia patentowego USA nr 08/245295 zgłoszonego 18 maja 1994, które z kolei jest kontynuacją w części zgłoszenia patentowego USA nr 08/102852 zgłoszonego 5 sierpnia 1993 jako kontynuacja w części zgłoszenia patentowego USA nr 08/009266 zgłoszonego 22 stycznia 1993, będącego kontynuacją w części zgłoszenia patentowego USA nr 07/894061 zgłoszonego 5 czerwca 1992, będącego w dalszym ciągu kontynuacją w części zgłoszenia patentowego USA nr 07/889724 zgłoszonego 26 maja 1992, jako kontynuacja w części oczekującego na uznanie zgłoszenia patentowego USA nr 07/827689 zgłoszonego 27 stycznia 1992.
Podstawa wynalazku
Badania naukowe ostatniego dziesięciolecia umożliwiły wyjaśnienie różnych, zachodzących na poziomie molekularnym, zdarzeń stanowiących podłoże wzajemnego oddziaływania na siebie komórek ciała, w szczególności tych, jakie warunkują ruchliwość i aktywację komórek układu odpornościowego człowieka, a w ostatnim czasie, także tych, które biorą
188 612 udział w rozwoju i prawidłowym, fizjologicznym funkcjonowaniu komórek układu nerwowego. Ogólnych informacji dotyczących komórek układu odpornościowego szukaj w publikacji Springera, Nature, 346: 425-434 (1990), natomiast odnoszących się do komórek układu nerwowego - w artykułach autorstwa Yoshihary i wsp., Neurosci. Res. 10: 83-105 (1991) oraz u Sondereggera i Rathjena, J. Cell. Biol. 119: 1387-1394 (1992). Białka powierzchniowe komórek, a w szczególności grupa tak zwanych komórkowych cząsteczek adhezyjnych [Cellular Adhesion Molecules - „CAMs”] stopniowo stawały się przedmiotem zainteresowania nauk farmaceutycznych umożliwiając postęp wiedzy. Celem badań była ingerencja w procesy związane z przenikaniem leukocytów przez ścianę naczyń krwionośnych i ich migracji do ogniska zapalnego oraz te, jakie odpowiadają za ukierunkowane przemieszczanie leukocytów do różnych tkanek docelowych. Podobnie, zainteresowanie naukowców skupia się także na procesach prowadzących do różnicowania się neuronów i tworzenia kompleksowej sieci neuronalnej. Wyizolowanie oraz charakterystyka komórkowych cząsteczek adhezyjnych, sklonowanie i ekspresja sekwencji DNA kodujących te cząsteczki, a także wprowadzenie i stosowanie ich jako środków służących celom diagnostyki i terapii procesów zapalnych oraz określających rozwój i funkcjonowanie układu nerwowego legły u podstaw wielu patentów amerykańskich oraz pozaamerykanskich. Informacji szukaj w: Edwards, Current Opinion in Therapeutic Patents, 1(11): 1617-1630 (1991) oraz w szczególności w opublikowanych tam literaturowych odnośnikach cytowanych w części zatytułowanej „Odnośniki do publikacji patentowych”.
Fundamentalne znaczenie dla założeń obecnego wynalazku miała wcześniejsza identyfikacja oraz określenie struktury niektórych cząstek pośredniczących w procesach adhezji komórkowej, takich jak „leukointegryny”: LFA-1, MAC-1 i gpl50.95 (zgodnie z nomenklaturą WHO określane odpowiednio jako CD18/CDlla, CD18/CDllb oraz CD18/CDllc), tworzące podrodzinę heterodimerycznych białek powierzchniowych (tzw. „integryn”) komórki obecnych na powierzchni limfoc^ów B, limfocytów T, monocytów i granulocytów. Danych tych szukaj w tabeli 1, strona 429, w publikacji Springera cytowanej powyżej. Interesującymi są także inne jednołańcuchowe cząsteczki adhezyjne (CAMs), biorące udział w aktywacji leukocytów, ich przyleganiu, przemieszczaniu oraz podobnych im zjawiskach nierozerwalnie związanych z procesem zapalnym. Dla przykładu, jak się obecnie uważa, zanim dojdzie do diapedezy (przenikanie leukocytów przez śródbłonek naczyń krwionośnych), jaki to proces ma miejsce w obrębie ogniska zapalnego, muszą najpierw ulec aktywacji integryny, których obecność obserwuje się konstytutywnie na powierzchni leukocytów. Aktywacja ta na drodze silnego wiązania receptora z jego ligandem powoduje w konsekwencji interakcję pomiędzy integrynami (np. LFA-1) oraz jedną lub obiema z dwóch różnych międzykomórkowych cząsteczek adhezyjnych (ICAMs) określonych jako ICAM-1 i ICAM-2, których ekspresję można stwierdzić na powierzchni komórek śródbłonka naczyniowego oraz wielu leukocytów.
Podobnie jak i inne, scharakteryzowane do dzisiaj CAMs (np. naczyniowa cząsteczka adhezyjna - [VCAM-1] opisana w publikacji PCT WO nr 90/13300 z dnia 15 listopada 1990 r; oraz płytko wo-śródbłonkowa komórkowa cząsteczka adhezyjna [PECAM-1] opisana przez Newmana i wsp., Science, 247: 1219-1222 (1990) oraz w zgłoszeniu patentowym PCT WO 91/10683 opublikowanym 25 lipca 1991), ICAM-1 oraz ICAM-2 wykazują strukturalnie homologię z innymi cząsteczkami będącymi pochodnymi superrodziny genu immunogłobulinowego, z tym, że część pozakomórkowa każdej z ICAM składa się z serii domen posiadających podobny motyw karboksy-końca. Typowa domena przypominająca immunoglobulinę tworzy pętlę zazwyczaj połączoną wiązaniem dwusiarczkowym występującym pomiędzy dwoma grupami cysteiny położonymi na końcach tej pętli. ICAM-1 zawiera pięć domen immunoglobulinopodobnych; ICAM-2, różniąca się głównie rozmieszczeniem w obrębie komórki, zawiera dwie takie domeny; PECAM-1 posiada sześć domen; VCAM obejmuje sześć lub siedem domen, zależnie od wariantów wiązania pętli, i tak dalej. Co więcej, wszystkie CAM charakteryzują się występującym typowo w obrębie cząsteczki śródbłonowym regionem hydrofobowym, jak się uważa, koniecznym dla zorientowania przestrzennego cząsteczki na powierzchni komórki oraz karboksykońcowym regionem cytoplazmatycznym. Graficzny model CAMs można przedstawić w postaci cząsteczki zakotwiczonej w błonie poprzez region śródbłonowy z ogonkiem cytoplazmatycznym, sterczącym w kierunku komórkowej cytoplazmy oraz jedną lub większą ilością pętli immunoglobulinopodobnych wystających ponad powierzchnię komórki.
188 612
Liczne komórki neuronalne ekspresjonują receptory powierzchniowe immunoglobulinowe wykazują podobieństwo do cząsteczek ICAM, patrz np. publikacja Yoshihara i wsp., cytowana powyżej. Poza domenami posiadającymi struktury immunoglobulinopodobne, wiele cząsteczek adhezyjnych występujących w obrębie układu nerwowego posiądą również w swoich domenach pozakomórkowych powtarzające się tandemowo sekwencje przypominające fibronektynę.
Można przewidzieć, że ze względu na specyfikę działania międzykomórkowe cząsteczki adhezyjne zostaną wykorzystane w celach leczniczych. Przesłanką dla jednego z zastosowań terapeutycznych może być zdolność wiązania się ICAM-1 z ludzkimi rinowirusami. Na przykład Europejskie zgłoszenie patentowe nr 468 257 a zgłoszone 29 stycznia 1992 opisuje wprowadzenie multimerycznych konfiguracji oraz form ICAM-1 (w tym form o pełnej długości jak i form okrojonych) w celu zwiększenia aktywności wiążącej kompleksu receptor/ligand, w szczególny sposób zwiększającego zdolność wiązania wirusów, antygenów limfocyto-pochodnych oraz takich patogenów jak zarodziec zimnicy (Plasmodium falciparum).
W podobny sposób można zakładać innego typu wykorzystanie białek immunologicznie wywodzących się z międzykomórkowych cząsteczek adhezyjnych. Przykład takiego zastosowania podaje publikacja WO 91/16928 z dnia 14 listopada 1991, w której opisano wykorzystanie humanizowanych chimerycznych przeciwciał o swoistości skierowanej przeciw ICAM1 w leczeniu specyficznych i niespecyficznych stanów zapalnych, zakażeń wirusowych oraz astmy oskrzelowej. Zastosowanie przeciwciał anty-ICAM-1 oraz fragmentów cząsteczki ICAM-1 wleczeniu wstrząsu endotoksycznego opisano także w publikacji WO 92/04034 z dnia 19 marca 1992 r. Opis metody leczenia polegającej na zahamowaniu odczynu zapalnego zależnego od ICAM-1 poprzez wprowadzenie przeciwciał antyidiotypowych lub ich fragmentów skierowanych przeciwko ICAM-1 można znaleźć w publikacji WO 92/06119 z dnia 16 kwietnia 1992 r.
Pomimo fundamentalnych odkryć rzucających światło na mechanizmy adhezji komórkowej, jakich dokonano poprzez identyfikację i charakterystykę białek adhezji międzykomórkowej, takich jak ICAM-1, oraz integryn wzajemnego oddziaływania limfocytów, takich jak LFA-1, obraz tych zjawisk nie jest jeszcze pełny. Ogólnie przyjmuje się, iż w procesach zapalnych oraz w mechanizmie ukierunkowanego przemieszczania limfocytów w organizmie uczestniczy wiele innych białek. Dla przykładu, zgłoszenia patentowe USA o numerach seryjnych 07/827 689, 07/889 724, 07/894 061 i 08/009 266 i odpowiadające im opublikowane zgłoszenie PCT WO 93/14776 (z dnia 5 sierpnia 1993) ujawniają metodę klonowania i ekspresji białek pochodnych od cząsteczek ICAM, określanych jako ICAM-R. Zgłoszenia te zostały powołane tu jako literatura, a sekwencje DNA oraz sekwencja aminokwasów ICAM-R zostały podane poniżej jako SEK ID nr 4. Ekspresję tego nowego ligandu stwierdzono w ludzkich limfocytach, monocytach oraz granulocytach.
Z punktu widzenia niniejszego zgłoszenia, najważniejszą jest jeszcze inna cząsteczka powierzchniowa ICAM podobna wykazująca, w odróżnieniu od pozostałych znanych cząsteczek ICAM, swoistość tkankową. Mori i wsp. [Proc. Natl. Acad. Sci.. (USA) 84: 3921-3925 (1987)] doniósł o identyfikacji specyficznego dla kresomózgowia antygenu jaki stwierdził w mózgu królika, swoiście reagującego z przeciwciałem monoklonalnym 271A6. Ten antygen powierzchniowy został nazwany telenkefaliną. Imamura i wsp. [Neurosci.. Letts 119: 118-121 (1990)] dla oceny lokalizacji występowania telenkefaliny stosowali przeciwciała poliklonalne. Wynikiem ich badań było stwierdzenie, że ekspresja telenkefaliny w korze wzrokowej kotów wykazuje zmienność zależną od warstwy tkanki oraz, że ekspresja telenkefaliny zmienia się w zależności od stadium rozwojowego. Jednocześnie Oka i wsp. [Neuroscience 35: 93-103 (1990)] przedstawili wyniki badań zmierzających do izolacji telenkefaliny przy użyciu przeciwciała monoklonalnego 271A6. Wyizolowali oni cząsteczkę powierzchniową o masie cząsteczkowej około 500 kD. Cząsteczka ta składała z czterech podjednostek, każda o masie natywnej molekuły 130 kD, która to pod wpływem N-glikanazy ulegała redukcji do 100 kD. Yoshihiro i wsp. [Neuroscience, Research Supplement 18, str. S83 (1994)] na 17 dorocznym spotkaniu Japońskiego Towarzystwa Nauk Neurologicznych (Japan Neuroscience Society) jakie odbyło się w Nagoi, Japonia, w dniach 7-9 grudnia 1993 r. oraz na 23 dorocznym zjeździe Naukowego Towarzystwa Neurologicznego (Society for Neuroscience), jaki odbył się
188 612 w Waszyngtonie 9 listopada 1993 r. [Society for Neuroscience Abstracts 19 (1-3) str. 646 (1993)] przedstawili cDNA oraz sekwencję aminokwasową króliczej telenkefaliny. Wydedukowana sekwencja aminokwasowa sugerowała, iż telenkefalina o masie 130 kD stanowi integralne białko błonowe zawierające dziewięć pozakomórkowych domen immunoglobulinopodobnych. Osiem z nich, położone dystalnie wykazywało homologię z domenami immunoglobulinopodobnymi charakteryzującymi inne cząsteczki ICĄM. Ta sama informacja została następnie opublikowana przez Yoshiharę i wsp. w Neuron 12: 543-553 (1994).
Z naukowego punktu widzenia istnieje stała konieczność prowadzenia badań zmierzających do wykrycia kolejnych białek uczestniczących w procesach interakcji między komórkowych. Nieustannie potrzeba też nowych infonnacji dotyczących identyfikacji tych białek oraz ich charakteryzowania w kontekście struktury aminokwasowej. Co więcej, potencjalne możliwości ich wykorzystania dla nowych metod leczenia oraz dla potrzeb diagnostyki powodują konieczność określenia sekwencji DNA kodującego strukturę tych cząsteczek. Takie brzemienne w skutki informacje mogą między innymi spowodować produkcję na skalę masową białek, pozwolić na identyfikację komórek naturalnie je produkujących, a także umożliwić wytwarzanie przeciwciał lub innych, nowatorskich białek wiążących, swoiście reagujących i/lub hamujących reakcje połączenia ligandu z receptorem w jakich cząsteczki te są zaangażowane.
Krótkie streszczenie wynalazku
Przedmiotem wynalazku jest oczyszczony i wyizolowany DNA zawierający regulatorową, transkrypcyjną sekwencję promotorową dla DNA kodującego ICAM-4, jak podano na id. Sekw. nr 27. Korzystnie sekwencją promotorową jest promotor dla ludzkiego ICAM-4 zawarty w Id. Sekw. nr 33. Korzystniej promotor jest zawarty w obrębie sekwencji od nukleotydu około 1204 do nukleotydu około 1666 w Id. Sekw. nr 33.
Ponadto wyżej wymieniony promotor korzystnie jest zdolny do prowadzenia transkrypcji polinukleotydu połączonego w sposób funkcjonalny z takim promotorem w neuronach. Korzystnie wyżej wymieniony promotor jest zdolny do prowadzenia transkrypcji polinukleotydu połączonego w sposób funkcjonalny z takim promotorem w komórce hipokampu.
Przedmiotem wynalazku jest również chimeryczny polinukleotyd zawierający promotor dla ludzkiego genu ICAM-4, którego sekwencja jest zawarta wid. Sekw. nr 33. Korzystnie promotor ten jest zawarty w obrębie sekwencji od nukleotydu około 1204 do nukleotydu około 1666 Id. Sekw. nr 33.
Przedmiotem wynalazku jest również wektor ekspresyjny zawierający oczyszczony i izolowany DNA obejmujący promotor dla DNA kodującego ICAM-4, jak podano na Id. Sekw. nr 27 albo chimeryczny polinukleotyd zawierający promotor dla ludzkiego genu ICAM-4, przy czym promotor zawarty jest w Id. Sekw. nr 33 oraz komórka gospodarza transformowana takim wektorem.
Komórki gospodarza według wynalazku, mogą być w szczególności - komórkami takimi jak komórki organizmów prokariotycznych lub eukariotycznych, które są stabilnie transformowane sekwencjami.
Komórki gospodarza wykazujące ekspresję takich produktów jak ICAM-4 lub warianty ICAM-4 mogą służyć różnym celom. Z powodu ekspresji żądanych produktów na powierzchni komórek gospodarza, komórki te mogą stanowić doskonały immunogen służący produkcji przeciwciał o swoistej immunoreaktywności z ICAM-4 i jej wariantami. Komórki gospodarza według wynalazku są użyteczne do produkcji na większą skalę ICAM-4 oraz wariantów ICAM-4 przez hodowanie ich w odpowiedniej pożywce hodowlanej i wyizolowanie pożądanych polipeptydów z samych komórek lub z pożywki, na której one rosną.
Cząsteczka ICAM-4 może zostać wyizolowana z naturalnych komórek, ale korzystnie ICAM-4 razem z wariantami jest wytwarzana metodami rekombinacji genetycznej, przez komórki gospodarza według wynalazku. Korzystną sekwencję amino-kwasową polipeptydu ICAM-4 przedstawia sekwencja SEK. ID nr 2. Produkty można wytwarzać w postaci polipeptydów częściowo lub całkowicie glikozylowanych, częściowo lub całkowicie deglikozylowanych lub nieglikozylowanych, w zależności od rodzaju komórek gospodarza użytych do produkcji białka lub/i procedur poizolacyjnych. Warianty cząsteczki ICAM-4 mogą obejmować rozpuszczalne lub nierozpuszczalne w wodzie, monomeryczne, multimeryczne lub cykliczne
188 612 fragmenty ICAM-4 zawierające wszystkie lub tylko część jednego lub kilku z regionów domen opisanych powyżej, a posiadających właściwości biologiczne lub immunologiczne ICAM-4, takie jak: zdolność wiązania z partnerem wiązania ICAM-4 i/lub zdolność hamowania wiązania ICAM-4 z naturalnym jej partnerem. Warianty ICAM-4 mogą obejmować także analogi polipeptydowe, w których jeden lub większa liczba określonych aminokwasów zostaje usunięta lub zastąpiona: (1) nie powodując utraty, a korzystnie wzmacniając jedną lub więcej biologicznych funkcji lub właściwości immunologicznych właściwych dla ICAM-4; lub (2) powodując niezdolność do konkretnego wiązania ligand/receptor. Bierze się pod uwagę także analogi polipeptydów, powstałych na skutek wprowadzenia do cząsteczki dodatkowych reszt aminokwasowych (np. lizyny lub cysteiny), co z kolei ułatwia tworzenie struktur multimerycznych.
Ponadto oczyszczony i wyizolowany DNA według wynalazku, chimeryczny polinukleotyd, wektor ekspresyjny i komórka gospodarza transformowana tym wektorem znajdą zastosowanie w wytwarzaniu przeciwciał (np. przeciwciał monoklonalnych i poliklonalnych, fragmentów przeciwciał, przeciwciał jednołańcuchowych, przeciwciał chimerycznych, przeciwciał szczepionych-CDR itp.) oraz innych białek wiążących (np. polipeptydy i peptydy), które są swoiste (tzn. nie reagują ani z ICAM-1, ani z ICAM-2 i ICAM-R, do których ICaM-4 jest strukturalnie podobna) wobec ICAM-4 lub wariantów ICAM-4. Przeciwciała takie można wytwarzać przy zastosowaniu hybrydoma np. 127A, 127H, 1731 oraz 179H. Przeciwciała można wytwarzać zarówno używając naturalnych lub rekombinowanych cząsteczek ICAM-4 jak i wariantów ICAM-4 lub komórek wyrażających na swojej powierzchni takie produkty. Białka wiążące, mogą być dodatkowo wykorzystywane w celu charakteryzowania struktury miejsc wiążących (np. dla określenia epitopu i/lub wrażliwości własności wiążących na modyfikacje w sekwencji aminokwasowej ICAM-4).
Białka wiążące są przydatne w kompozycjach do immunizacji oraz do oczyszczania polipeptydów ICAM-4, a także do identyfikacji komórek prezentujących na swojej powierzchni polipeptydy. W oczywisty sposób można je także wykorzystywać w celach modulacji (tzn. blokowania, hamowania lub stymulacji) biologicznych aktywności wiązania ligand/receptor, w których bierze udział ICAM-4, w szczególności funkcji efektorowych ICAM-4, które odgrywają rolę w swoistej i nieswoistej odpowiedzi układu odpornościowego. Można również brać pod uwagę przeciwciała anty idiotypowe swoiste wobec przeciwciał skierowanych przeciwko ICAM-4 i ich zastosowanie w modulacji odpowiedzi immunologicznej. Testy na wykrywanie oraz ilościową ocenę obecności ICAM-4 na powierzchni komórek oraz w płynach ustrojowych, takich jak surowica czy płyn mózgowordzeniowy, mogą obejmować np. pojedyncze lub wielokrotne przeciwciała wykorzystywane w systemach badania typu „sandwich” („kanapkowego'1'’').
Wartość naukowa informacji, jakie można uzyskać poprzez ujawnienie sekwencji DNA ICAM-4 jest znaczna. Jak to można wykazać w jednej serii przykładów, znajomość sekwencji cDNA dla ICAM-4 umożliwia izolację sekwencji genomowego DNA kodującego ICAM-4 poprzez DNA/DNA hybrydyzację oraz umożliwia poznanie sekwencji kontrolujących ekspresję ICAM-4, takich jak promotory, operatory itp. Oczekuje się, że procedury hybrydyzacji DNA/DNA prowadzone przy użyciu sekwencji DNA według wynalazku i w ostrych warunkach hybrydyzacji, pozwolą na izolację wielu DNA kodujących alleliczne warianty ICAM-4, inne strukturalnie pokrewne białka posiadające jedną lub więcej biologicznych i/lub immunologicznych właściwości ICAM-4 oraz białka homologiczne z ICAM-4 pochodzących z innych gatunków.
DNA według wynalazku są także przydatne w teście hybrydyzacji DNA/RNA służącym ocenie zdolności komórek do syntezy ICAM-4. Także uzyskane polinukleotydy antysensowe posiadają znaczenie w regulacji ekspresji ICAM-4 przez komórki, w których normalnie zachodzi taka ekspresja. Jak to można wykazać w innej serii przykładów, znajomość sekwencji DNA oraz sekwencji aminokwasowej ICAM-4 umożliwia wytwarzanie metodami rekombinacji DNA wariantów ICAM-4 takich jak białka hybrydowe (czasami określane jako „immunoadhezyny”) charakteryzujące się obecnością sekwencji białkowych ICAM-4 oraz ciężkich łańcuchów regionu stałego lub/i regionu zawiasowego immunoglobulin, patrz: Capon i wsp., Nature 337: 525-531 (1989); Ashkenazi i wsp., P.N.A.S. (USA) 88: 10535-10539 (1991); oraz
188 612
PCT WO 89/02922 opublikowany 6 kwietnia 1989 r. Warianty ICAM-4 typu białek fuzyjnych mogą także zawierać, np. wybrane domeny pozakomórkowe ICAM-4 oraz części innych komórkowych cząstek adhezyjnych.
DNA według wynalazku pozwala także na identyfikację sekwencji nie ulegających translacji, które swoiście ułatwiają ekspresję polinukleotydów związanych funkcjonalnie z regionami promotora. Identyfikacja oraz zastosowanie .tych sekwencji promotora wych są, zwłaszcza pożądane w przypadkach, takich jak np. przenoszenie genu, które w szczególny sposób wymagają ekspresji heterologicznych genów w ograniczonym środowisku neuronalnym. Obecny wynalazek obejmuje także wektory zawierające promotory, oraz chimeryczne konstrukty genów, w których promotor jest połączony funkcjonalnie z heterologiczną sekwencją polinukleotydową oraz z sekwencją sygnałową końca transkrypcji.
Informacja dotycząca DNA, której dostarcza niniejszy wynalazek umożliwia także systematyczną analizę struktury i funkcji ICAM-4, a także określenie tych cząstek, które współdziałają z ICAM-4 na poziomie wewnątrz i pozakomórkowym. Idiotypy przeciwciał monoklonalnych przeciwko ICAM-4 są reprezentatywne dla takich cząsteczek i mogą naśladować naturalne białka wiążące (peptydy i polipeptydy), które modulują międzykomórkową oraz wewnątrzkomórkową aktywność ICAM-4 lub poprzez które ICAM-4 moduluje zdarzenia zachodzące pomiędzy komórkami lub w obrębie komórki. Alternatywnie, mogą one reprezentować nową klasę modulatorów aktywności ICAM-4. Z kolei, przeciwciała antyidiotypowe mogą reprezentować nową klasę biologicznie aktywnych ekwiwalentów ICAM-4. Testy wykonywane in vitro do identyfikacji przeciwciał lub innych związków modulujących aktywność ICAM-4 mogą obejmować, np. immobilizowanie ICAM-4 lub naturalnego ligandu, z którym wiąże się ICAM-4, umożliwiające wykrywanie znakowania nieimmobilizowanego partnera wiązania, inkubowanie razem partnerów wiązania i określanie wpływu badanego związku na ilość znakowanego wiązania, przy czym zmniejszenie znakowanego wiązania w obecności badanego związku w porównaniu z ilością znakowanego wiązania w nieobecności badanego związku, wskazuje, że badany czynnik jest inhibitorem wiązania ICAM-4.
Rozwiązania według wynalazku umożliwiają przeprowadzenie badania przesiewowego pod kątem zmian neuropatologicznych polegającym na skontaktowaniu próbki od pacjenta z przeciwciałem dającym specyficzną reakcję immunologiczną z ICAM-4, oznaczeniu wiązania ICAM-4/przeciwciało, a następnie porównaniu wyniku oznaczenia z wynikiem osoby, o której wiadomo, że nie ma zmian neuropatologicznych.
Informacja o sekwencji DNA dostarczona przez niniejszy wynalazek umożliwia też uzyskanie poprzez rekombinację homologiczną lub procedury „knockout” [patrz: np. Kapecchi, Science, 244: 1288-1292 (1989)] gryzom, u których nie zachodzi ekspresja funkcjonalnego białka ICAM-4 lub u których ma miejsce ekspresja wariantów ICAM-4. Takie gryzonie są użyteczne jako modele do badania in vivo aktywności ICAM-4 i modulatorów ICAM-4.
Szczegółowy opis wynalazku
Ujawnienia w macierzystym zgłoszeniu patentowym USA nr 08/102 852, zgłoszonym 5 sierpnia 1993 są szczegółowo włączone jako odnośnik. Przykłady z tego zgłoszenia dotyczą między innymi: projektowania i konstruowania sond oligonukleotydowych do powielania metodą PCR DNA związanych z ICAM, zastosowania sond do powielania ludzkiego genomowego fragmentu homologicznego, ale różniącego się od DNA kodującego ICAM-1 i ICAM-2, przeszukiwania bibliotek cDNA genomowym fragmentem celem wyizolowania dodatkowych sekwencji kodujących ICAM, przeszukiwania bibliotek cDNA celem wyizolowania pełnej sekwencji ludzkiego cDNA kodującego ICAM-R, charakteryzowania informacji o DNA i sekwencji aminokwasowej pod kątem ICAM-R, a w szczególności ICAM-1 i ICAM-2, wytwarzania ssaczych komórek gospodarza wyrażających ICAM-R, mierzenia udziału ICAM-R w procesie adhezji, obejmującym szlaki zależne od CD 18 i niezależne od CD 18, hamowania adhezji do ICAM-R przez polipeptydy wywodzące się od ICAM-R, ekspresji odmian ICAM-R, wytwarzania i charakteryzowania przeciwciał przeciw ICAM-R i ich fragmentów, mapowania epitopów rozpoznawanych przez przeciwciała monoklonalne przeciw ICAM-R, pomiaru dystrybucji i biochemicznego charakteryzowania ICAM-R i kodującego go RNA, mierzenia ICAM-R przy adhezji komórek danego typu i aktywacji/namnażaniu komórek opornościowych, charakteryzowania przeciwciał monoklonalnych dla ICAM-R oraz pomiaru różnicowej
188 612 fosforylacji i powiązania cytoplazmatycznej domeny ICAM-R z cytoszkieletem. Ujawniono również identyfikację DNA kodującego ICAM ze szczura, który wówczas okazał się być szczurzym homologiem ludzkiego ICAM-R oraz zastosowanie tego DNA do konstruowania i wyrażania DNA kodujących fuzje białkowe z transferazą S-glutationu. Szczegółowy opis, w jaki sposób taki DNA szczura był zidentyfikowany można znaleźć w macierzystym zgłoszeniu (USA Nr 08/102 852) w przykładzie 6 i jest tu zaprezentowany jako przykład 1. Po zidentyfikowaniu dalszej sekwencji kodującej ICAM, okazało się, że DNA dla ICAM ze szczura nie koduje szczurzego homologu ludzkiego ICAM-R, ale faktycznie koduje nowy polipeptyd ICAM, nazwany tu ICAM-4. W celu pokazania zdarzeń prowadzących do identyfikacji ICAM-4, przedstawiono chronologię, po której następuje szczegółowy opis wynalazku.
Pierwsza zidentyfikowana genomowa sekwencja ICAM-4 ze szczura kodowała region homologiczny do domeny 2 (tutaj SEK NR ID: 3, aSEK NR ID: 23 w Patencie USA Nr 08/102 852) ludzkiego ICAm-R (tutaj SEK NR ID:4). Zidentyfikowano również drugi, zachodzący genomowy DNA (tutaj SEK NR ID: 5, a SEK NR ID: 26 w Patencie USA Nr 08/102 852), który kodował zarówno region domeny 2 z SEK NR ID:3, jak i sekwencje dla ICAM-1. Stosując SEK NR ID: 3 jako sondę zidentyfikowano cDNA ze śledziony szczura (tutaj SEK NR ID: 6, a SEK NR ID: 25 w Patencie USA Nr 08/102 852), który kodował domeny od 2 do 5, jak również domenę piątą, wcześniej nie obserwowaną jako domena ICAM. W tym czasie te nowo zidentyfikowane DNA szczura okazały się kodować homolog ludzkiego ICAM-4 szczura, jakkolwiek dopasowanie regionów 3' tych DNA do innych ICAM okazało się trudne.
Następująca później izolacja klonu cDNA o długości 1 kb z biblioteki ze śledziony szczura i powielenie fragmentu poprzez RT-PCR wykazały, że część zarówno klonów cDNA, jak i genomowych nie została zsekwencjonowana. Inny produkt powielania RT-PCR (SEK NR ID: 7) potwierdził ten brak. Stwierdzono, że fragment o długości 177 bp został wycięty z klonów genomowych i cDNA poprzez trawienie klonów EcoRI celem izolowania tych sekwencji z faga X, do badań nad sekwencją. Ponowna analiza SEK NR ID: 5 i 6 pod kątem tych sekwencji umożliwiła identyfikację bardziej dokładnej i pełnej sekwencji oryginalnie wyizolowanych klonów genomowych i cDNA, przedstawionych tu w postaci poprawionej jako SEK NR ID: 8 i 9.
W celu zidentyfikowania pełnej sekwencji kodującej dla ICAM-R, wyizolowano cDNA ze szczurzego mózgu (SEK NR ID: 10) i oznaczono sekwencję końca 5' poprzez powielenie końca 5'cDNA metodą rapid (5' RACE), produkt amplifikacji przedstawiono w SEK NR ID: 11. Zestawienie danych dla klonu RT-PCR (SEK NR ED: 7), cDNA z mózgu (SEK NR ID: 10) i produktu amplifikacji RACE (SEK NR ID: 11) umożliwiło identyfikację pełnej sekwencji kodującej dla ICAM-4 (SEK NR ID: 1). Niniejszy wynalazek jest zatem zilustrowany przez następujące przykłady. Bardziej szczegółowo, przykład 1 dotyczy klonowania części DNA dla ICAM-4. Przykład 2 opisuje analizę metodą Northern transkrypcji szczurzego ICAM-4. Przykład 3 opisuje izolację szczurzego cDNA pełnej długości dla ICAM-4. Przykład 4 dotyczy hybrydyzacji in situ szczurzego ICAM-4 w tkance mózgowej. Przykład 5 dotyczy wytwarzania fuzji białkowych ICAM-4 w organizmach prokariotycznych. Przykład 6 opisuje wytwarzanie monoklonalnych przeciwciał specyficznych wobec fuzji białkowych: szczurzy ICAM4/GST. Przykład 7 opisuje ekspresję rozpuszczalnych szczurzych białek ICAM-4 w bakulowirusowym systemie ekspresyjnym. Przykład 8 dotyczy wytwarzania monoklonalnych przeciwciał specyficznych dla szczurzego ICAM-4 wyrażanego w systemie bakulowirusowym. Przykład 9 opisuje analizę immunocytochemiczną ekspresji ICAM-4. Przykład 10 dotyczy klonowania ludzkiego genomowego DNA kodującego ICAM-4. Przykład 11 dotyczy klonowania ludzkiego cDNA kodującego ICAM-4. Przykład 12 opisuje analizę ekspresji ludzkiego ICAM-4 metodą Northern. Przykład 13 opisuje wytwarzanie fuzji białkowych: ludzki ICAM4/GST. Przykład 14 dotyczy wytwarzania przeciwciał monoklonalnych specyficznych wobec ludzkiego ICAM-4. Przykład 15 opisuje opracowanie testu wyłapującego dla określania stężenia rozpuszczalnego ICAM-4 w poszczególnych płynach. Przykład 16 stosuje test wyłapujący do pomiaru stężenia ICAM-4 w surowicy pacjentów po ataku. Przykład 17 dotyczy pomiaru transkrypcji ICAM-4 w modelu epilepsji szczurzej. Przykład 18 dotyczy klonowania regionu promotorowego ludzkiego ICAM-4.
188 612
Przykład 1
Klonowanie szczurzego DNA dla białka ICAM-pokrewnego
A. Izolacja szczurzego genomowego DNA dla domeny 2 białka ICAM-pokrewnego
Szczurza biblioteka genomowa, skonstruowana w wektorze λ EMBL3, była przeszukiwana sondą wyznakowaną [32P], otrzymaną metodą PGR na matrycy DNA kodującego ludzką domenę 2 ICAM-3. Sekwencja nukleotydową tej sondy jest przedstawiona w SEK. NR ID: 12. Łysinki z biblioteki przenoszono na filtry nylonowe Hybond N+ (Amersham, Arlington Heights, IL). Przeszukiwanie wszystkich bibliotek cDNA i genomowych prowadzono według standardowych przepisów. Prehybrydyzację i hybrydyzację przeprowadzano w roztworze: 40-50% formamid, 5 X Denhardt, 5 X SSPE i 1,0%) SDS w temp. 42°C. Sondy, wyznakowane [32P], dodawano do stężenia 105-106 cpm/ml roztworu hybrydyzacyjnego. Po 16-18 godzinach hybrydyzacji, filtry nylonowe obficie płukano w temperaturze pokojowej w 2 X SSPE z 0,1% SDS, a następnie eksponowano błony Rtg w -80°C przez noc. Pozytywne łysinki poddawano jednej lub kilku rundom hybrydyzacji w celu otrzymania klonu fagowego. DNA otrzymany z lizatu klonu pozytywnego subklonowano w wektorze pBS+ i sekwencjonowano.
Pierwszy klon genomowy kodujący ICAM-pokrewną szczurzą domenę 2, zidentyfikowany na podstawie znalezionej homologii do obszarów domeny 2 innych członków rodziny ICAM (patrz dla przykładu tabela 1 ze Zgłoszenia Patentowego USA Nr 08/102,852), różnił się od wcześniej opisanej sekwencji szczurzego ICAM-1 [Kita i wsp., Biochem. Biophys. Acta 1131:108-110 (1992)], czy mysiego ICAM-2 [Xu i wsp., J.hnmunol. 149:2560-2565 (1992)]. Sekwencja nukleotydową i przewidziana sekwencja aminokwasowa tego klonu zostały ujawnione w równoległych zgłoszeniach macierzystych w stosunku do niniejszego zgłoszenia jako znaczące odmiany szczurzego ICAM-R i były przedstawione odpowiednio jako SEK NR ID:23 i 24 w Zgłoszeniu Patentowym USA Nr 08/102 852. Tutaj te same sekwencje są przedstawione odpowiednio jako SEK NR ID: 3 i 13.
Przy użyciu tej samej sondy zidentyfikowano drugi, zachodzący klon i ustalono, że posiada on sekwencję domeny 2 ICAM z SEK NR ID: 3 oraz koniec 5' DNA kodujący przynajmniej fragment szczurzego ICAM-1. Sekwencja nukleotydową tego klonu została przedstawiona w równoległym zgłoszeniu macierzystym w stosunku do niniejszego zgłoszenia jako SEK. NR ID: 26 i jest przedstawiona tutaj jako SEK NR ID: 5. Drugi klon wskazuje na to, że fragment ICAM-pokrewnego genu z klonu pierwszego i gen kodujący szczurzy ICAM-1 są zlokalizowane na tym samym chromosomie szczura w odległości 5 kb.
B. Izolacja cDNA dla białka ICAM-pokrewnego ze szczura
W celu zidentyfikowania kompletnej sekwencji kodującej białko ICAM-pokrewne, wyznakowany [32P] DNA kodujący domenę 2 ze szczurzego klonu genomowego, zidentyfikowanego w Sekcji a (SEK NR ID: 3), powyżej, został użyty do przeszukania szeregu bibliotek cDNA z różnych typów komórek szczurzych i mysich, w tym szczurzych makrofagów (Clontech, Pało Alto, CA), limfocytów krwi obwodowej (PBL) (Clontech), limfocytów T (skonstruowanych przez zespół) i komórek śledziony (Clontech) oraz mysich PBL (Clontech), limfocytów T (skonstruowanych przez zespół) i limfocytów B (skonstruowanych przez zespół).
W bibliotece cDNA ze śledziony zidentyfikowano pojedynczy klon (Clontech), który zawierał pięć domen Ig-podobnych, z których cztery były homologiczne do domen od 2 do 5 zarówno w ICAM-1, jak i ICAM-R. Co więcej, klon ten zawierał koniec 3' DNA kodujący piątą domenę Ig-podobną, która nie była poprzednio zidentyfikowana w żadnym innym peptydzie ICAM. Dodatkowo, zawarta w tym klonie nietypowa sekwencja na końcu 3', później zdeterminowana jako częściowy intron (dyskutowane poniżej), leżący pomiędzy domeną 4 i 5 sugeruje, że klon ten jest produktem niedojrzałego lub nieprawidłowo złożonego transkryptu. Obecność unikatowej domeny i wykazanie, że obszaru 3' nie daje się dobrze dopasować do innych znanych sekwencji ICAM sugeruje, że DNA dla białka ICAM-pokrewnego może kodować nowy szczurzy polipeptyd ICAM. Sekwencja nukleotydową tego klonu została przedstawiona jako SEK NR ED:25 w zgłoszeniu macierzystym w stosunku do niniejszego zgłoszenia; tutaj sekwencja nukleotydowa klonu cDNA ze śledziony jest przedstawiona jako SEK NR ID:6.
C. Powtórna analiza cDNA i DNA genomowego ze szczura
Po złożeniu 5 sierpnia 1993 Zgłoszenia Patentowego USA Nr 08/102 852 ustalono, że częściowy klon cDNA ze śledziony szczura (SEK NR ID:25 w zgłoszeniu macierzystym
188 612 i SEK NR ID: 6 tutaj) oraz genomowy klon z wątroby szczura (SEK NR ID: 26 w zgłoszeniu macierzystym i SEK Nr ID: 5 tutaj) nie posiadały wewnętrznego fragmentu EcoRI o długości 177 bp, który był częścią każdego z tych klonów, lecz został zgubiony podczas etapu subklonowania, kiedy wstawki z biblioteki wycinano z wektora X poprzez trawienie EcoRI i włączano poprzez ligację do wektora używanego do sekwencjonowania. Obserwacja, że w klonach cDNA i genomowym został zgubiony fragment sekwencji kodującej wynikała z dopasowania szczurzej sekwencji genomowej i cDNA do różnych produktów amplifikacji RT-PCR, włączając w to SEK NR ID: 7, które uwidoczniło lukę w sekwencji DNA ze szczura.
Kolejna izolacja i dopasowanie sekwencji cDNA z biblioteki śledziony, przy użyciu klonu cDNA śledziony (SEK NR ID: 6) jako sondy, potwierdziły pierwotne przypuszczenia, że nie został zsekwencjonowany fragment klonu cDNA i genomowego ze śledziony. Dalsze, oczywiste potwierdzenie otrzymano po amplifikacji fragmentu łączącego domeny od 3 do 5 metodą RT-PCR, przy użyciu startera 5' (RRD3 5'Xho, zawierającego na końcu 5' miejsce restrykcyjne XhoI dla ułatwienia klonowania), pokazanego jako SEK NR ID: 14, oraz startera 3' (RRD5 3'Hind, zawierającego miejsce restrykcyjne HindÓI dla ułatwienia klonowania), pokazanego jako SEK NR ID: 15.
GAACTCGAGGCCATGCCTCCACTTTCC (SEK NR D : 14)
CCATAAGCTTTAITCCACCGTGACAGCCAC SSEK NR ID: 15)
Dopasowanie obu omawianych sekwencji DNA w sposób jednoznaczny pokazało. że klony cDNA i genomowy utraciły fragment DNA jeszcze przed sekwencjonowaniem; znalazło to potwierdzenie po odczytaniu sekwencji DNA RT-PCR, omówionym poniżej. Stwierdzono, że trawienie restrykcyjne EcoRI wycinające fragmenty cDNA i genomowe z DNA faga X, przed sekwencj onowaniem, spowodowało wycięcie fragmentu o długości 177 bp, który nie uwidaczniał się podczas rozdzielania w żelu agarozowym. Kolejna analiza sekwencji potwierdziła obecność dwóch miejsc EcoRI ograniczających fragment 177bp w obu wyjściowych klonach.
Fragment EcoRI o długości 177 bp jest położony pomiędzy nukleotydami 719 i 896 w częściowym klonie cDNA ze szczura, jak pokazano w SEK NR ID: 9, a pomiędzy nukleotydami 2812 i 2989 w częściowym klonie genomowym, jak pokazano w SEK NR ID: 8.
D. DNA izolowany przy zastosowaniu klonu z RT-PCR
RT-PCR został wykorzystany do otrzymania kompletnej informacji o sekwencji genu dla białka ICAM-pokrewnego ze szczura. Znajomość sekwencji klonu genomowego (SEK NR ID: 3) wykorzystano do zaprojektowania starterów komplementarnych do obszaru 5' odcinka kodującego białko, ustalonego na podstawie klonu cDNA oraz antysensownego startera zaprojektowanego jako komplementarny do sekwencji kodujących i regionów 3' w stosunku do sekwencji kodującej w klonie cDNA (SEK NR ID: 6).
Matrycowy cDNA do reakcji PGR przygotowywano w sposób następujący. Około 2 pg RNA poły A+ izolowanego z komórek śledziony szczura denaturowano przez grzanie w 65°C w objętości 10 pl. Po denaturacji dodawano 0,1 pl RNazyny (Invitrogen, San Diego, CA), 5 pl 5X buforu do RTazy (BRL, Bethesda, MD), 2 pl losowych heksamerów (pd(N)6 w 100 pg/ml) (Pharmacia, Piscataway, NJ), 6 pl dNTP (2 pM każdy) i 2 pl RTazy AmV (BRL); reakcję prowadzono w temperaturze 42°C przez 60-90 min. Mieszaniny reakcyjne przechowywano w -20°C do momentu użycia.
Przeprowadzano wstępne serie doświadczeń w celu zidentyfikowania par starterów oligonukleotydowych dających produkt amplifikacji w reakcjach PGR przy użyciu cDNA ze śledziony szczura. Różne sensowne startery 5' były dobierane w pary ze starterami 3' zaprojektowanymi jako komplementarne do wewnętrznej sekwencji kodującej; starter 3' oznaczono jako RRD2 3-1 i przedstawiono w SEK NR ID: 16.
AACGTGCGGAGCTGTCTG (SEK NR ID: 16) (W ostatecznie wyizolowanym produkcie RT-PCR, SEK NR ID: 7, poniżej, starter RRD2 3-1 odpowiada nukleotydom 719 do 736.) Podobnie, różne antysensowne startery 3'
188 612 dobierano w pary ze starterami 5' zaprojektowanymi jako komplementarne do innej sekwencji kodującej; starter 5' w tych reakcjach oznaczono jako RGen3900S i pokazano w SEK NR ID: 17.
ACGGAATTCGAAGCCATCAACGCCAGG (SEK NR ID: 17) (W SEK NR ID: 7, poniżej, starter RGen3900S odpowiada nukleotydom 1719 do 1736.) w oparciu o wielkości powielonych produktów i zdolności tych produktów do hybrydyzacji z częściowym klonem cDNA, ustalono jedną parę starterów jako najbardziej wydajną i używano jej w kolejnych reakcjach powielania PCR. Starter 5' oznaczono jako RGen780S (SEK NR ID: 18), a starter 3' oznaczono jako RGen4550AS (SEK NR ID: 19).
CATGAATTCCGAATCTTGAGTGGGATG (SEK NR ID: 18)
ATAG AATTCCTCGGGACACCTGTAGCC (SEK NR ID: 19) (W SEK NR ID: 7, poniżej, starter RGen780S odpowiada nukleotydom od 1 do 18, a starter RGen4550AS odpowiada nukleotydom od 2197 do 2214.)
Taka para starterów została użyta w reakcjach PCR prowadzonych w różnych warunkach celem optymalizacji reakcji amplifikacji. W sumie użyto 15 buforów różniących się wartościami pH i stężeniem Mg++ i zastosowano dwie różne temperatury przyłączania starterów; próbki produktu otrzymanego w każdej z reakcji rozdzielano w 1% żelu agarozowym. Ponieważ produkty amplifikacji PGR z różnych warunków reakcji mogły nie być widoczne w żelu barwionym bromkiem etydyny, do wykrywania produktów PCR wykorzystano bardziej czulą metodę Southerna.
Część powielonego DNA rozdzielano elektroforetycznie w żelu, przenoszono na filtr nylonowy Hybond N+ stosując standardową technikę z zastosowaniem kompresu ssącego i hybrydyzowano z pełnym cDNA ze szczura wyznakowanym [32P]. Zastosowano warunki hybrydyzacji zasadniczo takie, jak opisano dla procedury przeszukiwania biblioteki w Sekcji A, powyżej. Autoradiogramy wykazały, że niewielka ilość DNA o wielkości około 2,2 kb była wytwarzana w dwóch reakcjach, więc pozostałe produkty obu reakcji rozdzielono w żelu agarozowym. Pomimo, że nie widziano w sposób oczywisty prążka DNA, fragment 2,2 kb eluowano z żelu i używano jako matrycy w kolejnej reakcji PCR przy zastosowaniu tych samych starterów (SEK NR ID: 18 i 19), buforu Tris-HCl pH 8,0, zawierającego 1 pM Mg++; przyłączanie starterów prowadzono w temperaturze 55°C. Produkt amplifikacji z drugiej rundy PCR, widoczny w żelu, eluowano i klonowano w wektorze pBS+ (Stratagene, La Jola, CA) w celu przeprowadzenia analizy sekwencji.
Ustalono, że otrzymany klon RT-PCR zawiera 2214 bp, jak pokazano w SEK NR ID: 7. Klon ten koduje domeny od 2 do 6 znalezione w klonie cDNA ze śledziony szczura oraz dodatkową N-końcową domenę I, dodatkową C-końcową domenę 7 i fragment o wielkości 164 bp, który wydaje się być dalszą C-końcową domeną 8. Tuż przed domeną 1 na końcu 5' występuje dodatkowa sekwencja 144 bp pochodząca przypuszczalnie z intronu leżącego pomiędzy sekwencją liderową i pierwszą domeną. Klon ten nie zawiera sekwencji lidera na końcu 5' oraz regionu transbłonowego i cytoplazmatycznego na końcu 3'. Dodatkowo oprócz poprzednio zidentyfikowanej domeny 6 w klonie cDNA ze śledziony, zidentyfikowano domenę siódmą i ósmą w klonie RT-PCR, co stanowi podstawę hipotezy, że klon ten jest nowym szczurzym ICAm.
Przykład 2
Analiza metodą Northern
W celu dalszego zbadania możliwości, że klony ICAM-pokrewne zidentyfikowane w przykładzie 1 kodują nowy polipeptyd ICAM, co sugerują unikatowe domeny Ig-podobne, analizowano specyficzną tkankowe ekspresję tego genu metodą Northern, pozwalającą na porównanie otrzymanych wyników z wcześniej opublikowanymi danymi dla ludzkich ICAM [ICAM-1, Dustin i wsp., J.Immunol. 137:245-254 (1986); ICAM-R, de Fourgerolles i Springer, J.Exp.Med. 175:185-190 (1992)].
Całkowity komórkowy RNA z płuc, mózgu, rdzenia kręgowego, wątroby, przewodu pokarmowego, grasicy, węzłów chłonnych i śledziony szczura otrzymywano przy użyciu
188 612 odczynników do izolacji RNA STAT60 (Tel-test „B”, Inc. Friendswood, Texas), zgodnie z przepisem producenta. RNA poli A* izolowano z całkowitego RNA przy użyciu kolumienek z oligo dT celulozą. Około 5 fag RNA otrzymanego z każdego rodzaju tkanki rozdzielano w 1% żelu agarozowym, zawierającym formaldehyd i przenoszono na filtr nitrocelulozowy Hybond-C (Amersham).
Fragment cDNA ze śledziony szczura z przykładu 1, odpowiadający domenie od 2 do 4 (nukleotydy od 1 do 724 w SEK Nr ID:6) subklonowano w wektorze pBluscript SK+ (Stratagene), a następnie otrzymywano antysensowną sondę RNA przy zastosowaniu transkrypcji in vitro, z użyciem UTP wyznakowanego 32P i około 500 ng liniowej matrycy, stosownie do przepisu producenta (Boehringer Mannheim, Indianapolis, IN). Filtry z przyłączonym RNA prehybrydyzowano w roztworze zawierającym 50% formamid, 5 X SSC, 1 X PE (50 mM Tris-HCl pH 7,5, 0,1% pirofosforan sodu, 0,2% poliwinylopirolidon, 0,2% fikol, 5 mM EDTA, 1% SDS) oraz zdenaturowany DNA ze spermy łososia w stężeniu 150 pg/ml. Wyznakowaną radioaktywnie sondę denaturowano przez gotowanie i dodawano do roztworu prehybrydyzacyjnego do końcowego stężenia 1 x 106 cpm/ml. Hybrydyzację prowadzono przez 1618 godzin w 65°C. Następnie filtry płukano w 65°C w 2 X sSc zawierającym 0,1% SDS i eksponowano stosując błony Rtg przez 3-16 godzin.
Analiza metodą Northern wykazała, że ICAM-pokrewny cDNA zidentyfikowany w przykładzie 1 ulega ekspresji jedynie w mózgu szczura. Ta specyficzność tkankowa nie była poprzednio opisywana dla żadnego z innych polipeptydów ICAM. Wzór ekspresji, w kombinacji z unikatowymi domenami Ig-podobnymi, nie znalezionymi w innych polipeptydach ICAM wskazuje, że klon ICAM-pokrewny jest nowym członkiem rodziny białek ICAM i został nazwany ICAM-4.
Fakt, że zidentyfikowane początkowo klony cDNA wykryto w bibliotece ze śledziony szczura sugeruje, że w części komórek śledziony gen ICAM-4 ulega ekspresji na niskim poziomie.
Jednakże, nie udało się wykryć klonu w prawidłowy sposób złożonego w wielu bibliotekach cDNA z komórek krwiotwórczych, co pozwala wątpić czy białko ICAM-4 jest rzeczywiście wyrażane w tkankach innych od mózgu. Jednym z wytłumaczeń wykrywania ICAM-4 cDNA w śledzionie jest możliwość powielenia śladowej ilości transkryptu w bardzo czułej reakcji PCR, nawet jeśli tkanki te nie wytwarzają kodowanego białka.
Przykład 3
Izolacja pełnej długości szczurzego cDNA dla ICAM-4
A. Identyfikacja klonu cDNA z mózgu szczura
Z uwagi na specyficzną tkankową ekspresję ICAM-4, mRNA pochodzący z tkanki mózgowej wykorzystano przy próbach izolacji pełnej długości cDNA kodującego ICAM-4. Dwie sondy, jedną, komplementarną do domeny od 1 do 2 oraz drugą, komplementarną do domeny od 3 do 5 klonu cDNA ze śledziony, zidentyfikowanego w przykładzie 1 (SEK NR ID: 7), wyznakowano i użyto do przeszukiwania biblioteki cDNA z mózgu szczura, skonstruowanej w wektorze Agtt0, otrzymanej uprzednio w naszym zespole. Warunki hybrydyzacji opisano w przykładzie 1, a pozytywne łysinki poddawano jednej lub kilku rundom hybrydyzacji w ceiu otrzymania klonu fagowego.
Zidentyfikowano dziewięć pozytywnych klonów, z których dwa hybrydyzowały z obiema sondami. Najdłuższy z otrzymanych klonów, oznaczony jako klon 7, zawierający 2550 bp, koduje cztery domeny Ig-podobne, które występują w sondzie cDNA. Dodatkowo klon 7 koduje cztery inne domeny Ig-podobne, które nie występują w sondzie. Zidentyfikowano przypuszczalną domenę trąnsbłonową i cytoplazmatyczną, po których występuje kodon stop, sygnał poliadenylacji i ogon poli A. Klon 7 utracił, co najmniej jedną domenę Ig-podobną na końcu 5', co ustalono porównując z klonem RT-PCR (SEK NR ID: 7), jak również utracił sekwencję liderową; ponowne przeszukanie biblioteki nie ujawniło dłuższego klonu, który posiadałby wspomniane sekwencje. Sekwencja nukleotydowa klonu 7 jest pokazana w SEK NR ID: 10.
B. Ustalenie końca 5'
W celu wyizolowania domeny 1 i innych sekwencji z końca 5', wykorzystano technikę PGR zwaną 5' RACE (ang. Rapid Amplification of cDNA Ends) [PCR Protocols:
188 612 a Guide to Methods and Applications, Innis i wsp., wyd. Academic Press: New York (1990) str. 28-38] z wykorzystaniem zestawu do 5'RACE (Clontech). Technika ta wykorzystuje wewnętrzny starter, który jest używany w parze z drugim starterem komplementarnym do sekwencji adaptorowej, dołączonej do końca 5' cząsteczek cDNA z biblioteki. Reakcja PCR z tym starterem umożliwi amplifikację i identyfikację brakującej sekwencji. Informacja na temat zachodzących na siebie sekwencji pozwoli na utworzenie pełnej sekwencji tego genu.
cDNA z mózgu szczura przygotowany techniką RACE (dostarczony z zestawem) został użyty w reakcji PCR z wykorzystaniem oligonukleotydu z zestawu i antysensownego startera opartego na wewnętrznej sekwencji ICAM-4. Antysensowny starter 3', oznaczony jako Spot714AS. został nazwany stosownie do sekwencji domeny 4 z ICAM-4 i pokazany w SeK NR ID: 20.
CARGGTGACAAGGGCTCG (SEK INR ID: 20)
Produkt otrzymany w wyniku amplifikacji, z wykorzystaniem pary tych starterów był następnie użyty w drugiej reakcji PCR, w której wykorzystano ten sam starter 5' z zestawu oraz starter 3' komplementarny do rejonu domeny 1 w ICAM-4. Drugi starter 3' oznaczono jako RRACE2 i pokazano w SEK NR ID: 21.
TATGAATTCACTTGAGCCACAGCGAGC (SEK NR ID: 21)
Każdy ze starterów użyty w drugiej reakcji PCR zawierał miejsce restrykcyjne EcoRI ułatwiające klonowanie w wektorze pBS+ (Stratagene) produktów otrzymanych w wyniku amplifikacji. Otrzymany plazmidowy DNA, który zawierał koniec 5' genu został zidentyfikowany poprzez hybrydyzację do sondy zawierającej domeny 1 i 2 szczurzego ICAM-4, odpowiadającej nukleotydom od 1 do 736 w SEK NR ID: 7. Na podstawie otrzymanego produktu amplifikacji ustalono częściową informację o sekwencji domeny 1 i hydrofobowego lidera.
Produkt otrzymany metodą 5’RACE jest fragmentem o długości 222 bp zawierającym 60 bp przed pierwszym kodonem dla metioniny, sekwencję liderową o długości 82 bp i sekwencję domeny 1 o długości 80 bp. Produkt powielania pokazano w SEK NR ID: 11.
C. Sekwencja szczurzego ICAM-4 pełnej długości
Na podstawie informacji o sekwencji, pochodzącej z metody 5' RACE (SEK NR ID: 11), klonu RT-PCR (SEK NR ID: 7) i klonu 7 niosącego cDNA z mózgu (SEK NR ID: 10), skonstruowano złożony klon o pełnej długości. Ustalono, że szczurzy gen ICAM-4 pełnej długości zawiera 2985 bp z pojedynczą ramką odczytu kodującą białko złożone z 917 aminokwasów. Przypuszczalna sekwencja Kozak położona jest powyżej kodonu dla metioniny i sekwencji liderowej. Za 27-aminokwasowym, hydrofobowym liderem występuje dziewięć domen Ig-podobnych, region transbłonowy i zawierający 58 aminokwasów cytoplazmatyczny ogon. Złożony cDNA dla ICAM-4 pokazano w SEK NR ID: 1, a ustalona sekwencja aminokwasowa przedstawiona jest jako SEK NR ID: 2.
Podobnie jak inne polipeptydy ICAM, ICAM-4 zawiera domenę zewnątrzkomórkową, transbłonową i cytoplazmatyczną. W zewnątrzkomórkowej domenie ICAM-4 koniec N stanowi sekwencja liderowa, obejmująca aminokwasy od 1 do 27, po których następuje dziewięć immunoglobulinowych domen(Ig)-podobnych charakterystycznych dla ICAM-4, które w ICAM-1, ICAM-2 i ICAM-R zawierają odpowiednio pięć, dwie i pięć zewnątrzkomórkowych domen Ig-podobnych. W ICAM-4 domena 1 obejmuje aminokwasy od 28 do 118; domena 2 obejmuje aminokwasy od 119 do 224; domena 3 obejmuje aminokwasy od 225 do 321; domena 4 obejmuje aminokwasy od 322 do 405; domena 5 obejmuje aminokwasy od 406 do 488; domena 6 obejmuje aminokwasy od 489 do 569; domena 6 obejmuje aminokwasy do 570 do 662; domena 8 obejmuje aminokwasy od 663 do 742 i domena 9 obejmuje aminokwasy od 743 do 830. W każdej z domen tworzona jest charakterystyczna struktura „pętli” dzięki mostkom dwusiarczkowym powstającym pomiędzy resztami cysternowymi, rozmieszczonymi zazwyczaj na dwóch przeciwległych końcach sekwencji aminokwasowej. Na inne cechy strukturalne ICAM-4 składają się transbłonowy region obejmujący aminokwasy od 831 do 859 i cytoplazmatyczny rejon obejmujący aminokwasy od 860 do 917.
188 612
Porównanie homologii sekwencji aminokwasowej każdej z domen szczurzego ICAM-4 z innymi członkami rodziny ICAM ograniczono do odpowiednich sekwencji ludzkich ICAM-1, ICAM-2 i ICAM-R, ponieważ informacje o sekwencji dla trzech szczurzych homologów nie były wcześniej publikowane. W pierwszej domenie szczurzy ICAM-4 wykazuje odpowiednio 21, 30 i 28 procent identyczności z ludzkimi ICAM-1, ICAM-2 i ICAM-R. Druga domena jest silniej konserwowana i posiada 60, 42 i 62 procent identyczności odpowiednio z ICAM-1, -2 i -3. Domeny 3-5 wykazują odpowiednio procent identyczności 48, 49 i 40 z ICAM-1 i 60, 59 i 29 odpowiednio z ICAM-R. Interesujące, że szczurze domeny od 4 do 6 ICAM-4 wykazują najsilniejszą homologię z domeną 5 (wahające się w zakresie 29-42% identyczności) i jest możliwe, że powstały one w wyniku duplikacji segmentu genu. Dziewiąta i końcowa zewnątrzkomorkowa domena wykazuje niskie poobieństwo do innych domen ICAM, lecz posiada 22% identyczności z 3 i 6 domeną ludzkiego VCAM-1, innego członka rodziny białek Ig, które biorą udział w adhezji komórek. Cytoplazmatyczny ogon składa się z 58 aminokwasów. Jest on dłuższy od występujących u innych członków rodziny ICAM w której ludzkie ICAM-1, -2 i -3 posiada odpowiednio 28, 26 i 37 aminokwasowe ogony. Podobnie jak domena dziewiąta, cytoplazmatyczny ogon szczurzego ICAM-4 wykazuje największą homologię z cytoplazmatycznym ogonem ludzkiego VCAM-1, który składa się tylko z 19 aminokwasów. 19 proksymalnych błonowych aminokwasów szczurzego ICAM-4 ma 7 wspólnych reszt aminokwasowych z VCAM-1 (37%).
W końcu, miejsce wiązania do LFA-1 (CDlla/CD18) mapuje się w pierwszej domenie polipeptydów ICAM. Vonderheide i wsp. [/. Cell. Biol., 125:215-222 (1994)] zidentyfikował motyw sekwencji wymagany w wiązaniu integryny. Pomimo relatywnie niskiej homologii pomiędzy szczurzą domeną 1 i odpowiednimi domenami w innych polipeptydach ICAM, omawiane miejsce wiązania jest konserwowane co sugeruje, że szczurzy ICAM-4 może być ligandem dla LFA-1, a może także innych integryn.
Przykład 4
Hybrydyzacja in situ w tkance mózgowej
W ceiu zlokalizowania specyficznej tkanki mózgowej, w której zachodzi ekspresja ICAM-4, wykonano hybrydyzację in situ z sondami antysensownego RNA utworzonymi na matrycy domeny 1 ICAM-4 oraz domen 3 i 4 ICAM-4. Sondy wyznakowano in vitro przy użyciu [35S]-UTP.
Zamrożony skrawek tkanki prawidłowego szczurzego mózgu utrwalano w 4% paraformaldehydzie przez 20 minut, płukano i odwadniano; utrwalony RNA denaturowano przez 2 minuty w 2 X SSC, 70% formamidzie w 70°C przed przystąpieniem do hybrydyzacji. Skrawki tkanki hybrydyzowano przez noc w 50°C w roztworze zawierającym 50% formamid, 0,3 M NaCl, 20 mM Tris-HCl pH 7,4, 5 mM EDTA, 10% siarczan dekstranu, 1 X roztwór Denhardta, 0,5 mg/ml drożdżowego RNA, 100 mM DTT oraz sondę w stężeniu 50000 cpm/pl. Skrawki płukano jednokrotnie w 4 X SSC, 10 mM DTT w temperaturze pokojowej przez 60 minut, jednokrotnie w 50% formamidzie, 1 X SSC, 10 mM DTT w 60°C przez 40 min. Po płukaniu skrawki zanurzano w emulsji NTB2 (Kodak, Rochester, NY), eksponowano przez 2 do 21 dni nim wywołano i barwiono kontrastowo. Kontrole negatywne, oprócz sondy RNA wirusa ludzkiego niedoboru odporności (HIV-1), zawierały sensowne sondy utworzone na matrycy domeny 1 ICAM-4 oraz sensowne sondy RNA dla domen 3 i 4 ICAM-4.
Wykrywany sygnał w tkance mózgowej był zlokalizowany przede wszystkim w istocie szarej z najsilniejszym sygnałem w korze mózgowej i hipokampie. Profil hybrydyzacji był zgodny z ekspresją ICAM-4 mającą miej see głównie w komórkach nerwowych mózgu.
Przykład 5
Wytwarzanie fuzji białkowych z ICAM-4
Fuzje białkowe: szczurze ICAM-4/transferaza S-glutationu (GST) wytwarzano przy zastosowaniu prokariotycznego wektora ekspresyjnego pGEX (Pharmacia, Alameda, CA) w celu wytworzenia przeciwciał monoklonalnych przeciw specyficznym fragmentom polipeptydowym ICAM-4.
Startery do PCR odpowiadające końcom 5' i 3' domeny 1 i końcom 5' i 3' domeny 2 zastosowano do powielenia fragmentów DNA kodujących poszczególne domeny. Otrzymane fragmenty były oddzielnie klonowane w miejscu EcoRI pGEX-2T; sekwencja DNA potwierdziła
188 612 prawidłową orientację i ramkę odczytu. Transformanty przeszukiwano następnie pod kątem ich zdolności do wytwarzania fuzji białkowych o odpowiedniej masie cząsteczkowej.
Obie fuzje białkowe: domena 1 ICAM-4/GST i domena 2 ICAM-4/GST pozostawały we frakcji nierozpuszczalnej po lizie bakterii poprzez sonikację w buforze PBS zawierającym 1% SDS. Frakcje nierozpuszczalnych białek ze 100 ml hodowli gotowano w buforze do nanoszenia z SDS i rozdzielano na 10% preparatywnym żelu poliakryloamid-SDS. Żel barwiono w schłodzonym w lodzie 0,4 M KCl i prążki odpowiadające fuzjom białkowym wycinano. Fuzje białkowe poddawano elektroelucji ze skrawków żelu w woreczkach dializacyjnych w buforze zawierającym 25 mM Tris-HCl i 192 mM glicynę. Przybliżone stężenie białka określano poprzez pomiar OD280, a czystość preparatu określano poprzez SDS-PAGE i barwienie błękitem Coomasie.
Przykład 6
Wytwarzanie przeciwciał monoklonalnych przeciw fuzjom białkowym szczurza ICAM-4/GST
Myszy balb/c immunizowano poprzez podskórne wstrzyknięcie 40-50 pg fuzji białkowej: domena 2 ICAM-4/GST (opisanej w przykładzie 5) przeprowadzonej w postać emulsji w pełnym adiuwancie Freunda (FCA). Dwa tygodnie później, myszy były ponownie immunizowane poprzez podskórne wstrzyknięcie tego samego białka, ale przeprowadzonego w postać emulsji w niepełnym adiuwancie Freunda. Dwie końcowe immunizacje wewnątrzotrzewnowe wykonane dwa tygodnie po drugiej immunizacji obejmowały rozpuszczalny antygen bez adiuwanta podawany w odstępie dwóch tygodni. Surowica z każdej immunizowanej myszy była testowana poprzez test ELISA pod kątem zdolności do specyficznej reakcji ze szczurzym IGAM-4 wytwarzanym w opisanym tu bakulowirusowym. systemie ekspresyjnym.
Z myszy # 1654 sterylnie pobierano śledzionę i umieszczano w 10 ml RPMI 1640 wolnego od surowicy. Zawiesinę komórek uzyskiwano poprzez rozgniatanie tkanki śledziony pomiędzy zamrożonymi końcami dwóch szkiełek mikroskopowych zanurzonych w RPMI 1640 wolnym od surowicy (Gibco, Burlington, Ottawa, Kanada) uzupełnionym 2 mM glutaminy 1 mM pirogronianem sodu, 100 jednostkami/ml penicyliny i 100 pg/ml streptomycyny. Zawiesinę komórek filtrowano przez sterylny filtr do komórek Nitex z siatką 70 (Becton Dickinson, Parsippany, NJ) i płukano dwukrotnie RPMI, po czym zwirowywano przy 200 x g przez 5 minut. Otrzymany po ostatnim płukaniu osad ponownie zawieszano w 20 ml RPMI wolnego od surowicy. Tymocyty pobrane z trzech nagich myszy Balb/c przygotowywano w identyczny sposób.
Przed fuzją komórki szpiczaka NS-1 były utrzymywane logarytmicznej fazie wzrostu w RPMI z 11% surowicą Fetalclone (FBS) (Hyclone Laboratories, Logan, Utah) przez trzy dni. Po zebraniu komórki zwirowywano przy 200 x g przez 5 minut i osad przemywano dwukrotnie tak, jak opisano w poprzednim akapicie. Po przemyciu, zawiesinę komórek doprowadzano do końcowej objętości 10 ml w RPMI wolnym od surowicy. Pobierano 20 pl porcje i rozcieńczano 1:50 RPMI wolnym od surowicy, po czym pobierano 20 pl porcje z tego rozcieńczenia, mieszano z 20 pl barwnika błękitu trypanu 0,85% roztworze soli fizjologicznej (Gibco), nanoszono na hemacytometr (Baxter Healthcare, Deerfield, IŁ) i liczono komórki. Około 2,425 x 108 komórek śledziony mieszano z 4,85 x 107 komórek NS-1, mieszaninę zwirowywano, a supematant usuwano. Otrzymany osad przemieszczano poprzez stukanie w probówkę i dodawano 2 ml 50% PEG 1500 w 75 pM Hepes, pH 8,0, (Boehringer Mannheim, Indianapolis, IN), mieszając przez okres 1 minuty. Następnie dodawano kolejne 14 ml RPMI wolnego od surowicy w czasie 7 minut. Zawiesinę komórek zwirowywano przy 200 x g przez 10 minut i supematant odrzucano. Osad zawieszano w 200 ml RPMI zawierającego 15% FBS, 100 pM hipoksantyny sodu, 0,4 pM aminopteryny, 16 pM tymidyny (HAT) (Gibco), 25 jednostek/ml IL-6 (Boehringer Mannheim) 1,5 x 106 tymocytów/ml. Zawiesina była najpierw umieszczana w 225 cm2 kolbie (Corning, Essex, Unitet Kingdom) w 37°C na cztery godziny przed rozporcjowaniem do płaskodennych płytek do hodowli tkankowej z 96 studzienkami(Coming) w ilości 200 pl/studzienkę. Komórki na płytkach były dożywiane 3, 4, 5 i 6 dnia po fuzji poprzez oddessanie około 100 pl z każdej studzienki igłą 20 G (Becton Dickinson) i dodanie 100 pl /studzienkę podłoża hodowlanego opisanego powyżej, z tą różnictą że zawierało 10 jednostek/ml IL-6 i nie zawierało tymocytów.
188 612
Płytki z fuzjami przeszukiwano początkowo poprzez wyłapywanie antygenu w teście ELISA jak następuje. Płytki Immulon 4 (Dynatech, Cambridge, MA) były opłaszczane przez noc w 4°C ze 100 ng/studzienkę fuzji białkowej bądź domena 1/GST bądź domena 2/GST w 50 μΜ buforze węglanowym. Płytki były blokowane 100 μΐ/studzienkę 0,5% żelatyną ze skóry ryb (Sigma, St. Louis, MO) w PBS przez 30 minut w 37°. Po zablokowaniu płytki przemywano 3 X PBS zawierającym 0,05% Tween 20 (PBST) i dodawano 50 μΐ/ścieżkę supematantu znad hybrydom dla każdej fuzji. Po inkubacji w 37°C przez 30 minut, płytki przemywano jak opisano powyżej i dodawano 50 μΐ rozcieńczenia 1:3500 kozich anty-mysich IgG (Fc) koniugowanych z peroksydazą z chrzanu (Jackson ImmunoResearch, West Grove, Pennsylvania). Płytki inkubowano ponownie przez 30 minut i przemywano 4 x PBST. Dodawano substrat, 100 μΐ/studzienkę, składający się z 1 mg/ml o-fenylenodiaminy (Sigma) i 0,1 μΐ/ml 30% H2O2 w 100 μΜ cytrynianie pH 4,5. Reakcja barwna była prowadzona przez 10 minut i wygaszana przez dodanie 50 μΐ/studzienkę 15% H2SO4. Następnie oznaczano absorbancję przy 490 nm w automatycznym czytniku płytek (Dynatech).
Studzienki, które były pozytywne pod względem białka domena 2-GST, ale nie białka domena 1-GST, były następnie przeszukiwane testem ELISA wobec supematantu z Baculowirusa (opisane poniżej). Test ELISA był przeprowadzany jak opisano powyżej z tą różnicą że płytki Immulon 4 były wyjściowo opłaszczane przez noc supematantem Baculowirusa rozcieńczonym 1:4 w 50 μΜ buforze węglanowym. Trzy studzienki (103A, 103B i 103F) były kolejno klonowane dwa do trzech razy, poprzez dwukrotne rozcieńczenie w RPM1, 15% FBS, 100 μΜ hypoksantyna sodu, 16 μΜ tymidyna i 10 jednostek/ml IL-6. Studzienki płytek z klonami badano wizualnie po 4 dniach i oznaczano liczbę kolonii w studzienkach o najwyższej gęstości. Wybrane studzienki dla każdego klonowania były ponownie badane testem ELISA po 7 do 10 dniach wobec białek domena 1-GST i domena 2-GST lub supematantu Bakulowirusa.
Izo typ monoklonalnych przeciwciał wytwarzanych przez hybrydomy ustalano stosując test ELISA. Płytki Immulon 4 (Dynatech) były opłaszczane w 4°Ć 50 μΐ/ścieżkę kozimi antymysimi IgA, IgG lub IgM (Organon Teknika, Durham, NC) rozcieńczonymi 1:5000 w 50 mM buforze węglanowym pH 9,6. Płytki były blokowane przez 30 minut w 37°C 1% BSA w PBS, przemywane 3 X PBST. Do każdej płytki dodawano rozcieńczenie 1:10 supematantu z hodowli hybrydoma (50 μΐ), inkubowano i płukano jak wyżej. Po usunięciu ostatniego płukania dodawano 50 μΐ króliczych anty-mysich IgG], G2a, G2b, lub G3 skoniugowanych z peroksydazą z chrzanu (Zymed, San Francisco, CA) (rozcieńczonych 1:1000 w PBST z 1% normalną kozią surowicą). Płytki inkubowano jak wyżej, przemywano 4 x PBST i dodawano 100 μΐ substratu. Reakcja barwna była wygaszana po 5 minutach poprzez dodanie 50 μΐ 15% H2SĆ>4 i oznaczano absorbancję przy 490 nm w automatycznym czytniku płytek (Dynatech).
Wyniki wskazują że przeciwciała 103A, 103B i 103F wszystkie mająizotyp IgG,. Przeciwciała te były następnie stosowane w analizach immunocytochemicznych, analizie Western i do oczyszczania białka wyrażanego w Bakulowirusie.
Przykład 7
Ekspresja szczurzego ICAM-4 w Bakulowirusie
Bakulowirusowy system ekspresyjny (Invitrogen) został zastosowany do wytworzenia rozpuszczalnego białka odpowiadającego domenom od 1 do 6 ICAM-4. Ponieważ sekwencja liderowa dla ICAM-4 nie była w .tym czasie znana, wykonano konstrukt ekspresyjny zawierający sekwencję kodującą dla ICAM-4, połączoną po stronie 3' z sekwencją liderową ICAM-1 w odpowiedniej ramce odczytu. Szczegóły dotyczące konstruowania plazmidu ekspresyjnego ICAM-l/ICAM-4 są następujące.
DNA dla szczurzego ICAM-1, kodujący pięć domen Ig-40 podobnych, był namnażany poprzez PCR przy zastosowaniu starterów, które posiadały kilka właściwości ułatwiających konstrukcję plazmidu z fuzją. Starter oligonukleotydowy 5' zawierał oprócz sekwencji największej zgodności Kozak, poprzedzającej pierwszą metioninę w sekwencji liderowej, miejsca Hindlll i Bglll. Starter oligonukleotydowy 3' zawierał sekwencję kodującą dla sześciu histydyn, po których następował kodon stop i miejsce klonowania Hindlll. Produkt amplifikacji PCR klonowano w wektorze pBS+ strawionym Hindlll, a analiza sekwencji potwierdziła prawidłowość konstrukcji. Wewnętrzne miejsce Smal w sekwencji liderowej ICAM-1 i inne
188 612 miejsce SmaI w regionie do klonowania w wektorze (3' w stosunku do Ig-podobnej domeny 5 ICAM-1) zostało strawione, czego wynikiem było usunięcie większej części sekwencji kodującej ICAM-1. Po tych manipulacjach, przeprowadzony w formę liniową z tępymi końcami wektor zawierał część regionu z miejscami do klonowania (miejsca restrykcyjne znajdujące się po stronie 5' w stosunku do oryginalnego miejsca HindII w regionie z miejscami do klonowania), sekwencję Kozak i większość sekwencji liderowej ICAM-1.
Sekwencję kodującą dla domen od 1 do 6 szczurzego ICAM-4 powielano poprzez PCR przy zastosowaniu starterów, zaprojektowanych dla umożliwienia klonowania tej sekwencji do przeprowadzonego w formę liniową wektora opisanego powyżej. Starter oligonukleotydowy 5' zawierał miejsce EcoRv i kodony niezbędne do uzupełnienia sekwencji liderowej ICAM-1. Starter oligonukleotydowy 3' zawierał kodony dla sześciu reszt histydynowych, kodon stop, miejsca restrykcyjne HindIII i EcoRV. Produkt powielania w tej reakcji PCR trawiono EcoRV celem wytworzenia sekwencji z tępymi końcami, która była następnie włączona poprzez ligację do mającej tępe końce, liniowej formy wektora pBS+, strawionego Smal. Całkowita sekwencja zawierająca sekwencję liderowąl CAM-1 położoną 5' w stosunku do domen do 1 do 6 ICAM-4 została usunięta z konstruktu poprzez trawienie BgLI i HindIII i oczyszczoną sekwencję fuzji ICAM-I/ICaM-4 sklonowano bezpośrednio w wektorze pBluesac III (Invitrogen) strawionym BglII/HindIII.
Wytwarzanie białka przez zrekombinowany wirus było testowane poprzez test ELISA, stosując wyjściowo surowice z myszy immunizowanych fuzją białkową: domena 2 szczurzej ICAM-4/GST opisaną w przykładzie 5. W dalszej części pracy, przeciwciała monoklonalne wytworzone z tych myszy zostały zastosowane do oczyszczenia białka ICAM-4, wytworzonego przy użyciu zrekombinwanego Baculowirusa w komórkach SF9.
Przykład 8
Wytwarzanie przeciwciał monoklonalnych przeciw szczurzemu ICAM-4 wyrażonemu w Bakulowirusie.
Domeny 1-6 szczurzego ICAM-4 zostały wyrażone w bakulowirusowym systemie ekspresyjnym jak opisano w przykładzie 7. Zrekombinowane białko zostało oczyszczone przy zastosowaniu przeciwciała monoklonalnego 103 A (jak opisano w przykładzie 6).
Pokrótce, 30 mg oczyszczonego monoklonalnego 103A (w 100 mM boranie sodu, 500 mM chlorku sodu) było wiązane z trzema gramami złoża Activated Cyanogon Bromide Sepharose 4B (Pharmacia, Piscataway, NJ). Supematąnt Baculowirusa zawierający zrekombinowane szczurze ICAM-4 (domeny 1-6) nanoszono na kolumnę Sepharose przez noc w 4°C. Kolumnę przemywano roztworem soli fizjologicznej buforowanej wolnym od wapnia i magnezu fosforanem (CMF-PBS) i związany materiał był wymywany 50 pM kwasem cytrynowym, 500 mM NaCl pH 4,0. Próbka była neutralizowana 1/10 objętości Tris pH 10 i przechowywana w -20°C. Oczyszczone białko rozdzielone poprzez SDS-PAGE okazało się w ponad 90% czyste i migrowało w przybliżeniu jako białko o masie 80 kD.
Myszy immunizowano oczyszczonym zrekombinowanym szczurzym białkiem ICAM-4 obejmującym domeny 1-6 w podobny sposób, jak opisano w przykładzie 6. Śledziona z myszy #1945 została zastosowana do fuzji #127. Protokół otrzymywania fuzji był taki, jak opisany w przykładnie 6. Studzienki z fuzjami były przeszukiwane poprzez test ELISA pod kątem zrekombinowanego białka ICAM-4. Drugi przesiew obejmował analizę immunocytochemiczną skrawków mózgu szczura (tak jak opisano w przykładzie 9). Cztery dodatkowe, specyficzne przeciwciała dla szczurzych ICAM-4 sklonowano w wyniku fuzji: 127A, 127E, 127F i 127H. Wzór barwienia cytochemicznego dla każdego przeciwciała na skrawkach mózgu szczura był taki sam, jaki obserwowano z przeciwciałem monoklonalnym 103A (patrz przykład 9). Przeciwciała monoklonalne testowano na ich zdolność do wiązania fuzji białkowych D1/GST i D2/GST (opisanych w przykładzie 5). Przeciwciało monoklonalne 127A rozpoznawało fuzję białkową Dl/GST, a przeciwciało 127H rozpoznawało fuzję białkową D2/GST. Te dwie odrębne specyficzności wiązania łącznie z innymi, które nie wiążą się z żadnym z białek GST, sugerują, że co najmniej trzy różne epitopy były rozpoznawane przez zestaw przeciwciał. Hybrydomy 127A i 127H zdeponowano, odpowiednio, 31 maja 1995 i 1 czerwca 1995 w American Type Culture Collection, 12301 Parklawn Drive, Rockville, Maryland 20852 i oznaczono numerami dostępu, odpowiednio, HB11905 i HB11911.
188 612
Przykład 9
Analiza immunocytochemiczna ekspresji szczurzego ICAM-4
Analizę immunocytochemiczną z przeciwciałem monoklonalnym 103 A wykonywano celem zlokalizowania miejsca wytwarzania białka wewnątrz mózgu szczura.
Mózg pobierano od normalnej dorosłej samicy szczura Lewis, pocięto strzałkowe i przemywano w 1 x PBS wolnym od RNazy przez 30 min. Skrawki mózgu umieszczano następnie w formie do zamrażania Tissue Tek Ii (Miles Laboratories, Inc., Naperville, IN) z niewielką ilością związku O.C.T (Miles, Inc., Elkhart, IN). Mózgi przesuwano na środek formy, formę wypełniano związkiem OCT, następnie umieszczano w pojemniku zawierającym 2-metylobutan (Aldrich Chemical Company, Inc., Milwaukee WI), a pojemnik umieszczano w ciekłym azocie. Gdy tkanka i związek OCT w formie zostały zamrożone, bloki przechowywano w -80°C przed wykonaniem skrawków.
Otrzymywano skrawki tkanki o grubości 6 (im, przytwierdzano do szkiełek pokrytych Vectabond (Vector Laboratories, Inc., Burlingame, CA) pozostawiano do wyschnięcia na powietrzu w temperaturze pokojowej przez noc przed użyciem. Skrawki utrwalano eterem etylowym (Malinckrodt, Paris, KY) przez 5 minut w temperaturze pokojowej. Po wyjęciu szkiełek z eteru, pozostawiano je dla odparowania odczynnika. Każdy skrawek tkanki był blokowany przy zastosowaniu 150 μ1 50% normalnej szczurzej surowicy (Sigma) w 1 x PBS (zrobionym jedynie z fosforanem sodu) przez 30 min w temperaturze pokojowej. Po zablokowaniu ze skrawków delikatnie usuwano bibułą roztwory i oczyszczone przeciwciała 103A z supematantu (1,65 mg/ml) były rozcieńczane 1:10 w roztworze blokującym i nanoszone w ilości 150 jtl na każdy skrawek tkanki. Skrawki były umieszczane w wilgotnej komorze i inkubowane przez noc w 4°C.
Następnego dnia roztwór przeciwciał był odsączany bibułą ze skrawków i skrawki trzykrotnie przemywano 1 x PBS, każde płukanie prowadzono przez cztery minuty. Nadmiar PBS odsysano ze skrawka i na tkankę nakładano 100 (il drugiego, szczurzego anty-mysiego przeciwciała połączonego z biotyną (Jackson ImmunoResearch Laboratories), rozcieńczonego 1:100 w roztworze 10% normalnej szczurzej surowicy i 2% BSA w PBS. Inkubację prowadzono przez jedną godzinę w temperaturze pokojowej. Skrawki przepłukiwano dwa razy w 1 x PBS, każdorazowo po 4 minuty, a następnie na każdy skrawek nakładano 100 μ1 odczynnika ABC z zestawu Elite Rat IgG Vectastain ABC (Vector Laboratories, Inc., Burlingame, CA), przygotowanego zgodnie z instrukcją producenta. Inkubację prowadzono przez 30 min. w temperaturze pokojowej. Po inkubacji, skrawki przemywano dwukrotnie 1 x PBS (każdorazowo po cztery minuty) i każdy skrawek poddawano działaniu 150 μ.1 roztworu Vector VIP Peroxidase Substrate Solution (Vector Laboratories, Inc., Burlingame, CA). Po wybarwieniu, skrawki przepłukiwano pod bieżącą wodą przez 5 minut, barwiono kontrastowo przez 20 sekund hematoksyliną Mayera (Sigma) i ponownie przepłukiwano małym strumieniem bieżącej wody przez pięć minut. Skrawki odwadniano poprzez serię kolejnych działań etanolem, przeprowadzano przez ksylen i utrwalano stosując Accumount 60 (Stephens Scientific, Riverdale, NJ).
Analiza immunohistochemiczna skrawków szczurzego mózgu barwionych mAb 103A wykazała, że szczurze ICAM-4 jest wyrażane w neuronach hipokampu. Wzór barwienia sugerował, że białko może ograniczać się do wypustek neuronów (dendrytów). Skrawki mózgu barwione w podobny sposób innymi przeciwciałami lub samym odczynnikiem z drugiego etapu barwienia nie dawały wyraźnego wzoru ekspresji obserwowanego dla MAb 103A.
Przykład 10
Klonowanie ludzkiego genomowego DNA dla ICAM-4
W czasie klonowania szczurzego ICAM-4 z genomowego DNA odkryto, że ICAM-4 i ICAM-1 były zlokalizowane w obrębie 5 kb i ta informacja została wykorzystana w próbach klonowania homologu ICAM-4.
Przy użyciu Genomie System Inc. (St. Louis, MO) powielono w reakcji PGR fragmenty w ludzkiej bibliotece PI stosując startery dla ludzkiej domeny 3 z ICAM-1, sensowny starter zaprojektowany jako komplementarny do domeny 3 ludzkiego ICAM-1 (H-1/3D S) i antysensowny starter zaprojektowany jako komplementarny do domeny 3 ludzkiego IC'AM-1 (H-1/3D AS). Startery te są przedstawione odpowiednio, w SEK NR ID 22 i 23.
188 612
CCGGGTCCTAGAGGTGGACACGCA (SEK NR. D: 22)
TGCAGTGTCTCCTGGCTCTGGTTC (SEK NR D: 23)
Dwa klony, oznaczone 1566 i 1567, zostały zidentyfikowane i poddane dalszej analizie. Oba klony PI zawierały wstawki genomowego DNA o wielkości około 75-95 kb. Klony trawiono BamHI, rozdzielano elektroforetycznie w żelu agarozowym i przenoszono na filtry nylonowe. Hybrydyzacja Southema filtrów była wykonywana w warunkach łagodnych (30% formamid) lub w ostrych (60% formamid) w 42°C z wyznakowanymi izotopowe sondami ludzkich ICAM-1, ICAM-3 lub szczurzej ICAM-4; inne składniki roztworu hybrydyzacyjnego były takie, jak opisano w przykładzie 1. Serie hybrydyzacji w warunkach łagodnych przemywano w 2 x SSPE zawierającym 0,1% SDS w temperaturze pokojowej. Hybrydyzacje w warunkach ostrych przemywano w 65°C w 0,2 x SSPE zawierającym 0,1% SDS. Przemyte filtry eksponowano stosując błonę rtg przez 3,5 godziny.
Różnicowa hybrydyzacja wykazała, że ludzki ICAM-1 zawierał fragment BamHI o wielkości 5,5 kb, podczas gdy ludzki ICAM-3 był zlokalizowany we fragmentach BamHI 0 wielkości 4,0 kb i 1,5 kb. Fragmenty ludzkich ICAM-1 i ICAM-R subklonowano w pBS+ 1 ich tożsamość potwierdzano poprzez częściową analizę sekwencyjną.
Fragment BamHI o wielkości 7,0 kb, który hybrydyzował ze szczurzym ICAM-4 w ostrych warunkach, subklonowano i dalej fragmentowano poprzez trawienie Rsal. Trzy fragmenty Rsal, które hybrydyzowały z szczurzym ICAM-4 zostały zidentyfikowane, a ich sekwencja ustalona. Opierając się na homologii do szczurzego ICAM-4, fragmenty te okazały się zawierać domeny 2, 3, 4, 5 i część domeny 6.
Przykład 11
Klonowanie ludzkiego cDNA dla ICAM-4
Fragmenty genomowego DNA, odpowiadające domenom 2-5 ludzkiego ICAM-4 (opisane w przykładzie 10) były użyte jako sondy do przeszukania biblioteki cDNA z ludzkiego hipokampu na >ggl0 (Clontech, Pało Alto, Ca). Protokół przeszukiwania biblioteki był zasadniczo taki, jak opisano w przykładzie 1.
Najdłuższy klon ludzkiego ICAM-4 (#18), który został znaleziony w tej bibliotece miał jedynie 992 bp (SEK JD: 24) i odpowiadał połowie genu o spodziewanej wielkości 3 kb. Wstawka DNA z klonu 18 o długości 992 bp (SEK ID: 24) została zastosowana jako sonda do przeszukania biblioteki cDNA z ludzkiego podwzgórza na λ ZAPII (Stratagene, La Jolla, CA). Z tej biblioteki uzyskano liczne pozytywne klony. Najdłuższy klon #34, miał długość 2775 bp (SEK ID: 25). W oparciu o dopasowanie do pełnego szczurzego ICAM-4 przewidziano, że w klonie tym brakuje sekwencji lidera i około 30 bp z końca 5' domeny 1. Brakowało ogona poliA+ na końcu 3', ale obecny był kodon stop dla translacji.
Fragment DNA odpowiadający pierwszym trzem domenom (nukleotydy 1 do 840 w klonie #34) był użyty jako sonda do przeszukania biblioteki cDNA pochodzącego z ludzkiej kory mózgowej na A gtlO (Clontech, Pało Alto, CA). Jeden klon, 16-1 (SEK ID: 26) zidentyfikowano jako zawierający 1557 bp i obejmujący 39 bp z nie ulegającym translacji DNA na końcu 5', sekwencję liderową i sekwencję z piątej domeny. Zachodzące na siebie klony #34 (SEK DD: 25) i 16-1 (SEK ID: 26) zostały użyte do wytworzenia złożonej pełnej sekwencji ICAM-4 (SEK ID: 27).
Kompletny gen ma długość 2927 bp i koduje białko złożone z 924 aminokwasów. Sekwencja nukleotydów ICAM-4 jest przedstawiona jako SEK NR ID: 27, a sekwencja aminokwasowa jest przedstawiona jako SEK NR ID: 28. Porównanie sekwencji z pełnym szczurzym genem dla ICAM-4 wykazało 82% identyczności sekwencji DNA i 85% identyczności na poziomie aminokwasów. Widoczna, Ig9-podobna, struktura zewnątrzkomórkowej domeny jest zachowana między szczurem i człowiekiem. Sekwencja liderowa rozciąga się od aminokwasu 1 do 28; domena 1 od aminokwasu 29 do 117; domena 2 od aminokwasu 118 do 224; domena 3 od aminokwasu 225 do 320; domena 4 od aminokwasu 321 do 405; domena 5 od aminokwasu 406 do 488; domena 6 od aminokwasu 489 do 570; domena 7 od aminokwasu 571 do 663; domena 8 od aminokwasu 664 do 743; domena 9 od aminokwasu 744 do 837;
188 612 region transbłonowy od aminokwasu 838 do 857 i ogon cytoplazmatyczny od aminokwasu 858 do 924.
Ludzki ICAM-4 (HuICAM-4) oprócz tego, że jest genetycznie związany z ICAM-1
ICAM-R, wykazuje równocześnie także pewne wspólne strukturalne cechy, tak, że zgrupowano je razem jako rodzinę cząsteczek.
Dopasowanie poszczególnych domen HuICAM-4 z domenami innych członków rodziny ICAM pokazuje różny stopień homologii. Sekwencja aminokwasów z domeny 1 HuICAM-4 wykazuje 21, 30 i 26% identyczności z domeną 1 z ICAM 1, 2 i 3, odpowiednio. Domena 2 HuICAM-4 wykazuje 61, 39 i 62% identyczności z ICAM 1, 2 i 3, odpowiednio. Domena 3 HuICAM-4 wykazuje 50 i 65% identyczności z ICAM 1 i 3, odpowiednio. Domena 4 HuICAM-4 wykazuje 54 i 64% identyczności z ICAM 1 i 3, odpowiednio. Domeny 5-8 HuICAM-4 są bardziej homologiczne do domeny piątej ICAM 1 i 3, z procentem identyczności wahającym się w przedziale 33-47 dla domeny 5 ICAM-1 i 21-31 dla domeny 5 iCaM-R. Domena dziewiąta HulCAM wykazuje słabsze podobieństwo do innych członków rodziny ICAM, ale jest homologiczna do domeny 3 (24% identyczności) i 6 (23% identyczności z HuICAM-1).
Przykład 12
Analiza ekspresji ludzkiego ICAM-4 metodą Northern
Dwa ludzkie filtry do badania ludzkich tkanek metodą Norhem (human multiple tissue Northern blots, MTN) otrzymano z Clontech (Pało Alto, CA). Zawierały one, co najmniej jag RNA poły A+ z 16 różnych ludzkich tkanek (jak pokazano w tabeli 1) rozdzielone w denaturującym formaldehydowym 1,2% żelu agarozowym i przeniesione na filtr nylonowy. Filtry prehybrydyzowano przez trzy godziny w 42°C w 10 ml roztworu zawierającego 5 X SSPE, 10 X roztwór Denhardta, 50% formamid, 2% SDS i 100 pg/ml zdeneturowanego DNA ze spermy łososia. Filtry hybrydyzowano w powyższym roztworze z wyznakowaną radioaktywnie ludzką sondą ICAM-4 (klon #18, SEK ID: 24) przez 16 godzin w 42°C. Następnego dnia, filtry płukano w roztworze 0,1 X SSC/0,1% SDS w temperaturze pokojowej, po czym płukano w 50°C. Filtry eksponowano na kliszy rtg w -80°C przez 24 godziny. Wyniki analizy są pokazane poniżej w tabeli 1.
Tabela 1
Analiza ekspresji ludzkiego ICAM-4 w tkankach metodą
Northern Sonda
1 2 3
Tkanka ICAM 4 β-aktyna
Serce - + + +
Mózg + + + +
Łożysko - + + +
Płuca - + + +
Wątroba - + +—+
Mięśnie szkieletowe - + + + +
Nerka - + + +
Trzuska - + +
Śledziona - + + +
188 612
c.d. tabeli 1
1 2 3
Grasica - + + +
Prostata - + + +
Jądra - + + +
Jajniki - + + +
Jelito cienkie - + + +
Okrężnica - + + +
Leukocyty krwi obwodowej - + + +
Jedynie ścieżka zawierająca RNA z mózgu hybrydyzuje z sondą ICAM-4, dając pojedyncze pasmo odpowiadające wielkości około 3 kb. Dłuższa ekspozycja (pięć dni) potwierdziła, że jedynie mózg miał wykrywalny poziom mRNA. W celu stwierdzenia, czy wszystkie ścieżki zawierają porównywalne ilości RNA o porównywalnej jakości, te same filtry były hybrydyzowane z kontrolną sondą β-aktynową. Filtry pozbawiano sondy ICAM-4 poprzez traktowanie wrzącym roztworem 0,1% SDS przez 15 minut, a następnie analizowane w podobny sposób z zastosowaniem sondy β-aktynowej, dostarczonej przez producenta. Z wyjątkiem niewielkich różnic ilościowych, wszystkie ścieżki okazały się mieć RNA dobrej jakości.
Dwa dodatkowe filtry do analizy Northern, zawierające poły A+ z 16 różnych podregionów ludzkiego mózgu (jak pokazano w tabeli 2), otrzymano z firmy Clontech. Filtry analizowano przy użyciu w podobny sposób do użytego przy analizie tkanek i wyniki pokazano w tabeli 2. Jakość RNA i ilość nałożona na żel była sprawdzana poprzez hybrydyzację filtrów z sondą β-aktynową.
Wszystkie regiony, które wykazywały ekspresję ICAM-4 są częściami przodomózgowia, z wyjątkiem wzgórza wzrokowego, które jest uważane za część międzymózgowia. Hipokampus i kora mózgowa okazały się mieć najwyższy poziom ekspresji. Wielkość transkryptu była we wszystkich przypadkach taka sama, wynosiła 3 kb. Wyraźna zależność tkankowa ekspresji ICAM-4 sugeruje, że region promotorowy może zawierać elementy odpowiedzialne za obserwowaną, zależną od rozwoju i lokalizacji, ekspresję produktu genu. Zastosowanie takich informacji może wnieść wkład w zrozumienie ogólnej kontroli ekspresji genów w neuronach.
Tabela 2
Analiza ekspresji ludzkiej ICAM-4 w różnych typach komórekmózgu metodą Northern
Sonda
Region mózgu ICAM-4 β-aktyna
1 2 3
jądro migdałowate + + + + +
jądro ogoniaste + + + + +
ciało modzelowate + + + +
hipokamp + + + + +
podwzgórze - + + +
istota szara pnia mózgu - + + +
jądro podwzgórzowe + + + +
188 612
c.d. tabeli 2
1 2 3
wzgórze wzrokowe + + + +
móżdżek - + + +
kora móżdżku +—+ + + + +
rdzeń przedłużony - + + +
rdzeń kręgowy - + + +
biegun potyliczny + + + + +
płat czołowy + + + + +
płat skroniowy + + + + +
skorupa + + + + +
Przykład 13
Wytwarzanie fuzji białkowych ludzkiego ICAM-4/IgG
Wektory ekspresyjne zawierające fuzje białkowe ludzkiego ICAM-4/IgG zostały skonstruowane w celu otrzymywania białek dla wytworzenia przeciwciał monoklonalnych i do zastosowania w testach adhezji celem zidentyfikowania potencjalnych ligandów ICAM-4. Wykonano dwa konstrukty; pierwszy zawierał DNA kodujący domeny 1-3 HuICAM-4, a drugi domeny 4-8. Oba zostały połączone z regionem Fc ludzkiej IgG1 w wektorze pDCS1, który wykorzystuje promotor cytomegalowirusa (CMV) do kierowania ekspresją i sekwencję sygnałową z IgG4 do ułatwienia wydzielania cząsteczek.
Startery do PCR (pokazane poniżej jako SEK NR ID: 29-32) zostały zaprojektowane w celu wytworzenia niezbędnych fragmentów DNA do subklonowania. Starter „sensowny” dla końca 5' domeny 1 (HI4-Dl(s), SEK NR ID: 29) został zaprojektowany tak, aby uzupełnić 30 par zasad domeny 1, brakujących w klonie #34. Startery do PCR HI4-D1(S) (SEK NR ED: 29) i HI4-D3(AS) (SEK NR ID: 30) zostały użyte do wytworzenia fragmentu DNA kodującego domeny 1-3 ludzkiego ICAM-4, odpowiadającego regionowi w SEK ID NR: 1 od nukleotydu 130 do nukleotydu 996. Startery HI4-D3(S) (SEK NR ID: 31) i HI4-D8(AS) (SEK NR ID: 32) zostały użyte do wytworzenia fragmentu DNA kodującego domeny 4-8 ludzkiej ICAM-4, odpowiadającego regionowi w SEK NR ID: 30 od nukleotydu 997 do nukleotydu 2268. Każdy starter 5' kodował miejsce restrykcyjne BamHI (GGATCC, wskazane poniżej poprzez wytłuszczenie), a każdy starter 3' (antysensowny) zawierał miejsce XhoI (CTCGAG wskazane poniżej poprzez wytłuszczenie) celem ułatwienia subklonowania końca 5' genu IgG1. Wszystkie oligonukleotydy zawierały łącznik nukleotydowy (poniżej, podkreślony) na końcu 5' celem umożliwienia trawienia restrykcyjnego.
HI4-D1 (S) (SEKINRID
GTACTTACAGGACCGCGGTCTCGCAGGAGCCCTTCTGGGCGGACCTACAGCCTGCGTGGCGTTC HI4-D3(AS) (SEK NR ID
ATTTCTCTCGAGGAiGCrrCACGTTCTCCCGG
HI4-D4(S) (SEK NR DD ATTTCTCCATCCTACAGCTTCCCGGCACCACTC
HI4-D8(AS) (SEK NR ID
ĄΓΓΠC^’CTCGACTTCCACGCCCACAGTGACGG
29)
300
31)
32)
Reakcje PCR prowadzono w objętości 50 pl przy zastosowaniu buforów dostarczonych przez Perkin Elmer i enzymu AmpliTaq. Startery dodawano do końcowego stężenia 10 p g/ml, a wszystkie cztery dNTP były obecne jako 2 mM. Reakcje były kontynuowane przez 30 cykli denaturacji (94°C przez 4 minuty), przyłączania (50°C przez 2 minuty) i wydłużania (72°C
188 612 przez jedną minutę). Produkty PCR uwidaczniano w żelach agarozowych i próbki z każdej reakcji używano do klonowania produktów PCR w wektorze pCRU (Invitrogen, SanDiego, CA). Przeprowadzono analizę sekwencji celem wykrycia możliwych błędów będących wynikiem procesu powielania i celem potwierdzenia właściwej orientacji. Odpowiednie klony trawiono BamHI i Xhol i fragmenty rozdzielano poprzez elektroforezę w żelu. Oczyszczone fragmenty poddawano ligacji z wektorem pDCS1 strawionym uprzednio BamHI i Xhol i uzyskane w rezultacie plazmidy sekwencjonowano w celu potwierdzenia właściwej orientacji i ramki odczytu.
Domeny 1-3 ludzkiego ICAM-4 i fuzje białkowe 4-8/IgG1 otrzymano po przejściowej transfekcji plazmidów ekspresyjnych do komórek COS7 i izolacji wydzielanych białek z podłoża hodowlanego. Transfekcja była przeprowadzana jak następuje. Przylegające komórki COS7 przy stopniu zrośnięcia się 50-60% przemywano CMF-PBS, a następnie dodawano 10-15 pg plazmidowego dNa w 7,5 ml podłoża DMEM wolnego od surowicy (Gibco, Gaithersburg, MD) zawierającego 6 pl 0,25 M chlorochinonu (Sigma, St. Louis, MO). Dodawano następne 7,5 ml podłoża wolnego od surowicy zawierającego 150 pl dekrtranu DEAE (50 mg/ml) (Sigma, St. Louis, MO) i płytki inkubowano 2-3 godziny przed usunięciem podłoża i zamianą na 10% DMSO (Mallinckrodt, McGaw Park, Illinois) w PBS. Po jednej minucie inkubacji, roztwór DMSO usuwano i wymieniano na świeże podłoże zawierające 5% PBS. Każda transfekcja obejmowała wiele płytek i podłoże z komórek wyrażających to samo białko łączono w celu izolowania białka.
Podłoża zbierano 3-4-krotnie co trzy dni. Białka oczyszczano przy zastosowaniu kolumny Procep a o objętości 0,4-0,8 ml (Bioprocessing Ltd, England) zrównoważonej uprzednio 35 pM Tris, 150 pM NaCl, pH 7,5. Podłoże hodowlane nakładano na kolumnę dwukrotnie, przy przepływie mniejszym, iż 60 objętości kolumny na godzinę. Kolumnę przemywano jednokrotnie 20 objętościami kolumny buforu Tris/NaCl, 20 objętościami kolumny 0,55 M dietanolaminy, pH 8,5 i 20 objętościami kolumny 30 pM kwasu cytrynowego, pH 5,0. Fuzje białkowe wymywano w jednomililitrowych frakcjach przy zastosowaniu 50 pM kwasu cytrynowego pH 3,0 i każdą frakcję neutralizowano 1/10 objętości 1 M Trisu, pH 9,5. Stężenie białka oznaczano poprzez OD280, a czystość oznaczano stosując SDS-PAGE.
Zaobserwowano znaczne zanieczyszczenie wołowym IgG (obecnym w FBS). Pomimo iż spodziewano się, że fuzja białkowa domen 1-3 będzie mniejsza niż fuzja białkowa domen
4-8, obie migrowały w przybliżeniu zgodnie z masą 90 kD. Jednym z możliwych wyjaśnień takiej obserwacji, jest ta, iż mniejsze białko z domenami 1-3 jest bardziej glikozylowane niż większe białko z domenami 4-8.
Poza użyciem oczyszczonych białek do wytwarzania monoklonalnych przeciwciał, co opisano poniżej, białka będą również stosowane w testach adhezji celem identyfikowania ligandów ICAM-4.
Przykład 14
Wytwarzanie przeciwciał monoklonalnych
Oczyszczone białko opisane w przykładzie 13 zastosowano do wytworzenia przeciwciał monoklonalnych przy zastosowaniu protokołu immunizacji takiego, jak opisano w przykładzie 6.
Śledziona z myszy # 2250 (immunizowanej HuICAM-4 Dl-3/IgGl) została użyta do fuzji 172, a śledziona z myszy # 2272 (immunizowanej HuICAM-4 D4-8/IgGl) została użyta do fuzji 173. Protokół fuzji był taki, jak opisano w przykładzie 6. Płytki z fuzjami były przeszukiwane testem ELISA (zasadniczo jak opisano w przykładzie 6) przy zastosowaniu fuzji białkowej HuICAM-4/IgG1. Supematanty ze studzienek z fuzjami, które rozpoznawały białko immunogenne, ale nie inne, były wybrane do klonowania. Analizę immunocytochemiczną skrawków ludzkiego hipokampu zastosowano jako dodatkowy sposób przeszukiwania.
Jeden pierwotny klon z każdej fuzji był pozytywny w teście immunocytochemicznym i był klonowany. Jeden z dwóch klonów nie wykazywał wzrostu w czasie klonowania, pozostawiając tylko jednego kandydata do dalszych badań, klon 173E, który pochodził z myszy immunizowanej HuICAM-4 D4-8/IgG1. Hybrydoma 173E została zdeponowana 1 czerwca 1995 w American Type Culture Collection, 12301 Parklawn Drive, Rockville, Maryland 20852 i została oznaczona numerem dostępu HB11912.
188 612
Dla innej fuzji, pochodzącej z myszy immunizowanej rozpuszczalnym fragmentem ICAM-4 odpowiadającym domenom 1-3, sześć klonów(179A, 179B, 179D, 179H, 1791, i 179K) okazało się być specyficznymi dla domen od 1 do 3 HuICAM4 (Dl-3). Wszystkie sześć przeciwciał z serii 179 wiąże się z wypustkami dendrytowymi w zakręcie zębatym, jak również warstwą komórek wielokształtnych i warstwą piramidową kory mózgowej. Przeciwciało monoklonalne 179A wybarwiało oprócz wypustek dendrytowych również ciało komórek nerwowych z tych obszarów.
Podobnie postępowano z dalszymi fuzjami w celu wytworzenia innych przeciwciał o aktywności immunologicznej specyficznej wobec poszczególnych regionów ICAM-4.
Przykład 15
Opracowanie testu wyłapującego.
Sześć przeciwciał monoklonalnych z fuzji 179 testowano w różnych kombinacjach pod kątem ich zdolności do wyłapywania i wykrywania rozpuszczalnego ICAM-4 w roztworze. Test, jak opisano poniżej, został opracowany w celu oszacowania poziomów rozpuszczalnego ICAM-4 w płynach ludzkich w odniesieniu do warunków normalnych i chorobowych.
Przeciwciało 1791 było opłaszczane na płytkach Immulon 4 (Dynatech) z 96 studzienkami w stężeniu 3 pg/ml, 125 pl/studzienkę przez dwie godziny w 37°C. Roztwór przeciwciała był usuwany poprzez odsysanie i studzienki blokowano przez 30 minut w temperaturze pokojowej 300 pl roztworu blokującego zawierającego 5% rybią żelatynę w PBS wolnym od wapnia i magnezu (CMF-PBS). Roztwór blokujący usuwano poprzez odessanie, do każdej studzienki dodawano 100 pl próbki płynu, rozcieńczonego w Omni Diluent (CMF-PBS, 1% żelatyny i 0,05% Tween 20) i mieszaninę inkubowano 37°C przez 30 minut. Płytki płukano trzykrotnie PBST (CMF-PBS, 0,05% Tween 20). Przeciwciało 179H biotynylowano w stężeniu 1,5 mg/ml przy zastosowaniu NHS-LC-Biotin (Pirce), postępując zgodnie z protokołem sugerowanym przez producenta, rozcieńczano 1:2000 i dodawano do studzienek (100 pl/ /studzienkę). Otrzymaną mieszaninę inkubowano przez 30 minut 37°C i płytki płukano trzykrotnie PBST. Do każdej studzienki dodawano streptawidyny-HRP(Pierce) (100 pl, 0,25 pg/ml) i taką mieszaninę inkubowano w 37°C przez 30 minut. Płytki przepłukiwano czterokrotnie PBST przed dodaniem 100 pl tetrametylobenzydyny (Sigma) (roztwór wyjściowy 10 mg/ml w DMSO) rozcieńczonego 1:100 w zbuforowanym substracie (13,6 g/l trój wodnego octanu sodu, pH 5,5 z 1 N kwasem cytrynowym, z 150 pl/l 30% nadtlenku wodoru dodanego tuż przed wywołaniem). Reakcję przeprowadzano przez 30 minut w temperaturze pokojowej w ciemności, po czym reakcję zatrzymywano poprzez dodanie 50 pl/studzienkę 15% H2SO4. Absorbancję odczytywano przy 450 nm.
Wyniki pokazały, że test miał zdolność wykrywania rozpuszczalnego zrekombinowanego białka, HuICAM-4 D1-3 w stężeniu tak niskim jak 5-10 ng/ml, przy czym liniowa część krzywej była w zakresie 10-100 ng/ml. Nie obserwowano reakcji krzyżowej z HuICAM4 D4-8, gdy ten region białka testowano w stężeniu 1 i 10 pg/ml.
Przykład 16
Pomiar rozpuszczalnego ICAM-4 surowicy pacjentów po ataku
W celu określenia roli ICAM-4 w chorobach i przypadkach neurologicznych, surowicę pochodzącą od dwudziestu ośmiu pacjentów cierpiących na ostry udar i dwudziestu młodych zdrowych ochotników (nie dobieranych pod względem wieku) testowano jak opisano powyżej pod kątem różnic w stężeniu rozpuszczalnego ICAM-4 w surowicy.
Wyniki pokazały, że w surowicy ze zdrowych ochotników nie na wykrywalnego poziomu ICAM-4. Natomiast dwudziestu spośród dwudziestu ośmiu pacjentów z ostrym udarem ma wykrywalny poziom rozpuszczalnego ICAM-4. Sygnał z pozytywnych pacjentów z udarem odpowiada zakresowi 5-38 ng/ml standardu (rozpuszczalnego zrekombinowanego białka ICAM-4 Dl-3).
Przykład 17
Poziom mRNA dla ICAM-4 w hipokampie w szczurzym modelu epilepsji.
Poziomy wyrażanego mRNA dla szczurzego ICAM-4 mierzono w hipokampach szczurów traktowanych w taki sposób, aby utworzyć zwierzęcy model powstawania wzbudzanej
188 612 epilepsji (Lothman, et al., Brain Res. 360:83-91, (1985)). W tym modelu hipokamp szczura jest stymulowany seriami poddrgawkowych elektrowstrząsów za pośrednictwem elektrody, wszczepionej w region mózgu, które stopniowo prowadzą do poważnych behawioralnych ataków. Proces pobudzania obejmuje dwanaście stymulacji na dzień, wykonywanych co drugi dzień przez osiem dni. Po kompletnym pobudzeniu pojedynczy bodziec może doprowadzić do ataku ruchowego i zmian histologicznych, które są podobne do epilepsji u człowieka. W pełni pobudzane szczury otrzymywały dwie stymulacje na dzień w okresie dwóch tygodni i zwierzęta były uśmiercane 24 godziny po ostatniej stymulacji. Pobierano hipokamp i preparowano celem otrzymania RNA.
Całkowity RNA otrzymywano z każdej próbki stosując procedurę ekstrakcji guaunidyna/fenol/chloroform (Chomczynski and Sacchi, Anal. Biochem. 162:156-159 (1987). RNA rozdzielano na denaturujących formaldehydowych żelach agarozowych, przenoszono na filtry nylonowe i hybrydyzowano z wyznakowanymi radioaktywnie sondami DNA specyficznymi dla szczurzego ICAM-4 i dehydrogenazy 3-gliceroaldehydo-3 fosforanu (GAPDH). GAPDH genem wyrażanym na poziomie podstawowym i jest zwykle używany jako kontrola do wykrywania różnic między ścieżkami w ilości RNA nałożonego na żel. Wahania w stosunku ICAM-4/GAPDH są interpretowane jako zmiany poziomu ekspresji ICAM-4. Prążki hybrydyzujące dla ICAM-4 i GAPDH oznaczno ilościowo przy użyciu urządzenia Phosphoimager i określano stosunek ICAM-4/GAPDH.
Stosunek ICAM-4/GAPDH był wyraźnie wyższy u zwierząt kontrolnych, które nie były pobudzane (n=5) w porównianiu z grupą pobudzaną (n=5), co sugerowało, że ekspresja ICAM-4 była obniżona w konsekwencji procesu pobudzania. Jednakże należy zauważyć, że grupa kontrolna nie podlegała pozornym zabiegom, a zatem istnieje możliwość, że poziom mRNA ICAM-4 był modulowany w odpowiedzi na zabiegi chirurgiczne związane z pobudzaniem.
Przykład 18
Klonowanie i analiza regionu DNA regionu regulacy'nego po stronie 5' ludzkiego ICAM-4
Ekspresja genu ICAM-4 jest regulowana przestrzennie i czasowo, przy czym ekspresja jest ograniczona do najbardziej przedniego lub spodniego regionu mózgu, kresomózgowia. W celu zidentyfikowania sekwencji genu odpowiedzialnego za ograniczoną transkrypcyjną. regulację ICAM-4, badano region nukleotydowy położony 5' w stosunku do sekwencji kodującej ludzkiego ICAM-4.
Fragment BamHI/Pstl o długości 2607 par zasad pochodzący z genomowego fragmentu BamHI o wielkości 7 kb (opisanego w przykładzie 10) został zsekwencjonowany i ustalono, że zawiera 1684 nukleotydów przed kodonem start ATG. Kompletna sekwencja tego regionu jest przedstawiona w SEK NR ID: 33. W stosunku do pozycji regionu kodującego ICAM-4, „A” w kodonie startowym ATG (występującym w SEK Nr ID: 33 jako nukleotydy 1685-1687) jest oznaczonyjako nukleotyd +1, a nukleotyd leżący bezpośrednio po stronie 5' w stosunku do nukleotydu A+ 'jest oznaczony jako -1, a zatem cała sekwencja jest pokazana jako rozciągająca się od nukleotydu - 1684 do nukleotydu +3, co odpowiada numeracji od nukleotydu 1 do nukleotydu 1687 na liście sekwencji.
W oparciu o sekwencję genomowego HuICAM-4 zsyntetyzowano nukleotydy i zastosowano je w reakcji PCR w celu wytworzenia cząsteczek DNA o różnej długości w obrębie regionu regulacyjnego z końca 5'. Każdy oligonukleotyd, przedstawiony w tabeli 3 zawierał region rozdzielający (zaznaczony kursywą) o długości około 6 do 10 bp dla umożliwienia enzymatycznego trawienia produktu PCR, miejsca restrykcyjne Nhel lub Hindlll (zaznaczone tłustym drukiem) i specyficzną sekwencję startera do hybrydyzacji (podkreśloną). Nazwa oligonukleotydu zawierała numery, które oznaczały jego położenie w obrębie regionu regulacyjnego. W reakcji powielania PCR oligonukleotydu dobierano w pary jako pokazano w tabeli 4 w celu wytworzenia fragmentów DNA zawierających specyficzne regiony obszaru regulacyjnego na końcu 5'.
188 612
Tabela 3
Startery do PCR stosowane do powielenia regionu z końca 5' HuICAM-4
HI4-19 (AS)
HI4-114
HI4-149
HI4-206
HI4-270
HI4-408
HI4-480
HI4-560
HI4-817
C4 CA4 CCTAAGCrrAC AGGAGGCGAGGAGAGCGCGAG (SEK NR ID: 34)
AAACAA 7GCTAGCCAAGCGCAACTCTGTCTC (SEK NR ID: 35)
AAA AAA 7GCTAGCCTTGGAAAiCCAAiGTTACC (SEK NR DD: 36)
CAA CAA 7GCTAGCAGGAGCTTAGCGCACGCTCG (SEK NR ID: 37)
AAACAA TCCTAGCCATGCCGGCCTCCACGTAG (SEK NR ID: 38)
CAA CA TGCT^/^C^C(GTCCAXCJTATTATCATG (SEK NR ED: 39)
AAA AAA TGCAAGCCAAAGCtCCCAAAAYCTATYC (SEK NR ID: 40)
CaAI CaL4 TGCTAGCGGAGTAAGGATCAGTG AG (SEK NR ID: 41)
CAA CA 7GCT AGCTTCACCCACCG AGCA G ΛΛ G (SEK NR ID: 42)
Miejsca restrykcyjne i region rozdzielający wytworzony w obrębie każdego oligonukleotydu umożliwił trawienie enzymatyczne i następujące po tym ukierunkowane klonowanie poszczególnych produktów PGR w wektorze pGL3 Basic Vector (Promega, Madison, WI), który zawiera gen reporterowy dla lucyferazy bezpośrednio za miejscami do klonowania (MSC). Aktywność promotora sklonowanego w regionie MSC wektora kierowała ekspresją reporterowego genu dla lucyferazy w transfekowanych liniach komórkowych, a wytwarzanie światła przez wyrażoną lucyferazę można mierzyć jako wskaźnik aktywności promotora. pGL3 Basic Vector nie ma aktywności promotora i dlatego służy jako kontrola negatywna, podczas gdy wektor pGL3 zawierający promotor SV40 służy jako kontrola pozytywna. Sekwencja każdego konstruktu ekspresyjnego była sprawdzana poprzez analizę restrykcyjną i sekwencjonowanie DNA.
Plazmidy zawierające każdą z powielonych sekwencji opisanych w tabeli 4 były transfekowane do komórek ssaczych przy zastosowaniu zestawu Transfection MBS Mammalian Transfection Kit (Stratagene, La Jolla, CA), zgodnie z protokołem sugerowanym przez producenta. Każdy plazmid był wprowadzany do dwóch różnych linii komórkowych, COS7 i NT2 Precursor Cells (Ntera2/Dl ze Stratagene). Komórki COS7 są powszechnie stosowaną małpią fibroblasto-podobną linią komórkową transformowaną SV40, co czyni je dobrze nadającymi się do kierowania ekspresją genu pod kontrolą promotora SV40 w komórkach transfekowanych pozytywną kontrolą - wektorem pGL3 Promoter Vector. Komórki prekursorowe NT2 łączy się z neuronową linią komórkową i ponieważ nie wyrażają ICAM-4, mogą być reprezentatywne dla typu komórek, które nie wyrażają ICAM-4.
188 612
Tabela 4
Pary starterów i powielane regiony
Pary oligonukleotydów Odpowiedni region regulatorowy po stronie 5'
HI4-19(AS) z HI4-114 HI4-19(AS) z HI4-149 HI4-19(AS) z HI4-206 HI4-19(AS) z HI4-270 HI4-19(AS) z HI4-408 HI4-19(AS) z HI4-480 HI4-19(AS) z HI4-560 HI4-19(AS) z HI4-817
-19^-114 -19 ->-149 -19 -206 -19 -»-270 -19 ->-408 -19->-480 -19 ->-560 -19 -> -817
Do każdej z 6 studzienek płaskodennej płytki do hodowli tkankowej (Falcon)nanoszono 2,5 xl05 komórek. Transfekcję COS7 i komórek NT2 wykonywano równolegle w dwóch powtórzeniach przy zastosowaniu 5 pg plazmidowego DNA na każdą studzienkę. Komórki hodowano w 37°C przez 48 godzin, lizowano i testowano pod kątem aktywności lucyferazy stosując Luciferase Assay System (Promega).
Wyniki doświadczenia, zebrane w tabeli 5, wskazują na wysoki poziom aktywności promotora leżącego między nukleotydatni -408 i -19 oraz -480 i -19 regionu regulatorowego po stronie 5' ICAM w komórkach NT2. Ponieważ komórki NT2 są pochodzenia neuronowego, mogą one wyrażać pewne czynniki transkrypcyjne, rozpoznające promotor ICAM-4, które nie są znajdywane w innych typach komórek. Najwyższy poziom aktywności promotora w transfektantach komórek COS otrzymano dla plazmidów zawierających nukleotydy od -560 do -19. Podczas gdy kontrola pozytywna - wektor promotorowy pGL3 działała dobrze w komórkach COS, wykazywała bardzo słabą aktywność promotorową w komórkach NT2, pokazując w ten sposób preferencję pewnych sekwencji promotorowych w stosunku do specyficznych typów komórek.
Tabela 5
Aktywność promotora z regionu 5' ICAM-4
Region 5' Luminescencja
CO NT2
-114 do-19 0,003 0,376
-149 do-19 0,008 0,628
-206 do-19 0,443 0,622
-270 do-19 0,056 1,140
-408 do-19 0,401 7,970
-480 do-19 0,274 4,630
-560 do-19 3,227 1,232
-817 do-19 0,035 4,453
Wektor
promotorowy 29,070 0,063
pGL3
Wektor
podstawowy 0,008 0,014
pGL3
188 612
Ponieważ ani COS7 ani NT2 normalnie nie wyrażały ICAM-4, to samo doświadczenie będzie powtórzone przy zastosowaniu pierwotnych hodowanych neuronów zhipokampu szczura, w którym następuje ekspresja ICAM-4 i koniecznie posiada maszynerię transkrypcyjną wymaganą do aktywności promotora ICAM-4. Poprzez transfekowanie poszczególnych konstruktów promotorowych, opisanych tutaj, jak również innych, być może będzie możliwe bardziej dokładne zidentyfikowanie nukleotydów w regionie regulatorowym po stronie 5', które są odpowiedzialne za ścisłą regulację genu ICAM-4 w mózgu.
Przedstawione powyżej przykłady będące ilustracją wynalazku dotyczą wykonań wynalazku i korzystnych w chwili obecnej i biegli w tej dziedzinie mogą się spodziewać powstania licznych ich modyfikacji i odmian. A zatem jedynie takie ograniczenia, które zawarte są w dołączonych zastrzeżeniach, będą określać zakres niniejszego wynalazku.
188 612
188 612
Lista sekwencji (1) Informacje ogólne:
(i) Zgłaszający: Gallatin, W. Michael
Kilgannon, Patrick D.
(ii) Tytuł : Materiały i sposoby dla ICAM-4 (iii) Liczba sekwencji: 42 (iv) Adres dd korespondencji:
(A) Adresat: Marshall, O'Toole, Gerstein, Murray & Borun (B) Ulica: 233 South Wacker Drive, 6300 Sears Tower (C) Miasto: Chicago (D) Stan: Illinois (E) Państwo: United States of America (F) Kod: 60606-6402 (v) Forma szczytywalna komputerowo:
(A) Rodzaj nośnika: dyskietka (B) Komputer: kompatybilny z IBM PC (C) System operacyjny: PC-DOS/MS-DOS (D) Oprogramowanie: PatentIn Release #1.0, wersja #1.25 (vi) Dane bierzącego zgłoszenia:
(A) NUMER ZGŁOSZENIA::
(B) DATA ZGŁOSZENIA:
(C) KLASYFIKACJA.:
(vii) DANE POPRZEDNIEGO ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: US 07/827,689 (B) DATA ZGŁOSZENIA: 27-Sty-1992 (vii) DANE POPRZEDNIEGO ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: US 07/889,724 (B) DATA ZGŁOSZENIA: 26-maj-1992 (vii) DANE POPRZEDNIEGO ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: US 07/894,061 (B) DATA ZGŁOSZENIA: 05-czer-1992 (vii) DANJE POPRZEDNIEGO ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: US 08/009,266 (B) DATA ZGŁOSZENIA: 22-Sty-1993 (vii) DANE POPRZEDNIEGO ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: US 08/102,852 (B) Data zgłoszenia: 05-sierp-1993 (vii) DANE POPRZEDNIEGO ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: US 08/245,295 (B) Data zgłoszenia: 18-maj-1994 (vii) DANE POPRZEDNIEGO ZGŁOSZENIA:
(A) NUMER ZGŁOSZENIA: US 08/485,604 (B) Data zgłoszenia: 07-czer-1995 (viii) Dane pełnomocnika/agenta:
188 612 (A) Nazwisko: WILLIAMS, JR. JOSEPH A.
(B) Nr rejstracyjny: 38,659 (C) Znak: 27866/33321 (ix) Dane telekomunikacyjne:
(A) telefon: 312-474-6300 (B) telefakB: 312-474-0448 (C) teleks: 25-3856] (2) INFORMACJA O SEK NR ID:1:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 2988 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ix) CHARAKTERYSTYKA:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 61..2814 (xi) OPIS SEKWENCJI: SEK NR ID: 1:
AATTCGATCA CTCGCGCTCC CCTCGCCTTC TGCGCTCTCC CCTCCCTGGC AGCGGCGGCA 60
ATG CCG GGG CCT TCA CCA
Met 1 Pro Gly Pro Ser 5 Pro
GCT GCC CTG GGC CTG GGG
Ala Ala Leu Gly 20 Leu Gly
CCT TTC TGG GCG GAC CTT
Pro Phe Trp 35 Ala Asp Leu
GGC TCG CTG TGG CTC AAC
Gly Ser 50 Leu Trp Leu Asn
GGT GGC CTG GAG ACC TCG
Gly 65 Gly Leu Glu Thr Ser 70
CGC TGG CTG GCT CGA CAG
Arg Trp Leu Ala Arg 85 Gln
CCG GTC TGC TTC TTC CGC
Pro Val Cys Phe 100 Phe Arg
CTC ATC CGA ACT TTC CAG
Leu Ile Arg 115 Thr Phe Gln
CCT CCT TGG CAG CCT GTA
GGG CTG CGC CGA ACG CTC
Gly Leu Arg Arg 10 Thr Leu
ATC CTA GGC ATC TCA GCG
Ile Leu Gly 25 Ile Ser Ala
CAG CCC CGC GTG GCG CTC
Gin Pro 40 Arg Val Ala Leu
TGC AGC ACT AAC TGT CCG
Cys 55 Ser Thr Asn Cys Pro 60
CTA CGC CGA AAC GGG ACC
Leu Arg Arg Asn Gly 75 Thr
CTG GTG GAC ATC CGA GAG
Leu Val Asp Ile 90 Arg Glu
TGC GCG CGC CGC ACA CTC
Cys Ala Arg 105 Arg Thr Leu
CGA CCG GAT CGG GTA GAG
Arg Pro 120 Asp Arg Val Glu
GGT GAG AAC TTC ACC TTG
CTC Leu GGC CTC TGG 108
Gly Leu 15 Trp
GTC GCG CTA GAA 156
Val Ala 30 Leu Glu
GTG GAG CGC GGG 204
Val 45 Glu Arg Gly
AGG CCG GAG CGC 252
Arg Pro Glu Arg
CAG Gln AGG Arg GGT Gly CTG Leu 80 300
CCT GAA ACC CAG 348
Pro Glu Thr 95 Gln
CAA GCG CGT GGG 396
Gln Ala 110 Arg Gly
CTA GTG CCT CTG 444
Leu 125 Val Pro Leu
AGC TGC AGG GTC 492
188 612
Pro Pro Cop Gin Pro Val Gly Glu Asn Phe Thr Llu Cer C—s AAo Vvl
130 115 144
CCC GGG GCA CCC CCG CCA PAG aga? CGT Pac ACT pac ptg CCC AGA AAA 540
Pro Gly Ala. gi. Cro Arg AGa C^r· LUU TTr Puu ATh Plu Alu AAO All
145 115 115 160
GGC CAG GAC CTA ACC CGC CGA AGT ttc GTA GGC AAA CCC CCC CGA GCC 588
Gly Gin Glu Leu Ilu Arg Arg Ser Phe Val Gly llu Pro Pro Arg AGu
165 170 175
CGG GGT GCC ACG CTC ACC GCC ACG GTC CCG PAG CCG AAA CAG ACC ACC 636
Arg Gly Ala Get Leu Thr Ala Thr Val Llu PGu pao pao Alu Aap Aii
180 118 191
AGG GCC AAT TTC TCA TGC CTC CCC GAA CTT AAG CTl GCC CCA CAC CAC 684
Arg Ala Asn Phe Ser Cys Leu Ala Glu Lru Asp Lru Arg Pro His Cly
195 200 205
TCA GGA CTG TCT GCA CGCC A(AC TCCG (ACC CCC pac pca CCC CCC ACG CCC 732
Leu Gly Leu Płie Ala Asn Ser Ser Ala Ppo pao Ali Alu Aao ATh CPh
210 215 220
GCC ATG CCT CCA CGT TCC CCA ACC CTT ATG GGG CCA CGA TCC TTA CCA 780
Ala Met Pro Pro Leu Ser Pro Srr Lru Ilu Ala Pro Arg Phr Lru Clu
225 230 235 220
GTG GGC TCA gcgg AGG CCC ATG ACT TAG AAT TTG GAT CGA CCC! ctct CCT 828
Val Gly Ser Glu Arg Pro VaU Thr Cys Thr Leu Asp Gly Leu Phe PrO
245 220 255
GCC CCA GAA CCC GAG ATT TAC CTC TCT GTA GAA AAT CAA CCC GTC CAC 876
Ala Pro Glu Ala Gly Val Tyr Lru Ser Lru Cly Asp Gin Arg Leu His
260 226 227
CCT AAT CTC ACC CTC CAC GGA GAG ACC CGG GTG ACC ACT CCC ACC ACT 924
Pro Asn Val Thr Leu Asp Gly Glu Ser Ueu Val Ala Chr Ala Tho Ala
275 280 285
ACA GCA AGT GAA GAA CAC GAA GGC ACC AAC CAG CTl ATG TCC ATC CTC 972
Thr Ala Ser Clu Glu Gin Glu Gly Thr Uys lin Leu Met Cys Ilr VgU
290 295 300
ACC CTC CAC GAC CCA AGC AGG GAG ACC GAG GAA AAC CTG ACT ATC TCC 1020
Thr Leu Gly lly Glu Ser Arg Glu Tho lin Glu Asn Leu Thr Val Tyo
305 310 315 320
AGC TTC CCC GCG CCT CTT CCA ACT TTA CAT GAG CCA AAA GCC CCC CAC 1068
Ser Phe Pro Ala Pro Leu Lru Thr Leu Sur Glu Pro Alu Ala Pro Alu
325 330 355
GGA AAG ATG ATA AGC GTA AGC TCC TGA AGC GAG ACC CGA CCC CCC CTG 1116
Gly Lys Met Val Thr Val Ser Cys Top CUa Gly Ala Arg Ala Leu Vll
340 345 335
ACC TTG GAC CAA CTT CCA CCC GCCl GTC CCT CAG CAG CCC GCT GAG CTC 1164
Thr Leu GGu AUy Ile Pro Ala Ala Val Pro lly Gin Pro Ala Glu Leu
355 330 336
CAG TTA AAT GGC ACC AAA i AAT 1 AAC AAC CCA CGG CCC TCC TCC TCC ! CAC 1212
188 612
Gin Leu Asn Val Thr LyB Asn Asp Aep Lys Arg Gly Phe Phe Cys Asp
370 375 380
GCT GCC CTC GAT gto GAC GG’ GAA ACT CT’ AGA AA’ AAC CA’ A’C TCT 1260
Ala Ala Leu Asp Val Asp Gly Glu Thr Leu Arg Lys Asn ’in Ser Ser
385 390 395 400
GAG CTT CGT GTT CT’ TAC GCA CCT CG’ CT’ GAT GAC TT’ GAC TGT CCC 1308
Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Leu Asp Cys Pro
405 441 415
AGG AGC TGG AC’ TGG CCA ’A’ GOT CCA GA’ CAG ACC CTC CAC TGC GA’ 1356
Arg Ser Trp Thr Trp Pro ’lu ’ly Pro Glu Gin Thr Leu His Cys Glu
420 440 430
GCC CGT GGA AAC CCT GAG CCC TCC GT’ CAC TGT GCA A” CCT GAC GOT 1404
Ala Arg Gly Asn Pro ’lu Pro Ser Val His Cys Ala Arg Pro Asp Gly
435 444 444
GGG GCG GTG CTA ’C’ CTG ’’C CTC TT’ GCT CCA GT’ ACC CGT ’CC CTC 1450
Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu
450 445 446
GCG GGC ACT TAC C’A TGT ACA ’CA ATC AAT CAA ^C CAG ’C’ ’TC 1500
Ala Gly Thr Tyr Arg Cys Thr Ala Ile Asn Gly Gin ’ly ’in Ala Val
465 477 445 440
AAG GAT GTG ACC CTG ACT GT’ GAA TAT GCC CCA GCG CTG ’AC AGT GTA 1548
Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val
485 449 449
GGC TGC CCA GAA CGT ATT ACT T’’ CTO GA’ ’’’ ACA ’A’ ’CA TC’ CTT 1596
Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu ’ly Thr Glu Ala Ser Leu
500 555 551
AGC TGT GTG GCA CAC ”’ GTC CCA CCA CCT AGC GTC A’C TCT GT’ C’C 1644
Ser Cys Val Ala His Gly Val Pro Pro Pro Ser Val Ser Cys Val Arg
515 550 525
TCT GGA AAG GA’ GAA ’TC AT’ GAA ’’’ CCC CTC CGT ’TC GCC CGG ’A’ 1690
Ser Gly Lys Glu Glu Val Met ’lu Gly Pro Leu Arg Val Ala Arg ’lu
530 553 550
CAC GCT GGC ACT TAC CGA TGC dAA ’CC ATC AAC GCC Α” ’’A TCA GC’ 1040
His Ala Gly Thr Tyr Arg Cys ’lu Ala Ile Asn Ala Arg Gly Ser Ala
545 550 5155 550
GCC AAA AAT GTG GCT ’TC AC’ GT’ ’AA TAT CCC AGT GGG ’A’ ’A’ 1088
Ala Lys Asn Val Ala ViU Thr Val ’lu Tyr Gly Pro Ser Phe ’lu ’lu
565 550 550
TTG GGC TGC CCC A’C AAC TC’ ACT GTA ’AA G’A TCT G^A AAA CTC 1836
Leu Gly Cys Pro Ser Asn Trp Thr Trp Val ’lu Gly Ser ’ly Lys Leu
580 5S5 550
TTT TCC TGT’ GGA GGT GGA (5” GAG GCC GGA CCCI CGC GTG «Άσ TGC GT’ 1884
Phe Ser Cys GGu W1 Gas GGy Gys Gro GGu Pro iirg Val Glu C/s Val
595 600 605
GGC TCG GAG GGC GAG GGA GCG GTA GG^ TTC CCC CTC GTG TCC TC’ 1930
Gly Ser Glu GGy Gil SSr GGu GGy Vv1 Gv1 Leu Pro Leu Val Ser Ser
610 615 600
188 612
AAC TCT GGT TCC ACTA AAC TCC? ATG ACC CCT CCT AAC CCA5 TCA CCG (TCT Asn Ser G1t Ser Arg Asn Ser Met TCh ProGly Asn Leu Ser Pro Gly 0580
025 030 035 040
ATT TAC ctc: TGC cacc GCC . ACC . JACC CCTC CAT CT3C ' TCC . ACCC TAC AAA . ACCC 2028
Ile Tyr Lee CAs Asn Ala Thr Asn . Arg His Gly Ser Thr · Val Lys Thr
045 050 055
TTC TTC TCT ATC TCT TAA TCA CCT CCA CAT ACT TAT TAA TCC ATT TTC 2070
Val Val Val Ser rla Tlu Ser rro Pgo Tin Met Asp Tlu Ser Ser Cys
000 055 070
CCT ATT CAC CAT acc TTT CAT TAA TCA TCC TAT TCT ACC TCT CTT TCC 2024
rro Ser His Tln Thr Arp Leu Tlu Cly Ala Tlu Ala Chg Ala Leu Ala
075 080 085
TTC ATT TCC ATA TTC CTC CCC TCT CCA CTC TCT CTC CTT TCC ATT TAA 2072
Cys Ser Ala Arg Tly Arg rro Ser Pgo Agg Val Arg Cys Ser Agg Tlu
090 605 700
TTT TCA TCC ATT CTT TAT ATT CTA CAC TTT TCC CTA TAT TAT TCT TTT 2220
Tly Ala Ala Arg Leu Tlu Arg Leu Cln Val Ser Agg Tlu Asp Ala Tly
705 710 7U 720
ACC TAC CAT CTT TTT TCC ACC AAC TCT CAT TTC ACT TAC ACA CTT ACC 2208
Ahr Tyr Leu Cys Val Ala Thr Asn Ala His Tly Thr Asp Ser Agg Chg
725 770 770
TTC ACT TTT TTT TTT TAA TAC CTT CCT TTT TCT TCC TAT CAT TCA TCC 2000
Val Thr Val Tly Val Tlu Tyr Arg Pro Val Val Ala Tlu Leu Cla Ala
740 774 750
TCT CCC CAC agc: GTG CCT SCC CTT STT CAA CTC ACC SCC ACC TAT ACT 2354
Ser Pro rro Ser Val Arg Srr STl STl Crn CPr CTh See Thr CCS Arg
755 770 775
TCA TAT TCC TGG CCT CCC STC CCA CTC CAT CCC cct: STC CCC CCC! ATT 2402
Ala Tlu Ala Trp Pro Prr SAa STl CIl CSe Arg Crg AAl Pgo Pro Cly
770 775 880
TCT CTC AAC CTC CT5T CCT ATC AGC CAG CAC CCTC ACC CCG AGC GTG GCG 2400
Ala Leu Asn Leu Gly Lee See· S^e- Am Am (Se ATh Alu Ser Vb1 CA.a
785 7S90 7!5i5 880
TTT TCC ATT GGC AGC CAT «3Τ (T3C CCG CrcA? GAG TOC GCCC TCC ACTCC CCCTC 2508
Tly Ala Met Gly Ser His GTy Gly Glu Syr Glu Ctys Ala Ala Thr Asn
805 810 880
TCT CAT TTT CGC CAC GCA (CTC CGC ATG acc: GTG CGC GTC TCC GGT CCA 2550
Ala His Tly Arg His Ala Arg CArg Cle Thr Val Arg Val Ala Gly Pro
820 882 830
TTT CTT ATT GTC TCT GTC (CCC GGT GCG GCA CCTC CTCC GCG TCT • CTG CTG 2004
Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu
535 880 845
TCC TCA . TTT GCC GGC CTG GCC ' ATT CCT ' CCG i cr^cc i TCC ATC GCC ' TAC AAC 2052
Ala Ala Tly Ala ^Sy ' Leu . ACl . rre ryg • Val . Cln - ACh ' Ala , CCS i Cys
850 855 860
188 612
AAG Lys 865 GGA GAG Gly GGu TTA AC Tyr Asn GTO CAG GAG GCT GAG AGG TCA GGG TAA GCG GTG Ser Ser Gly Glu Ala Val 2700
Val Gin 870 Glu Ala Glu
875 880
TGT CTC AAT TGG GCG GGC GAA AOA CCG GGT GCA GAA ®5C GGA GCA <GG 2748
Cys Leu Asn TGy Ala Gly Gly Tłnr Pro Gly Ala Glu ' Gly Gly Ala Glu
885 890 895
ACC CCC GGG TAC (GCC GAG TCA CCT GCA GAT <G3C GAG GUTT TTC GCC ATC 2796
Thr Pro GGy Thh Ala Glu Ser Pro Ala Asp Gly Glu Val Phe Ala 11 «i
900 905 910
CAG CTG ACA TCT TCC TGAGCCTGTA TCCAGCTCCC CCAGGGGCCT CGAAAGCACA 2851
Gln Leu Thr Ser Ser
915
GGGGTGGACG TATGTATTGT TCACTCTCTA TTTATTCAAC TCCAGGGGCG TCGTCCCCGT 2911
TTTCTACCCA TTCCCTTAAT AAAGTTTTTA TAGGAGAAAA AAAAAAAAAA AAAAAAAAAA 2971
AAAAAAAAAA AAAAAAA 2988 (2) INFORMACJA O SEK NR ID:2:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 917 aminokwasy (B) TYP: aminokwas
O) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: białko (ci) OPIS SEKWENCJI: SEK NR ID:2:
Met 1 Pro Gly Pro Ser 5 Pro Gly Leu Arg Arg Thr Leu Leu Gly Leu Trp
10 15
Ala Ala Leu Gly Leu Gly Ile Leu Gly Ile Ser Ala aal Ala Leu Glu
20 25 30
Pro Phe Trp Ala Aep Leu Gln Pro Arg aal Ala Leu aal Glu Arg Gly
35 40 45
Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg
50 55 60
Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu
65 70 75 80
Arg Trp Leu Ala Arg Gln Leu aal Asp Ile Arg Glu Pro Glu Thr Gln
85 90 95
Pro aal Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly
100 105 110
Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg aal Glu Leu aal Pro Leu
115 120 125
Pro Pro Trp Gin Pro aal Gly Glu Asn Phe Thr Leu Ser Cys Arg aal
130 135 140
Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly
145 150 155 160
Gly Gin Glu Leu Ile Arg Arg Ser Phe aal Gly Glu Pro Pro Arg Ala
165 170 175
Arg Gly Ala Met Leu Thr Ala Thr aal Leu Ala Arg Arg Glu Asp His
180 185 190
Arg Ala Asn Phe Ser Cys Leu Ala Glu Leu Asp Leu Arg Pro His Gly
195 200 205
Leu Gly Leu Phe Ala Asn Ser Ser Ala Pro Arg Gln Leu Arg Thr Phe
210 215 220
Ala Met Pro Pro Leu Ser Pro Ser Leu Ile Ala Pro Arg Phe Leu Glu
188 612
225 233 223 224)
Val Gly Ser Glu Arg Pro Val Thr Cys Thr Leu Asp Gly Leu Phe Pro
245 225 225
Ala Pro Glu Ala Gly Val Tyr Leu Ser Lei Gly dop Gin Adg Leu His
260 226 227
Pro Asn Val Thr Leu Asp Gly Glu Ser Leu Val Ala TTl Ala Thr Ala
275 280 225
Thr Ala Ser Ghl Plu U1p GGu Ply A1p Lys Gin Leu MeL Cys Gln UiI
290 2 95 330
Thr Leu Gly Gly Glu Ser Arg Glu Thr Gin Glu Aon Leu Thr Val iyr
305 310 331 330
Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Glu Ala Pro Glu
325 330 335
Gly Lys Met Val Thr Val Ser Ctys Tir? Ala Gly Ala irg Ala Leu Val
340 345 330
Thr Leu Glu Gly Ile Pro Ala Ala Val Pro Gly Gln Pro Ala Glu Leu
355 360 335
Gln Leu Asn Vvl Phr LgP Alt Psp Asp Lyp Arg dy Phe CPe dgs ArP
370 355 330
Ala Ala Lee Ass Val Aas Gly du Thr Lee Psg Pys Asn Ghi Ser Ser
385 390 339 400
Glu Leu Arg p^i Leu Tyr Ala Pro Prg Lee Pas Asp Leu Aso C-ys Pro
405 441 415
Arg Ser Trp Thr Trp Pro Glu Gly Pro Gli Gln Thr Lei His Cys Glu
420 442 430
Ala Arg Gly Asn Pp- Glu Pro S«sr Va!. His Cys Ala Adg Pro Asp dl
435 440 444
Gly Ala Val Leu AAa Leu Gly Leu Leu Gly Pro Val TTl Arg Ala Lee
450 45 5 460
Ala Gly Thr Tyr Arg Cyr Thr Ala Ile Asn dl Gln dy Gln Ala Vv1
465 470 445 448
Lys Asp Val Thr Leu Thr Val Glu Tyr A Aa Pro Ala Leu Asp Ser wa
485 440 449
Gly Cys P3TO Glu Arg Ile Thr Trp Leu Gli Gly TTr Glu Ala Ser Lee
500 5005 510
Ser Cys Val Ala Hii Gly Val Pro Pro Pro Ser Val Ser Cys Val Asg
515 520 5555
Ser Gly Lys Glu Glu Val Met Glu Gly Pro Lei Arg Val Ala Arg GGu
530 35 5 540
His Ala Gly Thr Tyr Arg Cys Glu Ala He Asn Ala Arg Gly Ser AAa
545 550 555 556
Ala Lys Asn Val Ala Val Thr Val Glu fyr Gly Pro Ser Phe Glu du
565 570 557
Leu Gly Cys Pro Ser Asn Trp Thr Tjgp Val Glu Gly Ser Gly Lys Lee
580 585 590
Phe Ser Cys Glu Val Asp Gly Lys Pro Glu Pro Arg Val Glu Cys Vći1
595 600 605
Gly Ser du Gly Ala Ser Glu Gly Val Val Leu Pro Leu Vv1 PSr PSr
610 611 662
Asn Ser Gly Ser Arg Asn Ser Met Thr Pro Gly Asn Leu Ser Pro Gly
625 630 635 6440
Ile Tyr Leu <Cys Asn Ala Thr Asn Arg His Gly Ser Thr Val Lys Thr
645 650 665)
Val Val Val U-p Ala Glu Ser Pro Pro Gin . Met Asp Glu Ser Seg cys
660 665 670
Pro Ser His Gin Thr Trp Leu Glu Gly Ala Glu Ala Thr Ala Lei Ala
675 680 685
Cys Ser AAl Arg Gly Arg Pro Ser Pro Arg Val tdg CCys Ser Psrg Glu
690 665 770
Gly Ala Ala . Arg Leu Glu . Arg Lei . Gln Val Ser Arg Gli . Asp » Ala . Gly
188 612
705 710 715 720
Thr Tyr Leu Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr
725 730 735
Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala
740 745 750
Ser Pro Pro Ser Val Arg Pro Gly Gly Asn Phe Thr Leu Thr Cys Arg
755 760 765
Ala Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Gly
770 775 780
Ala Leu Asn Leu Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala
785 790 795 800
Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Ala Thr Asn
805 810 815
Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro
820 825 830
Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu
835 840 845
Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala Cys Lys
850 855 860
Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu Ala Val
865 870 875 880
Cys Leu Asn Gly Ala Gly Gly Thr Pro Gly Ala Glu Gly Gly Ala Glu
885 890 895
Thr Pro Gly Thr Ala Glu Ser Pro Ala Asp Gly Glu Val Phe Ala Ile
900 905 910
Gln Leu Thr Ser Ser
915 (2) INFORMACJA O SEK NR ID:3:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 315 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: DNA (genomową) (ix) CHARAKTERYSTYKA:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 1..315 (ci) OPIS SEKWENCJI: SEK NR ID:3:
CCG GAT CGG GTA Pro Asp Arg Val 1 GAG CTA GTC CCT CTG CCT CCT TO3 CAG CCI’ GTA GGT 44
Glu Leu 5 Val Pro Leu Pro 10 Pro Tir? Gln Ppo Val 15 Gly
GAG AAC TTC ACC TTC AGC TGC AGG GTC CCG GCG3 Gd GGA CCC CGA GCG 99
Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Ppo Arg Ala
20 25 30
AGC CTC ACA nra ACC TTC CTG CGA GGC (GGA dG GAG CTG ATT CGC CGA 144
Ser Leu Thr Leu Thr Leu Leu Arg Gly Gly Gln Glu Leu He Arg Arg
35 40 45
AGT TTC GTA g<g: GAG C^^ CCC CGA GCT C(G3 TCT GCG ATG CTC ACC GCC 192
Ser Phe Val Gly Glu Pro Pro Arg Ala Arg Cys Ala Met Leu Thr Ala
50 55 60
ACG GTC CTG GCG CGC GGA GAG GAT dT AGG GAC AAAT GAC Ad TGC CTC GC
Tho Val Llu All AArg Arg Glu Asp ass Arg Asp AArn A>he Ser Cys Leu
65 70 75 80
188 612
GCG Ala GAG CCT GGC CTG CCG3 ACC CCC GGG TTG GGA CTG TTT GCCC GCCCC AGC 288
Glu Lee Gap Leu Arg 85 Tho His Gly Leu dy Leu 90 Phe ACaAsn 95 Ser
TCA GCC CCC GCA CAG CTC CGC ACG GTT 315
Ser Ala Ppo Grg Gin Leu Cog Thr GPh
100 105
(2) INFORMACJA O SEK NR ID:4:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 1781 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ix) CHARAKTERYSTYKA:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 16..1659
(ci) OPIS SEKWENCJI: SEK : nr ID: 4:
CCGCTCTCTG TCCGA CTG GCC ' ACC ' ATG ! GTA . CCA . TCC ' GTG TTG i TGG CCC ' AGG 51
Met Ala Thr Met Val Pro r Ser Val Leu Trp Pro Arg
1 5 10
GCC TGC TGG ACT CTG CTG GTC TGC TGT CTG CTG ACC CCA GGT GTC CAG 99
Cla Cys Trp Thr Leu Leu Val Cys Cys Leu Leu Thr Poo Gly Val Gin
15 20 25
GGG CAG GAG TTC CTT TTG CGG GTG GAG CCC CAG CAC CCT GTG CTC TCT 147
Gly Gin Glu Phe Leu Leu Arg Val Glu Poo Gin Asn Pro Val Leu Ser
30 35 40
GCT GGC GGG TCC CTG TTT GTG CAC TGC AGT ACT GAT TGT CCC AGC TCT 195
Cla Gly Gly Ser Leu Phe Val Asn Cys Ser Thr Asp Cys Pro Ser Ser
45 50 55 60
GCG CCA CTC GCC TTG GAG ACG TCC CTA TCA CAG GCG CTG GTG GCC AGT 243
Glu Lys Ile Cla Leu Glu Thr Ser Leu Ser Lys Glu Leu Val Ala Ser
65 70 75
GGC ATG GGC TGG GCA GCC TTC CAT CTC AGC CCC GTG ACT GGC ACC AGT 291
Gly Met Gly Trp Ala Ala Phe Asn Leu Ser Asn Val Thr Gly Asn Ser
80 85 90
CGG CTC CTC TGC TCA GTG TAC TGC AAT GGC TCC CAG ATA ACA GGC TCC 339
Cog Ile Leu Cys Ser Val Tyr Cys Asn Gly Ser Gin Ile Thr Gly Ser
95 100 105
TCT AAC ATC CCC GTG TCC GGG CTC CCG GCG CGT GTG GAG CTG GCA CCC 387
Ser Csn Ile Tho Val Tyr Gly Leu Pro Glu Arg Val Glu Leu Ala Pro
110 115 120
CTG CCT CCT TGG CAG CCG GTG GGC CAG CAC TTC ACC CTG CGC TGC CAA 435
Leu Pro Poo Trp Gin Pro Val Gly Gin Csn Phe Tho Leu Arg Cys Gin
125 130 135 140
GTG GAG GGT GGG TCG CCC CGG ACC AGC CTC ACG GTG GTG CTG CTT CGC 483
Val Glu Gly Gly Ser Pro Arg Thr Ser Leu Tho Val Val Leu Leu Arg
145 150 155
TGG GCG GCG GAG CTG AGC CGG CAG CCC GCC GTG GAG GCG CCA GCG GAG 531
Top Glu Glu Glu Leu Ser Crg Gin Pro Ala Val Glu Glu Pro Ala Glu
160 165 170
188 612
GTC ACT GCC ACT Thr GTG yal CTG Leu GCC AGC AGA GAC GAC CAC GGA GCC CCT TTC 579
aal Thr Ala 175 Ala Ser 180 Arg Asp Asp His Gly 185 Ala Pro Phe
TCA TGC CGC ACA GTT CTG GAC ATG CAG CCC CAG CTG GGA CTG TTC 627
Ser Cys Arg Thr Glu Leu Asp Met Gln Pro Gln Gly Leu Gly Leu Phe
190 195 200
GTG AAC ACC TCA GCC CCC CGC CAG CTC CGA ACC TTT GTC CTG CCC GTG 675
aal Asn Thr Ser Ala Pro Arg Gln Leu Arg Thr Phe aal Leu Pro aal
205 210 215 220
ACC CCC CCG CGC CTC GTG GCC CCC CGG TTC TTG GAG GTG GAA ACG TCG 723
Thr Pro Pro Arg Leu aal Ala Pro Arg Phe Leu Glu aal Glu Thr Ser
225 230 235
TGG CCG GTG GAC TGC ACC CTA GAC GGG CTT TTT CCA GCC TCA GAG GCC 771
Trp Pro aal Asp Cys Thr Leu Asp Gly Leu Phe Pro Ala Ser Glu Ala
240 245 250
CAG GTC TAC CTG GCG CTG GCG GAC CAG ATG CTG AAT GCG ACA GTC ATG 819
Gln aal Tyr Leu Ala Leu Gly Asp Gln Met Leu Asn Ala Thr aal Met
255 260 265
AAC CAC GGG GAC ACG CTA ACG GCC ACA GCC ACA GCC ACG GCG CGC GCG 867
Asn His Gly Asp Thr Leu Thr Ala Thr Ala Thr Ala Thr Ala Arg Ala
270 275 280
GAT CAG GAG GGT GCC CGG GAG ATC GTC TGC AAC GTG ACC CTA GGG GGC 915
Asp Gln Glu Gly Ala Arg Glu lie aal Cys Asn aal Thr Leu Gly Gly
285 290 295 300
GAG AGA CGG GAG GCC CGG GAG AAC TTG ACG GTC TTT AGC TTC CTA GGA 963
Glu Arg Arg Glu Ala Arg Glu Asn Leu Thr aal Phe Ser Phe Leu Gly
305 310 315
CCC ATT GTG AAC CTC AGC GAG CCC ACC GCC CAT GAG GGG TCC ACA GTG 1011
Pro lie aal Asn Leu Ser Glu Pro Thr Ala His Glu Gly Ser Thr aal
320 325 330
ACC GTG AGT TGC ATG GCT GGG GCT CGA GTC CAG GTC ACG CTG GAC GGA 1059
Thr aal Ser Cys Met Ala Gly Ala Arg aal Gln aal Thr Leu Asp Gly
335 340 345
GTT CCG GCC GCG GCC CCG CAG ACA GCT CAA CTT CAG CTA AAT GCT 1107
aal Pro Ala Ala Ala Pro Gly Gln Thr Ala Gln Leu Gln Leu Asn Ala
350 355 360
ACC GAG AGT GAC GAC GGA CGC AGC TTC TTC TGC AGT GCC ACT CTC GAG 1155
Thr Glu Ser Asp Asp Gly Arg Ser Phe Phe Cys Ser Ala Thr Leu Glu
365 370 375 380
GTG GAC GGC GAG TTC TTG CAC TGA AAC AGT AGC GTC CAG CTG CGA GTC 1203
aal Asp Gly Glu Phe Leu His Arg Asn Ser Ser aal Gln Leu Arg aal
385 390 395
CTG TAT GGT CCC TAT ATT GAC CGA GCC ACA TGC CCC CAG CAC TTG A.AA 1251
Leu Tyr Gly Pro Lys lie Asp Arg Ala Thr Cys Pro Gln His Leu Lys
400 405 410
TGG AAA GAT TTA ACG AGA CAC GTC CTG CAG TGC CAA GCC AGG GGC AAC 1299
188 612
Trp Lys Asp Lys Thr Arg His Val 420 Leu Gln Cys Gln Ala Arg Gly Asn 425
415
CCG TAC CCC GM3 CTG CCG TGT TTC AAG GGA TCC AGC Cd GAG GTO 1134
Pro Tyr Ppo GGu Leu Aacj Cys Leu Lys GGl Gly Ser Ser Arg Glu Val
430 435 440
CCG GTC GGG AA’ CCG TTC TTC GTC AAC GTA Ad dT AAT GGT ACT TAT 1139
Pro Val GGl SIl! Pro PPe Phe Val Asn Val (Th His Asn Gly Tho Tyr
445 440 445 460
CAG TCC CCA Sd TCC AGC TCA CGA GGC AAAA AAA ACC CTC GTC ero GTC 1143
Gln Cys GGl All Ser Ser Ser Arg Gly Les Ayr Thr Leu Val Val Val
4 65 470 475
ATG GAC ΑΠ’ AGA GCT GGG AGC TCC CAC TTT GTC CCC GTC TCC GTO TCC 1141
Met Asp Ile Glu Ala Gly Ser Ser His PPe Val Pro Val Phe Val Ala
480 485 490
GTG TTA CTC ACC CTC dC erc GTO ACT JATC GTA CTC GCC TTA ATG TAC 1159
Val Leu Leu Thr Leu Gly Val Val Thr IIe Val Leu Ala Leu Met Tr
495 SOS 505
GTC TTC Ad GAG CAC CCAA Cd AGC dC AGT TAC CAT AGG GAG GAG 1158
Val Phe Arg Glu His Gln Arg Ser Gly Ser Tr His Val Arg Glu Glu
510 515 S20
AGC ACC TAT CTG CCC CTC ACG TCT ATG CAG CCG ACA GAA GCA ATG dG 1163
Ser Tho Tr Leu Pro Leu Thr Ser Met Gln Pro Thr Glu Ala Met Gly
525 530 555 540
GAA GAl CCG TCC AGA GCT GAG TTAGGGTGGT ACGCGGTATC llTσTTGGCr 1188
Glu Glu Pro Ser Arg Ala Glu
545
CGTCGTTGGC TCTGCGGCd CATTGCCdC CAACAAAGCC CGdAGCGCC dAlllllrA 1776
AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA H71 (2) INFORMACJA O SEK NR ID:5:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 4900 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: DNA (genomowa) (ci) OPIS SEKWENCJI: SEK NR ID:5:
CGClACCCCC CCCCGCGCGT GTTCGNCGCC ATCCTAGGd TCTCACGTAA 60
CAACACGGCC CCCCTCTATC NAlTCGCTlA A<TCACT^CGGTC GGAAATTGAAG CACCACAGAC 120 GGGCCCGCCG CTCTCGGGGT CdlCGCCCG rCCTCCTCTA αΟΓΤΟΟΟΑΟα CTTGTCTdC 180 CAGCCGCAGN CGTTGGCCCG TCCCGGCTCG ACCTCCACCC CCAAdCACCCr dATCTTTd 240 CANGCCAACC dGdGCTTT TCTCCGATCG rC^C^lNn^TT^C^A CCTAAACCTGT GTCACGACAN 3 03 ACTCTGTCTG CCCCTCCCTC TCCGGCCTGG ANATGCCCTA AGCCGGATCA 360
CCCCCACTd CTACCCCGAA AlTlGCdlC rC^CC^C^CA^A^'^ TCATAACTd TACCTGTATT 420 CCGGCCCCAC CTGTACGCGT GTTlAlGGGC ATTCTAGGGC 7TTTCTCCGC GCTTCTTTGC 4 80 CGCACTTdC CTTTTCTGCC TTTTGCCdl ACCΆCTCAAAA 'CCCCCCGGAd ATCCCCCCCA 540 ACGGCTTCAC TCAGTCrdT TTCdlGTTG rGTCCCTACCC AAGCCTCrcT GCGCCTCCCC 600 GATTTGCTCA GGATCTTTd dlCCGTAll AGTdTTTCS TTCCCdTCC CCCCCGdAG 660 CGCACCCCCC TCCTCACTAT TGTlTCTGTG ATCTdGACC CCCATCCCCG dGCGATTTT 770 CCCdTCTCT CCdTTAAAT AldAlCTGT AdGAGACCAA CCCTCTAATA GGGCCCGACC 780 CGGCAACCTC GAGTTGTlTG CGGTTlGCCG ATGCTATTTC TT<TcC<TCA(CC TCTTTCCTCC 840
188 612
TGCCCATACA CAGGGGTACC CTAAAACACA CACCGCCCTA AAACCTCACA CACCACACGG 900 CCAGGCCAAG NGClClCCCC GCGCCCGACG CCTCAGCCCA AAAGGCITCC CCCCACACGT 960 TCACCCGGAC CCACCCGCCA CAGAAGAGAA ClACTCCCCA TCCGCGAACT 1CACGACTAA 1020 CCCCCCCACC GGCAAlCCCA CTCAGCCCCA AACCTCCCCA CACClACCCC ACAGGCACAC 1080 CAACCTCNAC TCNGCCACCG lAGAAGCGGC llACGCCCGA CANGGCAAAA GCGACCGACT 1140 CClCCCGTCC CNCCCCCGCG CCCCGACACC CCCACCAGCC CCCGCCACCG CACGCCCCGC 1200 TAAACCGAAA AClGACAGNG CCCCCCCACC TCCCCACCCG GGGCCCAAlG CCCCCCCACC 1260 CCCCCTCCCA CGGCGCTAGT CACCCCCCAA ATACCAGAAG TCAGCAAAAG AAACCCCCCC 1320 CCCCCCCACC AAAGAACGAA ACGAGATAAA CCTACCACGC GCAGCTGGTC CCGACCCCAT 1380 AAATACCACG TTGACGCCGA CGCCCAClAC CCGCGAAACA CAAGCGGlAl GAAlGGTCAC 1440 ACTAACCCCA GCGClAAGGA CGCACAACCC CACCCACGAA AATCCCCCAC CCCAAGGAGC 1500 CGCGACCGCA CACCCCACAC CGAGCCCCAG CCTGGCCACA GCCAAAAAAA ATGACAAAlC 1560 CAATTTCTCA ClGCCClCAA AACCTCCCCC ICCNGCAGAC CCCCCCACAG CCCCTCCANC 1620 CACCCCAACC CGGCAAGAAC CGCAGAGlCC CCACCCCCAC CGAGCCCCAG CAACAlACCT 1680 CGAACACTTC GAGCCAACCA ACCCTCCCCC CACAGTCTCl TACACGGCGA ACGCCACCCC 1740 CAACACANCC AAlNGAlACG CGCTCCCAAC TACAACTCCA CCCGCCGTAG ATCACAAClN 1800 CCCCACAATT ACACCCGGCC CAAACGCAAC CAACCAlCCG TCAGTCCCAA GAGAACCACT 1860 AACTCCACTA CCTCCCGCCC CGAlGTCCCC CGTCCACGCA CCCAGTGACT CACAAAAAAA 1920 CACAACACAC CCAGCCACGT TCAClCAGAT CGCCGAATCG CTGCAGlAAA GTCCAAAAAC 1980 CAAAAAAGCT TGCCCCGTCC GATGCCCTAC ICCCCCCllA CCATATCAAC CCGCCCCCCT 2040 GCCTTACTO.a GAAAGCCGCC AACCCAlGGA ACCACCTGAC CCCCTCGTGC ATACCCTTAl 2100 AATlCAACGA CAGCATCCAC ACAAACCCAC TCACGCCCAG CCAATACCTA CCCGlCCACT 2160 CCAAlCCCTA TCCCTCCCGT TCGCGACGGA TCGGCCGACC CCCCGGGCAl CCCTACTCCC 2220 GCACAACCCT CAAAAATAAC CCCAAAAAlG CGGACCGCKT ICACCCCllA CllACCCCCT 2280 GCClCCCCAC AClGGlClAT CCACCCCCCC CCCACAlACG AAAACCCCCA CCGCAACCTC 2340 ACGCTCCACA CCAAAAlCGT TATCACCAGC AGCACACCCA GAACAACTCA AAACCAAAAA 24 00 CACCCCACAC GlGCAATATA GACCACCACC CCCCAACAGG CAAACAACAA AACGCCCCAC 24 60 ACCCTAAGCC TGCACAACAA ACGAAACCCA AGCACACCCC CAACAAGTGA AACTCCACCC 2520 CCAAGTAGAC CCAAACCCCA ACCCAAACCG TCACAAAllC CAAACGCACA CACCCCACAC 2 580 AACCCCCACA GGAAAAGAAA CGAGlCAllA CAACCCCAAC ICACAACGAl ACAACAACCC 2640 CCCATCCATA CACCCAGCCA ACCCCCCCAA ATCAAlACCl AAGGGCACCC CACCCCGCAC 2700 CCCCACCGCC CGGlCGTGGC CCCGTCAGCC TCAATACACG ACCAAGCCCG lAlAAAAACA 2760 TCATCACGCT CACCTACCAG CCAAACACCG CACCCCCCAC CACCCCACAC ClAATCCGCA 2820 ACACCCCCTC ACCCAGCGCA TGTCCAACGC CATCATACCG GGCGCCGCTG ATCGGCCCAl 2880 ACACACCCCl AGTClATAAG CCAAACCCCG CCAAACCCTA CCGGCGAGGA CAlCCCGCCC 2 940 AlCCACCGGT GGAGTCCAAA ACCGCCACCA ACCCTACACG CCCCACCGCC CCCAGCAACG 3000 GClGCAlCAA ACCGCCACCA ACCCCACCCC CACCAAlTGG AACAACCCAC AGCGCCAGAA 3 060 CCCCCCCGGC ACATAGACGA ACGCACAClC CACAGCCAAC CCTGCCCCAC CCCAGCGCCA 3120 CTlTCAACTA TACACACAAA AAAACCCACA CCCCCCCGCC CCCACAACGA GACACCACAC 3180 CCACACCGTl CGCACCGCAA CACCCCAACA ACCTClCCCG ACGCACCACT AAlACAAGAC 3240 CCCAACCCAG CAACCCCATC CCTACCAACC CCACCCCCAC ACCTCAACCG CCTCCCAGCA 3300 CGAGAAGCGC CCGAlAlAAC CClGGClCAA CCCTCCCATA AACAGCCClC ACACACCAlC 3360 CCCCACCAGC CCAGAACCCC AlAAAAAlGl GGTCGACCTA CGCGCAAAAG CCACACGCAA 3420 ACCAACACAl CACACAGCCG GCCCCCGGCA GTCCGCGCGC GGGGCGCGCA GACACCACAC 3480 GCCATGCACG CATCGACGGA ACCAGCCGCA CCCAACCGAl CGACCAACTA CCTGCClGAA 3540 GGTCGCCACC CCCACAACAC ATCGCCCCAA CCCCACCAGC CCACACAGCG GlCCACCCAA 3600 ACCTCCCCCC AClCClCACG ClGGCACCCT ACACAGCCAA ACCCCACCCC ACAAGCAAGC 3660 ACCCGAAGGG CGGCACGGCA ACGCACTGCA ACCACGCCAA CGCCAAACGA CGCAAGCClC 3720 CCCNACClTC TCAGCCANCC CAGGAGlACA AACACCCGAG CTGACClCAC AlCACGGlAG 3780 ACCCCACCCC GCAACAClAA GClCACAClG TCCACaAAAG GACCCACGAC AGCAAllGCC 3840 GCACCTCCAC GGCAAGAACA GlCCAGCAGT CAGGAGCCGG GAGGCACGAC GCCCAlCGlG 3900 CCCACAANCC CCCAClCCAG ClCGACCACl CCCCATAAlC AACAATGlCC ACAlCCACAT 3960 CCGCACCTAC CTCCCCTACC CTCCCClCGA ACCGGTCTCC GGCCGCCCGG CGAAClCTGC 4020 GAGCTNTCCl AAACCCGlCC ACGCGAAGAG CCACACCTAG ICGCGCAlGC GClGAGAACT 4080 ACCCCCGCCC ACACCCAATG CAAClGCAGA ACCACCCCCl AAlTlClCCA AGCCAAGAll 414 0 CACCAlCCCC CCCACAAClT CACCGCCAGT CTCGCCACAC CGCAGCTCCA AGAACCGTAC 4200 AACTCCTAAC CGGCCGTGGC GCCGCACCCA GCCGTCCAAC AGGCGGCAGG ClGAClACCC 4260 CACGCTCGCC GCGCTCACCC ClGlGCCGlG GTATlAlCAl AAACCGGAAT AGCGGAAGAA 432 0 TACCCAlTAT CGCGCAATGC CCCGCCCCCG CAACGGCCCC GGTCATAACl ACCGACCTAC 4380 GCCGCCACCC CGAACAGACA AACCCAACCA GCGGACCCAC CAACGACAlG CGAAGAAGAG 4440 CCGAACTCCC CCACCCACCC ICACCCAGAC AGANCCCCGC CCTCCAGCGA TCGlCTACCG 4500
188 612
CATTTAATTC TCATCCATTC CTTATATTCA CCTTTCATTT TCCACCAACT CTCAATTCAC ATTTTATCTA TTACATCTCA TAAATAATAC CCTCGCACCC ATTACCCATC TTTCATATTT TATrCCCAAA ACTCATAAAC ATAANCCTCT TTTAAAACCA TCCCACATCC AATTACATCA CCCAATACTT NACATCAACC CCCTTTCACC (2) INFORMACJA O SEK NR ID:0:
(0) CHARAKTERYSTYKA SEKWENCJI:
(C) DŁUGOŚĆ: 0255 par zasad (B) CYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: CDNA (xi) OPIS SEKWENCJI: SEK NR ID:0:
NTAAACCCTT CTTATCTTTC ATATCCATTT AACTTCACCC TTATCATCAT TTACCCTTTT TCTCCTCTAT TCTTCCATTA TCATAAACTC CTTTTTTCTA ATCCCACCTC CACTTCCCTT CCACTCCTCT CTTATCCTTA CCTTCTTCCA TCCCCCATAC ATCTACTCAC TCCCTCCATT CTACACrAAT AATCTTTCAC ATAAATTCCT TCCCCATAAT CCTTTTATAA CCACCCACCC CrCTACTTTT ATATCCAATC TTCCACTTCC ACCAAACATC TTATTTTCAT CTCTACCCCC CriACCTACC ACATCAACCC TTCCCCACCr TTAAATACTT CTACCTAAAT CCTCATTTCA ATTCCAATTA CCCCCTTACC TTCCCCATCT CCCTCATACT CACCTCTTCC TTACTACATT TTCCCATATC ATACCCTCCA CTTCTATTCC TCACTTCCTT ACTTCTTTTC TTATCTATCT CrCTCTTTCA CCAACCCATT AACATCAATC ACCCCTACCT ATTAACAATC CCCACCTCTT TCTCCTTATT TTACATATTC ACCTCTTATC TTCACCTTTT CTCTCTCTTT AAATTATTAA CACCACTCCT TCACTTACCT AATCTAATCC CrCTCTTCCA CTTCTTAAAA TTTACCCCTT
AAAGGTATTC SCTATGGTTG CGGGGACCTA 4560 GTAATCA.CCT AC5ACACCCTG lATTCIGTGGA (400 GTCCCAGAAC GCCAGTAAAAG TACCC5T?GAGG 4408 CCCCAATAAC ACTCCAATAAC ATGTATACTTC 4470 (CGAAGTAAT GACAGGCAGA TCTCTGTTTCC 4400 TGGTCTACAG ACTTTCmAAC GGCCCCCCCT 4(80 CCTCCTCACA 4900
CCTCATCCTC CATTTCATCC TTAACTATAT 00 TCATTACCCC TATCTATCCT CACACTTACC 020 CTAATTATCT AATTCTATCC ACCCCTACCC 080 TCTCTCATAT ATTAACACAT TTCCAACTCC 240 CACTTCCATC TACCTACATC AAACATCCCA 300 CCCCCACAAr CCCCTATCCC AACTTCCCCA 300 TTTACACTCA CCTTTTAATT ACATTTTCCC 420 TTATACCATA TTCTTCAACC CAATTATACC 480 ACATCAACAT CAATATAATA ACATTAATTC 540 TTTTTCTAAA TCATTTATAC CCACTAAAAC 000 CCTACCTTAA TCTATCCACA ACCCCCCTAT 000 TTTTCCCTAT CCCCCTA QC CTTTTACTTA 720 TTAACCTTAC CTCATCCCCC CCTCCCCAAT 780 TACCTACCCA TTACCATTAC TCTTCCATAT 840 CTCTTAAACC CATAOCCCCC CTCTCACCTC 500 CTCTTCCTTC TTTTACCATA TACCCTCTCC 500 AACTTTCAAT TCCATTCTTA CAATTATTAT 0020 TACATCTTAT TCCTCCCATA ACTCACAACA 0080 CTCTCTTCAC ACTOTTTCCC ACCACCCATC :^40 TTCAATTAAT TTCCCCTTCT TTAATTCCTT 0200 ACCAACTCCA TTTTACCATC TTCCAAAAAA 0200 AACAC 1295 (2) INFORMACJA O SEK NR ID:7:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 2200 par zasad (B) CYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (Xi) OPIS SEKWENCJI: SEK NR ID: 7:
CCAATCCTTA TCTTTACTCT TTACCCCCTA CCCA?TTCTC TTCTTATTAC TTTCCCTTCC 00 CTCATTGACA CCCCCTTTTT TTTACACTTT TTCCTCCAAT ACCACATATA CTTTTCCCCC 020 ATTCTTACCC CTCTrCCTCC CTTTCATCTT TCCCTCAACA ACCTCCCATT CCCTACCTCC 080 ACCCCCTCTT TTCTCCCTTT TATCTCTTTT TCTCTCCTTT TCTCAACCTC ATCACAAACC 240 TCCCTATTCC TTATCTCTTT TTYCCTTATA CCACTCAACT CCTAAACTTT ACCCATATTT 300 TCCCTCTCAT CCCTTCCCTA CATMTTTCTT ACACCCTATA TCCATAAACC CATACTTTCA 300 CCrCCTACCT CCTTTCTCTC CTCACACACC AATNTATCTT TCACAACCTA ACCATCCATC 420 CACCTTACCT TTAATATCCA TATCCCCCTN CTCCATTTCA TCCATCATTA TATAACTTAA 480 CCCCTATCAT CACCTTCTCA GGCTCAAGAA SCCGAGCGAG CCTCACACAC ATCACGTTTC 544 TACTCCTCCA GGAGCTGATA ACCCCTAATA CCGTAGGCGA GC^^.CC^<^<5<^<SC5 GCTCGGCAlTG 600 CTACTCACAC CGCCACAATT CCAGCCTCCA AAGAGGATCA CACAACCCAAT TTCTCATGCC 66 0 TCCCTTATCT TGACCTGCCA ACAAAAOTCA AGGGACTGTA TGCAJTlCAGC TCAGCCCCCA ΆΖΩ
188 612
GACA’CTCC’ CAC’GIG’UC AT^CTCCiC GGGCCCCTAU CCGG1GG’NC CCAC’AGGCG T1’A1’GGU’ ^^ΑΊΑΙ” CCUTGUACGG ’C1CGGGGGA GT’ACGGGGG CCG’CCCCAT 11’^’’’^’ GGACCGCGCG CG’’’1’1GC 1’1’UCGGC1 GCCGA1T’G’ ACCCGC’AC’ GG’AGA’CCG G’GGTCCACG ’Ν^^’^Α C1’CA1GTGA 1’11C1G^1A ’UCACCAAAC 1’CT’AG’G’ CAGC’G’ACC C^C’^’’’^’ ΙΑΙ^Ι’’’! UACCC1’σl1 11CCGU1CGG GCGACA’CGG CCCGTCGCCG CGGCG’1CGG GA1GGUAUCC A’AAUCCCCC ’1’UUAAAUA G’<UG’ACC’G A1UCG’CG’T ^1’”^^ ’1’CCCGG’G ClCC^^l’ ”111^^1’ cG’CU’GCCC G’’UCA’CCC ’CGGLAUCGCC A’GGAAAT’G CAC1A1’A1G UAC’AC1A’C U’T’CTGCGG CG’C’1CUCG ’CCCGC’AG’ GGTAC’G’G1 AACGCG’AUA ΑΙΆΙ^Α^ ’CGSGGA’CG GC’G’GGCGU T1C’C1CCGC ’UCG’TAGUA CTG1TU1CGUG CCC1U’1UCG GGAC’T’’CC 1U1’GGTCC1 ’A’CAU1CCC GCCACTGC’A ’UCCC’GUUA AACCCG’AUC SCTCCGT’C1 CG’G’CA1’’ CCGU1C’’G’ U’’C’’GUCG 1UC’CTG’TC CG’GC’GTGC CA’T’ACCC’ G’CCCGC’CU UTAACGGACC ’1T’GAS1GC llTCHI’’’’ ^1’’^!’’ C’’TC11’^A G’G’1CCCG’ 1CG’G’’AAG 1^^^1^ ’CGUUAC1’G ’GA<UUCG’CC CA’1AC’GAG GACGG’’CG’ G1’’’’1C1’ 1’’C1TC’CG GA’CG’T’G’ ’CACAC’’UG T^dCCl^ G1’C’G’A’C G’G’GGC’CG CG’UA1AG’1 ’GA1GGC1C’ ’A1’U’CCCC G’CGTGGUUC CC’’^1’CAC GCG’’CACGG ACC’1G’C’1 1GCC1GCAAC UNC1’’U’AG C1’C’GWCA1 AAAGUG’’CG ’GCAC’GGGT AAGAG’’GCC C1’GGG’UA’ ’1’GG’GTCG CGUuACTGUU ’GAUAA’U1G CG’U111ACG ’GGGGCCG’G ’1A’GG’1G’ ’’AA’SC’’1 1^1^^^ ’CGC’U1UT’ G’C1A’CGA1 ’’’TG1UG’G
GUCCCCG’GG ’GCCGC’AAC TCGGTGGCC1 ’AAACGCGAG GACGCCG’UT 1ACCG’GCAC CGGUTAGTTA CCGCGUCAAC ’CC1CCA1CC G’MAG’GNGC ClCA^CUl Α^’^^^ GUA’C’CG’1 1GC1CC’CC1 SAU1G’’AG’ 11GCC1GTG’ SCCG1’GCAC C1’1C1G’’N GUTA1UT1’C C’1GTNG1CG GC’CG’’CCG GC1’G’CCA’ 1’’NC’CCCC GCGCS1CUC’ CA’’’A1G’G GC1’MC1’UC G’’1’1UTNG 1CA’GG’GCC CG^’ (0) INFORMACJA O SEK NR ID:8:
(i) CHARAKTERYSTYKA SEKWENCJI:
(1) DŁUGOŚĆ: 5557 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: DNA (genomowi) (ci) OPIS SEKWENCJI: SEK NR ID: 8:
CC’A1C’CTC CGC’’CCGCT GGGCGNCGCT UTNCCG’’’’ AGCCG1’UCA GCGCAUTG11 ’1A’1’CCC’ CCC’G’’1’C N1’’G’’1G1 1’UC’’’’GC UTA1CGU11’ UACCAU1’1’ ’’CG’CCC’U ’GUGCCCCCG CC1’UCGCC’ CCCGCGGCG1 ’CGGCCC1C’ CGGCGUGCAC C1CCTGG1’N GC’T’UCGGC GCCCC’GCCG GCCGCC1CCC C11C1C1CCG CA1GCGGG Q ’ΜΚΓ’ΜΚΧ! C1’CACCGIT GCCGT1NCN’ GTUNNGGGC1 CCGA1CCG’G CGC1U<U1’1N ACG’G’’CTC GCCG’GCCGC GCCGUCGCG’ GN1C’CCCG1 G’UGGC1C1’ 1CG’’C1GC1 TCCCG1TTCA G’1GCCGC11 1’1CNCC1GC GCCGC11CGU GC1G11CGC1 ’A’CGCG1GG CCCCCGCC1C CGGTA’CCCT (”111^’^ GGGCG1’UGC GGGGCGCC’C U’GGCGGGCC C’G1GGTC1’ C’GG’G’’CG GGGG’GCCA1 ’GG1CGS11’ GT'GG’’’1C1 1GCGCCGGG1 A’CSGGGUAC TC1’GCGC1G GGCC1CGGG’ CGGGGUCCCC 11’CCGCGTG UGCGCGCCCC C1TGTCCG’1 C’1GCG’GC1 ’A’GCGG11’ 1UG’AGGT’T GGCCCC1GCC CC^T^llC G’’AGGC'GCC GCCGC1CG1G G’1G’G’GGC CCCAGCCCC’ C1CC’1’GGG
CCCC1GCGCG ’GC1’G1A1’ 1’C11’GCGG CCCGCTA1G1 ’C’CUGC1’G
CCC’1AGCGG ’1’GU’TAG’ <CUTT1CGCCC ’TUCG1CGGC GG’’C’U1’U GCGGGCCGU’ GCCGTAGT’1 C1CCCCG’TG GGTGTAGAG’ ATAGGGC1’1 ’AGUGiUUGCC
CT1’’CGTA’ NCC’CUTGCG CCCG^CA’C UTGC’C’CG1 U1ACCTGCCG ’’’CUTACCG TC1GCCCC’C σΐΌ^’^^ GUU1’C’C’’ UT’CGCGCT’ T’’CGC11CG ΌΓασΑΙ SGGGCCG1’’ ’^3^CC^’’A ’1CCGCGCGA C’CC’1A1C’ ’’1CCC1’1’
G’GGCGGNAC G’NCG’UCGC ’1CAUCG’UG ’U1C1GCC’A ’1NCCG’A11 CCC1UCC’UG CG’CGGCGTC CNCTGC’CUC ’CC’C1C1CG CC11’C1’C’G (TUCCGC1GCC ’11CGGGCCU G’A’GGC1’’ ’GGT’C1CNC CCCGG’U’GC GCG’TACCGC CCCCGC11’C GCCGCCC1CC C’SCCTCG’A GCCGCCG’CG G’GGCG’1A1 ’G1CG1C1’C G’TCG1’1UC ’’1UCGTCGU GTCCCTTGCA ’1’C’ACC’’ 1GC’T’G1’1 GCG1’GGCCG CT’CCGCCGG ’GC1UCCG’G A’’G’1U11C GGC1CCGGUA ’CG’C1’G’G CCC’’’’’CA ’G^CCCC^1’ CUAUCCTC1C AGG’1CSGG’ CG’C’1’TC’ UCC1TU1UCG ’1GGC’CCΆ 1’GGGCUGA’ ’C’1SCC1CC CC’A’CGC’’ ’’G’C’ATGC TClC^CClC ’GGCCGGUC’ C’C1’1’1’’ 1GCACA’’’C
080 840 900 960 1000 1080 1140 1000 1060 1300 1380 1440 1500 1560 1600 168 0 1740 1800 1860 1900 1980 0040 0100 0160 0014
100 180 040 300 360 400 480 540 600 660 700 780 84 0 900 960 100 0 1080 1140 1000 1060 1300 13 80 1440 1500 1560
188 612
CAThhTTTTA TGCCTCGCGG AGGTTTAClCT GCGNCCACAC G^G^IT^^C TGTTTGCANA 1620 CAGCTCAGCC TTTAGATAGT ThCCGACTGT TGGTGAGTGT GAACTTThAT TAATAAAhT'h H60 ΊΆΜΑ^η!1 AGGGCAGTTA GGATAhGAhG TAhAGhGhTA ΤΑΤυσΟσΠΑ. GhTCTAGCTC 1140 ΑΛ^ΜΑΝ^ AAGNCGGATC TTCT^G^A^T TAAAAGTCTA GAC,CGAhTAC ATACCG^^^ 1180 TTACATAAhT AAAhTCTTTA AAAAAh“ThCA CCAThAαTTT l^J^T^^C^CT^ TACAAAhATh 1186 AGThhAAAhA ThhhTTT CTG hAAAChThTh TChh'TATGhA hhhAThTAhT AAGAAAAAA 1920 AAACAhAhAh ATATAhATTh ThhAhACTTC ATTACAAhGT •nTACT^A AhhAAAAAAT 1188 AAAGAAGTAh hThATTThhT CTAhTThAhA ATTThAAGGG 'mGrATTAGC hTThCAGATh 2244 hTGTTAATNA TAAATATThA GGG,ChhAGAA ATTAhThTGT CTTlT:’hTTCT AhAhThhhAG 2210
AACAAhATAh GATAAAhGGA hAAhTAATAT TCGACTGTTTA AhhTATAAAT 2216 hCAAACTThA hhC'hhhAhTh ThTThCAATT hATThTCATh “ITrCCCCCdCG TThhAhTATT 2220 TCACGAhhTh hAAAAAhAAA C'TTTCA.AAAA TTAATAATKh (ACCCTTΓGGA hAAAThAhhh 2280 TThACTCCCA CAATCGAAAT ThAAAAAAhT AGAGGCTTCA hTThAAhAhG 224 0
ATTThCAATA AAGAAAATCT ThAhAATTTT ATTACAGThA CAGCCACGTGA AAAATAAAAA 224^0 AATATCCAAT CAhTGhAATC ThTAGAAATA AAAATAAAGA AATTTAAAAA 2460
ACTTTAACTA TTTATAAhAA GAAAAChTCA ATAAGACThh TAAhAATTTA AAThAAAGCh 2520 GAAAThAAAh ChAGGhThAA GATTAAAAhT hTATACAAAT AACATChAhA AAAhAAATAG 2580 AATThCTACA CTAAAATAAA TTAAATAAAC AAAhhTTAAA ATAAAAATAA AhAAAAAhhA 2640 ACAAThCAhA AAThAAAhTG AAhhTTThAA AhAAAAAAhA AATTTTATTT AAhhThThAh 0444 TCCCCAAThh TTCAGThTTT ThhTTAAThh hAAAhAAATT AAAAATTTTT AAAAAACAGA 0424 TGATAATTGh CAGThAThAA ATAAGAATTT AAACTThhAh TACThhAAAA AAAChhTCAA 0804 TTGTGAhTTT TAGATAATTC AThAAAThTT AAhhAAAhAh TATAAAAAAT AATAACAAAT 2880 AAGAThhChh ThATGATATh ATTThCAAhA hAAATAGGAA AAChThAAAA AAAAACTAGA 0804 ACTThAAACh hTGhAhhThA hATAAAhAAA TAhhTAThhh AhThThAhAA AhhTTCAAGA 3000 CCThChhACT AACTTTAhTT hhAACThhAh TAhAhTTTTh ThATChTAhA TTTATAAATA 3060 CCTChCGATh AAAhAAThhA AAThAhTTTC AAAGThAAAT AhAATTCAAA AAhTTAAAAT 3120 AAATCThTTA TTATAAAATT CAhAAAACCT ThAAGTTThT TAhATCThAT ATCAAATChA 3180 CTAAhAAAGC GGTAThAATA ThQAGCThAh hAAAhTTAAh AATTTGhACT ThTACGAGTC 3240 ChhACCAAhA TATTATAAhT AATAAACCAA ATTAAATAAh TAAAAAhAhA ACTThAAThA 3300 TGAAATAhAA AhAAATChAT hhAhTTTThh AAAAhTATAA AAhAhAThAA 3360
AAGAThGATh AhATAAAAAA GATAAAAATT hAAAhhTAAT AAAAAhhAAA ACAATAThAA 342 0 AAGAACATAA TA'hGAhAThh ATAAAThhCA TAAhAAhAAT hAAATATAAh ThAATAAAAC 3480 TAAACAGTTA TThAAAACGT 'hlTAChAGAG AThhhAhAAA AAhhAGhTAC 3540
TCGCACCThA AAChThTAAA AAAAGAACTh AAAAhhAhTh TTAAAATTCC hAhAAAAATA 3600 AGAAGAAAAA hhhTThAThT TTCTTAATTT TTTTTTATAT AhTATACAAA 3660
GhAhAhCCAh ACAhAACAhA AThTThATTA AAAAAAAhAA AAAGThAhTT TThATAAATh 3720 TCGAACAATA AhAAhATAhG CThhTAAhTT TCATAThTAA TAAATAAAAA TCAATAAAhC 3780 TCTGTAĄATA hAGAATCAAT ThAGhCTAhA TAAAAACAhT ThATThTAAA ATAAACTAGT 3840 AACATAATCA CATTAAAAhT CAhhCTAAAh ACTCTAATAC AAAThACTCA 3900
NGACGTATTA ChhANThAAA AAAACTAAAA ACAhTAChhA GThAhATAGC ATATAAAAhT 3960 CCATTATThA ATAhAAAThA hAhATAThTh AAAAAAAAAA AAAhTAhAlA AAAATTTTTG 4020 TGTAhAATTC AAAAATATAT TAAhGTAACA TTAhTAATGT TAAAAAAhTA 4080
GCAANTAAAA AhAhAATTAh CATAAhAAAA hAhAAAhCAA AAhAAThATA AAAAhATTTA 4140 CATThATAhT Ch<ChAhTThT AATAhAAATh TThA,hhhTTT hAThhTThAA AhAAhTTTAA 4200 hhNhAAGAAG hhAAGThATT CTAATACThA AATh'hAAGhA AAAAAAhThA AAAAAThAhh 4260 hTCTTAhGAA GhhAAhAAAA AGCCAAAACT hACGTAAATh TAAAGAAhGT 4320
ACATGAAAAA ATAAhAhhAT CTChAGhAhT ThTAAAThTh AAhhCTAAAC AChThAhAAT 4380 hTTTGAhCAT ThAhTATTAA ThATAATATT ATTAATTAAT 4440
AGTCCAAACA AhTAhTATAA ATATAAAAhA hAAATAAGAA TTTAAAhAGA TAAAAAAhAT 4500
CGAGTAhTCT AAAAhChhhh T’hThTTChAA hACTTThTTh hAhAAhAATh AAhThATAAT 4560
AhAGA'hGACh CTAAhhACTT AAAhTATTAA ATAhAAThAA AAAAAATTAA 4620 GACTCCTATG ChAATChATA GhAATCAAAA NTACCTThTT TTATATAhAT GThAThTTAA 4680 GAATAATACA ACTAAAThAA MAUCTACA AAhAhTTTAA AAAAAhATGA AAATThATCh 4740 GhGhAhAACh ATTAATATAT AhAATATAAA hhTCTAAATT AhTAThAhAA AhAhAAAAhA 4800 hAAAhAAAGA TAATAChAAA hAAAAATAAT hTAAATCATT AAAAAAAhGT ThhAAAATTh 4860 GGAATGTAhA TAAAAhAT'hT AAhhAATATh TAThAACAhA hAhAThThAh 4 920 hCChAChACh ChhhAA,hhhh TNTThhhAAA AAATAAAhTh ThAhhTTAAA 4 980
AhACCCTACT ChChGTThAA GATAACThAA TTTCCThCCT 504 0
ATAAThGNAT AATAATTChT hAAThCTThA TTTThTh 5077 (2) INFORMACJA O SEK NR ID:9:
188 612 (i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: i003 par zasad (B) TYP: kwas llklrinnwr (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA; liniowa (ii) RODZAJ CZĄSTECZKI: cDNA ((Ci) OPIS SEKWENCJI: SEK NR ID: 9:
NGA^.TTCCGG dACrgCACCT
TTGCTGCGAG
TOGG^TGCGA tcatgcctcg
GyyyycdGdy cgattcttag
GyyccdGddG
CyCGdyGGGG dyydddydGC ctgactgtct
GGdAAGATGG dyyyydGyyG
GACAdGCOGG
AdyyAGAGyτ yyddGGdycy
GyAGdyGCdC
CCAGAGCAGA dGGyyτGAyG gcgggcactt
CTGAyTGTGG
CTGGAGGGGA
AGCyGTGTGy cACGyyGGyA
GCTCyCdCGG
CGGATCGOGT
TGAGyTGyAG
GCGGCCdGOd
TGCτyAycGy
CGGAGCTTGA
AGCτyyGyAy
AdGTGGGyrc ccggggttta
AGAGCCTTG'
TGATGTGCAT acagcttccc
TGACCGhAdG yGGTcyyτGG
GyyτyττyτG
CTGAGCTTCG τyyydcyGGy
CTCGGyTGGd cycτycdcτG
GTOUGCGGy dCCGATGTAy aatatgcccc yAGAGGyAτy
GCTCTGGAAA
CTTACCGATG
TGGAATATGG dGAGCTAGTG
GOTCCCGGOG
GcyGdττyGy yAyGGτyyτG
CCyGCGGC^
GTTTGCCATG
AGddAGGyyG yyycτcyyτG
GGycAcτGyy yGyGAcyyτy
GGyτcyτcτy yτGyτlGGyd
GydGcycGyy yGdyGyτGyc
TGTTCTGTGT ycyAτcτττA yGdyττGGAy yGAGGyyyGT
GCydGCGC:yG dGCdATySAT dGCGCTOGAC
GyyτAGyτGT
GGAGGAdGTC yGdAGyyAτc τyycyGGddT cyτcτGcyτc
GyAGGAyyyc
CGAAGTTTCG
GyGyGyAGdG
CAyGGyTTGG cyτcyAyτττ
GTGAyyτGyA
GGAGATCAGA
AydGyTACAG
GGGGGCGAAA
CyGACTyTAd
GGGGyyyGAG
GdGyycydGτ yτyGATGTGG
GAGTGGdTGT
AcyττAτyGT
TGTycydGGA
GGddACyyTG
GGyyyGττGG
GGGCdAGGCC
AGTOTAGOCT
GTGGydyACG
ATGGAAlGGy ddCGCCAGOG
TC
CTTGGCAGyy
GAGCGAGCCT
TAG^CGAGCC
AGGATCACAG
GAyτGyyτGy yyycGAGycτ
CTTTGGATGG
GOCTTCATCC
CAAGTGAAGA
GCAG^AGAC
GiGAGCCAGA yycττGycAy yAAdTGyyAC
AyGGGGAAAy τcdcττΓAτy dτccyyτyτG
GCTGGACGTG
AGcyyτcyGy
GTyyAGTGAC
AGGyGGTyAd
GyyydGdACG
GGGτyyyAyy cycτGCGTτy
GATCAGyGGy
TGTAGGTGAG
CACATyGACC
AyyyyGAGCT
GGCCdATyTC
AAdCAGCTCA τATτGyyccA
AyτGτyτyyτ ydATGTGACy
AyAGGAAGGy
CCAGGAGdAy
AGyyccyGAG
CTTGGAGGGA
ASAGdATGAC
TCyGAGASAG
TyrGTGdAyT yyτcATGycy
GyydGAGGGT
GyAyτGTGyA ycGTGyycτy
GGATGTGACC
TATTACTTOG
ACCyAGCGTG
TGGyyGGGAG yAAAdATGTG
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1472 (2) INFORMACJA O SEK NR ID:10:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 2550 pag zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ci) OPIS SEKWENCJI: SEK NR ID:10:
cyτyτGyyτy
GyAGGAycyc
CGdAGTTyCG
GCGCGCAGAG yAyGGyττlG cyτcyAyτττ
GlGdCTTGCd
GGAGATCAGA
AyAGyτAyAG
GOGGOCGASA yTGACTTTAA
GGGGycyGAG
GdGyτyyAGτ
CTCGATOTaG
GyAyyτyGGy yAGAycyτcy
GACGGTGGGG
AyττdyyGAτ yττGGyAGcy
GAGCGAGCCT
TAGOCGAGCC dGGdTyAyAG
GAyTGTTTGy
CCCCGAGCCT
CTTTGGATGG
GGyττydτcy
C^aTGAdGA
GCAGUdGAC
GTGAGyyAGA yccττGτyAy
TAdATOTCAC
ACGGGGAdAy
TGGATGACTT
ACyGCGAGOC yGGTGyyAGy
GTAyAGydAT
TGTdGGTGAG
CACATTGACC dyyycGdGyy
GGCCASTITC
SAACdGCTCA τAττGyyyyA dyτGTττycy
TAATGTGdCC
ACAGGAdGGy yyAGGAddAy
AGcyyyyGAG
CTTGGAGGGA
AAAGAATGAC
TCTGAGddAG
GGACTGTCyy
CyGTGGdAdC
GyτGGGyyτG yAATGGGyAA
AAyyycdyyτ
TTGCTOCGAG yGGGGTGyGA τyATGyyτCG
GccycydGAc
CGATTCTTAG
GCCCCAGASG
CTCGdCGG^G
AyCdAdydGC yrGAyτGτyτ
GGAdAGATGG
AτyyyAGyΓG
GACASOCOGG dAcyAGAGyy
AOGAGCTOGA ycτGdGcycy
TTGGGTCCAG
GGyyAGGyGG
TGAGCTGCAG
GCGGCC^GGA τGyτcAyyGC
CGGAGCTTGA
AGyyyyGCdc
AdGTGGGyyC yyGGGGTTTA
AGAGCCTTGT
TGATGTGCdT
AyAGyττycc
TGACCGTAAG
COGTCCCyGO
GCrTCTTCrG
CTGAGCTTCG yGTGGyCAGA yCGTGCAyTG
TGACyCGTGC
TyAAGGdTGT
GGTCCyGGGG
GCTGATTCGC
CAyGGTyCTG
CCTGCGGCCA
GτyτGcydTG
AGAAAGGCCG
CCTCyCTCTO
GGcyAyτGcy yGTGACCCτy
GGCTCCTCTy yτGyτGGGyA
GyAGyyyGCτ yGACGyτGyy
TGτyyτGTAy
GGGTyyAGAG
TGCAAGGyyT ccτyGyGGGy
GACCCyGACT
12 0 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080
188 612
GG’’AAGAG’ CCCCA’C’CG ”^1’^^ ’’CG’CCC1’ 11C’G1GGAC GGUUCGU’A’ 1140 ’T’1C1’1’T C1GCUCGT1’ CT’GΌGQTC1 C1CUTUUGCC C1CCACCG1’ C’G’A’CGGG 1000 ’GGC’CGCT’ ΊΑ!’’!’’! 1’GC1GUU11 G’TCCCCG’C GGUG’UCCC’ ’’1’C1C’CG 1060 ’’C1C^ACC ’1GUC’11’C CAGC11CUCC 1’’’’^^’ COCClAllA GTG’’CG’TC 1300 AC’’G’’AAG 1G’’GCCCAU GGGG’1UT1’ ^1’®^ U1CGG’T’T1 1380 ’1A’GAGCG’ U11A1CGUGG GGCCGUGU11 UGC’1GGGG1 irCC’’11CC ^^^”1’ 1440 G’C’G’’’CT C’U1’UTG’C ΙΜ^ΊΑ’’’ ’G1’G’GG’C CCCT’’TUGC CGC’11CGCG 1500 ’’TTCCAG1A 1CGCG1GU1C GCCG’UGA1C CGUGC1CCTG ’G1GGG1CCG CG’CA1C’CC 1560 ACC1ACCG’C 1G’’CGCC1C 1’GC1A1AC1 ’GC’GC’G’1 ’C’C’’11GC 1CC’CC1C1’ 1600 AG’’AT’A1T ’A’GC1CC1U AC1GG’CG’T A1’’1’CC^1 UUCG1CGGCU 1680
CGCUCCGUC1 UG’CCAG1GT CC’CCCCGCG CCAC’CUG’C ’CG’GGCC1’ ’’A1’’GGCA 1740 ’CC1’GCT’’ 1’AGTCGAC1 GTG’GCCC’1 ’1G’1GUC’’ ’G1CCGACCG ’G’G’G’’CG 1800 1CCAAC’CGC 1T’’C1C’’1 GGCAC’U1CC ’GC1CG’G’’ ’G’G’UA1GA CC’’CCGGG’ 1860 GG’’CGTA’C G’’C1’CCGC ’CCCCCA1’C ’GGC’UCCG’ GC’UA11CGG C1CGCG’1CC 1900 T’CC’G’CAG 1’’CCT’’CC GCSA’CCC1’ AGC1GCG’TC ’C’C’CCCCC ’’’1’CGCGS 1980 1ASCGCGTTC GCGCCA’C11 C1AC1’C1CU CG’A’C’G’T GTGCAUCC1G 0040 ’UGG’C’1’G 1G’1’G’CGC ’CUCAG’’TC GCC1C’CACT UC’CAGCACG 0100
CCGTGCC1G’ ’CT’G’UTGC ’CT’G<’UTC’ ’UTC’CG’C’ 0160
STGCGG’CC’ CA’UG’SC’T CCG’UCCGGC G1C’G’C1’G CC1CCGCGGU CAA’11’’’A 0000 ’AGT1C1AST GCC1G’AU’C G’A’1UCGC1 GTS’1’UCGT T’T’GCGCA1 G’TC’C’’UC 0080 ’GU1C1CCUU UGUCA’11GT C’’A’C1’1’ ACCCCC^Cl CG’CCGA’GC 1CCG’CAG1T 0340 GUSGAG’GGG GC’CC1GCCA ’CT’1C1GCG GCST’1’CCG ’GAGCC1’CG CCCCC1GG’’ 0400 ^^111^ 1C1’’GTG’’ 1C’G1G’G1G G’TGC1CGCG CGATGG1GGC ΑΙ^^Α’’’ 0460 ’CGTC’GCCC C’GGGGCG1C CS1GGCCCGG 11TAAA’GGG πΑΓΙ’’!’! 11A1AAAAA1 0500 1111111111 1AA11A11A1 1AAAA1AAA1 0550 (0) INFORMACJA O SEK NR ID:11:
(i) CHARAKTERYSTYKI SEKWENCJI:
(1) DŁUGOŚĆ: 000 par zasad (B) TYP: kwas nukleinowy (C) oodzaj NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: CDN1 (ci) OPIS SEKWENCJI: SEK NR ID: 11:
1AGGC’AGCA CGC’CUCGCC GGCGCTCTCC CTTCG CTCCT CCG’GC1UC’ ’’
AGUCC’’U’C CGGCACC1’’ GCGCTCCTCG C^I^^’^CTG’CC CG’’UCG’CC GUU
CTUGG’1GCC G1GTC1GCGC A1GCT’GC’C GTAGAA<C<i’i ΤΟΤσασ^^ GGCU’1CCTG iGC CUS’G’’C’C GC’GGT1’C’ CC’U’UGCTC GTGTGGCTCA AC 222 (0) INFORMACJA O SEK NR ID:10:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 090 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: CDN1 (ci) OPIS SEKWENCJI: SEK NR ID: 10:
TUT’GAUCG’ ’C1CCCCG’C CGCCTG’UC1 ’SC’’G’’TC CAG1ACGGC1 CCCG’C’CG’ 60 CS1A’G’’A’ UGGGUTGC’C ^^”1^1 GCTCACGGTG GTGGTGC’G’ G’CGGCAGGA 12’ ’U1’CGGA’C C’’C1’CCC’ (ΑΙ’}’’!’’ GCCAGUGGAG σΊΆΤΟ’^ CG’CC1GGGC 180
C1’C1G1G1C GACC1C’T1’ CCCCCGGTCG ATGCCGCACA σΑ^ΤΟσ’!! G’G1C1GCCA 2 4 0
GU’’CG(GU’A CGGGGCTG’A AlCiCC^!’ GCCCCGCCAC CC1’GAACGC ’1 0 92 (0) INFORMACJA O SEK NR ID:13: (i) CHARAKTERYSTYKA SEKWENCJI: (1) DŁUGOŚĆ: 105 aminokwasy (B) TYP: aminokwas (C) RODZAJ NICI: pojedyncza
188 612 (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: białko (ci) OPIS SEKWENCJI: SEK NR ID:13:
Pro Asp Arg Val Glu Leu Val Pro Leu Pro 10 Pro Trp Gln Pro Val 15 Gly
1 5
Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro Arg Ala
20 25 30
Ser Leu Tho Leu Thr Leu Leu Arg Gly Gly Gln Glu Leu Ile Arg Arg
35 40 45
Ser Phe Val Gly Glu Pro Pro Arg Ala Arg Cys Ala Met Leu Thr Ala
50 55 60
Thr Val Leu Ala Arg Arg Glu Asp His Arg Asp Asn Phe Ser Cys Leu
65 70 75 80
Ala Glu Leu Asp Leu Arg Thr His Gly Leu Gly Leu Phe Ala Asn Ser
85 90 95
Ser Ala Pro Arg Gln Leu Arg Thr Phe
100 105
(2) INFORMACJA O SEK NR ID :14:
(1) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 27 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA; liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ci) OPIS SEKWENCJI: SEK NR ID: 14:
GAAGTCCAGG GCATGGGCGC ACCCCCG 27 (2) INFORMACJA O SEK NR ID:15:
(1) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 30 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: CDNA (ci) OPIS SEKWENCJI: SEK NR ID :15:
CGATAACGTC TACCGGACCC TTACATGCAG 30 (2) INFORMACJA O SEK NR ID:16:
(1) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 18 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: CDNA (ci) OPIS SEKWENCJI: SEK NR ID:16:
AACGCTCCCA TCTGCGTG 18 (2) INFORMACJA O SEK NR ID:17:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 27 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: CDNA (ci) OPIS SEKWENCJI: SEK NR ID: 17:
188 612
ACCTAACTCT AATCCACCAA CTCCATC Π (2) INFORMACJA O SEK NR ID:08:
(0) CHARAKTERYSTYKA SEKWENCJI:
(C) DŁUGOŚĆ: 27 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ci) OPIS SEKWENCJI: SEK NR ID:08:
CACTAATCCC TAACCTrTAT CCTTACT 27 (2) INFORMACJA O SEK NR ID:05:
(0) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 27 par zasad (B) CYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTCCZKI : cDJAA (ci) OPIS SEKWENCJI: SEK NR ID:05:
ATATAAACCC TCTTTACACC ATCATCC 27 (2) INFORMACJA O SEK NR ID:20:
(1) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 08 par zasad (B) CYP; kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ci) OPIS SEKWENCJI: SEK NR ID: 20:
CARGCCCACA ATTTCACT 08 (2) INFORMACJA O SEK NR (1) CHAR/CKCERYSCYKA SEKWENCJI:
(A) DŁUGOŚĆ: 27 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ci) OPIS SEKWENCJI: SEK NR ID :20:
AACCAACACA TCCTATCCAC ATCTATC 27 (2) INFORMACJA O SEK NR ID:22:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 24 par zasad (B) TYP·. kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ci) OPIS SEKWENCJI: SEK NR ID:22:
CCCTGCCCTA TATTATTACA CTCA 24 (2) INFORMACJA O SEK NR ID:23: (i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 24 par zasad (B) TYP; kwas nukleinowy
188 612 (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) ROD&JJ CZĄSTECZKI : cDNA (ci) OPIS SEKWENCJI: SEK NR ID) 23:
TACAGAGACA CCAGACACTG GTTC 24 (2) INFORMACJA O SEK NR ID:24:
(1) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 992 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ (^^.^TECZKI : cDNA (ci) OPIS SEKWENCJI: SEK NR ID:24:
GEAARAAEEG AGAGTECEGA GAAASEAAAA EETTEATCAG ETAEEEGGCA EEAETEETAT 60 CEEAGAGCGT ACCETGCAAE TACEASAGGA AGATGGTGAC AGTJCCCTGC GCAGCTGGGG ECCTTGETET AGTEAEAEAG GASAGATGTA TAGCCGETGE CCCGCCCAGC AL 80
TAETGCATAT TGC QCEGAA AATEATEASA CACGCAGSEA TGCTTCCGAC GC^C^C^C^C^C^SΓC^CC 240 AAGTAGTEGA GGAATCEETG ASTATAAASA TGAGCGCATA GCTGCGEAAC CC^^AC^^CAC^^C^CSΓC ^00 ECEAGETAGA EAAAAEGAAC TAACCCESAA TTTGGAGAAA TEAAAACEGC C^C^L^^C^^C^C^S^?C 360 EGEAAEAETG EGTGGEEEGE GGGAASEEAT AACCCTSAEE TEAGTGCTCA CCC3C^C^C^C^C3A\C2C3 420 AEAGGAEEGA GEAGACTETA GAACEAACAA TTCCAGTTAC GAECE;CGCτC TCAGGCACTT 480 AEEACAACTA GGCAAECTTA σATTCTSAAE AGGCGGTAAA GTATGAGAEG TTEAETTTGG 5G0 AGTTEGCAEC AGEGCAAAAE ATAEGAGGGC TCCCAGGCCG CASEΆCSAAT CΊCG3A<AATAC <^C^0 CTATAAECAC GCTAAGCAAA GGAGAEGASE GGGTACAGAT ECGECAECAA ATCTGCCTraC 660 AETEAGGAAA TEAEAGGAEE GGAATTEATA TGCTGTGAET TAACACCCGG GAGCATGCGG 720 AETETTTEEG EAGEGAAGEE ATECATEEEA TGGGCTCGAG AEAACAAAAT TTTACCGGEΆ TCA CAGAAATTAA TAAEEEEAGG TAAAAAAATA CGAGCΊE5ASG AGGEEATTGG ACATGGGTGG 840 TAAAAAETAG GCGECTGTAA TCCTATGAAG TEGTAGGGTA GCETEAGEEA AGEATATAAA 900 AEGTGGGCAE EGAAAGEAEE AETGTGGGAG TGEAGCTGCE GCAAGCSECE CEAGAECEAA 960 ATCCETATAE TECEAGSTTE EEAAGAGAEC TG 992 (2) INFORMACJA O SEK NR ID:25:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 2775 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (xi) OPIS SEKWENCJI: SEK NR ID: 25:
GEAGCETEAC GAGAEGAAEG TAAAGEACGG GAAETCACAG AGGCAATATA GETGCAEETT 60 ETACCCACAA EEGAAAEGEG ATGGCCAGAA ATCCACGCAG CGEEGTAAEA GAACCETGAG 120 GGATATACGA AGAAAGAEAC AAETAETAGA GATEATACGE GTAEEGAAAA EAETGCEEGA 180 EAGCATETAC CACAACGEAC GGEGCACACA AETGGCAEGT GAGEAEAAAE AEAETTACCT 240 GEAAEETGAT EΑCΑΑAGAΑC AATTGECGET ACCAEECTGA CAAEEAATAG GCGAGATCAA 300 EAEEEAAAGE TAATAGAAEC CEAACGEEAG ACCCCATAEG AGEETCACGE AAACCEAGEA 360 GEGAAGEGCC ETAATGCTAA ACCGEEACAG EATCGEEGAA GTAEEACCEE GAGEGEGAGA 420 EACAAAAETC AEAAEEAEGA TAEAAAETEG AAAAGTGGAC CAAAGAGCEA AAAAETEGAA 460 TCGEACCATA CAGGTCEAAE GGEEGETCAA AETAGAACAG TATAATTACT ΑETEGΑCEEE 540 EAGAATAETC EATTECAAEA ^CTAT^^ GGAAGEEECG CAEETEGEAG EACEEEAGCA 600 EATGAAAGAA GAETEGGTTA AACCCAAAAG CAGEAETEAA AAEAGACAGT TTCCTGECTE 660 AGTGGCCAGG GTEATCETEG EACTGGAGGA CEAAATTEAG AAAECAGTAG TCACECTEGT 720 AAAGAACGET TACAAGAECA ETAEETCAGC EAEAACTAGE GCAAAGEAAA AGAGAGEEAA 780 GCTAEAAAAC TGEATEAAET EEETGAAAGG CAAAAAECAA GAGTEEEGAG AGSTEGTGAC 840 CAACAACTGE ATCEEGACTE EAEACCTGAE CEAGAAEGTA CECTGCATEA CCGAGGGGET 900 AAAAATGTCT GAAAECAGCG EAACAAGAAE EEAAAETEAA ATCTCAEAGG AGGGTGAAEC 960 AAECAEGGTC ECAAAGCTGE EEGEEEAGCA AEAGEATTAT AECTEEGAAA AEGACAAEAG 1020 ACACTACAAE AAEAAEGAEG EEACEETCGA TAAAGTCGGA GAGTEEETGT AETTGTAEAG 1080 AAACGEAGAG CTTCAAAACE ATAACGCTCE CCGGCATGTC AAAAEGGAEA AECECAAGAG 1140 TAAATEGTAA CCEATGAAEC ETGAGCTGAC GETGCGCTGC GAAAECEGCG GGAACCETGA 1200
188 612
ACCCCCCCTG
CCCGATCCCC
ACCCATCGAl
CCGACAACAG
CCTACClGCA
ACTACCAGCC
CCGCCGCACA
AAGCCGCGGG
CAATGAGCAA
CCTCGCCCGl
GACCGGCAGC
CCCCGCAAGG
ATACCTAGCA
AAAAlCCCCG
GCACGCCGGG
GACTGTAGCC
GACCGCCGGA
CGTCACCCAA
ACCCAGCGCA
CCGCGACAGA
GGCCACCCCC
CCGCCCCCGA
ACGCAACAGG
AGACACGGGC
GCCCGGACCC
GTCAGCCAAA
ACTCCGAAAA
CACCGCGCGC GACTCCGACCGC CCGGACGCAC GTGGCTCTGG ACCTGCTGGG 1166 CGGAGlGCGC CAGGCACCTA CCCCGCCCAC ACGGCCAATG ATCGAAGGCGA 1132 AACACGACGC TCACGGTCAtA Al^C^CT-^C^C^CC^Ca GCGCTGGA Q GCGTGCCCCTC 1138 ACCAGCCGGC CGGAAGGAAG AGACGCGTGA CClAlCClCl CCCGACACAG 1440 GGTAAClClA TCClCGCGCC GCGCAGAGCA CCGGAGGGCl CCACClAlGl 1500 CCAAGCGGAA AAGACGGGGA GAGCCAGGAG TACGAAGCCA GCAAGGGCGG 1560 GCGGAAGACl CAGCGGCCAG AGCGGCACAC GGCGGCAGGC CTGCAGAGCG 1620 AACAACCGGA CACGGGCGGA AGAACCCCCG GlCGTGCCCC CCCGCGACGC 1680 CCCGAGGCAA ACGCGACGCA ClCCGACTCG GAGAGGACGA GCAAGAGGAT 174 0 CGGGGAGGCG CAGAGCGCAA CCGCCGCAGC CCCCAGACCC GCACCGCGCC 1800 GCCCAClCGC GCAACGCCAG CCACCGCCAC AGCCGCACGG GCCAAAGAAC 1860 AGAGAGTCGG GACGGCAGAC AGAClACCCC CGCCGGCGA.A GCCAGCAGGG 1920 GGAGCCAAGG GCCCCGGGCC GGCGCGGGCG AGCCAGGGCC lGCCCCGCCG 1980 CACCCCGGGG CAGGCACGCG ACAGGCCAAG CAGCAAGGCC CGCCGGAAAA 2040 AGTCAGCACT ACGCAGGCAC CCACCCCCAT ACGACGAACC CGGCAACCCT 2100 GCCAAACACC GGGGAGCGGC AGCClGACCC lCCGGGCCGG CGGCCAAAAG 2160 AGCGGAAACC TGAGACCGAG CCCGCAGAGG AAGGGGCGGC CCCGAAGCCA 2220 GGGGGGGCGC GGAAAGGCCC CAACACCGGG CTGCGGAGCA ACAACAACCC 2280 ACCGGCGCGA CGGGGAGCCA GGGCAGGGAG CACGAGCGCG GACGCAGCGA 2340 GACCACGCGG AGGGGACCAG AGTGGGGGCA AGGAACCClC GCCCACGGCC 2400 GAGAGGGCCG GGGAGGGGGC ACTAGCGGCG AGGCACACGA lGCCClCCCT 2460 TCCAGGGCCC ACAACCAGGA GAAACAGGAC ACACAAAAGG GGGAGAAGCC 2520 ATCCGCCCAA ACGGAGCGCG GAGGGACGCC AGGCGAGCGG CAllClGlCA 2580 AACGGGGGAA AAGGGGGGGG CCAGCCCCGG lGGCAGllGl AGGCGCCGCG 2640 ACCCCGGCAC GAACGCAGCC CCCTGTGGAC AAGCGCAGAG lCGGGGGAAA 2700 GGCCTACCCA CCGCCCCACC TATCCACCCA CCCACCCACC CACGCACCCA 2760 CACCG 2775 (2) INFORMACJA O SEK NR ID:26:
(i) CHARAKTERYSTYKA SEKWENCJI:
(G) DŁUGOŚĆ: 1557 pao zasad (B) CYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ci) OPIS SEKWENCJI: SEK NR ID:
CGCCCTCCCC CGACCCCGCA CGCCCCCCCG CCACGCCAGA GGCCGCCCGG CGCGTGGGGT ACCCTCCGGC AAGAAGCGCC CCACGGGCAG CGAGACCGAC CACGGGCAAC CCCCAACAGG AGCAGGTCCC TCCGGCGACA CGGGACCGAG CCCGCCCCCG CGGAGCCCGC CACCCAGCCC CCCCACAGGC CCGAGGCCAC CCGGACCICG CTCGCCCCCT ACCAGGCGGT AGGCGAGCAC CCACCCCCCC CAAAGGCCAC AGCAAGCGCA AGCCCCACCA ACGAACCACC GCGAGCGGGG CCCAAGAAGA AGCAClGACC GAACCCGCCl CGAGCAGGAG CACCCAGAAA GAGCCGACGC GCCAACCCCC CACGCCCCGC CGCCCCCCCG CCCCACCCCG CAGACGGACC ACCCCCCACG GGCCACCCCC CAAACGCCGC TACCAGCGCG ACCACCAGTC CGGCAGACGA CGAAGCCGCG CCCGCCCAGG CAGAGACGCG GAAGCAGGCG ACCCTAACGC CACGCAlCCC CCCGGACCCG lCCGGAACTG ClGCCACACC GGAGGGAGCC CTCGCGCTCC ACGGCACCGG GAAGGAGAAG GCTACGAACC GGGAGAGCCT AACCCAGCAG CCCGCGCCGC CGGACTCAGA CCGCCGCAGG CCGGCGCGCT CCGAGGCGGA GAGGAAGGCA CACACAGCCG TACTGGCTCT ACACCCGGCG
AGGGCAAGAA CGGGAGGAGC CCCGCGAGGG GGCCClGGGG CGAGAGCCCC CGGGGCCCGA GCACAGGCCC GGGCGGGGCC CCCGGAGCGG CACCACGGCG GGGCGAAGCG CAGCGGGGCC AAGGGCCCGG GCCGGCCGGC GCGCGAACCA GCGTCCCCCC CCGAGCGGGC GGGGCGCGCA CAACGACCAA ACCACACAGA GCCGACGGCA CCGAGCGCGA ACTACAGAGC CGCGGAGACG GCGCCAGGCA GGCAGGAAGC GACGGCCGGC GAGGCAGTGG CCACCGCCAC GCCACTGGGT CGCGGCGCCC AGGCGGACCC GGAAGGGGAG CGCAAAGAAG CGGGAAGGCC GCGCCTACCC CCCCCCGAAA CCAAGCCGGA AAGGGGGCCC CCAAACGCCA CGGTGCACCC CAGAGCGGCG CAAGGGGAGA CATCGACGGC CACCGCGACA AGCGAGCCCG CCCGGAACGC CACCCCGGGG ACGACCCACA ACTCGGCGGC AGCAGCCGCC CACACAGTAA CCACAAGCCG CGCAAGCAGC CCCCCCACAG CCGCGGGGCA GGGCGGCCAA ACAGGCAACC CCCCGCACGA CGCGGCGCCC AACAAGAGAA CGCCCGGCGC GGCACACAGT AACCGGAGAC CGGCCAAGAG CGGAGAGCAA GACCGCCGGA CGCAGCGCGG GGGCTGCAAC ACCCCAGCGA CCCGGGCGGC CCGAACCCGT
120
180
240
00 360 420
80 540 600 660 720 7 80 840 900 960
1020
1080
1140
1200
1260
1320
1380
1440
188 612
TACCGCTGCA AGGCGGCCAA TGATCAAGGC GAGGCGGTCA AGGACGTAAC GCTAACGGTG 1500 GAGTACGCAC CAGCGCTGGA CAGCGTGGGC TGCCCAGAAC GCATTACTTG GCTGGAG 1557 (2) INFORMACJA O SEK NR ID:27:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 2927 par zasad (B) TYP: kwa3 nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: cDNA (ix) CHARAKTERYSTYKA:
(A) NAZWA/KLUCZ: CDS (B) POŁOŻENIE: 40..2814 (xi) OPIS SEKWENCJI: SEK NR ID:27:
CGCGCTCTCC TCGCCTCCTG TGCTTTCCCC GCCGCGGCG ATG CCA GGG CCT TCG 54
Met Pro Gly Pro Ser
5
CCA Pro GGG CTG CGC Arg CGG GCG CTA CTC GGC CTC TGG GCT GCT CTG GGC CTG 102
Gly Leu Arg 10 Ala Leu Leu Gly Leu 15 Trp Ala Ala Leu Gly 20 Leu
GGG CTC TTC GGC CTC TCA GCG GTC TCG CAG GAG CCC TTC TGG GCG GAC 150
Gly Łeu Phe Gly Leu Ser Ala Val Ser Gln Glu Pro Phe Trp Ala Asp
25 30 35
CTG CAG CCT CGC GTG GCG TTC GTG GAG CGC GGG GGC TCG CTG TGG CTG 198
Łeu Gln Pro Arg Val Ala Phe Val Glu Arg Gly Gly Ser Leu Trp Leu
40 45 50
AAT TGC AGC ACC AAC TGC CCT CGG CCG GAG CGC GGT GGC CTG GAG ACC 246
Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg Gly Gly Leu Glu Thr
55 60 65
TCG CTG CGC CGA AAC GGG ACC CAG AGG GGT TTG CGT TGG TTG GCG CGG 294
Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu Arg Trp Leu Ala Arg
70 75 80 85
CAG CTG GTG GAC ATT CGC GAG CCG GAG ACT CAG CCC GTC TGC TTC TTC 342
Gln Łeu Val Asp Ile Arg Glu Pro Glu Thr Gln Pro Val Cys Phe Phe
90 95 100
CGC TGC GCG CGG CGC ACA CTA CAG GCG CGT GGG CTC ATT CGC ACT TTC 390
Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly Leu Ile Arg Thr Phe
105 110 115
CAG CGA CCA GAT CGC GTA GAG CTG ATG CCG CTG CCT CCC TGG CAG CCG 438
Gln Arg Pro Asp Arg Val Glu Leu Met Pro Leu Pro Pro Trp Gln Pro
120 125 130
GTG GGC GAG AAC TTC ACC CTG AGC TGT AGG GTC CCC GGC GCC GGG CCC 486
Yal Gly Glu Asn Phe Thr Leu Ser Cys Arg Yal Pro Gly Ala Gly Pro
135 140 145
CGT GCG AGC CTC ACG CTG ACC CTG CTG CGG GGC GCC CAG GAG CTG ATC 534
Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly Ala Gln Glu Leu Ile
150 155 160 165
CGC CGC AGC TTC GCC GGT GAA CCA CCC CGA GCG CGG GGC GCG GTG CTC 582
188 612
Arg Arg Ser rhe Ala 070 Gly Glu Pro Pro Arg 105 Ala Arg Tly Ala ' Vv1 108 Leu
ACA TCC ACA! GTA CAT (TCT CCT act: GAG GAC CCCT CTA GTC AAC TAC TCT 580
Thr Ala Thr Val 085 Leu Ala Arg CArg Glu 105 Asp Hii Gly AAa Asn 195 Phe Ser
CTT CCC GCC! CAG CCT GAC CAG CGG CCG C5CC GGA CAG CTCC CCT T1A TAA 505
Cys Arg Ala 200 Glu Leu TAsp Leu Arg 205 Pro His Gly Leu Gly 200 Leu Phe Tlu
AAC ATC CCT TCC CCC ATA TAT CTC CTA ACC CTC ACC CCT ACA CCT TAC 025
Asn Ser 205 Seo Ala Poo Arg Tlu 220 Leu Arg Chr Phe Seo 724 Leu Ser rro Asp
CCC CCC CTC CCC GCA TCA CCC CTT CTC ACT CAA TCA TCC CCT TAA ATT 070
Ala 230 Pro Agg Leu Ala Ala 734 Pro Arg Leu Leu Clu 240 Vi1 Tly Ser Tlu Arg 704
CCC TTT ACC TTC ACT CCT TAC TCA CCT CTT CCA TCC CCA TAT TCC ATT 522
Pro Val Seo Cys Tho 250 Leu Asp Tly Leu rhe 255 Poo Ala Ser Tlu Ala 260 Arg
TAC TAC CAC TCA CAT TTT TAC ACT AAT CCT ATC CCC TAC TTC ACC CCC 800
Val Tyr Leu Ala 254 Leu Tly Asp Tln Asn 270 Leu Ser Pro Asp Val 045 Tho Leu
TAA CTT CAC TCA CTC TTT TCC ACA CCC ACA TCC ACA TCT ATC TCA CAT 508
Clu Cly Asp 280 Ala rhe aaa Ala Chr 264 Ala Chg Ala Chr Ala 250 Ser Ala Clu
CAC TAT TTT TCC ATT CAT CCT TCC TTC AAC TTC ACC CAC TTT TTC TAA 500
Tln Tlu 255 Tly Ala Arg Tln Leu 330 Val Cys Asn Val Tho 330 Leu Tly Tly Clu
AAC CCC CAT ACC CTT TAT AAC TCT ACC ACC AAC ACC TAC CCT TCA CCA 2504
Asn 300 Arg Clu Aho Agg Tlu 330 Asn Val Chg lie Ayg 332 Seg Phe Poo Ala Poo 322
CCC CTC AAC CAT AAC ATA ACC AGC CTC TCC AitA ATT SCA ATG GTC ACA 2502
Leu Leu Tto See S^e· 330 GTa Arg S^eo Vs^l See 834 Ala τι. Cln . Met Val 340 Thr
TTC ACC TCC CCA . ACC AGT ACC (AAC GCA CTC GTT AAA . CCA • CAT (TA . GCC 1110
Val Ahr Ccs Ala Ala Gly CAa Gin Ala Leu Vćil TCh ' Lee . Tlu Gly Val
044 350 355
CCA CCC GGG CTC CCG C^G CAG CCC GCC CAG CTT CAG CTA AAT GCC ACC 0058
Pro Ala AAa Val Pro Gly Gin Pro Ala Gin Leu Gin Leu Asn Ala Thr
300 305 370
CAG AAC GT^CC GAC AGA CGC AGC TTC TTC TGC GAC GCC ACC CCC GAT CCT 0200
Clu Asn Asp Asp CArg Aic<^ Ser Piie Phe C5ys Asp Ala Thr Leu Asp Val
375 380 338
CAC CTC GAG ACC CTG ATC CAAG AAC AGG AGC GCA GAG CAT CTT GTC CTA 0240
Asp Gly Glu Thr Leu Ile Lys Asn Arg Ser Ala Glu Leu Aog Val Leu
350 395 400 445
TAC GGC SCC CCG SCA GAC TAA ACT TAC TGC CCC AGC ATC ATT ACG TGG 0302
188 612
Tyo Cla Poo Arg Leu Asp Asp Ser Asp Ccs Pro Arg Seo Trp Thr Trg>
410 441 442)
CCC GAG GGC CCC. CGC GAG GTC GTT GGC GGC GAG TCC GTC TCG ACC GCC 1350
Poo Glu Gly Prr G Gu G Gu Uff Glu Gcg Gys du ACu tog dy Acp Gro
425 443 445
GTA CCC TCA GTC CCT GOT GGC TCG TCC GAC TCC TCG GTC GTG CTC GOT 1398
Glu Pro Ser Val H Hi Gys G Cu Acg G eu Gsp Gly dy Alu Vnl Llu Mu
440 445 440
CTC TCC CTC CTC GGG GCC GTC GOT GCG GCG CTC TCA TCC ACT TTC GTC 1446
Leu Gly Leu Leu dl Gpo GCh tog Ma Leu Ser Gly Thr Tts tog
455 460 465
TCC CCG GCG GCC AAC dC GCA GTC dC ©TC GTC GAG GAC GTA ATC CTC 1494
Cys Lys Ala Ala Acp Acp GGu OTu GGu Ala Val Lys Asp Val Tto Geu
470 475 480 485
ACG GTG GAG TAC GGC GCC GTC GCT GGC AGC GTC TCC TGC Cd GGA GCG 1000
Tho Val Glu Tyr A Cu Gpo GCu Glu Gap Ger Val Gly CC^E! Pro GGu Acg
490 495 500
ATT CCT TCG CTC dC Gd GCC GGC TCC TCG CTC ATC TCT GTG GCG GCC 6590
Ile Thr Trp Leu GGu GGu Gto du GCu Ger Leu Ser Cys Val ACu Aii
505 510 s:l^
TCG GTA CCG CCG CCT dC GGT ATC GTC GTG CGC TCT TCT GAC CTC TCG 6638
Gly Val Pro Pro G po Acp Gv1 GIu Gcs Val Arg Ser Gly Glu Leu Gly
520 525 530
GCC GTC ATT CGA GTC GCT GTC GCG GTC GGC TCG GAC GCT GGC Gd GCT 1686
Cla Val Ile GGu dy Glu Geu Arg Vv1 Mu tog GGu GHi Mu GGl' Thr
535 554 544
TAC CGC TCT CGA GCC ACC GAC COT CTC ©H TCT GTC TCC GCA GAT GTC 1430
Tyr Arg Cys Glu Ala Thr Asn Pro tog Gly Gsu ACu Mu GYS Aen Val
550 555 560 520
GCC GTC ACG GTG CGA TAT TCC CCC ATC GCT GAG GAG GCC AGC TGC CCC 1782
Ala Val Thr Vv1 Glu ΊΥγ Gly Pro tog Phh Glu du Ppo GST Cys Pro
570 575 580
AGC TAT TGG ACA TTC GTG GTCC TCT TCG CTC CTC TT?T TCC TCT GAG 6830
Seo Asn Trp Thr Τη? Val Glu Gly Ser Gly tog Leu PPh Ser Cys Glu
585 590 490
OTC GCT GGG GAG CCA CAG CCA AGC GTC GAG TGC GTG GGC TCC GGG GGC 1878
Val Asp Gly Lys Pro Gln Pro Ser Val Lys C/S Val Gly Ser Gly Gly
600 605 610
CTC CCT GAG ©TC GTC CTC CTG CCG CTG GCA CCC Cd GAC CCT AGT CCC 1926
Thr Tho Glu Gly Val Leu Leu Pro Leu Ala Pro Pro Asp Pro Ser Pro
615 620 625
CGC TCT CCC AGA ATC COT Ad GTC tTG Gd CCC TCT ATC TAC GTC TGC 1974
Crg Cla Ppo Arg Ile Pro Arg Val Leu Ala Ppo Gly ile Tyg Val Cys
630 663 664 665
CCC GCC CTC CCC CGC CCC TCC TCC GTC GCC CCC CCC GTC CTC CGC 2022
188 612
Asn Ala Thr Asn Alg 650 His Gly Sua Val Ala 665 Lys Thr Val Val Val 660 Ser
CGC CAC Td KA Cd GAA AAT (GAT (GA TCT ACC Ad Ad AGT AAAG CCA 2070
Ala Glu See Ooo 665 Pro Glu Met Αβρ Glu 670 Ser Tta sgs Sor Ser 675 His GAu
ACA TCG CTC GGA Gd dT GAG GCT TCC Gd CTG GCC ΑΚ GCC AGGC Cd 2118
Tho Trp Leu 680 GAu Gly Ala GAu Ala 668 See Ala Leu Ala Cgs 690 Ala Ala Aaa
TCC dC CCC TCC CCA GGA GTG CGC TGC TCT CGG GAA dC ATC CGA TTG 2166
Gly Arg 695 Pro SSr Pro Gly Viil 770 AArg acs Ser Arg Glu 705 Gly Ile Pro T’A
CCT CAC CAC A^A^C( dC GTO TCC CGA GAG GAC GCG GGC ACT TAC GAC TCG 2214
Pro 710 Glu Gln Gln Arg Val 715 Ser Arg Glu Asp Ala 720 Gly Thr syr His Cgs 725
GTC GCC ACC CAT GCG CAT GGC ACG GAC TCC CA3G ACC GTC ACT GTC GK 2262
Vil Ala Thr Asn Ala 730 His Gly Thr Asp Ser 735 Arg TTir Val Thr Val 740 GAu
GTC GAA TAC dA CAA GTC ATC AGC AGA AGT ACT AGC Ad ACC CCT dA 2310
Vil Glu Tyr Ag} 745 Oor Vv1 Av1 AGl AAu 775 Alu. All All Ser SPA 775 Aro GAy
Gd GTC CAC CAA dA gaMl AAA STC Ad STC AAC Ad Sd GCG GAG GCC 2358
Gly Val Arg 760 Aor ISa GGl Am (Oh 776 (Th Alu r^h· Ais Aaa 777 Ala GAu Ala
TOG CCT CCA GCC CAG ATC Ad TGG CGC dG SAGC Cd Ad GCC CTC AAC 2406
Top Pro 775 Pro Ala G Au S le Ser 778 Trg Alg Ala Ppo Ppo 778 Arg Ala Leu Asn
ATI GGC CTC TCG Ad AAC AAC AGC Ad CATG AAd GTG GCA dC GCC ATG 2454
Ile 790 Gly Leu Ser S su Asn 795 Asn Ser Thr Leu Ser 800 Val Ala Gly Ala Met 805
GGA AGC CAC GGC GK SAG TAC GAG TGC AACA CGC ACC AAC GCG CAC dG 2502
Gly Ser His Gly GAu 810 Alu Tr Glu Cys Ala 815 Arg Thr Asn Ala His 820 Gly
CK CAC Gd Cd Cd ATC ACG GTG CGC GTO GCC dT CCG Td CTA TCG 2550
Arg His Ala Arg 825 Aaa Sie Thr Val Arg 880 Val Ala Gly Pro Tir? 835 Leu Trp
CCC GCC CTG GGC dG dG GCG GGG AA^C GCG GCG CTC CTA GCC Gd Ad 2598
Val Ala Val 840 Gly G Gl Ala Ala Gly 845 Gly Ala Ala Leu Leu 8S0 Ala Ala Gly
Gd GGC CCT acc TTC TAC GTG dG TCA ACC GCC TGA GAG WAG dC GAG 2646
Ala Gly 855 Leu Ala Phe Tyr Val 886 Gln Ser Thr Ala Cgs 886 Sus Lys Gly Glu
TAC AAC GTC dG GAG GCC GAG AGC TCA GGC GAG dG GTG TGT CTG AAC 2694
Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu Ala Val cys Leu Asn
870 875 880 08 5
nnA (GAC AAC^C AAGC GCT Gd Gd AAGG dA GGC GCG dG dC dA CCC 2742
188 612
Gly Ala Gly Gly Gly Ala Gly Gly Ala Ala Gly Ala Glu Gly Gly Pro
890 895 900
GAG GCG GCG GGG GGC GCG GCC GAG TCG CCG GCG GAG GGC GAG GTC TTC 2790
Gli Ala Ala Gly Gly Ala Ala Glu Ser Pro Ala Glu Gly Gli Val.PLn
905 910 915
GCC ATA CAG CTG ACA TCG GCG TGAGCCCGCT l ycyyτcτycG yGGGycGGGA 2841
dla Ile Gln Lei TLr Sur dla
Ο 925
CGCycyyyAG AyryACACGG GGGCTTATTT ATTGCITTAT yTAhTTACTT dTyCATTIAT 2901
TTdTGTATTy ddyTCCAAGG GdATTC 3930 (2) INFORMACJA O SEK NR ID:28:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 924 lmύlskwlsr (B) TYP: aminokwas (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: białko (ci) OPIS SEKWENCJI: SEK NR ID :28:
Met Pro Glr Pro Ser Pro Gly Lei Arg Arg Ala Lnu Lnu Gly Lnu Trp
1 5 11 11
Ala Ala Lei Gly Lei Gly Leu Phe GPy Lnr kir Ala Val Ser Gln Plu
20 22 30
Pro Phe Trp Ala Asp Lei Gln Pro Arg VaA dla PLn Val Gli Arg Gly
35 40 45
Gly Ser Lui Trp Lei Asn Cys Ser TLr Asn Cys Pro Arg Pro Gli Arg
50 55 66
Gly Gly Len. du PTe Psu Per Psg PArg Asn Gly Thr Gln Arg du Per
65 75 88
Arg Trp Leu AAn Arg dn Peu Val Asp Ile Arg Gli Pro Gli TTe PGu
85 99 99
Pro Val Cys PLe Phe Arg Cyr Ala Aaa Arg ggr Leu Gln Ala Arg Gly
100 115 110
Lei Ile Asg TLr Phe Gln Arg Pro Asp Arg Vv1 Glu Lei Mek Prr Peu
115 120 125
Pro Pro Trg) Gln Pro Val Gly Glu Jdin PPe TTe Leu Ser Cys PUrg Pv1
130 113 114
Pro Gly AA a Gly Ppo Arg Ala Ser Leu Thr Leu Thr Leu Leu Asg P3y
145 1150 155 116
AAi Gln Glu Leu IIe Arg Arg Ser Phe dla Gly Glu Pro Pro Arg AAn
165 110 175
Arg Glr Ala Val Lei Thr AAa Thr Val Liu Ala OArg Arg Gli Asp His
180 185 190
Gly dla idin Phe Ser Cys JAcg Ala Glu Leu Asp Leu Arg Pro di Gly
195 200 205
Lei Gly Leu Phe Glu Asn Ser Ser Ala Pro Arg Glu Lui Arg Thr Phe
210 215 220
Sur Lei Ser Pro Asp Ala Pro Arg Leu dla Ala Pro Arg Leu Leu Glu
225 220 255 220
Val Gly Ser Glu Arg Pro Val Ser Cys TLr LlU App Gly Leu Phe Pro
245 250 255
Ala Ser Gli Ala Arg Val Tyr Lei Ala Lei Gly Asp Gln Asn Lki Sur
260 265 270
Pro Asp Val Thr Leu Glu Gly Asp Ala phe Val Ala TLr Ala Thr Ala
275 280 285
TLg dla Ser Ala Glu Gln Glu Gly Ala Arg Gln Leu Val Cys Asn Val
290 295 300
188 612
Thr Leu GGy GGu Alu Asi Arr Glu Thr Ar' AGu isg lal Thr Ile Tyr
305 310 3H 330
Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Poo Ser Val Ser Glu
305 333 333
Gly Gln Met Val Thr Val Thr Ccs Al a Ala Gly ila ’Ia Ala Lli Av1
340 345 350
Thr Leu Glu GGy Val Pro Ala Ala Val Pro Gly Gin Pro Ala Gin Lli
355 330 365
Gln Leu Asn Ala Thr Glu Asn iAp GAp Glrg Arg Ser Phe Phe Cys Aig
370 375 380
Ala Thr Leu Asp Val Asp ’iy Glu Thr Leu Ile Lys Asn Arg Ser Ala
385 390 3!5 400
Glu Leu Arg Val Leu Tyr ila Pro Arg Leu Asp Asp Ser Asp Cys Pro
405 410 441
irg Ser Τη? Thr Τη? Pro ’lu Gly Pro Glu Gin Ghr Leu Arg Ccs GGe
400 440 430
ila irg Gly Asn PrO Glu Pro Ser Val His Ctys Ala Arg Ser Asp dy
435 440 445
’ly ila Val Leu Ala Leu Gly Leu Leu Gly Pro Val Tiar Arg Ala Lli
450 455 460
Ser ’ly Thr Tyr irg Cys Lys ila Ala isn Asp Gin ’ly Ala Val
465 470 475 480
Lys isp Val Ghr Leu Ghr Val ’lu Gys Ala roo ila Leu iGp Ser Val
485 490 449
’ly Cys Pro Glu Arg Il? Ghr Trp Leu Glu Gly Gho Glu Ala SSr Leu
500 550 510
Ser Cys Val Ala His Gly Val Pro Pro Pro Asp Val He Cys Val GArg
515 520 525
Ser ’ly GGu Leu Gly ila Val Ile ’iu Gly Leu Llu Arg Val Ala Ais
530 535 544
Glu His ila ’iy Thr Tyr irg cys ’lu Ala Ghr isn Poo log ’ly Seo
545 550 555 560
ila ila Lys Asa Vai ila Val Gho Vai ’lu Gyr ’ly Pro isg Phe Glu
565 570 575
Glu Pro Ser Pro Ser isn Trp Thr Gop Val ’lu Gly Ser Gly Ars
580 555 590
Leu Phe Ser CSgs Glu aau isp Gly Lys roo Gin roo Ser Val Lys Ccs
595 660 660
Val ’ly Ser Gly Gly Thr Th? Glu ’ly Val Leu Lli Pro Leu Ala Pro
610 15 G 660
Pro isp Pro Ser Pro Arg ila Pro Arg Ilr Pro log Val Leu Ala Pro
605 630 635 640
Gly Ile Tyr Vai Cys isn ila Thr isn log His ’ly Seo Vai Ala Lys
645 650 665
Thr Val Val Val See ila ’lu Ser Pro Pro ’lu Met Asp Giu S^r Thr
660 665 670
Cys Pro Ser HG? Gin Ghr Τη? Leu Glu ’iy Ala ’lu Ala Ser Ala Leu
675 668 668
ila Cys Ala A1s Arg ’ly ArG Aog Ser Pro Gly Val log Cys Ser Arg
690 95 G 770
Glu ’ly Ile Pro Trp Pro ’lu ’Ia ’Ia . log Val Seo log Asp Ala
705 710 715 700
’ly Thr Tyr His Cys Vai ila . Thr isn Ala His ’ly Ghs isp Ses log
705 730 77,^
Ghr Vai Thr Val Gly Val Glu iyr Arg Pro Val Val Ala Glu Llu Ala
740 745 750
Ala Ser Pro Pro Gly Gly Val Arg Pso Gly Gly Asn Phe Thr Llu Ghr
755 760 765
cys Arg Ala Glu Ala Τη? Pro Pro ila Gin Ile Ser Trp Arg Ala Pro
188 612
770 775 780
Pro Arg Ala Leu Asn Ile Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser
785 790 795 800
aal Ala Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Arg
805 810 815
Thr Asn Ala His Gly Arg His Ala Arg Arg Ile Thr aal Arg aal Ala
820 825 830
Gly Pro Trp Leu Trp aal Ala aal Gly Gly Ala Ala Gly Gly Ala Ala
835 840 845
Leu Leu Ala Ala Gly Ala Gly Leu Ala Phe Tyr aal Gln Ser Thr Ala
850 855 860
Cys Lys Lys Gly Glu Tyr Asn aal Gln Glu Ala Glu Ser Ser Gly Glu
865 870 875 880
Ala aal Cys Leu Asn Gly Ala Gly Gly Gly Ala Gly Gly Ala Ala Gly
885 890 895
Ala Glu Gly Gly Pro Glu Ala Ala Gly Gly Ala Ala Glu Ser Pro Ala
900 905 910
Glu Gly Glu aal Phe Ala Ile Gln Leu Thr Ser Ala
915 920
(2) INFORMACJA O SEK NR ID:29:
(1) EHTRAKTERYeAYZA SEKWENCJI:
(A) DŁUGOŚĆ: 65 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODAJJ CZĄATECZKI: DNA (ci) OPIS SEKWENCJI: SEK NR ID:29:
ATAEAATCAG GAAEEGCGAT ETEGETAGAG ECCTTCAGGG CGGACCTACA AECAAEATGA 60
EGAAC 6 5 (2) INFORMACJA O SEK NR ID:30:
(1) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 31 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RDDA.JJ CZAATECZKI : DNA (ci) OPIS SEKWENCJI: SEK NR ID: 30:
TTATEACAEG AGATAAAAEA CGAAETCECG G 33 (2) INFORMACJA O SEK NR ID:31:
(1) CHTRSZAERYSTYZT SEKWENCJI:
(A) DŁUGOŚĆ: 33 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RDDAJT CZĄATCCZKI : dDNA (ci) OPIS SEKWENCJI: SEK NR ID:31:
TAAACAGGAA EEATCTAEAA CEEAACAEET CTC 33 (2) INFORMACJA O SEK NR ID:32:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 32 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa
188 612 (ii) RODZAJ CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: SEK NR ID:32:
ATTTCTCTCG AGTTCCACGC CCACAGTGAC GG 32 (2) INFORMACJA O SEK NR ID:33:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 1687 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: DNA (genomowa) (xi) OPIS SEKWENCJI: SEK NR ID: 33:
GGATCCTTTG AGCCCTGARA GTCGAGGTTG CAGTGAGCCT TGATCGTGCC ACTGCACTCC 60 AGCCTGGGGG ACAGAGCACG ACCCTGTCTC CAAAAATAAA ATALAAATAA ARATARATAT 120 TGGCGGGGGA ACCCTCTGGA ATCAATAAAG GCTTCCTTAA CCAGCCTCTG TCCTGTGACC 180 TAAGGGTCCG CATTACTGCC CTTCTTCGGA GGAACTGGTT TGTTTTTGTT GTTGTTGTTG 240 TTTTTGCGAT CACTTTCTCC AAGTTCCTTG TCTCCCTGAG GGCACCTGAG GTTTCCTCAC 300 TCAGGGCCCA CCTGGGGTCC CGAAGCCCCA GACTCTGTGT ATCCCCAGCG GGTGTCACAG 360 AAACCTCTCC TTCTGCTGGC CTTATCGAGT GGGATCAGCG CGGCCGGGGA GAGCCACGGG 420 CAGGGGCGGG GTGGGGTTCA TGGTATGGCT TTCCTGATTG GCGCCGCCGC CACCACGCGG 480 CAGCTCTGAT TGGATGTTAA GTTTCCTATC CCAGCCCCAC CTTCAGACCC TGTGCTTTCC 540 TGGAGGCCAA ACAACTGTGG AGCGAGAACT CATCTCCAAA ATAACTTACC ACGCTGGAGT 600 GAGACCACGA ATGGTGGGGA GGGGAGGGTC CCACGGACAT ATTGAGGGAC GTGGATACGC 660 AGAAGAGGTA TCCATGTGGT GGCAGCCGGG AAGGGGTGAT CAGATGGTCC ACAGGGAATA 720 TCACAAACTC GAATTCTGAC GATGTTCTGG TAGTCACCCA GCCAGATGAG CGCATGGAGT 780 TGGCGGTGGG GGGTGTCAAA GCTTGGGGCC CGGAAGCGGA GTCAAAAGCA TCACCCTCGG 840 TCCCTTGTTC TCGCGTGGAT GTCAGGGCCT CCACCCACCG AGCAGAAGGC GGACTCAGGG 900 GCGCTCCAGG GTGGCTCGAG CTCACACACG CTGAGTAGAC ACGTGCCCGC TGCACCCTGG 960 GTAAATACAG ACCCGGAGCC GAGCGGATTC TAATTTAGAC GCCCGCGAAC GCTGCGCGCA 1020 CGCACACGTG TCCTCGGCTC GCTGGCACTT TCGTCCCGCC CCCTCCGTCG CGTGCCGGAG 1080 CTGACCCGGA GGGGTGCTTA GAGGTATGGC TCCGCGGGGT CAAAAGGAGA AGGATCAGTG 1140 AGAGAGGATC CCCACACCCT CCCCTAGAAC TGTCCTTTCC CCATCCAGTG CCTCCCAAAT 1200 CTCTCTTAGT CCCCAAATGT ATCCCCGCCC TAAGGGGCGC TGGTGGGAGG AGCTAAATGT 1260 GGGGGCGGAG CTCGGAGTCC AGCTTATTAT CATGGCATCT CAGCCAGGGC TGGGGTAGGG 1320 GTTTGGGAAG GGCAACCCAG CATCCCCCGA TCCCAGAGTC GCGGCCGGGG ATGACGCGAG 13 80 AGAGCGTGGT CGCCCCCAGA AGGCCCTGGG CCATCATGCC GGCCTCCACG TAGACCCCAG 1440 GGGTCGCTCA CTCCTGCCAG CTCGCCTTCA CCAAGGCCAG GAGCTTAGCG CACGCTCGCC 1500 TCCCGCCCCC CCGCCGCCTC TGCCGCCGCC CCCTCCTTGG AAACCAAGTT ACCAACGTTA 1560 AACCAATCCC CAAGCGCAAC TCTGTCTCCC CCACACCCCA CCCGCCGCGC CGCGCGGAGC 1620 CGTCCTCTAG CCCAGCTCCT CGGCTCGCGC TCTCCTCGCC TCCTGTGCTT TCCCCGCCGC 1680 GGCGATG 1687 (2) INFORMACJA 0 SEK NR ID:34:
(1) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 36 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: DNA (xi) OPIS SEKWENCJI: SEK NR ID:34:
CAGAACTAAG CTTACAGGAG GCGAGGAGAG CGCGAG 36 (2) INFORMACJA O SEK NR ID:35:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 31 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa
188 612 (ii) ^ZĄ^TCZZ^I : DNA (ci) OPIS SEKWENCJI: SEK NR ID :35:
CAACAACTCC ATCCAATCCC AACTCATTCT C 31 (2) INFORMACJA O SEK NR ID:30:
(0) CHARAKCERYSCYKA SEKWENCJI:
(A) DŁUGOŚĆ: 30 pao zasad (13) CYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODAJC CZĄSTCCZKI: DNA (ci) OPIS SEKWENCJI: SEK NR ID :30:
CAACAACC5A ACCCTTCTAA ACCAATCrAC C 31 (2) INFORMACJA O SEK NR ID:37:
(1) CHARAKCTRYeTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 33 par zasad (B) CYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODAJC CZĄrTCCZKΪ: DNA (ci) OPIS SEKWENCJI: SEK NR ID: 37:
CAACAATCCT ATCATTATCC CATCTCACTC ACC 33 (2) INFORMACJA O SEK NR ID^:
(0) CHARAKCTRYeAYKA SEKWENCJI:
(C) DŁUGOŚĆ: 32 pao zasad (B) CYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza O) TOPOLOGIA: liniowa (ii) RODaJC ΟΖ^δΙΈ^Α!! : DNA (ci) OPIS SEKWENCJI: SEK NR ID^:
5ACCAATTCA ACCCACTCCT TCCACCCCTA AT 32 (2) INFORMACJA O SEK NR ID:35:
(0) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 30 par zasad (B) CYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZM CZĄSTCCZKI : DNA (ci) OPIS SEKWENCJI: SEK NR ID:35:
CAACACTTCC ACCTAC CAC C TAAATATCAC C 31 (2) INFORMACJA O SEK NR ID:40:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 32 par zasad (B) TYP: kwas nukleinowy (C) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTECZKI: DNA (ci) OPIS SEKWENCJI: SEK NR ID:40:
CAACAATCCT ATCCATATAC CCCAAAATCA CC 32 (2) INFORMACJA O SEK NR ID:41:
188 612 (1) CHARAKTERYSTYKA. SEKWENCJI:
(A) DŁUGOŚĆ: 30 pao zasad (B) CYP: kwas nukleinowy (G) RODZAJ NICI: pojedyncza
O) TOPOLOGIA: liniowa (ii) RODZAJ CZĄSTCCZKI: DNA (xi) OPIS SEKWENCJI: SEK NR ID :41:
CAACACCGCC AGCGGAGCAG GACCAGCGAG 30 (2) INFORMACJA O SEK NR ^:42:
(i) CHARAKTERYSTYKA SEKWENCJI:
(A) DŁUGOŚĆ: 33 pao zasad (B) CYP: kwas nukleinowy (G) RODZAJ NICI: pojedyncza (D) TOPOLOGIA: liniowi (ii) RODZAJ CZĄSTECZKI: DNA (ci) OPIS SEKWENCJI: SEK NR ID:42:
GAAGACCGCC AGCCCCCAGC CACCGAGCAG CAG 33
Departament Wydawnictw UP RP. Nakład 50 egz. Cena 6,00 zł.

Claims (9)

  1. Zastrzeżenia patentowe
    1. Oczyszczony i wyizolowany DNA zawierający regulatorową, transkrypcyjną sekwencję promotorową dla DNA kodującego ICAM-4, jak podano na Id. Sekw. nr 27.
  2. 2. DNA według zastrz. 1, znamienny tym, że sekwencją promotorowąjest promotor dla ludzkiego ICAM-4 zawarty w Id. Sekw. nr 33.
  3. 3. DNA według zastrz. 2, w którym promotor jest zawarty w obrębie sekwencji od nukleotydu około 1204 do nukleotydu około 1666 w Id. Sekw. nr 33.
  4. 4. DNA według zastrz. 1 albo 2, albo 3, znamienny tym, że taki promotor jest zdolny do prowadzenia transkrypcji polinukleotydu połączonego w sposób funkcjonalny z takim promotorem w neuronach.
  5. 5. DNA według zastrz. 4, znamienny tym, że taki neuron jest komórką hippokampa.
  6. 6. Chimeryczny polinukleotyd zawierający promotor dla ludzkiego genu ICAM-4, znamienny tym, że promotor zawarty w Id. Sekw. nr 33.
  7. 7. Chimeryczny polinukleotyd według zastrz. 6, znamienny tym, że promotor jest zawarty w obrębie sekwencji od nukleotydu około 1204 do nukleotydu około 1666 Id. Sekw. nr 33.
  8. 8. Wektor ekspresyjny zawierający oczyszczony i izolowany DNA obejmujący promotor dla DNA kodującego ICAM-4, jak podano na Id. Sekw. nr 27 albo chimeryczny polinukleotyd zawierający promotor dla ludzkiego genu ICAM-4, przy czym promotor zawarty jest w Id. Sekw. nr 33.
  9. 9. Komórka gospodarza transformowana wektorem zawierającym oczyszczony i izolowany DNA obejmujący promotor dla DNA kodującego ICAM-4, jak podano na Id. Sekw. nr 27 albo chimeryczny polinukleotyd zawierający promotor dla ludzkiego genu ICAM-4, przy czym promotor zawarty jest w Id. Sekw. nr 33.
PL96361105A 1995-06-07 1996-06-06 Oczyszczony i wyizolowany DNA, chimeryczny polinukleotyd, wektor ekspresyjny i komórka gospodarza transformowana tym wektorem PL188612B1 (pl)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/481,130 US5702917A (en) 1992-01-27 1995-06-07 Polynucleotides encoding human ICAM-4
PCT/US1996/009146 WO1996040916A1 (en) 1995-06-07 1996-06-06 Icam-4 materials and methods

Publications (1)

Publication Number Publication Date
PL188612B1 true PL188612B1 (pl) 2005-03-31

Family

ID=23910735

Family Applications (2)

Application Number Title Priority Date Filing Date
PL96361105A PL188612B1 (pl) 1995-06-07 1996-06-06 Oczyszczony i wyizolowany DNA, chimeryczny polinukleotyd, wektor ekspresyjny i komórka gospodarza transformowana tym wektorem
PL96318545A PL188878B1 (pl) 1995-06-07 1996-06-06 Sposób badania przesiewowego pod kątem zmian neuropatologicznych

Family Applications After (1)

Application Number Title Priority Date Filing Date
PL96318545A PL188878B1 (pl) 1995-06-07 1996-06-06 Sposób badania przesiewowego pod kątem zmian neuropatologicznych

Country Status (21)

Country Link
US (1) US5702917A (pl)
EP (2) EP0789763B1 (pl)
JP (2) JP3349514B2 (pl)
CN (2) CN1597950A (pl)
AT (1) ATE224448T1 (pl)
AU (1) AU721316B2 (pl)
BR (1) BR9606440A (pl)
CA (2) CA2288401A1 (pl)
CZ (1) CZ291974B6 (pl)
DE (1) DE69623746T2 (pl)
DK (1) DK0789763T3 (pl)
ES (1) ES2183961T3 (pl)
FI (1) FI970503A (pl)
HU (1) HUP9901123A3 (pl)
IL (2) IL146447A0 (pl)
MX (1) MX9700941A (pl)
NO (1) NO317150B1 (pl)
PL (2) PL188612B1 (pl)
RU (2) RU2155345C2 (pl)
SK (1) SK284161B6 (pl)
WO (1) WO1996040916A1 (pl)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5702917A (en) * 1992-01-27 1997-12-30 Icos Corporation Polynucleotides encoding human ICAM-4
GB9715164D0 (en) * 1997-07-19 1997-09-24 Medical Res Council Improvements in or relating to expression of nucleic acid sequences in cerebellar cells
AU735917B2 (en) * 1997-10-02 2001-07-19 Icos Corporation ICAM-4 and diagnostic uses thereof
JP2001506139A (ja) * 1997-10-22 2001-05-15 アイコス コーポレイション Icam−6物質及び方法
WO2000032140A1 (en) * 1998-11-30 2000-06-08 Ivf Sciences Colorado, Inc. System and sequential culture media for in vitro fertilization

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2080044T3 (es) * 1987-05-04 1996-02-01 Dana Farber Cancer Inst Inc Moleculas de adhesion intercelular y sus ligandos de fijacion.
NZ226414A (en) * 1987-10-02 1992-07-28 Genentech Inc Cd4 peptide adhesion variants and their preparation and use
US5272263A (en) * 1989-04-28 1993-12-21 Biogen, Inc. DNA sequences encoding vascular cell adhesion molecules (VCAMS)
US5264554A (en) * 1990-01-19 1993-11-23 The Blood Center Of Southeastern Wisconsin, Inc. Platelet cell adhesion molecule and variants thereof
GB9009548D0 (en) * 1990-04-27 1990-06-20 Celltech Ltd Chimeric antibody and method
ES2134762T3 (es) * 1990-07-20 1999-10-16 Bayer Ag Formas multimericas de proteinas receptoras de rinovirus humanos.
EP0546076B1 (en) * 1990-08-31 1998-05-20 Boehringer Ingelheim Pharmaceuticals Inc. Use of anti-ICAM antibodies in the manufacture of a medicament FOR TREATING ENDOTOXIN SHOCK
RO115415B1 (ro) * 1991-06-11 2000-02-28 Center For Blood Research, Inc. Moleculă-3 de adeziune intercelulară (icam-3), moleculă adn recombinant care o codifică, anticorpi ai acesteia, metodă de producere a celulei hibridoma, metode de modulare a funcţiilor biologice, de suprimare, identificare, diagnoză şi compoziţii farmaceutice
US5702917A (en) * 1992-01-27 1997-12-30 Icos Corporation Polynucleotides encoding human ICAM-4
JP3616090B2 (ja) * 1992-01-27 2005-02-02 イコス コーポレイション 細胞間接着分子関連タンパク質

Also Published As

Publication number Publication date
DK0789763T3 (da) 2003-01-27
ATE224448T1 (de) 2002-10-15
EP0789763B1 (en) 2002-09-18
NO970546L (no) 1997-04-07
HUP9901123A3 (en) 2001-10-29
CA2288401A1 (en) 1996-12-19
IL120095A0 (en) 1997-04-15
JP2003047493A (ja) 2003-02-18
HUP9901123A2 (hu) 1999-07-28
SK284161B6 (sk) 2004-10-05
WO1996040916A1 (en) 1996-12-19
CA2196431A1 (en) 1996-12-19
FI970503A (fi) 1997-04-04
CN1152960C (zh) 2004-06-09
ES2183961T3 (es) 2003-04-01
RU2000111744A (ru) 2002-09-10
PL318545A1 (en) 1997-06-23
CZ291974B6 (cs) 2003-06-18
JPH10505508A (ja) 1998-06-02
DE69623746D1 (de) 2002-10-24
IL146447A0 (en) 2002-07-25
CA2196431C (en) 2000-08-15
PL188878B1 (pl) 2005-05-31
AU721316B2 (en) 2000-06-29
RU2155345C2 (ru) 2000-08-27
JP3349514B2 (ja) 2002-11-25
CN1164870A (zh) 1997-11-12
EP1308514A3 (en) 2004-01-02
NO970546D0 (no) 1997-02-06
CZ29297A3 (en) 1997-10-15
EP0789763A1 (en) 1997-08-20
DE69623746T2 (de) 2003-05-08
MX9700941A (es) 1998-01-31
SK16597A3 (en) 1998-02-04
NO317150B1 (no) 2004-08-30
FI970503A0 (fi) 1997-02-06
CN1597950A (zh) 2005-03-23
BR9606440A (pt) 1997-09-30
EP1308514A2 (en) 2003-05-07
AU6256096A (en) 1996-12-30
US5702917A (en) 1997-12-30

Similar Documents

Publication Publication Date Title
US5811517A (en) ICAM-related protein variants
EP0619841B1 (en) T-cadherin adhesion molecule
US20060134121A1 (en) DII4 antagonists, assays, and therapeutic methods thereof
US5837822A (en) Humanized antibodies specific for ICAM related protein
WO1995013387A1 (en) Tie-2, a novel receptor tyrosine kinase
CA2245956A1 (en) Monoclonal antibodies specific to endothelial cell cadherins and uses thereof
JP3779989B2 (ja) リンパ抗原cd30
US5753502A (en) Neuron-specific ICAM-4 promoter
CA2315280A1 (en) Method for quantifying denatured ldl
US6040176A (en) Antibodies to ICAM-related protein
PL188612B1 (pl) Oczyszczony i wyizolowany DNA, chimeryczny polinukleotyd, wektor ekspresyjny i komórka gospodarza transformowana tym wektorem
US5773293A (en) Anti-ICAM-4 antibodies and hybridomas
US5989843A (en) Methods for identifying modulators of protein kinase C phosphorylation of ICAM-related protein
AU735917B2 (en) ICAM-4 and diagnostic uses thereof
US20030068659A1 (en) ICAM-4 materials and methods
US5852170A (en) ICAM-4 materials and methods
WO1999047671A2 (en) Dna sequences encoding semaphorin-h and diagnosis of metastatic cancer
US5700658A (en) ICAM-4 materials and methods
WO1999018441A1 (en) Icam-4 and diagnostic uses thereof

Legal Events

Date Code Title Description
LAPS Decisions on the lapse of the protection rights

Effective date: 20050606