CZ214998A3 - Lidský semaforin typu L (H-sema-L) a příbuzné semaforiny jiných druhů - Google Patents

Lidský semaforin typu L (H-sema-L) a příbuzné semaforiny jiných druhů Download PDF

Info

Publication number
CZ214998A3
CZ214998A3 CZ982149A CZ214998A CZ214998A3 CZ 214998 A3 CZ214998 A3 CZ 214998A3 CZ 982149 A CZ982149 A CZ 982149A CZ 214998 A CZ214998 A CZ 214998A CZ 214998 A3 CZ214998 A3 CZ 214998A3
Authority
CZ
Czechia
Prior art keywords
sema
quot
sequence
type
seq
Prior art date
Application number
CZ982149A
Other languages
English (en)
Inventor
Bernhard Prof. Dr. Fleckenstein
Armin Dr. Ensser
Original Assignee
Hoechst Marion Roussel Deutschland Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE1997129211 external-priority patent/DE19729211C2/de
Priority claimed from DE1998105371 external-priority patent/DE19805371A1/de
Application filed by Hoechst Marion Roussel Deutschland Gmbh filed Critical Hoechst Marion Roussel Deutschland Gmbh
Publication of CZ214998A3 publication Critical patent/CZ214998A3/cs

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4703Inhibitors; Suppressors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

• ft • · • ·
176209/KB
criouz r.e senaionnv sena torony, které vykazuj í ; a jej ich deriváty . Vynález my ; DNA, RNA, cDNA) které je i jejich přípravu a použití. io c: α a
V dkmem (Kolcdkir: a j / 9 ' j 3. O 7. d 3 3 '3 O C 3 Ο/0Πί
Mezitím byly klonovány a částečně charakterizovány qeny anebo jej ich části kódu lící da 1 š i seiaaforiny. Doposud bylo popsáno 5 lidských serraior mu d-Seni-III, H-Sema-7, K-Sonia~rv, H-Serp.a-3 a vit Ko..odum a daisi 1993.) ;
Počne a další (1996: Onkogene p? · S u Γ3 r' ti 239 až 1297 5 e k ido a 3 ,3 j_ 5 1 [ [r 9 9 0 ' f Proč. Nati . Acad. Sci. JSA 93; stran _1 Ί 7 , ^ - - / 115; Xí-ar.a a halš i (1995 3λγ,λ^ i rt 3 ; ! 3 3 7' 3 ^7 j 9 3 4 7 / 3 a _ o 3 3la_3i [í:i -'· -··'/ - - · -- *· Máti. Acad. Sci. USA 3 9 t runa 11 /30 až 1 17 3 5; 1 α’ΐΐ ada a aalsi (1997) (přistup islc Ger.Bank A300Q22G; dále 3 myších (M- 1 017 d ϋ až M-Sena Puscnel a ' 71 d _ 5 1 , : .995' J.j » T- i-. ' Z · 3 11 d 71 d 9 4 1 .= a q "Í 7 a další i ; 199 5) Meur m 14: strana 949 až 9 aa 1 š i 7 99o; rEbS Letters 370: s t rar.a 269 až 272; dat ši í1996) Mech. Dev. 57; strana 33 až 45;
Cnristen sen a další 7996] (přístupová čísla Genbank 2 80941, 7 q 3 o 13 ' v slepicích ikolapsm-l až - 5) viz Luo a další ’ '1 0 0 7 j - Luc a daiši (1995) Neuron 14: Strana 1 131 až 740) , a dále k . r y s 1 (R-Sema-lII) viz Giger u aa1s í ( 1 996) J. Comp. V Λ - ' V - 3 .i . 5: strana 375 až 392), popsán y byly dále • * • · • ···· · · ·* • · · · « * · semaforiny ryby Danio rerio, dále semaforiny hmyzu například octoiailky {Drosophila melanogaster: D-Sema-I a D-Sema-II) , brouku Triboliurr. confusura (T-Sema-I) , kobylek Schistocsrca amencana G-Sema-I, viz Kolodkm a další (1993) ), a u nematod C.elegans Ce-Sema, viz Roy a další (1994) přístupové číslo GenBank U15667. Dále byly u dvou poxvirů (vakcicnia viru (CRE-A39) a variola viru (0RFA39-homolog, viz Kolodkm a další (1993) } jakož i u Aleclaphine herpesviru typu I (AHV-1)(AHV-Sema) nalezeny geny homologní se semaforiny, viz Ensser a Fleckenstein (1995) Gen. Virol. 76: strana 1063 až řehied doposud identifikovaných semaforinů různých nvch druhů je uveden v tabulce 1. V této tabulce i sou . dl)** V d.. serr.a torny. používané synonymum (druhý sloupec), druh, z něh uvedený semaforin izolován (třetí, sloupec) jakož i uaaje emu a sou v lučně sekvence vedeny v genových databázích, například v EST (expressed sequence tags - databází exprimovaných sekvencí), Evropské laboratoře pro molekulární biologii sou-li známy! o doménové struktuře kódovaného proti .romczorná lni lokalizaci genu (čtvrtý sloupec) . Dále ;vá čísla, pod kterými jsou př • 1 1
rv- v H 01' ~j _tí 1 ,-m r -r- 27 J ) n ebo v NC3I ( databazi M= árodnihc centra pí blote: dnno) .cgíc ké inf ormace v Marvlandu, USA) a přísiuš: 13 C . 0 0 C p . o ^ ace, ve kt eré byla tato data publ i :<o vána (pá: - V ID _ U 11C ř. : C ti ibu i k y i) • Všec :hny gem ové produkty (semaforiny) dopos ud znám.ýc :h semafc í r inc ) výcn ge nu obsahuj í N-koncový signální peptid, k j ehož C-k onci 3 e př ipojena c harakteris t ická sem a-doména O velikc ''Stí přibliž ně 450 až 500 ammkys e1inovýh zbytku. V této sena-doméně se nacházejí silně konzervativní aminokyselinové motivy a množství vysoce konzervativních cysternových zbytku. Jednotlivé sema-domény následující C-koncovou sekvencí, která sestává z se liší jedné nebo
• * * · • ♦ · · více domén, V této C-koncové oblasti sekvenc se tak nacházejí například transměme ranové domény ;TM , domény podobné konstantním oblastem imuncgi obul inu : I o , cytoplazmatické sekvence (C F1, signální peptidy pna další zpracování (P), jako je například konvenční sekvence RXR, ve které R znamená arginin a X libovolnou aminokyselinu, a/nebo hydrofilni C-koncové oblasti ;H:1 . Na základě rozdílné doménové struktury v C-koncové oblasti je možno rozdělit doposud známé semaforiny do něko1 ika pcdskupin (I až V; : r searetovany domény· , na: ig, γμ, ? p m r~·. r sexvenci IV Ig, (?) , HP; s e k r e t o v r, v rt-seraa- 11, M-sena-^, GDiSS l 1 1 Π a' kolaps in-1)
V Ig, TM, CP membránově ukotveny s C t rombospondlnovým motivem sema-X a -G.:
Receotor nebo 1 ovane. co seta:·; nebyl dosud popsán. V souvislosti však popsány ir.trace luiárni, to komplexy vázayíci GT?. Jako ani komplexu byly u kuřat popsány (protein zprostředkuj ící odpověď Response Mediator Protein), které na senia ior i nem indukované intracel-lurni {Goshima a další (1995: Nátuře /"l: st Například protein CRMP62 vyka tu' e y,;mo kop sema ,n 1", ^ (m 'rR Vf p — £ r i r- r p r n i 514' . • * 3 3 / což je c r ... p. in nemá t od, kter ý je nezbyt ný pro oř 3 d *- továny r i 4- o ·._ axo m a. Je rovněž znám lidský protei .n s 98 z 313 1Γ:0 kyselme vo:; n: : i tou vzhieae.m k C sil? 62 (viz Hama jma a a a _Š 1 ilSlc·: G 6 0.1 e 1 3; 3: strana 157 až 163) . Rovněž u krys by -- '•‘m' poesáne něk ol_ t genu příbuzných S CRMP (viz Wang a Gá lš ί i1996;, Neu ros r* i m j l . 16: strana 6197 až 6207. ,^1 <r v m n var.é Γ P O·:·3 K' o 0 3 03110 :ranové ser aaforiny t* m y- -· .-- p- i— ,j· ,·* ^ 1 ' η τ r no q U1 3 mi signál pro ros touci nervová vlákna. Kr č. ' roli ve vý' jo j: centrálního nerve váho systému (CNS) a ] ^ ou exprimov any ve V 5 šech svalových a n ervových tkán: i_ c h (viz Kc loa km a d — - 1 5 ‘93: a duo a dal ši (1993), C ell 75: 3 3 y~ 2, ^ 3 3 L 3 3 - Krčme v CMS lz zřetelnou expres : semaforinu i l-seras-G ('Λ, zc r ovát rov; ‘něž u - ymfatickýeh a he: aatopcetických buněk. Ga prc ti tomu se : j - ěl doze buněk neoeda: rilo prokázat expresi ν' 3 Imi ΟΓ1003 Π 3 ηχ 0 3 3 dOI 1 Γ10 M — 3 03lďl1' \ viz Furuvima a další ?c □ - j L^Uii t ' ‘7 v Ί X Ί % 3 ** 3 - 1 ..i -J U I U. b- -J --J m ‘-.I _L ) semarormy n-oeia-iv a --berná-v 3 to v cr.romcncma mi ooiasti 3p21.3. Je že různé delece v této oblasti jksou asociovány s brcnchiáinimi karcinomy. H-sema-IV (viz Roche a další i 1996:, Klane a další. (L99ó) , Sek:do a další ί 1995) ; )0¾ identický s Μ z ol ine sema-Ξ, žati mco K- •sema-V (vis Sekido a da iší (1996:) přímým herno logem semamrinu M-sema- A (s hoda v 86 η -ί : v-i ,-· h- · , p; ar ' p. ' ; meu ke s uureO-ios t ’ , 7 6 3 V • „o cf*-*n / ι-os] IV a K-Sema-- v C'/1 V objeveny v průběhu pro j e ktu sekvenov ΙΝΑ v deletovaném 1okusu 3c21.3, je jejich exon-intronová struktura dobře známa. Oba geny se exprimují v různých nervových i ne-nervovýcn tkáních.
Rovněž teprve nedávno byl v lidské povrchové molekule GDI00, exprimované na indukované na povrchu aktivovaných T-Ivmfccvtu, iier.ti tikován semafcrin ; v i z tabulka 1) . Tento • · • · * · · m m •· · · »t ‘'"árorir. podporuje interakci B-buněčného receptoru CD4 0 s ^Povídajícím iigandem CD40L. CD100 je glykoproteinový dimer ' '«s- ι.·:ο3οi IbO k.Da zakotvený v membráně. Je popisována ^-iciace cytcplazmatické C-terminálni části proteinu CD100 s dcsud neznámou kinázou (viz Halí a další (1996) ) . Tak je pnctein CD100 prvním a dosud jediným semaforinem, u něhož se pocari ;.c prokázán jeho expresi v buňkách imunitního systému. V rámci řešení projektu „Transformující geny fncinovirú" byl klonován s sekvenován celý genom A-ec_arimhc herpesviru typu 1 (AHV-1), viz Ensser a další 'ÍaQb) , virus AKV-i je původcem vážné, život ohrožující xatancké herečky, která je zpravidla doprovázena tymioproliferativníiu syndromem, který je jedním z nesnesespěšnějších onemocněni různých hlodavců. Při sekvenačni analýze byl na konci virového genomu objeven otevřený čtecí rámec se vzdálenou, ale stále ještě významnou monologii s jedním genem vakcinía viru (gen QRF-A39 odpovídá enu VAC-A39, v '12 Er isser a další (1 995), . J. Gen. Virol. 76: trana 1063 až 10 6 7; . Tento gen. vakcinia viru byl zařazen do eneve rodiny lo 0 T: 5. orinů. Zatímco gen pro AHV-1 senaforin AHv-sema'.· vy! \ d. Z U Ί 1 s dobře konzervovanou semaforinovou strukturu, jsou genu poxvirů (ORF-A49 a homolog ORF-A49, viz tabulka 1: zkráceny na C-konci, to znamená, že mají zachovánu jenom část konzervované sema-domény. Při srovnávání stanovené sekvence AHV-sema s údaji v databázi dbEST (EST- databanka exprimovaných sekvencí) byly r.a_ezeny vřav 2 EST sekvence ze dvou nezávislých cDNA klonů z lidské placenty (pod přístupovými čísly H02902, H03806 (klon 151129), a pod čísly R33439 a R33537 (klon 135941)). Tyto sekvence vykazují ještě zřetelně vyšší hornologii s AHV-semaícrinem, než s dosud popsanými neuronálními semaforinv. • *** > · · * Μ ·* ► · · ρ · * · ♦ · ♦· • ♦ semarormy 3 rvi W U / '10 3 ovou siruki; :r ", s " κ· zí θά iim systému (semaftrz. O 7 orinv oodls V’ v 11 dl vu V du tď ΊΟ biochemickou tunkci v imunitním systém označuji jako semaforiny typu L (sema-1) . Obsahu] i M-koncov signální peptid, charakteristickou sema doménu a v c-kcncov oblasti proteinu obsahuj i doménu podobnou, iziur.cg 1 obulmúm hydroróbní doménu, která pravděpodobně představuj transmerabránovou ohlase . (kb Délka signálního peptidu je obyčejně menši neč aminokyselin, ve výhodném provedenu vynalezu men aminokyselin a více než 20 aminokyselin, ve výhodné provedeni vynálezu více ne; orevec rozmezí oa ^ vynálezu je signální peptid dlouhý h! aminokyselin, znamená, že mezi ami no kyselinovýn zbvzkem i a a 4^ 3 e mi sto pro peptidázy •ρ : ,-νη n ^ c r. ρ e ρ - -Ί1 Dé i ka sema domény muže O v V v rormer i ·: ·· : y s e j, i n do 7 00 neb c v i c e amvrv -j k. y selím, v 7 lení vy nálezu od 400 do pr. ^ C 1 l u Π mt 7 7' 0 um1 no sv ri H’ i ,!·.£ - orovecier. Výhodné jsou sem i-dorcér.y o dé ice od 450 do 55 zvláště výhodné pak sema -d oméuv 0 delce aminokyselin. Ve zvláštním pr 0 vedeni vynálezu navázána na signální peptia, p; a omen Délka domény podobné imuncglufcui mun muže c; přibližně 30 do 11.0 aminokyselin. Výhodné jsou délky domény mezi 50 až 90 aminokyselinami a zvláště vyhov pak délka přibližně 70 aminokyselin.
Transmembránová doména může být dlouhá přibližně 35 aminokyselin, výhodná je délka od 15 do 30 a z výhodná je délka mezi 20 až 25 aminokyselinami.
sena) patem; /
η ΌΠΟΙΟ cč eo~ VyTi a 1 e z11 JSOU sena fo rmy • f ' - d * měna sena *- ·'" y~ u, ^ my obra "lov cu, napři - a / hne - y f ci: mm 1 pan s g n .af o r i n y s . ^ U / V rys 1, kra Líc 1, psí, kO'Č. LČl , ovčí :e, vm v asečí, a z v láš tě vý 'hodr. .ě pak se my S 1 . Předmět en vy r.ález • · *1 J s 0 u rovna 0 r ' r.y rv 1 '· · m,· ’ .11 _ d- ~ ^ '•j V- -f Γ. — .d. - LÍ td. / ze; i měn a P semaronnv výnodnér" aminokysel o U : a ve : než například programové WI, 1991), a/nero viroví zejména pak člověka. tra n s 0.0 nic- r a r. o' uvedene v taou. necc :r corgan;snu , například serr.aforiny, například semaforiny mrkroorgan proveden i vyna_ecu ; sma-Ld , kte ry sestává amen ; ccatone ; domény. ve z v _ = s z n ok yselmová sekvence P0 íi . 'i r, ’ Ji r-·. p. v-'. ' c ' ze semafor ř yy ty y y y y : 13 S 11 5 βΓΓιΟ - než 40 1, 0 ' V [I C CUL e v y S S žení vyšší ne 60) ide ^ lammizy; se lir. v 4 5 sira formy b llzce cřícu r myši semafor my )u shodu 1 vyšší než cě v/hcanez 1 provedeni e odpovídající lidský ze signálního peptidu, i o on.·:1' o 1 00 a 11 nun a 101 provedení vynálezu semafor inu sekvenci •domény anti.no kysel i novou 1 než 50 i a ve zvláště ntitu vzhledem k sema-až 545 v tabulce 4) , .znych druhu (například ) mo h o u v 7 k a z o v a t 70 i, výhodné vyšší než lni stanoveni hcmologie lze spočítat j 0 součásti vvna.ezu zmoci programu GT >?, kterv balíku GCG (Genetic Compu ter
Takovým proveden mm vynálezu je oc rm (M-semamd Tento semaforin ^ 1 uo Ipovldajícl myší . « « i · • · ♦ · * • « · t · * Μ ·» ·· * · *· • » #·· · * • · · · ., *· ·♦ částečnou aminokyselinovou sekvenci podle tabulky 5 (myši semaforin M-sema-L).
Vynález dále popisuje semaforiny, jejichž aminokyselinová identita dosahuje pouze zhruba 15 až 20 1 (je-li o tána v úvahu celková délka proteinu) u málo příbuzných druhu (f ylogeneticky vzdálených), ve výhodném, provedeni vynálezu 25 až i a ve zvláště výhodném provedení vynálezu identita dosahující 35 až 40 i vzhledem k aminokyselinové sekvenci H-sema-L podle tabulky 4.
Geny kódující semaforiny typu L mají komplexní exor.-ir.tronovou strukturu. Tyto geny mohou obsahovat například iC až 2j exonu, ve výhodném provedeni vynálezu přibližně 11 až 13 a ve zvláště výhodném provedeni vynálezu 12 až 16 exor.ú a k tomu odpovídající počet intronu. Mohou vsak rovněž obsahovat stejné množství intronu a exonu jako gen H-sema-L .13 nebo 15 exonu, výhodně 14 exonu). Zvláštním provedením vynalezu je genem gen pro H-sema-L. Tento gen má výhodně délku 3.353 až 10.000 nebo více nukleotidů. Gen pro lidský semaforin. výhodně obsahuje nukleotidovou sekvenci uvedenou v tabulce li nebo sekvenci, která je uvedena v databázi Geo.3ank$ pod přístupovým číslem AF030697. Tyto nukieotidová sekvenc gen pn se kver. e obsahuji alespoň 13 intronu. Kromě toho obsahuje > lidský semaforin na svém 5' konci další doplňkovou i. Tato doplňková sekvence obsahuje popřípadě další xódujlci nebo nekódující sekvence, například jeden nebo dva is : mířen 1 r espektive exony.
Pokusy o chromozomálni lokalizaci lidského semaforir.u typu L prokázaly, že odpovídající gen se nachází v pozici 15q22.3-23. Obdobně byl lokalizován i gen pro semaforin M-sema-L v poloze 9A3.3-B. V důsledku komplexní exon-íntronove Stavby muže být primární transkript semaforinové mRNA ruznvm způsobem sestřihán, z čehož vyplývá možnost vzniku různých sestří nových variant semafor mu. 7, těchto alternativně
• · » · • « · · sestřihaných transkriptů vznikaj lei proteiny : sou. deriváty semaforinu podle vynálezu. Je;ich amine kyselinová sekvence a rovněž i doménová struktura odpoví ta; i cop sanic?. s semafor.inum typu L podle vynálezu, nicméně jsou prcci nim zkráceny. Může například docházet ke vzniku sestřinových variant, kterým zcela nebo částečně chybí cransmembránová doména. Derivát semafor -L, . LlI / ^ í 1 h '/Ώ u C Θ ' ď tra zsnembr a nc vá doména nebo jej í část, a i e obsahuje signál ni peptid, muče být sekre továr, a diky tomu působit lokálně ve vnějším, prostředí buňky nebo i na větší vzdálenosti, například no ] me oun sekvenci kóduiící /. Jiná sestřtneva varianta muže r.acp kódující signální peptid a popřípadě hydrofóbní aminokvse 1 lnovou se kver.·; s eavenci a 0 n a ai představuje pote :ono i. e r. dí membráně ani nedochází k jeho sekreci. K jeno vylučování může docházet pomocí sekřečcích věsí kulu. Takový derivát semaforinu se muže podílet na nit robuněčných crocesoacb například na signálové tr.ar.sdu.kci. Tímto způsobem mohou byt molekulami se stejným základem. · semaforir.sm typu L: a z něj odvozenými deriváty (například sestřihovými deriváty' regulovány rozmanité intra- a extracelulárni pochody a/nebe mohou být spolu harmonizovány. J edním pro v CTi Γ* e n í i?. vy nálezu ; sou i ema rc )rinové ' derivát j t kie } sou Odvoz ti .y od emafo r: .nu typu D podře vynalez -1 r K L 1’ y A V S 5 K V HC Θ z ; ne ri· sánu ’ _ nebe· :x sanuj i ΓΊΘ lus i n η 11 l Γ a nsme mbrén ovou dc menu. V ynáíe z dá ie popi _ S L ije se: mulo runové derivát y, hne ré jsou odvozeny od semaforinu typu b podle vynálezu, které však neobsahují signální peptid.
Signální peptid muže byt rovněž po s t-1 r ans i ačnš odštěpen. Tím v zni ká membrán:'/·/ y TM-doménou'1 nebo sekretovaný (sestřihová varianta cer iM-v:neuy sematonnovy * · · · * · · · derivál se z krace zpracovaný děravá doménu, Iv-drnenu dcméncvcu strukturou. Tímto způsobem emaforinu pak obsahuje pouze sema-cřicadě transxeiri:·ránovou doménu. Místo oddělení signálního petidu přímo na konci signálech vzdáleno 4 0 až 50 amine kyše se muže pak například nacházet peptidu, může být například in cd N-konce semaforinu. ' ^ A kovy, který tnich semaforinu, L liš í v tom, že i (větší než 90 t) :u sek1 věnci, která obsahuje menší počet demen; se od ostí které nejsou odvezenu od semaforinu typu vykazuje vysokou aminokyselinovou homolog a nebe obsahuje identickou amin:·kyselinov 'α Ί
3 ΘΓΓ. a i o r i n v o oasových ΓΠ. 1 b U . 7 vTl d„ ec popi: su j 3 3 U JÍL Čl ’ - J —1 .: V / U n i c hž se konvenčni mís ta 0 JT v .•v Ί '> ... ykosyi ac i na Á ” -A’- 1_ na poz i c i. c h 1 /η [y a C, A L P ! J- 0 J / ct c. h tj -J' - t — 3C ) a 602 ccd( Le adiir .o k vsel lnové set -/sr.cs semaforinu H- sema-L \ v i; ta bulka • Kro ně toho mohou byt s i tfh Ud z_ '/ l_V '-X J_ O vynál 0 ^ u po uži ty ve formě ]ejich rosfo: rylovan v ί c h. d λ v- ' i. vátu. u Sema f o r l u y moh '-j u o y l, substrátem mnch a ru -· y- k má i, '-, .s :r ’ Sil inu n ou obs anovat konvenčni se kvetu e pr: fw' — , -v Li : i" y Ť Τ': 3 7. L1 b / ty ros in kin ázy a/nebc kreatir. kiná. ty r. Dá 1 e mohou semaf or my pod 1 P vyn álezu obsahovat am inokys e' l i nc jV ou kotven ční s etv venc i- P ro myr istila ci. Na těcht o· mis· ώ ch r*\ = v rpL' ' rz d d1 o c h á z e t ke v z n i k odp oví dai ícich myristi 1 -der( . ’-i a tu 5 em a fo r m LU y řďr\ a formy typu Í po d: ' P v. / r„ ď 1 cd ** 1 ’ 3. její' ch der ivá ty moh o u bý z ve formě mono π :;e V 1 · ‘ l-·*· f d i meru d , ! nebo o Í ige >ner U
Napři-;_ai se mohou dva nebo více semaforinů respektive je:ich derivátu navzájem spojit intermolekulárnimi dtsui.: i iicxými můstky. Kromě toho muže docházet rovněž ke vzr. i ku intramo!skalárních disul fidických můstku.
Deriváty semaforinů typu L podle vynálezu jsou dále iuzní proteiny, různím proteinem se rozumí protein, který kromě semaforinů rýpu L anebo jeho částí obsahuje ještě další peptid nebo protein, respektive jeho část. Takovými peptidy nebo proteiny popřípadě částmi proteinů mohou být například epitopové značky (například His-Tag (6xhistidinový zbytek), značky Myc a flu), které se používají k purifikaci tužní ch proteinu, nebo j i né, které se používají ke značení fuzních proteinů, například GF? (zelený fluorescenční protein:. Příklady takovýchto derivátů jsou mimo jiné konstrukty popisované v Příkladech provedení vynálezu. Sekvence těchto konstruktu jsou uvedeny v tabulkách 7 až 15. vynalez dále popisuje nukieové kyseliny, výhodně DNA-nebo RNA.-sekvence, které kódují semaforin typu L podle vynálezu a/nebo jeho derivát, například odpovídající geny, různé seszřihove varianty mRNA, korespondující cDNA jakož i jejich deriváty jako jsou například soli DNA nebo RNA. Deriváty podle vynálezu jsou například sekvence nebo jejích části, které byly pozměněny pomoci technik molekulární ie pro konkrétní účely, například zkrácené geny nebo části genu (například promotorové sekvence, teriainázorové sekvence), cDNA nebo jejich chiméry, konstrukty určené ke ui ono váni, exoresi a jejich soli.
Vynalez dále popisuje genomové sekvence (geny) pro semaforlny typu L. Vynález rovněž popisuje sekvence intronů, axonu a sekvence regulační jako jsou například sekvence promotoru, enhancerú a s.ilencerů.
Takovým provedením vynálezu je například gen H-sema-I, a jeho aer:váty. Jedním z provedení vynálezu je gen, který
-12- • · * ** ♦ · * » » « * ·* ** · · * m * ··
obsahuje nukleotidovou sekvenci uvedenou v tabulce 14. Dalším nožným provedením vynálezu je gen, který obsahuje nukleotidovou sekvenci uvedenou v databázi GenBaakb pcd přístupovým číslem AF030697. Dalším příkladem tohoto provedení vynálezu je qer. M-sena-I. respektive jeho deriváty. Dalším předmětem vynálezu je cDNA pro H-serr.a-L nebo její deriváty (například části cDNA). Zvláštním provedením vynálezu je cDNA pro H-sema-L s nukleotidovou sekvencí uvedenou v tabulce 2. Dalším provedením vynálezu je cDNA pro H-sema-L, která je uložená v databázi GenBankT pod přístupovým číslem AF030698. Předmětem vynálezu jsou rovněž m?.NA cdpovidajíci uvedeným cDNA respektive jej ich části. 'iNT l
VT-
LiaiSlZu yΓΟ'V0C0Π 1IÍL VVridiGZU Ί G jej i deriváty (například části cDNA). Zvláštním provedením.
vynálezu le částečná cDNA pro M-sema-L { } sekvenci uvedenou v tabulce 3, jakož i další cDNA, které tuto částečnou obsahuj i. Da i šiti provedením vynálezu je cDNA pro M-sama· která jo uložená v databázi GenBankT- pod přístupovým čís AF030 699. Předmětem, vynálezu jsou rovněž m?.NA odpovídá j uvedeným cDNA respektive jejich části. rmc nu vynalez rovněž popisuje aiely a/neoo jednotilve vyskytující se formy genu/mRNA/cDNA, které se od popisovaných semaforinových sekvencí podle vynalezu liší pouze nepatrně a kódují přitom identický, nebo pouze nepatrně odlišný protein (t.j. takový protein, jehož aminokyselinová sekvence nebude vykazovat více než 10 1 odlišných aminokyselin). Dalšími, deriváty sekvencí podle vynálezu jsou konstrukty popsané v Příkladech. Sekvence těchto konstruktu jsou uvedeny v tabulkách 7 až 14. Vynález dále popisuje plazmidy, které obsahuji DNA kódující semaforin typu L nebo jeho derivát. Takovými * · * Μ* • * 1 • # ' t t · I · · 1 »· Μ • « * «« ·· plazmidy mohou být například plazmid s vysokými replikace lni rychlostmi, které jsou určeny pro amplifikaci DMA například v E. coli. Předmětem vynálezu jsou rovněž expres ivni plazmidy,· které umožňuji expresi semaforinú nebo jejich části či derivátů v prokaryotních a/nebo eukaryotnich expres ivr. leh systémech. Mezi takové expres ivni plazmidy patři i takové, které obsahují konstitutivní nebo inducibilní promotor.
Vynález rovněž popisuje způsob přípravy nuklecvých kyselin, které kóduji semaforiny typu L nebo j ej i ch deriváty. Tyto kyseliny (například DMA. nebo P.NAi mohou být například syntetizovány chemickou cestou. Zejména mohou být
:o :: o ·. a : CCU takové r.ukleove Kyseliny cDMA nebo jejich části! ampiifikevány pomoci ?C! specifických primeru a vhodného výchozího mater templátu (například za použití cDNA pocházejí tkáně nebo genoinové DNA) .
Konkrétní ořiklad ořípravy cDMA kódující JSOU uve p ^ \J ' V r“\ v- 7 n působ Τ', V*· ípr a Ί 7 5 ΘΓο. .5. f 0 Γ jej icn de Γ i. V Út y mo se nu kle ova k V S e li na s . i U .. ·/ krf- v vn a i e: sekvencí, kódující semaforin kypu L nebo jeho deriva: nakloňuje do expresivniho vektoru a tímto rek omb i r.ar. z r. ir vektorem se transformuji vhodné buňky. K tomuto účelu Izí například použít prokaryotní neb o e u k a r y o t n i fc u ř. k y
Semaforiny typu L nebo jejich deriváty mohou nýt rovně', popřípadě připraveny chemickou cestou.
Kromě toho mohou být semaforiny typu L nebo jejrc: deriváty exprimovány jako fúzní proteiny, například proteiny nebo pepr.idy, které umožňuj i důkaz exp:imcvánoc fúzních proteinu, například tedy ve formě íuznthz pr :zein • · uores ku :1.71 vynálezu mohou by * * ·*· * · ·* · #·· * · · · * · I · » * ·*· # * * · · *··· ·φ· *· *· Μ ·· ·* t«
: 1 Γ.βΓΠ ( GFP >emaforiny podle ’ jako f ú zní v i c e r. a 3 ODC.OU a/nebo His6 ůsobem bude snacíOu i naprikiad se onač ho u Myc- a/r.eco uist> a/nedo se značkou f lu. Podle tchc, jakým způsobem bude semaform exprimován, mohou být použity nebe sestrojeny vhodné piazmdy, ! jj. dtcii.y . „Nc naklonevány kódující GFí o n k r é uvádějicíc: konkrétním i y~ — Z b b α nuΊ1 56 kver.ee DNA ko dur í; 5 í ) y y <iad mehou b V L·, 5 6 0 V 0 Γ. 0 0 .k :o duj ICi C) o i ^ zmidu, který obsahu j e DNA a/ nebo kódujíc L epítepovou znač ku, a / z iebc Hi s ό a/ Γ. 0 t '5 5 0 Γ- V 0 Γ: C 0 se Ί. Γ: ^ sekvence nouzite serve :lu. ivedeny v příkladech a v tabulkách venoe, popřípadě v odkazech ke vyoa-ez aa_e pep: vážou, respektive jsou schopni jejich deriváty nebo jej ich časti polyklonáiní nebo m imunizací myši, králikt s e m a i o r in y t y p u L, rhou být například niv _ -.j b ru y / ooznat ~7A TT iklonaim. protiuátKy, y> V *'. -r ,—^ rr.,“' ' J ' ^ J — - f S 1 0 O ]. 5 d tl d k 0.0 V-, r O V — y n ^ rt. ou ZUTU r e n v epiccpurn, 5 0 S C dVal ICI.Tl 2 kyselm ových sekvencí na po z i. c i c 0 ]_ 79 až 323, sne kfive - 130 až r C r, 5 6 hV v· snce H-se.m ia - L pcdl e tabuh 0- , „ Λ né. i 05 rcV" ěŽ COC1 5 u ~ e t a k o " r ,u\ 7^'*';,' -o / J ·— — Ku l jn r y O y dγ y s o e c i f i tkveh stek proti semaíormum typu L, které zahrnují použiti uvedenvch eoitocu. v--, v ·
Vynalez dále popisuj e způsoby přípravy protilátek, při ni cín ž je výhodně použit fuzni protein, sestávající z epitopu charakteristického pro semaforiny a epitopové značky, která slouží k puri ťikaci tohoto rekombinantniho fúzního proteinu. Takto přečištěny futr.i protein muže být následně použit pro imunizaci. K přípravě rakového rekombinantniho fúzního proteinu je třeba zkonstruovat odpovídající rekorabinantní
expres ivři vektor a tímto vektorem infikovat vhodné buňky. Z těchto buněk je poté možno vyizolovat rekombinantní fúzni protein. Při přípravě takovýchto protilátek podle vynálezu lne postupovat způsobem popsanými v příkladu 8.
Tyto protilátky podle vynálezu mohou být použity například pro purifikaci odpovídajícího semaforinu typu L, například prc purifikaci H-sema-L nebo jeho derivátu. Purifikace muže byt prováděna pomocí afmitní kolony. Protilátky mohou být rovněž použity pro ímunochemické stanovení proteinů podle vynálezu, například v ELISA testu, Ά1 e s t e:
CaCtU :kv mohc a/neoc imunomstocnemickem stanovu : V t Hěl ale ; užity analýze exprese s 0 rrLd z 2' r ir. u H-sema-L v různých typech b uněk a různých blir. iiniich. c2NA pro H-sema-L má dél i u 2 63 6 nukleot idu, viz Γ -h b 11 ] k a 2 Genový produkt této H-sema-L cDNA má délku r^i v- i i-'. ; - ^ *Λ o 666 aminokyselin, viz t a jo u i k a 4 a \7\iV λ ·7 11 -i ea y J 11 “ - “ j - '/""C ' 1 '· doménovou strukturu semaforinu typu L Genový lýj ι"1· i'*'11) ,·- sáhuje N-koncový signáin i oeotid (ami no k / 5 íB L ^ Π 0 V Θ zbytky ! až 44), sena doménu (aminokyselinové zhv přibližně 545) , a imunoglobulinovou (Iq) doménu (přibližně aminokyselinové zbytky 550 až 620) jakož i sekvenci hydro řóbr.ícn aminokyselin na C konci,. představuj ieí potenciální t ransmeir.br áriovou doménu. Jde o membránově asociovaný glykcprotein nove podskupiny, pravděpodobně lokalizovaný na povrchu buňky. Na základě ze stavu techniky neznámé doménové struktury, mohou byt semaforiny rozděleny do ví podskuoin:
I II Ic sekretované bez dalších domén (například ORF-A49) sekretované (bez transmembránové domény), naořiklad AKV-sema • ··« • « * * φ · -Ita
li I Ig,TM,CP
IV Ig, ( P) , HPC
V Ig, TM, CP
VI Ig,TM membránově ukotvené s cytcpla sekvenci (například CD10Q; sekretované s hydrzřilni C oblastí (například H-sema-III, kolapsin-1) membránově ukotvené s C-kor. t r o rub o s p o n d i n o v ym moci v e m ( sema-F a -G) membránově ukotvené ír.aořikiad M-sema-Id
Neglykosylovaná, ne š t ěpe n á neupravená forma H-sema-L má vypéct přibližně 74,8 k.Da ;74823 Dalcor.u, Pept.ide Sort, součásti balíku GCG) bod činí pí = 7,56. a post- . - ^1 1~ V* ·*- r’,y^| -· ’ Vvocčtenv esce
Možné místo pro odštěpení signa nachází mezi aminokyselinami 44 a 45 < tabu byl vypočten pomocí programu Signál? http://www.cbs.dtu.dk/services/Signal?], který je z technologii neuronových šití a slouží k analýze s sekvenci (viz Nielsen H. a další (193?), Protein Fn 10: strana 1 až 6). Z toho vyplývá i molekulová štěpeného, post-translačně upraveného signálního peptidu), která ~e 70,3 kDa isolektrický bod, který se rovná 7,01. i \ p rc: i' p
Genomová struktura genu pro H-sema-h podrobně známa. Gen pro H-sema-L obsahu]e více exonu, výhodně j 4 exonu a 12 nebo 14 13 intronu. NA základě této složité exru-m jsou možné různé varianty sestřihu. Trat.sk: II-sema-L byla pomocí Nor Lhern-bíotu prcka c ne: ana * - - * « * * < * ? ·«* ♦ I Μ · I ·· > · * * * * · · f « ··*· « * m φ · «··· φ φ * ·♦ ·· ·♦ f* ·· p^aze: žádná ' P1 ir excrese 'lavr.ich žlázách, thymu a ve slezině. Naopak mRNA prokázána v buňkách nervové nebo svalové možno p zvaž zvaz za důkaz specificky regulované
Dik v alt; ormy H-sema-L s .ohcu 1— >“ pz, '— ν'· ·-> li v cdob ně, ja ko j e 1 7- ^ Γ- nativního ses z o rmy H—s ema-o, anai laoivmxu : intra-cvi -střihu mohou vznikat rovněž jplazmatickými sekvencemi. Ty .ulárni signálové transdukci, u CD100. Dikv mechanismu . v logické virovému AKY-sema. Analýza nuklectidcvých a aminokyselinových sekvenci tyla provedena pomocí programového baíieu GCG (Genetics Computer Group, 1391, verze 7, 575 Science Drive, Madison, Wi ster. sir., 53^11, G1A pr z gramu PASTA ,?earsor. a Liprtian ;19ic'; Proč. Nati. Aca-d. 5 c i. 15, : . U 1 ci-llu. 6 6 až trana 4 rovnáva: ; a: a c i. li a / 5 _ r a * - ct u_ o* a 4 a ú. / a ates ·;1993) Nat. Genet. 3, strana Hal ς - \ QQ n \ y Mi"; 1 * R ΐ O ? 1 6 ; programy byly rovněž použity při sekvenci v databázích GenBank yL' 'J _ J Λ. jo t _ .d i icr.i modifikace semafor inu K-sema-L, jako bo mynsti_aoe, jsou rovněž možné. Pomocí Z C Γ Z Z Γ cLZlG V 0Z.C íjgg U v 1 V V UUu-Cíl' ca^iku G' re o y I y v pozicí ys elinové s0 Vysnes H-sema .onvenční sekvence oro Κ (podle tabulky 4; glykosylaci. Rovněž T.v r i. s ” z 1 a c i r a o ozL: ' a *. Kromě toho obsahuje sekvence H-sema-L několik konvenčních sekvenci pro potenciální fosforylaci různými kinázazii. Z toho vyplývá, že H-sema-L muže být substrátem pro různé kinázy, například pro krcatin kmázu 2, Z Σ 1"' H to. ’ ό 1' ' - -r · Γ t; ^ / v,'*·. ‘O Lf * tol v > ’ (kenvenčn i sekvenc A, G, C, M) ~ ( ?) ) několik konvenčni na^ezerzy av konvenční sekvence pro pro 4, „j9, 271, 493, 4 99, 502, 654 IB, D, R, K, Η, P, F, Y, W) x i S, T, Ι; v - / - i a i. i -i -18- * * • «I» * * t · · I » é · * »·
* *· I » M t · · · * # · « · • # · · * · * V · * M vředpckiádaná místa pro fosforylaci kreatin-kinázou 2 (konvenční sekvence Ck2: (S, T) x2 (D, E) , Prosíte, GCG) byla nalezena na pozicích 119, 131, 173, 338, 419, 48 1 aminokyselinové sekvence H-sema-L. Předpokládaná místa pro fosforylaci protein-kinázou C (konvenční sekvence PkC: (S,T) x(R,K), (Prosíte, GCG) byla nalezena na pozicích 107,115, 190, 296, 350, 431, 524, 576 amir.okysel lnové sekvence H-sema-L. Předpokládané místo pro fosforylaci tyrosin-kinázou (konvenčni sekvence:(R,K)x(2,3)(D,E)x(2,3)Y), (Prosíte, GCG) byla nalezeno na oozici 205 aminokyselinové sekvence K-sema-sekver.ce jsou uvedeny v j edno-pí směnovém ro ammoovsí cceriscický íntegrinový RGD (arginin-glycin-
ZlO ^ i v so n a c [ i a z i na pozici z 6 / , Místa pro ykosyláci jsou mezi virovým AHV-sema, H-sema-L a M-sema-L :námo) dobře konzervována .
izace něco oí igomen zace semarormu h-sema-3 je popsaná u jiných semaforinu, napřikla CD100, viz Halí a další (1996;. o i m nez
Molekula CDÍ00 je membránově ukotvený, g1y kopro t e i no vy o velikosti přibližně 150 k.Da. Nicméně molekula CD10C “Ince příbuzná s lidskýma semařorinem podle vynálezu částečná cDNA sekvence pro M-sema-L má délku 1195 nukleotidu. Tato sekvence kóduje protein, který má délku 394 aminokyselin. Těchto 394 aminokyselin odpovídá aminokyselinám 1 až 394 v proteinu H-sema-L. Signální peptid dosahuje v M-sema-L dé.iky 44 aminokyselin co je stejně jako L·’ rovne z na aminekyše ně 4. a -19- -19- ι φ « · % I * » I * * i Μ ·» » I» · Φ 4 • * t · « 4 φ t t φ • · I Φ Φ I · Φ « Φ I dosáhuje až do konce, respektive přes kzr.ec sekvence uvecer. v tabulce 4,
Mnohonásobné srovnání sekvencí byle převáděno pcr.cc programu ClustalW (Thompson a další, 1994). Takto srovnán sekvence byly dále zpracovávány manuálně pomocí program. Seaview (Galtier a další, 1996, Comput Apel. Brosci 12 strana 543 až 548) . Fylogenetické vzdálenosti byly rovně vypočítány pomocí programu ClustalW (Thompson a další 1994) .
Ze srovnání prote lnových sekvenci . ze stavu techniky i nov; ých a z jejích fyi v y plývá, že jedno tlivé semafor ir.cvé gem zá kládě 3 e j ic:h tylem er.e t ic ke p řibuzm př irozeně rozhoduj lei rolí Ol ; ménova st C á stí. Dí . ky tomu ] sou s ι s ema foriny ze 7 7) ravidla f ylogen< eticky blíže příbuzné ni zných p odskupin. Rovn ěž zde nraje rom sena: tvmcrenetzcKe ana_v. niko. byl konkrétní semaforin izolován, to odpovídající druhy fyicgeneticky příbuzní l provedena rvicgenetzc/.ě ar.aryzy i v i z ccrazes o známých aminokyselinových sekvencí semaforinu (byl srovnávány celé a/nebo částečné sekvence, přičemž jak < - S ?"1 = zce přio užne a tvoři spel Analýza 0 v i. d pT -J: vedenu pomoc mips on J.D. . a da1s i ( 1994 ) MucLei. až 4630. Oba sematz 'riny A-secia- )geuet i cky nej. ic i. i že s v.rovym PAV emaforlny P 5 O o r c. r 7 ^ -· _z fy· \: 1 .;·*, sekvence pro H-sema-L a M-sema-L byly použity ty, které jso uvedeny v tabulkách 4 a 5, jako sekvence osratr.íc semaforínů byly použity sekvence uložené v databázích respektive z nich trans katované amine kyše 1 lnové sekvence vyplývá, že aminokyselinové sekvence M-sema-r, jsou íylogeneticky b sem a VAC -A39. Tv • * Mt • t* • · * · • ♦ • * • · · • · • ··* fc • · • * • » • · • * • v • · «· • · • · 9 · 0 Γ" i b u z né / r.‘ΞΖ * “* ;i -;y ý -V co sud známým semaforinem. Z T-' ν' M «. ovec er. e anal 7 Z y d a j e vypl ývá , že jiné semafonny jsou mezi 5 0 cou v tvněž tylege n 0 *r y 0 *T 'i P iízce příbuzné a tvoří mezi S Θ bcu vl .as tr.í skupin y. Nap ř i k lad sekretované semaforíny H- se ma-I i - , -IV, τ r v f d -Z pat ři do téže fylogenetické skupiny. Do té: ' 0 podře tmy 1 ze zařc i dl t i jejích homology z jiných dr tíhu. Rovněž lidský trans membránový GDI0 0 lze zařadit do ]e dr.é fy locens y i c k é Ξ .<upiny 5 jeho myším analogem M-5emaG2 a s ko 1 a ps i nem-4 Ce i ková po z o r o v a r. a herno1o gie aminokyselinových se kver- Γ" í u sek v s π c i Z u 0 Z S fy Logenetické skupiny dosahovala cř ibll zn á mezi 0 '"i .Ί a o >- - / například u blízce příbuzných £ ^ ns r r i nu H- a M -sema-R * zebo -111/D. 0 něco menší, př j rp ’ i žn ě 4 0 shoda byla sin Leaana u nepříliš příbuzných se ma f o r i_ nů. V .rámci s ema do Π0". y je pozorovaná homologie vždy 0 né k oi ik pr: z c e n t / v o d i / a aiky tomu, že tato doména představuje podstatnou část celého proteinu (50 až 80 5 celkové délky proteinu patři sema doméně), ovlivňuje tato ;men ccdstatnou měrou celtovou aninoovsertriovou nomoiogn. Ό y—i — A 1 t K-sema-h e v ráme i celtové délky ze 46 i dsn Γ / y y S prote inem AHV-sema, nicméně je-li porovnává homol Ά n i a *·- po uze v ráme i sema do mé o, je tato homologie 53
To je vyšší homoloois než naořiki; a M-sema-C, které vyřazuji proteinu a 43: hcmoiogii v rámu homologie j ako u M-sema-A a M—s nomolegii v rámci celého protein sema domény identita am.inorysei sema-L ;,viz tabulka 6) a H-sema1 hcmoiogii v rámci celého a částečných sekvenci. M-(viz tabulka 5) je v oblasti sema domény 931,. Z této vysoké homologie lze předpokládat, že jde o navzájem si odpovídající homologul :reny 1 ids ke a mvš i . -21- • ··· * 9 9· 9 9 #· • • • · • · 9 9 · 9 9·· 9 9 • * • 9 • ♦ • 9 9 9 9 • * f 9 99 99 ·· • 9
Semaforiny odpovídající H-sema-L a M-sema-L z jiných druhů mohou v oblasti sema domény vykazovat vyšší než 40/ honelegii se sekvencí H-sema-L. Mezi blízce příbuznými obratlovci (savci, ptáky) lze narazit dokonce i na 70-·, homolegii.
Jedná se tedy o novou semaforinovou podrodinu, která je svým aminokyselinovým složením bližší virovému AHV-sema než jiným doposud známým lidským, respektive myším semafori:i um a s novou, dosud u lidských semařorinú nepopsanou C-koncovou strukturou. Mezí tyto nové semařormy (členy této podredinv) patří takové semaforiny, které lze na základě jejich doménové struktury zařadit do IV podskupiny a/nebc dc stejné fylogenetické podskupiny jako H-sema-L nebo M-sema-L a/nebo vyřazují shodu celkové aminokyselinové sekvence s H-sema-L, která dosahuje alespoň 30 až 40 i, výhodně 50 až 60 e, zvláště výhodně 70 až 80 % a nebo ještě více a/nebo vykazují shodu aminokyselinové sekvence sema domény se sekvencí téže domény semaforinu H-sema-L alespoň 70 výhodně více než 80 i a zvláště výhodně více než 90 o.
Tyto nové semaforiny typu L mají také novou biochemickou funkci. Nová funkce těchto semaforinu spočívá v modulaci imunitního systému.
Nejbližším příbuzným semaforinu H-sema-L je virový Ar V-semaforin (AHV-sema). Má přibližně stejnou velikost, ale na rozdíl od H-sema-L neobsahuje žádnou transmerubránovou doménu. AKV-sema je pravděpodobně sekretován virem-znflkávanými buňkami proto, aby v přirozeném hostiteli zablokoval receptory pro ekvivalenty H-sema-L a tak umožnil těmto infikovanými buňkám uniknout před reakcí imunitního systému. Dále je možný jeho účinek ve funkci odpuzujícího agens pro buňky imunitního systému (chemorepelent).
Biochemickou funkci nových semaforinu typu L a jejich derivátu lze spatřovat v jejich pou žití jako obecně » t « · « * * ·· * *·· a · « · · ·· t * ··* 1 * 4··* · · · ♦ * * imunomoduluj icích látek, a/nebo jako látek modulujicich zánětlivé procesy. Tyto semaferiny neheu například: A) působit jako molekuly zbržcuj ici imunitní odpověď jak na lokální úrovni, například ve formě zransmembranových proteinů na povrchu buněk, nebo rovněž na větší vzdálenosti například jsou-li díky proteoiytickým procesům nebo alternativnímu sestřihu sekretovány a například difundují do příslušné tkáně, dále mohou působit jako chemorecelency a/nebo imimosupresiva.
Například mohou být tyto nové sematoriny typu L exprimovány na povrchu buněk cévního endothelu a tím bránit adhezi leukocytú a jejich migraci skrz cévní stěnu. Mcvé semaforin mohou rovněž hrát významnou roi i při zachování imunitních bariér, například při ccrar.é před infekci zvláště důležitých nebo exoonovanvch orcár.u, jako nacřiklad v henatoencefalické nebo v placentami barié: jiných imunologicky důle oankreatických ostrůvcích! imunitním onemocněn im. Kromě /· :ifých m: a!neb c c ř do - : naoriK. z o n o iiT o η o u n o ve 3 e m a r :: podle vynálezu nebo jejich deriváty porno napři :lad pro bii ňky imuni tního systému ( ^ v ~ ' 1 a a .ocyty; působit jar ío ochrana proti ne žádouci . a .< 71 'j 3. c t * mecha nisrnu. Dále mohou n ové semaforir ry pod. le vyňale — a/ ne co derivá ty fungovat j a kc a .< cesoro ve mcleki i ... 7 * Ja zrnované na povrchu buněk : mentu a a g .i i. u_ ad .v G 0 .i. nterakci s buňkami in mni tni ho svstem ! V r am c i pr 1 v ... _ o.· J y ' aktivace obraných mechanismů, například infekc ích. Z uvedených možnosti působení vyp1ývá několik moč použití nových semafor inú typu i cud...e vynálezu a j derivátů, jakož i nukleových kyse_in, které je kóduj;. • · · * 1 , * · « · ,. ·* ·*
Funkce A: 1: :ores ivn možnosti použití v oblastech terapie zanětlivých onemc· teraoie . a/nebo zánět-tlumicí účinek: mnohé jako jsou transplantace orgánů, imunoteraoie i genová
Napři klad mohou být pomoci DNA kódující semaforin nebo jeho derivát připravena trar.sgenr.í zvířata.
Jedna c mocnosti použiti takovýchto transgenních zvířat spočívá v použití jakožto medelevých zvířat pro studium zabráněni odhojování transplantátu. Například mohou být připraveny transgenni zvířecí orgány, chráněné proti odnoieni. Takové organy lze pak použit při xenotransplantacich. To ie možné rovněž spolu s dalšími transgeny (například s transgeny regulujícími funkci komplemencu jako i sou DAT a CD'59) -
Další možností nouzítí ie cřÍDrav" tohoto genu. Kr IGCk-OU (tor raná zvířata -Stavuj 1 vhodr : 3* modelo Vé systémy prc mocněni / j tC O !_ u T A e se u ká ž 0, že je myš í vúnei ; 5chop na L IVO l a. Jestliže se M-sema- - í du 1E 1 7 i tý prc munomodniaci .ze oc C tg η" ή V ď L rozšíření takovýchto if uprav ena zv: ířa . tC c.i s kne jck-in geny, .0 zviř atěch je napří k :lad gen pro M- r*·. v-r těžný/p UZ” leněny U_ sema-L nebo řík1 ad v ložen .i .. m nového S ě maforlnového i e ker it rc íovt ín j mým ko nstitutivníir. ;mc to r e m. Taková to zvi řata oak mohou onock-outováných zvířat (zvířat s vyřazeními určitým genem) například knock-outovaných myší (viz Laboratorní protokoly oro cílení genů ("Laboratory Protocols fer Gene-Tergsting") , Torres a Kůhn i 199A] Oxford University Press, ISBN 0-19-962677-X) . Pomocí knock-outcváni myšiho genu pro M-sema-L mohou být například objeveny další funkc rovněž potenciálně pi
i; 3 U Cl i. Lllm j. ή Γ.6__L _ V 7 d ýý Q bez 3enia řo r i rLovéno genu vune ukáže, ze je gen pr sema-1. nahrazen ge. pozměněny M-sema-L i subtvpu, nebo tím, a/nebo inducibiiním -24- * *·» • « -24- * *·» • « • · • · #· sloužit například při vyhledávání dalších funkcí novýcr. semafor lnů, například funkcí lidského genu nebo derivátu tohoto genu, nebo k identifikací a charakterizaci látek s imunomodulujícím účinkem. Dále je možné použití nukleových kyselin, které kódují například semaforin typu L nebo jeho derivát k přípravě například rekombinantních imunosupresiv a nebo jiných rozpustných proteinu nebo peptidů, které jsou odvozeny od aminokyselinové sekvence semaforinú typu L například od sekvecne H-sema-L nebo od odpovídajících nukleových kyselin, například genu. Podobným způsobem mohou být připraveny i agonisté se strukturními podobnostmi. Tyto látky s imuncsupresivními účinky, respektive jejich agonisté, mohou být použity při léčbě auto imunních onemocnění, zánět živých, onemocnění a/nebo při transplantacích orgánů. Dále je možná genová terapie pomocí semaforinú typu L. Jsou při Lom například použity nukleové kyseliny, které kóduji naoříklad H-sema-L nebo jeho derivát. Tyto r.uklecvé kyseliny jsou aplikovány například prostřednictvím virového nebo nevirového nosiče. Tuto terapii lze využit při iečbe autoimunních a zánětlivých onemocnění, transdukci orgánu, jakož i před/při/po transplantaci orgánů pro zmírněni nebezpečí odhoiení transplantovaného orgánu. Dále mohou být nové semaforiny a/nebo nukleové kyseliny, které je kóduji a jejich deriváty, zejména H-sema-L pcužitv ve způsobu vyhledávání účinných látek, zejména pak pro identifikaci a charakterizaci látek s imunomoduluj ícím účinkem.
Funkce B: H-sema-L je akcesorová molekula exprimovaná r.a povrchu buněk a sloužící k interakci s buňkami, například s buňkami imunitního systému, například jako akcesorová molekula při aktivaci signálu. Virový gen respektive produkt * · * · * · * · . K * 3 0 ] a ho virového genu nebo genu j měno pamgenu, na; mikrobiálního původu, muže působíc například
: _ ivycz. c T;0[TLC Cn-= mohou být napřik mističky DÚsobic *Γι. gine o Z C U 3 C kompetitivní inhibitor těchto akcesorových molekul. í možné použití nových semaforinu rovněž v transplantací orgánu, léčbě cá; imunoterapii a/nebo v genové terapii.
Nové semaforiny podle vynalez použity ve způsobu vyhledáváni antagor.isf účinnýcn látek, napři klad inhicl identifikované účinné látky mohou pak byt například použity k zablokováni semafor lnových recepturu. Rozpustnými a/nebo sekretovánými antagonismy, respektive inhibitory K-sema-L
morou být například cr.01r.1ck0 laik·/ nebe samcine nove senia f c r inv Γ 0 5 p 0 n u 1 V Θ - 0 ή ]_ a -d 0 r i v a i' / ! /h r - ^ ^ £ " s RM :ez trar.smemb ranové imuncobobulinv nebo usoeem látky mu například u t ran5cenních modelu, h . a Z á Γ: 0 "i" ^ č vých onemocněni a při u. Mukl00 vé kyše líny napřik lad DMA CO: čl i 0 V /110-0' 0 Z U / respektive ^ -211 .z h části nebo zkrácené formy, napři kl; domény, nebo ve formě fúzních protein formě peptidú od nich odvozených,! které /sou v blokováni příslušného recepceru. Tímto identifikované specifické antagonisticky působíc a/nebo inhibitory mohou účinkovat na základě komp vazby, a mohou byo použicy při potlačovaní, cd transplantovaných orgánu na nebo při autoimun: kódujíc! semaforiny deriváty připravené například pomoci molekulárně biologických metod mohou být například použity při přípravu transgennlch zvířat. Nadbytečná exprese K-sema-L může u těchto zvířat vésti ke zvýšenému výskytu autoimunních a/nebo zánětlivých onemocněni. Taková zvířata se tudíž hodí pro vyhledávání nových, specifických imunomoduluj ících účinných látek. outováných
Tyto nukleove kyseliny meritu ořiprave kno c k - o u t o va π vc h zvířat, na oř ♦ I t * * · • ·
i · * · *· myši u ni pak mohu knock-out systémy p :nž je vyřazen gen pro myši M-sema-L, . Tato zvířata oýz použita pro hledání dalších biochemických Ό · 1 P— V sematc nr. typu L. Budou-li myši s tímto váným genem schopny života, budou to vhodné
přípravě myší. V posměněno r~ c ’ uci i um sáně' tlivý ch onemocněn i . ;*: ^1 ' klec V' e ky; 5 β 11Γ: y mohou bý t dále použity k tran: s gemo ich 2 :víra! : 5 knock-i n geny, například tomt; ; pří ipadě je gen pro M- sema-L z aměněn za u M-sema-u/cDNé neb o popřípadě za mutantní formu semařorm t" : · : L- t n-· L ji .něho druhu ; například H-sema-L. τ i ř a z 3 . i ze opět pouí íit pro hledání dalších funkci u pod íe vy Ρ.αΙΘΖ u. 3.'^-· Z dále po. Ol suje p 0 U 0 0 Γ 1 S tO maťerinu typu L a rival u, 1a kož i tyto proteiny kó dujICÍCh nukleových apríl 1 Pj H -f enů n· ebo c DNA a jejich derivátu a/nebo za ,-V, ^ ς pim q ^ C Γ 1 Ti u i den ti řikovaných účinných látek pro léčiv . Nap f" ’ “CI, 81 d tne n ou oýt připr avéna léč iva, které 7 ' Γ p 1 na p rc g er.ovo u terapii a která přinášej í a/.ne bo a ntago uisT y exprese s enařorínu t y p u L, . semaíorinu H-. ib p ηη ;j — L. K tomu 1 .ze využh l virových mirot hen metod . lat :c léčiva iz e využít při léčbě . i C h 8 saně tlivv cd oř. .emocněni a/nebo před a/nebo při . tací orgánů pro zmírnění nebezpečí odhoj ení . ti Z V 3.Γ+ ého 0 V- -~f ^ >-·. ’ i i. o nuk mc ve kyše - i n y, Γί 8 c r i k 10 d GJvi A a jejich nohu j uci 3 emaio r o n y podle vyr.ále izu mohou být rovněž ^ ·-' \ Cj pomc ) C ΓΤ é a v; ýchozi látk y pro molekulární 1ΓΓ. P - c ho Gd OiTG U být i nové semafor my zvlá; ;tě pak H- p, P P; p. Π Li :L l eove ryse i .my, které je kódují např íklad ÚA a j e j leh den váty, použity ve způsobů vyhledávání 1 mný: :h lát -«V M.-gj P okované prot ein y a/nebo p e p t i d y od H- ” P r,‘ ITL CÍ “ lj a / . p m n M-sema-L no; n o u b ý t p o u ž i ty při
-27- -27- hledání příslušných respektive agonistů. proteiny nebo jejích například s využitím jeho homologů. receptorů a/nebo jejich antagonistú Při takovém hledání jsou uvedené deriváty použity ve funkčních testech expresivních konstruktů H-sema-L nebo
Vynález dále popisuje použití semaforinu typu L nebo nukleové kyseliny, která takový semaforin kóduje ve způsobu identifikace farmaceutických účinných látek, zvláště pak s imunomodulujícím účinkem.
Vynález dále popisuje způsob identifikace nových účinných látek, zvláště pak účinných látek s imunomodulujícím účinkem, při kterém je použit semaforin ypu [, r Lebo j eho derivát respektive nukleová kysel ádující semaforin typu L. nebo jeho derivát. Vyná apřikiad popisuje způsob, při kterém se za definován podmínek inkubuje semaforin typu L spolu se studovanou účinnou látkou a paralelně je proveden obdobný pokus bez studované látky ale jinak zcela identických podmínek. Poté jsou vyhodnoceny ínhi.bíční respektive aktivační účinky studované látkv. vynález například dále popisuje způsob identifikace nové účinné látky, při kterém se za definovaných podmínek exprimuje nukleová kyselina kódující semaforin typu L nebo jeho derivát spolu se studovanou účinnou látkou je vyhodnocena míra exprese. V daném případě muže být paralelně proveden jeden nebo více obdobných pokusů za idontickycn podmínek, ale s různými koncentracemi studované látky. Studovaná Látka může například inhibovat nebo aktivovat translaci a/nebo transkripci.
Nový semaforin typu L se může podobně jako jeho virové homoly vázat na nově popsanou recept.orovou molekulu VESPR , viz Comeau a další, (1999) Immunity., svazek 8, strana 473 až 482, a pravděpodobně způsobuje v monocylech inaukci -9 · buněčných adhezivních molekul jako ICAH-i a cytokinú jako interleukinu-6 a interleukinu-3. To pak múze vést k aktivaci monocytú a k agregaci buněk. Expresivní vzorek recsptoru VESPR vykazuje částečné zajímavé paralely s expresí H-sema-L, například silnou expresi v placentě a zřetelnou expresi ve slezinné tkáni. Jsou rovněž možné interakce s dalšími, dosud neznámými receptory z plexir.ové rodiny a nebe s 3 inými receptory. Rovněž jsou možné interakce semafor mu se sečou samým a nebo s jinými semaforirvům podobnými molekulemi. K interakci semaforinu typu L může docházet zejména v konzervované doméně v C-koncové oblasti sema-domény.
Stručný přehled plazmou
Piazmid pMe13 acA-E-S ema-L (6ó22kc;· v plazmou pMelBacA (Invitrogen, De Scheip, Holandsko/ viz Sekvence id. č.: 42;: Nukleotidy 96 až 98 ATG - startovací kodon, nukleotidy 96 až 168 signální sekvence meliitinu, nukleotidy 158 až 173 obsahují cílové místo prc restrikčni endcnuoieazu BamHI (PCR/klonovací), nukleotidy 171 až 1993 představu:i aminokyseliny 42 až 649 ve čtecím rámci sema-- (bez vlastních signálních sekvencí a bez transmemhrár.cvých sekvencí), nukleotidy 1593 až 1993 obsahuji cílové místo pro restrikční endonukleázu EcoRI (PCR/klonovací) a nukleotidy 1992 až 1994 představuji stop kodon.
Plazmid pCDiMA3.l-H-Sema-L-MychisA (747b op, viz Sekvence id. č.: 35): nukleotidy 954 až 959 obsahuji cílové místo pro restrikční endonukleázu 3amH! (klonovací), nukleotidy 968 až 970 představují ATG pro sema-L, nukleotidy 968 až 2965 představují čtecí rámec proteinu sema-L, nukleotidy 2963 až 2968 obsahuj í cílové místo pro restrikční endonukleázu Prali/ nukleotidy 2969 až 29~?4 obsahují cílové místo pro restrikční endonukleázu Hindi 11, nukleotidy 2981 až 3013 kódují značku Myc, nukleotidy 302o až 3 3 3 3 kóduji značku kodón. 6xKis, n; . i d v 30 3-
Oj* istavuji stop
Pia zrn id o 2 :dna3. ] - U. -3ema- SOL ?- -Myc thisA (61 92 bp) ; (S ekvence i i"1 J-· 3 6): nuk leot i dy 954 až 959 obsahu jí cílové ml sto pro res +- rikčni endor.i uk i e á z u EamHI (kl ono vad) , nu kleotidy 963 a 0 97 0 p V· O l '' stavu 11 á.TG n L-1·1 sertia-L, nukl eotidy 9 6 o 3>z 2 9 í 6 d oř L sestav 'U ’’ ' X far ; l rámec proteinu s err.a-L, nu kleotidy 2963 3 · ž 2 965 OD sa nu j i polov mu cílového mis ta pro rp 5 tnkčni endc ) Π ukleáz U Pni, nu kle O t i dy 2966 čd Z 3682 představuj i č tec 1 rámec pí :ote Ir LU EGb? [ n; skloňovaný do místa Pm 1 I) , nu i Up c k iy 3 63 , "i až 3i i8 i i ocs ahu : i druhou po lovinu C I io veho " i i- f- pro res :trikč :nr ►ti n ί ,j iXitědiU X mi 2- / 1 . LU kleotidy 3 b o 5 3 Ž 369; I- V bsahu J - - i V0 místo pro Ht r ,-i T T T il.ji _ 2. / rV l kleotidy i >; o i v .-· / 5 i J 3 1 i v i rÍ U ' 1 2 načnu JvT- rz, nukíec - - -i y 37 4 3 až 37 60 kót oui i ti nač ku óx2 iis-Ta .0 ct Π \ \ kle ctidy 3761 a; : 3 7 63 pr edstavuji s top točen Plazili i ,-J £. ~ :n iD-H-3ema- _ “ X-d ! 7 10 8 Op ·.. , , „ 1 , i.. d tč Vd >- O :oru p] ND (I nvitrogen , De ς , chelp, Ho lanas ko , viz d 0 kvence id. č. : 38) : nu kleotidy c; ~j t; ? ”3 3 obsahu: ' - C i IV ve místo pli izm: i~f LD ^ O re stri kční endcri U! deázu V Ci mH 1 ( kl i li O Vd Cl ) , nukíeoti ay 546 až 54 8 předat avui i Τ', rp r*’ pro sem Či _ T m, í_j / -i ukí eotidy 54 6 až př edstavuj í čtec 1 rámec orote ir LU s s m a - nukleotid) i 2 542 až η y z z 47 obsahu:i ci o vé mi LSI' o pro resori . kční θndonuk. i 0 á zu Pni I, ii u k 1 e o t 1 -Ji; i U V '/ : 14 8 a Z 2553 obsahu j i cílové m is 2 o pro re stři kční endor i 3. k1eázu i H indii - a mi k 10: ctidy 2563 3.! ž 2 5 65 00 f-ς ^ 1 T d η q j~ O O kC" d'i "d n ” dr’ O ld 0 i >í o-H-3e :Oia- -i “ X x ( ce 1 ko Va délka 710 2 cp; ve ve ktoru pih D i In V i trope. . - t De Sc he lp, H ala n cis o.o, viz Se kvence id . č.: 37) : nuk I i í C i i d V 3 2 3 až 53 3 o o s ahu ji cílové mis to pro re stři kční endor. u! oleátu BaiuHI ί 1 ^ onova c:) , nukleoti dy 5 4 6 a ž 54 8 převs ti iVUj _ starto vaz í-j ; - X ‘''U' " · r P Γ C· D Γ O tl θ ί Γ i S ena-L, nu kleotidy 54 6 a ž ř1 y;, m s Lávu 1 _L čtec i r ámec prote i nu sena- T f n u k lp, o -1. 'i' / 3 ví 2 a: · i- 1 -? . _/ "t .· 'κΙ Ί •'tváře 3 P cílové rr L j_ O _ . 0 wj i, O -30- restnkční endonukleázu Pml I, zatímco nukleotidy 2548 až 2553 vytvářejí cílové místo pro restrikční endonukleázu Hindi II, nukleotidy 2560 až 2592 kódují značku Myc, nukleotidy 2605 až 2622 kódují značku 6xHis a konečně nukleotidy 2623 až 2625 obsahují stop kodón. α>
Plazmíd pQE30-H-Sema-L-179-378. Seq (délka 4019 bp) ve vektoru p0E30 (Qiagen, Hilden) odpovídá plazmidu pQE30-H-Sema-LBK (viz Sekvence id. č.: 39): nukleotidy 115 až 117 tvoří startovací ATG, nukleotidy 127 až 144 kódují značku xHis, nukleotidy 145 až 750 představu]! BamHl-HindlII PCR fragment s aminokyselinami 179 až 378 proteinu sema-L a nukleotidy “58 až 760 představují stop kodón.
Piacnid pOE31-H-Sema-L-(SH) (délka 3999 bp) ve vektoru ?CE31 íQiager., Hilden, viz Sekvence id. č. : 40) : nukleotidy 115 až 117 tvoří startovací ATG, nukleotidy 127 až 144 •<óduj í purif ikační značku 6xHis, nukleotidy 147 až 152 vytvářejí cílové místo pro restrikční endonukleázu BamKi, nukleotidy 159 až 729 představují Sacl-HindlII fragment proteinu sema-L (C-koncový fragment) s aminokyselinami 480 až 666 a konečně nukleotidy 7 34 až 736 představují stop kodón . Překlady provedení vvnálezu rtručny popis obrázku:
C-orázek i: Tkáňově specifická exprese H-sema-L
Northern blot (Clontech, Heidelberg, SRN) RNA izolované z různých tkání. Zleva doprava jsou v jednotlivých stopách naneseny vždy 2μα polv-A-RNA ze sleziny, thymu, prostaty, varlat, vaječniku, tenkého střeva, z mukózy tlustého střeva a ieukocytu periferní krve. Markéry -31- relativní molekulové hmotnosti jsou uvedeny po levé straně. Bloty byly hybridizovány za stringentních podmínek s 3:0 cg dlouhou H-sema-L sondou.
Pod obrázkem je v malém obdélníku vyznačen kontrolní pokus s beta-aktinem.
Obrázek 2: Schematické znázornění postupu klonováni H-sema-L cDNA a genomová organizace genu pro H-sema-L.
Nahoře : lokalizace EST sekvenci a ]ejich přístupová čísla; poloha Est sekvencí je udána relativně vzhledem k AVK-seir.a 5 e kvenci.
Uprostřed: Produkty amplifikované pomocí PCR a RACE-PCP jakož i pozice cDNA klonů vzhledem k pozici úplné cDNA. pro H-sema-L a otevřené čtecí rámce pro kódovaný protein.
Dole: Relativní pozice exonů v genu pro H-sema-L v celkové genomové sekvencí
Pozice použitých oligonukleotidcvýcn primerú jsou sipkami.
Obrázek 3: fylogenetický strom získaný vícenásobným porovnáním uvedených semaforlnových sekvenci. Na základě seskupení v tomto fylogenetickém stromu ize posuzovat i řylogenetickou příbuznost jednotlivých semafor i nu.
Obrázek sorting- H-sema-L 4: FACS analýza (fluorescence activated te-1 metoda třídění buněk pomocí laseru) exprese v různých buněčných liniích respektive v různých buněčných typech (viz příklad 9)
* ·· • * ·· ·· # * * V levé 3 C 1 obrázku jn e v z o; y z & o n ycen graf, ve \r ose vynesen rozpt; yU ESC (forward sca ct paprsku) proti 55- i ÍS1C ieward scatter- SVÍ .slé ose, což odpoví .dá poměru ve li! ahu granul i. V gra fu je vyznačena oo la: ;erem ji e na ;r- rozptyl si lounecna populace) s podobnými velikostmi a obsahem granuli, která je dále charakterizována v pravém obrázku. Na pravých obrázcích )jsou histogramy znázorňující černost (osa y) jednotlivých intenzit fluorescence losa x).
Na grafu jsou vždy zároveň vyznačeny výsledky s kontrolním sérem (nevyplněná křivka) a výsledky se spécifickým barvením i vyplněná křivka· Posun křivky soecifíckeno barveni oproti kontroi.ni křivce odpovídá expresi H-sem v cop ovioajicicr cunraon. C "n y 3C a CCS1' tím silnější exprese.
Obrázek c. ; Srovnává ci anaiý za expr ese Cul 00 a H-sema-L. Popisy 0 s a jednotil vých obra i z ku odp 0V1 caj i obraz ku 4. vždy horní his: íogram je z aměřen írá exor es r . H-sems-1 a spodní his togr ara na expresi CD100 v uvedené bun .ěčné linii Obrázek 6: Exprese s arrpr c V n C P C O 1 3 · j.. s k e ho semafor mu sema-L (H-sema -L) v buňkách Kirive a Sfy (vi z o : ř i k1 a d 10) . Podmínky blotu: byl |H "j *- ^ ^ i"-( * 7· ^ r. O ΓΟ 3 6 1Π odpoví d- a ^ ci a ni in o k '/ sel inám 42 až 64 9 semafor inu expri nto váný v p 1 a zm i du pMelBac-A (Invitr oge n) v oacul ovirovem expresi .vru .m systér au (Bac-A- Blue, Invitrogen). Detekce byla prováděna s pecifíckým slepičí m antisérem ( 1:100) a králičím koniugátem anti-IgY- křenová pe roxidáza (1:3000, J a c ^ s c n L ab) • V jedno til vých stopách byly pus ten y nasleduj í c í vzorky: stopa i, 4 a 6 re i oř:kované buňky Hirhve™ (bez. séra); stopa 3, -33- 3, -33- no i e?>:u i :ve i n f i kované 7 a 5 buňky KiFive™ infikované rekombinantnim m (bez séra); stopa M - markéry relativní hmotnosti Rainbow (Amersham RPN756); stopa 9 a 10 buňky Sf9 (v médiu obsahujícím sérum).
Obrážen 7: Specifita antiséra
Stopy 1 až 3 odpovídají séru slepice 1, stopy 4 až 6 slepici 0^ j- , , 1 £ 4 JSOU pre-imunní sérum C L. 0 C 7 ú. a JSOU sérum 60 oni po imunizaci Stopy 3 a b J 5 o U sérum i Co dní po imunizaci Imin i za C £ b, via p rovedena aminokyselinami 179 až 378 proteinu y- sama. - L (s N-kc tisovou 6xHis značkou, viz příklad 8, boa 1) .
Obrázek 8: Mapa rekonbinantni.no piazmidu pMelBacA-H-sema-L. Přípravu plazmidu popisuje příklad 11.
Poominkv neužité v ořikladech:
Použité programy pro PC?.:
Taa52-60 {s Anpli-Taqů polymer ázou, Perkin Elmer, W e i. i d e r s t a d t, SRN) 98°r/60s 1 cyklus 960C/15s; 52°C/20s; 70°C/60s 40 cyklů 'o 0ů/cOs 1 cyklus -34- • · «· »«« φ * Τ a q 6 Ο - 3 Ο 96°C/60sl cyklus 96°C/15s; 60°C/20s; 70°C/30s 35 cyklu 70°C/60s 1 cyklus
Taq6Q-60 96°C/60s 1 cyklus 96°C/15s; 60°C/20s; 70°C/60s 35 cyklů 70°C/60s 1 cyklus
Taq62-40 96°C/60s 1 cyklus 960C/15s; 62°C/20s; 70°C/40s 35 cyklu 70°C/6Os 1 cyklus
Použité reakčni podmínky pro PCR s Taq polymerizou: 2 0 0 ;iM Amoll- 50 μΐ reakčni směsi s 100 až 2C0rig templátu, směsi dNTP, 0,2 až 0,4 μΜ každého z primerú, 2,5 :
Taqít, 5 ul přiloženého lOx reakčního puiru.
Programy použicé pro PCR s 1. XL62-6 (pro PCR systém Expanď^-Long Templatě, 3cehringer
Mannheim, 5RN) 94°C/60s 1 cyklus 94 °C/1Ss/ 62 0C/30s; 63°C/6min 10 cyklu 94°C/15s; 62°C/30s; 68°C/(6min+15s/cyklus) 25 cyklu 68°C/7niin lcyklus 2, XL62-12 (pro PCR systém Expand™-Long Templáře, Beehringer Mannheim, SRN) i · ·· i • · · * * q Z 0 r 1Λ c* · a ^ L/ ^ u b / On 0 ^ / o2 L. / 31 j s ; 637/12min; 10 cyklu q a o ~ t - ~ 0 r, , r . , / ' '· —' / ' * o ; " ít ' — · - | C* r\ & i _ , v-, , do o./ . mi.n; i c v klus
Použité reakční podmínky pro PCR s systémem Expand™-Long Templáře: 50 μΐ reakční směsi s ICO až 200ng templá tu, 500 μΜ směs i dMTP, 0,2 až 0,4 μΜ každého z primeru, 0,75 μ enzymové směsi, 5 ui přiložného lOx reakčn iho pufru č.2. Να Z á. K . la< lě s a kver ice •η ’ tt - oxl V - s em . a t, v '13 Pil s s e v a JT lec ke rs t e 7 (1995), J. Genera 1 Virol *7 6: s z rana 10 6 3 a z 10 í 57) byly provede na 3 CR a Ra iCE- -PCR >" a " V Jako v Jcht ::zi man t e r Ί 3 1 b y I a použita c DN Ά z tká .ně lids ké f 0 _ a C e π a y , π " ^ 0 0 v*’ u b y 1 y 11 g a c í připoj e ny aaamerv o ro R ACE- - Orr amp i if 01 ί sc :up: :ava pro ampliti ,05 CL CDNA Ma rathon™, >ntech Ca: oo r a to Γ i 0 5 GmbH, Tuiiast ra Γ< a 4, 69 -i r~ n. a i ie _ Z ·. ^ k" a t SRN: . N e n o Γ v "a by. pomoci PCR za r~\ j o ^ žiti sp 0C1 f ickj jch prim* O r ’ a 1 -Λ i Z 12 34 a č • 121236 (v i z. ta a 11 7 V :a 6) amp li . f i ke van asi 8 0 0 bp d0 )uhý pi CR f r agment i PCR p. η o cr ^ am Taq h Q ~ & 0 \ T H1' ^ 1“ .‘"Ί f ragm eni byn I_ klone >ván a sekvéno vá r. pomoc. sekv X n q ^ f a c i šoup: r a v y π aq -Dy e- Deoxy- Term na — ·~ι yy > (App Hed BÍOS’; /ste Ty> c / F o r s t a r O ity, i JSA; a Brunnen we a 13, W e i l de v* ^ - i O CCA lt, 5RN; . S e k v e no v. áriím P Γ\ pr oduktu byla z: - O ‘ c -á n ia se .< v o n p- e 5 V v s okou heme li ogn s DNA se kvěnci virového semaforinu AHV-sema, identická 5 oběma sekvencemi EST. viz
S tabu 1ka ným párem primerú (primery identifikován 6) byl č. 121237 a č. 121239, PCR fragment o délce I k«« * • # # * · » · * · * · Ι· * Μ • 9 Μ*> · t · ♦ · -3 6- přibližně 600 bp. Ukázalo se, že se jednalo o klon s DNA-sekvencí stejného genu. Přiklad 2 300 bp dlouhý PCR fragment z příkladu 1 byl označen radioaktivním pomoci náhodných primeru podle způsobů popsaného v práci Feinberg (1983) Anal. Biochem.132: strana 6 až 13. Takto značený fragment byl poté použit jako hybririizační sonda pro prohledáváni lidských tkáni pomoci Northern-blotu (Human Multiple Tissue Northern Blot II, Clcntech, Heidelberg, SRN), ve kterém byly použity mRNA ze siezinné tkáně, thymu, prostaty, varlat, vaječnikú, tenkého a tlustého střeva a leukocytů. Přitom byla prokázána zřetelná exprese mRNA o délce přibližně 3,3 kb ve slezině a v pohlavních žlázách (varlatech a vaječnících), jakož i slabší exprese v thymu a střevech. Další hybridizace pomocí dot-blotu (Human RNA MasterBloť1*, Clontech) s RNA z mnoha tkání potvrdila tyto výsledky a identifikovala rovněž silnou expresi v placentě.
Hybridizace byla prováděna po dobu 16 hodin za stringentních podmínek (5xSSC, 50 mM Na-fosfátový pufr, pH 6,8, 501 íormamid, 100 ug/ml kvasničné RNA.) při teplotě 42° Z. Poté byly bloty za stringentních podmínek promyty (65°c, 3,2xSSC, 0,1 % SDS) a exponovány ve fosfoirnageru Fuji nic? o n i? Příklad 3 S výše uvedenou sondou byla hybridizována cDNA knihovna z lidské sleziny, klonovaná do bakteriofága lambda gtlO (lidská slezinná 5’ Stretch PLUS cDNA, Clontech) a byl identifikován jeden klon. cDNA vložená do tohoto klonu o
t · · « * • * * · · I I · · • ·* * · ·« • » · *«·· · • · é · * · délce přibližně 1,6 kb byla amplifikována s pomoci soupravy Expand™ Long Template PCR, Boehringer Mannheim GmbH, Sandhofer Strafle 116, 68305 Mannheim, 5?S) a pnir.eru č. 207603 a Č. 207609 (viz tabulka 6; specifických :< vektoru (ohraničuji klonovaci místo EcoRI; a získaný PCR fragment byl sekvenován. Tento klon obsahoval 5' konec cDNA. a rozšířil známou cDNA sekvenci také k 3'konci. Na základě nové částečné cDNA sekvence byly vytvořeny nové primery pro RACE-PCR (primery č. 232643, č. 232644 a č. 233084, viz tabulka 6). Pomocí lepšího termocykieru (PTC-200 od firmy MJ-Research, Biozyra Diagnostik GmbH, 31333 Hess. Oldendcrf, SRN) s výrazně lepšími technickými parametry (s lepší rychlostí ohřevu a chlazeni) byl Simplifikován 3' RACE-PCR produkt přičemž bylv použity primerv č. 232644 respektive č. 232643 a API. Tento produkt byl pote nakloňován do vektoru pCR2.1 (Invitrogen, De Scheip 12, 9351 NV Leek, Holandsko). Tento 3' RACE-PCR produkt sekvenován a tím byl identifikován 3'konec cDNA. Pomocí RACE-PCR směrem k 5'konci (primerv č. 131990 respektive č. 2 3303 4 a API) bvl prodloužen známý 5' konec cDNA o několik nukleotidu a potvrzen amine konec proteinu H-sern.a-L nalezený v tomto lambda klonu. Příklad 4 Na základě krátké sekvence EST (příst z ni odvozeného primera č. 260813 (v: dalšího příměru (č. 121234; viz tabu. H-Seraa-E byl v PCR reakci (podmínky ' fragment o délce přibližně 840 bp myš byl nakloňován do vektoru pCR2.1. fragmentu byl nazván M-sema-L. Pomoci fragmentu byla prohledána cDNA kn: (5'STRETCH cDNA, Clontech) a bylo
upove číslo AA262340; a z tabulka 6) a s pomocí lna o.' soecificképro Taq 52-60; amolifikován 1 cDNA. a tento fragment Gen obsažený v tomto získaného M-sema-2 DNA mvs i - -1 v identifikováno ně.: klonu. * * · ·* · · Μ V * · · « I | · · * «» » · ··! I « f · « · · * · · · · -3c- dmínek Ta; s pouzí tím primerj č. 26C3I2, č. 260813 a myši endotheliálni cDNA byl zesílen ?CR fragment o délce 244 bp. PCR výsledky dokazují, že dochází k významné bazální expresi v myších endothe liální c: interferonem-v, sa stimulaci cytokinem Příklad
Vyhledá v ci n i c π. Γ C ulu zorná i re t M . . _k_ lok; v j 4 _ ^ 0P hledaného genu bylo provede nc pomoc 1 f i uc-re scén čni in-s i tu hybridizace (FISK). K tomu by ly peuži ·' y v - Ίρ y~ . p /-* i.rp iv v meta. fázi l z lidskycn a mysícn buněk. Jako vý cho; :i m. at er. L d 1 byl při. praven lidský krevní V Z C Γ 0 .< ve : u y Z Z c zin 0 z n ci mni 3 y. INF 4.3 : viz Kovu a a další i 1995', J . immur.o 1 . I C. ·' a r d f Y' μ; r· a o 536 až 5542 a Kraus a další ( 1594) Cu onom 1CS 23, 5 i Γ5 .na 2 ' A až 214; . Nosiče byly ošetřeny RN-ázo li d peps mem (VÍ z Lie hr a další (1995), Appl. Cytogen etics 21 / 3 f ran, a 13 5 a; : 138 Pro hybridizaci bylo pcužlto 120 mg i s ké sem,. a f ,y r „ n o v d 3 0 ndy připravené mek- trans la cí, respekt i V 6 ? 0 r“i mg ^ d '0 O v 1 trv y >Zj m Γ i va y ^ 'w .· zL / ic semafor in. Hybr Z dl Z ace b y i a p ro vaděn d '3 ždy v přítomnosti ven 4, 0 μα CO?i-DNA a 2 0 ug STO Z d t e o 1 o í- y 31°C pc dobu 3 dní ve vlhké k omurce. p Cté EU T 1 · r ’ ^ y Ή Q srče -r i>r d Z propláchnuty 50o formami·; iera/ 2x531 ; vž dy p o 5 minu tách za teploty 45°C a potom třikrát put rem 2xSSC Opět v z dy o o 5 minutách., ale za t Θ p 10 L y ", "7 0 r-, 3 ! b, 1 a 0 ]_ '2 } t i Γ; ’j dováná s o n da byla detekována konjugá tem FITC -a vi dm, VIZ Ί ker a a a Iši ; 1995) . Pote byly nos iče vyhodnocenu / n a f luor escer i č n i m mikroskopu. Bylo vyhodno ceno 25 metl s f ázovyer 1 v z c orku s · laždou sondou a každý experim ent byl pro v a den ve dvoj i m o ρ 13. X '-Z váni. Bylo prokázáno, že gen H-sema ~~ se nach az i n d mís tě 15q23, Na tomto chromez onu se i / Z- i. i z ku stí nachází 1y i is pro Bardet-Beidluv s vndrom iT' „ , , a i a. j ~ O 3 '3 Γ. 3 0 V1 i nemc c (h 0 X J 3 d .diammáza A) . -39- -39- M · « ·· * I * ♦ # * · · » I · · « • · ttt · · • · · * « i * • * · * * t
Cenomcvá exon-intronová struktura genu H-sema-L byla objasněna z velké části. Z 250 mg lidské genomové DNA, pocházející z ?HA stimulovaných lymfocytů z periferní krve, byly ampiifikovány genomové DNA fragmenty. Kratší fragmenty byly aitiplifikovány pomocí AmpliTaq® systému (Perkin Elmer) , delší fragmenty pomocí systému Expand™ Long Template Ooehrmger Mannheim) .
Pomocí PCR amplifikace mohly být klonovány a charakterizovány téměř úplné genomové lokusu H-sema-L. Celkově bvio charakterizováno více než 8888 bp z genomové sekvence a tak mohla být dále objasněna i exon-intronová strukzura cenu. Příklad 2; Klonování expresivního klonu '/zhledem k tomu, že se nepodařilo z lambda-gtlO cDNA knihovny izolovat žádný úplný klon a rovněž nebylo možné získat úplný klen pomoci PCR, byla kódující oblast cDNA airiplifikována ve dvou překrývajících se fragmentech pomocí PCR (podmínky XL-62-6) s použitím primerú č. 240655 a č. 121339 N-koncový DNA-fragment a s primery č. 240656 (obsahuje cílová místa pro HindlII a Pmel) a č. 121234 pro C-koncový fragment. Získané DNA fragmenty (subfragmenty) byly r.akloncvány do vektoru pCR21. Oba fragmenty byly kompletně sekvenovány a nakonec: byla sestavena úplná K-sema-1 cDNA vložením 0,6 kb dlouhého C-koncového restrikčního fragmentu vzniklého štěpením enzymy Sstl-HindlII do plazmidu obsahuj íciho N-koncový DNA fragment. Z tohoto plazmidu PČD2.1 -H-sema-L (viz Sekvence id. č. : 34 v tabulce 1) byl pomocí restrikčních enzymů EcoRI (restrikční místo je v plazmidu pCR2.1) a HindlII (restrikční místo je v prirceru č. 2-10656, víz tabulka 6) vystřižen úplný gen pro H-sema-L,
-40-
-40- É t ·· »·· « * • · * • v H t *« 4 V * Φ i 9 · · · « » · M ·*
který byl vzápětí nakloňován do stejnými enzymy rozštěpeného konstitutivního expresívního vektoru pCDNA3.1 (-) -H-sema-L-MycHisA (Invitrogen) . Ze vzniklého rekc-mbi nan nn iho plazmidu pCDNA3.1(-)-H-sema-L-MycHisA (sekvenci viz tabulka 3) byl pomocí enzymů EcoRI a Apal vystřižen fragment bez značek Myc a His a ten byl nakloňován do indukovatelnéno vektoru pIND (savčí expresivní systém stimulovateiný ekdyzonem, Invitrogen), který byl předtím rovněž natšpen enzymy EcoRI a Apal. Rekombinantní plazmid byl označen jako pIND-K-sema-L-EA (sekvenci viz tabulka 11). EcoRI-Pmel fragment (se značkami Myc a His) plazmidu pCDNA3.1 !-)H-Sema-L-Myc-HisA (sekvenci viz tabulka 9) wurde in einen mit EcoRl-EcoRV byl vložen do naštěpeného vektoru pIND. Rekombinantní plazmici byl pojmenován jako pIND-K-3ema-L-ΞΕ i sekvenci viz tabulka 10; .
Poté bvl zkonstruován fúzr.i orotein H-sema-: J - zesíleným zeleným floureskujícím proteinem (EGFP; . Čte-: rámec EGFP z vektoru pEGFP-Cl (Clontech) , byl amplif ik0vi.„
Domoci PCR za použití primerú č. 24 30cS a c. o J 7 ~ (podmínky Taq52-60) a poté naligcván do restrikčnmo ^ _ ' ^ - a
Pme I plasmidu pCDNA3.1 (-) H-Sema-L-MycHisA čxrrvz vz-c plazmid pCDNA3.1 (-)K-5ema-L-SGFP-MycHisA (sekvence T . 1 "* »i? tabulka 9). malá písmena souva^ zatímco velká V tabulkách 7 až 13 vyznačují sema-L, jejích dílů či derivátů, vyznačují sekvenci plazmidu. Příklad 8
Pro přípravu specifických protilátek proti sematorf^.. sema-I. byly cDNA fragmenty kódující tento semafor ir. v_v.^ do prokaryotického expresívního vektoru, exprimov^.., coli a vzniklé deriváty semafor inu byly pur *. z • · I t»l • · 1 • I 4 • * • * ·«
• t «4 »·· · • · * · M
Deriváty semafor i r.u ryly exprimc-vany iakc řúzní proteiny se značkou His. Byly vybrány takové vektory, které obsahuji značku His a umožňuj i integraci cDNA fragmentu s H-sema-L derivátem ve čtecím ranci. N-koncová His značka umožňuje purifikaci na afin!tni koloně s chelatováným niklem (Qiagen GmbH, Max-Volmer Straíie 4, 40724 Hilden, SRN) . 1. Část H-sema-L cDNA kódující aminokyseliny 179 až 378 byla ampiiííkována pomocí PCR s primery č. 150733 a 150739a tento DN'A-fragment byl vložen do vektoru pQE30 (Qiagen), který byi předtím Π3. i L· w resiriKcninu enzymy BamKi a Hindi li. Vzniklý konstrukt byl označen sako oQEBO-H-Sema-L-BH (sekvenci vit tabulka 12). mi no k vsel my 430 65 6 i k O Π i cn enzymu 55 t 1 a O O Z 6 vložena do v 6 k toru S *·· r \ č n i ni i θ ii z vzri y Ss 11 a ; ema )NA > ován a νζηικιν Konstruxt oř. ; sexvěnci v^z caourk·; byla vvstšpena pomoci r? HindlII z oiazmiau cCR 2.1 dQE31 (Qiaaen), naštečeného HindlII. Fragment byl zal označen jako pQE3I-H-Sema-L-i
Integrace viozenycn sekvenci ve správném ctecim rámci byla ověřena sekvenováním. Fúzni proteiny sestávající z Ν'-koncové purifikačni 6xHis značky a časti semaforinu H-sema-L byly purifikovány pomoci afin i tni chromatografie s Ni2+. áunriKovane proteiny by.y pcu: zvířat (králíku, kuřat a myší). v -h Příklad 9 tACS (Fluorescence activated ceii sorting) analýza různých buněčných typu (viz obrázky 4 a X 10°: t vyly promyty FACS pufrem logickým ro z to kem, ? B ΰ, s 5'(
Buňky (přibližně 0,2 až 0, (fosfátem pufrova n ým fy z -42- íetainim telecím sérem, FCS a 0,1% azidem sodným) a potom vždy po 1 hodinu inkubovány na ledu s antisérem.
Jako kontrolní primární protilátky bylo použito pre-imur.ní kuřecí sérum (1:50) a pro specifické barvení bylo použito specifické kuřecí antisérum proti H-sema-L (1:50). Specifické antisérum s protilátkami proti aminokyselinám 179 ač 378 (s N-koncovou značkou 6xHis) semafonnu H-sema-L byly připraveny imunizací slepic proteinem přečištěným afinitní chromatografii (viz příklad 8). Jako sekundární protilátky bylo použito FITC-značené anti-slepiči F(ab') králičí protilátky (Dianova Jackson Laboratories, objednací číslo 303-095-006, Hamburg, SRN) v koncentraci 1 mg/m.1 . Pro barveni CD1QQ bylo použito králičí-anti-myší IgG značené FITC. Sekundární protilátka byla vždy používána v ředění r.ACS oufru. )té byly buňky promyty, resuspendovány a analyzovány FACS analýza byla provedena v přístroji sur Q 7-, -ř í c- t- v i. J 1 irotékat měřícím kanálem, ve kterém jsou buňky FACS - Trak (Becton - Dickinson). Princip dělení pomocí tohoto přístroje je následující suspenze jednotlivých buněk se nechá ozařovány laserovým paprskem o vlnové délce 488 nm čímž je vybuzen fluorescence použitého barviva (FITC). Měří se rozptyl ve směru paprsku (íorward scatter, FSC, který je úměrný velikosti buněk) a rozptyl do stran (sideward scatter, S3C, který je úměrný obsahu granulárních organel a utery se v různých typech buněk liší) a dále se měří fluorescence v kanálu 1 (FLl) v emisní oblasti FITC (emisní maximum při vlnové délce 530 nm. Tímto způsobem se měří vždy 1000 událostí (buněk).
Na grafech (viz obrázky 4a až 4k) je {v levých obrázcích) vynesen rozptyl FSC proti SSC (velikost: buněk proti obsahu granulí) a je vyznačena oblast (buněčná populace) s podobnými velikostmi a obsahem granuli, která je -43- dále charakterizována v pravém obrázku. Na pravých obrážel jsou histogramy znázorňující četnost (osa y) jednotlivý intenzit fluorescence (osa x).
Na grafu jsou vždy zároveň vyznačeny výsledky kontrolním sérem (nevyplněná křivka) a výsledky specifickým barvením (vyplněná křivka). Posun křiv specifického barveni oproti kontrolní křivce odooví expresi H-sema-L v odpovídajících buňkách. Čím větší pos tím silnější exprese.
Buněčné linie použité pro FACS analýzu a) Buněčná linie U937
Ti · - v -Q
Uložena u Americké sbírky mikroorganismů, (American Culture Collection, ATCC) pod číslem: CRL-1593, jméno: Tkáň: lymfom; hístiocytární; podobný lymfocycúm Druh: člověk ;
Autor: H. Kořen b) Bur léčná iin ie THP-1 .ATC r příst upo vé číslo : T13-2C2 Tká ň: monoc yt; akutní monocytární Druh: čiově k n % _ KU ^ or : S. T suc hiva c) Buněčná linie K-562 ATCC, přístupové číslo : CCL-243 Tkáň: chronická myelogenní leukémie Druh: člověk ; 1 ·! • · • ♦ • • · • * • * • · ·*· * • • · t* « * • * * · • * · · • · · • · • · • ♦ * • « * • • · • · ·* ·· ·* ··
Autor: K.T. Holder> d) Buněčná linie L-42 8 Německá sbírka buněčných kutlur a mikroorganismu, (DSMZ-Deutsche Sammlung ven Mikroorganismen a Zeli kul turen'!, přístupové číslo: ACC 197 Typ buňky: lidsky Hodgkmsuv Lyrarcm e) Buněčná linie Jurkat DSMZ, přístupové číslo: ACC 282 Typ buňky: lidská T-buněčná leuken:e f) Buněčná linie Daudi ATCC, přístupové číslo: CCL-213
Tkáň: BurkitcUv lymtcm; B-Iyrtfoblast; B-h/oičocyty Druh : člověk Autor: G. Klein
g) Buněčná linie LCL E3V- trans formovaná lymfoblastoidní B-buněčná iir.ie h) Buněčná linie Jívové 'P-2003' ATCC Number: CCL-87
Tkáň: Burkittuv lyrcfom; B-iynfocyty
Druh: člověk Autor: W. Honíc -45- φφφ φφφφ φφφφ φ φφφφ φ φφφ φ φφφ φ φ φ φφφ φφ φφ φφφ φ φ Φφφφ φφφφ φφφ -Μιχ: ' ““ c'“d (izolovaná z krve) transformovaná rekoímnr.ani.nim n. Saimiri (přirozeným typem bez delece) i -v·v ςα i-ounecna linie (izolovaná z krve) transformovaná rekcmbinantnim K. Saimiri (s delecí 0RF71 ) lad 10: Gelevá e covány lidský s-ektrcíoréza proteinů a Western blot 5ma-L (aminokyseliny 42 až 649 v tabulce 4) bez signálního peptidu a bez transmembránové domény byl naKlonován co piazmiou pMeIBac-Α (Invitrogen, De Schelp, Leck, Holandsko, Cv 19o0-20) a tím vznikl plazmid pMeIBac-A-K-serr.a-c o delce 6622 bp, viz obrázek 8. Derivát semaforinu H-sema-L byl exprimcván v baču1ovirovém expresivnim systému (3ac-NÍ-3iue, Invitrogen} . Exprese byla prováděna ve hmyzí buněčné linii Sf9 odvozené od vaječných buněk Spodoptera fruoioerda a v buněčné linii High Five™ z Trichoplusia ni, U.S. patent číslo 5.300.435 (Invitrogen) po infekci rekombinantním, přečištěným baculovirem.
Exprese byla prováděna podle instrukcí dodavatele. Po expres: byly rozděleny proteiny na gelu a derivát H-sema-L ve Western blotu. Detekce byla provedena sp-mifíckvm slepičím antisérem (viz příklad 8 a obrázek 7) řpHSr,·;^ 1:100. Specifické slepičí protilátky byly detekovány kormu-játem ar.ti-IgY s křenovou peroxidázou v ředěni 1:3000 ,; „rot i látka, laboratoře Diananova Jackson) podle [ O b i * ť - ^ ' r instrukci výrobce. -46- • · ♦ * * * · · · t t • · *·♦ · * ·* I t ·· • ·* · · · * · · · t * * · * • · · · t · * * » I ·
Příklad 11: Příprava plazmidu pMeIBacA-H-sema-L
Vložením DNA fragmentu kódujícího aminokyseliny 42 až 649 semaforinu H-sema-L do vektoru pMelBacA (4,8 kbp, Ir.vitrogen) byl připraven rekombinantní vektor pMeI3acA-K-sema-L (délka 6622bp). Ke klonování bylo využito restrikčních míst pro enzymy BamHI a EcoRI ve čtecím rámci za signální sekvencí obsaženou ve vektoru (signální sekvence z včelího melitinu). H-sema-L DNA fragment byl amplifikcván párem primerů h-sema-1 baculo 5' a h-sema-1 baculo 3'.
Primery použité pro amplifikaci (s TaKaRa Ex Taq-pcívmerázou) a klonováni:
h-sema-1 baculo 5' k amplifikaci bez signální sekvence a pro vložení restrikčního místa BamHI 5'-CCGGATCCGCCCAGGGCCACCTAAGGAGCGG-3’ (Sekvence id.č.: 43) h-sema-1 baculo 3' k amplifikaci bez transmembranove domer.y a oro vložení restrikčního místa EcoRI 5’-CTGAATTCAGGAGCCAGGGCACAGGCATG-3' (Sekvence id.č.: 44:. -4 t · « ···* É··· « ···· * ·*φ · · * * * · I ··· ·» ·· *·Ι · * ···· * · · · ··· i Lil σι σι i—t i _____ ____ 'O 1 Lil \r~\ lO Lil ι_Π x. 1 l 01 m cr. σ'. G", σι —- — *vT CJl r-i σι σι νΤ1! 1—I '.O 01 — i—1 rd .—Η — 1— cn — o [— —- X — —- ΟΊ r£) 00 CO -r-l rM i—* M cn Ή (0 Ή Η I HO •3\ m m >(!) >co ι—i t-x íd 1—1 -P ι~Η ,—1 1--> Φ H —* —' O X i ro X (¾ 03 Ο Ί3 >(0 >tn c Ή >(/) Ό p X X 1—1 1—1 .a i co X £ Φ ‘0 (U > <—1 i—1 íO x Π3 03 φ ~G m 0 !d u XJ P, X -H .—( <n I- <—1 γΗ £ fd Φ 03 -.-i >P (U <L> P QJ ω Ρ ra J-l r-1 id a u X 0) X X ίΟ > i/] rn co |Λ (TI υ co U U 7J\ —i £ fc ^i 3 P 0 4-> ω (!) (!) (!) ιΌ ρ íd X o P Ή o OJ α α C ξ T~< •p _c OJ sz •T3 o x £ CU X Μ i-2-l < < u P Ή > > c P Td jj -i-J Τ 0 C Ο £ | p — tp 0>i ">1 X > O > > i—! O Ό ! >υ Cj £ (”* α> > u —· —1 X (!) φ'· £ Φ '03 c 0 Q 0 >υ Φ Qj d OJ > n rs 1 O p o o P 1 X £ o _C ; . L * <1) j •i—1 00 z: £ > : p O f-^ P Cli Ή > Φ c* X >(0 ,d V) <5 'Τ3 Φ > J.1 > > 0) £ > nd 0 0 α 'v *x 0 a o i-! AJ Φ Ο U CJ C j P u >0 Pl 0) 0) 0) h-Ι 5—i — !—1 f—! OJ M OJ P Ρ > X' P v 10 X V 71 2 OJ φ CD £ T, Φ £ 'id t-· Cl C0 cn Ε-* -Φ E—· ri Ír- >u X rJ >m >(Λ m Η0 m KO o/] >ro HO >Í0 P > >1 >. >1 > >- >1 >1 > > a e e c: £ £ - £ £ H e H π M £5 £_ f “l É 1 d 1 1 T >, cd φ iTS o c £ £ £ £ £ —i 0 <U φ 3 Φ Φ 5 c (!) ο co o Ί) 'Λ- >. | 1 1 i s X £ E 71 O --C C'j C'-J 1-t u Q I I d r_n I £j I r a 1 I > I ,-l ř li) 1 'Tj 1 Φ Φ 1 Φ 1 1 •Π I O 1 Φ 0 Ξ £ Ε ρ P £ £ ci £ 1 c 0) Φ φ Φ Φ Φ Φ Φ d) Φ V) co (0 71 /1 o CO 7? Tj ^0 1 ti 1 1 1 j I 1 1 f 1 1 ; t-j v y V £ £ v • · • «·· • · ·« i
f no • X 1 ^ — “V Γ" ____ CO lO 1 c\ co — CTr σ σ σι < i—1 — σ· '•C 'X σ σ a\ σ cn I ~ CTi σ σ σ T-4 σ 1-\ i—1 1 I cn |—t σ σ ^—t r-l χ_- _ ,Η a\ rH ι-Η n3 — , κο rH — T3 Ή : ' vH i 03 Kl—{ fO m >ffl c Hfl ‘.ι-H »co e o xo Λ1 r—1 ,—t T? Ή Γ1 1 >co >ro 1-1 CO c r^H >t0 (0 (0 1 KO co r-H rH N ΊΤΙ fO •CO Ή X) X j Ό tc ti T3 > "ϋ rH rc 03 Oj “V 0 jp (0 (U i ^ Ό (T3 (ti o Jxí X ι—1 1 ti cg -H >ÍH 1--1 ,—1 OJ 1 ..V <13 0 0 CM nH O a ΟΙ tu 0 ~c Ό 0 tji Ό O A co A A <T5 0 —1 rH x c -H o P -Ό 0 O U -U —1 '“f X! 0 0 JX o a co to -H 0 fC tu o rH 0 cn (U cC iU :3 O u 1 00 X X ϋΐ << c 2; -P Cu -0 J lO » p-J | 0 a —! i—1 O 1 a u Cj Cl rj ΊΪ3 Lú Cil O : X! rO ΓΌ J^4 · H a: >c Ji co CO m-H v>. •Ή p 3 σ. ‘ 1 1 c í JO ,.y r^ E-' 0 Q ‘0 & > 1—1 1—1 01 Vt 0 > 0) Ή v v. > > . ·» •w· '3>i VH ν’Η n 4>1 '>, £ 0 r' C p γ- V r* CJ C iTJ co <U ‘H (T3 ιΟ l0 K4 Π3 > ra > > > Γ-; > > 0 o 0 /Λ 0 1 0 M o U £ 4-J 4-J 4-J C3 X 0) j-t Ό OJ O — cu O O 6 X _Q tu !—! u 1- H íh Íh a) u 1 X Q-i X w v ai 2 X 0) O O 1 OJ 2 tu T. ' co ř 4 a> co co 'pO X co E- to E~i j x: X ><L) KU >01 >0 KU KU »<u — > > > > > > > Q 0 0 Q O Q O m >(0 1—' 1—1 -P —i ,—í 1—1 >1 >, Q >03 >u >u ‘O >o KJ >ο Ξ e Cli c d < n 3 í T—1 x iO ti 10 > ť c: £ ro C X OJ (D o Ί o ¢0 co CO fí c > l-Li X X M w 01 NI co > i—1 M i U] NO X < m ιΠ 10 Kj ti 1 MJ 1 'T3 1 tu 1 n3 0 — £ £i £ e É £ — <U o OJ O δ OJ (Ú OJ '(U - 1 0 ! :o i co 1 co· lf) to m (/) 0 | 0 1 1 1 no 1 1 1 S 49 • « » t % * · · t ·* * » ·· 1 r^, ΓΟ i ή σ σ\ σι ι—i i~C 1 - '-r-t Ή m „i >C0 I TJ 10 1 V Ό φ ! o d ‘Ό 0 0 1 'M u c ,4 -—- .—. .__ m m n C\ σ cn ú\ σ <Ti 1-\ i—1 tH - Ή Ή >r/3 HO K/3 ι—! *—1 } HTJ rC ro Ό X Ό m d <ΰ 0 0 0 P d 3 l-H 41
ΟΊ Ch .— co <Η σ — σ t-H Ή σ — >10 σ Η γΗ Ή (13 -— )t0 Ό —1 >1 (0 ο X C (0 γ-1 ,. -4 Γ- μ X VD 0) ο VX) ϊσ <—I m γΗ Ο ι—1 Ο D - .—. ΓΟ m η CTi σ σ 03 σ σ i—1 ι—1 Ή Ή Ή >ω >(0 >C0 ι—l <—1 •Η o <τί Π3 ιΤ) c '*Τ5 Ό X X > 0 ίΰ Φ <ΰ X α C C H *Η Ή Η -H Λί X X X TS X X Ο 0 ο a η~Η 1-1 ι—1 φ 0 Ο 0 £ Νί X id '>1 r^ TJ íC > > .•x Γ\ 4_J <1? OJ M •ti 'V co OJ Γ/3
OJ u c (1) > -> 0) 4 10 c LTJ /Τ» > Mil· > £ 0 u >u -μ <D OJ a; u xj 4 Ό λ; <D MT3 ai r0 >o CO coc (Z>o
4J U u CL· !—f 1—1 -.0 CL· £ s 73 ĚH
o o Μ M
fd 1 CD Cl) 1 0 u i r-1 •H r~· Cj a cD CD ^ i 1—1 _I a co to tl) φ CD u o u H • n-| •H a d, a CD 0) φ '—1 1—i I co co co CO f= C Oj g 01 •H 4 Cr •—1 CO CJ 0 4 -—1 co X! lw OJ >1 H 4 Dc O Λί E-< U Γ )
!"0 i—| ^ -H > o X) -u O ϋ M O octomilka sekretova > Mc 0 I >ι ! o co <d 1 1 CO [ 1 *-* í -H CO V3 | Lú Γι Μη C', 1 ilj, lTJ c i ,—f '0? 1 ‘—i Ή )-« 1 ^ [ c Γ)
Γ0 j τ un £ 1 4 1 C ni Ή H to CO CO a a a (Ό (0 cd r-f 1—1 -H <- 1 ‘—1 i—1 O O O 00 X III M r c 1 1 1 <d Id '0 G ε ε 0) φ OJ f/) co (0 1 1 1 a> X H u 1—i i ř—i II rd J rd [ cd Fi 0) B E Q) CD to I V) I CO LT 1 Ci 1 a -50- • φ φ φ « I I I * · · • ·«·· Φ ··* · I »· • · a · é f I » ·· ·*·· · • Φ · · Φ · * · ··· co CO £ m cn Η m (Ti φ \—l rH Ρ <ο C Ή Ή φ >(/) ></) Ρ 1-1 ’—1 U OJ (ΰ Φ Ό v '—1 U4 íTS co φ C íH Ή rH φ S-. l J M υ Φ ίΟ TJ 13 03 Í0 CTs O O Ρ C0 ΟΊ 1—í i—1 Η C rH 0 0 υ Μ '>! '>1 '>1 1—* i—i C G Φ Φ Φ > > > 0 O 0 P P P Φ φ 0) d φ Φ p V A P φ Φ cu co CO co > Η Ρ Ο υ ρ (0e Φ αο Ρ >ιυ Ι~*
3 c; 1-Η> 1- Ο C >> CO Φ ίϋ H r-t c d Ϊ—i Ή r-| 1 u U > P P' ’Χ, Φ φ > > Φ ε σ, φ η 0 cn < G I I OJ t--,ř [14 ε £ σ; σ α\ Ο ίσο I—Iοπο ρ σ mC ι [υ tliΟ £ VI ίό Φ 1—I Π Φ 'φ U g Φ Ο £ Ό Ρ £ 'Φ -r-i > Ο '>1 £i £ (tí _Q i. Ο jQ Τίε ο Φ Ο. G >Φ υ) Ό C > (0 Φ 1-4 1-1 4 i α Σ U Fn t-i -51- -51- • · ·· ♦ % t · « * « » · * ·· ··* · · * * * · · · * · · · ·
Tacuiía 2: cDNA-sekvence K-Serna-L (2636 nukleotidů) (Sekvence Id. č.: 1)
1 cggggccacg ggatgacgcc tcctccgccc ggacgtgccg cccccagcgc 51 accgcgcgcc cgcgtccctg gcccgccggc tcggttgggg cttccgctgc 101 ggctgcggct gctgctgctg ctctgggcgg ccgccgcctc cgcccagggc 151 cacctaagga gcggaccccg catcttcgcc gtctggaaag gccatgtagg 201 gcaggaccgg gtggactttg gccagactga' gccgcacacg gtgcttttcg 251 acgagccagg cagctcctct gtgtgggtgg gaggacgtgg caaggtctac 301 ctctttgact tccccgaggg caagaacgca tctgtgcgca cggtgaatat 351 cggctccaca aaggggtcct gtctggataa gcgggactgc gagaactaca 401 tcactctcct ggagaggcgg agtgaggggc tgctggcctg tggcaccaac 451 gcccggcacc ccagctgctg gaacctggtg aatggcactg tggtgccact 501 tggcgagatg agaggctacg cccccttcag cccggacgag aactccctgg 551 ttctgtttga aggggacgag gtgtattcca ccatccggaa gcaggaatac 6C1 aatgggaaga tccctcggtt ccgccgcatc cggggcgaga gtgagctgta 651 caccagtgat actgtcatgc agaacccaca gttcatcaaa gccaccatcg 701 tgcaccaaga ccaggcttac gatgacaaga tctactactt cttccgagag 751 gacaatcctg acaagaatcc tgaggctcct ctcaatgtgt cccgtgtggc 801 ccagttgtgc aggggggacc agggtgggga aagttcactg tcagtctcca 851 agtggaacac ttttctgaaa gccatgctgg tatgcagtga tgctgccacc 901 aacaagaact tcaacaggct gcaagacgtc ttcctgctcc ctgaccccag 951 cggccagtgg agggacacca gggtctatgg tgttttctcc aacccctgga 1001 actactcagc cgtctgtgtg tattccctcg gtgacattga caaggtcttc 1051 cgtacctcct cactcaaggg ctaccactca agccttccca acccgcggcc 1101 tggcaagtgc ctcccagacc agcagccgat acccacagag accttccagg 1151 tggctgaccg tcacccagag gtggcgcaga gggtggagcc catggggcct 1201 ctgaagacgc cattgttcca ctctaaatac cactaccaga aagtggccgt 1251 tcaccgcatg caagccagcc acggggagac ctttcatgtg ctttacctaa 1301 ctacagacag gggcactatc cacaaggtgg tggaaccggg ggagcaggag 1351 cacagcttcg ccttcaacat catggagatc cagcccttcc gccgcgcggc 1401 tgccatccag accatgtcgc tggatgctga gcggaggaag ctgtatgtga 1451 gctcccagtg ggaggtgagc caggtgcccc tggacctgtg tgaggtctat 1501 ggcgggggct gccacggttg cctcatgtcc cgagacccct actgcggctg 1551 ggaccagggc cgctgcatct ccatctacag ctccgaacgg tcagtgctgc 1601 aatccattaa tccagccgag ccacacaagg agtgtcccaa ccccaaacca 1651 gacaaggccc cactgcagaa ggtttccctg gccccaaact ctcgctacta 1701 cctgagctgc cccatggaat cccgccacgc cacctactca tggcgccaca 1751 aggagaacgt ggagcagagc tgcgaacctg gtcaccagag ccccaactgc 1801 atcctgttca tcgagaacct cacggcgcag cagtacggcc actacttctg -52- • · • · · 18 51 cgaggcccag gagggctcct acttccgcga ggctcagcac tggcagctgc 1901 tgcccgagga cggcatcatg gccgagcacc tgctgggtca tgcctgtgcc 1951 ctggctgcct ccctctggct gggggtgctg cccacactca ctcttggctt 2001 gctggtccac tagggcctcc cgaggctggg catgcctcag gcttctgcag 2051 cccagggcac tagaacgtct cacactcaga gccggctggc ccgggagctc 2101 cttgcctgcc acttcttcca ggggacagaa taacccagtg gaggatgcca 2151 ggcctggaga cgtccagccg caggcggctg. ctgggcccca ggtggcgcac 2201 ggatggtgag gggctgagaa tgagggcacc gactgtgaag ctggggcatc 2251 gatgacccaa gaetttatet tctggaaaat atttttcaga ctcctcaaac 2301 ttgactaaat gcagcgatgc tcccagccca agagcccatg ggtcggggag 2351 tgggtttgga taggagagct gggactccat ctcgaccctg gggctgaggc 2401 ctgagtcctt ctggactctt ggtacccaca ttgcctcctt cccctccctc 2451 tctcatggct gggtggctgg tgttcctgaa gacccagggc taccctctgt 2501 ccagccctgt cctctgcagc tccctctctg gtcctgggtc ccacaggaca 2551 gccgccttgc atgtttattg aaggatgttt gctttccgga cggaaggacg 2601 gaaaaagctc tgaaaaaaaa aaaaaaaaaa aaaaaa .bulle : 2) a 3; Nukleotidová sekvence cDNA M-Sema-n (Sekvence 1 cggggetgeg ggatgacgcc tcctcctccc ggacgtgccg cccccagcgc 51 accgcgcgcc cgcgtcctca gcctgccggc tcggttcggg ctcccgctgc 101 ggctgcggct tctgctggtg ttctgggtgg ccgccgcctc cgcccaaggc 151 cactcgagga gcggaccccg catctccgcc gtctggaaag ggcaggacca 201 tgtggacttt agccagcctg agccacacac cgtgcttttc catgagccgg 251 gcagcttctc tgtctgggtg ggtggacgtg gcaaggtcta ccacttcaac 301 ttccccgagg gcaagaatgc ctctgtgcgc acggtgaaca tcggctccac 351 aaaggggtcc tgtcaggaca aacaggactg tgggaattac atcactcttc 401 tagaaaggcg gggtaatggg ctgctggtct gtggcaccaa tgcccggaag 451 cccagctgct ggaacttggt gaatgacagt gtggtgatgt cact tggtga 501 gatgaaaggc tatgccccct tcagcccgga tgagaactcc ctggttctgt 551 ttgaaggaga tgaagtgtac tctaccatcc ggaagcagga atacaacggg 601 aagatccctc ggtttcgacg cattcggggc gagagtgaac tgtacacaag 651 tgatacagtc atgcagaacc cacagttcat caaggccacc attgtgcacc 101 aagaccaagc ctatgatgat aagatctact acttcttccg agaagacaac 751 cctgacaaga accccgaggc tcctctcaat gtgtcccgag tagcccagtt 801 gtgcaggggg gaccagggtg gtgagagttc gttgtctgtc tccaagtgga 851 acaccttcct gaaagccatg ttggtctgca gcgatgcagc caccaacagg 901 951 1001 1051 1101 1151 aacttcaatc gtggagagat cagctgtctg tcatcgctca gtgcctccca atagtcaccc ggctgcaaga accagggtct cgtgtattcg aaggctacca aaaaagcagc agaggtggct tgtcttcctg atggcgtttt cttggtgaca catgggcctt ccatacccac cagagggtgg ctccctgacc ctccaacccc ttgacagagt tccaaccctc agaaaccttc aacctatggg ccagtggcca tggaactact cttccgtacc gacctggcat caggtagctg gcccc • ···
*·♦ · * ♦ (666 -O1
Tabulka 4: Aminokyselinová sekvence K-Serca aminokyselin) (Sekvence id. č.: 3)
1 MTPPPPGRAA PSAPRARVPG PPARLGLPLR LRLLLLLWAA AASAQGHLRS 51 GPRIFAVWKG HVGQDRVDFG QTEPHTVLFH EPGSSSVWVG GRGKVYLFDF 101 PEGKNASVRT VNIGSTKGSC LDKRDCENYI TLLERRSEGL LACGTNARHP 151 SCWNLVNGTV VPLGEMRGYA PFSPDENSLV LFEGDEVYST IRKQEYNGKI 201 PRFRRIRGES ELYTSDTVMQ NPQFIKATIV HQDQAYDDKI YYFFREDNPD 251 KNPEAPLNVS RVAQLCRGDQ GGES5LSVSK WNTFLKAMLV CSDAATNKNF 301 NRLQDVFLLP DPSGQWRDTR VYGVFSNPWN YSAVCVYSLG DIDKVFRTSS 351 LKGYHSSLPN PRPGKCLPDQ QPIPTETFQV ADRHPEVAQR VEPMGPLKTP 401 LFHSKYHYQK VAVHRMQASH GETFHVLYLT TDRGTIHKW EPGEQEHSFA 451 FNIMEIQPFR RAAAIQTMSL DAERRKLYVS SQWEVSQVPL DLCEVYGGGC 501 HGCLMSRDPY CGWDQGRCIS IYSSERSVLQ SINPAEPHKE CPNPKPDKAP 551 LQKVSLAPNS RYYLSCPMES RHATYSHRHK ENVEQSCEPG HQSPNCILFI 601 ENLTAQQYGH YFCEAQEGSY FREAQHWQLL PEDGIMAEHL LGHACALAAS 651 LWLGVLPTLT LGLLVH
Tabulka 5: Aminokyselinová sekvence části M-Sema-L (394 aminokyselin, počáteční posice 1-396 H-Sema-L) (Sekvence id.
: 41 1 MTPPPPGRAA PSAPRARVLS LPARFGLPLR LRLLLVFWVA AASAQGHSRS 51 GPRISAVWKG QDHVDFSQPE PHTVLFHEPG SFSVWVGGRG KVYHFNFPEG 101 KNASVRTVNI GSTKGSCQDK QDCGNYITLL ERRGNGLLVC GTNARKPSCW 151 NLVNDSVVMS LGEMKGYAPF SPDENSLVLF EGDEVYSTIR KQEYNGKIPR 201 FRRIRGESEL YTSDTVMQNP QFIKATIVHQ DQAYDDKIYY FFREDNPDKN 251 PEAPLNVSRV AQLCRGDQGG ESSLSVSKWN TFLKAMLVCS DAATNRNFNR 301 LQDVFLLPDP SGQWRDTRVY GVFSNPWNYS AVCVYSLGDI DRVFRTSSLK 351 GYKMGLSNPR PGMCLPKKQP IPTETFQVAD SHPEVAQRVE PMGP
Tabulka 6: Syntetické oligonukleotidy, (Eurogentec, Seraign, Belgie)
. 1 « ·*-·* * * « *
• I M« I V·· I · M • I · ··* · * ·· *»« · * » t f «··« I f ·
Tabulka 7: Nukleotidová pCR2.l-H-Serp.a-L (Sekvenc 1 AGCGCCCAAT ACGCAAACCG Sl TGCAGCTGGC ACGACAGGTT 101 CGCAATTAAT GTGAGTTAGC 151 TTATGCTTCC GGCTCGTATG 201 CACACAGGAA ACAGCTATGA 251 gcaagccaag agtgagtgtg 301 agggcacagg catgacccag 351 cagcagctgc cagtgctgag 401 cgcagaagta gtggccgtac 451 atgcagttgg ggctctggtg 501 cttgtggcgc catgagtagg 551 ggtagtagcg agagtttggg rekombinantniho sekvence e i d. č. : CCTCTCCCCG TCCCGACTGG TCACTCATTA TTGTGTGGAA CCATGATTAC ggcagcaccc caggtgctcg cctcgcggaa tgctgcgccg accaggttcg tggcgtggcg gccagggaaa 34) CGCGTTGGCC AAAGCGGGCA GGCACCCCAG TTGTGAGCGG GCCaagcttc ccagccagag gccatgatgc gtaggagccc tgaggttctc cagctctgct ggattccatg ccttctgcag GATTCATTAA GTGAGCGCAA GCTTTACACT ATAACAATTT acgtggacca ggaggcagcc cgtcctcgggtcctgggcct gatgaacagg ccacgttctc gggcagctca tggggccttg plazraidu t í ';· μ C ιτ.^. z z > ·'.·.’ r. ί v e n I Sekvence nukleotidu 2 I 2 2 7 / Z Z 3 .-iccjtagaccctgg-.gr.w S£V.vorv^<3 kd . . : rí ;:;39·Ί.>ι 4 qca qr rj g igcbgccacca ar Seltvunce i d . č . : D CCOCj-iiCCa tqL (V J[, qq g i; q 0 ť; k v e! i c 1-c.č. 10 íij 1 g a -.3 q c a a c c g t. g j c ti g SeKvence id-Č ;i 1 13:93 vap; cc ne cc t a a t acg a ct c a c t j t a ggg c Sekvence id.č.:12 :31991735-. r aqqtagaccLtgccacgtcc Sekvence itj, č . : 13 131?3 3 gaaetteaacagqcUgcaacjacg Ser.ve nce 1 d. d : 1 -i 1319-33 atgctgagcqgaggaagctg Sekvance id.č.: 1“ 131391 c «c q 0 o a a c a c e t. o a c <i e .¾ q Sekvenc'.- id.i.: 19 c l g · j a a q c 111 c i. g t g g g t a c c g g e t. g : Sekvence ic.C : 1 ' ’ ť- \' ? '-Λ -i ϊ-ttggatccctgqr tctqtttgaaq .Sakvence i c - č - t i ď 1 «2 7 · 'J / Cl C 2 Γ Π a ttctagaa t tcagcggccgcLt ttt E t tt r f. ttctttt ttttttttt Sekvence id.č, : 1 9 syris::·. :2::λ c ttvn 193131 jgggaaagt tcactgt cagtctccaag Sekvtf (\ ce ic . 20 139-133 ggg .i atacacacagícqq c t g a q tag Sekvence ; .». . ; 21 303 3 0 0 / p ro =1 mp iiíikaci cigca ag 11 c aq c c t.gg 11 a a g t Sekvence id,č. : 2- 30"α9Γ'/ pr-j anplifUac t ta tgagta t ttfit. tccageg Sek ver.ee L-j.c. : 33 ; -0':i ccattaatccaq c. c q a q c c a c a c a a q o-ekver.c.e Ld.ó.:24 ZlZoA -i / E j1 ! . C Λ t c t a e a q c t e rq -1-1 -- ;j ; ·. c a g - g Sek ve.rcn 2 J. 2 0 d 1 -* V-1 j Lť -* R '-j C C C C ťJ C 0 Ct; -! -.j Sc kvenc-j id.č-:2¾ C -1 0 ή c: T i H S 7 gqg.jtgccgcctcct-cgeeogg Sek v e Γ; c c - - ·- ; ' 3-i 09 1 3/ H.l 1 aaget tcacgtqqracctiqcaagccaaq ag r.q Sekvence ui.č. 3.;;3:'/rU M haqr-AX. t ttgcgccttttcg r. c e g g Sekvence iO . c . · 2- S A 2 0 0 7 atggtgaqcaacjggegdggagctq Sekvence id.c.:30 cntgr.acagctcgiíccatqccťjay Sekvence id.-i. : ’ i gggtggtgagagť:<;gtcgtctgr.c Sekvence ičc.: i- mih: .1 gagcgaigagqta c g .1 -a ς a c r. : r. g lÍňfcvar,.;:.· 601 tctggtttgg ggttgggaca ctccttgtgt ggctcggctg gattaatgga • · • *·* » · ' • · < Φ I « « «««f φ · |· · «·· φ · « ·· ···· * • « · · * · * φ· Μ Μ ··
651 ttgcagcact gaccgttcgg agctgtagat ggagatgcag cggccctggt 701 cccagccgca gtaggggtct cgggacatga ggcaaccgtg gcagcccccg 751 ccatagacct cacacaggtc caggggcacc tggctcacct cccactggga 801 gctcacatac agcttcctcc gctcagcatc cagcgacatg gtctggatgg 851 cagccgcgcg gcggaagggc tggatctcca tgatgttgaa ggcgaagctg 901 tgctcctgct cccccggttc caccaccttg tggatagtgc ccctgtctgt 951 agttaggtaa agcacatgaa aggtctcccc gtggctggct tgcatgcggt 1001 gaacggccac tttctggtag tggtatttag agtggaacaa tggcgtcttc 1051 agaggcccca tgggctccac cctctgcgcc acctctgggt gacggtcagc 1101 cacctggaag gtctctgtgg gtatcggctg ctggtctggg aggeacttgc 1151 caggccgcgcj gttgggaagg cttgagtggt agcccttgag tgaggaggta 1201 cggaagacct tgtcaatgtc accgagggaa tacacacaga cggctgagta 1251 gttccagggg ttggagaaaa caccatagac cctggtgtcc ctccactggc 1301 cgctggggtc agggagcagg aagacgtctt gcagcctgtt gaagttcttg 1351 ttggtggcag catcactgca taccagcatg gctttcagaa aagtgttcca 1401 cttggagact gacagtgaac tttccccacc ctggtccccc ctgcacaact 1451 gggccacacg ggacacattg agaggagcct caggattctt gtcaggattg 1501 tcctctcgga agaagtagta gatcttgtca tcgtaagcct ggtcttggtg 1551 cacgatggtg gctttgatga actgtqggtt ctgcatgaca gtatcactgg 1601 tgtacagctc actctcgccc cggatgcggc ggaaccgagg gatcttccca 1651 ttgtattcct gcttccggat ggtggaatac acctcgtccc cttcaaacag 1701 aaccagggag ttctcgtccg ggctgaaggg ggcgtagcct ctcatctcgc 1751 caagtggcac cacagtgcca ttcaccaggt tccagcagct ggggtgccgg 1801 gcgttggtgc cacaggccag cagcccctca ctccgcctct ccaggagagt 1851 gatgtagttc tcgcagtccc gcttatccag acaggacccc tttgt-ggagc 1901 cgatattcac cgtgcgcaca gatgcgttct tgccctcogg 0 3. cl C 3 3 3 Q 1951 aggtagacct tgccacgtcc tcccacccaq acagaggagc tgcctggctc 2001 gtggaaaagc accgtgtgcg actcagtctg gccaaagtcc acccggtcct 2051 gccctacatg gcctttccag acggcgaaga tgcggggtcc gctccttagg 2101 tggccctggg cggaggcggc ggccgeccag aocagcag^a gcagccgcag 2151 ccgcagcgga agccccaacc gagccggcgg gccagggacg cgggcgcgcg 2201 gtgcgctggg ggcggcacgt ccgggcagag gaggcgtcat cccaagccga 2251 attcTGCAGA TATCCATCAC ACTGGCGGCC GCrCGAGCAT GCATCTAGAG 2301 GGCCCAATTC GCCCTATAGT GAGTCGTATT AGAATTCACT GGCGGTCGTT 2351 TTACAACGTC GTGACTGGGA AAACCCTGgC GTTACCCAAC TTAATCGCCT 2401 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA 2451 CCGATCGCCC TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG 2501 CCCTGTAGCG GCGCATTAAG CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT
-57-
2551 GACCGCTACA CTTGCCAGCG CCCTAGCGCC CGCTCCTTTC GCTTTCTTCC 2601 CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC TCTAAATCGG 2651 GGGCTCCCTT TAGGGTTCCG ATXTAGAGCT TTACGGCACC TCGACCGCAA 2701 AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CCCTGATAGA 2751 CGGTTTTTCG CCCTTTGACG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC 2801 TTGTTCCAAA CTGGAACAAC ACTCAACCCT ATCGCGGTCT ATTCTTTTGA 2851 TTTATAAGGG ATTTTGCCGA TTTCGGCCTA TTGGTTAAAA AATGAGCTGA 2901 TTTAACAAAT TCAGGGCGCA AGGGCTGCTA AAGGAACCGG AACACGTAGA 2951 AAGCCAGTCC GCAGAAACGG TGCTGACCCC GGATGAATGT CAGCTACTGG 3001 GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG 3051 CAGTGGGCTT ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA 3101 GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC 3151 TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG 3201 GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG 3251 AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA 3301 TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT 3351 GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC 3401 TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 3451 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTC-CTCGACC- TTGTCACTGA 3501 AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC 3551 TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA 3601 ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA 3651 AGCGAAACAT cgcatcgagc GAGCACGTAC TCGGATGGAA GCCGGTCTTG 3701 TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA 3751 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT 3801 GATCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT 3851 TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 3901 GACATAGCGT TGGATACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG 3951 GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC 4001 GCATCGCCTT CTATCGCCTT CTTGACCAGT TCTTCTGAAT TGAAAAAGGA 4051 AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC CTTTTTTGCG 4101 GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG TGAAAGTAAA 4151 AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC 4201 TCAACAGCGG TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGT7TTCCA 4251 ATGATGAGCA cttttaaagt TCTGCTATGT CATACACTAT TATCCCGTAT 4301 TGACGCCGGG CAACAGCAAC TCGGTCGCCG GGCGCGGTAT TCTCAGAATG 4351 ACTTGGTTGA GTACTCACCA GTCACAGAAA AGCATCTTAC GGATGGCATG 4401 ACAGTAAGAG AATTATCCAG TGCTGCCATA ACCATGAGTG ATAACACTGC • · m · ·· • · i • · 4 l · · · * * ř É I · M « · · , » · ·♦ ···· » · · · · ·* ·· ·· * 4451 GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT 4501 TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG 4551 GAGCTGAATG AAGCCATACC AAACGACGAG AGTGACACCA CGATGCCTGT 4601 AGCAATGCCA ACAACGTTGC GCAAACTATT AACTGGCGAA CTACTTACTC 4651 TAGCTTCCCG GCAACAATTA ATAGACTGGA TGGAGGCGGA TAAAGTTGCA 4701 GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA TTGCTGATAA 4751 ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC 4801 CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG 4851 GCAACTATGG ATGAACGAAA TAGACAGATC GCTGAGATAG GTGCCTCACT 4901 GATTAAGCAT TGGTAACTGT CAGACCAAGT TTACTCATAT ATACTTTAGA 4951 TTGATTTAAA ACTTCATTTT TAATTTAAAA GGATCTAGGT GAAGATCCTT 5001 TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT CGTTCCACTG 5051 AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT 5101 TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG 5151 GTGGTTTGTT TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC 5201 TGGCTTCAGC AGAGCGCAGA TACCAAATAC TGTCCTTCTA GTGTAGCCGT 5251 AGTTAGGCCA CCACTTCAAG AACTCTGTAG CACCGCCTAC ATACCTCGCT 5301 CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA AGTCGTGTCT 5351 TACCGGGTTG GACTCAAGAC GATAGTTACC GCATAAGGCG CAGCGGTCGG 5401 GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC 5451 ACCGAACTGA GATACCTACA GCGTGAGCAT TGAGAAAGCG CCACGCTTCC 5501 CGAAGGGAGA AAGGCGGACA GGTATCCGGT AAGCGGCAGG GTCGGAACAG 5551 GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA ACGCCTGGTA TCTTTATAGT 5601 CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT TGTGATGCTC 5651 GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC 5701 GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA 57 51 TCCCCTGATT CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC 5so: 58 51 CGCTCGCCGC CGGAAG AGCCGAACGA CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG ’ | [\ ‘i.1 ‘í _L eotidová sekvence, rekoinbinantního ex r:-7._ -0 ; - Y-.. .> - Τ'. Li l 3.1 (-) H-Sema-L-KGFP-MycHisA (Sekvence i GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC 51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT * f* - GGAGCTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA acaaggcaag expresníhod. č. : -5.9- • * · * · · · • · · · • « * · t » « · • » ·· * *»· • I · · · ··* * · « · · * · * · 151 GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG 201 CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC 251 TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 301 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG 351 CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT 401 AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT 451 AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC 501 CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA 551 CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 501 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA 651 TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA 701 TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA 751 ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG 801 GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG 851 GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 901 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT 951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc 1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc 1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc 1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat 1151 gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct 1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaaag 1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg 1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa 1351 ctacatcact ctcctggaga ggcggagrga ggggctgctg gcctgtggca 1401 ccaacgcccg gcaccccagc tgctggaacc rggtgaatgg cactgtggtg 1451 ccacttggcg agatgagaqg ctacazcccc ttcaqcccgg aagagaactc 1501 cctggttctg tttgaagggg acgaggt.gta ttccaqcat c cggaagcagg 1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg caagagtgag 1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac 1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc 1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcraa tqrgtcccgt 1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt 1801 ctccaagtgg aacacttttc: tgaaagccat gctggtatgc agtgatgcrtg 1851 ccaccaacaa gaact-wcaac aggct.gcaag acgtcrttcct gctccctgac 1901 cccagcggcc agtggagoga caccagggt.c latggtgttt tctrcaaccc 1951 ctggaactac tcagccgtct wvw w ^ w cctcgg-gac attgacaagg 2001 tcttccgtac ctcctcactc aagggct.č.cc ac'caagcct tcccaacccg • · » » · • * * • · · »1 * v · · · * # · « M t*
* I I * I ««« * * · » • t · * Μ * ·
2051 cggectggca agtgcctccc -60 agaccagcag ccgataccca cagagacctt 2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg 2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg 2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta 2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc 2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc 2351 gcggctgcca tccagaccat gtcgetggat gctgagcgga ggaagctgta 2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg 2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc 2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt 2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca 2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc 2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg 2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca 2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac 2801 ttctgcgagg cccaggaggg ctcctaettc cgcgaggctc agcactggca 2B51 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct 2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt 2951 ggcttgctgg tccacgtgaa gcttGGGCCC GAACAAAAAC TCATCTCAGA 3001 AGAGGATCTG AATAGCGCCG TCGACCATCA TCATCATCAT CATTGAGTTT 3051 AAACCGCTGA TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG 3101 TTTGCCCCTC CCCCGTGCCT TCCTTGACCC TGGAAGGTGC CACTCCCACT 3151 GTCCTTTCCT AATAAAATGA GGAAATTGCA TCGCATTGTC TGAGTAGGTG 3201 TCATTCTATT CTGGGGGGTG GGGTGGGGCA GGACAGCAAG GGGGAGGATT 3251 GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGCTC TATGGCTTCT 3301 GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG 3351 TAGCGGCGCA TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG 3401 CTACACTTGC CAGCGCCCTA GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC 3451 TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT CAAGCTCTAA ATCGGGGCAT 3501 CCCTTTAGGG TTCCGATTTA GTGCTTTACG GCACCTCGAC CCCAAAAAAC 3551 TTGATTAGCG TGATGGTTCA CGTAGTGGGC CATCGCCCTG ATAGACGGTT 3601 TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT 3651 CCAAACTGGA ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT 3701 AAGGGATTTT GGGGATTTCG GCCTATTGGT TAAAAAATGA gctgatttaa 3751 CAAAAATTTA ACGCGAATTA ATTCTGTGGA ATGTGTGTCA GTTAGGGTGT 3801 GGAAAGTCCC CAGGCTCCCC AGGCAGGCAG AAGTATGCAA AGCATGCATC 3851 TCAATTAGTC AGCAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCAGGC 3901 AGAAGTATCC AAAGCATCCA ^CTCAATTAG TCACCAACCA TAGTCCCGCC
0 t · f • · • M « · • · • 9 * · • • * IM • · · t * • » * • · * • ·*· • • · • « • • * • ·« «· ** • · -61-
3951 CCTAACTCCC CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC 4001 CGCCCCATGG CTGACTAATT TTTTTTATTT ATGCAGAGGC CGAGGCCGCC 4051 TCTGCCTCTG AGCTATTCCA GAAGTAGTGA GGAGCCTTTT TTGGAGGCCT 4101 AGGCTTTTGC AAAAAGCTCC CGGGAGCTTG TATATCCATT TTCGGATCTG 4151 ATCAAGAGAC AGGATGAGGA TCGTTTCGCA TGATTGAACA AGATGGATTG 4201 CACGCAGGTT CTCCGGCCGC TTGGGTGGAG AGGCTATTCG GCTATGACTG 4251 GGCACAACAG ACAATCGGCT GCTCTGATGC CGCCGTGTTC CGGCTGTCAG 4301 CGCAGGGGCG CCCGGTTCTT TTTGTCAAGA CCGACCTGTC CGGTGCCCTG 4351 AATGAACTGC AGGACGAGGC AGCGCGGCTA TCGTGGCTGG CCACGACGGG 4401 CGTTCCTTGC GCAGCTGTGC TCGACGTTGT CACTGAAGCG GGAAGGGACT 4451 GCCTGCTATT GGGCGAAGTG CCGGGGCAGG ATCTCCTGTC ATCTCACCTT 4501 GCTCCTGCCG AGAAAGTATC CATCATGGCT GATGCAATGC GGCGGCTGCA 4551 TACGCTTGAT CCGGCTACCT GCCCATTCGA CCACCAAGCG AAACATCGCA 4601 TCGAGCGAGC ACGTACTCGG ATGGAAGCCG GTCTTGTCGA TCAGGATGAT 4651 CTGGACGAAG AGCATCAGGG GCTCGCGCCA GCCGAACTGT TCGCCAGGCT 4701 CAAGGCGCGC ATGCCCGACG GCGAGGATCT CGTCGTGACC CATGGCGATG 4751 CCTGCTTGCC GAATATCATG GTGGAAAATG GCCGCTTTTC TGGATTCATC 4801 GACTGTGGCC GGCTGGGTGT GGCGGACCGC TATCAGGACA TAGCGTTGGC 4851 TACCCGTGAT ATTGCTGAAG AGCTTGGCGG CGAATGGGCT GACCGCTTCC 4901 TCCTGCTTTA CGGTATCGCC GCTCCCGATT CGCAGCGCAT CGCCTTCTAT 4951 CGCCTTCTTG ACGAGTTCTT CTGAGCGGGA CTCTGGGGTT CGAAATGACC 5001 GACCAAGCGA CGCCCAACCT GCCATCACGA GATTTCGATT CCACCGCCGC 5051 CTTCTATGAA AGGTTGGGCT TCGGAATCGT TTTCCGGGAC GCCGGCTGGA 5101 TGATCCTCCA GCGCGGGGAT CTCATGCTGG AGTTCTTCGC CCACCCCAAC 5151 TTGTTTATTG CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA 5201 TTTCACAAAT AAAGCATTTT TTTCACTGCA TTCTAGTTGT GGTTTGTCCA 5251 AACTCATCAA TGTATCTTAT CATGTCTGTA TACCGTCGAC CTCTAGCTAG 53C1 AGCOTGGCGT AATCATGGTC ATAGCTGTTT CCTGTGTGAA ATTGTTATCC 5351 GCTCACAATT CCACACAACA TACGAGCCGG AAGCATAAAG TGTAAAGCCT 5401 GGGGTGCCTA ATGAGTGAGC TAACTCACAT TAATTGCGTT GCGCTCACTG 5451 CCCGCTTTCC AGTCGGGAAA CCTGTCGTGC CAGCTGCATT AATGAATCGG 5501 CCAACGCGCG GGGAGAGGCG GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT 5551 CGCTCACTGA CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA 5601 GCTCACTCAA AGGCGGTAAT ACGGTTATCC ACAGAATCAG GGGATAACGC 5651 AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA AAAGGCCAGG AACCGTAAAA 57Cl AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT 5751 CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA 5801 AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC
φ φ φ φ · • Φ ·Μ · · ·· • · * ft · I · · • » Φ ♦ Φ Φ ♦ • · ΦΦ· · • Φ ΦΦ Φ Φ
5851 CGACCCTGCC GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC 5901 GTGGCGCTTT CTCAATGCTC ACGCTGTAGG TATCTCAGTT CGGTGTAGGT 5951 CGTTCGCTCC AAGCTGGGCT GTGTGCACGA ACCCCCCGTT CAGCCCGACC 6001 GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC 6051 GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG 6101 GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT 6151 ACACTAGAAG GACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTACC 6201 TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA CCACCGCTGG 6251 TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG 6301 GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG 6351 AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT 6401 CTTCACCTAG ATCCTTTTAA ATTAAAAATG AAGTTTTAAA TCAATCTAAA 6451 GTATATATGA GTAAACTTGG TCTGACAGTT ACCAATGCTT AATCAGTGAG 6501 GCACCTATCT CAGCGATCTG TCTATTTCGT TCATCCATAG TTGCCTGACT 6551 CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA 6601 GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA 6651 GCAATAAACC AGCCAGCCGG AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC 6701 TTTATCCGCC TCCATCCAGT CTATTAATTG TTGCCGGGAA GCTAGAGTAA 6751 GTAGTTCGCC AGTTAATAGT TTGCGCAACG TTCTTGCCAT TGCTACAGGC 6801 ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA GCTCCGGTTC 6851 CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG 6901 TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG 6951 TTATCACTCA TGGTTATGGC AGCACTGCAT AATTCTCTTA CTGTCATGCC 7001 ATCCGTAAGA TGCTTTTCTG TGACTGGTGA GTACTCAACC AAGTCATTCT 7051 GAGAATAGTG TATGCGGCGA CCGAGTTGCT CTTGCCCGGC GTCAATACGG 7101 GATAATACCG CGCCACATAG CAGAACTTTA AAAGTGCTCA TCATTGGAAA 7151 ACGTTCTTCG GGGCGAAAAC TCTCAAGGAT C7TACCGCTG TTGAGATCCA 7201 GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC ATCTTTTACT 7251 TTCACCAGCG TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA 7301 AAAGGGAATA AGGGCGACAC GGAAATGTTG AATACTCATA CTCTTCCTTT 7351 TTCAATATTA TTGAAGCATT TATCAGGGTT ATTGTCTCAT GAGCGGATAC 7401 7451 ATATTTGAAT TCCCCGAAAA GTATTTAGAA GTGCCACCTG AAATAAACAA ACGTC ATAGGGGTTC CGCGCACATT
-63- -63- ♦ ♦ · ♦ ·«· · · « · « • · · · « « «ft • ♦ · · * · ·· • f « « · * ♦ «» ·» ·· Μ
Tabulka 9: Nuklec itidová sekvence r< skoTrdinan·; mího pí pcDNA3. 1· -H-Sema-L- -EGFP-MycHisA ;Sek\ τ5Γιce id. c . : 36 i 1 GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC 51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT 101 GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG 151 GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG 201 CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC 251 TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 301 TGGAGTTCCG CGTTACATAA cttacggtaa ATGGCCCGCC TGGCTGACCG 351 CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT 401 AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT 451 AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC 501 CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA 551 CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 601 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA tgggcgtgga 651 TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA 701 TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA 751 ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG 801 GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG 851 GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 901 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT 951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc 1001 agcgcaccgc gcgcccgcat ccctogccog ccggctcggt tgaggcttcc 1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc 1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat 1151 gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct 1201 tttccacgag ccaggcagct cctctgtgtg ggtgggaaga cgtggcraagg 1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgaacggtg 1301 aatatcggct ccacaaaggg gtcctgtctg gataagcagg actgcgagaa 1351 ctacatcact ctcctggaga ggcggagtga ggggctgatg gcctgtggca 1401 ccaacgcccg gcaccccagc tgctggaacc tggtaaatgg c.acrvgtggtg 1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc 1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg 1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtqag 1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac 1651 catcgtgcac caagaccagg ctuacgatga caagatctac tactrcttcc 1701 gagaggacaa tcctgacaag aatcctgagg ct.cctctcaa *.gtgtcccat -64- -64- Φ * *· »·> « · • · · · · * * · * • ♦ · · · · · * • * * · · · * ·· Η ··
1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt 1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg 1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac 1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc 1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg 2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg 2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt 2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg 2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg 2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta 2251 cctaactac;a gacaggggca ctatccacaa ggtggtggaa ccgggggagc 2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc 2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta 2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg 2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc 2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt 2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca 2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc 2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg 2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca 2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac 2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca 2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct 2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt 2951 ggcttgctgg tccacATGGT GAGCAAGGGC GAGGAGCTGT TCACCGGGGT 3001 GGTGCCCATC CTGGTCGAGC TGGACGGCGA CGTAAACGGC CACAAGTTCA 3051 GCGTGTCCGG CGAGGGCGAG GGCGATGCCA CCTACGGCAA GCTGACCCTG 3101 AAGTTCATCT gcaccaccgg CAAGCTGCCC GTGCCCTGGC CCACCCTCGT 3151 GACCACCCTG ACCTACGGCG TGCAGTGCTT CAGCCGCTAC CCCGACCACA 3201 TGAAGCAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG CTACGTCCAG 3251 GAGCGCACCA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA 3301 GGTGAAGTTC GAGGGCGACA CCCTGGTGAA CCGCATCGAG CTGAAGGGCA 3351 TCGACTTCAA GGAGGACGGC AACATCCTGG GGCACAAGCT GGAGTACAAC 3401 TACAACAGCC ACAACGTCTA TATCATGGCC GACAAGCAGA AGAACGGCAT 3451 CAAGGTGAAC TTCAAGATCC GCCACAACAT CGAGGACGGC AGCGTGCAGC 3501 TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACCG CCCCGTGCTG 3551 CTGCCCGACA ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC
3601 CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG -65- • ···· f I Μ · I Μ • · # · * · * * « t« I · · • · · · · · * · ···
3651 GGATCACTCT CGGCATGGAC GAGCTGTACA Aggtgaagct tGGGCCCGAA 3701 CAAAAACTCA TCTCAGAAGA GGATCTGAAT AGCGCCGTCG ACCATCATCA 3751 TCATCATCAT TGAGTTTAAA CCGCTGATCA GCCTCGACTG TGCCTTCTAG 3801 TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTGACCCTGG 3851 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG 3901 CATTGTCTGA GTAGGTGTCA TTCTATTCTG gggggtgggg TGGGGCAGGA 3951 CAGCAAGGGG GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGATGCGG 4001 TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA CCAGCTGGGG CTCTAGGGGG 4051 TATCCCCACG CGCCCTGTAG CGGCGCATTA agcgcggcgg GTGTGGTGGT 4101 TACGCGCAGC GTGACCGCTA CACTTGCCAG CGCCCTAGCG CCCGCTCCTT 4151 TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCCGGCTT TCCCCGTCAA 4201 GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA 4251 CCTCGACCCC AAAAAACTTG ATTAGGGTGA TGGTTCACGT AGTGGGCCAT 4301 CGCCCTGATA GACGGTTTTT CGCCCTTTGA CGTTGGAGTC CACGTTCTTT 4351 AATAGTGGAC TCTTGTTCCA AACTGGAACA ACACTCAACC CTATCTCGGT 4401 CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC TATTGGTTAA 4451 AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT CTGTGGAATG 4501 TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG 4551 TATGCAAAGC ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAAAGTCCC 4601 CAGGCTCCCC AGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTCA 4651 GCAACCATAG TCCCGCCCCT AACTCCGCCC ATCCCGCCCC TAACTCCGCC 4701 CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT TTTATTTATG 4751 CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA 4801 GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT 4651 ATCCATTTTC GGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA 4901 TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG 4951 CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC 5001 CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG 5051 ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG 5101 TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC 5151 TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC 5201 TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT catggctgat 5251 GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA 5301 CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC 5351 TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 5401 GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGCATCTCGT £4 51 CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG gaaaatggcc 5501 GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT
5551 CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA 5601 ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC 5651 AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC 5701 TGCGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT 5751 TTCGATTCCA CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT 5801 CCGGGACGCC GGCTGGATGA TCCTCCAGCG CGGGGATCTC ATGCTGGAGT 5851 TCTTCGCCCA CCCCAACTTG TTTATTGCAG CTTATAATGG TTACAAATAA 5901 AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT CACTGCATTC 5951 TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGTATAC 6001 CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT 6051 GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG 6101 CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA 6151 TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG 6201 CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT TGCGTATTGG 6251 GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 6301 TGCGGCGAGC GGTATCAGCT CACTCAAA3G CGGTAATACG GTTATCCACA 6351 GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA 6401 GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC 6451 GCCCCCCTGA CGAGCATCAC AAAAAXCGAC GCTrftAGTCA GAGGTGGCGA 6501 AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG GAAGCTCCCT 6551 CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT 6601 TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT 6651 CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC 6701 CCCCGTTCAG CCCGACCGCT GCGCCTTATC CGGTAACTAT CGTCTTGAGT 6751 ccaacccggt AAGACACGAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC 6601 AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG 6651 GTGGCCTAAC TACGGCTACA ctagaaggac AGTATTTGGT ATCTGGGCTC 6901 TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC 6951 AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT 7001 TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG 7051 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG 7101 AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATT AAAAATGAAG 7151 TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC 7201 AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTCTCT ATTTCGTTCA 7251 TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG 7301 CTTACCATCT GGCCCCAGTG CTGCAATGAT ACCGCGAGAC CCACGCTCAC 7351 CGGCTCCAGA TTTATCAGCA ATAAACCAGC CAGCCGGAAC? GGCCGAGCGC 7401 AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA ttaattgttg -67- » I Μ» · *·· É ·· « · · • · * » · · · • · #» ·· ·* • · * « • * · · · • « · ·· t ·
7451 CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG 7501 TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT 7551 TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT 7601 GTTGTGCAAA AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA 7651 GTAAGTTGGC CGCAGTGTTA TCACTCATGG TTATGGCAGC ACTGCATAAT 7701 TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA CTGGTGAGTA 7751 CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT 7801 GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA 7851 GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT 7901 ACCGCTGTTG AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT 7951 CTTCAGCATC TTTTACTTTC ACCAGCGTTT CTGGGTGAGC AAAAACAGGA 8001 AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA AATGTTGAAT 8051 ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT 8101 GTCTCATGAG CGGATACATA TTTGAATGTA tttagaaaaa TAAACAAATA 8151 GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TC -68- -68- t ·· • » · • · · « »t • t ** * β · · · · • · * · sulka 1C: Xukleotidové sekvence rekombinantního plazmidu J η τ t íeir.a-L-EE i Sekvence id. č.: 37) 1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 51 TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 101 GATGCACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 201 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 251 AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 301 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA 351 AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA 401 GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT 451 ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT 501 ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga 551 cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc 601 cctggcccgc cagctcggtt ggggcttccg ctgcggctgc ggctgctgct 651 gctgctctgg gzggccgccg cctccgccca gggccaccta aggagcggac 701 cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac 751 tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc 801 ctctgtgf.gg gtgggaggac gtggcaaggt ctacctcttt gacttccccg 851 agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg 901 tcctgtctgg ataagcgaga ctgcgagaac tacatcactc tcctggagag 951 gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct 1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc 1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga 1101 cgaggtgrat tccaccatcc ggaagcagga atacaatggg aagatccctc 1151 ggttccgccg catccgaggc gagagtgagc tgtacaccag tgatactgtc O ÍN r i atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc 1251 ttacaatgac aagatctact acttcttccg agaggacaat cctgacaaga 1301 atcctgaggc tcctrťcaat gtgtcccgtg tggcccagtt gtgcaggggg 1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct 1401 gaaagscatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca 1451 ggctgcaaga cgticťt-cctg ctccctgacc ccagcggcca gtggagggac 1501 accagggt-ct. atggtgtttt ctccaacccc tggaactact cagccgtctg 15 51 vgtgtattcc ci:cggí.gaca ttgacaaggt cttccgtacc tcctcactca 1601 ÉiyCiQCtscců ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca 1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc 1701 & c; a g □ t g q c g cagagqgtgg agcccatggg gcctctgaag acgccattgt ♦ Mí »«· * • · • · «
1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc 1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac 1851 tatccacaag gtggtggaac egggggagca ggagcacagc ttcgccttca 1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg 1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt 2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg 2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc 2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc 2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc 2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaoa acgtggagca 2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 2551 cttGGGCCCG TTTAAACCCG CTGATCAGCC TCGACTGTGC CTTCTAGTTG 2601 CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG ACCCTGGAAG 2651 GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGAAAT TGCATCGCAT 2701 TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG 2751 CAAGGGGGAG GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGXGG 2801 GCTCTATGGC TTCTGAGGCG GAAAGAACCA GCTGGGGCTC TAGGGGGTAT 2851 CCCCACGCGC CCTGTAGCGG CGCATTAAGC gcggcgggtg TGGTGGTTAC 2901 GCGCAGCGTG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC GCTCCTTTCG 2951 CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT 3001 CTAAATCGGG CCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT 3051 CGACCCCAAA AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC 3101 CCTGATAGAC GGTTTTTCGC CCTTTGACGT TGGAGTCCAC GTTCTTTAAT 3151 AGTGGACTCT TGTTCCAAAC TGGAACAACA CTCAACCCTA TCTCGGTCTA 3201 TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT TGGTTAAAAA 3251 ATGAGCTGAT TTAACAAAAA ITTAACGCGA ATTAATTCTG TGGAATGTGT 3301 GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT 3351 GCAAAGCATG catctcaatt AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG 3401 GCTCCCCAGC AGGCAGAAGT ATCCAAAGCA TGCATCTCAA TTAGTCAGCA 3451 ACCATAGTCC CGCCCCTAAC TCCCCCCATC CCGCCCCTAA CTCCGCCCAG 3501 TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT ATTTATGCAG 3551 AGGCCGAGGC CGCCTCTGCC TCTGAGCTAT TCCAGAAGTA GTGAGGAGGC 3601 TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCGGGAG CTTGTATATC
-70- • «·« * *9 ♦ ♦ · « > < · Μ ** ·« · « ·· É ·· ··*» · I ( · · · ·» ·· »» 3651 3701 3751 3801 3851 3901 3951 4001 4051 4101 4151 4201 4251 4301 4351 4401 4451 4501 4551 4601 4651 4701 4751 4801 4851 4901 4951 5001 5051 5101 5151 5201 5251 5301 5351 5401 5451
CATTTTCGGA
AACAAGATGG
TTCGGCTATG
GTTCCGGCTG
TGTCCGGTGC
CTGGCCACGA
AGCGGGAAGG
TGTCATCTCA
ATGCGGCGGC
AGCGAAACAT
TCGATCAGGA
CTGTTCGCCA
GACCCATGGC
TTTCTGGATT
GACATAGCGT
GGCTGACCGC
GCATCGCCTT
GGTTCGAAAT
GATTCCACCG
GGACGCCGGC
TCGCCCACCC
AATAGCATCA
TTGTGGTTTG
CGACCTCTAG
TGAAATTGTT
AAAGTGTAAA
CGTTGCGCTC
CATTAATGAA
CTCTTCCGCT
GGCGAGCGGT
TCAGGGGATA
CAGGAACCGT
CCCCTGACGA
CCGACAGGAC
GCGCTCTCCT
TCCCTTCGGG
AGTTCGGTGT
TCTGATCAAG
ATTGCACGCA
ACTGGGCACA
TCAGCGCAGG
CCTGAATGAA
CGGGCGTTCC
GACTGGCTGC
CCTTGCTCCT
TGCATACGCT
CGCATCGAGC
TGATCTGGAC
GGCTCAAGGC
GATGCCTGCT
CATCGACTGT
TGGCTACCCG
TTCCTCGTGC
CTATCGCCTT
GACCGACCAA
CCGCCTTCTA
TGCATGATCC
CAACTTGTTT
CAAATTTCAC
TCCAAACTCA
CTAGAGCTTG
ATCCGCTCAC
GCCTGGGGTG
ACTGCCCGCT
TCGGCCAACG
TCCTCGCTCA
ATCAGCTCAC
ACGCAGGAAA
AAAAAGGCCG
GCATCACAAA
TATAAAGATA
GTTCCGACCC
AAGCGTGGCG
AGGTCGTTCG
AGACAGGATG
GGTTCTCCGG
ACAGACAATC
GGCGCCCGGT
CTGCAGGACG
TTGCGCAGCT
TATTGGGCGA
GCCGAGAAAG
TGATCCGGCT
GAGCACGTAC
GAAGAGCATC
GCGCATGCCC
TGCCGAATAT
GGCCGGCTGG
TGATATTGCT
TTTACGGTAT
CTTGACGAGT
GCGACGCCCA
TGAAAGGTTG
TCCAGCGCGG
ATTGCAGCTT
AAATAAAGCA
TCAATGTATC
GCGTAATCAT
AATTCCACAC
CCTAATGAGT
TTCCAGTCGG
CGCGGGGAGA
CTGACTCGCT
TCAAAGCCGG
GAACATGTGA
CGTTGCTGGC
AATCGACGCT
CCAGGCGTTT
TGCCGCTTAC
CTTTCTCAAT
CTCCAAGCTG
AGGATCGTTT
CCGCTTGGGT
GGCTGCTCTG
TCTTTTTGTC
AGGCAGCGCG
GTGCTCGACG
AGTGCCGGGG
TATCCATCAT
ACCTGCCCAT
TCGGATGGAA
AGGGGCTCGC
GACGGCGAGG
CATGGTGGAA
GTGTGGCGGA
GAAGAGCTTG
CGCCGCTCCC
TCTTCTGAGC
ACCTGCCATC
GGCTTCGGAA
GGATCTCATG
ATAATGGTTA
TTTTTTTCAC
TTATCATGTC
GGTCATAGCT
AACATACGAG
GAGCTAACTC
GAAACCTGTC
GGCGGTTTGC
GCGCTCGGTC
TAATACGGTT
GCAAAAGGCC
GTTTTTCCAT
CAAGTCAGAG
CCCCCTGGAA
CGGATACCTG
GCTCACGCTG
GGCTGTGTGC
CGCATGATTG
GGAGAGGCTA
ATGCCGCCGT
AAGACCGACC
GCTATCGTGG
TTGTCACTGA
CAGGATCTCC
GGCTGATGCA
TCGACCACCA
GCCGGTCTTG
GCCAGCCGAA
ATCTCGTCGT
AATGGCCGCT
CCGCTATCAG
GCGGCGAATG
GATTCGCAGC
GGGACTCTGG
ACGAGATTTC
TCGTTTTCCG
CTGGAGTTCT
CAAATKAAGC
TGCATTCTAG
TGTATACCGT
GTTTCCTGTG
CCGGAAGCAT
ACKTTAATTG
GTGCCAGCTG
GTATTGGGCG
GTTCGGCTGC
ATCCACAGAA
AGCAAAAGGC
AGGCTCCGCC
GTGGCGAAAC
GCTCCCTCGT
TCCGCCTTTC
TAGGTATCTC
ACGAACCCCC
5501 CGTTCAGCCC GACCGCTCCC CCTTATCCGG TAACTATCGT CTTGAGTCCA * · « · * · « · ·» tr ·« ·· · * 5551 ACCCGGTAAG ACACGACTTA -71 TCGCCACTGG CAGCAGCCAC TGGTAACAGG 5601 ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT TGAAGTGGTG 5651 GCCTAACTAC GGCTACACTA GAAGGACAGT ATTTGGTATC TGCGCTCTGC 5701 TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA 5751 CAAACCACCG CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC 5801 GCGCAGAAAA AAAGGATCTC AAGAAGATCC TTTGATCTTT TCTACGGGGT 5651 CTGACGCTCA GTGGAACGAA AACTCACGTT AAGGGATTTT GGTCATGAGA 5901 TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA AATGAAGTTT 5951 TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT 6001 GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC 6051 ATAGTTGCCT GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT 6101 ACCATCTGGC CCCAGTGCTG CAATGATACC GCGAGACCCA CGCTCACCGG 6151 CTCCAGATTT ATCAGCAATA AACCAGCCAG CCGGAAGGGC CGAGCGCAGA 6201 AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA ATTGTTGCCG 6251 GGAAGCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG 6301 CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA 6351 TTCAGCTCCG GTTCCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT 6401 GTGCAAAAAA GCGGTTAGCT CCTTCGGTCC TCCGATCGTT GTCAGAAGTA 6451 AGTTGGCCGC AGTGTTATCA CTCATGGTTA TGGCAGCACT GCATAATTCT 6501 CTTACTGTCA TGCCATCCGT AAGATGCTTT TCTGTGACTG GTGAGTACTC 6551 AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC 6601 CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG 6651 CTCATCATTG GAAAACGTTC TTCGGGGCGA AAACTCTCAA GGATCTTACC 6701 GCTGTTGAGA TCCAGTTCGA TGTAACCCAC TCGTGCACCC AACTGATCTT 6751 CAGCATCTTT TACTTTCACC AGCGTTTCTG GGTGAGCAAA AACAGGAAGG 6801 CAAAATGCCG CAAAAAAGGG AATAAGGGCG ACACGGAAAT GTTGAATACT 6851 CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC 6901 TCATGAGCGG ATACATATTT GAATGTATTT AGAAAAATAA ACAAATAGGG 6951 GTTCCGCGCA CATTTCCCCG AAAAGTGCCA CCTGACGTCG ACGGATCGGG .... . :: : Nukl sekvence rekombinantního p íSekvenc e i d. č. ; 38)
1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 51 TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC 101 GA7GGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT 151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG 201 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC 251 AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 301 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA 351 AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA 401 GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT 451 ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT 501 ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga 551 cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc 601 cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct 651 gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac 701 cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac 751 tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc 801 ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg 851 agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg 901 tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag 951 gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct 1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc 1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga 1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc 1151 ggt-tccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc 1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc 1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga 1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg 1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct 1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca 1451 ggqtgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac 1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg 1551 tgtgtattcc cr cggtgaca ttqacaaggt cttccgtacc t cctcactca 1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca 1651 gaccagcagc cgatacccac agagaccttc caggtggetg accgtcaccc 1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt 1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc 1801 agccacgggg agacctttca tgtgctttac crtaactacag acaggggcac 1B51 tatccacaag gtggtggaac cggqggagaa gqagcacagc ttcgccttca 1901 acatcatgga ga^ccagccc ~tccgccgcg cggctgccat ccagaccatg 1551 tcgctggatg ctgagcggag gaagct gt at gtgagctccc agtgggaggt 2001 gagccaggrg cccctggacc •gtgtgaogt ctatggcggg ggctgccacg -7 3- φ * · · · • ♦ * • · · • I · · • · ·· • « * « • · · ♦ •« · · ·*· » • · ·« *
2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc 2101 stctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc 2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc 2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg 2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca 2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga 2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc 2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat 2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct 2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag 2551 cttGGGCCCG AACAAAAACT CATCTCAGAA GAGGATCTGA ATAGCGCCGT 2601 CGACCATCAT CATCATCATC ATTGAGTTTA TCCAGCACAG TGGCGGCCGC 2651 TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT 2701 TCTAGTTGCC AGCCATCTGT TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC 2751 CCTGGAAGGT GCCACTCCCA CTGTCCTTTC CTAATAAAAT GAGGAAATTG 2801 CATCGCATTG TCTGAGTAGG TGTCATTCTA TTCTGGGGGG TGGGGTGGGG 2851 CAGGACAGCA AGGGGGAGGA TTGGGAAGAC AATAGCAGGC ATGCTGGGGA 2901 TGCGGTGGGC TCTATGGCTT ctgaggcgga AAGAACCAGC TGGGGCTCTA 2951 GGGGGTATCC CCACGCGCCC TGTAGCGGCG CATTAAGCGC GGCGGGTGTG 3001 GTGGTTACGC GCAGCGTGAC CGCTACACTT GCCAGCGCCC TAGCGCCCGC 3051 TCCTTTCGCT TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCCC 3101 GTCAAGCTCT AAATCGGGGC ATCCCTTTAG GGTTCCGATT TAGTGCTTTA 3151 CGGCACCTCG ACCCCAAAAA ACTTGATTAG GGTGATGGTT CACGTAGTGG 3201 GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG GAGTCCACGT 3251 TCTTTAATAG TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC 3301 TCGGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG 3351 GTTAAAAAAT GAGCTGATTT AACAAAAATT TAACGCGAAT TAATTCTGTG 3401 GAATGTGTGT CAGTTAGGGT GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC 3451 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA GGTGTGGAAA 3501 GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG CATCTCAAT? 3551 AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT 3601 CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA 3651 TTATGCAGAG GCCGAGGCCG CCTCTGCCTC TGAGCTATTC CAGAAGTAGT 3701 GAGGAGGCTT TTTTGGAGGC CTAGCCTTTT GCAAAAAGCT CCCGGGAGCT 3751 TGTATATCCA TTTTCGGATC TGATCAAGAG ACAGGATGAG GATCGTTTCG 3801 CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG 3851 AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGAT 3901 GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA -74- ( Μ · · · · • · ♦ ♦ ····
3951 GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC 4001 TATCGTCGCT GGCCACGACG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT 4051 GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA 41D1 GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA TCCATCATGC 4151 CTGATGCftAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC CTGCCCATTC 4201 GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC 4251 CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC 4301 CAGCCGAACT GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT 4351 CTCGTCGTGA CCCATGGCGA TGCCTGCTTG CCGAATATCA TGGTGGAAAA 4401 TGGCCGCTTT TCTGGATTCA TCGACTGTGG CCGGCTGGGT GTGGCGGACC 4451 GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA AGAGCTTGGC 4501 GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA 4551 TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG 4601 GACTCTGGGG TTCGAAATGA CCGACCAAGC GACGCCCAAC CTGCCATCAC 4651 GAGATTTCGA TTCCACCGCC GCCTTCTATG AAAGGTTGGG CTTCGGAATC 4701 GTTTTCCGGG ACGCCGGCTG GATGATCCTC CAGCGCGGGG ATCTCATGCT 4751 GGAGTTCTTC GCCCACCCCA ACTTGTTTAT TGCAGCTTAT AATGGTTACA 4801 AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG 4851 CATTCTAGTT GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG 4901 TATACCGTCG ACCTCTAGCT AGAGCTTGCC GTAATCATGG TCATAGCTGT 4951 TTCCTGTGTG AAATTGTTAT CCGCTCACAA TTCCACACAA CATACGAGCC 5001 GGAAGCATAA AGTGTAAAGC CTGGGGTGCC TAATGAGTGA GCTAACTCAC 5051 ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTCGGGA AACCTGTCGT 5101 GCCAGCTGCA TTAATGAATC GGCCAACGCG CGGGGAGAGG CGGTTTGCGT 5151 ATTGGGCGCT CTTCCGCTTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT 5201 TCGGCTGCGG CGAGCGGTAT CAGCTCACTC AAAGGCGGTA ATACGGTTAT 5251 CCACAGAATC AGGGGATAAC GCAGGAAAGA ACATGTGAGC AAAAGGCCAG 5301 CAAAAGGCCA GGAACCGTAA AAAGGCCGCG TTGCTGGCGT TTTTCCATAG 5351 GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA AGTCAGAGGT 5401 GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC 5451 TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC 5501 CGCCTTTCTC CCTTCGGGAA GCGTGGCGCT TTCTCAATGC TCACGCTGTA 5551 GGTATCTCAG TTCGGTGTAG GTCGTTCGCT CCAAGCTGGG CTGTGTGCAC 5601 GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA ACTATCGTCT 5651 TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA GCAGCCACTG 5701 GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG 5751 AAGTGGTGGC CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG 5801 CGCTCTGCTG AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT -75-
-75- 5851 CCGGCAAACA AACCACCGCT GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG 5901 CAGATTACGC GCAGAAAAAA AGGATCTCAA GAAGATCCTT TGATCTTTTC 5951 TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG 6001 TCATGAGATT ATCAAAAAGG ATCTTCACCT AGATCCTTTT AAATTAAAAA 6051 TGAAGTTTTA AATCAATCTA AAGTATATAT GAGTAAACTT GGTCTGACAG 6101 TTACCAATGC TTAATCAGTG AGGCACCTAT CTCAGCGATC TGTCTATTTC 6151 GTTCATCCAT AGTTGCCTGA CTCCCCGTCG TGTAGATAAC TACGATACGG 6201 GAGGGCTTAC CATCTGGCCC CAGTGCTGCA ATGATACCGC GAGACCCACG 6251 CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG 6301 AGCGCAGAAG TGGTCCTGCA ACTTTATCCG CCTCCATCCA GTCTATTAAT 6351 TGTTGCCGGG AAGCTAGAGT AAGTAGTTCG CCAGTTAATA GTTTGCGCAA 6401 CGTTGTTGCC ATTGCTACAG GCATCGTGGT GTCACGCTCG TCGTTTGGTA 6451 TGGCTTCATT CAGCTCCGGT TCCCAACGAT CAAGGCGAGT TACATGATCC 6501 CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC CGATCGTTGT 6551 CAGAAGTAAG TTGGCCGCAG TGTTATCACT CATGGTTATG GCAGCACTGC 6601 ATAATTCTCT TACTGTCATG CCATCCGTAA GATGCTTTTC TGTGACTGGT 6651 GAGTACTCAA CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG 6701 CTCTTGCCCG GCGTCAATAC GGGATAATAC CGCGCCACAT AGCAGAACTT 6751 TAAAAGTGCT CATCATTGGA AAACGTTCTT CGGGGCGAAA ACTCTCAAGG 6801 ATCTTACCGC TGTTGAGATC CAGTTCGATG TAACCCACTC GTGCACCCAA 6851 CTGATCTTCA GCATCTTTTA CTTTCACCAG CGTTTCTGGG TGAGCAAAAA 6901 CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC ACGGAAATGT 6951 TGAATACTCA TACTCTTCCT TTTTCAATAT TATTGAAGCA TXTATCAGGG 7001 TTATTGTCTC ATGAGCGGAT ACATATTTGA ATGTATTTAG AAAAATAAAC 7051 7101 aaataggggt GGATCGGG TCCGCGCACA TTTCCCCGAA AAGTGCCACC TGACGTCGAC r ·_κ;
I CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA
51 AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA
101 AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA 151 ctggttctgt rtgaagggga cgaggtgtat tccaccatcc 201 atacaatggg aagatccctc ggttccgccg catccggggc 251 tgtacaccag tgatactgtc atgcagaacc cacagttcat atcgtgcacc asgaccaggc ttacgatgac aagatctact
pQiSO-H-SeiTia- TAACAATTAT TTCATTAAAG TCACGGAtcc ggaagcagga gagagtgagc caaagccacc acttcttccg 301 -76- -76- «« I · ·· , ! I ,,· < · ,, ,,, ,« ·· ·· 2201 ι 111 · • * · * · • · ·
351 agaggacaat cctgacaaga atcctgaggc tcctctcaat gtgtcccgtg 401 tggcccagtt gtgcaggggg gaccagggtg gggaaagttc actgtcagtc 451 tccaagtgga acacttttct gaaagccatg ctggtatgca gtgatgctgc 501 caccaacaag aacttcaaca ggctgcaaga cgtcttcctg ctccctgacc 551 ccagcggcca gtggagggac accagggtct atggtgtttt ctccaacccc 601 tggaactact cagccgtctg tgtgtattcc ctcggtgaea ttgacaaggt 651 cttccgtacc tcctcactca agggctacca ctcaagcctt cccaacccgc 701 ggcctggcaa gtgcctccca gaccagcagc cgatacccac agaAAGCTTA 751 ATTAGCTGAG CTTGGACTCC TGTTGATAGA TCCAGTAATG ACCTCAGAAC 801 TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC GTTTTTTATT 851 GGTGAGAATC CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA 901 AAATGGAGAA AAAAATCACT GGATATACCA CCGTTGATAT ATCCCAATGG 951 CATCGTAAAG AACATTTTGA GGCATTTCAG TCAGTTGCTC AATGTACCTA 1001 TAACCAGACC GTTCAGCTGG ATATTACGGC CTTTTTAAAG ACCGTAAAGA 1051 AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG 1101 ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT 1151 GATATGGGAT AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG 1201 AAACGTTTTC ATCGCTCTGG AGTGAATACC ACGACGATTT CCGGCAGTTT 1251 CTACACATAT ATTCGCAAGA TGTGGCGTGT TACGGTGAAA ACCTGGCCTA 1301 TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA GCCAATCCCT 1351 GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC 1401 TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG GCGACAAGGT 1451 GCTGATGCCG CTGGCGATTC AGGTTCATCA TGCCGTCTGT GATGGCTTCC 1501 ATGTCGGCAG AATGCTTAAT GAATTACAAC AGTACTGCGA TGAGTGGCAG 1551 GGCGGGGCGT AATTTTTTTA AGGCAGTTAT TGGTGCCCTT AAACGCCTGG 1601 GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA GGCTCAGTCG 1651 AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT 1701 GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT TTCGGTGATG 1751 ACGGTGAAAA CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACKGCTTGT 1801 CTGTAAGCGG ATGCCGGGAG CAGACAAGCC CGTCAGGGCG CGTCAGCGGG 1851 TGTTGGCGGG TGTCGGGGCG CAGCCATGAC CCAGTCACGT AGCGATAGCG 1901 GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT GTACTGAGAG 1951 TGCACCATAT GCGGTGTGAA ATACCGCACA GATGGGTAAG GAGAAAATAC 2001 CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT 2051 CTGTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT 2101 TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC 2151 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCT^ACG AGCATCACAA AAATCGACGC TCAAGTCAGA
-77-
GGTGGCGAAA
AGCTCCCTCG
GTCCGCCTTT
GTAGGTATCT
CACGAACCCC
TCTTGAGTCC
CTGGTAACAG
TTGAAGTGGT
CTGCGCTCTG
GATCCGGCAA
CAGCAGATTA
TTCTACGGGG
TGGTCATGAG
AAATGAAGTT
CAGTTACCAA
TTCGTTCATC
CGGGAGGGCT
ACGCTCACCG
CCGAGCGCAG
AATTGTTGCC
CAACGTTGTT
GTATGGCTTC
TCCCCCATGT
TGTCAGAAGT
TGCATAATTC
GGTGAGTACT
TTGCTCTTGC
CTTTAAAAGT
AGGATCTTAC
CAACTGATCT
AAACAGGAAG
TGTTGAATAC
GGGTTATTGT
AACAAATAGG
TAAGAAACCA
CCCCACAGGA
TGCGCTCTCC
CTCCCTTCGG
CAGTTCGGTG
CCGTTCAGCC
AACCCGGTAA
GATTAGCAGA
GGCCTAACTA
CTGAAGCCAG
ACAAACCACC
CGCGCAGAAA
TCTGACGCTC
ATTATCAAAA
TTAAATCAAT
TGCTTAATCA
CATAGCTGCC
TACCATCTGG
GCTCCAGATT
AAGTGGTCCT
GGGAAGCTAG
GCCATTGCTA
ATTCAGCTCC
TGTGCAAAAA
AAGTTGGCCG
TCTTACTGTC
CAACCAAGTC
CCGGCGTCAA
GCTCATCATT
CGCTGTTGAG
TCAGCATCTT
GCAAAATGCC
TCATACTCTT
CTCATGAGCG
GGTTCCGCGC
TTATTATCAT
CTATAAAGAT
TGTTCCGACC
GAAGCGTGGC
TAGGTCGTTC
CGACCGCTGC
GACACGACTT
GCGAGGTATG
CGGCTACACT
TTACCTTCGG
GCTGGTAGCG
AAAAGGATCT
AGTGGAACGA
AGGATCTTCA
CTAAAGTATA
GTGAGGCACC
TGACTCCCCG
CCCCAGTGCT
TATCAGCAAT
GCAACTTTAT
AGTAAGTAGT
CAGGCATCGT
GGTTCCCAAC
AGCGGTTAGC
CAGTGTTATC
ATGCCATCCG
ATTCTGAGAA
TACGGGATAA
GGAAAACGTT
ATCCAGTTCG
TTACTTTCAC
GCAAAAAAGG
CCTTTTTCAA
GATACATATT
ACATTTCCCC
GACATTAACC
ACCAGGCGTT
CTGCCGCTTA
GCTTTCTCAA
GCTCCAAGCT
GCCTTATCCG
ATCGCCACTG
TAGGCGGTGC
AGAAGGACAG
AAAAAGAGTT
GTGGTTTTTT
CAAGAAGATC
AAACTCACGT
CCTAGATCCT
TATGAGTAAA
TATCTCAGCG
TCGTGTAGAT
GCAATGATAC
AAACCAGCCA
CCGCCTCCAT
TCGCCAGTTA
GGTGTCACGC
GATCAAGGCG
TCCTTCGGTC
ACTCATGGTT
TAAGATGCTT
TAGTGTATGC
TACCGCGCCA
CTTCGGGGCG
ATGTAACCCA
CAGCGTTTCT
GAATAAGGGC
TATTATTGAA
TGAATGTATT
GAAAAGTGCC
TATAAAAATA
TCCCCCTGGA
CCGGATACCT
TGCTCACGCT
GGGCTGTGTG
GTAACTATCG
GCAGCAGCCA
TACAGAGTTC
TATTTGGTAT
GGTAGCTCTT
TGTTTGCAAG
CTTTGATCTT
TAAGGGATTT
TTTAAATTAA
CTTGGTCTGA atctgtctat
AACTACGATA
CGCGAGACCC
GCCGGAAGGG
CCAGTCTATT
ATAGTTTGCG
TCGTCGTTTG
AGTTACATGA
CTCCGATCGT
ATGGCAGCAC
TTCTGTGACT
GGCGACCGAG
CATAGCAGAA
AAAACTCTCA
CTCGTGCACC
GGGTGAGCAA
GACACGGAAA
GCATTTATCA
TAGAAAAATA
ACCTGACGTC
GGCGTATCAC
GAGGCCCTTT CGTCTTCAC -78- * * · * • · · · * · a * v * t · » · * * * · I · « · I» a * · · i • a i ·· ** abulkč 13: Sekvence rekonikinantního plazmidu pQE31-H-Sema- -SH -.Sekvence ic. č.: 40}
1 CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT 51 AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG 101 AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACACGGAT 151 CCGCATGCga gctcccagtg ggaggtgagc caggtgcccc tggacctgtg 201 tgaggtctat ggcgggggct gccacggttg cctcatgtcc cgagacccct 251 actgcggctg ggaccagggc cgctgcatct ccatctacag ctccgaacgg 301 tcagtgctgc aatccattaa tccagccgag ccacacaagg agtgtcccaa 351 ccccaaacca gacaaggccc cactgcagaa ggtttccctg gccccaaact 401 ctcgctacta cctgagctgc cccatggaat cccgccacgc cacctactca 451 tggcgccaca aggagaacgt ggagcagagc tgcgaacctg gtcaccagag 501 ccccaactgc atcctgttca tcgagaacct cacggcgcag cagtacggcc 551 actacttctg cgaggcccag gagggctcct acttccgcga ggctcagcac 601 tggcagctgc tgcccgagga cggcatcatg gccgagcacc tgctgggtca 651 tgcctgtgcc ctggctgcct ccctctggct gggggtgctg cccacactca 701 Ctcttggctt gctggtccac gtgaagcttA ATTAGCTGAG CTTGGACTCC 751 TGTTGATAGA TCCAGTAATG ACCTCAGAAC TCCATCTGGA TTTGTTCAGA 801 ACGCTCGGTT GCCGCCGGGC GTTTTTTATT GGTGAGAATC CAAGCTAGCT 851 TGGCGAGATT TTCAGGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT 901 GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG AACATTTTGA 951 GGCATTTCAG TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG 1001 ATATTACGGC GTTTTTAAAG ACCGTAAAGA AAAATAAGCA CAAGTTTTAT 1051 CCGGCCTTTA TTCACATTCT TGCCCGCCTG ATGAATGCTC ATCCGGAATT 1101 TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT AGTGTTCACC 1151 CTTGTTACAC CGTTTTCCAT GAGCAAACTG AAACGTTTTC ATCGCTCTGG 1201 AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT ATTCGCAAGA 1251 TGTGGCGTGT tacggtgaaa ACCTGGCCTA TTTCCCTAAA GGGTTTATTG 1301 AGAATATGTT TTTCGTCTCA GCCAATCCCT GGGTGAGTTT CACCAGTTTT 1251 GATTTAAACG TGGCCAATAT GGACAACTTC TTCGCCCCCG TTTTCACCAT 1401 GGGCAAACAT TATACGCAAG GCGACAAGGT GCTGATGCCG CTGGCGATTC 1451 AGGTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT 1501 GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AATTTTTTTA • AGGCAGTTAT TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG 1 A Λ 7 j. Ό w * AGGCATCAAA TAAAACGAAA GGCTCAGTCG AAAGACTGGG CCTTTCGTTT a £ Γ -5 TATCTGTTGT T1'GTCGGTGA ACGCTCTCCT GAGTAGGACA AATCCGCCGC
TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA CCTCTCACAC
ATGCAGCTCC
CAGACAAGCC
CACCCATGAC
ATGCGGCATC
ATACCGCACA
TTCCTCGCTC
TATCAGCTCA
AACGCAGGAA
TAAAAAGGCC
AGCATCACAA
CTATAAAGAT
TGTTCCGACC
GAAGCGTGGC
TAGGTCGTTC
CGACCGCTGC
GACACGACTT
GCGAGGTATG
CGGCTACACT
TTACCTTCGG
GCTGGTAGCG
AAAAGGATCT
AGTGGAACGA
AGGATCTTCA
CTAAAGTATA
GTGAGGCACC
TGACTCCCCG
CCCCAGTGCT
TATCAGCAAT
GCAACTTTAT
AGTAAGTAGT
CAGGCATCGT
GGTTCCCAAC
AGCGGTTAGC
CAGTGTTATC
ATGCCATCCG
ATTCTGAGAA
TACGGGATAA
CGGAGACGGT
CGTCAGGGCG
CCAGTCACGT
AGAGCAGATT
GATCCGTAAG
ACTGACTCGC
CTCAAAGGCG
AGAACATGTG
GCGTTGCTGG
AAATCGACGC
ACCAGGCCTT
CTGCCGCTTA
GCTTTCTCAA
GCTCCAAGCT
GCCTTATCCG
ATCGCCACTG
TAGGCGGTGC
AGAAGGACAG
AAAAAGAGTT
GTGGTTTTTT
CAAGAAGATC
AAACTCACGT
CCTAGATCCT
TATGAGTAAA
TATCTCAGCG
TCGTGTAGAT
GCAATGATAC
AAACCAGCCA
CCGCCTCCAT
TCGCCAGTTA
GGTGTCACGC
GATCAAGGCG
TCCTTCGGTC
ACTCATGGTT
TAAGATGCTT
TAGTGTATGC
TACCGCGCCA
CACAGCTTGT
CGTCAGCGGG
AGCGATAGCG
GTACTGAGAG
GAGAAAATAC
TGCGCTCGGT
GTAATACGGT
AGCAAAAGGC
CGTTTTTCCA
TCAAGTCAGA
TCCCCCTGGA
CCGGATACCT
TGCTCACGCT
GGGCTGTGTG
GTAACTATCG
GCAGCAGCCA
TACAGAGTTC
TATTTGGTAT
GGTAGCTCTT
TGTTTGCAAG
CTT^G
TAAGGGATTT TTT*· AA^TAA CTTGGTCTGA ATCTGTCTAT AACTACGATA CGCGAGACCC GCCGGAAGGG CCAGTCTATT ATAGTTTGCG TCGTCGTTTG AGTTACATGA CTCCGATCGT ATGGCAGCAC TTC7GTGACT GGCGACCGAG CATAGCAGAA
CTGTAAGCGG
TGTTGGCGGG
GAGTGTATAC
TGCACCATAT
CGCATCAGGC
CTGTCGGCTG
TATCCACAGA
CAGCAAAAGG
TAGGCTCCGC
GGTGGCGAAA
AGCTCCCTCG
GTCCGCCTTT
GTAGGTATCT
CACGAACCCC
TCTTGAGTCC
CTGGTAACAG
TTGAAGTGGT
CTGCGCTCTG
GATCCGGCAA
CAGCAGATTA
TTCTACGGGG
TGGTCATGAG
AAATGAAGTT
CAGTTACCAA
TTCGTTCATC
CGGGAGGGCT
ACGCTCACCG
CCGAGCGCAG
AATTGTTGCC
CAACGTTGTT
GTATGGCTTC
TCCCCCATGT
TGTCAGAAGT
TGCATAATTC
GGTGAGTACT
TTGCTCTTGC
CTTTAAAAGT
ATGCCGGGAG
TGTCGGGGCG
TGGCTTAACT
GCGGTGTGAA
GCTCTTCCGC
CGGCGAGCGG
ATCAGGGGAT
CCAGGAACCG
CCCCCTGACG
CCCGACAGGA
TGCGCTCTCC
CTCCCTTCGG
CAGTTCGGTG
CCGTTCAGCC
AACCCGGTAA
GATTAGCAGA
GGCCTAACTA
CTGAAGCCAG
ACAAACCACC
CGCGCAGAAA
TCTGACGCTC
ATTATCAAAA
TTAAATCAAT
TGCTTAATCA
CATAGCTGCC
TACCATCTGG
GCTCCAGATT
AAGTGGTCCT
GGGAAGCTAG
GCCATTGCTA
ATTCAGCTCC
TGTGCAAAAA
AAGTTGGCCG
TCTTACTGTC
CAACCAAGTC
CCGGCGTCAA
GCTCATCATT 80- » « ·· · · 11 » φ · φ · φφ· · 1 I Φ Φ · · · * 9« |· · · · · 3601 GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG 3651 ATCCACTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT 3701 TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC 3751 GCAAAAAAGG GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT 3801 CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT CTCATGAGCG 3851 GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 3901 ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA TTATTATCAT 3951 GACATTAACC TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC ka 1 4: Nukleo tidovú sekvence ca stí lidsl :ého aenu 41) semaforin typu L (8888 nukleotidů) (Sekvence GAGCCGCACACGGTGCTTTTCCACGAGCCAGGCAGCTCCTCTGTGTGGGTGGGAGGACGT GGCAAGGTCTACCTCTTTGACTTCCCCGAGGGCAAGAACGCATCTGTGCGCACGGTGAGC CTCTCTCTTCCCCCAACACCCCCCCTACCCTCTTAtGTCCCCTCTGGCCCTGCCAAGGGT CCTCAGGGAATCCGAGGGAGCTGGCTTCTCTTCCTAAACTGCCCCCACCTCCGTATCCTA TAAATGGCTCCTGGGGGAGGCTCCCTAAAGGTAGTCCAGATTGGAGTGGGGAGCTGGGGC GGTGTGGAGAAAAACAGGAGCTAATGGGCCTGGCCAGCTGGGCAGCGCTGCTGCGGAAAG CCCAGGCTGGAAGCTGGGCCCCAGAGCCCATGCCTGGTCTTCTGAACCCTCTGGGCCTCA GCTCTGGATATGAGACCCTGTTTGACCTCAGGTAGATCACTCACCCTCTCAGAGCCCCAG TTGCTCATCTGTCAGATGAGAATAATGGTTGCTTCCTTTGGGGCTTATCCTGAGGCTGTG TGGAAAGCATTTCAGGGGTACCTCACCCCTGGCAGATTGAACTAATGCTTCTCCCCTTCC CCAGGTGAATATCGGCTCCACAAAGGGGTCCTGTCTGGATAAGCGG3TGAGCGGGGGAGG . GATCTGGAGGGGTCTGAGCCACTTGGTAAAGGGAGAGGAGACCCTGAGGGTCTAAGGAAG GAAGCATGGCCCTGCCCCACGAGTCCCAGACTGATGGGGAGACGTGGTCCTCTGTGCTTA GGGGATGGCGTCAGCTGCACACACTCTGGGCTGTCCCGGGASGCTG7CACCTATGCTAAG CCCTTCTGACACCTTCTTCCCTGATCCTGGGGGTCCTAGTGCTAGGCTTGCCAGGGCCTT CCAGCAACCAATTTCTCTCCTCCCTTCTCTCTTCCCCGGGCAGGACTGCGAGAACTACAT cactctcctggagaggcggagtgaggggctgctggcctgtggcaccaacgcccggcaccc
CAGCTGCTGGAACCTGGTGAGAAGGCTGCTCCCCATGTGCCTGATCAGCTCACCTTCTAC
TGCGTGGGCTTCTGCCCCTCATGGTGGGAAGGAGATGGCGAGACTCCAATGC
CCCTGGGAGGATGGGGCTCCTGGCCGAGAAACTGGCCGTCATGGGAGGCAGTGGCTGTGG GATTATGTGGCCATCCAACCCTCTGGATCTCCCACAGGTGAATGGCACTGTGSTGCCACT TGGCGAGATGAGAGGCTACGCCCCCTTCAGCCCGGACGAGAACTCCCT3GTTCTGTTTGA AGGTTGGGGCATGCTTCGGAACTGGGCTGGGAGCAGGATGGTCAGCTCTTTGTCCAGTGT CCGGAGGAGGGACTTCCAGGAGCTGCCTGCCCTTACTCATT'-CTCCCTCCCACTGACCCC AGGGGACGAGGTGTATTCCACCATCCGGAAGCAGG7-„ATACAATGGGAAGATCCCTCGGTT -81- • · «*· • t * Μ Μ • * ·· • ♦ · · • I · · ·· ♦· ·»· · * • * * 1« Μ
CCGCCGCATCCGGGGCGAGAGTGAGCTGTACACCAGTGATACTGTCATGCAGAGTGAGTC
AGGCTCCGGCTGGGCTGAGGGTGGGCAAGGGGGTGTGAGCACTTAAGGTGGCAGATGGGA tcctgatgtttctgggagggctccctgagggccgctggggccatgcaggaaagcaggaco ttggtataggcctgagaagttagggttggctgggagcagaggaacagacaaggtatagca gtgggatgggcccagccctcttcaggaacacaaacagagggagccccagacccagtgcag ggtccccaggagccaaagtttatcctctgctgagttcacgtggaggcagccccccaactc cctcctcatcagggctctgccaattgagcagaagtgacátaggggcccccagggaccttc ccccactccccaggcatgaagtcattgctcctgggccgatgacatctttgtaggaagagg gcaaaacaggtgtggggtggaggtgcagggtctagggcccctcggggagttggacctgat gttatgagtcctattccagatctgatttgccatggtttgtgcagacccgaaggagggagg agagtgtgcagggttggaatggtctcccgggcaagcttcccagccttacgcccattcgct
TCTGTGCCCTGGCAGACCCACAGTTCATCAAAGCCACCATCGTGCACCAAGACCAGGCTT
ACGATGACAAGATCTACTACTTCTTCCGAGAGGACAATCCTGACAAGAATCCTGAGGCTC
CTCTCAATGTGTCCCGTGTGGCCCAGTTGTGCAGGGTGAACACGGGCGTGAGGGCTGCTG
GCTACGTGTCTGTGCATGAATAGGCCTGAGTGAGGGTGAGTTCTGTGTGTCCGTGTGCAT
GTAGAAGTTGTGTGGATGTATGAGTGGGTCTGTGTCAGGGACTGTGGGAGCAGCTGTGTG
T5CATGGAGCATCATGTGTCTGTGTGTGGGTAAAGGTGGCTGAGCTCCTGTGCACGTATG
ATGGCGTGTGAGCGTGTGTATGATGGGGTGTGTGTGTGTGTGTGTGTGTGTGTTTTGCCT
GTGTGAATGTGCTGTGCCACGTATGTGGGTGCGTGAGTCAGTAAATGTGTGTCTGAGTCC
GTCTGCTCTGTGGGGACCTGGCACTCTCACCTGCCCTGACCCTGGGCACTGCTGGCCCTG
GGCTCTGGATCAGCCAGGCCTGCTTGCAGGAGTCTCATCTGGAGACCTGCCCTGAGTCCT
G^GvA^C-CCGG-AGGTCCTGC :agcctgccttcctcctctgggcccaggtg gcctcgtctcccctctacccttccagggggaccagggtggggaaagttcactgtcagtct ccaagtggaacacttttctgaaagccatgctggtatgcagtgatgctgccaccaacaaga acttcaacaggctgcaagacgtcttcctgctccctgaccccagcggccagtggagggaca ccagggtctatggtgttttctccaacccctggtgagtggcccttgtcctggggccggggc . _ * O .. ;tccagtagggacaggaggccttgggccctgctgagggcctccct gggggacagccagtgcgatgtatgtactgttgtgtgagtgagtctgcactcatgggtgtg tgtgcatgccctatatgcacactcatgactgcacttgtgcctgtgtgtcccaccacctgc tggtggcgagagtggacactgggcccaggaggaagctgctgaagcatctctcggggagct gggtgctattacacctgctcaggcactgcctgagcccgataattcacacttcttaatcac
tctcattgattgaacacacggcaggcggaagtgttgggtgtgtgtggggagagttaggga 35GAAGGGGTTGGGGGTCTGGCCTCCTGGGGCATCAGCACCCCACAGCCTGTGCCCAGGG Λ •J Ό :AACTí
TATGATGGGGTTCCTCCTGCCTTGGGGTTGGGTAGAGC
;tgat?ctgtaacaggatacaagtttgtggttttaaattgca . jAA-íTTAGGCTG.AACTCCTCTCCTTCCTCCTCTCCATCCCTCCCCATTTTCAG
TGGTGGTTGGCAACTCAGTGCCAGGCACAAGGCTGGCCTGGGTGAGTGGAGGTGGATGGG
TGGGTTCTGGGCCCCCCATTGAGCTGGTCTCCATGTCACTGCAGGAACTACTCAGCCGTC
TGTGTGTATTCCCTCGGTGACATTGACAAGGTCTTCCGTACCTCCTCACTCAAGGGCTAC cactcaagccttcccaacccgcggcctggcaaggtgagcgtgacaccagccgtggcccag
GCCCAGCCCTCCTTCTGCCTCACCTCCCACCACCCCACTGACCTGGGCCTGCTCTCCTTG cccagtgcctcccagaccagcagccgatacccacagagaccttccaggtggctgaccgtc acccagaggtggcgcagagggtggagcccatggggcctctgaagacgccattgttccact ctaaataccactaccagaaagtggccgtccaccgcatgcaagccagccacggggagacct ttcatgtgctttacctaactacaggtgagaggctaccccgggaccctcagtttgctttgt aaaaacgggcatgaaaggtgtaaggaataatgtagttaacatctggttggatctttacat gtggaaggaataattgagtgactggagttgtcaggggttaatgtgtgtgggtgtggaaga gccaggcagggagagcttcctggaggaggtaggggcaagagggaaagggggatgggagaa aagcaagcactgggatttggaggcggaaatctggagagtctgagcaaagccaggtgcacc tttggtccagatgtctgactcagggaagaagatggtaggaagagacgtggcaaatgagga ggaggggcctgaaccacagggatactggcctctgccaggcagaatgagggagtcaggccc tgcgcctgtctttgggattgtgcaggtgagaagaaacatttgaggagttgatggggcaca aattaggtatggggaaggagttccagggggcagaacctttgccatctcacagaggacagg ggcagcttctcttcttccctggagtaggccctgctgggggaagctgggtggaatgccgtg ggagatgctcctgctttctggaaagccacaggacacggaggagccagtcctgagttgggt ttgtcgcagcttcccatgccagctgccttccttgagactggaaagggcctctagcacccc tggggccattcaattcaggcccaggcgcccaacctcagttgttcacattccccatgtgat ctcctgttgctgcttcaccttgggactgtctcggctttggtgaccttgtaggaaactgga accccagcaccattgtttggctcctggaagccttggggagaggaatttcccacagggcag ggcctgggtcctgattccctgcctctttactccctattcatcccggctacacccttgggc ccccatccttgcttggctccagtactggctggcacagctgttgtggtcatccagggatgg cagggcactggggaacagaagagagaggtcacacagtgcggaactgggagcaggasctag gacaaggaaggctggacttggggcatggattcccttcctgcagacttgggaagtgagcac acttgagtgattagagaaggtgtcttcgttctaagggcagtggaggaggcaccattttgg AGCCTGCATCATTCGTATTTGGGCTAGATTGA.AAAATAGAGCTTTCTAAGTCCTCTGCAG agaatgggaggctctcacaactgggagaagtattggctcttttcctgagaattttgccaa
ATGTCTGTGAAGGCA
GGGTATGCTGTTACTGGGGCTGGTTTGGAAGGAGTATAGG
GTGGCTGGGGTGGGGCCTTATCAGGCCCAAGGAGCATCTGGCCACATCTCAGAGTCCACA
GATGAGGATCACGGATGTGTAGAGGAAACA.TCCTAGGCAG3CAATCATCTGACTGCTTTT
TTGGGGCAGGTGATGCCCTGGGAAATTGGGAGGGA3GGAGAGAGGGAGGTAGGCTATTCT
AGAAACTGGGAGAGCAGGTGAGGTAGGATTGGGAGGACCAGGGGTCAGGGTCCCCATTGG
TCCCTAATTGAGAACGGAGAGAGCATTGGTCTAGGAGGCAGGCAGCTCGGTTATAAGACC
TTGGGAACTCTTGATTTAGAATCCAAGATCCTTTTTAGATCTAGGA
TAGAACAGAAGAAG T GTTAATAGTAATG gatatcccctaagatcaaatgcaacgtggagtcctgaattggatcc
GACATTTGTGGAAAAACTAGTGřJiATCCAAATAAAGTCTGTAGTTT -83-
CACCAATGTCAGTTGCCTAGTTGTGACAAATATACCGTGGTTATGTAAGATGGTAACATT
agggggaactggagaagggtagattggagctctctgtactatctttgcaacttttctggg aatctaaaattactccaaaataaaaaaaaaatgtatttaaagtaaatatattccctaaga gtccaggaggcaggggagttgtagaagcagctgagtggttgggttctgacagatttggtt CCAACTCGGTCTCTGCTGCTCACCAGCTGTGTGACCTTGAGCAAGTGGCTTAGCCTTTCT GAGCCTGATTTCCTTATCTGTGGAGTGGGGAAGATGACAGCCACCTCGCAGGGCTGTGGA GGGTTAAACGAGGTGATGCATGGACAGCAGCCGCACTGACCTTGCTGGTGTGGGGCTCCT GCTTCTGTTCTTCCCGTGCAGCCTTGGGAATGTTGGAGGCCGTATCCAGGGACCCCTGGG CCTCCTGGGATGGCCTCTCTGGATCAGCCTTGGAAGGTTCCAGGCTGCCCTTAGGCTCCC ACATTCTTCCCCAGTCACGCTCTCCTCGCCCTGCCCACACCAGTCCTGTGACCCTTGCCT GAGTTGTGACTTCCCACCCCTCCCCGGCCTAGAGGAAAGCTGCCTGGCCCCTCAGTGGGA CTCCCGCCCACTGACCCTCTGTCCACCATACACAGACAGGGGCACTATCCACAAGGTGGT GGAACCGGGGGAGCAGGAGCACAGCTTCGCCTTCAACATCATGGAGATCCAGCCCTTCCG CCGCGCGGCTGCCATCCAGACCATGTCGCTGGATGCTGAGCGGGTGAGCCTTCCCCCACT GCGTCCCATGGGCTATGCAGTGACTGCAGCTGAGGACAGGGCTCCTTTGCATGTGATTTG TGTGTTCTTTTAAGAGCTTCTAGGCCTTAGGGCCTGGACATTTAGGACTGAGTGTGGGGT GGGGCCCGGGCCTGACCCAATCCTGCTGTCCTTCCAGAGGAAGCTGTATGTGAGCTCCCA GTGGGAGGTGAGCCAGGTGCCCCTGGACCTGTGTGAGGTCTATGGCGGGGGCTGCCACGG TTGCCTCATGTCCCGAGACCCCTACTGCGGCTGGGACCAGGGCCGCTGCATCTCCATCTA CAGCTCCGAACGGTACGTTGGCCGGGATCCCTCCGTCCCTGGGACAAGGTGGGCATGGGA CAGGGGGAGGTGTTGTCGGGCTGGAAGAGGTGGCGGTACTGGGCCTTTCTTGTGGGACCI CCTCTCTACTGGAACTGCACTAGGGGTAAGGATATGAGGGTCAGGTCTGCAGCCTTGTAT CTGCTGATCCTCTTTCGTCCTTCCCACTCCAGGTCAGTGCTGCAATCCATTAATCCAGCC GAGCCACACAAGGAGTGTCCCAACCCCAAACCAGGTACCTGATCTGGCCCTGCTGGCGGC TGTGGCCCAATGAGTGGGGTACTGCCCTGCCCTGATTGTCCTGGTCTGAGGGAAACATGG CCTTGTCCTGTGGGCCCCAGGTACATGGGGCAGGATACAGTCCTGCAGAGGGAGCCCTCT TGGTGGGATGAGCGAGACGGGAGAAAAAAGGAGGACGCTGAGGGCTGGGTTCCCCACGTT CATTCAGAAGCCTTGTCCTGGGATCCCAGTCGGTGGGGAGGACACATCCTCCCCTGGGAG CTCTTTGTCCCTCCTCACGGCTGCTTCCCCACTGCCTCCCCAGACAAGGCCCCACTGCAG AAGGTTTCCCTGGCCCCAAACTCTCGCTACTACCTGAGCTGCCCCATGGAATCCCGCCAC GCCACCTACTCATGGCGCCACAAGGAGAACGTGGAGCAGAGCTGCGAACCTGGTCACCAG AGCCCCAACTGCATCCTGTTCATCGAGAACCTCACGGCGCAGCAGTACGGCCACTACTTC TGCGAGGCCCAGGAGGGCTCCTACTTCCGCGAGGCTCAGCACTGGCAGCTGCTGCCCGAG GACGGCATCATGGCCGAGCACCTGCTGGGTCATGCCTGTGCCCTGGCCGCCTCCCTCTGG CTGGGGGTGCTGCCCACACTCACTCTTGGCTTGCTGGTCCACTAGGGCCTCCCGAGGCTG GGCATGCCTCAGGCTTCTGCAGCCCAGGGCACTAGAACGTCTCACACTCAGAGCCGGCTG GCCCGGGAGCTCCTTGCCTGCCACTTCTTCCAGGGGACAGAATAACCCAGTGGAGGATGC CAGGCCTGGAGACGTCCAGCCGCAGGCGGCTGCTGGGCCCCAGGTGGCGCACGGATGGTG AGGGGCTGAGAATGAGGGCACCGACTGTGAAGCTGGGGCATCGATGACCCAAGACTTTAT -84- -84- • ···· * • »♦ * · · • · · · *» I tl · · ·· • · * ♦ ··· · * • t · · » ·
CTTCTGGAAAATATTTTTCAGACTCCTCAAACTTGACTAAATGCAGCGATGCTCCCAGCC
CAAGAGCCCATGGGTCGGGGAGTGGGTTTGGATAGGAGAGCTGGGACTCCATCTCGACCC
TGGGGCTGAGGCCTGAGTCCTTCTGGACTCTTGGTACCCACATTGCCTCCTTCCCCTOCC
TCTCTCATGGCTGGGTGGCTGGTGTTCCTGAAGACCCAGGGCTACCCTCTGTCCAGCCCT
GTCCTCTGCAGCTCCCTCTCTGGTCCTGGGTCCCACAGGACAGCCGCCTTGCATGTTTAT
TGAAGGATGTTTGCTTTCCGGACGGAAGGACGGAAAAAGCTCTGAAAAAAAAAAAAAAAA
AAAAAAAA
bulka 15: Nukieotidová sekvence plazmicu pMelBacA-H-Sema-L 622; .Sekvence ic. c. : 4c.<
1 GATATCATGG AGATAATTAA AATGATAACC ATCTCGCAAA TAAATAAGTA
51 TTTTACTGTT TTCGTAACAG TTTTGTAATA AAAAAACCTA TAAATATGAA 101 ATTCTTAGTC AACGTTGCCC TTGTTTTTAT GGTCGTATAC ATTTCTTACA 151 TCTATGCGGA TCGATGG gga tccgcccagg gccacctaag gagcggaccc 2 01 cgcatcttcg ccgtctagaa aggccatgta gggcaggacc gggtggactt 251 tggccagact gagccgcaca cggtgctttt ccacgagcca ggcagctcct 301 ctgtgtgggt gggaggacgt ggcaaggtct acctctttga cttccccgag 3 51 ggcaagaacg catctgtgcg cacggtgaat atcggctcca caaaggggtc 4 0 i ctgtctqgat aagcgggact gcgaqaacta catcactctc ctggagaggc ^ c, η ggagtgaggg gctgctggcc tgtggcacca acgcccggca ccccagctgc 501 tggaacctgg tgaatggcac tgtggtgcca cttggcgaga tgagaggcta 551 tgcccccttc agcccggacg agaactccct ggttctgttt gaaggggacg 601 agqtgtattc caccatccgg aagcaggaat acaatgggaa gatccctcgg η *ί 1 otccgccgca Iccggqgcga gagtgagctg tacaccagtg atactgtcat "o: gcagaaccca cagttcatca aagccaccat cgtgcaccaa gaccaggctt 75^ gatctactac ttcťcccgag aggacaatcc tgacaagaat eo: cctgagactc ctctcaatgt gtcccgtgtg gcccagttgt gcagggggga ří c. Ί ccagggtggg gaaagttcac tgtcagtctc caagtggaac acttttctga b-o: aagccatgct ggtatgcagt gatgctgcca ccaacaagaa cttcaacagg ctgcaagacg tcttcctgct ccctgacccc agcggccagt ggagggacac :oo: cagqgtctat ggtgttttct ccaacccctg gaactactca gccgtctgtg * r c - tgtattccct cggtgacatt gacaaggtct tccgtacctc clcactcaag “ " Γ) ggctaccact caagccttcc caacccgcgg cctggcaagt gcctcccaga
• · ««· • · » · « • * * · t * ·» · • · · · · · • * * * - 3 5 - 1151 ccagcagccg atacccacag agaccttcca ggtggctgac cgtcacccag 1201 aggtggcgca gagggtggag cccatggggc ctctgaagac gccattgttc 1251 cactctaaat accactacca gaaagtggcc gttcaccgca tgcaagccag 1301 ccacggggag acctttcatg tgctttacct aactacagac aggggcacta 1351 tccacaaggt ggtggaaccg ggggagcagg agcacagctt cgccttcaac 1401 atcatggaga tccagccctt ccgccgcgcg gct.gccat.ee aaaccatgtc 1451 gctggatgct gagcggagga agctgtatgt gagctcccag tgggaggtga 1501 gccaggtgcc cctggacctg tgtgaggtct atggcggggg ctgccacggt 1551 tgcctcatgt cccgagaccc ctactgcggc tgggaccagg gccgctgcat 1601 ctccatctac agctccgaac ggtcagtgct gcaatceatt aatccagccg 1651 agccacacaa ggagtgtccc aaccccaaao cagacaaggc cccactgcag 1701 aaggtttccc tggccccaaa ctctcgctac tacctgagct gccccatgga Π 51 atcccgccac gccacctact catagcgcca caaggagaac gtggaacaga 1801 gctgcgaacc tggtcaccag a gccccaact gcatcctgtt catcgagaac 1851 ctcaccgcgc agcagtacgg ccactacttc tgcgaggccc aggagggctc 1901 ctacttccgc gaggctcagc actggcagct gctgcccgag gacggcatca 1951 tggccgagca cctgctgggt catgcctgtg ccctggctgc ctgaattc GA 2001 AGCTTGGAGT CGACTCTGCT GAAijAGGAGG AAATTCTCCT TGAAGTTTCC 2051 CTGGTGTTCA AA G T Aj-vA G GlA GTTTGCACCA GACGCACCTC TGTTCACTGG 2101 TCCGGCGTAT TAAAACACGA TACATTGTTA TTA3TACATT TATTAAGCGC 2151 TAGATTCTGT GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT 2201 AATTCATTAA ATTTAGAATC TTT AGGGTGu TATGTTAGAG CGAAAATCAA 2251 ATGATTTTCA gcgtctttat ATCTGAATTT ΑαλΑΤ /VTT aaa TCCTCAATAG 2301 ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA /JlCAAG^uTT G TTTTTCCGAA 2351 CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC 2401 CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT 2451 TTTG7AATAA aggttcgacg TCG7TCAAAA Ta I'Tm?gcgc TTTTGTATTT 2501 CTTTCATGAC TGTCGTTAGT GTACAATTGA CT C 3 A CGT .AA ACACGTTAAA 2551 TAAAGCCTGG ACATATTTAA CATCGGGCGT GTTAGCTTTA TTAGGCCGAT 2 601 TATCGTCGTC GTCCCAACCC TC oT L- GTT AG AAGTTGCTTC CGAAGACGAT 2651 TTTGCCATAG C CA^AC 'jjaC G ffirpr Τ' ΤΉ*1 0Liftí*rthi i ΛΓπ,'Ή Λ Τ) V * '•j - U· ^ Ό v . ACACí^TCCGC • · -3 6-
GATCAAATTT TTTGGGCGGG TTAGAAAGCG TAATGGCGGC CAGGCGGGGC GACGGCGGTT TCAACTATTG CTCTGATGCC ACGCGCCCTG GTGACCGTCT GAAACGCGCG ATGTCATGAT AATGTGCGCG GTATCCGCTC AAAGGAAGAG TTTGCGGCAT AGTAAAAGAT TGGATCTCAA TTTCCAATGA CCGTATTGAC AGAATGACTT GGCATGACAG lACTGCGGCC CCGCTTTTTT GAACCGGAGC GCCTGTAGCA TTACTCTAGC GTTGCAGGAC TGATAAATCT TGGGGCCAGA AGTCAGGCAA
TTTTTGGAAT ACTGTGCCCG CGGTGGTAAC CTGATGATAA GGCGGAGGCG TTGTCTCTTT GGGCGTATGG GCCAGCCCCG CTGCTCCCGG CATGTGTCAG GCCTCGTGAT TCTTAGACGT TTGTTTATTT AACCCTGATA CAACATTTCC TGTTTTTGCT AGTTGGGTGC ATCCTTGAGA TAAAGTTCTG AGCAACTCGG TCACCAGTCA ATGCAGTGCT TGACAACGAT GGGGATCATG CATACCAAAC CGTTGCGCAA CAATTAATAG CTCGGCCCTT AGCGTGGGTC TCCCGTATCG AC GAAATAGA
TGCGGGCGTT AGACAACACG GCAAATCTAC GGTGGAGGCG CGGTGATGCA AGTCGGCACC GTACAATCTG ACACCCGCTG CAGACAAGCT CGTCATCACC TTATAGGTTA TTTTCGGGGA ATTCAAATAT TAATATTGAA TATTCCCTTT CGCT GGT GArt TACATCGAAC CGAAGAACGT CGGTATTATC CACTATTCTC TCTTACGGAT TGAGTGATAA aaggagctaa TGATCGTTGG ACACCACGAT GGCGAACTAC GGCGGATAAA GGTTTATTGC ATTGCAGCAC CACGACGGGG /-„GATAGGTGC
GTAGTTGAGC
TTTCAATCTA
ATGGTGCAGG
GGTGGTGGAG
TGGCGGCGGA
TAGGCTCAAA
TACTGGTTTC
GCATAGTTAA
ACGGGCTTGT
CCGGGAGCTG
AGACGAAAGG
AATAATGGTT
GAACCCCTAT
ATGAGACAAT
TATGAGTATT
TTTGCCTTCC
GCTGAAGATC
CAGCGGTAAG
TGAGCACTTT
GCCGGGCAAG
GGTTGAGTAC
TAAGAGAATT
AACTTACTTC
GCACAACATG
TGAATGAAGC
ATGGCAACAA
TTCCCGGCAA
CACTTCTGCG
GGAGCCGGTG
TGGTAAGCCC
CTATGGATGA
TATTTCTGAT
ATTTTAATTC
ATTTCAGACG
ATCTACCATC
GAGGTGGTGG
CAGGCAACAC
TGCACTCTCA
ACACCCGCCA
CATCCGCTTA
AGGTTTTCAC
ACGCCTATTT
CAGGTGGCAC
TTCTAAATAC
AATGCTTCAA
GTGTCGCCCT
CACCCAGAAA
ACGAGTGGGT
GTTTTCGCCC
CTATGTGGCG
TCGCCGCATA
CAGAAAAGCA
GCCATAACCA
CGGAGGACCG
TAACTCGCCT
GACGAGCGTG
ACTATTAACT
ACTGGATGGA
CCGGCTGGCT
TCGCGGTATC
TAGTTATCTA
CAGATCGCTG r · · * *· · · » M« • » · l • · * · ** «·
4251
CTCACTGATT AAGCATTGGT AACTGTCAGA CCAAGTTTAC TCATATATAC
4301 TTTAGATTGA TTTAAAACTT CATTTTTAAT TTAAAAGGAT CTAGGTGAAG 4351 ATCCTTTTTG ATAATCTCAT GACCAAAATC CCTTAACGTG AGTTTTCGTT 4401 CCACTGASCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT TCTTGAGATC 4451 CTTT Φ Ipipijl QIJ GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA 4d01 CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA 4551 GGTAACTGGC TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT 4601 AGCCGTAGTT AGGCCACCAC TTCAAGAACT CTGTAGCACC GCCTACATAC 4651 CTCGCTCTGC TAATCCTGTT ACCAGTGGCT GCTGCCAGTG GCGATAAGTC 4701 GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT AAGGCGCAGC 4751 GGTCGGGCTG AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG 4801 ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAC 4851 GCTTCCCGAA GGGAGAAAGG cggacaggta TCCGGTAAGC GGCAGGGTCG 4901 GAACAGGAGA GCGuACGAGG GAGCTTCCA3 GGGGAAACGC CTGGTATCTT 4951 TATAGTCCTG TCGGGTTTCG CCACCTCTGA CTTGAGCGTC GATTTTTGTG 5001 ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC AACGCGGCCT 5051 TTTTACGGTT CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT 5101 GCGTTATCCC CTGATTCTGT GGATAACCGT ATTACCGCCT TTGAGTGAGC t Ί C, -· TGATACCGCT lu-CC GCAGCC GA>íCijAuc GA GCGCAGCGAG TCAGTGAGCG 5201 AGGAAG\_AT C CT ltCAl-CAT c GTCTGCTCAT CCATGACCTG ACCATGCAGA 5251 GGATGATGCT CGTGACGGTT AACGCCTCGA ATCAGCAACG GCTTGCCGTT 5301 CAGCAGCAGC AGACGATT7T CAATCCGCAC CTCGCGGAAA CCGACATCGC 5351 AG^CTTCTOC TTCAATCAGC GTGCCGTCGG CGGTGTGCAG TTCAACCACC 5 4 01 GCAC GjhTAsuA GATTCSGGAT TTCGGCGCTC CACAGTTTCG GGTTTTCGAC 54 51 GTTCAfoAuGT AGTGTGACGC GATCGGTATA ACCACCACGC TCATCGATAA 5 5 01 TTTCACCGCC GAAAG G C G C- G GTGCCGCTGG CGACCTGCGT TTCACCCTGC e ; c. - CATAAAGAAA CTGTTACCCG TAGGTASTCA CGCAACTCGC CGCACATCTG 5 € C1 AACTTCAGCC TCGAGTACAG CGCGGCTGAA ATCATCATTA AAGCGAGTGG 5651 CAA CAT G GAA ATCGCTGATT TGTGTAGTCG GTTTATGCAG CAACGAGACG 5701 T Cj-^C 3'ortAm TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT 5 7 5: --.'’ΊΤΚ** v- * 's.;Av λ v.· ~-*-A . 1- C Ά G CA CCATCACCGC GAGGCGGTTT TCTCCGGCGC í C 1 o AA-vA^AT i —A juT . i í-.—koAi-G GCAAACGACT GTCCTGGCCG - 88“ • ·
5851 TAACCGACCC AGCGCCCGTT GCACCACAGA TGAAACGCCG AGTTAACGCC 5901 ATCAAAAATA ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT TCATCAACAT 5951 TAAATGTGAG CGAGTAACAA CCCGTCGGAT TCTCCGTGGG AACAAA C GGC 6001 GGATTGACCG TAATGGGATA GGTCACGTTG GTGTAGATGG GCGCATCGTA 6051 ACCGTGCATC TGCCAGTTTG AGGGGACGAC GACAGTATCG GCCTCAGGAA 6101 GATCGCACTC CAGCCAGCTT TCCGGCACCG CTTCTGGTGC CGGAAACCAG 6151 GCAAAGCGCC ATTCGCCATT CAGSCTGCGC AACTGTTGGS AAGGGCGATC 6201 GGTGCGGGCC TCTTCGCTAT TACGCCAGCT GGCGAAAGG'j GGATGTGCTG 6251 CAAGGCGATT AAGTTGGGTA ACGCCAGGGT TTTCCCAGTC ACGACGTTGT 6301 AAAACGACGG GATCTATCAT TTTTAGCAGT GATTCTAATT GCAGCTGCTC 6351 TTTGATACAA CTAATTTTAC GACGACGATG CGAGCTTTTA TTCAACCGAG 6401 CGTGCATGTT TGCAATCGTG CAAGCGTTAT CAATTTTTCA TTATCGTATT 6451 GTTGCACATC AACAGGCTGG ACACCACGTT GAACTCGCCG CAGTTTTGCG 6501 GCAAGTTGGA CCCGCCGCGC atccaatgca AACTTTCCGA CATTCTGTTG 6551 6601 CCTACGAACG TTTTTCGTGT ATTGATTCTT CCAGTGTGGC TGTCCATTGA T^p TCGAAGCGAG TGCCTTCGAC 1^- '•.'Λ-'-
'KVE-NCI
}Β) TY?: r.ukLeová kyselina (C) POČET VLÁKEN: dvě íD'j TOPOLOGIE: _ l r. e č r r. i (ii) TYP MOLEKULY: OLA genomová lix) CHARAKTERISTICKÉ RYSY: IA) JKÉK O / K LIČ: e >: o n <3! UMÍSTĚNÍ:1 až 263€ íxi) POPIS SEKA 'ENCE ID.C: i : CGGGGCCACG GCATGACGCC TCCTCCGCCC 'OUftuO 1 LiO. — V.3 AGCo Co. o ^ 6 0 CGCGTCCCTG GCCCGCCGGC TCGGTTGGGG CTTCCGCTGC n ^ ^.»1 .·^ Λφ JJw. w i o w i oro voL· » o 12 C CTCTGGGCGG CCGCCGCCTC CGCCCAGGGl CACCiAAGGA řOA-n <-> ·-> ULUsir.v.Gv- V· O 1 B 0 GTCTGGAAAG GCCATGTAGG G C A G G A C C G G <-· rn, pn ; ρφΓηη.'ΐ ό i oUrt-. i - i w GCCAGACTGA o v. o _ri CA - -o 240 GTGCTTTTCC ACGAGCCAGG CAGCTCCTCT GTG T GG GTGG G AG G A C G Τ' o o j. __H... 3 00 -89- ► t · » · * · * *
CTCTTTGAC7 TCCCCGAGGG T τ· •"'ΛΛΠΓηΛΛΦ O * V- u * GTCTGGATAA AGTGAGGGGC TGCTGGCCTG AATGGCACTG TGGTGCCACT AACTCCCTGG TTCTGTTTGA AAT0G3AAGA TCCCTCGGTT ACTGTCATGC AGAACCCACA GATGACAAGA TCTACTACTT CTCAATGTGT CCCGTGTGGC TCAGTCTCCA AGTGGAACAC AACAAGAACT TCAACAGGCT AG GGACACCA GGGTCTATGG TATTCCCTCG GTGACATTGA AGCCTTCCCA ACCCGCGGCC ACCTTCCAGG TGGCTGACCG '·- - oAj-íuacgc CATTGTTCCA CmoC cagcc ACGGGGAGAC C κ ΑΆ G o T1G G TGGAACCGGG CAGCCCTTCC GCCGCGCGGC CTGTATGTGA GCTCCCAGTG G vj v o G G 3 G C T GCCACGGTTG -.1 _ * GCACC * C CA T C T A C A G CCACA2AAGG AGTGTCCCAA GCGCCAAACT CTCGCTACTA T -u -i C G C C A C A mGohGAACGT ATCCTGTTCA FCGAGAACCT vAGoGG-CCT ACTTCCGCGA G32GAG2ACC TGCTGGGTCA
CGGTGAATAT CGGCTCCACA TCACTCTCCT GGAGAGGCGG CCAGCTGCTG GAACCTGGTG CCCCCTTCAG CCCGGACGAG CCATCCGGAA GCAGGAATAC GTGAGCTGTA CACCAGTGAT TGCACCAAGA CCAGGCTTAC ACAAGAATCC TGAGGCTCCT AGGGTGGGGA AAGTTCACTG TATGCAGTGA TGCTGCCACC CTGACCCCAG CGGCCAGTGG ACTACTCAGC CGTCTGTGTG CACTCAAGGG CTACCACTCA AGCAGCCGAT ACCCACAGAG GGGTGGAGCC CATGGGGCCT AAGTGGCCGT TCACCGCATG CTACAGACAG GGGCACTATC CCTTCAACAT CATGGAGATC TGGATGCTGA GCGGAGGAAG TGGACCTGTG TGAGGTCTAT ACTGCGGCTG GGACCAGGGC ΑΛΤCCATTAA TC CAGCCG AG CACTGCAGAA GGTTTCCCTG CCCGCCACGC CACCTACTCA GTCACCAGAG CCCCAACTGC ACTACTTCTG CGAGGCCCAG TGCCCGAGGA CGGCATCATG CCCTCTGGCT GGGGGTGCTG
CAAGAACGCA TCTGTGCGCA GCGGGACTGC GAGAACTACA TGGCACCAAC GCCCGGCACC TGGCGAGATG AGAGGCTACG AGGGGACGAG GTGTATTCCA CCGCCGCATC CGGGGCGAGA GTTCATCAAA GCCACCATCG CTTCCGAGAG GACAATCCTG CCAGTTGTGC AGGGGGGACC TTTTCTGAAA GCCATGCTGG GCAAGACGTC TTCCTGCTCC TGTTTTCTCC AACCCCTGGA CAAGGTCTTC CGTACCTCCT TGGCAAGTGC CTCCCAGACC TCACCCAGAG GTGGCGCAGA CTCTAAATAC CACTACCAGA CTTTCATGTG CTTTACCTAA GGAGCAGGAG CACAGCTTCG TGCCATCCAG ACCATGTCGC GGAGGTGAGC CAGGTGCCCC CCTCATGTCC CGAGACCCCT CTCCGAACGG TCACTGCTGC CCCCAAACCA GACAAGGCCC CCTGAGCTGC CCCATGGAAT GGAGCAGAGC TGCGAACCTG CACGGCGCAG CAGTACGGCC GGCTCAGCAC TGGCAGCTGC TGCCTGTGCC CTGGCTGCCT 360 420 480 540 600 660 720 780 840 900 560 102 0 10B0 1140 1200 1260 1320 1380 14 4 0 1500 1560 1620 16 80 1740 ieoo 1860 1 92 0 1980 -90- • · • * • * · t I » f ft · ·
CCCACACTCA CTCTTGGCTT GCTGGTCCAC TAGGGCCTCC CGAGGCTGGG CATGCCTCAG 2040 GCTTCTGCAG CCCAGGGCAC TAGAACGTCT CACACTCAGA GCCGGCTGGC CCGGGAGCTC 2100 CTTGCCTGCC ACTTCTTCCA GGGGACAGAA TAjACCCAGTG GAGGATGCCA GGCCTGGAGA 2160 CGTCCAGCCG CAGGCGGCTG CTGGGCCCCA GGTGGCGCAC GGATGGTGAG GGGCTGAGAA 2220 TGAGGGCACC GACTGTGAAG CTGGGGCATC GATGACCCAA GACTTTATCT TCTGGAAAAT 2280 ATTTTTCAGA CTCCTCAAAC TTGACTAAAT GCAGCGATGC TCCCAGCCCA AGAGCCCATG 2340 GGTCG3GGAG TGGGTTTGGA TAGuAGAGC1 GGGACTCCAT CTCGACCCTG GGGCTGAGGC 2400 CTGAGTCCTT CTGGACTCTT GGTACCCACA TTGCCTCCTT CCCCTCCCTC TCTCATGGCT 2460 GGGTGGCTGG TGTTCCTGAA GACCCAGGGC TACCCTCTGT CCAGCCCTGT CCTCTGCAGC 2520 TCCCTCTCTG GTCCTGGGTC CCACAGGACA GCCGCCTTGC ATGTTTATTG AAGGATGTTT 2580 GCTTTCCGGA ^ íj G AAkj G ACTG GAAAAAGCTC TGAAAAAAAA AAAAAAAAAA AAAAAA 2 6 3 6 IKFOEKA CE 0 S a.K v El\i Cl II1. C . : A : ii i CKAFAKTERi 5 'ΤιίΊΑ SEKYii HCE: ÍA) Ά ·- V1 - , · .,0 L, pari bari i 3' yy •P: r.uiilecvi á kyselina ?' >ČET VGA KOK : dvě :n: ' TV? moleki: !LV: DKA ge: nosová íix i CHARAKTER! S7ICKĚ RVS Λ · •A) JMŽKO/KLiČ: ζ.’.ύι. ' 5 i Civ Z - - —- ' POPIS SPřO •rENCr: ::=.-::.- CuGoGl .'^CQ ggatgacgoc TCCTCCTCCC r f-V.! .‘i O J 'JwLL' Λ, n ,-1v ,·, ^ ACCGCGCGCC 60 CGCGTCCTCA GCCTGCCG3C .. Cu. TCGoG CT^GC^CTGC GG2TGCGGCT TCTGCTGGTG 120 TTCTGGGTGG CCGCCGCCTC CACTCGAGGA GGuGACCCCG CATCTCCGCC 1Θ0 GTCTGGAAAG ggcaggacca Έό.UohLa i - noC * '·*.? CGTGCTTTTC 2 4 0 CATGAGCCGG gcagcttctc i ό .. LvoGTG LvjTojjoA^vJ * v CCACTTCAAC 300 TTCCCCGAGG 'j^-ňAGAATGC C;^ j ACGGTG/vAGA i ουi l ^AC AAAGGGGTCC 360 TGTCAGGACA A w G A C T G * O «-1 A J , A. ‘s. A I\.ACTCTTC AoA^AG ^ CG r~- r~i ι·ή > 7*1 np /i Λί KJ vJ vJ hň . kJi 420 -91- ctgctggtct GTGGCACCAA TGCCCGGAAG CCCAGCTGCT GGAACTTGGT GAATGACAGT 480 GTGGTGATGT CACTTGGTGA GATGAAAGGC TATGCCCCCT TCAGCCCGGA TGAGAACTCC 540 CTGGTTCTGT TTGAAGGAGA TGAAGTGTAC TCTACCATCC ggaagcagga ATACAACGGG 600 AAGATCCCTC GGTTTCGACG CATTCGGGGC GAGAGTGAAC TGTACACAAG TGATACAGTC 66 0 ATGCAGAACC CACAGTTCAT CAAGGCCACC ATTGTGCACC aagaccaagc CTATGATGAT 720 AAGATCTACT ACTTCTTCCG AGAAGACAAC CCTGACAAGA ACCCCGAGGC TCCTCTCAAT 780 GTGTCCCGAG TAGCCCAGTT GTGCAGGGGG GACCAGGGTG GTGAGAGTTC GTTGTCTGTC 540 TCCAAGTGGA ACACCTTCCT GAAAGCCATG TTGGTCTGCA GCGATGCAGC CACCAACAGG 900 AACTTCAATC GGCTGCAAGA TGTCTTGCTG CTccCTGACC CCAGTGGCCA GTGGAGAGAT 960 ACCAGGGTCT ATGGCGTTTT CTCCAACCCC TGGAACTACT CAGCTGTCTG CGTGTATTCG 102 0 CTTGGTGACA TTGACAGAGT CTTCCGTACC TCATCGCTCA AAGGCTACGA CATGGGCCTT 1060 TCCAACCCTC GACCTGGCAT GTGCCTCCCA AAAAAGCAGC CCATACCCAC AGAAACCTTC 1140 CAGGTAGCTG ATAGTCACCC AGAGGTGGCT CAGAGGGTGG AACCTATGGG GCCCC 1195 INFORMACE Ο SEKVENCI ID. Č.: 3: {ii CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 666 airinckyse_ir: (E) TYP: aminokyselina (C) POČET VLÁKEN: dvě (D) TOPOLOGIE: lineární (li) TYP MOLEKULY; protein (ix) CHARAKTERISTICKÉ RYSY: (A) JMÉNO/KLIČ : proteir; {B) UMÍSTĚNÍ:! au 666 (xi) POPIS SEKVENCE ID.Č: 3:
Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Aro Ala 15 10 ·5~
Arg Val Pro Gly Pro Pro Ala Arg Leu Gly Leu Pro Leu Arg Leu Aro 20 25 30
Leu Leu Leu Leu Leu Trp Ala Ala Ala Ala Ser Ala Gin Gly His Len 35 40 41 -92- f.Z 0 Ser r'". , Pro Arg Ile Phe Ala Val Trp Lys Gly His Val Gly Gin 5 C 55 60 Asp Arg Val Asp Phe Gly Gin Thr Glu Pro His Thr Val Leu Phe His 65 70 75 80 Glu Pro Gly Ser Ser Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr 85 90 95 Leu Phe Asp Phe Pro Glu Gly Lys Asn Ala Ser val Arg Thr Val Asn 100 105 110 I le GIv Ser yv- r Lys Gly Ser Cvs Leu Asp Lys Arg Asp Cys Glu Asn 115 120 125 Tyr I le Thr Leu Leu Glu Arg Arg Ser Glu Gly Leu Leu Ala Cys Gly 130 135 140 Asn AI s Arg His Pro Ser Cys Trp Asn Leu Val Asn Gly Thr Val 145 150 155 160 v*&l Pro Leu Gly Glu Met Arg Gly Tyr Ala Pro Phe Ser Pro Asp Glu 165 170 175 As n Ser Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr Ile Arg 180 185 190 Lys Gin Glu Tyr Asn Gly Lys Ile Pro Arg Phe Arg Arg Ile Arg Gly 19S 200 205 Glu Ser Glu Leu Tur Thr Ser Asp Thr Val Met Gin Asn Pro Gin Phe 21 0 215 220 11 e Lys Ala Thr Ile Val His Gin Asp Gin Ala Tyr Asp Asp Lys Ile 225 230 235 240 TVr T·· . -t- Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro 245 250 255 Le u Asn VcÍi Ser Are Val Ala Gin Leu Cvs Arg Gly Asp Gin Gly Gly 2 60 265 270 Glu Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met 275 260 285 __f e Li ' · . 1 CVs Ser Asp A.la Ala Thr Asn Lys Asn Phe Asn Arg Leu Gin ISO 295 300 Asp '.7^ Ί ' u .* Pne Leu Leu Pro Asp Pro Ser Gly Gin Trp Arg Asp Thr Arg j 0 5 310 315 320 τ ~ ”1 v a - Tyr Gly Ya 1 Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val 330 335
I ··* * · * • · ·* I * ·· I ► I 4
ι · · I • t ·· » · Μ ·· · * * * · · «« ··
Tyr Ser Leu Gly Asp ile Asp Lys Val Phe Arg Thr Ser Ser Leu Lys 340 245 350 Gly Tyr His Ser Ser Leu Pro Asn Pro Arg Pro Gly Lys Cys Leu Pro 355 360 365 Asp Gin Gin Pro Ile Pro Thr Glu Thr Phe Gin Val Ala Asp Arg His 370 375 380 Pro Glu Val Ala Gin Arg Val Glu Pro Met Gly Pro Leu Lys Thr Pro 385 390 395 400 Leu Phe His Ser Lys Tyr His Tyr Gin Lys Val Ala Val His Arg Met 405 410 415 Gin Ala Ser Kis Gly Glu Thr Phe His Val Leu Tyr Leu Thr Thr Asp 420 425 430 Arg Gly Tfcr Ile His Lys Val Val Glu Pro Gly Glu Gin Glu His Ser 435 440 445 Phe Ala Phe Asn Ile Met Glu Ile Gin Pro Phe Arg Arg Ala Ala Ala 450 455 460 Ile Gin Thr Met Ser Leu Asp Ala Glu Arg Arg Lys Leu Tyr Val Ser 465 470 475 480 Ser Gin Trp Glu Val Ser Gin Val Pro Leu Asp Leu Cys Glu Val Tyr 4 S 5 490 495 o ι y Gly Gly Cys H i £ r* *1 , . u'; V Cys Lw u Met Ser Arg Asp Pro Tvr /“·. . ~ Civ 500 505 510 Tru Asp Gin Gly Arg Cys Ile Ser I ] e Tyr Ser Ser Glu Arg Ser Val 515 520 525 Leu Gin Ser Ile A. £ n Pro Ai a Glu Pro Kis Lys Glu Cys Pro Asn Pro 530 53 5 540 Lve Pro Asp Lys hafl Pro Leu Gin T ·. / c, Val Ser ř-Y-» O. Asn Ser 54 5 330 5 55 560 M JT Cj i v r Tyr Leu Se ί Cys Pro Met Glu Ser Arg Hi s Ala Thr Tyr Ser ο e 5 5-0 57 5 Trp Arg His Lys Glu Asn \ ci 4 n ! 1 1 Γ' T- u: _i - * Ser Cys Glu Pro Gly His Gin 560 585 590 Ser Pro Asn Cys ' ^ £. Leu Phe Ile o ^ Li Leu Th. r Ala Gin Gin Tyr 5 95 6 í! 0 6 05 Gly His Tyr Phe i'"'V ^ Glu 1—1. ^ ci Gin Glu Gi v Ser Tvr Phe Arg C-lu f\ \ Cí ci o C ΐ ΐ. 62 C* -94- -94- • * ψ 9 9 9 9 *9 9 9 9 9 9 9 9 9 9 9 9 · · · · · 9 9 9 9 ·»« · · 9 9 9 9 9 9 99 99 ·♦ · ·
Gln His Trp Gin Leu Leu Pro Glu Asp Gly Ile Met Ala Glu His Leu 625 630 535 640
Leu Gly His Ala Cys Ala Leu Ala Ala Ser Leu Trp Leu Gly Val Leu 645 650 655
Pro Thr Leu Thr Leu Gly Leu Leu Val His 660 665 FORMACE O SEKVENCI ID. C.: 4: (i) CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 394 aminokyselin (B) TYP: aminokyselina (C) POČET VLÁKEN: dvě (D) TOPOLOGIE: lineární (ii! TYP MOLEKULY: protein
Ji:·;) CHARAKTERISTICKÉ RYSY: (A) JMÉNO/KLÍČ: protein (B) UMÍSTĚNÍ:! až 391
Ui) POPTS SEKVENCE ID.Č: 4:
Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala 1 5 i 0 '5
Arg Val Leu Ser Leu Pro Ala Arg Phe Gly Leu Pro Leu Arg Leu Arg 20 25 30
Leu Leu Leu Val Phe Trp Val Ala Ala Ala Ser Ala Gin Gly His Ser 35 40 45
Arg Ser Gly Pro Arg Ile Ser Ala Val Trp Lys Gly Gin Α.ερ His Val Ό0 55 60
Asp Phe Ser Gin Pro Glu Pro His Thr Val Leu Phe His Glu Pro Gly 6 5 7 0 7 5 5 0
Ser Phe Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr His Phe Asr. 8 5 90 S 5
Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn Ile Gly Ser 100 105 110
Thr Lys Gly Ser Cys Gin Asp Lys Gin Asp Cys Gly Asn Tyr Ile Thr 115 120 125
Leu Leu Glu Arg Arg Gly Asn Gly Leu Leu Val 130 135
Cys Gly Thr Asn Ala 1 i 0 * · • ? · * • * · * »·· · · » * * Μ **
Arg Lys Pro Ser Cys Trp Asn Leu Val Asn Asp Ser Val Val Met Ser 145 150 155 160 Leu Gly Glu Met Lys Gly Tyr Ala Pro Phe Ser Pro Asp Glu Asn Ser 165 170 175 Leu Val Leu Phe Glu Gly Asp Glu Val T>rr Ser Thr lle Arg Lys Gin 1Θ0 185 190 Glu Tyr A.sn Gly Lys lle Pro Arg Phe Arg Arg lle Arg Gly Glu Ser 195 200 205 Glu Leu Tyr Thr Ser Asp Thr Val Met Gin Asn Pro Gin Pne 1 le Lys 2 2 0 215 220 A.la Thr lle Vn 1 His Gin Asp Gin Ala Tyr Asp Asp Lys lle Tyr Tyr 2 2 5 2 3 D 235 240 pfte Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro Leu Asn 245 250 255 Val Ser Arg Val Ala Gin Leu Cys Arg Gly Asp Gin Gly Gly Glu Ser 260 265 270 Ser Leu. Ser val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met Leu Val 275 280 285 Cys Ser Asp l', a Ala Thr τ c: τ'. Arg Asn Phe Asn Arg Leu Gin Asp Val 2 90 295 300 Piie Leu Leu Pro Asp Pro Ser Gi v Gin Trp Arg Asp TV- -k Arg Val Tyr ", Q G 210 315 320 vj i v Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val Tyr Ser 3 2 5 330 335 Leu Gly Asp j, i £ Asd a v τ Val Phe Arg Thr Ser Ser Leu Lys Gly Tyr j> 4 0 j 4 5 350 His vet Gly ; ou Ser /usr Pro VhU C Pro Gly Met Cys Leu Pro Lys Lys i 5 5 36 0 365 Gin Pro I le y' 1 O rn P- v- Glu Thr Phe ό u n Val Al a Asp Ser His Pro Glu 2 7 0 U 7 c 360 V a 1 . a n-| f Arg v a i o 1 u Pro Met g :: y Pro 2 9 Ο -96 • * -96 • * • · »« · · • · · * · * • · m · · · INFORMACE O SEKVENCI ID. C.: 5: ; i) CHARA .KTE P.I ŠTIKA SEK VEN Ca,: (A) DÉLKA: 23 pa rú baží (B) TYP: nukieová ky seiin, (C) POČET VLAK EN: dv ě (D) TOPOLOGIE: I i nea :ni Ui ) TYP MOC EKULY: DNA cen Ο.Τ,Ο v a íix ) CHAPAKT ERISTICKÉ P. Ysy !A) JMÉNO/KLÍČ l e >:on (B) UMÍSTĚNÍ:: ά 2 •“i C í x i ) PCPT S S EKVENCE ID. Č: 5 *. ACT1 CACTAT A G GGCTCGAGC 0 GC 'CRKÁ CE 0 SDi rCCENCI ID. ř : c * - i CHARA KTE RI3TIRR sek VEN CE: (A) DÉLKA.: 2 0 Τ') i i- ^ ru L čl ZI (B) TY'?: nukle O V 6 kv seiin- (C) POČET VLÁK EN: -v ě i J) TG-J GROG’ E: li fitc. 1' Γ. I -ys MOL lKL: : jKA -er: o:r;á Vc. i -- i CHAE i- ERISTICKÉ R I G Y (A) JMENC/KLÍČ : e >1 on (E) UMÍSTĚNI:I či 2 C _ ; >: i } POPI S 5 EKVENCE ID. C AGO CGCACA .C G GTGCTTTTC ORMA CE 0 SEKVENCI (ID. - “ * ;; ) i VT.ru i ,K7 E ;,ISTI KA SEK VLK 2. E : !A) DÉLKA: CO pa r;: Z- či 0 Z. (B) TYP: r:ukífc C V ά ři y s el: n (C) POČET VLÁK F.K : d v & (0) TOPOLOGIE: I1 nea --- (li ) TYP MOL· EKULY: DNA QcT. orno V ci (1 X } CHAPAKT ERISTICKÉ R YSY í Ai JKLNO/ KTIC : <.- c n -97- • · f * · · * • I 411 ψ * *t * ·« ·«« ♦ · φ * φ « t » * * · * * ·· φ« φ « • Φ t Φ 1 « φ * 9 9 99 (Β) UMÍSTĚNÍ:! až 20 Kii POPIS SEKVENCE J.D.Č: Ί: SCACAGATGC GTTCTTGCCCNFORMÁCE O SEKVENCI ID. Č.: 8: íi! CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 20 párů baží •;b; TYP: nukieová kyselina ;C) POČET VLÁKEN: dvě (Di TOPOLOGIE: lineární (i i) TY? MOLEKULY: DNA genomová :ix) CHARAKTERISTICKÉ RYSY: (A) JMENC/KL1Č: exon ; 5) UMÍSTĚNI:1 až 20 ;;-:ii POPIS SEKVENCE ID.Č: 8: ACCATAGACC CTGGTGTCCCNFOFVÍACE O SEKVENCI ID. Č. : 9: 20 20 CHARAKTERISTIKA SEKVENCE: DEL.KA: 20 pa y, L.....: U DQLl : 5 - i ť I Π U f. _ C: O V či kyselí :c: POČET VLÁKEN: dvě ; p ; TOPOLOGIE: li neá rní TYP MOL EKULY: DNA genomová CleAPJVK? ERIST1CKÉ RYSY :a; JMÉNO/KLIČ: e y.on ( E ; UMÍSTĚNI:! až 2 0 POPIS SEKVENCE ID.Č: 9: -VGATGC TGCCACCAACSE O SEKVENCI ID. Č.: 10: 2 0 CKAAAKTERIŠTIKA SEKVENCE: •A) DÉLKA: 20 párů bázi (B) TYP: zukleová kyselina íC) POČET VLÁKEN: dvě ',DÍ TOPOLOGIE: lineární • · • · * • · Μ • * · * · * » · · · • · * Μ« f « * · ·· *· (ii) TY? MOLEKULY: DNA genomová (íx) CHARAKTERISTICKÉ RYSY: (A) JMÉNO/KLÍC : on (B) UMÍSTĚNÍ:! až 20
(xi) POPIS SEKVENCE ID.Č: 10: CCAGACCATG TCGCTGGATG ěK/ iCE 0 SEÍ 7LT ' 1 ~ T \ V Llve -i 1 J . c . : , í i ; CHAAAřlTE RI ŠTIKA SEÍA' ΈΝ CE: (A) DÉLKA: 20 pa ru bs { B ) TYP: na klec ^ vé kyše \ ; POČET V LAKEK': dvě (D) TOPOLOG IE: Ί , n e a r π TYP MOLEKULY: ONA aenonjsvá (A) JKENO/KLÍC: exon (E) UMÍSTĚNÍ:! až 20 (xi) POPIS SEKVENCE ID.C: :ac 1/ -1 EHAFAETEf SZKYEKTl: a; 11C. —: ÍY-y i ě / V B1' U bací ; p Ί TYF: nvkle:;va >:y e e i i n a C ; ^ V'e_. r T v llÍ i ! Čj \. TYP MOLEKULY: I'N. AC GAUTCA: r:akle: e· 20 POCí 7 « · f * * * **· • ···· · #»« · ··· • I I »·* · · * · ·· · · · ···· · · * ♦ ·· - 99- (ii) TYP MOLEKULY: DNA genomová fix) CHARAKTERISTICKÉ RYSY; (A) JKÉNO/KLIC: exon (B) UMÍSTĚNÍ:1 až 20 (xi) POPIS SEKVENCE ID.Č: 13: AGGTAGACCT TGCCACGTCC 20 INFORMACE O SEKVENCI ID. Č.: 14: { i ) C HA RAK T E RIS TIKA S E KVEN C E: (A) DÉLKA: 23 páru bázi 1B) TYP: nukleová kyselina (C) POČET VLÁKEN: dvě D) TOPOLOGIE: lineární ;.ii) TYP MOLEKULY: DNA gencrticva í i v ; CHARAKTERISTICKÉ RYSY: (A) JMÉNO/KLÍČ: exon (B) UMÍSTĚNÍ:! až 23 (xi) POPIS SEKVENCE ID.Č: 1 i: GAACTTCAAC AGGCTGCAAG ACG 2 2· INtuRKACE O SEKVENCI ID. C. : x b: (i) CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 20 páru baží (B) TYP: nukleová kyselina (C) POČET VLÁKEN: dvě (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: DNA ger.omové CHARAKTERISTICKÉ RYSY: (A) JMÉNO/KLÍČ: exon (B) UMÍSTĚNÍ:1 až 20 (xi) POPIS SEKVENCE ID.Č: 15 : ATGCTGAGCG GAGGAAGCTG 10 INFORMACI: O SEKVENCI ID. Č.: 16: !i i CHARAKTERISTIKA SEKVENCE: (A) LELKA: 2 0 párů ba zi
-100- (3) TYP: nukleová kyselina (C) POČET VLÁKEN: dvě (D) TOPOLOGIE: lineární (li) TYP MOLEKULY: DNA genomová (ix) CHARAKTERISTICKÉ RYSY: (A) JMÉNO/KLÍČ; exon
(B) UMÍSTĚNÍ:! až 20 (xi) POPIS SEKVENCE ID.Č: 16: CCGCC.ATACA CCTCACACAG rKaCE 0 SEKVENCI ID. Č. : 17: '1' CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 28 páru baží (3) TYP: nuklecvé kyselina (C) POČET VLÁKEN: dvě (D) TOPOLOGIE: lineární iii) TYP MOLEKULY: DNA genomová \ix: CHARAKTERI5TICKE RYSY: :A) JMÉNO/KLÍČ: exon
(E) UMÍSTĚNI:1 až 28 ;xi; POPIS SEKVENCE ID.Č: 17: OTGGAAGCTT TCTGTGGG7A TCGGCTGC SEKVENCI ID. Č . : 18 : .KTE? STI KA . SEKVENCE: (A i DEL ΚΛ: 2 5 pa; :0 bázi i 3) Τγο. ^ uklec va kyselí (C) POČET VLÁKEN: dvě {D) TOPOLOGIE: lineární i i) TYP MOLEKULY: DNA genomová í:U CHARAKTERISTICKÉ RYSY: (A) JMÉNO/KLÍČ: exon (3) UMÍSTĚNÍ:! až 25 1 “ « · » • · · « · · *
πί γγ ΠΓ) ^ Γη r* r* r* rri !-· r· m m ''m /—ITHT· r- y τ f~ i _ . čr 0./-. i I 'Jwi * w. ΰ i v . .NFORMACE 0 SEKVENCI 11-. C. ! i ) CHAPAKTERISTIKA SEKVENCÍ (A; Γ1 £- u L. LEA. : 50 Γ> č! IU D n _ j. < Γ 1 TV Γ* Γι lP t S V či kyselina i C i PO ČET vlak E’č : dve ;ia TO I 1 o Mí OGIE: i- neárni TYP MOL OKU LY * DMA gen omová CHARAKT ORI STI CKE R YS ; i A i JKEN O / KLIČ: e >; o n í 3; UMÍSTĚNÍ:I a i 50
KYS VLÁKEN; 50 S sT-j.—J- Ψ t * » -102-
(C) POČET VLÁKEN: dvě (D> TOPOLOGIE: lineární iii) TYP MOLEKULY: DNA geno.nová {xi) POPIS SEKVENCE ID.Č: 21: GGGAATACAC ACAGACGGCT GAGTAG ORXACE O SEKVENCI ID. C.: 22: (i) CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 22 párů baží ! E) TYP: nukleová kyselí í c) POČET VLÁKEN: dvě ! D) TOPOLOGIE: lineární TYP MOL EKULY: DNA genomová CHARAKT KRISTICKE RYSY: (A) JMÉNO/KLÍČ: exon (3) UMÍSTĚNÍ:! až 22
íxi^ POPIS SEKVENCE IL.Č: 22 .-.GL.-vAGTTCA GLCTGGTTAA GT ORMACE O SEKVENCI ID. Č.: 23: ;i) CHARAKTERISTIKA SEKVENCE: i A) DÉLKA: 21 páru ba:: i (B) TYP: nukleová kyselina (C) POČET VLÁKEN: dvě : D) TOPOLOGIE: lineární
Li) TYP MOLEKULY: DNA genemová (iy.J CHARAKTERISTICKÉ RYSY: (A.) JÍNĚNO/KLÍ Č: exon 13) UMÍSTĚNI:i až 21 (xi) POPIS SEKVENCE 1LLČ: 23;
TTATGAGTAT TTCTTCCAGG G -103 O SEKVENCI ID. Č.: 24: KAPA.KTERISTIKA SEKVENCE: (A) DÉLKA: 26 párů bázi (B) TYP: nukleová kyselina (C) POČET VLÁKEN: dvě ;D! TOPOLOGIE: lineární TYP MOLEKULY: DNA genomová CHARAKTER!STICKE RYSY: i A) JMENO/KLÍČ: exon (Bj UMÍSTĚNÍ:! až 26 POPIS SEKVENCE ID.Č: 24:
ÁATCC AGCCGAGCCA CACAAG O SEKVENCI ID. Č . : 25: KARAKTEÁIŠTIKA S SKVĚNCE: [A] DÉLKA: 25 párů bázi ÍB) TYP: nukleová kyselina • C) POČET VLÁKEN: dvě 'Λ Γ — u G _ n - _ i n ϋ r π i TY? MOLEKULY: ONA. genomová CHARAKTERISTICKÉ RYSY: (A) JMÉNO/KLÍČ: exon ÍB) UMÍSTĚNÍ;! až 25 POP]S SEKVENCE ID.Č: 25: mlWjC . I. U .A A.. .-O ”: .G i v O SEKVENCI ID. C.: 26: .KAPA. K T E ?. I STI PA SEKVENCE : ;Ai DÉLKA: 20 párů baží ;B) TYP: nukleová kyselina C) POČET VLÁKEN: dvě :D; TOPOLOGIE: lineární TYP' MOLEKULY: DNA aenomova ♦ * * * * · « · ··· * · · · *** · • i · * ·«·« · * ·· ·· Μ ·♦ ·· I iN 1 í i x ; CHAPAKT. DPT SOICKE P.YSY: (a; JMEN0/KOIČ: exon (xi) popis s; 1KVF.NCE 1D.Č: 26: CAGCGGAAGC C1 1CAACCGAG 20
X FCLaILAC£ Ο 5 Ξ,Κ LlNC i I L ; i) CriARAΚΊΈΓ -USTIKA SEivJENCE: DÉLKA: 23 para bázi í B > TYP: nukieová kyselina ÍC] POČET VLÁKEN: dvě : D TOPOLOGIE: lineární li; TYP MOLí JKULY: DNA aenomová • ; CHAAAKT: ' R1 S r· * C K Ξ ^νρν· { L ) [ 3) JMÉNO/KLIČ: exon UMÍSTĚNI:] A 23 í>:i ) POPIS SI CKVENCE 10.Č: Z": GGGATGACGC Cr "OCTCCGCC CGG 2 3
I·-’ k. i' . V ,·’ i ('; 7 V μ Τ'^Υ" ι ~ Γι ~ H :i) 2: AFAnTE. -OSULA LEE VENDE : TYP: rudecva vrv.r.r 0‘C pOLOGI £ : _ i n rr:: ' - % — 7_. A A Y ' ..· V ; _ ► ·- _ '••i* ; p i ok:DLEN::i d d -105- • «««
Φ» · ι · * · ·« I I » • · I · ·· · * ·« (A) DÉLKA: 25 pá rů bázi (B) TYP: nukleová kyselina (O POČET VLÁKEN: dvě (D) TOPOLOGIE: lineární (11) TYP MOLEKULY: DNA genomová íix) CHARAKTERISTICKÉ RYSY: (A) JKENO/KLÍČ: exon (B) UMÍSTĚNI:1 až 25 íxi) POPIS SEKVENCE ID.Č: 29: AAGCTTTTTG CGTCTTTTCG TCCGG 25 CÁMACE O SEKVENCI ID. C.: 30: V; CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 24 párů bázi 1 El TYP: nukleová kyselina (C) POČET VLÁKEN: dvě (D; TOPOLOGIE: lineární !ii; TYP MOLEKULY: DNA genomová '!>:) CHARAKTERISTICKÉ RYSY: (A.) JMÉNO/KLIČ : exon (3) UMÍSTĚNI:1 ďž 11
(xi! POPIS SEKVENCE ID.Č: 30: ATGGTGAGCA AGGGCGAGGA GCTG CRMACE O SEKVENCI ID. Č.: 31: (_i CHARAK?ERI5 TIKA SEKVENCE: (A) DÉLKY: 24 párů bani (B} TYP: nukleová kyselina (C) POČET VLÁKEN: dvě (D) TOPOLOGIE: lineární (li) TYP MOLEKULY: DNA genomová (ix) CHARAKTERISTICKÉ RYSY: (A) JMÉNO/KLIČ: exon ÍB) UMÍSTĚNI:1 až 24 -106- ,χΐί POPIS SEKVENCE ID.Č: 31: CTTGTACAGC TCGTCCATGC CGAG 24 NFORMACE O -SEKVENCI ID. C,: 32: (il- CHARAKTEP.I ŠTIKA SEKVENCE: (A) DÉLKA: 25 párů baží ;=·! TYP: nukleová kyselina ÍC) POČET VLÁKEN: dvě ΐ D) TOPOLOGIE: lineární :ii; TY'P MOLEKULY: DNA genomová fix) CHARAKTERI STICKÉ RYSY: 25
(A) JMÉNO/KLÍČ: exon (Ei UMÍSTĚNI:! až 25 lni) POPIS SEKVENCE ID.Č: 32: GGGTGGTGAG AC-TTCGTTGT CTGTC NFORMACE O SEKVENCI ID. C.: 33: ciuarakterištika sskvence: A: .:1.0..0: 15 páru bázi _ _ i : nu 1 e c va : y o o i n a ÍC.) POČET VLÁKEN: dvě í0) TOPOLOGIE: lineární ) TYF MOLEKULY: DNO. genomová SY: !.A] -.JMENO/KLÍC : eon UMÍSTĚNI:1 povíš ΟΑΟ,ι i J 'sjALj
SEKVENCE ID.C: 33: GTACGGAAGA CTCTG 25 • ♦ • « L· : • · · I « · « · • ···· · « «· · • # ♦ « · · · · · « • · · · · · ι · INFORMACE O SELEKCI ID. ř (i) CHARAKTERISTIKA SEKVENCE: A) JEIHA: 28 CG páru razi (B) TYP: nukieová kyzelina ÍC) POČET VLÁKEN: GVc (D) TOPOLOGIE; li neárni MOL EKULY: DNA gen omeva !i>:l CHARAKTERISTICKÉ RYSY;
•A) JMÉNC/KLÍČ: c.xor:
{B! ’JM τ c ^ r"r,‘ ^ . -i ·>· -1 * -h - · x a z :> ř- 5 6 Ui i POPIS SEKV ENCE ID.Č: 3 ^ : AGCGCCCAAT ACGC.AAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA TGCAGCTGGC so ACGACAC-GTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA CGCAATTAAT GTGAGTTAGC 120 TCACTCATTA GGCACCCCAG GCTTTACACT TTATGCTTCC GGCTCGTATG TTGTGTGGAA ISO TTGTGAGCGG ATAACAATTT CACACAGGAA ACAGCTATGA CCATGATTAC GCCAAGCTTC 240 ACGTGGACCA GCAAGCCAAG AGTGAGTGTG GOCAGCACCC CCAGCCAGAG GGAGGCAGCC 300 AGGGCACAGG CATGACCCAG CAGGTGCTCG G U C.*-, T O/-V J. \J C 'ΊΛ-ΤΙ/πη rpl f~\ r-* Γ* 0,u*w'w J L w CAGCAGCTGC 360 CAGTGCTC-AG CCTCGCGGAA GTAGGAGC^u TCCTG3GCCT T ,-Ι'ΓΤ G7GGCC3TAC 420 T-r* ''''Τ'Γ' r* r-i /-» -i .· TGAGGTTCTC Gyn. . ójAh^A-J'w ATGCAGTTGG <*ι ·*ί Ύι n-nn “! pyii^ uyl i v_ I i o ACCAGGTTCG 4 SO CAGCTCTGCT CCACGTTCTC CTTGTGGCGC CATGAGTAGG TGGCGTGGCG GGATTCCATG 540 600 GGGCAGCTCA GGTAGTAGCG AGAGTTTGGG GCCAGGGAAA CCTTCTGCAG TGGGGCCTTG TTGCAGCACT .5 6 0 TCTGGTTTGG GOTTGOGAIA L. * u U - * U * - ^CIv J. v_ Ό -^5 * U v3.sT * AATuu A 72 0 GACCGTTCGG AGCTGTAGAT GGAGATGCAG CG3CCCTGGT CCCAGCCGCA GTAGGGGTCT 7 S 0 CG G C j AC AT G A Uj Ό U C C oj i o GCAGCCCCCG '-''--ACAGACCC CACACAu’^ i u CAGGSGlACv 84 0 TGGCTCACCT CCuACTGGGA GCTCACATAC UL. ...hOiCh 1 v- CAGCGACATO 03 CG AA.GCTG c>0 0 GTCTGGATGG CAGCCGCGCG G C G G AA G o 3 C TG 3ATC7CCA -ρ·-> r γτ-,,-,γ«Τι^ ř r I 0Jj“k i Ol - j. Ό ΛΑ 96° TGCTCCTGCT CCCCCGGTTC CACCACCTTG /--n /“S i « ΓΓι ^ 'Τ' ^ p ΑόΤ - AGG -TTTC7GGTAg l02° AGCACATGAA AGGTC7CCCC G J GG CTvjG j 'T m.-,-,ΛΛηΤ - O ^ r. J ^7 O -J - ό Α.*λ CGoC^rtC lC9° i oGT.ň ί ιΊΤAG AGTGGAAC7-A. j oj„G, i. * · /~, G A. p G ™ C C C A> I3G3CTCCAC CCTCT3C3'-’" 114 ^ ACCTCTGGGT GACGGTCAGC G A GGTGjAA^ GTCTCT3T3G Ο - ΛΛ 1 7 Ο VJ ·, TG CTGGTCTGGG -108- · · 4 · · 4 4«·· • ··# 4 444 · « ft 4 #4 ··· 4# #· *44« 4 444* 4444 4*4
AGGCACTTGC CAGGCCGCGG GTTGGGAAGG CTTGAGTGGT AGCCCTTGAG TGAGGAGGTA 1200 CGGAAGACCT TGTCAATGTC ACCGAGGGAA TACACACAGA CGGCTGAGTA GTTCCAGGGG 1260 TTGGAGAAAA CACCATAGAC CCTGGTGTCC CTCCACTGGC CGCTGGGGTC AGGGAGCAGG 1320 AAGACGTCTT GCAGCCTGTT GAAGTTCTTG TTGGTGGCAG CATCACTGCA TACCAGCATG 1380 GCTTTCAGAA AAGTGTTCCA CTTGGAGACT GACAGTGAAC rp l-p rp-> CTGGTCCCCC 14-30 CTGCACAACT GGGCCACACG GGACACATTG AGAGGAGCCT CAGGATTCTT GTCAGGATTG 1500 TCCTCTCGGA AGAAGTAGTA GATCTTGTCA TCGTAAGCCT GGTCTTGGTG CACGATGGTG 1560 GCTTTGATGA ACTGTGGGTT CTGCATGACA GTATCACTGG TGTACAGCTC ACTCTCGCCC 1620 CGGATGCGGC GGAACCGAGG GATCTTCCCA TTGTATTCCT GCTTCCGGAT GGTGGAATAC 16 80 ACCTCGTCCC CTTCAAACAG AACCAGGGAG TTCTCGTCCG GGCTGAAGGG ggcgtagcct 1740 CTCATCTCGC CAAGTGGCAC CACAGTGCCA TTCACCAGGT TCCAGCAGCT ggggtgccgg 1600 GCGTTGGTGC CACAGGCCAG CAGCCCCTCA CTCCGCCTCT ccaggagagt gatgtagttc 1660 TCGCAGTCCC GCTTATCCAG ACAGGACCCC Titgtggagc CGATATTCAC CGTGCGCACA 1 £2 0 GATGCGTTCT TGCCCTCGGG GAAGTCAAAG AGGTAGACCT TGCCACGTCC TCCCACCCAC 1960 ACAGAGGAGC TGCCTGGCTC o l Mol. ACCGTGTGCG Λ*. *, inrn -^rn''' Gli \_rtO i L GCGAAAíj iil 2 04 0 ACCCGGTCCT GCCCTACATG GCCTTTCCAG ACGGCGAAGA . o ’:w Gj JVJ Λ u gctccttasg 2.00 TGGCCCTGGG CGGAGGCGGC GGCCGCCCAG AGCAGCAGCA GCAGCCGCAG rcGCAGCGGA 216 0 AGCCCCAACC GAGCCGGCGG GCCAGGGACG CGGGCGCGCG GTGCGCTGGG ggcggcacgt 2220 CCGGGCGGAG GAGGCGTCAT CCCAAGCCGA ATTCTGCAGA TATCCATCAC -1-.--1 ηΠΛηρρ ^ ^ ^ 2260 GCTCGAGCAT GCATCTAGAG GGCCCAATTC GCCCTATAGT i^> v, rr\ r Τ''Τ’ i GCll Ai ACAATTCACT 2340 GGCCGTCGTT TTACAACGTC GTGACrGGGA --AACCCCGG C ΓΖΤ'ΤΕ,Γ'^' ^ 2 4 C 0 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCG AA. GAGGCCCGCn Γ1 C 3 Λ T C 3 C C C 2460 TTCCCAACAG TTGCGCAGCC TGAATGGCGA atgggacgcg CCCTGTAGCG GC3CA3TAAG 1520 cgcggcgggt GTGGTGGTTA CGCGCAGCGT GACCGCTACA CTTGCCAGCG 1S80 CGCTCCTTTC GCTTTCTTCC CTTCCTTTCT CGCCACG7TC GCCGGCTTTC CCCGTCAAGC 2 64 0 TCTA/iATCGG GGGCTCCCTT TAGGGTTCCG AT i iAGAGCT TTACGGCACC pcgagcgcaa rco AAAACTTG A T i 1'GGGTuATG GTTCA CG T Α(.ΐ i C/nTCG CCCTGATAGA --.'T-TTTTCO 2 7 6 0
CCCTTTGACG TTGGAGTCCA CGTTCTTTAA ACTCAACCCT ATCGCGGTCT ATTCTTTTGA TTGC-TTAAAA AATGAGCTGA TTTAACAAAT AACACGTAGA AAGCCAGTCC GCAGAAACGG GCTATCTGGA CAAGGGAAAA CGCAAGCGCA ACATGGCGAT AGCTAGACTG GGCGGTTTTA GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC CCAAGGATCT GATGGCGCAG GGGATCAAGA CGCATGATTG AACAAGATGG ATTGCACGCA TTCGGCTATG ACTGGGCACA ACAGACAATC TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC CTGCAGGACG AGGCAGCGCG GCTATCGTGG GTGCTCGACG TTGTCACTGA AGCGGGAAGG GAGGATCTCC TGTCATCTCG CCTTGCTCCT ATGGGGCGGC TGCATACGCT TGATCCGGCT CGZATCGAGC GAGCACGTAC TCGGATGGAA GAAGAGCATC aggggctcgc GCCAGCCGAA gacggcgagg atctcgtcgt gatccatggc aatggcggct tttctggatt caacgactgt GACATAGCGT 7GGATACCCG TGATATTGCT TTGGTGG7GC 7TTACGGTAT CGCCGCTCCC CTTGACGAC-T TCTTCTGAAT TGAAAAAGGA CCCT7A7TCC CTTTTTTGCG GCATTTTGCC 7'3íJiAG7 AAA AGATGCTGAA GATCAGTTGG 7CAACAGCGG TAAGATCCTT GAGAGTTTTC CT7TTAAAGT TCTGCTATGT CATACACTAT 7730TCGGCG GGCGCGGTAT TCTCAGAATG A3CA7CTTAC GGA7GGCATG ACAGTAAGAG , · v · t * · · f t t * l ··· » · * · · ·· • t · «·· · · ♦ ♦ ··♦* * *·*« ·*·· ··* -109-
TAGTGGACTC TTGTTCCAAA CTGGAACAAC TTTATAAGGG ATTTTGCCGA TTTCGGCCTA TCAGGGCGCA AGGGCTGCTA AAGGAACCGG TGCTGACCCC GGATGAATGT CAGCTACTGG AAGAGAAAGC AGGTAGCTTG CAGTGGGCTT TGGACAGCAA GCGAACCGGA ATTGCCAGCT TGCAAAGTAA ACTGGATGGC TTTCTTGCCG TCTGATCAAG AGACAGGATG AGGATCGTTT GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA GGCTGCTCTG ATGCCGCCGT GTTCCGGCTG AAGACCGACC TGTCCGGTGC CCTGAATGAA CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GACTGGCTGC TATTGGGCGA AGTGCCGGGG GCCGAGAAAG TA7CCATCAT GGCTGATGCA ACCTGCCCAT TCGACCACCA AGCGAAACAT GCCGGTCTTG TCGATCAGGA TGATCTGGAC CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GATGCCTGCT TGCCGAATAT CATGGTGGAA GGCCGGCTGG GTGTGGCGGA CCGCTATCAG GAAGAGCTTG GCGGCGAATG GGCTGACCGC GATTCGCAGC GCATCGCCTT CTATCGCCTT AGAGTATGAG TATTCAACAT TTCCGTGTCG TTCCTGTTTT TGCTCACCCA GAAACGCTGG GTGCACGAGT CGGTTACATC GAACTGGATC GCCCCGAAGA ACGTTTTCCA ATGATGAGCA TAXCCCGTAT TGACGCCGGG CAAGAGCAAC ACTTGGTTGA GTACTCACCA GTCACAGAAA AATTATGCAG TGCTGCCATA ACCATGAGTG 2820 2880 2940 2000 3060 3120 3160 3240 3300 3360 3420 3460 3 54 0 3600 3660 372 0 378 0 3840 3900 3960 4 02 0 4080 4 14 0 4200 4260 4320 4380 4 4 4 0
t · t · * v w • · · · • * · • « · • M · · · * • · ·· »t* * · • f · « · · M ·· *· ** ATAACACTGC GGCCAACTTA ^ i iC :GA^An «ταγί * LGuAG^j AL._.GAAGGAu T AAC C G T i 1 T Λ o T ^ v u TTTTGCACAA CATGGGGGAT C ATGTAACTC GCCTTGATGG Γ T G G GAACCG GAGCTGAATG 4560 AAGCCATACC AAACCACGAG AGTGACACCA wTy * AfoCAA*i_jCCA A^AAuuT -GC 4620 GCAAACTATT AACTGGCGAA CTACTTACTC TAGCT7CCCG G C AA GAATTA AT AG ACTGG A 4 6 8 0 TC-GAGGCGGA TAAAGTTGCA GGACCACTTC TGCGCTCGGC r— rrr m ^ i"τ /— γ·ί .“'ΟΓ-' Π* z'"' ^ '"Η Γ—r-r> > ί_ ' . i - ^lUL. lL-UI u 4 7 4 0 TTGCTGATAA ATCTGGAGCC oG a GAGCo j. G jCj .. uCGCG'·- T.A-CAOTGOA _’GACTGGGG'- 4 3 0 0 CAGATGGTAA GCCCTCCCGT ATCGTAGTTA I·'· Λ :- O Λ z-t i i, .-'.G.tgGatL :_;\_-Gí.jAGGACj AAACTA - Gvj 4 8 6 0 ATGAACG AAA TAGACAGATC GCTGAGATAG GTGCCTCACT GAT TAAGCAT TGGTAACTGT 4 2 2 0 CAGACCAAGT TTACTCATAT ATACTTTAGA i "imrpl *t > L - JAi, v t γΛ-Τ\ΑΛ ACTTCATTTT TAATTTAAAA 4230 GGATCTAC-GT GAAGATCCTT TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT 5 0 4 0 CGTTCCACTC- AGCGTCAGAC CCCGTAGAAA AG AT C AAACG ATCTTCTTGA GATCCTTTTT 5 20 0 TTCTGCGCGT AA.rCTGCTGC TTOCAAACAA AAAAA L G Al T ,;-jGG ACC.-.wCG G -GgTT i. 0 . ~ ~ ' Λ TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC TGGCTGCA.l-C AvjAGCG1—Α'ογλ. 5 2 2 0 TACCAAATAC TGTCCTTCTA GTGTAGCCGT AGTTAGGGCA CCACTTCAAG AACTCTGTAG 5230 CACCGCCTAC ATACCTCGCT CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA 5 34 0 n T' r' CV’* τ» L i sJ GACTCAAGAC íj ata^jTT al c GuA_AAgGGu LAGCGGTCGA 5400 GCTGAACGGG GGGTTCC-TGC A C A C AC C C C A GCTTGGAGCG AACGACCTAC ACCGAACTGA Z 4 Z 'J GATACCTACA GCGTGAGCAT TGAGAAAGCG CCACGCTTCC CGAAGGGAGA AAGGCGGACA Z Z J J GGTATCCGGT AAGCGOCAGG Λ * Γ1 Λ ,'*1 'jí GAGAGCOCAC GAGGGAvjCTT CCAGGGGGAA 5 5 3 0 ACGCCTGGTA TCTTTA7AGT i. G i a-GA.jT CTGACTTGAC- CGTCGATTTT 554 0 TGTC-ATGCTC GTCAGGGGGG CGGAGCCTAT G G AAArA-^C G L CAGCAACTCG GCCTTTTTAC 5 7 0 0 GoO TCuG GGC CTTTTGCTGG CCTTTTGCTG ACATGTTCTT TCCTGCGTTA TCCCCTGATT 57 60 CTGTGGATAA CCC-TATTACC GCCTTTGAGT GAGCTGATAC C A G T G G C C G C A vj G G G AA C G A 5320 CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG CGGAAG 515 6 .Cli, \j SE V* ΓΤ-* \ -y A 'Z i IU. i. C ΗΛΡΛ .KTiRISTAO ^ 2, Λ [A; DÉLKA: 747 5 {3 j TYP: m ukieov. · »·· * * * ·
• T’p £ ' " 7G' " " ‘ ~· ^ \11 ' HAAAKT Z?· 13™ ^ * " G 1 3VZ'l C ; 771 7 ; e:·:·: r. ·£ UM-7 -ŤV - . ^ - _t - : ; v ; : PCťll 3EXV7'< "·· :: ;; '5:: C \ nr^ry \ 'sjAv^vjVjrv *. '-•.JO ,-"' λ y“i -y f-* γ-ί «-Τ ,-i GATCCCCTAT .-1 r-m,/-i :·ν Λ ,-i.v ·“* H"1 JVJ L ^ i CAGTACAATC TGCTCTGATG 60 CCGuA *. A^· - T -\p. G ^ ^ A1"' T ' ^ l- . k 7 \_-w i. U v. iTGTG : bT r GGAGGTCGCT GAGT.AGTGCG 120 CGAGCAAAAT TTAAGC7 ALA η C \ A ί-1 ^ í™' * ^ „**. 7 Λη Lj vj g_ ,ηλ gj GC7TGACCGA CAATTGCATG AAGAATCTGC 180 TTAGGGTTAG ^ p^rnmmA ,*-» ^ ULw j. ί λ. Λ«^ΛΛ'ΊΙ,Γ'^Γ,^ί'Τ A 4. * OsJLgj ATGTACGGGC CAGATATACG CGTTGACATT 240 GATTATTGAC TAGTT YT'1'~ Λ -Π n -irp H * .“aVj ; .-v. * w ΛΛ iTALGGoGTC ATTAGTTCAT AGCCCATATA 300 TGuAu * κ Ά—'„j CGTTACA7AA C77ACGG7AA ATGGCCCGCC TGG CTGACGG GC CAACGAC C 7 6 0 CCCGCCCATT r· -l -> *»λ i. _.. Λ ACGACGTATG TTCCCATAGT AA.CGC7.A.-Ll Λ '-jOíjACT _7CC 420 ATTGACGTCA ATGGGTGGAC TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 4 80 ATCATATGCC AAGTACGCCC ,-^^ι-ρ Λ τ^-ηλ” λ w ^ ί\ i L 'jAgo TCAATGACGG i m^VA - ^ v. ^ ^ * Uvj ^ Ai t 5 4 0 ATGCCCAGTA CATGACCTTA 7 wGwA’_. *7 i ;w7A^77uG7A GTACATCTAC GTATTAGTCA 600 TCGCTATTAC CATGG7GATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA TAGCGGTTTG 6 6 0 ACTCACGGGC- ATTTCCAAGT CTCCACCCCA TTGACGTCAA TGGGAC-TTTG TTTCGGCACC 720 AAAATCAACG Γ" t"" ι'^'τιΤ'ΠίΓΐΓ' *, 'junv- 1 i i Λ ·\ λ τ' τ τ π-' λ rtArt lU.L^in ACAA.C7CCGC CCCATTGACG CAAATGGGCG 780 lGT ACGGTGGGAG GTCTA7.n xAA uCAGAGCTGT CTGGCTAACT AGAGA^CCCA 840 CTGCTTAGTG :wC , . A ^ CCAA ATTAA7ACGA 7 7 C A C Τ' A 7 A 7 jL-ť v7Αί_ _.A7 oC *GvjCT AO 900 ϋΤΠ AAA7G0 077 7 - lw - C jrGj L'7v_-C CGCCACTGTG CTGCATATC7 GCAGAA.TTC7 96 0 GCiTGGGATG ACGC C 7 C CT '7 _:G_ >·_'.j* Γ G C C G G G C C C AGCGCACCGC GCGCCCGCGT 1020 CCCTGGCCCG CCGGCTCGGT 1 o'7 7 '_ i 7 7 7 GC7GCGGCTG CGGCTGCTGC TGCTGCTCTG 1080 GGCGGCCGCC GCCTCGGCCC A7 7Ά7 -tg.-. 77 A1'^ rt. CCCCGCATCT TCGCCGTCTG 114 0 G AAAGG C C AT GGAGGGCAGG A7 r'7GG7GGA .-imfl·'"','! ,~y -· ^ -v ·- t i ·. ·- ACTGAGCCGC ACACGGTGCT 1200 I J. 1 č r\ CJ ,Άι._7 C C Ai 7 7 7 A 7 C 7' cctccjgggg 7-G 7 G G G AG G A J-j -7'^ rACCTCTT1 12 60 « «
TGAzrrcccc oA^GGCAAíjA ACGCATCTGT GCGCACGGTG AATATCGGCT CCACAAAGGG 1320 GTCCTGTCTG GATAAGCGGG ACTGCGAGAA CTACATCACT CTCCTGGAGA GGCGGAGTGA 1380 ΤΓΖ * 'J'- * *w GCCTGTGGCA CCAACGCCCG GCACCCCAGC TGCTGGAACC TGGTGAATGG 14 4 0 cactgtcgtg CCACTTGGCG AGATGAGAGG CTACGCCCCC TTCAGCCCGG ACGAGAACTC 1500 CCTGGTTCTG i. .. i GAAGGGG ACGAGGTGTA TTCCACCATC CGGAAGCAGG AATACAATGG 1560 O-rvTiU-n. * '--l CGGTTCCGCC GCATCCGGGG CGAGAGTGAG CTGTACACCA GTGATACTGT 1620 CA'1VJ C AC AAC ccagagttca tcaaagccac CATCGTGCAC caagaccagg CTTACGATGA 1680 ,-. ·, i Λ '_.AAU·. - » “-V, TACTTCTTCC GAGAGGACAA TCCTGACAAG AATCCTGAGG CTCCTCTCAA 1740 TGTCTCCCGT GTGGCCCAGT TGTGCACGGG GGACCAGGGT GGGGAAAGTT CACTGTCAGT 1800 CTCCAAGTGG AACACTTTTC TGAAAGCCAT GCTGGTATGC AGTGATGCTG CCACCAACAA 1860 CAACTTCAAC AGGCTGCAAG ACGTCTTCCT GCTCCCTGAC CCCAGCGGCC AGTGGAGGGA 1920 lAuCAouu - - TATGGTGTTT TCTCCAACCC CTGGAACTAC TCAGCCGTCT GTGTGTATTC 1980 CCTCGGTGAC ATTGACAAGG TCTTCCGTAC CTCCTCACTC AAGGGCTACC ACTCAAGCCT 2040 TCCCAACCCG CGGCCTGGCA AGTGCCTCCC AGACCAGCAG CCGATACCCA CAGAGACCTT 2100 CCAGGTGC-CT C-ACCGTCACC CAC-AGGTGGC ijCAGAGGGTG GAGCCCATGG GGCCTCTGAA 2160 GACGCCATTG AATACCACTA CCAGAAAGTG GCCGTTCACC GCATGCAAGC 2220 CAGCCACGGG gAgACCTTTC ^ rp £ ryi rp m ^ CCTAACTACA GACAC-GGGCA CTATCCÁCAA 2 2 80 GQri GGGG^í-ua CCGGC-GGAGC AGGAGCACAG CTTCGCCTTC AACATCATGG AGATCCAGCC 2340 CTTCCGCCGC C-CGGCTGCCA TCCAGACCAT GTCGCTGGAT GCTGAGCGGA GGAAGCTGTA 2400 TGTC-AGCTCG CAGTGGGAGG TC-AGCCAGGT GCCCCTGGAC CTGTGTGAGG TCTATGGCGG 2460 uuut .G>-v-Ai_ GGTTGCCTCA ^GTCCCGAGA CCCCTACTGC GGCTGGGACC AGGGCCGCTG 2520 CATCTCCATC TACAGCTCCG AACGGTCAGT GCTGCAATCC ATTAATCCAG CCGAGCCACA 2580 CAAGGAGT-^T CCCAACCCCA AACCAGACAA GGCCCCACTG CAGAAGGTTT CCCTGGCCCC 2640 AAACTCTCGC TACTACCTGA GCTGCCCCAT GGAATCCCGC CACGCCACCT ACTCATGGCG 2700 C G Al r*-A (jijHU AACGTCGAGC AGAGCTGCGA ACCTGGTCAC CAGAGCCCCA ACTGCATCCT 2760 GTTCATCGAG .viCC iLACGG CGCAGCAGTA CGGCCACTAC TTCTGCGAGG CCCAGGAGGG 2820 CTCCTACTTC CGCGAGGCTC AGCACTGGCA GCTGCTGCCC CAGGACGGCA TCATGGCCGA 2880 ί ,γιλγ'/·’ λγnr-» Ό1^- Λν, ^ i. ^ CGTCATGCCT GTGCCCTGGC TGCCTCCCTC TGGCTGGGGG TGCTGCCCAC 2940 1 t ř—1 LO « « »·« « « · * * * · · * %» M » · ·· · · * 1 · · · ··· • · » · · tl ·· »· • * • * • · • » ACTCACTCTT GGCTTGCTGG TCCACGTGAA GCTTGGGCCC gaacaaaaac i CA7CTCAGA 3 0 00 AGAGGATCTG AATAGCGCCG TCGACCATCA TCATCATCAT cattgagttt aaaccgctga 3 C 6 0 TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG TTTGCCCCTC CCCCGTGCCT "3 i "i ι-ί TCCTTGACCC TGGAAGGTGC CACTCCCACT GTCCTTTCCT AATAAAATGA GGAAATTGCA 313 0 TCGCATTGTC TGAGTAGGTG TCATTCTATT CTGGGGCGTG GGGTGGGGCA v O-.A-T Ά2 3240 GGGGAGGATT GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGGTC TATGGCT7CT ~ ", Λ .·*! J V υ 'v GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG * AGCGGCGGA 3 3 5 0 TTAAC-CGCGG CGC-GTGTGGT GGTTACGCGC AGCGTGACCG CTACACTTGC CAGCC-CCCTA 3 4 2 0 GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT 3430 CAAGCTCTAA ATCGGGGCAT CCCTTTAGGG TTCCGATTTA GTGCTTTACC GCACCTCGAC 3 54 0 CCCAAAAAA.C TTGATTAGGG TGATGGTTCA CGTAGTGC-GC CATCGCCCTG ATAGACGG7T 3 600 φΙΓίΓπρη^η^π-Γ-ι - * TGACGTTGGA GTCCACGTTC TTTAATAGTG jrtL ÍlL i 1'vj i i CCAAACTGGA 3 5 6 0 «CAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT AAGGGATTTT kjGGGATTTCG 3720 GCCTATTGGT TAAAAAATGA GCTGATTTAA CAAAAATTTA ACGCGAATTA ATTCTGTGGA 3780 ATGTGTGTCA GTTAGGGTGT GGAAAGTCCC CAGGCTCCCC AGGCAGC-CAG AAGTATGCAA 3 840 AGCATGCATC TCAATTAGTC AC-CAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCAC-GC 3 SG 0 AGAAGTATGC AAAGCATGCA TCTCAATTAG T C AG C AACCA TAGTCCCGCC CCTAACTCCG 3 960 CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC CGCCCCATGG CTGACTAATT 4020 TTTTTTA’1"7’" ATGCAGAC-GC CGAGGCCGCC TCTGCCTCTG AGCTATTCCA GAAGTAGTGA 4 0 SQ GC-AGGCTTTT TTC-GAGGCCT AGGCTTTTGC AAAAAGCTCC CGGGAGCTTG TATATCCATT 4 14 0 TTCGGATCTG ATCAAGAGAC AGGATGAGGA TGA7TGAACA AvjAtgcattg 4 2 U 0 v-rtCGCAGGTT CTCCGlCCGC TIGGGTGGAG AGGCTATTCG GCTATGACTG l L C AC AA C AG 4 2 6 0 ACAATCGGCT GCTCTGATGC CGCCGTGTTC CGGCTGTCAG CGCAGGGGCG CCCGGTTCTT 4320 TTTGTCAAGA CCGACCTGTC CGGTGCCCTG AATGAACTGC AbGACGAGGC AGCGCGGCTA 4330 TCGTGGCTGG CCACGACGGG CGTTCCTTGC GCAGCTGTGC TCGACGTTGT laCTGAAGCl 4 4 4 0 GGAAGCJGACT GGCTGCTATT GGGCGAAGTG CCGGGGCAGG ATCTCCTGTC ATCTCACCTT 4 5 0 0 CCTCCTGCCG ACAAAGTATC l ^ i L ΛIL G C Γ GATGCAATGC GGCGGCTGCA TACGCTTGA7 4 4 6 0 ’ 1 _ * · * ·· * **· · · • « · » « · * * * * ·· · » t · · * * · * * « t • * • » CCGGCTACCT GCCCAi i CGA n ·_ _ λ'.λλj AAACAGGGCA ^ ^ — — 4ó:: ATGGAAGCCG GTCTTGTCGA i CACGA j. wjA í AGCATCAGGG -jv_ „ 7GCGCCA 4 b 3 0 GCCGAACTGT TCGCCAGGCT CAALtGCGCuC ATGCCCGACG -.^CgAuGA l. ·._-._^TCG ^G.-ikCC 4 7 4 0 CATGGCGATG CCTGCTTGCC GAATATCATG '-i - GGAAAA í, ‘j GCCGCTTTTC TGGATTCATC 4 3 0 0 GACTGTGGCC GGCTGGGTGT GGCGGACCCC TATCAGGACA TAGCG77GGC TACCCGTGAT 4 3 6 0 ATTGCTGAAG AGCTTGGCGG CGAATGGGCT GACCGCTTCC TCGTGCTTTA GGGTATCGCC 4 12 j GCTCCCGATT CGCAGCGCAT CGCCTTCTAT C G C '*' t·"" ' ^ ^r; ACGA,gj , .C._ -^TGAajGCjGGA 4 9 8 0 CTCTGGGGTT CGAAATGACC GACCAAGCGA GGCCCAACCT •GCGATCACGA sjACT l CG ATT b '.j 4 0 CCACCGCCGC CTTCTATGAA AGGTTGGGCT TCGGAATCGT TTTCCGGGAC GCGGGCTGGA 5 10 0 TGATCCTCCA GCGCGGGGAT CTCATC-CTGG AGTTCTTCGC CCACCCCAAC TTGT7TATTG 5190 CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA TTTCACAAAT AAAGCATTTT 5220 TTTCACTGCA TTCTAGTTGT GGTTTGTCCA .JA LTCATC AA TGTAGCTTAT CATGTCTGTA 5 2 3 0 TACCGTCGAC CTCTAGCTAG AGCTTGGCGT AATCATGGTC ATAGCTGTTT CCTGTGTGAA 6 3 4 0 ATTGTTATCC GCTCACAATT CCACACAACA Τ' Λ ^ r"1 ·“11 j. ^'·_ Ό AA G CAT\ λ A A G TGT AAAG CCT 5 -i 0 0 GGGGTGCCTA ATGAGTGAGC TAACTCACAT "τί Λ ιΤ'πι 1 Γ~Τ^ ΤΤ -Artt 4.vrL'vj i * ^ T i·-’ Λ ^ Π fT / 1 i } i rn m /"t ,—1 i. :—·^ L Ό ·ν- i. 1, i.1—',. 5 4 6 0 AGTCGGGAAA CCTGTCGTGC cagctgcat? ATCGG CC AALGCGG --v;gj.4.G AjjájLG 5 52 0 GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT CGCTCACTGA i—’ 'n /—i r“> r·*’ m /—r i-τι Γί-^Γ^ m/~< r^fJ^r^-1 L i- - 'jGGG L i, 5530 GGCTGCGGCG AGCGGTATCA GCTCACTC.AA AuGCGG^ AAT ACGGTTA7CC ACAGAATCAG 6 b 4 0 GCjGA j. AACGl AGGAAAGAAC A * G7 CJAGlAA AA '-j G C C A G C A jtiAAGG'^ AGG AíAl C1^ l í^AlAA. 5700 AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT CACAAAAATC 5780 GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA íťA.GA. * Al,CAG '.jCTT ^ . C'-LC 5 8 2 0 CTGGAAGCTC CCTCC-TGCGC TCTCCTGTTC CGACCCTGCC t _ .-i^ '·_7 - ^ ·_· 5 3 3 0 CCTTTCTCCC i i CGGGAAGC uTGuCGCTTT CTCAATGCTC ACGC7GTAGG TATCTCAGTT 5 9 4 0 CGGTGTAGGT CGTTCGCTCC AACCTGGCCT G IG j. GL.-vg/jí'. ACCCCCCG7T CAGCCCGACC 5 0 0 0 GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC GACTTA7CGC 6 0 6 0 CACTGGCAGC AGCCACTGGT AACAGGATTA i"· Λ ^ --1 1 ''•'“V' *·. '•J ^ .—V·—rřA. Jf GTArGTAGGC GGTGCTACAG 512 0 AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG GACAGTATT'7 GGTATCTGCG 5 i 3 0 CTCTGCTGAA GCCAGTTACC TTCGG AAA ΛΑ Ί n. ,-· TT.-"»A ^ i ,'JU - C. i íCC oGCAAA,^AAA, 62 4 0 TT7T7.GT77 ^-CAAGCAuCA • • « • GATTACGCGC • · · · » t·· * * * * * * * * • · * · * AGAAAAAAAG « · · * 1 • · · · 1 • · 6300 _jA „ C.. CA^au^. AGATCCTTTG ATCTTTTCTA CGGC-GTCTGA CGCTCAGTGG AACGAAAACT 6360 C A C G TT AAGG GATTTGGGTC A7 G AG A 7 T .AT CAAAAAGGAT CTTCACCTAG ATCCTTTTAA 6420 ΑΤΤΑΑΑΑΛ * G AACTTTTAAA TCAA7C7AAA GTATATATGA GTAAACTTGG TCTGACAGTT 64 B0 C - .v^G^^T *-ί-- TuAuTGAG GCACC7A7C7 CAGCGATCTG TCTATTTCGT TCATCCATAG 654 0 ,^ΓΠ CGCCGTCG7G TAGA7AACTA „ G a„ A.uuvjUA GGGCT7ACCA TCTGGCCCCA 6600 U , ..:7, . '„''u, .Afk l. yyp.^1 AC^G-GGA GACCCACGCT CACCGGC7CC AGATTTATCA GCAATAAACC 6660 Au C CAu C GGG AAuUC c c g ag u '-j u Au aAG T G GTCCTGCAAC TTTATCCGCC TCCATCCAGT 6720 CTATTAATTG í ^GCCGGGA^ GCTAGAGTAA GTAGTTCGCC AGTTAATAGT TTGCGCAACG 6780 ΓΤ'ΓΓ·’ 1^1 ΓΤΊ-Τ\ «, ΓΤΛ λ 1—1 v ÍUL^Al TGCTACAGGC A * CUTOU i.G7 CACGCTCG7C GTTTGGTATG GCTTCATTCA 6 84 0 GCTCCGGTTC CCAACGATCA AGGCGAGTTA CATGATCGCC CATGTTGTGC aaaaaagcgg 6900 TTAGCTCGTT C0G7CCTCCG ATCGTTGTCA uAAGTAAG-7 T UGCCGCAGi G TTATCACTCA 6960 TGGTGATGGC AGCACTCCAT AA7TCTCTTA CTGTCATGCC A7CCGTAAGA TGCTTTTCTG 7020 íoAuGUG LuA GTACTCAACC AAGTCATTCT GAGAATAGTG TATGCGGCGA CCGAGTTGCT 7030 ''ιΓπγ-^,ιρ^/π^ U L - 'jv-GG^llG GTCAATACGG GATAATACCG CGCCACA7AG CAGAACTTTA AAAGTGCTCA 7140 - U.-v_ í.UGa“lAA\ ACGTTCTTCG G G G C G A.AGA. C TCTCAAGGAT CT7ACCGCTG TTGAGATCCA 7200 GTTCGATGTA a ^rT.rr^m u GAuCCAACT GATCTTCAGC ATCTTTTACT TTCACCAGCG 7260 rp n~r - -Τ' ^ /·-; ^ r; í-.tj 7. Ai-GrS.U A UuAAGGCAAA ATGCCGC AAA AAAGGG AATA AGGGCGACAC 7320 GGAAAGGTTG .“V\ *. i\.__·„ A 1 A T Τ' C 7 T T pΤ''Τ’Τ 7TCAATATTA TTGAAGCAT? 7A7CAGGGTT 7380 Ai. .. U i C iCA'. G/aU U U u A Γ Au A7A7T7GAA7 GTATT7AGAA AAATAAACAA ATAGGGGTTC 7440 CGCGCACATT 1l a Λ GTGCCACCTG Λ .-1,-Tt-nr-· rt,U -j : 7475 . C . : 3 6 ; i i C TA ?S\ K'u R1 5 71 ?77 o U K VENCS: 92 carů bázi -·:: TU Uv _^u- - :!. ; ’· ’ 'Tli .· ; - ^y:; MCI"’*!,*! v ; TN'7 gecomcvá • * ♦ · * * * • * i · 4 t 9 «·* * * *· « · · · * · * * « · · · * M *· ·· • · * · • * · * • • · -116- ., 1 Λ ; charakter. ISTICKÉ RYS' (A) JMÉNO/KLÍČ: exon (B) UMÍSTĚNÍ:1 a: : 8192 xi i POPIS SEKVENCE ID.Č: 3 6: GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG 60 CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG 120 CGAGCAAAA7 TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC 13 0 TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTC-ACATT 240 GATTATTGAC TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 300 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG CCCAACGACC 360 CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC 420 ATTGACGTCA ATGGGTGGAC TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 480 Λ .-n^ > rn \ .-l , a. -n * s_* AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT 540 ATGCCCAGTA CATOACCTTA TGGC-ACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 600 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA TAGCGGTTTG 660 ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA iGGíjAGx i Tg TTTTGGCACC 720 AAAATCAACG GGACTTTCCA AAATGTCGTA Ai-AACTClGC CCCATTGACG CAAATGGGCG 730 GTAGGCGTGT ACGC-T GGGAG GTCTATATAA GCAGAGCTCT CTGGCTAACT AG AG AA C C C A 340 u i.Gu -í- *^ GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 900 .--irv«Ttr—i λ ^ Kj i. i ^ ,τΆη,'-ο'ϋ GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT GCAQAATTCG 960 i - ^"GCrTCCTC ulj^CluGACG TGCCGCCCCC AGCGCACCGC GCGCCCC-CGT 1020 CCCGGGCGGG CCGGCTCGGT TGGGGCTTCC GCTGCGGCTG CGGCTGCTGC TGCTGCTCTG 1080 COCGCCCGCC GCCTCCGCCC AGGGCCACCT AAGGAGCGGA CCCCGCATCT TCGCCGTCTG 114 Q G AAA G G C C A T GTAGGGCAGG ACCGGGTGGA CTTTGGCCAG ACTGAGCCGC ACACGGTGCT 1200 TTTCCACGAG CCAGGCAGCT CC rc_TCiTuTG CGTGGGAGGA CGTGGCAAGG TCTACCTCTT 1260 TGACTTCCCC GAGGGCAAGA ACGCATCTGT GCGCACGGTG AATATCGGCT CCACAAAGGG 1320 GTCCTGTCTG GATAAGCGGG ACTGCGAGΛΑ CTACATCACT CTCCTGGACA GGCGGAGTGA 1380 gggggtgctg G ,. L Γ0 CCAACGCCCG GCACCCCAGC TGCTGGAACC TGGTGAATGG 1440
• · l i; * · · · · *t * * ** * * • · · • 9 » · · 9 * • 9 • · CACTGTGGTG CCACTTGGCG agatoagacg ;:TACcrc"cr" GT G A'G G G C GG AC G A G ΑΛ C G G 1500 CCTGGTTCTG TTTGAAGGGG ACGAGGTGTA TTCCACCA7C G G AAc ·-· Αλ * A\, AA * νυ 15 6 0 GAAGATCCCT CGGTTCCGCC GCATCCGGGG i-vo íPcCC /aCj CGGGAGACGA GGGAGACGGT 1620 CATGCAGAAC CCACAGTTCA T C AAAG C GA.C catggtgcag , ·:Ά L;rk ·_ ^Λ w ^J v i. . ;A.C P, .. G Pí. 16 3 0 CAAGATCTAC TACTTCTTCC ^jAijAvjGACAA i. ·« ·_ i Λ.·λ ί *. ^ L.nrt 1740 TGTGTCCCGT GTC-GCCCAGT Λ ' r~* r* ·_: G AC C AG G G T ••jfV^O-^-A-rA.G - - -—A^TCjTCACr 130 0 CTCC.AAGTGG AACACTTTTC tgaaagcca: GCTGGTÁTGC AGTGAGGCGG CCACCAACAA 1350 GAACTTCAAC AGC-CTGCAAG acgtcttcct G C T C C C T G AG CCGAGCGGCG AGTGGAGGGA 192Q CACCAGGGTC TATGOTGTTT TCTCCAACCC CT G G A AC T AC TCA.Cí-CG ,C- GTG a CCA *c 19 30 CCTCGGTGAC ATTGACAAGG TCTTCCGTAC CTCCTCACTC AAuGGí-GAL·w ACTCAAGCC x 2040 TCCCAACCCG CGGCCTGGCA A^-TGCcTlCC AC-ACCAGCAG Λ Ti A ,-τ,-ί,τΊ c"· 1 1 {**» Λ p/-*rrv-p ^L-Ά - *-vCv-χ.,ί x.u.IjaUix^ .» l 210 0 CCAGGTGGCT q ^P^Q^p p CAGAGGTGGC GCAGA.Gug_/ i c *y ,·*· /1 .-i -! Ί .-p^ '-i -'Γη ΠΓΓι^'ΤΛ *i ^ jrtL-ί.1·__rt - '.-í1·— -rci-v. >__·- ^ '·_· 2 15 0 GACGCCATTG TTCCACTCTA AATACCACTA L· i_ Ac AAAp _ j GCGGTGGAu^ i^CA .í. GC AA\jC 2 2 2 0 CAGCCACGGG GAGACCTTTC ATGTGCTTTA C C T AACCACA ·“♦ Ί -> Φ i 1 ^ *-» y» ř-1 », ^irp ΛΊΠι^Λ C* Λ Λ _ i. Λν . V, -•η.··' 1?β.Ί
• 9 I »M GGTGGTGGAA CCGGGGGAGC Alj o γ-iíj Λ.ί_ Ac CTTCGCCTTC AACATCATGG AGA.TCCAGCC TÍM *v -J *t CTTCCGCCGC GCGGCTGCCA TCCAGACCAT ~t > -T1 ;c GGAAGCTGTA 2 4 j 0 TGTGAGCTCC CAijTGgGAGG lGACjCCAGGT GCCCCTGGAC CTGGGTG; Λ •-‘rf Λ ,α,'ου'.Λ 2 4 5 0 GGGCTGCCAC GG i TGCCTCA TGTCCCCAGA CCCCTACTGC GGCTGG1, Cl.C > ,·ί ο ^ f^rTV-' ALtVJUTVw v_'sJVw - 2520 CATCTCCATC TACAGCTCCG A ί γ^ι^Γ''ύ'/~' \ f^rr· .-ν-ΟΛ '·, _ Χ,.-Λ'νί “« Π“ Τ’ /-1 *, Λ ΤΙ/Ί/*» U v, i 2J G P.P. * ·_ ATTAATC CAG o_ 'j.nU C »-i 2530 CAAGGAGTGT CCCAACCCCA AACCAGACAA GGCCCCACTG CAGAAvjG TGT ν-'^ν, íGijCCL·^ 2 54 0 AAACTCTCGC TACTACCTGA «. Ljv*-GG.-, - W Ό ΑΛΤ CCC G- G ^ Λ Λ •w ^ f-rri ^ Ρ'Τ'γ^' .-\L 1 -Λ LU\;vj 2700 CCACAAGGAG AACGTGGAGC A.1·, a AwC T G C G A -Ά1·---- * CAC oAljG.GCO CCA A'w , 2 7 6 0 GTTCATCGAG AACCTCACGG pccAALAp ..·*. LGGv^Grt1^ _ A;-.T TGGTGCG AGG i, L C .A Cj A C c' —' C 2 32 3 CTCCTACTTC CGCGAGGCTC A G C A C T G G C A 'jG JjvCGogLL GACGACG :GCA T C ATG C C CG A 2380 GCACCTGCTG GGTCATGCCT GTGCCCTGGC TGCGTCCGTC -Τ' i'*' .··> —"*T" f. — -> r— TGCTGCCCAC 2940 ACTCACTCTT GGC i TC-CTuG i. L G Αχ,ιλ u ,o'.j j .H ^ ΛΑν4 '.w '-j G lAuGA^j'. "TGT /-i r~j ^ ^ í"’ y" m 3 0 00 GGTGCCCATC CTGGTCGAGC G ^GAGGGgGA GGTAAAGGGC CACAA.GG . . _ 2Λ r. ^ ^ p r ’ p p- 3 0 6 0 CGrtGGGCGAG GGCGATGCCA CCTACGGCAA AAGTCC A re'71 i. j L Ac C AC C G G 3120
-118- • * • · » 1 » f * • * • * * # • * # · • * « · * • * * * * • * * * • · 4 · • * »* ^aac;': ..020:2 ^ι»^η ,-λ i·^ r-’ <. -Ai_ - ·.„ i UU*^- CCACCCTCGT GACCACCCTG ACCTACGGCG TGCAGTGCTT 3180 ^ r> ř-1 /-r"* ·. WSÍL * řVU CCCGACCACA TGAAC-CAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG 3240 - - ALo * C^AG -g A. GCGCACCA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA 3300 ^ G T G AAC- TT C T” Λ r*i Λ P* "i JntjU UPJALA CCCTGGTGAA CCGCATCGAG CTGAAGGGCA TCGACTTCAA 3360 LiKjk^G? CGGC _ u - i. uu GGCACaagct GGAGTACAAC TA^AACAGCC ACAACGTCTA 3420 TATCATGCCC •aía1^. ΑΛL Au n AGAACGGCA T CAAGGTGAAC TTCAAGATCC GCCACAACAT 3480 ‘-urtowrtLCL··^ AG CG 7 G C AG C TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACGG 3 54 0 CCCCGTGCTO •-1.— /-1 ί-'Γ-*.-'Γ> -tl ,-*i U - U L'xv 'J.n U f\ ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC 3600 CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG GGATCACTCT 3660 CGGCATC-GAC GAC-CTGTACA AGGTGAAGCT TGGGCCCGAA CAAAAACTCA TCTCAGAAGA 3720 Cj 0 AT C T G ΑΛΤ AGCGCCGTCG ACCATCATCA TCATCATCAT TGAGTTTAAA CCGCTGATCA 3780 .-'Γ'ηιΤ'η/" ‘i -irn U'-.- . ϋ 'Tf*’ ,-r ^rpr^.-^-T' "< ^ «i 1 J(M A - 'w J. 2~*»U TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC 384 0 TTGACCCTQG AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG 3900 CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA CAGCAAGGGG 3960 GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGAi GCGG TGGGCTCTAT GGCTTCTGAG 4020 u C G G AAAGAA Pf"' ,-1 Ρ'Τ'ΙΡΠΛ '·,· u .-\U u * '-Λjuu r~\mr-irp «! .-ι^ι.οπ Ιλ L^.Iíuouu TATCCCCACG CGCCClGTAu CGGCGCATTA 4 080 "í '"'i'·"· ^ /ΊΡ» ^ u j. u Tlo . GGT T A CG C G C AG C GTGA._ CGCTA CACTTGCCAG CGCCCTAGCG 4140 ΤΓ'γ^ CTCGCCACGT TCGCCGGCTT TCCCCGTCAA 4200 GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA CCTCGACCCC 4260 AAAAAACTTG ATTAGGGTGA 7uu7TCACG7 AGTGGGCCAT CGCCCTGATA GACGGTTTTT 4320 CGCCCTTTGA CGTTGGAGTC AATAGTGGAC TCTTGTTCCA AACTGGAACA 4380 ACACTCAAv-C CTATCTCGGT Γτρ Λ ·Τ"^ ΓΠι“Π LrtUL-i i L u gatttataag GGATTTTGGG GATTTCGGCC 44 4 0 TATTGGTTAA AAAATGAGCT v.-íaT ι,ΤΑΑΟΑΑ AAATTTAACG CGAATTAATT CTGTGGAATG 4500 TGTGTCAGTT TG I GGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG TATGCAAAGC 4560 ATGCA i C _ ί-*·Λ A TT AG TC AG C AACCAGGTGT GGAAAGTCCC CAGGCTCCCC AGCACGCAGA 4620 Au 7 ATG L *·*uV.->. GCATGCATCT CAATTAGTCA GCAACCATAG TCCCGCCCCT AACTCCGCCC 4680 ATCCCGCCCC TA.ACTCCG.-r CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT 4740
* · * * » · * · • * I · t · » |M * 1 ·· » » · · > « · B · « · » > * · ** · * f · • · 4 · · · • • * -119- TTTA7TTATG ~ ,-.G GCCG A GGCCGCCTCT GCCTCTGAGC TATTCCAGAA G lAGTGAGGA 4 3 C 0 GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT ATCCATTTTC 4 3 6 0 GGATCTGATC AAGAGACAGG atgaggatcg TTTCGCATGA TTGAACAAGA TGGATTGCAC 4520 GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT ATGACTGGGC ACAACAGACA 4230 ATCGGCTGCT CTGATGCCGC CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT 5040 GTCAAGACCG ACCTGTCCGG TGCCCTCAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG 5100 TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA 515 0 AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC TCACCTTGC.T 5220 CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC GGCTGCATAC GCTTGATCCG 5230 GCTACCTGCC CATTCGACCA CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG 5340 GAAC-CCGGTC TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 54 0 0 CAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAG 5450 GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG ATTCATCGAC 5520 TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG CGTTGGCTAC CCGTGATATT 55 3 0 GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT 5 64 0 CCCGATTCGC AGCGCATCGC CTTCTATCGC CTTCTTGACG AG'; i CTTCTG AGCGGuAClC 5700 TGGGGTTCGA. AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT TTCGATTCCA 5760 CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT CCGGGACCCC GGCTGGATGA 5320 TCCTCCAGCG CGGGGATCTC ATGCTGGAGT TCTTCGCCCA CCCCAACTTG TTTATTGCAG 56G0 CTTATAATGG TTACAAATAA AGCAATAGCA TCACAAATTT CAvAAATAAA GCATTTTTTT 534 0 CACTGCATTC TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT uTCTGTAiAL 60 00 cl? í L^ACCTC T.-ťjCT.-.GAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT GTGTGAAATT 6 060 GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG CATAAAGTGT AAAGCCTGGG 512 0 GTGCCTAATG AGTGAGCTAA CTCACATTAA TTGCGTTGCG CTCACTGCCC GCTTTCCAGT 6180 CGCGAAACCT GTCGTGCCAG CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT 62 4 0 TGCGTATTGG GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 630C TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATAGG GTTATCCACA GAATCAGGGG 6 3 60 A i. AaCCjCAGG AAAUAACATG TGAGCAAAAG GCCAGCAAAA CGCCAGGAAC CGTAAAAAGG 64 2 0
CCGCGTTGCT GCTCAAGTCA GAAGCTCCCT TTCTCCCTTC TGTAGGTCGT GCGCCTTATC TGGCAGCAGC TCTlGAAuiϋ TGCTGAAGCC CCGCTGGTAG CTCAAGAAGA | GTTAAGGGAT
I AAAAATGAAG t
I
‘ AATGCTTAAT
! CCTGACTCCC
CTGCAATGAT CAGCCGGAAG TTAATTGTTG TTGCCATTGC CCGGTTCCCA GCTCCTTCGG TTATGGCAGC CTGGTGAGTA GCCCGGCGTC TTGGAAAACG CGATGTAACC CTGGGTGAGC . .. .... ......... . .. ...... .... .... .. .. ·· ·· * · w » , * . ♦ * • · • * GGCGTTTTTC CA * j-líjGC _ C G G AG G A T C A AAAAAT C G AC 6430 GAGGTGGCGA AACCCGACA/G oACTATAAAC A7ACCAGGCG 77TCCCCC7G 6540 CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT 6600 GGGAAGCGTG GCGCT7TCTC AATGCTCACG CTGTAGGTAT C7CAG770GG 6 56 0 TCGCTCCAAG CTGGGCTGTG TGCACC-AACC /Τ' Λ r'" /“· f-’ H ^ _______— ^ .'.Hu t 6 72 0 CGGTAACTAT CCAACCCGGT 6^30 CACTGGTAAC A L? GATT A G C A. GAGCGAGGTA TOTACGCGGC '.jCC ACA.G Akj * 6840 vj iooCL i. rv-vC TACGGCTACA v, T r1. o PA. LGAl AG7ATTTGG7 A7CTGCGC7C 6900 AGTTACCTTC GGAAAAAGAG TTGGTAGGTC TTGA7CCGGC AAACAAACCA 6960 CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT TACGCGCAGA AAAAAAGGAT 7020 TCCTTTGATC TTTTCTACGG GGTCTGACGC TCAGTGGAAC GAAAACTCAC 7030 TTTGGTCATG AGATTATCAA AAAGGATCGT CACC7AGA7C CTT77AAA7? 714 0 TTTTAAATCA A7CTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC 7200 CAGTGAGGCA CCTATCTCAG CGATCTGTCT Λ t ^ ·_ J ^ i 1 * Ai J i * kj 7260 CGTCGTGTAG AGAACTACGA TACGCjGAúCG .^íT^m λ ,--1 ř-1 ^ /“* Λ /'"Τ' r* L· i. L i*, Í. *'.j 7320 ACCGCGAGAC CCACGCTCAC GGGCTCCAGA TTTATCAGCA ATAAACCAGC 7 3 3 0 GGCCGAGCGC AGAAGTGGTC CTGCAACTTT A7CCGCCTCC ATCCAGTCTA 74 4 0 CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT -ny ντΆ prirpiviř·' A" ^ "l npiri(T'f ^ íAAíAo i , i.'·^ i. ιό 7500 TACAGGCATC gTGvjTgTGAC "P^rpT "T,rT·' Ok_. j. k_Ό ΌΌ i i 7GGTA7GGC7 TCAT7CAGC7 7560 ACGATCAACC CGAGTTACAT GATCCCGCAT όΤΤ-όΤ'όCAAA AAAíjv^GGC .A 7 5 2 0 TCCTCCGATC GITGTCAGAA Ό 1. GirV—· * *. '-JUL CGCAGTGTTA TCACTCATGG ~ ó 3 0 ACTGCATAAT TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTCTC-A 77 4 0 L λ L γ-όυό TCATTCTOAG AATAGGG7AT GCGGGGACCG AGTTGCTCTT 7 80 0 AATACGGGAT AhTACCLjCgC A * ."vO a_ ,^ό AA CTTTAA AA GTGCTCATCA 7860 TTCTTCGGGG CGAAAACTCT CC -CG AC C CCTCATC- AGAT C C AuTT 7920 CACTCGTGCA 7'CCP CTTC -,υΓΑΤ,Λ ITTTACTTTC accagcgttt 7930 Λ " - f' * « - ..‘O v._ rtuurt AGGCAAAATG _ A j C ΑΑΑΑΑΑ·, όόΟ-ΑΑ^ -ΑΡλ'όό uCGAChCGoA 8040
• · · • · * * • * · • · · • · * • * · * * « · · · » · « · # * * « 1 ♦ · * t «* ♦* • · · • · ·> • 1* · * * »· ·' AA ^ jT' Γ jA-λ .. Λ^1--iC^C ^^CCrr~TTTTC AATATTATTC AAGCATTTAT CAGGGTTATT 8100 _ _ * T A i 0 .''T· r*' « l-n «. -'-I η 1 *, , TTT AG .AAAAA T AAAC AAATA GGGGTTCCGC 8160 GCACATTTCC LC jAAAAC-TG ccacctgacg TC 8192 ;-YvU-. — a gag7-3C. _D. C . : 37 : ^ A, ŤEEKA: Tťj ’ ; _ bar.-_ ','= I":'?: :: . ·. . í v. : 'jf r ’ A kři 7 ^ ÍG. ECO EG VLAKEM: dvě • ~ -rr, = aEC<"Γ- ' - aearna i lLÍ TY? MCEEřLJLY: DMA gen 0 rrVC Vd [ T_ V ' CHARAKTíS:S7tCKE RYSY i A; JKEMG/KLEČV e v ;2; E ,· DME ST EM E : 2 a i 7 γ i j ;; ?T?:s sekyzmge :::.á AGATCTCGGC CC-CATATTAA GTGCATTGTT CTCGATACCG CT.AAGTGCAT TGTTCTCGTT 60 AGCTCGATGG ACAAGTC-CAT TGTTCTCTTG CTG.AAAGCTC GATGGACAAG TGCATTGTTC 12 0 TGT7GCTGAA AGCTCGATGG ACAAGTGCAT C TG AAAGCTC AGTACCCGGG iao AGTACCCTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT 240 TCAAACAAGC .AAAGTGAACA CGTCGCTAA.G L· tj j-u-LaL: C i AA GCAAATAAAC AA.GCGCAGCT 300 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA AAAGTAACCA 360 GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 420 GAAGAGAACT CTGAATACTT TCAACAAGTT ACCGAGAAAG AAGAACTCAC ACACAGCTAG 430 GC Γ. Τ."\ΑΑ^Α TAAGCTTGGT ACCGAGCTCG GA-CCACTAG TCCAGTGTGG TGgAATTCGG 540 >- i uuurt ^ ur\ Γ~· "* η ^ 'T' ι*"1 Γ1 ^'ί-'Γ' 1Λ .'ν'τ-ι LvL:LL .'-v. o (2 ^ Q 7 C C C -* GCGCACCGCG CGCCCGCGTC 600 CCTGGCCCGC i CTjíjT l GGuClTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG 660 GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGCAGCCGAC CCCGCATCTT CGCCGTCTGG 720 AAAGGCCAYG -.—* j'T(:, v..' jA CCGGGTGGAG i T 1 ooLOvGA CTGAGCCGCA CACGGTGCTT 780 TiCCACuAGC CAGGCAGCTC CTCTGTGTGG 'j i GGGAGíjA.C GTGGCAAGGT CTACCTCTTT 840 GAYTTCCCTG i'-*. -: .) ^ 7 . A'._ AA. E A.. A„ LT GTG duCALďJ i GA ATATCGGCTC CACAAAGGGG 900
-122- -122- • * • · · · « t • é · * · · · · • · · * · * · II Μ M ** rr- ,1 r-1 r* -7- f* f •fa *fae fa* fa lSw7 fa w fa *J faij ataagcggga CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG 960 /“·/“+ /** /~”-rr* t~*-*f*»r* '•juuv fa'faj'__'-avi CCTGTGGCAC CAACGCCCGG CACCCCAGCT CCTGGAACCT GGTGAATGGC 1020 ACTGTGGTGC CACTTGGCGA GATGAGACGC TACGCCCCCT TCAGCCCGGA CGAGAACTCC 1080 CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT TCCACCATCC GGAAGCAGGA ATACAATGGG 114 0 AAGATCCCTC GGTTCCGCCG CATCCGGGGC GAGAGTGAGC TGTACACCAG TGATACTGTC 1200 ATGCAGAAk. C CACAGTTCAT CAAAGCCACC ATCGTGCACC AAGACCAGGC TTACGATGAC 1260 AAGATCTACT ACTTCTTCCG AGAGGACAAT CCTGACAAGA ATCCTGAGGC TCCTCTCAAT 1320 GTGTCCCGTG TGGCCCAGTT GTGCACGGGG GACCAGGGTG GGGAAACTTC ACTGTCAGTC 13 60 TCCAAGTGGA ACACTTTTCT GAAAGCCATG CTGGTATGCA GTGATGCTGC CACCAACAAG 14 40 AACTTCAACA GGCTGCAAGA CGTCTTCCTG CTCCCTGACC CCAGCGGCCA GTGGAGGGAC 1500 ACCAGGGTCT ATGGTGTTTT CTCCAACCCC TGGAACTACT CAGCCGTCTG TGTGTATTCC 1560 CTCGGTGACA TTGACAAGGT CTTCCGTACC TCCTCACTCA AGGGCTACCA CTCAAGCCTT 1620 CCCAACCCGC GGCCTGGCAA GTGCCTCCCA GACCAGCAGC CGATACCCAC AGAGACCTTC 1690 CAGGTGGCTG ACCGTCACCC AGAGGTGGCG CAGAGGGTGG AGCCCATGGG GCCTCTGAAG 174 0 ACGCCATTGT TCCACTCTAA ATACCACTAC CAGAAAGTGG CCGTTCACCG CATGCAAGCC 1800 λ q c CAC GGC0 rVsJfrVwfaN** i x TGTGCTTTAC CTAACTACAG ACAGGGGCAC TATCCACAAG 18 60 GTGGTGGAAl CGGCCGAGCA GGAGCACAGC TTCGCCTTCA acatcatgga GATCCAGCCC 1920 TTCCC-CCGCG CGGCTGCCAT CCAGACCATG tcgctggatg CTGAGCGGAG GAAGCTGTAT 1930 GTGAGCTCCC AGTGGGAGGT GAGCCAGGTG CCCCTGGACC TGTGTCAGGT CTATGGCGGG 2040 CGCTGCCACG GTTC-CCTCAT GTCCCGAGAC CCCTACTGCG GCTGGGACCA GGGCCGCTGC 2100 ATCTCGA7CT ACAGCTCCGA ACGGTCAGTG CTGCAATCCA TTAATCCAGC CGAGCCACAC 2160 AAGGAGTGTC CCAACCCCAA ACCAGACAAG GCCCCACTGC AGAAGGTTTC CCTGGCCCCA 2220 AACTCTCGCT ACTACCTGAG CTGCCCCATG GAATCCCGCC ACGCCACCTA CTCATGGCGC 2230 CACAAGGAGA ACGTGGAGCA GAGCTGCGAA CCTGGTCACC AGAGCCCCAA CTGCATCCTG 2340 TTCATCGAGA ACCTCACCCC GCAGCAGTAC GGCCACTACT TCTGCGAGCC CCAGGAGGGC 2400 TCCTACTTCC GCGAGGCTCA GCACTGGCAG CTGCTGCCCG AGGACGGCAT CATGGCCGAG 2460 CACCTGCTGG GTCATGCCTG TGCCCTGGCT GCCTCCCJTCT GCCTGGGGG1 GCTGCGCACA 2520 CTCACTCTTG GCTVGCTGGT CCACGTGAAG CTTGGGCCCG TTTAAACCCG CTGATCAGCC 2580 # *
TCGACTGTGC CTTCTAGTTG CCAGCCATCT U * TGTTTGg, w _ *. „Us- i. *.'-J 2 640 ACCCTGGAAG GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGrtAA- -Γ'Γ'Γ' Λ 5 -n 4. Uga L .vUgHi 2700 TGTCTGAGTA GGTGTCATTC i A l TCTGGUG GG ^ GGGG > —’ GGCAGGACAG CAAGGGGGAG 2760 GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTuG GCTCTATGGC TTGTGAGGCG 2320 GAAAGAACCA GCTGGGGCTC TAGGGGGTAT CCCCACGCGC ^ ř*i rr- pí J-" > -‘I pí /^1 l_. t 'J A »** l— '*-1 O CGCATT AAGC 2 330 GCGGCGGGTG TGGTGGTTAC Γ>(“^Γ>Γ> ·". ř-| .-i^ J i. ACCGCTACAC T T G C C A lt v, U ^ •1 ,τη ^pprpp'·' 2940 GCTCCTTTCG CTTTCTTCCC TTCCTTTCTC GCCACGTTCG ^LUUG i 1 CCGTCAAGCT 3000 CTAAATCGGG C-CATCCCTTT AGGGTTCCGA TTTAGTGCTT TACC-GCACCT CGACCCCAAA 3060 AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC CCTGATAGAC GGTTTTTCGC 3120 CCTTTGACGT TuGAGTCCAC GTTCTTTAAT AGTGGACTCT TGTTCCAAAC TGGAACAACA 3180 CTCAACCCTA TCTCGGTCTA TTCTT7TGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT 3 2 40 TGGTTAAAAA ATGAGCTGAT TTAACAAAAA TTTAACGCGA η Ι-Πφ Λ ^ ΤΊΤ1^1(11.·Ί «Λ - i γ\Λ - i. i nJ TGGAATGTGT 3 2 00 GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGC-CAG GCAGAAGTAT GCAAAGCATC- 3 360 CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG GCTCCCCAGC AGGCAGAAGT 3420 ATGCAAAGCA TGCATCTCAA TTAGTCAGCA ACTA^arVT-r’.'- CGCCCCTAAC TCCGCCCATC 3-3 ·'; CCGCCCCTAA C^crGC^C-G -nm/—< /-* Í—rr-l/*1 Λ rri - i-wuUWi-n S. TCTCCGCGCC AT GG CTGACT 2Λ.Ά* i * * * i - 3 540 ATTTATGCAG AGGCCGAC-GC CGCC7CTGCC TCTGAC-CTAT TCCAGAAGTA u i GAGGAGGC 3600 TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCGGGAG CTTGTATATC CATTTTCGGA 3 650 TCTGA7CAAG AGACAGGATG AGGATCGTTT C G C AT G AT T G AACAAGATGG ATTGCACGCA 372 0 C-GTTCTCCCG CCGCrTGGGT GGAGAGGCTA TTCGGCTATG ACTGGGCACA ACAGACAATC 3 7 3 0 GGCTGCTCTG Λ 'Τ' /1 <~ir* p* «—i ^ 'w L· vj^ 2 GTTCCGGCTG T C A Li C G C AG G ví G C U U C U G U T TCTTTTTGTC w 0 *t 0 AAGACCGACC TU. CLUGTGC CCTGAATGAA l s '.juAGGACG AGGCAGCGCG Lv. k .-v i \_vj L 3900 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCAC7GA AGU UvaGAAGG 3960 GACTGGCTGC TATTGGGCCA AGTGCCGGGG CAGGATCTCC TGTCATCTCA CCTTGCTCCT 4020 GCCGAGAAAG TATCCATCAT GGCTGATGí-A ATGCGGCGGC Τ'— u*\ i rtCGCT TGATCCGCCT 4080 ACCTCCCCAT TCGACCACCA AGCGAAACAI l U C AT U C: AG C u A^u al oTAC 7CGGATGGAA 4140 GCCGCTCTTG 1 UUřV ^ UAGC3A TGATCTGGAC LjpaA-L; AUCATT AGGGGCTCGC GCCAGCCGAA 4200
* 1 · * * · * 1 4 • · · ·· * · ·· · · ·· * · · « · * • · · · · *1 ** ·· • * » • * • ·* · * • ♦ • · -12 4 - 2^,2^.^2 i'"’ rj ·” ^ 2 ,'- ^ ^ jt·. _ v.-UA, -jp- ju ATCT^G TG l GrtCCCATGGC 4260 GATOCCTGCT . C^_ _jAa .. ,λ- ^ A ^ '.gTí. G^jAA .-A. *. GOCCGC i TTTCTGGATT CATCGACTGT 4320 GGCCGG-* GG .^r fry f* 'Τ' Q Q ^ p ^ CCGCTArCAG GACATAGCGT TGGCTACCCG TGATATTGCT 4380 GhkGAC^T_ o .juGuCGr·-'-'. ^ G GGCTGACCGC TTCGTCGTGC TTTACGGTAT CGCCGCTCCC 4440 GATTCGCAGC •jurt t GJl·---- CT.-lTGGCCTT CTTGACGAGT TGTTCTGAGC GGGACTCTGG 4500 C-GTTCGAAAT -JrV-_ _ G,u,U _ .“'—"V GG 'ν.-*.·- u ...C A. AlCTGCCAT C Ag w A i. í taC C-ATTCCAC CG 4 560 v», ·_ >jL^ _ ^ T G AAAG G T T G GGCTTCGGAA GGACGCCGGC TGGATGATCC 4620 TCCAGCGCGG GGATCTCATG C T G GAGTTTT TCGCCGACCC CAACTTGTTT ATTGCAGCTT 4630 ATAATGGTTA C A.AAT AAAG C AATAGCATCA CAAATTTCAC AAATAA^G CA TTTTTTTCAC 4740 TGCATTCTAG TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC TGTATACCGT 4300 CGACCTCTAG CTAGACCTTG OlGi AA ^ C»-*·. - GGTCA.TAGCT GTTTCCTGTG TGAAATTGTT 4860 ATCCC-CTCAC 2, 2 r''rn·''"' 3 AACATACGAG CCGGAAGCAT AAAGTGT.AAA GCCTGGGGTG 4920 C CTAAT G AG T GAuCThACTC ACATTAATTG CGTTGCGCTG ACTGCCCGCT TTCCAGTCGG 4930 C-AAACCTGTC rjnf~* ^ *. U3 . 'k A_: CA. ITAATGAA TCGGCCAACG G C G L· G G A G A C-GCGGTTTGC 5040 L; i AT * oCjGl,G ^ i u. i. l LL ju - TCCTCGCTCA CTGACTCGCT GCGCTCGGTC GTTCGGCTGC 5100 uGCGAGCGGT ATCAGCTCAC T C AAAGG C G G T2A T AC G C-^T 7\ fTi ^ n i. in. ·._ .-v^T rt γα ii :v-A^íjO*cA i A 5160 ACGCAGGAAA Γ-AAC ArnGTr'A GCAAAAGGCC AG C .AA AAC o ^ GAGGAACCGT AAAAAGGCCG 5220 CG _ iGGTGíjC GTTTTTCCAT rtbuv. * '_LG,^G CCCCTGACGA G^ATCACAAA AATCGACGCT 5230 'vrtr.u t ^/-‘.CriAv '._j « GGCujAAA!s_ L- T ATAAAG ATA CCAGGCGTTT CCCCCTGGAA 5340 ^ ^ <p c Γ1 T r' * Q T1 ΙΛ^,'Ί|^ΓΠ^'Τ’Λ’Γ,ΤΙ GTTCCGACCC TC-CCGCTTAC CGGATACCTC- TCCGCCTTTC 5400 TCCCTTCGGG * JVJV, w GCTCACGCTG TAGGTATCTC AGTTCGGTGT 5460 AGGTCGTTCG ^ ^v’’ Γ' 2 ^ Π Γ"~ GGCTGTGTGC ACGAACCCCC CGTTCAGCCC GACCGCTGCG 5 5 2 0 CC : TAΓCLoC- i, P*_—.L· A s\ I _ ·_> - CTTTATTCCA Ί ,·'^'.-’'··ΓΤΊ Λ > .--1 rv-w ·- -w g .-..-v', j ACACGACTTA TCGCCACTGG 5530 C .AG C A G C C A C TG GTAACAGG AI l AíjCAíjAG lGaGuj γλτοτ AGGCGGiGlC ACAGAGTTCT 5640 TGAAGTCGTG GCCTAACTAC G G C T AC A C T A ACAG Γ ATTTGGTATC TGCGCTCTGC 57 0 0 TUAAulCAíj 1 TACCTTCGGA rAAuA'jT 10 GTAGCTCTTC A T C C G G C AAA CAAACCACCG 5760 CTGCjTAGC cg ,·, r-π^ GTTTGCAAGC rtcurtij.H . . AC GCGCAGAAAA AAAG G AT C T C 5820 A A gj AA G AT ~ C -TT—T/-' Λ --η /'ί-ιι— r-p j. x : un - ^ ; ; _ i. LT.^l TíjGvj .. CTGACGCTCA GT GGAAGGAA AACTCACGTT 5880 -125- -125- * · *1 Φ · * * * · · · • · éi· * * ·· Φ * * #♦· · * AAGGC-ATCCT Ga\(jA TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA 5940 áatoaagttt taaatcaatc TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT 60 OQ C-CTTAATCAG tgaggcacct ATCTCAGCGA TCTGTCTATT TCGTTCATCC ATAGTTGCCT 6060 GACTCCCCGT cgtgtagata ACTACGATAC GGGAGGGCTT ACCATCTGGC CCCAGTGCTG 6120 -** i vjí\ _ A v - GCGAGACCCA CGCTCACCGG CTCCAGATTT ATCAGCAATA AACCAGCCAG 6180 ^ ‘ -r '‘-'"u-v-j O ϋ AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA 6240 ATTGTTGCCG CGAACCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG 6300 CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA TTCAGCTCCG 6360 GT7CCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT GTGCAAAAAA GCGGTTAGCT 6420 CCTTCGGTCC TCCGATCGTT GTCAGAAGTA AGTTGGCCGC AGTGTTATCA CTCATGGTTA 6480 tggcagcact GCATAATTCT CTTACTGTCA TGCCATCCGT AAGATGCTTT TCTGTGACTG 6540 GTGAGTACTC AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC 6600 CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG CTCATCATTG 6660 ^jAAAAL ϋτ i c TTCGGGGCGA AAACTCTCAA GGATCTTACC GCTGTTGAGA TCCAGTTCGA 6720 TGTAACCCAC TCGTGCACCC AACTGATCTT CAGCATCTTT TACTTTCACC AGCGTTTCTG 6780 GGTGAu*^ AaA C A G G AA G G CAAAATGCCG CAAAAAAGGG AATAAGGGCG ACACGGAAAT 6840 gttgaatact CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC 6900 TG-^GAGCGG atacatattt GAATC-TATTT AGAAAAATAA ACAAATAGGG GTTCCGCGCA 6960 CATTTCCCCG AAAAGTGCCA CCTGACGTCG ACGGATCGGG 70 0 0
C StXVZNC :D. Č.: 38: - CHARAKT E?.lST i! řlA SEKVENCE: ;A; DÉLKA: 7103 párů bazi (35 TYP: nukieová kyselina (C) POČET VLÁKEN: dvě (D) TOPOLOGIE: lineami i11-! TY? MOLEKULY: DMA genorcova í->0 CHARAKTERISTICKÉ RYSY: 7108 (A) JMÉNO/KLÍČ: e>:on f£i UMÍSTĚNI:! až - 1 ? 5. ~ * · · É · ··* • t · · • * · * M *· • · % * t • » M · • · · · * • * · · ** ** (xi) POPIS SEKVENCE ID.Č: 38: AGATCTCGGC CGCATATTAA gtgcattgtt CTCGATACCG C íAA-jTCCAT * w 1 - *. -w ί J i ^ 50 AGCTCGATGG ACAAGTGCAT tgttctcttg CTGAAAGCTC GATGGACAAG TGCATTGTTC 120 TCTTGCTGAA AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC agtacccggg 130 AGTACCfTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTA1-'G‘jAGCG ACAAí 4.CAA.T 240 TCAAACAAGC AAAGTGArtCA CGTCGCTAAG CGAAAGCTAA GCAAA * AAAC AAGCGCAGCT 3 00 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA AAAGTAACCA 350 GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 42 C GAAGAGAACT CTGAATACTT TCAACAAGTT AC CGAGAAAG AAGAACTCAC ACACAGCTAG 480 CGTTTAAACT TAAGCTTGGT ACCGAGCTCG GATCCACTAG TCCAG7GTGG TGGAATTCGG 540 CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GCGCACCGCG CC-CCCGCGTC 600 CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GC-CTGCTGCT GCTGCTCTGG 66 0 GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG 720 AAAGGCCATG TAC-GGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT 780 TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC C-TGGCAAGGT CTACCTCTTT 840 GACTTCCCCG AGGGCAAGAA CGCATCTGTG lGl A-^GGTGA ATATCGGCTC CACAAAGGGG 9C0 TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG 96 0 GGGCTGCTGG CCTGTGC-CAC CAACGCCCGG CACCCCAGCT GCTGGAA.CCT GC-TGAATGGC 1020 ACTGTGGTGC CACTTGGCGA GATGAGAGGC TACGCCCCCT TCAGCCCGGA CGAGAACTCC 10 80 CTGC-TTCTGT TTGAAGGGGA CGACGTGTAT 'Τ'ΓΓ' L ^ GGAAGCAGC-A ATACAATGGG 114 0 AAGATCCCTC GGTTCCGCCG CATCCGCGGC i^AGň.GTCJAGC TGTACACCAG TGATACTGTC 12 0 0 ATGCAGAACC CACAGTTCAT CAAAGCCACC ATCGTGCACC AAGACCAGGC TTACGATGAC 1260 AAGATCTACT ACTTCTTCCG AGAGGACAAT CCTGACAA.GA ATCCTGAGGC TCCTCTCAAT 1320 GTGTCCCGTG TC-GCCCAGTT GTGCAGGGGG GACCAGGGTG GGGAAAGTTC ACTGTCAGTC 1380 TCCAAGTGGA ACACTTTTCT GAAAGCCATG CTGGTATGCA GTGATGCTGC CACCAACAAG 14 4 0 AACTTC AACA GGCTGCAAGA CGTCTTCCTG CTCCCTGACC CCAGCGGCCA oTGGAGGO^^C 15 0 0 ACCAGGGTCT atggtgtttt CTCCAACCCC TCGAACTACT C AG C C G - C : G .. GTrt: i. C C 156 0 9 9 9 9 * · 1 ( · · · * ».♦ * · • · mm* mm mm · * · · »· ·· » * M · • · · · * ** ·· CTCGGTGACA TTGACAA03T CTTCGGTACG TGGTCAGTGA AGGGGTACCA -- í Grv^jjCCTT 1620 CCCAACCCGC GGCCTGGCAA GTGCCTCCCA ! jía.L AGC CoATAuCCA^ AGAGACCTTC 16 8 0 CAGGTGGCTG ACCGTCACGC A.·-.'s_;»j _ G G CAGWjGGTGG AGCCCATGGG GCCTCTGAAG 17 40 ACGCCATTGT TCCACTCTAA ATACCACTAC ' _ r*.L: AAAoj T :o \j CCGTTCACGG CATGCAAGCC 1600 AGCCACGGGG AGACCTTTCA TGTGCTTTAC G L Aj*.1^- A>_ A C A \ j G v jG v A i. Γ»1 Λ fTion lpi Λ ,·^ i ,Τ. i. s_. w jA 13 60 GTGGTGGAAC CGGGGGAGCA • j G .-λAG ^ TTCGCCTTCA AG A T G AT GG A GATGCAGCCC 1920 TTCCGCCGCG CGGCTGCCAT CCAGACCATG 7CGCTGGA.G GTGAGCGGAG GAAGCTGTAT 1980 GTGAGCTCCC AGTGGGAGGT GAGCCAGGTG 71j.G .GAvgGT ^ L A * G^^Guv; 2 040 GGCTGCCACG GTTGCCTCAT GT C C C GAGAC CCC7ACTGCG ljCTGGGAuCA GGGCCGCTGC 2100 ATCTCCATCT ACAGCTCCGA ACGGTCAGTG CTGCAATCCA. TTAATCCAGC CGAGCCACAC 2160 AAGGAGTGTC CCAACCCCAA A* AAG GCCCCAC7GC A.GAAjvjG ΓΤ Γ7 CCTGGCCCCA 2220 AACTCTCGCT ACTACCTGAG {""Τ' <“* t'*' GAATC7CGC7 ACGCGACCTA i Lrt i uGJUvjL 22 3 0 CACAAGGAGA ACGTGGAGCA GAGCTGCGAA CCTGGTCACC AGAGCCCCAA CTC-CATCCTG 2 3 4 0 TTCATCGAGA ACCTCACGGC GCAGCAGTAC GGCCACTACT T'Τ'^ "· ·-’ ^ * ·_ j. ·_ί'·_ CCAoGAljGGC 24 00 TCCTACTTCC GCGAGGCTCA C-CACTGGCAG o. - Lr^ - Lí^wwJ AGGACGGCAT CATGGCCGAG 2 4 60 Γ ί,Γ'Π'ΤΠ.ΓΎΠ,ιΊ Oj fT'/"' Z-' ^ Γ~»ΓΓ* í-* L j. X GCCTCCCTCT 'vJVgtC í'•.'UuULj i GCTGCCCACA 2 520 CTCACTCTTG GCTTGCTGGT CCACGTGAAG rr=-n AACAAAAACT GATCTCAC-AA 25 30 C-AGGATCTGA ATAGCGCCGT CGACCATCAT CATCATCA7C ATTGAGTTT\ TCCAGCACAG 2640 TGGCGGCCGC TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT 2700 TCTAGTTGCC AGCCATCTGT TGTTTGCCCC TGCCCGGTGC CTTCCTTGAC CCTíjGAAGGT 2760 GCCACTCCCA CTGTCCTTTC TTAATAAAAT : _r Au G AAA TT G CATCGCATTG TCTGAGTAGG 2 8 2 0 TGTCATTCTA TiCTGGGuoG ToLuv Γ'-rGG^ gAgG^lAGG^-v ALiC-CAjwA^-G Pí TTGíjGAAGAC 2 8 80 AATAGCAGGC A i i. GCGGTGGGC TCTAGGCCTT GGGAGGCGGA .λ PG v _ CPíG C 2940 TGGGGCTCTA GGGGGTATCC ccacgcgccc lvi * Avj^GCG CATTAAGCGC GGCGGGTGTG 3000 GTGGTTACGC GCAGCGTGaC C G C T A C A C T T GCCAGCGCCC TAGCGCCCGC TCCTTTCGCT 3060 TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCGC .^r^r-Λ y - '/'ΓΠ^-ΙΓΡ U - 'v-nnAi^ t ^ Ι .AAATCGGGGC 3120 ATCCCTTTAG -Τ'ι-Ι','-· . Π"ι-Γ> uu . * GGGCAGGT^G Α··- 7 7 A; ‘v.1 w-ua ACTTGATTAG 3 ] 30 GGTGATGGrI'T C* Λ f~> /-* T "i ·-· Tf'’ ---1 L-awo tn'j l -jvj G G G A Γ C G G G G tgatagacgc TTTGACGTTG 3 24 0 TCTTTAATA3 TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC 3300 TCOGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG GTTAAAAAAT 3360 [-j Aw CT G AI77 AACAAAAATT TAACGCGAAT TAATTCTGTG GAATGTGTGT CAGTTAGGGT 3420 ! C-7GG.AAA3TC CCCAGGCTCC CCAGGCAGGC AGAAGTATGC AAAGCATGCA TCTCAATTAG 3480 i TCACCAACCA GGTGTGuAAA GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG 3540 CATCTCAATT AGTCAGCAAC CATAG7CCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT 3600 CCGCCCAT7C TCCGCCCCAT GGCTGACTAA TTTTTT7TAT TTATGCAGAG 3660 C-CCGAGGCCG CCTCTC-CCTC iGAGCTATTC CAGAAGTAGT GAGGAGGCTT TTTTGGAGGC 3720 CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT TGTATATCCA TTTTCGGATC TGATCAAGAG 3780 ACAGGATGAG GATCGTTTCG CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC 3840 úCTIGGGTGG AGAGGCTATT lGoCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGA7 3900 | GCCGCCGTGT TCCGOCTGTC AGCC-CAGGGG CGCCCGGTTC TTTTTGTCAA GACCGACCTC- 3960 TCCGGTC-CCC TGAATGAACT GCAGGACGAG GCAGCGCGGC TATCGTGGCT GGCCACGACG 4020 GGCGTTCCTT GCGCAGCTGT GCTCGACGTT GTCACTGAAG CGGGAAGGGA CTGGCTGCTA 4080 TTGGGCGAAG TGCCGGGGCA GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA 4ίΐ^ 1 j *\.vA:^A-\jvj CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC CTGCCCATTC 4200 GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC CGGTCTTGTC 4 26 0 GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC CAGCCGAACT GTTCGCCAGG 4320 J CTCAAGGCGC GCATGCCCGA CGGCGAGGAT CTCGTCGTGA cccatggcga TGCCTGCTTG 4 380 CCGAÁTATCA TGí_; *. GGAAAA 7GGCCC-CTTT TCTGC-ATTCA TCGACTGTGG CCGGCTGGGT 4440 i 'o - oGCGGr'-’- G C 7 AT C AGG A CATAGCG77G GCTACCGGTG ATATTGCTGA AGAGCTTGGC 4 5 00 GGCGAATGGG C7GACCCC7T CCTCGTGCT7 TACGGTATCG CCGCTCCCGA TTCGCAGCGC 4560 ATCGCCTTCT 1 ATCGCCTTCT TGACGAGTTC TTCTGAGCGG GACTCTGGGG TTCGAAATGA 4620 ^ C C G A C C AA G C GACGCCCAAC CTGCCATCAC GAGATTTCGA TTCCACCGCC gccttctatg 4 6 8 0 AAAGGTTGGG CTTCGGAATC GTTTTCCGGG ACGCCGGCTG GATGATCCTC CAGCGCGGGG 4740 ATCTCATGCT GGAGTTC7TC GCCCACCCCA ACTTGTTTAT TGCAGCTTAT AATGGTTACA 4800 1 1 AA i AA AG C Art ^ cWiC.A JCAC.A AATTTCACAA ATAAAGCATT TTTTTCACTG CATTCTAGTT 4860
-129- 9 GTGGTTTGTC CAAACTCATC aatgtatctt ATCATGTCTC TATACCG7CG AC77C7AGC7 •i?-3 AGAGCTTGGC GTAATCATGG TCATAGCTGT TTCCTGTGTG AAATTGT7AT CCGC7CAGAA Λ9Θ0 TTCCACACAA CATACGAGCC GGAAGCATAA AGTGTAAAGC CTGGGGTGCC taatgagtga 50« GCTAACTCAC ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTCGGC-A AA C CT G 7 7 G'7 510 0 GCCAGCTGCA TTAATGAATC GGCCAACGCG CGGGGAGAGC- CGGTTTGCGT AT7GGGCGCT 5160 CTTCCGCTTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT TCGGCTGCGG CGAGCGGTAT 5 20 0 CAGCTCACTC AAAGGCGGTA ATACGGTTAT CCACAGAATC AGGGGATAAC GCAGGAAAGA 52S0 ACATGTGAGC AAAAGGCCAG CAAAAGGCCA GGAACCGTAA AAA.GGCCGCG TTGCTGGCGT 5340 TTTTCCATAG GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA AGTCAGAGC- * 5400 GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC TCCCTCG7GC 5 4 5 0 GCTCTCCTGT TCCGACCCTG CCGCT7ACCG GATACCTGTC CGCCT77CTC CCT7CGC-GAA 5520 GCGTGGCGCT TTCTCAATGC TCACGCTGTA GGTATCTCAG i, * Lgj-u ίο i rtL: GTCGT7CGCT 5 5 3 0 CCAAGCTGGG CTGTGTGCAC GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA 564 0 ACTATCGTCT TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA GCAGCCACTG 57 0 0 GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG AAGTGGTGGC 5760 rm i?, π a C(’G CTACACTAGA V'"'^ r+m h m n i. TTGGTATCTG ^ L 1 C 1 L -J aAoCCAG j. t λ 53 20 CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT CCGGCAAACA AACCACCGCT OGTAGCGGTG 3330 GTTTTTTTGT TTGCAAGCAG CAGATTACGC GCAGAAAAAA AGGATCTCAA GAAGATCC7T 5940 TGATCTTTTC TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG 6000 TCATGAGATT ATCAAAAAGC- ATCTTCACCT AGATCCTTTT AAATTAAAAA 7GAAGTTTTA 60 60 AATCAATCTA AAGTATATAT GAGTAAACTT GGTCTGACAG TTACCAATGC 77AAT CAGTG 612 0 ACGCACC7AT CTCAGCGATC TGTCTATTTC GTTCATCCAT AGT1GlCTGA .·-! rp ^ f 1 i m f-> 1. v_ v._ vj L w '-J 613 0 TG7AGATAAC T ACGA í AC'oG GAGGGCTTAC CATCTGGCCC CAGTGC7GCA ATGA7ACCGC 6 2 4 0 GAGACCCACG CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG 6 3 00 AGCGCAGAAG TGGTCCTGCA AGTTTATCCG CCTCCATCCA GTCTATTAAT TGTTGCCGGG 6 3 6 0 AAGCTAGAGT AAGTAGTTCC CCAGTTAATA GTTTGCGCAA CGTTGTTGCC ATTGC7ACAG 6420 GCATCGTGGT GTCACGCTGG TCGTTTGGTA TGCCTTCATT CAGCTCCGGT 7CCCAACGAT 64 SQ CAAGGCGAGT TACATGATCC CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC 654 0 • * • · • · • · *· ( · * · * Ml · · ·» • · · · · » * • · · * · · ai ·» ·· • · • · • ··· • ** - _ j- CGATCG7TGT C A_J. ^ o. OCj-.^ — lGTTATCAj,., j. CATGGTlATG GCAGCACTGC 6 6 00 ATAATTCTCT TACTGTCATG CCATCCGTAA gatgcttttc l GTGíA^ i GGT GAGTACTCAA 6 6 6 0 CCAAGTCATT _ lGAljAATAG <T* ·, Τ'/-* --1 c* ^ ^ Λ ’ <1 .G L.AT-JG^UG OrtL-'GriU *. ^ V3 GCGTCAATAC 6720 GGGATAATAC CGCGCCACAT AGCAGAAC j. - T A *ΑΑΛϋ T G L - CATCATTGGA AAACGTTCTT 6780 CGGoGCGAAA ACTCTCAAGG ATCTTACCGC TOTTGΑ.0·Λ’ΓC ...A.j Γ i. ,A. * ~· T.AACCCACTC 6840 GTGCACCCAA C7GA7CTT0A 3CATC7TT7A CTTTCAGCAG CGTTTGTGGG TG AG C AA.AAA 6 3 0 0 CAGGA--.GGC.-v AAATGCCGCA AAAjAAGGLr.AA . AAvj ioL"gG A. '·._ ACGGAAATGT ^p ^ ", '"Ί /Pmp 1 . UrtJ-L - i-ί1^ iGrt 69 60 TACTCTTCCT T. 1 Γτ-η -n - i . 1 i TATTGAAGCA TTTATCAGGG -ρ ρτ pí Pí i--' /1 ρ fi ATGAGCGGAT 7020 ACATATTTGA ATGTATTTAG AAAAATAAAC AAAT A.o G G G T TCCGCGCACA TTTCGCCGAA 7080 AAGTGCCACC TGACGTCGAC GGATCGGG 7108 V ?. i S T 7 KA. i il .v/E Ν' Γ T ; (A ‘ DÉLKA: 4019 Í3 I TV?: nuklecví i-cys Ť_i"a ?,f_-L rv i v ...,.A3's h N : dvě TV? MG LEKULV: DNA len cmcv.i . - - - A- :*- — : :a : JMÉNO/KLÍČ: - ncn , 3 ; UMIoTŽm::i ač 4 01ř ..... ^ CTCGAGAAAT CATAAAAAAT TTA7TTCCTT TGTGAGCGGA TAACAATTAT AATAGATTCA 60 ATTGí GAGCg TrvM·- AA .. _ TCACACAGAA -ΓΙΡΠ ,ρί -«l ΡΊ/-Ρ Λ Λ j. i ·_ -Λ i. i A G G Λ G ΑΛΑ T T AACTATGAGA 120 CGATGGCATG ACCATCACCA TGALjoA - G s- J. GojTT... . 7_J _ T T G A.AG G G G A w G.ACj\j ;G i .AT 130 TCCACCATCC u o -íAo C aAG 'j .A A G A. G A_roT GuG AAGATCCCTC GGTTGCGCCG CATCCGGGGC 240 GAGAGTGAGC TGTACACCAG X'-jAT.-vn_ a. G i r._ ATG:·- Aé_: ΓvAL C CACAGTTCAT CAAAGCCACC 300 ATCGTGCACC AAGACCAGGC T T AC G ATG AC AAG PvT C T A C T ACTTCTTCCG AviAojGAí, AjH i 360 CCTCACAAGA ATCfTGAGGC TCCTCTCAAT GTGGCCCGTG TGGCGCAGTT GTCGAGGGGC 4 20 gaccagggtg vjLívjAA^GT'1 C - ·_ G.A.AGTGGA. ACACTTTTGT OAAAGCCATG 480 -131- ^ -jG - Λ - CL λ -i 'J. · a. *kj ^ ^ Vj CACCAACkAG AACTTCAACA GGCTGCAAGA CGTCTTCCTG 54 0 L j. -vjr\'w — C CAGCGGCCA GTGGAGGGAC ACCAGGGTCT ATGGTGTTTT CTCCAACCCC 600 TC-GAACTACT - A G C C G T C T G TGTGTATTCC CTCGGTGACA TTGACAAGGT CTTCCGTACC 660 TCCTCACTCA AuGGCTACCA CTCAAGCCTT CCCAACCCGC GGCCTGGCAA GTGCCTCCCA 720 GACCAC-CAGC CGATACCCAC AGAAAGCTTA ATTAGCTCAG CTTGGACTCC TGTTGATAGA 780 TCCAGTAATG “w*’ -· · η ,»-ι "i * * r"i w i 'w- Í^S^. 4- TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC S 4 C ΛΊ^Τ'^ΓΓ'ΓΡ'Π'' “i r^'r—’ o fc * * , h i r* * GGTGAGAAT c CAAOCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA 900 ΛΑΑ TGG A G AA AAAAATCACT GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG 960 AACATTTTGA C-GCATTTCAG TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG 1020 ATATTACGGC CTTTTTAAAG ACCGTAAAGA AAAATAAGCA CAAGTTTTAT CCGGCCTTTA íoeo tto ^γρι'γ’^ίΓ’ φηρρΛ/^ΛρΓΠΛ λ VjU ‘-.l— 4J ίν '-v * 4j ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG 1140 '-í - 'oí-wCTLjG -. GATATGGGAT AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG 1200 AAACGTTTTC ATCGCTGTGG AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT 1260 ATT C u l Aau A TGTGGCGTGT TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTC- 1320 AGAA.TATGTT TTTCGTCTCA GCCAATCCCT GGGTGAGTTT CACCAGTTTT GATTTAAACG 1380 TGGCCAA.TAT GbACAACTTC TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG 1440 C-CGACAAGGT GCTGATGCCG CTGGCGATTC AGGTTCATCA TGCCGTCTGT C-ATGGCTTCC 15 Q 0 ATGTCGGCAG AATGCTTAAT GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT 1560 AATTTTTTTA AGGCAGTTAT TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG LS 2 0 acgcatcaaa ΦΊ Ί ' >l V *i * lw AJ f νΛ-ίΛ uGC \l CAoi. CG AAAGACTGGG CCTTTCGTTT TATCTGTTGT 163 0 TTGTCGGTGA ACGCTCTCCT GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT 1740 TTCGGTGATG .‘-Vw — o 1 CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT 18 C 0 CTOTAA-; Gu ATGCCGGCAG CAGACAAGCC CGrí. CAGGuCG CGTCAGCGGG TGTTGGCGGG 1360 TGTCGGGGCG CAGOCATGAC CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT 1920 atc-cggcatc AG-ťauCAGAT i GTACTGAGAG TGCACCATAT GCGGTGTGAA ATACCGCACA 1980 gatgcgtaag áj ag AAAAT c CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC 2 04 0 TGCjCTCGG i A:’! CGGC - G CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT 2 100 132- * · · I » «Μ • · * * * · » ♦ *s ο ► • « • ♦ · • « ι · Μ TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC CAoCAAAAvjG 2 16 0 CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG 2220 AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA C CCGACAGGA ΓΤ1 Λ-» >y ·* % /“Ί -<l Girt; MrusLrrv a - q > ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC tgttccgacc L· * k i-.-i 2340 CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT 2400 GTAGGTATCT CAGTTCGGTG TAGGTCGTTC gctccaagct GGGCTGTGTG CACGAACCCC 2 4 0 0 CCCTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGT.AA 2 5 2:) GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG 2 5 S 0 TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACA^T AGAAGGACAG 2 64 0 TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT 2700 GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA 2 760 CGCGCAGAAA AAAAGGATCT CAAGAAGATC TTCTACGGGG TC7GACC-CTC 2320 AGTGGAACGA AAACTCACGT TAACGGATTT TCGTCATGAG ATTATCAAAA AGGATCT7CA 28 8 0 CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA T ATGAGTAAA 2 i»4 0 CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ^ rn^rr r-^ “Ti 3 0C0 CA TAGCTGCC TCACTCCCCG i Cv/TíjTAGAT Ař\C. IACGATA CGGGAGGGCT 3 OSO TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT 3120 TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT 3130 CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA 3240 ATAGTTTCCG CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC 3300 GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT 3360 TGTGCAAAAA AGCGCTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AA^jXTGGC j 3420 CAGTGTTATC A v. l ATGG [ X λ IGCGAGCAC TGCATAATTC TCTTACTCTC ATGCCATCCG 3 4 3 0 TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC 3540 GGCGACCGAG TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAG.AA 3600 CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC 3 66 0 CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT 3 7 2 0 TTACTTTCAC CAGCGTTTCT GGG'rUAGCAA AAACAGGAAG GCAAAATGCC G C AAAAAAGG 3 7 30 v * v * ψ I *«· » · * « • f · I · · · • I » · ««·· * • * * * · GAATAAGGGC GACACGGAAA TGTTGAA.. Al TCa A^ - CGTTT* TCAA TATTATTGAA 3340 GCATTTATCA GGGTTATTGT CTCATGAGCG GATACATATT TGAATG7ATT TACAAAAATA 3 00 0 AACAAATAGG GGTTCCGCGC ACATTTCCCC •jíáAAAvgtTGC - ACCTGACGTC TAA.GAAACCA 3 0 6 C TTATTATCAT GACATTAACC ^ !)_- .. " n-c.r^^Tr^c 'jA'jG ^ T ^ CGTCTTCAC 4 013 INFOrOTAC F, O S F λ 11, M·. !C i POČET VLAKEM: dvě TY? MOLEKULY: LNA qensmova CrJLPAKTEPI STICKE P.Y3Y: :a:· ΤΜΞΝ6/KLLČ : ·.· r.
ta; 'JMI STEM' POPIS 3 ΕΚΥΕΜ6Ξ I CTCGAGAAAT CAT.AAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT AATAGATTCA 6 0 AI ;Oi GATAACAATT TfACACAGAA TTC.ATTTl.YAC Ag GAC'<“~i“iA 1 . .-GT.L i .-i i ^Α.Ο*Λ IÓ0 GGATCGCATC ACCATCACGA .•’ΤΤ ^ 1—1 i. _ CCGCATGCGA ·**^~* *% '‘nmnuT’^ •^'w i. F.4,L' .. \j· 'wA;rx'ij - b.-.ljG ISO CAGGTGCCCC TGGACCTGTG TGAGGTCTAT GGCGuuGGCT GCCACGGTTG CCTCATGTCC 240 CGAGACCCCT ACiGCGGCTG gGACCAlhLjGC CGCTGCATCT CCATCTACAG CTCCGAACGG 300 TCAGTGCTGC Ί <~n rt η λ AAílgA: *y4—-v TCCAGCCGAG CCACACAAGG AGTGTCCCAA CCCCAAACCA 3 a 0 GACAAGGCCC CACTGCAGAA GGTTTCCCTG GCGCCAAACT CTCGCTACTA CCTC-AGCTGC 4 20 CCCATGCAAT CCCGCCACGC TGGCGCCACA AGGAG:AAgG i .jGAgCAGAGG 4 3 0 TGCGAACCTG GTCACCAGAG CCCCAACTCC AT ‘Z C T G T T C A *lGAGAA._'·- , gALGCCGC^G 540 CAGTACGGCC ACTACTTCTG C G A G G L C C A' GAGGGCTCGT ALTT^-G^A vjUCLCAíjCAC 600 TGGCAGCTGC TGCCCGAGGA CGGCATCATG GCCGAGCACC TGCTGGGTCA TGCCTGTGCC 6 6 0 CTGGCTGCCT CCCTCTGGCT GG^ljG .. v GTo CCCACACTGA GTCTTGGC7T GCTGGTCCAC 720 GTGAAGCTTA ATTAGCTGAG GTTGGAGTCT .. ! J . v .J J-*. .. .-1. sj ‘Λ T GC AG G AATG A C C T C A G A A C 7 8 0 TCCATCTGGA TTTGTTGAGA ACGCTCUGTT - .j * * > - ^ ^ * -j\j v uí\u Art 1 L 840
* » * • * * * · • » 1 * * « * * * II M ▼ - - * m • · *1 · ► · * * » * é · * * «* *· · · *· * * * • · * M ** -134- .“V 0 . x x. TTCA,GGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT 900 '<*Ι^Γ*.Τ.-Υ ^ A'n- CA 2lG -TGATAT ATCCC.AATGG CATCGTAAAG AACATTTTGA GGCATTTCAG 960 TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG ATATTACGGC CTTTTTAAAG 1020 ACCC7AAAGA AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG 1080 Λ I1^ 1, 1 ^ i·-’ "’rT’lr—' t\ _ Ό r\J-\ J. '- . i. ^ ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT 1140 AGTC-TTCACC CTTGTTACAC CGTTT7CCA7 GAGCAAACTG AAACGTTTTC ATCGCTCTGG 1200 Akj T 0 AA T A C C AC G A.C G AT T T CCGGCAGTTT CTACACATAT ATTCGCAAGA TGTGGCGTGT 1260 TAlGG * G AA«-\ ACCTGGCCTA TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA 1320 ^ ^ λ ^"P £ T GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC 13 3 0 TTCGCCCCCC- TTTTCACC.AT GC-GCAAATAT TATACGCAAG GCGACAAGGT GCTGATGCCG 14 4 0 CCuGCGATTC AC-GTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT 1500 GAAC T A C AAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AGGCAGTTAT 15 6 0 TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA 1520 kiv’ - iCAGTLG AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT 1630 G Α.ϋ T Au G A C A AATCCGCCGC TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA 17 4 0 GCTCTGACAC ATGCAGCTCC CGGAGAlGGT CACAGCTTGT CTGTAAGCGG ATGCCGGGAG 13 00 L AG AL AAG C C CGTCAGGGCG CGTCAGCGGG TGTTGGCGGG TGTCGGGGCG CAGCCATGAC 1860 CCAGTCAGGT AGCGATAGCG GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT 1920 GTAuTGAGAG TGCACCATAT C-CGGTGTGAA ATACCGCACA GATGCGTAAG GAGAAAATAC 1930 C^-'Γ' Λ 'Τ' ^ Λ ,·-> ι-' >-* 'vUL.-. - GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CTGTCGGCTG 2 04 0 U'Avj'._ -'G - A. i T hIj C 11 A. ..TCAAAGGCG GTAATAí_GGT TATCCACAGA ATCAGGGC-AT 2100 AACGCAGGAA AGAACATGTG A- g aaaag g c CAGCAAAAGG CCAGGAACCG TAAAAAGGCC 2160 'o ·._ G - V Gl G G CGTTTTTCCA TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC 2220 T C AA G T C r\G A CG . GGCGAAA CCCGALAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA 2280 AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT 2340 CTCCCTTCCG GAAGCGTGGC CCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG 2400 TACGTCGTTC -‘lA.o _T GoG-^TGTG i. G CACGAACCCC CCGTTCAGCC CGACCGCTGC 2 4 6 0
* * * · · » · · * * · * t II • · M • * · « « • * 1 φ ·« «» % · * » ¥ · * * ·#· * · • · v %· M -135- GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG ~ ®l .«« •2* «.· «_ J GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC Z S 3 0' TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG 2640 CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC 2700 GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA Am^AljGAGC Τ’ 2 7 6 0 CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT 2 32 0 TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA 2330 AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA Λ>ΤιΥ·ρ n-Trurr’ *s Ui j. i urt CAGTTACCAA — ^4 0 TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGCTGCC 3 0 00 TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG CCCCAGTGCT 3060 GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA 312 3 GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT r'' /-» r·· ^ >-p CCAGTCTATT 313 0 AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT 3240 GCCATTGCTA CAGGCATCGT GGTGTCACC-C TCGTCGTTTG GTATCGCTTC J. 1 ιί- ! I_L 3300 GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA AGCGGTTAGC 3 3 6 0 TCCTTCGGTC CTCCGATCGT tgtcagaagt AAGTTGGCCG CAGTGTTATC ACTC.ATGGTT 3 4 20 ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT 3480 GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC 3 540 CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT 3 600 GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG ATCCAGTTCG 3óo0 ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT 3723 GGuTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG gaataagggc 'jA.uAuGGAArt 3 "50 TGTTCAATAC TCATACTCTT CGTTTTTCAA TATTATTGAA gcatttatca JVI . . A ! TO 3 340 CTCATGAGCG GATACATATT TGAATCTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 3 900 ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA TTATTATCAT GACATXAAC1- 3 960 TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 3 5 99 « *·*
• « * * • « ·
' ' 37*";”^· J -: ---- - ' : 41: ·, - : : HA=a?:7gr;ít -ozkyelí _j Z: --- KA: iitř. p ir': ca1 ;B; ty? ’<v5íl ixa i.;· ?tč ^ v ' * "T* ; ·. D : Τ' ?' earr- MCYTKYL' '.Tčr. .'TCV; ·» L'A > i:< : "* * ΓΪ. Zí “ rt"’1 — ^ r ' —í*A.t\ * λλ: o zz-zzz a:lv- i\, J\1^ 1jC, KLIČ: ex. cn :=·: um: · 5 T !LL L : 1 .á z - ;xi ! ?C?I3 3£KVEř JCE ID-C: 4. GGCAAGGTCT acctctttga CTTCCCCGAG GGCAAGAAcG CATCTGTGCG CACGGTGAGC 120 CTCTCTCTTT CCCCAACACC CCCCCTACCC CCTCTGGCCC TGCCAAGGGT 18C CCTCAGGGAA TCCGAGGGAG 'VfT|n,irt»mf*irnp —' tt·”111 τ^ι'"·'—1 GCClCCACCT CCGTATCCTA 24 0 TAAATGGCTC CTGGGGGAGC- CTCCCTAAAG GTAGTCCAGA TTGGAGTGGG GAGCTGGGGC 300 ggtgtggaga AAAACAGGAG CTAATGGGCC TGGCCAGCTG GGCAGCGCTG CTGCGGAAAG 360 CCCAGGCTGG AAGCTGGGCC ccagagccca TGCCTGGTCT TCTGAACCCT CTGGGCCTCA 420 GCTGTGGATA TGAGACCCTG TTTGACCTCA GGTAGATCAC tp i CGCTC^0 AGAijCCCCAG 480 TTGCTCA'1'·''’'1' ^ /-i λ ·\ ,-“i j. L.J.L-n i •-•ftu AATAATCGTT 'T1' O f~+ γτι o\_ i i *_!·__x. 1G GGGCTTATCC j. «jALio^- x v7 i. 'w 540 TGGAAAGCAT TTCAGGGGTA CCTCACCCCT GGCAGATTGA ACTAATGCTT CTCCCCTTCC 600 CCAGGTGAAT ATCGGCTCCA CAAAGGGGTC L 1.GTCTGGAT AAGCGGGTGA GCGGGGGAGG 660 Γ1 ^ '^'/Tpnn Λ GGTCTGAGCC acttggtaaa ťoGGAGAGGAG ACCCTGAGGG TCTAAGGAAG 720 uAAoCA i GGC CCTGCCCCAC GACTCCCAGA ..tgatcogga GACGTGGTCC TCTGTGCTTA 780 CGG^-ATGGw TCAGCTGCAC acactctggg .ίΐτ'ΛΦΑΓ'πηηπ AGGCTGTCAC CTATGCTAAG 840 CCCTTCTGAC SCCTTCTT'''' i --n.; GGGTCCTAGT GCTAGGCTTG CCAGGGCCTT 900 CCAGCAACCA ATTTCTCTCC 'Τ' i'1·' Λ’1 /~»pprp^*> CTTCCCCGGG CAGGACTGCG AGAACTACAT 960 CAC7CTCCTG 0 r**'—' *“*- O O _1 j Cjí*\ >* *A-LjOO"i-JÍ— - JCTGGCCTCjT GGCACCAACG CCCGGCACCC 1020 CAGCTGCTGG AA^CTGvj -oa gaaggctgct CCCCATGTGC CTGATCAGCT CACCTTCTAC 1080 λ U··J * 'sjUVJ^ v i !--i c l l l rl AIGGTCOGaA τ*/*» λ ,··*’ λ r~* o r-\ -A^JrtA_;rt t'JuL1 j AGA'._ i CCkaT gctggccttg 1140 -137- CC'- .GGOAGG A ^ GGGGCTCC TGGCCGAGAA ACTGGCCGTC ATGGGAGGCA GTGGCTGTGG 1200 *A*.\jTGG CCATCCAACC CTCTGGATCT CCCACAGGTG AATGGCACTG TGGTGCCACT 1260 í 'j. G ACAGGCTACG CCCCCTTCAG CCCGGACGAG AACTCCCTGG TTCTGTTTGA 1320 AGGTTGGGC-C ATGCTTCGGA ACTGGGCTGG GAGCAGGATG GTCAGCTCTT TGTCCAGTGT 1380 crn.^ λ. '*' ·* C-ACTTCCAGG AGCTGCCTGC CCTTACTCAT TTCTCCCTCC CACTGACCCC 1440 AGGC-GACG A G GTGTATTCCA CCATCCGGAA GCAGGAATAC AATGGGAAGA TCCCTCGGTT 1500 CCGCCGCATC CGvjvjvj C Lr AG A GTGAGCTGTA CACCAGTGAT ACTGTCATGC AGAGTGAGTC 1560 AG G CT C C GG C TC-GGCTGAGG ^ *. GuGCA-.Cjo GC-GTGTGAGC ACTTAAGGTG GCAGATGGGA 1620 TCCTGATGTT ictgggaggg CTCCCTGAGG GCCGCTGGGG CCATGCAGGA AAGCAGGACC 1680 TTGGTATAGG CCTGAGAAGT TAGGGTTGGC TGGGAGCAGA GGAACAGACA AGGTATAGCA 1740 rr-i ,Ί -* r»-T^r»/^ VJ v Ο'-Γ'-Α.ΓΊ. * CCCAGCCCTC TTCAC-GAACA CAAACAGAGG GAGCCCCAGA CCCAGTGCAG 1800 GC-TCCCCAGG AGCCAAAGTT TATCCTCTGC TGAGTTCACG TGGAGGCAGC CCCCCAACTC 1860 CCTCCTCATC AGGGCTCTC-C CAATTGAGCA GAAGTGACAT AGGGGCCCCC AGGGACCTTC 1920 CCCCACTCCC CAGGCATGAA GTCATTGCTC CTGGGCCGAT GACATCTTTG TAGGAAGAGG 1980 GCAAAACAGC- ΦΛ'ΤΓΓ',^ΡΤΓ’Γ’ AGGTGCAGGG TCTAGGGCCC CTCGGGGAGT TGGACCTGAT 2040 GTTATGAGTC rT^rTCCAGA ^/-7Γρ^-Ί ^ i *, L *. vJ.-n* la* CATGGTTTGT GCAGACCCGA AGGAGGGAGG 2100 agagtgtgca GGGTTGGAAT GGTCTCCCGG GCAAGCTTCC CAGCCTTACG CCCATTCGCT 216 0 TCTGGC-CCCT GGGAGACCCA CAGTTCATCA AAGCCACCAT CGTGCACCAA GACCAGGCTT 2220 ACGATGACAA GATCTAC7AC TTCTTCCGAG AGGACAATCC TGACAAGAAT CCTGAGGCTC 2230 CTCTCAATGT GTCCCGTGTG GCCCAGTTGT GCAGGGTGAA CACGGGCGTG AGGGCTGCTG 2340 GCTACGTGTC TGTGCATGAA TAGGCCTGAb TGAGLGTGAG TTCTGTGTGT CCGTGTGCAT 2400 u .. Av-íA^4·'* * * J TG iGGA-íjT A TGAGTgGO * L. TGTGTCAGGG ACTGTGGGAG CAGCTGTGTG 2460 TGCATGGAGC ATCATGTGTG TGTGTGTGGG TAAAGGTGGC TGAGCTCCTG TGCACGTATG 2520 ATGGCGTGTG agcgtgtgta TGATGCGGTG TGTGTGTGTG TGTGTGTGTG TGTTTTGCCT 2580 GTGTGAA -‘GT CCTGTGCCAC GTATGTGGGT GCACTCTCAC gcgtgagtca CTGCCCTGAC GTAAATGTGT CCTGGGCACT GTCTGAGTCC GCTGGCCCTG 2 64 0 2700 ^ ,G U - ^ ^ - i UoLi u A gí-íu .". r* r-f-1 r·"· ^ 3 G A 1 * CAGCCAGGCC TGCTTCCAGG AGTCTCATCT GGAGACCTGC CCTGAGTCCT 2760 CGGCAGGTCC TGCCCCCTCG CAGCCTGCCT TCCTCCTCTG GGCCCAGGTG 2820 -138- TTGATATTGC TGGCAGTGGT TTCCTGGGGT GTGTGGGGAA GCCCGGGCAG GTGCTGAGGG 2330 GCCTCTTCTC CCCTCTACCC TTCCAGGGGG ACCAGGGTGG GGAAAGTTCA CTGTCAGTCT 2940 CCAAGTGGAA CACTTTTCTG AAAGCCATGC TGGTATGCAG TGATGCTGCC accaacaaga 3000 ACTTCAACAG GCTGCAAGAC GTCTTCCTGC TCCCTGACCC CAGCC-GCCAG TGGAGGGACA 3 060 CCAGGGTCTA TGGTGTTTTC TCCAACCCCT GGTGAGTGGC CCTTC-TCCTG GGGCCGGGGC 3 120 TGGCATTGGT TCAGTGTCCA GTAGGGACAG GAGGCCTTGG GCCCTGCTGA GGGCCTCCCT 3 23 0 GGTGTGGCAG GAGCAGGGGC TGCAGGCTCA AGAGGCTGGG CTGTTGCTGG GT0TGGGG7G 3240 GGGGGACAGC CAGTGCGATG TATGTACTGT TGTGTGAG7G AGTCTGCACT CATGGGTGGG 3 3 0 0 TGTGCATGCC CTATATGCAC ACTCATGACT GCACTTGTGC CTGTGTGTCC CACCACCTGC 3360 TTGTGCCGAG AGTGGACACT GGGCCCAGGA GGAAGCTGCT GAAGCATCTC TCGGGGAGCT 3420 GGGTGCTATT ACACCTGCTC AGGCACTGCC TGAGCCCGAT AATTCACACT TCTTAATCAC 3430 TCTCATTGAT TGAACACACG GCAGGCGC-AA GTGTTGGGTG TGTGT^GvjítA GAGTTAGGGA 3 54 0 TAGAGTGGAG GAAGCCAAGA CCCTGCTCTG TGGCTCCTGG GTGAGTGGGT CCCCCAGGCT 3 500 GCGAAGGGGT TGGGGGTCTG GCCTCCTGGG GCATCAGCAC CCCACAGCCT GTGCCCAGGG 3660 AGGGCTAGAG AACTGCTCAG CCTATGATGG GGTTCCTCCT GCCTTGGGGT TGGGTAGAGC 3 720 AGATGGCCTC TAGACTCAGT GATTCTGTAA CAGGATACAA lT" Γ M 1 1 I*—1 <T i"·'** ΓΠ Γ·"Ί AJ _ L'^r „ i. i. TAAATTGCA 2730 GCrtCAAAGAA ATTAGGCTGA ACTCCTCTCC TTCCTCCTCT Qr i—11—^ Λ rr»í"prprp r"·· V'-Λα. j. L G 3340 TGGTGGTTGG CAACTCAGTG CCAGGCACAA GGCTGGCCTG GGTGAGTGGA GGTGGATGGG 3 900 TGGGTTCTGG GCCCCCCATT GAGCTGGTCT CCATGTCACT GCAGC-AACTA ercAGcccTc 3960 TGTGTGTATT CCCTCGGTGA CATTGACAAG GTCTTCCGTA CCTCCTCACT CAAGGGCTAC 4 0 20 CACTCAAGCC TTCCCAACCC GCGGCCTGGC AAGGTGAGCG TGACACCAGC ^ v-’ L \JV -w ^ U Akj 40 30 GCCCAGCCCT CCTTCTGCCT CACCTCCCAC CACCCCACTG ACCTCGGCCT CCTCTCCTTG 414 0 CCCAGTGCCT í-CCAGACCAG CAGCCGATAC CLACAGAGAí. CTTCCAGGTG oCTGACCGTC 4200 ACCCAGAGGT GGCGCAGAGG GTGGAGCCCA TGGGGCCTCT GAAGAOGCCA TTGTTCCACT -* j ó 0 CTAAATACCA CTACCAGAAA GTGGCCGTCC ACCGCATGCA AGCCAGCCAC 'oGgGAGACCG 43 20 TTCATGTGCT TTACCTAACT ACAGGTGAGA GGCTACCCCG ggaccctcag TTTGCTTTGT 4 3 30 AAAAACGGGC A I GA/-\MLA.:j 1 i >\AGl?hA I AA TGTAGTTAAC A í L ΓGG T T G G ATCTTTACAT 4440 • **· * «« * *« * I » » * * · G -GGAAGGAA - .--n.T 7 Z A 31T 7 AC i G-GAG ^ TG * C, *,-\L:GLj\j i i .A . — ,-lrr Vj\j GTGTGGAAGA 4500 GLCAGGCAúG j AL- ag cttcc TG*jA:^jGfn.ij'j - Au-ovjGCAAGA GGGAAAGGGG GATGGGAGAA 4560 AAuCAAC-CAC * G^GATTTGG ι,.-Ή'πη,-' « ^ λ r\ v_rU ό 'u1 - •W 4. ajLí.nUrtG * W TGAGCAAAGC CAGGTGCACC 4620 tttggtccag «-- - i ·ν_ .GALT G AG G \ j AAG r'.-"' ,-i ^ ΓΓηΓ-ίφη Ί gn 1 'jVj AGAGACGTGG CAAATGAGGA 4680 ggaggggccc G AA C C A C A G G GATACTGGCC . ·_ 1. AgAA lGAGGG AGTCAGGCCC 4740 tgcgcctctc - ixGGGATTG TGCAGGTGAG AA i j AAA C A T T 7GAGGAGTTG ATGGGGCACA 4800 AATTAGGTAT *_» .-\vj T7CCAGGCGG ,Ί vn ' ' /-«f-irn<—Λ"» «. i. 1 GCCATCTCAC AGAGGACAGG 4860 GC-CAGCTTCT r*t r-i ^ m G GAG 7AGGC C C?’vC i LtGGGo Λ f*.'*'T«·“· "‘OI·'-»^ Aft jv. * i GAATGCCGTG 4920 GGAGATGCTC GAAAGC CAC A GGACACGGAG GAC-CCAGTCC TGAGTTGGGT 4980 TTGTCGCAGC TTCCCATCCC AGCTGCCT7C CTTGAGACTG GAAAC-GGCCT CTAGCACCCC 5040 TGGGGCCATT CAATTCAGGC ιπΛη(-ιη.·'Αίπ^Λ AACCTCAGTT GTTCACATTC CCCATGTGAT 5100 CTCCTGTTGC TGCTTCACCT TGGGACTGTC TCGGCTTTGC- TC-ACCTTGTA GGAAACTGGA 5160 ACCCCAC-CAC v— ·£"~1. i .Ui. L aGL /—i /-i ^ AGGAATTTCC CACAuGGCAG 5220 GGCCTGGGTC GCCTCTTTAC TCCCTATTCA TCCCGGCTAC ACCCTTGGGC 5280 CCCCATCCTT GCTTGGCTCC AGTACTC-GCT GGCACAGCTG TTGTGGTCAT GCAGGGATGG 5340 CAGGGCACTG G G G AACAG AA gAGAGAGGTC ACACAGTGCG GAACTGGGAG Γ' Λ CiC Λ ^ 540 0 GACAAGGAAG GCTGGACTTG GC-CCATC-GAT TCCCTTCCTG CAGACTTGGG AAGTGAGCAC 5460 ACTTGAGTGA TTAGAGAAGG p Ι'Γ1/'11‘: L. * ^‘--‘.o^-vjv-A U TC-GAGGAGGC ACCATTTTGG 5520 AGCCTGCATC A , X_SJ ..Λ* k * Gvj\_-CTAGATT ^^jaAA-í-i κ AgA GCT j. * GTAA-O TCCTCTGCAG 5580 AGAATGGGAG CCTCTCACAA CTGGGAGAAG TATTGGCTCT TTTCCTGAGA ATTTTGCCAA 5640 GGGTATGC.. G T T A C T G G G G C TGGTTTGGAA 'ok.* A; j7 Α7 AGG GCATTATGTC TGTG.AA.GGCA 5700 GTGGCTGGCG 7GGGGCCTTA TCACGCCCAA GGAGCATCTG GCCACATCTC AGAGTCCACA 5760 GATGAuGA. . G a^GuA 1G .. j - Aj AGG AAACA i· ·— G ·. ,Í"V--J A. VJ CCAATCATCT GACTGCTTTT 5820 TTGGGGCAGC 1 U.M. * Ό '·_ w ^ L\J l—· í' -Ά--.Α T T g g g AGG í j AG G G AG AGAGGGAGGT AGGCTATTCT 588 0 AGAAAC i G'oG AGAGCAGGTG AGGTAGGATT GGGAGGACCA GGGGTCAGGG TCCCCATTGG 5940 TCCCTAATTG AG AAO jU’r.'on GAGCATTGGT CTAGGAGGCA GGCAGCTCGG TTATAAGACC 6000 TTGGGAAv.TC TTGATTTAGA atccaagatc CTTTTTAGAT CTAGCATTTT ATAAAATTAA 6060 GATATCCCCT AAGATCAAAT '-ív.í-v.-.CGTgGA G7CGTGAAT7 GGATCCTAGA ACAGAAGAAG 6120 •jfVwATTTGTG vjrtAAAA CT AG TGAAATCCAA ATAAAGTCTG TAGTTTTGTT AATAGTAATG 6180 CACCAATGTC AGTTGCCTAG TTGTGACAAA TATACCGTGG TTATGTAAGA TGGTAACATT 6240 ^v-*"u vj Gvj ΑΛ C T GuAGAAGGGT AGATTGGAGC TCTCTGTACT ATCTTTGCAA CTTTTCTGGG 6300 •^T C T ΛΑΑΑ T TACTCCAAAA ΤΑΑΑΑΑΑΑΛΑ ATGTATTTAA AGTAAATATA TTCCCTAAGA 6360 GTCCAC-GP .G CAGGGGAGTT GT AGAAGCA j CTGAGTGGTT GGGT1GTGAC AGATTTGGTT 64 2 0 CCAACTCGGT -TCTGCTGCT CACCAGCTGT GTGACCTTGA GCAAGTGGCT TAGCCTTTCT 6480 TCCTTATCTG TGGAGTGGGG AAGATGACAG CCACCTCGCA GGGCTGTGGA 6540 GGGTTAAACG Au-GTGATGCA TGGACAGCAG CCGCACTGAC CTTGCTGGTG TGGGGCTCCT 6600 GCTTCTGTTC TTCCCGTGCA GCCTTGGGAA TGTTGGAGGC CGTATCCAGG GACCCCTGGG €660 CCTCCTGGGA '“'Λ"’ rr> ^i-p^rp * :L GGATCAGCCT TC-GAAGGTTC CAGGCTGCCC TTAGGCTCCC 6720 ACATTC7TCC CCAGTCACGC TCTCCTCGCC CTGCCCACAC CAGTCCTGTG ACCCTTGCCT 6780 GAGTTGTGA·'"· T7CCCACCCC TCCCCGGCCT AGAGGAAACC TGCCTGGCCC CTCAGTGGGA 684 0 CTCCCGCCCA CTGACCCTCT GTCCACCATA CACAGACAGG GGCACTATCC ACAAGGTGGT 6900 GC-AACCGGC-G GAGCAGGAGC ACAGCTTCGC CTTCAACATC ATGGAGATCC AGCCCTTCCG 6960 CCGCGCGGCT GCCATCCAGA CCATGTCGCT GGATGCTGAG CGGGTGAGCC TTCCCCCACT 7020 GCGTCCCATG GGCTATGCAG TGACTGCAGC TC-AGGACAGG GCTCCTTTGC ATGTGATTTG 7080 <r^ ,τ^ι^ρ /^r^m /^ίτ,,*·ρρ TAAGAGCTTG TAGGCCTTAG GGCCTGGACA TTTAGCACTG AGTGTGGGGT 7140 CCTGACCCAA TCCTGCTGTC CTTCCAGAGG AAGCTGTATG TGAGCTCCCA 7200 GTGGGAGGTG AGCCAGGTGC CCCTGGACCT GTGTGAGGTC TATGGCGGGG GCTGCCACGG 726C TTGCGTCATG TGCCGAGACC CCTACTGCGG CTGCGACCAG GGCCGCTGCA TCTCCATCTA 7320 CAGL ICCCjAA CC-GTACGTTG GCCGGGATCC CTCCGTCCCT GGGACAAGGT GGGCATGGGA 7380 C AC u G G G A l? i '-J , i. O i, JUG CTGGAAGAGG TGGCGGTACT GGGCCTTTCT TGTGGGACCT 7440 C CTCTCTAC: I*’·'-’ *· Λ Λ {- TAGQGGTAAG GATATGAGGG TCAGGTCTGC AGCCTTGTAT 7500 CCGCTGATCC TCTTTCGTCC TTCCCACTCC AGCTCAGTGC TGCAATCCAT TAATCCAGCC 7 560 G A G C C A C A C A AGGAGTGTCC CAACCCCAAA CCAGGTACCT GATCTGCCCC TGCTGGCGGC 7620 TGTGGCCCAA TGAGTGGGGT ACTGCCCTGC CCTGATTGTC CTGGTCTGAG GGAAACATGG 7680 CCTTGTCCTO TGGGCCCCAG GTACA íLjGOG CAGGATACAC TCCTGCAGAG GGAGCCCTCT 7740
• * · · · · *«· «*« * · « · * · % * · 4 «II · * « · I · * * * * · I « -14 TGOTGGGATG AGCGAGACGG GAGAAAAAAij GAGGACGCTG AeiGGC lGiju _ TCCCCA'^1'^— T30C CATTCAGAAG CCTTGTCCTG CGA "JCCAG'T' ''•''GTGGGGAG GACACATCCT · UUUftO 7 3 5 C CTCTTTGTCC CTCCTCACG: .. ď" .20. 2CTCCC C AG AC AAGGC TCCACTGCAG 7 22 0 AAGGTTTCCC TCGCCrn· ·.. 1CTCGCTAC TACCTGAGCT GCCCCATGGA ATCCCGCCAC 7 98 0 GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAGCAGA GCTGCGAACC tggtcaccag aoic AGCCCCAACT GCATCCTGTT CATCGAGAAC CTCACGGCGC AGCAGTACGG c c actact t c 3 10 0 TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC ACTGGCAGCT G ^ ^ ^ "i ^ J ^ *- -J — ^ oAu 3160 GACGGCATCA TGGCCGAGCA CCTGCTGGGT CATGCCTGTG CCCTGGCCGG p1^ r*«-»/", rp ř-« -~t 322:] CTGGGGGTGC TGCCCACACT CACTCTTGGC TTGCTGGTCC ACTAGGGCCT CCCGAGGCTG 82 3 Γ GGCATGCCTC AGGCTTCTGC AGCCCAGGGC ACTAGAACGT CTCACACTCA gac-ccggctg 8240 GCCCGGGAGC TCCTTGCCTG CCACTTCTTC CAGGGGACAG AATAACCCAG iGGaGGATGC 3400 CAGGCCTGGA GACGTCCAGC CGCAGGCGGC TGCTGGGCCC CAGLrT gg c g c acggatggtg 3 4 o 0 AGGGGCTGAG AATGAGGGCA CCGACTGTGA AGCTGGGGCA TCGATGACCC AAGACTTTAT 6520 CTTCTGGAAA ATATTTTTCA GACTCCTCAA ACTTGACTAA ATGCAGCGAT GCTCCCAGCC 35 3 C CAAGAGCCCA TGGGTCGGGG AGTGGGTTTG GATAGGAGAG CTC-GGACTCC ATCTCGACCC 3640 TGGGGCTGAG GCCTGAGTCC TTCTGGACTC TTGGTACCCA CATTGCCTCC TTCCCCTCCC 3700 TCTCTCATGG CTGGGTGGCT GGTGTTCCTG AAGACCCAGG GCTACCCTCT GTCGAGCCCT 8760 GTCCTCTGCA GCTCCCTCTC TGGTCCTGGG TCCCACAGGA CAGCCGCCTT GCATGTTTAT 9320 TGAAGGATGT TTGCTTTCCG GACGGAAGGA CGGAAAAAGC TCTGAAAAAA AAAAAAAAAA 8330 AAAAAAAA 8383 INFORMACE O SEKVENCI ID. C.: 42: (i) CHARAKTERISTIKA SEKVENCE: (A) DÉLKA: 6622 párů baui í B) TYP: n u k 1 e o vď kyselí r. a (C) POČET VLAKEM: dvě
(D) TOPOLOGIE: lineární (.11) TYP MOLEKULY: genomovd DNA (ix) CHARAKTF.RIÍ5TI CKK RYKY: (A) JMÉNO/KLIČ: exon (B) UMÍSTĚNÍ;1 až 6622 • · · · * »· • I» :ί -: ?C?IS 3 5KV -C.Č: : GATATCATGG AGATAATTAA AA T G AT Aa '* G AT CTC G C AAA TAAATAAGTA «-prrvrpfp^^ip^fpíp 60 TTCGTAACAG TTTTGTAATA c c t a ATTCTTAGTC AACGTTGCCC 120 GGTCGTATAC ^ - -A-a «v_. - g ·. sJ*jvjvjA TCCGCCCAGG 180 GCCACCTAAC- GAGCGGACCC cgcatcttcg CCGTC7GGAA AGuCCATGTA GGGCAGGACC 240 GGGTGGACTT TGGCCAGACT gacccgcaca /**/"· ’Τ'/*' p/ftfrtmrp 1 L L L i. CCACGAGCCA GGCAGCTCCT 300 CTGTGTGGGT GGGALrGACGT ggcaaggtc? . nprripmrnmr' Λ A<- - '•w- *- * *. urt CTTCCCCGAG GGC AAG AAC G 360 CATCTGTGCG CACGGTGAA? ATCGGCTCCA CAAAGGGGTC CTC-TCTGGAT AAGCGGGACT 420 GCGAGAACTA CATCACTCTC CTGGAGAC-GC GC-AGTGAGGG GCTGCTGGCC TC-TGGCACCA 430 ACGCCCGGCA CCCCAGCTGC TGGAACCTGG TGAaTGGCAu TGTGGTGCCA CTTGGCGAGA 540 TGAGAGGCTA TGCCCCCTTC Ac-CCCGGACG AGAACTCCCT ^ ^2 τ‘T q τ' ”*'τ* T T GAAuGgGACG 600 AGGTGTATTC CACCATCCGG AAGCAGGAAT ACAATGGGAA GATCCCTCGG ΙΓ’ΤΊ^’ΛΛ’Ρ/ΡΓ' ."» λ 1 660 TCCGGGGCGA GAGTGAGCTG TACACCAGTG ATAlTG GCAGAACCCA CAGTTCATCA 720 AAGCCACCAT CGTGCACCAA GACCAGGCTT acgatgacaa GATCTACTAC TTCTTCCGAG 780 AGGACAATCC TGACAAGAAT CCTGAGGCTC /“> 't-' ^ ^ ^ t1 (t ΠΤ' c*1 Gv-CC.H^T iG i 34 0 GCAGGGGGGA. CCAC-GGTGGG GAAAGTTCAC TGTCAGTGTC CAAGTGGAAC ACTTTTCTC-A 900 AAGCCATGCT GGTATGCAGT GATGCTGCCA CCAAC AAGAA CTTCAAC^oo CTGCAAGACG 960 TCTTCCTGCT CCCTGACCCC AGCGGCCACT G G A. L; L: Lj A ^ A L· CAGGGTCTAT GGTGTTTTCT 1020 CCAACCCCTG GAACTACTCA GCCGTCTGTG TGTATTCCCT CGGTGACATT GACAAGGTCT 1030 TCCGTACCTC C7CACTCAAG GGCTACCACT CAAGCCTTCC CAACCCGCGG CCTGGCAAGT 1140 GCCTCGCAGA CCAGCAGCCG AT AC CC Λ'-Α'ν· AG A CA TG L. C A GGTGGCTGAC CGTCACCCAG 12 0 0 AGGTGGCGCA GAGGGTGGAG ^CCA * Ο'·_τ'·_;0:·- CTCTGAAGAC , r-iVy-T1,·*, lg·! : ·- CACTCTAAAT 1260 ACCACTACCA GAAAGTGGCC GTTCACCGCA TCCAAGCCAG CC ACGGGL; Aíj ACGTTTCATG 1320 TGCTTTACCT AACT ACAG A.C AGGGGCALia TC CA C AAGG T GG OiGAACCG GGGGAGCAGG 1380 AGCACAGCTT CGClTí CAA'- TCCAGCCCTT C C G C C 0 C G C G GCTGCCATCC 1440 AGACCATGTC GCTGGATCCT G AG C G G AGG A r, 'i ,-+rnj~' T Λ Tí^T i-VsJW, LMiO i. GAGCTCCGAG tgggaggtga 1500 GCCAGGTGCC CCTGGACCTG TGTGAGG7CT atggcgcggg CTGCCACGGT TGCCTCATGT 1560
-143- CCCGAGACCC - 4. Ai_TGCGGC T^vjLiACCAGG GCCGCTGCAT CTCCATCTAC AGCTCCGAAC 1620 * «ν-ί,υ ; jl * GCAATCCATT AATCCAGCCG AGCCACACAA GGAGTGTCCC AACCCCAAAC 1680 Α“ΐ^·ι\ν*Ά^Ό^ CCCACTGCAG AAGGTTTCCC TGGCCCCAAA CTCTCGCTAC TACCTGAGCT 174 Q GCCCCATGGA ATCCCGCCAC GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAGCAGA 1800 GCTGCGAACC TGGTCACCAG AvvCCClAA^T GC.ATCCTGTT CATCGAGAAC CTCACGGCGC 1860 agcagtacgc CCACTACTTC TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC 1920 actc-gcagct GCTGCCCC-AG GACGGCATCA TGGCCGAGCA CCTGCTGGGT CATGCCTGTG 1980 i ^ •'-'Γη/-' uL'·__'JC^- - -J1*- CTGAATTCGA AoCT i. GljAu Γ CGACTCTGCT GAAGAGGAGG AAATTCTCCT 2040 TGAAGTTTCC CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG 2100 TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC TAGATTCTGT 2160 GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT AATTCATTAA ATTTATAATC 2220 TTTACGGTGG TATGTTAGAG GAaAAT c aa ATGATTTTCA GCGTCTTTAT ATCTGAATTT 2280 AAA.TATT.AAA TCCTCAATAG ATTTGT.AAAA TAGGTTTCGA TTAGTTTCAA ACAAGGGTTG 2340 TTTTTCCGAA CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC 2400 CAAATCTTGT AGCAC-CAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT TTTGTAATAA 2460 AGG ltcuacg TCGTTCAAAA TATTATGCGC TTTTGTATTT CTTTCATCAC TGTCGTTAGT 2520 GTACAATTGA L_ , i. ru~í ACACGTTAAA TAAAGCCTGG ACATATTTAA CATCGGGCGT 2530 GTTAGCTTTA TTAGGCCGAT TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC 2640 CGAAGACGAT TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC 2700 GATCAAATTT GTAGTTGAGC mnlrtirpřTiri^ Λ Λ 1 - 4 L 1 oj Art. - TATTTCTGAT TGCGGGCGTT TTTGGGCGGG 2760 πρΎΐ'Τ',-ι Λ Λ Λ i . ν_ΛΤ\ A — η,'— * '-i X 'JG ‘s- i — — φ ^ λ —.m f, .1. i i 1 ΓΛ.-Λ i * AGACAACACG TTAGAAAGCG ATGGTGCAGG 2 820 CGGTGGTAAC ATTTCAGACG GC.AAAT CTAC TAATGGCGGC GGTGGTGGAG CTGATGATAA 2880 GGTGGAGGCG CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG 2940 CGCTGA * Gí~ A GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC 3000 TCAACTATTG TACTGGTTTC GGGCGTATGG TGCACTCTCA GTACAATCTG CTCTGATGCC 3060 GCATAGTTAA GCCAGCCCCG ACACCCCCCA ACACCCGCTG ACGCGCCCTG ACGGGCTTGT 3120 ^ G C ^ ^' C C- G CATCCGCTTA /"* * "* Λ Λ» λ * '''Τ' GTGACCGTCT CCGGGAGCTG CATGTGTCAG 3180
* · 4 AGGTTTTCAC CGTCATCACC GAAACGCGCG -14 4 -ACACGAAAGG GCCTCGTGA7 ACGCCTATTT j G '4 a ttataggtta ATCTCATGAT AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA 3 3 00 AATGTGCGCG GAACCCCTAT TTGTTTATTT TTCTAÁATAC ATTCAAATAT *·-* - ÍA * 4 -J '·» w 3 3 6 j ATGAGACAAT AACCCTGATA AATGCTTCAA TAATATTGAA AAAGGAAGAG TATGAGTAT7 3420 CAACATTTCC GTGTCGCCCT TATTCCCTTT TTTGCGGCAT 1-pfpfTIQ £ Γ' TGTTTTTGCT 3430 CACCCAGAAA CGCTGGTGAA AGTA/XAAGAT GCTL-AAGA i C ACGAGTGGGT 2 54 0 TACATCGAAC TGGATCTCAA CAGCGGTAAG ATCCTTGAGA CGAAGAACGT 3 50 0 TTTCCAATGA TGAGCACTTT TAAAGTTCTG CTATG7GGCG CGG7AITATC .-1 H .-rirnr^ Co , Λ - i 3 b 6 0 GCCGGGCAAG AGCAACTCGG TCGCCGCATA CACTATTGTC AGAATGACTT GGTTGAGTAC 3720 TCACCAGTCA CAGAAAAGCA TCTTACGGAT GGCATGACAG TAAC-AGAATT ATGCAC-TGCT 373 0 GCCATAACCA TGAGTGATAA CACTGCGGCC AACTTACTTC TGACAACC-AT CGGAGGACCG 3340 AAGGAGCTAA CCGCTTTTTT GCACAACATG GGGGATCATG TAACTCGCCT i. L;í-\ i \_wj * 3 900 GAACCGGAGC TGAATGAAGC CATACCAAAC GACGAGCGí G ACACCACGAT GCCTGTAGCA 3 96 0 ATGGCAACAA CGTTGCGCAA ACTATTAACT GGCGAACTAC TTACTCTAC-C 7TCCCGGCAA 40 20 CAATTAATAG ACTGGATGGA CGCGGATAAA GTTGCAGGAC CACTTCTGCG CTCGGCCCTT 408 0 CCGGCTGGCT GG TTT AT T GC TGATAAATC7 vjGAvjCl 1 i G TCGCGG7ATC 414 C ATTGCAGCAC TGGGGCCAGA TGGTAAGCCC TCCCGTATCG η n ^iTw*n λ r^rr^m λ L fAlJ v ΙΛ.Λ1 CACGACGGGC- 4 200 AGTCAGGCAA CTATGGATGA ACGAAATAGA CAGATCGCTG AGATAGGTGC CTCACTGATT 4 260 AAC-CATTGGT AACTGTCAGA CCAAGTTTAC TCATATATAC TTTAGAT7GA TTTAAAACTT 4320 CATTTTTAAT TTAAAAGGAT CTAGGTGAAG ATCCTTTTTG ATAATCTCAT L-AL CA AAAT i- i T G η v w - CCTTAACGTG AGTTTTCGTT CCACTGAGCG TCAGACCCCG TAGAAAAGAT ; ^ AA*··*. o vj ri Xi 4 44 0 TCTTGAGATC CTTTTTTTCT GCGCGTAATC i. VjL ίυ'.ί íjL. AAACAAAAAA 1. n- 4 2 'j ^ CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA ggtaactggc 4 360 TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT AGCCGTAG7T aggccaccac 4 52 0 TTCAAGAACT CTGTAGCACC GCCTACATAC CTCGCTCTGC TAATCCTGTT « ,·"> Ί .·“ ΤΝ/ΊΛ ζ-Η/Π 1 i 4 5 5 0 GCTGCCAGTG GCGATAAGTC GTGTCTTACC GGGTTGGACT CAAGACGATA /-i mn-' *> z*' ^ fl1 (j .. 474 0 AAGGCGCAGC GGTCGGGCTG AA CGUG t jG LΊ. TCGTGCACAC AGCGCAGCT7 -i f- \ ^ '“'Γ' 4 3 0 0 ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAu G C *. ^ v, C C G AA 43 60
* » · ·* • * · · • · · · ·· * · ft · *· * * » · · • * « · ·· ·· • » ·· ··· · · · · ·· · · GGGAGAAAGG CGGACACGTA £ £ CGGT Ac-au ^ u .-\G GGTCG gaacaggaga GCGCACGAGG 4920 GAGCTTCCAG GGGGAAACGC C7GGGA* L- v i. A. AGTCCTG gcgggtttcg CCACCTCTGA 4980 CTTGAGCG7C GATTTT7GTG atgctcgtga , Γ·* ^ /·ιπ ť> ·" v- U gcctatggaa AAACGCCAGC 5040 AACGCGGCC7 CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTC^TT^CT 5100 GCGTTATCCC CTGATTCTGT GGATAA·--j - M - -.rt^^CfuCT L.jAGTGAGC TGATACCGCT 5160 CGCCGCACCC GAAu Grf'.u L ΟιΛ GCGCAGGGrtO ·.;·- %*.£+ í. j AG ú u Aí_; G A 2;G CA T C CTG^ACCATC 5220 GTCTGCTCAT CCATGACCTG ACCATGCAC-A ggatgatgct CGTGACGGTT AACGCCTCGA 5280 ATCAGCAACG L CAGcAG.-AGC AGACCATTTT CAATCCGCAC CTCGCGGAAA 5 340 CCGACATCGC AGGCTTCTGC TTCAATCAGC GTGCCGTCGG cggtgtgcag TTCAACCACC 5400 GCACGATAGA GATTCGGGAT TTCGGCGCTC GACAGTTTCG GGTTTTCC-AC GTTCAGACGT 5460 AGTGTGACGC GATCGGTATA accaccacgc TCATCGATAA. TTTCACCGCC GAAAGGCGCG 5520 --OjG CGACCTGCG* TTCACCCTGC OATAAACrAAA /'""TV*’ rpipi ,Λ^Λ/Ι vi'JÍ ÍAU-LtJ TAGGTAGTCA 5580 CGCAACTCGC CGCACATGTG AACTTCAGCC TCCACTACAG CGCGGCTGAA ATCATCATTA 5640 AAGCGAGTGG CAACATGGAA ATCGCTGATT TGTGTAGTCG GTTTATGCA.G CAACGAGACG 5700 TCACGGAAAA TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT GCCGTCACTC S^óO CAACGCAGCA CCATCACCGC GAGGCGGTTT TCTCCGGCGC GTAAAAATC-C GCTCAGGTCA 5620 AATTCAGACG GCAAACCACT g.ul ÍwLGg i AíAt_ - -- AGCGCCCGTT GCACCACAGA 5380 TGAAACC CCG AGTTAAC σ c c A7CA.AAAATA r~ r*_ ^ Γ GGCCTTCCTG TAGCCAGCTT 5940 TCATCAACAT TAAAT GTC-AG CGAGTAACAA CCCGTCGGAT TCTCCC-TGGG AACAAACGGC 6000 GGATTGACCG ι-ΠΛ -v 'Π’ι A λΗ i UWvJiA. 1 r\ i. £ ř\U L 1 LJ gtgtagatgg GCGCATCGTA ACCGTGCATC 6060 TGCCAGTTTG AG 0 G G Au G A'··- ,•'1 "i z·’1 Λ .•"''Τ' Λ Au i A - ^ O gcctcaggaa uAiCGCACTC TAGCCAGCTT 6120 TCCGGCACCG L L U i Ul.J jL ^ Λ -7 '--'JíAiv. - gcaaagcgcc ATTCGCCATT L.-.GGCTCCGC 613 0 AAG i GT i íjGG AAG G GCGA1 2 - ϋϋ\GCJGGCC TCTTCGCTAT TACGCCAGCT GGCGA.XAGGG 62 4 0 GGATGTGCTG CAAGGCGATT A/\GT ÍGGGTA ACGCCA.GGGT TTTCCCAGTC ACGACGTTGT 6300 AAAACGACGG GATCTATCAT -7TTAGCAGT \_iA i, l G * rtf·.i- . GCAGCTGCTC TTTGATACAA 6360 CTAATTTTAC CACGACGATG CGAGCTTTTA γτ CAAGCGAG CGTGCATGTT TGCAATCGTG 6420 CAAG C GT' Γ AT TT AT TGT ATT GCTCCACATC AACAuuCiGG ACrtCCACcTT 64 8 0 -14 6- • «Μ • « v « Ψ * «« * · • · t « · * · • « • · • * *· «* *· GAACTCGCGG CA.GTTTTGCG GCAAGTTGGA CCCGCCGCGC ATCCAATGCA AACTTTCCGA 6540 CAT7CTGTTG CCTACGAACG ATTGATTCTT TGTCCATTGA TCGAAGCGAG TGCCTTCGAC 6600 TTTTTCGTGT CCAGTGTGGC TT 6622 ?.I ŠTIKA 5 Ξ KV ENCE DÉLKA: 7 · v - párů b a z i .-.3:. 7 vy | r·» akleo vá k yseliti. íc: POČET VLÁXE N: d vě .. C: TOrGLO G^E: 1 lne a :n i TY? MCL EKLTLY: geriorr .cvá DNA CEAPAKT ERTSTIC KÉ RY 'SY: V A; JAÉMG/ KLÍČ: exo n ’ 3' UHÍ3TĚ . 1 až 3 _AG’jGCCAl ^T.AAGGAGvG g 31 IMFORMAí Λ V i J.U,
'4 A IKA SEKVENCE: ·' i D ET ' 4 · a . ..v . v ·' 3 _ Γ : r' : Γ, V .< . Z 4 Vá i\. ys. ; c) PCCET VLÁKEN: d vě (n; TOPOLOGIE: Ime á Γ M0 L EKGLY: genorr.ová DK.
15 SEKVENCE IG.Č: 44: Gv-.r 5A .j - .Oj 1 ._Ljl· 4·,./'lÍ G 29

Claims (1)

  1. • «* + • « I · ·♦ • Ψ 9 * * · · * *1 ·· • I ♦ ·» *♦
    o v ? A T Sema forin obsahují c 1 charakter ; i s f ickcu sema i cmer. u v y značujíc T_ se t á — L r' γ' r- - jí in O D 3 cl hu je N-koncový signaln í oeptid a v C-koncove o O - 3. S t"_ dome nu podobnou imu nogl obul mám a t ransnembran í.á j O C CG menu , přičemž sema fotři n i θ o / j i a o of í a n j a u o s em Cl - Ol I typu L (sema h) a deriváty som.č tvoi Semaforin podle nároku 1, kde aminokyselinová sekveru proteinu (nasxeno senaronnu oduovídá sekvenci id. č.: 3. 701 -Lí (n 5 6Γί13.~.τ) 6 CCCC senaronn pocie jecncno něco více : který má v oblasti sema-donény aminokyselinovou alesooň 40¾ se sema-doménou H-seiaa-L. Semaforin nedle jednoho nebo v; nároku 1 který obsahuje Cd S Z aminokyseilnové sekvence id. č. : 4 (s e kvence rtyš í r 10 5 60 naíorinu M-sema-lS M ' > "i Nukleová sel i na v • y z n a č u ] í c i se t — 4k«· t •je nuk i 6 C 3 idcvou s e k v e n c i kódu jlCÍ 5 0ΓΠ.Ο forin ;di o ja w* dnoh o nebo vlče z n árokú 1 až 4, i ako ž r i_ váty • > . y 5 s _ i na codl e n d r o r u 5 č u j i c i c; e tím , že nukleoti 0 0 v on je gen pro semafc >rm typu L. Nukleová kyselina podle jednoho nebo více z nároku 5 , 6 vyznačující se tím, že nukleon idcv* sekvence obsahuje cen oro H-sema-L.
    • * * * » ·· · · · 4 4 · • * M • **«« « ··* • * * »·· t · « · f · » · * · 4« 4» ** 4· -149- Z pus ob identifikace iniunomoduluj ících účinných látek, vyznačuj í c í se t i m , že se inkubuje semaforin typu L za definovaných podmínek spolu se studovanou účinnou látkou a paralelně se provede za identických podmínek druhý pokus bez studované účinné látky a tim se stanoví inhibični respektive aktivační účinek studované účinné látky. Způsob identifikace imunotnoduluj ících účinných látek, vyznačující se tím, že se za definovaných podmínek exprimuje nukleová kyselina kódující semafor.in typu L v přítomnosti stu dG V 5. Π Θ účinná látky a poté se stanoví míra exprese. Způsob přípravy r.ukíeové kyseliny kódujíc! serr.afzr_n : ypu L/ v y z n a c u j íci se t í n , ze se tato nukleová kyselina amplifikuje pomoci polymerázové řetězové reakce za použití specifických primeru. rrotiiutna proti semarormu, vyznačuj i c i se tím, že buď rozeznává epitop H-sama-L odpovídájíci aminokyselinám 179 až 373 v sekvenci id. č, : 4 nebo rozeznává epitop H-sema-L odpovídající amine kyselinám 450 až 666 v sekvenci id. č.: 4
    Způsob přípravy protilátky proti semafor inu nároku 19, vyznačující s e t í m , epitopy exprimují jako řuzni proteiny s epi značkou sloužící k puri íikaci a purifi kované proteiny se použijí k imunizaci.
CZ982149A 1997-07-09 1998-07-07 Lidský semaforin typu L (H-sema-L) a příbuzné semaforiny jiných druhů CZ214998A3 (cs)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE1997129211 DE19729211C2 (de) 1997-07-09 1997-07-09 Humanes Semaphorin L (H-Sema-L) und korrespondierende Semaphorine in anderen Spezies
DE1998105371 DE19805371A1 (de) 1998-02-11 1998-02-11 Humanes Semaphorin L (H-Sema-L) und korrespondierende Semaphorine in anderen Spezies

Publications (1)

Publication Number Publication Date
CZ214998A3 true CZ214998A3 (cs) 1999-01-13

Family

ID=26038116

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ982149A CZ214998A3 (cs) 1997-07-09 1998-07-07 Lidský semaforin typu L (H-sema-L) a příbuzné semaforiny jiných druhů

Country Status (15)

Country Link
US (2) US20020037851A1 (cs)
EP (1) EP0892047A3 (cs)
JP (1) JPH11235189A (cs)
KR (1) KR19990013797A (cs)
CN (1) CN1209436A (cs)
AR (1) AR013190A1 (cs)
AU (1) AU744447B2 (cs)
BR (1) BR9802360A (cs)
CA (1) CA2237158A1 (cs)
CZ (1) CZ214998A3 (cs)
HU (1) HUP9801511A3 (cs)
ID (1) ID20819A (cs)
PL (1) PL327385A1 (cs)
RU (1) RU2218181C2 (cs)
TR (1) TR199801301A3 (cs)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7232899B2 (en) 1996-09-25 2007-06-19 The Scripps Research Institute Adenovirus vectors, packaging cell lines, compositions, and methods for preparation and use
WO1999038885A2 (en) * 1998-01-30 1999-08-05 Smithkline Beecham Plc Sbsemvl polypeptides, being members of the semaphorin protein family, and polynucleotides encoding the same
AU2982799A (en) * 1998-03-03 1999-09-20 Zymogenetics Inc. Human semaphorin zsmf-7
ES2315011T3 (es) * 1998-05-14 2009-03-16 Immunex Corporation Polipeptidos de semaforina.
JP2002534130A (ja) * 1999-01-14 2002-10-15 ノバルティス アクチエンゲゼルシャフト アデノウイルスベクター、パッケージ細胞系、組成物および製法および使用法
DE60236212D1 (de) 2001-11-09 2010-06-10 Univ Georgetown Neue isoform des gefässendothelzell wachstumshemmers (vegi)
JP2005173484A (ja) * 2003-12-15 2005-06-30 Canon Inc 画像形成装置及びプロセスカートリッジ
FR2932388B1 (fr) * 2008-06-17 2013-03-29 Univ Rabelais Francois Nouvelles proteines de fusion et leur application pour la preparation de vaccins contre l'hepatite c
KR101754433B1 (ko) 2009-05-08 2017-07-05 백시넥스 인코포레이티드 항-cd100 항체 및 이의 사용 방법
US20130095118A1 (en) * 2011-10-11 2013-04-18 Vaccinex, Inc. Use of Semaphorin-4D Binding Molecules for Modulation of Blood Brain Barrier Permeability
US9090709B2 (en) 2012-03-28 2015-07-28 Vaccinex, Inc. Anti-SEMA4D antibodies and epitopes
US10494440B2 (en) 2012-05-11 2019-12-03 Vaccinex, Inc. Use of semaphorin-4D binding molecules to promote neurogenesis following stroke
JP6611709B2 (ja) 2013-06-25 2019-11-27 バクシネックス インコーポレーティッド 腫瘍成長および転移を阻害するための免疫調節療法との組み合わせでのセマフォリン−4d阻害分子の使用
NZ630881A (en) 2013-10-10 2016-03-31 Vaccinex Inc Use of semaphorin-4d binding molecules for treatment of atherosclerosis
NZ630892A (en) 2013-10-21 2016-03-31 Vaccinex Inc Use of semaphorin-4d binding molecules for treating neurodegenerative disorders
CN104034761B (zh) * 2014-05-14 2017-01-04 浙江大学 一种检测气味结合蛋白与信息素结合过程的装置及方法
JP2020510845A (ja) * 2017-02-22 2020-04-09 バクシネックス インコーポレーティッド 神経変性疾患または神経炎症性疾患におけるグリア細胞活性化の早期検出方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5639856A (en) 1993-09-13 1997-06-17 The Regents Of The University Of California Semaphorin gene family
US5416197A (en) * 1993-10-15 1995-05-16 Trustees Of The University Of Pennsylvania Antibodies which bind human collapsin
WO1999038885A2 (en) * 1998-01-30 1999-08-05 Smithkline Beecham Plc Sbsemvl polypeptides, being members of the semaphorin protein family, and polynucleotides encoding the same
AU2982799A (en) * 1998-03-03 1999-09-20 Zymogenetics Inc. Human semaphorin zsmf-7
US6225285B1 (en) * 1998-03-11 2001-05-01 Exelixis Pharmaceuticals, Inc. Semaphorin K1
ES2315011T3 (es) * 1998-05-14 2009-03-16 Immunex Corporation Polipeptidos de semaforina.
JP2003531590A (ja) * 2000-04-12 2003-10-28 ヒューマン ゲノム サイエンシズ インコーポレイテッド アルブミン融合タンパク質

Also Published As

Publication number Publication date
CA2237158A1 (en) 1999-01-09
AU7507698A (en) 1999-01-21
AR013190A1 (es) 2000-12-13
ID20819A (id) 1999-03-11
PL327385A1 (en) 1999-01-18
EP0892047A3 (de) 2000-03-08
US20060029998A1 (en) 2006-02-09
KR19990013797A (ko) 1999-02-25
RU2218181C2 (ru) 2003-12-10
JPH11235189A (ja) 1999-08-31
HUP9801511A3 (en) 2001-08-28
HUP9801511A2 (hu) 1999-05-28
AU744447B2 (en) 2002-02-21
US7339030B2 (en) 2008-03-04
EP0892047A2 (de) 1999-01-20
TR199801301A2 (xx) 1999-01-18
HU9801511D0 (en) 1998-09-28
CN1209436A (zh) 1999-03-03
TR199801301A3 (tr) 1999-01-18
BR9802360A (pt) 1999-10-05
US20020037851A1 (en) 2002-03-28

Similar Documents

Publication Publication Date Title
AU775988B2 (en) Ligand activated transcriptional regulator proteins
US7339030B2 (en) Human semaphorin L (H-SemaL) and corresponding semaphorins in other species
DK2173869T3 (en) Fusion protein comprising a CASPASEDOMÆNE AND A NUKLÆRHORMONRECEPTORBINDINGSDOMÆNE AND METHODS AND USES THEREOF
AU2022200903B2 (en) Engineered Cascade components and Cascade complexes
DK2623594T3 (da) Antistof mod human prostaglandin-E2-receptor EP4
US20120225090A1 (en) Methods for enhancing antigen-specific immune responses
US11766478B2 (en) Methods for enhancing antigen-specific immune responses
PT1984512T (pt) Sistema de expressão génica utilizando excisão-união em insetos
WO2016191641A2 (en) Methods for enhancing antigen-specific immune responses using combination therapy comprising papillomavirus capsid antigens
WO2005081716A2 (en) DNA VACCINES TARGETING ANTIGENS OF THE SEVERE ACUTE RESPIRATORY SYNDROME CORONAVIRUS (SARS-CoV)
DK2185696T3 (en) Cells genetically modified to include pancreatic glucokinase, and uses thereof
CN113692225B (zh) 经基因组编辑的鸟类
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
KR20240037185A (ko) 키메라 공동자극 수용체, 케모카인 수용체, 및 세포 면역치료에서의 이의 용도
CN112877292A (zh) 产生人抗体的细胞
CN114026242A (zh) 具有髓鞘蛋白零启动子的aav载体及其用于治疗雪旺细胞相关疾病如charcot-marie-tooth疾病的用途
US20210130818A1 (en) Compositions and Methods for Enhancement of Homology-Directed Repair Mediated Precise Gene Editing by Programming DNA Repair with a Single RNA-Guided Endonuclease
MXPA98005529A (en) Semaforina l humana (h-sema-l) and correspondientmsemaforinas in other spec
RU2774631C1 (ru) Сконструированные компоненты cascade и комплексы cascade
US20240207318A1 (en) Chimeric costimulatory receptors, chemokine receptors, and the use of same in cellular immunotherapies
KR20240022571A (ko) Rna-가이드된 이펙터 동원을 위한 시스템, 방법 및 성분
KR20230153437A (ko) 코로나바이러스를 방지하는 백신 생산을 위한 완전 합성 장쇄 핵산
KR20240029020A (ko) Dna 변형을 위한 crispr-트랜스포손 시스템
CN113005146A (zh) 一种重组质粒及其构建方法、重组影像系统与应用
CN116033917A (zh) 与病毒感染相关的疾病或综合征的治疗和/或预防

Legal Events

Date Code Title Description
PD00 Pending as of 2000-06-30 in czech republic