CZ297640B6

CZ297640B6 - Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití

Info

Publication number: CZ297640B6
Application number: CZ0096699A
Authority: CZ
Inventors: Rappold-Hoerbrand@Gudrun; Rao@Ercole
Priority date: 1996-10-01
Filing date: 1997-09-29
Publication date: 2007-02-21
Also published as: CA2267097A1; IL129015A0; CZ96699A3; AU744188C; WO1998014568A1; NO991554D0; BR9712185A; SI0946721T1; JP2000515025A; CA2647169A1; EP1260228A2; US20030059805A1; US7252974B2; ES2188992T3; HU225131B1; CN1232499A; JP2004201692A; EP0946721B1; AU4625297A; NZ334970A

Abstract

Molekula izolované nukleové kyseliny obsahující nukleotidovou sekvenci SHOX ET93 - SEQ ID NO: 2 a nukleotidovou sekvenci vybranou ze skupiny sestávající z SHOX G310 - SEQ ID NO: 3, SHOX ET45 - SEQ IDNO: 4, SHOX G108 - SEQ ID NO: 5, SHOX Va - SEQ IDNO: 6 a SHOX Vb - SEQ ID NO: 7. cDNA odpovídajícítomuto genu se muže použít jako diagnostický nástroj pri další charakterizaci molekulární podstaty fenotypu s malou výškou postavy. Identifikace genového produktu genu poskytuje nový zpusob vývoje dokonalejší lécby malé výšky postavy.

Description

Molekula izolované nukleové kyseliny kódující polypeptidy a způsob jejího použití

Oblast techniky

Vynález se týká izolace, identifikace a charakterizace nově identifikovaných lidských genů, které odpovídají za vady lidského růstu, zvláště za malou výšku postavy nebo Turnérův syndrom. Dále se vynález týká diagnózy s terapie takových vad. Izolovaná genomová DNA nebo její fragmenty se mohou použít pro farmaceutické účely nebo jako diagnostické nástroje nebo činidla pro idenio tifikaci nebo charakterizaci genetických defektů, které se podílejí na uvedených vadách. Vynález dále popisuje lidské růstové proteiny (transkripční faktory A, B a C), které se exprimují po transkripci uvedené DNA na RNA nebo mRNA a které se mohou použít při terapii vad spojených s mutacemi v uvedených genech. Dále se popisují vhodné sekvence cDNA, které se mohou použít při přípravě rekombinantních proteinů vhodných pro léčbu takových vad. Předmětem 15 vynálezu jsou dále plazmidové vektory vhodné pro expresi DNA těchto genů a vhodné buňky, které obsahují takovou DNA. Dále se popisuji metody genetické léčby uvedených vad v oboru molekulární medicíny za použití expresního plazmidu připraveného inkorporací DNA downstream expresivního promotoru, který umožňuje expresi v savčí hostitelské buňce.

Dosavadní stav techniky

Růst je základní aspekt vývoje organizmu. Je regulovaný vysoce organizovaným a komplexním systémem. Výška postavy je multifaktorový rys, který je ovlivněn faktory prostředí a genetický25 mi faktory. Vývojové malformace, které zahrnují výšku postavy, jsou běžným jevem u lidí všech ras. V případě lidí je četnost výskytu 3 ze 100 a retardace růstu vede k malé velikosti postavy, za což ve většině případů odpovídají vrozené vady.

Turnérův syndrom je běžná chromozomální vada (Rosenfeld RG, Tesch L-G, Rodriguez-Rigau 30 LJ, McCauley E, Albertsson-Wikland K. Ach R, Cara J, Conte F, Halí, JG, Lippe G, Nagel TC,

Neely EK, Page DC, Ranke M, Saenger P, Watkins JM, Wilson DM (1994): Recommendation for diagnosis, treatment, and management of individuals with Turner syndrom. The Endocrinologist 4(5): 351-358) s četností výskytu 1:2 50 u živě narozených žen. Odhaduje se, že 1 až 2 % oplodnění u lidí má karyotyp 45,X a že až 99 % takových plodů nepřichází na svět v termínu 35 (Hal J.G., Gilchrist D.M. (1990): Turner syndrome and its variants. Pedriatr. Clin. North Am. 37:

obinson A (1990): Demography and prevalence of Turner syndrome. In: Turner Syndrome., edited by Rosenfield R.G., Grumbach M.NM., pp. 93-100, New York, Marcel Dekker). (J lidí s Turnérovým syndromem (nebo s Ullrich-Tumerovým syndromem) existuje podstatná klinická variabilita fenotypu (Ullrich, 1930; Turner, 1938). Malá výška postavy je konsistentní nález 40 a spolu s gonádovou dysgenezí se považuje za vedoucí symptom uvedených vad. Tumerový syndrom je skutečná muitifaktorová vada. Uvažuje se, že za embryonální letalitu, malou výšku postavy, gonodovou dysgenezí a charakteristické somatické rysy odpovídají monosomy genů, které jsou běžné u X a Y chromozomů. Ukazuje se, že pro normální vývoj člověka jsou nutné diploidy těchto homologních genů X-Y. Očekává se, že Turnérovy geny (nebo anti-Tumerovy 45 geny) se u žen exprimují jak z aktivního, tak z neaktivního chromozomu X nebo chromozomu Y, aby se zajistila správná dávka genového produktu. Haplo-nedostatečnost (nedostatečnost způsobená pouze jednou aktivní kopií) naznačuje mechanizmus vedoucí k onemocnění.

Dosud se objasnila řada mechanizmů, které vedou k malé výšce postavy. Nedostatečnost růsto50 vého hormonu a receptorů růstového hormonu, stejně jako vady skeletu se popisují jako příklady fenotypu s malou výškou postavy (Martial et al., (1979; Phillips et al., 1981; Leung et al., 1987; Goddard et al., 1995). Identifikovaly se mutace ve třech genech, které kódují receptor lidského fibroblastového růstového faktoru (FGFR 1-3) a způsobují řadu vad skeletu. Tylo vady zahrnují většinu forem trpasličího vzrůstu, achondroplázie (Shiang et al., 1994; Rousseau et al., 1994; 55 Muenke and Schell, 1995). Dobře známá a častá chromozomální vada (objevuje se u jedné z

- 1 CZ 297640 B6

2500 žen) Turnérův syndrom (45,X) je také spojena s malou výškou postavy. Všechny tyto důvody však odpovídají pouze za malou část pacientů s malou výškou postavy. Většina případů zatím zůstává nevysvětlena.

Věří se, že chromozomy X a Y nesou geny, které ovlivňují výšku postavy (Ogata T, Tyler-Smith C, Purvis-Smith S, Turner G. (1993): Chromosomal localisation of a gene(s) for Turner stigmata on Yp. J. Med. Genet. 30: 918-922). To se může u pacientů s abnormalitami pohlavních chromozomů odvodit ze vztahu genotyp-fenotyp. Cytogenetické studie dokazují, že delece konců krátkých ramen buď chromozomu X, nebo Y vedou u některých jedinců k malé výšce postavy (Zuffardi et al., 1982); Curry et al., 1984). Uvádí se více než 20 uspořádání chromozomu, které se spojují s delecemi konců chromozomu Xp a Yp a které nesou gen(y) odpovědné za malou výšku postavy, s pseudoautozomální oblastí (PARI) (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P„ Zuffardi O., Guilo S., Camerino G., (1989): Contiquous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome. Proč. Nati. Acad. Sci USA 86: 10001 — 10005.; Schaefer L., Ferrero G.B., Grillo A., Bassi M.T. Roth E.J. Wapenaar M.C., Van Ommen -J.B., Mohandas T.K., Rocchi M.. Zoghbi H.Y. Ballabio A. (1993): A high resolution deletion map of human chromosome Xp22. Nátuře genetics 4: 272-279). Pozice těchto genů se zúžila na distální DNA o velikosti 700 kb oblasti PARI, kterou lemuje markér DXYS15 (Ogata T., Goodfellow, P., Petit C., Aya M., Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal do DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834; Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629).

Regulace růstu u savců je organizována jako komplexní systém. Je možné, že vysoce organizovaným způsobem spolu reaguje více genů (proteinů), které podporují růst. Jeden z těchto genů, který odpovídá za výšku postavy, se zmapoval až do pseudoautozomální oblasti PARI (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P., Zuffardi O., Guilo S., Camerio G., (1989): Contiguous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome. Proč. Natí. Acad. Sci USA 86: 10001-10005), což je oblast, o které se ví, že je volně zaměnitelná mezi chromozomy X a Y (Rappold G.A. (1993): The pseudoautosomal region of the human sex chromosomes. Hum. Genet. 92: 315-324). Celá oblast RAPI je přibližně 2700 kb velká.

U pacientů s delecí se definovala kritická oblast ovlivňující výšku postavy. K malé výšce postavy dochází v případě, když se deletuje celá oblast o velikosti 700 kb nebo když je specifický gen v této kritické oblasti přítomen v haploidním stavu nebo když je přerušen nebo mutován (jako je případ idiotypické malé výšky postavy nebo Turnérův syndrom). Frekvence výskytu Turnérova syndromu ve světě je jedna z 2500 žen; četnost výskytu tohoto druhu idiopatické malé výšky postavy se odhaduje na 1 případ ze 4000 až 5000 osob. Ženám s Turnérovým syndromem a některým jednotlivcům s malou výškou postavy se obvykle po několik let až po několik desítek let aplikuje růstový hormon (GH), ačkoli je známo, že jejich hladina růstového hormonu v těle je normální a nedostatečnost GH zde není problémem. Léčba takových pacientů je velmi nákladná (odhaduje se přibližně na 30 000 USD ročně). Proto je nutné získat způsob rozlišení pacientů malého vzrůstu, kteří mají genetický defekt a pacienti, který nevykazují genetický defekt uvedeného genu. U pacientů s genetickým defektem tohoto genu - buď s úplnou delecí genu (jako je v případě Turnérova syndromu), nebo s bodovou mutací (jako je tomu u idiopatické malé výšky postavy)-je možné aplikovat alternativní léčbu bez lidského růstového hormonu.

Korelace genotyp/fenotyp podporují existenci růstového genu v proximální části Yq a v distální části Yp. Malá výška postavy se také objevuje u jedinců s terminálními delecemi Xp. Proběhlo rozsáhlé vyhledávání pacientů s částečnými monosomiemi pseudoautozomální oblasti. Na základě korelací genotyp-fenotyp se stanovila minimální běžná delece oblasti DNA o velikosti 700 kb (Ogata T., Matsuo N., (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of ciinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995); Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834). Zjistilo se, že uvedená oblast leží mezi genetickými markéry DXYS20 (3cosPP) a DXYS15 (113D) a u všech genů, které aspirují na řízení růstu, a leží v oblasti PARI (například receptor hemopoietického růstového faktoru; CSF2RA) (Gough N.M., Gearing D.P., Nicola N.A., Baker E., Pritchard M., Callen D.F., Sutherland G.R. (1990). Localization of the human GM-CSF receptor gene to the X-Aby pseudoautosomal region. Nátuře 345: 734736), se odstranily na základě jejich fyzikální pozice (Rappold G. A., Wilson T.A., Henke A., Gough N.M. (1992): Arrangment and localization of the human GM-CSF receptor achain gene CSF2RA within the X-Aby pseudoautosomal region. Genomics 14: 455-461). Geny se nacházely v deleční oblasti o velikosti 700 kb PARI oblasti o velikosti 2700 kb. Nedávno se objevily u jednotlivců s malým vzrůstem delece pseudoautozomální oblasti (PARI) pohlavních chromozomů a následně staké definovala minimální běžný oblast delece o velikosti 700 kb. Na základě analýzy DNA Southemovým přenosem u pacientů AK a SS za použití odlišných pseudoautozomálních markérů se identifikovala Xp terminální delece přibližně 700 kb od DXYS15 (113D) (Ogata T., Matsuo N., (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of ciinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P., Petit C., Aya M. Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: logalization of a growth gene(s) in the pseudoautosomoal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S., (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834).

Podstata vynálezu

Vynález se týká molekuly izolované nukleové kyseliny obsahující nukleotidovou sekvenci SHOX ET93 - SEQ ID NO: 2 a nukleotidovou sekvenci vybranou ze skupiny sestávající z SHOX G310 - SEQ ID NO: 3, SHOX ET45 - SEQ ID NO: 4, SHOX G108 - SEQ ID NO: 5, SHOX Va - SEQ ID NO: 6 a SHOX Vb - SEQ ID NO: 7.

Oblast genu odpovídající za malý vzrůst postavy se identifikovala jako oblast o velikosti přibližně 500 kb, s výhodou o velikosti přibližně 170 kb v PARI oblasti chromozomů X a Y. V této oblasti se identifikovaly tři geny jako kandidáti, kteří odpovídají za malý vzrůst. Tyto geny se označily SHOX (také jako SHOX93 nebo HOX93) (SHOX znamená gen obsahující homeobox malého vzrůstu), pET92 a SHOT (gen nesoucí homeobox podobný SHOX na chromozomu 3). Zvláště významný je gen SHOX, který má dvě oddělená místa sestřihu, což vede ke vzniku dvou variací (SHOXa a b). Během předchozích výzkumů se analyzovala podstatná část nukleotidové sekvence genu malého vzrůstu (SEQ ID NO: 8). Mohou se předpovědět a identifikovat exony nebo jejich části (například exon I [G310J; exon II [ET93J; exon IV [G108]; pET92). Získané informace o sekvenci se pak mohou použít pro navržení vhodných primerů nebo nukleotidových sond, které hybridizují s částmi genu SHOX nebo jeho fragmenty. Gen SHOX se pak může izolovat běžnými metodami. Na základě další analýzy sekvence DNA genů zodpovědných za malý vzrůst se izoluje nukleotidová sekvence exonu I a V (uvedeno na obrázku č. 1 až 2). Gen SHOX obsahuje homeobox (SEQ ID NO: 1) o velikosti přibližně 180 bp (obrázek č. 2 a obrázek č. 3). Začíná nukleotid, který kóduje aminokyselinu v pozici 117 (Q), končí nukleotidem kódujícím

- J CZ 297640 B6 aminokyselinu v pozici 176 (E), to znamená od CAG (440) do GAG (619). U pacientů z Německa (Al) s malou výškou postavy a u pacientů Japonska, kde se testovalo 250 jednotlivců s idiopatickým malým vzrůstem, se identifikoval homeobox jako sekvence homeobox-pEP93 (SHOX) a zjistily se dvě bodové mutace. Obě bodové mutace se našly ve stejné pozici a vedou ke zkrácení proteinu v pozici aminokyseliny 195. To naznačuje, že zde může existovat tzv. horké místo. Na základě skutečnosti, že obě mutace, které vedou ke zkrácení proteinu, se vyskytují ve stejné pozici, je pravděpodobné, že putativní horké místo rekombinace existuje v exonu 4(G108). Primery specifické pro exon jsou například GCA CAG CCA ACC ACC TAG (forward) nebo TGG AA GGC ATG ATC CGT AAG (reverzní). Shora uvedený nový gen obsahující homeobox, SHOX, který se nachází v intervalu 170 kb, je alternativně sestřižen a dává vznik dvěma proteinům s odlišnými funkcemi. Při demonstraci skutečnosti, že malá výška postavy je způsobena mutacemi v SHOX, se použila analýza mutace a sekvenování DNA.

Identifikace a klonování kritické oblasti malého vzrůstu podle vynálezu se uskutečnila následujícím způsobem. U 15 jednotlivců s částečnými monosomy v pseudoautozomální oblasti (PARI) se provedla rozsáhlá fyzikální mapovací studie. Korelací výšky těchto jedinců s delečními body se definovala kritická oblast malého vzrůstu (SS) o přibližné velikosti 700 kb. tato oblast se následně klonovala jako překiývací se kosmidový kontig za použití kvasinkových umělých chromozomů (YAC) z PARI (Ried K., Mertz A., Nagaraja R., Trusnich M. Riley J., Anand R., Page D., Lehrach H., Elloiso J., Rappold G.A. (1995): Characterization of a yeast artificial chromosome conting spanning the pseudoautosomal region. Genomics 29: 787-792) a pomocí metody „chodícího kosmidu“ (cosmid walking). Za účelem vyhledání genů odpovědných za SS v tomto intervalu se na přibližně 600 kb velkou oblast mezi distálním koncem kosmidu 56G10 a proximálním koncem 51 Dl 1 aplikovala řada metod. Za použití sekvence cDNA, trapování exonu a GpG klonování se identifikovaly dva nové geny.

Pozice kritického intervalu malého vzrůstu se zúžila na menší interval DNA o velikosti 170 kb tím, že se charakterizovaly tři další jedinci (GA, AT a RY), kteří vykazují malý vzrůst postavy. Za účelem přesného stanovení pozice bodu přerušení u těchto jedinců se provedla na chromozomech v metafázi za použité kosmidů vhodných pro kontig fluorescenční hybridizace in šitu (F1SH). Pacient GA, který vykazuje terminální deleci a normální výšku vzrůstu, definuje distální hranici kritické oblasti (bod přerušení se nachází na kosmidu 110E3) a pacient AT vykazují inverzi X chromozomu a normální výšku vzrůstu definoval proximální hranici (bod přerušení se nachází na kosmidu 34F5). Bod přerušení chromozomu Y u pacienta RY, který vykazuje terminální deleci a malý vzrůst, se také nachází na kosmidu 34F5, což naznačuje, že tato oblast obsahuje sekvence s predispozicí k přestavění chromozomů.

Celá oblast ohraničená Xp/Yp se klonovala jako sada přesahujících kosmidů. Ke studiu šesti pacientů s přestavěným chromozomem X, kdy tři z nich jsou normálního vzrůstu a tři mají malou výšku vzrůstu, se použila fluorescenční hybridizace in sítu (FISH) s kosmidy s této oblasti. Korelace genotypu fenotypu zúžily kritický interval pro malý vzrůst na 270 kb DNA nebo na dokonce menší interval, jako je 170 kb, který obsahuje gen nebo geny důležité pro růst člověka. Tento interval pokrývá minimálně šest až osm kosmidů a jsou nyní dostupné pro hybridizaci FISH interfáze a metafáze, která je dostupný nástroj pro diagnózu pacientů s idiopatickým malým vzrůstem postavy.

Skutečnost, že cílový gen vede k vadám růstu u lidí (např. oblast malého vzrůstu), nebyla dříve známá. Biologická a klinická asociace pacientů s uvedenou deleci vysvětluje funkci uvedeného genu. V této studii se použila fluorescenční in šitu hybridizace (FISH) za účelem testování metafáze a interfáze jádra lymfocyty u šesti pacientů. Cílem bylo testovat u všech přesahujících kosmidů jejich použitelnost jako sondy pro FISH hybridizaci a stanovit oblasti porušení genu u všech čtyř případů, a tímto způsobem stanovit minimální kritickou oblast genu malého vzrůstu.

Duplikace nebo delece genomové DNA se může uskutečnit kvantitativní PCR nebo odhadem dávky na Southernových blotech nebo použitím RFLP.

-4CZ 297640 B6

Zvláště vhodnou metodou pro přesné rozlišení mezi jednou a zdvojenou dávkou markérů je hybridizace FISH, přičemž její klinická aplikace je současnosti rutinní záležitostí. Zatímco při FISH hybridizaci interfáze se může zhodnotit absence nebo přítomnost molekulového markéru, hybridizace FISH metafáze chromozomů může poskytnou třemi-kvantitativní stanovení delece uvnitř kosmidu. Uvedeným způsobem se může stanovit delece o velikosti přibližně 10 kb (což odpovídá 25 % redukci signálu). Zvláště je důležité, že prakticky všechny geny onemocnění na lidském X chromosomu jsou spojeny s menšími a většími delecemi v rozmezí od několika kilobazí do několika megabází DNA (Nelson, D. L., Ballabio A., Cremers F., Monaco A.P., Schlessinger D., (1995). -Report of the sixth intemational workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342).

Vynález dále popisuje sekvence DNA nebo jejich fragmenty, které jsou části genů odpovědných za lidských růst (nebo v případě defektu v těchto genech odpovídají za malý vzrůst). Identifikovaly se tři geny odpovědné za lidský růst. Jsou to SHOX, pET92 a SHOT). Sekvence DNA nebo fragmenty těchto genů stejně jako sekvence DNA těchto genů v plné délce se mohou transformovat do vhodného vektoru a mohou se dále transfekovat do buněk. Když se takové vektory zavedou do buněk vhodným způsobem, jako jsou přítomny u zdravých jedinců, je možné uvedeným způsobem léčit onemocnění spojené s malým vzrůstem, to znamená například Turnérův syndrom. Onemocnění spojené s malým vzrůstem se může léčit odstraněním nebo mutací růstových genů odpovědných za malý vzrůst. Je také možné stimulovat geny, které kompenzují působení genů odpovědných za malou výšku postavy, to znamená inzercí sekvencí DNA před, za nebo do růstových genů/genů odpovídajících za malou výšku za účelem zvýšit expresi zdravých alel. Uvedenými modifikacemi genů se růstové geny/geny odpovídajících za malou výšku aktivují nebo deaktivují. To se může uskutečnit inzercí sekvencí DNA do vhodných míst, které jsou v genu nebo blízko genu umístěny tak, že tyto inzerované sekvence DNA interferují s růstovými geny/geny odpovídajícími za malou výšku a tak aktivují nebo brání jejich transkripci. Je také možné před růstové geny začlenit regulační element (například promotorovou sekvenci), aby se geny stimulovaly a staly se aktivní. Dále je možné stimulovat promotorovou sekvenci za účelem nadměrné exprese - v případě Turnérova syndromu-správně fungujících alel a tak kompenzovat chybějící alely. Modifikace genů se může obecně dosáhnout inzerci exogenních sekvencí DNA do růstového genu/genu odpovídajícího za malý vzrůst prostřednictvím homologní rekombinace.

Sekvence DNA podle vynálezu se mohou také použít k transformaci uvedených sekvencí do zvířat, jako jsou savci, prostřednictvím vhodného vektorového systému. Tyto transgenní zvířata se pak mohou použít pro zkoumání in vivo při testování a identifikaci farmaceutických činidel, která jsou použitelná při léčbě onemocnění spojených s malým vzrůstem. Jestliže zvířata pozitivně reagují na aplikaci sloučeniny nebo činidla, pak uvedené činidlo nebo sloučenina nebo jejich deriváty jsou vhodná jako farmaceutická činidla. Sekvence DNA podle vynálezu se mohou také využívat v genetických experimentech za účelem nalezení způsobů, jak kompenzovat ztráty genů odpovědných za malý vzrůst postavy.

Dále vynález popisuje sekvence DNA, které se mohou využít při transformaci buněk. Tyto buňky se mohou použít k identifikaci farmaceutických činidel, jenž se mohou použít při léčbě onemocnění spojených s malou výškou postavy nebo k testování takových látek nebo knihovny látek. Ve vhodném testovacím systému se mohou identifikovat změny fenotypu nebo změny expresivniho paternu těchto buněk, což umožňuje identifikaci činidla vhodného pro přípravu léků.

Sekvence DNA podle vynálezu se také mohou použít při tvorbě vhodných primerů, které za přísných podmínek hybridizují se segmenty genů odpovídajících za malý vzrůst nebo s jejich fragmenty. Mohou se konstruovat vhodné sekvence primerů, které se používají při diagnóze lidí, které mají genetický defekt způsobující malý vzrůst. Proto je nutné poznamenat, že dvě mutace nalezené v identické pozici naznačují, že existuje mutační horké místo.

-5 CZ 297640 B6

Sekvence DNA podle vynálezu zahrnují i takové sekvence, které se degenerovaly na specifické sekvence na základě degenerace genetického kódu nebo které hybridizují za přísných podmínek se specificky danými sekvencemi.

Vynález zdůrazňuje zvláště následující rysy:

a) Molekulu izolované nukleotidové kyseliny kódující polypeptidy obsahující oblast homeoboxu šedesáti aminokyselin, které mají aminokyselinovou sekvenci SEQ ID NO: 1 a vykazují regulující aktivitu lidského růstu.

b) Molekulu izolované DNA obsahující nukleotidovou sekvenci, jak je uvedeno na obrázku č. 2, 3 nebo 4 a zvláště, jak je uvedeno v SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15:

c) Molekuly DNA podle odstavce c) jsou schopny hybridizovat s molekulami DNA podle odst. 2 při teplotě 60 až 70 °C a v přítomnosti roztoku standardního pufru.

e) Molekuly DNA obsahují nukleotidové sekvence, které vykazují 70 % nebo vyšší homologii s nukleotidovou sekvencí SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15 a kódují polypeptid, který má regulační aktivitu lidského růstu.

f) Lidské růstové proteiny mají aminokyselinovou sekvenci SEQ ID NO: 11,13 nebo 16 nebo jejich funkční fragment.

g) Protilátky získané při imunizaci zvířat lidskými růstovými proteiny podle odst. f) nebo jejich antigenní varianty.

h) Farmaceutické kompozice obsahující lidské růstové proteiny nebo jejich funkční fragmenty pro léčbu vad způsobených genetickými mutacemi lidského růstového genu.

i) Způsob testování látky účinné při léčbě vad zmiňovaných shora v textu podle odst. h) zahrnující detekci mediátorové RNA hybridizující s libovolnými molekulami DNA popsanými v odstavcích a) až e), přičemž se měří zesílení exprese molekuly DNA jako odezvy na léčbu hostitelské buňky substitucí.

j) Expresivní vektor nebo plazmid obsahující libovolné molekuly nukleové kyseliny popsané v odstavcích a) až e), které umožňují, aby molekuly DNA se exprimovaly v savčích buňkách.

k) Způsob stanovení genu nebo genů v biologických vzorcích tkání nebo tělních tekutin odpovědných za malý vzrůst.

V případě metody popsané shora v textu v odstavci k) se pro detekci specifických nukleotidových sekvencí s výhodou používají nukleotidové amplifikační metody PCR, které jsou dobře známy v oboru a popisují se například v publikacích Mullis et al., 1986, Cold Spring Harbor Symposium Quant. Biol. 51, 263-273 a Saiki et al., Science 239, 487^491. Stanovené nukleotidové sekvence odpovídají za malý vzrůst jsou hlavně ty, které jsou reprezentovány sekvencemi SEQ ID NO: 2 až SEQ ID NO: 7.

V principu všech oligonukleotidové primery a sondy vhodné pro amplifikaci a detekci genetického defektu, který odpovídá za poškození lidského růstu v biologických vzorcích, jsou vhodné pro amplifikaci cílové sekvence spojované s malým vzrůstem. V tabulce č. 1 jsou uvedeny vhodný pár primerů specifický pro exon podle vynálezu. Následuje vhodná detekce, přičemž se například provádí radioaktivní nebo jiné značení.

-6CZ 297640 B6

Tabulka č. 1

exon	Sense primer	Antisense primer	Produkt (bp)	Ta (’C)
5'-I(G310)	SPI	ASP1	194	58
3'-I (G310)	SP2	ASP2	295	58
II(ET93)	SP3	ASP3	262	76/72/68
III(ET45)	SP4	ASP4	120	65
IV(G108)	SP5	ASP5	154	62
Va(SHOXa)	SP6	ASP6	265	61

Vysvětlení zkratek u primerů:

SP 1: ATTTCCAATGGAAAGGCGTAAATAAC

SP 2: ACGGCTTTTGTATCCAAGTCTTTTG

SP 3: GCCCTGTGCCCTCCGCTCCC

SP 4: GGCTCTTCACATCTCTCTCTGCTTC

SP 5: CCACACATGACACCTGCTCCCTTTG

SP 6: CCCGCAGGTCCAGGCTAGCTG

ASP1: CGCCTCCGCCGTTACCGTCCTTG

ASP2: CCCTGGAGCCGGCGCGCAAAG

ASP3: CCCCGCCCCCGCCCCCGG

ASP4: CTTCAGGTCCCCCCAGTCCCG

ASP5: CTAGGGATCTTCAGAGGAAGAAAAAG

ASP6: GCTGCGCGGCGGGTCAGAGCCCCAG

Jako targetová DNA může také sloužit jednořetězcová RNA. Metody zpětné transkribce RNA a cDNA jsou dobře známy v oboru a popisuje je Sambrook et al., Molecular Cloning“ A Laboratory Manual, New York, Cold Spring Harbor Laboratory 1989. V jiném případě preferované metody reverzní transkripce využívají termostabilní DNA polymerázy, které vykazují RT aktivitu.

Shora popsaná metoda se může použít při selekci těch osob ze skupiny lidí, jejichž malý vzrůst postavy se spojuje s genetickým defektem, což umožňuje specifičtější léčbu.

Vynález dále popisuje transkripční faktory A, B a C, které se mohou použít jako farmaceutická činidla. Tyto transkripční faktory iniciují stále neznámou kaskádu biologických účinků na molekulární úrovni, které se spojují s lidským růstem. Tyto proteiny nebo jejich funkční fragmenty mají mitogenní účinek na různé buňky. Zvláště mají osteogenní účinek. Mohou se použít při léčbě onemocnění kostí, jako je například osteoporóza, a zvláště všech onemocnění spojených s poškozením regulace vápníku v kostech.

Termín „izolovaný“ znamená původní derivaci molekuly DNA klonováním. Vynález se týká jak přirozeně se vyskytujících sekvencí tak i synteticky připravených.

Molekuly DNA podle vynálezu se mohou použít ve formách genové terapie, která zahrnuje 5 použití expresivních plazmidů připravených inkorporací vhodné sekvence DNA podle vynálezu downstream od expresivního promotoru, který ovlivňuje expresi v savčí hostitelské buňce. Vhodné hostitelské buňky jsou prokaryontní a eukaryontní buňky. Prokaryontní hostitelské buňky jsou například E. coli, Bacillus subtilis a podobně. Prostřednictvím transfekce hostitelských buněk replikony, které pocházejí z druhů adaptovatelných na hostitele, to jsou plazmidové vektory obsa10 hující počáteční bod replikace a regulační sekvence, se mohou uvedené hostitelské buňky transfekovat požadovaným genem nebo cDNA. Takové vektory jsou s výhodou ty, které mají sekvenci, jenž vybaví transfekované buňky vlastnostmi (fenotypem), na jejichž základě se mohou selektovat. V typickém případě se používají jako hostitele bakterie E. coli kmen K12a, z vektorů se používá buď pBK322, nebo plazmidy pUC. Příklady vhodných promotorů v případě hostitelů 15 E. coli jsou promotor trp, lac promotor nebo lpp promotor. Jestliže je to nutné, sekrece expresivního produktu skrz buněčnou membránu se může ovlivnit spojením sekvence DNA kódující sekvenci signálního peptidu s 5' upstream částí genu. Eukaryontní hostitelské buňky zahrnují buňky získané z obratlovců nebo kvasinek, atd. Jako hostitelské buňky obratlovců se mohou použít buď COS (Cell, 1981, 23: 175-182) nebo buňky CHO. Aby došlo k expresi mohou se 20 s výhodou použít promotory, které jsou umístěny 5'upstream genu a mají místa sestřihu RNA, polyadenylační a transkripční terminační sekvence.

Při léčbě vad způsobených mutacemi lidských růstových genů se mohou použít jako činidla podporující růst transkripční faktory A, Ba C podle vynálezu. Na základě polymorfizmu, který je 25 znám u eukaryontních genů, se může substituovat jedna nebo více aminokyselin. Jedna nebo více aminokyselin v polypeptidech může být deletována nebo začleněna do jednoho nebo více míst aminokyselinové sekvence polypeptidů SEQ ID NO: 11, 13 nebo 16. Takové polypeptidy jsou nazývány ekvivalentní polypeptidy, pokud vykazují biologicky aktivitu nemodifikovaného polypeptidu, jenž zůstává v podstatě beze změn.

Přehled obrázků na výkresech

Na obrázku č. 1 je zobrazena genetická mapa genu SHOX, který zahrnuje pět exonů, které se 35 označily následujícím způsobem: exon I: G310; exon 2: ET93; exon III: ET45; exon IV: G108; a exony Va a Vb, přičemž exony Va a Vb vedou ke vzniku dvou různých míst sestřihu genu SHOX. Exon II a III obsahuje homeobox o velikosti 180 nukleotidů.

Na obrázcích č. 2 a 3 jsou nukleotidy a předpovězené aminokyselinové sekvence SHOX 40 a SHOXb.

SHOXa: Předpovězený začátek translace začíná nukleotidem 92, první v rámci je stop kodon (TGA) - nukleotidy 968 - 970, přičemž vzniká otevřený čtecí rámec velikosti 876 bp, který kóduje předpovězený protein tvořený 292 aminokyselinami (označený jako transkripční faktor A 45 nebo protein SHOX). V rámci je 5' stop kodon v pozici nukleotidu 4, počáteční kodon a předpovězený terminační stop kodon znázorněný tučným písmem. Homeobox je ohraničen boxem (začínající aminokyselinou v pozici 117 (Q) až 176 (E), to v nukleotidové sekvenci odpovídá CAG až GAG). Pozice intronů je označený šipkami. Dva putativní polyadenylační signály v 3' nepředkládané oblasti jsou podtrženy.

SHOXb: Otevřený čtecí rámec o velikosti 876 bp se nachází od A v prvním metioninu nukleotidu 92 do terminačního kodonu v rámci v pozici 767 - 769, což tvoří otevřený čtecí rámec o velikosti 675 bp, který kóduje předpovězený protein o velikosti 225 aminokyselin (transkripční faktor B nebo protein SHOXb). Pozice intronů jsou označeny šipkami. Exony I až IV jsou identické

-8CZ 297640 B6 s SHOXa, exon V je specifický pro SHOXb. Putativní polyadenylační signál v 3' nepředkládané oblasti je podtržen.

Na obrázku č. 4 je nukleotidová sekvence a předpovězená aminokyselinová sekvence SHOT. Předpovězený počátek translace začíná v pozici nukleotidu 43, první v rámci je terminační kodon (TGA) - pozice nukleotidů 613-615, přičemž vzniká otevřený čtecí rámec o velikosti 573 bp, který kóduje předpovězený protein tvořený 190 aminokyselinami (označený jako transkripční faktor C nebo protein SHOT). Homeobox je označen boxem (začínající aminokyselinou v pozici 11 (Q) až 70 (E), to v nukleotidové sekvenci odpovídá CAG až GAG). Pozice intronů je označená šipkami. Dva putativní polyadenylační signály v 3' nepřekládané oblasti jsou podtrženy.

Na obrázku č. 5 je uvedena organizace exon/intron lidského genu SHOX a pozice v nukleotidové sekvenci.

Popis sekvencí SEQ ID:

SEQ ID NO. 1: předkládaná aminokyselinová sekvence oblasti homeobox (180 bp)

SEQ ID NO. 2: exon Π (ET93) genu SHOX

SEQ ID NO. 3: exon 1 (G310) genu SHOX

SEQ ID NO. 4: exon III (ET45) genu SHOX

SEQ ID NO. 5: exon IV (G108) genu SHOX

SEQ ID NO. 6: exon Va genu SHOX

SEQ ID NO. 7: exon Vb genu SHOX

SEQ ID NO. 8: předchozí nukleotidová sekvence genu SHOX

SEQ ID NO. 9: gen ET92

SEQ ID NO. 10: sekvence SHOXa (také uvedeno na obrázku č. 2)

SEQ ID NO. 11: transkripční faktor A (také uvedeno na obrázku č. 2)

SEQ ID NO. 12: sekvence SHOXb (také uvedeno na obrázku č. 3)

SEQ ID NO. 13: transkripční faktor B (také uvedeno na obrázku č. 3)

SEQ ID NO. 14: gen SHOX

SEQ ID NO. 15: sekvence SHOT (také uvedeno na obrázku č. 4)

SEQ ID NO. 16: transkripční faktor C (také uvedeno na obrázku č.4).

Příklady provedení vynálezu

Příklad 1: Pacienti

Všech šest studovaných pacientů vykazuje de novo odchylky na pohlavním chromozomu.

Pacient s označením CC je dívka s karyotypem 45,X/46,X psu dic (X) (Xqter ->Xp22.3:;Xp22.3->Xqter). Při posledním testuji bylo 6 1/2 roku, její výška byl 114 cm (25 až 50 percentil). Výška postavy její matky je 155 cm, otec nebyl zařazen do analýzy. Detailněji je případ popsán v publikaci Henke A., Wapenaar M„ van Ommen G-J. Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear growth. Am. J. Hum. Genet. 49: 811-819.

-9CZ 297640 B6

Pacient s označením GA je dívka s karyotypem 46,X der X (3pter—>3p23::Xp23.3—>Xpter). Při posledním testu jí bylo 17 let a zjistila se normální výška (159 cm). Výška její matky je 160 cm, její otec měří 182 cm. Detailněji se pacientka popisuje v publikaci Kulharya A.S., Roop H., Kukolich M.K., Nachtman R.G., Belmont J. W., Garcia-Heras J., (1995): Mild phenotypic effects of a de novo deletion Xpter—>Xp22.3 a duplication 3pter—>3p23. Am. J. Med. Genet. 56: 16-1.

Pacient s označením SS je dívka s karyotypem 46,X rea (X) (Xpter->Xp26:.Xp22.3->Xp26). V dedenácti letech její výška byla pod 3 percentil křivky růstu japonských dívek.; její předpovězená výška v dospělosti (148,5 cm) leží pod její cílovou výškou (163 cm) a cílové rozmezí je (155 až 191cm). Detailněji je případ popsán v publikaci Ogata T., Goodfellow P., petit C., Aya M., Matsuo N. (1992): Short Statute in a girl with a terminál xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455—459.

Pacient z označením AK. je dívka s karyotypem 46,X rea (X) (Xqter->Xp22.3::Xp22.3-»Xp21.3). Ve 13-ti letech její výška je pod 2 percentil křivky růstu japonských děvčat; její předpovídaná výška v dospělosti (142,8cm) je pod její cílovou výškou (155,5 cm) a cílové rozmezí je (147,5 až 163,5). Detailněji se případ popisuje v publikaci Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s): J. Med. Genet. 32: 831-834. Pacient označený RY má karyotyp 46,X,r(Y)/46,Xdic r(Y)/45,X[95:3:2], jak se zjistilo testem 100 lymfocytů; V 16-ti letech je její výška 148 cm; jeho tři bratři dosáhly normální výšky 170 cm (bratr 1,16 let), 164 (bratr 2, 9 let) a 128 cm (bratr 3, 9 let). Růstová retardace tohoto pacienta je tak silná, že by měla být kompatibilní s další delecí lokusu GCY na Yq.

Pacient s označením AT je chlapec s ataxii a inv(X); v sedmi letech dosahuje normální výšky 116 cm, výška rodičů je 156 cm a 190 cm.

Pacienti pro analýzu mutací

U 250 jednotlivců s idiopatickým malým vzrůstem postavy se vyšetřovaly mutace genu SHOXa. Pacienti se vybraly podle následujících kriterií: výška chronologického věku byla pod 3 centil národního výškového standardu mínus 2 standardní odchylky (SDS); nebylo známé žádné kauzativní onemocnění zvláště: normální váha (délka) v prenatálním stavu, normální tělesné proporce, žádné chronické onemocnění, normální příjem potravy, žádné psychiatrické obtíže, žádné dysplázie skeletu, žádná nedostatečnost růstového hormonu nebo hormonů štítné žlázy.

Rodina A:

Případy 1 a 2 jsou děti malého vzrůstu německé nepokrevné rodiny. Chlapec (případ 1) se narodil v 38 týdnu těhotenství císařským řezem. Porodní váha je 2 660 g, porodní délka byla 47 cm. Vyvíjel se normálně s výjimkou subnormálního růstu. Při schůzce ve věku 6,4 roku byl proporcionálně malý (106,8 cm, - 2, SDS) a obézní 22,7 kg) ale jinak normální. Stáří jeho kostí nebylo retardované (odpovídalo 6 letům) a dysplázie kostí je vyloučila na základě vyšetření X-paprsky. Nepravděpodobná je nedostatečnost v hladinách IGF-1 a IGFBP-3 stejně jako parametry štítné žlázy, které se v séru prokazují GH nebo nedostatečnost hormonů štítné žlázy. Dívka (případ 2) se narodila v termínu císařským řezem. Porodní váha byla 2 920 g, porodní délka byla 47 cm. Její vývoj byl normální, ale ve 12 měsících se projevil její malý růst (délka 67 cm, -3,0 SDS). Ve čtyřech letech měřila 89,6 cm (-3,6 SDS). Neprojevily se žádné dysmorfní ani dysproporcionální rysy. Nebyla obézní (13 kg). Stáří jejich kostí odpovídalo 3,5 letů a vyloučila se dysplázie kostí. Hormonální parametry byly normální. Je zajímavé poznávat, že růst děvčata i chlapce odpovídá 50 percentil růstové křivky žen s Turnérovým syndromem. Matka je nejmenší z rodiny a má

- 10CZ 297640 B6 střední rhizomelickou disproperci (142,3 cm, -3,8 SDS). Jedna ze sester (150 cm, -2,5 SDS) a babička z matčiny strany (153 cm, -2,0 SDS) jsou malé postavy, aniž mají nějakou disproporci. Druhá sestra má normální výšku postavy 167 cm, +0,4 SDS). Výška otce je 166 cm (-1,8 cm) a výška dědečka z matčiny strany je 165 cm (-1,9 SDS). Další pacient je japonského původu a vykazuje identické mutace.

Příklad 2: Identifikace genu odpovídajícího za malý vzrůst

A. Hybridizace in šitu

a) Fluorescenční hybridizace in silu

Provedla se fluorescenční hybridizace in šitu (FISH) za použití kosmidů, které leží v Xp/Yp pseudoautozomální oblasti (PARI). Uskutečnily se FISH studie za použití kosmidů 64/75cos (LLNlcl 10H032), E22COS(2e2). Fl/14cos (110A7), Ml/70cos (110E3), P99F2cos(43C11), P99cos (LLNLcl 10P2410), B6cosb (lCRFcl04H0425), F20cos (34F5), F21cos (ICRFcl04G0411), F3cos2 (9E3), F3cosl (11E6), P117cos (29B11), P6cosl(ICRFcl04P0117), P6cos2 (LLNLcl 10E0625) a E4cos (15G7) podle metody popsané v publikacích (Lichter P., Cremer T., Human Cytogenetics: A. practical Approach, IRL Press 1992, Oxford, New York, Tokyo) Jeden mikrogram kosmidového klonu se značil biotinem a hybridizoval se s metafází lidských chromozomů za podmínek, které redukují signál z repetivních sekvencí DNA. Detekce hybridizačního signálu probíhá prostřednictvím avidinu spojeného s FITC. Zviditelnění F1TC proběhlo za použití chlazeného zdvojeného kamerového systému (Photometrics, Tucson, AZ).

b) Fyzikální mapování

Kosmidy se získaly z Lawrence Livermore National Laboratory X- a Y-chromozomové knihovny a z X-chromozomové knihovny instituce Imperiál Cancer Research Fund London (nyní Max Plaňek Institute for Molecular Genetics Berlin). Za použití kosmidů distálních kDXYS15, jmenovitě E4cos, P6cos2, P6cosl, P117cos a P3cosl lze stanovit, že jsou stále přítomny dvě kopie E4cos, p6cos2, P6cosl a jedna kopie PÍ I7cos a F3cosl. Body porušení na mapě kosmidů P6cosl obou pacientů AK a SS jsou od sebe v maximální vzdálenosti lOkb. Zjistilo se, že abnormální X-chromozomy AK a SS měly deletováno přibližně 630 kb DNA.

Další kosmidy se získaly zZCRF X-chromozomové specifické kosmidové knihovny (ICRFclO4), z Lawrence Livermore X-chromosomové specifické knihovny (LLCO3'M'), stejně jako ze samostatně připravené kosmidové knihovny zahrnující celý genom. Kosmidy se identifikovaly hybridizací se všemi známými sondami, které mapují uvedenou oblast a použití celé YAC jako sondy. Za účelem ověření překrytů v případech, kde nebylo možno použít známých sond, se použily terminační sondy z několika kosmidů.

c) Hybridizace Southemovým přenosem

Analýza Southemovým přenosem za použití pseudoautozomálních markérů poskytuje důkaz, že bod porušení X-chromozomu u pacienta CC leží mezi DXYS20(3cosPP) a DXYS60(U7A) (Henke A., Wapenaar M., van Ommen G-J., Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear groth. Am. J. Hum. Genet. 49: 811-819). Za účelem potvrdit tento nález a definovat pozici bodu porušení, se použily kosmidy 64/75cos, E22cos, Fl/14cos, Ml/70cos, F2cos, P99F2cos a P99cos jako sondy při hybridizací FISH. Pozice bodu porušení na abnormálním chromozomu X u pacienta CC je mezi kosmidy 64/75cos (jedna kopie) a Fl/14cos (dvě kopie) na E22PAC. Pacient CC s normální výškou následně ztratil přibližně 269 až 290 kb DNA.

- 11 CZ 297640 B6

Hybridizace Southernovým přenosem se provedla za přísných podmínek v Churchově pufru (0,5 M NaPi pH7,2, 7 % SDS, 1 mM EDTA) při teplotě 65 °C a promývání se provedlo 40 mM NaPi, 1 % SDS při teplotě 65 °C.

d) Analýza hybridizací F1SH

Biotinem značená kosmidová DNA (velikost inzertu 32 až 45 kb) nebo kosmidové fragmenty (10 až 16 kb) se hybridizovaly s metafází chromozomů, které pochází ze stimulovaných lymfocytů pacientů, za podmínek, jenž se popisují dříve v textu (Lichter P., Cremer T., Human Cytogenetics: A practical Approach, 1RL Press, 1929, Oxford, New York, Tokyo). Hybridizované sondy se detekovaly prostřednictvím avidinu spojeného s FITC.

e) Amplifikace pCR

Všechny reakce PCR se provedly v objemech 50 ul. V tomto objemu je obsaženo 100 pg až 200 pg templátu, 20 pmol každého primeru, 200 uM dNTP (Pharmacia), 1,5 mM MgC12, 75 mM Tris/Hcl pH9, 20 mM (NH4)2SO4 0,01 % (hmotn./objem) Tween 20 a 2 U Goldstar DNA polymerázy (Eurogentec). Termocykly se provedly na zařízení GeneE (Techne).

f) Amplifikace exonu

Za účelem amplifikace exonu se použily čtyři kosmidové sebrané roztoky, kdy každý zahrnuje čtyři až pět klonů z kosmidových kontigů. Kosmidy v každém kosmidovém roztoku se částečně štěpily restrikčním enzymem Sau3A. Frakce čištěné na genu v rozmezí velikosti 4 až 10 kb se klonovaly do vektoru pSPL3B štěpeného restrikčním enzymem BamHI (Bum et al., 1995) a použily se při experimentech amplifikace exonu, jak se popisuje dříve v textu (Church et al., 1994).

g) Sekvenování genů

Sonifikované fragmenty dvou kosmidů LLOYNCO3'M'15D10 a LLOYNCO3'M34F5 se odděleně sub-klonovaly do vektorů M13mpl8. Z každé kosmidové knihovny se vybralo alespoň 1000 plaků, připravila se DNA Ml3 a sekvenovala se za použití barvivém značených terminátorů, termo-sekvenázy (Amersham) a univerzálního M13-primeru (MWG-BioTech). Gely se provedly na sekvenátoru ABI-377 a data se uspořádala a editovala pomocí programu GAP4 (Staden).

Ze všech šesti pacientů pacient GA měl nejméně charakterizovaný bod porušení chromozomu. Nejvzdálenější markéry, jejichž přítomnost na chromozomu X se testovala dříve, byly DXS1060 a DXS996, mapují přibližně 6 Mb od telomeru (Nelson, D.L., Ballabio A., CremersF., Monaco A.P., Schlessinger D., (1995). -Report of the sixth intemational workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342). Testovalo se několik kosmidů, které obsahují odlišné sekvence gen z PARI (MIC2, ANT3, CSF2RA a XE7). Všechny byly přítomny natranslokačním chromozomu. Kosmidy pokrývající kritickou oblast odpovídající za malý vzrůst postavy, například z chromozomu, přičemž translokační bod porušení je na kosmidů Ml/70cos. Kvantitativní srovnání intenzity signálu Ml/70cos mezi normálním a znovu uspořádaným chromozomem X ukazuje, že je deletováno přibližně 70 % kosmidů.

- 12 CZ 297640 B6

Tabulka č. 2

	CC	GA	AK	SS
64/75cos	-	-
E22cos	-	-
Fl/14cos	+
Ml/70cos	+	( + )
F2COS	+	+
P99F2cos	+	+
P99cos	4	4
B6cos		+

F20COS
F21cos
F3cos2
F3cosl	-	-
P117cos	-
P6cosl	+	+
P6cos2	+	+
E4cos	+	4

Tabulka č. 2: Tabulka udává souhrn dat z hybridizace FISH pro 16 kosmidů testovaných u čtyř pacientů (-) jedna kopie; indikuje, že kosmid je deletován a znovu uspořádán chromozomu X, aleje přítomen na normálním chromozomu X (+) dvě kopie; indikuje, že kosmid je přítomen na znovu uspořádaném i na normálním chromo15 zomu X ((+)) oblast bodu porušení; indikuje, že bod porušení se vyskytuje na kosmidu, jak ukazuje hybridizace FISH.

Molekulová analýza u šesti pacientů se znovu uspořádaným chromozomem X za použití kosmidových fluorescenčně značených kosmidových sond a hybridizace in šitu indikujeme oblast odpovídající za malý vzrůst je zúžena na interval o velikosti 270kb, který je ohraničený bodem porušení pacienta GA zjeho centromerové distální strany a u pacientů AK a SS na jeho centromerové proximální straně.

Korelace genotyp-fenotyp může být informativní a může posloužit k zobrazení kritického intervalu, kteiý odpovídá za malý vzrůst postavy, na lidském chromozomu X a Y. V této studii se použila analýza hybridizací FISH ke studiu rozšíření metafáze a interfáze jádra lymfocytů u pacientů, kteří nejsou delece a translokace na chromozomu X a body porušení v Xp22.3. Tyto 30 body porušení se jeví být přítomny u dvou ze čtyř pacientů (AK a SS), což je způsobeno přítomností sekvencí s predispozicí k znovu uspořádání chromozomu. Zjistil se další pacient s kruho

- 13 CZ 297640 B6 vým Y s porušením nacházejícím se v kritické oblasti o velikosti 270 kb, což redukuje kritický interval na 170 kb.

Korelací výšky šesti jedinců s jejich místem porušení se mapoval interval o velikosti 170 kb v pseudoautozomální oblasti, jehož přítomnost nebo absence má podstatný účinek na výšku vzrůstu. Tento interval je ohraničen místem porušení na chromozomu X pacienta GA v místě vzdáleném 340 kb distálně od telemoru (Xpteil) a místem porušení u pacientů AT a RY proximálně 510/520 kb Xptel. Toto uspořádání zahrnuje podstatnou redukci kritického intervalu na téměř jednu čtvrtinu jeho původní velikosti (Ogata T., Goodfellow P., Petic C., Aya M. Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal do DXYS15: localization of agrowth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455 459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short Stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene (s). J. Meg. Genet. 32: 831-834; Ogata T., Matsuo N. (1995): Turner Syndrome and female sex chromosome aberrations. deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629). Pro experimenty FISH za účelem testování prevealence a signifikance uvedeného genomového lokusu na velké sérii pacientů s idiopatickým malým vzrůstem je nyní dostupná malá sada šesti až osmi kosmidů.

B. Identifikace kandidáta genu odpovídajícího za malý vzrůst

Za účelem hledání transkripčních jednotek v nejmenší kritické oblasti o velikosti 170 kb se provedlo trapování exonu a selekce cDNA u šesti kosmidů (110E3, F2cos, 43C11, 02410, 15D15, 34F5). Trapování exonu se izolovaly tři různé pozitivní klony (ET93, ET45, a G108). Všechny z nich se mapovaly zpět ke kosmidů 34F5. Předchozí studie za použití cDNA selekčních protokolů a přístupu k 25 různým knihovnám cDNA vedly k neúspěchu, což naznačuje, že geny v tomto intervalu se exprimují s velmi malým nadbytkem.

Za účelem zjištění, zda nějaký gen v uvedeném intervalu chybí, se stanovila za použití náhodné M13 metody a terminátové chemie nukleotidové sekvence vzdálené přibližně 140 kb od uvedené oblasti PARI. Za účelem sekvenční analýzy se vybraly kosmidy se vzájemným minimálním překryvem, aby spolu pokryly kritický interval. Provedla se sekvenční analýza a následná předpověď proteinu pomocí programu „X Grail“, verze 1.3c, stejně jako trapování exonu pomocí programu FEXHB, což potvrdilo všechny 3 dříve klonované exony. Nedetekoval se žádný jiný gen kódující protein, než co už byl dříve izolován.

C. Izolace genu SHOX odpovídající za malý vzrůst

Za předpokladu, že všechny tři exonové klony ET93, ET45 a G108 jsou součástí stejného genu, použily se spolu jako sondy k testování 14 různých knihoven cDNA vytvořených z 12 různých fetálních (plíce, játra, mozek 1 a 2), a dospělých tkání (vaječníky, placenta 1 a 2, fibroblasty, skeletové svalstvo, kostní dřeň, mozek, mozkový kmen, hypotalamus, podvěsek mozkový). Mezi přibližně 14 miliony klony nanesenými na plotny se nedetekoval ani jeden klon. Za účelem izolace transkriptu v plné délce se uskutečnil 3' a 5'RACE. Za účelem 3'RACE se použily primery z exonu 108 na RNA z placenty, skeletového svalstva a fibroblastů z kostní dřeně a z tkáně, kde se exprimuje GI08. Ze všech tří tkání se získaly dva různé 3'RACE klony velikosti 1173 a 652 bp, což naznačuje, že existují dva různé 3' exony a a b. Tyto dvě odlišné formy se nazývají SHOXa a SHOXb.

Za účelem zvýšení šancí pro izolaci celé 5' části genu, o kterém se ví, že je exprimován s malým přebytkem, se buněčná linie Hela ošetřila retinoovou kyselinou a forbolesterem PMA. RNA z takové indukované buněčné linie a RNA z placenty a skeletového svalstva se použila ke konstrukci „Mararhonovy knihovny cDNA“. Ze všech tří tkání se izolovaly identické klony 5'RACE cDNA.

- 14CZ 297640 B6

Experimentální postup:

RT-PCR a konstrukce knihovny CDNA.

OD firmy Clontech se získala lidská polyA'RNA ze srdce, pankreasu, skeletového svalstva, fetálních ledvin a jater. Celková RNA se izolovala z buněčné linie fibroblastů z kostní dřeně činidlem TR1ZOL (Gibco-BRL), způsobem, který popisuje výrobce. První řetězec syntézy cDNA se získal pomocí kitu „Superscript first strand cDNA synthesis kit (Gibco-BRL), kdy počátečním materiálem je 100 ng polyA¹ RNA nebo 10 ug celkové RNA za použití oligofdtj-adaRNAptorového primem (GGCCACGCGTCGACTAGTAC[dT]₂oN. Po syntéze prvního řetězce dDNA se reakce naředila 1/10. Při dalších experimentech PCR se použila 5 ul tohoto ředění. „Marathonova knihovna cDNA“ se zkonstruovala z polyA'RNA skeletového svalstva a placenty amplifikačním kitem pro cDNA (Clontech), jak popisuje výrobce. Knihovny cDNA zfetálního mozku (katalogové číslo # HL5015b), fetální plíce (HL3022a), vaječníků (HL 1098a), podvěsku mozkového (HLI097v) a hypotalamu (HL 1172b) se získaly od firmy Clontech. Knihovny cDNA mozku, ledvin, jater a plic se staly součástí rychlého testu pomalu lidské cDNA knihovny (Clontech). cDNA knihovna fetálního svalstva se získala z instituce UK Human Genome Mapping Project Resources Center.

D. Sekvenační analýza a struktura genu SHOX

Na základě analýzy sekvencí získaných klonů pomocí 5' a 3'RACE se uspořádala sekvence SHOXa a SHOXb (1349 a 1870 bp). Identifikoval se jeden otevřený čtecí rámec o velikosti 1870 bp (SHOXa) a 1349 bp (SHOXb), který dává vzniku dvou proteinů o 292 aminokyselinách (SHOXa) a 225 aminokyselinách (SHOXb). Oba transkripty a i b se dělí o běžný 5'konec, ale mají odlišný poslední 3' exon. Toto zjištění naznačuje, že se používá alternativní signály sestřihu. Dosáhlo se úplného uspořádání mezi dvěmi cDNA a sekvenovanou genomovou DNA zkosmidů LL0YNCO3M15D10a LL0YNC3''M34F5, což umožňuje ustanovení struktury exon-intron (obrázek č. 4). Gen se skládá ze 6 exonů, jejichž velikost se pohybuje v rozmezí od 58 bp (exon III) do 1146 bp (exon VA). Exon 1 obsahuje CpG, startovací kodon a 5'oblast. Stop kodon stejně jako 3'-nekódující oblast se nachází v každém alternativně sestřiženém exonu Va a Vb.

Příklad 3

Identifikovaly se dvě cDNA, které tvoří 160 kb velkou oblast, která je kritická pro malý vzrůst. Tyto cDNA korespondují s geny SHOX a pET92. cDNA se se identifikovaly hybridizací subklonů kosmidů s knihovnami cDNA.

Sada kosmidových klonů, které úplně pokrývají kritickou oblast, je genetickým materiálem pro identifikaci kauzativního genu. Projekty pozičního klonování, které vedou k izolaci genů z uvedené oblasti, se uskutečnily trapováním exonu a selekcí cDNA. Zjištěním jejich polohy v pseudoatozomální oblasti se tyto geny mohou vyhnout X-deaktivaci a může se uplatnit účinek dávky.

Klonování genu, který když není přítomen (haploid) neboje deficitní odpovídá za malý vzrůst je delším krokem přesnosti diagnózy a poskytuje základny pro analýzu mutací v genu pomocí například jednořetězcového konformačního polymorfizmu (SSCP). Navíc klonování uvedeného genu a jeho následná biochemická charakterizace otevřela cestu k hlubšímu porozumění biologických procesů, které jsou zahrnuty v řízení růstu. Sekvence DNA podle vynálezu poskytuje první molekulový test pro identifikaci jednotlivců se specifickou vadou genu v komplexní heterogenní skupině pacientů, kteří vykazují idiopatický malý vzrůst.

- 15 CZ 297640 B6

Příklad 4: Expresní patern SHOXa a SHOXb

Analýza northernovým přenosem za použití jednotlivých exonů jako hybridizačních sond ukázala odlišný expresivní profil každého exonu, což silně naznačuje, že pruhy o různé velikosti a inten5 zitě reprezentují produkty křížové hybridizace s jinými genovými sekvencemi bohatými na G, C.

Aby se dosáhlo více realistického expresivního profilu genů SHOXa a b, provedly se s RNA z různých tkání RT-PCR experimenty. Zatímco exprese SHOXa se pozorovala ve fibroblastech skeletového svalstva, placenty, pankreasu, srdce a kostní dřeně, exprese SHOXb se omezila na fibroblasty fetální ledviny, skeletového svalstva a kostní dřeně, přičemž zdaleka nejsilnější expreio si vykazují fibroblasty kostní dřeně.

Exprese SHOXa v několika cDNA knihovnách připravených zfetálního mozku a ze svalstva, z mozku dospělých, z plic a z podvěsku mozkového a skutečnost, že v žádné uvedené knihovně není exprimován SHOXb, podává další důkaz, že exprese jedné formy sestřihu (SHOXa) je více 15 rozšířena než druhá (SHOXb), která se exprimuje převážně tkáňově specifickým způsobem.

K. odhadu transkripční aktivity SHOXa a SHOXb na X a Y chromozomu se použila RT-PCR RNA, která se extrahovala z různých buněčných linií, jenž vykazují aktivní X, neaktivní X nebo Y chromozom. Všechny buněčné linie vykazují produkt amplifikace očekávané délky 119 bp 20 (SHOXa) a 541 bp (SHOXb), což je důkaz, že jak SHOXa, i b unikly deaktivaci chromozomu X.

Geny SHOXa a b kódují nové proteiny homeodomén. Gen SHOX je vysoce konzervativní mezi jednotlivými živočišnými druhy od savců po ryby a ptáky. Na samém 5'konci a 3'konci vedle homeodomény jsou pravděpodobně konzervativní oblasti mezi člověkem a myši, což znamená funkční signifikanci. Během evoluce mezi člověkem a myší se v těchto oblastech aminokyselin 25 neakumulovaly rozdíly.

Experimentální postupy:

a) 5' a 3'RACE

Za účelem klonování transkriptů 5' konce SHOXa a b se provedla metoda 5'RACE za použití zkonstruované „Marathonových cDNA knihoven“. Použily se následující oligonukleotidy příměry: SHOX B. rev. GAAAGGCATCCGTAAGGCTCC (pozice 697-718, reverzní řetězec [r]) a adaptorový primer API. Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po 35 dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu vteřin, 66 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 25 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX A rev, GACGCCTTTATGCATCTGATT40 CTC (pozice 617-640 r) a adaptorového primeru AP2. PCR se provedlo během 35 cyklů s teplotou renaturace 60 °C.

Za účelem klonování transkriptů 3' konce SHOXa a b provedla metoda 3'RACE, jak popisuje v publikaci Frohman et al., 1988, za použití prvního řetězce cDNA s primerem oligo(dT)adapto45 ru. Použily se následující oligonukleotidové primery: SHOX A for GAATCAGATGCATAAAGGCGTC (pozice 619-640) a oligo(dT)adaptor. Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX B for, GGGAGCCTTACGGATGCCTTTC (pozice 697-718) 50 a oligo(dT) adaptoru. PCR se provedlo během 35 cyklů s teplou renaturace 62 °C.

Za účelem potvrdit sekvence transkriptů SHOXa a SHOXb se uskutečnila PCR 5'oligonukleotidovým primerem a 3'oligonukleotidovým primerem. V případě SHOXa se použily následující primery: G310 for AGCCCCGGCTGCTCGCCAGC (pozice 59-78) a SHOX D rev CTGCGCG

- 16CZ 297640 B6

GCGGGTCAGAGCCCCAG (pozice 959-982 r). V případě SHOXb se použily následující příměry: T310 for AGCCCCGGCTGCTGCCAGC a SHOX2A rev GCCTCAGCAGCAAAGCAAGATCCC (pozice 1215-1238 r). Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut, °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Produkty se čistily na gelu a klonovaly se za účelem sekvenační analýzy.

b) Analýza SSCP

Amplifikovaná gcnomová DNA pocházející z pacientů se analyzovala způsobem SSCP, který se popisuje v publikaci Orita M., Suzuki Y., Sekiya T., and Hayashi K., (1989): Rapid and sensitive detection of point mutations and polymorphisms using the polymerase chain reaction. Genomics 5:874-879). 1 až 5 ul produktů PCR se smíchalo s 5 ul denaturačního roztoku, který obsahuje % formamidu a 10 mM EDTA pH8, a denaturovaly se při teplotě 95 °C po dobu 10 minut, vzorky se ihned ochladily na ledu a nanesly se na 10% polyakrylamidový gel (akrylamid: bisakryamid = 37,5 : 1 a 29 : 1; gel s více sloty, báze TGGE, Qiagen), který obsahuje 2% glycerol a 1 x TBE. Elektroforéza proběhla při teplotě 15 °C při napětí 500 V po dobu 3 až 5 hodin a obarvila se stříbrem, jak se popisuje TGGE manuálu (Qiagen, 1993).

c) Klonování a sekvenování produktů PCR

Produkty PCR se klonovaly do vektoru pM0S5/we za použití pMOSfí/weT-sady vektorů od firmy Amersham. Kultura z jedné kolonie kultivována přes noc se lyžovala povařením ve 100 ml vody po dobu 10 minut. Lyzáty se použily jako templáty pro PCR se specifickými primery. SSCP produktů PCR umožnila identifikaci klonů, které obsahují různé alely. Klony se sekvenovaly za použití vektorových primerů Uni a T7 značených CY5 způsobem sekvenování v cyklech, jak popisuje výrobce (ThermoSequenase Kit (Amersham)) na automatickém sekvenátoru ALF (Pharmacia).

d) Testování cDNA knihoven pomocí PCR

Aby se detekovala exprese SHOXa a b provedlo se PCR testování několika knihoven cDNA a prvního řetězce cDNA s SHOXa a b specifickými primery. V případě knihoven cDNA se použil ekvivalent DNA 5 x 10⁸ pfu. V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for. V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 68 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů

e) PCR testování knihoven cDNA

Aby se detekovala expresse SHOXa a b provedlo se PCR testování několika knihoven cDNA s SHOXa a b specifickými primery. V případě knihoven cDNA se použil ekvivalent DNA 5 x 10⁸pfu. V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for. V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut. 94 °C po dobu 30 vteřin, 68 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů.

- 17CZ 297640 B6

Příklad 5: Expresivní patern OG12, což je putativní homolog SHOX a SHOT

Za účelem stanovení expresivního paternu se provedla hybridizace in šitu u embryí myší z 5. dne p.c. a 18,5 dne p.c., u fetálních a u nově narozených zvířat. Expresi bylo možno ukázat u vyvíjejících se zárodků noh, v mesodermu nasalních postupů, které se podílejí na tvorbě nosu a patra, u očních víček u aorty, ve vyvíjejících se žláz samic, ve vyvíjející se páteři (omezených na diferenciaci motorických neuronů) a v mozku. Na základě tohoto expresního patentu a na mapování pozice jeho lidského homologu SHOT, SHOT, reprezentuje pravdě podobně kandidáta Comelia de Lange syndromu, který zahrnuje malý vzrůst.

Příklad 6: Izolace nového genu homeoboxu podobného SHOX SHOT na chromozomu 3, který souvisí s lidským růstem/s malým vzrůstem postavy.

U člověka se izoloval nový gen nazývaný SHOT (SHOX homolog na chromozomu 3), který vykazuje nejvíce homologie s myším genem OG12 a lidským SHOX. Lidský gen SHOT a myší OG12 jsou vysoce homologní. Vykazují 99% identity na úrovni proteinu. Ačkoli se to ještě neprokázalo, díky homologii mezi SHOT a SHOX (jde o identitu pouze v homeooblasti) je pravděpodobné, že gen SHOT také odpovídá za malý vzrůst nebo lidský růst.

Gen SHOT se izoloval za použití primerů ze dvou nových lidských EST (HS 1224703 a HS 126759) z databáze EMBL, přičemž se amplifikuje reverzně přepsaná RNA z linie fibroblastů kostní dřeně (Rao E., Weiss B., Mertz A., et al., (1995): Construction of a cosmid conting spanning the short stature condidate region in the pseudosomal region PAR 1. In: Turner syndrome in a life spán respective: Research and clinical aspects. Proceeding of the 4^,hIntemational Symposium on Turner Syndrome, Gothenburg, Sweden, 18-21 May, 1995., edited by Aíbertsson-Wikland K., Ranke M.B., pp. 19-24, Elsevier. 5' a 3'konec genu SHOT se generoval RACE-PCR z fibroblastové knihovny kostní dřeně, která se zkonstruovala podle publikace Rao E., Weiss B., Fukami M., Rump A., Niesler B., Metz A., Muroya, K., Binder G.,. Kirsch S., Winkelmann M., Nordsiek G., Heinrich U., Breuning Μ. H., Ranke M.B., Rosenthal A., Ogata T., Rappold G.S. (1997): Pseudoautosomal deletions encompassing a navel homeobox gene cause groxth failure in idiopathic short stature and Turner syndrome. Nátuře Genet 15:54-62. Gen SHOT se mapoval analýzou FISH chromozomu 3q25/q26 a dále se mapoval myší homolog syntetické oblasti na myším chromozomu 3. Na základě expresivního patentu OG12, což je myší homolog genu SHOT, gen SHOT reprezentuje kandidáta odpovídajícího za Comelia Lange syndrom (který vykazuje malou výšku vzrůstu a další rysy, kam patří kraniofaciální abnormality), který se mapoval v tomto intervalu na chromozomu 3q25/26.

Příklad 7: Vyhledávání mutací u pacientů s idiopatickým malým vzrůstem

Sekvence DNA podle vynálezu se používají při PCR, LCR a při jiných známých technologiích, za účelem stanovení, zda takoví jednotlivci s malou výškou vzrůstu vykazují malé delece nebo bodové mutace v genu odpovídajícím za malý vzrůst.

U 91 (z celkového počtu 259 jednotlivců) nezávislých pacientů mužského a ženského pohlaví s idiopatickou malou výškou vzrůstu (odhad četnosti idiopatickou malé výšky vzrůstu v obecné populaci se odhaduje na 2 až 2,5 %) se testovala přítomnost malých změn v uspořádání nebo bodové mutace v genu SHOXa. Navrhlo se šest sad primerů PCR, ne pouze za účelem amplifikace jednotlivých exonů, ale také sekvencí, které lemují exon a malé části 5ÚTR. V případě největšího exonu, exon 1, se generovaly dva další primery uvnitř exonu. Primery, které se používaly při PCR, se uvádějí na tabulce č. 2.

- 18CZ 297640 B6

Provedl se jednořetězcový konformační polymorfizmus (SSCP) všech amplifikovaných exonů, jehož velikost se pohybuje v rozmezí od 120 do 295 bp. Pouze v případě dvou jednotlivců s malou výškou vzrůstu (Y91 a Al) se identifikoval posun pohyblivosti pruhů. Klonovaly se a sekvenovaly fragmenty, které vykazují pozměněné paterny SSCP (unikátní konformery SSCP). Aby se zabránilo vzniku PCR a sekvenaěních artifaktů, sekvenování se provedlo na dvou řetězcích za použití dvou nezávislých reakcí PCR. Mutace u pacienta Y91 se nachází v pozici 28 bp 5' konce startovacího kodonu v 5'UTR a zahrnuje substituci, kdy quannin se nahradí citidinem. Aby se zjistilo, jestli tato mutace reprezentuje řídký polymorfizmus neboje odpovědná za fenotyp regulací exprese genu, například slabším navázáním translačních iniciačních faktorů, testovaly se pacientovi rodiče a sestra. Přestože sestra a otec pacienta dosahují normální CP (data nejsou uvedeny). Uvedená substituce bází reprezentuje řídký polymorfizmus, který neovlivňuje fenotyp.

Klonování a sekvenování unikátních konformerů SSCP pacienta Al vykazuje transici bází, kdy citidin nahradí thymidin (nukleotid 674), která zavede terminační kodon do pozice aminokyseliny 195 předpovězených aminokyselinových sekvencí aminokyseliny 195 předpovězených aminokyselinových sekvencí 225 a 292. Aby se stanovilo, zda tato nesmyslná mutace je geneticky asociována s malou výškou vzrůstu rodiny, provedla se rodová analýza. Zjistilo se, že všech šest jednotlivců s malou výškou vzrůstu (definovanou jako výška nižší než 2 standardní odchylky) vykazuje nenormální posun SSCP a transici cytidinu za thymidin. Ani otec, ani jedna z tet a dědeček z matčiny strany, kteří dosáhly normální výšky nevykazují mutaci, což naznačuje, že babička přenesla mutovanou alelu na její dvě dcery a na jejich dvě vnoučata. U této rodiny existuje shoda mezi přítomností mutovaných alel a fenotypu vykazujícího malou výšku vzrůstu.

Stejná situace, která se popisuje shora v textu, se zjistila u jiného pacienta s malou výškou vzrůstu, který je japonského původu.

Příklad 8

Sekvence DNA podle vynálezu se používají pro charakterizaci funkce genu nebo genů. Sekvence DNA se mohou použít jak otázky při vyhledávání bází v databázích aminokyselin a nukleových kyselin za účelem identifikace příbuzných genů nebo genových produktů. Jako otázka pro vyhledávání v databázi aminokyselin se použila částečná aminokyselinová sekvence SHOX93. Test vykazuje velmi vysokou homologii s mnoha známými proteiny homeoboxů. Sekvence cDNA podle vynálezu se mohou použít při produkci peptidu rekombinantní metodou. Při produkci proteinu rekombinantním způsobem se mohou použít různé expresivní systémy, které jsou dobře známy v oboru.

Běžnou syntézou peptidu (syntéza proteinů podle Merrifieldovy metody) se syntetizoval peptid se sekvencí CSKSFDQKSKDGNGG a podle standardních protokolu se získaly polyklonální protilátky z králíků a kuřat.

Seznam literatury

Ashworth A., Rastan S., Lovell-Badge R., Kay G., (1991): X-chromosome inactivation may explain the difference in viability of X0 humans and mice. Nátuře 351: 406-408:

Blagowidow N., Page D.C., Huff D., Mennuti MT (1989): Ullrich-Tumer syndrome in an XY female fetus with deletion of the sex-determining portio of the Y chromosome. Am J. med. Genet. 34: 159-162.

Cantrell M.A., Bicknell J.N., Pagon RA et al. (1989): Molecular analysis 46, XY females and regional assignment of a new Y-chromosome-specific probe. Human. Genet. 83: 88-92.

- 19CZ 297640 B6

ConnorJ.M., Loughlin S.A.R. (1989): Molecular genetics of Turner's syndrome. Acta Pediatr. Scand. (Suppl.) 356: 77-80.

Disteche C.M., Casanova M., Saal H., Friedman C., Sybert V., Graham J., Thline H., Page D.C., Fellous M„ (1986): Smáli deletions of the short arm of the Y-chromosome in 46,XY females. Proč. Nati. Acad. Sci USA 83: 7841-7844.

Ferguson-Smith M.A. (1965): Karyotype-phenotype correlations in gonadal dysgenesis and their bearing on the pathogenesis of malformations. J. med. Gent. 2: 142-155:

Ferrari D., Kosher R.A. Dealy C.N. (1994): Limb mesenchymal cells inhibited from undergoing cartilage differentiation by a tumor promoting phorbol ester maintain expression of the homeobox-containing gene MSX1 and fail to exhibit gap junctional communication. Biochemical and Biophysical Research Communications. 205 (1):429-434.

Fischer M., Bur-Romero P., Brown L.G. et al., (1990): Homologous ribosomal protin genes in the human X- and Y-chromosomes escape from X-inactivation and possible implementation for Turner syndrome. Cell 63: 1205-1218.

Freund C., Horsford D.J., Mclnnes R.R. (1996): Transcription factor genes and the developing eye: a genetic perspective: Hum. Mol. Genet. 5: 1471-1488.

Gehring W., J., Qian Y.Q., Billeter, Furukubo-Tokunaga K.., Schier A. F., Resendez-Preze D., Affolter M., Otting G., Wuthrich K., (1994): Homeodomein-DNA recognition. Cell 78: 211-223.

Grumbach M.M., Conte F.A. (1992). Disorders of sexual differentation. In: Williams textbook of endocrinology, 8^th edn.m edited by Wilson J.D., Foster D.W., pp. 853-952, Philadelphia, WB Saunders.

Hernandez, D., Fisher E.M.C (1996): Down syndrome genetics: unravelling a multifactorial disorder. Hum. Mol. Genet. 5: 1411-1416.

Kenyon C., (1994): If birds can fly, why can't we? Homeotic genes and evolution. Cell 78: 175180.

KumlaufR., (1994): Hox genes in vertebrate development. Cell 78: 191-201.

Lawrence P.A., Morata G., (1994): Homeobox genes: their function in Drosophila segmentation and pattem formation. Cell 78: 181-189.

Lehrach H., Drmnac R., Hoheisel J.D., Larin Z., Lemon G., Monaco A.P., Nizetic D„ et al., Hybridization finger printing in genome mapping and sequencing. In Davies K.E., Tilghman S., Eds. Genome Analysis 1990: 39-81 Cold Spring Harbor, NY.

Levilliers J., Quack B., Weissenbach J., Petit C., (1989): Exchange of terminál portions of Xand Y-chromosomal short arms in human XY females. Proč. Nati. Acad. Sci. USA 86: 22962300.

Lippe B.M. (1991): Turner Syndrome. Endocrinol. Metab. Clin., North Am., 20: 121-152. Magenis R.E., Tochen M.L. Holahan K.P., Carey T., Allen L., Brown M.G. (1984): Turner syndrome resulting from partial deletion of Y-chromosome short arm: localization of male determinantns. J. Pediatr 105: 916-919.

-20CZ 297640 B6

Pohlschmidt M., Rappold G.A., Krause M., Ahlert D., Hosenfeld D., Weissenbach J., Gal A. (1991): Ring Y chromosoine: Molecular characterization by DNA probes. Cytogenet. Cell Genet. 56: 65-68.

Qiagen (1993) TGGE Handbook, Diagen GmbH, TGMA 41123/93. Osenfeld R.G. (1992): Turner syndrome: a quide for physicians. Second edition. The Turner's Syndrome Sciety.

Rovescalli A.C., Asoh S„ Nirenberg M. (1996): Cloning and characterization four murine homeobox genes. Proč. Nati. Acad. Sci. USA 93: 10691-10696.

Shalet S.M. (1993): Leukemia in children treated with growth hormone. Journal of Pediatrie Endocrinology 6: 109-11 Vimpani G.V., Vimpani A.F., Lidgard G.P., Cameron E.H.D., Farquhar J.W. (1977) Prevalence of severe growth hormone deficiency. Br. Med. J. 2: 427-430.

Zin A.R., Page D.C., Fisher E.M.C. (1993): Turner syndrome: the čase of the missing sex chromosomc. T1G 9 (3): 90-93.

Sekvenční protokol (1) Obecné informace (i) Navrhovatel:

(A) JMÉNO: Rappold-Hoerbrand, Gudrun, Dr.

(B) ULICE: Hauseckerweg 14 (C) MĚSTO: Heidelberg (D) ZEMĚ: Německo (E) ZIP:6918 (ii) Název vynálezu: Molekula nukleové kyseliny kódující polypeptidy a způsoby jejího použití.

(i i i) Počet sekvencí: 16 (iv) Počítačem čitelná forma:

(A) TYP MÉDIA: disketa (B) POČÍTAČ: kompatibilní s IBM PC (C) OPERAČNÍ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, verze #1.30 EPO (vi) Data předchozích přihlášek (A) PŘIHLÁŠKA č. US 60/027,633 (B) DAT UM PODÁNÍ: 01-10-1996 (2) Informace o sekvenci SEQ ID NO: 1:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 60 aminokyselin (B) TYP: aminokyselinová

-21 CZ 297640 B6 (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 1

Gin I

Arg

Ser

Arg 5

Thr

Asn

Phe

Thr

Leu 10

Glu

Gin

Leu

Asn

Glu 15

Leu

Giu

Arg

Leu

Phe 20

Asp

Glu

Thr

His

Tyr 25

Pro

Asp

Ala

Phe

Met 30

Arg

Glu

Leu

Ser 35

Gin

Arg

Leu

Gly

Leu 40

Ser

Glu

Ala

Arg

Val 45

Gin

Val

Trp

Phe

Gin 50

Asn

Arg

Ala

Lys 55

Cys

Arg

Lys

Gin

Glu 60

(2) Informace o sekvenci SEQ ID NO: 2:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 209 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon II: ET93“ (v) TYP FRAGMENTU: lineární (xi) POPIS SEKVENCE: SEQ ID NO: 2

GGATTTATGA	ATGCAAAGAG	AAGCGCGAGG	ACGTGAAGTC	GGAGGACGAG	GACGGGCAGA	60
CCAAGCTGAA	ACAGAGGCGC	AGCCGCACCA	ACTTCACGCT	GGAGCAGCTG	AACGAGCTCG	120
AGCGACTCTT	CGACGAGACC	CATTACCCCG	ACGCCTTCAT	GCGCGAGGAG	CTCAGCCAGC	180
GCCTGGGGCT	CTCCGAGGCG	CGCGTGCAG				209

(2) Informace o sekvenci SEQ ID NO: 3:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 368 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon I: G310“

-22 CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 3:

GTGATCCACC	CGCGCGCACG	GGCCGTCCTC	TCCGCGCGGG	GAGACGCGCG	CATCCACCAG	60
CCCCGGCTGC	TCGCCAGCCC	CGGCCCCAGC	CATGGAAGAG	CTCACGGCTT	TTGTATCCAA	120
GTCTTTTGAC	CAGAAAAGCA	AGGACGGTAA	CGGCGGAGGC	GGAGGCGGCG	GAGGTAAGAA	180
GGATTCCATT	ACGTACCGGG	AAGTTTTGGA	GAGCGGACTG	GCGCGCTCCC	GGGAGCTGGG	240
GACGTCGGAT	TCCAGCCTCC	AGGACATCAC	GGAGGGCGGC	GGCCACTGCC	CGGTGCATTT	300
GTTCAAGGAC	CACGTAGACA	ATGACAAGGA	GAAACTGAAA	GAATTCGGCA	CCGCGAGAGT	360
GGCAGAAG						368

(2) Informace o sekvenci SEQ ID NO: 4:

(i)	CHARAKTERISTIKA SEKVENCE
10	(A) DÉLKA: 58 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární
15 (ii)	TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon III: ET45“
(xi)	POPIS SEKVENCE: SEQ ID NO: 4:

GTTTGGTTCC AGAACCGGAG AGCCAAGTGC CGCAAAGAAG AGAATCAGAT GCATAAAG (2) Informace o sekvenci SEQ ID NO: 5:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 89 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon IV: G108“ (xi) POPIS SEKVENCE: SEQ ID NO: 5:

GCGTCATCTT GGGCACAGCC AACCACCTAG ACGCCTGCCG AGTGGCACCC TACGTCAACA

TGGGAGCCTT ACGGATGCCT TTCCAACAG

-23CZ 297640 B6 (2) Informace o sekvenci SEQ ID NO: 6:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 1166 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina o

(A) POPIS: /popis = „exon: Va“ (xi) POPIS SEKVENCE: SEQ ID NO: 6:

GTCCAGGCTC	AGCTGCAGCT	GGAAGGCGTG	GCCCACGCGC	ACCCGCACCT	GCACCCGCAC	60
CTGGCGGCGC	ACGCGCCCTA	CCTGATGTTC	CCCCCGCCGC	CCTTCGGGCT	GCCCATCGCG	120
TCGCTGGCCG	AGTCCGCCTC	GGCCGCCGCC	GTGGTCGCCG	CCGCCGCCAA	AAGCAACAGC	180
AAGAATTCCA	GCATCGCCGA	CCTGCGGCTC	AAGGCGCGGA	AGCACGCGGA	GGCCCTGGGG	240
CTCTGACCCG	CCGCGCAGCC	CCCCGCGCGC	CCGGACTCCC	GGGCTCCGCG	CACCCCGCCT	300
GCACCGCGCG	TCCTGCACTC	AACCCCGCCT	GGAGCTCCTT	CCGCGGCC&C	CGTGCTCCGG	360
GCACCCCGGG	AGCTCCTGCA	AGAGGCCTGA	GGAGGGAGGC	TCCCGGGACC	GTCCACGCAC	420
GACCCAGCCA	GACCCTCGCG	GAGATGGTGC	AGAAGGCGGA	GCGGGTGAGC	GGCCGTGCGT	480
CCAGCCCGGG	CCTCTCCAAG	GCTGCCCGTG	CGTCCTGGGA	CCCTGGAGAA	GGGTAAACCC	540
CCGCCTGGCT	GCGTCTTCCT	CTGCTATACC	CTATGCATGC	GGTTAACTAC	ACACGTTTGG	600
AAGATCCTTA	GAGTCTATTG	AAACTGCAAA	GATCCCGGAG	CTGGTCTCCG	ATGAAAATGC	660
catttcttcg	TTGCCAACGA	TTTTCTTTAC	TACGATGCTC	CTTCCTTGAT	CCCGAGAGGC	720
TGCGGAACGG	GTGTGGATTT	GAATGTGGAC	TTCGGAATCC	CAGGAGGCAG	GGGCCGGGCT	780
CTCCTCCACC	GCTCCCCCGG	AGCCTCCCAG	GCAGCAATAA	GGAAATAGTT	CTCTGGCTGA	840
GGCTGAGGAC	GTGAACCGCG	GGCTTTGGAA	AGGGAGGGGA	GGGAGACCCG AACCTCCCAC	900
GTTGGGACTC	CCACGTTCCG	GGGACCTGAA	TGAGGACCGA	CTTTATAACT TTTCCAGTGT	960
TTGATTCCCA	AATTGGGTCT	GGTTTTGTTT	TGGATTGGTA	TTTTTTTTTT TTTTTTTTTT	1020
TGCTGTGTTA	CAGGATTCAG	ACGCAAAAGA	CTTGCATAAG	AGACGGACGC GTGGTTGCAA	1080
GGTGTCATAC	TGATATGCAG	CATTAACTTT	ACTGACATGG	AGTGAAGTGC AATATTATAA	1140
ATATTATAGA	ΤΤΑΑΑΛΑΑΑΑ	AATAGC				1166

(2) Informace o sekvenci SEQ ID NO: 7:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 625 párů bází (B) TYP: nukleová kyselina

-24CZ 297640 B6 (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon: Vb“ (xi) POPIS SEKVENCE: SEQ ID NO: 7:

io

ATGGAGTTTT	GCTCTTGTCG	CCCAGGCTGG	AGTATAATGG	CATGATCTCG	ACTCACTGCA	60
ACCTCCGCCT	CCCGAGTTCA	AGCGATTCTC	CTGCCTCAGC	CTCCCGAGTA	GCTGGGATTA	120
CAGGTGCCCA	CCACCATGTC	AAGATAATGT	TTGTATTTTC	AGTAGAGATG	GGGTTTGACC	180
ATGTTGGCCA	GGCTGGTCTC	GAACTCCTGA	CCTCAGGTGA	TCCACCCGCC	TTAGCCTCCC	240
AAAGTGCTGG	GATGACAGGC	GTGAGCCCCT	GCGCCCGGCC	TTTGTAACTT	TATTTTTAAT	300
TTTTTTTTTT	TTTTAAGAAA	GACAGAGTCT	TGCTCTGTCA	CCCAGGCTGG	AGCACACTGG	360
TGCGATCATA	GCTCACTGCA	GCCTCAAACT	CCTGGGCTCA	AGCAATCCTC	CCACCTCAGC	420
CTCCTGAGTA	GCTGGGACTA	CAGGCACCCA	CCACCACACC	CAGCTAATTT	TTTTGATTTT	480
TACTAGAGAC	«XiATCTTGC	TTTGCTGCTG	AGGCTGGTCT	TGAGCTCCTG	AGCTCCAAAG	540
ATCCTCTCAC	CTCCACCTCC	CAAAGTGTTA	GAATTACAAG	CATGAACCAC	TGCCCGTGGT	600
CTCCAAAAAA	AGGACTGTTA	CGTGG				625

(2) Informace o sekvenci SEQ ID NO: 8:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 15577 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „HOX93“ (ix) RYSY:

(A) NÁZEV/KLÍČ: exon (B) POZICE: 1498..1807 (D) JINÉ INFORMACE: /funkce = „část exonu 1 (G310)“ (ix) RYSY:

(A) NÁZEV/KLÍČ: misc(B) POZICE: 3844..4068 (D) JINÉ INFORMACE: /funkce = „oblast pET92 (první část)“

-25CZ 297640 B6 (ix) RYSY:

(A) NÁZEV/KLÍČ: mise- (B) POZICE: 4326..4437 (D) JINÉ INFORMACE: /funkce = „oblast pET92 (druhá část)“ (ix) RYSY:

(A) NÁZEV/KLÍČ: misc- (B) POZICE: 4545..4619 (D) JINÉ INFORMACE: /funkce = „oblast pET92 (třetí část)“ (ix) RYSY:

(A) NÁZEV/KLÍČ: misc- (B) POZICE: 5305..5512 (D) JINÉ INFORMACE: /funkce = „část exonu Π (ET93)“ (ix) RYSY:

(A) NÁZEV/KLÍČ: misc- (B) POZICE: 11620..11729 (D) JINÉ INFORMACE: /funkce = „část exonu IV (G108)“ (xi) POPIS SEKVENCE: SEQ ID NO: 8:

CTCTCCCTGT	TGTGTCTCTC	TTTCTCTCTC	TCCATCTCTC	TCCGTCTTTC	CCCCTCTGTC	60
TCTTTCTCTG	TCTCCATCCC	TCTGTCTCTC	CCTTTCTCTC	TGTCTTTCCT	TGTCTCTCTC	120
TTTCTCTCTC	TCTCTCCATC	TCTCTCTCTC	CCGGTCTCTC	TCTCTCCATC	TCCCCGTCTC	180
TCCGTTTCTC	TCTCTGCCTC	TCCCTGTCTG	TCTCTCTCTT	TGTGTGTGTT	ACACACACCC	240
CAACCCACCG	TCACTCATGT	CCCCCCACTG	CTGTGCCATC	TCACACAAGT	TCACAGCTCA	300
GCTGTCATCC	TGGGTCCCCA	GGCCCCGCCG	GGGAGGAAGA	TGCGCCGTGG	GGTTACGGGA	360
GGAAGGGGAC	TCCGGGCCTC	CTGGTGCCCC	ACTTTATTTG	CAGAAGGTCC	TTGGCAGGAA	420
CCGTGACGCG	TTTGGTTTCC	AGGACTTGGA	AAACGAATTT	CAGGTCGCGA	TGGCGAGCAC	480
CGGCTTCCCC	TGAAGCACAT	TCAATAGCGA	GAGGCGťXiAG	GGAGCGAGCA	GGAGCATCCC	540
ACCATGAAAA	CCAAAAACAC	AAGTATTTTT	TTCACCCGGT	AAATACCCCA	GACGCCAGGG	600
TGACAGCGCG	GCGCTAAGGG	AGGAGGCCTC	gcgccggggt	CCGCCGGGAT	CTGGCGCGGG	660
CGGAAAGAAT	ATAGATCTTT	ACGAACCGGA	TCTCCCGGGG	ACCTGGGCTT	CTTTCTGCGG	720
GCGCTGGAAA	CCCGGGAGGC	GGCCCCGGGG	ATCCTCGGCC	TCCGCCGCCG	CCGCCTCCCA	780
AGCGCCCGCG	TCCCGGTTTG	GGGACACCCG'	GCCCCTTCTT	CTCACTTTCG	GGGATTCTCC	840
AGCCGCGTTC	CATCTCACCA	ACTCTCCATC	CAAGGGCGCG	CCGCCACCAA	CTTGGAGCTC	900
ATCTTCTCCC	AAAATCGTGC	GTCCCCGGGG	CGCCCGGGTC	CCCCCCCTCG	CCATCTCAAC	960
CCCGGCGCGA	CCCGGGCGCT	TCCTGGAAAG	ATCCAGGCGC	CGGGCTCTGC	GCTCCTCCCG	1020
GGAGCGAGGG	CGGCCGGACA	ACTGGGACCC	TCCTCTCTCC	AGCCGTGAAC	TCCTTGTCTC	1080

-26CZ 297640 B6

TCTGTCTCTC	TCTGCAGGAA	AACTGGAGTT	TGCTTTTCCT	CCGGCCACGG	AAAGAACGCG	1140
GGTAACCTGT	GTGGGGGGCT	CGGGCGCCTG	CGCCCCCCTC	CTGCGCGCGC	GCTCTCCCTT	1200
CCAAAAATGG	GATCTTTCCC	CCTTCGCACC	AAGGTGTACG	GACGCCAAAC	AGTGATGAAA	1260
TGAGAAGAAA	GCCAATTGCC	GGCCTGGGGG	GTGGGGGAGA	CACAGCGTCT	CTGCGTGCGT	1320
CCGCCGCGGA	GCCCGGAGAC	CAGTAATTGC	ACCAGACAGG	CAGCGCATGG	GGGGCTGGGC	1380
GAGGTCGCCG	CGTATAAATA	GTGAGATTTC	CAATGGAAAG	GCGTAAATAA	CAGCGCTGGT	1440
GATCCACCCG	CGCGCACGGG	CCGTCCTCTC	CGCGCGGGGA	GACGCGCGCA	TCCACCAGCC	1500
CCGGCTGCTC	GCCAGCCCCG	GCCCCAGCCA	TGGAAGAGCT	CACGGCTTTT	GTATCCAAGT	1560
CTTTTGACCA	GAAAAGCAAG	GACGGTAACG	GCGGAGGCGG	AGGCGGCGGA	GGTAAGAAGG	1620
ATTCCATTAC	GTACCGGGAA	GTTTTGGAGA	GCGGACTGGC	GCGCTCCCGG	GAGCTGGGGA	1680
CGTCGGATTC	CAGCCTCCAG	GACATCACGG	AGGGCGGCGG	CCACTGCCCG	GTGCATTTGT	1740
TCAAGGACCA	CGTAGACAAT	GACAAGGAGA	AACTGAAAGA	ATTCGGCACC	GCGAGAGTGG	1800
CAGAAGGTAA	GTTCCTTTGC	GCGCCGGCTC	CAGGGGGGCC	CTCCTGGGGT	TCGGCGCCTC	1860
CTCGCCACGG	AGTCGGCCCC	GCGCGCCCCT	CGCTGTGCAC	ATTTGCAGCT	CCCGTCTCGC	1920
CAGGGTAAGG	CCCGGGCCGT	CAGGCTTTGC	CTAAGAAAGG	AAGGAAGGCA	GGAGTGGACC	1980
CGACCGGAGA	CGCGGGTGGT	GGGTAGCGGG	GTGCGGGGGG	ACCCAGGGAG	GGTCGCAGCG	2040
(XGGCCGCGC	GCGTGGGCAC	CGACACGGGA	AGGTCCCGGG	CTGGGGTGGA	TCCGGGTGGC	2100
TGTGCCTGAA	GCCGTAGGGC	CTGAGATGTC	TTTTTCATTT	TCTTTTTCTT	TCCTTTCCTT	2160
TTTTTGTTTG	TTTGTTTGTT	TGTTTGAGAC	AGAGTCTCGC	TCTGTCCCCC	AGGCTGGAGT	2220
GCAGTGGTGC	GATCTCGGCT	CACTGCAACC	TCCGCCTCCT	GGGTTCAAGC	GATTCTCCTG	2280
CCTCAGCCTC	CCCAGTAGCT	GGGATTACAG	GCATGCACCA	CCACGCCTGG	CTAATTTTTG	2340
TGCTTTTAGT	AAAGACGGGG	ATTCACCATG	TTGGCCAGGC	TGGTCTCGAA	CTCCTGACCT	2400
CAGGTGATCC	ACCCGCCTCG	GCCTCCCAAA	GTGCTGGGAT	GACAGGCGTG	AGGGACCGCG	2460
CCCGGCCTGG	GTCCTGACGG	CTTAGGATGT	GTGTTTCTGT	CTCTGCCTGT	CTGCCTTGTA	2520
tttaccx;tc-a	C C CAG AC í A A	CAGACX. AGG €	GTGTCGACGC	GCCTTCCCAG	c<x:tcagcgc	2 580
CTGCCGGGCC	CCCGGAGATC	ACGCXiAAGAC	TCGAGGCTGC	GTGGTAGGAG	ACGGGAAGGC	2640
cccgggtcag	CTCGGTTCTG	TTTCNGTTTA	AGGAACCCTT	CATTATTATT	TCATTGTTTT	2700
CCTTTGAACG	TCGAGGCTTG	ATCTTGGCGA	AAGCTGTTGG	GTCCATAAAA	ACCACTCCCG	2760
TGAGCGGAGG	TGGCCGGGAT	CTGGATGGGG	CGCGAGGGGC	CCCGGGGAAG	CTGGCGGCTT	2820
CGCGGGCGCG	TCCTAAGTCA	AGGTTGTCAG	AGCGCAGCCG	GTTGTGCGCG	GCCCGGGGGN	2880
AGCTCCCCTC	TGGCCCTTGC	TCCTGAGACC	TCACTGGTGG	GTCGTCCCGT	GGTGGAAATC	2940
GGGGAGTAAG	AGGCTCAGAG	AGAGGGGCTG	GCCCCGGGGA	TCTCTGTGGA	CACACGACAA	3000
CTGGGCGGCA	TACATCTTAA	GAATAAAATG	GGCTGGCTGT	GTCGGGGCAC	AGCTGGAGAC	3060

-27CL 297640 B6

GGCTATGGAC	GCCTGTTATG	TTTTCATTAC	AAAGACGCAG	AGAATCTAGC	CTCGGCTTTT	3120
GCTGATTCGC	AAAGTTGAGG	TGCGAGGGTG	AATGCCCCAA	AGGTAATTCT	TCCTAAGACT	3180
CTGGGGCTAC	CTGCTCTCCG	GGGCCCTGCA	TTTGGGGTGT	GGAGTGGCCC	CGGGAAATAG	3240
CCCTTGTATT	CGTAGGAGGC	ACCAGGCAGC	TTCCCAAGGC	CCTGACTTTG	TCGAAGCAGA	3300
AAGCTGTGGC	TACGGTTTAC	AAAGCAGTCC	CCGGTTTCTG	ACCGTCTAAG	AGGCAGGAGC	3360
CCAGCCTGCC	TTTGACAGTG	AGAGGAGTTC	CTCCCTACAC	ACTGCTGCGG	GCACCCGGCA	3420
CTGTAATTCA	TACACAGAGA	GTTGGCCTTC	CTGGACGCAA	GGCTGGGAGC	CGCTTGAGGG	3480
CCTGCGTGTA	ATTTAAGAGG	GTTCGCANGC	GCCCGGCGGC	CGCTTCTGNT	GGGGTTGCTT	3540
TTTGGTTGTC	CTTCNGCAAA	CACCGTTTTG	CTCCTCTNGN	AACTCTCTCT	TNCTCCCCCN	3600
TGGCCNGTNG	GACCCGGGNA	NGAGCAAAGT	GTCCTCCAGA	CCNTTTTGAA	ANGTGAGAGG	3660
AAAATAAAGA	CCAGGCCAAA	NNGACCCAGG	GCCACAGGAG	AGGAGACAGA	GAGTCCCCGT	3720
TACATTTTNC	CCCTTGGCTG	GGTGCAGAAA	GACCCCCGGG	CCAGGACTGC	CACCCAGGCT	3780
ACTATTTATT	CATCAGATCC	AAGTTAAATC	GAGGTTGGAG	GGCAGGGGAG	AGTCTGAGGT	3840
TACCGTGGAA	GCCTGGAGTT	TTTGGGNAAC	AGCGTGTCCC	CGCCGAGCCT	GGGAGCCCGT	3900
GGGTTCTGCA	AAGCCTGCGG	GTGTTTGAGG	ACTTTGAAGA	CCAGTTTGTC	AGTTGGGCTC	3960
AATTNCCTGG	GGTTCAGACT	TAGAGAAATG	AAGGAGGGAG	AGCTGGGGTC	GTCTCCAGGA	4020
AACGATTCAC	TTGGGGGGAA	GGAATGGAGT	GTTCTTGCAG	GCACATGTCT	GTTAGGAGGT	4080
GAAACAGAAT	GTGAAATCCA	CGTTGGAGTA	AGCGTCCAGC	GCTGAATGTA	GCTCGGGGTG	4140
GGGTGGGAGG	GCUrTGGTGT	GGATCGTGGA	AGGNAAGAAA	gacagaacag	GGTGCTAGTA	4700
TTTACCCCGT	TNCCCTGTAG	AGACCCTGGA	TTTGTCAGCT	TTGCAAGCTT	CTTGGTTGCA	4260
GCGGCCTTGC	CTGTGGCCCT	TTGAGACTGT	TTCCAGACTA	ZiACTTCCAAA	TGTCAGCCCC	4320
TTACCCTTGA	CAl/CAAGGGA	CATCTCATTA	GGGCATCGCG	tgcttctcat	CTGTGNCTCA	4380
GCAGGCCCNG	AGATAGGAAN	CANGAGGGGC	NGTTGGNAGA	TGCNCACTTC	CACCAGCCCT	4440
GGGNTTGAAG	GGGANGCGAN	GGGANGACNA	CCTTTTANCT	TAAACCCCTN	GAGCTTGGTN	4500
CAGAGAGGNC	TGAATGTCTA	AAATGAGGAA	GAAAAGGTTT	TTCACCTGGA	AACGCTTGAG	4560
UXTGAGTCT	tctggccntt	CTGACNTCCC	CCAGCAAATA	CAGACAGGTC	ACCAANCTAC	4620
TGGAGATGAG	AAAGTGCCAT	TTTTGWLACA	CTCTGGTGGG	GTAGGTGCCC	GACCGCGTGT	4680
GAAAAANGTG	GGAANNGGAG	AGATTTCTGN	CGCACGCGGT	TCAGCCCCC-A	GGCGCGGNTG	4740
GCNGCATTCN	AGGNTACTCA	GACGCGGTTC	TGCTGTTCTG	CTGAGAAAGA	GGCTTCGGGT	4800
AGGGGCTCCT	AGCTCCGCCA	GATCGCGGAG	GGACCCCCAG	CCCTCCTGCG	CTGCAGCGGT	4 U 60
GGGGATAGCG	TCTCTCCGTA	GGCCTAGAAT	CTGCAACCCG	CCCCGGGTCC	TCCCCGTGTC	4920
CTTCCCGGGC	GTCCCGCCGG	GGATCCCACA	GTTGGCAGCT	CTTCCTCAAA	TTCTTTCCCT	4980
TAAAAATAGG	ATTTGACACC	CCACTCTCCT	TAAAAAAAAA	AAATAAGAAA	AAAAGGTTAG	5040
GTTATGTCAA	CAGAGGTGAA	GTGGATAATT	GAGGAAACGA	TTCTGAGATG	AGGCCAAGAA	5100

-28CZ 297640 B6

AACAACGCTC	GTGCAAAGCC	CAGGTTTTTG	GGAAAGCAGC	GAGTATCCTC	CTCGGCTTTT	5160
GCGTTATGGA	CCCCACGCAG	TTTTTGCGTC	AAAGCGCATT	GGTTTTCGAG	GGCCCCCTTT	5220
CCACCGCGGG	ATGCACGAAG	GGGTTCGCCA	CGTTGCGCAA	AACCTCCCCG	GCCTC1AGCCC	5280
TGTGCCCTCC	GCTCCCCACG	CAGGGATTTA	TGAATGCAAA	GAGAAGCGCG	AGGACGTGAA	5340
GTCGGAGGAC	GAGGACGGGC	AGACCAAGCT	GAAACAGAGG	CGCAGCCGCA	CCAACTTCAC	5400
GCTGGAGCAG	CTGAACGAGC	TCGAGCGACT	TTTTGACGAG	ACCCATTACC	CCGACGCCTT	5460
CATGCGCGAG	GAGCTCAGCC	AGCGCCTGGG	GCTTTCCGAG	GCGCGCGTGC	AGGTAGGAAC	5520
CCGGGGGCGG	GGGCGGGGGG	CCCGGAGCCA	TCGCCTGGTC	CTCGGGAGCG	CACAGCACGC	5580
GTACAGCCAC	CTGCGCCCGG	GCCGCCGCCG	TCCCCTTCCC	GGAGCGCGGG	gaggttgggt	$640
GAGGGACGGG	CTGGGGTTCC	TGGACTTTTG	GAGACGCCTG	AGGCCTGTAG	GATGGGTTCA	5700
TTGCGTTTGT	TTTTCACCAA	CAGCAAACAA	ATATATATAC	ATATATATTA	TACAAATAAC	5760
AAATAAATAT	ATATGTTATA	C.AGATGGGTA	TATTGTATAT	ATTATAGATA	TTTGTTCGTC	5820
CTTGGTGCAA	AGACACCCGG	TGAACCCATA	TATTGGCTCC	TGACTGCCTT	CGGTTCCCCT	5860
GGGATTGGTT	ATAGGGGCAA	CACATGCAAA	CAAAACTTTC	CCTGGATTAT	ACTTAGGAGA	5940
CGAAGCTACA	GATGCGTTTG	ATCCAGZiGTG	TTTTACAAGA	TTTTTCATTT	ΆΑΑΑΑΛΛΆΑΤ	6000
GTGTCTTTTG	GCCCCTGATT	CCCCTCCGTC	TTCCCGTGTG	GCTGCATTGA	AAAGGTTTCC	6060
TTAGGATGAA	AGGAGAGGGG	TGTCCTCTGT	CCCTAGGTGG	AGAGAAACAG	GGTCTTCTCT	6120
TTCCTCCGTT	TTTTCACCTA	CCGTTTCTAT	CTCCCTCCTC	ccctctccag	CCCTGTCCTC	6180
1 írGTZGAAAC	CACCCCCTCC	tccctccggc	TGTGGGGAGC	GCAGGAGCAC	GTTGGGCATC	624 0
ZGGATGAGt G	GNAGACTATT	AGCGGGGCAí	GGGGGGTCCC	(ΧΜΛΜΧΜ:	GCGZvATTCAC	6300
<,< T(/:c<.<.7-.t	GAGACC.AGGC	A< CGGGGGGC	GGAGGGGCCT	TGGGTGTCCG	CAGAíXíGALG	6360
GGCGGGť AGA	GCCTTCCTCC	G< ATTCTAAA	CATTCACTTA	/vAGGTATGAG	TTTAHTTTCA	6420
GGGGTGC TGC	TGGGAGAGCC	TCCAAATGGC	TTCTTCCAGC	CCCTGCCTGA	CAGTTCAGCT	6480
( CCCTGGAAG	GTCAACTCC r	CTAGTCCTTT	CTCCTGGTTC	TGGGCAGGAC	AGAAGTGGGG	6540
..gagggagag	AGAGAGAGAG	AGAGAGAGAG	ACfíGTCAGGA	TCCCCGGACC	ΓΤ(χκχ/Λ< c	6600
C.i,T( AA/kAAT	AAATGAAATT	AAGATTGCC G	ACCAGAGAGA	GAACCGTGAC	AAAGGAAACG	6660
GCGTTGAAAG	CAAAGAGACG	AACTGAAAGC	CCGTTCCCGT	AGGACTGGTT	ATGAGGTCAA	6720
CACATTCAAA	CACAGCTTGC	TCTGGATTTT	GCTGAGCAGA	ggaagataga	GATGCATTTG	6780
ATCCAAAGTG	TGTTAGATCT	TTCATTATAT	GTGTGTCTAT	ATATATAAAC	ατατατ/λατ	6840
ΑΤΛΤΛΛΛί.ΛΤ	ACATAAATGT	ATGTAAATAT	ATATAATCTA	TATACATATA	ΤΑΑΑΤΑΤΛΤΑ	6900
AACACATATA	TAATATATAA	ATCTATAAAC	ΛΤΑΤΑΤΑΑΤΆ	TATAAACATA	ΑΑΤΑΤΑΤΆΑΑ	6960
CATATATAAT ,	ΑΤΛΤΑΑΑΤΛΤ	ATTAACATAT	ATAAAATATG	ΤΑΤΛΆΑΤΑΤΆ	TATAAACATA	7020
TAAACATATA	ΤΑΑΑΤΆΤΛΤΑ	AACATATAAA	TATATAAACA	ΤΛΤΆΤΑΑΑΤΛ	TATACAAACA	7080

-29CZ 297640 B6

TATTGTATAT	ATATAAATAT	ATATAAAAAC	ATATATATAC	ΑΤΛΤΑΑΑΑΑΤ	ATATATAAAC	7140
ATATATACAT	ATAAAGAAAT	ATATATAAAC	ATATATACAT	ATAAATATAC	ATATATAAAC	7200
ATATATATAC	ATAAAATATA	TATAAACATA	TATACATATA	AAAATATATA	TATATTAACA	7260
TATATATACA	ΤΑΤΑΑΑΑΑΤΛ	ΤΑΤΑΤΆΤΤΑΑ	CATATATATA	CATATAAAAA	ΤΛΤΑΤΑΤΑΤΑ	7320
TTTTTGGCCC	CTGATTCCCT	TCGGTTCCTG	TGGGATGGGT	GATTGAGTCA	ACACATTCAA	7300
ACACAACTTT	TCCATCGATG	TTGCTTAGGA	GATGAGGATA	CAGATGCGTT	TGATGGAGAG	7440
GGTTTTACAA	GCTCTTTCAT	TTAAATATAT	ATATATATAT	ΑΤΛΤΑΤΑΤΤΤ	TTTGGCTCCT	7500
GATTCTCTTC	CGTCTTCCCA	TGTGGCTGCA	TTTTAAAAGG	CTTCCCTAAG	ATCGTTACGA	7560
TTAAATCAAC	CCTCCCCAGG	catctttacc	GAGGGCTGTG	GTCCCCAAAG	CGATACAGCC	7620
CAGGAGGGAG	AGAGGCTTTC	GTGACTTGGA	GGAAGGACTG	TGTCCCTCCT	TAGGGCGTCT	7680
GTGGCCTCAG	TGAGGGAAGG	AAGCTGCATC	AGACAGGGGT	TTCCTCGCTG	TCCACCCCTC	7740
TGGCAGAAGA	TGGATTGGGC	TGCCCCGNTA	TAAATTAATG	AAAAGATTAA	AGTTTCGCTA	7800
AAGGGGACAT	CGAGTTTATG	TGTCATCTCC	TGGTGNTCTG	TGTGCCNTGG	GATNCTGCAA	7860
TATATCCCAN	NGCCCTTGAT	GNNNTACTGT	TTNCTATAAA	ΑΑΝΝΤΆΑΛΤΝ	TACTTGTNNA	7920
ATTTAANTTC	CNNNACACTA	TTTNCTTTCC	NNGTNAGTCT	NATTANCCGA	NCGAGAGCAN	7980
CGNTTAGTTN	CAGCTNGCGG	AAAATTGGTT	GTGGGGTGTG	TGCGGACCCC	NGAGNAACGC	8040
CCNNTAAAAT	NAAAGACAAA	NTCNGGGGAC	AAGNCTNGGG	GGTTATCGNN	ATTGCNNAGG	8100
GGTCGNCATG	ΆΑΑΛΝΤΤΤΑΑ	CGACGGTAAA	ΤΑΑΤΆΆΤΆΆΑ	AANNCAAACA	TGGGAATGNC	8160
AAT A/iAAOAC	ΛΤΑΑΓΤΤί	WATCGCCGC	C A a rvzG' /V, A G	GATCCTATAG	TAAAGGCGA.G	o ·’ -> p
TGCGCTTTGA	GGGGTCATAA	AAATCAATTA	GTTCCAACAC	CCACGTCCCG	CGTTC.AGGGG	8280
acgg<x;acga	GCAGGGACAG	AAAAAGAAAC	CATATTTGAA	TCCCATCTCT	CTGTGAATTG	8340
ttgggtcaca	TGCGTCTCAG	TACAGCCCGT	CCCGTGCTGT	GACCGGATAG	AGTTTCAATT	8400
tactgtggaa	ATTTGCTGTA	AATAAATTGA	GCATCCGATA	GAAGCTGTTG	CTGATTAACC	8460
TTTTATTTTT	AGCGTGGCCC	TGCAAAGTCG	TATCACCCAG	CTGTCAGGCT	TCTAATCGAA	8520
AGTTATGAGA	CCACGGTGAG	GGGCAGGCGG	ΤΑΆΤΤΤΑΑΤΤ	ACAACAAATA	TCTTTGGGTT	ÍJS80
TATGGCW .	AGCTZwXATTA	AAT< >7' ΆΤΤΆ	TTCZiGTGTct	UTNAATGGNA	AATCAAAANN	8·> 40
GGAAATCGCA	NTTACGGNCA	TTTGGGNNAA	ANGAAAGCGG	GGNAGTGCTC	TTTAATNGAA	8700
NNGAAATAAC	TGTCTTAAGC	AGTGTCACAC	ACTTCACTTA	CCATATTCGN	GGCCTNAATT	8760
GGAANNTGGA	TCGTNNGAAT	CACTCCNAAG	ACTNGATTTA	TTANGCGCTT	CACGNCAGCN	8820
NGGCNTAATT	CATCHACTTN	NGTATTCTTC	ATCMNNNATT	TTTTTTTTTC	CTCTCNNGCC	8880
GTGTTNNGAA	gggagagtga	ATGAGGCTTT	CCACGTTTCA	GGAGGATTTT	CTTTTTTGAA	8940
AAATGCCCTT	CCAGAGGCTT	TTGGGTGGCT	GGCTTGCTTT	CTGGGCCCTG	GAGGANGACA	9000
GGCGGANGAG	TCCAGGTGGG	CATGGAGAGG	CACAGTGGCA	GGTCACCTGG	ATGGTGAGTG	9060
GAGGTGGAGG	TCTGAAGGCG	CCAGCTTTGG	AAATTATTGG	TGAATTTCGA	TGTCAGCACC	9120

-30CZ 297640 B6

AGGNCAGGGG	CCTTTTTGGC	GGGGGTGTGA	GGGANGGATG	ANCTTTGCTG	GGAAANNCAG	9180
GATCAGGTTC	TCCAGGCGCA	CTGCAGCCCG	GTAGGACCCA	CTTTGGAAAT	GAAAAGCCAG	9240
TTNCCGAAAG	CTGGGCTGGA	AGCTTCCGTG	TTGGGTTCAA	GAGCAAGTTC	ACGTTGCGCT	9300
GTGTAGACTC	CTGGCTGCTC	CCAAACTCTG	AGGGTTTTCT	GAGGTTCCCT	TCATAGGGGC	9360
ACCGGCCCTG	GGCCATGCAC	AGTGCGTAAG	GGTGGCTGTG	GGCCGAGGGA	CCCAGCACGT	9420
GTTTTGCCCA	CAACAGCCGG	AGTGACTGGT	TCACTCACCG	CCTTGGCGGA	GGACGCCTGT	9480
TCTCTGGACG	AATCATTTCT	CTTGGGTGGT	GACTGCCTTG	TGGGTCAAGG	TGCAGGTTTT	954 0
CTGCCACAGA	AAACCTGTTA	GGAGGAATTA	AGCGACTAAG	ACTGTCAGGG	AGGTGGTGGT	9600
GGGGGANGAG	GNAGGGGGTG	GTGTCCAGAT	TACCAGGCAT	AGGCTAAACT	GCCTGCACTC	9660
TCCAGCTGGT	CTGTCTGTGG	AGGAGGGGAT	TGTCAATACT	GGGAGAGCAG	AGGAGGCTCG	9720
TAGGAGGTGA	GAGGGGGTGG	AATTTGCATG	CAAATCTTCA	CATGAGGCCT	GTGTGAATTT	9780
CTCCAGCCTC	CTGAGGGTCC	CCTGCGCTAT	TGCACTCAAC	TTCTTGATAG	TTTACCCCAA	9840
GACTCAGAAG	TCCTTAGAGG	GGCAGAATGC	CCCCACCACA	AAGCCTGCTA	TCCTTGGGCG	9900
TCCTCAGGAC	CCTTGGTCAT	GAATGGGACC	CTTTCATGTA	TGGGGACCCT	TGGTAATATG	9960
AATGGGACGC	CTTCAGCTCC	CCAGGGCTTC	CGAGGAGGCC	GAGAAGGGCA	AAGACACTTC	10020
CGAGGAGGCC	GAGAAGGGCA	AAGACATTTT	CTGGGCTTGG	TGTGTCAAGA	GCTAGATTGG	10080
AGAAGGGGCT	GGATTTGGAA	CTCTTTAGCC	ATCAGCTCAC	CCTCTCCGTT	TGTGGCTAAA	10140
GTCTGAAGGT	GGAAACTTCG	GTTCTCCTAC	AGGGTCTACA	GGAGTTGGGG	GGCGGGGCGC	10200
CCACACAGAA	CGCTGGAAAG	TTCGACAGTC	CACTTCCACT	GGCTCGGAAC	TCACTTTTTC	10260
ACCTTAAGTT	CATCAGCGGT	AACGCATAGG	TCTCACTTAG	GCAGGGCACG	GATGATTTAA	10320
gziatttctac	TTCTAGGTCzT	GGTGCGGTGG	CTCACACCTC	TAATCCCAGC	ACTTTG<>GAG	10380
GCCCAGGAGG	GTGGATCGCT	TGAGGTCAGG	AGTTTGAGAC	CAGCCTGGCC	AACATGGTGA	10440
AACCCCGTCT	CTACTAAAAT	ACGAAAATTA	GCCAGGCATG	GTGGTGAGCA	CCTGTAATTC	10500
CAGCTACTCG	GGAGC,CTGAG	gcaggagaat	CGC.TTGAACC	TGGGAGGTGG	ACGTTGCAGT	10560
GAGGTGAGAT	CACACCACTG	CACTCCAGCC	TGGATGAGAG	AGCAAGACTC	TGTCTCAAAA	10620
ACAAAATAAA	ACAAAAACAA	AACAAAAATC	aaaaaagaaa	ACCCAATTTC	cagttctaLg	10680
CCAGGTGCAG	TGGCTCACGC	CTGTCATCCC	AGCACTTTGG	GAGGCCCAGG	AGGGTGGATC	10740
GCTTGAGGTC	AGGAGTTCGA	GACCAGCCTG	GCCAACATGG	TGAAACCCCA	TCTTTACTAA	10800
AAATACAAAC	GTTAGCTGGG	TGTGGTGGTG	TGCGCCTGTA	ATCCCAGCTA	CTCGGGAAGC	10860
TGAGGCTGGA	GAATTGCTTG	AATCTGGGAG	GTGGAGGTTG	CAGGGAGGCG	AGATAGTGCC	10920
ACTGCAGTCC	AGCCTGGACC	AGAGAGCAAG	ACTCCGTCTC	AAAAACAAAA	GAAAGCAAAA	10980
ACAAAAAACA	AGAGACCAGC	CTGGCCAACA	TGGTGAAACC	GCGTCTTTAC	TAAAATACAA	11040
AATTAGCCGG	GCATGGTGGT	GGGCACCTGT	AGTCCCAGCT	ACTCGGGAGG	CTGAGGCAGG	11100

-31 CZ 297640 B6

AGAATGGCTT	GAACCTGGGA	GGTGGAGCTT	GCAGTGAGCC	GAGATAGTGC	CACTGCACTC	11160
CAGCCTGGGC	GACAGAGCGA	GACTTGATTT	CAGAACCACC	ACCACCACAA	CAAAACAAAA	11220
CAAAAAATCC	AAAAAAACCC	CAATTTCCAG	TACTAGGTAG	TCAGTGATGC	AGGGCTGGAG	11280
ACAGAGGGGC	GGTAAGTGTC	TGGGCGCCCA	CCATCAGTCA	CCTCCCAGCT	CCCANGAGGT	11340
GCAAAGTGCT	TGGTTCAGCC	TCATGGGAAG	GATGCTCCCT	GGGGAGGCTG	GGCTGGGTTC	11400
ACAGGGCTCT	TCACATCTCT	CTCTGCTTCT	NCCCCAAGGT	TTGGTTNCCA	GAACCGGAGA	11460
GCCAAGTGCC	GNCAAACAAG	AGAATCAGAT	GCATAAAGGT	GGGTGTCGGG	ACTGGGGGGA	11520
CCTGAAGCTG	GGGGATCCTG	CTCCAGGAGG	GATGGGGTCG	ACAAGGTGCT	GGCTACACCC	11580
AGGACCACCA	CACTGACACC	TGCTCCCTTT	GGACACAGGC	GTCATCTTGG	GCACAGCCAA	11640
CCACCTAGAC	GCCTGCCNGA	GTGGCACCCT	ACGTCAACAT	GGGAGCCTTA	CGGATGCCTT	11700
TCCAACAGGT	AGCTCACTTT	TTCTTCCTCT	GNAAGATCCC	TAGGGACCTG	CTGCTCCCTT	11760
CCCCTTTCCC	CTATTTGCTG	CCGCATCCTG	ACACTCCTAG	TCCCTCCCTG	CCCCTGCAGA	11820
CTTCTCAGCT	GGCCCTTAGA	AAAAAAGCCT	CTTTTCCGAG	GAGGCATTTA	CAGGCACCTT	11880
GGCACCTATG	AAATCAGGCT	GGGCCAGGCG	GGGTGGCTCA	CACCTGTCAT	CCCAGCACTT	11940
TGGGAGGCCA	AGGTTAGGAG	TTTGAGACCA	GCCTGGACAA	CATAGCAAAA	GCCTGTCTCT	12000
ACTAAAAATA	CAAAAAAAAA	TTAACAGGGA	GTGGTGGTGG	GGACCTGTAA	TCCCAGCTAC	12060
TTGGGAGGCT	GAGGCAGGAG	AATCACTTGA	ACCCGGGAGG	CCGAGGTTGC	GGTGAGCCGA	12120
GATCGTGCGA	TTGCACTCCA	GGCTGGGCGA	CAGAGTGAGA	CTCTGTCTCA	ΑΑΑΑΑΤΆΆΆΤ	12180
ΛΑΆΤΆΆΆΤΆΑ	ATGTAAAAAA	ATAAAAATAG	GTCGGGCACG	GTGGGTCACG	TCTGTAATCC	12240
CAíXLAGTTTG	GAAGGCCGAG	GTGGGTGGAT	GACAGGGTCA	AGAGATTGAG	ACCATCCTGG	12300
< caacatggc	AAAATGCCGT	CTCTACTAAA	AAATACAAAA	ATTAGGCGGG	CGTGGTGGCG	12360
GGTGCCTGTA	ATCCCAGCTA	CTUGGGAGGC	TGAGGCAGGA	GAATCGGTTG	AACCCGGGAT	12420
GCGGAGGTTG	CAGTGAGCGG	AGATCACATC	ACTGCACTCC	AGGCTGGGGA	ACAAGAGCGA	12480
AACTGCGTCT	TACAATAAAT	ΛΛΑΤΛβΑΤΛΑ	ATAAATAAAC	AAATAAACTT	TACTTTAGAA	12540
ACAAATCIXT	GTCCG7GTTT	GTCTTTTCAC	CTGTCCTGCA	(X X3 t \AAACA A	AACATAAAAT	12600
1 ¹ -7\A	ATAGTAGT', A	TTTCATTCCG	GGAAAAAGAA	AG”GGA i*g ΓΓ	TGCCTTCACt:	1 'λ 660
CT7TCTCGTC	CTTCVTCTGG	TGCTCCTGAN	GGCCCANGGG	NAGAGGGTGG	AAAGTNCAGA	12720
ggaagaaaga	CGGGGCTGGG	GGGGGGGGTC	CGTGGGGACC	GAGGGAGGCA	TGTTCCCNAT	12780
TTCCNTGTCT	TCACNTTCAA	AGNAGGGGCC	CCTCGNCTCT	GGAATGAGGC	CTACGGTTTC	12840
CTTTCCCNGA	AGAGTTNCCC	CTTTGTGAGC	TTACGGCTTC	GGAGTGAACC	TCGGTGCAAC	12900
CTGTTATTAA	AACACACAGA	GGCTAATGCC	AGCAAAAACA	CGCUCCCCGC	TCCTGGTTTC	12960
AGAGGGAAGA	AAAAAATTCA	TAAGCACGGC	CATGCTTTTC	TAATAAAAAT	TCATTAAATA	13020
ATCGTTATAA	GGGATGAAGC	CGGGAGGGGA	GAGGAGAGGA	ACACAATCAA	GAGACTTTCT	13080
TTGAACTTTT	TCTCCC/TGCT	TCAAATACAA	AGCAATCTTC	TGTGGGCCTG	GGCCTGGGGG	13140

-32CZ 297640 B6

GTTTCCCCCT	TTCTCTGCAG	CCCATTGGGA	GGAAGAAAAT	GCTTCCCTGA	ANGTTGCTGC	13200
AAAATTGTTT	CTGTTTTTCT	TTTCTTTTTC	T T T? T	TTTTTTGAGA	CGGAGTCTCG	13260
CTCTGTCACC	AGGCTGGAGT	GCAATGGTAT	GATCTCAGCT	CACTGCAACC	TCCACGTTCC	13320
TGTTTCAAGT	CATTCTCCTG	CCTCAGCCTC	CTGAGTAGCT	GGGACTACAG	GCGCCCGCCA	13380
CCACGCCCGG	CTAGTGTTTG	TATTTTTAGA	AAAGACAGGG	TTTCCCCATG	TTGGCCAGGC	13440
TGGTCTTGAA	CTCCTGTCCT	CAAGTGATCT	GCCTGCCTCG	GCCTCCCAAA	GTGCTGTGTT	13500
TCTGTTTTTC	TTTCCCCGCT	TTCTTAGGAG	GCCATCGGGA	AGAATAAAAT	GGTTTCCTTG	13560
AAGTTGATGC	AAAATTGTTT	CTGTTTTTCT	TTTCTCTTTT	CTTTCTTTTT	GAGATGGAGT	13620
CTCGCTCTTT	CACCCAGGCT	GGAGGGCAGT	GGCGCGACCT	CGGCTCACTG	CAACCTCCGC	13680
CTCCCGGGTT	CAAGCGATTC	TCCTGCCTCA	GCCTCCGGAG	TAGCTGGGAT	TACAGGCACC	13740
TGCCACTATG	CCTGGCTAAT	TTTATTATTT	TTAGTAGAGA	CGGGGTTTCA	CCATGTTGGC	13800
CAGGCTGGTC	TCAAACTCCT	GACCTCAGGT	GATCCGCCCG	CCTCGCCTCC	CAAAGTGATG	13860
GGATGANCAG	GNCATNGAGC	NCACCGTGCC	CGGCCCTCTA	ACTCTTTACC	AGACATAAAG	13920
TCTCCNNTTC	CCCTTTCTAA	ATGTATATAT	TGTGTTTTTA	AAAGTTAACA	GCAGGGATCC	13980
CACCTCATTN	CCCCGCTNCT	CTCCCCAAGA	CCTGTCCTGC	ACGTTGCACA	CAGCAGGTGT	14040
GCCCTGGACA	TATCCCAAAC	CCACGCTGAA	AGAAAGAGGG	TCTCACTACA	CGTATGATAT	14100
CTGTGNATCC	TTTAAACATC	TCCGTGGCTT	CCAGGCAACA	CAGCCATAAA	TAGGAATCTC	14160
ATGTCTGACA	TGATACCGGG	ACCATGTATG	GGNAAATTCT	MIGTGTGAAG	TTCCAGCTAC	14220
CCCCGGAGAG	GGANCCATTG	CATACCCTCC	AGAAACTCCC	CTGCCGTTNC	AAGCCAAAGA	14280
U AC AA< GAC AA	ACAGGNTCGG	AGAGAGGGTG	TCATTGAAAA	TCAATACGAT	CATAAGAGCA	1 4340
CACAGCA.CCG	tctttctctt	CTGCCCGTTG	ATACACAATT	ATGAGCAATT	TGCTAACACT	14400
GACAACTCGT	GGCAAGAACA	GGTCGTGTTG	ATACGGTTGC	CTCGTGAGGA	CCCATCTGTC	14460
TTCTGGGGTC	TTGCCTGGAA	CGGAGATCGG	AGTTCAGGGT	GGCTAATAGA	ATCATTACTC	14520
ACCTAGGGAC	ACAGAATNA'!’	GAGGGTTACC	CCCAGTTAAG	TGCATACAGT	CAAACGGACG	14580
GCTtJCTCTGG	AAGGTACAGT	GACGTGAACA	GCTTTTATGA	AATGCCTAGA	TCTGGACCTT	14640
CCATACCTGA	GCCACCGTTC	CAAAGCACTG	GGCGTTTTTC	AGATACTTTC	ATGAGAAAřlG	14700
TTGTCAACAC	CGCAAGTTTG	CAGTACACAG	TCTGAAAGAT	ATTCTTGTAT	ATGTAGATGT	14760
CTGTAGATGC	CCTGAAGGTG	TGTAGACTTT	AGACACCCAG	AAGGTGTGTA	GATGTCTGTA	14820
GACACCTTCT	ATGTGTGTAG	ATGTCTGTAG	ACGCCCTGCA	GGTGTGTAGA	TATATCTAGA	14880
TGGTCTGCCT	GTGTATGATA	CAGGCTAAAA	AGACATTTGT	GGTGGACACT	AGTTGATTAT	14940
TTAGGACTAT	GAGATGGGAA	AGGAAGNAGC	AACCAGCAGT	GAAAGGCATG	TGGTGGGTGG	15000
GGGGTTGGCA	TTGCAGTGGG	GTCCTCNTGA	NGCAGGTGAC	ACCCACTATA	GGGCTGCCCT	15060
TGGNATGGAC	GCTTTGTNGA	AGCTGTTTGA	TTTCACCACA	CCAAGCCTGG	AGGCACGGAC	15120

-33CZ 297640 B6

ATTCCAGGAT	GGTGAGGAGT	CTGCAAAGGA	GGAGATTGGA	GGAGGTGfAA	TATCCCTAGA	15180
GTACGAGAGA	TGAGATAGGA	GAGCTGTATA	AATAGCACTA	CCAGCCGGAT	GCGGTGGCTC	15240
ACGCCTGTCA	TCCCAGCACT	TTAGGAGGCT	GAGGCAGGCG	GATCACCTGA	GGTCAGGAGT	15300
TCCAGAACAG	CCTGGCCAAC	ACAATGAAAC	CCCATCTTTA	CTAAAAATAC	AAGATTAGCT	15360
GGGCACGGTG	TCTCACGCCT	GTCATCCCTG	CACTTTGGGA	GGTCGAGGTG	CGCAGATCAT	15420
GAGGTCAGTT	TGGCCAACGC	GGCGAAACCC	CGTCTCTACT	AAAAATACAA	AAAAGTAGCC	15480
GGGCGTGGTG	GTGGGCACCT	GTAGTCCCAG	CTACTAGGGA	GGCTGAGGCA	GGAGAATCGC	15540
TTGAACCCGG	ATGCGGACAT	TGCAGTGAGC	CGAGATC			15577

(2) Informace o sekvenci SEQ ID NO: 9:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 753 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „segment genu ET92“ (xi) POPIS SEKVENCE: SEQ ID NO: 9:

CGTGGAAGCC	TGGAGTTTTT	GGGAACAGCG	TGTCCCCGCC	GAGCCTGÍXSA	GCCCGTGGGT	60
TCTGGAAAGC	CTGCGGGTGT	TTGAGGACTT	TGAAGACCAG	TTTGTCAGTT	GGGCTCAATT	120
CCTGGGGTTC	AGACTTAGAG	AAATGAAGGA	GGGAGAGCTG	GGGTCGTCTC	CAGGAAACGA	180
TTCACTTGCíG	GGGAAGGAAT	GGAGTGTTCT	TGCAGGCACA	TGTCTGTTAG	GAGGTGAAAC	240
AGAATGTGAA	ATCCACGTTG	GAGTAAGCGT	CCAGCGCTGA	ATGTAGCTCG	GGGTGGGGTG	300
GGAGGGCCCT	GGTGTGGATC	GTGGAAGGAA	GAAAGACAGA	ACAGGGTGCT	AGTATTTACC	360
CCGTTCCCTG	TAC.ACACCCT	GGATTTGTCA	GCTTTGCAAG	CTTCTTGGTT	GCAGCGGCCT	420
TGCCTGTGCC	CCTTTGAGAC	TGTTTCCAGA	CTAAACTTCC	AAATGTCAGC	CCCTTACCCT	480
TGACAGCAAG	GGACATCTCA	TTAGGGCATC	GCGTGCTTCT	CATCTGTGCT	CAGCAGGCCC	540
GAGATAGGAA	CAGAGGGGCG	TTGGAGATGC	CACTTCCACC	AGCCCTGGGT	TGAAGGGGAG	600
CGAGGGAGAU	ACCTTTTACT	TAAACCCCTG	AGCTTGGTCA	GAGAGGCTGA	ATGTCTAAĎXA	660
TGAGGAAGAA	AAGGTTTTTC	ACCTGGAAAC	GCTTGAGGGC	TGAGTCTTCT	gcccttctga	720
CTCCCCCAGC	AAATACAGAC	AGGTCACCAA	CTA			753

-34CZ 297640 B6 (2) Informace o sekvenci SEQ ID NO: 10:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 1890 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina o

(A) POPIS: /popis = „SHOXa“ (ix) RYSY:

(A) NÁZEV/KLÍČ: cds (B) POZICE: 91...968 (xi) POPIS SEKVENCE: SEQ ID NO: 10:

-35CZ 297640 B6

GTGATCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC60

CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA114

Met Glu Glu Leu Thr Ala Phe Val

TCC Ser

AAG Lys 10

tct ttt

GAC Asp

CAG Gin

AAA Lys 15

AGC Ser

AAG Lys

GAC GGT AAC

GGC Gly

GGA Gly

GGC Gly

GGA Gly

162

Ser

Phe

Asp

Gly

Asn 20

GGC

GGA

GGT

AAG

GAT

TCC

ATT

ACG

TAC

CGG

GAA

GTT

TTG

GAG

210

Gly 25

Gly

GJy

Lys

Lys 30

Asp

Ser

Ile

Thr

Tyr 35

Arq

Glu

Val

Leu

Glu 40

AGC

GGA

CTG

GCG

CGC

TCC

CGG

GAG

CTG

GGG

ACC,

TCG

GAT

TCC

MX

CTC

258

Ser

Gly

Leu

Ala

Arg 45

Ser

Arg

Glu

Leu

Gly 50

Thr

Ser

Asp

ser

Ser 55

Leu

CAG

GAC

ATC

ACG

GAG

GGC

CAC

TGC

GCG

GTG

CAT

TTG

TTC

AAG

306

Gin

Asp

Ile

Thr 60

G1 u

Gly

G1 y

Hj s 65

Cys

Pro

vai

His

Leu 70

Phe

Lys

GAC

CAC

GTA

GAC

AAT

GAC

AAG

GAG

AAA

CTG

AAA

GAA

TTC

GGC

ACC

GCG

354

Asp

His

val 75

Asp

Asn

Asp

Lys

Glu 80

Lys

Leu

Lys

Glu

Phe 85

Gly

Thr

Ala

GTG

GCA

GAA

GGG

ATT

ΤΆΤ

GAA

TGC

AAA

GAG

AAG

CGC

GAG

GAC

GTG

402

Arq

Vai 9(1

Ala

Glu

Gly

Ile

Tyr 95

Glu

Cys

Lys

G1 u

Lys 100

Arq

G1 u

Asp

Val

AAG

TCG

GAG

GAC

GAG

GAC

CX.,G

GAG

ACC

AAG

CTG

AAA

GAG

AGG

CGC

AGC

450

Lys 105

Sei

Glu

Asp

Glu

Asp 110

Gly

Gin

Thr

Lys

Leu US

Lys

Gin

Arg

Ser 1 20

CGC

ACC

AAC

TTC

ACG

CTG

GAG

CAG

CTG

AAC

GAG

CTC

GAG

CGA

crc

TTC

498

Arq

Thr

Asn

Phe

Thr 125

Leu

Glu

Gin

Leu

Asn 130

Glu

Leu

Glu

Arg

Leu 135

Phe

GAC

GAG

ACC

CAT

TAC

GCC

GAC

GCC

TTC

ATG

CGC

GAG

CTC

AGC

CAG

546

Asp

Glu

Thr

His 140

Tyr

Pro

Asp

Ala

Phe 145

Met

Arg

Glu

Leu 150

Ser

Gin

CGC

CTC,

ggg

CTC

TCC

GAG

GCG

CGC

GTG

CAG

GTT

TGG

TTC

CAG

AAC

CGG

594

Arq

Leu

Gly 155

Leu

Ser

Glu

Ala

Arg 160

Val

Gin

Val

Trp

Phe 165

Gin

Asn

Arg

AGA

GCC

AAG

TGC

CGC

AAA

CAA

GAG

AAT

CAG

ATG

CAT

AAA

GGC

GTC

ATC

642

Arq

A) a 170

Lys

Cys

Arg

Lys

Gin 175

Glu

Asn

Gin

Met

His 180

Lys

G1 y

Val

Ile

-36CZ 297640 B6

TTG GGC Leu Gly 135

AAC ATG Asn Met

ACA GCC Thr Ala

GGA GCC

Gly Ala

AAC CAC Asn His

190

TTA CGG Leu Arg

CTA GAC Leu Asp

ATG CCT Met Pro

GCC TGC

Ala Cys

TTC CAA Phe Gin

CGA GTG

Arg Val

195

CAG GTC Gin val

GCA CCC Ala Pro

CAG GCT Gin Ala

TAC GTC

Tyr Val

200

CAG CTG Gin Leu

205

210

215

CAG CTG GAA GGC. GTG GCC CAC

GCG Ala

CAC CCG CAC CTG

CAC His

CCG CAC

CTG Leu

786

Gin

Leu

Glu

Gly Val 220

Ala

His

His 225

Pro

His

Leu

Pro 230

His

GCG

CAC

GCG

CCC

TAC

CTG

ATG

TTC

CCC

CCG

CCC

TTC

GGG

CTG

834

Ala

Al a

His

Ala

Pro

Tyr

Leu

Mec

Phe

Pro

Phe

Gly

Leu

235

240

245

CCC

ATC

GCG

TCG

CTG

GCC

GAG

TCC

GCC

TCG

GCC

GTG

GTC

GCC

882

Pro

Ile

Ala

Ser

Leu

Ala

Glu

Ser

Ala

Ser

Ala

Val

Ala

250

255

260

GCC

AAA

AGC

AAC

AGC

AAG

AAT

TCC

AGC

ATC

GCC

GAC

CTG

CGG

930

Aid

Ala

Lys

Ser

Asn

Ser

Lys

Asn

Ser

Ile

Ala

Asp

Leu

Arg

265

270

275

280

CTC

AAG

GCG

CGG

AAG

CAC

GCG

GAG

GCC

CTG

GGG

CTC

TG ACCCGCCGCG

978

Leu

Lys

Ala

Arg

Lys

His

Ala

Glu

Ala

Leu

Gly

Leu

285

290

CAGCCCCCCG	CGCGCCCGGA	CTCCCGGGCT	CCGCGCACCC	CGCCTGCACC	GCGCGTCCTG	1038
CACTCAACCC	CGCCTGGAGC	TCCTTCCGCG	GCCACCGTGC	TCCGGGCACC	CCGGGAGCTC	1098
CTGCAAGAGG	CCTGAGGAGG	GAGGCTCCCG	GGACCGTCCA	CGCACGACCC	AGCCAGACCC	1158
TCGCGGAGAT	GGTGCAGAAG	GCGGAGCGGG	TGAGCGGCCG	TGCGTCCAGC	CCGGGCCTCT	1218
CCAAGGCTGC	CCGTGCGTCC	TGGGACCCTG	GAGAAGGGTA	AACCCCCGCC	TGGCTGCGTC	1278
TTCCTCTGCT	ATACCCTATG	CATGCGGTTA	ACTACACACG	TTTGGAAGAT	CCTTAGAGTC	1338
TATTGAAACT	GCAAAGATCC	CGG/XGCTGGT	CTCCGATGAA	AATGCCATTT	CTTCGTTGCC	1398
AACGATTTTC	TTTACTACCA	TGCTCCTTCC	TTCATCCCGA	GAGGCTGCGG	AACGGGTGTG	1458
gatttgaatg	TGGACTTCGG	AATCCCAGGA	GGCAGGGGCC	GGGCTCTCCT	CCACCGCTCC	1518
CCCGGAGCCT	CCCAGGCAGC	AATAAGGAAA	TAGTTCTCTG	GCTGAGGCTG	AGGACGTGAA	1578
CCGCGGGCTT	TGGAAAGGGA	CXJGGAGGGAG	ACCCGAACCT	CCCACGTTGG	GACTCCCACG	1638
TTCCGGGGAC	CTGAATGAGG	ACCGACTTTA	TAACTTTTCC	AGTGTTTGAT	TCCCAAATTG	1698
GGTCTGGTTT	TGTTTTGGAT	TGGTATTTTT	TTTTTTTTTT	TTTTTTGCTG	TGTTACAGGA	17S8
TTCAGACGCA	AAAGACTTGC	ATAAGAGACG	GACGCGTGGT	TGCAAGGTGT	CATACTGATA	1818
TGCAGCATTA	ACTTTACTGA	CATGGAGTGA	AGTGCAATAT	ΤΑΤΆΑΑΤΆΤΤ	ATAGATTAAA	1878
AAAAAAATAG	CA					1890

-37CZ 297640 B6 (2) Informace o sekvenci SEQ ID NO: 11:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 292 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 11:

Met Glu 1

Glu Leu Thr Ala 5

Phe val

Ser Lys 10

Ser

Phe Asp Gin Lys 15

Ser

Lys Asp

Gly Asn

Gly

Lys

Lvs

Asp

Ser

20

25

30

Ile Thr

Tyr Arg

Glu

Val

Leu

Glu

Ser

Gly

Leu

Ala

Arg

Ser

Arg

Glu

35

40

45

Leu Gly

Thr Ser

Asp

Ser

Leu

Gin

Asp

Ile

Thr

Glu

Gly

90

55

60

His Cys

Pro Val

His

Leu

Phe

Lys

Asp

His

Val

Asp

Asn

Asp

Lys

Glu

65

70

75

80

Lys Leu

Lys Glu

Phe

Gly

Thr

Ala

Arg

Val

Ala

Glu

Gly

Ile

Tyr

Glu

85

90

95

Cys Lys

Glu Lys

Arg

Glu

Asp

Val

Lys

Ser

Glu

Asp

Glu

Asp

Gly

Gin

100

105

I 10

Thr Lys

Leu Lys

Gin

Arg

Ser

Arg

Thr

Asn

Phe

Thr

Leu

Glu

Gin

115

120

125

Leu Asn

Glu Leu

Glu

Arq

Leu

Phe

Asp

Glu

Thr

His

Tyr

Pro

Asp

Ala

110

135

140

Phe Me t

Arg Glu

G1 u

Leu

Ser

Gin

Arg

Leu

Gly

Leu

Ser

Glu

Al a

Arg

145

150

155

160

Val Gin

val Trp

Phe

Gin

Asn

Arg

Al a

Lys

Cys

Arg

Lys

Gin

Glu

165

170

175

Asn Gin

Met His

Ly3

cly

Val

Ile

Leu

Gly

Thr

Ala

Asn

His

Leu

Asp

180

185

190

Ala Cys

Arg Val

Al a

Pro

Tyr

val

Asii

Met

Gly

Al a

Leu

Arg

Met

Pro

195

200

205

Phe Gin

Gin Val

Gin

Ala

Gin

Leu

Gin

Leu

Glu

Gly

Val

Ala

His

Ala

210

215

220

His Pro

His Leu

His

Pro

His

Leu

Ala

His

Ala

Pro

Tyr

Leu

Met

225

2 30

235

240

Phe Pro

Pro Pro

Pro

Phe

G1 y

Leu

Pro

Ile

Ala

Ser

Leu

Ala

Glu

Ser

245

250

255

Ala Ser

Ala Ala

Ala

Val

Ala

Al a

Ala

Lys

Ser

Asn

Ser

Lys

2 60

265

270

Asn Ser

Ser Ile

Al a

Asp

Leu

Arg

Leu

Lys

Ala

Arg

Lys

His

Ala

Glu

275

280

285

Ala Leu Gly Leu

290

-38CL 297640 B6 (2) Informace o sekvenci SEQ ID NO: 12:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 1354 párů bází s (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina io (A) POPIS:/popis = „SHOXb“ (ix) RYSY:

(A) NÁZEV/KLÍČ: cds (B) POZICE: 91..768 (xi) POPIS SEKVENCE: SEQ ID NO: 12:

GTGATCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC60

CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA114

Met Glu Glu Leu Thr Ala Phe Val

295300

TCC Ser

AAG TCT TTT GAC

CAG AAA

AGC Ser

AAG Lys

GAC Asp 310

GGT AAC GGC

GGA GGC

GGA Gly

162

Lys

Ser

Phe Asp .305

Gin

Lys

Gly

Asn

Gly

Gly 315

GGC

GGA

GGT

AAG

GAT

TCC

ATT

ACG

TAC

CGG

GAA

GTT

TTG

GAG

210

Gly

Lys

Asp

Ser

Ile

Thr

Tyr

Arg

Glu

Val

Leu

Glu

320

325

330

AGC

GGA

CTG

<;cg

CGC

TCC

CGG

GAG

CTG

W.G

ACG

TCG

GAT

TCC

AGC

CTC

258

Ser

Gly

Leu

Ala

Arg

Ser

Arg

Glu

Leu

Gly

Thr

Ser

Asp

Ser

Leu

335

340

345

CAG

GAC

ATC

ACG

GAG

GGC

CAC

TGC

CCG

GTG

CAT

TTG

TTC

AAG

306

Gin

Asp

Ile

Thr

Glu

Gly

G1 y

Gly

His

Cys

Pro

Val

His

Leu

Phe

Lys

350

355

360

GAC

CAC

GTA

GAC

AAT

GAC

AAG

GAG

AAA

CTG

AAA

GAA

TTC

GGC

ACC

GCG

354

Asp

H1 3

Val

Asp

Asn

Asp

Lys

G1 u

Lys

Leu

Lys

G1 u

Phe

Gly

Thr

Al a

365

370

375

380

AGA

GTG

GCA

GAA

GGG

ATT

TAT

GAA

TGC

AAA

GAG

AAG

CGC

GAG

GAC

GTG

402

Arg

Val

Ala

Glu

Gly

Ile

Tyr

Glu

Cys

Lys

Glu

Lys

Arq

Glu

Asp

Val

385

390

395

AAG

TCG

GAG

GAC

GAG

GAC

GGG

CAG

ACC

AAG

CTG

AAA

CAG

AGG

CGC

AGC

450

Lys

Ser

Glu

Asp

Glu

Asp

G1 y

Gin

Thr

Lys

Leu

Lys

Gin

Arg

Ser

400

405

4 10

CGC

ACC

AAC

TTC

ACG

CTG

GAG

CTG

AAC

GAG

CTC

GAG

CG7\

CTC

TTC

498

Arg

Thr

Asn

Phe

Thr

Leu

Glu

Gin

Leu

Asn

Glu

Leu

Glu

Arg

Leu

Phe

415

420

425

GAC

GAG

ACC

CAT

TAC

CCC

GAC

GCC

TTC

ATG

CGC

GAG

CTC

AGC

CAG

S46

ASp

Glu

Thr

His

Tyr

Pro

Asp

Ala

Phe

Met

Arg

Glu

Leu

Ser

Gin

430

435

440

CGC

CTG

GGG

CTC

TCC

GAG

GCG

CGC

GTG

CAG

GTT

TGG

TTC

CAG

AAC

CGG

594

Arg

Leu

Gly

Leu

Ser

Glu

Al a

Arg

Val

Gin

Val

Trp

Phe

G’s n

Asn

Arg

14 5

4 50

455

4 60

-39CZ 297640 B6

AGA GCC AAG TGC CGC AAA CAA GAG AAT CAG ATG CAT AAA GGC GTC ATC642

Arg Ala Lys Cys Arg Lys Gin Glu Asn Gin Met His Lys Gly Val Ile

465 470475

TTG GGC ACA GCC AAC CAC CTA GAC GCC TGC CGA GTG GCA CCC TAC GTC690

Leu Gly Thr Ala Asn His Leu Asp Ala Cys Arg Val Ala Pro TyrVal

480 485490

AAC ATG GGA GCC TTA CGG ATG CCT TTC CAA CAG ATG GAG TTT TGC TCT738

Asn Met Gly Ala Leu Arg Met Pro Phe Gin Gin Met Glu Phe CysSer

495 500505

TGT CGC CCA GGC TGG AGT ATA ATG GCA TGA TCTCGACTCA CTGCAACCTC788

Cys Arg Pro Gly Trp Ser Ile Met Ala ·

S10515

CGCCTCCCGA GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC GAGTAGCTGG GATTACAGGT848

GCCCACCACC ATGTCAAGAT AATGTTTGTA TTTTCAGTAG AGATGGGGTT TGACCATGTT908

GGCCAGGCTG GTCTCGAACT CCTGACCTCA GGTGATCCAC CCGCCTTAGC CTCCCAAAGT968

GCTGGGATGA CAGGCGTGAG CCCCTGCGCC CGGCCTTTGT AACTTTATTT ΤΤΛΆΤΤΤΤΤΤ1028

ΤΤΤΤΤΤΤΤΤΛ AGAAAGACAG AGTCTTGCTC TGTCACCCAG GCTGGAGCAC ACTGGTGCGA1088

TCATAGCTCA CTGCAGCCTC AAACTCCTGG GCTCAAGCAA TCCTCCCACC TCAGCCTCCT1148

GAGTAGCTGG GACTACAGGC ACCCACCACC ACACCCAGCT AATTTTTTTG ATTTTTACTA1208

GAGACGGGAT CTTGCTTTGC TGCTGAGGCT GGTCTTGAGC TCCTGAGCTC CAAAGATCCT1268

CTCACCTCCA CCTCCCAAAG TGTTAGAATT ACAAGCATGA ACCACTGCCC GTGGTCTCCA1328

AAAAAAGGAC TGTTACGTGG AAAAAA1354 (2) Informace o sekvenci SEQ ID NO: 13:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 226 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární io (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 13:

-40CZ 297640 B6

Met 1

Glu

Leu Thr Ala S

Phe

Val

Ser

Lys 10

Ser

Phe

Asp

Gin

Lys 15

Ser

Lys

Asp

Gly

Asn 20

Gly

G1 y

Gly

Gly 25

Gly

G1 y

Gly

Lys

Lys 30

Asp

Ser

Ile

Thr

Tyr 35

Arq

Glu

Val

Leu

Glu 40

Ser

Gly

Leu

Ala

Arg 45

Ser

Arg

Glu

Leu

G1 y 50

Thr

Ser

Asp

Ser

Ser 55

Leu

Gin

Asp

Ile

Thr 60

Glu

Gly

His 65

Cys

Pro

Val

His

Leu 70

Phe

Lys

Asp

Hi3

val 75

Asp

Asn

Asp

Lys

Glu 80

Lys

Leu

Lys

Glu

Phe 85

GLy

Thr

A] a

Arg

Val 90

Ala

Glu

Gly

Ile

Tyr 95

Glu

Cys

Lys

Glu

Lys 100

Arq

Glu

Asp

Val

Lys 105

Ser

Glu

Asp

Glu

Asp 110

Gly

Gin. r

Thr

Lys

Leu 115

Lys

Gin

Arg

Arq

Ser 120

Arg

Thr

Asn

Phe

Thr 125

Leu

Glu

Gin

Leu

Asn 130

Glu

Leu

Glu

Arg

Leu 135

Phe

Asp

Glu

Thr

His 140

Tyr

Pro

Asp

Ala

Phe 145

Met

Arg

Glu

Leu 150

Ser

Gin

Arq

Leu

Gly 155

Leu

ser

Glu

Ala

Arg 160

Val

Gin

Val

Trp

Phe 165

Gin

Asn

Arg

Al a 170

Lys

Cys

Arg

Lys

Gin 175

Glu

Asn

Gin

Met

His

Lys

G1 y

Val

Ile

Leu

G1 y

Thr

Ala

Asn

His

Leu

Asp

180 185 ¹⁹⁰

Ala

Cys

Arg

Val

Ala

Pro

Tyr

Val

Asn

Met

Gly

Ala

Leu

Arg

Met

Pro

195

200

205

Phe

Gin

Met

Glu

Phe

cys

Ser

Cys

Arg

Pro

Gly

Trp

Ser

Ile

Met

210

215

220

Ala

225 (2) Informace o sekvenci SEQ ID NO: 14:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 32367 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „kosmid: LLNOYCO3'34F5“

-41 CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 14:

TTTCTCTGTC	TCCATCCCTC	TGTCTCTCCC	TTTCTCTCTG	TCTTTCCTTG	TCTCTCTCTT	60
TCTCTCTCTC	TCTCCATCTC	TCTCTCTCCC	TGTCTCTCTC	TCTCCATCTC	CCCGTCTCTC	120
CGTTTCTCTC	TCTGCCTCTC	CCTGTCTGTC	TCTCTCTTTC	TGTGTCTTAC	ACACACCCCA	180
ACCCACCGTC	ACTCATGTCC	CCCCACTGCT	GTGCCATCTC	ACACAAGTTC	ACAGCTCAGC	240
TGTCATCCTG	GGTCCCCAGG	CCCCGCCGGG	GAGGAAGATG	CGCCGTGGGG	TTACGGGAGG	300
AAGGGGACTC	CGGGCCTCCT	GGTGCCCCAC	TTTATTTGCA	GAAGGTCCTT	GGCAGGAACC	360
GTGACGCGTT	TGGTTTCCAG	GACTTGGAAA	ACGAATTTCA	GGTCGCGATG	GCGAGCACCG	420
(XTTCCCCTG	AAGCACATTC	AATAGCGAGA	GGCGGGAGGG	AGCGAGCAGG	AGCATCCCAC	480
CATGAAAACC	AAAAACACAA	GTATTTTTTT	CACCCGGTAA	ATACCCCAGA	CGCCAGGGTG	540
ACAGCGCGGC	GCTAAGGGAG	GAGGCCTCGC	gccggggtcc	GCCGGGATCT	GGCGCGGGCG	600
GAAAGAATAT	AGATCTTTAC	GAACCGGATC	TCCCGGGGAC	C7GGGCTTCT	TTCTGCGGGC	660
GCTGGAGACC	CGGGAGGCGG	CCCCGCGGAT	CCTCGGCCTC	CGCCGCCGCC	GCCTCCCAAG	720
CGCCCGCGTC	CCGGTTTGGG	GACACCCGGC	CCCTTCTTCT	CACTTTCGGG	GATTCTCGAG	780
CCGCGTTCCA	TCTCACCAAC	TCTCCATCCA	AGGGCGCGCC	GCCACCAACT	TGGAGCTCAT	840
CTTCTCCCAA	GATCGTGCGT	CCCCGGGGCG	CCCGGGTCCC	CCCCCTCGCC	ATCTCAACCC	900
CGGCGCGACC	cgggcgcttc	CTGGAAAGAT	CCAGGCGCCG	GGCTCTGCGC	TCCTCCCGGG	960
AGCGAGGGCG	GCCGGACGAC	TGGGACCCTC	CTCTCTCCAG	CCGTGAACTC	CTTGTCTCTC	1020
TGTCTCTCTC	TGCAGGAAAA	CTGGAGTTTG	CTTTTCCTCC	GGCCACGGAG	AGAACGCGGG	1080
TAACCTGTGT	GGGGGGCTCG	GGCGCCTGCG	CCCCCCTCCT	GCGCGCGCGC	TCTCCCTTCC	1140
AAAAATGGGA	TCTTTCCCCC	TTCGCACCAA	GGTGTACGGA	CGCCAAACAG	TGATGAAATG	1200

-42CZ 297640 B6

AGAAGAAAGC	CAATTGCCGG	CCTGGGGGGT	GGGGGAGACA	CAGCGTCTCT	GCGTGCGTCC	1260
GCCGCGGAGC	CCGGAGACCA	GTAATTGCAC	CAGACAGGCA	GCGCATGGGG	GGCTGGGCGA	1320
GGTCGCCGCG	TATAAATAGT	GAGATTTCCA	ATGGAAAGGC	GTAAATAACA	GCGCTGGTGA	1380
TCCACCCGCG	CGCACGGGCC	GTCCTCTCCG	CGCGGGGAGA	CGGGCGCATC	CACCAGCCCC	1440
GGCTGCTCGC	CAGCCCCGGC	CCCAGCCATG	GAAGAGCTCA	CGGCTTTTGT	ATCCAAGTCT	1500
TTTGACCAGA	AAAGCAAGGA	CGGTAACGGC	GGAGGCGGAG	GCGGCGGAGG	TAAGAAGGAT	1560
TCCATTACGT	ACCGGGAAGT	TTTGGAGAGC	GGACTGGCGC	GCTCCCGGGA	GCTGGGGACG	1620
TCGGATTCCA	GCCTCCAGGA	CATCACGGAG	GGCGGCGGCC	ACTGCCCGGT	gcatttgttc	1680
AAGGACCACG	TAGACAATGA	CAAGGAGAAA	CTGAAAGAAT	TCGGCACCGC	GAGAGTGGCA	1740
GAAGGTAAGT	TCCTTTGCGC	GCCGGCTCCA	GGGGGGCCCT	CCTGGGGTTC	GGCGCCTCCT	1800
CGCCACGGAG	TCGGCCCCGC	GCGCCCCTCG	CTGTGCACAT	TTGCAGCTCC	CGTCTCGCCA	1860
GGGTAAGGCC	CGGGCCGTCA	GGCTTTGCCT	AAGAAAGGAA	GGAAGGCAGG	AGTGGACCCG	1920
ACCGGAGACG	CGGGTGGTGG	GTAGCGGGGT	GCGGGGGGAC	CCAGGGAGGG	TCGCAGCGGG	1960
GGCCGCGCGC	GTGGGCACCG	ACACGGGAAG	GTCCCGGGCT	GGGGTGGATC	CGGGTGGCTG	2040
TGCCTGAAGC	CGTAGGGCCT	GAGATGTCTT	TTTCATTTTC	TTTTTCTTTC	CTTTCCTTTT	2100
TTTGTTTGTT	TGTTTGTTTG	TTTGAGACAG	AGTCTCGCTC	TGTCCCCCAG	GCTGGAGTGC	2160
AGTGGTGCGA	TCTCGGCTCA	CTGCAACCTC	CGCCTCCTGG	GTTCAAGCGA	TTCTCCTGCC	2220
TCAGCCTCCC	CAGTAGCTGG	GATTACAGGC	ATGCACCACC	ACGCCTGGCT	AATTTTTGTG	2280
CTTTTAGTAA	AGACGGGGAT	tcaccatgtt	GGCCAGGCTG	GTCTCGAACT	CCTGACCTCA	2340
GGTGATCC/3C	CCGCCTCGGC	CTCCCAAAGT	GCTGGGATGA	CAGGCGTGAG	GCACCGCGCC	2400
CGGCCTGGGT	CCTGACGGCT	TAGGATGTGT	GTTTCTGTCT	CTGCCTGTCT	GCCTTGTATT	2460
TACGGTCACC	CAGACGCACA	GAGGAGCCGT	CTCCACGCGC	CTTCCGAGCG	CTCAGCGCCT	2520
GCCGGGCCCC	CGGAGATCAC	GGGAAGACTC	GAGGCTGCGT	GGTAGGAGAC	GGGAAGGCCC	2580
CCXjGTGAGCT	CGGTTCTGTT	TCCTTTAAGG	AACCCTTCAT	TATTATTTCA	TTGTTTTCCT	2640
TTGAAGGTCG	AGG-CTTGATC	TTGGCGAAAG	{.TGTTGGGTC	CATAAAAACC	ACTCCCGTGA	2700
‘ . 1 »4_rZ\( r Ϊ ' Áf	CCGÍiGATCTG	( íM 1^7* A.7* X.	gzVx;g<x.(.;:c	(zxj^./AAíjv, I Cj	GCGGCTTCGC	2760
GÍXCGCGTCC	TAAGTCAAGG	TTGTCAGAGC	GCAGCCGGTT	GTGGGCGGCC	CGGGGGAGCT	2820
CCÍXTCTGGC	CCTTCCTCCT	GAGACCTCAG	TGGTGGGTCG	TCCCGTGGTC	GAAATCGGGG	2880
AGTAAGAGGC	TCAGAGAGAG	GGGCTGGCCC	CGGGGATCTC	TGTGCACACA	CGACAACTGG	2940
gcggcataca	TCTTAAGAAT	AAAATGGGCT	GGCTGTGTCG	GGGGACAGCT	GGAGACGGCT	3000
ATGGACGCCT	GTTATGTTTT	CATTACAAAG	ACGCAGAGAA	TCTAGCCTCG	GCTTTTGCTG	3060
ATTCGCAGAG	TTGAGGTGCG	AGGGTGAATG	CCCCAAAGGT	AATTCTTCCT	AAGACTCTGG	3120
GGCTACCTGC	TCTCCGGGGC	CCTGCATTTG	GGGTGTGGAG	TGGCCCCGGG	AAATAGCCCT	3180
TGTATTCGTA	GGAGGCACCA	GGCAGCTTCC	CAAGGCCCTG	ACTTTGTCGA	AGCAGAAAGC	3240

-43CZ 297640 B6

TGTGGCTACG	GTTTACAAAG	CAGTCCCCGG	TTTCTGACCG	TCTAAGAGGC	AGGAGCCCAG	3300
CCTGCCTTTG	ACAGTGAGAG	GAGTTCCTCC	CTACACACTG	CTGCGGGCAC	CCGGCACTGT	3360
AATTCATACA	CAGAGAGTTG	GCCTTCCTGG	ACGCAAGGCT	GGGAGCCGCT	TGAGGGCCTG	3420
CGTGTAATTT	AAGAGGGTTC	GCAGCGCCCG	GCGGCCGCTT	CTGTGGGGTT	GCTTTTTGGT	3460
TGTCCTTCGC	AGACACCGTT	TTGCTCCTCT	GAACTCTCTC	TTCTCCCCCT	GGCCGTGGAC	3540
CCGGGAGAGC	AAAGTGTCCT	CCAGACCTTT	TGAAAGTGAG	AGGAAAATAA	AGACCAGGCC	3600
AAAGACCCAG	GGCCACAGGA	GAGGAGACAG	AGAGTCCCCG	TTACATTTTC	CCCTTGGCTG	3660
GGTGCAGAAA	GACCCCCGGG	CCAGGACTGC	CACCCAGGCT	ACTATTTATT	CATCAGATCC	3720
AAGTTAAATC	GAGGTTGGAG	GGCAGGGGAG	AGTCTGAGGT	TACCGTGGAA	GCCTGGAGTT	3780
TTTGGGAACA	GCGTGTCCCC	GCCGAGCCTG	GGAGCCCGTG	GGTTCTGCAA	AGCCTGCGGG	3840
TGTTTGAGGA	CTTTGAAGAC	CAGTTTGTCA	GTTGGGCTCA	ATTCCTGGGG	TTCAGACTTA	3900
GAGAAATGAA	GGAGGGAGAG	CTGGGGTCGT	CTCCAGGAAA	CGATTCACTT	GGGGGGAAGG	3960
AATGGAGTGT	TCTTGCAGGC	ACATGTCTGT	TAGGAGGTGA	AACAGAATGT	GAAATCCACG	4020
TTGGAGTAAG	CGTCCAGCGC	TGAATGTAGC	TCGGGGTGGG	GTGGGAGGGC	CCTGGTGTGG	4080
ATCGTGGAAG	GAAGAAAGAC	AGAACAGGGT	GCTAGTATTT	ACCCCGTTCC	CTGTAGACAC	4140
CCTGGATTTG	TCAGCTTTGC	AAGCTTCTTG	GTTGGAGCGG	CCTTGCCTGT	GCCCCTTTGA	4200
GACTGTTTCC	AGACTAAACT	TCCAAATGTC	AGCCCCTTAC	CCTTGACAGC	AAGGGACATC	4260
TCATTAGGGC	ATCGCGTGCT	TCTCATCTGT	GCTCAGCAGG	CCCGAGATAG	GAACAGAGGG	4320
GCGTTGGAGA	TGCCACTTCC	ACCAGCCCTG	GGTTGAAGGG	GAGCGAGGGA	GACACCTTTT	4380
ACTTAAACCC	CTGAGCTTC/.	TGAGAGAGGC	TGAATGTCTA	AAATGAGGAA	GAAAAGGTTT	4 4 40
TTCACCTGGA	aacgcttgag	GGCTGAGTCT	TCTGCCCTTC	TGAC7CCCCC	AGCAAATACA	4500
GACAGGTCAC	CAACTACTGG	AGATGAGAAA	ÚTGCCATTTT	TGGCACACTC	TGGTGGGGTA	4 560
GGTGCCCGAC	CGCGTGTGAA	AAAGTGGGAA	GGAGAGATTT	CTGCGCACGG	GGTTCAGCCC	4620
CCAGGCGCGG	TGGCGCATTC	AGGTACTCAG	ACGCGGTTCT	GCTGTTCTGC	TGAGAAACAG	4680
GCTTCGGGTA	GGGGCTCCTA	ΤΓ··<χ : A(,	r~(GCGGAGG	GACCCCCAGC	CCTCCTGCGC	4740
TGCAGCGGTG	GGGATAGCGT	CTCTCCGTAG	(VCTAGAATC	TGCAACCCGC	CCCGGGTCCT	4800
CCCCGTGTCC	TTCCCGGGCG	TCCCGCCGGG	GAT C CCA CAG	TTGGCAGCTC	TTCCTCAAAT	4860
TCTTTCCCTT	AAAAATAGGA	TTTGACACCC	CACTCTCCTT	AAAAAAAAAA	AATAAGAAAA	4920
AAAGGTTAGG	TTATGTCAAC	AGAGGTGAAG	TGGATAATTG	AGGAAACGAT	TCTGAGATGA	4 980
GGCCAAGAAA	ACAACGCTCG	TGCAAAGCCC	AGGTTTTTGG	GAAAGCAGCG	AGTATCCTCC	5040
TCGGCTTTTG	CGTTATGGAC	CCCACGCAGT	TTTTGCGTCA	AAGCGCATTG	GTTTTCGAGG	5100
GCCCCCTTTC	CACCGCGGGA	TGCACGAAGG	GGTTCGCCAC	GTTGCGCAAA	ACCTCCCCGG	5160
CCTCAGCCCT	GTGCCCTCCG	CTCCCCACGC	AGGGATTTAT	GAATGCAAAG	AGAAGCGCGA	5220

-44CZ 297640 B6

GGACGTGAAG	TCGGAGGACG	AGGACGGGCA	GACCAAGCTG	AAACAGAGGC	GCAGCCGCAC	5280
CAACTTCACG	CTGGAGCAGC	TGAACGAGCT	CGAGCGACTC	TTCGACGAGA	CCCATTACCC	5340
CGACGCCTTC	ATGCGCGAGG	AGCTCAGCCA	GCGCCTGGGG	CTCTCCGAGG	CGCGCGTGCA	5400
GGTAGGAACC	CGGGGGCGGG	GGCGGGGGGC	CCGGAGCCAT	CGCCTGGTCC	TCGGGAGCGC	5460
ACAGCACGCG	TACAGCCACC	TGCGCCCGGG	CCGCCGCCGT	CCCCTTCCCG	GAGCGCGGGG	S520
AGGTTGGGTG	AGGGACGGGC	TGGGGTTCCT	GGACTTTTGG	AGACGCCTGA	GGCCTGTAGG	SS80
ATGGGTTCAT	TGCGTTTGTT	TTTCACCAAC	AGCAAACAAA	TATATATACA	TATATATTAT	5640
ACAAATAACA	AATAAATATA	TATGTTATAC	AGATGGGTAT	ATTGTATATA	TTATAGATAT	5700
TTGTTCGTCC	TTGGTGCAAA	GACACCCGGT	GAACCCATAT	ATTGGCTCCT	GACTGCCTTC	5760
GGTTCCCCTG	GGATTGGTTA	TAGGGGCAAC	ACATGCAAAC	AAAACTTTCC	CTGGATTATA	5820
CTTAGGAGAC	GAAGCTACAG	ATGCGTTTGA	TCCAGAGTGT	TTTACAAGAT	TTTTCATTTA	5880
AAAAAAAATG	TGTCTTTTGG	CCCCTGATTC	CCCTCCGTCT	TCCCGTGTGG	CTGCATTGAA	$940
AAGGTTTCCT	TAGGATGAAA	GGAGAGGGGT	GTCCTCTGTC	CCTAGGTGGA	GAGAAACAGG	6000
GTCTTCTCTT	TCCTCCGTTT	TTTCACCTAC	CGTTTCTATC	TCCCTCCTCC	CCTCTCCAGC	6060
CCTGTCCTCT	GCTACAAACC	ACCCCCTCCT	CCCTCCGGCT	GTGGGGAGCG	CAGGAGCACG	6120
TTGGGCATCT	GGATGAGCGG	AGACTATTAG	CGGGGCACGG	GGGCTCCCCG	AGGAGCGCGC	6180
GAATTCACGC	TGCCCCATGA	GACCAGGCAC	CGGGGGGCGG	AGGGGCCTTG	GGTGTCCGCA	6240
GAGGGACGGG	CGGGCAGAGC	CTTCCTCCGC	ATTCTAAACA	TTCACTTAAA	GGTATGAGTT	6300
TATTCAGGG	GTGCTGCTGG	GAGACCCTCC	.ΑΛ.ΛΤGGv.. TC.	TTCCAGCCCC	TGCCTGACAG	6360
TTCAGCTCCC	CTGGAAGGTC	AACTCCTCTA	GTCCTTTCTC	CTGGTTCTGG	GCAGGACAGA	6420
AGTG'X^Z,G;\	GGGAGAGAGA	GAGAGAGAGA	GAGAGAGACG	GTCAGGATCC	CCGGACCCTG	6480
GGGAACCCGT	CAAAAATAAA	TGAAATTAAG	ATTGCCGACC	AGAGAGAGAA	CCGTGACAAA	6540
GCAAACGGCG	TTCAAAGCAA	AGAGACGAAC	TGAAAGCCCG	TTCCCGTAGG	ACTGGTTATG	6600
AGGTCAACAC	ATTCAAACAC	AGCTTGCTCT	GGATTTTGCT	GAGCAGAGGA	AGATACAGAT	6660
GCATTTGATC	CAAAGTGTGT	TACATCTTTC	ATTATATGTG	TGTCTATATA	TATAAACATA	6720
ΤΑΤΑΑΑΓΛΤΑ	TAAACATACA	TAAATGTATG	TAAATATATA	T/iATCTATAT	ACATATATAA	6780
ATATATAAAC	ACATATATAA	TATATAAATC	TATAAACATA	TATAATATAT	AAACATAAAT	6840
ATATAAACAT	ΛΤΛΤΆΑΤΑΤΑ	ΤΛΛΑΤΑΤΑΤΤ	AACATATATA	AAATATGTAT	AAATATATAT	6900
AAACATATAA	ACATATATAA	ATATATAAAC	ΑΤΛΤΑΑΑΤΑΤ	ATAAACATAT	ATAAATATAT	6960
ACAAACATAT	TGTATATATA	ΤΑΑΑΤΑΤΑΤΛ	TAAAAACATA	TATATACATA	ΤΑΑΑΑΑΤΑΤΛ	7020
TATAAACATA	TATACATATA	AAGAAATATA	TATAAACATA	TATACATATA	AATATACATA	7080
TATAAACATA	TATATACATA	AAATATATAT	AAACATATAT	ACATATAAAA	ATATATATAT	7140
ATTAACATAT	ATATACATAT	AAAAATATAT	ATATTAACAT	ATATATACAT	ATAAAAATAT	7200
ATATATATTT	TTGGCCCCTG	ATTCCCTTCG	GTTCCTGTGG	GATGGGTGAT	TGAGTCAACA	7260

-45 CZ 297640 B6

CATTCAAACA	CAACTTTTCC	ATCGATGTTG	CTTAGGAGAT	GAGGATACAG	ATGCGTTTGA	7320
TGGAGAGGGT	TTTACAAGCT	CTTTCATTTA	AATATATATA	TATATATATA	TATATTTTTT	7380
GGCTCCTGAT	TCTCTTCCGT	CTTCCCATGT	GGCTGCATTT	TAAAAGGCTT	CCCTAAGATC	7440
GTTACGATTA	AATCAACCCT	CCCCAGGCAT	CTTTACCGAG	GGCTGTGGTC	CCCAAAGCGA	7500
TACAGCCCAG	GAGGGAGAGA	GGCTTTGGTG	ACTTGGAGGA	AGGACTGTGT	CCCTCCTTAG	7560
GGCGTCTGTG	GCCTCAGTGA	GGGAAGGAAG	CTGCATCAGA	CAGGGGTTTC	CTCGCTGTCC	7620
ACC.CCTCTGG	CAGAAGATGG	ATTGGGCTGC	CCCGTATAAA	TTAATGAAAA	GATTAAAGTT	7680
TCGCTAAAGG	GGACATCGAG	TTTATGTGTC	ATCTCCTGGT	GTCTGTGTGC	CTGGGATCTG	7740
CAATATATCC	CAGCCCTTGA	TGTACTGTTT	CTATAAAAAT	AAATTACTTG	ΤΆΆΤΤΤΛΑΤΤ	7800
CCACACTATT	TCTTTCCGTA	GTCTATTACC	GACGAGAGCA	CGTTAGTTCA	GCTGCGGAAA	7860
ATTGGTTGTG	GGGTGTGTGC	GGACCCCGAG	AACGCCCTAA	AATAAAGACA	AATCGGGGAC	7920
AAGCTGGGGG	TTATCGATTG	CAGGGGTCGC	ATGAAAATTT	AACGACGGTA	AATAATAATA	7980
AAAACAAACA	TGGGAATGCA	ATAAAAGACA	TAATTCTCGA	TCGCCGCGGG	GGGAAAGGAT	8040
CCTATAGTAA	AGGCGAGTGC	GCTTTGAGGG	GTCATAAAAA	TCAATTAGTT	CCAACACCCA	8100
CGTCCCGCGT	TGAGGGGACG	GGGACGAGCA	GGGACAGAAA	AAGAAACCAT	ATTTGAATCC	8160
CATCTCTCTG	TGAATTCTTG	GGTCACATGG	GTCTCAGTAC	AGCCCGTCCC	GTGCTGTGAC	8220
CGGATAGAGT	TTCAATTTAC	TGTGGAAATT	TGCTGTAAAT	AAATTGAGCA	TCCGATAGAA	8280
GCTGTTGCTG	ATTAACCTTT	TATTTTTAGC	GTGGCCCTGC	AAAGTCGTAT	GACCCAGCTG	8340
TCAGGCTTCT	AATCGAAAGT	TATGAGACCA	CGGTGAGGGG	CAGGCGGTAA	TTTAATTACA	8 4 00
ACAAATATCT	TTGGGTTTAT	GGCGCAGAGC	ΤΑΛΑΤΤΆΑΑΤ	GTCATTATTC	ACTGTCTGTA	8460
A7GGAAATCA	AAAGGAAATC	GGATTACGGC	ATTTGGGAAA	GAAAGCGGGG	AGTGCTCTTT	8520
AATGAAGAAA	TAACTGTGTT	AAGCAGTGTC	ACACACTTCA	CTTACCATAT	TCGGGCCTAA	8580
TTGGAATGGA	TCGTGAATCA	CTCCAAGACT	GATTTATTAG	CGCTTCACGC	AGCGGCTAAT	8640
TCATCACTTG	TATTCTTCAT	CATTTTTTTT	TTTCCTCTCG	CCGTGTTGAA	GGGAGAGTGA	8700
ATGAGGCTTT	CCACGTTTCA	GGAGGATTTT	CTTTTTTGAA	AAATGCCCTT	CCAGAGGCTT	8 760
TTGGGTGGCT	GGCTTGCTTT	CTGGGCCCTG	GAGGAGACAG	GCGGAGAGTC	CAGGTGGGCA	8820
TGGAGAGGCA	CAGTGGCAGG	TCACCTGGAT	GGTCAGTGGA	GGTGGAGGTC	TGAAGGCGCC	8880
agctttggaa	ATTATTGGTG	AATTTCGATG	TCAGGACCAG	GCAGGGGCCT	TTTTGGCGGG	8940
GGTGTGAGGG	AGGATGACTT	TGCTGGGAAA	CAGGATCAGG	TTCTCCAGGC	GCACTGCAGC	9000
CCGGTAGGAC	CCACTTTGGA	AATGAAAAGC	CAGTTCCGAA	AGCTGGGCTG	GAAGCTTCCG	9060
TGTTGGGTTC	AAGAGCAAGT	TCACGTTGCG	CTGTGTAGAC	TCCTGGCTGC	TCCCAAACTC	9120
TGAGGGTTTT	CTGAGGTTCC	CTTCATAGGG	GCACCGGCCC	TGGGCCATGC	ACAGTGCGTA	9180
AGGGTGGCTG	TGGGCCGAGG	GACCCAGCAC	GTGTTTTGCC	CACAACAGCC	GGAGTGACTG	9240

-46CZ 297640 B6

GTTCACTCAC	CGCCTTGGCG	GAGGACGCCT	GTTCTCTGGA	CGAATCATTT	CTCTTGGGTG	9300
GTGACTGCCT	TGTGGGTGAA	GGTGCAGGTT	TTCTGCCACA	GAAAACCTGT	TAGGAGGAAT	9360
TAAGCGACTA	AGACTGTCAG	GGAGGTGGTG	GTGGGGGAGA	GGAGGGGGTG	GTGTCCAGAT	9420
TACCAGGCAT	AGGCTAAACT	GCCTGCACTC	TCCAGCTGGT	CTGTCTGTGG	AGGAGGGGAT	9480
TGTCAATACT	GGGAGAGCAG	AGGAGGCTCG	TAGGAGGTGA	GAGGGGGTGG	AATTTGCATG	9540
CAAATCTTCA	CATGAGGGCT	GTGTGAATTT	CTCCAGCCTC	CTGAGGGTCC	CCTGCGCTAT	9600
TGCACTCAAC	TTCTTGATAG	TTTACCCCAA	GACTCAGAAG	TCCTTAGAGG	GGCAGAATGC	9660
CCCCACCACA	AAGCCTGCTA	TCCTTGGGCG	TCCTCAGGAC	CCTTGGTCAT	GAATGGGACC	9720
CTTTCATGTA	TGGGGACCCT	TGGTAATATG	AATGGGACGC	CTTCAGCTCC	CCAGGGCTTC	9780
CGAGGAGGCC	GAGAAGGGCA	AAGACACTTC	CGAGGAGGCC	GAGAAGGGCA	AAGACATTTT	9840
CTGGGCTTGG	TGTGTCAAGA	GCTAGATTGG	AGAAGGGGCT	GGATTTGGAA	CTCTTTAGCC	9900
ATCAGCTCAC	CCTCTCCGTT	TGTGGCTAAA	GTCTGAAGGT	GGAAACTTCG	GTTCTCCTAC	9960
AGGGTCTACA	GGAGTTGGGG	GGCGGGGCGC	CCACACAGAA	CGCTGGAAAG	TTCGACAGTC	10020
CACTTCCACT	GGCTCGGAAC	TCACTTTTTC	ACCTTAAGTT	CATCAGCGGT	AACGCATAGG	10080
TCTCACTTAG	GCAGGGCACG	GATGATTTAA	CAATTTCTAC	TTCTAGGTCA	GGTGCGGTGG	10140
CTCACACCTC	TAATCCCAGC	ACTTTGGGAG	GCCCAGGAGG	GTGGATCGCT	TGAGGTCAGG	10200
AGTTTGAGAC	CAGCCTGGCC	AACATGGTGA	AACCCCGTCT	CTACTAAAAT	ACGAAAATTA	10260
GCCAGGCATG	GTGGTGAGCA	CCTGTAATTC	CAGCTACTCG	GGAGGCTGAG	GCAGGAGAAT	10320
CGCTTGAACC	TGGGA^TGG	ACGTTGCA.GT	GAGGTGAGAT	CACACfACTG	CACTCTAGCC	10380
TGGATGAGAG	AGCAAGACTC	TGTCTCAAAA	ACAAAATAAA	ACAAAAACAA	AACAAAAATC	10440
/AAA AAAGAAA	ACCCAATTTC	CAGTTCTAGG	CCAGGTGCAG	TGGCTCACGC	CTGTCATCCC	10500
AGCACTTTGG	GAGGCCCAGG	AGGGTGGATU	GCTTGAGGTC	AGGAGTTCGA	GACCAGCCTG	10560
GCCAACATGG	TGAAACCCCA	TCTCTACTAA	AAATACAAAC	GTTAGCTGGG	TGTGGTGGTG	10620
TGCGCCTGTA	ATCCCAGCTA	CTCGGGAAGC	TGAGGCTGGA	GAATTGCTTG	AATCTGGGAG	10680
GTGGAGGTTG	<'A<Y,GAG<X.G	AGATAGTG·'C	ACTGCAGTCC	A(A'CTí.GACC	AGAGAGCAAG	10740
ACTCCGT: :TC	AAAAACAAAA	GAAAÍ žCAAAA	ACAAAAAACA	AGAGACCAGC	CTGGCCAACA	10800
TGGTGAAACC	:x:gtctctac	TAAAATACAA	AATTAGCCGG	GCATGGTGGT	GGGCACCTGT	10860
AGTCCCAGCT	ACTCGGGAGG	CTGAGGCAGG	AGAATGGCTT	GAACCTGGGA	GGTGGAGCTT	10920
GCAGTGAGCC	GAGATAGTGC	CACTGCACTC	CAGCCTGGGC	GACAGAGCGA	GACTTGATTT	10980
CAGAACCACC	ACCACCACAA	CAAAACAAAA	CAAAAAATCC	AAAAAAACCC	CAATTTCCAG	1 1040
TACTAGGTAG	TCAGTGATGC	AGGGCTGGAG	ACAGAGGGGC	GGTAAGTGTC	TGGGCGCCCA	11100
CCATCAGTCA	CCTCCCAGCT	CCCAGAGGTG	CAAAGTGCTT	GGTTCAGCCT	CATGGGAAGG	11160
ATGCTCCCTG	GGGAGGCTGG	GCTGGGTTCA	CAGGGCTCTT	CACATCTCTC	TCTGCTTCTC	11220
CCCAAGGTTT	GGTTCCAGAA	CCGGAGAGCC	AAGTGCCGCA	AACAAGAGAA	TCAGATGCAT	11280

-47CZ 297640 B6

AAAGGTGGGT GTCGGGACTG GGGGGACCTG AAGCTGGGGG ATCCTGCTCC AGGAGGGATG	11340
GGGTCGACGA GGTGCTGGCT ACACCCAGGA CCACCACACT GACACCTGCT CCCTTTGGAC	11400
ACAGGCGTCA TCTTGGGCAC AGCCAACCAC CTAGACGCCT GCCGAGTGGC ACCCTACGTC	11460
AACATGGGAG CCTTACGGAT GCCTTTCCAA CAGGTAGCTC ACTTTTTCTT CCTCTGAAGA	11520
TCCCTAGGGA CCTGCTGCTC CCTTCCCCTT TCCCCTATTT GCTGCCGCAT CCTGACACTC	11580
CTAGTCCCTC CCTGCCCCTG CAGACTTCTC AGCTGGCCCT TAGAAAAAAA GCCTCTTTTC	11640
CGAGGAGGCA TTTACAGGCA CCTTGGCACC TATGAAATCA GGCTGGGCCA GGCGGGGTGG	11700
CTCACACCTG TCATCCCAGC ACTTTGGGAG GCTGAGGAGG GTGCATCACC TGAGATCAGG	11760
AGTTCAAGAC CAGCCTGGCC AACTTAACGA AACCCCGTCT ΛΤΤΑΑΑΑΑΤΑ CAAAATGGGT	11820
GTGGTGGCTC ACGCCTGTCA TCCCAGCACT TTGGGAGGCC GAGGGAGGTG GATCACCTGA	11880
GGTCAGGAAT TCGAGACCAG CCTGACCAAC ATGCTGAAAC CCCGTCTCTA CTGAAAACAC	11940
AAAGCTTAGC CGGGCGTGGT GGTGCACACC TGTGATCCCA GGTACTTGGG AGGGAGAATC	12000
ACTTGAACCT GGGAGGTGGA GGTTGCCGTG AGCCAATATC GCGCCACTGC ACTCCACTCT	12060
GGGTGACAGA GTGAGACTCC AAGACTCCAT CTCAAAAAAA AAAAAAAAAA TCAGGCTGTA	12120
AAAATCCACT TTTGGGAAGG TGAACACACA CAAGCCCAAA CAGAAATCTG ACAAAAACCA	12180
GAGGGGTGAA AAGTCCACAC AGTCAGGCAC CCCCACCTGG CTTGCTGCCT GGTTAAGAAG	12240
GGCGCAGATG CCTGTGCCTG GATACCAGAG ATGGGACAGA CACCCATTCC CTTTTCATCA	12300
CCACCCCCGA GTGCCCGAGG GCCTGGGGCG TCTGCCTGGC CCCTGGCCCC TGGCTTGGGC	12360
TCTGCACCTC TGAACTGGAG ACACCCTACT CAGCTCCCCA CTTACTTTGG AGTGAGCAGC	12420
GCTTGGGTGC CCAGCGTGGA TTTGGGGCTT CCAGGGAGTC GGGGTTCGGT CGCGGAGCCC	12480
AAGCTTCCGA IXXiXtXCC.C CGCCCTGCCC TrXCTTAGTG GTGGGGATGG GATGGGGGGA	12540
AACGGGGAGC TGCGTGGAAG GAGGTGAAGG GTCACAGGAG GAGAGAGCGt AGCGCCCACG	12600
TGCGCCCTGC ctgaacgcgc agcgcagcgc ccggctgcgg tgccccttgc CCCTTCGGTt:	12660
CCTAATTTGG GGATCGGGAG TGCATGCGCG GGCGGAACGG GCTTGGGGGG GGGGCTCTGG	J 272.0
GAGGGCGGAC GTGTGGCCTC CCTTCTTCAC CGTTTTATTC CAAGGGGACzX GG< :TGGGGAT	12780
TGTATTTGGG ClXGTGTTTG GCTGAGGGTG CAGGGACTTG GGGGGTGGCG GTGGGGAGGG	12840
CGGAAGGTAT AAACGTATAA ATCATAAGTA AACAACTCAG AAATGGACCC CGAGCGCTGG	12900
TCGCCGCTAG CTCTCCAGCT CTCCCTGGCC CAGGCCCGAA GGAGAGGGGT GCGCATCCCT	12960
CCGCGGTTCT CCTCTCCTGG GTACCTGGCC TTGAGGTGGG GGAACGAGCC TACTTCTTGT	13020
ACCGTCTTTT GCCGACGGCG GGACCCAGTG AAATTAGGCC GTTGGAGCGC GCAGGCCTCX	13080
CTGGCTTTGC GCACCGGAGT CTTGGGGACC TGGTGTCCCC GGGAAAAACT TGGGGACCTG	13140
GTATCCCCGG GAGAGGCTTG GGGACCTGGT GTCCCGGGAG AGGCTTGGGT ACCTGGTTTC	13200
TCTGGAAGAG GCTTGGACAC CTGGTGTCCT GGGAGGGCCT TTGGGACCTG GTGTCCTGGG	13260

-48CZ 297640 B6

AGAGGCTTGG	AGATCTGTTG	TCCTGGGAGA	GGCTTGGGGA	CCTGGTGTCC	CTGGAGAGGC	13320
TTGGGGACCT	GGTGACCTTG	GAGAGGCTTG	GAGACCTGGT	GTTCTGGGAG	AGGCTTGGGG	13380
ACCTGGTGTT	CTGGGAGAGG	CTTGGGGACC	TGGTGTCTCT	GGAAGAGGCT	TGGACACCTG	13440
GTGACCCGGG	AGGGCCTTGG	GGATCTGGTG	TCCCGGGAGA	GCCTTGGGGA	CCTGGTGTCC	13500
TGGGAGAGGC	TTGGGGACCT	GGTGACCTTG	GAGAGGCTTG	GGGACCTGGT	GTCCTGAGAG	13560
AGGCTTGGGG	ATCTGGTGTC	CCAGGAGAGG	CTTGGGGACC	TGGTGTCTCT	GGAAGAGGCT	13620
TGGACACCTG	GTGTCCTGGG	GAGAGGCTTG	GGGACCTGGT	GTCCTGGGAG	AGGCTTGGGG	13680
ACCTGGTGTC	CTGGGAGAGG	CTTGGAGATC	TGGTGAGCCG	GGAGAGGCTT	GGGGACCTGG	13740
TGTCCCGGGA	GAGGCTTGGG	GACTTGGTGT	CCCGGGAGAG	GCTTGAACAC	CTGGTGTCCC	13800
AGGAGAGGCT	TGGGGACCTG	GTGACCTTGG	AGAGGCCTGG	GGACCTGGTG	ACCCGGGAGA	13860
GCCTTGGGGA	CCTGGTGTCC	TGGGGAGAGC	CTTGGGGACC	TGGTGACCTT	GGAGAGGCTT	13920
GGGGACCTGG	TGTCTCGGGA	GTGCCTTGGG	GACCTAGTGA	CCCGGGAGAG	GCTTGGGGAC	13980
CTGGTGTCCC	GGGAGAGGCT	TGGGGACCTG	GTGTCCTGGG	AGAGGCTTGG	GGATCTGGTG	14040
TCCTGGGGAG	AGGCTGGGGG	ACCTGGTGTC	TCGGGAGAGA	GCCTTGGGGA	CCTGGTGACC	14100
CGGGAGAGGC	TTGGACACCT	GGTGTCCCGG	GAGAGGCTTG	GGGACCTGGT	GACOCGGGAG	14160
AGGCTTGGGG	ACCTGGTGTC	CTGGGGAGAG	GCTGGGGGAC	CTGGTGTCTC	GGGAGAGAGC	14220
CTTGGGGACC	TGGTGACCCG	GGAGAGGCTT	GCACACCTGG	TGTCCCGGGA	GAGGCTTGGG	14280
AGCCTGGTGT	CCCGGGAGAG	CCTTGGGGAC	CAGGTGACCT	TGGAGAGGCT	TGGGGACCTG	14340
GTGATCTTGG	AGAíiGCTTGG	ίΧΑΓΓ'ΤΛτη	Trrc/íAGA	fGTTA.CGGGG	gctggttggg	L44OO
GGAGAGAACG	TTGTGAGCCA	AAGTCCCTGA	ATCCCTGCGzA	AAAGAGCGCA	TCGGGAGCTC	14460
CCCCTGA.GGG	CGTTCCATTT	GTGGACCCCC	CTCCCATGCG	CTTTGCAGGG	AGCTGTTCGG	14520
AT TCCCCTGG	CCCGGCTCCC	GCGGATGCAT	CCAGTGGCAG	CGCCAATTCT	GGGCCAGGGG	14580
(./A AGGAGGAA	AGGCGGGTGT	GGGGTGGTCT	CCACGGCTGG	AGAAGGGGCG	ACGCTCCCTA	14640
GGGGAGAAGA	GGCACGTTGG	GGGTTTCCGG	GGGCGCGGGG	CGGAGCAGGC	CCCCCAGTCC	14700
CCATCCTGCG	CCCTCACCCC	GCCGGGTCCG	CTCCCGCAGG	TCCAGGCTCA	GCTGCAGCTG	14760
* ZG7GG	CCCACGCGCA	CCCGCACCTG	CACCCGCAC'	TGGCGGCGCA	CGCGCCCTAC	14820
CTGATGTTCC	CCCCGCCGCC	CTTCGGGCTG	CCCATCGCGT	CGCTGGCCGA	GTCCGCCTCG	14880
GCCGCCGCCG	TGGTCGCCGC	CGCCGCCAAA	AGCAACAGCA	AGAATTCCAG	CATCGCCGAC	14940
C.TGCGGCTCA	AGGCGCGGAA	GCACGCGGAG	GCCCTGGGGC	TCTGACCCGC	CGCGCAGCCC	15000
CCCGCGCGCC	CGGACTCCCG	GGCTCCGCGC	ACCCCGCCTG	CACCGCGCGT	CCTGCACTCA	15060
ACCCCGCCTG	GAGCTCCTTC	CGCGGCCACC	GTGCTCCGGG	CACCCCGGGA	GCTCCTGCAA	15120
GAGGCCTGAG	GAGGGAGGCT	CCCGGGACCG	TCCACGCACG	ACCCAGCCAG	ACCCTCGCGG	15180
AGATGGTGCA	GAAGGCGGAG	CGGGTGAGCG	GCCGTGCGTC	CAGCCCGGGC	CTCTCCAAGG	15240
CTGCCCGTGC	GTCCTGGGAC	CCTGGAGAAG	GGTAAACCCC	CGCCTGGCTG	CGTCTTCCTC	15300

-49CZ 297640 B6

TGCTATACCC	TATGCATGCG	GTTAACTACA	CACGTTTGGA	AGATCCTTAG	AGTCTATTGA	15360
AACTGCAAAG	ATCCCGGAGC	TGGTCTCCGA	TGAAAATGCC	ATTTCTTCGT	TGCCAACGAT	15420
TTTCTTTACT	ACCATGCTCC	TTCCTTCATC	CCGAGAGGCT	GCGGAACGGG	TGTGGATTTG	15480
AATGTGGACT	TCGGAATCCC	AGGAGGCAGG	GGGCGGGCTC	TCCTCCACCG	CTCCCCCGGA	15540
GCCTCCCAGG	CAGCAATAAG	GAAATAGTTC	TCTGGCTGAG	GCTGAGGACG	TGAACCGCGG	15600
GCTTTGGAAA	GGGAGGGGAG	GGAGACCCGA	ACCTCCCACG	TTGGGACTCC	CACGTTCCGG	15660
GGACCTGAAT	GAGGACCGAC	TTTATAACTT	TTCCAGTGTT	TGATTCCCAA	ATTGGGTCTG	15720
GTTTTGTTTT	GGATTGGTAT	ΤΓΤΤΤΤΤΤΤΤ	TTTTTTTTTT	GCTGTGTTAC	AGGATTCAGA	15780
CGCAAAAGAC	TTGCATAAGA	GACGGACGCG	TGGTTGCAAG	GTGTCATACT	GATATGCAGC	15840
ATTAACTTTA	CTGACATGGA	GTGAAGTGCA	ATATTATAAA	TATTATAGAT	ΤΆΛΑΛΑΑΑΑΑ	15900
ATAGCCGTGC	ACTCTTGACC	CCGTCAACGT	CCAACGTGGA	AAAGGCGTTA	CCTCTTCTCC	15960
CAGCGCTGGC	CGCCTGGCCA	CTGAGGGCCC	TTTGCAAAAA	TCACGGGTGT	AGAGATGGCC	16020
CTGGGCGCGC	TGGGAGTGTG	GTTGTGTTTC	TGAAGGGGAT	AAAAGAGGGC	ACGGTGGTGC	16080
CAAGATATCA	GTTTGGTACC	TGAGCTGTTT	CTGGTTGGGA	AGCGTAAAAG	CCAGGGAGAG	16140
ATCCAGAGAG	TTTTCAAGTT	TTTGCAGATG	TAGGTGGTTC	CAGCTTTTCT	TTCTCCCCTA	16200
CTCCATCTTC	TGCGTTCCCC	CAGTTCTTTT	ATTTCTTTGT	ΤΤΤΤΤΆΤΤΤΤ	TGAGACAGAG	16260
ACTTGCTTTG	TCGCCCAGGC	TGGAGTGCAG	TGGCGCAATG	TCAGCTCACT	GCCACCTCCA	16320
CCTCCCCJGGT	TCAAGCGATG	CTCCTCCCTC	AGCCTCCCGA	GTAGCTGGGA	CTACAGGCAC	16380
CTGCíACGAC	CCCCGGCTAA	TTTTTTGTAT	TTATAGTAGA	GACGGGGTTT	CACCGTGTTG	16440
ÍXCAGGCTCG	TCTCGAACTC	CTGACCTCAG	GTGATCTGCC	CGCCTCGGCC	TCCCAACGTG	16500
crcccAGTrr	TATAAACAGC	AGATAÍXIAAC	TTGTCGTCAC	AGCTGGCATG	GGCTGGACAG	16560
TTGCTTGAAA	TGACCTAACC	AAAAACATTC	AAGGGTTCTG	CCCCCAGATT	TCGGGAGATC	16620
CACGTTCCAT	GTTCTGATTG	GTTTTCTGGG	AACACAGCAA	GGGGTTTGGT	GACCTCCGAG	16680
AAGATCCATC	TGCATGATTG	GGATTAGTTA	CCACAGCCTG	fCCAGAGAGZ»	AACTATCTTC	16740
TCCCAAGATT	TACTAACATC	CAC > i C ziA	CTGTCTTATT	TCCATAACAC	ATTTGCATCT	16800
TTGTGGATTC	AAGCTTGGTG	GTTTTCTTTC	CTAACTTCTG	ATTTAGATAC	TTCTCCCTGA	16860
GGTGGGGATA	AAAGAAAAAA	ZiAAAAACAAC	ttcttttttt	CTTCCGCATA	AGACTTTCTZ»	16920
TCTTGTCACT	GAGCTGAACT	GTAGATCCAT	TTGGACCCGT	CTCATTTGTA	TCTTCTGATA	16980
TTCTTTATAC	AAACCAAAAG	TCCCCTTCAA	CATTTTTTAT	GTCAAAATGT	TACAACCGCT	17040
GTAAAATGAC	GGAGAGAGAG	AGAAAGAATC	CCAGACATTA	ACGGTATTAG	AGAGTTTGCC	17100
TCATTCATCC	ATTTTTCTTA	AAAGCTGGAA	ATTAAAAAAA	AAAAAGAGAG	AGAGAGGCTT	17160
TAATAGTTAA	GCTGAAATTT	TTATCGAAAA	GAAGAATTGC	ATTTTGAATC	TTTGGGAAGT	17220
AGGTTCATTC	ATCAGAGTAT	GTAACCCTTT	GGAAAAGTGG	TTGGTAAGAT	ATGTACAGCC	17280

-50CZ 297640 B6

CTAGATTTTT	TTTTTTTTAA	CCAAAAAGGC	TGAGTAATTT	TGAAAAATCG	AAACATAACA	17340
GTGTGTCATC	ATTTCCTCCC	AAGAAAAAGC	TCACTCCACG	TGAGTAGAAA	GACATCTACC	17400
TGGTCCCTGT	AGAATCTGAA	CGTTTCTCTT	TAGAGACGGA	ATTTCAATCT	TGTTGCCCAG	17460
GCTGGAGTGC	AGTGGCACAA	TCTCGGCTCA	CCGCAACCTC	CGCCTCCCGG	GTTCAAGCCA	17520
TTCTCCTGCC	TCAGTCTCCC	GAGTAGCTGG	GATTACAGGC	ACCTGCCACC	AGGCCTGGGT	17580
AACTTTCTGG	TATTTTTAGT	AGAGACAGGG	TTTCAGCCTC	CCGAGTAGCT	GGGATTACAG	17640
GCACCTGCCA	CCAGGCCTGG	GTAACTTTCT	GGTATTTTTA	GTAGAGACAG	GGTTTCAGCC	177OQ
TCCCGAGTAG	CTGGGATTAC	AGGCACCTGC	CACCAGGCCT	GGGTAACTTT	CTGGTAGTTT	17760
TAGTAGAGAC	AGGGTTTCGG	CCTCCCGAGT	AGCTGGGATT	ACAGGCACCT	GCCACCAGGC	17820
CTGGGTAACT	TTCTGGTATT	TTTAGTAGAG	ACAGGGTTTC	GGCCTCCCGA	GTAGCTGGGA	17080
TTACAGGCAC	CTGCCACCAG	GCCTGGGTAA	CTTTCTGGTA	TTTTTAGTAC	AGACAGGGTT	17940
TCGGCCTCCT	GAGTAGCTGG	GATTACAGGC	ACCTGCCACC	AGGCCTGGGT	AACTTTCTGG	18000
TAGTTTTAGT	AGAGACAGGG	TTTCAGCCTC	CCGAGTAGCT	GGGATTACAG	GCACCTGCCA	18060
CCAGGCCTGG	GTAATTTTTT	TGCATTTTTG	GTAGAGACAG	GTTTTTGCCG	TGTTGGCCCG	18120
GCTGGTCTCA	AACTCCTGAC	CTCAGGTTGA	CCTGCCCGCT	TTGTCCCTCG	CAAAGTGCTG	18180
GGATTACAGG	CGTGAGCCAC	CACACCTGGC	CTGAATCTGA	ACTTTTAAAA	GGGAGTTACT	18240
GACTCTCAAC	TGTGCGGGGA	CGGTTTCACT	TTGATTTAAT	ATGGAAAGAG	GGCCAAGTGT	18300
CATCCTCACA	AATGGGTCCC	CGAAGCAGAT	CAAACGCAGA	GAACTGTGAG	GGTGGGACAC	18360
GAGTGTCTGT	GGACACTGGC	TGCCTTTGGC	TTTTCTCCTG	CGAGAGAAGT	TGGGTGACTT	18420
TCTGTAGGTG	GATGAGTGAT	CCCTGAATGzX	GTGTGGGGTA	CGTGTATGCT	AGCTGCTTCT	18480
TTCTCCCTGA	AACTCTCGGA	TGoAAGG/vaG	TAAGAAATTC	AGCTTGÍXX1T	<> GACCAGT T	18540
CTCACCAUGA	ACGCCCTCTT	CTCTCTCCCT	tctccttcct	TCCTTCCTTX	CTTCCTTTCT	18600
TTCTTTTTCT	TTCTTTCTCT	CTTTCTTTCT	TTTCTTTCTT	TCTGTTTCTT	TCCTTTTTAT	18660
CTTTCTCTCT	TTTTCTTTCT	CTTTTCCTTT	TTTGTTTCTT	TCTTTCTTTT	TCTTTCTTTC	18720
TTTTTCTTTC	TTCTTTCTTT	CTTCGATGAA	GTCTCACTCT	GTCACCCAGG	CTGGAGTGCA	18780
< *TGGTf ιΙ-.Α/χ';	!:ua</:tgac	TGCA'ÍC'_T: T	zTCCTCCTGGC	FTGAzV »AAAT	r:tcctgcct	> 884 0
CAGCCTCCCA	AGTAGCTGGG	ATGACAGGCA	CCCACCACCA	TTCCCC«GATA	ATTTTTČTAT	18900
TTTTTAGTAG	AGACTGGGTT	TCGCCATGTT	GGCCAGGCTG	GTCTTGAACT	CCTGACCTCA	18960
GATGATCCAC	CCGCCTCAGC	CTCCCAGAGT	GCTGGGATTA	CGGGGTGAGG	CACCGCGCCC	19020
GGCCTCCTCT	CTCTTTTTCT	GAGATGTTTA	GGAAGGACTG	GGCTGATGCG	GACCCTCTGT	19080
ATGTGATGTG	CGTGGGTTTG	GTTTCCCGGA	AGGCCCTCCA	GAGACACGTT	TGCGTGAACA	19140
TTCAGCATGG	AAACAACATA	CGTCTCTCCA	CAGGAGGTGA	GAAATTGAAT	TTATGGGGTG	19200
GGTGTACGCT	GGCGATTCTT	GGTGCTTTTT	GCTCAAAACA	AGGTTCTTTT	GAAAGTCACG	19260
TTCCTGCTTT	CCCTGTGGCT	TCCCGGTGAG	CTCGCTCGCA	GAGCAAGGAA	TACCACCCAG	19320

-51 CZ 297640 B6

AGAGCAACGT	GGGCTGTGTT	CCGTTGTAAC	GCCGTTGCAG	AGAGAGGATT	TGGTGTGTGA	19380
GATCCGTACC	AGCTCCAGCA	CACTGATAGG	AACACGTTGC	TGGCCGAACT	GAACGATGCT	19440
GGGTTGGGTC	CTGATTGATA	CGTATTTTCT	TCCCTCCTCT	CCCCAAAACT	TGGCCAAATA	19500
GTCCGTGGAG	GGTTGTCAGT	CGCCGCAGTT	GAGCAAAAAA	CACTTCTTCC	TTTGAGTGGC	19560
TGTTCTGGTG	AAATCTGTTT	CTGACATATC	CACTTTTCTC	TCTCTTTTCT	CTCTCTCTGA	19620
CTGCGAAGCA	CCCACAGGGA	GAAGGAATTG	GATGTATCGG	ATGTTGGTAT	TAGATTTTCT	19680
TTCTCCGTTC	GAGTCTCTGA	CTGGTGCATA	CTTTGCAAAG	GTGTGTTCCT	GGCAATTGCC	19740
AAGAGTTAGA	AAAATGCACC	TTCTCTGGTG	GCCGTTGGGG	TGTTGTTTCA	CAGGCAGTGG	19800
TGACAGGGCC	CCTTGGCTGT	GGCTGTCTTC	TCCAGCGCCG	TGGATAAAGA	GACGGGACAG	19860
attctgtgcc	TCTGTACGAT	TTAGAGCGTA	ACTGACCGCG	TCCAACACCC	GTTTTTCCAC	19920
TTACAAAGCT	GGTGGTGCGA	CGGGCTTGGT	GTCTCCCGTA	CGGGAAGGAG	GCCTTTGGGC	19980
CGCTCCAAAG	ACGCCCTGTC	GTAGGAATGG	CCTCTCCATC	CCGCCAAAGT	CCAGCCAGGC	20040
CCCCGAAATG	GTCCCATTTC	CTTGGAAGCC	TGAGTTTCTG	TTCTGGTCTT	GCTGCTGTCC	20100
TTGGCCACGT	CAGCACGTGG	GAGCATCTGT	GGATACCGCA	GAGTCTGGGG	ACAGCTGGGC	20160
CTTTAACCGA	AATGAAGCCG	AGACGGGTTT	GAGGTTTTGG	TGCCAAGCTC	TGGTCAGGAT	20220
GAAAGGGAAA	TACCAGAGTC	CTCTGTCCTC	GCCTCTGGGT	TTCATGCTGA	CCTTTCTAAC	20280
ATTTGTTTTC	CCCTAAGAAC	AAGCAGAAGC	CTCCAGCTCC	CTTTAGCTCC	ACAGTTTTCC	20340
CGGGGACATA	GCGAGGATGG	CACACGGCAG	CCACTCCCAC	GACACACATT	7CGGAGGCAC	20400
''-VTGrTGCA Λ	^rX.'í*^rXTTGTC	TCCTCCAGCT		TGGGGAGGAG	AGAG-GCTTTC	20460
GGTGGACACG	TTTGACATTA	AAAAAAAAAA	AAAAAAAAAA	AAAAAAACTG	GTGCCTAATT	20520
TATTAAAGAG	AATTAGCTTA	GCGAGTATAT	GCTGATATTC	TTCGACACAC	GTGGG7AAGT	20580
TGATGCCATT	TATAAATGTT	TTATTGAAAT	TTGATATTTA	ATGA.GAAGCC	GGTTAA<X>AA	20640
TGTAGACAAT	ATCCCGTTTC	AAAGCTATGA	AATGTGCTAT	TTATTGAAAG	GGGATGTGGC	20700
TTCACGAGTT	CAGCCCATTG	TACGTGCAGG	TCCCGTGGGA	AGGAGGCAAA	AGCCCCTGCT	20760
TCTTACTTTG	tgatgtatgt	GCATTTGTTA	TTTATTTTTT	TTTCCTTGGT	CGGACI.TTCA	20820
TAAATATGTA	υΤΑΓΤΤΤΑΛΤ	TATGTCGAGT	GTAAATTTGA	CATCGCGTTG	CATT7ATTTT	0880
TATATTTCTG	AAAACTGTTG	CTTTTTCTTT	TTCCCTCCCC	CATTGACGAC	ATAGCGGtcC	20940
CCGCGTCCGG	GTTACAAATA	CATCTACAGA	TATTTTCAGG	GATTGCTTCA	GATGAAAACA	21000
AATCACACAC	CGTTTCCCAA	ACCAACAGTC	TTCACAT7TC	TATCCCTCTG	TTATTGTCGG	21060
CAGGCGGTGA	GGín »T AGAAA	AAAAACAAAC	AAACAAACAC,	AAAAAAAAAC	CAAAAAAAAC	21120
CACCCTGAGT	TTCTCTGGTG	ACGCCCTCAT	TCTCCTAACG	TTCAATAATC	TCAATGTTGA	21180
GTTGCAGCAA	CAGACTGTAT	TTTTGTGACG	CCCCGTAGTA	TGAATGTACA	TCTTGTAAAA	21240
CTGAGATATA	AATAAACTTA	TAAATATTTG	TATTCAAGTG	TTAAAAAAAA	AAAAATTCTC	21300

-52CZ 297640 B6

AACCTCTCCC	CTGAGGACAG	GCTTATTGGA AAAAAAAAAA	AAAAAAAAAA	ATCCTGAGTC	21360
GGCCGTGGCT	GAACACAGAG	TGTTGTTCTG	CTCCGTGCAT	TTCCAGGGTG	GGTACCCAGT	21420
GTTGCCCCCC	AGCCTTAGAT	CGGGAGGTAC	CATTGACTTT	TGGTTGTATC	CCATCCCCTT	21480
CCTTTACTGA	AACCTACCTC	CCCGCTTCTC	AGCCAACGTC	CCCCCAGAAG	GTGGCAAAAA	21540
AAACAGAGGA	AAAAGCCCTG	ATTTGAATCA	AGTCAGAGCT	GCTAATTCTC	CACTTTCTTT	21600
AATTAATTAA	ΤΤΤΑΤΤΓΤΤΤ	TTTTTGAGAC	TGAGTCTCGC	TCTGTCGCCC	AGGCCGGAGG	21660
AGTGCAGGGG	CGCGATCTCG	GCTCACCGCG	ACCTCCGCCT	CCCGGGTTCA	AGCGACTCTC	21720
CTGCCTCAGC	CTCCCGAGTA	GCTGGGATGA	CAGTCACCTG	CACCACCGCG	CCCGGCTCAT	21780
TTTTGTATTT	TTAGTAGCAA	TGGGGTTTCA	CCGTGTTGGT	CAGGCTGGTC	TCGAACTCCT	21840
GACCTCGTGA	TCCACCCGCG	TCTGGGCCCG	GCCGGTGATG	TGTGTGCTTT	TAACTTTTAT	21900
TTTGTTCCAG	TTTTCGACAG	TGGCACGGAT	TTTCCAGCAC	GGTCTTGCAA	CXÍATGATTGA	21960
GTCATTTTTG	AGACAAAAAA	ΤΑΤΆΆΤΆΑΤΆ	ATAAATGGAA	AAAGAAATCG	ACTTTTAAAA	22020
ATGACAAATT	TTTTTTTTTT	TTTTTTGCAT	AGATTTTTCT	CTCTTTATGT	AAAGGAAAGT	22080
TCATGATTGG	ATTTGGCCGG	CCTGACTGCT	TCCCGGCTGT	GATAAAAAAC	ACATGTGAGC	22140
TGGGAGGGAA	GTGGGGGAGG	GACACAGCTG	CCCACACAGG	GTTCCCACCG	CGGTTACAGG	22200
GTGGGCAGTG	CTGGGGGAGC	TTTCTCTGTG	GGGGGCTCAG	AGCCTGAGGA	CAGGTGAGCC	22260
TCTCCGACAC	CTCCCCAGTT	GCCTGGAGTC	TAAACCGTCC	GTTGTCTGTA	CCGTCCGTTC	22320
TTCCTGCTGA	CTCCTGGTAG	TTCCTGAAAG	CTTCTCTTGG	CCAGAGAAGG	GGTTTCAGAG	22380
íx:cgtgtgtc	(_ACXX:CATTC	TGCAAAGTGC	AACTTC.ACCG	TTCCTTTCCT	TTTCTGGCCT	22440
(iCGTGGTCTG	AAGCTCAGAG	CCUTCTCTTC	ACCCAGCCTG	TGTGTGTCTT	GCCGGACAGA	22 500
AGmAAAA I úG	TGCTTTTTCC	GTGTTAGCAG	AGGTGCTTTT	CATGGCTGAC	CTCAACGCGT	22560
CCATCTCCAG	CCTTGACCAA	GCTGTTTTTT	a<xxxx:aaac	GCAGGGAAGT	TCTGAATGCA	22620
CACAGTTATT	TCATGGTTAA	ACTATTCAGC	TTTGGCCGGG	CGCAGTGTGG	CTCTCACGCC	22680
TGTCATCCCA	GCACTTTGGG	AGGCCGAGGC	CXXiTGGATCA	CCTGAGGTCA	GGAGTTCGAG	22740
ACCAGCCTGG	CCAACACGGT	GAAACTCTAT	CTCTACTAAA	AATAC-ΛΛΛΆΛ	TTAGCCfXXX:	22800
GTGGTGGTGT	GTATCTGTAA	TCCCAGCTAC	TCAGGAAGCT	GA(X>(. AfX iAí»	AATCCX-.TTGG	2 2860
ACCCAGGAGG	CGGAGGTTGC	ACTGAGCCGA	GATCGCGCCA	TTGCACTCCA	cx:ctgggí.ga	2 2 920
CAGAÍXJCAGA	CGCTGTCTCA	AAAAAATGAA	ΤΑΑΤΑΑΑΑΤΛ	AAATAACAGG	AACTAAATAA	22980
AATAAAACGT	TCAGCTTTGT	TCTGCAAATC	CACTCCTATT	GTTTTACGTG	GTTTGAGAGA	23040
CTCTGTCCCT	TAGAAATAGA	TGTTTGTTGC	CAATTGTAAT	GAATCTGTTT	CAAAAATGAA	23100
CAGAATATTC	AAATGGTTTG	AGAGATCTTT	TCCCTTAGAA	ATAGCTTGTT	GCCAATCACA	23160
AAGAATGTTT	TTCAAAAATG	AATGGAATCT	TCCTGGATAT	CGCTTCCAGA	TCTTCATTTT	23220
TTTTGCATAG	TTCAACCTGA	AAAGTAAGTG	TCTCAGCCCT	GAATTTCTTT	CTGATTTTTC	23280
CATGGGTTGT	CTTGCAGACT	TCTCTGGACT	TGACCACATT	ΤΑΑΑΑΑΑΑΑΛ	AAAATTAACT	23340

-53 CZ 297640 B6

TTTTCACACG	GACACGGTTT	CAATAGGAAT	GAGATCTTTG	AGTTTTTATG	TAACAGATTC	23400
TTACCATCAG	TTCTCAGATT	CCCAAATTAC	ACACAAAAAG	ccacggactt	CGCCTCCTGC	23460
TAACATGTCC	TTCTGTTTCT	GAGGCTTCTG	TTGGTGTTAG	actttcatgt	TTAATAGCAG	23S20
ACAATGTAGG	GATTTAAAGA	AAAATGCAGA	gaaagcaaaa	acactgacca	AACACACGGA	23580
GATAAGCTTT	CTAAAGCCTT	TGTTCTTGGA	GTTGTCGTTA	aaaaaaaaaa	GTTGTTTTAA	23640
ACTTTGCAAG	CATGCCTATA	TTGAACTCAT	AAGCAAGAGA	GCCAAGAAAA	ATAGTGTCGG	2 3700
TCGTCTACTC	TACACGTTTT	CCCAAAACAG	ACGTATTTTA	ATTTCTTTTG	TTTGAACTCA	2 3760
CAGATGCTGA	GAGTTAAAAG	TTAAATTTTT	GTCATGAACA	ATAGTGGCCA	AAACCACAGT	23820
TACTTTTGCA	CTATAGCATA	ATAAGAAAAA	TACAGGCTGG	GCTCGGTGGC	TCACACCTGT	23880
AATCAAAGCA	CTTTTGGAGG	CGAAACAGCC	AGATCCCTTG	AGCCCAGGAG	ATTGAGACCA	23940
GCCTCÍGGCAA	CATAGCGAGA	CCCTCATCTC	TACAAAAAAG	GTTTGTTACA	TATGTAACAA	24000
ACCTGCACAT	TGTGCACATG	TACCCTAAAA	CTTAAAGTAT	ΑΑΤΛΑΤΑΑΑΑ	ΆΑΑΤΤΑΑΆΑΑ	24060
AAAATTCACC	AATCAACTGC	CTGCTGGTGC	CTTCAAGAGA	CTCACCTAAC	ACATAAGGAC	2 4120
TTGCATAAAC	TTATAAAACA	ATTCAATGGA	AGAATCCTTG	AAAGTATTCT	GAGAAGACAG	24180
TATAATAAAC	TGATTTCTAA	AAAGGCTATA	AAAAATTGAA	TAAATCATTG	TTGGGCATCC	24240
TGTGCTGAAA	TATAATGCAG	CCAATAAAAA	TTACAAAATG	AATAAACATT	TTATAACAAT	24300
AAAAAAAAGT	CAAATAATTA	GGCAGGCATG	GTGGTGCTCT	CCTACGGTTG	AAGCTATTCA	24360
GCAGGCAAGA	GGATACTTTG	TTTTTGTTTT	ΤΤΆΑΤΤΤΤΤΤ	TTGAGACAGA	GTCTCGCTCT	24420
GTTGCCAGGC	TGGAGTGCAG	TGGCGTGATC	TCAGCTCACT	GTAATTTCTG	CCTCCCGGGT	24480
TCAAGCGATT	TTCCTGCCCC	AGCCTCCCGA	GTAGCTGGGA	TTACAÍXiTGC	CCGCCACCAC	24540
AC C1GG<TAA	TTTCTTTTGT	ATTTTTAGTA	gagacgaggt	TTCCCCATGT	TGGCCAGGCT	24600
GGTTTTGAGC	TCCCGACCTC	GGGTGATCCA	CCCGCCTVAG	CCTCCCAAAG	TGCTGGGATG	24660
ACAGGCGTGA	GCCACCGCGC	CTGGCCCAGG	aggattattt	GATCCCAGGA	GGTGGAGGCT	24720
GCAGGAAGCC	ATGATTGCAC	CACTGCACTC	cagcctggct	GACAGAGTGA	GACCACATCT	2 4 780
CTAAATAAAT	GAATAAATAC	AGGCAGAAAC	tttttttgtt	TTGTTTTGAT	GGAGTCTTGC	2 4840
TCTGT' ACCA	A: »GAGT(»	CAGTGGTrX. t.	atc.tcagctc	ACTGCAACCT	CCACCTCCTG	2 4 900
GGTTCAAGCA	ATCCTCCTGC	CTCAGCCTCC	cgagtagctg	GGATTACAGG	TGCCCGCCÁC	2 4 960
CACGCCCGGC	TAATTTTTTG	TATGTTTAGT	agagacggga	TTTCACCGTG	TTAGCCAGGA	25020
TGGTCTTGAT	CTCTTGACTT	TGTGATCTGC	ctgcctcagc	CTCCCAAAGT	GCTGGGATTA	25080
CAGGCATGAG	CCCAGGAGTT	CAAGACCAGC	ctcagcaaca	AAGTGAGACC	TTTTCTCTCC	25140
AAAAAATCAA	AAATTTAGCC	AGCTGTGGTG	gctcctgccc	GTGATCCCAG	TACTGTGGGA	25200
GGCTGAGGGA	GAATTGCTTG	AGCCCAGGAG	ttcgagacca	ACCTCAGCAA	AAAGGACTCT	25260
CTCTCTCTCT	CTCTCTCTCT	CTCTCTCTCT	ctctctatat	ΑΤΑΤΛΤΑΤΑΤ	ΛΤΑΤΑΤΑΤΛΤ	25320

-54CZ 297640 B6

GAGTTTCAAA	AATTGCTGGG	TGACCAGCTC	ATCTACTGGT	TTTCCCCTTG	GGAAAGTGAA	25380
ATTGTCATGT	ATTGAAGATT	TCCAAGGAAG	TTGTATTGAA	TGAGAAACAA	ACTCAATCTG	25440
TTCGTGTTTA	AAGAGCTGCA	GTGCGTTTGC	TGTGTTTCCC	ATAAAACTGC	ACTTCCAAAA	25500
GACACGCTGA	GAAAGGAGAC	CAGGATTTGT	AATTCAGAAA	TTGGAAAGCA	AGTTAGGCTG	25560
GACGTGGTAG	CTCATGCTTG	TTGTAATCTC	AGCACTCTGG	GAGGCTGAGG	CAGGAGGATC	25620
ACTTGAGCCC	AGGAGTTCAA	GACCAGCCCG	TGCCACATGG	TGAAACCCTG	TCTCTCCAAA	25680
AAATAAAACA	TTTAGCCAGA	TGTGGTGACT	CATGCCTGTA	ATCCCGGTAT	TCTGGGAGGC	25740
TGAGGCAGAG	TTGCTTGAGC	CCAGGAGTTC	AAGACCAGCC	TCGGCAACAA	AGTGAGACCC	25800
TGTCTCTCCA	ΛΑΑΑΆΤΑΑΑΑ	CATTTAGCCA	GCTGTGGTGA	CTCATGCCTG	TAATCTCAGT	25860
ACTCTGGGAG	GCTGGGGCAG	AATGGCTTGzA	GCCCAGGAGT	TCGAGACCAA	CCTCAGCAAC	2S920
AAAGTGAGAT	CTTGTTTCTC	CAAAAAATCA	AAAATTTAGC	CAGCTGTGCT	GGCTCATGCC	25980
TGTAATCCCG	GTACTCTGGG	AGGCTGAGGC	AGAATCGTTT	GAGCCCAGGA	GTTCGAGACC	26040
AACCTCAGCA	ACAAAGTGAG	ATCTTGTTTC	TCCAAAAAAA	TCAAAAATTT	AGCCAGCTGT	26100
GCTGGCTGGT	GCCTGTAATC	CCGGTACTCT	GGGAGGCTGA	GGCGGAATTG	CTTGAGCCCA	2 6160
GGAGTTCAAG	ACCAGCCTCA	GCAACAAAGT	GAGATCTTGT	TTCTCCAAAA	AATAAAACAT	26220
TTAGTCAGCT	GTGGTGGCTC	AAGCCTGTGA	TCCCAGCATT	TTGGGAGGCC	GAGGCGGGCG	26280
GATCACGAGG	TCATGAGATC	GAGACCATCC	TGGCTAACAC	GGTGzAAACCC	CGTCTCTACT	2 6340
AAAAATACAA	AGAAAATTAG	CCGGGCGTGG	TGGCGGGCGC	CTGTAGTCCC	ŽYGCTACTCAG	2 6400
GAGGCTGAGG	CAGGAGAATG	CCGTGACX.CT	GGGAGGCGGA	CCATGCAGTG	AGTCAAGATC	26460
GCGCCACTGC	CCTCCAGCCT	CACAG/	GCAAGACTCC	GTCTGAAAAA	ΑΑΑΑΑΑΑΑΑΑ	2 6520
AAAACTGCTG	CCCAACCTGT	GTTTGCACCA	CTGCCCTCCA	Cjí. ; c	CAGAGCAAGA	2 6580
CTCCGTCTCA	AzAAAAAAAAA	/XATGCTGCCC	AAGCTGTGTT	TGCACCACTG	CCCTCCAGCC	2 664 0
TCGGCAACAG	AGCAAGACTC	CGTCTCAAAA	ΑΑΑΑΛΑΑΑΆΑ	AAzAATGCTGC	CCAAGCTGTG	2 6700
TTTGCACCAC	TGCCCTCCAG	CCTGGGCAAC	AGAGCAAGzAC	TCTGTCTCAA	z\AAAAAAAAA	26760
AATGCTGCCC	AAGCTGTGTT	TGCACCACTG	CCCTCCGGCC	TGGGCAACAG	AGCAAGACTC	26820
CGTCTCAAAA	ΑΆΛΑΑΑΛΛΆΑ	AATGCTGCCC	AAGCTGTGTT	TGCzACCACTG	CCCTCCAGCC	2 6880
TGGGCAACAA	AGCAAGCCTC	AGCTTTCTGC	CATCTCCACzA	ACCAAGzWW.	CAATTCACAC	26940
AGAAzVTCAGT	GCATCGTGCA	GTGACCTCTT	CAGAAAACCA	zVTGzTGTTTTC	cacctgagga	27000
ACTGTTTCTG	AGCCCCATTC	AGAAAAACAC	ATCCCTGTAA	CTGCAGGGCA	GATTTACTCA	27060
CTGTATGCCT	GTTTAAATAA	AGCTTCCAGC	CTCTGCATGC.	GGTCTGTCTG	GAAGCTCCTG	27120
TATCTGTCCC	ACATTCTTGG	AATCACAATG	CACCCTTGGG	AGGAAGATAT	GTATTTAAAG	27180
GGAGTGGATG	TTATGGTGAG	AAAATGCTGC	CCATCCTTCT	AGAAGACAAA	AGCCACACAA	2724 0
AATACATCAC	AAGAACCAGT	TTTTTTCAGA	GAAGAACCTG	CACAAAGAAC	CTGCTCCCCC	27300
CACACCCCCA	CACACAGGTG	AATTAACAGG	ATGTATGTTT	TATCATAAAA	GCACAGGTTT	27360

-55 CZ 297640 B6

GTTTCCTATG	CACTCTCTGA	GGATTTGGCC	ATATGCAAAG	atgtacaaaa	ACCTTCTCTT	27420
TCCCCAGGGA	ACCGTAACCC	GTCTGAAAAG	ATGCCCTTCT	CAGAAGCGAG	TTGAACGATT	27480
GTTGGAAAAG	ATAAAATACG	ACGTGCACAC	ACACAGTAGA	GAAATGTCAC	CGATGCAAAT	27540
TATGTGTTTG	AATGGAACAC	ATTCAGGAAG	CTAAATGGGG	TATGACCACA	CATTTGGGTT	27600
GATTTATTTG	ACGAGTGGAA	GGGGCAGATG	GAAATGAATA	CTGCTGTTTT	CCTTTGGAAG	27660
GCCATATATG	GGAATACCAA	GAGGATTACT	TTGGAAGTTT	AGCTTCTCCA	GGTGGTCTCT	27720
CTCTCTCTCT	CTTTTTTTGA	GACAGAGTCT	CACTCTGTCA	CCCAGGCTGC	AGTGCAATGG	27780
CGTGCTCTCG	GCTCACTGCA	ACCTCAGCCT	CCCAGGTACA	AGCGATTCTC	CTGCCTCAGC	27840
CTCCCGAGTA	GCTGGGATCA	CAGGTGTGCA	CCACCACGCC	TGGCTAATGT	TTGTATTTTC	27900
AGTAGAGATG	AGGTTTTACC	ATGTTGGCCA	GGCTGGTCTT	GAACTCCTGA	CCTCAGGTGA	27960
TCCGCCTGCC	TCGGCCTCCC	AAAGTGCTGG	GATGACAGAC	ATGAGCTAGC	ACGCCCGGCC	28020
CCAGGTGGTC	TTTTTAGCGG	GTATTAAAGC	AGCTTTCTCT	CTGAGCCTTA	AACCATGAAG	28080
ATAGACAGAC	TCAGTGTATG	GGTTTTAGAG	TTGTAATTTT	ATAAAAATAA	GAAAAAGTCG	28140
ACCTATCATT	GATGGTTAGT	ATTTTTTGTA	GCAGTTGCAT	GGAATATTAG	GATAAGGCAT	28200
GTTCTCAAAA	AGAACTCTTT	TTTTTTTTTT	TTTGAGACGG	AGTCTCGCTC	TGTCACCCAG	28260
GCTGGAGTGC	AGTGGGACGA	TCTCCGCTCA	CTGCAAGCTC	GTCTTCCCGG	GTTCACGCGA	28320
TTCTCCTGCC	TCAGCCTCCC	CAGTAGCTGG	GACTACAGGC	GCCCGCCACC	ACGCCCGGCT	28380
AATTTTTTGT	ATTTTTAGTA	GAGACGGGGT	TTCACCATGT	TAGCCAGGAA	(X.TCTCGATC	28440
			T*-rr AAAGTG		AGGCGTGAGC
CACTGCACTT	GGCCTTTTTT	TTTTTTTAG/A	TGGAGTTTTG	CTCTTGTCGG	CGAGGCTGGA	28560
GTATAATGGC	AIGAΓC TC GA	CTCACTGCAA	CCTCCGCCTC	CCGAGTTCAA	GCCATTCTCC	2 9 620
TGCCTCAGCC	TCCCGAGTAG	CTGGGATTAC	AGGTGCCGAC	CACGATGTCA	AGATAATGTT	2 8 680
TGTATTTTCA	GTAGAGATGG	GGTTTGACCA	TGTTGGCCAG	GCTGGTCTCG	AACTCCTGAC	28740
CTCAGGTGAT	CCACCCGCCT	TAGCCTCCGA	AAGTGCTGGG	ATGACAGGCG	TGAGCCCCTG	28800
CGCCCGGCCT	TTGTAACTTT	ΑΤΤΤΤΤΆΑΤΤ	_{τπτττττττ}	TTTAAGAAAG	ACAGAGTCTT	28860
GGTCTGTCAC	'GAGM.TGGA	GC/ií ACTCA» Γ	GCGATCATAG	CTGACTGCAG	Í_CTCAAA< ;<	2 8920
CTGGGCTCAA	GCAATCCTCC	CACGTGAGCC	TCCTGAGTAG	CTCrGGACTAC	aggcaccCac	29 980
CACCACACCC	AGCTAATTTT	TTTGATTTTT	ACTAGAGACG	GGATCTTGCT	TTGCTGCTGA	29040
GGCTGGTCTT	gacx:tcctga	GCTCCAAAGA	tcctctcacc	TCCACCTCCC	AAAGTGTTAG	29100
AATTACAAGC	atgaacgact	GCCCGTGGTC	TCCAAAAAAA	GGACTGTTAC	GTGGATGTTC	29160
TACXJTTCCTG	TTCTCGTCTT	TTCTTTGTTA	ATTGTACAGT	TTGAGGGTGT	GTGTGCGTGT	29220
GCGCACGTGT	GTGTGTGCAG	TCTCCTGATT	TCATGTATTT	AATTGTTATT	ACCACCACCT	29280
CCATCTCTCA	TTCCTTCTTA	CCCTCACTGT	GTAAAGATAC	ATGTTGTTTT	ΤΛΑΑΤΤΤΤΑΤ	29340

-56CZ 297640 B6

GTATTTATAT	TTATTTATTT	GTATTTCTGA	GACAGAGTCT	CACTCTGTTG	CCCAGGCTAG	29400
TGGCATGATC	TCAGCTCACA	GCAACCTTTG	CCTCCTGGGT	TCAAGCGATT	CTCCTGCCTC	29460
AGCCTCCCGA	GTAGCTGAGA	TTACAGGCAC	ACACCACCAC	ACCCGGCTAG	TTTTGTTTTG	29520
AGACGGAGTC	TCGCTCTGTT	GCAGGCTGCA	GTGCAGTGGC	GTGATCCTGG	CTCACTGCAA	29580
CCTCTGCCTC	CTGGATTCAA	GCGATTCTCC	TGCCTCAGCC	TCCCAAGTAG	CTGGGATTAC	29640
AGGCGCCCAC	CGCCACACCT	GGCTAATTTT	TTATTGGTAG	TAGAGACGGG	GTTTCTCCAT	29700
GTTGACCAGA	CTGGTCTTGA	ACTCCCAACC	TCGGGTGATC	CACCCACCTG	GGCCTCCCAA	29760
AGTGCTGGGA	TGACAGGCGA	GGGCCACCGC	GTCCAGCCTT	CTTCTTCTTC	TTCTTTTTTT	29820
TTTTTTTAAG	ATGGAGTTTC	ACTCTGTTGC	CCAGGCTGGA	GTGCAGTGGT	GCAATCTCGG	29880
CTCCCTGCAA	CCTCCACCTC	CCAGGTTCAA	GAAATTCTTT	TGCCTCAGCC	TCCCGAGTAG	29940
CTGGGACTAC	AGGTGCCCGC	CACCACACCC	ACCTAATGTT	TGTATTTTTT	TGGTAGAGAC	30000
GGGGCTTCAC	CACATTGGCC	AGGCTGGTCT	TGAACTCCTC.	ACTTCAGATG	ATCCTCCTGC	30060
CTCAGCCTCC	CAGAGTGTTG	GGATTACAGG	CGTGAGCCAC	GGTGCCCGGC	CAGACGTCAT	30120
GTCTTAGGAA	ATCAGAAAGT	GGGTAGTTTC	CGCACTCTGA	GGAGAAAAAG	AGACGTCCGG	30180
CGAAGAGAAA	GGAGAGTGAA	AGGATGTCTC	CTCTTGTCTG	TAGCCTGTTC	TCAATCGTGA	.302 40
GTGAGCCAAT	TGCCAGAAAC	TGAGGGTGCT	TCATTTGGCC	AGGCAAGCTT	CTCAACAGAA	30300
TGTCTAAGTA	CTTGTTAATG	CTGAGAAGCT	CTCCAAGCTA	CTGCACTCCA	GCCTGGGTGA	30360
CAGAGCACGA	CCTTGTCTGA	AAACAATTAA	TTAATCAATT	AATTAATATA	ATGAAATCAT	30420
ACTGAACTC-A	GUAGACCATT	GGGGTGGGCA	GGGC T GGT X > T	TGGAAAGGAA	CATAAAATAT	30480
GGTGCAATGG	ACTTTGCTCC	AGTCTCCCT'2	UCCATCTCTT	CTCGCCAAGA	GTCTCTGGAG	30540
GGAGCATGGG	GAAGATGCTT	TGGGAATCTG	TAACTTCTTG	TCTTGTAAAC	AGAA.TATCTA	30600
AGTAATTGTT	AATGCTGAGA	AGTTATAGAT	7 TC:.AA#\GC*.	TTTCTCCAGG	CTACGGACAA	30660
GGGTCATGGG	TTACTCAGTG	TTACAGAAAG	AATGACATGG	AGATGTTTGT	TACATCTTAA	30720
GGAACCATGA	GGGGCCAGAG	TATTTTACTC	TAAGTGTAGA	TGGTACATTG	GCCACGCCTG	30780
TCCCAACACC	ACCAATGGTG	GCACCTAACT	TTTGTGTTTG	TGCCCCACAT	TTCTTCTTCT	30840
TTTCTGACGT	AAATGCAAGT	GATATTCCTT	cx;aaac-„atg	CTGCAGCAAG	AGGCCATCTG	10900
ACTACTAGTG	ATACCCTGTA	GCTCACCTAC	AGCAGCTCAC	TTGAAGCAGC	TCACCCJ>TAG	30960
CTCAGGTATA	GCTCACCTGC	AGCGGCTCAC	CTGTAGCTCA	CGTC.TAGCTC	ACTTGTAGCA	3 1020
GCTCACTGGT	AGCTCACCTG	CAGCAGCTCA	CCTGTACÍ.TC	ACCTGTACCT	CACCTGCAGC	31080
AGCTCACCTG	TAGCTCACCT	GTACGTGAGC	CACCGTACCC	GGCCAGCAAG	ACCCCATTTC	31140
ΤΛΑΑΑΤΛΛΛΤ	ACACAAAAAT	TAGCCGGACG	CGGTGGCGCG	TGTCTGTAGT	TGTAGCTACT	31200
CAGGAGGCTG	AGGTGGGAGG	ATTGCTGGAG	GCTGGGAGGT	AGAGGCTGCA	GTGAACCGTG	31260
ATCCAGCCAC	TGTACTCTAG	CCTGGATGAC	ATAGCAAAAC	CTTGTCTCAA	AAAACAAAAA	31320
CAAAAAACAA	AACAAAGAAA	CAaACAAAAA	ACCCACACAC	ACCGGAAAAC	AAAACAAAAA	31380

-57CZ 297640 B6

GCAAAAAGGA	AAGAAAAGAG	AGCCAGGTCC	CAAATATATA	TTTCCTTGGA	GAACCATTTG	31440
CAAAGAGCAC	ACTTAAGGCC	GGGCGCGGTG	GCTCACGCCT	GTCATCCCGG	CACTTTGGGA	31500
GGCCGAGGTG	GGTGGATCAC	GAGGTTGGGA	GATCGAGACC	ATCCTGGCCA	ACATGGCGAA	31560
ACCCCATCTC	TACTAAAAAT	ACAAAAAATC	AGCCAGGTGC	TGAGGCAGGT	GCCTGTAGTC	31620
CCAGCCACTC	AGGAGGCTGA	GGCAGGAGAA	TGGCATGAAC	CTGGGAGGTG	GAGGTTGCAG	31680
TGAGCCGAGÁ	TCGCGCCCCT	GCACTCCAGC	CTGGGCGACA	GAGCGAGACT	CCTTCTCAAA	31740
TAAATAAATA	AATAAATAAC	AAAGAGCAAA	CTTAAAATTG	TCTCAGAAAT	CCCACGGGAT	33800
ATTGGATCTC	CCTCATGCCT	ATCTGATGAC	ACTTTGAGTG	TCTGGGGCCC	CGTGCCTATT	31860
TTCTGGGGTT	CCCAGAAGCT	GCCGTTCTGA	AAGTGTGGCT	CTCGGGGACG	TGGCACAGGT	31920
GTGGATGTCT	GTTTTAAATG	TCAGGCGTTT	GGACGTTGAG	GAACGTGAGG	CTGAAGGTCG	31980
CCTTCGCCGA	CCCCCTGAGT	TTAGGGTCCT	GCCTTTTAAA	ATCTTCCCAG	CACTCTGTTG	32040
TTCACGCAAG	CGTCCCATCT	GTTTGGGTGG	CCGTGCCGTC	TGCATCTGTC	TCGAACCTTC	32100
ACAGCTTTGC	AGAATATCCT	GTTTCTCAAT	ACGGATGGAG	AAACACGAGA	CGCGTTTTCT	32160
GGGTTATTTT	AGCCGTCACG	GAGAACCCCA	GACTCATGTG	TGCTAATGAC	CTCATTAATG	32220
ATACTCTGAG	GCAGACAGCC	CTGCCTGATC	TTAACAACAT	ΤΤΤΤΤΆΑΑΤΤ	TCTTTTTTTG	32280
TTGTTGTTGT	TACAGCATCA	TTCATATAAC	GTAGGAAACC	GTGATCAGTA	GCTTTTAGGA	32340
TATTTGCAAC	AGGGTGTAAC	ADAAABD				32367

(2) Informace o sekvenci SEQ ID NO: 15:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 806 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOT“ (ix) RYSY:

(A) NÁZEV/KLÍČ: CDS (B) POZICE: 43..615

-58CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 15:

GTGTCCCCGG	AÍXTGAAAGA	TCGCAAAGAG	GATGCGAAAG	GGATGCAGGA	CGAAGGCCAG	60
ACCAAAATCA	ACXIAGAGGCG	AAGTCGGACC	AATTTCACCC	TGGAACAACT	CAATGAGGTG	120
GAGAGGCTTT	TTGACGAGAC	CCACTATCCC	GACGCCTTCA	TGCGAGAGGA	ACTGAGCCAG	180
CGACTGGGCC	TGTCGGAGGC	CCGAGTGCAG	GTTTGGTTTC	AAAATCGAAG	AGCTAAATGT	240
AGAAAACAAG	AAAATCAACT	CCATAAAGGT	GTTCTCATAG	GGGCCGCCAG	CCAGTTTGAA	300
GCTTGTAGAG	TCGCACCTTA	TGTCAACGTA	GGTGCTTTAA	GGATGCCATT	TCAGCAGGTT	360
CAGGCGCACX.	TGCAGCTGGA	CAGCGCTGTG	GCGCACGCGC	ACCACCACCT	GCATCCGCAC	420
CTGGCCGCGC	ACGCGCCCTA	CATGATGTTC	CCAGCACCGC	CCTTCGGACT	GCCGCTCGCC	480
ACGCTGGCCG	CGGATTCGGC	TTCCGCCGCC	TCGGTAGTGG	CGGCCGCAGC	AGCCGCCAAG	540
ACCACCAGCA	AGGACTCCAG	CATCGCCGAT	CTCAGACTGA	AAGCGAAAAA	GCACGCCGCA	600
GCCCTGGGTC	TGTGACVCCA	ACGCCAGCAC	CAATGTCGCG	CCTGTCCCGC	GGCACTCAGC	660
CTGCASNCCC	TNDDKANMCG	TTRCTYHTCM	ATTACACTTT	GGGACCYCGG	GDBAGVCCTT	720
TTNNAGACTT	YVATKGGSCW	CSCTGGBCCC	TBRKGAWAC	TTGSGHYCGR	GAACCGAKHT	780
GCCCABAYGA	GGACCRGTTT	GGAKDG				806

(2) Informace o sekvenci SEQ ID NO: 16:

(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 190 aminokyselin ίο (B) TYP: aminokyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid

-59CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 16:

Met 1

Glu

Asp

Glu Gly Gin 5

Thr

Lys

Ile

Lys 10

Gin Arg

Arg

Ser

Arg 15

Thr

Asn

Phe

Thr

Leu

Gj u

G1 n

Leu

Asn

Glu

Leu

Glu

Arg

Leu

Phe

Asp

G1 u

20

25

30

Thr

His

Tyr

1’ r. o

Asp

Ala

Phe

Mor.

Arq

Glu

Leu

Ser

Gin

Axg

Leu

3 5

40

45

Gly

Leu

Ser

Glu

Al a

Arg

Val

Gin

Val

Trp

Phe

Gin

Asn

Arg

Arq

AJ a

50

55

60

Lys

Cys

Arg

Lys

Gin

Glu

Asn

Gin

Leu

His

Lys

G1 y

Val

Leu

Ile

Gly

65

70

75

80

Ala

Al a

Se r

Gin

Phe

Glu

Ala

Cys

Arg

Val

Ala

Pro

Tyr

Val

Asn

Val

85

90

95

Gly

Ala

Leu

Axg

Met

Pro

Phe

Gin

Val

Gin

Al a

Gin

Leu

Gin

Leu

100

105

110

Asp

Ser

AJ a

Val

Ala

Hl 3

Ala

Hl 3

His

Leu

His

Pro

His

Leu

Ala

115

120

125

Ala

His

AJ a

Pro

Tyr

Met

Phe

Pro

Ala

Pro

Phe

Gly

Leu

Pro

110

135

140

Leu

Ala

Thr

Leu

Ala

Asp

Ser

Ala

Sec

Ala

Ser

Val

Ala

145

150

1S5

160

Al a

Ala

Al a

Ala

Lys

Thr

Ser

Lys

Asp

Ser

Ile

Ala

Asp

165

170

175

Leu

Arg

Leu

Lys

Ala

Lys

His

Ala

Leu

Gly

Leu

180

185

190

PATENTOVÉ NÁROKY

Claims

PATENTOVÉ NÁROKY

1. Molekula izolované nukleové kyseliny obsahující nukleotidovou sekvenci SHOX ET93 SEQ ID NO: 2 a nukleotidovou sekvenci vybranou ze skupiny sestávající z SHOX G310 - SEQ ID NO: 3, SHOX ET45 - SEQ ID NO: 4, SHOX G108 - SEQ ID NO: 5, SHOX Va - SEQ ID NO: 6 a SHOX Vb - SEQ ID NO: 7.
2. Molekula nukleové kyseliny podle nároku 1 obsahující nukleotidové sekvence SHOX ET93 - SEQ ID NO: 2, SHOX ET45 - SEQ ID NO: 4 a SHOX G108 - SEQ ID NO: 5.
3. Molekula nukleové kyseliny podle nároku 2 dále obsahující nukleotidovou sekvenci SHOX G310-SEQ IDNO: 3.
4. Molekula nukleové kyseliny podle nároku 3 dále obsahující nukleotidovou sekvenci SHOX Va-SEQ ID NO: 6.
5. Molekula nukleové kyseliny podle nároku 3 dále obsahující nukleotidovou sekvenci SHOX Vb-SEQ ID NO: 7.

-60CZ 297640 B6
6. Molekula izolované nukleové kyseliny kódující polypeptidy obsahující oblast homeoboxu z šedesáti aminokyselin mající aminokyselinovou sekvenci SEQ ID NO: 1 a dále obsahující nukleotidovou sekvenci SHOX ET93 - SEQ ID NO: 2 a nukleotidovou sekvenci SHOX ET45 SEQ ID NO: 4.
7. Molekula nukleové kyseliny podle nároku 6, která kóduje polypeptid mající N-koncové a/nebo C-koncové aminokyselinové prodloužení oblasti homeoboxu z šedesáti aminokyselin SEQ ID NO: 1 a mající délku 150 až 350 aminokyselin.
8. Molekula nukleové kyseliny podle nároku 4, která kóduje polypeptid mající aminokyselinovou sekvenci SEQ ID NO: 11.
9. Molekula nukleové kyseliny podle nároku 5, která kóduje polypeptid mající aminokyselinovou sekvenci SEQ ID NO: 13.
10. Molekula nukleové kyseliny podle kteréhokoliv z nároků 1 až 9, přičemž molekula nukleové kyseliny je molekula genomové nukleové kyseliny.
11. Molekula nukleové kyseliny podle kteréhokoliv z nároků 1 až 9, přičemž molekula nukleové kyseliny je cDNA.
12. Molekula nukleové kyseliny podle nároku 11 obsahující nukleotidovou sekvenci SHOXa SEQ ID NO: 10.
13. Molekula nukleové kyseliny podle nároku 11 obsahující nukleotidovou sekvenci SHOXb SEQ ID NO: 12.
14. Molekula izolované nukleové kyseliny sestávající z částečné nukleotidové sekvence genu SHOX-SEQ ID NO: 8.
15. Molekula izolované nukleové kyseliny sestávající z částečné nukleotidové sekvence genu SHOX-SEQ ID NO: 14.
16. Molekula izolované nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízené hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C s tím, že sekvence - SEQ ID NO: 17, která je popsána v práci M. Marra a kol., EMBL, databázový vstup MMA59929, a sekvence SEQ ID NO: 18, která je popsána v M. Marra a kol., EMBL, databázový vstup MMA3349, jsou vyloučeny.
17. Polypeptid mající aminokyselinovou sekvenci - SEQ ID NO: 11.
18. Polypeptid mající aminokyselinovou sekvenci - SEQ ID NO: 13.
19. Expresní vektor nebo plazmid obsahující molekulu nukleové kyseliny podle kteréhokoliv z nároků 1 až 16.
20. Buňka transformovaná expresním vektorem nebo plazmidem podle nároku 19.
21. Transgenní živočich jiný než člověk nebo živočich jiný než člověk s deaktivovaným genem transformovaný expresním vektorem nebo plazmidem podle nárok 19.

-61 CZ 297640 B6
22. Způsob identifikace nebo testování kandidátů farmaceutických činidel použitelných při léčbě vad vztahujících se k mutacím genu odpovídajícího za malou výšku postavy - SEQ ID NO: 8 nebo SEQ ID NO: 14, vyznačující se tím, že zahrnuje poskytnutí transformované buňky podle nároku 20 a stanovení změn fenotypu uvedených buněk nebo změn v produktech exprese uvedených buněk poté, co se uvedené buňky dostanou do kontaktu s uvedenými kandidáty farmaceutických činidel.
23. Použití molekuly nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekuly nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízené hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C jako primerů pro přípravu diagnostické sady pro identifikaci jednotlivců podezřelých z toho, že mají genetickou vadu v genu SHOX - SEQ ID NO: 8 nebo SEQ ID NO: 14.
24. Použití molekuly nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekuly nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízení hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C, jako primerů pro analýzu biologického vzorku izolovaného z lidského pacienta pro identifikaci jednotlivců podezřelých z toho, že mají genetickou vadu v genu SHOX - SEQ ID NO: 8 nebo SEQ ID NO: 14.
25. Použití molekuly nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekuly nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízení hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C, pro stanovení množství produktu exprese nebo sekvence z lidského genu SHOX v biologickém vzorku izolovaném z lidského pacienta pro identifikaci jednotlivců podezřelých z toho, že mají genetickou vadu v genu SHOX, přičemž tento gen SHOX má nukleotidovou sekvenci danou v SEQ ID NO: 8 nebo SEQ ID NO: 14.
26. Použití podle nároků 23, 24 nebo 25, ve kterém je molekula nukleové kyseliny vybrána ze skupiny sestávající z:

GCA CAG CCA ACC ACC TAG;

TGG AAA GGC ATC ATC CGT AAG;

ATT TCC AAT GGA AAG GCG TAA ATA AC (SPI);

ACG GCT ΊΤΤ GTA TCC AAG TCT ΤΊΤ G (SP2);

GCC CTG TGC CCT CCG CTC CC (SP3);

GGC TCT TCA CAT CTC TCT C1G CTT C (SP4);

CCA CAC TG A CAC CTG CTC CCT TTG (SP5);

CCC GCA GGT CCA GGC TCA GCT G (SP6);

CGC CTC CGC CGT TAC CGT CCT TG (ASP1);

CCC TGG AGC CGG CGC GCA AAG (ASP2);

CCC CGC CCC CGC CCC CGG (ASP3);

CIT CAG GTC CCC CCA GTC CCG (ASP4);

CTA GGG ATC TTC AGA GGA AGA AAA AG (ASP5); a

GCT GCG CGG CGG GTC AGA GCC CCA G (ASP6).

-62CZ 297640 B6
27. Způsob stanovení genetické vady v biologickém vzorku izolovaném z lidského pacienta, který je podezřelý z toho, že má genetickou vadu v genu SHOX, přičemž tento gen SHOX má nukleotidovou sekvenci danou v SEQ ID NO: 8 nebo SEQ ID NO: 14, vyznačující se tím, že se provádí na základě molekul RNA nebo DNA.
28. Způsob podle nároku 27, vyznačující se tím, že molekula nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekula nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za podmínek přísně řízené hybridizace je použita jako primer pro stanovení genetické vady v genu SHOX io - SEQ ID NO: 8 nebo SEQ ID NO: 14, přičemž podmínky přísně řízené hybridizace jsou následující: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPia 1 % SDS při 65 °C.