CZ297640B6 - Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití - Google Patents

Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití Download PDF

Info

Publication number
CZ297640B6
CZ297640B6 CZ0096699A CZ96699A CZ297640B6 CZ 297640 B6 CZ297640 B6 CZ 297640B6 CZ 0096699 A CZ0096699 A CZ 0096699A CZ 96699 A CZ96699 A CZ 96699A CZ 297640 B6 CZ297640 B6 CZ 297640B6
Authority
CZ
Czechia
Prior art keywords
seq
nucleic acid
acid molecule
shox
gene
Prior art date
Application number
CZ0096699A
Other languages
English (en)
Other versions
CZ96699A3 (cs
Inventor
Rappold-Hoerbrand@Gudrun
Rao@Ercole
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Publication of CZ96699A3 publication Critical patent/CZ96699A3/cs
Publication of CZ297640B6 publication Critical patent/CZ297640B6/cs

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P5/00Drugs for disorders of the endocrine system
    • A61P5/02Drugs for disorders of the endocrine system of the hypothalamic hormones, e.g. TRH, GnRH, CRH, GRH, somatostatin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P5/00Drugs for disorders of the endocrine system
    • A61P5/06Drugs for disorders of the endocrine system of the anterior pituitary hormones, e.g. TSH, ACTH, FSH, LH, PRL, GH
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biomedical Technology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Diabetes (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • General Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Endocrinology (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Obesity (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

Molekula izolované nukleové kyseliny obsahující nukleotidovou sekvenci SHOX ET93 - SEQ ID NO: 2 a nukleotidovou sekvenci vybranou ze skupiny sestávající z SHOX G310 - SEQ ID NO: 3, SHOX ET45 - SEQ IDNO: 4, SHOX G108 - SEQ ID NO: 5, SHOX Va - SEQ IDNO: 6 a SHOX Vb - SEQ ID NO: 7. cDNA odpovídajícítomuto genu se muže použít jako diagnostický nástroj pri další charakterizaci molekulární podstaty fenotypu s malou výškou postavy. Identifikace genového produktu genu poskytuje nový zpusob vývoje dokonalejší lécby malé výšky postavy.

Description

Molekula izolované nukleové kyseliny kódující polypeptidy a způsob jejího použití
Oblast techniky
Vynález se týká izolace, identifikace a charakterizace nově identifikovaných lidských genů, které odpovídají za vady lidského růstu, zvláště za malou výšku postavy nebo Turnérův syndrom. Dále se vynález týká diagnózy s terapie takových vad. Izolovaná genomová DNA nebo její fragmenty se mohou použít pro farmaceutické účely nebo jako diagnostické nástroje nebo činidla pro idenio tifikaci nebo charakterizaci genetických defektů, které se podílejí na uvedených vadách. Vynález dále popisuje lidské růstové proteiny (transkripční faktory A, B a C), které se exprimují po transkripci uvedené DNA na RNA nebo mRNA a které se mohou použít při terapii vad spojených s mutacemi v uvedených genech. Dále se popisují vhodné sekvence cDNA, které se mohou použít při přípravě rekombinantních proteinů vhodných pro léčbu takových vad. Předmětem 15 vynálezu jsou dále plazmidové vektory vhodné pro expresi DNA těchto genů a vhodné buňky, které obsahují takovou DNA. Dále se popisuji metody genetické léčby uvedených vad v oboru molekulární medicíny za použití expresního plazmidu připraveného inkorporací DNA downstream expresivního promotoru, který umožňuje expresi v savčí hostitelské buňce.
Dosavadní stav techniky
Růst je základní aspekt vývoje organizmu. Je regulovaný vysoce organizovaným a komplexním systémem. Výška postavy je multifaktorový rys, který je ovlivněn faktory prostředí a genetický25 mi faktory. Vývojové malformace, které zahrnují výšku postavy, jsou běžným jevem u lidí všech ras. V případě lidí je četnost výskytu 3 ze 100 a retardace růstu vede k malé velikosti postavy, za což ve většině případů odpovídají vrozené vady.
Turnérův syndrom je běžná chromozomální vada (Rosenfeld RG, Tesch L-G, Rodriguez-Rigau 30 LJ, McCauley E, Albertsson-Wikland K. Ach R, Cara J, Conte F, Halí, JG, Lippe G, Nagel TC,
Neely EK, Page DC, Ranke M, Saenger P, Watkins JM, Wilson DM (1994): Recommendation for diagnosis, treatment, and management of individuals with Turner syndrom. The Endocrinologist 4(5): 351-358) s četností výskytu 1:2 50 u živě narozených žen. Odhaduje se, že 1 až 2 % oplodnění u lidí má karyotyp 45,X a že až 99 % takových plodů nepřichází na svět v termínu 35 (Hal J.G., Gilchrist D.M. (1990): Turner syndrome and its variants. Pedriatr. Clin. North Am. 37:
obinson A (1990): Demography and prevalence of Turner syndrome. In: Turner Syndrome., edited by Rosenfield R.G., Grumbach M.NM., pp. 93-100, New York, Marcel Dekker). (J lidí s Turnérovým syndromem (nebo s Ullrich-Tumerovým syndromem) existuje podstatná klinická variabilita fenotypu (Ullrich, 1930; Turner, 1938). Malá výška postavy je konsistentní nález 40 a spolu s gonádovou dysgenezí se považuje za vedoucí symptom uvedených vad. Tumerový syndrom je skutečná muitifaktorová vada. Uvažuje se, že za embryonální letalitu, malou výšku postavy, gonodovou dysgenezí a charakteristické somatické rysy odpovídají monosomy genů, které jsou běžné u X a Y chromozomů. Ukazuje se, že pro normální vývoj člověka jsou nutné diploidy těchto homologních genů X-Y. Očekává se, že Turnérovy geny (nebo anti-Tumerovy 45 geny) se u žen exprimují jak z aktivního, tak z neaktivního chromozomu X nebo chromozomu Y, aby se zajistila správná dávka genového produktu. Haplo-nedostatečnost (nedostatečnost způsobená pouze jednou aktivní kopií) naznačuje mechanizmus vedoucí k onemocnění.
Dosud se objasnila řada mechanizmů, které vedou k malé výšce postavy. Nedostatečnost růsto50 vého hormonu a receptorů růstového hormonu, stejně jako vady skeletu se popisují jako příklady fenotypu s malou výškou postavy (Martial et al., (1979; Phillips et al., 1981; Leung et al., 1987; Goddard et al., 1995). Identifikovaly se mutace ve třech genech, které kódují receptor lidského fibroblastového růstového faktoru (FGFR 1-3) a způsobují řadu vad skeletu. Tylo vady zahrnují většinu forem trpasličího vzrůstu, achondroplázie (Shiang et al., 1994; Rousseau et al., 1994; 55 Muenke and Schell, 1995). Dobře známá a častá chromozomální vada (objevuje se u jedné z
- 1 CZ 297640 B6
2500 žen) Turnérův syndrom (45,X) je také spojena s malou výškou postavy. Všechny tyto důvody však odpovídají pouze za malou část pacientů s malou výškou postavy. Většina případů zatím zůstává nevysvětlena.
Věří se, že chromozomy X a Y nesou geny, které ovlivňují výšku postavy (Ogata T, Tyler-Smith C, Purvis-Smith S, Turner G. (1993): Chromosomal localisation of a gene(s) for Turner stigmata on Yp. J. Med. Genet. 30: 918-922). To se může u pacientů s abnormalitami pohlavních chromozomů odvodit ze vztahu genotyp-fenotyp. Cytogenetické studie dokazují, že delece konců krátkých ramen buď chromozomu X, nebo Y vedou u některých jedinců k malé výšce postavy (Zuffardi et al., 1982); Curry et al., 1984). Uvádí se více než 20 uspořádání chromozomu, které se spojují s delecemi konců chromozomu Xp a Yp a které nesou gen(y) odpovědné za malou výšku postavy, s pseudoautozomální oblastí (PARI) (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P„ Zuffardi O., Guilo S., Camerino G., (1989): Contiquous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome. Proč. Nati. Acad. Sci USA 86: 10001 — 10005.; Schaefer L., Ferrero G.B., Grillo A., Bassi M.T. Roth E.J. Wapenaar M.C., Van Ommen -J.B., Mohandas T.K., Rocchi M.. Zoghbi H.Y. Ballabio A. (1993): A high resolution deletion map of human chromosome Xp22. Nátuře genetics 4: 272-279). Pozice těchto genů se zúžila na distální DNA o velikosti 700 kb oblasti PARI, kterou lemuje markér DXYS15 (Ogata T., Goodfellow, P., Petit C., Aya M., Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal do DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834; Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629).
Regulace růstu u savců je organizována jako komplexní systém. Je možné, že vysoce organizovaným způsobem spolu reaguje více genů (proteinů), které podporují růst. Jeden z těchto genů, který odpovídá za výšku postavy, se zmapoval až do pseudoautozomální oblasti PARI (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P., Zuffardi O., Guilo S., Camerio G., (1989): Contiguous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome. Proč. Natí. Acad. Sci USA 86: 10001-10005), což je oblast, o které se ví, že je volně zaměnitelná mezi chromozomy X a Y (Rappold G.A. (1993): The pseudoautosomal region of the human sex chromosomes. Hum. Genet. 92: 315-324). Celá oblast RAPI je přibližně 2700 kb velká.
U pacientů s delecí se definovala kritická oblast ovlivňující výšku postavy. K malé výšce postavy dochází v případě, když se deletuje celá oblast o velikosti 700 kb nebo když je specifický gen v této kritické oblasti přítomen v haploidním stavu nebo když je přerušen nebo mutován (jako je případ idiotypické malé výšky postavy nebo Turnérův syndrom). Frekvence výskytu Turnérova syndromu ve světě je jedna z 2500 žen; četnost výskytu tohoto druhu idiopatické malé výšky postavy se odhaduje na 1 případ ze 4000 až 5000 osob. Ženám s Turnérovým syndromem a některým jednotlivcům s malou výškou postavy se obvykle po několik let až po několik desítek let aplikuje růstový hormon (GH), ačkoli je známo, že jejich hladina růstového hormonu v těle je normální a nedostatečnost GH zde není problémem. Léčba takových pacientů je velmi nákladná (odhaduje se přibližně na 30 000 USD ročně). Proto je nutné získat způsob rozlišení pacientů malého vzrůstu, kteří mají genetický defekt a pacienti, který nevykazují genetický defekt uvedeného genu. U pacientů s genetickým defektem tohoto genu - buď s úplnou delecí genu (jako je v případě Turnérova syndromu), nebo s bodovou mutací (jako je tomu u idiopatické malé výšky postavy)-je možné aplikovat alternativní léčbu bez lidského růstového hormonu.
Korelace genotyp/fenotyp podporují existenci růstového genu v proximální části Yq a v distální části Yp. Malá výška postavy se také objevuje u jedinců s terminálními delecemi Xp. Proběhlo rozsáhlé vyhledávání pacientů s částečnými monosomiemi pseudoautozomální oblasti. Na základě korelací genotyp-fenotyp se stanovila minimální běžná delece oblasti DNA o velikosti 700 kb (Ogata T., Matsuo N., (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of ciinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995); Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834). Zjistilo se, že uvedená oblast leží mezi genetickými markéry DXYS20 (3cosPP) a DXYS15 (113D) a u všech genů, které aspirují na řízení růstu, a leží v oblasti PARI (například receptor hemopoietického růstového faktoru; CSF2RA) (Gough N.M., Gearing D.P., Nicola N.A., Baker E., Pritchard M., Callen D.F., Sutherland G.R. (1990). Localization of the human GM-CSF receptor gene to the X-Aby pseudoautosomal region. Nátuře 345: 734736), se odstranily na základě jejich fyzikální pozice (Rappold G. A., Wilson T.A., Henke A., Gough N.M. (1992): Arrangment and localization of the human GM-CSF receptor achain gene CSF2RA within the X-Aby pseudoautosomal region. Genomics 14: 455-461). Geny se nacházely v deleční oblasti o velikosti 700 kb PARI oblasti o velikosti 2700 kb. Nedávno se objevily u jednotlivců s malým vzrůstem delece pseudoautozomální oblasti (PARI) pohlavních chromozomů a následně staké definovala minimální běžný oblast delece o velikosti 700 kb. Na základě analýzy DNA Southemovým přenosem u pacientů AK a SS za použití odlišných pseudoautozomálních markérů se identifikovala Xp terminální delece přibližně 700 kb od DXYS15 (113D) (Ogata T., Matsuo N., (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of ciinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P., Petit C., Aya M. Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: logalization of a growth gene(s) in the pseudoautosomoal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S., (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834).
Podstata vynálezu
Vynález se týká molekuly izolované nukleové kyseliny obsahující nukleotidovou sekvenci SHOX ET93 - SEQ ID NO: 2 a nukleotidovou sekvenci vybranou ze skupiny sestávající z SHOX G310 - SEQ ID NO: 3, SHOX ET45 - SEQ ID NO: 4, SHOX G108 - SEQ ID NO: 5, SHOX Va - SEQ ID NO: 6 a SHOX Vb - SEQ ID NO: 7.
Oblast genu odpovídající za malý vzrůst postavy se identifikovala jako oblast o velikosti přibližně 500 kb, s výhodou o velikosti přibližně 170 kb v PARI oblasti chromozomů X a Y. V této oblasti se identifikovaly tři geny jako kandidáti, kteří odpovídají za malý vzrůst. Tyto geny se označily SHOX (také jako SHOX93 nebo HOX93) (SHOX znamená gen obsahující homeobox malého vzrůstu), pET92 a SHOT (gen nesoucí homeobox podobný SHOX na chromozomu 3). Zvláště významný je gen SHOX, který má dvě oddělená místa sestřihu, což vede ke vzniku dvou variací (SHOXa a b). Během předchozích výzkumů se analyzovala podstatná část nukleotidové sekvence genu malého vzrůstu (SEQ ID NO: 8). Mohou se předpovědět a identifikovat exony nebo jejich části (například exon I [G310J; exon II [ET93J; exon IV [G108]; pET92). Získané informace o sekvenci se pak mohou použít pro navržení vhodných primerů nebo nukleotidových sond, které hybridizují s částmi genu SHOX nebo jeho fragmenty. Gen SHOX se pak může izolovat běžnými metodami. Na základě další analýzy sekvence DNA genů zodpovědných za malý vzrůst se izoluje nukleotidová sekvence exonu I a V (uvedeno na obrázku č. 1 až 2). Gen SHOX obsahuje homeobox (SEQ ID NO: 1) o velikosti přibližně 180 bp (obrázek č. 2 a obrázek č. 3). Začíná nukleotid, který kóduje aminokyselinu v pozici 117 (Q), končí nukleotidem kódujícím
- J CZ 297640 B6 aminokyselinu v pozici 176 (E), to znamená od CAG (440) do GAG (619). U pacientů z Německa (Al) s malou výškou postavy a u pacientů Japonska, kde se testovalo 250 jednotlivců s idiopatickým malým vzrůstem, se identifikoval homeobox jako sekvence homeobox-pEP93 (SHOX) a zjistily se dvě bodové mutace. Obě bodové mutace se našly ve stejné pozici a vedou ke zkrácení proteinu v pozici aminokyseliny 195. To naznačuje, že zde může existovat tzv. horké místo. Na základě skutečnosti, že obě mutace, které vedou ke zkrácení proteinu, se vyskytují ve stejné pozici, je pravděpodobné, že putativní horké místo rekombinace existuje v exonu 4(G108). Primery specifické pro exon jsou například GCA CAG CCA ACC ACC TAG (forward) nebo TGG AA GGC ATG ATC CGT AAG (reverzní). Shora uvedený nový gen obsahující homeobox, SHOX, který se nachází v intervalu 170 kb, je alternativně sestřižen a dává vznik dvěma proteinům s odlišnými funkcemi. Při demonstraci skutečnosti, že malá výška postavy je způsobena mutacemi v SHOX, se použila analýza mutace a sekvenování DNA.
Identifikace a klonování kritické oblasti malého vzrůstu podle vynálezu se uskutečnila následujícím způsobem. U 15 jednotlivců s částečnými monosomy v pseudoautozomální oblasti (PARI) se provedla rozsáhlá fyzikální mapovací studie. Korelací výšky těchto jedinců s delečními body se definovala kritická oblast malého vzrůstu (SS) o přibližné velikosti 700 kb. tato oblast se následně klonovala jako překiývací se kosmidový kontig za použití kvasinkových umělých chromozomů (YAC) z PARI (Ried K., Mertz A., Nagaraja R., Trusnich M. Riley J., Anand R., Page D., Lehrach H., Elloiso J., Rappold G.A. (1995): Characterization of a yeast artificial chromosome conting spanning the pseudoautosomal region. Genomics 29: 787-792) a pomocí metody „chodícího kosmidu“ (cosmid walking). Za účelem vyhledání genů odpovědných za SS v tomto intervalu se na přibližně 600 kb velkou oblast mezi distálním koncem kosmidu 56G10 a proximálním koncem 51 Dl 1 aplikovala řada metod. Za použití sekvence cDNA, trapování exonu a GpG klonování se identifikovaly dva nové geny.
Pozice kritického intervalu malého vzrůstu se zúžila na menší interval DNA o velikosti 170 kb tím, že se charakterizovaly tři další jedinci (GA, AT a RY), kteří vykazují malý vzrůst postavy. Za účelem přesného stanovení pozice bodu přerušení u těchto jedinců se provedla na chromozomech v metafázi za použité kosmidů vhodných pro kontig fluorescenční hybridizace in šitu (F1SH). Pacient GA, který vykazuje terminální deleci a normální výšku vzrůstu, definuje distální hranici kritické oblasti (bod přerušení se nachází na kosmidu 110E3) a pacient AT vykazují inverzi X chromozomu a normální výšku vzrůstu definoval proximální hranici (bod přerušení se nachází na kosmidu 34F5). Bod přerušení chromozomu Y u pacienta RY, který vykazuje terminální deleci a malý vzrůst, se také nachází na kosmidu 34F5, což naznačuje, že tato oblast obsahuje sekvence s predispozicí k přestavění chromozomů.
Celá oblast ohraničená Xp/Yp se klonovala jako sada přesahujících kosmidů. Ke studiu šesti pacientů s přestavěným chromozomem X, kdy tři z nich jsou normálního vzrůstu a tři mají malou výšku vzrůstu, se použila fluorescenční hybridizace in sítu (FISH) s kosmidy s této oblasti. Korelace genotypu fenotypu zúžily kritický interval pro malý vzrůst na 270 kb DNA nebo na dokonce menší interval, jako je 170 kb, který obsahuje gen nebo geny důležité pro růst člověka. Tento interval pokrývá minimálně šest až osm kosmidů a jsou nyní dostupné pro hybridizaci FISH interfáze a metafáze, která je dostupný nástroj pro diagnózu pacientů s idiopatickým malým vzrůstem postavy.
Skutečnost, že cílový gen vede k vadám růstu u lidí (např. oblast malého vzrůstu), nebyla dříve známá. Biologická a klinická asociace pacientů s uvedenou deleci vysvětluje funkci uvedeného genu. V této studii se použila fluorescenční in šitu hybridizace (FISH) za účelem testování metafáze a interfáze jádra lymfocyty u šesti pacientů. Cílem bylo testovat u všech přesahujících kosmidů jejich použitelnost jako sondy pro FISH hybridizaci a stanovit oblasti porušení genu u všech čtyř případů, a tímto způsobem stanovit minimální kritickou oblast genu malého vzrůstu.
Duplikace nebo delece genomové DNA se může uskutečnit kvantitativní PCR nebo odhadem dávky na Southernových blotech nebo použitím RFLP.
-4CZ 297640 B6
Zvláště vhodnou metodou pro přesné rozlišení mezi jednou a zdvojenou dávkou markérů je hybridizace FISH, přičemž její klinická aplikace je současnosti rutinní záležitostí. Zatímco při FISH hybridizaci interfáze se může zhodnotit absence nebo přítomnost molekulového markéru, hybridizace FISH metafáze chromozomů může poskytnou třemi-kvantitativní stanovení delece uvnitř kosmidu. Uvedeným způsobem se může stanovit delece o velikosti přibližně 10 kb (což odpovídá 25 % redukci signálu). Zvláště je důležité, že prakticky všechny geny onemocnění na lidském X chromosomu jsou spojeny s menšími a většími delecemi v rozmezí od několika kilobazí do několika megabází DNA (Nelson, D. L., Ballabio A., Cremers F., Monaco A.P., Schlessinger D., (1995). -Report of the sixth intemational workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342).
Vynález dále popisuje sekvence DNA nebo jejich fragmenty, které jsou části genů odpovědných za lidských růst (nebo v případě defektu v těchto genech odpovídají za malý vzrůst). Identifikovaly se tři geny odpovědné za lidský růst. Jsou to SHOX, pET92 a SHOT). Sekvence DNA nebo fragmenty těchto genů stejně jako sekvence DNA těchto genů v plné délce se mohou transformovat do vhodného vektoru a mohou se dále transfekovat do buněk. Když se takové vektory zavedou do buněk vhodným způsobem, jako jsou přítomny u zdravých jedinců, je možné uvedeným způsobem léčit onemocnění spojené s malým vzrůstem, to znamená například Turnérův syndrom. Onemocnění spojené s malým vzrůstem se může léčit odstraněním nebo mutací růstových genů odpovědných za malý vzrůst. Je také možné stimulovat geny, které kompenzují působení genů odpovědných za malou výšku postavy, to znamená inzercí sekvencí DNA před, za nebo do růstových genů/genů odpovídajících za malou výšku za účelem zvýšit expresi zdravých alel. Uvedenými modifikacemi genů se růstové geny/geny odpovídajících za malou výšku aktivují nebo deaktivují. To se může uskutečnit inzercí sekvencí DNA do vhodných míst, které jsou v genu nebo blízko genu umístěny tak, že tyto inzerované sekvence DNA interferují s růstovými geny/geny odpovídajícími za malou výšku a tak aktivují nebo brání jejich transkripci. Je také možné před růstové geny začlenit regulační element (například promotorovou sekvenci), aby se geny stimulovaly a staly se aktivní. Dále je možné stimulovat promotorovou sekvenci za účelem nadměrné exprese - v případě Turnérova syndromu-správně fungujících alel a tak kompenzovat chybějící alely. Modifikace genů se může obecně dosáhnout inzerci exogenních sekvencí DNA do růstového genu/genu odpovídajícího za malý vzrůst prostřednictvím homologní rekombinace.
Sekvence DNA podle vynálezu se mohou také použít k transformaci uvedených sekvencí do zvířat, jako jsou savci, prostřednictvím vhodného vektorového systému. Tyto transgenní zvířata se pak mohou použít pro zkoumání in vivo při testování a identifikaci farmaceutických činidel, která jsou použitelná při léčbě onemocnění spojených s malým vzrůstem. Jestliže zvířata pozitivně reagují na aplikaci sloučeniny nebo činidla, pak uvedené činidlo nebo sloučenina nebo jejich deriváty jsou vhodná jako farmaceutická činidla. Sekvence DNA podle vynálezu se mohou také využívat v genetických experimentech za účelem nalezení způsobů, jak kompenzovat ztráty genů odpovědných za malý vzrůst postavy.
Dále vynález popisuje sekvence DNA, které se mohou využít při transformaci buněk. Tyto buňky se mohou použít k identifikaci farmaceutických činidel, jenž se mohou použít při léčbě onemocnění spojených s malou výškou postavy nebo k testování takových látek nebo knihovny látek. Ve vhodném testovacím systému se mohou identifikovat změny fenotypu nebo změny expresivniho paternu těchto buněk, což umožňuje identifikaci činidla vhodného pro přípravu léků.
Sekvence DNA podle vynálezu se také mohou použít při tvorbě vhodných primerů, které za přísných podmínek hybridizují se segmenty genů odpovídajících za malý vzrůst nebo s jejich fragmenty. Mohou se konstruovat vhodné sekvence primerů, které se používají při diagnóze lidí, které mají genetický defekt způsobující malý vzrůst. Proto je nutné poznamenat, že dvě mutace nalezené v identické pozici naznačují, že existuje mutační horké místo.
-5 CZ 297640 B6
Sekvence DNA podle vynálezu zahrnují i takové sekvence, které se degenerovaly na specifické sekvence na základě degenerace genetického kódu nebo které hybridizují za přísných podmínek se specificky danými sekvencemi.
Vynález zdůrazňuje zvláště následující rysy:
a) Molekulu izolované nukleotidové kyseliny kódující polypeptidy obsahující oblast homeoboxu šedesáti aminokyselin, které mají aminokyselinovou sekvenci SEQ ID NO: 1 a vykazují regulující aktivitu lidského růstu.
b) Molekulu izolované DNA obsahující nukleotidovou sekvenci, jak je uvedeno na obrázku č. 2, 3 nebo 4 a zvláště, jak je uvedeno v SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15:
c) Molekuly DNA podle odstavce c) jsou schopny hybridizovat s molekulami DNA podle odst. 2 při teplotě 60 až 70 °C a v přítomnosti roztoku standardního pufru.
e) Molekuly DNA obsahují nukleotidové sekvence, které vykazují 70 % nebo vyšší homologii s nukleotidovou sekvencí SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15 a kódují polypeptid, který má regulační aktivitu lidského růstu.
f) Lidské růstové proteiny mají aminokyselinovou sekvenci SEQ ID NO: 11,13 nebo 16 nebo jejich funkční fragment.
g) Protilátky získané při imunizaci zvířat lidskými růstovými proteiny podle odst. f) nebo jejich antigenní varianty.
h) Farmaceutické kompozice obsahující lidské růstové proteiny nebo jejich funkční fragmenty pro léčbu vad způsobených genetickými mutacemi lidského růstového genu.
i) Způsob testování látky účinné při léčbě vad zmiňovaných shora v textu podle odst. h) zahrnující detekci mediátorové RNA hybridizující s libovolnými molekulami DNA popsanými v odstavcích a) až e), přičemž se měří zesílení exprese molekuly DNA jako odezvy na léčbu hostitelské buňky substitucí.
j) Expresivní vektor nebo plazmid obsahující libovolné molekuly nukleové kyseliny popsané v odstavcích a) až e), které umožňují, aby molekuly DNA se exprimovaly v savčích buňkách.
k) Způsob stanovení genu nebo genů v biologických vzorcích tkání nebo tělních tekutin odpovědných za malý vzrůst.
V případě metody popsané shora v textu v odstavci k) se pro detekci specifických nukleotidových sekvencí s výhodou používají nukleotidové amplifikační metody PCR, které jsou dobře známy v oboru a popisují se například v publikacích Mullis et al., 1986, Cold Spring Harbor Symposium Quant. Biol. 51, 263-273 a Saiki et al., Science 239, 487^491. Stanovené nukleotidové sekvence odpovídají za malý vzrůst jsou hlavně ty, které jsou reprezentovány sekvencemi SEQ ID NO: 2 až SEQ ID NO: 7.
V principu všech oligonukleotidové primery a sondy vhodné pro amplifikaci a detekci genetického defektu, který odpovídá za poškození lidského růstu v biologických vzorcích, jsou vhodné pro amplifikaci cílové sekvence spojované s malým vzrůstem. V tabulce č. 1 jsou uvedeny vhodný pár primerů specifický pro exon podle vynálezu. Následuje vhodná detekce, přičemž se například provádí radioaktivní nebo jiné značení.
-6CZ 297640 B6
Tabulka č. 1
exon Sense primer Antisense primer Produkt (bp) Ta (’C)
5'-I(G310) SPI ASP1 194 58
3'-I (G310) SP2 ASP2 295 58
II(ET93) SP3 ASP3 262 76/72/68
III(ET45) SP4 ASP4 120 65
IV(G108) SP5 ASP5 154 62
Va(SHOXa) SP6 ASP6 265 61
Vysvětlení zkratek u primerů:
SP 1: ATTTCCAATGGAAAGGCGTAAATAAC
SP 2: ACGGCTTTTGTATCCAAGTCTTTTG
SP 3: GCCCTGTGCCCTCCGCTCCC
SP 4: GGCTCTTCACATCTCTCTCTGCTTC
SP 5: CCACACATGACACCTGCTCCCTTTG
SP 6: CCCGCAGGTCCAGGCTAGCTG
ASP1: CGCCTCCGCCGTTACCGTCCTTG
ASP2: CCCTGGAGCCGGCGCGCAAAG
ASP3: CCCCGCCCCCGCCCCCGG
ASP4: CTTCAGGTCCCCCCAGTCCCG
ASP5: CTAGGGATCTTCAGAGGAAGAAAAAG
ASP6: GCTGCGCGGCGGGTCAGAGCCCCAG
Jako targetová DNA může také sloužit jednořetězcová RNA. Metody zpětné transkribce RNA a cDNA jsou dobře známy v oboru a popisuje je Sambrook et al., Molecular Cloning“ A Laboratory Manual, New York, Cold Spring Harbor Laboratory 1989. V jiném případě preferované metody reverzní transkripce využívají termostabilní DNA polymerázy, které vykazují RT aktivitu.
Shora popsaná metoda se může použít při selekci těch osob ze skupiny lidí, jejichž malý vzrůst postavy se spojuje s genetickým defektem, což umožňuje specifičtější léčbu.
Vynález dále popisuje transkripční faktory A, B a C, které se mohou použít jako farmaceutická činidla. Tyto transkripční faktory iniciují stále neznámou kaskádu biologických účinků na molekulární úrovni, které se spojují s lidským růstem. Tyto proteiny nebo jejich funkční fragmenty mají mitogenní účinek na různé buňky. Zvláště mají osteogenní účinek. Mohou se použít při léčbě onemocnění kostí, jako je například osteoporóza, a zvláště všech onemocnění spojených s poškozením regulace vápníku v kostech.
Termín „izolovaný“ znamená původní derivaci molekuly DNA klonováním. Vynález se týká jak přirozeně se vyskytujících sekvencí tak i synteticky připravených.
Molekuly DNA podle vynálezu se mohou použít ve formách genové terapie, která zahrnuje 5 použití expresivních plazmidů připravených inkorporací vhodné sekvence DNA podle vynálezu downstream od expresivního promotoru, který ovlivňuje expresi v savčí hostitelské buňce. Vhodné hostitelské buňky jsou prokaryontní a eukaryontní buňky. Prokaryontní hostitelské buňky jsou například E. coli, Bacillus subtilis a podobně. Prostřednictvím transfekce hostitelských buněk replikony, které pocházejí z druhů adaptovatelných na hostitele, to jsou plazmidové vektory obsa10 hující počáteční bod replikace a regulační sekvence, se mohou uvedené hostitelské buňky transfekovat požadovaným genem nebo cDNA. Takové vektory jsou s výhodou ty, které mají sekvenci, jenž vybaví transfekované buňky vlastnostmi (fenotypem), na jejichž základě se mohou selektovat. V typickém případě se používají jako hostitele bakterie E. coli kmen K12a, z vektorů se používá buď pBK322, nebo plazmidy pUC. Příklady vhodných promotorů v případě hostitelů 15 E. coli jsou promotor trp, lac promotor nebo lpp promotor. Jestliže je to nutné, sekrece expresivního produktu skrz buněčnou membránu se může ovlivnit spojením sekvence DNA kódující sekvenci signálního peptidu s 5' upstream částí genu. Eukaryontní hostitelské buňky zahrnují buňky získané z obratlovců nebo kvasinek, atd. Jako hostitelské buňky obratlovců se mohou použít buď COS (Cell, 1981, 23: 175-182) nebo buňky CHO. Aby došlo k expresi mohou se 20 s výhodou použít promotory, které jsou umístěny 5'upstream genu a mají místa sestřihu RNA, polyadenylační a transkripční terminační sekvence.
Při léčbě vad způsobených mutacemi lidských růstových genů se mohou použít jako činidla podporující růst transkripční faktory A, Ba C podle vynálezu. Na základě polymorfizmu, který je 25 znám u eukaryontních genů, se může substituovat jedna nebo více aminokyselin. Jedna nebo více aminokyselin v polypeptidech může být deletována nebo začleněna do jednoho nebo více míst aminokyselinové sekvence polypeptidů SEQ ID NO: 11, 13 nebo 16. Takové polypeptidy jsou nazývány ekvivalentní polypeptidy, pokud vykazují biologicky aktivitu nemodifikovaného polypeptidu, jenž zůstává v podstatě beze změn.
Přehled obrázků na výkresech
Na obrázku č. 1 je zobrazena genetická mapa genu SHOX, který zahrnuje pět exonů, které se 35 označily následujícím způsobem: exon I: G310; exon 2: ET93; exon III: ET45; exon IV: G108; a exony Va a Vb, přičemž exony Va a Vb vedou ke vzniku dvou různých míst sestřihu genu SHOX. Exon II a III obsahuje homeobox o velikosti 180 nukleotidů.
Na obrázcích č. 2 a 3 jsou nukleotidy a předpovězené aminokyselinové sekvence SHOX 40 a SHOXb.
SHOXa: Předpovězený začátek translace začíná nukleotidem 92, první v rámci je stop kodon (TGA) - nukleotidy 968 - 970, přičemž vzniká otevřený čtecí rámec velikosti 876 bp, který kóduje předpovězený protein tvořený 292 aminokyselinami (označený jako transkripční faktor A 45 nebo protein SHOX). V rámci je 5' stop kodon v pozici nukleotidu 4, počáteční kodon a předpovězený terminační stop kodon znázorněný tučným písmem. Homeobox je ohraničen boxem (začínající aminokyselinou v pozici 117 (Q) až 176 (E), to v nukleotidové sekvenci odpovídá CAG až GAG). Pozice intronů je označený šipkami. Dva putativní polyadenylační signály v 3' nepředkládané oblasti jsou podtrženy.
SHOXb: Otevřený čtecí rámec o velikosti 876 bp se nachází od A v prvním metioninu nukleotidu 92 do terminačního kodonu v rámci v pozici 767 - 769, což tvoří otevřený čtecí rámec o velikosti 675 bp, který kóduje předpovězený protein o velikosti 225 aminokyselin (transkripční faktor B nebo protein SHOXb). Pozice intronů jsou označeny šipkami. Exony I až IV jsou identické
-8CZ 297640 B6 s SHOXa, exon V je specifický pro SHOXb. Putativní polyadenylační signál v 3' nepředkládané oblasti je podtržen.
Na obrázku č. 4 je nukleotidová sekvence a předpovězená aminokyselinová sekvence SHOT. Předpovězený počátek translace začíná v pozici nukleotidu 43, první v rámci je terminační kodon (TGA) - pozice nukleotidů 613-615, přičemž vzniká otevřený čtecí rámec o velikosti 573 bp, který kóduje předpovězený protein tvořený 190 aminokyselinami (označený jako transkripční faktor C nebo protein SHOT). Homeobox je označen boxem (začínající aminokyselinou v pozici 11 (Q) až 70 (E), to v nukleotidové sekvenci odpovídá CAG až GAG). Pozice intronů je označená šipkami. Dva putativní polyadenylační signály v 3' nepřekládané oblasti jsou podtrženy.
Na obrázku č. 5 je uvedena organizace exon/intron lidského genu SHOX a pozice v nukleotidové sekvenci.
Popis sekvencí SEQ ID:
SEQ ID NO. 1: předkládaná aminokyselinová sekvence oblasti homeobox (180 bp)
SEQ ID NO. 2: exon Π (ET93) genu SHOX
SEQ ID NO. 3: exon 1 (G310) genu SHOX
SEQ ID NO. 4: exon III (ET45) genu SHOX
SEQ ID NO. 5: exon IV (G108) genu SHOX
SEQ ID NO. 6: exon Va genu SHOX
SEQ ID NO. 7: exon Vb genu SHOX
SEQ ID NO. 8: předchozí nukleotidová sekvence genu SHOX
SEQ ID NO. 9: gen ET92
SEQ ID NO. 10: sekvence SHOXa (také uvedeno na obrázku č. 2)
SEQ ID NO. 11: transkripční faktor A (také uvedeno na obrázku č. 2)
SEQ ID NO. 12: sekvence SHOXb (také uvedeno na obrázku č. 3)
SEQ ID NO. 13: transkripční faktor B (také uvedeno na obrázku č. 3)
SEQ ID NO. 14: gen SHOX
SEQ ID NO. 15: sekvence SHOT (také uvedeno na obrázku č. 4)
SEQ ID NO. 16: transkripční faktor C (také uvedeno na obrázku č.4).
Příklady provedení vynálezu
Příklad 1: Pacienti
Všech šest studovaných pacientů vykazuje de novo odchylky na pohlavním chromozomu.
Pacient s označením CC je dívka s karyotypem 45,X/46,X psu dic (X) (Xqter ->Xp22.3:;Xp22.3->Xqter). Při posledním testuji bylo 6 1/2 roku, její výška byl 114 cm (25 až 50 percentil). Výška postavy její matky je 155 cm, otec nebyl zařazen do analýzy. Detailněji je případ popsán v publikaci Henke A., Wapenaar M„ van Ommen G-J. Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear growth. Am. J. Hum. Genet. 49: 811-819.
-9CZ 297640 B6
Pacient s označením GA je dívka s karyotypem 46,X der X (3pter—>3p23::Xp23.3—>Xpter). Při posledním testu jí bylo 17 let a zjistila se normální výška (159 cm). Výška její matky je 160 cm, její otec měří 182 cm. Detailněji se pacientka popisuje v publikaci Kulharya A.S., Roop H., Kukolich M.K., Nachtman R.G., Belmont J. W., Garcia-Heras J., (1995): Mild phenotypic effects of a de novo deletion Xpter—>Xp22.3 a duplication 3pter—>3p23. Am. J. Med. Genet. 56: 16-1.
Pacient s označením SS je dívka s karyotypem 46,X rea (X) (Xpter->Xp26:.Xp22.3->Xp26). V dedenácti letech její výška byla pod 3 percentil křivky růstu japonských dívek.; její předpovězená výška v dospělosti (148,5 cm) leží pod její cílovou výškou (163 cm) a cílové rozmezí je (155 až 191cm). Detailněji je případ popsán v publikaci Ogata T., Goodfellow P., petit C., Aya M., Matsuo N. (1992): Short Statute in a girl with a terminál xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455—459.
Pacient z označením AK. je dívka s karyotypem 46,X rea (X) (Xqter->Xp22.3::Xp22.3-»Xp21.3). Ve 13-ti letech její výška je pod 2 percentil křivky růstu japonských děvčat; její předpovídaná výška v dospělosti (142,8cm) je pod její cílovou výškou (155,5 cm) a cílové rozmezí je (147,5 až 163,5). Detailněji se případ popisuje v publikaci Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s): J. Med. Genet. 32: 831-834. Pacient označený RY má karyotyp 46,X,r(Y)/46,Xdic r(Y)/45,X[95:3:2], jak se zjistilo testem 100 lymfocytů; V 16-ti letech je její výška 148 cm; jeho tři bratři dosáhly normální výšky 170 cm (bratr 1,16 let), 164 (bratr 2, 9 let) a 128 cm (bratr 3, 9 let). Růstová retardace tohoto pacienta je tak silná, že by měla být kompatibilní s další delecí lokusu GCY na Yq.
Pacient s označením AT je chlapec s ataxii a inv(X); v sedmi letech dosahuje normální výšky 116 cm, výška rodičů je 156 cm a 190 cm.
Pacienti pro analýzu mutací
U 250 jednotlivců s idiopatickým malým vzrůstem postavy se vyšetřovaly mutace genu SHOXa. Pacienti se vybraly podle následujících kriterií: výška chronologického věku byla pod 3 centil národního výškového standardu mínus 2 standardní odchylky (SDS); nebylo známé žádné kauzativní onemocnění zvláště: normální váha (délka) v prenatálním stavu, normální tělesné proporce, žádné chronické onemocnění, normální příjem potravy, žádné psychiatrické obtíže, žádné dysplázie skeletu, žádná nedostatečnost růstového hormonu nebo hormonů štítné žlázy.
Rodina A:
Případy 1 a 2 jsou děti malého vzrůstu německé nepokrevné rodiny. Chlapec (případ 1) se narodil v 38 týdnu těhotenství císařským řezem. Porodní váha je 2 660 g, porodní délka byla 47 cm. Vyvíjel se normálně s výjimkou subnormálního růstu. Při schůzce ve věku 6,4 roku byl proporcionálně malý (106,8 cm, - 2, SDS) a obézní 22,7 kg) ale jinak normální. Stáří jeho kostí nebylo retardované (odpovídalo 6 letům) a dysplázie kostí je vyloučila na základě vyšetření X-paprsky. Nepravděpodobná je nedostatečnost v hladinách IGF-1 a IGFBP-3 stejně jako parametry štítné žlázy, které se v séru prokazují GH nebo nedostatečnost hormonů štítné žlázy. Dívka (případ 2) se narodila v termínu císařským řezem. Porodní váha byla 2 920 g, porodní délka byla 47 cm. Její vývoj byl normální, ale ve 12 měsících se projevil její malý růst (délka 67 cm, -3,0 SDS). Ve čtyřech letech měřila 89,6 cm (-3,6 SDS). Neprojevily se žádné dysmorfní ani dysproporcionální rysy. Nebyla obézní (13 kg). Stáří jejich kostí odpovídalo 3,5 letů a vyloučila se dysplázie kostí. Hormonální parametry byly normální. Je zajímavé poznávat, že růst děvčata i chlapce odpovídá 50 percentil růstové křivky žen s Turnérovým syndromem. Matka je nejmenší z rodiny a má
- 10CZ 297640 B6 střední rhizomelickou disproperci (142,3 cm, -3,8 SDS). Jedna ze sester (150 cm, -2,5 SDS) a babička z matčiny strany (153 cm, -2,0 SDS) jsou malé postavy, aniž mají nějakou disproporci. Druhá sestra má normální výšku postavy 167 cm, +0,4 SDS). Výška otce je 166 cm (-1,8 cm) a výška dědečka z matčiny strany je 165 cm (-1,9 SDS). Další pacient je japonského původu a vykazuje identické mutace.
Příklad 2: Identifikace genu odpovídajícího za malý vzrůst
A. Hybridizace in šitu
a) Fluorescenční hybridizace in silu
Provedla se fluorescenční hybridizace in šitu (FISH) za použití kosmidů, které leží v Xp/Yp pseudoautozomální oblasti (PARI). Uskutečnily se FISH studie za použití kosmidů 64/75cos (LLNlcl 10H032), E22COS(2e2). Fl/14cos (110A7), Ml/70cos (110E3), P99F2cos(43C11), P99cos (LLNLcl 10P2410), B6cosb (lCRFcl04H0425), F20cos (34F5), F21cos (ICRFcl04G0411), F3cos2 (9E3), F3cosl (11E6), P117cos (29B11), P6cosl(ICRFcl04P0117), P6cos2 (LLNLcl 10E0625) a E4cos (15G7) podle metody popsané v publikacích (Lichter P., Cremer T., Human Cytogenetics: A. practical Approach, IRL Press 1992, Oxford, New York, Tokyo) Jeden mikrogram kosmidového klonu se značil biotinem a hybridizoval se s metafází lidských chromozomů za podmínek, které redukují signál z repetivních sekvencí DNA. Detekce hybridizačního signálu probíhá prostřednictvím avidinu spojeného s FITC. Zviditelnění F1TC proběhlo za použití chlazeného zdvojeného kamerového systému (Photometrics, Tucson, AZ).
b) Fyzikální mapování
Kosmidy se získaly z Lawrence Livermore National Laboratory X- a Y-chromozomové knihovny a z X-chromozomové knihovny instituce Imperiál Cancer Research Fund London (nyní Max Plaňek Institute for Molecular Genetics Berlin). Za použití kosmidů distálních kDXYS15, jmenovitě E4cos, P6cos2, P6cosl, P117cos a P3cosl lze stanovit, že jsou stále přítomny dvě kopie E4cos, p6cos2, P6cosl a jedna kopie PÍ I7cos a F3cosl. Body porušení na mapě kosmidů P6cosl obou pacientů AK a SS jsou od sebe v maximální vzdálenosti lOkb. Zjistilo se, že abnormální X-chromozomy AK a SS měly deletováno přibližně 630 kb DNA.
Další kosmidy se získaly zZCRF X-chromozomové specifické kosmidové knihovny (ICRFclO4), z Lawrence Livermore X-chromosomové specifické knihovny (LLCO3'M'), stejně jako ze samostatně připravené kosmidové knihovny zahrnující celý genom. Kosmidy se identifikovaly hybridizací se všemi známými sondami, které mapují uvedenou oblast a použití celé YAC jako sondy. Za účelem ověření překrytů v případech, kde nebylo možno použít známých sond, se použily terminační sondy z několika kosmidů.
c) Hybridizace Southemovým přenosem
Analýza Southemovým přenosem za použití pseudoautozomálních markérů poskytuje důkaz, že bod porušení X-chromozomu u pacienta CC leží mezi DXYS20(3cosPP) a DXYS60(U7A) (Henke A., Wapenaar M., van Ommen G-J., Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear groth. Am. J. Hum. Genet. 49: 811-819). Za účelem potvrdit tento nález a definovat pozici bodu porušení, se použily kosmidy 64/75cos, E22cos, Fl/14cos, Ml/70cos, F2cos, P99F2cos a P99cos jako sondy při hybridizací FISH. Pozice bodu porušení na abnormálním chromozomu X u pacienta CC je mezi kosmidy 64/75cos (jedna kopie) a Fl/14cos (dvě kopie) na E22PAC. Pacient CC s normální výškou následně ztratil přibližně 269 až 290 kb DNA.
- 11 CZ 297640 B6
Hybridizace Southernovým přenosem se provedla za přísných podmínek v Churchově pufru (0,5 M NaPi pH7,2, 7 % SDS, 1 mM EDTA) při teplotě 65 °C a promývání se provedlo 40 mM NaPi, 1 % SDS při teplotě 65 °C.
d) Analýza hybridizací F1SH
Biotinem značená kosmidová DNA (velikost inzertu 32 až 45 kb) nebo kosmidové fragmenty (10 až 16 kb) se hybridizovaly s metafází chromozomů, které pochází ze stimulovaných lymfocytů pacientů, za podmínek, jenž se popisují dříve v textu (Lichter P., Cremer T., Human Cytogenetics: A practical Approach, 1RL Press, 1929, Oxford, New York, Tokyo). Hybridizované sondy se detekovaly prostřednictvím avidinu spojeného s FITC.
e) Amplifikace pCR
Všechny reakce PCR se provedly v objemech 50 ul. V tomto objemu je obsaženo 100 pg až 200 pg templátu, 20 pmol každého primeru, 200 uM dNTP (Pharmacia), 1,5 mM MgC12, 75 mM Tris/Hcl pH9, 20 mM (NH4)2SO4 0,01 % (hmotn./objem) Tween 20 a 2 U Goldstar DNA polymerázy (Eurogentec). Termocykly se provedly na zařízení GeneE (Techne).
f) Amplifikace exonu
Za účelem amplifikace exonu se použily čtyři kosmidové sebrané roztoky, kdy každý zahrnuje čtyři až pět klonů z kosmidových kontigů. Kosmidy v každém kosmidovém roztoku se částečně štěpily restrikčním enzymem Sau3A. Frakce čištěné na genu v rozmezí velikosti 4 až 10 kb se klonovaly do vektoru pSPL3B štěpeného restrikčním enzymem BamHI (Bum et al., 1995) a použily se při experimentech amplifikace exonu, jak se popisuje dříve v textu (Church et al., 1994).
g) Sekvenování genů
Sonifikované fragmenty dvou kosmidů LLOYNCO3'M'15D10 a LLOYNCO3'M34F5 se odděleně sub-klonovaly do vektorů M13mpl8. Z každé kosmidové knihovny se vybralo alespoň 1000 plaků, připravila se DNA Ml3 a sekvenovala se za použití barvivém značených terminátorů, termo-sekvenázy (Amersham) a univerzálního M13-primeru (MWG-BioTech). Gely se provedly na sekvenátoru ABI-377 a data se uspořádala a editovala pomocí programu GAP4 (Staden).
Ze všech šesti pacientů pacient GA měl nejméně charakterizovaný bod porušení chromozomu. Nejvzdálenější markéry, jejichž přítomnost na chromozomu X se testovala dříve, byly DXS1060 a DXS996, mapují přibližně 6 Mb od telomeru (Nelson, D.L., Ballabio A., CremersF., Monaco A.P., Schlessinger D., (1995). -Report of the sixth intemational workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342). Testovalo se několik kosmidů, které obsahují odlišné sekvence gen z PARI (MIC2, ANT3, CSF2RA a XE7). Všechny byly přítomny natranslokačním chromozomu. Kosmidy pokrývající kritickou oblast odpovídající za malý vzrůst postavy, například z chromozomu, přičemž translokační bod porušení je na kosmidů Ml/70cos. Kvantitativní srovnání intenzity signálu Ml/70cos mezi normálním a znovu uspořádaným chromozomem X ukazuje, že je deletováno přibližně 70 % kosmidů.
- 12 CZ 297640 B6
Tabulka č. 2
CC GA AK SS
64/75cos - -
E22cos - -
Fl/14cos +
Ml/70cos + ( + )
F2COS + +
P99F2cos + +
P99cos 4 4
B6cos +
F20COS
F21cos
F3cos2
F3cosl - -
P117cos -
P6cosl + +
P6cos2 + +
E4cos + 4
Tabulka č. 2: Tabulka udává souhrn dat z hybridizace FISH pro 16 kosmidů testovaných u čtyř pacientů (-) jedna kopie; indikuje, že kosmid je deletován a znovu uspořádán chromozomu X, aleje přítomen na normálním chromozomu X (+) dvě kopie; indikuje, že kosmid je přítomen na znovu uspořádaném i na normálním chromo15 zomu X ((+)) oblast bodu porušení; indikuje, že bod porušení se vyskytuje na kosmidu, jak ukazuje hybridizace FISH.
Molekulová analýza u šesti pacientů se znovu uspořádaným chromozomem X za použití kosmidových fluorescenčně značených kosmidových sond a hybridizace in šitu indikujeme oblast odpovídající za malý vzrůst je zúžena na interval o velikosti 270kb, který je ohraničený bodem porušení pacienta GA zjeho centromerové distální strany a u pacientů AK a SS na jeho centromerové proximální straně.
Korelace genotyp-fenotyp může být informativní a může posloužit k zobrazení kritického intervalu, kteiý odpovídá za malý vzrůst postavy, na lidském chromozomu X a Y. V této studii se použila analýza hybridizací FISH ke studiu rozšíření metafáze a interfáze jádra lymfocytů u pacientů, kteří nejsou delece a translokace na chromozomu X a body porušení v Xp22.3. Tyto 30 body porušení se jeví být přítomny u dvou ze čtyř pacientů (AK a SS), což je způsobeno přítomností sekvencí s predispozicí k znovu uspořádání chromozomu. Zjistil se další pacient s kruho
- 13 CZ 297640 B6 vým Y s porušením nacházejícím se v kritické oblasti o velikosti 270 kb, což redukuje kritický interval na 170 kb.
Korelací výšky šesti jedinců s jejich místem porušení se mapoval interval o velikosti 170 kb v pseudoautozomální oblasti, jehož přítomnost nebo absence má podstatný účinek na výšku vzrůstu. Tento interval je ohraničen místem porušení na chromozomu X pacienta GA v místě vzdáleném 340 kb distálně od telemoru (Xpteil) a místem porušení u pacientů AT a RY proximálně 510/520 kb Xptel. Toto uspořádání zahrnuje podstatnou redukci kritického intervalu na téměř jednu čtvrtinu jeho původní velikosti (Ogata T., Goodfellow P., Petic C., Aya M. Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal do DXYS15: localization of agrowth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455 459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short Stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene (s). J. Meg. Genet. 32: 831-834; Ogata T., Matsuo N. (1995): Turner Syndrome and female sex chromosome aberrations. deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629). Pro experimenty FISH za účelem testování prevealence a signifikance uvedeného genomového lokusu na velké sérii pacientů s idiopatickým malým vzrůstem je nyní dostupná malá sada šesti až osmi kosmidů.
B. Identifikace kandidáta genu odpovídajícího za malý vzrůst
Za účelem hledání transkripčních jednotek v nejmenší kritické oblasti o velikosti 170 kb se provedlo trapování exonu a selekce cDNA u šesti kosmidů (110E3, F2cos, 43C11, 02410, 15D15, 34F5). Trapování exonu se izolovaly tři různé pozitivní klony (ET93, ET45, a G108). Všechny z nich se mapovaly zpět ke kosmidů 34F5. Předchozí studie za použití cDNA selekčních protokolů a přístupu k 25 různým knihovnám cDNA vedly k neúspěchu, což naznačuje, že geny v tomto intervalu se exprimují s velmi malým nadbytkem.
Za účelem zjištění, zda nějaký gen v uvedeném intervalu chybí, se stanovila za použití náhodné M13 metody a terminátové chemie nukleotidové sekvence vzdálené přibližně 140 kb od uvedené oblasti PARI. Za účelem sekvenční analýzy se vybraly kosmidy se vzájemným minimálním překryvem, aby spolu pokryly kritický interval. Provedla se sekvenční analýza a následná předpověď proteinu pomocí programu „X Grail“, verze 1.3c, stejně jako trapování exonu pomocí programu FEXHB, což potvrdilo všechny 3 dříve klonované exony. Nedetekoval se žádný jiný gen kódující protein, než co už byl dříve izolován.
C. Izolace genu SHOX odpovídající za malý vzrůst
Za předpokladu, že všechny tři exonové klony ET93, ET45 a G108 jsou součástí stejného genu, použily se spolu jako sondy k testování 14 různých knihoven cDNA vytvořených z 12 různých fetálních (plíce, játra, mozek 1 a 2), a dospělých tkání (vaječníky, placenta 1 a 2, fibroblasty, skeletové svalstvo, kostní dřeň, mozek, mozkový kmen, hypotalamus, podvěsek mozkový). Mezi přibližně 14 miliony klony nanesenými na plotny se nedetekoval ani jeden klon. Za účelem izolace transkriptu v plné délce se uskutečnil 3' a 5'RACE. Za účelem 3'RACE se použily primery z exonu 108 na RNA z placenty, skeletového svalstva a fibroblastů z kostní dřeně a z tkáně, kde se exprimuje GI08. Ze všech tří tkání se získaly dva různé 3'RACE klony velikosti 1173 a 652 bp, což naznačuje, že existují dva různé 3' exony a a b. Tyto dvě odlišné formy se nazývají SHOXa a SHOXb.
Za účelem zvýšení šancí pro izolaci celé 5' části genu, o kterém se ví, že je exprimován s malým přebytkem, se buněčná linie Hela ošetřila retinoovou kyselinou a forbolesterem PMA. RNA z takové indukované buněčné linie a RNA z placenty a skeletového svalstva se použila ke konstrukci „Mararhonovy knihovny cDNA“. Ze všech tří tkání se izolovaly identické klony 5'RACE cDNA.
- 14CZ 297640 B6
Experimentální postup:
RT-PCR a konstrukce knihovny CDNA.
OD firmy Clontech se získala lidská polyA'RNA ze srdce, pankreasu, skeletového svalstva, fetálních ledvin a jater. Celková RNA se izolovala z buněčné linie fibroblastů z kostní dřeně činidlem TR1ZOL (Gibco-BRL), způsobem, který popisuje výrobce. První řetězec syntézy cDNA se získal pomocí kitu „Superscript first strand cDNA synthesis kit (Gibco-BRL), kdy počátečním materiálem je 100 ng polyA1 RNA nebo 10 ug celkové RNA za použití oligofdtj-adaRNAptorového primem (GGCCACGCGTCGACTAGTAC[dT]2oN. Po syntéze prvního řetězce dDNA se reakce naředila 1/10. Při dalších experimentech PCR se použila 5 ul tohoto ředění. „Marathonova knihovna cDNA“ se zkonstruovala z polyA'RNA skeletového svalstva a placenty amplifikačním kitem pro cDNA (Clontech), jak popisuje výrobce. Knihovny cDNA zfetálního mozku (katalogové číslo # HL5015b), fetální plíce (HL3022a), vaječníků (HL 1098a), podvěsku mozkového (HLI097v) a hypotalamu (HL 1172b) se získaly od firmy Clontech. Knihovny cDNA mozku, ledvin, jater a plic se staly součástí rychlého testu pomalu lidské cDNA knihovny (Clontech). cDNA knihovna fetálního svalstva se získala z instituce UK Human Genome Mapping Project Resources Center.
D. Sekvenační analýza a struktura genu SHOX
Na základě analýzy sekvencí získaných klonů pomocí 5' a 3'RACE se uspořádala sekvence SHOXa a SHOXb (1349 a 1870 bp). Identifikoval se jeden otevřený čtecí rámec o velikosti 1870 bp (SHOXa) a 1349 bp (SHOXb), který dává vzniku dvou proteinů o 292 aminokyselinách (SHOXa) a 225 aminokyselinách (SHOXb). Oba transkripty a i b se dělí o běžný 5'konec, ale mají odlišný poslední 3' exon. Toto zjištění naznačuje, že se používá alternativní signály sestřihu. Dosáhlo se úplného uspořádání mezi dvěmi cDNA a sekvenovanou genomovou DNA zkosmidů LL0YNCO3M15D10a LL0YNC3''M34F5, což umožňuje ustanovení struktury exon-intron (obrázek č. 4). Gen se skládá ze 6 exonů, jejichž velikost se pohybuje v rozmezí od 58 bp (exon III) do 1146 bp (exon VA). Exon 1 obsahuje CpG, startovací kodon a 5'oblast. Stop kodon stejně jako 3'-nekódující oblast se nachází v každém alternativně sestřiženém exonu Va a Vb.
Příklad 3
Identifikovaly se dvě cDNA, které tvoří 160 kb velkou oblast, která je kritická pro malý vzrůst. Tyto cDNA korespondují s geny SHOX a pET92. cDNA se se identifikovaly hybridizací subklonů kosmidů s knihovnami cDNA.
Sada kosmidových klonů, které úplně pokrývají kritickou oblast, je genetickým materiálem pro identifikaci kauzativního genu. Projekty pozičního klonování, které vedou k izolaci genů z uvedené oblasti, se uskutečnily trapováním exonu a selekcí cDNA. Zjištěním jejich polohy v pseudoatozomální oblasti se tyto geny mohou vyhnout X-deaktivaci a může se uplatnit účinek dávky.
Klonování genu, který když není přítomen (haploid) neboje deficitní odpovídá za malý vzrůst je delším krokem přesnosti diagnózy a poskytuje základny pro analýzu mutací v genu pomocí například jednořetězcového konformačního polymorfizmu (SSCP). Navíc klonování uvedeného genu a jeho následná biochemická charakterizace otevřela cestu k hlubšímu porozumění biologických procesů, které jsou zahrnuty v řízení růstu. Sekvence DNA podle vynálezu poskytuje první molekulový test pro identifikaci jednotlivců se specifickou vadou genu v komplexní heterogenní skupině pacientů, kteří vykazují idiopatický malý vzrůst.
- 15 CZ 297640 B6
Příklad 4: Expresní patern SHOXa a SHOXb
Analýza northernovým přenosem za použití jednotlivých exonů jako hybridizačních sond ukázala odlišný expresivní profil každého exonu, což silně naznačuje, že pruhy o různé velikosti a inten5 zitě reprezentují produkty křížové hybridizace s jinými genovými sekvencemi bohatými na G, C.
Aby se dosáhlo více realistického expresivního profilu genů SHOXa a b, provedly se s RNA z různých tkání RT-PCR experimenty. Zatímco exprese SHOXa se pozorovala ve fibroblastech skeletového svalstva, placenty, pankreasu, srdce a kostní dřeně, exprese SHOXb se omezila na fibroblasty fetální ledviny, skeletového svalstva a kostní dřeně, přičemž zdaleka nejsilnější expreio si vykazují fibroblasty kostní dřeně.
Exprese SHOXa v několika cDNA knihovnách připravených zfetálního mozku a ze svalstva, z mozku dospělých, z plic a z podvěsku mozkového a skutečnost, že v žádné uvedené knihovně není exprimován SHOXb, podává další důkaz, že exprese jedné formy sestřihu (SHOXa) je více 15 rozšířena než druhá (SHOXb), která se exprimuje převážně tkáňově specifickým způsobem.
K. odhadu transkripční aktivity SHOXa a SHOXb na X a Y chromozomu se použila RT-PCR RNA, která se extrahovala z různých buněčných linií, jenž vykazují aktivní X, neaktivní X nebo Y chromozom. Všechny buněčné linie vykazují produkt amplifikace očekávané délky 119 bp 20 (SHOXa) a 541 bp (SHOXb), což je důkaz, že jak SHOXa, i b unikly deaktivaci chromozomu X.
Geny SHOXa a b kódují nové proteiny homeodomén. Gen SHOX je vysoce konzervativní mezi jednotlivými živočišnými druhy od savců po ryby a ptáky. Na samém 5'konci a 3'konci vedle homeodomény jsou pravděpodobně konzervativní oblasti mezi člověkem a myši, což znamená funkční signifikanci. Během evoluce mezi člověkem a myší se v těchto oblastech aminokyselin 25 neakumulovaly rozdíly.
Experimentální postupy:
a) 5' a 3'RACE
Za účelem klonování transkriptů 5' konce SHOXa a b se provedla metoda 5'RACE za použití zkonstruované „Marathonových cDNA knihoven“. Použily se následující oligonukleotidy příměry: SHOX B. rev. GAAAGGCATCCGTAAGGCTCC (pozice 697-718, reverzní řetězec [r]) a adaptorový primer API. Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po 35 dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu vteřin, 66 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 25 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX A rev, GACGCCTTTATGCATCTGATT40 CTC (pozice 617-640 r) a adaptorového primeru AP2. PCR se provedlo během 35 cyklů s teplotou renaturace 60 °C.
Za účelem klonování transkriptů 3' konce SHOXa a b provedla metoda 3'RACE, jak popisuje v publikaci Frohman et al., 1988, za použití prvního řetězce cDNA s primerem oligo(dT)adapto45 ru. Použily se následující oligonukleotidové primery: SHOX A for GAATCAGATGCATAAAGGCGTC (pozice 619-640) a oligo(dT)adaptor. Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX B for, GGGAGCCTTACGGATGCCTTTC (pozice 697-718) 50 a oligo(dT) adaptoru. PCR se provedlo během 35 cyklů s teplou renaturace 62 °C.
Za účelem potvrdit sekvence transkriptů SHOXa a SHOXb se uskutečnila PCR 5'oligonukleotidovým primerem a 3'oligonukleotidovým primerem. V případě SHOXa se použily následující primery: G310 for AGCCCCGGCTGCTCGCCAGC (pozice 59-78) a SHOX D rev CTGCGCG
- 16CZ 297640 B6
GCGGGTCAGAGCCCCAG (pozice 959-982 r). V případě SHOXb se použily následující příměry: T310 for AGCCCCGGCTGCTGCCAGC a SHOX2A rev GCCTCAGCAGCAAAGCAAGATCCC (pozice 1215-1238 r). Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut, °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Produkty se čistily na gelu a klonovaly se za účelem sekvenační analýzy.
b) Analýza SSCP
Amplifikovaná gcnomová DNA pocházející z pacientů se analyzovala způsobem SSCP, který se popisuje v publikaci Orita M., Suzuki Y., Sekiya T., and Hayashi K., (1989): Rapid and sensitive detection of point mutations and polymorphisms using the polymerase chain reaction. Genomics 5:874-879). 1 až 5 ul produktů PCR se smíchalo s 5 ul denaturačního roztoku, který obsahuje % formamidu a 10 mM EDTA pH8, a denaturovaly se při teplotě 95 °C po dobu 10 minut, vzorky se ihned ochladily na ledu a nanesly se na 10% polyakrylamidový gel (akrylamid: bisakryamid = 37,5 : 1 a 29 : 1; gel s více sloty, báze TGGE, Qiagen), který obsahuje 2% glycerol a 1 x TBE. Elektroforéza proběhla při teplotě 15 °C při napětí 500 V po dobu 3 až 5 hodin a obarvila se stříbrem, jak se popisuje TGGE manuálu (Qiagen, 1993).
c) Klonování a sekvenování produktů PCR
Produkty PCR se klonovaly do vektoru pM0S5/we za použití pMOSfí/weT-sady vektorů od firmy Amersham. Kultura z jedné kolonie kultivována přes noc se lyžovala povařením ve 100 ml vody po dobu 10 minut. Lyzáty se použily jako templáty pro PCR se specifickými primery. SSCP produktů PCR umožnila identifikaci klonů, které obsahují různé alely. Klony se sekvenovaly za použití vektorových primerů Uni a T7 značených CY5 způsobem sekvenování v cyklech, jak popisuje výrobce (ThermoSequenase Kit (Amersham)) na automatickém sekvenátoru ALF (Pharmacia).
d) Testování cDNA knihoven pomocí PCR
Aby se detekovala exprese SHOXa a b provedlo se PCR testování několika knihoven cDNA a prvního řetězce cDNA s SHOXa a b specifickými primery. V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu. V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for. V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 68 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů
e) PCR testování knihoven cDNA
Aby se detekovala expresse SHOXa a b provedlo se PCR testování několika knihoven cDNA s SHOXa a b specifickými primery. V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu. V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for. V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut. 94 °C po dobu 30 vteřin, 68 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů.
- 17CZ 297640 B6
Příklad 5: Expresivní patern OG12, což je putativní homolog SHOX a SHOT
Za účelem stanovení expresivního paternu se provedla hybridizace in šitu u embryí myší z 5. dne p.c. a 18,5 dne p.c., u fetálních a u nově narozených zvířat. Expresi bylo možno ukázat u vyvíjejících se zárodků noh, v mesodermu nasalních postupů, které se podílejí na tvorbě nosu a patra, u očních víček u aorty, ve vyvíjejících se žláz samic, ve vyvíjející se páteři (omezených na diferenciaci motorických neuronů) a v mozku. Na základě tohoto expresního patentu a na mapování pozice jeho lidského homologu SHOT, SHOT, reprezentuje pravdě podobně kandidáta Comelia de Lange syndromu, který zahrnuje malý vzrůst.
Příklad 6: Izolace nového genu homeoboxu podobného SHOX SHOT na chromozomu 3, který souvisí s lidským růstem/s malým vzrůstem postavy.
U člověka se izoloval nový gen nazývaný SHOT (SHOX homolog na chromozomu 3), který vykazuje nejvíce homologie s myším genem OG12 a lidským SHOX. Lidský gen SHOT a myší OG12 jsou vysoce homologní. Vykazují 99% identity na úrovni proteinu. Ačkoli se to ještě neprokázalo, díky homologii mezi SHOT a SHOX (jde o identitu pouze v homeooblasti) je pravděpodobné, že gen SHOT také odpovídá za malý vzrůst nebo lidský růst.
Gen SHOT se izoloval za použití primerů ze dvou nových lidských EST (HS 1224703 a HS 126759) z databáze EMBL, přičemž se amplifikuje reverzně přepsaná RNA z linie fibroblastů kostní dřeně (Rao E., Weiss B., Mertz A., et al., (1995): Construction of a cosmid conting spanning the short stature condidate region in the pseudosomal region PAR 1. In: Turner syndrome in a life spán respective: Research and clinical aspects. Proceeding of the 4,h Intemational Symposium on Turner Syndrome, Gothenburg, Sweden, 18-21 May, 1995., edited by Aíbertsson-Wikland K., Ranke M.B., pp. 19-24, Elsevier. 5' a 3'konec genu SHOT se generoval RACE-PCR z fibroblastové knihovny kostní dřeně, která se zkonstruovala podle publikace Rao E., Weiss B., Fukami M., Rump A., Niesler B., Metz A., Muroya, K., Binder G.,. Kirsch S., Winkelmann M., Nordsiek G., Heinrich U., Breuning Μ. H., Ranke M.B., Rosenthal A., Ogata T., Rappold G.S. (1997): Pseudoautosomal deletions encompassing a navel homeobox gene cause groxth failure in idiopathic short stature and Turner syndrome. Nátuře Genet 15:54-62. Gen SHOT se mapoval analýzou FISH chromozomu 3q25/q26 a dále se mapoval myší homolog syntetické oblasti na myším chromozomu 3. Na základě expresivního patentu OG12, což je myší homolog genu SHOT, gen SHOT reprezentuje kandidáta odpovídajícího za Comelia Lange syndrom (který vykazuje malou výšku vzrůstu a další rysy, kam patří kraniofaciální abnormality), který se mapoval v tomto intervalu na chromozomu 3q25/26.
Příklad 7: Vyhledávání mutací u pacientů s idiopatickým malým vzrůstem
Sekvence DNA podle vynálezu se používají při PCR, LCR a při jiných známých technologiích, za účelem stanovení, zda takoví jednotlivci s malou výškou vzrůstu vykazují malé delece nebo bodové mutace v genu odpovídajícím za malý vzrůst.
U 91 (z celkového počtu 259 jednotlivců) nezávislých pacientů mužského a ženského pohlaví s idiopatickou malou výškou vzrůstu (odhad četnosti idiopatickou malé výšky vzrůstu v obecné populaci se odhaduje na 2 až 2,5 %) se testovala přítomnost malých změn v uspořádání nebo bodové mutace v genu SHOXa. Navrhlo se šest sad primerů PCR, ne pouze za účelem amplifikace jednotlivých exonů, ale také sekvencí, které lemují exon a malé části 5ÚTR. V případě největšího exonu, exon 1, se generovaly dva další primery uvnitř exonu. Primery, které se používaly při PCR, se uvádějí na tabulce č. 2.
- 18CZ 297640 B6
Provedl se jednořetězcový konformační polymorfizmus (SSCP) všech amplifikovaných exonů, jehož velikost se pohybuje v rozmezí od 120 do 295 bp. Pouze v případě dvou jednotlivců s malou výškou vzrůstu (Y91 a Al) se identifikoval posun pohyblivosti pruhů. Klonovaly se a sekvenovaly fragmenty, které vykazují pozměněné paterny SSCP (unikátní konformery SSCP). Aby se zabránilo vzniku PCR a sekvenaěních artifaktů, sekvenování se provedlo na dvou řetězcích za použití dvou nezávislých reakcí PCR. Mutace u pacienta Y91 se nachází v pozici 28 bp 5' konce startovacího kodonu v 5'UTR a zahrnuje substituci, kdy quannin se nahradí citidinem. Aby se zjistilo, jestli tato mutace reprezentuje řídký polymorfizmus neboje odpovědná za fenotyp regulací exprese genu, například slabším navázáním translačních iniciačních faktorů, testovaly se pacientovi rodiče a sestra. Přestože sestra a otec pacienta dosahují normální CP (data nejsou uvedeny). Uvedená substituce bází reprezentuje řídký polymorfizmus, který neovlivňuje fenotyp.
Klonování a sekvenování unikátních konformerů SSCP pacienta Al vykazuje transici bází, kdy citidin nahradí thymidin (nukleotid 674), která zavede terminační kodon do pozice aminokyseliny 195 předpovězených aminokyselinových sekvencí aminokyseliny 195 předpovězených aminokyselinových sekvencí 225 a 292. Aby se stanovilo, zda tato nesmyslná mutace je geneticky asociována s malou výškou vzrůstu rodiny, provedla se rodová analýza. Zjistilo se, že všech šest jednotlivců s malou výškou vzrůstu (definovanou jako výška nižší než 2 standardní odchylky) vykazuje nenormální posun SSCP a transici cytidinu za thymidin. Ani otec, ani jedna z tet a dědeček z matčiny strany, kteří dosáhly normální výšky nevykazují mutaci, což naznačuje, že babička přenesla mutovanou alelu na její dvě dcery a na jejich dvě vnoučata. U této rodiny existuje shoda mezi přítomností mutovaných alel a fenotypu vykazujícího malou výšku vzrůstu.
Stejná situace, která se popisuje shora v textu, se zjistila u jiného pacienta s malou výškou vzrůstu, který je japonského původu.
Příklad 8
Sekvence DNA podle vynálezu se používají pro charakterizaci funkce genu nebo genů. Sekvence DNA se mohou použít jak otázky při vyhledávání bází v databázích aminokyselin a nukleových kyselin za účelem identifikace příbuzných genů nebo genových produktů. Jako otázka pro vyhledávání v databázi aminokyselin se použila částečná aminokyselinová sekvence SHOX93. Test vykazuje velmi vysokou homologii s mnoha známými proteiny homeoboxů. Sekvence cDNA podle vynálezu se mohou použít při produkci peptidu rekombinantní metodou. Při produkci proteinu rekombinantním způsobem se mohou použít různé expresivní systémy, které jsou dobře známy v oboru.
Běžnou syntézou peptidu (syntéza proteinů podle Merrifieldovy metody) se syntetizoval peptid se sekvencí CSKSFDQKSKDGNGG a podle standardních protokolu se získaly polyklonální protilátky z králíků a kuřat.
Seznam literatury
Ashworth A., Rastan S., Lovell-Badge R., Kay G., (1991): X-chromosome inactivation may explain the difference in viability of X0 humans and mice. Nátuře 351: 406-408:
Blagowidow N., Page D.C., Huff D., Mennuti MT (1989): Ullrich-Tumer syndrome in an XY female fetus with deletion of the sex-determining portio of the Y chromosome. Am J. med. Genet. 34: 159-162.
Cantrell M.A., Bicknell J.N., Pagon RA et al. (1989): Molecular analysis 46, XY females and regional assignment of a new Y-chromosome-specific probe. Human. Genet. 83: 88-92.
- 19CZ 297640 B6
ConnorJ.M., Loughlin S.A.R. (1989): Molecular genetics of Turner's syndrome. Acta Pediatr. Scand. (Suppl.) 356: 77-80.
Disteche C.M., Casanova M., Saal H., Friedman C., Sybert V., Graham J., Thline H., Page D.C., Fellous M„ (1986): Smáli deletions of the short arm of the Y-chromosome in 46,XY females. Proč. Nati. Acad. Sci USA 83: 7841-7844.
Ferguson-Smith M.A. (1965): Karyotype-phenotype correlations in gonadal dysgenesis and their bearing on the pathogenesis of malformations. J. med. Gent. 2: 142-155:
Ferrari D., Kosher R.A. Dealy C.N. (1994): Limb mesenchymal cells inhibited from undergoing cartilage differentiation by a tumor promoting phorbol ester maintain expression of the homeobox-containing gene MSX1 and fail to exhibit gap junctional communication. Biochemical and Biophysical Research Communications. 205 (1):429-434.
Fischer M., Bur-Romero P., Brown L.G. et al., (1990): Homologous ribosomal protin genes in the human X- and Y-chromosomes escape from X-inactivation and possible implementation for Turner syndrome. Cell 63: 1205-1218.
Freund C., Horsford D.J., Mclnnes R.R. (1996): Transcription factor genes and the developing eye: a genetic perspective: Hum. Mol. Genet. 5: 1471-1488.
Gehring W., J., Qian Y.Q., Billeter, Furukubo-Tokunaga K.., Schier A. F., Resendez-Preze D., Affolter M., Otting G., Wuthrich K., (1994): Homeodomein-DNA recognition. Cell 78: 211-223.
Grumbach M.M., Conte F.A. (1992). Disorders of sexual differentation. In: Williams textbook of endocrinology, 8th edn.m edited by Wilson J.D., Foster D.W., pp. 853-952, Philadelphia, WB Saunders.
Hernandez, D., Fisher E.M.C (1996): Down syndrome genetics: unravelling a multifactorial disorder. Hum. Mol. Genet. 5: 1411-1416.
Kenyon C., (1994): If birds can fly, why can't we? Homeotic genes and evolution. Cell 78: 175180.
KumlaufR., (1994): Hox genes in vertebrate development. Cell 78: 191-201.
Lawrence P.A., Morata G., (1994): Homeobox genes: their function in Drosophila segmentation and pattem formation. Cell 78: 181-189.
Lehrach H., Drmnac R., Hoheisel J.D., Larin Z., Lemon G., Monaco A.P., Nizetic D„ et al., Hybridization finger printing in genome mapping and sequencing. In Davies K.E., Tilghman S., Eds. Genome Analysis 1990: 39-81 Cold Spring Harbor, NY.
Levilliers J., Quack B., Weissenbach J., Petit C., (1989): Exchange of terminál portions of Xand Y-chromosomal short arms in human XY females. Proč. Nati. Acad. Sci. USA 86: 22962300.
Lippe B.M. (1991): Turner Syndrome. Endocrinol. Metab. Clin., North Am., 20: 121-152. Magenis R.E., Tochen M.L. Holahan K.P., Carey T., Allen L., Brown M.G. (1984): Turner syndrome resulting from partial deletion of Y-chromosome short arm: localization of male determinantns. J. Pediatr 105: 916-919.
-20CZ 297640 B6
Pohlschmidt M., Rappold G.A., Krause M., Ahlert D., Hosenfeld D., Weissenbach J., Gal A. (1991): Ring Y chromosoine: Molecular characterization by DNA probes. Cytogenet. Cell Genet. 56: 65-68.
Qiagen (1993) TGGE Handbook, Diagen GmbH, TGMA 41123/93. Osenfeld R.G. (1992): Turner syndrome: a quide for physicians. Second edition. The Turner's Syndrome Sciety.
Rovescalli A.C., Asoh S„ Nirenberg M. (1996): Cloning and characterization four murine homeobox genes. Proč. Nati. Acad. Sci. USA 93: 10691-10696.
Shalet S.M. (1993): Leukemia in children treated with growth hormone. Journal of Pediatrie Endocrinology 6: 109-11 Vimpani G.V., Vimpani A.F., Lidgard G.P., Cameron E.H.D., Farquhar J.W. (1977) Prevalence of severe growth hormone deficiency. Br. Med. J. 2: 427-430.
Zin A.R., Page D.C., Fisher E.M.C. (1993): Turner syndrome: the čase of the missing sex chromosomc. T1G 9 (3): 90-93.
Sekvenční protokol (1) Obecné informace (i) Navrhovatel:
(A) JMÉNO: Rappold-Hoerbrand, Gudrun, Dr.
(B) ULICE: Hauseckerweg 14 (C) MĚSTO: Heidelberg (D) ZEMĚ: Německo (E) ZIP:6918 (ii) Název vynálezu: Molekula nukleové kyseliny kódující polypeptidy a způsoby jejího použití.
(i i i) Počet sekvencí: 16 (iv) Počítačem čitelná forma:
(A) TYP MÉDIA: disketa (B) POČÍTAČ: kompatibilní s IBM PC (C) OPERAČNÍ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, verze #1.30 EPO (vi) Data předchozích přihlášek (A) PŘIHLÁŠKA č. US 60/027,633 (B) DAT UM PODÁNÍ: 01-10-1996 (2) Informace o sekvenci SEQ ID NO: 1:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 60 aminokyselin (B) TYP: aminokyselinová
-21 CZ 297640 B6 (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 1
Gin I Arg Arg Ser Arg 5 Thr Asn Phe Thr Leu 10 Glu Gin Leu Asn Glu 15 Leu
Giu Arg Leu Phe 20 Asp Glu Thr His Tyr 25 Pro Asp Ala Phe Met 30 Arg Glu
Glu Leu Ser 35 Gin Arg Leu Gly Leu 40 Ser Glu Ala Arg Val 45 Gin Val Trp
Phe Gin 50 Asn Arg Arg Ala Lys 55 Cys Arg Lys Gin Glu 60
(2) Informace o sekvenci SEQ ID NO: 2:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 209 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon II: ET93“ (v) TYP FRAGMENTU: lineární (xi) POPIS SEKVENCE: SEQ ID NO: 2
GGATTTATGA ATGCAAAGAG AAGCGCGAGG ACGTGAAGTC GGAGGACGAG GACGGGCAGA 60
CCAAGCTGAA ACAGAGGCGC AGCCGCACCA ACTTCACGCT GGAGCAGCTG AACGAGCTCG 120
AGCGACTCTT CGACGAGACC CATTACCCCG ACGCCTTCAT GCGCGAGGAG CTCAGCCAGC 180
GCCTGGGGCT CTCCGAGGCG CGCGTGCAG 209
(2) Informace o sekvenci SEQ ID NO: 3:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 368 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon I: G310“
-22 CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 3:
GTGATCCACC CGCGCGCACG GGCCGTCCTC TCCGCGCGGG GAGACGCGCG CATCCACCAG 60
CCCCGGCTGC TCGCCAGCCC CGGCCCCAGC CATGGAAGAG CTCACGGCTT TTGTATCCAA 120
GTCTTTTGAC CAGAAAAGCA AGGACGGTAA CGGCGGAGGC GGAGGCGGCG GAGGTAAGAA 180
GGATTCCATT ACGTACCGGG AAGTTTTGGA GAGCGGACTG GCGCGCTCCC GGGAGCTGGG 240
GACGTCGGAT TCCAGCCTCC AGGACATCAC GGAGGGCGGC GGCCACTGCC CGGTGCATTT 300
GTTCAAGGAC CACGTAGACA ATGACAAGGA GAAACTGAAA GAATTCGGCA CCGCGAGAGT 360
GGCAGAAG 368
(2) Informace o sekvenci SEQ ID NO: 4:
(i) CHARAKTERISTIKA SEKVENCE
10 (A) DÉLKA: 58 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární
15 (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon III: ET45“
(xi) POPIS SEKVENCE: SEQ ID NO: 4:
GTTTGGTTCC AGAACCGGAG AGCCAAGTGC CGCAAAGAAG AGAATCAGAT GCATAAAG (2) Informace o sekvenci SEQ ID NO: 5:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 89 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon IV: G108“ (xi) POPIS SEKVENCE: SEQ ID NO: 5:
GCGTCATCTT GGGCACAGCC AACCACCTAG ACGCCTGCCG AGTGGCACCC TACGTCAACA
TGGGAGCCTT ACGGATGCCT TTCCAACAG
-23CZ 297640 B6 (2) Informace o sekvenci SEQ ID NO: 6:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 1166 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina o
(A) POPIS: /popis = „exon: Va“ (xi) POPIS SEKVENCE: SEQ ID NO: 6:
GTCCAGGCTC AGCTGCAGCT GGAAGGCGTG GCCCACGCGC ACCCGCACCT GCACCCGCAC 60
CTGGCGGCGC ACGCGCCCTA CCTGATGTTC CCCCCGCCGC CCTTCGGGCT GCCCATCGCG 120
TCGCTGGCCG AGTCCGCCTC GGCCGCCGCC GTGGTCGCCG CCGCCGCCAA AAGCAACAGC 180
AAGAATTCCA GCATCGCCGA CCTGCGGCTC AAGGCGCGGA AGCACGCGGA GGCCCTGGGG 240
CTCTGACCCG CCGCGCAGCC CCCCGCGCGC CCGGACTCCC GGGCTCCGCG CACCCCGCCT 300
GCACCGCGCG TCCTGCACTC AACCCCGCCT GGAGCTCCTT CCGCGGCC&C CGTGCTCCGG 360
GCACCCCGGG AGCTCCTGCA AGAGGCCTGA GGAGGGAGGC TCCCGGGACC GTCCACGCAC 420
GACCCAGCCA GACCCTCGCG GAGATGGTGC AGAAGGCGGA GCGGGTGAGC GGCCGTGCGT 480
CCAGCCCGGG CCTCTCCAAG GCTGCCCGTG CGTCCTGGGA CCCTGGAGAA GGGTAAACCC 540
CCGCCTGGCT GCGTCTTCCT CTGCTATACC CTATGCATGC GGTTAACTAC ACACGTTTGG 600
AAGATCCTTA GAGTCTATTG AAACTGCAAA GATCCCGGAG CTGGTCTCCG ATGAAAATGC 660
catttcttcg TTGCCAACGA TTTTCTTTAC TACGATGCTC CTTCCTTGAT CCCGAGAGGC 720
TGCGGAACGG GTGTGGATTT GAATGTGGAC TTCGGAATCC CAGGAGGCAG GGGCCGGGCT 780
CTCCTCCACC GCTCCCCCGG AGCCTCCCAG GCAGCAATAA GGAAATAGTT CTCTGGCTGA 840
GGCTGAGGAC GTGAACCGCG GGCTTTGGAA AGGGAGGGGA GGGAGACCCG AACCTCCCAC 900
GTTGGGACTC CCACGTTCCG GGGACCTGAA TGAGGACCGA CTTTATAACT TTTCCAGTGT 960
TTGATTCCCA AATTGGGTCT GGTTTTGTTT TGGATTGGTA TTTTTTTTTT TTTTTTTTTT 1020
TGCTGTGTTA CAGGATTCAG ACGCAAAAGA CTTGCATAAG AGACGGACGC GTGGTTGCAA 1080
GGTGTCATAC TGATATGCAG CATTAACTTT ACTGACATGG AGTGAAGTGC AATATTATAA 1140
ATATTATAGA ΤΤΑΑΑΛΑΑΑΑ AATAGC 1166
(2) Informace o sekvenci SEQ ID NO: 7:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 625 párů bází (B) TYP: nukleová kyselina
-24CZ 297640 B6 (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon: Vb“ (xi) POPIS SEKVENCE: SEQ ID NO: 7:
io
ATGGAGTTTT GCTCTTGTCG CCCAGGCTGG AGTATAATGG CATGATCTCG ACTCACTGCA 60
ACCTCCGCCT CCCGAGTTCA AGCGATTCTC CTGCCTCAGC CTCCCGAGTA GCTGGGATTA 120
CAGGTGCCCA CCACCATGTC AAGATAATGT TTGTATTTTC AGTAGAGATG GGGTTTGACC 180
ATGTTGGCCA GGCTGGTCTC GAACTCCTGA CCTCAGGTGA TCCACCCGCC TTAGCCTCCC 240
AAAGTGCTGG GATGACAGGC GTGAGCCCCT GCGCCCGGCC TTTGTAACTT TATTTTTAAT 300
TTTTTTTTTT TTTTAAGAAA GACAGAGTCT TGCTCTGTCA CCCAGGCTGG AGCACACTGG 360
TGCGATCATA GCTCACTGCA GCCTCAAACT CCTGGGCTCA AGCAATCCTC CCACCTCAGC 420
CTCCTGAGTA GCTGGGACTA CAGGCACCCA CCACCACACC CAGCTAATTT TTTTGATTTT 480
TACTAGAGAC «XiATCTTGC TTTGCTGCTG AGGCTGGTCT TGAGCTCCTG AGCTCCAAAG 540
ATCCTCTCAC CTCCACCTCC CAAAGTGTTA GAATTACAAG CATGAACCAC TGCCCGTGGT 600
CTCCAAAAAA AGGACTGTTA CGTGG 625
(2) Informace o sekvenci SEQ ID NO: 8:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 15577 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „HOX93“ (ix) RYSY:
(A) NÁZEV/KLÍČ: exon (B) POZICE: 1498..1807 (D) JINÉ INFORMACE: /funkce = „část exonu 1 (G310)“ (ix) RYSY:
(A) NÁZEV/KLÍČ: misc(B) POZICE: 3844..4068 (D) JINÉ INFORMACE: /funkce = „oblast pET92 (první část)“
-25CZ 297640 B6 (ix) RYSY:
(A) NÁZEV/KLÍČ: mise- (B) POZICE: 4326..4437 (D) JINÉ INFORMACE: /funkce = „oblast pET92 (druhá část)“ (ix) RYSY:
(A) NÁZEV/KLÍČ: misc- (B) POZICE: 4545..4619 (D) JINÉ INFORMACE: /funkce = „oblast pET92 (třetí část)“ (ix) RYSY:
(A) NÁZEV/KLÍČ: misc- (B) POZICE: 5305..5512 (D) JINÉ INFORMACE: /funkce = „část exonu Π (ET93)“ (ix) RYSY:
(A) NÁZEV/KLÍČ: misc- (B) POZICE: 11620..11729 (D) JINÉ INFORMACE: /funkce = „část exonu IV (G108)“ (xi) POPIS SEKVENCE: SEQ ID NO: 8:
CTCTCCCTGT TGTGTCTCTC TTTCTCTCTC TCCATCTCTC TCCGTCTTTC CCCCTCTGTC 60
TCTTTCTCTG TCTCCATCCC TCTGTCTCTC CCTTTCTCTC TGTCTTTCCT TGTCTCTCTC 120
TTTCTCTCTC TCTCTCCATC TCTCTCTCTC CCGGTCTCTC TCTCTCCATC TCCCCGTCTC 180
TCCGTTTCTC TCTCTGCCTC TCCCTGTCTG TCTCTCTCTT TGTGTGTGTT ACACACACCC 240
CAACCCACCG TCACTCATGT CCCCCCACTG CTGTGCCATC TCACACAAGT TCACAGCTCA 300
GCTGTCATCC TGGGTCCCCA GGCCCCGCCG GGGAGGAAGA TGCGCCGTGG GGTTACGGGA 360
GGAAGGGGAC TCCGGGCCTC CTGGTGCCCC ACTTTATTTG CAGAAGGTCC TTGGCAGGAA 420
CCGTGACGCG TTTGGTTTCC AGGACTTGGA AAACGAATTT CAGGTCGCGA TGGCGAGCAC 480
CGGCTTCCCC TGAAGCACAT TCAATAGCGA GAGGCGťXiAG GGAGCGAGCA GGAGCATCCC 540
ACCATGAAAA CCAAAAACAC AAGTATTTTT TTCACCCGGT AAATACCCCA GACGCCAGGG 600
TGACAGCGCG GCGCTAAGGG AGGAGGCCTC gcgccggggt CCGCCGGGAT CTGGCGCGGG 660
CGGAAAGAAT ATAGATCTTT ACGAACCGGA TCTCCCGGGG ACCTGGGCTT CTTTCTGCGG 720
GCGCTGGAAA CCCGGGAGGC GGCCCCGGGG ATCCTCGGCC TCCGCCGCCG CCGCCTCCCA 780
AGCGCCCGCG TCCCGGTTTG GGGACACCCG' GCCCCTTCTT CTCACTTTCG GGGATTCTCC 840
AGCCGCGTTC CATCTCACCA ACTCTCCATC CAAGGGCGCG CCGCCACCAA CTTGGAGCTC 900
ATCTTCTCCC AAAATCGTGC GTCCCCGGGG CGCCCGGGTC CCCCCCCTCG CCATCTCAAC 960
CCCGGCGCGA CCCGGGCGCT TCCTGGAAAG ATCCAGGCGC CGGGCTCTGC GCTCCTCCCG 1020
GGAGCGAGGG CGGCCGGACA ACTGGGACCC TCCTCTCTCC AGCCGTGAAC TCCTTGTCTC 1080
-26CZ 297640 B6
TCTGTCTCTC TCTGCAGGAA AACTGGAGTT TGCTTTTCCT CCGGCCACGG AAAGAACGCG 1140
GGTAACCTGT GTGGGGGGCT CGGGCGCCTG CGCCCCCCTC CTGCGCGCGC GCTCTCCCTT 1200
CCAAAAATGG GATCTTTCCC CCTTCGCACC AAGGTGTACG GACGCCAAAC AGTGATGAAA 1260
TGAGAAGAAA GCCAATTGCC GGCCTGGGGG GTGGGGGAGA CACAGCGTCT CTGCGTGCGT 1320
CCGCCGCGGA GCCCGGAGAC CAGTAATTGC ACCAGACAGG CAGCGCATGG GGGGCTGGGC 1380
GAGGTCGCCG CGTATAAATA GTGAGATTTC CAATGGAAAG GCGTAAATAA CAGCGCTGGT 1440
GATCCACCCG CGCGCACGGG CCGTCCTCTC CGCGCGGGGA GACGCGCGCA TCCACCAGCC 1500
CCGGCTGCTC GCCAGCCCCG GCCCCAGCCA TGGAAGAGCT CACGGCTTTT GTATCCAAGT 1560
CTTTTGACCA GAAAAGCAAG GACGGTAACG GCGGAGGCGG AGGCGGCGGA GGTAAGAAGG 1620
ATTCCATTAC GTACCGGGAA GTTTTGGAGA GCGGACTGGC GCGCTCCCGG GAGCTGGGGA 1680
CGTCGGATTC CAGCCTCCAG GACATCACGG AGGGCGGCGG CCACTGCCCG GTGCATTTGT 1740
TCAAGGACCA CGTAGACAAT GACAAGGAGA AACTGAAAGA ATTCGGCACC GCGAGAGTGG 1800
CAGAAGGTAA GTTCCTTTGC GCGCCGGCTC CAGGGGGGCC CTCCTGGGGT TCGGCGCCTC 1860
CTCGCCACGG AGTCGGCCCC GCGCGCCCCT CGCTGTGCAC ATTTGCAGCT CCCGTCTCGC 1920
CAGGGTAAGG CCCGGGCCGT CAGGCTTTGC CTAAGAAAGG AAGGAAGGCA GGAGTGGACC 1980
CGACCGGAGA CGCGGGTGGT GGGTAGCGGG GTGCGGGGGG ACCCAGGGAG GGTCGCAGCG 2040
(XGGCCGCGC GCGTGGGCAC CGACACGGGA AGGTCCCGGG CTGGGGTGGA TCCGGGTGGC 2100
TGTGCCTGAA GCCGTAGGGC CTGAGATGTC TTTTTCATTT TCTTTTTCTT TCCTTTCCTT 2160
TTTTTGTTTG TTTGTTTGTT TGTTTGAGAC AGAGTCTCGC TCTGTCCCCC AGGCTGGAGT 2220
GCAGTGGTGC GATCTCGGCT CACTGCAACC TCCGCCTCCT GGGTTCAAGC GATTCTCCTG 2280
CCTCAGCCTC CCCAGTAGCT GGGATTACAG GCATGCACCA CCACGCCTGG CTAATTTTTG 2340
TGCTTTTAGT AAAGACGGGG ATTCACCATG TTGGCCAGGC TGGTCTCGAA CTCCTGACCT 2400
CAGGTGATCC ACCCGCCTCG GCCTCCCAAA GTGCTGGGAT GACAGGCGTG AGGGACCGCG 2460
CCCGGCCTGG GTCCTGACGG CTTAGGATGT GTGTTTCTGT CTCTGCCTGT CTGCCTTGTA 2520
tttaccx;tc-a C C CAG AC í A A CAGACX. AGG € GTGTCGACGC GCCTTCCCAG c<x:tcagcgc 2 580
CTGCCGGGCC CCCGGAGATC ACGCXiAAGAC TCGAGGCTGC GTGGTAGGAG ACGGGAAGGC 2640
cccgggtcag CTCGGTTCTG TTTCNGTTTA AGGAACCCTT CATTATTATT TCATTGTTTT 2700
CCTTTGAACG TCGAGGCTTG ATCTTGGCGA AAGCTGTTGG GTCCATAAAA ACCACTCCCG 2760
TGAGCGGAGG TGGCCGGGAT CTGGATGGGG CGCGAGGGGC CCCGGGGAAG CTGGCGGCTT 2820
CGCGGGCGCG TCCTAAGTCA AGGTTGTCAG AGCGCAGCCG GTTGTGCGCG GCCCGGGGGN 2880
AGCTCCCCTC TGGCCCTTGC TCCTGAGACC TCACTGGTGG GTCGTCCCGT GGTGGAAATC 2940
GGGGAGTAAG AGGCTCAGAG AGAGGGGCTG GCCCCGGGGA TCTCTGTGGA CACACGACAA 3000
CTGGGCGGCA TACATCTTAA GAATAAAATG GGCTGGCTGT GTCGGGGCAC AGCTGGAGAC 3060
-27CL 297640 B6
GGCTATGGAC GCCTGTTATG TTTTCATTAC AAAGACGCAG AGAATCTAGC CTCGGCTTTT 3120
GCTGATTCGC AAAGTTGAGG TGCGAGGGTG AATGCCCCAA AGGTAATTCT TCCTAAGACT 3180
CTGGGGCTAC CTGCTCTCCG GGGCCCTGCA TTTGGGGTGT GGAGTGGCCC CGGGAAATAG 3240
CCCTTGTATT CGTAGGAGGC ACCAGGCAGC TTCCCAAGGC CCTGACTTTG TCGAAGCAGA 3300
AAGCTGTGGC TACGGTTTAC AAAGCAGTCC CCGGTTTCTG ACCGTCTAAG AGGCAGGAGC 3360
CCAGCCTGCC TTTGACAGTG AGAGGAGTTC CTCCCTACAC ACTGCTGCGG GCACCCGGCA 3420
CTGTAATTCA TACACAGAGA GTTGGCCTTC CTGGACGCAA GGCTGGGAGC CGCTTGAGGG 3480
CCTGCGTGTA ATTTAAGAGG GTTCGCANGC GCCCGGCGGC CGCTTCTGNT GGGGTTGCTT 3540
TTTGGTTGTC CTTCNGCAAA CACCGTTTTG CTCCTCTNGN AACTCTCTCT TNCTCCCCCN 3600
TGGCCNGTNG GACCCGGGNA NGAGCAAAGT GTCCTCCAGA CCNTTTTGAA ANGTGAGAGG 3660
AAAATAAAGA CCAGGCCAAA NNGACCCAGG GCCACAGGAG AGGAGACAGA GAGTCCCCGT 3720
TACATTTTNC CCCTTGGCTG GGTGCAGAAA GACCCCCGGG CCAGGACTGC CACCCAGGCT 3780
ACTATTTATT CATCAGATCC AAGTTAAATC GAGGTTGGAG GGCAGGGGAG AGTCTGAGGT 3840
TACCGTGGAA GCCTGGAGTT TTTGGGNAAC AGCGTGTCCC CGCCGAGCCT GGGAGCCCGT 3900
GGGTTCTGCA AAGCCTGCGG GTGTTTGAGG ACTTTGAAGA CCAGTTTGTC AGTTGGGCTC 3960
AATTNCCTGG GGTTCAGACT TAGAGAAATG AAGGAGGGAG AGCTGGGGTC GTCTCCAGGA 4020
AACGATTCAC TTGGGGGGAA GGAATGGAGT GTTCTTGCAG GCACATGTCT GTTAGGAGGT 4080
GAAACAGAAT GTGAAATCCA CGTTGGAGTA AGCGTCCAGC GCTGAATGTA GCTCGGGGTG 4140
GGGTGGGAGG GCUrTGGTGT GGATCGTGGA AGGNAAGAAA gacagaacag GGTGCTAGTA 4700
TTTACCCCGT TNCCCTGTAG AGACCCTGGA TTTGTCAGCT TTGCAAGCTT CTTGGTTGCA 4260
GCGGCCTTGC CTGTGGCCCT TTGAGACTGT TTCCAGACTA ZiACTTCCAAA TGTCAGCCCC 4320
TTACCCTTGA CAl/CAAGGGA CATCTCATTA GGGCATCGCG tgcttctcat CTGTGNCTCA 4380
GCAGGCCCNG AGATAGGAAN CANGAGGGGC NGTTGGNAGA TGCNCACTTC CACCAGCCCT 4440
GGGNTTGAAG GGGANGCGAN GGGANGACNA CCTTTTANCT TAAACCCCTN GAGCTTGGTN 4500
CAGAGAGGNC TGAATGTCTA AAATGAGGAA GAAAAGGTTT TTCACCTGGA AACGCTTGAG 4560
UXTGAGTCT tctggccntt CTGACNTCCC CCAGCAAATA CAGACAGGTC ACCAANCTAC 4620
TGGAGATGAG AAAGTGCCAT TTTTGWLACA CTCTGGTGGG GTAGGTGCCC GACCGCGTGT 4680
GAAAAANGTG GGAANNGGAG AGATTTCTGN CGCACGCGGT TCAGCCCCC-A GGCGCGGNTG 4740
GCNGCATTCN AGGNTACTCA GACGCGGTTC TGCTGTTCTG CTGAGAAAGA GGCTTCGGGT 4800
AGGGGCTCCT AGCTCCGCCA GATCGCGGAG GGACCCCCAG CCCTCCTGCG CTGCAGCGGT 4 U 60
GGGGATAGCG TCTCTCCGTA GGCCTAGAAT CTGCAACCCG CCCCGGGTCC TCCCCGTGTC 4920
CTTCCCGGGC GTCCCGCCGG GGATCCCACA GTTGGCAGCT CTTCCTCAAA TTCTTTCCCT 4980
TAAAAATAGG ATTTGACACC CCACTCTCCT TAAAAAAAAA AAATAAGAAA AAAAGGTTAG 5040
GTTATGTCAA CAGAGGTGAA GTGGATAATT GAGGAAACGA TTCTGAGATG AGGCCAAGAA 5100
-28CZ 297640 B6
AACAACGCTC GTGCAAAGCC CAGGTTTTTG GGAAAGCAGC GAGTATCCTC CTCGGCTTTT 5160
GCGTTATGGA CCCCACGCAG TTTTTGCGTC AAAGCGCATT GGTTTTCGAG GGCCCCCTTT 5220
CCACCGCGGG ATGCACGAAG GGGTTCGCCA CGTTGCGCAA AACCTCCCCG GCCTC1AGCCC 5280
TGTGCCCTCC GCTCCCCACG CAGGGATTTA TGAATGCAAA GAGAAGCGCG AGGACGTGAA 5340
GTCGGAGGAC GAGGACGGGC AGACCAAGCT GAAACAGAGG CGCAGCCGCA CCAACTTCAC 5400
GCTGGAGCAG CTGAACGAGC TCGAGCGACT TTTTGACGAG ACCCATTACC CCGACGCCTT 5460
CATGCGCGAG GAGCTCAGCC AGCGCCTGGG GCTTTCCGAG GCGCGCGTGC AGGTAGGAAC 5520
CCGGGGGCGG GGGCGGGGGG CCCGGAGCCA TCGCCTGGTC CTCGGGAGCG CACAGCACGC 5580
GTACAGCCAC CTGCGCCCGG GCCGCCGCCG TCCCCTTCCC GGAGCGCGGG gaggttgggt $640
GAGGGACGGG CTGGGGTTCC TGGACTTTTG GAGACGCCTG AGGCCTGTAG GATGGGTTCA 5700
TTGCGTTTGT TTTTCACCAA CAGCAAACAA ATATATATAC ATATATATTA TACAAATAAC 5760
AAATAAATAT ATATGTTATA C.AGATGGGTA TATTGTATAT ATTATAGATA TTTGTTCGTC 5820
CTTGGTGCAA AGACACCCGG TGAACCCATA TATTGGCTCC TGACTGCCTT CGGTTCCCCT 5860
GGGATTGGTT ATAGGGGCAA CACATGCAAA CAAAACTTTC CCTGGATTAT ACTTAGGAGA 5940
CGAAGCTACA GATGCGTTTG ATCCAGZiGTG TTTTACAAGA TTTTTCATTT ΆΑΑΑΑΛΛΆΑΤ 6000
GTGTCTTTTG GCCCCTGATT CCCCTCCGTC TTCCCGTGTG GCTGCATTGA AAAGGTTTCC 6060
TTAGGATGAA AGGAGAGGGG TGTCCTCTGT CCCTAGGTGG AGAGAAACAG GGTCTTCTCT 6120
TTCCTCCGTT TTTTCACCTA CCGTTTCTAT CTCCCTCCTC ccctctccag CCCTGTCCTC 6180
1 írGTZGAAAC CACCCCCTCC tccctccggc TGTGGGGAGC GCAGGAGCAC GTTGGGCATC 624 0
ZGGATGAGt G GNAGACTATT AGCGGGGCAí GGGGGGTCCC (ΧΜΛΜΧΜ: GCGZvATTCAC 6300
<,< T(/:c<.<.7-.t GAGACC.AGGC A< CGGGGGGC GGAGGGGCCT TGGGTGTCCG CAGAíXíGALG 6360
GGCGGGť AGA GCCTTCCTCC G< ATTCTAAA CATTCACTTA /vAGGTATGAG TTTAHTTTCA 6420
GGGGTGC TGC TGGGAGAGCC TCCAAATGGC TTCTTCCAGC CCCTGCCTGA CAGTTCAGCT 6480
( CCCTGGAAG GTCAACTCC r CTAGTCCTTT CTCCTGGTTC TGGGCAGGAC AGAAGTGGGG 6540
..gagggagag AGAGAGAGAG AGAGAGAGAG ACfíGTCAGGA TCCCCGGACC ΓΤ(χκχ/Λ< c 6600
C.i,T( AA/kAAT AAATGAAATT AAGATTGCC G ACCAGAGAGA GAACCGTGAC AAAGGAAACG 6660
GCGTTGAAAG CAAAGAGACG AACTGAAAGC CCGTTCCCGT AGGACTGGTT ATGAGGTCAA 6720
CACATTCAAA CACAGCTTGC TCTGGATTTT GCTGAGCAGA ggaagataga GATGCATTTG 6780
ATCCAAAGTG TGTTAGATCT TTCATTATAT GTGTGTCTAT ATATATAAAC ατατατ/λατ 6840
ΑΤΛΤΛΛΛί.ΛΤ ACATAAATGT ATGTAAATAT ATATAATCTA TATACATATA ΤΑΑΑΤΑΤΛΤΑ 6900
AACACATATA TAATATATAA ATCTATAAAC ΛΤΑΤΑΤΑΑΤΆ TATAAACATA ΑΑΤΑΤΑΤΆΑΑ 6960
CATATATAAT , ΑΤΛΤΑΑΑΤΛΤ ATTAACATAT ATAAAATATG ΤΑΤΛΆΑΤΑΤΆ TATAAACATA 7020
TAAACATATA ΤΑΑΑΤΆΤΛΤΑ AACATATAAA TATATAAACA ΤΛΤΆΤΑΑΑΤΛ TATACAAACA 7080
-29CZ 297640 B6
TATTGTATAT ATATAAATAT ATATAAAAAC ATATATATAC ΑΤΛΤΑΑΑΑΑΤ ATATATAAAC 7140
ATATATACAT ATAAAGAAAT ATATATAAAC ATATATACAT ATAAATATAC ATATATAAAC 7200
ATATATATAC ATAAAATATA TATAAACATA TATACATATA AAAATATATA TATATTAACA 7260
TATATATACA ΤΑΤΑΑΑΑΑΤΛ ΤΑΤΑΤΆΤΤΑΑ CATATATATA CATATAAAAA ΤΛΤΑΤΑΤΑΤΑ 7320
TTTTTGGCCC CTGATTCCCT TCGGTTCCTG TGGGATGGGT GATTGAGTCA ACACATTCAA 7300
ACACAACTTT TCCATCGATG TTGCTTAGGA GATGAGGATA CAGATGCGTT TGATGGAGAG 7440
GGTTTTACAA GCTCTTTCAT TTAAATATAT ATATATATAT ΑΤΛΤΑΤΑΤΤΤ TTTGGCTCCT 7500
GATTCTCTTC CGTCTTCCCA TGTGGCTGCA TTTTAAAAGG CTTCCCTAAG ATCGTTACGA 7560
TTAAATCAAC CCTCCCCAGG catctttacc GAGGGCTGTG GTCCCCAAAG CGATACAGCC 7620
CAGGAGGGAG AGAGGCTTTC GTGACTTGGA GGAAGGACTG TGTCCCTCCT TAGGGCGTCT 7680
GTGGCCTCAG TGAGGGAAGG AAGCTGCATC AGACAGGGGT TTCCTCGCTG TCCACCCCTC 7740
TGGCAGAAGA TGGATTGGGC TGCCCCGNTA TAAATTAATG AAAAGATTAA AGTTTCGCTA 7800
AAGGGGACAT CGAGTTTATG TGTCATCTCC TGGTGNTCTG TGTGCCNTGG GATNCTGCAA 7860
TATATCCCAN NGCCCTTGAT GNNNTACTGT TTNCTATAAA ΑΑΝΝΤΆΑΛΤΝ TACTTGTNNA 7920
ATTTAANTTC CNNNACACTA TTTNCTTTCC NNGTNAGTCT NATTANCCGA NCGAGAGCAN 7980
CGNTTAGTTN CAGCTNGCGG AAAATTGGTT GTGGGGTGTG TGCGGACCCC NGAGNAACGC 8040
CCNNTAAAAT NAAAGACAAA NTCNGGGGAC AAGNCTNGGG GGTTATCGNN ATTGCNNAGG 8100
GGTCGNCATG ΆΑΑΛΝΤΤΤΑΑ CGACGGTAAA ΤΑΑΤΆΆΤΆΆΑ AANNCAAACA TGGGAATGNC 8160
AAT A/iAAOAC ΛΤΑΑΓΤΤί WATCGCCGC C A a rvzG' /V, A G GATCCTATAG TAAAGGCGA.G o ·’ -> p
TGCGCTTTGA GGGGTCATAA AAATCAATTA GTTCCAACAC CCACGTCCCG CGTTC.AGGGG 8280
acgg<x;acga GCAGGGACAG AAAAAGAAAC CATATTTGAA TCCCATCTCT CTGTGAATTG 8340
ttgggtcaca TGCGTCTCAG TACAGCCCGT CCCGTGCTGT GACCGGATAG AGTTTCAATT 8400
tactgtggaa ATTTGCTGTA AATAAATTGA GCATCCGATA GAAGCTGTTG CTGATTAACC 8460
TTTTATTTTT AGCGTGGCCC TGCAAAGTCG TATCACCCAG CTGTCAGGCT TCTAATCGAA 8520
AGTTATGAGA CCACGGTGAG GGGCAGGCGG ΤΑΆΤΤΤΑΑΤΤ ACAACAAATA TCTTTGGGTT ÍJS80
TATGGCW . AGCTZwXATTA AAT< >7' ΆΤΤΆ TTCZiGTGTct UTNAATGGNA AATCAAAANN 8·> 40
GGAAATCGCA NTTACGGNCA TTTGGGNNAA ANGAAAGCGG GGNAGTGCTC TTTAATNGAA 8700
NNGAAATAAC TGTCTTAAGC AGTGTCACAC ACTTCACTTA CCATATTCGN GGCCTNAATT 8760
GGAANNTGGA TCGTNNGAAT CACTCCNAAG ACTNGATTTA TTANGCGCTT CACGNCAGCN 8820
NGGCNTAATT CATCHACTTN NGTATTCTTC ATCMNNNATT TTTTTTTTTC CTCTCNNGCC 8880
GTGTTNNGAA gggagagtga ATGAGGCTTT CCACGTTTCA GGAGGATTTT CTTTTTTGAA 8940
AAATGCCCTT CCAGAGGCTT TTGGGTGGCT GGCTTGCTTT CTGGGCCCTG GAGGANGACA 9000
GGCGGANGAG TCCAGGTGGG CATGGAGAGG CACAGTGGCA GGTCACCTGG ATGGTGAGTG 9060
GAGGTGGAGG TCTGAAGGCG CCAGCTTTGG AAATTATTGG TGAATTTCGA TGTCAGCACC 9120
-30CZ 297640 B6
AGGNCAGGGG CCTTTTTGGC GGGGGTGTGA GGGANGGATG ANCTTTGCTG GGAAANNCAG 9180
GATCAGGTTC TCCAGGCGCA CTGCAGCCCG GTAGGACCCA CTTTGGAAAT GAAAAGCCAG 9240
TTNCCGAAAG CTGGGCTGGA AGCTTCCGTG TTGGGTTCAA GAGCAAGTTC ACGTTGCGCT 9300
GTGTAGACTC CTGGCTGCTC CCAAACTCTG AGGGTTTTCT GAGGTTCCCT TCATAGGGGC 9360
ACCGGCCCTG GGCCATGCAC AGTGCGTAAG GGTGGCTGTG GGCCGAGGGA CCCAGCACGT 9420
GTTTTGCCCA CAACAGCCGG AGTGACTGGT TCACTCACCG CCTTGGCGGA GGACGCCTGT 9480
TCTCTGGACG AATCATTTCT CTTGGGTGGT GACTGCCTTG TGGGTCAAGG TGCAGGTTTT 954 0
CTGCCACAGA AAACCTGTTA GGAGGAATTA AGCGACTAAG ACTGTCAGGG AGGTGGTGGT 9600
GGGGGANGAG GNAGGGGGTG GTGTCCAGAT TACCAGGCAT AGGCTAAACT GCCTGCACTC 9660
TCCAGCTGGT CTGTCTGTGG AGGAGGGGAT TGTCAATACT GGGAGAGCAG AGGAGGCTCG 9720
TAGGAGGTGA GAGGGGGTGG AATTTGCATG CAAATCTTCA CATGAGGCCT GTGTGAATTT 9780
CTCCAGCCTC CTGAGGGTCC CCTGCGCTAT TGCACTCAAC TTCTTGATAG TTTACCCCAA 9840
GACTCAGAAG TCCTTAGAGG GGCAGAATGC CCCCACCACA AAGCCTGCTA TCCTTGGGCG 9900
TCCTCAGGAC CCTTGGTCAT GAATGGGACC CTTTCATGTA TGGGGACCCT TGGTAATATG 9960
AATGGGACGC CTTCAGCTCC CCAGGGCTTC CGAGGAGGCC GAGAAGGGCA AAGACACTTC 10020
CGAGGAGGCC GAGAAGGGCA AAGACATTTT CTGGGCTTGG TGTGTCAAGA GCTAGATTGG 10080
AGAAGGGGCT GGATTTGGAA CTCTTTAGCC ATCAGCTCAC CCTCTCCGTT TGTGGCTAAA 10140
GTCTGAAGGT GGAAACTTCG GTTCTCCTAC AGGGTCTACA GGAGTTGGGG GGCGGGGCGC 10200
CCACACAGAA CGCTGGAAAG TTCGACAGTC CACTTCCACT GGCTCGGAAC TCACTTTTTC 10260
ACCTTAAGTT CATCAGCGGT AACGCATAGG TCTCACTTAG GCAGGGCACG GATGATTTAA 10320
gziatttctac TTCTAGGTCzT GGTGCGGTGG CTCACACCTC TAATCCCAGC ACTTTG<>GAG 10380
GCCCAGGAGG GTGGATCGCT TGAGGTCAGG AGTTTGAGAC CAGCCTGGCC AACATGGTGA 10440
AACCCCGTCT CTACTAAAAT ACGAAAATTA GCCAGGCATG GTGGTGAGCA CCTGTAATTC 10500
CAGCTACTCG GGAGC,CTGAG gcaggagaat CGC.TTGAACC TGGGAGGTGG ACGTTGCAGT 10560
GAGGTGAGAT CACACCACTG CACTCCAGCC TGGATGAGAG AGCAAGACTC TGTCTCAAAA 10620
ACAAAATAAA ACAAAAACAA AACAAAAATC aaaaaagaaa ACCCAATTTC cagttctaLg 10680
CCAGGTGCAG TGGCTCACGC CTGTCATCCC AGCACTTTGG GAGGCCCAGG AGGGTGGATC 10740
GCTTGAGGTC AGGAGTTCGA GACCAGCCTG GCCAACATGG TGAAACCCCA TCTTTACTAA 10800
AAATACAAAC GTTAGCTGGG TGTGGTGGTG TGCGCCTGTA ATCCCAGCTA CTCGGGAAGC 10860
TGAGGCTGGA GAATTGCTTG AATCTGGGAG GTGGAGGTTG CAGGGAGGCG AGATAGTGCC 10920
ACTGCAGTCC AGCCTGGACC AGAGAGCAAG ACTCCGTCTC AAAAACAAAA GAAAGCAAAA 10980
ACAAAAAACA AGAGACCAGC CTGGCCAACA TGGTGAAACC GCGTCTTTAC TAAAATACAA 11040
AATTAGCCGG GCATGGTGGT GGGCACCTGT AGTCCCAGCT ACTCGGGAGG CTGAGGCAGG 11100
-31 CZ 297640 B6
AGAATGGCTT GAACCTGGGA GGTGGAGCTT GCAGTGAGCC GAGATAGTGC CACTGCACTC 11160
CAGCCTGGGC GACAGAGCGA GACTTGATTT CAGAACCACC ACCACCACAA CAAAACAAAA 11220
CAAAAAATCC AAAAAAACCC CAATTTCCAG TACTAGGTAG TCAGTGATGC AGGGCTGGAG 11280
ACAGAGGGGC GGTAAGTGTC TGGGCGCCCA CCATCAGTCA CCTCCCAGCT CCCANGAGGT 11340
GCAAAGTGCT TGGTTCAGCC TCATGGGAAG GATGCTCCCT GGGGAGGCTG GGCTGGGTTC 11400
ACAGGGCTCT TCACATCTCT CTCTGCTTCT NCCCCAAGGT TTGGTTNCCA GAACCGGAGA 11460
GCCAAGTGCC GNCAAACAAG AGAATCAGAT GCATAAAGGT GGGTGTCGGG ACTGGGGGGA 11520
CCTGAAGCTG GGGGATCCTG CTCCAGGAGG GATGGGGTCG ACAAGGTGCT GGCTACACCC 11580
AGGACCACCA CACTGACACC TGCTCCCTTT GGACACAGGC GTCATCTTGG GCACAGCCAA 11640
CCACCTAGAC GCCTGCCNGA GTGGCACCCT ACGTCAACAT GGGAGCCTTA CGGATGCCTT 11700
TCCAACAGGT AGCTCACTTT TTCTTCCTCT GNAAGATCCC TAGGGACCTG CTGCTCCCTT 11760
CCCCTTTCCC CTATTTGCTG CCGCATCCTG ACACTCCTAG TCCCTCCCTG CCCCTGCAGA 11820
CTTCTCAGCT GGCCCTTAGA AAAAAAGCCT CTTTTCCGAG GAGGCATTTA CAGGCACCTT 11880
GGCACCTATG AAATCAGGCT GGGCCAGGCG GGGTGGCTCA CACCTGTCAT CCCAGCACTT 11940
TGGGAGGCCA AGGTTAGGAG TTTGAGACCA GCCTGGACAA CATAGCAAAA GCCTGTCTCT 12000
ACTAAAAATA CAAAAAAAAA TTAACAGGGA GTGGTGGTGG GGACCTGTAA TCCCAGCTAC 12060
TTGGGAGGCT GAGGCAGGAG AATCACTTGA ACCCGGGAGG CCGAGGTTGC GGTGAGCCGA 12120
GATCGTGCGA TTGCACTCCA GGCTGGGCGA CAGAGTGAGA CTCTGTCTCA ΑΑΑΑΑΤΆΆΆΤ 12180
ΛΑΆΤΆΆΆΤΆΑ ATGTAAAAAA ATAAAAATAG GTCGGGCACG GTGGGTCACG TCTGTAATCC 12240
CAíXLAGTTTG GAAGGCCGAG GTGGGTGGAT GACAGGGTCA AGAGATTGAG ACCATCCTGG 12300
< caacatggc AAAATGCCGT CTCTACTAAA AAATACAAAA ATTAGGCGGG CGTGGTGGCG 12360
GGTGCCTGTA ATCCCAGCTA CTUGGGAGGC TGAGGCAGGA GAATCGGTTG AACCCGGGAT 12420
GCGGAGGTTG CAGTGAGCGG AGATCACATC ACTGCACTCC AGGCTGGGGA ACAAGAGCGA 12480
AACTGCGTCT TACAATAAAT ΛΛΑΤΛβΑΤΛΑ ATAAATAAAC AAATAAACTT TACTTTAGAA 12540
ACAAATCIXT GTCCG7GTTT GTCTTTTCAC CTGTCCTGCA (X X3 t \AAACA A AACATAAAAT 12600
1 1 -7\A ATAGTAGT', A TTTCATTCCG GGAAAAAGAA AG”GGA i*g ΓΓ TGCCTTCACt: 1 'λ 660
CT7TCTCGTC CTTCVTCTGG TGCTCCTGAN GGCCCANGGG NAGAGGGTGG AAAGTNCAGA 12720
ggaagaaaga CGGGGCTGGG GGGGGGGGTC CGTGGGGACC GAGGGAGGCA TGTTCCCNAT 12780
TTCCNTGTCT TCACNTTCAA AGNAGGGGCC CCTCGNCTCT GGAATGAGGC CTACGGTTTC 12840
CTTTCCCNGA AGAGTTNCCC CTTTGTGAGC TTACGGCTTC GGAGTGAACC TCGGTGCAAC 12900
CTGTTATTAA AACACACAGA GGCTAATGCC AGCAAAAACA CGCUCCCCGC TCCTGGTTTC 12960
AGAGGGAAGA AAAAAATTCA TAAGCACGGC CATGCTTTTC TAATAAAAAT TCATTAAATA 13020
ATCGTTATAA GGGATGAAGC CGGGAGGGGA GAGGAGAGGA ACACAATCAA GAGACTTTCT 13080
TTGAACTTTT TCTCCC/TGCT TCAAATACAA AGCAATCTTC TGTGGGCCTG GGCCTGGGGG 13140
-32CZ 297640 B6
GTTTCCCCCT TTCTCTGCAG CCCATTGGGA GGAAGAAAAT GCTTCCCTGA ANGTTGCTGC 13200
AAAATTGTTT CTGTTTTTCT TTTCTTTTTC T T T? T TTTTTTGAGA CGGAGTCTCG 13260
CTCTGTCACC AGGCTGGAGT GCAATGGTAT GATCTCAGCT CACTGCAACC TCCACGTTCC 13320
TGTTTCAAGT CATTCTCCTG CCTCAGCCTC CTGAGTAGCT GGGACTACAG GCGCCCGCCA 13380
CCACGCCCGG CTAGTGTTTG TATTTTTAGA AAAGACAGGG TTTCCCCATG TTGGCCAGGC 13440
TGGTCTTGAA CTCCTGTCCT CAAGTGATCT GCCTGCCTCG GCCTCCCAAA GTGCTGTGTT 13500
TCTGTTTTTC TTTCCCCGCT TTCTTAGGAG GCCATCGGGA AGAATAAAAT GGTTTCCTTG 13560
AAGTTGATGC AAAATTGTTT CTGTTTTTCT TTTCTCTTTT CTTTCTTTTT GAGATGGAGT 13620
CTCGCTCTTT CACCCAGGCT GGAGGGCAGT GGCGCGACCT CGGCTCACTG CAACCTCCGC 13680
CTCCCGGGTT CAAGCGATTC TCCTGCCTCA GCCTCCGGAG TAGCTGGGAT TACAGGCACC 13740
TGCCACTATG CCTGGCTAAT TTTATTATTT TTAGTAGAGA CGGGGTTTCA CCATGTTGGC 13800
CAGGCTGGTC TCAAACTCCT GACCTCAGGT GATCCGCCCG CCTCGCCTCC CAAAGTGATG 13860
GGATGANCAG GNCATNGAGC NCACCGTGCC CGGCCCTCTA ACTCTTTACC AGACATAAAG 13920
TCTCCNNTTC CCCTTTCTAA ATGTATATAT TGTGTTTTTA AAAGTTAACA GCAGGGATCC 13980
CACCTCATTN CCCCGCTNCT CTCCCCAAGA CCTGTCCTGC ACGTTGCACA CAGCAGGTGT 14040
GCCCTGGACA TATCCCAAAC CCACGCTGAA AGAAAGAGGG TCTCACTACA CGTATGATAT 14100
CTGTGNATCC TTTAAACATC TCCGTGGCTT CCAGGCAACA CAGCCATAAA TAGGAATCTC 14160
ATGTCTGACA TGATACCGGG ACCATGTATG GGNAAATTCT MIGTGTGAAG TTCCAGCTAC 14220
CCCCGGAGAG GGANCCATTG CATACCCTCC AGAAACTCCC CTGCCGTTNC AAGCCAAAGA 14280
U AC AA< GAC AA ACAGGNTCGG AGAGAGGGTG TCATTGAAAA TCAATACGAT CATAAGAGCA 1 4340
CACAGCA.CCG tctttctctt CTGCCCGTTG ATACACAATT ATGAGCAATT TGCTAACACT 14400
GACAACTCGT GGCAAGAACA GGTCGTGTTG ATACGGTTGC CTCGTGAGGA CCCATCTGTC 14460
TTCTGGGGTC TTGCCTGGAA CGGAGATCGG AGTTCAGGGT GGCTAATAGA ATCATTACTC 14520
ACCTAGGGAC ACAGAATNA'!’ GAGGGTTACC CCCAGTTAAG TGCATACAGT CAAACGGACG 14580
GCTtJCTCTGG AAGGTACAGT GACGTGAACA GCTTTTATGA AATGCCTAGA TCTGGACCTT 14640
CCATACCTGA GCCACCGTTC CAAAGCACTG GGCGTTTTTC AGATACTTTC ATGAGAAAřlG 14700
TTGTCAACAC CGCAAGTTTG CAGTACACAG TCTGAAAGAT ATTCTTGTAT ATGTAGATGT 14760
CTGTAGATGC CCTGAAGGTG TGTAGACTTT AGACACCCAG AAGGTGTGTA GATGTCTGTA 14820
GACACCTTCT ATGTGTGTAG ATGTCTGTAG ACGCCCTGCA GGTGTGTAGA TATATCTAGA 14880
TGGTCTGCCT GTGTATGATA CAGGCTAAAA AGACATTTGT GGTGGACACT AGTTGATTAT 14940
TTAGGACTAT GAGATGGGAA AGGAAGNAGC AACCAGCAGT GAAAGGCATG TGGTGGGTGG 15000
GGGGTTGGCA TTGCAGTGGG GTCCTCNTGA NGCAGGTGAC ACCCACTATA GGGCTGCCCT 15060
TGGNATGGAC GCTTTGTNGA AGCTGTTTGA TTTCACCACA CCAAGCCTGG AGGCACGGAC 15120
-33CZ 297640 B6
ATTCCAGGAT GGTGAGGAGT CTGCAAAGGA GGAGATTGGA GGAGGTGfAA TATCCCTAGA 15180
GTACGAGAGA TGAGATAGGA GAGCTGTATA AATAGCACTA CCAGCCGGAT GCGGTGGCTC 15240
ACGCCTGTCA TCCCAGCACT TTAGGAGGCT GAGGCAGGCG GATCACCTGA GGTCAGGAGT 15300
TCCAGAACAG CCTGGCCAAC ACAATGAAAC CCCATCTTTA CTAAAAATAC AAGATTAGCT 15360
GGGCACGGTG TCTCACGCCT GTCATCCCTG CACTTTGGGA GGTCGAGGTG CGCAGATCAT 15420
GAGGTCAGTT TGGCCAACGC GGCGAAACCC CGTCTCTACT AAAAATACAA AAAAGTAGCC 15480
GGGCGTGGTG GTGGGCACCT GTAGTCCCAG CTACTAGGGA GGCTGAGGCA GGAGAATCGC 15540
TTGAACCCGG ATGCGGACAT TGCAGTGAGC CGAGATC 15577
(2) Informace o sekvenci SEQ ID NO: 9:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 753 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „segment genu ET92“ (xi) POPIS SEKVENCE: SEQ ID NO: 9:
CGTGGAAGCC TGGAGTTTTT GGGAACAGCG TGTCCCCGCC GAGCCTGÍXSA GCCCGTGGGT 60
TCTGGAAAGC CTGCGGGTGT TTGAGGACTT TGAAGACCAG TTTGTCAGTT GGGCTCAATT 120
CCTGGGGTTC AGACTTAGAG AAATGAAGGA GGGAGAGCTG GGGTCGTCTC CAGGAAACGA 180
TTCACTTGCíG GGGAAGGAAT GGAGTGTTCT TGCAGGCACA TGTCTGTTAG GAGGTGAAAC 240
AGAATGTGAA ATCCACGTTG GAGTAAGCGT CCAGCGCTGA ATGTAGCTCG GGGTGGGGTG 300
GGAGGGCCCT GGTGTGGATC GTGGAAGGAA GAAAGACAGA ACAGGGTGCT AGTATTTACC 360
CCGTTCCCTG TAC.ACACCCT GGATTTGTCA GCTTTGCAAG CTTCTTGGTT GCAGCGGCCT 420
TGCCTGTGCC CCTTTGAGAC TGTTTCCAGA CTAAACTTCC AAATGTCAGC CCCTTACCCT 480
TGACAGCAAG GGACATCTCA TTAGGGCATC GCGTGCTTCT CATCTGTGCT CAGCAGGCCC 540
GAGATAGGAA CAGAGGGGCG TTGGAGATGC CACTTCCACC AGCCCTGGGT TGAAGGGGAG 600
CGAGGGAGAU ACCTTTTACT TAAACCCCTG AGCTTGGTCA GAGAGGCTGA ATGTCTAAĎXA 660
TGAGGAAGAA AAGGTTTTTC ACCTGGAAAC GCTTGAGGGC TGAGTCTTCT gcccttctga 720
CTCCCCCAGC AAATACAGAC AGGTCACCAA CTA 753
-34CZ 297640 B6 (2) Informace o sekvenci SEQ ID NO: 10:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 1890 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina o
(A) POPIS: /popis = „SHOXa“ (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91...968 (xi) POPIS SEKVENCE: SEQ ID NO: 10:
-35CZ 297640 B6
GTGATCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA114
Met Glu Glu Leu Thr Ala Phe Val
TCC Ser AAG Lys 10 tct ttt GAC Asp CAG Gin AAA Lys 15 AGC Ser AAG Lys GAC GGT AAC GGC Gly GGA Gly GGC Gly GGA Gly 162
Ser Phe Asp Gly Asn 20
GGC GGC GGA GGT AAG AAG GAT TCC ATT ACG TAC CGG GAA GTT TTG GAG 210
Gly 25 Gly Gly GJy Lys Lys 30 Asp Ser Ile Thr Tyr 35 Arq Glu Val Leu Glu 40
AGC GGA CTG GCG CGC TCC CGG GAG CTG GGG ACC, TCG GAT TCC MX CTC 258
Ser Gly Leu Ala Arg 45 Ser Arg Glu Leu Gly 50 Thr Ser Asp ser Ser 55 Leu
CAG GAC ATC ACG GAG GGC GGC GGC CAC TGC GCG GTG CAT TTG TTC AAG 306
Gin Asp Ile Thr 60 G1 u Gly Gly G1 y Hj s 65 Cys Pro vai His Leu 70 Phe Lys
GAC CAC GTA GAC AAT GAC AAG GAG AAA CTG AAA GAA TTC GGC ACC GCG 354
Asp His val 75 Asp Asn Asp Lys Glu 80 Lys Leu Lys Glu Phe 85 Gly Thr Ala
GTG GCA GAA GGG ATT ΤΆΤ GAA TGC AAA GAG AAG CGC GAG GAC GTG 402
Arq Vai 9(1 Ala Glu Gly Ile Tyr 95 Glu Cys Lys G1 u Lys 100 Arq G1 u Asp Val
AAG TCG GAG GAC GAG GAC CX.,G GAG ACC AAG CTG AAA GAG AGG CGC AGC 450
Lys 105 Sei Glu Asp Glu Asp 110 Gly Gin Thr Lys Leu US Lys Gin Arg Arg Ser 1 20
CGC ACC AAC TTC ACG CTG GAG CAG CTG AAC GAG CTC GAG CGA crc TTC 498
Arq Thr Asn Phe Thr 125 Leu Glu Gin Leu Asn 130 Glu Leu Glu Arg Leu 135 Phe
GAC GAG ACC CAT TAC GCC GAC GCC TTC ATG CGC GAG GAG CTC AGC CAG 546
Asp Glu Thr His 140 Tyr Pro Asp Ala Phe 145 Met Arg Glu Glu Leu 150 Ser Gin
CGC CTC, ggg CTC TCC GAG GCG CGC GTG CAG GTT TGG TTC CAG AAC CGG 594
Arq Leu Gly 155 Leu Ser Glu Ala Arg 160 Val Gin Val Trp Phe 165 Gin Asn Arg
AGA GCC AAG TGC CGC AAA CAA GAG AAT CAG ATG CAT AAA GGC GTC ATC 642
Arq A) a 170 Lys Cys Arg Lys Gin 175 Glu Asn Gin Met His 180 Lys G1 y Val Ile
-36CZ 297640 B6
TTG GGC Leu Gly 135
AAC ATG Asn Met
ACA GCC Thr Ala
GGA GCC
Gly Ala
AAC CAC Asn His
190
TTA CGG Leu Arg
CTA GAC Leu Asp
ATG CCT Met Pro
GCC TGC
Ala Cys
TTC CAA Phe Gin
CGA GTG
Arg Val
195
CAG GTC Gin val
GCA CCC Ala Pro
CAG GCT Gin Ala
TAC GTC
Tyr Val
200
CAG CTG Gin Leu
205
210
215
CAG CTG GAA GGC. GTG GCC CAC GCG Ala CAC CCG CAC CTG CAC His CCG CAC CTG Leu 786
Gin Leu Glu Gly Val 220 Ala His His 225 Pro His Leu Pro 230 His
GCG GCG CAC GCG CCC TAC CTG ATG TTC CCC CCG CCG CCC TTC GGG CTG 834
Ala Al a His Ala Pro Tyr Leu Mec Phe Pro Pro Pro Pro Phe Gly Leu
235 240 245
CCC ATC GCG TCG CTG GCC GAG TCC GCC TCG GCC GCC GCC GTG GTC GCC 882
Pro Ile Ala Ser Leu Ala Glu Ser Ala Ser Ala Ala Ala Val Val Ala
250 255 260
GCC GCC GCC AAA AGC AAC AGC AAG AAT TCC AGC ATC GCC GAC CTG CGG 930
Aid Ala Ala Lys Ser Asn Ser Lys Asn Ser Ser Ile Ala Asp Leu Arg
265 270 275 280
CTC AAG GCG CGG AAG CAC GCG GAG GCC CTG GGG CTC TG ACCCGCCGCG 978
Leu Lys Ala Arg Lys His Ala Glu Ala Leu Gly Leu
285 290
CAGCCCCCCG CGCGCCCGGA CTCCCGGGCT CCGCGCACCC CGCCTGCACC GCGCGTCCTG 1038
CACTCAACCC CGCCTGGAGC TCCTTCCGCG GCCACCGTGC TCCGGGCACC CCGGGAGCTC 1098
CTGCAAGAGG CCTGAGGAGG GAGGCTCCCG GGACCGTCCA CGCACGACCC AGCCAGACCC 1158
TCGCGGAGAT GGTGCAGAAG GCGGAGCGGG TGAGCGGCCG TGCGTCCAGC CCGGGCCTCT 1218
CCAAGGCTGC CCGTGCGTCC TGGGACCCTG GAGAAGGGTA AACCCCCGCC TGGCTGCGTC 1278
TTCCTCTGCT ATACCCTATG CATGCGGTTA ACTACACACG TTTGGAAGAT CCTTAGAGTC 1338
TATTGAAACT GCAAAGATCC CGG/XGCTGGT CTCCGATGAA AATGCCATTT CTTCGTTGCC 1398
AACGATTTTC TTTACTACCA TGCTCCTTCC TTCATCCCGA GAGGCTGCGG AACGGGTGTG 1458
gatttgaatg TGGACTTCGG AATCCCAGGA GGCAGGGGCC GGGCTCTCCT CCACCGCTCC 1518
CCCGGAGCCT CCCAGGCAGC AATAAGGAAA TAGTTCTCTG GCTGAGGCTG AGGACGTGAA 1578
CCGCGGGCTT TGGAAAGGGA CXJGGAGGGAG ACCCGAACCT CCCACGTTGG GACTCCCACG 1638
TTCCGGGGAC CTGAATGAGG ACCGACTTTA TAACTTTTCC AGTGTTTGAT TCCCAAATTG 1698
GGTCTGGTTT TGTTTTGGAT TGGTATTTTT TTTTTTTTTT TTTTTTGCTG TGTTACAGGA 17S8
TTCAGACGCA AAAGACTTGC ATAAGAGACG GACGCGTGGT TGCAAGGTGT CATACTGATA 1818
TGCAGCATTA ACTTTACTGA CATGGAGTGA AGTGCAATAT ΤΑΤΆΑΑΤΆΤΤ ATAGATTAAA 1878
AAAAAAATAG CA 1890
-37CZ 297640 B6 (2) Informace o sekvenci SEQ ID NO: 11:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 292 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 11:
Met Glu 1 Glu Leu Thr Ala 5 Phe val Ser Lys 10 Ser Phe Asp Gin Lys 15 Ser
Lys Asp Gly Asn Gly Gly Gly Gly Gly Gly Gly Gly Lys Lvs Asp Ser
20 25 30
Ile Thr Tyr Arg Glu Val Leu Glu Ser Gly Leu Ala Arg Ser Arg Glu
35 40 45
Leu Gly Thr Ser Asp Ser Ser Leu Gin Asp Ile Thr Glu Gly Gly Gly
90 55 60
His Cys Pro Val His Leu Phe Lys Asp His Val Asp Asn Asp Lys Glu
65 70 75 80
Lys Leu Lys Glu Phe Gly Thr Ala Arg Val Ala Glu Gly Ile Tyr Glu
85 90 95
Cys Lys Glu Lys Arg Glu Asp Val Lys Ser Glu Asp Glu Asp Gly Gin
100 105 I 10
Thr Lys Leu Lys Gin Arg Arg Ser Arg Thr Asn Phe Thr Leu Glu Gin
115 120 125
Leu Asn Glu Leu Glu Arq Leu Phe Asp Glu Thr His Tyr Pro Asp Ala
110 135 140
Phe Me t Arg Glu G1 u Leu Ser Gin Arg Leu Gly Leu Ser Glu Al a Arg
145 150 155 160
Val Gin val Trp Phe Gin Asn Arg Arg Al a Lys Cys Arg Lys Gin Glu
165 170 175
Asn Gin Met His Ly3 cly Val Ile Leu Gly Thr Ala Asn His Leu Asp
180 185 190
Ala Cys Arg Val Al a Pro Tyr val Asii Met Gly Al a Leu Arg Met Pro
195 200 205
Phe Gin Gin Val Gin Ala Gin Leu Gin Leu Glu Gly Val Ala His Ala
210 215 220
His Pro His Leu His Pro His Leu Ala Ala His Ala Pro Tyr Leu Met
225 2 30 235 240
Phe Pro Pro Pro Pro Phe G1 y Leu Pro Ile Ala Ser Leu Ala Glu Ser
245 250 255
Ala Ser Ala Ala Ala Val Val Ala Al a Ala Ala Lys Ser Asn Ser Lys
2 60 265 270
Asn Ser Ser Ile Al a Asp Leu Arg Leu Lys Ala Arg Lys His Ala Glu
275 280 285
Ala Leu Gly Leu
290
-38CL 297640 B6 (2) Informace o sekvenci SEQ ID NO: 12:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 1354 párů bází s (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina io (A) POPIS:/popis = „SHOXb“ (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91..768 (xi) POPIS SEKVENCE: SEQ ID NO: 12:
GTGATCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA114
Met Glu Glu Leu Thr Ala Phe Val
295300
TCC Ser AAG TCT TTT GAC CAG AAA AGC Ser AAG Lys GAC Asp 310 GGT AAC GGC GGA GGC GGA Gly 162
Lys Ser Phe Asp .305 Gin Lys Gly Asn Gly Gly Gly 315
GGC GGC GGA GGT AAG AAG GAT TCC ATT ACG TAC CGG GAA GTT TTG GAG 210
Gly Gly Gly Gly Lys Lys Asp Ser Ile Thr Tyr Arg Glu Val Leu Glu
320 325 330
AGC GGA CTG <;cg CGC TCC CGG GAG CTG W.G ACG TCG GAT TCC AGC CTC 258
Ser Gly Leu Ala Arg Ser Arg Glu Leu Gly Thr Ser Asp Ser Ser Leu
335 340 345
CAG GAC ATC ACG GAG GGC GGC GGC CAC TGC CCG GTG CAT TTG TTC AAG 306
Gin Asp Ile Thr Glu Gly G1 y Gly His Cys Pro Val His Leu Phe Lys
350 355 360
GAC CAC GTA GAC AAT GAC AAG GAG AAA CTG AAA GAA TTC GGC ACC GCG 354
Asp H1 3 Val Asp Asn Asp Lys G1 u Lys Leu Lys G1 u Phe Gly Thr Al a
365 370 375 380
AGA GTG GCA GAA GGG ATT TAT GAA TGC AAA GAG AAG CGC GAG GAC GTG 402
Arg Val Ala Glu Gly Ile Tyr Glu Cys Lys Glu Lys Arq Glu Asp Val
385 390 395
AAG TCG GAG GAC GAG GAC GGG CAG ACC AAG CTG AAA CAG AGG CGC AGC 450
Lys Ser Glu Asp Glu Asp G1 y Gin Thr Lys Leu Lys Gin Arg Arg Ser
400 405 4 10
CGC ACC AAC TTC ACG CTG GAG GAG CTG AAC GAG CTC GAG CG7\ CTC TTC 498
Arg Thr Asn Phe Thr Leu Glu Gin Leu Asn Glu Leu Glu Arg Leu Phe
415 420 425
GAC GAG ACC CAT TAC CCC GAC GCC TTC ATG CGC GAG GAG CTC AGC CAG S46
ASp Glu Thr His Tyr Pro Asp Ala Phe Met Arg Glu Glu Leu Ser Gin
430 435 440
CGC CTG GGG CTC TCC GAG GCG CGC GTG CAG GTT TGG TTC CAG AAC CGG 594
Arg Leu Gly Leu Ser Glu Al a Arg Val Gin Val Trp Phe G’s n Asn Arg
14 5 4 50 455 4 60
-39CZ 297640 B6
AGA GCC AAG TGC CGC AAA CAA GAG AAT CAG ATG CAT AAA GGC GTC ATC642
Arg Ala Lys Cys Arg Lys Gin Glu Asn Gin Met His Lys Gly Val Ile
465 470475
TTG GGC ACA GCC AAC CAC CTA GAC GCC TGC CGA GTG GCA CCC TAC GTC690
Leu Gly Thr Ala Asn His Leu Asp Ala Cys Arg Val Ala Pro TyrVal
480 485490
AAC ATG GGA GCC TTA CGG ATG CCT TTC CAA CAG ATG GAG TTT TGC TCT738
Asn Met Gly Ala Leu Arg Met Pro Phe Gin Gin Met Glu Phe CysSer
495 500505
TGT CGC CCA GGC TGG AGT ATA ATG GCA TGA TCTCGACTCA CTGCAACCTC788
Cys Arg Pro Gly Trp Ser Ile Met Ala ·
S10515
CGCCTCCCGA GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC GAGTAGCTGG GATTACAGGT848
GCCCACCACC ATGTCAAGAT AATGTTTGTA TTTTCAGTAG AGATGGGGTT TGACCATGTT908
GGCCAGGCTG GTCTCGAACT CCTGACCTCA GGTGATCCAC CCGCCTTAGC CTCCCAAAGT968
GCTGGGATGA CAGGCGTGAG CCCCTGCGCC CGGCCTTTGT AACTTTATTT ΤΤΛΆΤΤΤΤΤΤ1028
ΤΤΤΤΤΤΤΤΤΛ AGAAAGACAG AGTCTTGCTC TGTCACCCAG GCTGGAGCAC ACTGGTGCGA1088
TCATAGCTCA CTGCAGCCTC AAACTCCTGG GCTCAAGCAA TCCTCCCACC TCAGCCTCCT1148
GAGTAGCTGG GACTACAGGC ACCCACCACC ACACCCAGCT AATTTTTTTG ATTTTTACTA1208
GAGACGGGAT CTTGCTTTGC TGCTGAGGCT GGTCTTGAGC TCCTGAGCTC CAAAGATCCT1268
CTCACCTCCA CCTCCCAAAG TGTTAGAATT ACAAGCATGA ACCACTGCCC GTGGTCTCCA1328
AAAAAAGGAC TGTTACGTGG AAAAAA1354 (2) Informace o sekvenci SEQ ID NO: 13:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 226 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární io (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 13:
-40CZ 297640 B6
Met 1 Glu Glu Leu Thr Ala S Phe Val Ser Lys 10 Ser Phe Asp Gin Lys 15 Ser
Lys Asp Gly Asn 20 Gly G1 y G1 y Gly Gly 25 Gly G1 y Gly Lys Lys 30 Asp Ser
Ile Thr Tyr 35 Arq Glu Val Leu Glu 40 Ser Gly Leu Ala Arg 45 Ser Arg Glu
Leu G1 y 50 Thr Ser Asp Ser Ser 55 Leu Gin Asp Ile Thr 60 Glu Gly Gly Gly
His 65 Cys Pro Val His Leu 70 Phe Lys Asp Hi3 val 75 Asp Asn Asp Lys Glu 80
Lys Leu Lys Glu Phe 85 GLy Thr A] a Arg Val 90 Ala Glu Gly Ile Tyr 95 Glu
Cys Lys Glu Lys 100 Arq Glu Asp Val Lys 105 Ser Glu Asp Glu Asp 110 Gly Gin. r
Thr Lys Leu 115 Lys Gin Arg Arq Ser 120 Arg Thr Asn Phe Thr 125 Leu Glu Gin
Leu Asn 130 Glu Leu Glu Arg Leu 135 Phe Asp Glu Thr His 140 Tyr Pro Asp Ala
Phe 145 Met Arg Glu Glu Leu 150 Ser Gin Arq Leu Gly 155 Leu ser Glu Ala Arg 160
Val Gin Val Trp Phe 165 Gin Asn Arg Arg Al a 170 Lys Cys Arg Lys Gin 175 Glu
Asn Gin Met His Lys G1 y Val Ile Leu G1 y Thr Ala Asn His Leu Asp
180 185 190
Ala Cys Arg Val Ala Pro Tyr Val Asn Met Gly Ala Leu Arg Met Pro
195 200 205
Phe Gin Gin Met Glu Phe cys Ser Cys Arg Pro Gly Trp Ser Ile Met
210 215 220
Ala
225 (2) Informace o sekvenci SEQ ID NO: 14:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 32367 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „kosmid: LLNOYCO3'34F5“
-41 CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 14:
TTTCTCTGTC TCCATCCCTC TGTCTCTCCC TTTCTCTCTG TCTTTCCTTG TCTCTCTCTT 60
TCTCTCTCTC TCTCCATCTC TCTCTCTCCC TGTCTCTCTC TCTCCATCTC CCCGTCTCTC 120
CGTTTCTCTC TCTGCCTCTC CCTGTCTGTC TCTCTCTTTC TGTGTCTTAC ACACACCCCA 180
ACCCACCGTC ACTCATGTCC CCCCACTGCT GTGCCATCTC ACACAAGTTC ACAGCTCAGC 240
TGTCATCCTG GGTCCCCAGG CCCCGCCGGG GAGGAAGATG CGCCGTGGGG TTACGGGAGG 300
AAGGGGACTC CGGGCCTCCT GGTGCCCCAC TTTATTTGCA GAAGGTCCTT GGCAGGAACC 360
GTGACGCGTT TGGTTTCCAG GACTTGGAAA ACGAATTTCA GGTCGCGATG GCGAGCACCG 420
(XTTCCCCTG AAGCACATTC AATAGCGAGA GGCGGGAGGG AGCGAGCAGG AGCATCCCAC 480
CATGAAAACC AAAAACACAA GTATTTTTTT CACCCGGTAA ATACCCCAGA CGCCAGGGTG 540
ACAGCGCGGC GCTAAGGGAG GAGGCCTCGC gccggggtcc GCCGGGATCT GGCGCGGGCG 600
GAAAGAATAT AGATCTTTAC GAACCGGATC TCCCGGGGAC C7GGGCTTCT TTCTGCGGGC 660
GCTGGAGACC CGGGAGGCGG CCCCGCGGAT CCTCGGCCTC CGCCGCCGCC GCCTCCCAAG 720
CGCCCGCGTC CCGGTTTGGG GACACCCGGC CCCTTCTTCT CACTTTCGGG GATTCTCGAG 780
CCGCGTTCCA TCTCACCAAC TCTCCATCCA AGGGCGCGCC GCCACCAACT TGGAGCTCAT 840
CTTCTCCCAA GATCGTGCGT CCCCGGGGCG CCCGGGTCCC CCCCCTCGCC ATCTCAACCC 900
CGGCGCGACC cgggcgcttc CTGGAAAGAT CCAGGCGCCG GGCTCTGCGC TCCTCCCGGG 960
AGCGAGGGCG GCCGGACGAC TGGGACCCTC CTCTCTCCAG CCGTGAACTC CTTGTCTCTC 1020
TGTCTCTCTC TGCAGGAAAA CTGGAGTTTG CTTTTCCTCC GGCCACGGAG AGAACGCGGG 1080
TAACCTGTGT GGGGGGCTCG GGCGCCTGCG CCCCCCTCCT GCGCGCGCGC TCTCCCTTCC 1140
AAAAATGGGA TCTTTCCCCC TTCGCACCAA GGTGTACGGA CGCCAAACAG TGATGAAATG 1200
-42CZ 297640 B6
AGAAGAAAGC CAATTGCCGG CCTGGGGGGT GGGGGAGACA CAGCGTCTCT GCGTGCGTCC 1260
GCCGCGGAGC CCGGAGACCA GTAATTGCAC CAGACAGGCA GCGCATGGGG GGCTGGGCGA 1320
GGTCGCCGCG TATAAATAGT GAGATTTCCA ATGGAAAGGC GTAAATAACA GCGCTGGTGA 1380
TCCACCCGCG CGCACGGGCC GTCCTCTCCG CGCGGGGAGA CGGGCGCATC CACCAGCCCC 1440
GGCTGCTCGC CAGCCCCGGC CCCAGCCATG GAAGAGCTCA CGGCTTTTGT ATCCAAGTCT 1500
TTTGACCAGA AAAGCAAGGA CGGTAACGGC GGAGGCGGAG GCGGCGGAGG TAAGAAGGAT 1560
TCCATTACGT ACCGGGAAGT TTTGGAGAGC GGACTGGCGC GCTCCCGGGA GCTGGGGACG 1620
TCGGATTCCA GCCTCCAGGA CATCACGGAG GGCGGCGGCC ACTGCCCGGT gcatttgttc 1680
AAGGACCACG TAGACAATGA CAAGGAGAAA CTGAAAGAAT TCGGCACCGC GAGAGTGGCA 1740
GAAGGTAAGT TCCTTTGCGC GCCGGCTCCA GGGGGGCCCT CCTGGGGTTC GGCGCCTCCT 1800
CGCCACGGAG TCGGCCCCGC GCGCCCCTCG CTGTGCACAT TTGCAGCTCC CGTCTCGCCA 1860
GGGTAAGGCC CGGGCCGTCA GGCTTTGCCT AAGAAAGGAA GGAAGGCAGG AGTGGACCCG 1920
ACCGGAGACG CGGGTGGTGG GTAGCGGGGT GCGGGGGGAC CCAGGGAGGG TCGCAGCGGG 1960
GGCCGCGCGC GTGGGCACCG ACACGGGAAG GTCCCGGGCT GGGGTGGATC CGGGTGGCTG 2040
TGCCTGAAGC CGTAGGGCCT GAGATGTCTT TTTCATTTTC TTTTTCTTTC CTTTCCTTTT 2100
TTTGTTTGTT TGTTTGTTTG TTTGAGACAG AGTCTCGCTC TGTCCCCCAG GCTGGAGTGC 2160
AGTGGTGCGA TCTCGGCTCA CTGCAACCTC CGCCTCCTGG GTTCAAGCGA TTCTCCTGCC 2220
TCAGCCTCCC CAGTAGCTGG GATTACAGGC ATGCACCACC ACGCCTGGCT AATTTTTGTG 2280
CTTTTAGTAA AGACGGGGAT tcaccatgtt GGCCAGGCTG GTCTCGAACT CCTGACCTCA 2340
GGTGATCC/3C CCGCCTCGGC CTCCCAAAGT GCTGGGATGA CAGGCGTGAG GCACCGCGCC 2400
CGGCCTGGGT CCTGACGGCT TAGGATGTGT GTTTCTGTCT CTGCCTGTCT GCCTTGTATT 2460
TACGGTCACC CAGACGCACA GAGGAGCCGT CTCCACGCGC CTTCCGAGCG CTCAGCGCCT 2520
GCCGGGCCCC CGGAGATCAC GGGAAGACTC GAGGCTGCGT GGTAGGAGAC GGGAAGGCCC 2580
CCXjGTGAGCT CGGTTCTGTT TCCTTTAAGG AACCCTTCAT TATTATTTCA TTGTTTTCCT 2640
TTGAAGGTCG AGG-CTTGATC TTGGCGAAAG {.TGTTGGGTC CATAAAAACC ACTCCCGTGA 2700
‘ . 1 »4_rZ\( r Ϊ ' Áf CCGÍiGATCTG ( íM 1^7* A.7* X. gzVx;g<x.(.;:c (z*x*j^./AAíjv, I Cj GCGGCTTCGC 2760
GÍXCGCGTCC TAAGTCAAGG TTGTCAGAGC GCAGCCGGTT GTGGGCGGCC CGGGGGAGCT 2820
CCÍXTCTGGC CCTTCCTCCT GAGACCTCAG TGGTGGGTCG TCCCGTGGTC GAAATCGGGG 2880
AGTAAGAGGC TCAGAGAGAG GGGCTGGCCC CGGGGATCTC TGTGCACACA CGACAACTGG 2940
gcggcataca TCTTAAGAAT AAAATGGGCT GGCTGTGTCG GGGGACAGCT GGAGACGGCT 3000
ATGGACGCCT GTTATGTTTT CATTACAAAG ACGCAGAGAA TCTAGCCTCG GCTTTTGCTG 3060
ATTCGCAGAG TTGAGGTGCG AGGGTGAATG CCCCAAAGGT AATTCTTCCT AAGACTCTGG 3120
GGCTACCTGC TCTCCGGGGC CCTGCATTTG GGGTGTGGAG TGGCCCCGGG AAATAGCCCT 3180
TGTATTCGTA GGAGGCACCA GGCAGCTTCC CAAGGCCCTG ACTTTGTCGA AGCAGAAAGC 3240
-43CZ 297640 B6
TGTGGCTACG GTTTACAAAG CAGTCCCCGG TTTCTGACCG TCTAAGAGGC AGGAGCCCAG 3300
CCTGCCTTTG ACAGTGAGAG GAGTTCCTCC CTACACACTG CTGCGGGCAC CCGGCACTGT 3360
AATTCATACA CAGAGAGTTG GCCTTCCTGG ACGCAAGGCT GGGAGCCGCT TGAGGGCCTG 3420
CGTGTAATTT AAGAGGGTTC GCAGCGCCCG GCGGCCGCTT CTGTGGGGTT GCTTTTTGGT 3460
TGTCCTTCGC AGACACCGTT TTGCTCCTCT GAACTCTCTC TTCTCCCCCT GGCCGTGGAC 3540
CCGGGAGAGC AAAGTGTCCT CCAGACCTTT TGAAAGTGAG AGGAAAATAA AGACCAGGCC 3600
AAAGACCCAG GGCCACAGGA GAGGAGACAG AGAGTCCCCG TTACATTTTC CCCTTGGCTG 3660
GGTGCAGAAA GACCCCCGGG CCAGGACTGC CACCCAGGCT ACTATTTATT CATCAGATCC 3720
AAGTTAAATC GAGGTTGGAG GGCAGGGGAG AGTCTGAGGT TACCGTGGAA GCCTGGAGTT 3780
TTTGGGAACA GCGTGTCCCC GCCGAGCCTG GGAGCCCGTG GGTTCTGCAA AGCCTGCGGG 3840
TGTTTGAGGA CTTTGAAGAC CAGTTTGTCA GTTGGGCTCA ATTCCTGGGG TTCAGACTTA 3900
GAGAAATGAA GGAGGGAGAG CTGGGGTCGT CTCCAGGAAA CGATTCACTT GGGGGGAAGG 3960
AATGGAGTGT TCTTGCAGGC ACATGTCTGT TAGGAGGTGA AACAGAATGT GAAATCCACG 4020
TTGGAGTAAG CGTCCAGCGC TGAATGTAGC TCGGGGTGGG GTGGGAGGGC CCTGGTGTGG 4080
ATCGTGGAAG GAAGAAAGAC AGAACAGGGT GCTAGTATTT ACCCCGTTCC CTGTAGACAC 4140
CCTGGATTTG TCAGCTTTGC AAGCTTCTTG GTTGGAGCGG CCTTGCCTGT GCCCCTTTGA 4200
GACTGTTTCC AGACTAAACT TCCAAATGTC AGCCCCTTAC CCTTGACAGC AAGGGACATC 4260
TCATTAGGGC ATCGCGTGCT TCTCATCTGT GCTCAGCAGG CCCGAGATAG GAACAGAGGG 4320
GCGTTGGAGA TGCCACTTCC ACCAGCCCTG GGTTGAAGGG GAGCGAGGGA GACACCTTTT 4380
ACTTAAACCC CTGAGCTTC/. TGAGAGAGGC TGAATGTCTA AAATGAGGAA GAAAAGGTTT 4 4 40
TTCACCTGGA aacgcttgag GGCTGAGTCT TCTGCCCTTC TGAC7CCCCC AGCAAATACA 4500
GACAGGTCAC CAACTACTGG AGATGAGAAA ÚTGCCATTTT TGGCACACTC TGGTGGGGTA 4 560
GGTGCCCGAC CGCGTGTGAA AAAGTGGGAA GGAGAGATTT CTGCGCACGG GGTTCAGCCC 4620
CCAGGCGCGG TGGCGCATTC AGGTACTCAG ACGCGGTTCT GCTGTTCTGC TGAGAAACAG 4680
GCTTCGGGTA GGGGCTCCTA ΤΓ··<χ : A(, r~(GCGGAGG GACCCCCAGC CCTCCTGCGC 4740
TGCAGCGGTG GGGATAGCGT CTCTCCGTAG (VCTAGAATC TGCAACCCGC CCCGGGTCCT 4800
CCCCGTGTCC TTCCCGGGCG TCCCGCCGGG GAT C CCA CAG TTGGCAGCTC TTCCTCAAAT 4860
TCTTTCCCTT AAAAATAGGA TTTGACACCC CACTCTCCTT AAAAAAAAAA AATAAGAAAA 4920
AAAGGTTAGG TTATGTCAAC AGAGGTGAAG TGGATAATTG AGGAAACGAT TCTGAGATGA 4 980
GGCCAAGAAA ACAACGCTCG TGCAAAGCCC AGGTTTTTGG GAAAGCAGCG AGTATCCTCC 5040
TCGGCTTTTG CGTTATGGAC CCCACGCAGT TTTTGCGTCA AAGCGCATTG GTTTTCGAGG 5100
GCCCCCTTTC CACCGCGGGA TGCACGAAGG GGTTCGCCAC GTTGCGCAAA ACCTCCCCGG 5160
CCTCAGCCCT GTGCCCTCCG CTCCCCACGC AGGGATTTAT GAATGCAAAG AGAAGCGCGA 5220
-44CZ 297640 B6
GGACGTGAAG TCGGAGGACG AGGACGGGCA GACCAAGCTG AAACAGAGGC GCAGCCGCAC 5280
CAACTTCACG CTGGAGCAGC TGAACGAGCT CGAGCGACTC TTCGACGAGA CCCATTACCC 5340
CGACGCCTTC ATGCGCGAGG AGCTCAGCCA GCGCCTGGGG CTCTCCGAGG CGCGCGTGCA 5400
GGTAGGAACC CGGGGGCGGG GGCGGGGGGC CCGGAGCCAT CGCCTGGTCC TCGGGAGCGC 5460
ACAGCACGCG TACAGCCACC TGCGCCCGGG CCGCCGCCGT CCCCTTCCCG GAGCGCGGGG S520
AGGTTGGGTG AGGGACGGGC TGGGGTTCCT GGACTTTTGG AGACGCCTGA GGCCTGTAGG SS80
ATGGGTTCAT TGCGTTTGTT TTTCACCAAC AGCAAACAAA TATATATACA TATATATTAT 5640
ACAAATAACA AATAAATATA TATGTTATAC AGATGGGTAT ATTGTATATA TTATAGATAT 5700
TTGTTCGTCC TTGGTGCAAA GACACCCGGT GAACCCATAT ATTGGCTCCT GACTGCCTTC 5760
GGTTCCCCTG GGATTGGTTA TAGGGGCAAC ACATGCAAAC AAAACTTTCC CTGGATTATA 5820
CTTAGGAGAC GAAGCTACAG ATGCGTTTGA TCCAGAGTGT TTTACAAGAT TTTTCATTTA 5880
AAAAAAAATG TGTCTTTTGG CCCCTGATTC CCCTCCGTCT TCCCGTGTGG CTGCATTGAA $940
AAGGTTTCCT TAGGATGAAA GGAGAGGGGT GTCCTCTGTC CCTAGGTGGA GAGAAACAGG 6000
GTCTTCTCTT TCCTCCGTTT TTTCACCTAC CGTTTCTATC TCCCTCCTCC CCTCTCCAGC 6060
CCTGTCCTCT GCTACAAACC ACCCCCTCCT CCCTCCGGCT GTGGGGAGCG CAGGAGCACG 6120
TTGGGCATCT GGATGAGCGG AGACTATTAG CGGGGCACGG GGGCTCCCCG AGGAGCGCGC 6180
GAATTCACGC TGCCCCATGA GACCAGGCAC CGGGGGGCGG AGGGGCCTTG GGTGTCCGCA 6240
GAGGGACGGG CGGGCAGAGC CTTCCTCCGC ATTCTAAACA TTCACTTAAA GGTATGAGTT 6300
TATTCAGGG GTGCTGCTGG GAGACCCTCC .ΑΛ.ΛΤGGv.. TC. TTCCAGCCCC TGCCTGACAG 6360
TTCAGCTCCC CTGGAAGGTC AACTCCTCTA GTCCTTTCTC CTGGTTCTGG GCAGGACAGA 6420
AGTG'X^Z,G;\ GGGAGAGAGA GAGAGAGAGA GAGAGAGACG GTCAGGATCC CCGGACCCTG 6480
GGGAACCCGT CAAAAATAAA TGAAATTAAG ATTGCCGACC AGAGAGAGAA CCGTGACAAA 6540
GCAAACGGCG TTCAAAGCAA AGAGACGAAC TGAAAGCCCG TTCCCGTAGG ACTGGTTATG 6600
AGGTCAACAC ATTCAAACAC AGCTTGCTCT GGATTTTGCT GAGCAGAGGA AGATACAGAT 6660
GCATTTGATC CAAAGTGTGT TACATCTTTC ATTATATGTG TGTCTATATA TATAAACATA 6720
ΤΑΤΑΑΑΓΛΤΑ TAAACATACA TAAATGTATG TAAATATATA T/iATCTATAT ACATATATAA 6780
ATATATAAAC ACATATATAA TATATAAATC TATAAACATA TATAATATAT AAACATAAAT 6840
ATATAAACAT ΛΤΛΤΆΑΤΑΤΑ ΤΛΛΑΤΑΤΑΤΤ AACATATATA AAATATGTAT AAATATATAT 6900
AAACATATAA ACATATATAA ATATATAAAC ΑΤΛΤΑΑΑΤΑΤ ATAAACATAT ATAAATATAT 6960
ACAAACATAT TGTATATATA ΤΑΑΑΤΑΤΑΤΛ TAAAAACATA TATATACATA ΤΑΑΑΑΑΤΑΤΛ 7020
TATAAACATA TATACATATA AAGAAATATA TATAAACATA TATACATATA AATATACATA 7080
TATAAACATA TATATACATA AAATATATAT AAACATATAT ACATATAAAA ATATATATAT 7140
ATTAACATAT ATATACATAT AAAAATATAT ATATTAACAT ATATATACAT ATAAAAATAT 7200
ATATATATTT TTGGCCCCTG ATTCCCTTCG GTTCCTGTGG GATGGGTGAT TGAGTCAACA 7260
-45 CZ 297640 B6
CATTCAAACA CAACTTTTCC ATCGATGTTG CTTAGGAGAT GAGGATACAG ATGCGTTTGA 7320
TGGAGAGGGT TTTACAAGCT CTTTCATTTA AATATATATA TATATATATA TATATTTTTT 7380
GGCTCCTGAT TCTCTTCCGT CTTCCCATGT GGCTGCATTT TAAAAGGCTT CCCTAAGATC 7440
GTTACGATTA AATCAACCCT CCCCAGGCAT CTTTACCGAG GGCTGTGGTC CCCAAAGCGA 7500
TACAGCCCAG GAGGGAGAGA GGCTTTGGTG ACTTGGAGGA AGGACTGTGT CCCTCCTTAG 7560
GGCGTCTGTG GCCTCAGTGA GGGAAGGAAG CTGCATCAGA CAGGGGTTTC CTCGCTGTCC 7620
ACC.CCTCTGG CAGAAGATGG ATTGGGCTGC CCCGTATAAA TTAATGAAAA GATTAAAGTT 7680
TCGCTAAAGG GGACATCGAG TTTATGTGTC ATCTCCTGGT GTCTGTGTGC CTGGGATCTG 7740
CAATATATCC CAGCCCTTGA TGTACTGTTT CTATAAAAAT AAATTACTTG ΤΆΆΤΤΤΛΑΤΤ 7800
CCACACTATT TCTTTCCGTA GTCTATTACC GACGAGAGCA CGTTAGTTCA GCTGCGGAAA 7860
ATTGGTTGTG GGGTGTGTGC GGACCCCGAG AACGCCCTAA AATAAAGACA AATCGGGGAC 7920
AAGCTGGGGG TTATCGATTG CAGGGGTCGC ATGAAAATTT AACGACGGTA AATAATAATA 7980
AAAACAAACA TGGGAATGCA ATAAAAGACA TAATTCTCGA TCGCCGCGGG GGGAAAGGAT 8040
CCTATAGTAA AGGCGAGTGC GCTTTGAGGG GTCATAAAAA TCAATTAGTT CCAACACCCA 8100
CGTCCCGCGT TGAGGGGACG GGGACGAGCA GGGACAGAAA AAGAAACCAT ATTTGAATCC 8160
CATCTCTCTG TGAATTCTTG GGTCACATGG GTCTCAGTAC AGCCCGTCCC GTGCTGTGAC 8220
CGGATAGAGT TTCAATTTAC TGTGGAAATT TGCTGTAAAT AAATTGAGCA TCCGATAGAA 8280
GCTGTTGCTG ATTAACCTTT TATTTTTAGC GTGGCCCTGC AAAGTCGTAT GACCCAGCTG 8340
TCAGGCTTCT AATCGAAAGT TATGAGACCA CGGTGAGGGG CAGGCGGTAA TTTAATTACA 8 4 00
ACAAATATCT TTGGGTTTAT GGCGCAGAGC ΤΑΛΑΤΤΆΑΑΤ GTCATTATTC ACTGTCTGTA 8460
A7GGAAATCA AAAGGAAATC GGATTACGGC ATTTGGGAAA GAAAGCGGGG AGTGCTCTTT 8520
AATGAAGAAA TAACTGTGTT AAGCAGTGTC ACACACTTCA CTTACCATAT TCGGGCCTAA 8580
TTGGAATGGA TCGTGAATCA CTCCAAGACT GATTTATTAG CGCTTCACGC AGCGGCTAAT 8640
TCATCACTTG TATTCTTCAT CATTTTTTTT TTTCCTCTCG CCGTGTTGAA GGGAGAGTGA 8700
ATGAGGCTTT CCACGTTTCA GGAGGATTTT CTTTTTTGAA AAATGCCCTT CCAGAGGCTT 8 760
TTGGGTGGCT GGCTTGCTTT CTGGGCCCTG GAGGAGACAG GCGGAGAGTC CAGGTGGGCA 8820
TGGAGAGGCA CAGTGGCAGG TCACCTGGAT GGTCAGTGGA GGTGGAGGTC TGAAGGCGCC 8880
agctttggaa ATTATTGGTG AATTTCGATG TCAGGACCAG GCAGGGGCCT TTTTGGCGGG 8940
GGTGTGAGGG AGGATGACTT TGCTGGGAAA CAGGATCAGG TTCTCCAGGC GCACTGCAGC 9000
CCGGTAGGAC CCACTTTGGA AATGAAAAGC CAGTTCCGAA AGCTGGGCTG GAAGCTTCCG 9060
TGTTGGGTTC AAGAGCAAGT TCACGTTGCG CTGTGTAGAC TCCTGGCTGC TCCCAAACTC 9120
TGAGGGTTTT CTGAGGTTCC CTTCATAGGG GCACCGGCCC TGGGCCATGC ACAGTGCGTA 9180
AGGGTGGCTG TGGGCCGAGG GACCCAGCAC GTGTTTTGCC CACAACAGCC GGAGTGACTG 9240
-46CZ 297640 B6
GTTCACTCAC CGCCTTGGCG GAGGACGCCT GTTCTCTGGA CGAATCATTT CTCTTGGGTG 9300
GTGACTGCCT TGTGGGTGAA GGTGCAGGTT TTCTGCCACA GAAAACCTGT TAGGAGGAAT 9360
TAAGCGACTA AGACTGTCAG GGAGGTGGTG GTGGGGGAGA GGAGGGGGTG GTGTCCAGAT 9420
TACCAGGCAT AGGCTAAACT GCCTGCACTC TCCAGCTGGT CTGTCTGTGG AGGAGGGGAT 9480
TGTCAATACT GGGAGAGCAG AGGAGGCTCG TAGGAGGTGA GAGGGGGTGG AATTTGCATG 9540
CAAATCTTCA CATGAGGGCT GTGTGAATTT CTCCAGCCTC CTGAGGGTCC CCTGCGCTAT 9600
TGCACTCAAC TTCTTGATAG TTTACCCCAA GACTCAGAAG TCCTTAGAGG GGCAGAATGC 9660
CCCCACCACA AAGCCTGCTA TCCTTGGGCG TCCTCAGGAC CCTTGGTCAT GAATGGGACC 9720
CTTTCATGTA TGGGGACCCT TGGTAATATG AATGGGACGC CTTCAGCTCC CCAGGGCTTC 9780
CGAGGAGGCC GAGAAGGGCA AAGACACTTC CGAGGAGGCC GAGAAGGGCA AAGACATTTT 9840
CTGGGCTTGG TGTGTCAAGA GCTAGATTGG AGAAGGGGCT GGATTTGGAA CTCTTTAGCC 9900
ATCAGCTCAC CCTCTCCGTT TGTGGCTAAA GTCTGAAGGT GGAAACTTCG GTTCTCCTAC 9960
AGGGTCTACA GGAGTTGGGG GGCGGGGCGC CCACACAGAA CGCTGGAAAG TTCGACAGTC 10020
CACTTCCACT GGCTCGGAAC TCACTTTTTC ACCTTAAGTT CATCAGCGGT AACGCATAGG 10080
TCTCACTTAG GCAGGGCACG GATGATTTAA CAATTTCTAC TTCTAGGTCA GGTGCGGTGG 10140
CTCACACCTC TAATCCCAGC ACTTTGGGAG GCCCAGGAGG GTGGATCGCT TGAGGTCAGG 10200
AGTTTGAGAC CAGCCTGGCC AACATGGTGA AACCCCGTCT CTACTAAAAT ACGAAAATTA 10260
GCCAGGCATG GTGGTGAGCA CCTGTAATTC CAGCTACTCG GGAGGCTGAG GCAGGAGAAT 10320
CGCTTGAACC TGGGA^TGG ACGTTGCA.GT GAGGTGAGAT CACACfACTG CACTCTAGCC 10380
TGGATGAGAG AGCAAGACTC TGTCTCAAAA ACAAAATAAA ACAAAAACAA AACAAAAATC 10440
/AAA AAAGAAA ACCCAATTTC CAGTTCTAGG CCAGGTGCAG TGGCTCACGC CTGTCATCCC 10500
AGCACTTTGG GAGGCCCAGG AGGGTGGATU GCTTGAGGTC AGGAGTTCGA GACCAGCCTG 10560
GCCAACATGG TGAAACCCCA TCTCTACTAA AAATACAAAC GTTAGCTGGG TGTGGTGGTG 10620
TGCGCCTGTA ATCCCAGCTA CTCGGGAAGC TGAGGCTGGA GAATTGCTTG AATCTGGGAG 10680
GTGGAGGTTG <'A<Y,GAG<X.G AGATAGTG·'C ACTGCAGTCC A(A'CTí.GACC AGAGAGCAAG 10740
ACTCCGT: :TC AAAAACAAAA GAAAÍ žCAAAA ACAAAAAACA AGAGACCAGC CTGGCCAACA 10800
TGGTGAAACC :x:gtctctac TAAAATACAA AATTAGCCGG GCATGGTGGT GGGCACCTGT 10860
AGTCCCAGCT ACTCGGGAGG CTGAGGCAGG AGAATGGCTT GAACCTGGGA GGTGGAGCTT 10920
GCAGTGAGCC GAGATAGTGC CACTGCACTC CAGCCTGGGC GACAGAGCGA GACTTGATTT 10980
CAGAACCACC ACCACCACAA CAAAACAAAA CAAAAAATCC AAAAAAACCC CAATTTCCAG 1 1040
TACTAGGTAG TCAGTGATGC AGGGCTGGAG ACAGAGGGGC GGTAAGTGTC TGGGCGCCCA 11100
CCATCAGTCA CCTCCCAGCT CCCAGAGGTG CAAAGTGCTT GGTTCAGCCT CATGGGAAGG 11160
ATGCTCCCTG GGGAGGCTGG GCTGGGTTCA CAGGGCTCTT CACATCTCTC TCTGCTTCTC 11220
CCCAAGGTTT GGTTCCAGAA CCGGAGAGCC AAGTGCCGCA AACAAGAGAA TCAGATGCAT 11280
-47CZ 297640 B6
AAAGGTGGGT GTCGGGACTG GGGGGACCTG AAGCTGGGGG ATCCTGCTCC AGGAGGGATG 11340
GGGTCGACGA GGTGCTGGCT ACACCCAGGA CCACCACACT GACACCTGCT CCCTTTGGAC 11400
ACAGGCGTCA TCTTGGGCAC AGCCAACCAC CTAGACGCCT GCCGAGTGGC ACCCTACGTC 11460
AACATGGGAG CCTTACGGAT GCCTTTCCAA CAGGTAGCTC ACTTTTTCTT CCTCTGAAGA 11520
TCCCTAGGGA CCTGCTGCTC CCTTCCCCTT TCCCCTATTT GCTGCCGCAT CCTGACACTC 11580
CTAGTCCCTC CCTGCCCCTG CAGACTTCTC AGCTGGCCCT TAGAAAAAAA GCCTCTTTTC 11640
CGAGGAGGCA TTTACAGGCA CCTTGGCACC TATGAAATCA GGCTGGGCCA GGCGGGGTGG 11700
CTCACACCTG TCATCCCAGC ACTTTGGGAG GCTGAGGAGG GTGCATCACC TGAGATCAGG 11760
AGTTCAAGAC CAGCCTGGCC AACTTAACGA AACCCCGTCT ΛΤΤΑΑΑΑΑΤΑ CAAAATGGGT 11820
GTGGTGGCTC ACGCCTGTCA TCCCAGCACT TTGGGAGGCC GAGGGAGGTG GATCACCTGA 11880
GGTCAGGAAT TCGAGACCAG CCTGACCAAC ATGCTGAAAC CCCGTCTCTA CTGAAAACAC 11940
AAAGCTTAGC CGGGCGTGGT GGTGCACACC TGTGATCCCA GGTACTTGGG AGGGAGAATC 12000
ACTTGAACCT GGGAGGTGGA GGTTGCCGTG AGCCAATATC GCGCCACTGC ACTCCACTCT 12060
GGGTGACAGA GTGAGACTCC AAGACTCCAT CTCAAAAAAA AAAAAAAAAA TCAGGCTGTA 12120
AAAATCCACT TTTGGGAAGG TGAACACACA CAAGCCCAAA CAGAAATCTG ACAAAAACCA 12180
GAGGGGTGAA AAGTCCACAC AGTCAGGCAC CCCCACCTGG CTTGCTGCCT GGTTAAGAAG 12240
GGCGCAGATG CCTGTGCCTG GATACCAGAG ATGGGACAGA CACCCATTCC CTTTTCATCA 12300
CCACCCCCGA GTGCCCGAGG GCCTGGGGCG TCTGCCTGGC CCCTGGCCCC TGGCTTGGGC 12360
TCTGCACCTC TGAACTGGAG ACACCCTACT CAGCTCCCCA CTTACTTTGG AGTGAGCAGC 12420
GCTTGGGTGC CCAGCGTGGA TTTGGGGCTT CCAGGGAGTC GGGGTTCGGT CGCGGAGCCC 12480
AAGCTTCCGA IXXiXtXCC.C CGCCCTGCCC TrXCTTAGTG GTGGGGATGG GATGGGGGGA 12540
AACGGGGAGC TGCGTGGAAG GAGGTGAAGG GTCACAGGAG GAGAGAGCGt AGCGCCCACG 12600
TGCGCCCTGC ctgaacgcgc agcgcagcgc ccggctgcgg tgccccttgc CCCTTCGGTt: 12660
CCTAATTTGG GGATCGGGAG TGCATGCGCG GGCGGAACGG GCTTGGGGGG GGGGCTCTGG J 272.0
GAGGGCGGAC GTGTGGCCTC CCTTCTTCAC CGTTTTATTC CAAGGGGACzX GG< :TGGGGAT 12780
TGTATTTGGG ClXGTGTTTG GCTGAGGGTG CAGGGACTTG GGGGGTGGCG GTGGGGAGGG 12840
CGGAAGGTAT AAACGTATAA ATCATAAGTA AACAACTCAG AAATGGACCC CGAGCGCTGG 12900
TCGCCGCTAG CTCTCCAGCT CTCCCTGGCC CAGGCCCGAA GGAGAGGGGT GCGCATCCCT 12960
CCGCGGTTCT CCTCTCCTGG GTACCTGGCC TTGAGGTGGG GGAACGAGCC TACTTCTTGT 13020
ACCGTCTTTT GCCGACGGCG GGACCCAGTG AAATTAGGCC GTTGGAGCGC GCAGGCCTCX 13080
CTGGCTTTGC GCACCGGAGT CTTGGGGACC TGGTGTCCCC GGGAAAAACT TGGGGACCTG 13140
GTATCCCCGG GAGAGGCTTG GGGACCTGGT GTCCCGGGAG AGGCTTGGGT ACCTGGTTTC 13200
TCTGGAAGAG GCTTGGACAC CTGGTGTCCT GGGAGGGCCT TTGGGACCTG GTGTCCTGGG 13260
-48CZ 297640 B6
AGAGGCTTGG AGATCTGTTG TCCTGGGAGA GGCTTGGGGA CCTGGTGTCC CTGGAGAGGC 13320
TTGGGGACCT GGTGACCTTG GAGAGGCTTG GAGACCTGGT GTTCTGGGAG AGGCTTGGGG 13380
ACCTGGTGTT CTGGGAGAGG CTTGGGGACC TGGTGTCTCT GGAAGAGGCT TGGACACCTG 13440
GTGACCCGGG AGGGCCTTGG GGATCTGGTG TCCCGGGAGA GCCTTGGGGA CCTGGTGTCC 13500
TGGGAGAGGC TTGGGGACCT GGTGACCTTG GAGAGGCTTG GGGACCTGGT GTCCTGAGAG 13560
AGGCTTGGGG ATCTGGTGTC CCAGGAGAGG CTTGGGGACC TGGTGTCTCT GGAAGAGGCT 13620
TGGACACCTG GTGTCCTGGG GAGAGGCTTG GGGACCTGGT GTCCTGGGAG AGGCTTGGGG 13680
ACCTGGTGTC CTGGGAGAGG CTTGGAGATC TGGTGAGCCG GGAGAGGCTT GGGGACCTGG 13740
TGTCCCGGGA GAGGCTTGGG GACTTGGTGT CCCGGGAGAG GCTTGAACAC CTGGTGTCCC 13800
AGGAGAGGCT TGGGGACCTG GTGACCTTGG AGAGGCCTGG GGACCTGGTG ACCCGGGAGA 13860
GCCTTGGGGA CCTGGTGTCC TGGGGAGAGC CTTGGGGACC TGGTGACCTT GGAGAGGCTT 13920
GGGGACCTGG TGTCTCGGGA GTGCCTTGGG GACCTAGTGA CCCGGGAGAG GCTTGGGGAC 13980
CTGGTGTCCC GGGAGAGGCT TGGGGACCTG GTGTCCTGGG AGAGGCTTGG GGATCTGGTG 14040
TCCTGGGGAG AGGCTGGGGG ACCTGGTGTC TCGGGAGAGA GCCTTGGGGA CCTGGTGACC 14100
CGGGAGAGGC TTGGACACCT GGTGTCCCGG GAGAGGCTTG GGGACCTGGT GACOCGGGAG 14160
AGGCTTGGGG ACCTGGTGTC CTGGGGAGAG GCTGGGGGAC CTGGTGTCTC GGGAGAGAGC 14220
CTTGGGGACC TGGTGACCCG GGAGAGGCTT GCACACCTGG TGTCCCGGGA GAGGCTTGGG 14280
AGCCTGGTGT CCCGGGAGAG CCTTGGGGAC CAGGTGACCT TGGAGAGGCT TGGGGACCTG 14340
GTGATCTTGG AGAíiGCTTGG ίΧΑΓΓ'ΤΛτη Trrc/íAGA fGTTA.CGGGG gctggttggg L44OO
GGAGAGAACG TTGTGAGCCA AAGTCCCTGA ATCCCTGCGzA AAAGAGCGCA TCGGGAGCTC 14460
CCCCTGA.GGG CGTTCCATTT GTGGACCCCC CTCCCATGCG CTTTGCAGGG AGCTGTTCGG 14520
AT TCCCCTGG CCCGGCTCCC GCGGATGCAT CCAGTGGCAG CGCCAATTCT GGGCCAGGGG 14580
(./A AGGAGGAA AGGCGGGTGT GGGGTGGTCT CCACGGCTGG AGAAGGGGCG ACGCTCCCTA 14640
GGGGAGAAGA GGCACGTTGG GGGTTTCCGG GGGCGCGGGG CGGAGCAGGC CCCCCAGTCC 14700
CCATCCTGCG CCCTCACCCC GCCGGGTCCG CTCCCGCAGG TCCAGGCTCA GCTGCAGCTG 14760
* ZG7GG CCCACGCGCA CCCGCACCTG CACCCGCAC' TGGCGGCGCA CGCGCCCTAC 14820
CTGATGTTCC CCCCGCCGCC CTTCGGGCTG CCCATCGCGT CGCTGGCCGA GTCCGCCTCG 14880
GCCGCCGCCG TGGTCGCCGC CGCCGCCAAA AGCAACAGCA AGAATTCCAG CATCGCCGAC 14940
C.TGCGGCTCA AGGCGCGGAA GCACGCGGAG GCCCTGGGGC TCTGACCCGC CGCGCAGCCC 15000
CCCGCGCGCC CGGACTCCCG GGCTCCGCGC ACCCCGCCTG CACCGCGCGT CCTGCACTCA 15060
ACCCCGCCTG GAGCTCCTTC CGCGGCCACC GTGCTCCGGG CACCCCGGGA GCTCCTGCAA 15120
GAGGCCTGAG GAGGGAGGCT CCCGGGACCG TCCACGCACG ACCCAGCCAG ACCCTCGCGG 15180
AGATGGTGCA GAAGGCGGAG CGGGTGAGCG GCCGTGCGTC CAGCCCGGGC CTCTCCAAGG 15240
CTGCCCGTGC GTCCTGGGAC CCTGGAGAAG GGTAAACCCC CGCCTGGCTG CGTCTTCCTC 15300
-49CZ 297640 B6
TGCTATACCC TATGCATGCG GTTAACTACA CACGTTTGGA AGATCCTTAG AGTCTATTGA 15360
AACTGCAAAG ATCCCGGAGC TGGTCTCCGA TGAAAATGCC ATTTCTTCGT TGCCAACGAT 15420
TTTCTTTACT ACCATGCTCC TTCCTTCATC CCGAGAGGCT GCGGAACGGG TGTGGATTTG 15480
AATGTGGACT TCGGAATCCC AGGAGGCAGG GGGCGGGCTC TCCTCCACCG CTCCCCCGGA 15540
GCCTCCCAGG CAGCAATAAG GAAATAGTTC TCTGGCTGAG GCTGAGGACG TGAACCGCGG 15600
GCTTTGGAAA GGGAGGGGAG GGAGACCCGA ACCTCCCACG TTGGGACTCC CACGTTCCGG 15660
GGACCTGAAT GAGGACCGAC TTTATAACTT TTCCAGTGTT TGATTCCCAA ATTGGGTCTG 15720
GTTTTGTTTT GGATTGGTAT ΤΓΤΤΤΤΤΤΤΤ TTTTTTTTTT GCTGTGTTAC AGGATTCAGA 15780
CGCAAAAGAC TTGCATAAGA GACGGACGCG TGGTTGCAAG GTGTCATACT GATATGCAGC 15840
ATTAACTTTA CTGACATGGA GTGAAGTGCA ATATTATAAA TATTATAGAT ΤΆΛΑΛΑΑΑΑΑ 15900
ATAGCCGTGC ACTCTTGACC CCGTCAACGT CCAACGTGGA AAAGGCGTTA CCTCTTCTCC 15960
CAGCGCTGGC CGCCTGGCCA CTGAGGGCCC TTTGCAAAAA TCACGGGTGT AGAGATGGCC 16020
CTGGGCGCGC TGGGAGTGTG GTTGTGTTTC TGAAGGGGAT AAAAGAGGGC ACGGTGGTGC 16080
CAAGATATCA GTTTGGTACC TGAGCTGTTT CTGGTTGGGA AGCGTAAAAG CCAGGGAGAG 16140
ATCCAGAGAG TTTTCAAGTT TTTGCAGATG TAGGTGGTTC CAGCTTTTCT TTCTCCCCTA 16200
CTCCATCTTC TGCGTTCCCC CAGTTCTTTT ATTTCTTTGT ΤΤΤΤΤΆΤΤΤΤ TGAGACAGAG 16260
ACTTGCTTTG TCGCCCAGGC TGGAGTGCAG TGGCGCAATG TCAGCTCACT GCCACCTCCA 16320
CCTCCCCJGGT TCAAGCGATG CTCCTCCCTC AGCCTCCCGA GTAGCTGGGA CTACAGGCAC 16380
CTGCíACGAC CCCCGGCTAA TTTTTTGTAT TTATAGTAGA GACGGGGTTT CACCGTGTTG 16440
ÍXCAGGCTCG TCTCGAACTC CTGACCTCAG GTGATCTGCC CGCCTCGGCC TCCCAACGTG 16500
crcccAGTrr TATAAACAGC AGATAÍXIAAC TTGTCGTCAC AGCTGGCATG GGCTGGACAG 16560
TTGCTTGAAA TGACCTAACC AAAAACATTC AAGGGTTCTG CCCCCAGATT TCGGGAGATC 16620
CACGTTCCAT GTTCTGATTG GTTTTCTGGG AACACAGCAA GGGGTTTGGT GACCTCCGAG 16680
AAGATCCATC TGCATGATTG GGATTAGTTA CCACAGCCTG fCCAGAGAGZ» AACTATCTTC 16740
TCCCAAGATT TACTAACATC CAC > i C ziA CTGTCTTATT TCCATAACAC ATTTGCATCT 16800
TTGTGGATTC AAGCTTGGTG GTTTTCTTTC CTAACTTCTG ATTTAGATAC TTCTCCCTGA 16860
GGTGGGGATA AAAGAAAAAA ZiAAAAACAAC ttcttttttt CTTCCGCATA AGACTTTCTZ» 16920
TCTTGTCACT GAGCTGAACT GTAGATCCAT TTGGACCCGT CTCATTTGTA TCTTCTGATA 16980
TTCTTTATAC AAACCAAAAG TCCCCTTCAA CATTTTTTAT GTCAAAATGT TACAACCGCT 17040
GTAAAATGAC GGAGAGAGAG AGAAAGAATC CCAGACATTA ACGGTATTAG AGAGTTTGCC 17100
TCATTCATCC ATTTTTCTTA AAAGCTGGAA ATTAAAAAAA AAAAAGAGAG AGAGAGGCTT 17160
TAATAGTTAA GCTGAAATTT TTATCGAAAA GAAGAATTGC ATTTTGAATC TTTGGGAAGT 17220
AGGTTCATTC ATCAGAGTAT GTAACCCTTT GGAAAAGTGG TTGGTAAGAT ATGTACAGCC 17280
-50CZ 297640 B6
CTAGATTTTT TTTTTTTTAA CCAAAAAGGC TGAGTAATTT TGAAAAATCG AAACATAACA 17340
GTGTGTCATC ATTTCCTCCC AAGAAAAAGC TCACTCCACG TGAGTAGAAA GACATCTACC 17400
TGGTCCCTGT AGAATCTGAA CGTTTCTCTT TAGAGACGGA ATTTCAATCT TGTTGCCCAG 17460
GCTGGAGTGC AGTGGCACAA TCTCGGCTCA CCGCAACCTC CGCCTCCCGG GTTCAAGCCA 17520
TTCTCCTGCC TCAGTCTCCC GAGTAGCTGG GATTACAGGC ACCTGCCACC AGGCCTGGGT 17580
AACTTTCTGG TATTTTTAGT AGAGACAGGG TTTCAGCCTC CCGAGTAGCT GGGATTACAG 17640
GCACCTGCCA CCAGGCCTGG GTAACTTTCT GGTATTTTTA GTAGAGACAG GGTTTCAGCC 177OQ
TCCCGAGTAG CTGGGATTAC AGGCACCTGC CACCAGGCCT GGGTAACTTT CTGGTAGTTT 17760
TAGTAGAGAC AGGGTTTCGG CCTCCCGAGT AGCTGGGATT ACAGGCACCT GCCACCAGGC 17820
CTGGGTAACT TTCTGGTATT TTTAGTAGAG ACAGGGTTTC GGCCTCCCGA GTAGCTGGGA 17080
TTACAGGCAC CTGCCACCAG GCCTGGGTAA CTTTCTGGTA TTTTTAGTAC AGACAGGGTT 17940
TCGGCCTCCT GAGTAGCTGG GATTACAGGC ACCTGCCACC AGGCCTGGGT AACTTTCTGG 18000
TAGTTTTAGT AGAGACAGGG TTTCAGCCTC CCGAGTAGCT GGGATTACAG GCACCTGCCA 18060
CCAGGCCTGG GTAATTTTTT TGCATTTTTG GTAGAGACAG GTTTTTGCCG TGTTGGCCCG 18120
GCTGGTCTCA AACTCCTGAC CTCAGGTTGA CCTGCCCGCT TTGTCCCTCG CAAAGTGCTG 18180
GGATTACAGG CGTGAGCCAC CACACCTGGC CTGAATCTGA ACTTTTAAAA GGGAGTTACT 18240
GACTCTCAAC TGTGCGGGGA CGGTTTCACT TTGATTTAAT ATGGAAAGAG GGCCAAGTGT 18300
CATCCTCACA AATGGGTCCC CGAAGCAGAT CAAACGCAGA GAACTGTGAG GGTGGGACAC 18360
GAGTGTCTGT GGACACTGGC TGCCTTTGGC TTTTCTCCTG CGAGAGAAGT TGGGTGACTT 18420
TCTGTAGGTG GATGAGTGAT CCCTGAATGzX GTGTGGGGTA CGTGTATGCT AGCTGCTTCT 18480
TTCTCCCTGA AACTCTCGGA TGoAAGG/vaG TAAGAAATTC AGCTTGÍXX1T <> GACCAGT T 18540
CTCACCAUGA ACGCCCTCTT CTCTCTCCCT tctccttcct TCCTTCCTTX CTTCCTTTCT 18600
TTCTTTTTCT TTCTTTCTCT CTTTCTTTCT TTTCTTTCTT TCTGTTTCTT TCCTTTTTAT 18660
CTTTCTCTCT TTTTCTTTCT CTTTTCCTTT TTTGTTTCTT TCTTTCTTTT TCTTTCTTTC 18720
TTTTTCTTTC TTCTTTCTTT CTTCGATGAA GTCTCACTCT GTCACCCAGG CTGGAGTGCA 18780
< *TGGTf ιΙ-.Α/χ'; !:ua</:tgac TGCA'ÍC'_T: T zTCCTCCTGGC FTGAzV »AAAT r:tcctgcct > 884 0
CAGCCTCCCA AGTAGCTGGG ATGACAGGCA CCCACCACCA TTCCCC«GATA ATTTTTČTAT 18900
TTTTTAGTAG AGACTGGGTT TCGCCATGTT GGCCAGGCTG GTCTTGAACT CCTGACCTCA 18960
GATGATCCAC CCGCCTCAGC CTCCCAGAGT GCTGGGATTA CGGGGTGAGG CACCGCGCCC 19020
GGCCTCCTCT CTCTTTTTCT GAGATGTTTA GGAAGGACTG GGCTGATGCG GACCCTCTGT 19080
ATGTGATGTG CGTGGGTTTG GTTTCCCGGA AGGCCCTCCA GAGACACGTT TGCGTGAACA 19140
TTCAGCATGG AAACAACATA CGTCTCTCCA CAGGAGGTGA GAAATTGAAT TTATGGGGTG 19200
GGTGTACGCT GGCGATTCTT GGTGCTTTTT GCTCAAAACA AGGTTCTTTT GAAAGTCACG 19260
TTCCTGCTTT CCCTGTGGCT TCCCGGTGAG CTCGCTCGCA GAGCAAGGAA TACCACCCAG 19320
-51 CZ 297640 B6
AGAGCAACGT GGGCTGTGTT CCGTTGTAAC GCCGTTGCAG AGAGAGGATT TGGTGTGTGA 19380
GATCCGTACC AGCTCCAGCA CACTGATAGG AACACGTTGC TGGCCGAACT GAACGATGCT 19440
GGGTTGGGTC CTGATTGATA CGTATTTTCT TCCCTCCTCT CCCCAAAACT TGGCCAAATA 19500
GTCCGTGGAG GGTTGTCAGT CGCCGCAGTT GAGCAAAAAA CACTTCTTCC TTTGAGTGGC 19560
TGTTCTGGTG AAATCTGTTT CTGACATATC CACTTTTCTC TCTCTTTTCT CTCTCTCTGA 19620
CTGCGAAGCA CCCACAGGGA GAAGGAATTG GATGTATCGG ATGTTGGTAT TAGATTTTCT 19680
TTCTCCGTTC GAGTCTCTGA CTGGTGCATA CTTTGCAAAG GTGTGTTCCT GGCAATTGCC 19740
AAGAGTTAGA AAAATGCACC TTCTCTGGTG GCCGTTGGGG TGTTGTTTCA CAGGCAGTGG 19800
TGACAGGGCC CCTTGGCTGT GGCTGTCTTC TCCAGCGCCG TGGATAAAGA GACGGGACAG 19860
attctgtgcc TCTGTACGAT TTAGAGCGTA ACTGACCGCG TCCAACACCC GTTTTTCCAC 19920
TTACAAAGCT GGTGGTGCGA CGGGCTTGGT GTCTCCCGTA CGGGAAGGAG GCCTTTGGGC 19980
CGCTCCAAAG ACGCCCTGTC GTAGGAATGG CCTCTCCATC CCGCCAAAGT CCAGCCAGGC 20040
CCCCGAAATG GTCCCATTTC CTTGGAAGCC TGAGTTTCTG TTCTGGTCTT GCTGCTGTCC 20100
TTGGCCACGT CAGCACGTGG GAGCATCTGT GGATACCGCA GAGTCTGGGG ACAGCTGGGC 20160
CTTTAACCGA AATGAAGCCG AGACGGGTTT GAGGTTTTGG TGCCAAGCTC TGGTCAGGAT 20220
GAAAGGGAAA TACCAGAGTC CTCTGTCCTC GCCTCTGGGT TTCATGCTGA CCTTTCTAAC 20280
ATTTGTTTTC CCCTAAGAAC AAGCAGAAGC CTCCAGCTCC CTTTAGCTCC ACAGTTTTCC 20340
CGGGGACATA GCGAGGATGG CACACGGCAG CCACTCCCAC GACACACATT 7CGGAGGCAC 20400
''-VTGrTGCA Λ rX.'í*rXTTGTC TCCTCCAGCT TGGGGAGGAG AGAG-GCTTTC 20460
GGTGGACACG TTTGACATTA AAAAAAAAAA AAAAAAAAAA AAAAAAACTG GTGCCTAATT 20520
TATTAAAGAG AATTAGCTTA GCGAGTATAT GCTGATATTC TTCGACACAC GTGGG7AAGT 20580
TGATGCCATT TATAAATGTT TTATTGAAAT TTGATATTTA ATGA.GAAGCC GGTTAA<X>AA 20640
TGTAGACAAT ATCCCGTTTC AAAGCTATGA AATGTGCTAT TTATTGAAAG GGGATGTGGC 20700
TTCACGAGTT CAGCCCATTG TACGTGCAGG TCCCGTGGGA AGGAGGCAAA AGCCCCTGCT 20760
TCTTACTTTG tgatgtatgt GCATTTGTTA TTTATTTTTT TTTCCTTGGT CGGACI.TTCA 20820
TAAATATGTA υΤΑΓΤΤΤΑΛΤ TATGTCGAGT GTAAATTTGA CATCGCGTTG CATT7ATTTT 0880
TATATTTCTG AAAACTGTTG CTTTTTCTTT TTCCCTCCCC CATTGACGAC ATAGCGGtcC 20940
CCGCGTCCGG GTTACAAATA CATCTACAGA TATTTTCAGG GATTGCTTCA GATGAAAACA 21000
AATCACACAC CGTTTCCCAA ACCAACAGTC TTCACAT7TC TATCCCTCTG TTATTGTCGG 21060
CAGGCGGTGA GGín »T AGAAA AAAAACAAAC AAACAAACAC, AAAAAAAAAC CAAAAAAAAC 21120
CACCCTGAGT TTCTCTGGTG ACGCCCTCAT TCTCCTAACG TTCAATAATC TCAATGTTGA 21180
GTTGCAGCAA CAGACTGTAT TTTTGTGACG CCCCGTAGTA TGAATGTACA TCTTGTAAAA 21240
CTGAGATATA AATAAACTTA TAAATATTTG TATTCAAGTG TTAAAAAAAA AAAAATTCTC 21300
-52CZ 297640 B6
AACCTCTCCC CTGAGGACAG GCTTATTGGA AAAAAAAAAA AAAAAAAAAA ATCCTGAGTC 21360
GGCCGTGGCT GAACACAGAG TGTTGTTCTG CTCCGTGCAT TTCCAGGGTG GGTACCCAGT 21420
GTTGCCCCCC AGCCTTAGAT CGGGAGGTAC CATTGACTTT TGGTTGTATC CCATCCCCTT 21480
CCTTTACTGA AACCTACCTC CCCGCTTCTC AGCCAACGTC CCCCCAGAAG GTGGCAAAAA 21540
AAACAGAGGA AAAAGCCCTG ATTTGAATCA AGTCAGAGCT GCTAATTCTC CACTTTCTTT 21600
AATTAATTAA ΤΤΤΑΤΤΓΤΤΤ TTTTTGAGAC TGAGTCTCGC TCTGTCGCCC AGGCCGGAGG 21660
AGTGCAGGGG CGCGATCTCG GCTCACCGCG ACCTCCGCCT CCCGGGTTCA AGCGACTCTC 21720
CTGCCTCAGC CTCCCGAGTA GCTGGGATGA CAGTCACCTG CACCACCGCG CCCGGCTCAT 21780
TTTTGTATTT TTAGTAGCAA TGGGGTTTCA CCGTGTTGGT CAGGCTGGTC TCGAACTCCT 21840
GACCTCGTGA TCCACCCGCG TCTGGGCCCG GCCGGTGATG TGTGTGCTTT TAACTTTTAT 21900
TTTGTTCCAG TTTTCGACAG TGGCACGGAT TTTCCAGCAC GGTCTTGCAA CXÍATGATTGA 21960
GTCATTTTTG AGACAAAAAA ΤΑΤΆΆΤΆΑΤΆ ATAAATGGAA AAAGAAATCG ACTTTTAAAA 22020
ATGACAAATT TTTTTTTTTT TTTTTTGCAT AGATTTTTCT CTCTTTATGT AAAGGAAAGT 22080
TCATGATTGG ATTTGGCCGG CCTGACTGCT TCCCGGCTGT GATAAAAAAC ACATGTGAGC 22140
TGGGAGGGAA GTGGGGGAGG GACACAGCTG CCCACACAGG GTTCCCACCG CGGTTACAGG 22200
GTGGGCAGTG CTGGGGGAGC TTTCTCTGTG GGGGGCTCAG AGCCTGAGGA CAGGTGAGCC 22260
TCTCCGACAC CTCCCCAGTT GCCTGGAGTC TAAACCGTCC GTTGTCTGTA CCGTCCGTTC 22320
TTCCTGCTGA CTCCTGGTAG TTCCTGAAAG CTTCTCTTGG CCAGAGAAGG GGTTTCAGAG 22380
íx:cgtgtgtc (_ACXX:CATTC TGCAAAGTGC AACTTC.ACCG TTCCTTTCCT TTTCTGGCCT 22440
(iCGTGGTCTG AAGCTCAGAG CCUTCTCTTC ACCCAGCCTG TGTGTGTCTT GCCGGACAGA 22 500
AGmAAAA I úG TGCTTTTTCC GTGTTAGCAG AGGTGCTTTT CATGGCTGAC CTCAACGCGT 22560
CCATCTCCAG CCTTGACCAA GCTGTTTTTT a<xxxx:aaac GCAGGGAAGT TCTGAATGCA 22620
CACAGTTATT TCATGGTTAA ACTATTCAGC TTTGGCCGGG CGCAGTGTGG CTCTCACGCC 22680
TGTCATCCCA GCACTTTGGG AGGCCGAGGC CXXiTGGATCA CCTGAGGTCA GGAGTTCGAG 22740
ACCAGCCTGG CCAACACGGT GAAACTCTAT CTCTACTAAA AATAC-ΛΛΛΆΛ TTAGCCfXXX: 22800
GTGGTGGTGT GTATCTGTAA TCCCAGCTAC TCAGGAAGCT GA(X>(. AfX iAí» AATCCX-.TTGG 2 2860
ACCCAGGAGG CGGAGGTTGC ACTGAGCCGA GATCGCGCCA TTGCACTCCA cx:ctgggí.ga 2 2 920
CAGAÍXJCAGA CGCTGTCTCA AAAAAATGAA ΤΑΑΤΑΑΑΑΤΛ AAATAACAGG AACTAAATAA 22980
AATAAAACGT TCAGCTTTGT TCTGCAAATC CACTCCTATT GTTTTACGTG GTTTGAGAGA 23040
CTCTGTCCCT TAGAAATAGA TGTTTGTTGC CAATTGTAAT GAATCTGTTT CAAAAATGAA 23100
CAGAATATTC AAATGGTTTG AGAGATCTTT TCCCTTAGAA ATAGCTTGTT GCCAATCACA 23160
AAGAATGTTT TTCAAAAATG AATGGAATCT TCCTGGATAT CGCTTCCAGA TCTTCATTTT 23220
TTTTGCATAG TTCAACCTGA AAAGTAAGTG TCTCAGCCCT GAATTTCTTT CTGATTTTTC 23280
CATGGGTTGT CTTGCAGACT TCTCTGGACT TGACCACATT ΤΑΑΑΑΑΑΑΑΛ AAAATTAACT 23340
-53 CZ 297640 B6
TTTTCACACG GACACGGTTT CAATAGGAAT GAGATCTTTG AGTTTTTATG TAACAGATTC 23400
TTACCATCAG TTCTCAGATT CCCAAATTAC ACACAAAAAG ccacggactt CGCCTCCTGC 23460
TAACATGTCC TTCTGTTTCT GAGGCTTCTG TTGGTGTTAG actttcatgt TTAATAGCAG 23S20
ACAATGTAGG GATTTAAAGA AAAATGCAGA gaaagcaaaa acactgacca AACACACGGA 23580
GATAAGCTTT CTAAAGCCTT TGTTCTTGGA GTTGTCGTTA aaaaaaaaaa GTTGTTTTAA 23640
ACTTTGCAAG CATGCCTATA TTGAACTCAT AAGCAAGAGA GCCAAGAAAA ATAGTGTCGG 2 3700
TCGTCTACTC TACACGTTTT CCCAAAACAG ACGTATTTTA ATTTCTTTTG TTTGAACTCA 2 3760
CAGATGCTGA GAGTTAAAAG TTAAATTTTT GTCATGAACA ATAGTGGCCA AAACCACAGT 23820
TACTTTTGCA CTATAGCATA ATAAGAAAAA TACAGGCTGG GCTCGGTGGC TCACACCTGT 23880
AATCAAAGCA CTTTTGGAGG CGAAACAGCC AGATCCCTTG AGCCCAGGAG ATTGAGACCA 23940
GCCTCÍGGCAA CATAGCGAGA CCCTCATCTC TACAAAAAAG GTTTGTTACA TATGTAACAA 24000
ACCTGCACAT TGTGCACATG TACCCTAAAA CTTAAAGTAT ΑΑΤΛΑΤΑΑΑΑ ΆΑΑΤΤΑΑΆΑΑ 24060
AAAATTCACC AATCAACTGC CTGCTGGTGC CTTCAAGAGA CTCACCTAAC ACATAAGGAC 2 4120
TTGCATAAAC TTATAAAACA ATTCAATGGA AGAATCCTTG AAAGTATTCT GAGAAGACAG 24180
TATAATAAAC TGATTTCTAA AAAGGCTATA AAAAATTGAA TAAATCATTG TTGGGCATCC 24240
TGTGCTGAAA TATAATGCAG CCAATAAAAA TTACAAAATG AATAAACATT TTATAACAAT 24300
AAAAAAAAGT CAAATAATTA GGCAGGCATG GTGGTGCTCT CCTACGGTTG AAGCTATTCA 24360
GCAGGCAAGA GGATACTTTG TTTTTGTTTT ΤΤΆΑΤΤΤΤΤΤ TTGAGACAGA GTCTCGCTCT 24420
GTTGCCAGGC TGGAGTGCAG TGGCGTGATC TCAGCTCACT GTAATTTCTG CCTCCCGGGT 24480
TCAAGCGATT TTCCTGCCCC AGCCTCCCGA GTAGCTGGGA TTACAÍXiTGC CCGCCACCAC 24540
AC C1GG<TAA TTTCTTTTGT ATTTTTAGTA gagacgaggt TTCCCCATGT TGGCCAGGCT 24600
GGTTTTGAGC TCCCGACCTC GGGTGATCCA CCCGCCTVAG CCTCCCAAAG TGCTGGGATG 24660
ACAGGCGTGA GCCACCGCGC CTGGCCCAGG aggattattt GATCCCAGGA GGTGGAGGCT 24720
GCAGGAAGCC ATGATTGCAC CACTGCACTC cagcctggct GACAGAGTGA GACCACATCT 2 4 780
CTAAATAAAT GAATAAATAC AGGCAGAAAC tttttttgtt TTGTTTTGAT GGAGTCTTGC 2 4840
TCTGT' ACCA A: »GAGT(» CAGTGGTrX. t. atc.tcagctc ACTGCAACCT CCACCTCCTG 2 4 900
GGTTCAAGCA ATCCTCCTGC CTCAGCCTCC cgagtagctg GGATTACAGG TGCCCGCCÁC 2 4 960
CACGCCCGGC TAATTTTTTG TATGTTTAGT agagacggga TTTCACCGTG TTAGCCAGGA 25020
TGGTCTTGAT CTCTTGACTT TGTGATCTGC ctgcctcagc CTCCCAAAGT GCTGGGATTA 25080
CAGGCATGAG CCCAGGAGTT CAAGACCAGC ctcagcaaca AAGTGAGACC TTTTCTCTCC 25140
AAAAAATCAA AAATTTAGCC AGCTGTGGTG gctcctgccc GTGATCCCAG TACTGTGGGA 25200
GGCTGAGGGA GAATTGCTTG AGCCCAGGAG ttcgagacca ACCTCAGCAA AAAGGACTCT 25260
CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT ctctctatat ΑΤΑΤΛΤΑΤΑΤ ΛΤΑΤΑΤΑΤΛΤ 25320
-54CZ 297640 B6
GAGTTTCAAA AATTGCTGGG TGACCAGCTC ATCTACTGGT TTTCCCCTTG GGAAAGTGAA 25380
ATTGTCATGT ATTGAAGATT TCCAAGGAAG TTGTATTGAA TGAGAAACAA ACTCAATCTG 25440
TTCGTGTTTA AAGAGCTGCA GTGCGTTTGC TGTGTTTCCC ATAAAACTGC ACTTCCAAAA 25500
GACACGCTGA GAAAGGAGAC CAGGATTTGT AATTCAGAAA TTGGAAAGCA AGTTAGGCTG 25560
GACGTGGTAG CTCATGCTTG TTGTAATCTC AGCACTCTGG GAGGCTGAGG CAGGAGGATC 25620
ACTTGAGCCC AGGAGTTCAA GACCAGCCCG TGCCACATGG TGAAACCCTG TCTCTCCAAA 25680
AAATAAAACA TTTAGCCAGA TGTGGTGACT CATGCCTGTA ATCCCGGTAT TCTGGGAGGC 25740
TGAGGCAGAG TTGCTTGAGC CCAGGAGTTC AAGACCAGCC TCGGCAACAA AGTGAGACCC 25800
TGTCTCTCCA ΛΑΑΑΆΤΑΑΑΑ CATTTAGCCA GCTGTGGTGA CTCATGCCTG TAATCTCAGT 25860
ACTCTGGGAG GCTGGGGCAG AATGGCTTGzA GCCCAGGAGT TCGAGACCAA CCTCAGCAAC 2S920
AAAGTGAGAT CTTGTTTCTC CAAAAAATCA AAAATTTAGC CAGCTGTGCT GGCTCATGCC 25980
TGTAATCCCG GTACTCTGGG AGGCTGAGGC AGAATCGTTT GAGCCCAGGA GTTCGAGACC 26040
AACCTCAGCA ACAAAGTGAG ATCTTGTTTC TCCAAAAAAA TCAAAAATTT AGCCAGCTGT 26100
GCTGGCTGGT GCCTGTAATC CCGGTACTCT GGGAGGCTGA GGCGGAATTG CTTGAGCCCA 2 6160
GGAGTTCAAG ACCAGCCTCA GCAACAAAGT GAGATCTTGT TTCTCCAAAA AATAAAACAT 26220
TTAGTCAGCT GTGGTGGCTC AAGCCTGTGA TCCCAGCATT TTGGGAGGCC GAGGCGGGCG 26280
GATCACGAGG TCATGAGATC GAGACCATCC TGGCTAACAC GGTGzAAACCC CGTCTCTACT 2 6340
AAAAATACAA AGAAAATTAG CCGGGCGTGG TGGCGGGCGC CTGTAGTCCC ŽYGCTACTCAG 2 6400
GAGGCTGAGG CAGGAGAATG CCGTGACX.CT GGGAGGCGGA CCATGCAGTG AGTCAAGATC 26460
GCGCCACTGC CCTCCAGCCT CACAG/ GCAAGACTCC GTCTGAAAAA ΑΑΑΑΑΑΑΑΑΑ 2 6520
AAAACTGCTG CCCAACCTGT GTTTGCACCA CTGCCCTCCA Cjí. ; c CAGAGCAAGA 2 6580
CTCCGTCTCA AzAAAAAAAAA /XATGCTGCCC AAGCTGTGTT TGCACCACTG CCCTCCAGCC 2 664 0
TCGGCAACAG AGCAAGACTC CGTCTCAAAA ΑΑΑΑΛΑΑΑΆΑ AAzAATGCTGC CCAAGCTGTG 2 6700
TTTGCACCAC TGCCCTCCAG CCTGGGCAAC AGAGCAAGzAC TCTGTCTCAA z\AAAAAAAAA 26760
AATGCTGCCC AAGCTGTGTT TGCACCACTG CCCTCCGGCC TGGGCAACAG AGCAAGACTC 26820
CGTCTCAAAA ΑΆΛΑΑΑΛΛΆΑ AATGCTGCCC AAGCTGTGTT TGCzACCACTG CCCTCCAGCC 2 6880
TGGGCAACAA AGCAAGCCTC AGCTTTCTGC CATCTCCACzA ACCAAGzWW. CAATTCACAC 26940
AGAAzVTCAGT GCATCGTGCA GTGACCTCTT CAGAAAACCA zVTGzTGTTTTC cacctgagga 27000
ACTGTTTCTG AGCCCCATTC AGAAAAACAC ATCCCTGTAA CTGCAGGGCA GATTTACTCA 27060
CTGTATGCCT GTTTAAATAA AGCTTCCAGC CTCTGCATGC. GGTCTGTCTG GAAGCTCCTG 27120
TATCTGTCCC ACATTCTTGG AATCACAATG CACCCTTGGG AGGAAGATAT GTATTTAAAG 27180
GGAGTGGATG TTATGGTGAG AAAATGCTGC CCATCCTTCT AGAAGACAAA AGCCACACAA 2724 0
AATACATCAC AAGAACCAGT TTTTTTCAGA GAAGAACCTG CACAAAGAAC CTGCTCCCCC 27300
CACACCCCCA CACACAGGTG AATTAACAGG ATGTATGTTT TATCATAAAA GCACAGGTTT 27360
-55 CZ 297640 B6
GTTTCCTATG CACTCTCTGA GGATTTGGCC ATATGCAAAG atgtacaaaa ACCTTCTCTT 27420
TCCCCAGGGA ACCGTAACCC GTCTGAAAAG ATGCCCTTCT CAGAAGCGAG TTGAACGATT 27480
GTTGGAAAAG ATAAAATACG ACGTGCACAC ACACAGTAGA GAAATGTCAC CGATGCAAAT 27540
TATGTGTTTG AATGGAACAC ATTCAGGAAG CTAAATGGGG TATGACCACA CATTTGGGTT 27600
GATTTATTTG ACGAGTGGAA GGGGCAGATG GAAATGAATA CTGCTGTTTT CCTTTGGAAG 27660
GCCATATATG GGAATACCAA GAGGATTACT TTGGAAGTTT AGCTTCTCCA GGTGGTCTCT 27720
CTCTCTCTCT CTTTTTTTGA GACAGAGTCT CACTCTGTCA CCCAGGCTGC AGTGCAATGG 27780
CGTGCTCTCG GCTCACTGCA ACCTCAGCCT CCCAGGTACA AGCGATTCTC CTGCCTCAGC 27840
CTCCCGAGTA GCTGGGATCA CAGGTGTGCA CCACCACGCC TGGCTAATGT TTGTATTTTC 27900
AGTAGAGATG AGGTTTTACC ATGTTGGCCA GGCTGGTCTT GAACTCCTGA CCTCAGGTGA 27960
TCCGCCTGCC TCGGCCTCCC AAAGTGCTGG GATGACAGAC ATGAGCTAGC ACGCCCGGCC 28020
CCAGGTGGTC TTTTTAGCGG GTATTAAAGC AGCTTTCTCT CTGAGCCTTA AACCATGAAG 28080
ATAGACAGAC TCAGTGTATG GGTTTTAGAG TTGTAATTTT ATAAAAATAA GAAAAAGTCG 28140
ACCTATCATT GATGGTTAGT ATTTTTTGTA GCAGTTGCAT GGAATATTAG GATAAGGCAT 28200
GTTCTCAAAA AGAACTCTTT TTTTTTTTTT TTTGAGACGG AGTCTCGCTC TGTCACCCAG 28260
GCTGGAGTGC AGTGGGACGA TCTCCGCTCA CTGCAAGCTC GTCTTCCCGG GTTCACGCGA 28320
TTCTCCTGCC TCAGCCTCCC CAGTAGCTGG GACTACAGGC GCCCGCCACC ACGCCCGGCT 28380
AATTTTTTGT ATTTTTAGTA GAGACGGGGT TTCACCATGT TAGCCAGGAA (X.TCTCGATC 28440
T*-rr AAAGTG AGGCGTGAGC
CACTGCACTT GGCCTTTTTT TTTTTTTAG/A TGGAGTTTTG CTCTTGTCGG CGAGGCTGGA 28560
GTATAATGGC AIGAΓC TC GA CTCACTGCAA CCTCCGCCTC CCGAGTTCAA GCCATTCTCC 2 9 620
TGCCTCAGCC TCCCGAGTAG CTGGGATTAC AGGTGCCGAC CACGATGTCA AGATAATGTT 2 8 680
TGTATTTTCA GTAGAGATGG GGTTTGACCA TGTTGGCCAG GCTGGTCTCG AACTCCTGAC 28740
CTCAGGTGAT CCACCCGCCT TAGCCTCCGA AAGTGCTGGG ATGACAGGCG TGAGCCCCTG 28800
CGCCCGGCCT TTGTAACTTT ΑΤΤΤΤΤΆΑΤΤ τπτττττττ TTTAAGAAAG ACAGAGTCTT 28860
GGTCTGTCAC 'GAGM.TGGA GC/ií ACTCA» Γ GCGATCATAG CTGACTGCAG Í_CTCAAA< ;< 2 8920
CTGGGCTCAA GCAATCCTCC CACGTGAGCC TCCTGAGTAG CTCrGGACTAC aggcaccCac 29 980
CACCACACCC AGCTAATTTT TTTGATTTTT ACTAGAGACG GGATCTTGCT TTGCTGCTGA 29040
GGCTGGTCTT gacx:tcctga GCTCCAAAGA tcctctcacc TCCACCTCCC AAAGTGTTAG 29100
AATTACAAGC atgaacgact GCCCGTGGTC TCCAAAAAAA GGACTGTTAC GTGGATGTTC 29160
TACXJTTCCTG TTCTCGTCTT TTCTTTGTTA ATTGTACAGT TTGAGGGTGT GTGTGCGTGT 29220
GCGCACGTGT GTGTGTGCAG TCTCCTGATT TCATGTATTT AATTGTTATT ACCACCACCT 29280
CCATCTCTCA TTCCTTCTTA CCCTCACTGT GTAAAGATAC ATGTTGTTTT ΤΛΑΑΤΤΤΤΑΤ 29340
-56CZ 297640 B6
GTATTTATAT TTATTTATTT GTATTTCTGA GACAGAGTCT CACTCTGTTG CCCAGGCTAG 29400
TGGCATGATC TCAGCTCACA GCAACCTTTG CCTCCTGGGT TCAAGCGATT CTCCTGCCTC 29460
AGCCTCCCGA GTAGCTGAGA TTACAGGCAC ACACCACCAC ACCCGGCTAG TTTTGTTTTG 29520
AGACGGAGTC TCGCTCTGTT GCAGGCTGCA GTGCAGTGGC GTGATCCTGG CTCACTGCAA 29580
CCTCTGCCTC CTGGATTCAA GCGATTCTCC TGCCTCAGCC TCCCAAGTAG CTGGGATTAC 29640
AGGCGCCCAC CGCCACACCT GGCTAATTTT TTATTGGTAG TAGAGACGGG GTTTCTCCAT 29700
GTTGACCAGA CTGGTCTTGA ACTCCCAACC TCGGGTGATC CACCCACCTG GGCCTCCCAA 29760
AGTGCTGGGA TGACAGGCGA GGGCCACCGC GTCCAGCCTT CTTCTTCTTC TTCTTTTTTT 29820
TTTTTTTAAG ATGGAGTTTC ACTCTGTTGC CCAGGCTGGA GTGCAGTGGT GCAATCTCGG 29880
CTCCCTGCAA CCTCCACCTC CCAGGTTCAA GAAATTCTTT TGCCTCAGCC TCCCGAGTAG 29940
CTGGGACTAC AGGTGCCCGC CACCACACCC ACCTAATGTT TGTATTTTTT TGGTAGAGAC 30000
GGGGCTTCAC CACATTGGCC AGGCTGGTCT TGAACTCCTC. ACTTCAGATG ATCCTCCTGC 30060
CTCAGCCTCC CAGAGTGTTG GGATTACAGG CGTGAGCCAC GGTGCCCGGC CAGACGTCAT 30120
GTCTTAGGAA ATCAGAAAGT GGGTAGTTTC CGCACTCTGA GGAGAAAAAG AGACGTCCGG 30180
CGAAGAGAAA GGAGAGTGAA AGGATGTCTC CTCTTGTCTG TAGCCTGTTC TCAATCGTGA .302 40
GTGAGCCAAT TGCCAGAAAC TGAGGGTGCT TCATTTGGCC AGGCAAGCTT CTCAACAGAA 30300
TGTCTAAGTA CTTGTTAATG CTGAGAAGCT CTCCAAGCTA CTGCACTCCA GCCTGGGTGA 30360
CAGAGCACGA CCTTGTCTGA AAACAATTAA TTAATCAATT AATTAATATA ATGAAATCAT 30420
ACTGAACTC-A GUAGACCATT GGGGTGGGCA GGGC T GGT X > T TGGAAAGGAA CATAAAATAT 30480
GGTGCAATGG ACTTTGCTCC AGTCTCCCT'2 UCCATCTCTT CTCGCCAAGA GTCTCTGGAG 30540
GGAGCATGGG GAAGATGCTT TGGGAATCTG TAACTTCTTG TCTTGTAAAC AGAA.TATCTA 30600
AGTAATTGTT AATGCTGAGA AGTTATAGAT 7 TC:.AA#\GC*. TTTCTCCAGG CTACGGACAA 30660
GGGTCATGGG TTACTCAGTG TTACAGAAAG AATGACATGG AGATGTTTGT TACATCTTAA 30720
GGAACCATGA GGGGCCAGAG TATTTTACTC TAAGTGTAGA TGGTACATTG GCCACGCCTG 30780
TCCCAACACC ACCAATGGTG GCACCTAACT TTTGTGTTTG TGCCCCACAT TTCTTCTTCT 30840
TTTCTGACGT AAATGCAAGT GATATTCCTT cx;aaac-„atg CTGCAGCAAG AGGCCATCTG 10900
ACTACTAGTG ATACCCTGTA GCTCACCTAC AGCAGCTCAC TTGAAGCAGC TCACCCJ>TAG 30960
CTCAGGTATA GCTCACCTGC AGCGGCTCAC CTGTAGCTCA CGTC.TAGCTC ACTTGTAGCA 3 1020
GCTCACTGGT AGCTCACCTG CAGCAGCTCA CCTGTACÍ.TC ACCTGTACCT CACCTGCAGC 31080
AGCTCACCTG TAGCTCACCT GTACGTGAGC CACCGTACCC GGCCAGCAAG ACCCCATTTC 31140
ΤΛΑΑΑΤΛΛΛΤ ACACAAAAAT TAGCCGGACG CGGTGGCGCG TGTCTGTAGT TGTAGCTACT 31200
CAGGAGGCTG AGGTGGGAGG ATTGCTGGAG GCTGGGAGGT AGAGGCTGCA GTGAACCGTG 31260
ATCCAGCCAC TGTACTCTAG CCTGGATGAC ATAGCAAAAC CTTGTCTCAA AAAACAAAAA 31320
CAAAAAACAA AACAAAGAAA CAaACAAAAA ACCCACACAC ACCGGAAAAC AAAACAAAAA 31380
-57CZ 297640 B6
GCAAAAAGGA AAGAAAAGAG AGCCAGGTCC CAAATATATA TTTCCTTGGA GAACCATTTG 31440
CAAAGAGCAC ACTTAAGGCC GGGCGCGGTG GCTCACGCCT GTCATCCCGG CACTTTGGGA 31500
GGCCGAGGTG GGTGGATCAC GAGGTTGGGA GATCGAGACC ATCCTGGCCA ACATGGCGAA 31560
ACCCCATCTC TACTAAAAAT ACAAAAAATC AGCCAGGTGC TGAGGCAGGT GCCTGTAGTC 31620
CCAGCCACTC AGGAGGCTGA GGCAGGAGAA TGGCATGAAC CTGGGAGGTG GAGGTTGCAG 31680
TGAGCCGAGÁ TCGCGCCCCT GCACTCCAGC CTGGGCGACA GAGCGAGACT CCTTCTCAAA 31740
TAAATAAATA AATAAATAAC AAAGAGCAAA CTTAAAATTG TCTCAGAAAT CCCACGGGAT 33800
ATTGGATCTC CCTCATGCCT ATCTGATGAC ACTTTGAGTG TCTGGGGCCC CGTGCCTATT 31860
TTCTGGGGTT CCCAGAAGCT GCCGTTCTGA AAGTGTGGCT CTCGGGGACG TGGCACAGGT 31920
GTGGATGTCT GTTTTAAATG TCAGGCGTTT GGACGTTGAG GAACGTGAGG CTGAAGGTCG 31980
CCTTCGCCGA CCCCCTGAGT TTAGGGTCCT GCCTTTTAAA ATCTTCCCAG CACTCTGTTG 32040
TTCACGCAAG CGTCCCATCT GTTTGGGTGG CCGTGCCGTC TGCATCTGTC TCGAACCTTC 32100
ACAGCTTTGC AGAATATCCT GTTTCTCAAT ACGGATGGAG AAACACGAGA CGCGTTTTCT 32160
GGGTTATTTT AGCCGTCACG GAGAACCCCA GACTCATGTG TGCTAATGAC CTCATTAATG 32220
ATACTCTGAG GCAGACAGCC CTGCCTGATC TTAACAACAT ΤΤΤΤΤΆΑΑΤΤ TCTTTTTTTG 32280
TTGTTGTTGT TACAGCATCA TTCATATAAC GTAGGAAACC GTGATCAGTA GCTTTTAGGA 32340
TATTTGCAAC AGGGTGTAAC ADAAABD 32367
(2) Informace o sekvenci SEQ ID NO: 15:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 806 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOT“ (ix) RYSY:
(A) NÁZEV/KLÍČ: CDS (B) POZICE: 43..615
-58CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 15:
GTGTCCCCGG AÍXTGAAAGA TCGCAAAGAG GATGCGAAAG GGATGCAGGA CGAAGGCCAG 60
ACCAAAATCA ACXIAGAGGCG AAGTCGGACC AATTTCACCC TGGAACAACT CAATGAGGTG 120
GAGAGGCTTT TTGACGAGAC CCACTATCCC GACGCCTTCA TGCGAGAGGA ACTGAGCCAG 180
CGACTGGGCC TGTCGGAGGC CCGAGTGCAG GTTTGGTTTC AAAATCGAAG AGCTAAATGT 240
AGAAAACAAG AAAATCAACT CCATAAAGGT GTTCTCATAG GGGCCGCCAG CCAGTTTGAA 300
GCTTGTAGAG TCGCACCTTA TGTCAACGTA GGTGCTTTAA GGATGCCATT TCAGCAGGTT 360
CAGGCGCACX. TGCAGCTGGA CAGCGCTGTG GCGCACGCGC ACCACCACCT GCATCCGCAC 420
CTGGCCGCGC ACGCGCCCTA CATGATGTTC CCAGCACCGC CCTTCGGACT GCCGCTCGCC 480
ACGCTGGCCG CGGATTCGGC TTCCGCCGCC TCGGTAGTGG CGGCCGCAGC AGCCGCCAAG 540
ACCACCAGCA AGGACTCCAG CATCGCCGAT CTCAGACTGA AAGCGAAAAA GCACGCCGCA 600
GCCCTGGGTC TGTGACVCCA ACGCCAGCAC CAATGTCGCG CCTGTCCCGC GGCACTCAGC 660
CTGCASNCCC TNDDKANMCG TTRCTYHTCM ATTACACTTT GGGACCYCGG GDBAGVCCTT 720
TTNNAGACTT YVATKGGSCW CSCTGGBCCC TBRKGAWAC TTGSGHYCGR GAACCGAKHT 780
GCCCABAYGA GGACCRGTTT GGAKDG 806
(2) Informace o sekvenci SEQ ID NO: 16:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 190 aminokyselin ίο (B) TYP: aminokyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid
-59CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 16:
Met 1 Glu Asp Glu Gly Gin 5 Thr Lys Ile Lys 10 Gin Arg Arg Ser Arg 15 Thr
Asn Phe Thr Leu Gj u G1 n Leu Asn Glu Leu Glu Arg Leu Phe Asp G1 u
20 25 30
Thr His Tyr 1’ r. o Asp Ala Phe Mor. Arq Glu Glu Leu Ser Gin Axg Leu
3 5 40 45
Gly Leu Ser Glu Al a Arg Val Gin Val Trp Phe Gin Asn Arg Arq AJ a
50 55 60
Lys Cys Arg Lys Gin Glu Asn Gin Leu His Lys G1 y Val Leu Ile Gly
65 70 75 80
Ala Al a Se r Gin Phe Glu Ala Cys Arg Val Ala Pro Tyr Val Asn Val
85 90 95
Gly Ala Leu Axg Met Pro Phe Gin Gin Val Gin Al a Gin Leu Gin Leu
100 105 110
Asp Ser AJ a Val Ala Hl 3 Ala Hl 3 His His Leu His Pro His Leu Ala
115 120 125
Ala His AJ a Pro Tyr Met Met Phe Pro Ala Pro Pro Phe Gly Leu Pro
110 135 140
Leu Ala Thr Leu Ala Ala Asp Ser Ala Sec Ala Ala Ser Val Val Ala
145 150 1S5 160
Al a Ala Ala Al a Ala Lys Thr Thr Ser Lys Asp Ser Ser Ile Ala Asp
165 170 175
Leu Arg Leu Lys Ala Lys Lys His Ala Ala Ala Leu Gly Leu
180 185 190
PATENTOVÉ NÁROKY

Claims (28)

  1. PATENTOVÉ NÁROKY
    1. Molekula izolované nukleové kyseliny obsahující nukleotidovou sekvenci SHOX ET93 SEQ ID NO: 2 a nukleotidovou sekvenci vybranou ze skupiny sestávající z SHOX G310 - SEQ ID NO: 3, SHOX ET45 - SEQ ID NO: 4, SHOX G108 - SEQ ID NO: 5, SHOX Va - SEQ ID NO: 6 a SHOX Vb - SEQ ID NO: 7.
  2. 2. Molekula nukleové kyseliny podle nároku 1 obsahující nukleotidové sekvence SHOX ET93 - SEQ ID NO: 2, SHOX ET45 - SEQ ID NO: 4 a SHOX G108 - SEQ ID NO: 5.
  3. 3. Molekula nukleové kyseliny podle nároku 2 dále obsahující nukleotidovou sekvenci SHOX G310-SEQ IDNO: 3.
  4. 4. Molekula nukleové kyseliny podle nároku 3 dále obsahující nukleotidovou sekvenci SHOX Va-SEQ ID NO: 6.
  5. 5. Molekula nukleové kyseliny podle nároku 3 dále obsahující nukleotidovou sekvenci SHOX Vb-SEQ ID NO: 7.
    -60CZ 297640 B6
  6. 6. Molekula izolované nukleové kyseliny kódující polypeptidy obsahující oblast homeoboxu z šedesáti aminokyselin mající aminokyselinovou sekvenci SEQ ID NO: 1 a dále obsahující nukleotidovou sekvenci SHOX ET93 - SEQ ID NO: 2 a nukleotidovou sekvenci SHOX ET45 SEQ ID NO: 4.
  7. 7. Molekula nukleové kyseliny podle nároku 6, která kóduje polypeptid mající N-koncové a/nebo C-koncové aminokyselinové prodloužení oblasti homeoboxu z šedesáti aminokyselin SEQ ID NO: 1 a mající délku 150 až 350 aminokyselin.
  8. 8. Molekula nukleové kyseliny podle nároku 4, která kóduje polypeptid mající aminokyselinovou sekvenci SEQ ID NO: 11.
  9. 9. Molekula nukleové kyseliny podle nároku 5, která kóduje polypeptid mající aminokyselinovou sekvenci SEQ ID NO: 13.
  10. 10. Molekula nukleové kyseliny podle kteréhokoliv z nároků 1 až 9, přičemž molekula nukleové kyseliny je molekula genomové nukleové kyseliny.
  11. 11. Molekula nukleové kyseliny podle kteréhokoliv z nároků 1 až 9, přičemž molekula nukleové kyseliny je cDNA.
  12. 12. Molekula nukleové kyseliny podle nároku 11 obsahující nukleotidovou sekvenci SHOXa SEQ ID NO: 10.
  13. 13. Molekula nukleové kyseliny podle nároku 11 obsahující nukleotidovou sekvenci SHOXb SEQ ID NO: 12.
  14. 14. Molekula izolované nukleové kyseliny sestávající z částečné nukleotidové sekvence genu SHOX-SEQ ID NO: 8.
  15. 15. Molekula izolované nukleové kyseliny sestávající z částečné nukleotidové sekvence genu SHOX-SEQ ID NO: 14.
  16. 16. Molekula izolované nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízené hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C s tím, že sekvence - SEQ ID NO: 17, která je popsána v práci M. Marra a kol., EMBL, databázový vstup MMA59929, a sekvence SEQ ID NO: 18, která je popsána v M. Marra a kol., EMBL, databázový vstup MMA3349, jsou vyloučeny.
  17. 17. Polypeptid mající aminokyselinovou sekvenci - SEQ ID NO: 11.
  18. 18. Polypeptid mající aminokyselinovou sekvenci - SEQ ID NO: 13.
  19. 19. Expresní vektor nebo plazmid obsahující molekulu nukleové kyseliny podle kteréhokoliv z nároků 1 až 16.
  20. 20. Buňka transformovaná expresním vektorem nebo plazmidem podle nároku 19.
  21. 21. Transgenní živočich jiný než člověk nebo živočich jiný než člověk s deaktivovaným genem transformovaný expresním vektorem nebo plazmidem podle nárok 19.
    -61 CZ 297640 B6
  22. 22. Způsob identifikace nebo testování kandidátů farmaceutických činidel použitelných při léčbě vad vztahujících se k mutacím genu odpovídajícího za malou výšku postavy - SEQ ID NO: 8 nebo SEQ ID NO: 14, vyznačující se tím, že zahrnuje poskytnutí transformované buňky podle nároku 20 a stanovení změn fenotypu uvedených buněk nebo změn v produktech exprese uvedených buněk poté, co se uvedené buňky dostanou do kontaktu s uvedenými kandidáty farmaceutických činidel.
  23. 23. Použití molekuly nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekuly nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízené hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C jako primerů pro přípravu diagnostické sady pro identifikaci jednotlivců podezřelých z toho, že mají genetickou vadu v genu SHOX - SEQ ID NO: 8 nebo SEQ ID NO: 14.
  24. 24. Použití molekuly nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekuly nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízení hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C, jako primerů pro analýzu biologického vzorku izolovaného z lidského pacienta pro identifikaci jednotlivců podezřelých z toho, že mají genetickou vadu v genu SHOX - SEQ ID NO: 8 nebo SEQ ID NO: 14.
  25. 25. Použití molekuly nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekuly nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízení hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C, pro stanovení množství produktu exprese nebo sekvence z lidského genu SHOX v biologickém vzorku izolovaném z lidského pacienta pro identifikaci jednotlivců podezřelých z toho, že mají genetickou vadu v genu SHOX, přičemž tento gen SHOX má nukleotidovou sekvenci danou v SEQ ID NO: 8 nebo SEQ ID NO: 14.
  26. 26. Použití podle nároků 23, 24 nebo 25, ve kterém je molekula nukleové kyseliny vybrána ze skupiny sestávající z:
    GCA CAG CCA ACC ACC TAG;
    TGG AAA GGC ATC ATC CGT AAG;
    ATT TCC AAT GGA AAG GCG TAA ATA AC (SPI);
    ACG GCT ΊΤΤ GTA TCC AAG TCT ΤΊΤ G (SP2);
    GCC CTG TGC CCT CCG CTC CC (SP3);
    GGC TCT TCA CAT CTC TCT C1G CTT C (SP4);
    CCA CAC TG A CAC CTG CTC CCT TTG (SP5);
    CCC GCA GGT CCA GGC TCA GCT G (SP6);
    CGC CTC CGC CGT TAC CGT CCT TG (ASP1);
    CCC TGG AGC CGG CGC GCA AAG (ASP2);
    CCC CGC CCC CGC CCC CGG (ASP3);
    CIT CAG GTC CCC CCA GTC CCG (ASP4);
    CTA GGG ATC TTC AGA GGA AGA AAA AG (ASP5); a
    GCT GCG CGG CGG GTC AGA GCC CCA G (ASP6).
    -62CZ 297640 B6
  27. 27. Způsob stanovení genetické vady v biologickém vzorku izolovaném z lidského pacienta, který je podezřelý z toho, že má genetickou vadu v genu SHOX, přičemž tento gen SHOX má nukleotidovou sekvenci danou v SEQ ID NO: 8 nebo SEQ ID NO: 14, vyznačující se tím, že se provádí na základě molekul RNA nebo DNA.
  28. 28. Způsob podle nároku 27, vyznačující se tím, že molekula nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekula nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za podmínek přísně řízené hybridizace je použita jako primer pro stanovení genetické vady v genu SHOX io - SEQ ID NO: 8 nebo SEQ ID NO: 14, přičemž podmínky přísně řízené hybridizace jsou následující: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPia 1 % SDS při 65 °C.
CZ0096699A 1996-10-01 1997-09-29 Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití CZ297640B6 (cs)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US2763396P 1996-10-01 1996-10-01
EP97100583 1997-01-16
PCT/EP1997/005355 WO1998014568A1 (en) 1996-10-01 1997-09-29 Human growth gene and short stature gene region

Publications (2)

Publication Number Publication Date
CZ96699A3 CZ96699A3 (cs) 1999-08-11
CZ297640B6 true CZ297640B6 (cs) 2007-02-21

Family

ID=26145174

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ0096699A CZ297640B6 (cs) 1996-10-01 1997-09-29 Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití

Country Status (20)

Country Link
US (2) US7252974B2 (cs)
EP (2) EP0946721B1 (cs)
JP (2) JP2000515025A (cs)
KR (1) KR20000048838A (cs)
CN (1) CN1232499A (cs)
AT (1) ATE230026T1 (cs)
AU (1) AU744188C (cs)
BR (1) BR9712185A (cs)
CA (2) CA2267097A1 (cs)
CZ (1) CZ297640B6 (cs)
DE (1) DE69718052T2 (cs)
DK (1) DK0946721T3 (cs)
ES (1) ES2188992T3 (cs)
HU (1) HU225131B1 (cs)
IL (1) IL129015A0 (cs)
NO (1) NO991554L (cs)
NZ (1) NZ334970A (cs)
PL (1) PL194248B1 (cs)
SI (1) SI0946721T1 (cs)
WO (1) WO1998014568A1 (cs)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2368223A1 (en) * 1999-03-19 2000-09-28 Craig A. Rosen 48 human secreted proteins
AU3913100A (en) * 1999-03-26 2000-10-16 Human Genome Sciences, Inc. 50 human secreted proteins
US7927597B2 (en) 2001-04-10 2011-04-19 Agensys, Inc. Methods to inhibit cell growth
EP2280030A3 (en) 2001-04-10 2011-06-15 Agensys, Inc. Nucleic acids and corresponding proteins useful in the detection and treatment of various cancers
US20040248132A1 (en) 2001-10-04 2004-12-09 Toshiyuki Sakai DR5 gene promoter and siah-1 gene promoter
EP1583554A2 (en) * 2003-01-13 2005-10-12 Gudrun Rappold-Hoerbrand Use of natriuretic peptides for the treatment of stature disorders related to the shox gene
BRPI0607508B8 (pt) 2005-04-15 2021-07-27 Epigenomics Ag método para detecção e/ou classificação de distúrbios proliferativos celulares colorretais ou hepatocelulares, e uso do mesmo
US7382944B1 (en) 2006-07-14 2008-06-03 The United States Of America As Represented By The Administration Of The National Aeronautics And Space Administration Protective coating and hyperthermal atomic oxygen texturing of optical fibers used for blood glucose monitoring
DK2258871T3 (da) * 2007-01-19 2014-08-11 Epigenomics Ag Fremgangsmåder og nukleinsyrer til analyse af celleproliferative lidelser
EP2994541A4 (en) * 2013-05-06 2017-01-18 Capilet Genetics AB Diagnostic test for skeletal atavism in horses

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3445933A1 (de) * 1984-12-17 1986-06-19 Röhm GmbH, 6100 Darmstadt Arzneimittel mit diuretischer wirksamkeit
US4983511A (en) * 1989-01-09 1991-01-08 Olin Corporation Method and kit for detecting live microorganisms in chlorine- or bromine-treated water

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Marra, M. et al.: "mb68b03.rl Soares mouse p3NMF19.5 Mus musculus cDNA clone 334541 5asimilar to SW: HPR1-chick q05437 homeobox protein PRX-1", EMBL DATABASE ACCESSION NUMBER W18334, 4.5.1996 *
Marra, M. et al.: "mj75d03.rl Soares mouse p3NMF19.5 Mus musculus cDNA clone 481925 5asimilar to TR:G1002491 G1002494 ARIXI", EMBL DATABASE ACCESSION NUMBER AA059929, 24.9.1996 *

Also Published As

Publication number Publication date
HUP9904175A3 (en) 2002-01-28
DK0946721T3 (da) 2003-04-14
DE69718052T2 (de) 2003-07-31
WO1998014568A1 (en) 1998-04-09
ATE230026T1 (de) 2003-01-15
EP1260228A3 (en) 2003-03-05
EP0946721A1 (en) 1999-10-06
US7252974B2 (en) 2007-08-07
BR9712185A (pt) 1999-08-31
ES2188992T3 (es) 2003-07-01
US20030059805A1 (en) 2003-03-27
EP1260228A2 (en) 2002-11-27
NO991554D0 (no) 1999-03-30
IL129015A0 (en) 2000-02-17
EP0946721B1 (en) 2002-12-18
US20090111744A1 (en) 2009-04-30
PL194248B1 (pl) 2007-05-31
SI0946721T1 (en) 2003-06-30
AU744188B2 (en) 2002-02-14
NO991554L (no) 1999-05-14
AU4625297A (en) 1998-04-24
CN1232499A (zh) 1999-10-20
AU744188C (en) 2003-07-24
CA2647169A1 (en) 1998-04-09
HU225131B1 (en) 2006-06-28
JP2004201692A (ja) 2004-07-22
JP2000515025A (ja) 2000-11-14
CA2267097A1 (en) 1998-04-09
KR20000048838A (ko) 2000-07-25
CZ96699A3 (cs) 1999-08-11
NZ334970A (en) 2000-12-22
HUP9904175A2 (hu) 2000-04-28
PL332568A1 (en) 1999-09-27
DE69718052D1 (de) 2003-01-30

Similar Documents

Publication Publication Date Title
KR102526525B1 (ko) 타우 발현 조절 조성물
RU2745324C2 (ru) Композиции и способы модулирования экспрессии tau
KR20220062517A (ko) 결합 변형된 올리고머 화합물 및 이의 용도
CA3119065A1 (en) Use of adeno-associated viral vectors to correct gene defects/ express proteins in hair cells and supporting cells in the inner ear
AU2021200783A1 (en) Mitigating tissue damage and fibrosis via latent transforming growth factor beta binding protein (LTBP4)
ES2792126T3 (es) Método de tratamiento basado en polimorfismos del gen KCNQ1
AU2016325030A1 (en) Novel biomarkers and methods of treating cancer
KR20130123357A (ko) 저산소증과 관련된 질환의 진단방법 및 키트
AU744188C (en) Human growth gene and short stature gene region
WO2006022629A1 (en) Methods of identifying risk of type ii diabetes and treatments thereof
EP1347992A2 (en) Polymorphic bone morphogenetic protein 2
US6262334B1 (en) Human genes and expression products: II
US6566061B1 (en) Identification of polymorphisms in the PCTG4 region of Xq13
IL179831A (en) In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders
PT1939287T (pt) Método de transferência de genes específico para células trofectodérmicas
US20160250182A1 (en) Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson&#39;s disease risk
CA2433869C (en) Gene for identifying individuals with familial dysautonomia
CA2348657C (fr) Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
US20160184454A1 (en) Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson&#39;s disease risk
Class et al. Patent application title: Human Growth Gene and Short Stature Gene Region Inventors: Gudrun Rappold-Hoerbrand (Heidelberg, DE) Ercole Rao (Riedstadt, DE)
CN111278468A (zh) 用于脂肪营养不良的自体细胞疗法的人脂肪组织祖细胞
US6627745B1 (en) Pyrin gene and mutants thereof, which cause familial Mediterranean fever
MXPA99002809A (en) Human growth gene and short stature gene region
RU2805557C2 (ru) Варианты b4galt1 и их применение
US20030203380A1 (en) Gene linked to osteoarthritis

Legal Events

Date Code Title Description
PD00 Pending as of 2000-06-30 in czech republic
MM4A Patent lapsed due to non-payment of fee

Effective date: 20110929