CZ96699A3 - Isolovaná lidská molekula nukleové kyseliny kodující polypeptidy, růstový protein a jeho použití a způsob - Google Patents

Isolovaná lidská molekula nukleové kyseliny kodující polypeptidy, růstový protein a jeho použití a způsob Download PDF

Info

Publication number
CZ96699A3
CZ96699A3 CZ99966A CZ96699A CZ96699A3 CZ 96699 A3 CZ96699 A3 CZ 96699A3 CZ 99966 A CZ99966 A CZ 99966A CZ 96699 A CZ96699 A CZ 96699A CZ 96699 A3 CZ96699 A3 CZ 96699A3
Authority
CZ
Czechia
Prior art keywords
seq
human growth
dna
gene
shox
Prior art date
Application number
CZ99966A
Other languages
English (en)
Other versions
CZ297640B6 (cs
Inventor
Gudrun Rappold-Hoerbrand
Ercole Rao
Original Assignee
Gudrun Rappold-Hoerbrand
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gudrun Rappold-Hoerbrand filed Critical Gudrun Rappold-Hoerbrand
Publication of CZ96699A3 publication Critical patent/CZ96699A3/cs
Publication of CZ297640B6 publication Critical patent/CZ297640B6/cs

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P5/00Drugs for disorders of the endocrine system
    • A61P5/02Drugs for disorders of the endocrine system of the hypothalamic hormones, e.g. TRH, GnRH, CRH, GRH, somatostatin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P5/00Drugs for disorders of the endocrine system
    • A61P5/06Drugs for disorders of the endocrine system of the anterior pituitary hormones, e.g. TSH, ACTH, FSH, LH, PRL, GH
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biomedical Technology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Diabetes (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • General Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Endocrinology (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Obesity (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Description

Oblast techniky
Vynález se týká izolace, identifikace a charakterizace nově identifikovaných lidských genů, které odpovídají za vady lidského růstu, zvláště za malou výšku postavy nebo Turnérův syndrom. Dále se vynález týká diagnózy a terapie takových vad. Izolovaná genomová DNA nebo její fragmenty se mohou použít pro farmaceutické účely nebo jako diagnostické nástroje nebo činidla pro identifikaci nebo charakterizaci genetických defektů, které se podílejí na uvedených vadách. Vynález dále popisuje lidské růstové proteiny (transkripční faktory A, B a C) , které se exprimují po transkripci uvedené DNA na RNA nebo mRNA a které se mohou použít při terapii vad spojených s mutacemi v uvedených genech. Dále se popisují vhodné sekvence cDNA, které se mohou použít při přípravě rekombinantních proteinů vhodných pro léčbu takových vad. Předmětem vynálezu jsou dále plazmidové vektory vhodné pro expresi DNA těchto genů a vhodné buňky, které obsahují takovou DNA. Dále se popisují metody genetické léčby uvedených vad v oboru molekulární medicíny za použití expresivního plazmidu připraveného inkorporací DNA dównstream expresivního promotoru, který umožňuje expresi v savčí hostitelské buňce.
Dosavadní stav techniky
Růst je základní aspekt vývoje organizmu. Je regulovaný vysoce organizovaným a komplexním systémem. Výška postavy je multifaktorový rys, který je ovlivněn faktory prostředí a genetickými faktory. Vývojové malformace, které zahrnují výšku postavy, jsou běžným jevem u lidí všech ras. V případě lidí je četnost výskytu 3 ze 100 a retardace růstu vede k malé • · · · · • · · · • · · · · · • · · · · · • · velikosti postavy, za což ve většině případů odpovídají vrozené vady.
Turnérův syndorm je běžná ohromo zoinální vada (Rosenfeld RG, Tesch L-G, Rodriguez-Rigau LJ, McCauley E, Albertsson-Wikland K, Asch R, Cara J, Conte F, Halí JG, Lippe B, Nagel TC, Neely EK, Page DC, Ranke M, Saenger P, Watkins JM, Wilson DM (1994): Recommendations for diagnosis, treatment, and management of individuals with Turner syndrom. The Endocrinologist 4(5) : 351-358) s četností výskytu 1:2 500 u živě narozených žen. Odhaduje se, že 1 až 2 % oplodnění u lidí má karyotyp 45,X a že až 99 % takových plodů nepřichází na svět v termínu (Halí J.G., Gilchrist D.M. (1990): Turner syndrome and its variants. Pedriatr. Clin. North Am. 37: obinson A (1990): Demography and prevalence of Turner syndrome. In: Turner Syndrome., edited by Rosenfield R.G., Grumbach M.M., pp. 93 - 100, New York, Marcel Dekker). U lidí s Turnérovým syndromem (nebo s UllrichTurnerovým syndromem) existuje podstatná klinická variabilita fenotypu (Ullrich, 1930; Turner, 1938). Malá výška postavy je konsistentní nález a spolu s gonádovou dysgenezí se považuje za vedoucí symptom uvedených vad. Turnerový syndrom je skutečná multifaktorová vada. Uvažuje se, že za embryonální letalitu, malou výšku postavy, gonodovou dysgenezi a charakteristické somatické rysy odpovídají monosomy genů, které jsou běžné u X a Y chromozomů. Ukazuje se, že pro normální vývoj člověka jsou nutné diploidy těchto homologních genů X-Y. Očekává se, že Turnérovy geny (nebo anti-Turnerovy geny) se u žen exprimují jak z aktivního tak z neaktivního chromozomu X nebo chromozomu Y, aby se zajistila správná dávka genového produktu. Haplo-nedostatečnost (nedostatečnost způsobená pouze jednou aktivní kopií) naznačuje mechanizmus vedoucí k onemocnění.
Dosud se objasnila řada mechanizmů, které vedou k malé výšce postavy. Nedostatečnost růstového hormonu a receptorů růstového hormonu, stejně jako vady skeletu se popisují jako • · · · · · · · · · ···· · ··· · ·· · • · · · · · ···· · ··· ··· ······ · · • · · · · ·· · ·· ·· příklady fenotypu s malou výškou postavy (Martial et al.,(1979; Phillips et al., 1981; Leung et al., 1987; Goddard et al., 1995). Identifikovaly se mutace ve třech genech, které kódují receptor lidského fibroblastového růstového faktoru (FGFR 1-3) a způsobují řadu vad skeletu. Tyto vady zahrnují většinu forem trpasličího vzrůstu, achondroplázie (Shiang et al. , 1994; Rousseau et al., 1994; Muenke and Schell, 1995) . Dobře známá a častá chromozomální vada ( objevuje se u jedné z 2 500 žen) Turnérův syndrom (45,X) je také spojena s malou výškou postavy. Všechny tyto důvody však odpovídají pouze za malou část pacientů s malou výškou postavy. Většina případů zatím zůstává nevysvětlena.
Věří se, že chromozomy X a Y nesou geny, které ovlivňují výšku postavy (Ogata T, Tyler-Smith C, Purvis-Smith S, Turner G. (1993): Chromosomal localisation of a gene(s) for Turner stigmata on Yp. J. Med. Genet. 30: 918-922). To se může u pacientů s abnormalitami pohlavních chromozomů odvodit ze vztahu genotyp-fenotyp. Cytogenetické studie dokazují, že delece konců krátkých ramen buď chromozomu X nebo Y vedou u některých jedinců k malé výšce postavy (Zuffardi et al., 1982); Curry et al., 1984). Uvádí se více než 20 uspořádání chromozomu, které se spojují s delecemi konců chromozomu Xp a Yp a které nesou gen(y) odpovědné za malou výšku postavy, s pseudoautozornálni oblastí (PARI) (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P., Zuffardi O., Guilo S., Camerino G., (1989): Contiguous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome . Proč. Nati. Acad. Sci USA 86: 10001-10005.; Schaefer L., Ferrero G.B., Grillo A., Bassi M.T. Roth E.J. Wapenaar M.C., Van Ommen -J.B., Mohandas T.K., Rocchi M., Zoghbi H.Y. Ballabio A. (1993): A high resolution deletion map of human chromosome Xp22. Nátuře genetics 4: 272279). Pozice těchto genů se zúžila na distální DNA o velikosti i
• · ·
700 kb oblasti PARI, kterou lemuje markér DXYS15 (Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T.,
Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834;
Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629) .
Regulace růstu u savců je organizována jako komplexní systém. Je možné, že vysoce organizovaným způsobem spolu reaguje více genů (proteinů), které podporují růst. Jeden z těchto genů, který odpovídá za výšku postavy, se zmapoval až do pseudoautozomální oblasti PARI (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P., Zuffardi O., Guilo S., Camerino G., (1989): Contiguous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome . Proč. Nati. Acad. Sci USA 86: 10001-10005) , což je oblast, o které se ví, že je volně zaměnitelná mezi chromozomy X a Y (Rappold G.A. (1993) : The pseudoautosomal region of the human sex chromosomes. Hum. Genet. 92: 315-324). Celá oblast RAPI je přibližně 2 700 kb velká.
U pacientů s delecí se definovala kritická oblast ovlivňující výšku postavy. K malé výšce postavy dochází v případě, když se deletuje celá oblast o velikosti 700 kb nebo když je specifický gen v této kritické oblasti přítomen v haploidním stavu nebo když je přerušen nebo mutován (jako je případ
*· ·· · · · ·· • · « · · · · · ··· · ··· · · · · • · · · · ···· · ··· ··· • · · · · · · ·· ·· · '♦· «· idiotypické malé výšky postavy nebo Turnérův syndrom). Frekvence výskytu Turnérova syndromu ve světě je jedna z 2 500 žen; četnost výskytu tohoto druhu idiopatické malé výšky postavy se odhaduje na 1 případ ze 4 000 až 5 000 osob. Ženám s Turnérovým syndromem a některým jednotlivcům s malou výškou postavy se obvykle po několik let až po několik desítek let aplikuje růstový hormon (GH) , ačkoli je známo, že jejich hladina růstového hormonu v těle je normální a nedostatečnost GH zde není problémem. Léčba takových pacientů je velmi nákladná (odhaduje se přibližně na 30 000 USD ročně). Proto je nutné získat způsob rozlišení pacientů malého vzrůstu, kteří mají genetický defekt a pacienti, kteří nevykazují genetický defekt uvedeného genu. U pacientů s genetickým defektem tohoto genu - buď s úplnou delecí genu (jako je v případě Turnérova syndromu) nebo s bodovou mutací (jako je tomu u idiopatické malé výšky postavy)- je možné aplikovat alternativní léčbu bez lidského růstového hormonu.
Korelace genotyp/fenotyp podporují existenci růstového genu v proximální části Yq a v distální části Yp. Malá výška postavy se také objevuje u jedinců s terminálními delecemi Xp. Proběhlo rozsáhlé vyhledávání pacientů s částečnými monosomiemi pseudoautozomální oblasti. Na základě korelací genotyp-fenotyp se stanovila minimální běžná delece oblasti DNA o velikosti 700 kb (Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P.,
Petit C., Aya M., Matsuo N. (1992) : Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N.,
Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the • 4 4 4 4 4 4 4 4 4
494 «49 9944
9444 4 994 9 49 · • 9 444 4 4444 4 444 444 • 44444 4 4
44444 44 4 44 44 critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834). Zjistilo se, že uvedená oblast leží mezi genetickými markéry DXYS20 (3cosPP) a DXYS15 (113D) a u všech genů, které aspirují na řízení růstu, a leží v oblasti PARI (například receptor hemopoietického růstového faktoru; CSF2RA) (Gough N.M., Gearing D.P., Nicola N.A., Baker E., Pritchard
M. , Callen D.F., Sutherland G.R. (1990). Localization of the human GM-CSF receptor gene to the X-Aby pseudoautosomal region. Nátuře 345: 734736), se odstranily na základě jejich fyzikální pozice (Rappold G. A., Wilson T.A., Henke A., Gough
N. M. (1992): Arrangment and localization of the human GM-CSF receptor achain gene CSF2RA within the X-Aby pseudoautosomal region. Genomics 14: 455-461). Geny se nacházely v deleční oblasti o velikosti 700 kb PARI oblasti o velikosti 2 700 kb. Nedávno se objevily u jednotlivců s malým vzrůstem delece pseudoautozomální oblasti (PARI) pohlavních chromozomů a následně se také definovala minimální běžná oblast delece o velikosti 700 kb. Na základě analýzy DNA Southernovým přenosem u pacientů TIK a SS za použití odlišných pseudoautozomální ch markérů se identifikovala Xp terminální delece přibližně 700 kb od DXYS15 (113D) (Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P.,
Petit C., Aya M., Matsuo N. (1992) : Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N.,
Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834) .
·
• 4 · ·>·
Podstata vynálezu
Oblast genu odpovídající za malý vzrůst postavy se identifikovala jako oblast o velikosti přibližně 500 kb , s výhodou o velikosti přibližně 170 kb v PARI oblasti chromozomů X a Y. V této oblasti se identifikovaly tři geny jako kandidáti, kteří odpovídají za malý vzrůst. Tyto geny se označily SHOX (také jako SHOX93 nebo HOX93) (SHOX znamená gen obsahující homeobox malého vzrůstu), pET92 a SHOT (gen nesoucí homeobox podobný SHOX na chromozomu 3) . Zvláště významný je gen SHOX, který má dvě oddělená místa sestřihu, což vede ke vzniku dvou variací (SHOXa a b) . Během předchozích výzkumů se analyzovala podstatná část nukleotidové sekvence genu malého vzrůstu (SEQ ID NO: 8) . Mohou se předpovědět a identifikovat exony nebo jejich části (například exon I [G310]/ exon II [ET93]; exon IV [G108]; pET92) . Získané informace o sekvenci se pak mohou použít pro navržení vhodných primerů nebo nukleotidových sond, které hybridizují s částmi genu SHOX nebo jeho fragmenty. Gen SHOX se pak může izolovat běžnými metodami. Na základě další analýzy sekvence DNA genů zodpovědných za malý vzrůst se izoluje nukleotidová sekvence exonu I až V (uvedeno na obrázku č. 1 až 2). Gen SHOX obsahuje homeobox (SEQ ID NO: 1) o velikosti přibližně 180 bp (obrázek č. 2 a obrázek č. 3). Začíná nukleotidem, který kóduje aminokyselinu v pozici 117 (Q) , končí nukleotidem kódujícím aminokyselinu v pozici 176 (E) , to znamená od CAG(440) do GAG(619). U pacientů z Německa (AI) s malou výškou postavy a u pacientů Japonska, kde se testovalo 250 jednotlivců s idiopatickým malým vzrůstem, se identifikoval homeobox jako sekvence homeobox-pET93(SHOX) a zjistily se dvě bodové mutace. Obě bodové mutace se našly ve stejné pozici a vedou ke zkrácení proteinu v pozici aminokyseliny 195. To naznačuje, že zde může existovat tzv. horké místo. Na základě skutečnosti, že obě mutace, které vedou ke zkrácení proteinu, se vyskytují • · •9 ·9 · « 9 9 9 9 · · ·
999 9 99« · 99 · • 99* 9 999· 9 999 999
9 9 9 9 · · • 99 9-9 9 9« 99 ve stejné pozici, je pravděpodobné, že putativní horké místo rekombinace existuje v exonu 4(G108). Primery specifické pro exon jsou například GCA CAG CCA ACC ACC TAG (forward) nebo TGG AAA GGC ATG ATC CGT AAG (reverzní) . Shora uvedený nový gen obsahující homeobox, SHOX, který se nachází v intervalu 170 kb, je alternativně sestřižen a dává vznik dvěma proteinům s odlišnými funkcemi. Při demonstraci skutečnosti, že malá výška postavy je způsobena mutacemi v SHOX, se použila analýza mutace a sekvenování DNA.
Identifikace a klonování kritické oblasti malého vzrůstu podle vynálezu se uskutečnila následujícím způsobem. U 15 jednotlivců s částečnými monosomy v pseudoautozomální oblasti (PARI) se provedla rozsáhlá fyzikální mapovací studie. Korelací výšky těchto jedinců s delečními body se definovala kritická oblast malého vzrůstu (SS) o přibližné velikosti 700 kb. Tato oblast se následně klonovala jako překrývající se kosmidový kontig za použiti kvasinkových umělých chromozomů (YAC) z PARI (Ried K., Mertz A., Nagaraja R., Trusnich M., Riley J., Anand R., Page D., Lehrach H., Elloiso J., Rappold G.A. (1995): Characterization of a yeast artificial chromosome conting spanning the pseudoautosomal region. Genomics 29: 787792) a pomocí metody „chodícího kosmidu (cosmid walking). Za účelem vyhledání genů odpovědných za SS v tomto intervalu se na přibližně 600 kb velkou oblast mezi distálním koncem kosmidu 56G10 a proximálním koncem 51D11 aplikovala řada metod. Za použití selekce cDNA, trapování exonu a CpG klonování se identifikovaly dva nové geny.
Pozice kritického intervalu malého vzrůstu se zúžila na menší interval DNA o velikosti 170 kb tím, že se charakterizovaly ' tři další jedinci (GA, AT a RY) , kteří vykazují malý vzrůst postavy. Za účelem přesného stanovení pozice bodu přerušení u těchto jedinců se provedla na chromozomech v metafázi za použití kosmidu vhodných pro kontig fluorescenční hybridizace in šitu (FISH). Pacient GA, který vykazuje terminální deleci a • · • · · 9 9 9 9 9 · ·
9 9 9 9 9 9 9 · · · 9 • 9 · · · 9 9999 9 999 999
99999* 9 9
99999 99 9 99 99 normální výšku vzrůstu, definuje distální hranici kritické oblasti (bod přerušení se nachází na kosmidu 110E3) a pacient AT vykazující inverzi X chromozomu a normální výšku vzrůstu definoval proximální hranici (bod přerušení se nachází na kosmidu 34F5). Bod přerušení chromozomu Y u pacienta RY, který vykazuje terminální deleci a malý vzrůst, se také nachází na kosmidu 34F5, což naznačuje, že tato oblast obsahuje sekvence s predispozicí k přestavění chromozomů.
Celá oblast ohraničená Xp/Yp se klonovala jako sada přesahujících kosmidu. Ke studiu šesti pacientů s přestavěným chromozomem X, kdy tři z nich jsou normálního vzrůstu a tři mají malou výšku vzrůstu, se použila fluorescenční hybridizace in šitu (FISH) s kosmidy s této oblasti. Korelace genotypufenotypu zúžily kritický interval pro malý vzrůst na 270 kb DNA nebo na dokonce menší interval, jako je 170 kb, který obsahuje gen nebo geny důležité pro růst člověka. Tento interval pokrývá minimálně šest až osm kosmidu a jsou nyní dostupné pro hybridizaci FISH interfáze a metafáze, která je dostupný nástroj pro diagnózu pacientů s idiopatickým malým vzrůstem postavy.
Skutečnost, že cílový gen vede k vadám růstu u lidí (např. oblast malého vzrůstu), nebyla dříve známa. Biologická a klinická asociace pacientů s uvedenou deleci vysvětluje funkci uvedeného genu. V této studii se použila fluorescenční in šitu hybridizace (FISH) za účelem testování metafáze a interfáze jádra lymfocytu u šesti pacientů. Cílem bylo testovat u všech přesahujících kosmidů jejich použitelnost jako sondy pro FISH hybridizaci a stanovit oblasti porušení genu u všech čtyř případů, a tímto způsobem stanovit minimální kritickou oblast genu malého vzrůstu.
Duplikace nebo delece genomové DNA se může uskutečnit kvantitativní PCR nebo odhadem dávky na Southernových blotech nebo použitím RFLP.
·4 444 44 44
444 4 4 4 4444
4444 4 4 4 4 4 4« 4 4 4 444 444444 444 444 • 44444 · 4
44444 44 4 «4 44
Zvláště vhodnou metodou pro přesné rozlišení mezi jednou a zdvojenou dávkou markérů je hybridizace FISH, přičemž její klinická aplikace je v současnosti rutinní záležitostí. Zatímco při FISH hybridizaci interfáze se může zhodnotit absence nebo přítomnost molekulového markéru, hybridizace FISH metafáze chromozomů může poskytnout semi-kvantitativní stanovení delecí uvnitř kosmidu. Uvedeným způsobem se může stanovit delece o velikosti přibližně 10 kb (což odpovídá 25 % redukci signálu). Zvláště je důležité, že prakticky všechny geny onemocnění na lidském X chromosomu jsou spojeny s menšími a většími delecemi v rozmezí od několika kilobazí do několika megabazí DNA (Nelson, D.L., Ballabio A., Cremers F., Monaco A.P., Schlessinger D., (1995). -Report of the sixth international workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342).
Vynález dále popisuje sekvence DNA nebo jejich fragmenty, které jsou části genů odpovědných za lidský růst (nebo v případě defektu v těchto genech odpovídají za malý vzrůst). Identifikovaly se tři geny odpovědné za lidský růst. Jsou to SHOX, pET92 a SHOT) . Sekvence DNA nebo fragmenty těchto genů stejně jako sekvence DNA těchto genů v plné délce se mohou transformovat do vhodného vektoru a mohou se dále transfekovat do buněk. Když se takové vektory zavedou do buněk vhodným způsobem, jako jsou přítomny u zdravých jedinců, je možné uvedeným způsobem léčit onemocnění spojené s malým vzrůstem, to znamená například Turnérův syndrom. Onemocnění spojené s malým vzrůstem se může léčit odstraněním nebo mutací růstových genů odpovědných za malý vzrůst. Je také možné stimulovat geny, které kompenzují působení genů odpovědných za malou výšku postavy, to znamená inzercí sekvencí DNA před, za nebo do růstových genů/genů odpovídajících za malou výšku za účelem zvýšit expresi zdravých alel. Uvedenými modifikacemi genů se růstové geny/geny odpovídajících za malou výšku aktivují nebo deaktivují. To se může uskutečnit inzercí • 44 ··· 4« • •4 4*4 « 4 4 4
4444 · 444 4 44 4 44 444 4 4*44 · 444 444
4444 4 4 · 4
4 4 4 4 44 4 44 44 sekvencí DNA do vhodných míst, které jsou v genu nebo blízko genu umístěny tak, že tyto inzerované sekvence DNA interferují s růstovými geny/geny odpovídajícími za malou výšku a tak aktivují nebo brání jejich transkripci. Je také možné před růstové geny začlenit regulační element (například promotorovou sekvenci), aby se geny stimulovaly a staly se aktivní. Dále je možné stimulovat promotorovou sekvenci za účelem nadměrné exprese - v případě Turnérova syndromusprávně fungujících alel a tak kompenzovat chybějící alely. Modifikace genů se může obecně dosáhnout inzercí exogenních sekvencí DNA do růstového genu/genu odpovídajícího za malý vzrůst prostřednictvím homologní rekombinace.
Sekvence DNA podle vynálezu se mohou také použít k transformaci uvedených sekvencí do zvířat, jako jsou savci, prostřednictvím vhodného vektorového systému. Tyto transgenni zvířata se pak mohou použít pro zkoumání in vivo při testování a identifikaci farmaceutických činidel, která jsou použitelná při léčbě onemocnění spojených s malým vzrůstem. Jestliže zvířata pozitivně reagují na aplikaci sloučeniny nebo činidla, pak uvedené činidlo nebo sloučenina nebo jejich deriváty jsou vhodná jako farmaceutická činidla. Sekvence DNA podle vynálezu se mohou také využívat v genetických experimentech za účelem nalezení způsobů, jak kompenzovat ztráty genů odpovědných za malý vzrůst postavy.
Dále vynález popisuje sekvence DNA, které se mohou využít při transformaci buněk. Tyto buňky se mohou použít k identifikaci farmaceutických činidel, jenž se mohou použít při léčbě onemocnění spojených s malou výškou postavy nebo k testování takových látek nebo knihovny látek. Ve vhodném testovacím systému se mohou identifikovat změny fenotypu nebo změny expresivního paternu těchto buněk, což umožňuje identifikaci činidla vhodného pro přípravu léků.
Sekvence DNA podle vynálezu se také mohou použít při tvorbě vhodných primerů, které za přísných podmínek hybridizují se
• 00 * · · • 000 0 0 0 0 · · 9 0 » · • 9 «9 9 0 0 0 0 0 0 0
12 0 0» 00· 00 0 · 0 9 9 · 9 9 0 · · ·
segmenty genů odpovídajících za malý vzrůst nebo s jejich
fragmenty. Mohou se konstruovat vhodné sekvence primerů, které
se používají při diagnóze lidí, které mají genetický defekt
způsobující malý vzrůst. Proto je nutné poznamenat, že dvě mutace nalezené v identické pozici naznačují, že existuje mutační horké místo.
Sekvence DNA podle vynálezu zahrnují i takové sekvence, které se degenerovaly na specifické sekvence na základě degenerace genetického kódu nebo které hybridizují za přísných podmínek se specificky danými sekvencemi.
Vynález zdůrazňuje zvláště následující rysy:
a) Molekulu izolované nukleotidové kyseliny kódující polypeptidy obsahující oblast homeoboxu šedesáti amininokyselin, které mají aminokyselinovou sekvenci SEQ ID NO: 1 a vykazují regulující aktivitu lidského růstu.
b) Molekulu izolované DNA obsahující nukleotidovou sekvenci, jak je uvedeno na obrázku č. 2, 3 nebo 4 a zvláště, jak je uvedeno V SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15.
c) Molekuly DNA jsou schopny hybridizovat s molekulami DNA popsanými v odst. b).
d) Molekuly DNA podle odstavce c) jsou schopny hybridizovat s molekulami DNA podle odst. 2 při teplotě 60 °C až 70 °C a v přítomnosti roztoku standardního pufru.
e) Molekuly DNA obsahují nukleotidové sekvence, které vykazují % nebo vyšší homologii s nukleotidovou sekvencí SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15 a kódují polypeptid, který má regulační aktivitu lidského růstu.
f) Lidské růstové proteiny mají aminokyselinovou sekvenci SEQ ID NO: 11, 13 nebo 16 nebo jejich funkční fragment.
g) Protilátky získané při imunizaci zvířat lidskými růstovými proteiny podle odst. f) nebo jejich antigenní varianty.
h) Farmaceutické kompozice obsahující lidské růstové proteiny nebo jejich funkční fragmenty pro léčbu vad způsobených genetickými mutacemi lidského růstového genu.
* φ φφφ φ φφφφ • φ
ΦΦ 4
Φ Φ Φ • Φ Φ
ΦΦΦ 4
Způsob testování látky účinné při léčbě vad zmiňovaných shora v textu podle odst. h) zahrnující detekci mediátorové RNA hybridizující s libovolnými molekulami DNA popsanými v odstavcích a) až e) , přičemž se měří zesílení exprese molekuly DNA jako odezvy na léčbu hostitelské buňky substancí. Expresivní vektor nebo plazmid obsahující libovolné molekuly nukleové kyseliny popsané v odstavcích a) až e) , které umožňují, aby molekuly DNA se exprimovaly v savčích buňkách.
k) Způsob stanovení genu nebo genů v biologických vzorcích tkání nebo tělních tekutin odpovědných za malý vzrůst.
V případě metody popsané shora v textu v odstavci k) se pro detekci specifických nukleotidových sekvencí s výhodou používají nukleotidové amplifikační metody PCR, které jsou dobře známy v oboru a popisují se například v publikacích Mullis et al., 1986, Cold Spring Harbor Symposium Quant. Biol. 51, 263-273 a Saiki et al., Science 239, 487-491. Stanovené nukleotidové sekvence odpovídající za malý vzrůst jsou hlavně ty, které jsou reprezentovány sekvencemi SEQ ID NO: 2 až SEQ ID NO: 7.
V principu všechny oligonukleotidové primery a sondy vhodné pro amplifikaci a detekci genetického defektu, který odpovídá za poškození lidského růstu v biologických vzorcích, jsou vhodné pro amplifikaci cílové sekvence spojované s malým vzrůstem. V tabulce č. 1 jsou uvedeny vhodný pár primerů specifický pro exon podle vynálezu. Následuje vhodná detekce, přičemž se například provádí radioaktivní nebo jiné značení.
Tabulka č. 1
exon Sense Antisense Produkt Ta (°C)
primer primer (bp)
44
4 4
444 4 4
4 4 4 4
4 4 4 4
44 »4 4
44
4 4 4
4 4 4
444 444
4
5'-I(G310) SPI ASP1 194 58
3'-I(G310) SP2 ASP2 295 58
II (ET93) SP3 ASP3 262 76/72/68
III (ET45) SP4 ASP4 120 65
IV(GI08) SP5 ASP5 154 62
Va (SHOXa) SP6 ASP6 265 61
Vysvětlení zkratek u primerů:
SP 1: ATTTCCAATGGAAAGGCGTAAATAAC
SP 2: ACGGCTTTTGTATCCAAGTCTTTTG
SP 3: GCCCTGTGCCCTCCGCTCCC
SP 4: GGCTCTTCACATCTCTCTCTGCTTC
SP 5: CCACACATGACACCTGCTCCCTTTG
SP 6: CCCGCAGGTCCAGGCTAGCTG
ASP1: CGCCTCCGCCGTTACCGTCCTTG
ASP2 ; CCCTGGAGCCGGCGCGCAAAG
ASP3: CCCCGCCCCCGCCCCCGG
ASP4; CTTCAGGTCCCCCCAGTCCCG
ASP5: CTAGGGATCTTCAGAGGAAGAAATVkG
ASP6: GCTGCGCGGCGGGTCAGAGCCCCAG
Jako targetová DNA může také sloužit jednořetězcová RNA. Metody zpětné transkribce RNA na cDNA jsou dobře známy v oboru a popisuje je Sambrook et al., Molecular Cloning A Laboratory Manual, New York, Cold Spring Harbor Laboratory 1989. V jiném případě preferované metody reverzní transkripce využívají termostabilní DNA polymerázy, které vykazují RT aktivitu.
Shora popsaná metoda se může použít při selekci těch osob ze skupiny lidí, jejichž malý vzrůst postavy se spojuje s genetickým defektem, což umožňuje specifičtější léčbu.
Vynález dále popisuje transkripční faktory A, B a C, které se mohou použít jako farmaceutická činidla. Tyto transkripční faktory inicijují stále neznámou kaskádu biologických účinků na molekulární úrovni, které se spojují s lidským růstem. Tyto *
999 9 999 9 99 9
999 9 9999 · 999 999
9 9 9 9 9 9
9* 99 9 99 99 proteiny nebo jejich funkční fragmenty mají mitogenní účinek na různé buňky. Zvláště mají osteogenní účinek. Mohou se použít při léčbě onemocnění kostí, jako je například osteoporéza, a zvláště všech onemocnění spojených s poškozením regulace vápníku v kostech.
Termín „izolovaný'' znamená původní derivaci molekuly DNA klonováním. Vynález se týká jak přirozeně se vyskytujících sekvencí tak i synteticky připravených.
Molekuly DNA podle vynálezu se mohou použít ve formách genové terapie, která zahrnuje použití expresivních plazmidů připravených inkorporací vhodné sekvence DNA podle vynálezu downstream od expresivního promotoru, který ovlivňuje expresi v savčí hostitelské buňce. Vhodné hostitelské buňky jsou prokaryontní a eukaryontní buňky. Prokaryontní hostitelské buňky jsou například E. coli, Bacillus subtilis a podobně. Prostřednictvím transfekce hostitelských buněk replikony, které pocházejí z druhů adaptovatelných na hostitele, to jsou plazmidové vektory obsahující počáteční bod replikace a regulační sekvence, se mohou uvedené hostitelské buňky transfekovat požadovaným genem nebo cDNA. Takové vektory jsou s výhodou ty, které mají sekvenci, jenž vybaví transfekované buňky vlastnostmi (fenotypem), na jejichž základě se mohou selektovat. V typickém případě se používají jako hostitelé bakterie E. coli kmen K12a, z vektorů se používá buď pBR322 nebo plazmidy pUC. Příklady vhodných promotorů v případě hostitelů E. coli jsou promotor trp, lac promotor nebo lpp promotor. Jestliže je to nutné, sekrece expresivního produktu skrz buněčnou membránu se může ovlivnit spojením sekvence DNA kódující sekvenci signálního peptidu s 5'upstream částí genu. Eukaryontní hostitelské buňky zahrnují buňky získané z obratlovců nebo kvasinek, atd. Jako hostitelské buňky obratlovců se mohou použít buňky COS (Cell, 1981, 23: 175-182) nebo buňky CHO. Aby došlo k expresi mohou se s výhodou použít promotory, které jsou umístěny 5'upstream genu a mají místa
I 9 9 9 > · · · •99 999 sestřihu RNA, polyadenylační a transkripční terminační sekvence.
Při léčbě vad způsobených mutacemi lidských růstových genů se mohou použít jako činidla podporující růst transkripční faktory A, B a C podle vynálezu. Na základě polymorfizmu, který je znám u eukaryontních genů, se může substituovat jedna nebo více aminokyselin. Jedna nebo více aminokyselin v polypeptidech může být deletována nebo začleněna do jednoho nebo více míst aminokyselinové sekvence polypeptidů SEQ ID NO: 11, 13 nebo 16. Takové polypeptidy jsou nazývány ekvivalentní polypeptidy, pokud vykazují biologickou aktivitu nemodifikovaného polypeptidů, jenž zůstává v podstatě beze změn.
Přehled obrázků na výkrese
Na obrázku č. 1 je zobrazena genetická mapa genu SHOX, který zahrnuje pět exonů, které se označily následujícím způsobem: exon I: G310; exon 2: ET93; exon III: ET45; exon IV: G108; a exony Va a Vb, přičemž exony Va a Vb vedou ke vzniku dvou různých míst sestřihu genu SHOX. Exon II a III obsahuje homeobox o velikosti 180 nukleotidů.
Na obrázcích č. 2 a 3 jsou nukleotidy a předpovězené aminokyselinové sekvence SHOXa a SHOXb.
SHOXa: Předpovězený začátek translace začíná nukleotidem 92, první v rámci je stop kodon (TGA) - nukleotidy 968 - 970, přičemž vzniká otevřený čtecí rámec o velikosti 876 bp, který kóduje předpovězený protein tvořený 292 aminokyselinami (označený jako transkripční faktor A nebo protein SHOX). V rámci je 5'stop kodon v pozici nukleotidu 4, počáteční kodon a předpovězený terminační stop kodon znázorněný tučným písmem. Homeobox je ohraničen boxem (začínající aminokyselinou v pozici 117 (Q) až 176 (E), to v nukleotidové sekvenci odpovídá CAG až GAG) . Pozice intronů je označená šipkami. Dva
99 99 9 99
9 9 9 9 9 9
9999 9 999 9 99 9
999 9 9999 9 999 999
999999 9 9
99999 99 9 99 99 putativní polyadenylační signály v 3' nepřekládané oblasti jsou podtrženy.
SHOXb: Otevřený čtecí rámec o velikosti 876 bp se nachází od A v prvním metioninu nukleotidu 92 do terminačního kodonu v rámci v pozici 767 - 769, což tvoří otevřený čtecí rámec o velikosti 675 bp, který kóduje předpovězený protein o velikosti 225 aminokyselin (transkripčni faktor B nebo protein SHOXb). Pozice intronů jsou označeny šipkami. Exony I až IV jsou identické s SHOXa, exon V je specifický pro SHOXb. Putativní polyadenylační signál v 3' nepřekládané oblasti je podtržen.
Na obrázku č. 4 je nukleotidová sekvence a předpovězená aminokyselinová sekvence SHOT. Předpovězený počátek translace začíná v pozici nukleotidu 43, první v rámci je terminační kodon (TGA) - pozice nukleotidů 613 - 615, přičemž vzniká otevřený čtecí rámec o velikosti 573 bp, který kóduje předpovězený protein tvořený 190 aminokyselinami (označený jako transkripčni faktor C nebo protein SHOT). Homeobox je ohraničen boxem (začínající aminokyselinou v pozici 11(Q) až 70 (E), to v nukleotidové sekvenci odpovídá CAG až GAG).
Pozice intronů je označená šipkami. Dva putativní polyadenylační signály v 3' nepřekládané oblasti jsou podtrženy.
Na obrázku č. 5 je uvedena organizace exon/intron lidského genu SHOX a pozice v nukleotidové sekvenci.
Popis sekvencí SEQ ID:
SEQ ID NO. 1: překládaná aminokyselinová sekvence oblasti
homeoboxu (180 ' bp)
SEQ ID NO. 2: exon II (ET93) genu SHOX
SEQ ID NO. 3: exon I (G310) genu ; SHOX
SEQ ID NO. 4 : exon III (ET45) genu SHOX
SEQ ID NO. 5: exon IV (G108) genu SHOX
SEQ ID NO. 6: exon Va genu SHOX
«9 9* 9 99 ·· • •9 9 9 · 9999
9999 9 999 9 99 9
9 « 9 9 9999 9 999 99«
9 9 9 · 9 * 9 «99 9« 9« 9 9« «9
SEQ ID NO. 7: exon Vb genu SHOX
SEQ ID NO. 8: předchozí nukleotidová sekvence genu SHOX
SEQ ID NO. 9: gen ET92
SEQ ID NO. 10: sekvence SHOXa (také uvedeno na obrázku č. 2)
SEQ ID NO. 11: transkripční faktor A (také uvedeno na obrázku
č. 2)
SEQ ID NO. 12: sekvence SHOXb (také uvedeno na obrázku č. 3)
SEQ ID NO: 13: transkripční faktor B (také uvedeno na obrázku
Č. 3)
SEQ ID NO. 14: gen SHOX
SEQ ID NO. 15: sekvence SHOT (také uvedeno na obrázku č. 4)
SEQ ID NO: 16: transkripční faktor C (také uvedeno na obrázku
č. 4) .
Příklady provedeni vynálezu
Příklad 1: Pacienti
Všech šest studovaných pacientů vykazuje de novo odchylky na pohlavním chromozomu.
Pacient s označením CC je dívka s karyotypem 45,X/46,X psu dic (X) (Xqter ->Xp22.3 : : Xp22.3->Xqter) . Při posledním testu jí bylo 6 1/2 roku, její výška byla 114 cm (25 až 50 % percentil) . Výška postavy její matky je 155 cm, otec nebyl zařazen do analýzy. Detailněji je případ popsán v publikaci Henke A., Wapenaar M., van Ommen G-J., Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear growth. Am. J. Hum. Genet. 49: 811-819.
Pacient s označením GA je dívka s karyotypem 46,X der X (3pter-»3p23: :Xp22.3-»Xqter) . Při posledním testu jí bylo 17 let a zjistila se normální výška (159 cm). Výška její matky je 160 cm, její otec měří 182 cm. Detailněji se pacientka popisuje v publikaci Kulharya A.S., Roop H., Kukolich M.K., Nachtman R.G., Belmont J.W., Garcia-Heras J., (1995): Mild • 9 • Λ*
I ··>· «9
I 9 9 » 9 9
999
9 • 9 99 phenotypic effects of a de novo deletion Xpter—»Xp22.3 a duplication 3pter—>3p23. Am. J. Med. Genet. 56: 16-21.
Pacient s označením SS je dívka s karyotypem 46,X rea (X) (Xqter—»Xq26: :Xp22.3->Xq26: ) . V jedenácti letech její výška byla pod 3 percentil křivky růstu japonských dívek.; její předpovězená výška v dospělosti (148,5 cm) leží pod její cílovou výškou (163 cm) a cílové rozmezí je (155 až 191 cm) . Detailněji je případ popsán v publikaci Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992) girl with a terminál Xp deletion
Short stature in a distal to DXYS15:
localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459.
Pacient z označením AK je dívka s karyotypem 46,X rea (X) (Xqter-»Xp22.3: :Xp22.3->Xp21.3 :) . Ve 13-ti letech její výška je pod 2 percentil křivky růstu japonských děvčat; její předpovídaná výška v dospělosti (142,8 cm) je pod její cílovou výškou (155,5 cm) a cílové rozmezí je (147,5 až 163,5). Detailněji se případ popisuje v publikaci Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834. Pacient označený RY má karyotyp 46,X,r(Y)/46,Xdic r (Y)/45, X[95: 3: 2], jak se zjistilo testem 100 lymfocytů; V 16ti letech je její výška 148 cm; jeho tři bratři dosáhly normální výšky 170 cm (bratr 1, 16 let), 164 cm (bratr 2, 9 let) a 128 cm (bratr 3, 9 let) . Růstová retardace tohoto pacienta je tak silná, že by měla být kompatibilní s další delecí lokusu GCY na Yq.
Pacient s označením AT je chlapec s ataxii a inv(X); v sedmi letech dosahuje normální výšky 116 cm, výška rodičů je 156 cm a 190 cm.
• 9
«I ·· • ··
9
9
9 9 9
999 ·9·
Pacienti pro analýzu mutací
U 250 jednotlivců s idiopatickým malým vzrůstem postavy se vyšetřovaly mutace genu SHOXa. Pacienti se vybraly podle následujících kriterií: výška chronologického věku byla pod 3 centil národního výškového standardu mínus 2 standardní odchylky (SDS); nebylo známé žádné kauzativní onemocnění zvláště : normální váha (délka) v prenatálním stavu, normální tělesné proporce, žádné chronické onemocnění, normální příjem potravy, žádné psychiatrické obtíže, žádná dysplázie skeletu, žádná nedostatečnost růstového hormonu nebo hormonů štítné žlázy.
Rodina A:
Případy 1 a 2 jsou děti malého vzrůstu německé nepokrevné rodiny. Chlapec (případ 1) se narodil v 38 týdnu těhotenství císařským řezem. Porodní váha byla 2 660 g, porodní délka byla 47 cm. Vyvíjel se normálně s výjimkou subnormálního růstu. Při schůzce ve věku 6,4 roku byl proporcionálně malý (106,8 cm, 2,6 SDS) a obézní 22,7 kg) ale jinak normální. Stáří jeho kostí nebylo retardované (odpovídalo 6 letům) a dysplázie kostí se vyloučila na základě vyšetření X-paprsky. Nepravděpodobná je nedostatečnost v hladinách IGF-I a IGFBP-3 stejně jako parametry štítné žlázy, které se v séru prokazují GH nebo nedostatečnost hormonů štítné žlázy. Dívka (případ 2) se narodila v termínu císařským řezem. Porodní váha byla 2 920 g, porodní délka byla 47 cm. Její vývoj byl normální, ale ve 12 měsících se projevil její malý růst (délka 67 cm, -3,0 SDS). Ve čtyřech letech měřila 89,6 cm (-3,6 SDS). Neprojevily se žádné dysmorfní ani dysproporcionální rysy. Nebyla obézní (13 kg). Stáří jejich kostí odpovídalo 3,5 letům a vyloučila se dysplázie kostí. Hormonální parametry byly normální. Je zajímavé poznamenat, že růst děvčete i chlapce odpovídá 50 percentil růstové křivky žen s Turnérovým syndromem. Matka je nejmenší z rodiny a má střední rhizomelickou disproporci • · · · (142,3 cm, -3,8 SDS) . Jedna ze sester (150 cm, -2,5 SDS) a babička z matčiny strany (153 cm, -2,0 SDS) jsou malé postavy, aniž mají nějakou disproporci. Druhá sestra má normální výšku postavy (167 cm, +0,4 SDS). Výška otce je 166 cm (-1,8 cm) a výška dědečka z matčiny strany je 165 cm (-1,9 SDS). Další pacient je japonského původu a vykazuje identické mutace.
Příklad 2: Identifikace genu odpovídajícího za malý vzrůst
A. Hybridizace in sítu
a) Fluorescenční hybridizace in sítu
Provedla se fluorescenční hybridizace in sítu (FISH) za použití kosmidů, které leží v Xp/Yp pseudoautozomální oblasti (PARI). Uskutečnily se FISH studie za použití kosmidů 64/75cos (LLNlcll0H032), E22cos(2e2), Fl/14cos (110A7), Ml/70cos (110E3), P99F2cos(43C11), P99cos (LLNLcll0P2410), B6cosb (1CRFC104H0425), F20cos (34F5), F21cos (ICRFcl04G0411), F3cos2 (9E3), F3cosl (11E6), P117cos (29B11), P6cosl(ICRFcl04P0117), P6cos2 (LLNLcll0E0625) a E4cos (15G7) podle metody popsané v publikacích (Lichter P., Cremer T., Human Cytogenetics: A practical Approach, IRL Press 1992, Oxford, New York, Tokyo). Jeden mikrogram kosmidového klonu se značil biotinem a hybridizoval se s metafází lidských chromozomů za podmínek, které redukují signál z repetivních sekvencí DNA. Detekce hybridizačního signálu probíhá prostřednictvím avidinu spojeného s FITC. Zviditelnění FITC proběhlo za použití chlazeného zdvojeného kamerového sytému (Photometrics, Tucson, AZ) .
b) Fyzikální mapování
Kosmidy se získaly z Lawrence Livermore National Laboratory Xa Y-chromozomové knihovny a z X-chromozomové knihovny instituce Imperiál Cancer Research Fund London (nyní Max Plaňek Institute for Molecular Genetics Berlin). Za použití
• · ·
........
kosmidů distálních k DXYS15, jmenovitě E4cos, P6cos2, P6cosl, P117cos a F3cosl lze stanovit, že jsou stále přítomny dvě kopie E4cos, P6cos2, P6cosl a jedna kopie P117cos a F3cosl. Body porušení na mapě kosmidu P6cosl obou pacientů AK a SS jsou od sebe v maximální vzdálenosti lOkb. Zjistilo se, že abnormální X-chromozomy AK a SS měly deletováno přibližně 630 kb DNA.
Další kosmidy se získaly z ICRF X-chromozomové specifické kosmidové knihovny (ICRFclG4), z Lawrence Livermore Xchromosomové specifické kosmidové knihovny (LLNLcllO) a Ychromozomové specifické knihovny (LLCO3'M'), stejně jako ze samostatně připravené kosmidové knihovny zahrnující celý genom. Kosmidy se identifikovaly hybridizací se všemi známými sondami, které mapují uvedenou oblast a použitím celé YAC jako sondy. Za účelem ověření překryvů v případech, kde nebylo možno použít známých sond, se použily terminační sondy z několika kosmidů.
c) Hybridizace Southernovým přenosem
Analýza Southernovým přenosem za použití pseudoautozomálních markérů poskytuje důkaz, že bod porušení X-chromozomu u pacienta CC leží mezi DXYS20(3cosPP) a DXYS60(U7A ( Henke A., Wapenaar M., van Ommen G-J., Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear growth. Am. J. Hum. Genet. 49: 811-819). Za účelem potvrdit tento nález a definovat pozici bodu porušení, se použily kosmidy 64/75cos, E22cos, Fl/14cos, Ml/70cos, F2cos, P99F2cos a P99cos jako sondy při hybridizací FISH. Pozice bodu porušení na abnormálním chromozomu X u pacinta CC je mezi kosmidy 64/75cos (jedna kopie) a Fl/14cos (dvě kopie) na E22PAC. Pacient CC s normální výškou následně ztratil přibližně 269 až 290 kb DNA.
• ·
Hybridizace Southernovým přenosem se provedla za přísných podmínek v Churchově pufru (0,5 M NaPi pH7,2, 7 % SDS, 1 mM
EDTA) při teplotě 65 °C a promývání se provedlo 40 mM NaPi, 1 % SDS při teplotě 65 °C.
d) Analýza hybridizaci FISH
Biotinem značená kosmidová DNA (velikost inzertu 32 až 45 kb) nebo kosmidové fragmenty (10 až 16 kb) se hybridizovaly s metafází chromozomů, které pochází ze stimulovaných lymfocytů pacientů, za podmínek, jenž se popisují dříve v textu (Lichter P., Cremer T., Human Cytogenetics: A practical Approach, IRL Press 1992, Oxford, New York, Tokyo). Hybridizované sondy se detekovaly prostřednictvím avidinu spojeného s FITC.
e) Amplifikace pCR
Všechny reakce PCR se provedly v objemech 50 ul. V tomto objemu je obsaženo 100 pg až 200 pg templátu, 20 pmolkaždého primeru, 200 uM dNTP (Pharmacia), 1,5 mM MgC12, 75 mM Tris/Hcl pH9, 20 mM (NH4)2SO4 0,01 % (hmot. /objem) Tween 20 a 2 U
Goldstar DNA polymerázy (Eurogentec). Termocykly se provedly na zařízení GeneE (Techne).
f) Amplifikace exonu
Za účelem amplifikace exonu se použily čtyři kosmidové sebrané roztoky, kdy každý zahrnuje čtyři až pět klonů z kosmidových kontigů. Kosmidy v každém kosmidovém roztoku se částečně štěpily restrikčním enzymem Sau3A. Frakce čištěné na gelu v rozmezí velikostí 4 až 10 kb se klonovaly do vektoru pSPL3B štěpeného restrikčním enzymem BamHI (Burn et al., 1995) a použily se při experimentech amplifikace exonu, jak se popisuje dříve v textu (Church et al., 1994).
g) Sekvenování genů ·· ··
Sonifikované fragmenty dvou kosmidů LLOYNCO3'M'15D10 a LLOYNCO3'M'34F5 se odděleně sub-klónovaly do vektorů M13mpl8. Z každé kosmidové knihovny se vybralo alespoň 1 000 plaků, připravila se DNA M13 a sekvenovala se za použití barvivém značených terminátorů, termo-sekvenázy (Amersham) a univerzálního M13-primeru (MWG-BioTech). Gely se provedly na sekvenátoru ABI-377 a data se uspořádala a editovala pomocí programu GAP4 (Staden).
Ze všech šesti pacientů pacient GA měl nejméně chrakterizovaný bod porušení chromozomu. Nejvzdálenější markéry, jejichž přítomnost na chromozomu X se testovala dříve, byly DXS1060 a DXS996, mapují přibližně 6 Mb od telomeru (Nelson, D.L., Ballabio A., CremersF., Monaco A.P., Schlessinger D., (1995). -Report of the sixth International workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342). Testovalo se několik kosmidů, které obsahují odlišné sekvence genů z PARI (MIC2, ANT3, CSF2RA a XE7). Všechny byly přítomny na translokačním chromozomu. Kosmidy pokrývající kritickou oblast odpovídající za malý vzrůst postavy, například z chromozomu, přičemž translokační bod porušení je na kosmidů Ml/70cos. Kvantitaivní srovnání intenzity signálu Ml/70cos mezi normálním a znovu uspořádaným chromozomem X ukazuje, že je deletováno přibližně 70 % kosmidů.
Tabulka č. 2
CC GA AK SS
64/75cos - -
E22cos - -
Fl/14cos + -
Ml/70cos + (+)
F2cos + +
P99F2cos + +
P99cos + +
B6cos +
• · > · · · · • · > ·«
F20cos
F21cos
F3cos2
F3cosl
P117cos
P6cosl + +
P6cos2 + +
E4cos + +
Tabulka č. 2: Tabulka udává souhrn dat z hybridizace FISH pro 16 kosmidů testovaných u čtyř pacientů (-) jedna kopie; indikuje, že kosmid je deletován na znovu uspořádaném chromozomu X, ale je přítomen na normálním chromozomu X (+) dvě kopie; indikuje, že kosmid je přítomen na znovu uspořádaném i na normálním chromozomu X ((+)) oblast bodu porušení; indikuje, že bod porušení se vyskytuje na kosmidu, jak ukazuje hybridizace FISH.
Molekulová analýza u šesti pacientů se znovu uspořádaným chromozomem X za použití kosmidových fluoresčenčně značených kosmidových sond a hybridizace in šitu indikuje, že oblast odpovídající za malý vzrůst je zúžena na interval o velikosti 270 kb, který je ohraničený bodem porušení pacienta GA z jeho centromerové distální strany a u pacientů AK a SS na jeho centromerové proximální straně.
Korelace genotyp-fenotyp může být informativní a může posloužit k zobrazení kritického intervalu, který odpovídá za malý vzrůst postavy, na lidském chromozomu X a Y. V této studii se použila analýza hybridizací FISH ke studiu rozšíření metafáze a interfáze jádra lymfocytů u pacientů, kteří nesou delece a translokace na chromozomu X a body porušení v Xp22.3. Tyto body porušení se jeví být přítomny u dvou ze čtyř pacientů (AK a SS) , což je způsobeno přítomností sekvencí ·· ·· » · · « proximálně 510/520 podstatnou redukci s predispozicí k znovu uspořádání chromozomu. Zjistil se další pacient s kruhovým Y s porušením nacházejícím se v kritické oblasti o velikosti 270 kb, což redukuje kritický interval na 170 kb.
Korelací výšky šesti jedinců s jejich místem porušení se mapoval interval o velikosti 170 kb v pseudoautozomální oblasti, jehož přítomnost nebo absence má podstatný účinek na výšku vzrůstu. Tento interval je ohraničen místem porušení na chromozomu X pacienta GA v místě vzdáleném 340 kb distálně od telemoru (Xptel) a místem porušení u pacientů AT a RY kb Xptel. Toto uspořádání zahrnuje kritického intervalu na téměř jednu čtvrtinu jeho původní velikosti (Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992) : Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N.,
Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834; Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629). Pro experimenty FISH za účelem testování prevealence a signifikance uvedeného genomového lokusu na velké sérii pacientů s idiopatickým malým vzrůstem je nyní dostupná malá sada šesti až osmi kosmidů.
B. Identifikace kandidáta genu odpovídajícího za malý vzrůst Za účelem hledání transkripčních jednotek v nejmenší kritické oblasti o velikosti 170 kb se provedlo trapování exonu a selekce cDNA u šesti kosmidů (110E3, F2cos, 43C11, 02410, 15D10, 34F5). Trapováním exonu se izolovaly tři různé
pozitivní klony (ET93, ET45 a G108). Všechny z nich se mapovaly zpět ke kosmidu 34F5. Předchozí studie za použití cDNA selekčních protokolů a přístupu k 25 různým knihovnám cDNA vedly k neúspěchu, což naznačuje, že geny v tomto intervalu se exprimují s velmi malým nadbytkem.
Za účelem zjištění, zda nějaký gen v uvedeném intervalu chybí, se stanovila za použití náhodné M13 metody a terminátorové chemie nukleotidová sekvence vzdálená přibližně 140 kb od uvedené oblasti PARI. Za účelem sekvenční analýzy se vybraly kosmidy se vzájemným minimálním překryvem, aby spolu pokryly kritický interval. Provedla se sekvenční analýza a následná předpověď proteinu pomocí programu „X Grail, verze 1.3c, stejně jako trapování exonu pomocí programu FEXHB, což potvrdilo všechny 3 dříve klonované exony. Nedetekoval se žádný jiný gen kódující protein, než co už byl dříve izolován.
C. Izolace genu SHOX odpovídajícího za malý vzrůst
Za předpokladu, že všechny tři exonové klony ET93, ET45 a G108 jsou součástí stejného genu, použily se spolu jako sondy k testování 14 různých knihoven cDNA vytvořených z 12 různých fetálních (plíce, játra, mozek 1 a 2) a dospělých tkání (vaječníky, placenta 1 a 2, fibroblasty, skeletové svalstvo, kostní dřeň, mozek, mozkový kmen, hypotalamus, podvěsek mozkový). Mezi přibližně 14 milióny klony nanesenými na plotny se nedetekoval ani jeden klon. Za účelem izolace transkriptu v plné délce se uskutečnil 3'a 5'RACE. Za účelem 3'RACE se použily primery z exonu G108 na RNA z placenty, skeletového svalstva a fibroblastů z kostní dřeně a z tkáně, kde se exprimuje G108. Ze všech tří tkání se získaly dva různé 3'RACE klony velikosti 1173 a 652 bp, což naznačuje, že existují dva různé 3'exony a a b. Tyto dvě odlišné formy se nazývají SHOXa a SHOXb.
Za účelem zvýšení šancí pro izolaci celé 5'části genu, o kterém se ví, že je exprimován s malým přebytkem, se buněčná • ·0 00 0 000 000 • 000 0 ··* • · 000 0 0 0 0 1 ♦ 0 0 0 0 «
........
linie Hela ošetřila retinoovou kyselinou a forbolesterem ΡΜΆ. RNA z takové indukované buněčné linie a RNA z placenty a skeletového svalstva se použila ke konstrukci „Mararhonovy knihovny cDNA. Ze všech tří tkání se izolovaly identické klony 5'RACE cDNA.
Experimentální postup:
RT-PCR a konstrukce knihovny CDNA.
Od firmy Clontech se získala lidská polyA+RNA ze srdce, pankreasu, skeletového svalstva, fetálních ledvin a jater. Celková RNA se izolovala z buněčné linie fibroblastů z kostní dřeně činidlem TRIZOL (Gibco-BRL), způsobem, který popisuje výrobce. První řetězec syntézy cDNA se získal pomocí kitu „Superscript first strand cDNA synthesis kit (Gibco-BRL), kdy počátečním materiálem je 100 ng polyA+RNA nebo 10 ug celkové RNA za použití oligo (dt)-ada+RNAptorového primeru (GGCCACGCGTCGACTAGTAC[dT]2oN. Po syntéze prvního řetězce cDNA se reakce naředila 1/10. Při dalších experimentech PCR se použilo 5 ul tohoto ředění. „Marathonova knihovna cDNA se zkonstruovala z polyA+RNA skeletového svalstva a placenty amplifikačním kitem pro cDNA (Clontech), jak popisuje výrobce. Knihovny cDNA z fetálního mozku (katalogové číslo # HL5015b), fetální plíce (HL3022a), vaječníků (HLlO98a), podvěsku mozkového (HL1097v) a hypotalamu (HL1172b) se získaly od firmy Clontech. Knihovny cDNA mozku, ledvin, jater a plic se staly součástí rychlého testu panelu lidské cDNA knihovny (Clontech). cDNA knihovna fetálního svalstva se získala z instituce UK Human Genome Mapping Project Resources Center.
D. Sekvenační analýza a struktura genu SHOX
Na základě analýzy sekvencí získaných klonů pomocí 5' a 3'RACE se uspořádala sekvence SHOXa a SHOXb (1349 a 1870 bp). Identifikoval se jedne otevřený čtecí rámec o velikosti 1870 bp (SHOXa) a 1349 bp (SHOXb), který dává vzniku dvou proteinů ·· BB ► · B 4
BBB
B B o 292 aminokyselinách (SHOXa) a 225 aminokyselinách (SHOXb). Oba transkripty a i b se dělí o běžný 5'konec, ale mají odlišný poslední 3'exon . Toto zjištění naznačuje, že se používá alternativní signály sestřihu. Dosáhlo se úplného a sekvenovanou genomovou DNA LL0YNC3M34F5, což umožňuje uspořádání mezi dvěmi cDNA z kosmidů LL0YNCO3M15D10a ustanovení struktury exon-intron (obrázek č. 4) . Gen se skládá ze 6 exonů, jejichž velikost se pohybuje v rozmezí od 58 bp (exon III) do 1146 bp (exon Va). Exon I obsahuje CpG, startovací kodon a 5'oblast. Stop kodon stejně jako 3'nekódující oblast se nachází v každém alternativně sestřiženém exonu Va a Vb.
Příklad 3:
Identifikovaly se dvě cDNA, které tvoří 160 kb velkou oblast, která je kritická pro malý vzrůst. Tyto cDNA korespondují s geny SHOX a pET92. cDNA se se identifikovaly hybridizací subklónů kosmidů s knihovnami cDNA.
Sada kosmidových klonů, které úplně pokrývají kritickou oblast, je genetickým materiálem pro identifikaci kauzativního genu. Projekty pozičního klonování, které vedou k izolaci genů z uvedené oblasti, se uskutečnily trapováním exonu a selekcí cDNA. Zjištěním jejich polohy v pseudoatozomální oblasti se tyto geny mohou vyhnout X-deaktivaci a může se uplatnit účinek dávky.
Klonování genu, který když není přítomen (haploid) nebo je deficitní odpovídá za malý vzrůst, je dalším krokem přesnosti diagnózy a poskytuje základy pro analýzu mutací v genu pomocí například jednořetězcového konformačního polymorfizmu (SSCP). Navíc klonování uvedeného genu a jeho následná biochemická charakterizace otevřela cestu k hlubšímu porozumění biologických procesů, které jsou zahrnuty v řízení růstu. Sekvence DNA podle vynálezu poskytují první molekulový test pro identifikaci jednotlivců se specifickou vadou genu ·· ·· ·· • · · · • · · · • · · · ··♦ · · · >
• · · · · ···· · ··· • · · · · • ·· ·· · v komplexní heterogenní skupině pacientů, kteří vykazují idiopatický malý vzrůst.
Příklad 4: Expresní patern SHOXa a SHOXb
Analýza northernovým přenosem za použití jednotlivých exonů jako hybridizačních sond ukázala odlišný expresivní profil každého exonu, což silně naznačuje, že pruhy o různé velikosti a intenzitě reprezentují produkty křížové hybridizace s jinými genovými sekvencemi bohatými na G,C. Aby se dosáhlo více realistického expresivního profilu genů SHOXa a b, provedly se s RNA z různých tkání RT-PCR experimenty. Zatímco exprese SHOXa se pozorovala ve fibroblastech skeletového svalstva, placenty, pankreasu, srdce a kostní dřeně, exprese SHOXb se omezila na fibroblasty fetální ledviny, skeletového svalstva a kostní dřeně, přičemž zdaleka nej silnější expresi vykazují fibroblasty kostní dřeně.
Exprese SHOXa v několika cDNA knihovnách připravených z fetálního mozku a ze svalstva, z mozku dospělých, z plic a z podvěsku mozkového a skutečnost, že v žádné uvedené knihovně není exprimován SHOXb, podává další důkaz, že exprese jedné formy sestřihu (SHOXa) je více rozšířena než druhá (SHOXb), která se exprimuje převážně tkáňově specifickým způsobem.
K odhadu transkripční aktivity SHOXa a SHOXb na X a Y chromozomu se použila RT-PCR RNA, která se extrahovala z různých buněčných linií, jenž vykazují aktivní X, neaktivní X nebo Y chromozom. Všechny buněčné linie vykazují produkt amplifikace očekávané délky 119 bp (SHOXa) a 541 bp (SHOXb), což je důkaz, že jak SHOXa i b unikly deaktivaci chromozomu X. Geny SHOXa a b kódují nové proteiny homeodomén. Gen SHOX je vysoce konzervativní mezi jednotlivými živočišnými druhy od savců po ryby a ptáky. Na samém 5'konci a 3' konci vedle homeodomény jsou pravděpodobně konzervativní oblasti mezi člověkem a myší, což znamená funkční signifikanci. Během • 4 • ·· 4· 4 • 4444 4
4
• ··· 4 4
4
evoluce mezi člověkem a myší se v těchto oblastech aminokyselin neakumulovaly rozdíly.
Experimentální postupy:
a) 5'a 3 'RACE
Za účelem klonování transkriptů 5'konce SHOXa a b se provedla metoda 5'RACE za použití zkonstruované „Marathonových cDNA knihoven. Použily se následující oligonukleotidové primery: SHOX B rev. GAAAGGCATCCGTAAGGCTCCC (pozice 697-718, reverzní řetězec [r]) a adaptorový primer API. Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 66 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 25 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX A rev,
GACGCCTTTATGCATCTGATTCTC (pozice 617-640 r) a adaptorového primeru AP2. PCR se provedlo během 35 cyklů s teplotou renaturace 60 °C.
Za účelem klonování transkriptů 3'konce SHOXa a b se provedla metoda 3'RACE, jak popisuje v publikaci Frohman et al., 1988, za použití prvního řetězce cDNA s primerem oligo(dT)adaptoru. Použily se následující oligonukleotidové primery: SHOX A for GAATCAGATGCATAAAGGCGTC (pozice 619-640) a oligo(dT)adaptor. . Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX B for, GGGAGCCTTACGGATGCCTTTC (pozice 697-718) a oligo(dT)adaptoru. PCR se provedlo během 35 cyklů s teplotou renaturace 62 °C.
• ·· ··
4· t * ♦ · • 4 4 4 • · ···· · • · » ·· · • 4 * 4 • · • 44 »4 a· a « • 4 »44 4 • 4
Za účelem potvrdit sekvence transkriptů SHOXa a SHOXb se uskutečnila PCR 5'oligonukleotidovým primerem a
3'oligonukleotidovým primerem. V případě SHOXa se použily následující primery: G310 for AGCCCCGGCTGCTCGCCAGC (pozice 5978) a SHOX D rev CTGCGCGGCGGGTCAGAGCCCCAG (pozice 959-982 r) . V případě SHOXb se použily následující primery: G310 for AGCCCCGGCTGCTGCCAGC a SHOX2A rev GCCTCAGCAGCAAAGCAAGATCCC (pozice 1215-1238 r) . Obě PCR se provedly za podmínek: 94 °C po dobu 2 .minut, 94 °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřint, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Produkty se čistily na gelu a klonovaly se za účelem sekvenační analýzy.
b) Analýza SSCP
Amplifikovaná genomová DNA pocházející z pacientů se analyzovala způsobem SSCP, který se popisuje v publikaci Orita M., Suzuki Y., Sekiya T., and Hayashi K., (1989): Rapid and sensitive detection of point mutations and polymorphisms using the polymerase chain reaction. Genomics 5:874-879). 1 až 5 ul produktů PCR se smíchalo s 5 ul denaturačního roztoku, který obsahuje 95 % formamidu a 10 mM EDTA pH8, a denaturovaly se při teplotě 95 °C po dobu 10 minut. Vzorky se ihned ochladily na ledu a nanesly se na 10 % polyakrylamidový gel (akrylamid : bisakryamid = 37,5 : 1 a 29 : 1; gel s více sloty, báze TGGE, Qiagen), který obsahuje 2 % glycerol a 1 x TBE. Elektroforéza proběhla při teplotě 15 °C při napětí 500 V po dobu 3 až 5 hodin a obarvila se stříbrem, jak se popisuje TGGE manuálu (Qiagen, 1993).
c) Klonování a sekvenování produktů PCR
Produkty PCR se klonovaly do vektoru pMOSBlue za použití pMOSBlueT-sady vektorů od firmy Amersham. Kultura z jedné ·« 9 • · ·
kolonie kultivovaná přes noc se lyžovala povalením ve 100 ul vody po dobu 10 minut. Lyzáty se použily jako templáty pro PCR se specifickými primery. SSCP produktů PCR umožnila identifikaci klonů, které obsahují různé alely. Klony se sekvenovaly za použití vektorových primerů Uni a T7 značených CY5 způsobem sekvenování v cyklech, jak popisuje výrobce (ThermoSequenase Kit (Amersham)) na atomatickém sekvenétoru ALF (Pharmacia).
d) Testování cDNA knihoven pomocí PCR
Aby se detekovala exprese SHOXa a b provedlo se PCR testování několika knihoven cDNA a prvního řetězce cDNA s SHOXa a b specifickými primery. V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu. V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for. V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po
dobu 2 minut, 94 1 °c po dobu 30 vteřin, 68 °C po dobu 30
vteřin, 72 °C PO dobu 40 vteřin po 5 cyklů. 94 ° C po dobu 30
vteřin, 65 °C PO dobu 30 vteřin, 72 ° C po dobu 40 vteřin po 5
cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů
e) PCR testování knihoven cDNA
Aby se detekovala exprese SHOXa a b provedlo se PCR testování několika knihoven cDNA s SHOXa a b specifickými primery.
V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu.
V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for.
V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 68 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů.
Příklad 5: Expresivní patern 0G12, což je putativní homolog SHOX a SHOT
Za účelem stanovení expresivního paternu se provedla hybridizace in šitu u embryí myší z 5. dne p.c. a 18,5 dne p.c. , u fetálních a u nově narozených zvířat. Expresi bylo možno ukázat u vyvíjejících se zárodků noh, v mesodermu nasalních postupů, které se podílejí na tvorbě nosu a patra, u očních víček, u aorty, ve vyvíjejících se žláz samic, ve vyvíjející se páteři (omezených na diferenciaci motorických neuronů) a v mozku. Na základě tohoto expresivního paternu a na mapování pozice jeho lidského homologu SHOT, SHOT reprezentuje pravděpodobně kandidáta Cornelia de Lange syndromu, který zahrnuje malý vzrůst.
Příklad 6: Izolace nového genu homeoboxu podobného SHOX SHOT na chromozomu 3, který souvisí s lidským růstem/s malým vzrůstem postavy.
U člověka se izoloval nový gen nazývaný SHOT (SHOX homolog na chromozomu 3), který vykazuje nejvíce homologie s myším genem OG12 a lidským SHOX. Lidský gen SHOT a myší OG12 jsou vysoce homologní. Vykazují 99 % identity na úrovni proteinu. Ačkoli se to ještě neprokázalo, díky homologii mezi SHOT a SHOX (jde o identitu pouze v homeooblasti) je pravděpodobné, že gen SHOT také odpovídá za malý vzrůst nebo lidský růst.
Gen SHOT se izoloval za použití primerů ze dvou nových lidských EST (HS 1224703 a HS 126759) z databáza EMBL, přičemž se amplifikuje reverzně přepsaná RNA z linie fibroblastů kostní dřeně (Rao E., Weiss B., Mertz A., et al., (1995): Construction of a cosmid conting spanning the short stature candidate region in the pseudosomal region PAR 1. In: Turner • ·
9 9 • 9 9 «
« ·» • 9 · · · · 9 • · · β 9 9 9 · • 9 9 9999 · ··· 999
9 9 9 9
Λ 9 9 9 9 9 syndrome in a life spán respective: Research and clinical aspects. Proceeding of the 4th International Symposium on Turner Syndrome, Gothenburg, Sweden, 18-21 May, 1995., edited by Albertsson-Wikland K., Ranke M.B., pp. 19-24, Elsevier. 5'a 3'konec genu SHOT se generoval RACE-PCR z fibroblastové knihovny kostní dřeně, která se zkonstruovala podle publikace Rao E., Weiss B., Fukami M., Rump A., Niesler B., Metz A.,
Muroya K., Binder G., Kirsch S., Winkelmann M., Nordsiek G., Heinrich U., Breuning Μ. H., Ranke M.B., Rosenthal A., Ogata T., Rappold G.A. (1997): Pseudoautosomal deletions encompassing a navel homeobox gene cause groxth failure in idiopathic short stature and Turner syndrome. Nátuře Genet 15:54-62. Gen SHOT se mapoval analýzou FISH chromozomu 3q25/q26 a dále se mapoval myší homolog syntetické oblasti na myším chromozomu 3. Na základě expresivního paternu OG12, což je myší homolog genu SHOT, gen SHOT reprezentuje kandidáta odpovídajícího za Cornelia Lange syndrom (který vykazuje malou výšku vzrůstu a další rysy, kam patří kraniofaciální abnormality) , který se mapoval v tomto intervalu na chromozomu 3q25/26.
Příklad 7: Vyhledávání mutací u pacientů s idiopatickým malým vzrůstem
Sekvence DNA podle vynálezu se používají při PCR, LCR a při jiných známých technologiích, za účelem stanovení, zda takoví jednotlivci s malou výškou vzrůstu vykazují malé delece nebo bodové mutace v genu odpovídajícím za malý vzrůst.
U 91 (z celkového počtu 250 jednotlivců) nezávislých pacientů mužského a ženského pohlaví s idiopatickou malou výškou vzrůstu (odhad četnosti idiopatické malé výšky vzrůstu v obecné populaci se odhaduje na 2 až 2,5 %) se testovala přítomnost malých změn v uspořádání nebo bodové mutace v genu SHOXa. Navrhlo se šest sad primerů PCR, ne pouze za účelem amplifikace jednotlivých exonů, ale také sekvencí, které ·· ·· t· ·« lemují exon a malé části 5ÚTR. V případě největšího exonu, exon I, se generovaly dva další primery uvnitř exonu. Primery, které se používaly při PCR, se uvádějí v tabulce č. 2.
Provedl se jednořetězcový konformační polymorfizmus (SSCP) všech amplifikováných exonů, jehož velikost se pohybuje v rozmezí od 120 do 295 bp. Pouze v případě dvou jednotlivců s malou výškou vzrůstu (Y91 a AI) se identifikoval posun pohyblivosti pruhů. Klonovaly se a sekvenovaly fragmenty, které vykazují pozměněné paterny SSCP (unikátní konformery SSCP) . Aby se zabránilo vzniku PCR a sekvenačních artifaktů, sekvenování se provedlo na dvou řetězcích za použití dvou nezávislých reakcí PCR. Mutace u pacienta Y91 se nachází v pozici 28 bp 5'konce startovacího kodonu v 5'UTR a zahrnuje substituci, kdy guanin se nahradí citidínem. Aby se zjistilo, jestli tato mutace reprezentuje řídký polymorfizmus nebo je odpovědná za fenotyp regulací exprese genu, například slabším navázáním translačních iniciačních faktorů, testovaly se pacientovi rodiče a sestra. Přestože sestra a otec pacienta dosahují normální CP (data nejsou uvedeny). Uvedená substituce bází reprezentuje řídký polymorfizmus, který neovlivňuje fenotyp.
Klonování a sekvenování unikátních konformerů SSCP pacienta Al vykazuje transici bází, kdy citidin nahradí thymidin (nukleotid 674), která zavede terminační kodon do pozice aminokyseliny 195 předpovězených aminokyselinových sekvencí 225 a 292. Aby se stanovilo, zda tato nesmyslná mutace je geneticky asociována s malou výškou vzrůstu rodiny, provedla se rodová analýza. Zjistilo se, že všech šest jednotlivců s malou výškou vzrůstu (definovanou jako výška nižší než 2 standardní odchylky) vykazuje nenormální posun SSCP a transici cytidinu za thymidin. Ani otec, ani jedna z tet a dědeček z matčiny strany, kteří dosáhly normální výšky nevykazují mutaci, což naznačuje, že babička přenesla mutovanou alelu na její dvě dcery a na jejich dvě vnoučata. U této rodiny * 4 • ·
4 44 44
4 4 4 4 4
4 4 4 4 4 4
44444 4 444 444 • · 4 4 <4 4 ·· «4 existuje shoda mezi přítomností mutovaných alel a fenotypu vykazujícího malou výšku vzrůstu.
Stejná situace, která se popisuje shora v textu, se zjistila u jiného pacienta s malou výškou vzrůstu, který je japonského původu.
Příklad 8:
Sekvence DNA podle vynálezu se používají pro charakterizaci funkce genu nebo genů. Sekvence DNA se mohou použít jako otázky při vyhledávání bází v databázích aminokyselin a nukleových kyselin za účelem identifikace příbuzných genů nebo genových produktů. Jako otázka pro vyhledávání v databázi aminokyselin se použila částečná aminokyselinová sekvence SHOX93. Test vykazuje velmi vysokou homologii s mnoha známými proteiny homeoboxů. Sekvence cDNA podle vynálezu se mohou použít při produkci peptidu rekombinantní metodou. Při produkci proteinu rekombinantním způsobem se mohou použít různé expresivní systémy, které jsou dobře známy v oboru.
Běžnou syntézou peptidu (syntéza proteinů podle Merrifieldovy metody) se syntetizoval peptid se sekvencí CSKSFDQKSKDGNGG a podle standardního protokolu se získaly polyklonální protilátky z králíků a kuřat.
6*4 4» 4 «4 44
38 4 4 4 4 4 4 «4444 «4 4 4 4 4 4 4 4
Seznam literatury
Ashworth A., Rastan S., Lovell- Badge R., Kay G., (1991): X-
chromosome inactivation may explain the difference in
viability of XO humans and mice. Nátuře 351: 406-408.
Blagowidow N., Page D.C., Huff D., Mennuti MT (1989): UllrichTurner syndrome in an XY female fetus with deletion of the sex-determining portio of the Y chromosome. Am. J. med. Genet. 34: 159-162.
Cantrell M.A., Bicknell J.N., Pagon RA et al. (1989): Molecular analysis 46,XY females and regional assignment of a new Y-chromosome-specific probe. Human. Genet. 83. 88-92.
ConnorJ.M., Loughlin S.A.R. (1989): Molecular genetics of Turner's syndrome.Acta Pediatr. Scand. (Suppl.) 356: 77-80.
Disteche C.M., Casanova M., Saal H., Friedman C., Sybert V., Graham J., Thline H., Page D.C., Fellous M., (1986): Smáli deletions of the short arm of the Y-chromosome in 46,XY females. Proč. Nati. Acad. Sci USA 83: 7841-7844.
Ferguson-Smith M.A. (1965) : Karyotype-phenotype correlations in gonadal dysgenesis and their bearing on the pathogenesis of malformations. J. med. Gent. 2: 142-155.
Ferrari D., Kosher R.A., Dealy C.N. (1994): Limb mesenchymal cells inhibited from undergoing cartilage differentiation by a tumor promoting phorbol ester maintain expression of the homeobox-containing gene MSX1 and fail to exhibit gap junctional communication. Biochemical and Biophysical Research
Communications. 205(1):429-434.
9
I 9 ·
99999 9 999 99« «
9> 9 99 99
Fischer M., Bur-Romero P., Brown L.G. et al., (1990): Homologous ribosomal protin genes in the human X- and Ychromosomes escape from X-inactivation and possible implementation for Turner syndrome. Cell 63: 1205-1218.
Freund C., Horsford D.J., Mclnnes R.R. (1996): Transcription factor genes and the developing eye: a genetic perspective: Hum. Mol. Genet. 5: 1471-1488.
Gehring W. J., Qian Y.Q., Billeter, Furukubo-Tokunaga K., Schier A. F., Resendez-Perez D., Affolter M., Otting G., Wuthrich K., (1994): Homeodomein-DNA recognition . Cell 78:
211-223.
Grumbach M.M., Conte F.A. ¢1992): Disorders of sexual differentation. In: Williams textbook of endocrinology, 8th edn.m edited by Wilson J.D., Foster D.W., pp. 853-952, Philadelphia, WB Saunders.
Hernandez D., Fisher E.M.C. (1996): Down syndrome genetics: unravelling a multifactorial disorder. Hum. Mol. Genet. 5: 1411-1416.
Kenyon C., (1994) : If birds can fly, why can't we? Homeotic genes and evolution . Cell 78: 175-180.
Krumlauf R., (1994): Hox genes in vertebrate development. Cell
78: 191-201.
Lawrence P.A., Morata G., (1994): Homeobox genes: their function in Drosophila segmentation and pattern formation. Cell 78: 181-189.
F FF FF F FF FF
FFF FFF FFFF
F F · · · FFF F FF F * F FFF F FFFF · FFF FFF FFFFFF F F
FFF FF <F F FF F-F
Lehrach H., Drmnac R., Hoheisel J.D., Larin Z., Lemon G.,
Monaco A.P., Nizetic D., et al., Hybridization finger printing in genome mapping and sequencing. In Davies K.E., Tilghman S.,
Eds. Genome Analysis 1990: 39-81 Cold Spring Harbor, NY.
Levilliers J., Quack B., Weissenbach J., Petit C., (1989):
Exchange of terminál pdrtions of X- and Y-chromosomal short arms in human XY females. Proč. Nati. Acad. Sci. USA 86: 22962300.
Lippe B.M. (1991) : Turner Syndrome. Endocrinol. Metab. Clin.
North Am. 20: 121-152. Magenis R.E., Tochen M.L. Holahan K.P.,
Carey T., Allen L., Brown M.G. (1984): Turner syndrome resulting from partial deletion of Y-chromosome short arm: localization of male determinantns. J. Pediatr 105: 916-919.
Pohlschmidt M., RappoldG.A., Krause M., Ahlert D., Hosenfeld D., Weissenbach J., Gal A. (1991): Ring Y chromosome: Molecular characterization by DNA probes. Cytogenet. Cell Genet. 56: 65-68.
Qiagen (1993) TGGE Handbook, Diagen GmbH, TGMA 41123/93.
Osenfeld R.G. (1992): Turner syndrome: a guide for physicians.
Second edition. The Turner's Syndrome Sciety.
Rovescalli A.C., Asoh S., Nirenberg M. (1996): Gloning and characterization four murine homeobox genes. Proč. Nati. Acad.
Sci. USA 93: 10691-10696.
Shalet S.M. (1993): Leukemia in children treated with growth hormone. Journal o fPediatric Endocrinology 6: 109-11
Vimpani G.' Farquhar J deficiency.
41 • · · 4 4 · 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 44 4 44 44 4 4 4 4 4 4 4 4 444 4 44 4 4 4 4444 4 444 444 4 4 4 4 4 44 4 44 44
• / Vimpani A.F., Lidgard G.P., Cameron E.H.D.,
w. (1977) Prevalence of severe growth hormone
Br. Med. J. 2: 427-430.
Zinn A.R., Page D.C., Fisher E.M.C. (1993): Turner syndrome: the čase of the missing sex chromosome. TIG 9(3): 90-93.
• «» 9· 9 99 99
999 999 9 9 9 9 • · · · · 9 19 1 9 1 9 • 1 9 11 9 1111 1 111 111
199 19 19 1 9· «9
Sekvenční protokol (1)
Obecné informace:
Navrhovatel:
(A) JMÉNO : Rappold-Hoerbrand, Gudrun
(B) ULICE : Hausackerweg 14
(C) MĚSTO : Heidelberg
(D) ZEMĚ: Německo
(E) ZIP: 69118
(ii) Název vynálezu: Molekula nukleové kyseliny kódující polypeptidy a způsoby jejího použití.
(iii) Počet sekvencí: 16 (iv) Počítačem čitelná forma:
(A) TYP MÉDIA: disketa (B) POČÍTAČ: kompatibilní s IBM PC (C) OPERAČNÍ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, verze #1.30 EPO (2) (vi) Data předchozích přihlášek (A) PŘIHLÁŠKA č. US 60/027,633 (B) DATUM PODÁNÍ: 01-10-1996 (vi) Data předchozích přihlášek (A) PŘIHLÁŠKA č. US 60/027,633 (B) DAT UM PODÁNÍ: 01-10-1996
Informace o sekvenci SEQ ID NO: 1:
(i) CHARAKTERIŠTIKA SEKVENCE:
(A) DÉLKA: 60 aminokyselin (B) TYP: aminokyselinová (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární
9* ·· 4 44 44
4 4 4 4 4 4
4 4 4 « 44 4
4 · « 4 4 ···· 4 444 444 · » 4 · 4 4 4
........ ** ·’ (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 1
Gin 1 Arg Arg Ser Au:g 5 Thr Aan Phe Thr Leu 10 Glu Gin Leu Aan Glu 15 Leu
Glu Arg Leu Phe 20 Aap Glu Thr Hia Tyr 25 Pro Aap Ala Phe Met 30 Arg Glu
Glu Leu Ser 35 Gin Arg Leu Gly Leu 40 Ser Glu Ala Arg Val 45 Gin Val Trp
Phe Gin 50 Aan Arg Arg Ala Lya 55 Cya Arg Ly3 Gin Glu 60
(2) Informace o sekvenci SEQ ID NO: 2:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 209 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon II: ET93 (v) TYP FRAGMENTU: lineární (xi) POPIS SEKVENCE: SEQ ID NO: 2
GGATTTATGA ATGCAAAGAG AAGCGCGAGG ACGTGAAGTC GGAGGACGAG GACGGGCAGA 60
CCAAGCTGAA ACAGAGGCGC AGCCGCACCA ACTTCACGCT GGAGCAGCTG AACGAGCTCG 120
AGCGACTCTT CGACGAGACC CATTAGCCCG ACGCCTTCAT GCGCGAGGAG CTCAGCCAGC 180
GCCTGGGGCT CTCCGAGGCG CGCGTGCAG 209
(2) Informace o sekvenci SEQ ID NO: 3:
(i) CHARAKTERIŠTIKA SEKVENCE:
(A) DÉLKA: 368 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis= „exon I: G310 (xi) POPIS SEKVENCE: SEQ ID NO: 3:
• 9 • 9 • 999 • 9 k · > 9
9 » 9
I 9
9 9 9
9
GTGATCCACC CGCGCGCACG GGCCGTCCTC TCCGCGCGGG GAGACGCGCG CATCCACCAG 60
CCCCGGCTGC TCGCCAGCCC CGGCCCCAGC CATGGAAGAG CTCACGGCTT TTGTATCCAA 120
GTCTTTTGAC CAGAAAAGCA AGGACGGTAA CGGCGGAGGC GGAGGCGGCG GAGGTAAGAA 180
GGATTCCATT ACGTACCGGG AAGTTTTGGA GAGCGGACTG GCGCGCTCCC GGGAGCTGGG 240
GACGTCGGAT TCCAGCCTCC AGGACATCAC GGAGGGCGGC GGCCACTGCC CGGTGCATTT - 300
GTTCAAGGAC CACGTAGACA ATGACAAGGA GAAACTGAAA GAATTCGGCA CCGCGAGAGT 360
GGCAGAAG r 368
(3) Informace o sekvenci SEQ ID NO: 4:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 58 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon III: ET45 (xi) POPIS SEKVENCE: SEQ ID NO: 4:
GTTTGGTTCC AGAACCGGAG AGCCAAGTGC CGCAAACAAG AGAATCAGAT GCATAAAG (2) Informace o sekvenci SEQ ID NO: 5:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 89 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon IV: G108 (xi) POPIS SEKVENCE: SEQ ID NO: 5:
GCGTCATCTT GGGCACAGCC AACCACCTAG ACGCCTGCCG AGTGGCACCC TACGTCAACA
TGGGAGCCTT ACGGATGCCT TTCCAACAG •44 444
4» (2) Informace o sekvenci SEQ ID NO: 6:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1166 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon : Va (Xij POPIS SEKVENCE: SEQ ID NO: 6:
GTCCAGGCTC AGCTGCAGCT GGAÁGGCGTG GCCCACGCGC ACCCGCACCT GCACCCGCAC
CTGGCGGCGC ACGCGCCCTA cctgatgttc CCCCCGCCGC CCTTCGGGCT GCCCATCGCG
TCGCTGGCCG AGTCCGCCTC GGCCGCCGCC GTGGTCGCCG CCGCCGCCAA AAGCAACAGC
AAGAATTCCA GCATCGCCGA CCTGCGGCTC AAGGCGCGGA AGCACGCGGA GGCCCTGGGG
CTCTGACCCG CCGCGCAGCC CCCCGCGCGC CCGGACTCCC GGGCTCCGCG CACCCCGCCT
GCACCGCGCG TCCTGCACTC AACCCCGCCT GGAGCTCCTT CCGCGGCC^C CGTGCTCCGG
GCACCCCGGG AGCTCCTGCA AGAGGCCTGA GGAGGGAGGC TCCCGGGACC GTCCACGCAC
GACCCAGCCA GACCCTCGCG GAGATGGTGC AGAAGGCGGA GCGGGTGAGC GGCCGTGCGT
CCAGCCCGGG CCTCTCCAAG GCTGCCCGTG CGTCCTGGGA cCC.TGGAGAA GGGTAAACCC
CCGCCTGGCT GCGTCTTCCT CTGCTATACC CTATGCATGC GGTTAACTAC ACACGTTTGG
AAGATCCTTA GAGTCTATTG AAACTGCAAA GATCCCGGAG CTGGTCTCCG ATGAAAATGC
CATTTCTTCG TTGCCAACGA TTTTCTTTAC TACCATGCTC CTTCCTTCAT CCCGAGAGGC
TGCGGAACGG GTGTGGATTT GAATGTGGAC TTCGGAATCC CAGGAGGCAG GGGCCGGGCT
CTCCTCCACC GCTCCCCCGG AGCCTCCCAG GCAGCAATAA GGAAATAGTT CTCTGGCTGA
GGCTGAGGAC GTGAACCGCG GGCTTTGGAA AGGGAGGGGA GGGAGACCCG AACCTCCCAC
GTTGGGACTC CGACGTTCCG GGGACCTGAA TGAGGACCGA CTTTATAACT TTTCCAGTGT
TTGATTCCCA AATTGGGTCT GGTTTTGTTT TGGATTGGTA TTTTTTTTTT TTTTTTTTTT
TGCTGTGTTA CAGGATTCAG ACGCAAAAGA CTTGCATAAG AGACGGACGC GTGGTTGCAA
GGTGTCATAC TGATATGCAG CATTAACTTT ACTGACATGG AGTGAAGTGC AATATTATAA
ATATTATAGA TTAAAAAAAA AATAGC
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1166 (2) Informace o sekvenci SEQ ID NO: 7:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 625 párů baží (E) TYP: nukleová kyselina (F) DRUH ŘETĚZCE: jednořetězcová
9-9
99
9 9 «9 9 9 · « 9 9
9 9 9 9
99 99 9
9 9 9 « 9 9 9
999 999
9
99 • 9 • 999 (G) TOPOLOGIE: lineární (iii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon Vb (xi) POPIS SEKVENCE: SEQ ID NO: 7:
ATGGAGTTTT GCTCTTGTCG CCCAGGCTGG AGTATAATGG CATGATCTCG ACTCACTGCA 60
ACCTCCGCCT CCCGAGTTCA AGCGATTCTC CTGCCTCAGC CTCCCGAGTA GCTGGGATTA 120
CAGGTGCCCA CCACCATGTC AAGATAATGT TTGTATTTTC AGTAGAGATG GGGTTTGACC 180
ATGTTGGCCA GGCTGGTCTC GAACTCCTGA CCTCAGGTGA TCCACCGGCC TTAGCCTCCC 240
AAAGTGCTGG GATGACAGGC GTGAGCCCCT GCGCGCGGCC TTTGTAACTT TATTTTTAAT 300
TTTTTTTTTT TTTTAAGAAA GACAGAGTCT TGCTCTGTCA CCCAGGCTGG AGCACACTGG 360
TGCGATCATA GCTCACTGCA GCCTCAAACT CCTGGGCTCA AGCAATCCTC CCACCTCAGC 420
CTCCTGAGTA GCTGGGACTA CAGGCACCCA CCACCACACC CAGCTAATTT TTTTGATTTT 480
TACTAGAGAC GGGATCTTGC TTTGCTGCTG AGGCTGGTCT TGAGCTCCTG AGCTCCAAAG 540
ATCCTCTCAC CTCCACCTCC CAAAGTGTTA GAATTACAAG CATGAACCAC TGCCCGTGGT 600
CTCCAAAAAA AGGACTGTTA CGTGG
625
B BB BB · BB BB ··· BBB BBBB • BBB B BBB B B B B
B B · B B B BBBB · BBB BBB BBBBBB B * (2) Informace o sekvenci SEQ ID NO: 8: (i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 15577 párů baží
(B) TYP: nukleová kyselina
(C) DRUH ŘETĚZCE: jednořetězcová
(D) TOPOLOGIE: lineární
(ii) TYP MOLEKULY: jiná nukleová kyselina
(A) POPIS: /popis = „HOX93
(ix) RYSY:
(A) NÁZEV/KLÍČ: exon
(B) POZICE: 1498..1807
(D) JINÉ INFORMACE: /funkce = „část exonu I (G310)
(ix) RYSY:
(A) NÁZEV/KLÍČ: misc_
(B) POZICE: 3844..4068
(D) JINÉ INFORMACE: /funkce = „oblast pET92 (první
část)
(ix) RYSY:
(A) (B) (D) část NÁZEV/KLÍČ: misc_ POZICE: 4326..4437
JINÉ INFORMACE: /funkce = ) „oblast pET92 (druhá
(ix) RYSY:
(A) NÁZEV/KLÍČ: misc_
(B) POZICE: 4545..4619
(D) JINÉ INFORMACE: /funkce = „oblast pET92 (třetí
část) (ix) RYSY:
(A) NÁZEV/KLÍČ: misc_ (B) POZICE: 5305..5512 (D) JINÉ INFORMACE: /funkce = „část exonu II (ET93) (ix) RYSY:
(A) NÁZEV/KLÍČ: mise
44
4 4
44
4 4 4
4 4 4
444 444
4 (B) POZICE: 11620..11729 (D) JINÉ INFORMACE: /funkce (G108) (xi) POPIS SEKVENCE: SEQ ID NO: 8:
„část exonu IV
CTCTCCCTGT TGTGTCTCTC TTTCTCTCTC TCCATCTCTC TCCGTCTTTC CCCCTCTGTC 60
TCTTTCTCTG TCTCCATCCC TCTGTCTCTC CCTTTCTCTC TGTCTTTCCT TGTCTCTCTC 120
TTTCTCTCTC TCTCTCCATC TCTCTCTCTC CCGGTCTCTC TCTCTCCATC TCCCCGTCTC 180
TCCGTTTCTC TCTCTGCCTC TCCCTGTCTG TCTCTCTCTT TGTGTGTGTT ACACACACCC 240
CAACCCACCG TCACTCATGT CCCCCCACTG CTGTGCCATC TCACACAAGT TCACAGCTCA 300
GCTGTCATCC TGGGTCCCCA GGCCCCGCCG GGGAGGAAGA TGCGCCGTGG GGTTACGGGA 360
GGAAGGGGAC TCCGGGCCTC CTGGTGCCCC ACTTTATTTG CAGAAGGTCC TTGGCAGGAA 420
CCGTGACGCG TTTGGTTTCC AGGACTTGGA AAACGAATTT CAGGTCGCGA TGGCGAGCAC 480
CGGCTTCCCC TGAAGCACAT TCAATAGCGA GAGGCGGGAG GGAGCGAGCA GGAGCATCCC 540
ACCATGAAAA CCAAAAACAC AAGTATTTTT TTCACCCGGT AAATACCCCA GACGCCAGGG 600
TGACAGCGCG GCGCTAAGGG AGGAGGCCTC GCGCCGGGGT CCGCCGGGAT T CTGGCGCGGG 660
CGGAAAGAAT ATAGATCTTT ACGAACCGGA TCTCCCGGGG ACCTGGGCTT CTTTCTGCGG 720
GCGCTGGAAA CCCGGGAGGC GGCCCCGGGG ATCCTCGGCC TCCGCCGCCG CCGCCTCCCA 780
AGCGCCCGCG TCCCGGTTTG GGGACACCCG GCCCCTTCTT CTCACTTTCG GGGATTCTCC 840
AGCCGCGTTC CATCTCACCA ACTCTCCATC CAAGGGCGCG CCGCCACCAA CTTGGAGCTC 900
ATCTTCTCCC AAAATCGTGC GTCCCCGGGG CGCCCGGGTC CCCCCCCTCG CCATCTCAAC 960
CCCGGCGCGA CCCGGGCGCT TCCTGGAAAG ATCCAGGCGC CGGGCTCTGC GCTCCTCCCG 1020
GGAGCGAGGG CGGCCGGACA ACTGGGACCC TCCTCTCTCC AGCCGTGAAC TCCTTGTCTC 1080
• 99 99 9 99 94
999 «99 9999
9 9« 9 999 9 99 9 • 9 9 9 9 9 9999 · 999 999
9499*9 9 9
999 99 99 9 99 99
TCTGTCTCTC T C aGCAGGAA AAC ± GGAGTT TGCTTTTCCT CCGGCCACGG AAAGAACGCG 1140
GGTAACCTGT GTGGGGGGCT CGGGCGCCTG CGCCCCCCTC CTGCGCGCGC GCTCTCCCTT 1200
CCAAAAATGG GATCTTTCCC CCTTCGCACC AAGGTGTACG GACGCCAAAC AGTGATGAAA 1260
TGAGAAGAAA GCCAATTGCC GGCCTGGGGG GTGGGGGAGA CACAGCGTCT CTGCGTGCGT 1320
CCGCCGCGGA GCCCGGAGAC CAGTAATTGC ACCAGACAGG CAGCGCATGG GGGGCTGGGC 1380
GAGGTCGCCG CGTATAAATA GTGAGATTTC CAATGGAAAG GCGTAAATAA CAGCGCTGGT 1440
GATCCACGCG CGCGCACGGG CCGTCCTCTC CGCGCGGGGA GACGCGCGCA TCCACCAGCC 1500
CCGGCTGCTC GCCAGCCCCG GCCCCAGCCA TGGAAGAGCT CACGGCTTTT GTATCCAAGT 1560
CTTTTGACCA GAAAAGCAAG GACGGTAACG GCGGAGGCGG AGGCGGCGGA GGTAAGAAGG 1620
ATTCCATTAC GTACCGGGAA GTTTTGGAGA GCGGACTGGC GCGCTCCCGG GAGCTGGGGA 1680
CGTCGGATTC CAGCCTCCAG GACATCACGG AGGGCGGCGG CCACTGCCCG GTGCATTTGT 1740
TCAAGGACCA CGTAGACAAT GACAAGGAGA AACTGAAAGA ATTCGGCACC GCGAGAGTGG 1800
CAGAAGGTAA GTTCCTTTGC GCGCCGGCTC CAGGGGGGCC CTCCTGGGGT TCGGCGCCTC 1860
CTCGCCACGG AGTCGGCCCC GCGCGCCCCT CGCTGTGCAC ATTTGCAGCT CCCGTCTCGC 1920
CAGGGTAAGG CCCGGGCCGT CAGGCTTTGC CTAAGAAAGG AAGGAAGGCA GGAGTGGACC 1980
CGACCGGAGA CGCGGGTGGT GGGTAGCGGG GTGCGGGGGG ACCCAGGGAG GGTCGCAGCG 2040
GGGGCCGCGC GCGTGGGCAC CGACACGGGA AGGTCCCGGG CTGGGGTGGA TCCGGGTGGC 2100
TGTGCCTGAA GCCGTAGGGC CTGAGATGTC TTTTTCATTT TCTTTTTCTT TCCTTTCCTT 2160
TTTTTGTTTG TTTGTTTGTT TGTTTGAGAC AGAGTCTCGC TCTGTCCCCC AGGCTGGAGT 2220
GCAGTGGTGC GATCTCGGCT CACTGCAACC TCCGCCTCCT GGGTTCAAGC GATTCTCCTG 2280
CCTCAGCCTC CCCAGTAGCT GGGATTACAG GCATGCACCA CCACGCCTGG CTAATTTTTG 2340
TGCTTTTAGT AAAGACGGGG ATTCACCATG TTGGCCAGGC TGGTCTCGAA CTCCTGACCT 2400
CAGGTGATCC ACCCGCCTCG GCCTCCCAAA GTGCTGGGAT GACAGGCGTG AGGCACCGCG 2 4 60
CCCGGCCTGG GTCCTGACGG CTTAGGATGT gtgtttctgt CTCTGCCTGT CTGCCTTGTA , 2520
TTTACGGTCA CCCAGACGCA CAGAGGAGCC GTCTCCACGC GCCTTCCCAG CGCTCAGCGC 2580
CTGCCGGGCC CCCGGAGATC ACGGGAAGAC TCGAGGCTGC GTGGTAGGAG ACGGGAAGGC 264 0
CCCGGGTCAG CTCGGTTCTG TTTCNCTTTA AGGAACCCTT CATTATTATT TCATTGTTTT 2700
CCTTTGAACG TCGAGGCTTG ATCTTGGCGA AAGCTGTTGG GTCCATAAAA ACCACTCCCG 2760
TGAGCGGAGG TGGCCGGGAT CTGGATGGGG CGCGAGGGGC CCCGGGGAAG CTGGCGGCTT 2820
CGCGGGCGCG TCCTAAGTCA AGGTTGTCAG AGCGCAGCCG GTTGTGCGCG GCCCGGGGGN 2880
AGCTCCCCTC TGGCCCTTCC TCCTGAGACC TCAGTGGTGG GTCGTCCCGT GGTGGAAATC 2940
GGGGAGTAAG AGGCTCAGAG AGAGGGGCTG GCCCCGGGGA TCTCTGTGCA CACACGACAA 3000
CTGGGCGGCA TACATCTTAA GAATAAAATG GGCTGGCTGT GTCGGGGCAC AGCTGGAGAC 3060
• 00 00 • · · 0 0
0 0 0 * 0 • · 0 0 0 0
0 0 0 0
0 0 0 0 00 ·· • · 0 · • · 0 · • 00 · · · 0
0 0
00 00
GGCTATGGAC GCCTGTTATG TTTTCATTAC AAAGACGCAG AGAATCTAGC CTCGGCTTTT 3120
GCTGATTCGC AAAGTTGAGG TGCGAGGGTG AATGCCCCAA AGGTAATTCT TCCTAAGACT 3180
CTGGGGCTAC CTGCTCTCCG GGGCCCTGCA TTTGGGGTGT GGAGTGGCCC CGGGAAATAG 3240
CCCTTGTATT CGTAGGAGGC ACCAGGCAGC TTCCCAAGGC CCTGACTTTG TCGAAGCAGA 3300
AAGCTGTGGC TACGGTTTAC AAAGCAGTCC CCGGTTTCTG ACCGTCTAAG AGGCAGGAGC 3360
CCAGCCTGCC TTTGACAGTG AGAGGAGTTC CTCGCTACAC ACTGCTGCGG GCACCCGGCA 3420
CTGTAATTCA TACACAGAGA GTTGGCCTTC CTGGACGCAA GGCTGGGAGC CGCTTGAGGG 3480
CCTGCGTGTA ATTTAAGAGG GTTCGCANGC GCCCGGCGGC CGCTTCTGNT GGGGTTGCTT 3540
TTTGGTTGTC CTTCNGCAAA CACCGTTTTG CTCCTCTNGN AACTCTCTCT TNCTCCCCCN 3600
TGGCCNGTNG GACCCGGGNA NGAGCAAAGT GTCCTCCAGA CCNTTTTGAA ANGTGAGAGG 3660
AAAATAAAGA CCAGGCCAAA NNGACCCAGG GCCACAGGAG AGGAGACAGA GAGTCCCCGT 3720
TACATTTTNC CCCTTGGCTG GGTGCAGAAA GACCCCCGGG CCAGGACTGC CACCCAGGCT 3780
ACTATTTATT CATCAGATCC AAGTTAAATC GAGGTTGGAG GGCAGGGGAG AGTCTGAGGT 3840
TACCGTGGAA GCCTGGAGTT TTTGGGNAAC AGCGTGTCCC CGCCGAGCCT GGGAGCCCGT 3900
GGGTTCTGCA AAGCCTGCGG GTGTTTGAGG ACTTTGAAGA CCAGTTTGTC AGTTGGGCTC 3960
AATTNCCTGG GGTTCAGACT TAGAGAAATG AAGGAGGGAG AGCTGGGGTC GTCTCCAGGA 4020
AACGATTCAC TTGGGGGGAA GGAATGGAGT gttcttgcag GCACATGTCT GTTAGGAGGT 4080
GAAACAGAAT GTGAAATCCA CGTTGGAGTA AGCGTCCAGC GCTGAATGTA GCTCGGGGTG 4140
GGGTGGGAGG GCCCTGGTGT GGATCGTGGA AGGNAAGAAA GACAGAACAG GGTGCTAGTA 4200
TTTACC.CCGT TNCCCTGTAG ACACCCTGGA TTTGTCAGCT TTGCAAGCTT CTTGGTTGCA 4260
GCGGCCTTGC CTGTGCCCCT TTGAGACTGT TTCCAGACTA AACTTCCAAA TGTCAGCCGC 4320
TTACCCTTGA CAGCAAGGGA CATCTCATTA GGGCATCGCG TGCTTCTCAT CTGTGNCTCA 4380
GCAGGCCCNG AGATAGG/vAN CANGAGGGGC NGTTGGNAGA TGCNCACTTC CACCAGCCCT 4440
GGGNTTGAAG GGGANGCGAN GGGANGACNA CCTTTTANCT TAAACCCCTN GAGCTTGGTN 4500
CAGAGAGGNC TGAATGTCTA AAATGAGGAA GAAAAGGTTT TTCACCTGGA AACGCTTGAG 4560
GGCTGAGTCT TCTGGCCNTT CTGACNTCCC CCAGCAAATA CAGACAGGTC ACCAANCTAC ř GACCGCGTGT 4620
TGGAGATGAG AAAGTGCCAT TTTTGGCACA CTCTGGTGGG GTAGGTGCCC 4680
GAAAAANGTG GGAANNGGAG AGATTTCTGN CGCACGCGGT TCAGCCCCCA GGCGCGGNTG 4740
GCNGCATTCN AGGNTACTCA GACGCGGTTC TGCTGTTCTG CTGAGAAACA GGCTTGGGGT 4800
AGGGGCTCCT AGCTCCGCCA GATCGCGGAG GGACCCCCAG CCCTCCTGCG CTGCAGCGGT 4860
GGGGATAGCG TCTCTCCGTA GGCCTAGAAT CTGCAACCCG CCCCGGGTCC TCCCCGTGTC 4920
CTTCCCGGGC GTCCCGCCGG GGATCCCACA GTTGGCAGCT CTTCCTCAAA TTCTTTCCCT 4980
TAAAAATAGG ATTTGACACC CCACTCTCCT TAAAAAAAAA AAATAAGAAA AAAAGGTTAG 5040
GTTATGTCAA CAGAGGTGAA GTGGATAATT GAGGAAACGA TTCTGAGATG AGGCCAAGAA 5100
9 9 9 9 • 99 9« • · ♦ · · • »99 · · • · 9 9 9 9 • 99 · 9 «
999 99 99 9
99
9 9 9
9 9 9
999 999
9
AACAACGCTC GTGCAAAGCC CAGGTTTTTG GGAAAGCAGC GAGTATCCTC CTCGGCTTTT 5160
GCGTTATGGA CCCCACGCAG TTTTTGCGTC AAAGCGCATT GGTTTTCGAG GGCCCCCTTT 5220
CCACCGCGGG ATGCACGAAG GGGTTCGCCA CGTTGCGCAA AACCTCCCCG GCCTCAGCCC 5280
TGTGCCCTCC GCTCCCCACG CAGGGATTTA TGAATGCAAA GAGAAGCGCG AGGACGTGAA 5340
GTCGGAGGAC GAGGACGGGC AGACCAAGCT GAAACAGAGG CGCAGCCGCA CCAACTTCAC 5400
GCTGGAGCAG CTGAACGAGC TCGAGCGACT TTTTGACGAG ACCCATTAGC CCGACGCCTT 5460
CATGCGCGAG GAGCTCAGCC AGCGCCTGGG GCTTTCCGAG GCGCGCGTGC AGGTAGGAAC 5520
GCGGGGGCGG GGGCGGGGGG CCCGGAGCCA TCGCGTGGTC CTCGGGAGCG CACAGCACGC 5580
GTACAGCCAC CTGCGCCCGG GCCGCCGCCG TCCCCTTCCC GGAGCGCGGG GAGGTTGGGT 5640
GAGGGACGGG CTGGGGTTCC TGGACTTTTG GAGACGCCTG AGGGCTGTAG GATGGGTTCA 5700
TTGCGTTTGT TTTTCACCAA CAGCAAACAA ATATATATAC ATATATATTA TACAAATAAC 57 60
ΑΑΑΤΑΑΑΤΑΤ ATATGTTATA CAGATGGGTA TATTGTATAT ATTATAGATA TTTGTTCGTC 5820
CTTGGTGCAA AGACACCGGG TGAACCCATA TATTGGCTCC TGACTGCCTT CGGTTCCCCT 5880
GGGATTGGTT ATAGGGGGAA CACATGCAAA CAAAACTTTC CCTGGATTAT ACTTAGGAGA 5940
CGAAGCTACA GATGCGTTTG ATGCAGAGTG TTTTACAAGA TTTTTCATTT AAAAAAAAAT 6000
GTGTCTTTTG GCCCCTGATT CCCCTCCGTC TTCCCGTGTG GCTGCATTGA AAAGGTTTCC 6060
TTAGGATGAA AGGAGAGGGG TGTCCTCTGT CCCTAGGTGG AGAGAAACAG GGTCTTCTCT 6120
TTCCTCCGTT TTTTCACCTA CCGTTTCTAT CTCCCTCCTC CCCTCTCCAG CCCTGTCCTC 6180
TGCTACAAAC CACCCCCTCC TCCCTCCGGC TGTGGGGAGC GCAGGAGCAC GTTGGGCATC 6240
TGGATGAGCG GNAGACTATT AGCGGGGCAC GGGGGCTCCC cgaggagcgc GCGAATTCAC 6300
GCTGCCCCAT GAGACCAGGC ACCGGGGGGC GGAGGGGCCT TGGGTGTCCG CAGAGGGACG 6360
GGCGGGCAGA GCCTTCCTCC GCATTCTAAA CATTCACTTA AiAGGTATGAG TTTANTTTCA 6420
GGGGTGCTGC TGGGAGAGCC TCCAAATGGC TTCTTCCAGC CCCTGCCTGA CAGTTCAGCT 6480
CCCCTGGAAG GTCAACTCCT CTAGTCCTTT CTCCTGGTTC TGGGCAGGAC AGAAGTGGGG 6540
GGAGGGAGAG AGAGAGAGAG AGAGAGAGAG ACGGTCAGGA TCCCCGGACC CTGGGGAACC 6600
CGTCAAAAAT AAATGZvAATT AAGATTGCCG ACCAGAG/aGA GAACCGTGAC AAAGCAAACG r 6660
GCGTTCAAAG CAAAGAGACG AACTGAAAGC CCGTTCCCGT AGGACTGGTT ATGAGGTCAA 6720
CACATTCAAA CACAGCTTGC TCTGGATTTT GCTGAGCAGA GGAAGATACA GATGCATTTG 67 80
ATCCAAAGTG TGTTACATCT TTCATTATAT GTGTGTCTAT ATATATAAAC ATATATAAAT 6840
ATATAAACAT ACATAAATGT ATGTAAATAT ATATAATCTA TATACATATA ΤΑΑΑΤΛΤΑΤΑ 6900
AACACATATA TAATATATAA ATCTATAAAC ΑΤΑΤΑΤΛΑΤΑ TATAAACATA AATATATAAA 6960
CATATATAAT ATATAAATAT ATTAACATAT ATAAAATATG ΤΑΤΛΑΑΤΑΤΑ TATAAACATA 7020
TAAACATATA ΤΑΑΑΤΛΤΑΤΑ AACATATAAA TATATAAACA ΤΑΤΛΤΑΑΑΤΑ TATACAAACA 7080
• 44 ··
4« 4 · ·
4444 4 ·
4 4 4 4 4
4 4 4 4
444 44 ·· '·»>
4 4 4
4 4 4
444 444
4 4
44 4 4 • · 4444
TATTGTATAT ATATAAATAT ATATAAAAAC ATATATATAC ATATAAAAAT ATATATAAAC 7140
ATATATACAT ATAAAGAAAT ATATATAAAC ATATATACAT ATAAATATAC ATATATAAAC 7200
ATATATATAC ATAAAATATA TATAAACATA TATACATATA AAAATATATA TATATTAACA 7260
TATATATACA TATAAAAATA TATATATTAA CATATATATA CATATAAAAA TATATATATA 7320
TTTTTGGCCC CTGATTCCCT TCGGTTCCTG TGGGATGGGT GATTGAGTCA ACACATTCAA 7380
ACACAACTTT TCCATCGATG TTGCTTAGGA GATGAGGATA CAGATGCGTT TGATGGAGAG 7440
GGTTTTACAA GCTCTTTCAT TTAAATATAT ATATATATAT ATATATATTT TTTGGCTCCT 7500
GATTCTCTTC CGTCTTCCCA TGTGGCTGCA TTTTAAAAGG CTTCCCTAAG ATCGTTACGA 7560
TTAAATCAAC CCTCCCCAGG CATCTTTACC GAGGGCTGTG GTCCCCAAAG CGATACAGCC 7620
CAGGAGGGAG AGAGGCTTTG GTGACTTGGA GGAAGGACTG TGTCCCTCCT TAGGGCGTCT 7680
GTGGCCTCAG TGAGGGAAGG AAGCTGCATC AGACAGGGGT TTCCTCGCTG TCCACCCCTC 7740
TGGGAGAAGA TGGATTGGGC TGCCCCGNTA TAAATTAATG AAAAGATTAA AGTTTCGCTA 7800
AAGGGGACAT CGAGTTTATG TGTCATCTCC TGGTGNTCTG TGTGCCNTGG GATNCTGCAA 7860
TATATCCCAN NGCCCTTGAT GNNNTACTGT TTNCTATAAA ΑΑ1ΊΝΤΑΑΑΤΝ TACTTGTNNA 7920
ATTTAANTTC CNNNACACTA TTTNCTTTCC NNGTNAGTCT NATTANCCGA NCGAGAGCAN 7980
CGNTTAGTTN CAGCTNGCGG AAAATTGGTT GTGGGGTGTG TGCGGACCCC NGAGNAACGC 8040
CCNNTAAAAT NAAAGACAAA NTCNGGGGAC AAGNCTNGGG GGTTATCGNN ATTGCNNAGG 8100
GGTCGNCATG AAAANTTTAA CGACGGTAAA TAATAATAAA AANNCAAACA TGGGAATGNC 8160
AATAAAAGAC ATAATTCTCC NNATCSCCGC GG<jvjtG\jAAAG GATCCTATAG TAAAGGCGAG 8220
TGCGCTTTGA GGGGTCATAA AAATCAATTA GTTCCAACAC CCACGTCCCG CGTTGAGGGG 8280
acggggacga GCAGGGACAG AAAAAGAAAC CATATTTGAA TCCCATCTCT CTGTGAATTC 8340
TTGGGTCACA TGCGTCTCAG TACAGCCCGT CCCGTGCTGT GACCGGATAG AGTTTCAATT 8400
TACTGTGGAA ATTTGCTGTA AATAAATTGA GCATCCGATA GAAGCTGŤTG CTGATTAACC 8460
TTTTATTTTT AGCGTGGCCC TGCAAAGTCG TATCACCCAG CTGTCAGGCT TCTAATCGAA 8520
AGTTATGAGA CC.ACGGTGAG GGGCAGGCGG ΤΑΑΤΪΤΑΑΤΤ ACAACAAATA TCTTTGGGTT 8580
TATGGCGCAG AGCTAAATTA AATGTCATTA TTCACTGTCT GTNAATGGNA AATCAAAANN r TTTAATNGAA 8640
GGAAATCGCA NTTACGGNCA TTTGGGNNAA ANGAAAGCGG GGNAGTGCTC 8700
NNGAAATAAC TGTCTTAAGC AGTGTCACAC ACTTCACTTA CCATATTCGN GGCCTNAATT 8760
GGAANNTGGA TCGTNNGAAT CACTCCNAAG ACTNGATTTA TTANGCGCTT CACGNCAGCN 8820
NGGCNTAATT CATCNACTTN NGTATTCTTC ATCNNNNATT TTTTTTTTTC CTCTCNNGCC 8880
GTGTTNNGAA GGGAGAGTGA ATGAGGCTTT CCACGTTTCA GGAGGATTTT CTTTTTTGAA 8940
AAATGCCCTT CCAGAGGCTT TTGGGTGGCT GGCTTGCTTT CTGGGCCCTG GAGGANGACA 9000
GGCGGANGAG TCCAGGTGGG CATGGAGAGG CACAGTGGCA GGTCACCTGG ATGGTCAGTG 9060
GAGGTGGAGG TCTGAAGGCG CCAGCTTTGG AAATTATTGG TGAATTTCGA TGTCAGCACC 9120
• ·4 ·
• 444 ·· r ·
4 4
444 44 ♦
4
4
4 • · 4444 • 4
4
4
444
4
4
444
AGGNCAGGGG CCTTTTTGGC GGGGGTGTGA GGGANGGATG ANCTTTGCTG GGAAANNCAG 9180
GATCAGGTTC TCCAGGCGCA CTGCAGCCCG GTAGGACCCA CTTTGGAAAT GAAAAGCCAG 9240
TTNCCGAAAG CTGGGCTGGA AGCTTCCGTG TTGGGTTCAA GAGCAAGTTC ACGTTGCGCT 9300
GTGTAGACTC CTGGCTGCTC CCAAACTCTG AGGGTTTTCT GAGGTTCCCT TCATAGGGGC 9360
ACCGGCCCTG GGCCATGCAC AGTGCGTAAG GGTGGCTGTG GGCCGAGGGA CCCAGCACGT 9420
GTTTTGCCCA CAACAGCCGG AGTGACTGGT TCACTCACCG CCTTGGCGGA GGACGCCTGT 9480
TCTCTGGACG AATCATTTCT CTTGGGTGGT GACTGCCTTG TGGGTCAAGG TGCAGGTTTT 9540
CTGCCACAGA AAACCTGTTA GGAGGAATTA AGCGACTAAG ACTGTCAGGG AGGTGGTGGT 9600
GGGGGANGAG GNAGGGGGTG GTGTCCAGAT TACCAGGCAT AGGCTAAACT GCCTGCACTC 9660
TCCAGCTGGT CTGTCTGTGG AGGAGGGGAT TGTCAATACT GGGAGAGCAG AGGAGGCTCG 9120
TAGGAGGTGA GAGGGGGTGG AATTTGCATG CAAATCTTCA CATGAGGCCT GTGTGAATTT 9780
CTCCAGCCTC CTGAGGGTCC CCTGCGCTAT TGCACTCAAC TTCTTGATAG TTTACCCCAA 9840
GACTCAGAAG TCCTTAGAGG GGCAGAATGC CCCCACCACA AAGCCTGCTA TCCTTGGGCG 9900
TCCTCAGGAC CCTTGGTCAT GAATGGGACC CTTTCATGTA TGGGGACCCT TGGTAATATG 9960
AATGGGACGC CTTCAGCTCC CCAGGGCTTC CGAGGAGGCC GAGAAGGGCA AAGACACTTC 10020
CGAGGAGGCC GAGAAGGGCA AAGACATTTT CTGGGCTTGG TGTGTCAAGA GCTAGATTGG 10080
AGAAGGGGCT GGATTTGGAA CTCTTTAGCC ATCAGCTCAC CCTCTCCGTT TGTGGCTAAA 10140
GTCTGAAGGT GGAAACTTCG GTTCTCCTAC AGGGTCTACA GGAGTTGGGG GGCGGGGCGC 10200
CCACACAGAA CGCTGGAAAG TTCGACAGTC CACTTCCACT GGCTCGGAAC TCACTTTTTC 10260
ACCTTAAGTT CATCAGCGGT AACGCATAGG TCTCACTTAG GCAGGGCACG GATGATTTAA 10 320
CAATTTCTAC TTCTAGGTCA GGTGCGGTGG CTCACACCTC TAATCCCAGC ACTTTGGGAG 0380
GCCCAGGAGG GTGGATCGCT TGAGGTCAGG AGTTTGAGAC CAGCCTGGCC AACATGGTGA 10440
AACCCCGTCT CTACTAAAAT ACGAAAATTA GCCAGGCATG GTGGTGAGCA CCTGTAATTC 10500
CAGCTACTCG GGAGGCTGAG GCAGGACAAT CGCTTGAACC TGGGAGGTGG ACGTTGCAGT 10560
GAGGTGAGAT CACACCACTG CACTCCAGCC TGGATGAGAG AGCAAGACTC TGTCTCAAAA 10620
ACAAAATAAA ACAAAAACAA AACAAAAATC AAAAAAGAAA ACCCAATTTC CAGTTCTAGG 10680
CCAGGTGCAG TGGCTCACGC CTGTCATCCC AGCACTTTGG GAGGCCCAGG AGGGTGGATC 10740
GCTTGAGGTC AGGAGTTCGA GACCAGCCTG GCCAACATGG TGAAACCCCA TCTTTACTAA 10800
AAATACAAAC GTTAGCTGGG TGTGGTGGTG TGCGCCTGTA ATCCCAGCTA CTCGGGAAGC 10860
TGAGGCTGGA GAATTGCTTG AATCTGGGAG GTGGAGGTTG CAGGGAGGCG AGATAGTGCC 10920
ACTGCAGTCC AGCCTGGACC AGAGAGCAAG ACTCCGTCTC AAAAACAAAA GAAAGCAAAA 10980
ACAAAAAACA AGAGACCAGC CTGGCCAACA TGGTGAAACC GCGTCTTTAC TAAAATACAA 11040
AATTAGCCGG GCATGGTGGT GGGCACCTGT AGTCCCAGCT ACTCGGGAGG CTGAGGCAGG 11100
• φ • φ
54 Φ 1 Φ Φ Φ · · ·
AGAATGGCTT GAACCTGGGA GGTGGAGCTT GCAGTGAGCC GAGATAGTGC CACTGCACTC 11160
CAGCCTGGGC GACAGAGCGA GACTTGATTT CAGAACCACC ACCACCACAA CAAAACAAAA 11220
CAAAAAATCC AAAAAAACCC CAATTTCCAG TAGTAGGTAG TCAGTGATGC AGGGCTGGAG 11280
ACAGAGGGGC GGTAAGTGTC TGGGCGCCCA CCATCAGTCA CCTCCCAGCT CCCANGAGGT 11340
GCAAAGTGCT TGGTTCAGCC TCATGGGAAG GATGCTCCCT GGGGAGGCTG GGCTGGGTTC 11400
ACAGGGCTCT TCACATCTCT CTCTGCTTCT NCCCCAAGGT TTGGTTNCCA GAACCGGAGA 11460
GCCAAGTGCC GNCAAACAAG AGAATCAGAT GCATAAAGGT GGGTGTCGGG ACTGGGGGGA 11520
CCTGAAGCTG GGGGATCCTG GTCCAGGAGG GATGGGGTCG ACAAGGTGCT GGCTACACCC 11580
AGGACCACCA CACTGACACC TGCTCCCTTT GGACACAGGC GTCATCTTGG GCACAGCCAA 11640
CCACCTAGAC GCCTGCCNGA GTGGCACCCT ACGTCAACAT GGGAGCCTTA CGGATGCCTT 11700
TCCAACAGGT AGCTCACTTT TTCTTCCTCT GNAAGATCCC TAGGGACCTG CTGCTCCCTT 11760
CCCCTTTCCC CTATTTGCTG CCGCATCGTG ACACTCCTAG TCCCTCCCTG CCCCTGCAGA 11820
CTTCTCAGCT GGCCCTTAGA AAAAAAGCCT CTTTTCCGAG GAGGCATTTA CAGGCACCTT 11880
GGCACCTATG AAATCAGGCT GGGCCAGGCG GGGTGGCTCA CACCTGTCAT CCCAGCACTT 11940
TGGGAGGCCA AGGTTAGGAG TTTGAGACCA GCCTGGACAA CATAGCAAAA GCCTGTCTCT 12000
ACTAAAAATA CAAAAAAAAA TTAACAGGGA GTGGTGGTGG GCACCTGTAA TCCCAGCTAC 12060
TTGGGAGGCT GAGGCAGGAG AATCACTTGA ACCCGGGAGG CCGAGGTTGC GGTGAGCCGA 12120
GATCGTGCCA TTGCACTCCA GGCTGGGCGA CAGAGTGAGA CTCTGTCTCA AAAAATAAAT 12180
ΑΑΑΤΛΛΑΤΑΛ ATGTAAAAAA ATAAAAATAG GTCGGGCACG GTGGCTCACG TCTGTAATCC 12240
CAGCACTTTG GAAGGCCGAG GTGGGTGGAT GACAGGGTCA AGAGATTGAG ACCATCCTGG 12300
CCAACATGGC AAAATGCCGT CTCTACTAAA AAATACAAAA ATTAGGCGGG CGTGGTGGCG 12360
.GGTGCCTGTA ATCCCAGCTA CTCGGGAGGC TGAGGCAGGA GAATCGGTTG AACCCGGGAT 12420
GCGGAGGTTG CAGTGAGCGG AGATCACATC ACTGCACTCC AGGCTGGGCA ACAAGAGCGA 12480
AACTGCGTCT TACAATAAAT AAATAGATAA ATAAATAAAC AAATAAACTT TACTTTAGAA 12540
ACAAATCCCT GTCCGTGTTT GTCTTTTCAC CTGTCCTGCA GGGAAAACAA AACATAAAAT 12600
GTCAAGGCAA ATAGTAGTG/3 TTTCATTCCG GGAAAAAGAA AGTGGATGTT TGCCTTCACC 12660
ctttctcgtc CTTCCTCTGG TGCTCCTCAN GGCCCANGGG NAGAGGGTGG AAAGTNCAGA 12720
GGAAGAAAGA CGGGGCTGGG GGGGGGGGTC CGTGGGGACC CAGGCAGGCA TGTTCCCNAT 12780
TTCCNTGTCT TCACNTTCAA AGNAGGGGCC CCTCGNCTCT GGAATGAGGC CTACGGTTTC 12840
CTTTCCCNGA AGAGTTNCCC CTTTGTGAGC TTACGGCTTC GGAGTGAACC TCGGTGCAAC 12900
CTGTTATTAA AACACACAGA GGCTAATGCC AGCAAAAACA CGCCCCCCGC TCCTGGTTTC 12960
AGAGGGAAGA AAAAAATTCA TAAGCACGGC CATGCTTTTC TAATAAAAAT TCATTAAATA 13020
ATCGTTATAA GGGATGAAGC CGGGAGGGGA GAGGAGAGGA ACACAATCAA GAGACTTTCT 13080
TTGAACTTTT TCTCCCTGCT TCAAATACAA AGCAATCTTC TGTGGGCCTG GGCCTGGGGG 13140 • ·
GTTTCCCCCT TTCTCTGCAG CCCATTGGGA GGAAGAAAAT GCTTCCCTGA ANGTTGCTGC 13200
AAAATTGTTT CTGTTTTTCT TTTCTTTTTC TTTTTTTTTT TTTTTTGAGA CGGAGTCTCG 13260
CTCTGTCACC AGGCTGGAGT GCAATGGTAT GATCTCAGCT CACTGCAACC TCCACGTTCC 13320
TGTTTCAAGT CATTCTCCTG CCTCAGCCTC CTGAGTAGCT GGGACTACAG GCGCCCGCCA 13380
CCACGCCCGG CTAGTGTTTG TATTTTTAGA AAAGACAGGG TTTCCCCATG TTGGCCAGGC 13440
TGGTCTTGAA CTCCTGTCCT CAAGTGATCT GCCTGCCTCG GCCTCCCAAA GTGCTGTGTT 13500
TCTGTTTTTC TTTCCCCGCT TTCTTAGGAG GCCATCGGGA AGAATAAAAT GCTTTCCTTG 13560
AAGTTGATGC AAAATTGTTT CTGTTTTTCT TTTCTCTTTT CTTTCTTTTT GAGATGGAGT 13620
CTCGCTCTTT CACCCAGGCT GGAGGGCAGT GGCGCGACCT CGGCTCACTG CAACCTCCGC 13680
CTCCCGGGTT CAAGCGATTC TCCTGCCTCA GCCTCCGGAG TAGCTGGGAT TACAGGCACC 13740
TGCCAGTATG CCTGGCTAAT TTTATTATTT TTAGTAGAGA CGGGGTTTCA CCATGTTGGC 13800
CAGGCTGGTC TCAAACTCCT GACCTCAGGT GATCCGCCCG CCTCGCCTCC CAAAGTGATG 13860
GGATGANCAG GNCATNGAGC NCACCGTGCC CGGCCCTCTA ACTCTTTACC AGACATAAAG 13920
TCTCCNNTTC CCCTTTCTAA ATGTATATAT TGTGTTTTTA AAAGTTAACA GCAGGGATCC 13980
CACCTCATTN CCCCGCTNCT CTCCCCAAGA CCTGTCCTGC ACGTTGCACA CAGCAGGTGT 14040
GCCCTGGACA TATCCCAAAC CCACGCTGAA AGAAAGAGGG TCTCACTACA CGTATGATAT 14100
CTGTGNATCC TTTAAACATC TCCGTGGCTT CCAGGCAACA CAGCCATAAA TAGGAATCTC 14160
ATGTCTGACA TGATACCGGG ACCATGTATG GGNAAATTCT GGGTGTGAAG TTCCAGCTAC 14220
CCCCGCAGAG GCANCCATTG CATACCCTCC AGAAACTCCC CTGCCGTTNC AAGCCAAAGA 14280
CACAACACAA ACAGCNTCCG AGAGAGGGTG TCATTGAAAA TCAATACCAT CATAAGAGCA 14340
CACAGCACCG TCTTTCTCTT CTGCCCGTTG ATACACAATT ATGAGCAATT TGCTAACACT 14400
GACAACTCGT GGCAAGAACA. GGTCGTGTTG ATACGGTTGC CTCGTGAGGA CCCATCTGTC 14460
TTCTGGGGTC TTGCCTGGAA CGGAGATCGG AGTTCAGGGT GGCTAATAGA ATCATTACTC 14520
ACCTAGGGAC ACAGAATNAT GAGGGTTACC CCCAGTTAAG TGCATACAGT CAAACGGACG 14580
GCTGCTCTGG AAGGTACAGT GACGTGAACA GCTTTTATGA AATGCCTAGA TCTGGACCTT 14 640
CCATACCTGA GCCACCGTTC CAAAGCACTG GGCGTTTTTC AGATACTTTC ATGAGAA7ÝTG 14700
TTGTCAACAC CGCAAGTTTG CAGTACACAG TCTGAAAGAT ATTCTTGTAT ATGTAGATGT 14760
CTGTAGATGC CCTGAAGGTG TGTAGACTTT AGACACCCAG AAGGTGTGTA GATGTCTGTA 14820
GACACCTTCT ATGTGTGTAG ATGTCTGTAG ACGCCCTGCA GGTGTGTAGA TATATCTAGA 14880
TGGTCTGCCT GTGTATGATA CACGCTAAAA AGACATTTGT GGTGGACACT AGTTGATTAT 14940
TTAGGACTAT GAGATGGGAA AGGAAGNAGC AACCAGCAGT GAAAGGCATG TGGTGGGTGG 15000
GGGGTTGGCA TTGCAGTGGG GTCCTCNTGA NGCAGGTGAC ACCCACTATA GGGCTGCCCT 15060
TGGNATGGAC gctttgtnga AGCTGTTTGA TTTCACCACA CCAAGCCTGG AGGCACGGAC 15120
56 • · 9 · • · · · * • · « · « • » · « • · · · · • » • · · • · · · · • · • · «
ATTCCAGGAT GGTGAGGAGT CTGCAAAGGA GGAGATTGGA GGAGGTG£AA TATCCCTAGA 15180
GTACGAGAGA TGAGATAGGA GAGCTGTATA AATAGCACTA CCAGCCGGAT GCGGTGGCTC 15240
ACGCCTGTCA TCCCAGCAGT TTAGGAGGCT GAGGCAGGCG GATCACCTGA GGTCAGGAGT 15300
TCCAGAACAG CCTGGCCAAC ACAATGAAAC CCGATCTTTA CTAAAAATAC AAGATTAGCT 15360
GGGCACGGTG TCTCACGCCT GTCATCCCTG CACTTTGGGA GGTCGAGGTG CGOAGATCAT 15420
GAGGTCAGTT TGGCCAACGC GGCGAAACCC CGTCTCTACT AAAAATACAA AAAAGTAGCC 15480
GGGCGTGGTG GTGGGCACCT GTAGTCCCAG CTACTAGGGA GGCTGAGGCA GGAGAATCGC 15540
TTGAACCCGG ATGCGGACAT TGCAGTGAGC CGAGATC 15577
(2) Informace o sekvenci SEQ ID NO: 9:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 753 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „segment genu ET92 (xi) POPIS SEKVENCE: SEQ ID NO: 9:
CGTGGAAGCC TGGAGTTTTT GGGAACAGCG TGTCCCCGCC GAGCCTGGGA GCCCGTGGGT 60
TCTGCAAAGC CTGCGGGTGT TTGAGGACTT TGAAGACCAG TTTGTCAGTT GGGCTCAATT 120
CCTGGGGTTC AGACTTAGAG AAATGAAGGA GGGAGAGCTG GGGTCGTCTC CAGGAAACGA 180
TTCACTTGGG GGGAAGGAAT GGAGTGTTCT TGCAGGCAGA TGTCTGTTAG GAGGTGAAAC 240
AGAATGTGAA ATCCACGTTG GAGTAAGCGT CCAGCGCTGA ATGTAGCTCG GGGTGGGGTG 300
GGAGGGCCCT GGTGTGGATC GTGGAAGGAA GAAAGACAGA ACAGGGTGCT AGTATTTACC 360
CCGTTCCCTG TAGACACCCT GGATTTGTCA GCTTTGCAAG CTTCTTGGTT GCAGCGGCCT 420
TGCCTGTGCC CCTTTGAGAC TGTTTCCAGA CTAAACTTCC AAATGTCAGC CCCTTACCCT 480
TGACAGCAAG GGACATCTCA TTAGGGCATC GCGTGCTTCT CATCTGTGCT CAGCAGGCCC 54 0
GAGATAGGAA CAGAGGGGCG TTGGAGATGC CACTTCCACC AGCCCTGGGT TGAAGGGGAG 600
CGAGGGAGAC ACCTTTTACT TAAACCCCTG AGCTTGGTCA GAGAGGCTGA ATGTCTAAAA 660
TGAGGAAGAA AAGGTTTTTC ACCTGGAAAC GCTTGAGGGC TGAGTCTTCT GCCCTTCTGA 720
CTCCCCCAGC AAATACAGAC AGGTCACCAA CTA
753 • · • · (2) Informace o sekvenci SEQ ID NO: 10:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1890párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOXa (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91..968 (xi) POPIS SEKVENCE: SEQ ID NO: 10:
GTGATCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC 60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA 114
Met Glu Glu Leu Thr Ala Phe Val
5
TCC Ser AAG Lys 10 TCT Ser TTT Phe GAC CAG AAA AGC AAG GAC GGT Gly AAC Asn 20 GGC Gly GGA Gly GGC Gly GGA Gly 162
Asp Gin Ly3 15 Ser Lys Asp
GGC GGC GGA GGT AAG AAG GAT TCC ATT ACG TAC CGG GAA GTT TTG GAG 210
Gly 25 Gly Gly Gly Lys Lys 30 Asp Ser Ile Thr Tyr 35 Arg Glu Val Leu Glu 40
AGC GGA CTG GCG CGC TCC CGG GAG CTG GGG ACG TCG GAT TCC AGC CTC 258
Ser Gly Leu Ala Arg 45 Ser Arg Glu Leu Gly 50 Thr Ser Asp Ser Ser 55 Leu
CAG GAC ATC ACG GAG GGC GGC GGC CAC TGC CCG GTG CAT TTG TTC AAG 306
Gin Asp Ile Thr 60 Glu Gly Gly Gly His 65 Cys Pro Val His Leu 70 Phe Lys
GAC CAC GTA GAC AAT GAC AAG GAG A7A CTG AAA GAA TTC GGC ACC GCG 354
Asp His Val 75 Asp Asn Asp Lys Glu 80 Lys Leu Lys Glu Phe 85 Gly Thr Ala
AGA GTG GCA GAA GGG ATT TAT GAA TGC AAA GAG AAG CGC GAG GAC GTG 402
Arg Val 90 Al a Glu Gly Ile Tyr 95 Glu Cys Lys Glu Lys 100 Arg Glu Asp Val
AAG TCG GAG GAC GAG GAC GGG CAG ACC AAG CTG AAA CAG AGG CGC AGC 450
Lys 105 Ser Glu Asp Glu Asp 110 Gly Gin Thr Lys Leu 115 Lys Gin Arg Arg Ser 120
CGC ACC AAC TTC ACG CTG GAG CAG CTG AAC GAG CTC GAG CGA CTC TTC 498
Arg Thr Asn Phe Thr 125 Leu Glu Gin Leu Asn 130 Glu Leu Glu Arg Leu 135 Phe
GAC GAG ACC CAT TAC CCC GAC GCC TTC ATG CGC GAG GAG CTC AGC CAG 546
Asp Glu Thr His 140 Tyr Pro Asp Ala Phe 145 Met Arg Glu Glu Leu 150 Ser Gin r
CGC CTG GGG CTC TCC GAG GCG CGC GTG CAG GTT TGG TTC CAG AAC CGG 594
Arg Leu Gly 155 Leu Ser Glu Ala Arg 160 Val Gin Val Trp Phe 165 Gin Asn Arg
AGA GCC AAG TGC CGC AAA CAA GAG AAT CAG ATG CAT AAA GGC GTC ATC 642
Arg Al a 170 Lys Cys Arg Lys Gin 175 Glu Asn Gin Met His 180 Lys Gl y Val I le
• · • · >
690
TTG GGC ACA GCC AAC CAC CTA GAC GCC TGC CGA GTG GCA CCC TAC GTC Leu Gly Thr Ala Aan His Leu Asp Ala Cys Arg Val Ala Pro Tyr Val 185 190 195 200
AAC ATG GGA GCC TTA CGG ATG CCT TTC CAA CAG GTC CAG GCT CAG CTG Asn Met Gly Ala Leu Arg Met Pro Phe Gin Gin Val Gin Ala Gin Leu
738
205 210 215
CAG CTG GAA GGC .GTG GCC CAC GCG CAC CCG CAC CTG CAC CCG CAC CTG 786
Gin Leu Glu Gly Val Ala His Ala His Pro His Leu HÍ3 Pro His Leu
220 225 230
GCG GCG CAC GCG CCC TAC CTG ATG TTC CCC CCG CCG CCC TTC GGG CTG 834
Ala Ala His Ala Pro Tyr Leu Met Phe Pro Pro Pro Pro Phe Gly Leu
235 240 245
CCC ATC GCG TCG CTG GCC GAG TCC GCC TCG GCC GCC GCC GTG GTC GCC 882
Pro Ile Ala Ser Leu /Via Glu Ser Ala Ser Ala Ala Ala Val Val Ala
2S0 255 260
GCC GCC GCC AAA AGC AAC AGC AAG AAT TCC AGC ATC GCC GAC CTG CGG 930
Ala Ala Ala Lys Ser Asn Ser Lys Asn Ser Ser Ile Ala Asp Leu Arg
265 270 275 280
CTC AAG GCG CGG AAG CAC GCG GAG GCC CTG GGG CTC TG ACCCGCCGCG 978
Leu Lya Ala Arg Lys His Ala Glu Ala Leu Gly Leu
285
290
CAGCCCCCCG CGCGCCCGGA CTCCCGGGCT CCGCGCACCC CGCCTGCACC GCGCGTCCTG 1038
CACTCAACCC CGCCTGGAGC TCCTTCCGCG GCCACCGTGC TCCGGGCACC CCGGGAGCTC 1098
CTGCAAGAGG CCTGAGGAGG GAGGCTCCCG GGACCGTCCA CGCACGACCC AGCCAGACCC 1158
TCGCGGAGAT GGTGCAGAAG GCGGAGCGGG TGAGCGGCCG TGCGTCCAGC CCGGGCCTCT 1218
CCAAGGCTGC CCGTGCGTCC TGGGACCCTG GAGAAGGGTA AACCCCCGCC TGGCTGCGTC 1278
TTCCTCTGCT ATACCCTATG CATGCGGTTA ACTACACACG TTTGGAAGAT CCTTAGAGTC 1338
TATTGAAACT GCAAAGATCC CGGAGCTGGT CTCCGATGAA AATGCCATTT CTTCGTTGCC 1398
AACGATTTTC TTTACTACCA 'PQ/’' 'Τ' f* c' 'Γ *Γ f* TTCATCCCGA GAGGCTGCGG AACGGGTGTG 1458
GATTTGAATG TGGACTTCGG AATCCCAGGA GGCAGGGGCC GGGCTCTCCT CCACCGCTCC 1518
CCCGGAGCCT CCCAGGCAGC AATAAGGAAA TAGTTCTCTG GCTGAGGCTG AGGACGTGAA 1578
CCGCGGGCTT TGGAAAGGGA GGGGAGGGAG ACCCGAACCT CCCACGTTGG GACTCCCACG 1638
TTCCGGGGAC CTGAATGAGG ACCGACTTTA TAACTTTTCC AGTGTTTGAT TCCCAAATTG 1698
GGTCTGGTTT TGTTTTGGAT TGGTATTTTT T T T T T T TTTTTTGCTG TGTTACAGGA 1758
TTCAGACGCA AAAGACTTGC ATAAGAGACG GACGCGTGGT TGCAAGGTGT CATACTGATA 1818
TGCAGCATTA ACTTTACTGA CATGGAGTGA AGTGCAATAT ΤΛΤΑΑΑΤΑΤΤ ATAGATTAAA 1878
f
AAAAAAATAG CA
1890 ·· • A 9 • 9 9 9 • 9 9 • 9 9
9 9 9 9
9« 9
9
9.9
99
9 9 9 • 9 9 9 (2) Informace o sekvenci SEQ ID NO: 11:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 292 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 11:
Met 1 Glu Glu Leu Thr 5 Ala Phe Val Ser Lys 10 Ser Phe Asp Gin Lys 15 Ser
Lys Asp Gly Asn 20 Gly Gly Gly Gly Gly 25 Gly Gly Gly Lys Lys 30 Asp Ser
Xle Thr Tyr 35 Arg Glu Val Leu Glu 40 Ser Gly Leu Ala Arg 45 Ser Arg Glu
Leu Gly 50 Thr Ser Asp Ser Ser 55 Leu Gin Asp Ile Thr 60 Glu Gly Gly Gly
His 65 Cys Pro Val His Leu 70 Phe Lys Asp His Val 75 Asp Asn Asp Lys Glu 80
Ly3 Leu Lys Glu Phe 85 Gly Thr Ala Arg Val 90 Ala Glu Gly Ile Tyr 95 Glu
Cy3 Ly3 Glu Lys 100 Arg Glu Asp Val Lys 105 Ser Glu Asp Glu Asp 110 Gly Gin
Thr Lys Leu 115 Lys Gin Arg Arg Ser 120 Arg Thr Asn Phe Thr 125 Leu Glu Gin
Leu Asn 130 Glu Leu Glu Arg Leu 135 Phe Asp Glu Thr His 140 Tyr Pro Asp Ala
Phe 145 Met Arg Glu Glu Leu 150 Ser Gin Arg Leu Gly 155 Leu Ser Glu Ala Arg 160
Val Gin Val Trp Phe 165 Gin Asn Arg Arg Ala 170 Lys Cys Arg Lys Gin 175 Glu
Asn Gin Met His 180 Lys Gly Val Ile Leu 185 Gly Thr Ala Asn His 190 Leu Asp
Ala Cys Arg 195 Val Ala Pro Tyr Val 200 Asn Met Gly Ala Leu 205 Arg Met Pro
Phe Gin 210 Gin Val Gin Ala Gin 215 Leu Gin Leu Glu Gly 220 Val Ala His Ala
His 225 Pro His Leu His Pro 230 His Leu Ala Ala His 235 Ala Pro Tyr Leu Met 240
Phe Pro Pro Pro Pro 245 Phe Gly Leu Pro Ile 250 Ala Ser Leu Ala Glu 255 Ser
Ala Ser Ala Ala 260 Ala Val Val Ala Ala 265 Ala Ala Lys Ser Asn 270 Ser Ly3
Asn Ser Ser 275 Ile Ala Asp Leu Arg 280 Leu Lys Ala Arg Lys 285 His Ala Glu
Ala Leu Gly Leu 290 ·· ·· « « · · ··* ·· (2) Informace o sekvenci SEQ ID NO: 12:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1354 párů bázi (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOXb (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91..768 (xi) POPIS SEKVENCE: SEQ ID NO: 12:
GTGATCCACC CGGCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC 60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA 114
Met Glu Glu Leu Thr Ala Phe Val
295 300
TCC Ser AAG Lys TCT Ser TTT Phe GAC Asp 305 CAG AAA AGC AAG GAC GGT AAC Gly Asn GGC Gly GGA Gly GGC Gly 315 GGA Gly 162
Gin Lys Ser Lys Asp 310
GGC GGC GGA GGT AAG AAG GAT TCC ATT ACG TAC CGG GAA GTT TTG GAG 210
Gly Gly Gly Gly Lys Lys Asp Ser Ile Thr Tyr Arg Glu Val Leu Glu
320 325 330
AGC GGA CTG GCG CGC TCC CGG GAG CTG GGG ACG TCG GAT TCC AGC CTC 258
Ser Gly Leu Ala Arg Ser Arg Glu Leu Gly Thr Ser Asp Ser Ser Leu
335 340 345
CAG GAC ATC ACG GAG GGC GGC GGC CAC TGC CCG GTG CAT TTG TTC AAG 306
Gin Asp Ile Thr Glu Gly Gly Gly His Cys Pro Val His Leu Phe Lys
350 355 360
GAC CAC GTA GAC AAT GAC AAG GAG AAA CTG AAA GAA TTC GGC ACC GCG 354
Asp His Val Asp Asn A3p Lys Glu Lys Leu Lys Glu Phe Gly Thr Ala
365 370 375 380
AGA GTG GCA GAA GGG ATT TAT GAA TGC AAA GAG AAG CGC GAG GAC GTG 402
Arg Val Ala Glu Gly Ile Tyr Glu Cys Lys Glu Lys Arg Glu Asp Val
385 390 395
AAG TCG GAG GAC GAG GAC GGG CAG ACC AAG CTG AAA CAG AGG CGC AGC 450
Lys Ser Glu Asp Glu Asp Gly Gin Thr Lys Leu Lys Gin Arg Arg Ser
400 4 05 4 10
CGC ACC AAC TTC ACG CTG GAG CAG CTG AAC GAG CTC GAG CGA CTC TTC 498
Arg Thr Asn Phe Thr Leu Glu Gin Leu Asn Glu Leu Glu Arg Leu Phe
415 420 425
GAC GAG ACC CAT TAC CCC GAC GCC TTC ATG CGC GAG GAG CTC AGC CAG 546
Asp Glu Thr His Tyr Pro Asp Ala Phe Met Arg Glu Glu Leu Ser Gin
430 435 440
CGC CTG GGG CTC TCC GAG GCG CGC GTG CAG GTT TGG TTC CAG AAC CGG 594
Arg Leu G1 y Leu Ser Glu Ala Arg Val Gin Val Trp Phe Gin Asn Arg
445 450 455 4 60 r
• 9
9 · 9
AGA GCC AAG TGC CGC AAA CAA GAG AAT CAG ATG CAT His AAA Lys GGC Gly GTC Val 475 ATC Ile 642
Arg Ala Lys Cys Arg 465 Lya Gin Glu Asn Gin 470 Met
TTG GGC ACA GCC AAC CAC CTA GAC GCC TGC CGA GTG GCA CCC TAC GTC 690
Leu Gly Thr Ala Aan HÍ3 Leu Asp Ala Cys Arg Val Ala Pro Tyr Val
480 485 4 90
AAC ATG GGA GCC TTA CGG ATG CCT TTC CAA CAG ATG GAG TTT TGC TCT 738
Asn Met G1 y Ala Leu Arg Met Pro Phe Gin Gin Met Glu Phe Cys Ser
495 500 505
TGT CGC CCA GGC TGG AGT ATA ATG GCA TGA TCTCGACTCA CTGCAACCTC 788
Cy3 Arg Pro Gly Trp Ser Ile Met Ala *
510 515
CGCCTCCCGA GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC GAGTAGCTGG GATTACAGGT 848
GCCCACCACC ATGTCAAGAT AATGTTTGTA TTTTCAGTAG AGATGGGGTT TGACCATGTT 908
GGCCAGGCTG GTCTCGAACT CCTGACCTCA GGTGATCCAC CCGCCTTAGC CTCCCAAAGT 968
GCTGGGATGA CAGGCGTGAG CCCCTGCGCC CGGCCTTTGT AACTTTATTT TTAATTTTTT 1028
TTTTTTTTTA AGAAAGACAG AGTCTTGCTC TGTCACCCAG GCTGGAGCAC ACTGGTGCGA 1088
TCATAGCTCA CTGCAGCCTC AAACTCCTGG GCTCAAGCAA TCCTCCCACC TCAGCCTCCT 1148
GAGTAGCTGG GACTACAGGC ACCCACCACC ACACCCAGCT AATTTTTTTG ATTTTTACTA 1208
GAGACGGGAT CTTGCTTTGC TGCTGAGGCT GGTCTTGAGC TCCTGAGCTC CAAAGATCCT 1268
CTCACCTCCA CCTCCCAAAG TGTTAGAATT ACAAGCATGA ACCACTGCCC GTGGTCTCCA 1328
AAAAAAGGAC TGTTACGTGG AAAAAA 1354 (2) Informace o sekvenci SEQ ID NO: 13:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 226 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 13:
· • F FF F F · F • · F ·
FFF FFF
F F
F · ··
Met 1 Glu Glu Leu Thr 5 Ala Phe Val Ser Lys 10 Ser Phe Asp Gin Lys 15 Ser
Lys Asp Gly Asn 20 Gly Gly Gly Glv Gly 25 Gly Gly Gly Lys Lys 30 Asp Ser
Xle Thr Tyr 35 Arg Glu Val Leu Glu 40 Ser Gly Leu Ala Arg 45 Ser Arg Glu
Leu Gly 50 Thr Ser Asp Ser Ser 55 Leu Gin Asp Ile Thr 60 Glu Gly Gly Gly
His 65 Cys Pro Val His Leu 70 Phe Lys Asp His Val 75 Asp Asn Asp Lys Glu 80
Ly3 Leu Lys Glu Phe 85 Gly Thr Ala Arg Val 90 Ala Glu Gly Ile Tyr 95 Glu
Cys Lys Glu Lys 100 Arg Glu Asp Val Lys 105 Ser Glu Asp Glu Asp 110 Gly Gin, r
Thr Lys Leu 115 Lys Gin Arg Arg Ser 120 Arg Thr Asn Phe Thr 125 Leu Glu Gin
Leu Asn 130 Glu Leu Glu Arg Leu 135 Phe Asp Glu Thr His 140 Tyr Pro Asp Ala
Phe 145 Met Arg Glu Glu Leu 150 Ser Gin Arg Leu Gly 155 Leu Ser Glu Ala Arg 160
Val Gin Val Trp Phe 165 Gin Asn Arg Arg Ala 170 Lys Cys Arg Lys Gin 175 Glu
Asn Gin Met His Lys Gly Val I le Leu Gly Thr Al a Asn Hi 3 Leu Asp
180 185 190
Ala Cys Arg 195 Val Ala Pro Tyr Val 200 Asn Met Gly Ala Leu 205 Arg Met Pro
Phe Gin 210 Gin Met Glu Phe Cys 215 Ser Cys Arg Pro Gly 220 Trp Ser Ile Met
Ala
225
4 4 4 4
4 4 ··
4444 * 4
4 4 4 4 4
4 4 4 4 4 •«•44 4 4 4 (2) Informace o sekvenci SEQ ID NO: 14:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 32367 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „kosmid: LLNOYCO3'M'34F5 (xi) POPIS SEKVENCE: SEQ ID NO: 14:
TTTCTCTGTC TCCATCCCTC TGTCTCTCCC TTTCTCTCTG TCTTTCCTTG TCTCTCTCTT 60
TCTCTCTCTC TCTCCATCTC TCTCTCTCCC TGTCTCTCTC TCTCCATCTC CCCGTCTCTC 120
CGTTTCTCTC TCTGCCTCTC CCTGTCTGTC TCTCTCTTTC TGTGTCTTAC ACACACCCCA 180
ACCCACCGTC ACTCATGTCC CCCCACTGCT GTGCCATCTC ACACAAGTTC ACAGCTCAGC 240
TGTCATCCTG GGTCCCCAGG CCGCGCCGGG GAGGAAGATG CGCCGTGGGG TTACGGGAGG 300
AAGGGGACTC CGGGCCTCCT GGTGCCCCAC TTTATTTGCA GAAGGTCCTT GGCAGGAACC 360
GTGACGCGTT TGGTTTCCAG GACTTGGAAA ACGAATTTCA GGTCGCGATG GCGAGCACCG 420
GCTTCCCCTG AAGCACATTC AATAGCGAGA GGCGGGAGGG AGCGAGCAGG AGCATCCCAC 480
CATGAAAACC AAAAACACAA gtattttttt CACCCGGTAA ATACCCCAGA CGCCAGGGTG 540
ACAGCGCGGC GCTAAGGGAG GAGGCCTCGC GCCGGGGTCC GCCGGGATCT GGCGCGGGCG 600
GAAAGAATAT AGATCTTTAC GAACCGGATC TCCCGGGGAC CTGGGCTTCT TTCTGCGGGC 660
GCTGGAGACC CGGGAGGCGG CCCCGGGGAT CCTCGGCCTC CGCCGCCGCC GCCTCCCAAG 720
CGCCCGCGTC CCGGTTTGGG GACACCCGGC CCCTTCTTCT CACTTTCGGG GATTCTC^AG 780
CCGCGTTCCA TCTCACCAAC TCTCCATCCA AGGGCGCGCC GCCACCAACT TGGAGCTCAT 840
CTTCTCCCAA GATCGTGCGT CCCCGGGGCG CCCGGGTCCC CCCCCTCGCC ATCTCAACCC 900
CGGCGCGACC CGGGCGCTTC CTGGAAAGAT CCAGGCGCCG GGCTCTGCGC TCCTCCCGGG 960
AGCGAGGGCG GCCGGACGAC TGGGACCCTC CTCTCTCCAG CCGTGAACTC CTTGTCTCTC 1020
TGTCTCTCTC TGCAGGAAAA CTGGAGTTTG CTTTTCCTCC GGCCACGGAG AGAACGCGGG 1080
TAACCTGTGT GGGGGGCTCG GGCGCCTGCG CCCCCCTCCT GCGCGCGCGC TCTCCCTTCC 1140
AAAAATGGGA TCTTTCCCCC TTCGCACCAA GGTGTACGGA CGCCAAACAG TGATGAAATG 1200
• Β Β ·»· ·· ·· •« · #·· BBBB • BBB » Β Β · Β · · · » · · « · · ···· · BBB BBB • Β Β Β Β Β · · • Β · · Β Β Β * Β· · *
AGAAGAAAGC CAATTGCCGG CCTGGGGGGT GGGGGAGACA CAGCGTCTCT GCGTGCGTCC 1260
GCCGCGGAGC CCGGAGACCA GTAATTGCAC CAGACAGGCA GCGCATGGGG GGCTGGGCGA 1320
GGTCGCCGCG TATAAATAGT GAGATTTCCA ATGGAAAGGC GTAAATAACA GCGCTGGTGA 1380
TCCACCCGCG CGCACGGGCC GTGCTCTCCG CGCGGGGAGA CGCGCGCATC CACCAGCCCC 1440
GGCTGCTCGC CAGCCCCGGC CCCAGCCATG GAAGAGCTCA CGGCTTTTGT ATCCAAGTCT 1500
TTTGACCAGA AAAGCAAGGA CGGTAACGGC GGAGGCGGAG GCGGCGGAGG TAAGAAGGAT 1560
TCCATTACGT ACCGGGAAGT TTTGGAGAGC GGACTGGCGC GCTCCCGGGA GCTGGGGACG 1620
TCGGATTCCA GCCTCCAGGA CATCACGGAG GGCGGCGGCC ACTGCCCGGT gcatttgttc 1680
AAGGACCACG TAGACAATGA CAAGGAGAAA CTGAAAGAAT TCGGCACCGC GAGAGTGGCA 1740
GAAGGTAAGT TCCTTTGCGC GCCGGCTCCA GGGGGGCCCT CCTGGGGTTC GGCGCCTCGT 1800
CGCCACGGAG TCGGCCCCGC GCGCCCCTCG CTGTGCACAT TTGCAGCTCC CGTCTCGCCA 1860
GGGTAAGGCC CGGGCCGTCA GGCTTTGCCT AAGAAAGGAA GGAAGGCAGG AGTGGACCCG 1920
ACCGGAGACG CGGGTGGTGG GTAGCGGGGT GCGGGGGGAC CCAGGGAGGG TCGCAGCGGG 1980
GGCCGCGCGC GTGGGCACCG ACACGGGAAG GTCCCGGGCT GGGGTGGATC CGGGTGGCTG 2040
TGCCTGAAGC CGTAGGGCCT GAGATGTCTT TTTCATTTTC TTTTTCTTTC CTTTCCTTTT 2100
TTTGTTTGTT TGTTTGTTTG TTTGAGACAG AGTCTCGCTC TGTCCCCCAG GCTGGAGTGC 2160
AGTGGTGCGA TCTCGGCTCA CTGCAACCTC CGCCTCCTGG GTTCAAGCGA TTCTCCTGCC 2220
TCAGCCTCCC CAGTAGCTGG GATTACAGGC ATGCAGCACC ACGCCTGGCT AATTTTTGTG 2280
CTTTTAGTAA AGACGGGGAT TCACCATGTT GGCCAGGCTG GTCTCGAACT CCTGACCTCA 2340
GGTGATCCAC CCGCCTCGGC CTCCCAAAGT GCTGGGATGA CAGGCGTGAG GCACCGCGCC 2400
CGGCCTGGGT CCTGACGGCT TAGGATGTGT GTTTCTGTCT CTGCCTGTCT GCCTTGTATT 2460
TACGGTCACC CAGACGCACA GAGGAGCCGT CTCCACGCGC CTTCCCAGCG CTCAGCGCCT 2520
GCCGGGCCCC CGGAGATCAC GGGAAGACTC GAGGCTGCGT GGTAGGAGAC GGGAAGGCCC 2580
CGGGTCAGCT CGGTTCTGTT TCCTTTAAGG AACCCTTCAT TATTATTTCA TTGTTTTCCT 2640
TTGAACGTCG AGGCTTGATC TTGGCGAAAG CTGTTGGGTC CATAAAAACC ACTCCCGTGA 2700
GCGGAGGTGG CCGGGATCTG GATGGGGCGC GAGGGGCCCC GGGGAAGCTG GCGGCTTCGC 2760
GGGCGCGTCC TAAGTCAAGG TTGTCAGAGC GCAGCCGGTT GTGCGCGGCC r CGGGGGAGCT 2820
CCCCTCTGGC CCTTCCTCCT GAGACCTCAG TGGTGGGTCG TCCCGTGGTG GAAATCGGGG 2880
AGTAAGAGGC TCAGAGAGAG GGGCTGGCCC CGGGGATCTC TGTGCACACA CGACAACTGG 2940
GCGGCATACA TCTTAAGAAT AAAATGGGCT GGCTGTGTCG GGGCACAGCT GGAGACGGCT 3000
ATGGACGCCT GTTATGTTTT CATTACAAAG ACGGAGAGAA TCTAGCCTCG gcttttgctg 3060
ATTCGCAGAG TTGAGGTGCG AGGGTGAATG CCCCAAAGGT aattcttcct AAGACTCTGG 3120
GGCTACCTGC TCTCCGGGGC CCTGCATTTG GGGTGTGGAG TGGCCCCGGG AAATAGCCCT 3180
TGTATTCGTA GGAGGCACCA GGCAGCTTCC CAAGGCCCTG ACTTTGTCGA AGCAGAAAGC 3240
• 9 •
• 9 · · * · · · 9
9« 9 • · · 9 9 »9 99 • 9 9 9 9
9 9 9 9 9 >99· 9 »·· 999 • 9 9 • 9 9 9 9
TGTGGCTACG GTTTACAAAG CAGTCCCCGG TTTCTGACCG TCTAAGAGGC AGGAGCCCAG 3300
CCTGCCTTTG ACAGTGAGAG GAGTTCCTCC CTACACACTG CTGCGGGCAC CCGGCACTGT 3360
AATTCATACA CAGAGAGTTG GCCTTCCTGG ACGCAAGGCT GGGAGCCGCT TGAGGGCCTG 3420
CGTGTAATTT AAGAGGGTTC GCAGCGCCCG GCGGCCGCTT CTGTGGGGTT GCTTTTTGGT 3480
TGTCCTTCGC AGACACCGTT TTGCTCCTCT GAACTCTCTC TTCTCCCCCT GGCCGTGGAC 3540
CCGGGAGAGC AAAGTGTCCT CCAGACCTTT TGAAAGTGAG AGGAAAATAA AGACCAGGCC 3600
AAAGACCCAG GGCCACAGGA GAGGAGACAG AGAGTCCCCG TTACATTTTC CCCTTGGGTG 3660
GGTGCAGAAA GACCCCCGGG CCAGGACTGC CACCCAGGCT ACTATTTATT CATCAGATCC 3720
AAGTTAAATC GAGGTTGGAG GGCAGGGGAG AGTCTGAGGT TACCGTGGAA GCCTGGAGTT 3780
TTTGGGAACA GCGTGTCCCC GCCGAGCCTG GGAGCCCGTG GGTTCTGCAA AGCCTGCGGG 3840
TGTTTGAGGA CTTTGAAGAC CAGTTTGTCA GTTGGGCTCA ATTCCTGGGG TTCAGACTTA 3900
GAGAAATGAA GGAGGGAGAG CTGGGGTCGT CTCCAGGAAA CGATTCACTT GGGGGGAAGG 3960
AATGGAGTGT TCTTGCAGGC ACATGTCTGT TAGGAGGTGA AACAGAATGT GAAATCCACG 4020
TTGGAGTAAG CGTCCAGCGC TGAATGTAGC TCGGGGTGGG GTGGGAGGGC CCTGGTGTGG 4080
ATCGTGGAAG GAAGAAAGAC AGAACAGGGT GCTAGTATTT ACCCCGTTCC CTGTAGACAC 4140
CCTGGATTTG TCAGCTTTGC AAGCTTCTTG GTTGCAGCGG CCTTGCCTGT GCCCCTTTGA 4200
GACTGTTTCC AGACTAAACT TCCAAATGTC AGCCCCTTAC CCTTGACAGC AAGGGACATC 4260
TCATTAGGGC ATCGCGTGCT TCTCATCTGT GCTCAGCAGG CCCGAGATAG GAACAGAGGG 4320
GCGTTGGAGA TGCCACTTCC ACCAGCCCTG GGTTGAAGGG GAGCGAGGGA GACACCTTTT 4380
ACTTAAACCC CTGAGCTTGG TCAGAGAGGC TGAATGTCTA AAATGAGGAA GAAAAGGTTT 4440
TTCACCTGGA AACGCTTGAG GGCTGAGTCT TCTGCCCTTC TGACTCCCCC AGCAAATACA 4500
GACAGGTCAC CAACTACTGG AGATGAGAAA GTGCCATTTT TGGCACACTC TGGTGGGGTA 4560
GGTGCCCGAC CGCGTGTGAA AAAGTGGGAA GGAGAGATTT CTGCGCACGC GGTTCAGCCC 4620
CCAGGCGCGG TGGCGCATTC AGGTACTCAG ACGCGGTTCT GCTGTTCTGC TGAGAAACAG - 4 680
GCTTCGGGTA GGGGCTCCTA GCTCCGCCAG ATCGCGGAGG GACCCCCAGC CCTCCTGCGC 4740
TGCAGCGGTG GGGATAGCGT CTCTCCGTAG GGCTAGAATC TGCAACCCGC CCCGGGTCeT 4800
CCCCGTGTCC TTCCCGGGCG TCCCGCCGGG GATCCCACAG TTGGCAGCTC TTCCTCAAAT 4860
TCTTTCCCTT AAAAATAGGA TTTGACACCC CACTCTCCTT AAAAAAAAAA AATAAGAAAA 4920
AAAGGTTAGG TTATGTCAAC AGAGGTGzAAG TGGATAATTG AGGAAACGAT TCTGAGATGA 4980
GGCCAAGAAA ACAACGCTCG TGCAAAGCCC AGGTTTTTGG GAAAGCAGCG AGTATCCTCC 5040
TCGGCTTTTG CGTTATGGAC CCCACGCAGT TTTTGCGTCA AAGCGCATTG GTTTTCGAGG 5100
GCCCCCTTTC CACCGCGGGA TGCACGAAGG GGTTCGCCAC GTTGCGCAAA ACCTCCCCGG 5160
CCTCAGCCCT GTGCCCTCCG CTCCCCACGC AGGGATTTAT GAATGCAAAG AGAAGCGCGA 5220
99 9· 9
66 * · · « • · ·· * • · * · · • · · » ··« ·· ·< 9 9 • 9 9 9 99 9 9 • 9 9
GGACGTGAAG TCGGAGGACG AGGACGGGCA GACCAAGCTG AAACAGAGGC GCAGCCGCAC 5280
CAACTTCACG CTGGAGCAGC TGAACGAGCT CGAGCGACTC TTCGACGAGA CCCATTACCC 5340
CGACGCCTTC ATGCGCGAGG AGCTCAGCCA GCGCCTGGGG CTCTCCGAGG CGCGCGTGCA 5400
GGTAGGAACC CGGGGGCGGG GGCGGGGGGC CCGGAGCCAT CGCCTGGTCC TCGGGAGCGC 5460
ACAGCACGCG TACAGCCACC TGCGCCCGGG CCGCCGCCGT CCCCTTCCCG GAGCGCGGGG 5520
AGGTTGGGTG AGGGACGGGC TGGGGTTCCT GGACTTTTGG AGACGCCTGA GGCCTGTAGG 5580
ATGGGTTCAT TGCGTTTGTT TTTCACCAAC AGCAAACAAA TATATATACA TATATATTAT 5640
ACAAATAACA AATAAATATA TATGTTATAC AGATGGGTAT ATTGTATATA TTATAGATAT 5700
TTGTTCGTCC TTGGTGCAAA GACACCCGGT GAACGCATAT ATTGGCTCCT GACTGCCTTC 5760
GGTTCCCCTG GGATTGGTTA TAGGGGCAAC ACATGCAAAC AAAACTTTCC CTGGATTATA 5820
CTTAGGAGAC GAAGCTACAG ATGCGTTTGA TCCAGAGTGT TTTACAAGAT TTTTCATTTA 5880
AAAAAAAATG TGTCTTTTGG CCCCTGATTC CCCTCCGTCT TCCCGTGTGG CTGCATTGAA 5940
AAGGTTTCCT TAGGATGAAA GGAGAGGGGT GTGCTCTGTC CCTAGGTGGA GAGAAACAGG 6000
GTCTTCTCTT TCCTCCGTTT TTTCAGCTAC GGTTTGTATC TCCCTCCTCC CCTCTCCAGC 6060
CCTGTCCTCT GCTACAAACC ACCCCCTCCT CCCTCCGGCT GTGGGGAGCG CAGGAGCACG 6120
TTGGGCATCT GGATGAGCGG AGACTATTAG CGGGGCACGG GGGCTCCCCG AGGAGCGCGC 6180
GAATTCACGC TGCCCCATGA GACCAGGCAC CGGGGGGCGG AGGGGCCTTG GGTGTCCGCA 6240
GAGGGACGGG CGGGCAGAGC CTTCCTCCGC ATTCTAAACA TTCACTTAAA GGTATGAGTT 6300
TATTTCAGGG GTGCTGCTGG GAGAGCCTCC AAATGGCTTC TTCCAGCCCC TGCCTGACAG 6360
TTCAGCTCCC CTGGAAGGTC ZáACTCCTCTA GTCCTTTCTC CTGGTTCTGG GCAGGACAGA 6420
AGTGGGGGGA GGGAGAGAGA GAGAGAGAGA GAGAGAGACG GTCAGGATCC CCGGACCCTG 6480
GGGAACCCGT CAAAAATAAA TGAAATTAAG ATTGCCGACC AGAGAGAGAA CCGTGACAAA 6540
GCAAACGGCG TTCAAAGCAA AGAGACGAAC TGAAAGCCCG TTCCCGTAGG ACTGGTTATG 6600
AGGTCAACAC ATTCAAACAC AGGTTGCTCT GGATTTTGCT GAGCAGAGGA AGATACAGAT 6660
GCATTTGATC CAAAGTGTGT TACATCTTTC ATTATATGTG TGTCTATATA TATAAACATA 6720
ΤΑΤΛΑΑΤΑΤΑ TAAACATACA TAAATGTATG TAAATATATA TAATCTATAT ACATATATAA 6780
ATATATAAAC ACATATATAA TATATAAATC TATAAACATA TATAATATAT AAACATAAAT 6840
ATATAAACAT ATATAATATA TAAATATATT AACATATATA AAATATGTAT AAATATATAT 6900
AAACATATAA ACATATATAA ATATATAAAC ATATAAATAT ATAAACATAT ATAAATATAT 6960
ACAAACATAT TGTATATATA TAAATATATA TAAAAACATA TATATACATA TAAAAATATA 7020
TATAAACATA TATACATATA AAGAAATATA TATAAACATA TATACATATA AATATACATA 7080
TATAAACATA TATATACATA AAATATATAT AAACATATAT ACATATAAAA ATATATATAT 7140
ATTAACATAT ATATACATAT AAAAATATAT ATATTAACAT ATATATACAT ATAAAAATAT 7200
ATATATATTT TTGGCCCCTG ATTCCCTTCG GTTCCTGTGG GATGGGTGAT TGAGTCAACA 7260
9« 99 • 9 '9 • *4
4 ·
4 44 4
4 · fl ·
4 · 4
.....
• ·« ·· • · » · · · « # · « · · · • •««v * ··· · · · • « · *
CATTCAAACA
TGGAGAGGGT
GGCTCCTGAT
GTTACGATTA
TACAGCCCAG
GGCGTCTGTG
ACCCCTCTGG
TCGCTAAAGG
CAATATATCC
CCACACTATT
ATTGGTTGTG
AAGCTGGGGG
AAAACAAACA
CCTATAGTAA
CGTCCCGCGT
CATCTCTCTG
CGGATAGAGT
GCTGTTGCTG
TCAGGCTTCT
ACAAATATCT z\TGGAAATCA
AATGAAGAAA
TTGGAATGGA
TCATCACTTG
ATGAGGCTTT
TTGGGTGGCT
TGGAGAGGCA
AGCTTTGGAA
GGTGTGAGGG
CCGGTAGGAC
TGTTGGGTTC
TGAGGGTTTT
AGGGTGGCTG
CAACTTTTCC
TTTACAAGCT
TCTCTTCCGT
AATCAACCCT
GAGGGAGAGA
GCCTCAGTGA
CAGAAGATGG
GGACATCGAG
CAGCCCTTGA
TCTTTCCGTA
GGGTGTGTGC
TTATCGATTG
TGGGAATGCA
AGGCGAGTGC
TGAGGGGACG
TGAATTCTTG
TTCAATTTAC
ATTAACCTTT
AATCGAAAGT
TTGGGTTTAT
AAAGGAAATC
TAACTGTCTT
TCGTGAATCA
TATTCTTCAT
CCACGTTTCA
GGCTTGCTTT
CAGTGGCAGG
ATTATTGGTG
AGGATGACTT
CCACTTTGGA
AAGAGCAAGT
CTGAGGTTCC
TGGGCCGAGG
ATCGATGTTG
CTTTCATTTA
CTTCCCATGT
CCCCAGGCAT
GGCTTTGGTG
GGGAAGGAAG
ATTGGGCTGC
TTTATGTGTC
TGTACTGTTT
GTCTATTACC
GGACCCCGAG
CAGGGGTGGC
ATAAAAGACA
GCTTTGAGGG
GGGACGAGCA
GGTCACATGC
TGTGGAAATT
TATTTTTAGC
TATGAGACCA
GGCGCAGAGC
GCATTACGGC
AAGCAGTGTC
CTCCAAGACT
CATTTTTTTT
GGAGGATTTT
CTGGGCCCTG
TCACCTGGAT
AATTTCGATG
TGCTGGGAAA
AATGAAAAGC
TCACGTTGCG
CTTCATAGGG
GACCCAGCAC
CTTAGGAGAT
AATATATATA
GGCTGCATTT
CTTTACCGAG
ACTTGGAGGA
CTGCATCAGA
CCCGTATAAA
ATCTCCTGGT
CTATAAAAAT
GACGAGAGCA
AACGCCCTAA
ATGAAAATTT
TAATTCTCCA
GTCATAAAAA
GGGACAGAAA
GTCTCAGTAC
TGCTGTAAAT
GTGGCCCTGC
CGGTGAGGGG
TAAATTAAAT
ATTTGGGAAA
ACACACTTCA
GATTTATTAG
TTTCCTCTCG
CTTTTTTGAA
GAGGAGACAG
GGTCAGTGGA
TCAGCACCAG
CAGGATCAGG
CAGTTCCGAA
CTGTGTAGAC
GCACCGGCCC
GTGTTTTGCC
GAGGATACAG
TATATATATA
TAAAAGGCTT
GGCTGTGGTC
AGGACTGTGT
CAGGGGTTTC
TTAATGAAAA
GTCTGTGTGC
AAATTACTTG
CGTTAGTTCA
AATAAAGACA
AACGACGGTA
TCGCCGCGGG
TCAATTAGTT
AAGAAACCAT
AGCCCGTCCC
AAATTGAGCA
AAAGTCGTAT
CAGGCGGTAA
GTCATTATTC
GAAAGCGGGG
CTTACCATAT
CGCTTCACGC
CCGTGTTGAA
AAATGCCCTT
GCGGAGAGTC
GGTGGAGGTC
GCAGGGGCCT
TTCTCCAGGC
AGCTGGGCTG
TCCTGGCTGC
TGGGCCATGC
CACAACAGCC
ATGCGTTTGA
TATATTTTTT
GCCTAAGATC
CCCAAAGCGA
CCCTCCTTAG
CTCGCTGTCC
GATTAAAGTT
CTGGGATCTG
TAATTTAATT
GCTGCGGAAA
AATCGGGGAC
AATAATAATA
GGGAAAGGAT
CCAACACCCA
ATTTGAATCC
GTGCTGTGAC
TCCGATAGAA
CACCCAGCTG
TTTAATTACA
ACTGTCTGTA
AGTGCTCTTT
TCGGGCCTAA
AGCGGCTAAT
GGGAGAGTGA
CCAGAGGCTT
CAGGTGGGCA r
TGAAGGCGCC
TTTTGGCGGG
GCACTGCAGC
GAAGCTTCCG
TCCCAAACTC
ACAGTGCGTA
GGAGTGACTG
7320
7380
7440
7500
7560
7620
7680
7740
7800
7860
7920
7980
8040
8100
8160
8220
8280
8340
8400
8460
8520
8580
8640
8700
8760
8 20
8880
8940
9000
9060
9120
9180
9240 » 9 » 9
999 *
• 9 9 ·
68 • 9 9 9 9 •9999 9« • «
GTTCACTCAC CGCCTTGGCG GAGGACGCCT GTTCTCTGGA CGAATCATTT CTCTTGGGTG 9300
GTGACTGCCT TGTGGGTCAA GGTGCAGGTT TTCTGCCACA GAAAACCTGT TAGGAGGAAT 9360
TAAGCGACTA AGACTGTCAG GGAGGTGGTG GTGGGGGAGA GGAGGGGGTG GTGTCCAGAT 9420
TACCAGGCAT AGGCTAAACT GCCTGCACTC TCCAGCTGGT CTGTCTGTGG AGGAGGGGAT 9480
TGTCAATACT GGGAGAGCAG AGGAGGCTCG TAGGAGGTGA GAGGGGGTGG AATTTGCATG 9540
caaatcttca CATGAGGCCT GTGTGAATTT CTCCAGCCTC CTGAGGGTCC CCTGCGCTAT 9600
TGCACTCAAC TTCTTGATAG TTTACCCCAA GACTCAGAAG TCCTTAGAGG GGCAGAATGC 9660
CCCCACCACA AAGCCTGCTA TCCTTGGGCG TCCTCAGGAC CCTTGGTCAT GAATGGGACC 9720
CTTTCATGTA TGGGGACCCT TGGTAATATG AATGGGACGC CTTCAGCTCC CCAGGGCTTC 9780
CGAGGAGGCC GAGAAGGGCA AAGACACTTC CGAGGAGGCC GAGAAGGGCA AAGACATTTT 9840
CTGGGCTTGG TGTGTCAAGA GCTAGATTGG AGAAGGGGCT GGATTTGGAA CTCTTTAGCC 9900
ATCAGCTCAC CCTCTCCGTT TGTGGCTAAA GTCTGAAGGT GGAAACTTCG GTTCTCCTAC 9960
AGGGTGTACA GGAGTTGGGG GGCGGGGCGC CCACACAGAA CGCTGGAAAG TTCGACAGTC 10020
CACTTCCACT GGCTCGGAAC TCACTTTTTC ACCTTAAGTT CATCAGCGGT AACGCATAGG 10080
TCTCACTTAG GCAGGGCACG GATGATTTAA CAATTTCTAC TTCTAGGTCA GGTGCGGTGG 10140
CTCACACCTC TAATCCCAGC ACTTTGGGAG GCCCAGGAGG GTGGATCGCT TGAGGTCAGG 10200
AGTTTGAGAC CAGCCTGGCC AACATGGTGA AACCCCGTCT CTACTAAAAT ACGAAAATTA 10260
GCCAGGCATG GTGGTGAGCA CCTGTAATTC CAGCTACTCG GGAGGCTGAG GCAGGAGAAT 10320
CGCTTGAACC TGGGAGGTGG ACGTTC-CAGT GAGGTGAGAT CACACCACTG CACTCCAGCC 10380
TGGATGAGAG AGCAAGACTC TGTCTCAAAA ACAAAATAAA ACAAAAACAA AACAAAAATC 10440
AAAAAAGzAAA ACCCAATTTC CAGTTCTAGG CCAGGTGCAG TGGCTCACGC CTGTCATCCC 10500
AGCACTTTGG GAGGCCCAGG AGGGTGGATC GCTTGAGGTC AGGAGTTCGA GACCAGCCTG 10560
GCCAACATGG TGAAACCCCA TCTCTACTAA AAATACAAAC GTTAGCTGGG TGTGGTGGTG 10620
TGCGCCTGTA ATCCCAGCTA CTCGGGAAGC TGAGGCTGGA GAATTGCTTG AATCTGGGAG 10680
GTGGAGGTTG CAGGGAGGCG AGATAGTGCC ACTGCAGTCC AGCCTGGACC AGAGAGCAAG 10740
ACTCCGTCTC AAAAACAAAA GAAAGCAAAA ACAAAAAACA AGAGAC.CAGC CTGGCCAACA 10800
TGGTGAAACC GCGTCTCTAC TAAAATACAA AATTAGCCGG GCATGGTGGT r GGGCACCTGT 10860
AGTCCCAGCT ACTCGGGAGG CTGAGGCAGG AGAATGGCTT GAACCTGGGA GGTGGAGCTT 10920
GCAGTGAGCC GAGATÁGTGC CACTGCACTC CAGCCTGGGC GACAGAGCGA GACTTGATTT 10980
CAGAACCACC ACCACCACAA CAAAACAAAA CAAAAAATCC AAAAAAACCC CAATTTCCAG 11040
TACTAGGTAG TCAGTGATGC AGGGCTGGAG ACAGAGGGGC GGTAAGTGTC TGGGCGCCCA 11100
CCATCAGTCA CCTCCCAGCT CCCAGAGGTG CAAAGTGCTT GGTTCAGCCT CATGGGAAGG 11160
ATGCTCCCTG GGGAGGCTGG GCTGGGTTCA CAGGGCTCTT CACATCTCTC TCTGCTTCTC 11220
CCCAAGGTTT GGTTCCAGAA CCGGAGAGCC AAGTGCCGCA AACAAGAGAA TCAGATGCAT 11280
• 99
9
999
9 9
9 9
999 9· • ·
AAAGGTGGGT GTCGGGACTG GGGGGACCTG AAGCTGGGGG ATCCTGCTCC AGGAGGGATG 11340
GGGTCGACGA GGTGCTGGCT ACACCCAGGA CCACCACACT GACACCTGCT CGCTTTGGAC 11400
ACAGGCGTCA TCTTGGGCAC AGCCAACCAC CTAGACGCCT GCCGAGTGGC ACGCTACGTC 11460
AACATGGGAG CCTTACGGAT GCCTTTCCAA CAGGTAGCTC ACTTTTTCTT CCTCTGAAGA 11520
TCCCTAGGGA CCTGCTGCTC CCTTCCCCTT TCCCGTATTT GCTGGCGCAT CCTGACACTC 11580
CTAGTCCCTC CCTGCCCCTG CAGACTTCTC AGCTGGCCCT TAGAAAAAAA GCCTCTTTTC 11640
CGAGGAGGCA TTTACAGGCA CCTTGGCACC TATGAAATCA GGCTGGGCCA GGCGGGGTGG 11700
CTCACACCTG TCATCCCAGC ACTTTGGGAG GCTGAGGAGG GTGCATCACC TGAGATCAGG 11760
AGTTCAAGAC CAGCCTGGCC AACTTAACGA AACCCCGTCT ATTAAAAATA CAAAATGGGT 11820
GTGGTGGCTC ACGCCTGTCA TCCCAGCACT TTGGGAGGCC GAGGCAGGTG GATCACCTGA 11880
GGTCAGGAAT TCGAGACCAG CCTGACCAAC ATGCTGAAAC CCCGTCTGTA CTGAAAACAC 11940
AAAGCTTAGC CGGGCGTGGT GGTGCACACC TGTGATCCCA GGTACTTGGG AGGGAGAATC 12000
ACTTGAACCT GGGAGGTGGA GGTTGCCGTG AGCCAATATC GCGCCACTGC ACTCCACTCT 12060
GGGTGACAGA GTGAGACTCC AAGACTCCAT CTCAAAAAAA AAAAAAAAAA TCAGGCTGTA 12120
AAAATCCACT TTTGGGAAGG TGAACACACA CAAGCCCAAA CAGAAATCTG ACAAAAACCA 12180
GAGGGGTGAA AAGTCCACAC AGTCAGGCAC CCCCACCTGG CTTGCTGCCT GGTTAAGAAG 12240
GGCGCAGATG CCTGTGCCTG GATACCAGAG ATGGGACAGA CACCCATTCC CTTTTCATCA 12300
CCACCCCCGA GTGCCCGAGG GCCTGGGGCG TCTGCCTGGC CCCTGGCCCC TGGCTTGGGC 12360
TCTGCACCTC TGAACTGGAG ACACCCTACT CAGCTCCCCA CTTACTTTGG AGTGAGCAGC 12420
GCTTGGGTGC CCAGCGTGGA TTTGGGGCTT CCAGGGAGTC GGGGTTCGGT CGCGGAGCCC 12480
AAGCTTCCCA AGGGCGCCCC CGCCCTGCCC TGGCTTAGTG GTGGGGATGG GATGGGGGGA 12540
AACGGGGAGC TGCGTGGAAG GAGGTGAAGG GTCACAGGAG GAGAGAGCGC AGCGCCCACG 12600
TGCGCCCTGC CTGAACGCGC AGCGCAGCGC CCGGGTGCGG TGCCCCTTGC CCCTTCGGTC 12660
CCTAATTTGG GGATCGGGAG TGCATGCGCG GGCGGAACGG GCTTGGGGGG GGGGGTCTGG 12720
CAGGGCGGAC GCGTGGCCTC CCTTCTTCAC cgttttattc CAAGGGGACA GGCTGGGGAT 12780
TGTATTTGGG CGCGTGTTTG GCTGAGGGTG CAGGGACTTG GGGGGTGGCG GTGGGGAGGG 12840
CGGAAGGTAT AAACGTATAA ATCATAAGTA AACAACTCAG AAATGGACCC CGAGCGCTGG 12900
TCGCCGCTAG CTCTCCAGCT CTCCCTGGCC CAGGCCCGAA GGAGAGGGGT CCGCATCCCT 12960
CCGCGGTTCT CCTCTCCTGG GTACCTGGCC TTGAGGTGGG GGAACGAGCC TACTTCTTGT 13020
ACCGTCTTTT GCCGACGGCG GGACCCAGTG AAATTAGGCC GTTGGAGCCC GCAGGCCTGC 13080
CTGGCTTTGC GCACCGGAGT CTTGGGGACC TGGTGTCCCC GGGAAAAACT TGGGGACCTG 13140
GTATCCCCGG GAGAGGCTTG GGGACCTGGT GTCCCGGGAG AGGCTTGGGT ACCTGGTTTC 13200
TCTGGAAGAG GCTTGGACAC CTGGTGTCCT GGGAGGGCCT TTGGGACCTG GTGTCCTGGG 13260
« 4 44
4 4 • 4 ·
44
4 4 4
4 4 4
444 444
4
44
AGAGGCTTGG AGATCTGTTG TCCTGGGAGA GGCTTGGGGA CCTGGTGTCC CTGGAGAGGC 13320
TTGGGGACCT GGTGACCTTG GAGAGGCTTG GAGACCTGGT GTTCTGGGAG AGCCTTGGGG 13380
ACCTGGTGTT CTGGGAGAGG CTTGGGGACC TGGTGTCTCT GGAAGAGGCT TGGACACCTG 13440
GTGACCCGGG AGGGCCTTGG GGATCTGGTG TCCCGGGAGA GCCTTGGGGA CCTGGTGTCC 13500
TGGGAGAGGC TTGGGGACCT GGTGACCTTG GAGAGGCTTG GGGACCTGGT GTCCTGAGAG 13560
AGCCTTGGGG ATCTGGTGTC CCAGGAGAGG CTTGGGGACC TGGTGTCTCT GGAAGAGGCT 13620
TGGACACCTG GTGTCCTGGG GAGAGGCTTG GGGACCTGGT GTCCTGGGAG AGGCTTGGGG 13680
ACCTGGTGTC CTGGGAGAGG CTTGGAGATC TGGTGAGCCG GGAGAGGCTT GGGGACCTGG 13740
TGTCCCGGGA GAGGCTTGGG GACTTGGTGT CCCGGGAGAG GCTTGAACAC CTGGTGTCCC 13800
AGGAGAGGCT TGGGGACCTG GTGACCTTGG AGAGGCCTGG GGACCTGGTG ACCCGGGAGA 13860
GCCTTGGGGA CCTGGTGTCC TGGGGAGAGC CTTGGGGACC TGGTGACCTT GGAGAGGCTT 13920
GGGGACCTGG TGTCTCGGGA GTGCCTTGGG GACCTAGTGA CCCGGGAGAG GCTTGGGGAC 13980
CTGGTGTCCC GGGAGAGGCT TGGGGACCTG GTGTCCTGGG AGAGCCTTGG GGATCTGGTG 14040
TCCTGGGGAG AGGCTGGGGG ACCTGGTGTC TCGGGAGAGA GCCTTGGGGA CCTGGTGACC 14100
CGGGAGAGGC TTGGACACCT GGTGTCCCGG GAGAGGCTTG GGGACCTGGT GACCCGGGAG 14160
AGCCTTGGGG ACCTGGTGTC CTGGGGAGAG GCTGGGGGAC CTGGTGTCTC GGGAGAGAGC 14220
CTTGGGGACC TGGTGACCCG GGAGAGGCTT GGACACCTGG TGTCCCGGGA GAGGCTTGGG 14280
AGCCTGGTGT CCCGGGAGAG CCTTGGGGAC CAGGTGACCT TGGAGAGGCT TGGGGACCTG 14340
GTGATCTTGG AGAGGCTTC-G GGACCTGGTG TCTCGGGAGA GGTTACGGGG GCTGGTTGGG 14400
GGAGAGAACG TTGTGAGCCA AAGTCCCTGA ATCCCTGCGA AAAGÁGCGCA TCGGGAGCTC 14460
CCCCTGAGGG CGTTCCATTT GTGGACCCCC CTCCCATGCG CTTTGCAGGG AGCTGTTCGG 14520
ATTCCCCTGG CCCGGCTCCC GCGGATGCAT CCAGTGGCAG CGCCAATTCT GGGCCAGGGG 14580
GAAGGAGGAA AGGCGGGTGT GGGGTGGTCT CCACGGCTGG AGAAGGGGCG ACGCTCCCTA 14640
GGGGAGAAGA GGCACGTTGG GGGTTTCCGG GGGCGCGGGG CGGAGCAGGC CCCCCAGTCC 14700
CCATCCTGCG CCCTCACCCC GCCGGGTCCG CTCCCGCAGG TCCAGGCTCA GCTGCAGCTG 14760
GAAGGCGTGG CCCACGCGCA CCCGCACCTG CACCCGCACC TGGCGGCGCA CGCGCCCTAC r GTCCGCCTCG 14820
CTGATGTTCC CCCCGCCGCC CTTCGGGCTG CCCATCGCGT CGCTGGCCGA 14880
GCCGCCGCCG TGGTCGCCGC CGCCGCCAAA AGCAACAGCA AGAATTCCAG CATCGCCGAC 14940
CTGCGGCTCA AGGCGCGGAA GCACGCGGAG GCCCTGGGGC TCTGACCCGC CGCGCAGCCC 15000
CCCGCGCGCC CGGACTCCCG GGCTCCGCGC ACCCCGCCTG CACCGCGCGT CCTGCACTCA 15060
ACCCCGCCTG GAGCTCCTTC CGCGGCCACC GTGCTCCGGG CACCCCGGGA GCTCCTGCAA 15120
GAGGCCTGAG GAGGGAGGCT CCCGGGACCG TCCACGCACG ACCCAGCCAG ACCCTCGCGG 15180
AGATGGTGCA GAAGGCGGAG CGGGTGAGCG GCCGTGCGTC CAGCCCGGGC CTCTCCAAGG 15240
CTGCCCGTGC GTCCTGGGAC CCTGGAGAAG GGTAAACCCC CGCCTGGCTG CGTCTTCCTC 15300
999· • 9
9
9
999 9 9 • 9 99 • 99
TGCTATACCC TATGCATGCG GTTAACTACA CACGTTTGGA AGATCCTTAG AGTCTATTGA 15360
AACTGCAAAG ATCCCGGAGC TGGTCTCCGA TGAAAATGCC ATTTCTTCGT TGCCAACGAT 15420
TTTCTTTACT ACCATGCTCC TTCCTTCATC CCGAGAGGCT GCGGAACGGG TGTGGATTTG 15480
AATGTGGACT TCGGAATCCC AGGAGGCAGG GGCCGGGCTC TCCTCCACCG CTCCCCCGGA 15540
GCCTCCCAGG CAGCAATAAG GAAATAGTTC TCTGGCTGAG GCTGAGGACG TGAACCGCGG 15600
GCTTTGGAAA GGGAGGGGAG GGAGACCGGA ACCTCCCACG TTGGGACTCC CACGTTCCGG 15660
GGACCTGAAT GAGGACCGAC TTTATAACTT TTCCAGTGTT TGATTCCCAA ATTGGGTCTG 15720
GTTTTGTTTT GGATTGGTAT TTTTTTTTTT TTTTTTTTTT GCTGTGTTAC AGGATTCAGA 15780
CGCAAAAGAC TTGCATAAGA GACGGACGCG TGGTTGCAAG GTGTCATACT GATATGCAGC 15840
ATTAACTTTA CTGACATGGA GTGAAGTGCA ATATTATAAA TATTATAGAT ΤΑΑΑΑΑΆΑΑΑ 15900
ATAGCCGTGC ACTCTTGACC CCGTCAACGT CCAACGTGGA AAAGGCGTTA CCTCTTCTCC 15960
CAGCGCTGGC CGCCTGGCCA CTGAGGGCCC TTTGCAAAAA TCACGGGTGT AGAGATGGCC 16020
CTGGGCGCGC TGGGAGTGTG GTTGTGTTTC TGAAGGGGAT AAAAGAGGGC ACGGTGGTGC 16080
CAAGATATCA GTTTGGTACC TGAGCTGTTT GTGGTTGGGA AGCGTAAAAG CCAGGGAGAG 16140
ATCCAGAGAG TTTTCAAGTT TTTGCAGATG TAGGTGGTTC CAGCTTTTCT TTCTCCCCTA 16200
CTCCATCTTC TGCGTTCCCC CAGTTCTTTT ATTTCTTTGT TTTTTATTTT TGAGACAGAG 16260
ACTTGCTTTG TCGCCCAGGC TGGAGTGCAG TGGCGCAATG TCAGCTCACT GCCACCTCCA 16320
CCTCCCGGGT TCAAGCGATG CTCCTGCCTC AGCCTCCCGA GTAGCTGGGA CTACAGGCAC 16380
CTGCCACCAC CCCCGGCTAA TTTTTTGTAT TTATAGTAGA GACGGGGTTT CACCGTGTTG 16440
GCCAGGCTCG TCTCGAACTC CTGACCTCAG GTGATCTGCC CGCCTCGGCC TCCCAACGTG 16500
CCCCCAGTTT TATAAACAGC AGATAGCAAC TTGTCGTCAC AGCTGGCATG GGCTGGACAG 16560
TTGCTTGAAA TGACCTAACC AAAAACATTC AAGGGTTCTG CCCCCAGATT TCGGGAGATC 16620
CACGTTCCAT GTTCTGATTG GTTTTCTGGG AACACAGCAA GGGGTTTGGT GAGCTCCGAG 16680
AAGATCCATC TGCATGATTG GCATTAGTTA CCACAGCCTG CCCAGAGAGA AACTATCTTC _16740
TCCCAACATT TACTAACATC CACTGGTCAA CTCTCTTATT TCCATAACAC ATTTGCATCT 16800
TTCTGGATTC AAGCTTGGTG GTTTTCTTTC CTAACTTCTG ATTTAGATAC TTCTCCCfGA 16860
GGT GvjGoAT A AAAGAAAAAA AAAAAACAAC *£* CTTCCGCATA ACACTTTCTA 16920
TCTTGTCACT GAGCTGAACT GTAGATCCAT TTGGACCCGT CTCATTTGTA TCTTCTGATA 16980
TTCTTTATAC AAACCAAAAG TCCCCTTCAA CATTTTTTAT GTCAAAATGT TACAACCGCT 17040
GTAAAATGAC GGAGAGAGAG AGAAAGAATC CCAGACATTA ACGGTATTAG AGAGTTTGCC 17100
TCATTCATCC ATTTTTCTTA AAAGCTGGAA ATTAAAAAAA AAAAAGAGAG AGAGAGGCTT 17160
TAATAGTTAA GCTGAAATTT TTATCGAAAA GAAGAATTGC ATTTTGAATC TTTGGGAAGT 17220
AGGTTCATTC ATCAGAGTAT GTAACCCTTT GGAAAAGTGG TTGGTAAGAT ATGTACAGCC 17280
9
72 9 9 9 9 9 9 99 9 9 9 «99 • 9 9 9 999 99 9 9 9 9 9 9 99999 · 9 9 9 9
CTAGATTTTT TTTTTTTTAA CCAAAAAGGC TGAGTAATTT TGAAAAATCG AAACATAACA 17340
GTGTGTCATC ATTTCCTCCC AAGAAAAAGC TCACTCCACG TGAGTAGAAA GACATCTACC 17400
TGGTCCCTGT AGAATCTGAA CGTTTCTCTT TAGAGACGGA ATTTCAATCT TGTTGCCCAG 17460
GCTGGAGTGC AGTGGCACAA TCTCGGCTCA CCGCAACCTC CGCCTCCCGG GTTCAAGCCA 17520
TTCTCCTGCC TCAGTCTCCC GAGTAGCTGG GATTACAGGC ACCTGCCACC AGGCCTGGGT 17580
AACTTTCTGG TATTTTTAGT AGAGACAGGG TTTCAGCCTC CCGAGTAGCT GGGATTACAG 17640
GCACCTGCCA CCAGGCCTGG GTAACTTTCT GGTATTTTTA GTAGAGACAG GGTTTCAGCC 17700
TCCGGAGTAG CTGGGATTAC AGGCACCTGC CACCAGGCCT GGGTAACTTT CTGGTAGTTT 17760
TAGTAGAGAC AGGGTTTCGG CCTCCCGAGT AGCTGGGATT ACAGGCACCT GCCACCAGGC 17820
CTGGGTAACT TTCTGGTATT TTTAGTAGAG ACAGGGTTTC GGCCTCCCGA GTAGCTGGGA 17880
TTACAGGCAC CTGCCACCAG GCCTGGGTAA CTTTCTGGTA TTTTTAGTAC AGACAGGGTT 17940
TCGGCCTCCT GAGTAGCTGG GATTACAGGC ACCTGCCACC AGGCCTGGGT AACTTTCTGG 18000
TAGTTTTAGT AGAGACAGGG TTTCAGCCTC CCGAGTAGCT GGGATTACAG GCACCTGCCA 18060
CCAGGCCTGG GTAATTTTTT TGCATTTTTG GTAGAGACAG GTTTTTGCCG TGTTGGCCCG 18120
GCTGGTCTCA AACTCCTGAC CTCAGGTTGA CCTGCCCGCT TTGTCCCTCG CAAAGTGCTG 18180
GGATTACAGG CGTGAGCCAC CACACCTGGC CTGAATCTGA ACTTTTAAAA GGGAGTTACT 18240
GACTCTCAAC TGTGCGGGGA CGGTTTCACT TTGATTTAAT ATGGAAAGAG GGCCAAGTGT 18300
CATCCTCACA AATGGGTCCC CGAAGCAGAT CAAACGCAGA GAACTGTGAG GGTGGGACAC 18360
GAGTGTCTGT GGACACTGGC TGCCTTTGGC TTTTCTCCTG CGAGAGAAGT TGGGTGACTT 18420
TCTGTAGGTG GATGAGTGAT CCCTGAATGA GTGTGGGGTA CGTGTATGCT AGCTGCTTCT 18480
TTCTCCCTGA AACTCTCGGA T GvrAAGv, A/^G TAAGAAATTC AGCTTGGGCT G j GACCAG l Γ 18540
CTCACCACCA ACGCCCTCTT CTCTCTCCCT TCTCCTTCCT TCCTTCCTTC CTTCCTTTCT 18600
TTCTTTTTCT TTCTTTCTCT CTTTCTTTCT TTTCTTTCTT TCTGTTTCTT TCCTTTTTAT 18660
CTTTCTCTCT TTTTCTTTCT CTTTTCCTTT TTTGTTTCTT TCTTTCTTTT TCTTTCTTTC 18720
TTTTTCTTTC TTCTTTCTTT CTTCGATGAA GTCTCACTCT GTCACCCAGG CTGGAGTGCA *18780
GTGGTGCAAT CCCAGCTCAC 1 <jGA I CCl C Γ ACCTCCTGGC TTCAAGAAAT TCTCCTGCCT 18840
CAGCCTCCCA AGTAGCTGGG ATGACAGGCA CCCACCACCA TTCCCGGATA ATTTTTGTAT 18900
TTTTTAGTAG AGACTGGGTT TCGCCATGTT GGCCAGGCTG GTCTTGAACT CCTGACCTCA 18960
CATGATCCAC CCGCCTCAGC CTCCCAGAGT GCTGGGATTA CGGGGTGAGG CACCGCGCCC 19020
GGCCTCCTCT CTCTTTTTCT GAGATGTTTA GGAAGGACTG GGCTGATGGG GACCCTCTGT 19080
ATGTGATGTG CGTGGGTTTG GTTTCCCGGA AGGCCCTCCA GAGACACGTT TGCGTGAACA 19140
TTCAGCATGG AAACAACATA CGTCTCTCCA CAGGAGGTGA GAAATTGAAT TTATGGGGTG 19200
GGTGTACGCT GGCGATTCTT GGTGCTTTTT GCTCAAAACA AGGTTCTTTT GAAAGTCACG 19260
TTCCTGCTTT CCCTGTGGCT TCCCGGTGAG CTCGCTCGCA GAGCAAGGAA TACCACCCAG 19320
9 9 9
9
73 4 4 4 4 « 444 4 4 4 · 4 4 4*4 * 44444 4 4 4 4 4 4 4 44 44 4 4 4 4
AGAGCAACGT GGGCTGTGTT CCGTTGTAAC GCCGTTGCAG AGAGAGGATT TGGTGTGTGA 19380
GATCCGTACC AGCTCCAGCA CACTGATAGG AACACGTTGC TGGCCGAACT GAACGATGCT 19440
GGGTTGGGTC CTGATTGATA CGTATTTTCT TCCCTCCTCT CCCCAAAACT TGGCCAAATA 19500
GTCCGTGGAG GGTTGTCAGT CGCCGCAGTT GAGCAAAAAA CACTTCTTCC TTTGAGTGGC 19560
TGTTCTGGTG AAATCTGTTT CTGACATATC CACTTTTCTC TCTCTTTTCT CTCTCTCTGA 19620
CTGCGAAGCA CCCACAGGGA GAAGGAATTG GATGTATCGG ATGTTGGTAT TAGATTTTCT 19680
TTCTCCGTTC GAGTCTCTGA CTGGTGCATA CTTTGCAAAG GTGTGTTCCT GGCAATTGCC 19740
AAGAGTTAGA AAAATGCACC TTCTCTGGTG GCCGTTGGGG TGTTGTTTCA CAGGCAGTGG 19800
TGACAGGGCC CCTTGGCTGT GGCTGTCTTC TCCAGCGCCG TGGATAAAGA GACGGGACAG 19860
ATTCTGTGCC TCTGTACGAT TTAGAGCGTA ACTGACCGCG TCCAACACCC GTTTTTCCAC 19920
TTACAAAGCT GGTGGTGCGA CGGGCTTGGT GTCTCCCGTA CGGGAAGGAG GCCTTTGGGC 19980
CGCTCCAAAG ACGCCCTGTC GTAGGAATGG CCTCTCCATC CCGCCAAAGT CCAGCCAGGC 20040
CCCCGAAATG GTCCCATTTC CTTGGAAGCC TGAGTTTCTG TTCTGGTCTT GCTGCTGTCC 20100
TTGGCCACGT CAGCACGTGG GAGCATCTGT GGATACCGCA GAGTCTGGGG ACAGCTGGGC 20160
GTTTAACCGA AATGAAGCCG AGACGGGTTT CAGGTTTTGG TGCCAAGCTC TGGTCAGGAT 20220
GAAAGGGAAA TACCAGAGTC CTCTGTCCTC GCCTCTGGGT TTCATGCTGA CCTTTCTAAC 20280
ATTTGTTTTC CCCTAAGAAC AAGCAGAAGC CTCCAGCTCC CTTTAGCTCC ACAGTTTTCC 20340
CGGGGACATA GCGAGGATGG CACACGGCAG CCACTCCCAC GACACACATT TCGGAGGCAC 2Ό4ΟΟ
TTTGCTGGAA GCCGCTTGTC TCCTCCAGCT TTGGGAGGTC TGGGGAGGAG AGAGGCTTTC 20460
GGTGGACACG TTTGACATTA AAAAAAAAAA AAAAAAAAAA AAAAAAACTG GTGCCTAATT 20520
TATTAAAGAG AATTAGCTTA GCGAGTATAT GCTGATATTC TTCGACACAC GTGGGTAAGT 20580
TGATGCCATT TATAAATGTT TTATTGAAAT TTGATATTTA ATGAGAAGCC GGTTAAGGAA 2064 0
TGTAGACAAT ATCCCGTTTC AAAGCTATGA AATGTGCTAT TTATTGAAAG GGGATGTGGC 20700
TTCACGAGTT CAGCCCATTG TACGTGCAGG TCCCGTGGGA AGGAGGCAAA AGCCCCTGCT 20760
TCTTACTTTG TGATGTATGT GCATTTGTTA TTTATTTTTT TTTCCTTGGT CGGACGTTCA *20820
TAAATATGTA CTATTTTAAT TATGTCGAGT GTAAATTTGA CATCGCGTTG CATTTATTTT 20880
TATATTTCTG AAAACTGTTG CTTTTTCTTT TTCCCTCCCC CATTGACGAC ATAGCGGtCC 20940
CCGCGTCCGG GTTACAAATA CATCTACAGA TATTTTCAGG GATTGCTTCA GATGAAAACA 21000
AATCACACAC CGTTTCCCAA ACCAACAGTC TTCACATTTC TATCCCTCTG TTATTGTCGG 21060
CAGGCGGTGA GGGGTAGAAA AAAAACAAAC AAACAAACAG AAAAAAAAAC CAAAAAAAAC 21120
CACCCTGAGT TTCTCTGGTG ACGCCCTCAT TCTCCTAACG TTCAATAATC TCAATGTTGA 21180
GTTGCAGCAA CAGACTGTAT TTTTGTGACG CCCCGTAGTA TGAATGTACA TCTTGTAAAA 21240
• 4
4 «44
CTGAGATATA AATAAACTTA TAAATATTTG TATTCAAGTG TTAAAAAAAA AAAAATTCTC 21300
4 4 4 *
• 44 » 44 44
4 4 4 4
4444 4 ·
4 444 444444
4 4 4 4 4 ·*· ·* ·* * • 44 4
4
AACCTCTCCC CTGAGGACAG gcttattgga AAAAAAAAAA AAAAAAAAAA ATCCTGAGTC 21360
GGCCGTGGCT GAACACAGAG TGTTGTTCTG CTGCGTGCAT TTCCAGGGTG GGTACCCAGT 21420
GTTGCCCCCC AGCCTTAGAT CGGGAGGTAC CATTGACTTT TGGTTGTATC CCATCCCCTT 21480
CCTTTACTGA AACCTACCTC CCCGCTTCTC AGCCAACGTC CCCCCAGAAG GTGGCAAAAA 21540
AAACAGAGGA AAAAGCCCTG ATTTGAATCA AGTCAGAGCT GCTAATTCTC CACTTTCTTT 21600
ΑΑΤΤ7ΆΤΤΑΑ TTTATTTTTT TTTTTGAGAC TGAGTCTCGC TCTGTCGCCC AGGCCGGAGG 21660
AGTGCAGGGG CGCGATCTCG GCTCACCGCG ACCTCCGCCT CCCGGGTTCA AGCGACTCTC 21720
CTGCCTCAGC CTCCCGAGTA GCTGGGATGA CAGTCACCTG CACCACCGCG CCGGGCTCAT 21780
TTTTGTATTT TTAGTAGCAA TGGGGTTTCA CCGTGTTGGT CAGGCTGGTC TCGAACTCCT 21840
GACCTCGTGA TCCACCCGCG TCTGGGCCCG GCCGGTGATG TGTGTGCTTT TAACTTTTAT 21900
TTTGTTCCAG TTTTCGACAG TGGGACGGAT TTTCCAGCAC GGTCTTGCAA GGATGATTGA 21960
GTCATTTTTG AGACAAAAAA TATAATAATA ATAAATGGAA AAAGAAATCG ACTTTTAAAA 22020
ATGACAAATT TTTTTTTTTT TTTTTTGCAT AGATTTTTCT CTCTTTATGT AAAGGAAAGT 22080
TCATGATTGG ATTTGGCCGG CCTGACTGCT TCCCGGCTGT GATAAAAAAC ACATGTGAGC 22140
TGGGAGGGAA GTGGGGGAGG GACACAGCTG CCCACACAGG GTTCCCACCG CGGTTACAGG 22200
GTGGGCAGTG CTGGGGGAGC TTTCTCTGTG GGGGGCTCAG AGCCTGAGGA CAGGTGAGGC 22260
TCTCCGACAC CTCCCCAGTT GCCTGGAGTC TAAACCGTCC GTTGTCTGTA CCGTCCGTTC 22320
TTCCTGCTGA CTCCTGGTAG TTCCTGAAAG CTTCTCTTGG CCAGAGAAGG GGTTTCAGAG 22380
GCCGTGTGTC CAGGCCATTC TGCAAAGTGC AACTTGACCG TTCCTTTCCT TTTCTGGCCT 22440
GCGTGGTCTG AAGCTCAGAG CCCTCTCTTC ACCCAGCCTG TGTGTGTCTT GCCGGACAGA 22500
AGAAAAATGG TGCTTTTTGC GTGTTAGCAG AGGTGCTTTT CATGGCTGAC CTCAACGCGT 22560
CCATCTCCAG CCTTGACCAA GCTGTTTTTT AGGGGCAAAC GCAGGCAAGT TCTGAATGCA 22620
CACAGTTATT TCATGGTTAA ACTATTCAGC TTTGGCCGGG CGCAGTGTGG CTCTCACGCC 22680
TGTCATCCCA GCACTTTGGG AGGCCGAGGC GGGTGGATCA CCTGAGGTCA GGAGTTCGAG 22740
ACCAGCCTGG CCAACACGGT GAAACTCTAT CTCTACTAAA AATACAAAAA TTAGCCGGGC 22800
GTGGTGGTGT GTATCTGTAA TCCCAGCTAC TCAGGAAGCT GAGGCAGGAG AATCGCTTGG 22860
ACCCAGGAGG CGGAGGTTGC ACTGAGCCGA GATCGCGCCA TTGCACTCCA GCCTGGGCG/A 22920
CAGAGCCAGA CGCTGTCTCA AAAAAATGAA ΤΑΑΤΑΑΛΑΤΑ AAATAACAGG AACTAAATAA 22980
AATAAAACGT TCAGCTTTGT TCTGCAAATC CACTCCTATT GTTTTACGTG GTTTGAGAGA 23040
CTCTGTCCCT TAGAAATAGA TGTTTGTTGC CAATTGTAAT GAATCTGTTT CAAAAATGAA 23100
CAGAATATTC AAATGGTTTG AGAGATCTTT TCCCTTAGAA ATAGCTTGTT GCCAATCACA 23160
AAGAATGTTT TTCAAAAATG AATGGAATCT TCCTGGATAT CGCTTCCAGA TCTTCATTTT 23220
TTTTGCATAG TTCAACCTGA AAAGTAAGTG TCTCAGCCCT GAATTTCTTT CTGATTTTTC 23280
CATGGGTTGT CTTGCAGACT TCTCTGGACT TGACCACATT TAAAAAAAAA AAAATTAACT 23340
«9
9 4
9 4«
4 4
4 4
94« ··
9994 9
4 • 4 4«
4 4
4 ·
444 944 «
94
TTTTCACACG GACACGGTTT CAATAGGAAT GAGATCTTTG AGTTTTTATG TAACAGATTC 23400
TTACCATCAG TTCTCAGATT CCCAAATTAC ACACAAAAAG CCACGGACTT CGCCTCCTGC 234 60
TAACATGTCC TTCTGTTTCT GAGGCTTCTG TTGGTGTTAG ACTTTCATGT TTAATAGCAG 23520
ACAATGTAGG GATTTAAAGA AAAATGCAGA GAAAGCAAAA ACACTGACCA AACACACGGA 23580
GATAAGCTTT CTAAAGCCTT TGTTCTTGGA GTTGTCGTTA AAAAAAAAAA GTTGTTTTAA 23640
ACTTTGCAAG CATGCCTATA TTGAACTCAT AAGCAAGAGA GCCAAGAAAA ATAGTGTCGG 23700
TCGTCTACTC TACACGTTTT CCCAAAACAG ACGTATTTTA ATTTCTTTTG TTTGAACTCA 23760
CAGATGCTGA GAGTTAAAAG TTAAATTTTT GTCATGAACA ATAGTGGCCA AAACCACAGT 23820
TACTTTTGCA CTATAGCATA AT7VAGAAAAA TACAGGCTGG GCTCGGTGGC TCACACCTGT 23880
AATCAAAGCA CTTTTGGAGG CGAAACAGCC AGATCCCTTG AGCCCAGGAG ATTGAGACCA 23940
GCCTGGGCAA CATAGCGAGA CCCTCATCTC TACAAAAAAG GTTTGTTACA TATGTAACAA 2 4000
ACCTGCACAT TGTGCACATG TACCCTAAAA CTTAAAGTAT AATAATAAAA AAATTAAAAA 24060
AAAATTCACC AATCAACTGC CTGCTGGTGC CTTCAAGAGA CTCACCTAAC ACATAAGGAC 24120
TTGCATAAAC TTATAAAACA ATTCAATGGA AGAATCCTTG AAAGTATTCT GAGAAGACAG 24180
TATAATAAAC TGATTTCTAA AAAGGCTATA AAAAATTGAA TAAATCATTG TTGGGCATCC 24240
TGTGCTGAAA TATAATGCAG CCAATAAAAA TTACAAAATG AATAAACATT TTATAACAAT 24300
AAAAAAAAGT CAAATAATTA GGCAGGCATG GTGGTGCTCT CCTACGGTTG AAGCTATTCA 24360
GCAGGCAAGA GGATACTTTG TTTTTGTTTT TTAATTTTTT TTGAGACAGA GTCTCGCTCT 24420
GTTGCCAGGC TGGAGTGCAG TGGCGTGATC TCAGCTCACT GTAATTTCTG CCTCCCGGGT 24480
TCAAGCGATT TTCCTGCCCC AGCCTCCCGA GTAGCTGGGA TTACAGGTGC CCGCCACCAC 24540
ACCTGGCTAA TTTCTTTTGT ATTTTTAGTA GAGACGAGGT TTCCCCATGT TGGCCAGGCT 24600
GGTTTTGAGC TCCCGACCTC GGGTGATCCA CCCGCCTCAG CCTCCCAAAG TGCTGGGATG 24660
ACAGGCGTGA GCCACCGCGC CTGGCCCAGG AGGATTATTT GATCCCAGGA GGTGGAGGCT 24720
GCAGGAAGCC ATGATTGCAC CACTGCACTC CAGCCTGGCT GACAGAGTGA GACCACATCT 24780
CTAAATAAAT GAATAAATAC AGGCAGAAAC TTTTTTTGTT TTGTTTTGAT GGAGTCTTGC *24840
TCTGTCACCA GGCAGGAGTG CAGTGGTGCC ATCTCAGCTC ACTGCAACCT CCACCTCCTG 2 4 900
GGTTCAAGCA ATCCTCCTGC CTCAGCCTCC CGAGTAGCTG GGATTACAGG TGCCCGCGAC 24960
CACGCCCGGC TAATTTTTTG TATGTTTAGT AGAGACGGGA TTTCACCGTG TTAGCCAGGA 25020
TGGTCTTGAT CTCTTGACTT TGTGATCTGC CTGCCTCAGC CTCCCAAAGT GCTGGGATTA 25080
CAGGCATGAG CCCAGGAGTT CAAGACCAGC CTCAGCAACA AAGTGAGACC TTTTCTCTCC 25140
AAAAAATCAA AAATTTAGCC AGCTGTGGTG GCTCCTGCCC GTGATCCCAG TACTGTGGGA 25200
GGCTGAGGCA GAATTGCTTG AGCCCAGGAG TTCGAGACCA ACCTCAGCAA AAAGGACTCT 25260
CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTATAT ATATATATAT ATATATATAT 25320
• 76 • ·« ·· • · · • · ·· · • · · « · • · · * «· ·· ·« • ·» • · * * • · · · · ···*· · ·»· • « · • ·· »· « * • · • · · • ··
GAGTTTCAAA AATTGCTGGG TGACCAGCTC ATCTACTGGT TTTCCCCTTG GGAAAGTGAA 25380
ATTGTCATGT ATTGAAGATT TCCAAGGAAG TTGTATTGAA TGAGAAACAA ACTCAATCTG 25440
TTCGTGTTTA AAGAGCTGCA GTGCGTTTGC TGTGTTTCCC ATAAAACTGC ACTTCCAAAA 25500
GACACGCTGA GAAAGGAGAC CAGGATTTGT AATTCAGAAA TTGGAAAGCA AGTTAGGCTG 25560
GACGTGGTAG CTCATGCTTG TTGTAATCTC AGCACTCTGG GAGGCTGAGG CAGGAGGATC 25620
ACTTGAGCCC AGGAGTTCAA GACCAGCCCG TGCCACATGG TGAAACCCTG TCTCTCCAAA 25680
AAATAAAACA TTTAGCCAGA TGTGGTGACT CATGCCTGTA ATCCCGGTAT TCTGGGAGGC 25740
TGAGGCAGAG TTGCTTGAGC CCAGGAGTTC AAGACCAGCC TCGGCAACAA AGTGAGACCC 25800
TGTCTCTCCA AAAAATAAAA CATTTAGCCA GCTGTGGTGA CTCATGCCTG TAATCTCAGT 25860
ACTCTGGGAG GCTGGGGCAG AATGGCTTGA GCCCAGGAGT TCGAGACCAA CCTCAGCAAC 25920
AAAGTGAGAT CTTGTTTGTC CAAAAAATCA AAAATTTAGC CAGCTGTGCT GGCTCATGCC 25980
TGTAATCCCG GTACTCTGGG AGGCTGAGGC AGAATCGTTT GAGCCCAGGA GTTCGAGACC 2 6040
AACCTCAGCA ACAAAGTGAG ATCTTGTTTC TCCAAAAAAA TCAAAAATTT AGCCAGCTGT 26100
GCTGGCTGGT GCCTGTAATC CCGGTACTCT GGGAGGCTGA GGCGGAATTG CTTGAGCCCA 2 6160
GGAGTTCAAG ACCAGCCTCA GCAACAAAGT GAGATCTTGT TTCTCCAAAA AATAAAACAT 26220
TTAGTCAGCT GTGGTGGGTC AAGCCTGTGA TCCCAGCATT TTGGGAGGCC GAGGCGGGCG 26280
GATCACGAGG TCATGAGATC GAGACCATCC TGGCTAACAC GGTGAAACCC CGTCTCTACT 26340
AAAAATACAA AGAAAATTAG CCGGGCGTGG TGGCGGGCGC CTGTAGTCCC AGCTACTCAG 26400
GAGGCTGAGG CAGGAGAÁTG CCGTGAGCCT GGGAGGCGGA CCATGCAGTG AGTCAAGATC 26460
GCGCCACTGC CCTCCAGCCT GGGCCACAGA GCAAGACTCC GTCTCAAAAA /AAAAAAAAAA 26520
AAAACTGCTG CCCAACCTGT GTTTGCACCA CTGCCCTCCA GCCTGGGCAA CAGAGCAAGA 26580
CTCCGTCTCA AAAAAAAAAA AATGCTGCCC AAGCTGTGTT TGCACCACTG CCCTCCAGCC 26640
TGGGCAACAG AGCAAGACTC CGTCTCAAAA AAAAAAAAAA AAAATGCTGC CCAAGCTGTG 26700
TTTGCACCAC TGCCCTCCAG CCTGGGCAAC AGAGCAAGAC TCTGTCTCAA /AAAAAAAAAA 26760
AATGCTGCCC AAGCTGTGTT TGCACCACTG CCCTCCGGCC TGGGCAACAG AGCAAGACTC _ 26820
CGTCTCAAAA AAAAAAAAAA AATGCTGCCC AAGCTGTGTT TGCACCACTG CCCTCCAGCC 26880
TGGGCAACAA AGCAAGCCTC AGCTTTCTGC CATCTCCACA ACCAAGAAAG CAATTCACAC 26940
AGAAATCAGT GGATCGTGCA GTGACCTCTT CAGAAAACCA ATGAGTTTTC CACCTGAGGA 27000
ACTGTTTCTG AGCCCCATTC AGAAAAACAC ATCCCTGTAA CTGCAGGGCA GATTTACTCA 27060
CTGTATGCCT GTTTAAATAA AGCTTCCAGC CTCTGCATGG GGTCTGTCTG GAAGCTCCTG 27120
TATCTGTCCC ACATTCTTGG AATCACAATG CACCCTTGGG AGGAAGATAT GTATTTAAAG 27180
GGAGTGGATG TTATGGTGAG AAAATGCTGC CCATCCTTCT AGAAGACAAA AGCCACACAA 27240
AATACATCAC AAGAACCAGT TTTTTTCAGA GAAGAACCTG CACAAAGAAC CTGCTCCCCC 27300
CACACCCCCA CACACAGGTG AATTAACAGG ATGTATGTTT TATCATAAAA GCACAGGTTT 27360
·· • · • · • 9 · 9 9 9
9 9 9 9 ·
9·· 99 99 9 • ·· ·· · • ··· • · ···· • 9 99
9 9 9
9 9 9
999 999
9
99
GTTTCCTATG CACTCTCTGA GGATTTGGCC ATATGCAAAG ATGTACAAAA ACCTTCTCTT 27420
TCCCCAGGGA ACCGTAACCC GTCTGAAAAG ATGCCCTTCT CAGAAGCGAG TTGAACGATT 27480
GTTGGAAAAG ATAAAATACG ACGTGCACAC ACACAGTAGA GAAATGTCAC CCATGCAAAT 27540
TATGTGTTTG AATGGAACAC ATTCAGGAAG CTAAATGGGG TATGACCACA CATTTGGGTT 27600
GATTTATTTG ACGAGTGGAA GGGGCAGATG GAAATGAATA CTGCTGTTTT CCTTTGGAAG 27660
GCCATATATG GGAATACGAA GAGGATTACT TTGGAAGTTT AGCTTCTCCA GGTGGTCTCT 27720
CTCTCTCTCT CTTTTTTTGA GACAGAGTCT CACTCTGTCA CCCAGGCTGC AGTGCAATGG 27780
CGTGCTCTCG GCTCACTGCA ACCTCAGCCT CCCAGGTACA AGCGATTCTC CTGCCTCAGC 27840
CTCCCGAGTA GCTGGGATCA CAGGTGTGCA CCACCACGGC TGGCTAATGT TTGTATTTTC 27900
AGTAGAGATG AGGTTTTACC ATGTTGGGCA GGCTGGTCTT GAACTCGTGA CCTCAGGTGA 27960
TCCGCCTGCC TCGGCCTCCC AAAGTGCTGG GATGACAGAC ATGAGCTAGC ACGCCCGGCC 28020
CCAGGTGGTC TTTTTAGCGG GTATTAAAGC AGCTTTCTCT CTGAGCCTTA AACCATGAAG 28080
ATAGACAGAC TCAGTGTATG GGTTTTAGAG TTGTAATTTT ATAAAAATAA GAAAAAGTCG 28140
ACCTATCATT GATGGTTAGT ATTTTTTGTA GCAGTTGCAT GCAATATTAG GATAAGGCAT 28 200
GTTCTCAAAA AGAACTCTTT 3? T T T 3? *5* T TTTGAGACGG AGTCTGGCTC TGTCACCCAG 28260
GCTGGAGTGC AGTGGCACGA TCTCCGCTCA CTGCAAGCTC CTCTTCCCGG GTTCACGCCA 28320
TTCTCCTGCC TCAGGCTCCC CAGTAGCTGG GACTACAGGC GCCCGCCACC ACGGCCGGCT 28380
AATTTTTTGT ATTTTTAGTA GAGACGGGGT TTCACCATGT TAGCCAGGAA GGTCTCGATC 28440
TCC7GACCTC ATGATCCC-TC CGCCTCAGCC TCCCAAAGTG CTGGGACTAC AGGCGTGAGC 28500
CACTGCACTT GGCCTTTTTT TTTTTTTAGA TGGACTTTTG CTCTTGTCGC CCAGGCTGGA 28560
GTATAATGGC ATGATCTCGA CTCACTGCAA CCTCCGCCTC CCGAGTTCAA GCGATTCTCC 2 8 620
TGCCTCAGCC TCCCGAGTAG CTGGGATTAC AGGTGCCCAC CACCATGTCA AGATAATGTT 2 8 680
TGTATTTTCA GTAGAGATGG GGTTTGACCA TGTTGGCCAG GCTGGTCTCG AACTCCTGAC 28740
CTCAGGTGAT CCACCCGCCT TAGCCTCCCA AAGTGCTGGG ATGACAGGCG TGAGCCCCTG 28800
CGCCCGGCCT TTGTAACTTT ATTTTTAATT TTTTTTTTTT TTTAAGAAAG ACAGAGTCTT *28860
GCTCTGTCAC CCAGGCTGGA GGAGAC Γ Gvj Γ GGGATCATAG CTCACTGCAG CC I CzWAC I C 28920
CTGGGCTCAA GCAATCCTCC CACCTCAGCC TCCTGAGTAG CTGGGACTAC AGGCACCČAC 2 8980
CACCACACCC AGCTAATTTT TTTGATTTTT ACTAGAGACG GGATCTTGCT TTGCTGCTGA 29040
GGCTGGTCTT GAGCTCCTGA GCTCCAAAGA TCCTCTCACC TCCACCTCCC AAAGTGTTAG 29100
AATTACAAGC ATGAACCACT GCCCGTGGTC TCCAAAAAAA GGACTGTTAC GTGGATGTTC 29160
TAGCTTCCTG TTCTCGTCTT TTCTTTGTTA ATTGTACAGT TTGAGGGTGT GTGTGCGTGT 29220
GCGCACGTGT GTGTGTGCAG TCTCCTGATT TCATGTATTT AATTGTTATT ACCACCACCT 29280
CCATCTCTCA TTCCTTCTTA CCCTCACTGT GTAAAGATAC ATGTTGTTTT TAAATTTTAT 29340
GTATTTATAT TTATTTATTT GTATTTCTGA GACAGAGTCT CACTCTGTTG CCCAGGCTAG 29400
TGGCATGATC TCAGCTCACA GCAACCTTTG CCTCCTGGGT TCAAGCGATT CTCCTGCCTC 29460
AGCCTCCCGA GTAGCTGAGA TTACAGGCAC ACACCACCAC ACCCGGCTAG TTTTGTTTTG 29520
AGACGGAGTC TCGCTCTGTT GCAGGCTGCA GTGCAGTGGC GTGATCCTGG CTCACTGCAA 29580
CCTCTGCCTC CTGGATTCAA GCGATTCTCC TGCCTCAGCC TCCCAAGTAG CTGGGATTAC 29640
AGGCGCCCAC CGCCACACCT GGCTAATTTT TTATTGGTAG TAGAGACGGG GTTTCTCCAT 29700
GTTGACCAGA CTGGTCTTGA ACTCCCAACC TCGGGTGATC CACCCACCTG GGCCTCCCAA 29760
AGTGCTGGGA TGACAGGCGA GGGCCACCGC GTCCAGCCTT CTTCTTCTTC TTCTTTTTTT 29820
TTTTTTTAAG ATGGAGTTTC ACTCTGTTGC CCAGGCTGGA GTGCAGTGGT GCAATCTCGG 29880
CTCCCTGGAA CCTCCACCTC CCAGGTTCAA GAAATTCTTT TGCCTCAGCC TCCCGAGTAG 29940
CTGGGACTAC AGGTGCCCGC CACCACACCC ACCTAATGTT TGTATTTTTT TGGTAGAGAC 30000
GGGGCTTCAC CACATTGGCC AGGCTGGTCT TGAACTCCTG ACTTCAGATG ATCCTCCTGC 30060
CTCAGCCTCC CAGAGTGTTG GGATTACAGG CGTGAGCCAC GGTGCCCGGC CAGACGTCAT 30120
GTCTTAGGAA ATCAGAAAGT GGGTAGTTTC CGCACTCTGA GGAGAAAAAG AGACGTCCGG 30180
CGAAGAGAAA GGAGAGTGAA AGGATGTCTC CTCTTGTCTG TAGCCTGTTC TCAATCGTGA 30240
GTGAGCCAAT TGCCAGAAAC TGAGGGTGCT TCATTTGGCC AGGCAAGCTT CTCAACAGAA 30300
TGTCTAAGTA CTTGTTAATG CTGAGAAGCT CTCCAAGCTA CTGCACTCCA GCCTGGGTGA 30360
CAGAGCACGA CCTTGTCTGA AAACAATTAA TTAATCAATT AATTAATATA ATGAAATCAT 30420
ACTGAACTCA GGAGACCATT GGGGTGGGCA GGGCTGGGGT TGGAAAGGAA CATAAAATAT 30480
GGTGCAATGG actttgctcc AGTCTCCCTC CCCATCTCTT CTCGCCAAGA GTCTCTGGAG 30540
GGAGCATGGG GAAGATGCTT TGGGAATCTG TAACTTCTTG TCTTGTAAAC AGAATATCTA 30600
AGTAATTGTT AATGCTGAGA AGTTATAGAT TTCCAAAGCC TTTCTCCAGG CTACGGACAA 30660
GGGTCATGGG TTACTCAGTG TTACAGAAAG AATGACATGG AGATGTTTGT TACATCTTAA 30720
GGAACCATGA GGGGCCAGAG TATTTTACTC TAAGTG7AGA TGGTACATTG GCCACGCCTG 30780
TCCCAACACC ACCAATGGTG GCACCTAACT TTTGTGTTTG TGCCCCACAT TTCTTCTTCT 30840
TTTCTGACGT AAATGCAAGT GATATTCCTT GGAAACCATG CTGCAGCAAG AGGCCATCTG 30900
ACTACTAGTG ATACCCTGTA GCTCACCTAC AGCAGCTCAC TTGAAGCAGC TCACČCATAG 30960
CTCAGGTATA GCTCACCTGC AGCGGCTCAC CTGTAGCTCA CGTGTAGCTC ACTTGTAGCA 3 1020
GCTCACTGGT AGCTCACCTG CAGCAGCTCA CCTGTACCTC ACCTGTACCT CACCTGCAGC 31080
AGCTCACCTG TAGCTCACCT GTACGTGAGC CACCGTACCC GGCCAGCAAG ACCCCATTTC 31140
TAAAATAAAT ACACAAAAAT TAGCCGGACG CGGTGGCGCG TGTCTGTAGT TGTAGCTACT 31200
CAGGAGGCTG AGGTGGGAGG ATTGCTGGAG GCTGGGAGGT AGAGGCTGCA GTGAACCGTG 31260
ATCCAGCCAC TGTACTCTAG CCTGGATGAC ATAGCAAAAC CTTGTCTCAA AAAACAAAAA 31320
CAAAAAACAA AACAAAGAAA CAAACAAAAA ACCCACACAC ACCGGAAAAC AAAACAAAAA 31380
• ·0 · ··· · · · · • 0 Q · 0 0000 0 000 000
0 0 0 0 · ·
79 •to ·· ·· 0
GCAAAAAGGA AAGAAAAGAG AGCCAGGTCC CAAATATATA TTTCCTTGGA GAACCATTTG 31440
CAAAGAGCAC ACTTAAGGCC GGGCGCGGTG GCTCACGCCT GTCATCCCGG CACTTTGGGA 31500
GGCCGAGGTG GGTGGATCAC GAGGTTGGGA GATCGÁGACC ATCCTGGCCA ACATGGCGAA 31560
ACCCCATCTC TACTAAAAAT ACAAAAAATC AGCCAGGTGC TGAGGCAGGT GCCTGTAGTC 31620
CCAGCCACTC AGGAGGCTGA GGCAGGAGAA TGGCATGAAC CTGGGAGGTG GAGGTTGGAG 31680
TGAGCCGAGA TCGCGCCCCT GCACTCCAGC CTGGGCGACA GAGCGAGACT CCTTCTCAAA 31740
TAAATAAATA AATAAATAAC AAAGAGCAAA CTTAAAATTG TCTCAGAAAT CCCACGGGAT 31800
ATTGGATCTC CCTCATGCCT ATCTGATGAC ACTTTGAGTG TCTGGGGCCC CGTGCCTATT 318 60
TTCTGGGGTT CCCAGAAGCT GCCGTTCTGA AAGTGTGGCT CTCGGGGACG TGGCACAGGT 31920
GTGGATGTCT GTTTTAAATG TCAGGCGTTT GGACGTTGAG GAACGTGAGG CTGAAGGTCG 31980
GCTTCGCCGA CCCCCTGAGT TTAGGGTCCT gccttttaaa ATCTTCCCAG CACTCTGTTG 32040
TTCACGCAAG CGTCCCATCT GTTTGGGTGG CCGTGCCGTC TGCATCTGTC TCGAACCTTC 32100
ACAGCTTTGC AGAATATCCT GTTTCTCAAT ACGGATGGAG AAACACGAGA CGCGTTTTCT 32160
GGGTTATTTT AGCCGTCACG GAGAACCCCA GACTGATGTG TGCTAATGAC CTCATTAATG 32220
ATACTCTGAG GCAGACAGCC CTGCCTGATC TTAACAACAT TTTTTAAATT TCTTTTTTTG 32280
TTGTTGTTGT TACAGCATCA TTCATATAAC GTAGGAAACC GTGATCAGTA GCTTTTAGGA 32340
TATTTGCAAC AGGGTGTAAC ADAAABD 32367
(2) Informace o sekvenci SEQ ID NO: 15:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 806 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (iii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOT (ix) RYSY:
(A) NÁZEV/KLÍČ: CDS (B) POZICE: 43..615 (xi) POPIS SEKVENCE: SEQ ID NO: 15:
GTGTCCCCGG AGCTGAAAGA TCGCAAAGAG GATGCGAAAG GGATGGAGGA CGAAGGCCAG 60
ACCAAAATCA AGCAGAGGCG AAGTCGGACC AATTTCACCC TGGAACAACT CAATGAGCTG 120
GAGAGGCTTT TTGACGAGAC CCACTATCCC GACGCCTTCA TGCGAGAGGA ACTGAGCCAG 180
CGACTGGGCC TGTCGGAGGC CCGAGTGCAG GTTTGGTTTC AAAATCGAAG AGCTAAATGT 240
AGAAAACAAG AAAATCAACT CCATAAAGGT GTTCTCATAG GGGCCGCCAG CCAGTTTGAA 300
GCTTGTAGAG TCGCACCTTA TGTCAACGTA GGTGCTTTAA GGATGCCATT TCAGCAGGTT 360
CAGGCGCAGC TGCAGCTGGA CAGCGCTGTG GCGCACGCGC ACCACCACCT GCATCCGCAC 420
«· »44 ·· • 4 4 4 4 4
4 4 * 4 ·
4 4 4 4 »44 44 44 ř» 4 4 4 4 4 4
4
4 4
CTGGCCGCGC ACGCGCCCTA CATGATGTTC CCAGCACCGC CCTTCGGACT GCCGCTCGCC 480
ACGCTGGCCG CGGATTCGGC TTCCGCCGCC TCGGTAGTGG CGGCCGCAGC AGCCGCCAAG 540
ACCACCAGCA AGGACTGCAG CATCGCCGAT CTCAGACTGA AAGCCAAAAA GCACGCCGCA 600
GCCCTGGGTC TGTGACVCCA ACGCCAGCAC CAATGTCGCG CCTGTCCCGC GGCACTCAGC 660
CTGCASNCCC TNDDKANMCG TTRCTYHTCM ATTACACTTT GGGACCYCGG GDBAGVCCTT 720
TTNNAGACTT YVATKGGSCW CSCTGGBCCC TBRKGAWAC TTGSGHYCGR GAACCGAKHT 780
GCCCABAYGA GGACCRGTTT GGAKDG 806
(2) Informace o sekvenci SEQ ID NO: 16:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 190 aminokyselin
(B) TYP: aminokyselina
(C) DRUH ŘETĚZCE: jednořetě
(D) TOPOLOGIE: lineární
(ii) TYP MOLEKULY: peptid
(xi) POPIS SEKVENCE: SEQ ID NO: 16:
Met 1 Glu Asp Glu Gly 5 Gin Thr Lys Ile Lys 10 Gin Arg Arg Ser Arg 15 Thr
Asn Phe Thr Leu 20 Glu Gin Leu Asn Glu 25 Leu Glu Arg Leu Phe 30 Asp Glu
Thr His Tyr 35 Pro A3p Ala Phe Met 40 Arg Glu Glu Leu Ser 4 5 Gin Arg Leu
Gly Leu 60 Ser Glu Ala Arg Val 55 Gin Val Trp Phe Gin 60 Asn Arg Arg Ala
Lys 65 Cys Arg Lys Gin Glu 70 Asn Gin Leu His Lys 75 Gly Val Leu Ile Gly 80
Ala Al a Ser Gin Phe 85 Glu Ala Cys Arg Val 90 Ala Pro Tyr Val Asn 95 Val
Gly Ala Leu Arg 100 Met Pro Phe Gin Gin 105 Val Gin Ala Gin Leu 110 Gin Leu
Asp Ser Ala 115 Val Ala Hi 3 Ala His 120 His Hi 3 Leu His Pro 125 His Leu T Ala
Ala His 130 Ala Pro Tyr Met Met 135 Phe Pro Ala Pro Pro 140 Phe Gly Leu Pro
Leu 145 Ala Thr Leu Ala Ala 150 Asp Ser Ala Ser Ala 155 Ala Ser Val Val Ala 160
Ala Ala Ala Ala Ala 165 Ly3 Thr Thr Ser Ly3 170 Asp Ser Ser Ile Ala 175 Asp
Leu Arg Leu Lys Ala Lys Lys His Ala Ala Ala Leu Gly Leu
180 185 .. 190
Změněné nároky
·«· ····♦· ·· • · · * 99 9 99· • · 9 9

Claims (35)

  1. PATENTOVÉ NÁROKY
    1. Molekula nukleové kyseliny kódující polypeptidy, které obsahují oblast homeoboxu tvořenou 60-ti aminokyselinami a mají aminokyselinovou sekvenci SEQ ID NO: 1 a vykazují regulační aktivitu lidského růstu a dále obsahují nukleotidovou sekvenci SHOX ET93 (SEQ ID NO:2) a nukleotidovou sekvenci SHOX ET45 (SEQ ID NO: 4).
  2. 2. Molekula DNA podle nároku 1, která kóduje polypeptid, jehož délka je 150 až 350 aminokyselin.
  3. 3. Molekula DNA podle libovolného z nároků 1 nebo 2, která dále obsahuje nukleotidovou sekvenci SHOX G310 (SEQ ID NO: 3).
  4. 4. Molekula DNA podle libovolného z nároků 1 až 3, která dále obsahuje nukleotidovou sekvenci SHOX G108 (SEQ ID NO: 5).
  5. 5. Molekula DNA podle libovolného z nároků 1 až 4, která dále obsahuje nukleotidovou sekvenci SHOX Va (SEQ ID NO: 6) nebo SHOX Vb (SEQ ID NO: 7) .
  6. 6. Molekula DNA podle libovolného z nároků 1 až 5, která kóduje polypeptid vybraný ze skupina, která zahrnuje:
    a) transkripční faktor A, který má v podstatě aminokyselinovou sekvenci (SEQ ID NO: 11),
    b) transkripční faktor B, který má v podstatě aminokyselinovou sekvenci (SEQ ID NO: 13).
  7. 7. Sekvence DNA podle libovolného z nároků 1 až 6, přičemž DNA je genomová nebo izolovaná DNA odpovědná za regulaci lidského růstu.
    φφ φφ φ φ φ φ Φ· φ · • φφφ φ φ φ φ φ φφ φφ
    ΦΦΦΦ φ
    φφ φφ r φ φ φ » φ φ φ φφφ φφφ
    Φ φ φ φ φ φ
  8. 8. Sekvence DNA podle libovolného z nároků 1 až 6, přičemž DNA je cDNA.
  9. 9. cDNA podle nároku 8, která v podstatě obsahuje nukleotidovou sekvenci SHOXa (SEQ ID NO: 10) nebo SHOXb (SEQ ID NO: 12).
  10. 10. DNA podle nároku 7, která v podstatě obsahuje nukleotidovou sekvenci genu SHOX (SEQ ID NO: 14).
  11. 11. Lidský růstový protein, který má aminokyselinovou sekvenci danou v sekvenci (SEQ ID NO: 11) (transkripční faktor SHOXa), nebo jeho funkční fragment vykazující regulační aktivitu lidského růstu
  12. 12. Lidský růstový protein, který má aminokyselinovou sekvenci danou v sekvenci (SEQ ID NO: 13) (transkripční faktor SHOXb), nebo jeho funkční fragment vykazující regulační aktivitu lidského růstu.
  13. 13. Lidský růstový protein, který má aminokyselinovou sekvenci danou v sekvenci (SEQ ID NO: 16) (transkripční faktor SHOT) , nebo jeho funkční fragment vykazující regulační aktivitu lidského růstu.
  14. 14. cDNA kódující protein, který má aminokyselinovou sekvenci danou v (SEQ ID NO: 11), (SEQ ID NO: 13) nebo (SEQ ID NO: 16).
  15. 15. Farmaceutická kompozice, vyznačuj ící se tím, že obsahuje protein podle libovolného z nároků
    11, 12 nebo 13.
    .)
    99 99 9
    9 9 9 9 9 ·
    9999 9 99« 9
    9 999 999999
    999999 9 9 • 9999 99 » 99 99
    9 9
    9 9
    999 999
  16. 16. Způsob léčby malé výšky vyznačující se tím, že zahrnuje subjektu, je-li to nutné, terapeuticky účinné proteinu podle nároku 11, 12 nebo 13.
    postavy, aplikaci množství
  17. 17. Použití proteinu podle nároku 11, 12 nebo 13 při přípravě farmaceutické kompozice vhodné pro léčbu malé výšky postavy.
  18. 18. Použití sekvence DNA podle libovolného z nároků 1 až 10 nebo 14 nebo jejího fragmentu, která vykazuje regulační aktivitu lidského růstu, při přípravě farmaceutické kompozice pro léčbu vad spojených s mutacemi genu odpovídajícího za malou výšku postavy.
  19. 19. Použití sekvence DNA podle libovolného z nároků 1 až 10 nebo 14 nebo jejího fragmentu, která vykazuje regulační aktivitu lidského růstu, při přípravě kitu pro identifikaci jedinců, kteří mají genetický defekt odpovědný za poškození lidského růstu.
  20. 20. Použití sekvence DNA podle libovolného z nároků 1 až 10 nebo 14 nebo jejího fragmentu, která vykazuje regulační aktivitu lidského růstu, při identifikaci genu odpovědného za malou výšku lidské postavy.
  21. 21. Způsob stanovení malé výšky postavy na základě molekul RNA nebo DNA, vyznačující se tím, že molekula biologického vzorku, který se zkoumá, se amplifikuje v přítomnosti dvou nukleotidových sond komplementárních s libovolnou ze sekvencí DNA uvedených v SEQ ID NO: 2 až SEQ ID NO: 7 a následně se stanoví pomocí vhodného detekčního systému.
    <*
    99 9· 9
    9 9 9 · • 999 9 999
    9 999 9 9 9 9
    9 9 9 9 9
    99999 99 9 ·9
    9 9 9
    9 9 9
  22. 22. Použití způsobu podle nároku 21 při identifikaci osob, které mají genetický defekt odpovědný za malou výšku postavy.
  23. 23. Transgenní zvíře nebo zvíře s deaktivovaným genem, vyznačující se tím, že je transformované genem odpovědným za malou výšku postavy, který obsahuje sekvenci DNA podle libovolného z nároků 1 až 10 nebo 14.
  24. 24. Buňky transformované sekvencí DNA podle libovolného z nároků 1 až 10 nebo 14.
  25. 25. Testovací systém, vyznačující se tím, že je vhodný pro identifikaci nebo testování činidel použitelných při léčbě malé výšky lidské postavy, který zahrnuje buňky podle nároku 24.
  26. 26. Způsob identifikace nebo testování kandidátů farmaceutických činidel použitelných při léčbě vad vztahujících se k mutacím genu odpovídajícího za malou výšku postavy, vyznačující se tím, že zahrnuje testovací systém podle nároku 25 a stanovení změn fenotypu uvedených buněk nebo změn produktů exprese uvedených buněk po té, co se uvedené buňky dostanou do kontaktu s uvedenými kandidáty farmaceutických činidel.
  27. 27. Expresivní vektor, vyznačující se tím, že obsahuje molekulu DNA podle nároků 1 až 10 nebo 14, která je schopna způsobit expresi kódovaného polypeptidu.
  28. 28. Způsob in vivo léčby genovou terapií vad růstu u lidí spojených alespoň s jednou mutací v genu SHOX nebo SHOT, vyznačující se tím, že zahrnuje zavedení expresivního plazmidu do lidských buněk, ve kterém molekula DNA podle libovolného z nároků 1 až 10 nebo 14 je začleněna ve • »· »· · • ·»«
    9 9 9
    99» 9 * »· « • 9 9
    9 9 9
    9 9999
    9» ·» ·
    99
    9 9 9
    9 9 9
    999 999
    9
    99 směru 3'konce polynukleotidu od expresivního promotoru, jenž způsobuje expresi v lidské hostitelské buňce.
  29. 29. Způsob podle nároku 28, vyznačuj ící se tím, zeje vhodný pro léčbu Turnérova syndromu nebo malé výšky postavy.
  30. 30. Použití lidských růstových proteinů nebo jejich funkčních fragmentů, které mají regulační aktivitu lidského růstu, při přípravě léků pro léčbu pacientů, jenž vykazují genetickou mutaci genů lidského růstu SHOX (SEQ ID NO: 8) nebo SHOT (SEQ ID NO: 15) s tou podmínkou, že je vyloučena příprava léků pro léčbu pacientů trpících Turnérovým syndromem.
  31. 31. Použití lidských růstových proteinů nebo jejich funkčních fragmentů, které mají regulační aktivitu lidského růstu, při přípravě léků pro léčbu pacientů, jenž vykazují genetickou mutaci genů lidského růstu SHOX (SEQ ID NO: 8) nebo SHOT (SEQ ID NO: 15) a u nichž se použitím molekul DNA schopných hybridizovat se sekvencí DNA genů lidského růstu SHOX nebo SHOT zjistilo, že mají genetický defekt odpovědný za malou výšku postavy, s tou podmínkou, že je vyloučena příprava léků pro léčbu pacientů trpících Turnérovým syndromem.
  32. 32. Použití podle nároků 30 až 31, kde genetická mutace je způsobena horkým místem mutace v sekvenci DNA kódující bod zkrácení proteinu v pozici aminokyseliny 195 v lidském růstovém genu SHOX.
  33. 33. Použití podle libovolného z nároků 30 až 32, kde lidský růstový protein je lidský růstový hormon.
  34. 34. Způsob léčby pacientů vykazujících vady způsobené mutacemi lidských růstových genů SHOX (SEQ ID NO: 8) nebo SHOT • 44 • 4 4
    444
    4 4 4 4
    44444 4
    4
    44 (SEQ ID NO: 15) , vyznačující se tím, že zahrnuje aplikaci pacientovi, je-li to nutné, farmaceuticky aktivní množství lidského růstového proteinu s tou podmínkou, že se vyloučí léčba pacientů trpících Turnérovým syndromem.
  35. 35. Způsob léčby pacientů vykazujících vady způsobené mutacemi lidských růstových genů SHOX (SEQ ID NO: 8) nebo SHOT (SEQ ID NO: 15) a u nichž se použitím molekul DNA schopných hybridizovat se sekvencí DNA lidských růstových genů SHOX nebo SHOT zjistilo, že mají genetický defekt odpovědný za malou výšku postavy, vyznačující se tím, že zahrnuje aplikaci pacientovi, je-li to nutné, farmaceuticky aktivní množství lidského růstového proteinu s tou podmínkou, že je vyloučena léčba pacientů trpících Turnérovým syndromem.
    • ·« ·· * . ·· ·· · φ φ φ φφφφ φ φ · · φ φφφ « φφ · • φ φφφ φ φφφφ · φφφ φφφ ···«·· · φ
    ΦΦΦ·· φφ « φ» φφ
CZ0096699A 1996-10-01 1997-09-29 Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití CZ297640B6 (cs)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US2763396P 1996-10-01 1996-10-01
EP97100583 1997-01-16
PCT/EP1997/005355 WO1998014568A1 (en) 1996-10-01 1997-09-29 Human growth gene and short stature gene region

Publications (2)

Publication Number Publication Date
CZ96699A3 true CZ96699A3 (cs) 1999-08-11
CZ297640B6 CZ297640B6 (cs) 2007-02-21

Family

ID=26145174

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ0096699A CZ297640B6 (cs) 1996-10-01 1997-09-29 Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití

Country Status (20)

Country Link
US (2) US7252974B2 (cs)
EP (2) EP0946721B1 (cs)
JP (2) JP2000515025A (cs)
KR (1) KR20000048838A (cs)
CN (1) CN1232499A (cs)
AT (1) ATE230026T1 (cs)
AU (1) AU744188C (cs)
BR (1) BR9712185A (cs)
CA (2) CA2267097A1 (cs)
CZ (1) CZ297640B6 (cs)
DE (1) DE69718052T2 (cs)
DK (1) DK0946721T3 (cs)
ES (1) ES2188992T3 (cs)
HU (1) HU225131B1 (cs)
IL (1) IL129015A0 (cs)
NO (1) NO991554L (cs)
NZ (1) NZ334970A (cs)
PL (1) PL194248B1 (cs)
SI (1) SI0946721T1 (cs)
WO (1) WO1998014568A1 (cs)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1169346A4 (en) * 1999-03-19 2003-02-26 Human Genome Sciences Inc 48 HUMAN SECRETED PROTEINS
CA2368469A1 (en) * 1999-03-26 2000-10-05 Craig A. Rosen 50 human secreted proteins
WO2002083921A2 (en) 2001-04-10 2002-10-24 Agensys, Inc. Nuleic acids and corresponding proteins useful in the detection and treatment of various cancers
US7927597B2 (en) 2001-04-10 2011-04-19 Agensys, Inc. Methods to inhibit cell growth
EP1439225A4 (en) 2001-10-04 2005-10-26 Kansai Tech Licensing Org Co DR5-GEN PROMOTER AND SIAH-1-GEN PROMOTER
WO2004062555A2 (en) * 2003-01-13 2004-07-29 Gudrun Rappold-Hoerbrand Use of natriuretic peptides for the treatment of stature disorders related to the shox gene
SG183708A1 (en) 2005-04-15 2012-09-27 Epigenomics Ag Methods and nucleic acids for analyses of cellular proliferative disorders
US7382944B1 (en) 2006-07-14 2008-06-03 The United States Of America As Represented By The Administration Of The National Aeronautics And Space Administration Protective coating and hyperthermal atomic oxygen texturing of optical fibers used for blood glucose monitoring
PL2258871T3 (pl) * 2007-01-19 2014-10-31 Epigenomics Ag Sposoby i kwasy nukleinowe do analizy zaburzeń proliferacyjnych komórki
WO2014182595A1 (en) * 2013-05-06 2014-11-13 Mikko Sofia Diagnostic test for skeletal atavism in horses

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3445933A1 (de) * 1984-12-17 1986-06-19 Röhm GmbH, 6100 Darmstadt Arzneimittel mit diuretischer wirksamkeit
US4983511A (en) * 1989-01-09 1991-01-08 Olin Corporation Method and kit for detecting live microorganisms in chlorine- or bromine-treated water

Also Published As

Publication number Publication date
SI0946721T1 (en) 2003-06-30
IL129015A0 (en) 2000-02-17
AU744188C (en) 2003-07-24
BR9712185A (pt) 1999-08-31
PL194248B1 (pl) 2007-05-31
NO991554D0 (no) 1999-03-30
NZ334970A (en) 2000-12-22
CA2267097A1 (en) 1998-04-09
DK0946721T3 (da) 2003-04-14
CN1232499A (zh) 1999-10-20
US7252974B2 (en) 2007-08-07
EP1260228A2 (en) 2002-11-27
AU744188B2 (en) 2002-02-14
EP0946721A1 (en) 1999-10-06
KR20000048838A (ko) 2000-07-25
DE69718052D1 (de) 2003-01-30
NO991554L (no) 1999-05-14
WO1998014568A1 (en) 1998-04-09
HUP9904175A3 (en) 2002-01-28
US20090111744A1 (en) 2009-04-30
DE69718052T2 (de) 2003-07-31
CZ297640B6 (cs) 2007-02-21
PL332568A1 (en) 1999-09-27
US20030059805A1 (en) 2003-03-27
CA2647169A1 (en) 1998-04-09
EP1260228A3 (en) 2003-03-05
HUP9904175A2 (hu) 2000-04-28
JP2000515025A (ja) 2000-11-14
AU4625297A (en) 1998-04-24
ES2188992T3 (es) 2003-07-01
ATE230026T1 (de) 2003-01-15
HU225131B1 (en) 2006-06-28
EP0946721B1 (en) 2002-12-18
JP2004201692A (ja) 2004-07-22

Similar Documents

Publication Publication Date Title
RU2745324C2 (ru) Композиции и способы модулирования экспрессии tau
AU2021200783B2 (en) Mitigating tissue damage and fibrosis via latent transforming growth factor beta binding protein (LTBP4)
TWI834177B (zh) 用於減少tau表現之組合物及方法
RU2768285C1 (ru) Олигонуклеотиды для модуляции экспрессии тау-белка
CN115181778A (zh) 选择治疗性分子的方法
ES2792126T3 (es) Método de tratamiento basado en polimorfismos del gen KCNQ1
AU744188C (en) Human growth gene and short stature gene region
KR20130123357A (ko) 저산소증과 관련된 질환의 진단방법 및 키트
US6566061B1 (en) Identification of polymorphisms in the PCTG4 region of Xq13
US6262334B1 (en) Human genes and expression products: II
US20160250182A1 (en) Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson&#39;s disease risk
CN111278468A (zh) 用于脂肪营养不良的自体细胞疗法的人脂肪组织祖细胞
CA2348657C (fr) Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
CA2433869C (en) Gene for identifying individuals with familial dysautonomia
Class et al. Patent application title: Human Growth Gene and Short Stature Gene Region Inventors: Gudrun Rappold-Hoerbrand (Heidelberg, DE) Ercole Rao (Riedstadt, DE)
US20160184454A1 (en) Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson&#39;s disease risk
MXPA99002809A (en) Human growth gene and short stature gene region
KR100968360B1 (ko) Her-2 유전자 복제수 변화에 의해 발생되는 유방암의 진단 방법
RU2805557C2 (ru) Варианты b4galt1 и их применение
US20030203380A1 (en) Gene linked to osteoarthritis
CN116606920A (zh) 一种定性分析和定量分析基因rilpl1的试剂盒
CN115362255A (zh) 用无七之子2(sos2)抑制剂治疗眼科疾患
CA2439155A1 (en) Isolated human tumor supressor proteins, nucleic acid molecules encoding these human tumor supressor proteins, and uses thereof
US20020173459A1 (en) Isolated human secreted proteins, nucleic acid molecules encoding human secreted proteins, and uses thereof
JP2002345493A (ja) 新規遺伝子及びそれにコードされる蛋白質

Legal Events

Date Code Title Description
PD00 Pending as of 2000-06-30 in czech republic
MM4A Patent lapsed due to non-payment of fee

Effective date: 20110929