PL194248B1

PL194248B1 - Cząsteczka kwasu nukleinowego kodująca polipeptydy, ludzkie białko wzrostu kodowane przez cząsteczkę DNA, cDNA kodujący ludzkie białko wzrostu, środek farmaceutyczny, zastosowanie ludzkiego białka wzrostu oraz sekwencji DNA, sposób określania niskiego wzrostu, sposób identyfikacji defektu genetycznego, komórki transformowane sekwencją DNA, układ testowy i sposób identyfikacji lub badań przesiewowych, wektor ekspresyjny oraz zastosowanie ludzkichbiałek wzrostu

Info

Publication number: PL194248B1
Application number: PL97332568A
Authority: PL
Inventors: Gudrun Rappold-Hoerbrand; Ercole Rao
Original assignee: Rappold Hoerbrand Gudrun
Priority date: 1996-10-01
Filing date: 1997-09-29
Publication date: 2007-05-31
Also published as: EP1260228A3; DK0946721T3; CA2647169A1; PL332568A1; CZ96699A3; WO1998014568A1; AU744188B2; NO991554D0; KR20000048838A; IL129015A0; AU4625297A; EP0946721B1; US7252974B2; AU744188C; JP2004201692A; NZ334970A; EP1260228A2; DE69718052T2; HUP9904175A2; BR9712185A

Abstract

1. Cz asteczka kwasu nukleinowego koduj aca polipeptydy sk ladaj ace si e z domeny homeoboks z lo zonej z 60 aminokwasów o sekwencji aminokwasów SEQ. ID NO: 1, wykazuj ace dzia lanie regulu- j ace ludzki wzrost oraz zawieraj aca co najmniej jedn a sekwencj e wybran a z grupy obejmuj acej se- kwencj e nukleotydów SHOX ET93 [SEQ. ID NO: 2], sekwencj e nukleotydów SHOX G310 [SEQ. ID NO: 3], sekwencj e nukleotydów SHOX ET45 [SEQ. ID NO: 4], sekwencj e nukleotydów SHOX G108 [SEQ. ID NO: 5], sekwencj e nukleotydów SHOX Va [SEQ. ID NO: 6] i sekwencj e nukleotydów SHOX Vb [SEQ. ID NO: 7]. PL PL PL PL PL PL PL PL PL

Description

Opis wynalazku

Przedmiotem wynalazku są cząsteczka kwasu nukleinowego kodująca polipeptydy, cząsteczka DNA kodująca polipeptyd, ludzkie białko wzrostu kodowane przez cząsteczkę DNA, cDNA kodujący ludzkie białko wzrostu, środek farmaceutyczny, zastosowanie ludzkiego białka wzrostu do wytwarzania środka farmaceutycznego, zastosowanie sekwencji DNA, sposób określania niskiego wzrostu, sposób identyfikacji defektu genetycznego, komórki transformowane sekwencją DNA, układ testowy do identyfikacji lub badań przesiewowych środków farmaceutycznych, przydatnych w leczeniu niskiego wzrostu u człowieka, sposób identyfikacji lub badań przesiewowych potencjalnych środków farmaceutycznych, przydatnych w leczeniu zaburzeń związanych z mutacjami w genie niskiego wzrostu, wektor ekspresyjny zawierający cząsteczkę DNA, zastosowanie ludzkich białek wzrostu, w tym ludzkiego hormonu wzrostu, do wytwarzania leków.

Wyizolowany genomowy DNA lub jego fragmenty można stosować w celach farmaceutycznych albo jako narzędzia lub reagenty diagnostyczne do identyfikacji lub charakteryzacji defektu genetycznego związanego z takimi zaburzeniami. Ludzkie białka wzrostu (czynniki transkrypcyjne A, B i C), eksprymowane po transkrypcji tego DNA w RNA lub mRNA, znajdują zastosowanie w terapii zaburzeń związanych z mutacjami w tych genach. Odpowiednie sekwencje cDNA, stanowiące przedmiot wynalazku, można stosować do wytwarzania zrekombinowanych białek nadających się do leczenia takich zaburzeń. Środki i sposoby według wynalazku znajdują wykorzystanie do genetycznego leczenia takich zaburzeń w dziedzinie medycyny molekularnej z użyciem plazmidu ekspresyjnego wytworzonego przez włączenie DNA według wynalazku poniżej promotora ekspresyjnego, który przeprowadza ekspresję w komórce ssaka-gospodarza.

Wzrost jest jednym z podstawowych aspektów rozwoju organizmu, regulowanym przez wysoce zorganizowany i złożony system. Wzrost jest cechą wieloczynnikową, na którą mają wpływ zarówno czynniki genetyczne, jak i środowiskowe. Zaburzenia rozwojowe dotyczące wzrostu są powszechnymi zjawiskami u ludzi wszystkich ras. Z częstością występowania 3 na 100 opóźnienie wzrostu powodujące niski wzrost odpowiada za dużą część wrodzonych niedoborów spotykanych u ludzi.

Z częstością występowania 1:2500 żywo urodzonych dzieci o fenotypie żeńskim, zespół Turnera jest powszechnym zburzeniem chromosomowym (Rosenfeld i wsp., 1996). Oszacowano, że 1-2% wszystkich zapłodnionych komórek jajowych u człowieka to 45,X i że aż 99% takich płodów nie rodzi się (Hall i Gilchrist, 1990; Robins, 1990). Istnieje znacząca kliniczna zmienność fenotypu osób z zespołem Turnera (lub zespołem Ullricha-Turnera) (Ullrich, 1930; Turner, 1938). Jednak zawsze stwierdza się niski wzrost i uważa się go wraz z dysgenezją gonad za wiodący objaw tego zaburzenia. Zespół Turnera jest prawdziwym zaburzeniem wieloczynnikowym. Zarówno letalność u zarodków, niski wzrost, dysgenezją gonad i charakterystyczne cechy somatyczne są uważane za efekt monosomii genów wspólnych dla chromosomów X i Y. Sugeruje się, że diploidalna dawka tych genów homologicznych na X i Y jest wymagana dla normalnego rozwoju człowieka. Oczekuje się, że geny Turnera (lub geny przeciwdziałające genom Turnera) będą eksprymowane u kobiet z zarówno czynnego i nieczynnego chromosomu X lub chromosomu Y, aby zapewnić prawidłową dawkę produktu genowego. Haploinsuficiencja (niedobór wynikający z tylko jednej czynnej kopii) byłaby więc sugerowanym mechanizmem genetycznym leżącym u podstaw tej choroby.

Dotychczas wyjaśniono różne mechanizmy związane z niskim wzrostem. Niedobory hormonu wzrostu i receptora hormonu wzrostu, jak i zaburzenia szkieletu zostały opisane jako przyczyny fenotypu niskiego wzrostu (Martial i wsp., 1979; Phillips i wsp., 1981; Leung i wsp., 1987; Goddard i wsp., 1995). Niedawno zidentyfikowano mutacje w trzech ludzkich genach kodujących receptor czynnika wzrostu fibroblastów (FGFR 1-3) jako przyczynę różnych zaburzeń szkieletu, przyjmujących najczęstszą postać karłowatości, achondroplazji (Shiang i wsp., 1994; Rousseau i wsp., 1994; Muenke i Schell, 1995). Dobrze znane i częste (1:2500 kobiet) zaburzenie chromosomowe, zespół Turnera (45, X), jest także nieodłącznie związane z niskim wzrostem. Razem wzięte, te wszystkie różne znane przyczyny stanowią wytłumaczenie tylko dla niewielkiej części niskich pacjentów, toteż dotychczas większość przypadków niskiego wzrostu pozostaje niewyjaśniona.

Uważa się, że chromosomy płci X i Y niosą geny wpływające na wzrost (Ogata i Matsuo, 1993). Można to było wydedukować z korelacji genotyp-fenotyp u pacjentów z anomaliami chromosomów płci. Badania cytogenetyczne dostarczyły dowodów, że terminalne delecje krótkich ramion chromosomu X lub Y nieodłącznie prowadzą do niskiego wzrostu u osób, u których to występuje (Zuffardi i wsp., 1982; Curry i wsp., 1984). Doniesiono o ponad 20 przegrupowaniach chromosomów związanych

PL 194 248 B1 z terminalnymi delecjami chromosomu Xp i Yp, które lokalizują gen(y) odpowiedzialne za niski wzrost do regionu pseudoautosomalnego (PAR1) (Ballabio i wsp., 1989; Schaefer i wsp., 1993). Ta lokalizacja została zawężona do najbardziej dystalnych 700 kb DNA regionu PAR1, z markerem flankującym DXYS15 (Ogata i wsp., 1992; 1995).

Regulacja wzrostu u ssaków jest zorganizowana jako złożony system. Można przypuszczać, że liczne geny (białka) sprzyjające wzrostowi oddziałują ze sobą w wysoce zorganizowany sposób. Jeden z takich genów kontrolujących wzrost został wstępnie zmapowany do regionu pseudoautosomalnego PAR1 (Ballabio i wsp., 1989), regionu, o którym wiadomo, że jest swobodnie wymieniany między chromosomami X i Y (patrz Rappold, 1993). Cały region PAR1 ma wielkość około 2700 kb.

Region krytyczny dla niskiego wzrostu zdefiniowano w przypadku pacjentów z delecjami. Niski wzrost jest konsekwencją delecji całego regionu 700 kb lub występuje wtedy, gdy specyficzny gen w obrę bie tego regionu jest obecny w stanie haploidalnym, jest przerwany lub zmutowany (tak jak w przypadku idiotypowego niskiego wzrostu, czy zespoł u Turnera). Czę stość zespoł u Turnera wynosi 1 na 2500 kobiet na całym ś wiecie, częstość idiopatycznego niskiego wzrostu tego typu można ocenić na 1 na 4000-5000 osób. Kobiety z zespołem Turnera i niektóre osoby o niskim wzroście na ogół są leczone w sposób niespecyficzny za pomocą hormonu wzrostu (GH) przez wiele lat aż do ponad dziesięciu, choć dobrze wiadomo, że mają normalne poziomy GH i że niedobór GH nie jest problemem. Leczenie takich pacjentów jest bardzo kosztowne (szacowany koszt około 30000 dolarów USA rocznie). Tak więc istniał problem dostarczenia sposobu i środków do rozróżnienia z jednej strony pacjentów o niskim wzroście, u których występuje defekt genetyczny w odpowiednim genie, a z drugiej strony pacjentów, którzy nie mają żadnego defektu genetycznego w tym genie. Pacjenci z defektem genetycznym w odpowiednim genie - z całkowitą delecją (jak w przypadku zespołu Turnera) lub z mutacją punktową (jak w idiopatycznym niskim wzroście) powinni być podatni na alternatywne terapie bez ludzkiego GH, które można obecnie opracować.

Korelacje genotyp/fenotyp podtrzymują istnienie genu wzrostu w proksymalnej części Yg i dystalnej części Yp. Niski wzrost jest także nieodłącznie wykrywany u osób z terminalnymi delecjami Xp. Niedawno podjęto rozległe poszukiwania pacjentów i pacjentek z częściowymi monosomiami regionu pseudoautosomalnego. Na podstawie korelacji genotyp-fenotyp stwierdzono minimalny wspólny region delecji 700 kb DNA przyległego do telomeru (Ogata i wsp., 1992; Ogata i wsp., 1995). Stwierdzono, że interesujący region jest położony między markerami genetycznymi DKYS20 (3cosPP) i DXYS15 (113D) i wykluczono wszystkie geny-kandydatów dla kontroli wzrostu z regionu PAR1 (np. receptor a hematopoetycznego czynnika wzrostu; CSF2RA) (Gough i wsp., 1992) na podstawie ich fizycznej lokalizacji (Rappold i wsp., 1992). Oznacza to, że geny mieściły się w obrębie delecji 700 kb regionu 2700 kb PAR1.

Niedawno wykryto delecje regionu pseudoautosomalnego (PAR1) chromosomów płci u osób o niskim wzroś cie, a nastę pnie zdefiniowano minimalny region wspólnej delecji o wielkoś ci 700 kb w obrębie PAR1. Analiza DNA pacjentów AK i SS techniką Southerna z użyciem różnych markerów pseudoautosomalnych zidentyfikowała terminalną delecje Xp o wielkości około 700 kb, dystalną w stosunku do DXYS15 (113D) (Ogata i wsp, 1992; Ogata i wsp., 1995).

Region genu odpowiadający za niski wzrost zidentyfikowano jako region około 500 kb, korzystnie około 170 kb w regionie PAR1 chromosomów X i Y. Trzy geny w tym regionie zidentyfikowano jako kandydatów na gen niskiego wzrostu. Geny te nazwano SHOX (także nazywany SHOX93 lub HOX93,

SHOX = short stature homeobox containing gene = gen niskiego wzrostu zawierający sekwencję homeotyczną), pET92 i SHOT (SHOX - like homeobox gene on chromosome three = gen homeotyczny podobny do SHOX na chromosomie trzecim). Gen SHOX, który ma dwa odrębne miejsca składania dające w efekcie dwa warianty (SHOX a i b) jest szczególnie ważny. We wstępnych badaniach możliwa była analiza istotnych części sekwencji nukleotydowej genu niskiego wzrostu (SEQ. ID NO: 8). Odpowiednie egzony lub ich części można było przewidzieć i zidentyfikować (np. egzon I [G310]; egzon II [ET93]; egzon IV [G108]; pET92). Uzyskane informacje o sekwencji można było następnie wykorzystać do zaprojektowania odpowiednich starterów lub sond nukleotydowych, które hybrydyzują z częściami genu SHOX lub z jego fragmentami. Wówczas gen SHOX można wyizolować z zastosowaniem znanych technik. W wyniku dalszej analizy sekwencji DNA genów odpowiedzialnych za niski wzrost możliwe było bardziej precyzyjne określenie sekwencji nukleotydowej egzonów I-V (p. fig. 1-3). Gen SHOX zawiera sekwencję homeoboks (SEQ. ID NO: 1) o około 180 bp (p. fig. 2 i fig. 3), zaczynającą się od nukleotydu kodującego pozycję aminokwasu 176 (E), to znaczy od CAG (440) do GAG (619). Sekwencja homeobox jest identyfikowana jako sekwencja homeoboks-pET93 (SHOX), przy

PL 194 248 B1 czym znaleziono dwie mutacje punktowe u pacjenta niemieckiego (A1) i japońskiego przez badania przesiewowe 250 osobników o idiopatycznym niskim wzroście. Obydwie mutacje punktowe wykryto w identycznych pozycjach i prowadzą one do obcięcia białka w pozycji aminokwasu 195, co sugeruje, że może istnieć „gorące miejsce” mutacji. Ze względu na to, że obie znalezione mutacje, które prowadzą do obciętego białka są w tej samej pozycji, istnieje prawdopodobieństwo, że występuje gorące miejsce rekombinacji w egzonie 4 (G108). Można więc stosować startery specyficzne w stosunku do egzonów tak jak wskazano poniżej, np. GCA CAG CCA ACC ACC TAG (do przodu) lub TGG AAA GGC ATC ATC CGT AAG (odwrotny).

Wymieniony powyżej nowy gen SHOX zawierający homeoboks, który jest zlokalizowany w obrębie regionu 170 kb, ulega alternatywnemu składaniu dając dwa białka o różnych funkcjach. Zastosowano analizę mutacji i sekwencjonowanie DNA dla wykazania, że niski wzrost może być spowodowany przez mutacje w SHOX.

Identyfikacja i klonowanie regionu istotnego dla niskiego wzrostu według wynalazku zostało przeprowadzone w sposób następujący.

Przeprowadzono rozległe badania map fizycznych u 15 osób z częściową monosomią w regionie pseudoautosomalnym (PAR1). Przez korelację wzrostu tych osób z ich punktami pęknięcia w delecji zdefiniowano krytyczny region dla niskiego wzrostu (SS) o wielkości około 700 kb. Region ten następnie sklonowano jako zachodzący na siebie kontig kosmidowy stosując sztuczne chromosomy drożdży (YAC) z PAR1 (Ried i wsp., 1996) i przez kroczenie kosmidami. Aby szukać genów-kandydatów na SS w tym regionie zastosowano różne techniki do regionu około 600 kb między dystalnym końcem kosmidu 56G10 i proksymalnym końcem 51D11. Stosując selekcję cDNA, pułapki na egzony i klonowanie wysp CpG zidentyfikowano dwa nowe geny.

Pozycję regionu istotnego dla niskiego wzrostu można było zawęzić do mniejszego przedziału 170 kb DNA przez scharakteryzowanie trzech dalszych konkretnych niskich osób (GA, AT i RY). Aby precyzyjnie zlokalizować punkty pęknięcia przy przegrupowaniu u tych osób, zastosowano fluorescencyjną hybrydyzację in situ (FISH) na chromosomach metafazowych za pomocą kosmidów z kontigu. Analiza pacjenta GA z terminalną delecją i normalnym wzrostem pozwoliła określić dystalną granicę krytycznego regionu (z punktem pęknięcia w kosmidzie 110E3), a pacjenta AT z inwersją chromosomu X i normalnym wzrostem, granicę proksymalną (z punktem pęknięcia w kosmidzie 34F5). Okazało się, że punkt pęknięcia na chromosomie Y pacjenta RY, z terminalną delecją i niskim wzrostem, także jest zawarty w kosmidzie 34F5, co sugeruje, że ten region zawiera sekwencje predysponujące do przegrupowania chromosomów.

Cały region, ograniczony przez telomer Xp/Yp, został sklonowany jako zestaw zachodzących na siebie kosmidów. Hybrydyzacja fluorescencyjna in situ (FISH) z kosmidami z tego regionu została użyta do badania sześciu pacjentów z przegrupowaniami chromosomu X, trzech z normalnym wzrostem i trzech o niskim wzroście. Korelacje genotyp-fenotyp zawęziły region istotny dla niskiego wzrostu do 270 kb DNA lub nawet mniej, np. 170 kb, zawierający gen lub geny o ważnej roli dla ludzkiego wzrostu. Minimalny zestaw sześciu do ośmiu kosmidów łączących ten region jest obecnie dostępny dla FISH w interfazie i metafazie, dostarczając cennego narzędzia do badań diagnostycznych pacjentów z idiopatycznie niskim wzrostem.

Krótki opis rysunków

Figura 1 przedstawia mapę genową genu SHOX zawierającą pięć egzonów, oznaczonych w sposób nastę pują cy: egzon I: G310, egzon II: ET93, egzon III: ET45, egzon IV: G108 i egzony Va i Vb, przy czym egzony Va i Vb są efektem dwóch różnych miejsc składania genu SHOX. Egzony II i III zawierają sekwencję homeoboks o d ł ugoś ci 180 nukleotydów.

Figury 2 i 3 przedstawiają sekwencję nukleotydów i przewidywaną sekwencją aminokwasów SHOXa i SHOXb.

SHOXa: przewidywany start translacji rozpoczyna się w nukleotydzie 92 z pierwszym kodonem stop (TGA) w ramce w nukleotydach 968-970, co daje otwartą ramkę odczytu 876 bp, która koduje przewidywane białko złożone z 292 aminokwasów (określone odpowiednio jako czynnik transkrypcyjny A lub białko SHOXa). Znajdujący się w ramce 5' kodon stop przy nukleotydzie 4, kodon start i przewidywany kodon terminacyjny stop są wytłuszczone. Homeoboks jest w ramce (począwszy od pozycji aminokwasu 117 (Q) do 176 (E), to znaczy w sekwencji nukleotydowej od CAG do GAG). Pozycje intronów są zaznaczone strzałkami. Dwa przypuszczalne sygnały poliadenylacji w regionie 3' nie ulegającym translacji podkreślono.

PL 194 248 B1

SHOXb: otwarta ramka odczytu 876 bp obejmuje region od A w pierwszej metioninie w nukleotydzie 92 do położonego w ramce kodonu stop przy nukleotydzie 767-769, co daje otwartą ramkę odczytu 675 bp, która koduje przewidywane białko złożone z 225 aminokwasów (określone odpowiednio jako czynnik transkrypcyjny B lub białko SHOXb). Położenia intronów są zaznaczone strzałkami. Egzony I-IV są identyczne jak w SHOXa, egzon V jest specyficzny dla SHOXb. Podkreślono przypuszczalny sygnał poliadenylacji w regionie 3' nie ulegającym translacji.

Figura 4 przedstawia sekwencję nukleotydów i przewidywaną sekwencję aminokwasów SHOT. Przewidywany start translacji rozpoczyna się przy nukleotydzie 43, a pierwszy położony w ramce odczytu kodon stop (TGA) jest w nukleotydach 613-615, co daje otwartą ramkę odczytu 573 bp, która koduje przewidywane białko o 190 aminokwasach (określane odpowiednio jako czynnik transkrypcyjny C lub białko SHOT). Homeoboks jest w ramce (począwszy od pozycji aminokwasu 11 (Q) do 70 (E), to znaczy od CAG do GAG w sekwencji nukleotydowej). Położenie intronów jest zaznaczone strzałkami. Dwa przypuszczalne sygnały poliadenylacji w regionie 3' nie ulegającym translacji podkreślono.

Figura 5 przedstawia organizację egzon/intron ludzkiego genu SHOX i odpowiednie pozycje w sekwencji nukleotydowej.

Krótki opis sekwencji

SEQ. ID NO: 1: sekwencja domeny homeoboks (180 bp) przetłumaczona na sekwencję aminokwasów

SEQ. ID NO: 2: egzon II (ET93) genu SHOX

SEQ. ID NO: 3: egzon I (G310) genu SHOX

SEQ. ID NO: 4: egzon III (ET45) genu SHOX

SEQ. ID NO: 5: egzon IV (G108) genu SHOX

SEQ. ID NO: 6: egzon Va genu SHOX

SEQ. ID NO: 7: egzon Vb genu SHOX

SEQ. ID NO: 8: wstępna sekwencja nukleotydowa genu SHOX

SEQ. ID NO: 9: gen ET92

SEQ. ID NO: 10: sekwencja SHOXa (patrz też fig. 2)

SEQ. ID NO: 11: czynnik transkrypcyjny A (patrz też fig. 2)

SEQ. ID NO: 12: sekwencja SHOXb (patrz też fig. 3)

SEQ. ID NO: 13: czynnik transkrypcyjny B (patrz też fig. 3)

SEQ. ID NO: 14: gen SHOX

SEQ. ID NO: 15: sekwencja SHOT (patrz też fig. 4)

SEQ. ID NO: 16: czynnik transkrypcyjny C (patrz też fig. 4)

W zwią zku z tym, ż e docelowy gen prowadz ą cy do zaburzeń wzrostu u ludzi (czyli region niskiego wzrostu) był nieznany przed wynalazkiem, biologiczne i kliniczne powiązanie pacjentów z tą delecją mogło dać wgląd w funkcję tego genu. W niniejszych badaniach zastosowano hybrydyzację fluorescencyjną in situ (FISH) do badania jąder limfocytów od sześciu pacjentów w metafazie i interfazie. Celem było przebadanie wszystkich kosmidów zestawu zachodzących na siebie kosmidów pod kątem ich przydatności jako sond do FISH i określenie regionów pęknięcia we wszystkich czterech przypadkach i w ten sposób ustalenie minimalnego regionu istotnego dla genu niskiego wzrostu.

Duplikację i delecję genomowego DNA można technicznie ocenić przez starannie kontrolowaną ilościową PCR lub ocenę dawki na filtrach sporządzonych techniką Southerna lub przez zastosowanie RFLP. Jednak szczególnie godną zaufania metodą do rozróżnienia pojedynczej i podwójnej dawki markerów jest FISH, którego zastosowanie kliniczne jest obecnie rutynowe. Podczas gdy dla FISH w interfazie można ocenić samą obecność lub nieobecność markera molekularnego, FISH na chromosomach metafazy może dostarczyć półilościowej miary delecji między kosmidami. Stwierdzono, że delecje około 10 kb (redukcja sygnału o 25%) mogą być nadal wykryte. Jest to o tyle ważne, że praktycznie wszystkie związane z chorobami geny na ludzkim chromosomie X zostały powiązane z wię kszymi i mniejszymi delecjami w zakresie od kilku kilozasad do kilku megazasad DNA (Nelson i wsp., 1995).

Wynalazek dotyczy cząsteczki kwasu nukleinowego kodującej polipeptydy składające się z domeny homeoboks złożonej z 60 aminokwasów o sekwencji aminokwasów SEQ. ID NO: 1 wykazujące działanie regulujące ludzki wzrost oraz zawierającej co najmniej jedną sekwencję wybraną z grupy obejmującej sekwencję nukleotydów SHOX ET93 [SEQ. ID NO: 2], sekwencję nukleotydów SHOX G310 [SEQ. ID NO: 3], sekwencję nukleotydów SHOX ET45 [SEQ. ID NO: 4], sekwencję nukleotydów

PL 194 248 B1

SHOX G108 [SEQ. ID NO: 5], sekwencję nukleotydów SHOX Va [SEQ. ID NO: 6] i sekwencję nukleotydów SHOX Vb [SEQ. ID NO: 7].

Korzystniej cząsteczka DNA według wynalazku koduje polipeptyd o długości 150-350 aminokwasów.

Korzystnie cząsteczka DNA według wynalazku zawiera sekwencję nukleotydów SHOX G310 [SEQ. ID NO: 3].

Korzystnie cząsteczka DNA według wynalazku zawiera sekwencję nukleotydów SHOX G108 [SEQ. ID NO: 5].

Korzystnie cząsteczka DNA według wynalazku zawiera sekwencję nukleotydów SHOXVa [SEQ. ID NO: 6] lub SHOXVb [SEQ. ID NO: 7].

Ponadto wynalazek dotyczy cząsteczki DNA kodującej polipeptyd wybrany z grupy obejmującej:

a) czynnik transkrypcyjny A mający sekwencję aminokwasów [SEQ. ID NO: 11] i

b) czynnik transkrypcyjny B mający sekwencję aminokwasów [SEQ. ID NO: 13].

Korzystnie DNA według wynalazku stanowi genomowy lub wyizolowany DNA odpowiedzialny za regulację ludzkiego wzrostu, a zwłaszcza DNA stanowi sekwencję nukleotydową genu SHOX [SEQ. ID NO: 14].

Korzystnie DNA według wynalazku stanowi cDNA, a zwłaszcza cDNA stanowiący sekwencję nukleotydów SHOXa [SEQ. ID NO: 10] lub SHOXb [SEQ. ID NO: 12].

Ponadto wynalazek dotyczy ludzkiego białka wzrostu kodowanego przez określoną powyżej cząsteczkę DNA albo jego funkcjonalnego fragmentu wykazującego działanie regulujące ludzki wzrost, które cechuje się tym, że ma sekwencję aminokwasów [SEQ. ID NO: 11] (czynnik transkrypcyjny SHOXa).

Ponadto wynalazek dotyczy ludzkiego białka wzrostu kodowanego przez określoną powyżej cząsteczkę DNA albo jego funkcjonalnego fragmentu wykazującego działanie regulujące ludzki wzrost, które cechuje się tym, że ma sekwencję aminokwasów [SEQ. ID NO: 13] (czynnik transkrypcyjny SHOXb).

Ponadto wynalazek dotyczy ludzkiego białka wzrostu kodowanego przez cząsteczkę DNA [SEQ. ID NO: 15] albo jego funkcjonalnego fragmentu wykazującego działanie regulujące ludzki wzrost, które cechuje się tym, że ma sekwencję aminokwasów [SEQ. ID NO: 16] (czynnik transkrypcyjny SHOT).

Ponadto wynalazek dotyczy cDNA kodującego określone powyżej ludzkie białko wzrostu, który cechuje się tym, że białko to ma sekwencję aminokwasów [SEQ. ID NO: 11], [SEQ. ID NO: 13] lub [SEQ. ID NO: 16].

Ponadto wynalazek dotyczy środka farmaceutycznego, którego cechą jest to, że zawiera określone powyżej ludzkie białko wzrostu.

Ponadto wynalazek dotyczy zastosowania określonego powyżej ludzkiego białka wzrostu do wytwarzania środka farmaceutycznego do leczenia niskiego wzrostu.

Ponadto wynalazek dotyczy zastosowania określonej powyżej sekwencji DNA albo jej fragmentu, do wytwarzania środka farmaceutycznego do leczenia zaburzeń związanych z mutacjami genu niskiego wzrostu [genu SHOX] [SEQ. ID NO: 14].

Ponadto wynalazek dotyczy zastosowania określonej powyżej sekwencji DNA albo jej fragmentu, do wytwarzania zastawu do identyfikacji osób z genetycznym defektem odpowiedzialnym za zmniejszony ludzki wzrost.

Ponadto wynalazek dotyczy zastosowania określonej powyżej sekwencji DNA albo jej fragmentu do identyfikacji genu odpowiedzialnego za niski ludzki wzrost.

Ponadto wynalazek dotyczy sposobu określania niskiego wzrostu na podstawie cząsteczek RNA lub DNA, który charakteryzuje się tym, że cząsteczkę z próbki biologicznej, która ma być badana, amplifikuje się w obecności dwóch sond nukleotydowych komplementarnych z którąkolwiek z sekwencji DNA wybranych z [SEQ. ID NO: 2] do [SEQ. ID NO: 7], a następnie cząsteczkę tę wykrywa się za pomocą systemu detekcji wykrywającego amplifikowane kwasy nukleinowe.

Ponadto wynalazek dotyczy sposobu identyfikacji defektu genetycznego w próbce biologicznej pobranej od człowieka podejrzewanego o przenoszenie mutacji genetycznej w genie SHOX, który charakteryzuje się tym, że

a) pobiera się od człowieka próbkę genetyczną zawierającą polinukleotyd;

b) amplifikuje się polinukleotyd z części a) w obecności startera, przy czym ten starter stanowi starter flankujący egzon dla sekwencji nukleotydów egzonu genu SHOX [SEQ. ID NO: 14], przy czym

PL 194 248 B1 sekwencja nukleotydów egzonu hybrydyzuje z polinukleotydową sekwencją [SEQ. ID NO: 14] w następujących ostrych warunkach hybrydyzacji: 0,5 M NaPi o pH 7,2, 7% SDS i 1 mM EDTA w 65°C oraz

c) identyfikuje się produkt amplifikacji polinukleotydu z a) jako oznakę mutacji genetycznej w genie SHOX tego człowieka.

Ponadto wynalazek dotyczy komórek transformowanych określoną powyżej sekwencją DNA.

Ponadto wynalazek dotyczy układu testowego do identyfikacji lub badań przesiewowych środków farmaceutycznych, przydatnych w leczeniu niskiego wzrostu u człowieka, który cechuje się tym, że zawiera określoną powyżej komórkę.

Ponadto wynalazek dotyczy sposobu identyfikacji lub badań przesiewowych potencjalnych środków farmaceutycznych, przydatnych w leczeniu zaburzeń związanych z mutacjami w genie niskiego wzrostu, który charakteryzuje się tym, że stosuje się układ testowy zawierający komórkę transformowaną określoną powyżej sekwencją DNA oraz określa się zmiany w fenotypie tych komórek lub zmiany w produktach ekspresji tych komórek porównując fenotypy tych komórek lub produkty ekspresji tych komórek zarówno przed, jak i po skontaktowaniu tych komórek z potencjalnymi środkami farmaceutycznymi.

Ponadto wynalazek dotyczy wektora ekspresyjnego zawierającego określoną powyżej cząsteczkę DNA, zdolnego do przeprowadzenia ekspresji kodowanego polipeptydu.

Ponadto wynalazek dotyczy zastosowania określonych powyżej ludzkich białek wzrostu albo ich funkcjonalnych fragmentów wykazujących działanie regulujące ludzki wzrost, do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOX [SEQ. ID NO: 14], przy czym korzystnie taka mutacja genetyczna jest spowodowana gorącym miejscem mutacji w sekwencji DNA kodującej skrócenie białka w pozycji aminokwasu 195 w ludzkim genie wzrostu SHOX.

Ponadto wynalazek dotyczy zastosowania ludzkiego hormonu wzrostu do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOX [SEQ. ID NO: 14], z wykluczeniem wytwarzania leków do leczenia pacjentów z zespołem Turnera.

Ponadto wynalazek dotyczy zastosowania określonych powyżej ludzkich białek wzrostu albo ich funkcjonalnych fragmentów wykazujących działanie regulujące ludzki wzrost, do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOT [SEQ. ID NO: 15].

Sekwencje DNA albo ich fragmenty, według wynalazku, stanowią część genów odpowiedzialnych za wzrost u ludzi (lub odpowiednio za niski wzrost w przypadku defektów genetycznych w tych genach). Zidentyfikowano trzy geny odpowiedzialne za ludzki wzrost: SHOX, pET92 i SHOT. Sekwencje DNA lub fragmenty tych genów, jak i odpowiednie sekwencje DNA pełnej długości tych genów mogą być wprowadzone do odpowiedniego wektora i transfekowane do komórek. Gdy takie wektory wprowadza się do komórek w odpowiedni sposób, tak jak są one obecne u zdrowych ludzi, można rozważyć leczenie chorób związanych z niskim wzrostem, np. zespołu Turnera, z zastosowaniem nowoczesnych technik terapii genowej. Tak przykładowo niski wzrost można leczyć przez usunięcie odpowiednich zmutowanych genów wzrostu odpowiedzialnych za niski wzrost. Można także stymulować odpowiednie geny, które kompensują działanie genów odpowiedzialnych za niski wzrost, np. przez wstawienie sekwencji DNA przed, za lub w obrębie genów wzrostu/niskiego wzrostu, aby zwiększyć ekspresję zdrowych alleli. Przez taką modyfikację genową geny wzrostu/niskiego wzrostu ulegają odpowiednio aktywacji lub wyciszeniu. Można to osiągnąć przez wstawienie sekwencji DNA w odpowiednich miejscach w obrębie genu lub w jego sąsiedztwie, tak by te wstawione sekwencje DNA interferowały z genami wzrostu/niskiego wzrostu i w ten sposób aktywowały ich transkrypcję lub jej zapobiegały. Można także rozważyć wprowadzenie elementu regulacyjnego (np. sekwencji promotora) przed tymi genami wzrostu, aby stymulować te geny tak, by stały się one aktywne. Można także rozważyć stymulację odpowiednich sekwencji promotorowych aby nadeksprymować - w przypadku zespołu Turnera - zdrowy czynny allel i skompensować brak drugiego allelu. Modyfikację genów może można zasadniczo osiągnąć przez insercję egzogennych sekwencji DNA do genu wzrostu/niskiego wzrostu za pomocą rekombinacji homologicznej.

Sekwencje DNA według wynalazku można także stosować do transformacji takich sekwencji do zwierząt, takich jak ssaki, poprzez odpowiedni układ wektora. Takie zwierzęta transgeniczne można wówczas stosować do badań in vitro przy selekcjonowaniu lub identyfikacji środków farmaceutycznych, przydatnych w leczeniu chorób związanych z niskim wzrostem. Jeśli zwierzęta reagują pozytywnie na podanie badanego związku lub środka, można rozważyć zastosowanie takiego środka lub związku albo jego pochodnych jako środków farmaceutycznych. Sekwencje DNA według wynalazku można także zastosować w odpowiedni sposób w eksperymentach genetycznych mających na celu

PL 194 248 B1 znalezienie sposobów kompensujących utratę genów odpowiedzialnych za niski wzrost (zwierzęta „knock-out”).

Sekwencje DNA według wynalazku można stosować do transformowania komórek. Komórki te można stosować do identyfikacji środków farmaceutycznych przydatnych w leczeniu chorób związanych z niskim wzrostem lub do selekcjonowania takich związków, lub zbioru związków. W odpowiednim układzie testowym można określić zmiany w fenotypie lub we wzorze ekspresji w tych komórkach, co umożliwia identyfikację interesujących potencjalnych środków w opracowywaniu leków.

Sekwencje DNA według wynalazku można także stosować w projektowaniu odpowiednich starterów, które hybrydyzują z odcinkami genów niskiego wzrostu lub ich fragmentami w warunkach ostrych. Można skonstruować sekwencje odpowiednich starterów, przydatne w diagnostyce ludzi z defektem genetycznym powodującym niski wzrost. W związku z tym należy podkreślić, że dwie wykryte mutacje znajdują się w identycznej pozycji, co sugeruje, że istnieje gorące miejsce dla mutacji.

Na ogół należy rozumieć, że sekwencje DNA według wynalazku obejmują także sekwencje DNA, które są zdegenerowane w stosunku do specyficznych przedstawionych sekwencji, w oparciu o degenerację kodu genetycznego lub które hybrydyzują w ostrych warunkach z konkretnymi przedstawionymi sekwencjami DNA.

W opisanym powyż ej sposobie oznaczania genu lub genów odpowiedzialnych za niski wzrost w biologicznej próbce tkanek ciała lub płynów ustrojowych korzystnie stosuje się znane fachowcom techniki amplifikacji nukleotydów, np. PCR, do detekcji specyficznych sekwencji nukleotydowych, opisane np. przez Mullisa i wsp. 1986, Cold Spring Harbor Symposium Quant. Biol. 51, 262-272 oraz Saiki i wsp., 1988, Science 239, 487-491, które przytacza się tu jako źródła literaturowe. Oznaczane sekwencje nukleotydowe niskiego wzrostu są głównie reprezentowane przez sekwencje SEQ. ID NO: 2 do SEQ. ID NO: 7.

Zasadniczo wszystkie startery i sondy oligonukleotydowe do amplifikacji i detekcji w próbce biologicznej defektu genetycznego odpowiedzialnego za zmniejszony wzrost człowieka nadają się dla amplifikacji docelowej sekwencji związanej z niskim wzrostem. W szczególności odpowiednie pary starterów specyficzne w stosunku do egzonów według wynalazku zamieszczono w tabeli 1. Następnie przeprowadza się odpowiednią detekcję, np. z użyciem znacznika radioaktywnego lub nie radioaktywnego.

T a b e l a 1

Egzon	Starter sensowny	Starter antysensowny	Produkt (bp)	Ta (°C)
5'-I(G310)	SPI	ASP1	194	58
3'-I(G310)	SP2	ASP 2	295	58
II(ET93)	SP3	ASP 3	262	76/72/68
III(ET45)	SP4	ASP 4	120	65
IV(G108)	SP5	ASP 5	154	62
Va(SHOXa)	SP6	ASP 6	265	61

Objaśnienie skrótów starterów

SP 1: ATTTCCAATGGAAAGGCGTAAATAAC

SP2: ACGGCTTTTGTATCCAAGTCTTTTG

SP3: GCCCTGTGCCCTCCGCTCCC

SP4: GGCTCTTCACATCTCTCTCTGCTTC

SP5: CCACACTGACACCTGCTCCCTTTG

SP6: CCCGCAGGTCCAGGCTCAGCTG

ASP1: CGCCTCCGCCGTTACCGTCCTTG

ASP2: CCCTGGAGCCGGCGCGCAAAG

ASP3: CCCCGCCCCCGCCCCCGG

ASP4: CTTCAGGTCCCCCCAGTCCCG

ASP5: CTAGGGATCTTCAGAGGAAGAAAAAG ASP6: GCTGCGCGGCGGGTCAGAGCCCCAG

PL 194 248 B1

Jako cel można także użyć jednoniciowy RNA. Sposoby odwrotnej transkrypcji RNA do cDNA są dobrze znane i opisane w pracy Sambrooka i wsp., Molecular Cloning: A Laboratory Manual, New York, Cold Spring Harbor Laboratory 1989. Alternatywnie, korzystne sposoby odwrotnej transkrypcji obejmują zastosowanie termostabilnych polimeraz DNA wykazujących aktywność RT (odwrotnej transkryptazy).

Technikę opisaną powyżej można także zastosować do selekcji z grupy obejmującej osoby o niskim wzroście tych osób, u których występuje defekt genetyczny, co pozwala w konsekwencji na bardziej specyficzne terapie medyczne.

Czynniki transkrypcyjne A, B i C można stosować jako środki farmaceutyczne. Te czynniki transkrypcyjne inicjują nadal nieznaną kaskadę efektów biologicznych na poziomie molekularnym, dotyczących ludzkiego wzrostu. Te białka lub ich funkcjonalne fragmenty wywołują działanie mitogenne na różne komórki. W szczególności wykazują one działanie osteogenne. Można je stosować w terapii chorób kości, takich jak np. osteoporoza, a szczególnie tych chorób, które dotyczą zaburzeń w regulacji wapnia w kościach.

W uż ytym tu znaczeniu okreś lenie „izolowany” dotyczy wytwarzania oryginalnych pochodnych cząsteczki DNA przez klonowanie. Należy jednak zdawać sobie sprawę, że określenie to nie jest ograniczające i w rzeczywistości wynalazek dotyczy zarówno naturalnie występujących, jak i syntetycznie wytworzonych sekwencji, co jest zrozumiałe dla fachowców.

Cząsteczki DNA według wynalazku można stosować w formach terapii genowej, obejmujących stosowanie plazmidu ekspresyjnego wytworzonego przez włączenie odpowiedniej sekwencji DNA według wynalazku poniżej promotora ekspresyjnego, który przeprowadza ekspresję w komórce ssaka-gospodarza. Odpowiednimi gospodarzami są komórki prokariotyczne lub eukariotyczne. Prokariotycznymi komórkami gospodarza są np. E. coli, Bacillus subtilis itp. Przez transfekcję komórek gospodarza za pomocą replikonów pochodzących od gatunków adaptowalnych do gospodarza, to znaczy plazmidowych wektorów zawierających punkt startu replikacji i sekwencje regulatorowe, takie komórki gospodarza mogą być transfekowane żądanym genem lub cDNA. Do korzystnych należą te wektory, które zawierają sekwencję, która nadaje transfekowanym komórkom właściwość (fenotyp), za pomocą którego mogą być one wybrane. Przykładowo w przypadku E. coli jako gospodarzy zazwyczaj stosuje się szczep E. coli K12, a jako wektory można na ogół stosować plazmidy pBR322 lub pUC. Do przykładowych odpowiednich promotorów dla E. coli jako gospodarzy należą promotor trp, promotor lac lub promotor Ipp. Jeśli jest to pożądane, wydzielanie produktu ekspresji przez błonę komórkową można osiągnąć przez połączenie sekwencji DNA kodującej sekwencję peptydu sygnałowego ze strony powyżej 5' genu. Eukariotyczne komórki gospodarzy obejmują komórki pochodzące od kręgowców lub drożdży itp. Jako komórki gospodarza kręgowca można stosować komórki COS (Cell, 1981, 23: 175-182) lub komórki CHO. Korzystnie można stosować promotory usytuowane 5' powyżej genu, który ma ulec ekspresji i mające sekwencje do składania RNA, poliadenylacji i terminacji transkrypcji.

Czynniki transkrypcyjne A, B i C według wynalazku można stosować do leczenia zaburzeń powodowanych przez mutacje w ludzkich genach wzrostu i można je stosować jako czynniki sprzyjające wzrostowi. Ze względu na polimorfizm znany w przypadku genów eukariotycznych, jeden lub więcej aminokwasów może być zmieniony. Co więcej, jeden lub więcej aminokwasów w polipeptydach może być wydeletowanych lub wstawionych w sekwencji aminokwasów w polipeptydach SEQ. ID NO: 11, 13 i 16. Takie polipeptydy są na ogół okreś lane jako ekwiwalentne polipeptydy, o ile aktywność biologiczna niezmodyfikowanego polipeptydu pozostaje w zasadzie niezmieniona.

Wynalazek ilustrują następujące przykłady.

P r z y k ł a d 1

Pacjenci

Cała szóstka badanych pacjentów miała aberracje chromosomów płci de novo.

CC jest dziewczynką o kariotypie 45,X/46, X psu dic (X) (Xqter > Xp22.3::Xp22.3 > Xqter). Przy ostatnim badaniu w wieku 6 1/2 lat jej wzrost wynosił 114 cm (25-50 percentyl). Wzrost jej matki wynosił 155 cm, ojciec nie był dostępny dla badań. Szczegóły, patrz Henkel i wsp., 1991.

GA jest dziewczynką o kariotypie 46,X der X (3pter > 3p23::Xp22.3 > Xqter). Przy ostatnim badaniu w wieku 17 lat stwierdzono normalny wzrost (159 cm). Wzrost jej matki wynosi 160 cm, a wzrost jej ojca 182 cm. Szczegóły, patrz Kulharya i wsp., 1995.

SS jest dziewczynką o kariotypie 46,X rea(X) (Xqter > Xq26::Xp22.3 > Xq26:). W wieku 11 lat jej wzrost był poniżej 3 percentylu krzywej wzrostu dla dziewczynek japońskich; jej przewidywany

PL 194 248 B1 wzrost w wieku dorosłym (148,5 cm) był poniżej jej docelowego wzrostu (163 cm) i docelowego zakresu (155 do 191 cm). Szczegóły, patrz Ogata i wsp., 1992.

AK jest dziewczynką o kariotypie 46,Xrea(X) (Xqter > Xp22.3::Xp22.3 > Xp21.3:). W wieku 13 lat jej wzrost był poniżej 2 percentylu krzywej wzrostu dla dziewczynek japońskich; jej przewidywany wzrost w wieku dorosłym (142,8 cm) był poniżej jej docelowego wzrostu (155,5 cm) i docelowego zakresu (147,5-163,5 cm). Szczegóły, patrz Ogata i wsp., 1995.

RY: kariotyp pacjenta z pierścieniowym Y jest 46,X,r(Y)/46,Xdic r(Y)/45,X [95:3:2], jak stwierdzono w 100 limfocytach; w wieku 16 lat jego ostateczny wzrost wynosił 148; wzrost wszystkich jego trzech braci jest w normalnym zakresie - odpowiednio 170 cm (16 lat, brat 1), 164 cm (14 lat, brat 2) i 128 cm (9 lat, brat 3). Opóźnienie wzrostu u tego pacjenta jest tak silne, że pasuje także do dodatkowej delecji locus GCY na Yq.

AT: chłopiec z ataksją i inv(X); normalny wzrost 116 cm w wieku 7 lat, wzrost rodziców - odpowiednio 156 cm i 190 cm.

Pacjenci do analizy mutacji

250 osób o idiopatycznym niskim wzroście zbadano pod względem mutacji w SHOXa. Pacjentów wybrano na podstawie następujących kryteriów: wzrost dla wieku chronologicznego był poniżej 3 centyla narodowych standardów wzrostu, minus 2 odchylenia standardowe (SDS); brak jakiejkolwiek choroby przyczynowej, w szczególności normalna waga (długość) dla czasu trwania ciąży, normalne proporcje ciała, brak przewlekłych zaburzeń organicznych, normalne odżywianie, brak zaburzeń psychiatrycznych, brak zaburzenia dysplazyjnego szkieletu, brak niedoboru hormonu tarczycy lub hormonu wzrostu.

Rodzina A

Przypadki 1 i 2 są dziećmi o niskim wzroście niemieckiej rodziny nie spokrewnionej. Chłopiec (przypadek 1) urodził się w 38 tygodniu ciąży po cięciu cesarskim. Waga przy urodzeniu wynosiła 2660 g, długość przy urodzeniu 47 cm. Rozwijał się normalnie, z wyjątkiem wzrostu poniżej normy. Przy badaniu w wieku 6,4 lat był proporcjonalnie mały (106,8 cm, -2,6 SDS) i otyły (22,7 kg), ale poza tym normalny. Jego wiek kostny nie był opóźniony (6 lat), a dysplazję kości wykluczono na podstawie analizy zdjęć rentgenowskich. Poziomy IGF-1 i IGFBP-3, jak i parametry w surowicy czyniły niedobór GH lub hormonu tarczycy nieprawdopodobnym. Dziewczynka (przypadek 2) przyszła na świat po cięciu cesarskim. Waga urodzeniowa wynosiła 2920 g, długość przy urodzeniu 47 cm. Jej rozwój przebiegał normalnie, ale w wieku 12 miesięcy widoczny był niewielki wzrost (długość 67 cm, -3,0 SDS). W wieku 4 lat miała 89,6 cm wzrostu (-3,6 SDS). Nie stwierdzono cech dysmorficznych czy dysproporcji. Nie była otyła (13 kg). Jej wiek kostny wynosił 3,5 lat i wykluczono dysplazję kości. Parametry hormonalne były normalne.

Należy podkreślić, że zarówno chłopiec, jak i dziewczynka rosną na 50 percentylu krzywej wzrostu dla dziewczynek z zespołem Turnera. Matka jest najmniejsza z całej rodziny i ma umiarkowaną dysproporcję dotyczącą proksymalnych części kończyn (142,3 cm, -3,8 SDS). Jedna z jej dwu sióstr (150 cm, -2,5 SDS) i babcia po stronie matki (153 cm, -2,0 SDS) są niskie, bez jakiejkolwiek dysproporcji. Jedna siostra ma normalny wzrost (167 cm, +0,4 SDS). Wzrost ojca wynosi 166 cm (-1,8 SDS), a wzrost dziadka po stronie matki wynosi 165 cm (-1,9 SDS). Drugi pacjent pochodził z rodziny japońskiej i wykazywał identyczną mutację.

P r z y k ł a d 2

Identyfikacja genu niskiego wzrostu

A. Hybrydyzacja in situ

a) Fluorescencyjna hybrydyzacja in situ (FISH)

Przeprowadzono fluorescencyjną hybrydyzację in situ (FISH) z użyciem kosmidów występujących w regionie pseudoautosomalnym Xp/Yp (PAR1). Badania FISH z użyciem kosmidów 64/75cos (LLNLc110H032), E22cos (2e2), F1/14cos (110A7), M1/70cos (110E3), P99F2cos (43C11), P99cos (LLNLc110P2410), B6cosb (1CRFc104H0425), F20cos (34F5), F21cos (ICRFc104G0411), F3cos2 (9E3), F3cos1 (11e6), P117cos (29B11), P6cos1 (ICRFc104P0117), P6cos2 (LLNLc110E0625) i E4cos (15G7) przeprowadzono według opublikowanych metod (Lichter i Cremer, 1992). W skrócie, 1 μg odpowiedniego klonu kosmidowego znakowano biotyną i hybrydyzowano do ludzkich chromosomów metafazowych w warunkach, które tłumią sygnały z repetytywnych sekwencji DNA. Detekcję sygnału hybrydyzacji przeprowadzono stosując awidynę skoniugowaną z FITC. Obrazy FITC wykonywano stosując chłodzony układ kamery sprzężonej z ładunkiem (Photometrics, Tucson, AZ).

PL 194 248 B1

b) Mapowanie fizyczne

Kosmidy pochodziły z bibliotek chromosomów X i Y z Lawrence Livermore National Laboratory i biblioteki chromosomu X z Imperial Cancer Research Fund w Londynie (obecnie Max Planck Institute for Molecular Genetics w Berlinie). Stosując kosmidy dystalne do DXYS15, a mianowicie E4cos, P6cos2, P6cos1, P117cos i F3cos1 można ustalić, że w dalszym ciągu istnieją dwie kopie E4cos, P6cos2, P6cos1 i jedna kopia P117cos i F3cos1. Punkty pęknięcia dla obydwu pacjentów, AK i SS, mapują się na kosmidzie P6cos1, z maksymalną odległością fizyczną 10 kb od siebie. Wywnioskowano, że nienormalne chormosomy X AK i SS mają delecję około 630 kb DNA.

Dalsze kosmidy pochodzą z biblioteki kosmidowej specyficznej dla chromosomu X ICRF (ICRFc104), biblioteki kosmidowej specyficznej dla chromosomu X z Lawrence Livermore (LLNLc110) i biblioteki specyficznej dla chromosomu Y (LLCO3'M'), jak i sporządzonej we własnym zakresie biblioteki kosmidowej pokrywającej cały genom. Kosmidy identyfikowano metodą hybrydyzacji ze wszystkimi znanymi sondami mapującymi się do tego regionu i przez stosowanie całych YACów jako sond. Aby sprawdzić zachodzenie na siebie, stosowano sondy końcowe z kilku kosmidów, gdy zachodzenia na siebie nie można było udowodnić z użyciem znanych sond.

c) Hybrydyzacja metodą Southerna

Analiza metodą Southerna z użyciem różnych markerów pseudoautosomalnych dostarczyła dowodów, że punkt pęknięcia w chromosomie X pacjenta CC leży między DXYS20 (3cosPP) i DXYS60 (U7A) (Henke i wsp. 1991). Aby potwierdzić ten wynik oraz aby sprecyzować lokalizację punktu pęknięcia zastosowano kosmidy 64/75cos, E22cos, F1/14cos, M1/70cos, F2cos, P99F2cos i P99cos jako sondy FISH. Lokalizacja punktu pęknięcia na nienormalnym chromosomie pacjenta CC została określona między kosmidami 64/75cos (jedna kopia) i F1/14cos (dwie kopie) na E22PAC. Pacjent CC o normalnym wzroście w efekcie stracił około 260-290 kb DNA.

Hybrydyzacje metodą Southerna przeprowadzono w warunkach ostrych w buforze Churcha (0,5M NaPi pH 7,2, 7% SDS, 1 mM EDTA) w 65°C i płukano w 40 mM NaPi, 1% SDS w 65°C.

d) Analiza FISH

Biotynylowany DNA kosmidowy (wielkość wstawki 32-45 kb) lub fragmenty kosmidów (10-16 kb) hybrydyzowano do chromosomów metafazowych ze stymulowanych limfocytów pacjentów w warunkach jak opisano poprzednio (Lichter i Cremer, 1992). Hybrydyzowaną sondę wykrywano za pomocą FITC skoniugowanego z awidyną.

e) Amplifikacja PCR

Wszystkie PCR przeprowadzano w objętościach 50 μl zawierających 100 pg - 200 ng matrycy, 20 pmoli każdego startera, 200 μM dNTP (Pharmacia), 1,5 mM MgCl₂, 75 mM Tris/HCl pH 9, 20 mM (NH4)2SO4, 0,01% (wag./obj.) Tween 20 i 2 U polimerazy DNA Goldstar (Eurogentec). Reakcję PCR przeprowadzono w aparacie Thermocycler GeneE (Techne).

f) Amplifikacja egzonów

Cztery pule kosmidów złożonych każdy z czterech lub pięciu klonów z kontigów kosmidowych zastosowano do eksperymentów z amplifikacją egzonów. Kosmidy w każdej puli kosmidowej strawiono częściowo Sau3A. Oczyszczone na żelu frakcje w zakresie wielkości 4-10 kb klonowano w trawionym BamHI wektorze pSPL3B (Burn i wsp., 1995) i stosowano do eksperymentów amplifikacji egzonów, jak opisano uprzednio (Church i wsp., 1994).

g) Sekwencjonowanie genomowe

Sonifikowane fragmenty dwóch kosmidów LLOYNCO3'M'15D10 i LLOYNCO3'M'34F5 subklonowano oddzielnie do wektorów M13mp18. Z każdej biblioteki kosmidowej wybrano co najmniej 1000 łysinek, wypreparowano z nich DNA M13 i poddano sekwencjonowaniu stosując barwniki terminujące, Thermo Sequenase (Amersham) i uniwersalny starter do M13 (MWG-Bio-Tech). Żele poddawano elektroforezie w sekwenserach ABI-377 i dane gromadzono i edytowano z zastosowaniem programu GAP4 (Staden).

Spośród wszystkich sześciu pacjentów GA miał najsłabiej scharakteryzowany punkt pęknięcia chromosomu. Najbardziej dystalnymi markerami, których obecność lub brak badano na X, były DXS1060 i DXS996, które mapują się około 6 Mb od telomeru (Nelson i wsp., 1995). Przebadano kilka różnych kosmidów zawierających różne sekwencje genów z obrębu PAR1 (MIC2, ANT3, CSF2RA i XE7) i wszystkie były obecne na kosmidach chromosomu z translokacją w regionie decydującym o niskim wzroście, np. w chromosomie i w ten sposób zlokalizowano punkt pęknięcia translokacji na kosmidzie M1/70cos. Ilościowe porównanie intensywności sygnałów M1/70cos między normalnymi i przegrupowanymi X wskazuje, że około 70% tego kosmidu uległo delecji.

PL 194 248 B1

T a b e l a 2

	CC	GA	AK	SS
64/75cos	-	-
E22cos	-	-
F1/14cos	+	-
M1/70cos	+	(+)
F2cos	+	+
P99F2cos	+	+
P99cos	+	+
B6cos		+
F20cos
F21cos
F3cos2
F3cos1			-	-
P17cos			-	-
P6cos1			+	+
P6cos2			+	+
E4cos			+	+

Tabela ta podsumowuje dane z FISH dla 16 zbadanych kosmidów od czterech pacjentów:

[-] jedna kopia; wskazuje, że odpowiedni kontrolny kosmid uległ delecji na przegrupowanym X, ale był obecny na normalnym chromosomie X;

[+] dwie kopie; wskazuje, że odpowiedni kosmid jest obecny zarówno na przegrupowanym, jak i na normalnym chromosomie X;

[(+)] punkt pęknięcia; wskazuje, że punkt pęknięcia jest obecny w obrębie kosmidu, jak wykazano za pomocą FISH

Podsumowując, analiza molekularna sześciu pacjentów z przegrupowaniami chromosomu X z uż yciem znakowanych fluorescencyjnie sond kosmidowych i hybrydyzacji in situ wskazuje, ż e region krytyczny dla niskiego wzrostu można zawęzić do przedziału 270 kb ograniczonego przez punkt pęknięcia pacjenta GA z dystalnej strony centromeru i pacjentów AK i SS z proksymalnej strony centromeru.

Korelacje genotyp-fenotyp mogą dostarczyć informacji, toteż wybrano je, aby określić przedział krytyczny dla niskiego wzrostu na ludzkim chromosomie X i Y. W badaniach analizę FISH zastosowano do zbadania rozmazów metafazowych i jąder interfazowych limfocytów pacjentów niosących delecje i translokacje w chromosomie X i punkty pęknięcia w obrębie Xp22.3. Okazało się, że te punkty pęknięcia są skupione u dwóch z czterech pacjentów (AK i SS) przypuszczalnie ze względu na obecność sekwencji predysponujących do przegrupowania chromosomowego. U pacjenta znaleziono dodatkowy pierścień Y z przerwą w krytycznym regionie 270 kb, w ten sposób zmniejszając krytyczny przedział do regionu 170 kb.

Wykorzystując korelację wzrostu wszystkich sześciu osób z ich punktem pęknięcia w delecji do regionu pseudoautosomalnego zmapowano przedział 170 kb, którego obecność lub brak ma znaczący wpływ na wzrost. Przedział ten jest ograniczony dystalnie przez chromosomalny punkt pęknięcia X pacjenta GA w odległości 340 kb od telomeru (Xptel) oraz proksymalnie przez punkty pęknięcia pacjentów AT i RY przy 510/520 kb Xptel.

Takie przyporządkowanie stanowi znaczne zmniejszenie krytycznego przedziału do prawie jednej czwartej jego poprzednio ustalonej wielkości (Ogata i wsp., 1992; Ogata i wsp., 1995). Mały zestaw sześciu do ośmiu kosmidów jest obecnie dostępny dla doświadczeń FISH, aby badać rozpowszechnienie i znaczenie tego locus genomowego na dużej serii pacjentów o idiopatycznym niskim wzroście.

PL 194 248 B1

B. Identyfikacja genu-kandydata odpowiedzialnego za niski wzrost

Poszukując jednostek transkrypcyjnych w najmniejszym regionie krytycznym 170 kb, zastosowano pułapki na egzony i selekcję cDNA na sześciu kosmidach (110E3, F2cos, 43C11, P2410, 15D10, 34F5). Wyizolowano trzy różne dodatnie klony (ET93, ET45 i G108) za pomocą pułapki na egzony; wszystkie mapowały się w kosmidzie 34F5. Uprzednie badania z zastosowaniem protokołów selekcji i nadmiaru 25 różnych bibliotek cDNA były bezowocne, co sugeruje, że geny w tym przedziale są eksprymowane na bardzo niskim poziomie.

Aby stwierdzić, czy jakiś gen tego przedziału nie został przeoczony, ustalono sekwencję nukleotydową regionu około 140 kb z tego regionu PAR1, stosując metodę losową z M13 i chemię barwnych terminatorów. Kosmidy do analizy sekwencji zostały wybrane tak, aby w minimalnym stopniu zachodziły na siebie i aby łącznie pokrywały krytyczny przedział. Przeprowadzono analizę sekwencji DNA i następne przewidywania białek za pomocą programu „X Grail” wersja 1.3c, a także za pomocą programu łapiącego egzony FEXHB i potwierdziły one wszystkie 3 uprzednio sklonowane egzony. Nie można było wykryć żadnych genów kodujących białka, innych niż uprzednio wyizolowane.

C. Izolowanie kandydata na gen niskiego wzrostu SHOX

Przyjmując, że wszystkie klony egzonowe, ET93, ET45 i G108 są częścią tego samego genu, zastosowano je łącznie jako sondy do przebadania 14 różnych bibliotek cDNA z 12 różnych tkanek płodowych (płuco, wątroba, mózg 1 i 2) i dorosłych (jajnik, łożysko 1 i 2, fibroblast, mięśnie szkieletowe, szpik kostny, mózg, pień mózgu, podwzgórze, przysadka). Nie wykryto ani jednego klonu spośród około 14 milionów wysianych na płytkach. Aby wyizolować transkrypt pełnej długości przeprowadzono 3' i 5' RACE. Dla 3' RACE zastosowano startery z egzonu G108 na RNA z łożyska, mięśni szkieletowych, fibroblastów szpiku kostnego, tkanek, w przypadku których stwierdzono, że G108 ulega ekspresji. Uzyskano dwa różne klony 3' RACE o wielkości 1173 i 652 bp ze wszystkich trzech tkanek co sugeruje, że istnieją dwa różne 3' egzony a i b. Dwie różne formy nazwano SHOXa i SHOXb.

Aby zwiększyć szansę wyizolowania całej 5' części genu, o którym wiadomo, że ulega ekspresji na niskim poziomie, poddano linię komórek HeLa działaniu kwasu retinowego i estru forbolowego PMA. RNA z takiej zaindukowanej linii komórkowej i RNA z łożyska i mięśni szkieletowych zastosowano do konstrukcji „bibliotek cDNA Marathon”. Wyizolowano identyczne klony 5' RACE cDNA ze wszystkich trzech tkanek.

Procedura doświadczalna

RT-PCR i konstrukcja biblioteki cDNA

Ludzki poliA⁺RNA z serca, trzustki, mięśni szkieletowych, nerek płodowych i wątroby nabyto od Clontech. Całkowity RNA wyizolowano z linii komórkowej fibroblastów szpiku kostnego za pomocą odczynnika TRLZOL (Gibco-BRL) według opisu producenta. Syntezę pierwszej nici cDNA wykonano z użyciem zestawu do syntezy pierwszej nici cDNA Superscript (Gibco-BRL) stosując 100 ng poliA+RNA lub 10 μg całkowitego RNA, z użyciem startera oligo(dt)adaptorowego (GGCCACGCGTCGACTAGTAC[dT]20N. Po syntezie pierwszej nici cDNA mieszaninę reakcyjną rozcieńczono 1/10. Dla dalszych eksperymentów PCR stosowano 5 μΐ tej rozcieńczonej mieszanki.

Skonstruowano „bibliotekę cDNA Marathon” z poliA⁺RNA z mięśni szkieletowych i łożyska z użyciem zestawu do amplifikacji cDNA Marathon (Clontech) według opisu producenta.

Biblioteki cDNA z mózgu płodowego (nr katalogowy HL5015b), płuca płodowego (HL3022a), jajnika (HL1098a), przysadki (HL1097v) i podwzgórza (HL1172b) nabyto od Clontech. Biblioteki cDNA mózgu, nerki, wątroby i płuc były częścią panelu bibliotek cDNA do szybkich badań przesiewowych (Clontech). Bibliotekę cDNA z mięśni płodowych uzyskano z UK Human Genome Mapping Project Resource Center.

D. Analiza sekwencji i budowa genu SHOX

Sekwencję najwyższej zgodności SHOXa i SHOXb (1349 i 1870 bp) zebrano na podstawie analizy sekwencji klonów pochodzących z 5' i 3' RACE. Zidentyfikowano pojedynczą otwartą ramkę odczytu 1870 bp (SHOXa) i 1349 bp (SHOXb), co daje dwa białka z 292 (SHOXa) i 225 (SHOXb) aminokwasów. Obydwa transkrypty a i b mają wspólny 5' koniec, ale mają inny 3' egzon, co sugeruje wykorzystywanie różnych sygnałów składania.

Uzyskano całkowite dopasowanie między dwoma cDNA i z sekwencjonowanym genomowym DNA z kosmidów LLOYNCO3M15D10 i LLOYNC3M34F5, co pozwala na ustalenie budowy egzon-intron (fig. 4). Gen składa się z 6 egzonów o wielkościach od 58 bp (egzon III) do 1146 bp (egzon Va). Egzon I zawiera wyspę CpG, kodon start i region 5'. Kodon stop, jak i region 3'-niekodujący jest położony w każdym z alternatywnie składanych egzonów Va i Vb.

PL 194 248 B1

P r z y k ł a d 3

Zidentyfikowano dwa cDNA, które mapują się do regionu 160 kb zidentyfikowanego jako krytyczny dla niskiego wzrostu. Te cDNA odpowiadają genom SHOX i pET92. cDNA zidentyfikowano przez hybrydyzację subklonów kosmidów do bibliotek cDNA.

Użycie zestawu kosmidów z całkowitym pokryciem krytycznego regionu dostarczyło obecnie materiału genetycznego do identyfikacji odpowiedzialnego genu. Projekty klonowania pozycyjnego mające na celu izolację genów z tego regionu przeprowadzono za pomocą pułapek na egzony i technik selekcji cDNA. Ze względu na ich lokalizację w obrębie regionu pseudoautosomalnego można założyć, że geny te uciekają przed X-inaktywacją i wywierają efekt zależny od dawki genu.

Klonowanie genu prowadzącego do niskiego wzrostu, gdy jest on nieobecny (haploidalny) lub występuje jego niedobór, stanowi kolejny krok naprzód w dokładności diagnozy i stanowi podstawę do analizy mutacyjnej w obrębie genu, np. w oparciu o polimorfizm konformacji pojedynczych nici (SSCP). Dodatkowo, klonowanie tego genu i jego dalsza biochemiczna charakterystyka otworzyły drogę dla głębszego zrozumienia procesów biologicznych związanych z kontrolą wzrostu.

Sekwencje DNA według wynalazku umożliwiają wykonanie pierwszego molekularnego testu w celu identyfikacji osób ze specyficznym zaburzeniem genetycznym w obrę bie zł o ż onej heterogennej grupy pacjentów o idiopatycznym niskim wzroście.

P r z y k ł a d 4

Wzory ekspresji SHOXa i SHOXb

Analiza metodą Northern z użyciem pojedynczych egzonów jako sond do hybrydyzacji wykazała inny profil ekspresji dla każdego egzonu, co wyraźnie sugeruje, że prążki o różnych wielkościach i intensywnoś ciach stanowią produkty hybrydyzacji krzyż owej do innych sekwencji genów bogatych w G, C. Aby uzyskać bardziej realny profil ekspresji obu genów SHOXa i b, przeprowadzono doświadczenia z RT-PCR dla RNA z różnych tkanek. Podczas gdy obserwowano ekspresję SHOXa w mięśniach szkieletowych, łożysku, trzustce, sercu i fibroblastach szpiku kostnego, ekspresja SHOXb była ograniczona do nerek płodowych, mięśni szkieletowych i fibroblastów szpiku kostnego, ze zdecydowanie najwyższą ekspresją w fibroblastach szpiku kostnego.

Ekspresja SHOXa w kilku bibliotekach cDNA sporządzonych z płodowego mózgu, płuca i mięśni oraz z dorosłego mózgu, płuca i przysadki, a także brak ekspresji SHOXb we wszystkich badanych bibliotekach stanowi dodatkowy dowód, że jedna forma składana (SHOXa) jest szerzej eksprymowana i ż e druga (SHOXb) jest eksprymowana przede wszystkim w sposób specyficzny tkankowo.

Aby ocenić aktywność transkrypcyjną SHOXa i SHOXb na chromosomie X i Y zastosowano RT-PCR RNA wyekstrahowanego z różnych linii komórkowych zawierających czynny X, nieczynny X lub chromosom Y, jako jedyne ludzkie chromosomy. Wszystkie linie komórkowe wykazywały produkt amplifikacji o spodziewanej długości 119 bp (SHOXa) i 541 bp (SHOXb), co dostarcza jasnych dowodów, że oba SHOXa i b uciekają przed inaktywacją X.

SHOXa i SHOXb kodują nowe białka z homeodomenami. SHOX jest wysoce konserwowany u gatunków od ssaków do ryb i much. Sam 5' koniec i 3' koniec oprócz homeodomeny są prawdopodobnie konserwowanymi regionami między człowiekiem a myszą, co sugeruje ich znaczenie funkcjonalne. W czasie ewolucji nie nagromadziły się różnice w tych regionach w sekwencji aminokwasów między człowiekiem i myszą.

Procedura eksperymentalna

a) 5' i 3' RACE

Aby sklonować 5' koniec transkryptów SHOXa i b przeprowadzono 5'RACE stosując skonstruowane „biblioteki cDNA Marathon”. Stosowano następujące startery oligonukleotydowe: SHOX B rev, GAAAGGCATCCGTAAGGCTCCC (pozycja 697-718, odwrotna nić [r]) i starter adaptorowy AP1. Przeprowadzono PCR stosując parametry typu „touchdown”: 94°C przez 2 min, 94°C przez 30 s, 70°C przez 30 s, 72°C przez 2 min przez 5 cykli, 94°C przez 30 s, 66°C przez 30 s, 72°C przez 2 min przez 5 cykli, 94°C przez 30 s, 62°C przez 30 s, 72°C przez 2 min przez 25 cykli. Przeprowadzono drugą rundę amplifikacji stosując 1/100 produktu PCR i następujące zakotwiczone startery oligonukleotydowe: SHOX A rev, GACGCCTTTATGCATCTGATTCTC (pozycje 617-640 r) i starter adaptorowy AP2. PCR przeprowadzono przez 35 cykli z temperaturą hybrydyzacji 60°C.

Aby sklonować 3' koniec transkryptów SHOXa i b przeprowadzono 3' RACE jak opisano uprzednio (Frohman i wsp., 1988) stosując startery adaptorowe oligo(dT) do syntezy pierwszej nici cDNA. Stosowano następujące startery oligonukleotydowe: SHOX A for, GAATCAGATGCATAAAGGCGTC (pozycje 619-640) i adaptor oligo(dT). PCR przeprowadzono stosując następujące paraPL 194 248 B1 metry: 94°C przez 2 min, 94°C przez 30 s, 62°C przez 30 s, 72°C przez 2 min przez 35 cykli. Przeprowadzono drugą rundę amplifikacji stosując 1/100 produktu PCR i następujące zakotwiczone startery oligonukleotydowe SHOX B for, GGGAGCCTTCACGGATGCCTTTC (pozycje 697-718) i adaptor oligo(dT). PCR przeprowadzono przez 35 cykli z temperaturą hy brydyzacji 62°C.

Aby potwierdzić sekwencje transkryptów SHOXa i SHOXb przeprowadzono PCR ze starterem oligonukleotydowym 5' i starterem oligonukleotydowym 3'. Dla SHOXa stosowano następujące startery: G310 for, AGCCCCGGCTGCTCGCCAGC (pozycje 59-78) i SHOX D rev, CTGCGCGGCGGGTCAGAGCCCCAG (pozycje 959-982 r). Dla SHOX b stosowano następujące startery: G310 for, AGCCCCGGCTGCTCGCCAGC i SHOX2A rev, GCCTCAGCAGCAAAGCAAGATCCC (pozycje 1215-1238 r). Oba PCR przeprowadzono stosując parametry typu „touchdown”: 94°C przez 2 min, 94°C przez 30 s, 70°C przez 30 s, 72°C przez 2 min przez 5 cykli, 94°C przez 30 s, 68°C przez 30 s, 72°C przez 2 min przez 5 cykli, 94°C przez 30 s, 65°C przez 30 s, 72°C przez 2 min przez 30 cykli. Produkty oczyszczono na żelu i sklonowano do analizy sekwencji.

b) Analiza SSCP

Przeprowadzono analizę SSCP na genomowym zamplifikowanym DNA od pacjentów według uprzednio opisanej metody (Orita i wsp., 1989). Zmieszano 1-5 μΐ produktów PCR z 5 μΐ roztworu denaturującego zawierającego 95% formamidu i 10 mM EDTA pH 8 i prowadzono denaturację w 95°C przez 10 minut. Próbki natychmiast oziębiano w lodzie i nakładano na 10% żel poliakryloamidowy (akryloamid:bisakryloamid = 37,5:1 i 29:1; Multislotgel, TGGE base, Quiagen) zawierający 2% gliceryny i 1 x TBE. Elektroforezę prowadzono w 15°C przy 500 V przez 3-5 godzin i barwiono srebrem jak opisano w instrukcji TGGE (Quiagen, 1993).

c) Klonowanie i sekwencjonowanie produktów PCR

Produkty PCR klonowano do pMOSBlue stosując zestaw do wektora pMOSBlueT z Amersham. Nocne hodowle pojedynczych kolonii lizowano w 100 μl H₂O przez gotowanie przez 10 minut. Lizaty stosowano jako matryce do PCR z starterami specyficznymi dla sklonowanych produktów PCR. SSCP produktów PCR pozwoliło na identyfikację klonów zawierających różne allele. Klony sekwencjonowano za pomocą znakowanych CY5 starterów do wektora Uni i T7, metodą cyklicznego sekwencjonowania opisaną przez producenta (zestaw ThermoSequenase Kit) (Amersham) stosując automatyczny sekwenser ALF (Pharmiacia).

d) Przeszukiwanie za pomocą PCR bibliotek cDNA

Aby wykryć ekspresję SHOXa i b, przeprowadzono przeszukiwanie kilku bibliotek cDNA i pierwszej nici cDNA za pomocą PCR z zastosowaniem starterów specyficznych dla SHOXa i b. Dla bibliotek cDNA stosowano równoważnik DNA 5 x 10⁸ pfu. Dla SHOXa stosowano startery SHOX E rev, GCTGAGCCTGGACCTGTTGGAAAGG (pozycje 713-737 r) i SHOX a for. Dla SHOXb zastosowano następujące startery: SHOX B for i SHOX2A rev. Obie reakcje PCR przeprowadzono stosując warunki „touchdown”. 94°C przez 2 min, 94°C przez 30 s, 68°C przez 30 s, 72°C przez 40 s, przez 5 cykli, 94°C przez 30 s, 65°C przez 30 s, 72°C przez 40 s, przez 5 cykli, 94°C przez 30 s, 62°C przez 30 s, 72°C przez 40 s, przez 35 cykli.

e) Przeszukiwanie bibliotek cDNA za pomocą PCR

Aby wykryć ekspresję SHOXa i b, przeprowadzono badania przesiewowe kilku bibliotek cDNA i pierwszej nici, za pomocą PCR z zastosowaniem starterów specyficznych dla SHOXa i b. Dla SHOXa zastosowano startery SHOXE rev, GCTGAGCCTGGACCTGTTGGAAAGG (pozycja 713-737 r) i SHOX a for. Dla SHOXb zastosowano następujące startery: SHOX B for i SHOX2A rev. Obie reakcje PCR przeprowadzono stosując parametry „touchdown”. 94°C przez 2 min, 94°C przez 30 s, 68°C przez 30 s, 72°C przez 40 s, przez 5 cykli, 94°C przez 30 s, 65°C przez 30 s, 72°C przez 40 s, przez 5 cykli, 94°C przez 30 s, 62°C przez 30 s, 72°C przez 40 s, przez 35 cykli.

P r z y k ł a d 5

Wzory ekspresji OG12, przypuszczalnego mysiego homologa SHOX i SHOT

Przeprowadzono hybrydyzację in situ na zarodkach myszy od 5 dni po zapłodnieniu do 18,5 dni po zapłodnieniu, jak i na płodach i nowonarodzonych zwierzętach, w celu ustalenia wzoru ekspresji. Ekspresję stwierdzono w rozwijających się zawiązkach kończyn, w mezodermie wyrostków nosowych, które mają udział w tworzeniu nosa i podniebienia, w powiece, w aorcie, w rozwijających się gonadach żeńskich, w rozwijającej się strunie grzbietowej (ograniczone do rozwijających się neuronów motorycznych) i w mózgu. W oparciu o ten wzór ekspresji i pozycję mapową jego ludzkiego homologu SHOT, można przyjąć, że SHOT stanowi prawdopodobnego kandydata dla zespołu Cornelia de Lange, który obejmuje niski wzrost.

PL 194 248 B1

P r z y k ł a d 6

Izolowanie nowego genu homeotycznego podobnego do SHOX na chromosomie 3 genu SHOT związanego z wzrostem/niskim wzrostem człowieka

Wyizolowano nowy gen u ludzi, nazwany SHOT (od SHOX - homolog on chromosome three - homolog SHOX na chromosomie trzecim). Gen ten wykazuje najwyż szą homologię do mysiego genu OG12 i ludzkiego genu SHOX. Ludzki gen SHOT i mysi gen OG12 są w wysokim stopniu homologiczne, z identycznością 99% na poziomie białka. Choć nie jest to jeszcze udowodnione, ze względu na uderzającą homologię między SHOT i SHOX (identyczność wyłącznie w regionie homeodomeny) jest prawdopodobne, że SHOT jest również genem związanym z niskim wzrostem lub z wzrostem człowieka.

SHOT wyizolowano z zastosowaniem starterów z dwóch nowych ludzkich EST (HS 1224703 i HS 126759) z bazy danych EMBL, w celu amplifikacji poddanego odwrotnej transkrypcji RNA z linii fibroblastów szpiku kostnego (Rao i wsp., 1997). 5' i 3' końce SHOT wygenerowano za pomocą RACE-PCR z biblioteki fibroblastów szpiku kostnego, która została zamplifikowana według Rao i wsp., 1997. SHOT zmapowano za pomocą analizy FISH do chromosomu 3q25/q26, a mysi homolog do syntenicznego regionu na mysim chromosomie 3. W oparciu o wzór ekspresji swego mysiego homologa OG12, SHOT jest kandydatem na zespół Cornelia Lange (który wykazuje niski wzrost i inne cechy, w tym anomalie twarzoczaszki) zmapowanym do tego przedziału chromosomowego w 3q25/26.

P r z y k ł a d 7

Poszukiwanie mutacji u pacjentów o idiopatycznym niskim wzroście

Sekwencje DNA według wynalazku stosuje się w PCR, LCR i innych znanych technikach, aby ustalić, czy takie osoby o niskim wzroście mają małe delecje lub mutacje punktowe w genie niskiego wzrostu.

Przebadano początkowo 91 (łącznie 250 osób) nie spokrewnionych pacjentów i pacjentek o idiopatycznym niskim wzroście (szacowana częstość występowania idiopatycznego niskiego wzrostu w populacji wynosi 2-2,5%) pod kątem występowania przegrupowania lub niewielkich mutacji punktowych w genie SHOXa. Zaprojektowano sześć zestawów starterów do PCR, nie tylko do amplifikacji pojedynczych egzonów, ale także sekwencji flankujących egzon i niewielkiej części 5'UTR. Dla największego egzonu, egzonu pierwszego, wygenerowano dwa dodatkowe startery wewnętrznych egzonów. Startery stosowane do PCR przedstawiono w tabeli 2.

Zbadano polimorfizm konformacji pojedynczych nici (SSCP) wszystkich zamplifikowanych egzonów o wielkości od 120 do 295 bp. Stwierdzono zmiany w ruchliwości prążków tylko u 2 osób o niskim wzroście (Y91 i A1). Fragmenty, które dały zmienione wzory SSCP (unikatowe konformery SSCP) sklonowano i poddano sekwencjonowaniu. Aby uniknąć artefaktów PCR i sekwencjonowania, przeprowadzono sekwencjonowanie na dwóch niciach stosując dwie niezależne reakcje PCR. Mutacja u pacjenta Y91 leż y 28 bp w stronę 5' od kodonu start w 5'UTR i obejmuje podstawienie cytydyny przez guaninę. Aby stwierdzić, czy ta mutacja stanowi rzadki polimorfizm, czy jest odpowiedzialna za fenotyp przez regulację ekspresji genu, np. przez słabsze wiązanie czynników inicjacji translacji, przebadano rodziców i jedną siostrę pacjenta. Ponieważ zarówno siostra, jak i ojciec o normalnym wzroście wykazują ten sam wariant SSCP (danych nie przedstawiono), takie podstawienie zasady jest rzadkim polimorfizmem, nie związanym z fenotypem.

Klonowanie i sekwencjonowanie unikatowego konformera SSCP dla pacjenta A1 wykazało przejście cytydyny do tymidyny (nukleotyd 674), która wprowadza kodon terminacyjny w pozycji aminokwasu 195 w przewidywanych sekwencjach odpowiednio z 225 i 292 aminokwasów. Aby ustalić, czy ta mutacja typu nonsens jest genetycznie związana z niskim wzrostem w tej rodzinie, przeprowadzono analizę rodowodu. Stwierdzono, że wszystkie sześć niskich osób (zdefiniowanych jako wzrost poniżej dwóch odchyleń standardowych) wykazywało zaburzenie w SSCP i przejście cytydyny w tymidynę. Ani ojciec, ani jedna ciotka i dziadek od strony matki z normalnym wzrostem nie wykazywali tej mutacji, co wskazywało, że babka przekazała zmutowany allel dwóm swoim córkom i dwóm wnukom. Tak więc, występuje zgodność między obecnością zmutowanego allelu i fenotypem niskiego wzrostu w tej rodzinie. Identyczną sytuację jak opisana powyż ej wykryto u innego pacjenta o niskim wzro ście z rodziny japoń skiej.

P r z y k ł a d 8

Sekwencje DNA według wynalazku stosuje się do charakterystyki funkcji genu lub genów. Sekwencje DNA można stosować do przeszukania baz danych sekwencji kwasów nukleinowych lub aminokwasów w celu identyfikacji spokrewnionych genów lub produktów genów. Częściową sekwencję aminokwasów SHOK93 zastosowano do przeszukiwania baz danych aminokwasów. Poszukiwania

PL 194 248 B1 wykazały bardzo wysoką homologię do wielu znanych białek homeotycznych. Sekwencje cDNA według wynalazku mogą być zastosowane do wytworzenia peptydu techniką rekombinacji. Różne systemy ekspresji znane fachowcom można zastosować do wytwarzania zrekombinowanych białek.

Z zastosowaniem znanej syntezy peptydów (syntezy białka według metody Merrifielda) zsyntetyzowano peptyd o sekwencji CSKSFDQKSKDGNGG i uzyskano poliklonalne przeciwciała zarówno u królików, jak i u kurcząt, według standardowych protokołów.

Literatura

W niniejszym opisie przytoczono następujące pozycje literaturowe.

Ashworth A, Rastan S, Lovell-Badge R, Kay G (1991): X-chromosome inactivation may explain the difference in viability of X0 humans and mice. Nature 351: 406-408.

Ballabio A, Bardoni A, Carrozzo R, Andria G, Bick D, Campbell L, Hamel B, Ferguson-Smith MA, Gimelli G, Fraccaro M, Maraschio P, Zuffardi O, Guilo S, Camerino G (1989): Contiguous gene syndromes due to deletions in the distal short arm of the human X chromosome. Proc. Natl. Acad. Sci. USA 86: 10001-10005.

Blagowidow N, Page DC, Huff D, Mennuti MT (1989): Ullrich-Turner syndrome in an XY female fetus with deletion of the sex-determining portion of the Y chromosome. Am. J. Med. Genet. 34: 159-162.

Cantrell MA, Bicknell JN, Pagon RA i inni (1989): Molecular analysis of 46,XY females and regional assignment of a new Y-chromosome-specific probe. Hum. Genet. 83: 88-92.

Connor JM, Loughlin SAR (1989): Molecular genetics of Turner's syndrome. Acta Pediatr. Scand. (Suppl.) 356: 77-80.

Disteche CM, Casanova M, Saal H, Friedmen C, Sybert V, Graham J, Thuline H, Page DC, Fellous M (1986) : Small deletions of the short arm of the Y-chromosome in 46,XY females. Proc. Natl.

Acad. Sci. USA 83:.7841-7844.

Ferguson-Smith MA (1965): Karyotype-phenotype correlations in gonadal dysgenesis and their bearing on the pathogenesis of malformations. J. Med. Genet. 2: 142-155.

Ferrari D, Kosher RA, Dealy CN (1994): Limb mesenchymal cells inhibited from undergoing cartilage differentiation by a tumor promoting phorbol ester maintain expression of the homeobox-containing gene MSX1 and fail to exhibit gap junctional communication. Biochemical and Biophysical Research Communications. 205 (1): 429-434.

Fischer M, Bur-Romero P, Brown LG i inni (1990): Homologous ribosomal protein genes in the human X- and Y-chromosomes escape from X-inactivation and possible implementation for Turner syndrome. Cell 63: 1205-1218.

Freund C, Horsford DJ, Mclnnes RR (1996): Transcription factor genes and the developing eye: a genetic perspective. Hum. Mol. Genet. 5: 1471-1488.

Gehring WJ, Qian YQ, Billeter M, Furukubo-Tokunaga K, Schier A F, Resendez-Perez D, Affolter M, Otting G, Wuthrich K (1994): Homeodomain-DNA recognition. Cell 78: 211-223.

Gough NM, Gearing DP, Nicola NA, Baker E, Pritchard M, Callen DF, Sutherland GR (1990). Localization of the human GM-CSF receptor gene to the X-Y pseudoautosomal region. Nature 345: 734736.

Grumbach MM, Conte FA (1992): Disorders of sexual differentiation. W: Williams textbook of endocrinology, wydanie ósme, pod red. Wilson JD, Foster DW, s. 853-952, Philadelphia, WB Saunders.

Hall JG, Gilchrist DM (1990): Turner syndrome and its variants. Pedriatr. Clin. North Am. 37: 1421-1436.

Henke A, Wapenaar M, van Ommen G-J, Maraschio P, Camerino O, Rappold GA (1991): Deletions within the pseudoautosomal region help map three new markers and indicate a possible role of this region in linear growth. Am. J. Hum. Genet. 49:.811-819.

Hernandez D, Fisher EMC (1996): Down syndrome genetics: unravelling a multifactorial disorder. Hum. Mol. Genet. 5: 1411-1416.

Kenyon C (1994): If birds can fly, why can't we? Homeotic genes and evolution. Cell 78: 175-180.

Krumlauf R (1994): Hox genes in vertebrate development. Cell 78: 191-201.

Kulharya AS, Roop H, Kukolich MK, Nachtman RG, Belmont JW, Garcia-Heras J (1995): Mild phenotypic effects of a de novo deletion Xpter > Xp22.3 and duplication 3pter > 3p23. Am. J. Med. Genet. 56 :16-21.

Lawrence PA, Morata G (1994): Homeobox genes: their function in Drosophila segmentation and pattern formation. Cell 78: 181-189.

PL 194 248 B1

Lehrach H, Drmnac R, Hoheisel JD, Larin Z, Lemon G, Monaco AP, Nizetic D i inni. Hybridization finger printing in genome mapping and sequencing. W Davies KE, Tilghman S, (red.), Genome Analysis 1990: 39-81 Cold Spring Harbor, NY.

Levilliers J, Quack B, Weissenbach J, Petit C (1989): Exchange of terminal portions of X- and Y-chromosomal short arms in human XY females. Proc. Natl. Acad. Sci. USA 86: 2296-2300.

Lichter P, Cremer T, Human Cytogenetics: A practical Approach, IRL Press 1992, Oxford, New York, Tokyo.

Lippe BM (1991): Turner Syndrome. Endocrinol. Metab. Clin. North Am. 20: 121-152. Magenis RE, Tochen ML Holahan KP, Carey T, Allen L, Brown MG (1984): Turner syndrome resulting from partial deletion of Y-chromosome short arm: localization of male determinanta. J. Pediatr. 105: 916-919.

Nelson DL, Ballabio A, Cremers F, Monaco AP, Schlessinger D (1995). Report of the sixth International Workshop on the X Chromosome Mapping. Cytogenet. Cell. Genet. 71: 308-342.

Ogata T, Goodfellow P, Petit, C, Aya M, Matsuo N (1992): Short stature in a girl with a terminal Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459.

Ogata T, Tyler-Smith C, Purvis-Smith S, Turner G (1993): Chromosomal localisation of a gene(s) for Turner stigmata on Yp. J. Med. Genet. 30: 918-922.

Ogata T, Yoshizawa A, Muroya K, Matsuo N, Fukushima Y, Rappold GA, Yokoya S (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834.

Ogata T, Matsuo N (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629.

Orita M, Suzuki Y, Sekiya T i Hayashi K (1989): Rapid and sensitive detection of point mutations and polymorphisms using the polymerase chain reaction. Genomics 5: 874-879.

Pohlschmidt M, Rappold GA, Krause M, Ahlert D, Hosenfeld D, Weissenbach J, Gal A (1991): Ring Y chromosome: Molecular characterization by DNA probes. Cytogenet. Cell. Genet. 56: 65-68.

Qiagen (1993) TGGE Handbook, Diagen GmbH, TGMA 4112 3/93.

Rao E, Weiss B, Mertz A i inni (1995): Construction of a cosmid contig spanning the short stature candidate region in the pseudoautosomal region PAR1. in: Turner syndrome in a life span perspective: Research and clinical aspects. Proceedings of the 4^th International Symposium on Turner Syndrome, Gothenburg, Szwecja, 18-21 maja, 1995, pod red. Albertsson-Wikland K, Ranke MB, s. 19-24, Elsevier.

Rao E, Weiss B, Fukami M, Rump A, Niesler B, Mertz A, Muroya K, Binder G, Kirsch S, Winkelmann M, Nordsiek G, Heinrich U, Breuning MH, Ranke MB, Rosenthal A, Ogata T, Rappold GA (1997): Pseudoautosomal deletions encompassing a novel homeobox gene cause growth failure in idiopathic short stature and Turner syndrome. Nature Genet. 15: 54-62

Rappold GA (1993): The pseudoautosomal region of the human sex chromosomes. Hum. Genet. 92: 315-324.

Rappold GA, Willson TA, Henke A, Gough NM (1992): Arrangement and localization of the human GM-CSF receptor α chain gene CSF2RA within the X-Y pseudoautosomal region. Genomics 14: 455-461.

Ried K, Mertz A, Nagaraja R, Trusnich M, Riley J, Anand R, Page D, Lehrach H., Elliso J, Rappold GA (1995): Characterization of a yeast artificial chromosome contig spanning the pseudoautosomal region. Genomics 29: 787-792.

Robinson A (1990): Demography and prevalence of Turner syndrome. W: Turner Syndrome, pod red. Rosenfeld RG, Grumbach MM, s. 93-100, New York, Marcel Dekker.

Rosenfeld RG (1992): Turner syndrome: a guide for physicians. Wydanie drugie. The Turner's Syndrome Society.

Rosenfeld RG, Tesch L-G, Rodriguez-Rigau LJ, McCauley E, Albertsson-Wikland K, Asch R, Cara J, Conte F, Hall JG, Lippe B, Nagel TC, Neely EK, Page DC, Ranke M, Saenger P, Watkins JM, Wilson DM (1994): Recommendations for diagnosis, treatment, and management of individuals with Turner syndrome. The Endocrinologist 4 (5): 351-358.

Rovescalli AC, Asoh S, Nirenberg M (1996): Cloning and characterization of four murine homeobox genes. Proc. Natl. Acad. Sci. USA 93: 10691-10696.

PL 194 248 B1

Schaefer L, Ferrero GB, Grillo A, Bassi MT, Roth EJ, Wapenaar MC, van Ommen GJB, Mohandas TK, Rocchi M, Zoghbi HY, Ballabio A (1993): A high resolution deletion map of human chromosome Xp22. Nature Genetics 4: 272-279.

Shalet SM (1993): Leukemia in children treated with growth hormone. Journal of Pediatrie Endocrinology 6: 109-11

Vimpani GV, Vimpani AF, Lidgard GP, Cameron EHD, Farquhar JW (1977). Prevalence of severe growth hormone deficiency. Br. Med. J. 2: 427-430

Zinn AR, Page DC, Fisher EMC (1993): Turner syndrome: the case of the missing sex chromosome. TIG 9 (3): 90-93.

Wykaz sekwencji (1) Informacja ogólna:

(i) Zgłaszający:

(A) Nazwa: Rappold-Hoerbrand, Gudrun, Dr.

(B) Ulica: Hausackerweg 14 (C) Miasto: Heidelberg (E) Państwo: Niemcy (F) Kod pocztowy (ZIP): 69118 (ii) Tytuł zgłoszenia:

Cząsteczka kwasu nukleinowego kodująca polipeptydy, cząsteczka DNA kodująca polipeptyd, ludzkie białko wzrostu kodowane przez cząsteczkę DNA, cDNA kodujący ludzkie białko wzrostu, środek farmaceutyczny, zastosowanie ludzkiego białka wzrostu do wytwarzania środka farmaceutycznego, zastosowanie sekwencji DNA, sposób określania niskiego wzrostu, sposób identyfikacji defektu genetycznego, komórki transformowane sekwencją DNA, układ testowy do identyfikacji lub badań przesiewowych środków farmaceutycznych, sposób identyfikacji lub badań przesiewowych potencjalnych środków farmaceutycznych, wektor ekspresyjny zawierający cząsteczkę DNA, zastosowanie ludzkich białek wzrostu, w tym ludzkiego hormonu wzrostu, do wytwarzania leków (iii) Liczba sekwencji: 16 (iv) Sposób odczytu komputerowego:

(A) Typ nośnika: dyskietka (B) Komputer: kompatybilny z IBM PC (C) System operacyjny: PC-DOS/MS-DOS (D) Oprogramowanie: Patentln Release #1,0 wersja #1,30 (EPO) (vi) Dane o pierwszeństwie:

(A) Numer zgłoszenia: US 60/027633 (B) Data zgłoszenia: 1 października 1996 r.

(vi) Dane o pierwszeństwie:

(A) Numer zgłoszenia: EP 97100583.0 (B) Data zgłoszenia: 16 stycznia 1997 r.

(2) Informacja o SEQ. ID NO: 1:

(i) Charakterystyka sekwencji:

(A) Długość: 60 aminokwasów (B) Typ: aminokwas (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: peptyd (xi) Opis sekwencji: SEQ. ID NO: 1:

PL 194 248 B1

Gin

Arg

Ser

Arg

Thr

Asn

Phe

Thr Leu

Giu

Gin

Leu

Asn

Giu

Leu

1

5

10

15

Giu

Arg

Leu

Phe

Aap

Giu

Thr

His

Tyr Pro

Asp

Aia

Phe

Met

Arg

Glu

20

25

30

Giu

Leu

Ser

Gin

Arg

Leu

Giy

Leu

Ser Glu

Aia

Arg

Vai

Gin

Vai

35

40

45

Phe

Gin

Δ Q*>

G_rg

Arg

Aia

Lys

Cys

Arg Lys

Gin

Giu

55 60 (2) Informacja o SEQ. ID NO: 2:

(i) Charakterystyka sekwencji:

(A) Długość: 209 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon II: ET93” (v) Typ fragmentu: liniowy (xi) Opis sekwencji: SEQ. ID NO: 2:

GGATTTATGA ATGCAAAGAG AAGCGCGAGG ACGTGAAGTC G\ru--G\=ACsiAG

GCAAGCTGAA ACAGAGGCGC AGCCGCACCA ACT7CACGC7 GGAGCAGCTG .-.«νσΛυ.ν-χ C'ssr».Uj«.t»n.U'w LfU^n'··.*^ .-ιν-σν»* -U.--x -«n^o/tiwnu

G^CTGG^rj^T CTC^^AG^j^kj C<j\»«jxGs-AG

120

ISO (2) Informacja o SEQ. ID NO: 3:

(i) Charakterystyka sekwencji:

(A) Długość: 368 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon I: G310” (xi) Opis sekwencji: SEQ. ID NO: 3:

GTGATCCACC	C GC G\~ GCAC G	G\J\.wJX	T C C <j\- NT'- kOAUTur	GAGAC GC GC G	CATCCACCAG	60
CCCCGvrJ7GC	TCGCCAGCCC	C ArC c c cagc	C.-.- nj\jt\AGaG	CTCACGGCTT	x -L'iA. ^μΛΛ	120
1^{H1 u} ł'¹	CAGAAAAGCA	AG\sft,C GGT AA	CGGCGGAGGC	GGAGGCG\rCG	GAGG7AAGAA	ISO
mmm^^ mm \j\xrtl χ X	ACGTACCGGG	AAGTTTTGGA	GAGCGGACTG	GCGCGCTCCC	GGLAGCTGGG	240
GACGTCGGAT	mmm^ X X Cx	AG^jACAT cac	GurAG\r\rC GGC	GGC CACT GC C	O-jGT G\_AT TT	- 300
Ισχ xUAruj\x.-\U	CACGTAGACA	ATGACAAGGA	GAAACTGAAA	GAATTCGGCA	C C GC GAGAGT	360
GGCAGA-.G						3 63

PL 194 248 B1 (2) Informacja o SEQ. ID NO: 4:

(i) Charakterystyka sekwencji:

(A) Długość: 58 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon III: ET45” (xi) Opis sekwencji: SEQ. ID NO: 4:

GTTTGGTTCC AGAACCGGAG AGCCAAGTGC CGCAAACAAG AGAATCAGAT GCATAAAG 58 (2) Informacja o SEQ. ID NO: 5:

(i) Charakterystyka sekwencji:

(A) Długość: 89 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon IV: G108” (xi) Opis sekwencji: SEQ. ID NO: 5:

GCGTCATCTT GGGCACAGCC AACCACCTAG ACGCCTGCCG AGTGGCACCC TACGTCAACA 60 TGGGAGCCTT ACGGATGCCT TTCCAACAG 89 (2) Informacja o SEQ. ID NO: 6:

(i) Charakterystyka sekwencji:

(A) Długość: 1166 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon : Va” (xi) Opis sekwencji: SEQ. ID NO: 6:

PL 194 248 B1

CTCCTCCACC	_ L. — — — <» xJV7	AGC —TTC CA<j	GCAGCAATAA		<_. — - tr»?'— x <xr.	Θ 40
Gvt\.T Gr.c-c.-C	GTGAACCGCG	1σ\σν^^ i. -i <Λ2ίνΐ	AGGGAGGGGA	Go\sAGAC—Ckj	AACCTCCCAC	900
GTT G\jGACT —	ws~Ak,xJi „ -<J	<7\J\JTV—— * 4λλ	TGAGGACCGA	m · /·*« U - X xAxAAt X	m	960
	?*λ- a. ’χϊ'^'σ x \- -	GGTTTT GTTT	X 'JC/Ł. x kJ<7 ΙΛ	TTTTTTTTTT	TTTTTTTTTT	1020
i VJ\«, X <7 X łj· i -Λ	/·« / —/ 'ν.·.υ\7Λ- i —.“Aj	ACGv-AAAAGA	CTTGCATAAG	AGAC GGAC GC	<7X <3\7X . 'J^rtA	1080
GGTGTCATAC	»r»h m<—“·*> /— • CPUAi 'χΖν-Λ'-ϊ	CATTAACTTT	ACTGACATGG	AGTGAAGTGC	AATATTATAA	1140
<“· * Λ-Λ-. X.“L«.-.kS.“i.	TTAAAAAAAA	AATAGC				1166

(2) Informacja o SEQ. ID NO : 7:

(i) Charakterystyka sekwencji:

(A) Długość: 625 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon Vb” (xi) Opis sekwencji: SEQ. ID NO: 7:

PL 194 248 B1

ATGGAGCTCC	GCCCCCGCCG	C C CAG\oC7 gg	AGCACAACGG	CACGATCCCG
AC C C C C A-. C C	C C C Gr-.GC C CA	AGCGACCCCC	CCGCCCCAGC	m^<*** mm* L· - wWw««UXA
CAGGC G\- C _A	CCACCACGCC	AAGACAACGC	CCGCACCCCC	AGCAGAGACG
·* m <·***** ^ - X	GG^-C GGC CC C	GAACCCCCGA	CCCCAGGCGA	CCCACCCGCC
* * * mmmmmmm Annb i kr>- - <j\j·	GAC GACAGo\-	GCGAGCCCCC	w w	mmmmm* * mmm i. - xkixAAC* x
mmmmmmmmmm	CCCCAAGAAA	GACAGAGC C C	TGCCCCGCCA	C *- '-AGGCC Gut
C GC GAC GACA	GCCCACCGCA	GC CC CAAACC	CCC GG\jCT ca	* mm* * mmmmm ,^u.tJVAiU -
CC C CC GAGCA	GCCGGGACCA	CAGGCACCCA	CCACCACACC	m* mmm* * mmm

ACCCACCGCA mmmmmm* mm* i Ό\3\-ζ·.« _Λ

GGGCTTGACC

CCAGCCCCCC

TACCCCCAAC

AGCACACCGG

C CAC CCCAGC ·Λ\ΛΛ«Λ^

120

180

240

300

360

420

480

540

600

625 (2) Informacja o SEQ. ID NO: 8:

(i) Charakterystyka sekwencji:

(A) Długość: 15577 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „HOX93” (ix) Cechy:

(A) Nazwa/klucz: egzon (B) Położenie: 1498 ...1807 (C) Inne informacje: /function= „part of the exon I (G310)” (ix) Cechy:

(A) Nazwa/klucz: misc_feature (B) Położenie: 3844 ... 4068 (C) Inne informacje: /function= „pET92 region (part one)” (ix) Cechy:

(A) Nazwa/klucz: misc_feature (B) Położenie: 4326 ... 4437 (C) Inne informacje: /function= „pET92 region (part two)” (ix) Cechy:

(A) Nazwa/klucz: misc_feature (B) Położenie: 4545 ... 4619 (C) Inne informacje: /function= „pET92 region (part three)” (ix) Cechy:

PL 194 248 B1 (A) Nazwa/klucz: egzon (B) Położenie: 5305 ... 5512 (C) Inne informacje: /function= „part of exon II (ET93)” (ix) Cechy:

(A) Nazwa/klucz: egzon (B) Położenie: 11620 ... 11729 (C) Inne informacje: /function= „part of exon IV (G108)” (xi) Opis sekwencji: SEQ. ID NO : 8:

CCGAC'•j^-'-G TTTG^TTTCC AG\jAC7TG\jA. AAACGAAT77 CAGG7CGCGA TGGCGAGCAC 480

CGoCTTCCCC TGA-tG^-ACAT TCAATAGC'«jA GAGGCGGGAG G\xAGCGAGCA GGAGCA7CCC 540

ACCATGAAAA	CCAAAAACAC	ΑΑΛσχΛ^	X X X	AAATACCCCA	GACG^CAGGG	600
TGACAGCGCG	GCGCTAAGGG	AGGAGGC CT C	Uj\-» U <7^3ΆΛ7 X	CCGCCSGGAT	CT	660
CGGAAAGAAT	ATAGATCTT7	AC GAAC C GGA	i ć . d « <7V7VS%7	AC CT G\aGCTT		720
GCGCTGGAAA	CCCGGGAGGC	GGCCCCGGGG	ATCCTCGGCC	TCCGCCGCCG	CCGCCTCCCA	780
AGCGCCCGCG	TCCCGGTT7G	GGGACACCCG	GCCCCTTCTT	CTCACTTTCG	GGGA7TCTCC	840
C G i T C	CATC7CACCA	ACTCTCCATC	kAA<JVJVJ\«. ij		CTTGGAGCTC	900
A7CTTC7CCC	AAAATCG7GC	<71	CGCCCGG^TC	CCCCCCCTCG	CCATCTCAAC	960
CCCGGCGCGA	C CCGjGC GCT	TCCTGGAAAG	ATCCAGGCGC	CGGGCTCTGC	GCTCCTCCCG	1020

PL 194 248 B1

GGAGCGAG^^»	CGGCCGGACA	ACTGGGACCC	TCCTCTCTCC	AGC CGT GAAC	TCCTTGTCTC	ioao
TCTGTCTCTC	TCT GCAGGAA	AACT GGAGT7	TGCTTTTCCT	CCGGCCACGy	AAAGAAC GC G	1140
GGTAACCT GT	GTGGGGGGCT	CGGGCGCCTG	CGCCCCCCTC	CTGCG^GCGC	GCTCTCCCTT	1200
CCAAAAATGG	GATC7TTCCC	CCTTCGCACC	AAGGTGTACG	GACGCCAAAC	AGTGATGAAA	1260
TGAGAAGAAA	GCCAATTGCC	G\JU,CTG%?VTX^\J	GTGGGGGAGA	CACAGCGTCT	CTGCGTGCGT	1220
CCGCCGCGGA	GC C C GGAGAC	CAGTAATTGC	ACGAGAGAGG	CAGCGCATGG	GyyyCTGGGC	1380
GAGGTCGCCG	CGTATAAATA	GTGAGATTTC	CAATGGAAAG	GC GTAAATAA	CAGCGC7GG7	1440
m^-* mmm·» mmmm '•Jf-_ vGz*.C w — y	C GC GCAC GG*y	CGGTCCTCTC	CG^ G\w ΑνΆ	GACGCGC GCA	TG-ACCAGCC	1300
C—-Jy—7G<-.T C	GCGAGCCCCG	GC G G CAGC CA	λ G\iAAGAGt-.T	m·* m m m mmmmm t/u-w. _ _ _ _	G i AT G CAAGT	15 60
CTTTTGACCA	GAAaAGA.AAG	GaC yy i AAC G	GCGGAGGCGG	AGGCGGCGGA	<5V k rtrtdr.-.&j	1620
A.T T C CA'” A- C	GTA.C G yj\sAA	GTT7TGGAGA	G— yjACT Gy—	G\- >y— G w G yy	GAy— Gyyy.—.	1530
	CA.C-G GT G GAG	GACATGACGG	A.GGGCGGCGG	C,_-iJG * CAC --y	GT GCA7TT GT	17-50

1SOO

CAGAASGTAA	GTTCCTTTCC	Gtt^-C^-^TC	Cy.GGGyyyG C	C7CC7A.-CCT	T2GGCGCC7C	15 60
CTCC-CCACGG	AG xG'yy- w'w-w	GCCCGCCCCT	CGCTGTGCAC	r.j. * - -	GGGGTGTGGC	1520
CASGGTAAGG	CGG GGGCCGT	CACCC7TTGC	CTAAGAAAGC-	rtAGvaj-AG\r<A.	GG.-.GT GG.AG G	1530

tSfŁ O y _ yy— X yU _ G\T— i AG-'yyy GT G— 3\ΛΓανα 'JwJkTUWJ ΓΙ'—'—·—y.yycrj-Ltj

G·-j. j^-—-.C C<=.-.CAC<rxjv?7·. A.GvTCCCGGG CTGGGjTGGG

mmmm#» i-.UiA^Ui- i kjr i _ i ν?Λ

G.-C .--S_'.^TmS- 7CTGTCCCCC AGGCTGGAGT

CCTCAGO

CCCAGTAGCT GGGATTACAG GCATGCACCA C2ACGCCTC-G C7AATTTTTG

£040

2100

2150

2220

2210

2240

2400 fW.tt.--V -r-f-f-J

A-^yyT GAT G G	ACCCGCCTGG	GCCTCCCAAA.	GT GC T GGGAT	Gr\CAGy— j i v	AGGCACCGCG	2450
·-. w — yy—— _ Ay	GT C GT GAC Gy	c* * λ Ca..—c g -	Giu*T.^:-.3i	CTCTGCC7GT	CTGAGTTGT.A	2520
- - ——.Cyyx CA	C — —“ttznC <7xAt	CAGAGyy^G^ G	GT CTG GAC GC	GCCTTCCCAG	Cc— - C-AG\ws7^-	2550
G _ G—— kj\jv7\_ —.	CCCGGAGATC	AC GGGAAGAC	T C AJA- T GC	GT GGTAGGAG	AC iAG\ru	2640
CCCSCGTCAG	CTCGCTTCTG	m m m m\* mm m m 1 ♦ 'm.ł <> X X Χ.Λ	AGjAAC ·- -T T	tiU X Ax A -	mm* m^^m>imm J· ·—~— - J· * * . X	2700
CCTTTGAACG	T C GAGkjCT t g	ATCTTGGCGA	AAGCTGTTGG	GTCCATAAAA	ACGACTCCCG	2760
T GAGA GGAGG	T Άν, C GyyAT	CT GGAT GGGG	CGCGAGGGGC	CCC GGGGAAG	CT CA·^, GGCTT	2320
C k3\- yyy— 1Λ. iy	TCCTAAGTCA	AGGTTGTCAG	AGCGCAG— C tj-	G x T GTGCGC G	(ACCGGGGGN	2SS0
AGCTCCCCTC	TGGCCCTTCC	TCCTGAGACC	TCAGTGGTGG	GTCGTCCCGT	GG7GGAAATC	2940
G5GGAG7AAG	AGGCTCAGAG	AGAGyyy—TG	&-CCCGwGA	TCTCTGTGCA	CAGtCGACAA	3000
U. T sAA-A	TACATCTTAA	GAATAAAATG	LkT\, i Lr-y— i' ty i'	G x C GGGGCAC	AGCTGGAGAC	3060

PL 194 248 B1

G337A733AC G337G77A7G 7777CA77AC AAAGACG3AG AGAA7C7AG3 C733337777	3120
G37GA77CG3 AAAG77GAG3 7G3GAGGG7G AA7GGCCCAA AG37AA77C7 TC37AA.GAC7	3180
CTGGGGCCAC CCGCTCTCCG GG\j\-CCCGCA TCCG^j^j^riGT Gvw\G.lG«\-C— CGA3AAACAG	3240
CCCCTGCACC CGTAGGAGGC ACCAGG'—AG<- TCCCCAAG\j\- CCxGnC-xCG TCGAAGCAGA	3300
AAGOTGTGGC TACG\jTTTAC AAtń.G'—AGCCk- C—.^\jxCCC*.G AC—<jxC-A-lG AG^rCAGGAGC	3360
CCAGCCCGCC TTTGACAGCG AGAGGAGTTC CTCCCTACAC ACTG^,TGCG\j GCACCCGGCA	3420
C737AA77CA TACACAGAGA G77GG3C77C C7GGAC33AA GGC7G33AG3 CG377GAGGG	3480
CCTGCGTGTA ATTTAAGAGG GTTCGCANG- G~—CCCAr—«uren— CG'—TTCTGiiT GGGGTTGCTT	3540
777GG7737C C77CNGCAAA CACCG7777G C7337C7NGN AAC7C73737 7*JC7CCCCCN	3600
73333713733 GACCCGGGNA NGAG3AAAG7 G7CC7CCAGA C37477773AA A7IG7GAGAG3	3660
AAAA7AAAGA CCAG33CAAA NNGACCCAGG GCCACAGGAG AGGAGAC.-.GA GA37CCCC37	3720
TACATTCTNG CCCTTGGCTG GGTGCAGAAA. GAC — CCC—·<η— C—AG\=ACTGC CACCCA.GGCT	3780
AC7A777A77 CA7CAGA73G AAG77AAA7C GAGG77GGAG GGCAGGGGAG AG777GAGG7	3840
TA-CCGTGGAA. GCCTGGAGTT TTTG^srjilAj-.C AG\-<rxGxC'—— C^r*—CGAG-CC GGGAGCCCGC	3500
GGGTTC — G-A AA.G'—CTG¹—G^j GTGx -AC--TGr^z+.Gr·. C—rvGxTTG-C AGTTGGGGTC	3960
.-AG7NCC7GG GG77CAGACT 7AGAGAAA7G AAGGAG3GAG AGC7GGGG73 G737CCAGGA	4020
AACGA77CAC T7GGGGGGAA GGAATGGAG7 G77377GCAC- GCACA73737 G77.-.GGAGG7	4G80
GAAACAGAA7 G7GAAA7CCA C377GGAG7A AGC37C7AGC GC7GAA737A G37333GG73	4140
33-37337,-3-3- 3333733737 G3A733733A AG33AAGAAA 3,333.3-3333 337337A37A	4200
777A.333337 77J33G7G7.-.G AC3.333733-A 7773733.337 773333.3377 3773377333.	4260
3333337733 C737333337 7733.33.3737 77333.GAC7A 33.37733333. 737333-3333	4220
773.C337733. C3.GGGAGGG3. C.373733.773. G333A7C333 7337737337 37373NC733.	4380
333.33333713 AGA7AG3AAN C3NGAG3333 NG77GGNAGA 733NC3C773 3333333337	4440
GGGN77G.33.G GGGANGGGAN GGG.3N33.37i3. C37777.3NC7 7AAAC33377I 333-3773373	4500
CAGA.GA.GGAC TGAA.TGTCTA AA-ACGAGw-A Gr-A..-AGGTTC TTCA.CCCGGA AACGCTTGAG	4560
GG37G3.G737 7373333377 C7GACN7333 C323G33AA33. CAGACAGG73 A333ANC7AC	4620
TGGAGACGAG AAAGTGCCAT TTTTG^n—A.CA. CTCTG^rTGw GTAGGTGCCC GACCGCGTGT	4630
GAAAAANGTG GGAANNGGAG AGATTTCTGN CG\-ACC*—GGT TCAGCCCCCA GGCGCGGNTG	4740
G3NG3A77CN AGGN7AC7CA GACG3GG77C TG37G77C7G CTGAGAAACA G3377CGGG7	4800
AGGGGCTCCT AGCTCCGCCA GACCGk-G^sAG Gv=ACCCCCAG CCCTCCTGCG CTGCAGCGGT	4860
GGGGATAGCG TCTCTCCGTA GGCCTAGAAC CTGCAACCCG CCCCGGGCCC TCCCCGTGTC	4920
C77CCCGGG3 G7CCCG33'3G GGA7CCCACA G77GGCAG37 C77CC7C.3AA 773777CCC7	4980
TAAAAA7AGG A777GA33CC CCAC7C7C37 7AAAAAAAAA AAATAAGSAA AAA3GG7TAG	5040
GTTATGTCAA CAGAGGTGAA GTGGATAATT GAGoAAACGA TTCTGAGATG AGGCCAAGAA	5100

PL 194 248 B1

AACAACG-GTC G7GCAAAGC7 CAGG77TTTG GGAAAGCAGC GAG7A7CC7C CTCGGCTTTT	S160
GGGT7ATGGA CGGGACGCAG TTT7TGCGTC AAAGCGGAIT GG7T77CGAG GGCGGGC7T7	5220
CCACCGGG-GG A7GCACGAAG GGG7TCS2CA CGTTGCGCAA AACC7CCCGG GGC7CAGCCC	5230
TGTGCGC^CG G\--*CCCCACG CAGGGATTTA TGAAIGCAAA GAGAAGCGCG AGGn.CGTGAA	5240
GG CGGAGGAC GAGGACGijGG AGACCAAGCT GAAACAGAGG CGCAGCGGCA CG^ĄCGTCAC	5400
GCTGGAGCAG CTGAACGAGC TCGAGCGACT TTTTGACGAG ACCCATCACC CCGACGCCTT	5460
CATGGGCGAG GAGCTCAGCC AGCGCCTGGG GCCCTCCGAG GCGCGCGTGC AGGTAGGAAC	5520
CCGGGGGCGG GCAt^Gj-utGGG CCCGGAGCCA CCOCCTGGTC CTCGGGAGCG CACAGCACGC	5520
Ga.ACAGx^<~AC C- CCCCCTTCC-w Gk^-.GCGCGGG GAGGTTGGGT	5 64 Q
GAGGGACGktG CTGvjvt\jTTCC tggactcttg gagacgcctg aggcctgtag GATGGGTTCA	5700
TCGCGTTCGT TTTTCACGAA CAGCAAACAA ATATATATAC ΆΤΑΤΑΤΑ7ΤΑ TACAAACAAC	5760
AAAZA.AAC.Ar A7A7G77A7A CAGA7GGGTA. 7A77G7A7A7 A77A7AGA7A T77G77CG7G	5320
C77GG7GCAA AGACACC2GG TGAACCGA7A 7A77GGC7G2 7GAC7GCG77 CGG77CCG2?	53 20
GGGAT7C-37T A7AGGGGCAA CACATGCAAA CAAAACTTTG CG7GGA77A7 AC77AGGAGA	5540
CGAAGG7A.CA GA7GCG777G A7CCAGAG7G T777ACAAGA 77777CA777 AGAA-AAAA7	60-00
G7G7C7777G GCGCG7GA77 CGGG7GGG7C 77CGGG7G7G GC7GCA77GA AAAGG777CC	6060
77A.GGA.7GAA. AG--.--GAGGGG 7G7CC7C7G7 CG27A.GGTGG AGAGAAACAG GG7G77C7C7	6120
77GG7CGG77 7777CACC7A CCG777C7AT C7CGG7CG7C CCC7C7CGAG C2G7G7CG7C	61:0
7GG7ACA.-AC CACGCCG7GC TCCC7CCGGC 7G7GGGGA.GG GCAGGAGCAC G773GGCA7C	6240
7GGA7GAGGG GNAGAC7A77 AGCGGGGCAC GGGGGC7G2G CGAGGAGC3C GCGAATTCAC	6200
GC7GCGG2A.7 G.-.G.-.CGAGGC ACGGGGGGGC GGAGGGGCC7 7GGG7G7C2G CAGAGGGACG	S-; cO
GGGGGGC.AGA GC277CG7GG GCA77C7AAA CA77CA.C77A AAGG7A7GAG 777A?777AG	6420
G%r^- a G^· - TCCAAAGG\^«. TTCTTCCAGC CCCTGCCCGA CAGTTCAGCT	6480
CGGC7GGAAG G7CAAC7G27 C7AG7CG777 C7GG7GG77G 7GGGC.AC-GAG AGA-.G7GGGG	65 40
GGAGGGAGAG AGAGAGAGAG AGAGAGAGAG ACGG7CAGGA TCGGGGGACG C7GGGGAACG	6500
CGTCAAAAAT AAA7GAAA77 AAGA77GCGG A.C2AGAGA.GA GAACCG7GAC AAAGCAAACG	6660
GCG77CAAAG CAAAGAGACG AACTGAAAGC CCG77CCCG7 AGGACTGGT7 ATGAGGTCAA	6720
CACATTCAAA CACAGCTTGC TCTGGATTTT GC7GAGCAGA GGAAGATACA GATC-CATTTG	6780
AICCAAAGTG TGT7ACATCT TTCATTATAT GTG7G7CTAT ATATATAAAC ATATATAAAC	6840
ATATAAACAT ACATAAATGT ATGTAAATAT ATATAATCTA TATACATATA TAAATATATA	6200
AACACATATA TAATATATAA ATCTATAAAC ATATATAATA TATAAACATA AATATATAAA	6260
CATATATAAT ΑΤΑΤΑΑΑΤΑΓ ATTAACATAT A7AAAA7A7G TATAAATATA TATAAACATA	7020
TAAACATATA TAAATATATA AACATATAAA TATATAAACA TATATAAATA TAIACAAACA	7080

PL 194 248 B1

AGGNCAGGGG CCTTTTTGGC GGGGGTGTGA GGGANGGATG ANCTTTGGTG GGAAANNCAG	9180
GATCAGG7TC TCCAGGCGCA CTGCAGCCCG GTAGGACCCA CTTTGGAAAT GAAAAGCGAG	9240
TTNCCGAAAG CTGGGCTGGA AGCTTCGGTG TTGGGTTCAA GAGCAAGTTC ACG7TGCGC7	9300
GTGTAGACTC CTGGCTGCTC CCAAACTCTG AGGGTTTTCT GAGGTTCCCT TCATAGGGGC	9360
ACCGGCCCTG GGCCATGCAC AGTGCGTAAG GGTGGCTGTG GGGCGAGGGA CCCAGCACGT	9420
GTTTTGCCCA CAACAGCCGG AGTGACTGGT TCACTCACCG CCTTGGCGGA GGACGCCTGT	9480
mmmmmmmmm mmmmmmm mmmm^-—mm^—”* m* mmm^-mmmm mm^-«—mm* * m ^— mm^-*m ^— mmmm ΛΛΧΧΛϋΙΧ-. '-.L k=r.>— X\J\- »- χ X\J X X —X X x X x	9540
CTGCCACAGA AAACCTGTTA GGAGGAATTA AGCGACTAAG ACTGTCAGGG AC-GTGGTGGT	9600
GGGGGANGAG GłIAGG^jGGTG GTGTCCAGAT TACCAGG'—AT aG\3>-7AAAC7 GCCTGCACTC	9660
TCCAGCTGGT CTGTCTGTGG AGGAGGGGAT TG7CAATACT GGGAGAGGAG AGGAGGCTCG	9720
mmmm^—mm* m * m m m —» mmm — * * mmm m m* m m m* * * mmmm m * m mmm^—— mm .—mmmm* * mmm - .dlk5XXTŁ\J'-y X UA Uxrttj%7k7vjvrxkjvr ΠΛΧ X - <J\—A— '-γ <—-λΑΑ- —X L-ΠΧ «AWMwi L7ikjxss.-ir\x - χ	9780
£m mm* £· —mmm ¢-m^·»·* ζ· m —m^m ^mmm m m mm ^m mmm^ ^m^* m Τ m * £ mmm* £mmm* *	9840
GAC7CAGAAG TCCTTAGAGG GGCAGAA7GC CCCCACCACA A-.GCC7C-C7A. TCCTTGGGCG	990C
mmmmm* m ^—* m m ^—mmm ^— mm* m m*mm^——m^— mmmmm* mmm* mm ^{— — —} * m ^— m m mm^-m* * m* mm • L.'—- X <3V7 X L-.« Ι-ΛΛ L. L7 X Λ X kTkTkrir.L. — — - - 'JUT	9960
* * mmmm* mmm mmmm* C m-m mmmmmmmmrn mmm^—m^——— m m* * m — mm* * «, m* m* mmmm .--r.— L. x - — L. —x - x- <— — <ir.kzr.r.Lr\rsr—r-rtLsr.'—-.*— - - -—	.0020
mm* mm* m ^{— ——} rn* m* * mmmm* * * m ·* m* mmmm mm m m m mmm m m mmmmmm* * m* mmm* m* mmmm L-jr.wuzycw- łjxxtxrt/-jA?\5\s\m··. A2-.Lsm.L-.-1.- - - - L-- - k?x '^χ Lr— χζ.-.- * '-ζνζ	10080
AGAAGGGGCT GGATTTGGAA CTCTTTAGCC ATCAGCTCAC CCTCTCCGTT TG7GGC7AAA	10140
mmm»ł»m* * m^—·» mm** mmmm^- mmmmmm^-mm mmmmmm* m* — — mmm-m —m mmmmmmmmmm Lr x <, - «w.w x wartAALi -L, — L..L.x-.r.L nbwiLiAL.-. L^r.—.u x _ x?\rsr\r Lr<r—	10200
CCACACAGAA CGCTGGAAAG TTCGACAGTG CAC77CCAC7 GGC7CGGAAC 7CAC77777C	10260
* m^— mm* * mmm m* mrn* /— ^{— — —} «* ** mmmmm— mmmm* mmm* m ^—-** m — mm* m m m* mm* mmm** x - L-λ--_Lr\_.1— -.~.Lr\r x — - - x— Lr—-,xrvryr—-.-- _r x —- χλλ	10320
m** mmmmm* m mmmm* ^—mmm* mmmm ^{- — —} mmm mmmmrn^—mm m** mmmm* mm mmmmmmm— 1 -„—.Lrxyx —-. i—r—x'j——x L. --—-.L--.»—— - — z*.L. - . --i\j\xr.G	10380
θ'—C—AG\sAG\r GCGGACCGCT CGAGGCCAGG AGTTCGAGAC CAGGCTGGC— AAGACGGTGA	10440
AACCCGGTG7 CCACTAAAAC A.CA-AAACCA GCGAGGCACG GTGGTGAGCA CG7GCAATTC	10500
C.-.G— lG - G — Gkir.G^r*— - Gr.G Gv—-i.G^jr-.G.—j-.G C —r— - - GrAC — _ G\j%xr.G\jCG\j A.CGTGGGAGT	10560
GAGGTGAGAT CACACGACCG CACTCGAGGG TGGACGAGAG AGGAAGAGTC CGCGCGAAAA	10620
ACAAAACAAA ACAAAAACAA AACAAAAATC AAAAAAGAAA ACGGAACCTG CAG7CCTAGG	10680
CGAGG7GCAG TGGC7CACGG C7GTCA7GCG AGCAC77TGG GAGGCGCAGG AGGG7GGA7G	10740
GC77GAGG7G AGGAG7TCGA GACCAGCC7G GCCAACATGG 7GAAACCCCA TC777AC7AA	10800
AAA7ACAAAC GTTAGC7GGG TG7GG7GG7G TGCGGC7GTA A7CGGAGC7A C7CGGGAAGC	10860
TGAGGOxG\sA GAATTGCT7G AATCTGGGAG GTGGAGoTTG CAG\jGAGGCG AGAIAG7GCC	10920
AC7GCAG7CC AGCCTGGACG AGAGAGCAAG ACTCCGTCTC AAAAACAAAA GAAAGCAAAA	10980
ACAAAAAACA AGAGACGAGC CTGGCCAACA TGGTGAAACC GCG7C777AC TAAAATACAA	11040
AATTAGCCGG GCA7GG7GG7 GGGCAC—TGT AGTCCCAGCT ACTCGGGAGG CTGAGGCAGG	11100

PL 194 248 B1

AGAAIGGCTT GAACCTGGGA GGTGGAGCTT GCAGTGAGCC GAGATAGTGC CACTGCACTC	11160
CAGCCTGGGC GACAGAGCGA GACTTGATTT CAGAACCACC ACCACCACAA CAAAACAAAA	11220
CAAAAAATCC AAAAAAACCC CAATTTCCAG TACTAGGTAG TCAGTGATGC AGGGCTGGAG	11280
ACAGAGGGGC GGTAAGTGTC TGGGCGCCCA CCATCAGTCA CCTCCCAGCT CCCANGAGGT	11240
G\—AAAGTGC7 TGGTTGAG—C TCATGGGAAG GA7GCTCCCT GGG\jAGGCTG GGGTGGGTTC	11400
ACAGGGCTCT TCACAICTCT CTCTGGTTCT NCCCCAAGGT TTGGTTNCCA GAACCGGAGA	11460
GCCAAGTGCC GNCAAACAAG AGAAICAGAT GCAIAAAGGT GGGTGTCGGG ACTGGGGGGA	11520
CCTGAAG\-TG G^^cATCCTG CTCCAGoAGG GAIGGGGTCG ACAAGGTGCT GGCTACACCC	11530
AGGACCACCA CACTGACACC TGC7CCCTTT GGACACAGGC G7CATCTTGG GGACAGCCAA	11640
CCACCTAGAC GGCTGGCNGA GTGGCACCCT ACGTCAACAT GGGAGGCTTA CGGATGGCTT	11700
TCGAACAGGT AC-CTCACTTT TTCTTCCTCT GNAAGATCCC TAGGGACCTG CTGCTCCCTT	11760
CCCCTTTCCC C7A7TTGC7G CCGCATCCTG ACACTCCTAG TCCCTCCCTG CCCCTGCAGA	11820
C77C7CAGCT GGCCCTTAGA AAAAAAGCCT CTTTTCCGAG GAGGCA7TTA CAGGCACCTT	11880
G\jx-ACCTATG AAATCAGGCI GGGCCAGGCG GGGTGGCTCA CACCTGTCAT CCCAGCACTT	11940
TG\jvxAGxyv— —A AG\jx iAG\=.—.G TTTGAGACCA GCCTGGACAA CATAGCAAAA GCCTGTCTCT	12000
A.C—i-AAAf-„A CAAhiUłAnrt x *AACnG\jxxn. GTG\tTGvj^,xG\j G\1ACCTG7AA TCCCAGCTAC	12060
TTG\sv=AG\j\-T Gr'.G\j\—AG\=r-.G AA7CACTTGA ACCCGGGAG\y CCGAGGT7GC GGTGAGCCGA	12120
Gz~,x CGTG^—A T-G_ACTC_A G^j^TG^jm^GA CAGAGTGr-.GA CTCTGTCTCA AAAAATAAA.T	12130
ΑΑλ.λλλ«-Α λ.μχλΑλλ.-λ A.TAAAA.-.IAG GTCGG^CACG GTG\rCTCACG tctgtaatcc	12240
CAx^—ACx « x G GrAG%3^C.j.-Ay GTGvxjx G\xAT GACAG\j\jTCA AGAGA.TTGA.G ACCA7CC7GG	12200
CCAACATGv^ AAAATGCC<rT CTCTA.CTAAA AAATACAAAA ATTAGGCGGG CGTGGTGGCG	12260
7.77-.17-.-. A- C— —A&-7A CTCG\jGAG\jC TGAGGCAGGA GAATCGGTTG AACCCGGGAT	12420
GCGv_-AG^TTG CAGTGAGCGG AGATCACATC ACTGCACTCC AGGCTGGGCA ACAAGAGCGA	12480
AACTGCGTCT TACAAIAAA7 AAATAGATAA ATAAATAAAC AAATAAACTT TACTTTAGAA	12540
ACAAATCCCT GTCCGTGTTT GTCTTTTCAC CTGTCCTGCA GGGAAAACAA AACATAAAAT	12 600
GTCAAGGCAA ATAGTAGTGA TTTCATTCCG GGAAAAAGAA AGTGGATGTT TGCCTTCACC	12660
CTTTCTCGTC CTTCCTCTGG TGCTCCTCAN GGCCCANGGG NAGAGGGTGG AAAGTNCAGA	12720
GGAAGAAAGA CGGGGCTGGG GGGGGGGGTC CGTGGGGACC CAGGCAGGCA TGTTCCCNAT	12780
TTCCNTGTCT TCACNTTCAA AGNAGGGGCC CCTCGNCTCT GGAATGAGGC CTACGGTTTC	12840
CTTTCCCNGA AGAGTTNCCC CTTTGTGAGC TTACGGCTTC GGAGTGAACC TCGGTGCAAC	12900
CTGTTATTAA AACACACAGA GGCTAATGCC AGCAAAAACA CGCCCCCCGC TCCTGGTTTC	12960
AGAGGGAAGA AAAAAATTCA TAAGCACGGC CATGCTTTTC TAATAAAAAT TCATTAAATA	13020
ATCGTTATAA GGGA7GAAGC CGGGAGGGGA GAGGAGAGGA ACACAATCAA GAGACTTTCT	13080
TTGAACTTTT TCTCCCTGCT TCAAATACAA AGCAAICTTC TGTGGGCCTG GGCCTGGGGG	13140

PL 194 248 B1

GTTTCCCCCT	TTCTCTGCAG	CCCATTGGGA	GGAAGAAAAT	GCTTCCCTGA	ANGTTGCTGC	13200
AAAATTGTTT	CTGTTTTTCT	TTTCTTTTTC	TTTTTTTTTT	TTTTTTGAGA	CGGAGTCTCG	13260
CTCTGTCACC	AGGCTGGAG7	GCAATGGTAT	GATCTCAGCT	CACTGCAACC	TCCACGTTCC	13320
TGTTTCAAGT	CATTCTCCTG	CCTCAGCGTC	CTGAGTAGCT	GGGACTACAG	GCGCCCGCCA	13380
CCACGCCCGG	CTAGTGTTTG	TATTTTTAGA	AAAGACAGGG	TTTCCCCATG	TTGGCCAGGC	13440
TGGTCTTGAA	CTCCTGTCCT	CAAGTGATCT	GCCTGCCTCG	GCCTCCCAAA	GTGCTGTGTT	13500
_TrTf._TTłpTW,_r	τττγτγγγζγ'	TT^irar,		ΙΓ.ΙΔΤ'ΜΔΔΤ		1
τι t« —ιτ»/“·« ΛΛ<σ X - <Λ--Χ kj\-	AAAATTGTTT		TTTCTCTTTT	CTTT CTTTTT	GAGATGGAC-7	13620
CTCGCTCTTT	CACCCAGG^T	GGAGwCAGT	GtoC GC GAC C T	CGGCTCACTG	CAACCTCCGC	13630
<· · ^--^^ m	CAAGCGATTC	TCCTGCCTCA	GCCTCCGGAG	TAGC7 GGGAT	T ACAGA2AC C	13740
TGCCACTATG	w X X ΛΠ ·	TTTATTATTT	TTAGTAGAGA	χ - >-Λ	<· · <- - '-J· X <7ντ\-.	13800
CAGvt\-T G\jT c	TCAAACTCCT	GACCTCAGG7	GATCCGCCCG	CCTCGCCTCC	CAAAGTGATG	13 8 60

GGATGANCAG GNCATNGAGC NCACCGTGCC CGGCCCTC7A

TCTCCNNTTC CCCTTTCTAA ATG7A7A7AT TGTGTTTTTA

CACC7CA77N CCCCGCTNCT C7CCCCAAGA CCTGTCCTGC

GCCC7GGACA TATCCCAAAC CCACGCTGAA AGAAAGAGGG

CTGTGNATCC TTTAAACA7C TCCGTGGCTT CCAGGCAACA

ATGTCTGACA TGATACCGGG ACCATGTATG GGNAAATTCT

CCCCGCAGAG GCANCCAT7G CA7ACCC7CC AGAAACTCCC

CACAACACAA ACAGCNTCCG AGAGAGGG7G TCATTGAAAA £C^mC'^T'^TT-C^r

AAAGTTAACA

AC GTT GCACA

TCTCACTACA

CAGCCATAAA

G\?\y7 GT GAAG

CTGCCGTTNC

CAGCAGG7G7

CGTA.T GAT AC rwn /--ί « rłi/-·*,TTCCAGCTAC

AAG\- CAAAGA

CATAAGAGCA

12920

13980

14040

14100

14160

14220

14280

142 40

CACAGCACCG	TCTTTCTCTT CTGCZC3TTG A7AC-.CAAT7 A7GAGCAA77 7GC7AACAC7	14400
GACAACTCGT	GGCAAGAACA GC7CG7G77G A7ACGG77GC C7CG7GAGGA CCCA7C7G7C	14 4 60
i - wi	77GCG7GGAA CGGAGATCGG AG77CAGGG7 GGC7AA7AGA A7CA77AC7G	14520
ACCTAGGGAC	ACAGAA7NA7 GAGGG77ACC CGGAG77AAG TGCA7ACAG7 CAAACGGACG	14580
z-z-·* X <σ\- X x αν	AAGG7ACAG7 GACGTGAACA GC7777A7GA AA7GCC7AGA 7C7GGACC77	14640
CCATACCTGA	GCCACCG77C CAAAGCAC7G GGCG777T7C AGATAC777C ATGAGAAATG	14700
TTG7CAACAC	CGCAAG7TTG CAG7ACACAG TCTGAAAGA7 A7TCT7G7AT ATG7AGATG7	1 Λ“7£Λ X 3 i W W
CTGTAGATGC	CCTGAAGG7G TG7AGACTT7 AGACACCCAG AAGGTGTG7A GA7G7CTG7A	14820
GACACC77C7	ATGTGTGTAG ATGTCTGTAG ACGCCCTGCA GGTGTGTAGA TATATCTAGA	14880
	GTG7AIGATA CAGGCTAAAA AGACATTTGT GGTGGACACT AGTTGATTAT	14940
TTAGGACTAT	GAGATGGGAA AGGAAGNAGC AACCAGCAGT GAAAGGCATG TGGTGGGTGG	15000
GGGGTTGGCA	TTGCAGTGGG GTCCTCNTGA NGCAGGTGAC ACCCACTATA GGGCTGCCCT	15060
TGGNATGGAC	GCTTTGTNGA AGCTGTTTGA TTTCACCACA CCAAGCCTGG AGGCACGGAC	15120

PL 194 248 B1

A77CCAGGAT	GG7GAGGAG7	CTGCAAAGGA	\Α2ΛμΛΧ X	GGAGGTGCAA	TATCCCTAGA	15180
GTACGAGAGA	TGAGATAGGA	GAGCTGTATA	AATAGCACTA	CCAGCCGGAT	GC GGT GGCT C	15240
ACGCCTGTCA	TCCCAGCACT	1 iAŁjNSTiijtA..	GAGGCAGGCG	GA7CACCTGA	GG7CAGGAG7	15300
7CCAGAACAG	CCTGGCCAAC	ACAA7GAAAC	CCCATCTTTA	CTAAAAATAC	AAGAT7AGC7	15360
GGGCACGGTG	TCTCACGCCT	GTCA7CCC7G	CAL x ± . GGGn	GGT C GAGG7 G	CGCAGATCA7	15420
GAGGTCAG77	TGGCCAACGC	GGCGAAACCC	CGTCTCTACT	AAAAATACAA	AAAAGTAGCC	15480
GGGCG7GG7G	GT GGGCAC C T	GTAG7CCCAG	C7AC7AGGGA	GGCTGAGGCA	GGAGAATCGC	15540
77GAACCCGG	ATGCGvsACAT	TGCAG7GAGC	Ukxrtkzr*xU			15577

(2) Informacja o SEQ. ID NO: 9:

(i) Charakterystyka sekwencji:

(A) Długość: 753 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = ET92 gene segment (xi) Opis sekwencji: SEQ. ID NO: 9:

^Z· z· Z·· *V1 r™· ΛΖ	C CT77GAGAC	x x · x	CTAAACTTCC AAA7G7CAGC		430
7GACAGCAAG	GGACATCTCA	7*^ GGGCA^m C	>· mmmmm m «m \J^L?X X X. - <JX	CAGCAGjC c c	540
TAGGAA	CAGAG'jvj'j%x«j	<r»m,z- — X X \j\».	CACTTCCACC AGCCC7GGG7	TGAAGGGGAG	600
C Gi-.GwAGAC	m ^m	TAAACCCC7G	AGC7TGGTCA GAGAGGC7GA	A7 G7 CTAAAA	660
TGAGGAAGAA	AAGGTTTTTC	ACC7GGAAAC	GCTTGAGGGC TGAG7CTTCT	GCCC7TCTGA	720
CTCCCCCAGC	AAATACAGAC	AGG7CACCAA	CTA		753

(2) Informacja o SEQ. ID NO: 10:

(i) Charakterystyka sekwencji:

(A) Długość: 1890 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa

PL 194 248 B1 (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „SHOXa” (ix) Cechy:

(A) Nazwa/klucz: CDS (B) Położenie: 91 ... 968 (xi) Opis sekwencji: SEQ. ID NO: 10:

PL 194 248 B1

AAC

ATG

GGA

GCC

TTA

CGG

ATG

CCT

TTC

CAA

CAG

GTC CAG

GCT

CAG

CTG

738

Asn

Met

Gly

Ala

Leu

Arg

Met

Pro

Phe

Gin

Val Gin

Ala

Gin

Leu

205

210

215

CAG

CTG

GAA

GGC

GTG

GCC

CAC

G—

CAC

CCG

CAC

CTG CAC

CCG

CAC

CTG

786

Gin

Leu

Glu

Gly

Val

Ala

Hi 3

Al 3.

His

Pro

His

Leu ΗΪ3

Pro

His

Leu

220

223

220

GCG GCG CAC GCG CCC TAC CTG ATG TTC CCC CCG CCG CCC TTC GGG CTG

834

Ala

His 225

Ala

Pro

Tyr

Leu

Met 240

Phe

Pro

Pro 245

Phe

Gly

Leu

CCC

ATC

GCG

TCG

CTG

GCC

GAG

TCC

GC—

TCG

<A_C

GCC

GTG

GTC

GCC

882

Pro

Ile

Ala

Ser

Leu

Ala

Glu

Ser

Ala

Ser

Ala

Val

Ala

260

250

255

GCC

GC—

GCC

AAA

AGC

AAC

AGC

AAG

AAT TCC

AGC

ATC

GCC

GAC

CTC-

CG\3

930

Ala

LVS

Ser

Asn

Ser

Lys

Asn Ser

Ser

Ile

Ala

Asp

Leu

Arg

265

270

275

TG .

280

CTC

AAC-

Gcg

Cćrur

AAG

CAC

ten—<7

ίσΑΙτ

GCC CTG

CxC

ri'-—i- m-—ur.

978

Leu

Lvs

Ala

Arg

Lvs

KI 3

Ala

Glu

Ala Leu

Gly

Leu

285

290

ΓΆGCC C C T T G CGCGC—CGGA CTCC—C—<r——.C—— C<j\-λ'— — (A~-<j

CACTCAACCC CGCCTGGAGC TC—TTC—GCG GCCAC—GTGC TC—GG\jCACC C—G\j\jAG\-TC

CTGCAAGAGG CCTGAGGAGG GAG\j*-TC——— G\s.-.^wu.C-A C-.o\—rt.Ck=AC—— j-.G-—.-.Gr*.C——

TCGCGGAGAT G\jTGCAGAAG —C.^-.^— C—c\rc\,^TCCCAAGGCTGC C—GTGCGTCC TGGGA.CCCTG GAGAAGG^TA AACCCCCGCC TGGCTGCGTC

TTCCTCTGCT ATACCCTATG CATGCGGTTA ACTACACACG TTTGGAAGAT CCTTAGAGTC

TATTGAAACT GCAAAGATCC CGGAGCTGGT CTCCGATGAA AATGCCATTT CTTCGTTGCC ±038

1098 '¹ 53

1218

1278

1338

1398 mmm*«^ · mm mmm^ mmmmmm ' mmmrn^ '—Ti— - - ΑΛΧ’-Μ.ΜΛνΛΧΛ „TT TG\iAAAG\r\srt mm—

TTCAGACGCA AAA.GAC7TGC ATAAGAGACG Ł3CGCGTGGT

AAAAAAAIA.G CA (2) Informacja o SEQ. ID NO: 11:

(i) Charakterystyka sekwencji:

(A) Długość: 292 aminokwasów (B) Typ: aminokwas (D) Topologia: liniowa ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEQ. ID NO: 11:

GAGGCTGCGG	1 Z T	1458
GGGCTCTCCT	CC3.CCGCTCC	1518
GCC GAGGCT G	“ GGA C G^T G- *	±578
CCCACGTTGG	GACTCCCACG	1638
* mmmmmmm^ m	__________	1698
ΛΑ7Α <7- i X	X ΛΛΛχ - 17
m «τ' m m m ηη {·» «—«w m	mmrnm^ m^ mm* x ^7- -<-J—AGisr.	1758
mmm·» mmmmm X νΛΛΚΙίνΐ Cl	m·* m^» mmm^ m* U.-ix--.U x isri-.-i	1818
mr mu m·» mm		1878 1890
ΧΛ-ΛΛΤνχ.-— -	A—AW-L ΧΛΛΛ

PL 194 248 B1

Met Glu 1	Glu Leu	Thr 5	Aia Phe	Val	Ser	Lys Ser 10	Phe	Asp	Gin Lys Ser 15
Lys Aro	Gly Asn ‘ 20	Giy	Gly Gly	Gly	Gly 25	Gly Gly	Gly	Lys	Lvs Aso Ser 30 '
Ile Thr	Tyr Arg 35	Giu	Yal Leu	Glu 40	Ser	Gly Leu	Ala	Aro 45	Ser Arg Giu
Leu Gly 50	Thr Ser	Asp	Ser Ser 55	Leu	Gin	Asp Ile	Thr 60	Glu	Gly Gly Gly
His Cys zrr OJ	Pro Val	His	Leu Phe t U	Lys	Asp	His Val 7	Asp	Asn	Asp Lys Giu A A □ U
Lys Leu	Lys Glu	Phe 85	Gly Thr	Ala	Arg	Val Ala 90	Glu	Gly	Ile Tyr Giu 95
Cys Lys	Glu Lvs 100	Arg	Glu Asp	Val	Lvs 105	Ser Glu	Asp	Glu	Aso Glv Gin 110 ’
Thr Lys	Leu Lvs 115 ‘	Gin	Arg Arg	Ser 120	Arg	Thr Am	Phe	Thr 125	Leu Glu Gin
Leu Asn 130	Glu Leu	Glu	Arg Leu 135	Phe	Asp	Glu Thr	Hus 140	Ty-»·	Pro Aro ATa
Phe o 145		Glu	Leu Ser 150	Gin	A . —	Leu Gly 155	Leu	Ser	' 160
Val Gin	Vai Cr?	Phe 165	Gin Am	Aro		ATa Lvs 170 ~	Cys	Arg	Lys Gin Glu
Asn Gin	Meo H' s 13 0	Lys	Gly Vai	lie	Leu 185	Giy Thr	Ala	Asn	His Leu Am 190 '
ATa Cys	Arg Yai	* i	Pro Tyr	Yai 200	Am	Mer Gly	Ala	Leu 205	Aro Mer Pro
Phe Gin 210	Gin Yai	Gin	AT a Gin 215	Leu	Gin	Leu Glu	Giv 220	Yai	Ara .~rs Ara
« W 225	His Leu	H' 2	p »· Z' ’-d 230	Leu		225	ATa	Pro	Tyr Leu Mer 2 40
Phe Pro	p ’Ό **O	Pro 245	Phe Gly	Leu	Pro	Ile ATa 250	Ser	Leu	ATa Glu Ser 255
Ala Ser	Ala Ala 260	Aia	Val Vai	Ala	AT a 265	ATa Ala	Lys	Ser	Am Ser Lvs 270 “
Asn Ser	Ser lie	Aia	. Am Leu	£ ł-Z»	Leu	. Lys Ala	Arg	Lys	His ATa Giu

275 250 255

Ala Leu Giv Leu 290 ‘ (2) Informacja o SEQ. ID NO: 12:

(i) Charakterystyka sekwencji:

(A) Długość: 1354 pary zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza

PL 194 248 B1 (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „SHOXb” (ix) Cechy:

(A) Nazwa/klucz: CDS (B) Położenie: 91 ... 768 (xi) Opis sekwencji: SEQ. ID NO: 12:

GTGAiTCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC 60

CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA 114

Met Glu Glu Leu Thr Ala Phe Val

295 300

TC—

AAG

TCT TTT

GAC

CAG

AAA AGC

AAG

GAC

GGT

AAC

GGC

GGA

G\xA

162

Ser

Lys

Ser Phe

Asp

Gin

Lys Ser

Lys

Asp

Giv

Asn

Gly

C-iy

Gly

305

310

215

G^r—

GGA GGT

AAG

AA.G

GAT TCC

ATT

ACG

TAC

CGvx

GAA

’<Ji -

- G

GAG

210

>* >

i— ’ . > I—·’ » »

— _reł

Λ e-0 S A

y _a

Th.”

Tur

A

ni 11

ΧΓ-ϋΤ

-

z—

uj—ν νζΐγ

jj V 15

—

^x 2 -

UJ — —

« ca—

i.ICU

UJ—

' 320

325

320

AGC GGA CTG GCG CGC TCC CS.· GAG CTG Gxj\j ACG TCG GAT TCC AGC CTC 258

Ser Glv Leu Ala Arg Ser Aso Glu Leu Gly Thr Ser Asp Ser Ser Leu * 235 340 345

CAG GAC A.TC .ACG GAG GxrC Gxr. CAC TG\- CCG GTG CAC TTG TTC .AAG 20 6

Gin Aso Ile Thr Glu Gly Gly Gly Kra Cys Pro Val Kia Leu Phe Lvs

350 355 360

GA.C GAC GTA. GA.C AAT GA.C AA.G GA.G AAA CTG AAA GAA TTC GvrC A.CC GCG 254

Aso Kra Vai Asp Asn Asp Lys Glu Lys Leu Lys Glu Phe Gly Thr Aha

365	270	375			280
A.GA	kJXUj ćj\—ζχπΛ Λ·.	TA.T G.-A. TGC .AAA GAG	AAG	CGC	GA.G GAC GT G	402
	Vai A_a Glu Glv Ile 38Ś	Tyr Glu Cys Lys Glu 390	Lys	Arg	Glu Asp Var
	TCG GA.C- AAC GA.G GAC	GGC- GAG ACC AAG CTC-	AAA	CAG	A.G\j CGC A.GC	450
’ 7*	Ser Glu Asn Glu Asp 400	Giy Gin Thr Lys Leu ’ 405	Lys	Gin	Aso Aso Ser 41Ó
CGC	ACC AAC TTC A.CG CTG	GA.G GAG CTG AAC GA.G	CTC	GAG	CGA. CTC TTC	498
-“—5	Thr Asn Phe Thr Leu 412	Glu Gin Leu Asn Glu 420	Leu	Glu 425	Aso Leu Phe
GAC	GAG A.CC GAT TAC CCC	GAC C-CC TTC ATG CGC	GAG	GAG	CTC A.GC CAG	546
Asp	Glu Thr Kra Tvr Pro 43 C '	Asp Aha Phe Met Asg 425	Glu 440	Glu	Leu Ser Gin
CGC	CTG GGG CTC TCC GA.G	GCG CGC GTG CAG GTT	TGG	TTC	CAG AAC CGG	594
-45	Leu Giv Leu Ser Glu * 450	Ala Arg Val Gin Vai 455	Trp	Phe	Gin Asn Asg 460
AGA	GCC AAG TGC CGC AAA	CAA GAG AAT CAG ATG	CAT	AAA	GGC GTC ATC	642
Arg	Aha Lys Cys Arg Lys 465	Gin Glu Asn Gin Met 470	His	Lys	Gly Vai Ile 475
TTG	GGC ACA GCC AAC CAC	CTA GAC GCC TGC CGA	GTG	GCA	CCC TAC GTC	690
Leu	Glv Thr Ala Asn His 480	Leu Asp Aha Cys Arg 485	Val	Ala	Pro Tvr Val 490 *
AAC	ATG GGA GCC TTA CGG	ATG CCT TTC CAA CAG	ATG	GAG	TTT TGC TCT	738
Asn	Met Gly Aha Leu Arg 495	Met Pro Phe Gin Gin 500 .	Met	Glu 505	Phe Cys Ser
TGT Cys	CGC CGA GGC TGG AGT Arg Pro Gly Trp Ser	ATA ATG GCA TGA TCTCGACTCA Ile Met Aha *	CTGCAACCTC	788

PL 194 248 B1

510

515

CGCCTCCCGA	GTTCAAGCGA	TTCTCCTGGC	TCAGCCTCCC	GAGTAGCTGG	GAITACAGGT	843
GCCCACCACC	ATGTCAAGAT	AATGTTTGTA	TTTTCAGTAG	AGAT GGGGTT	TGACCATGTT	908
GGCCAGGCTG	GTCTCGAACT	CCTGACC7CA	GGTGAT CuAC	CCGCGTTAGC	CTCCGAAAGT	968
GCTGGGATGA.	CAGGC GT GAG	CCCCTGCGCC	CGGCCTTTGT	AACTTTATTT	TTAAITTTTT	1028
ttttttttta	AGAAAGACAG	AGTCTTGCTC	TGTCACCCAG	GCTGGAGCAC	ACTGGTGGGA	1083
TCATAGCTCA	CTGCAGCCTC	AAACTCCTGG	GCTCAAGCAA	TCCTCCCACC	TCAGCCTCCT	1148
GAGTAGCT GG	GACTACAGGC	ACCCACCACG	ACACCCAGCT	AATTTTTTTG	AITTTTACTA	1208
GAGACGGGAT	CTTGCTTTGC	T GCT GAGG—T	GGTCTTGAGG	TCCTGAGCTC	CAAAGATCCT	1268
CTCACCTCCA	CCTCCCAAAG	T GT TAGAAT T	ACAAGCATGA	ACGACTGCCG	GTGGTCTCGA	1228
AAAAAAGoAC	7 G77AC G7 G\j	AAAAAA				1354

(2) Informacja o SEQ. ID NO: 13:

(i) Charakterystyka sekwencji:

(A) Długość: 226 aminokwasów (B) Typ: aminokwas (D) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEQ. ID NO: 13:

Mer

Glu

Leu

Thr AA a

PKe

Val

Ser Lvs i o

Ser

Phe

Asp

Gir

Lys 15

Ser

Tj ye

Asp

Gly

Λ2Γ-

Gly Gly

Gly

Glv GIv

Gly

Lys

1',’Ξ

Asp

Ser

20

25 ’

20

T ^? Ω

ψν.

Tyr

Aoc

Glu Val

Leu

Glu

Ser Gly

Leu

Ala

λτ g

^c e ”

Arg

Glu

25

40

45

Leu

Glv

Ser

Asp Ser

Ser

Leu

Gir. Asp

* s

Thr

Glu

c-iy

Gly

50

60

Ki 2

Cys

Pro

Vai

His Leu

Płie

Lys

Asp His

Val

r-.Sp

Asn

Asp

Lys

Glu

65

70

75

80

Lys

Leu

Lys

Glu

Phe Glv

Thr

Ala

Aro Val

Ale.

Glu

Gly

T ’ o

Tyr

Glu

85 *

90

95

Cys

Lys

Glu

LV3

Arg Glu

Asp

Val

Lys Ser

Glu

Asp

Glu

Asp

Gly

Gin

105

110

100

Thr

Lys

Leu

Lys

Gin

Arg

Ser

Arg

Thr

Asn

Phe

Thr

Leu

Glu

Gin

115

120

125

Leu

Asn

Glu

Leu

Glu

Arg

Leu

Phe

Asp

Glu

Thr

His

Tyr

Pro

Asp

Ala

130

135

140

Phe

Ket

Arg

Glu

Leu

Ser

Gin

Arg

Leu

Gly

Leu

Ser

Glu

Ala

Arg

145

150

155

160

Val

Gin

Val

Trp

Phe

Gin

Asn

Arg

Ala

Lys

Cys

Arg

Lys

Gin

Glu

165

170

175

Asn

Gin

Met

His

Lys

Gly

Val

Ile

Leu

Gly

Thr

Ala

Asn

His

Leu

Asp

180

185

190

Aro

Val

Ala

Pro

Tyr

Val

Asn

Met

Gly

Ala

Leu

Arg

Met Pro

195

200

205

Gin

Met

Glu

Phe

Cys

Ser

Cys

Arg

Pro

Gly

Trp

Ser

Ile Met

Ala

225

21'

220

210

PL 194 248 B1 (2) Informacja o SEQ. ID NO: 14:

(i) Charakterystyka sekwencji:

(A) Długość: 32367 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „COSMID: LLNOYCO3'M'34F5” (xi) Opis sekwencji: SEQ. ID NO: 14:

i - - 'w ·^ - ^-xkj 1·- m « ki	T CTCT CT CTT	60
mmmmmmmmmm mmmm·-·* mmmm
x yx — —
z^-* i · - w	ACACACCCCA	ISO
GTGCCATCTC ACACAAGTTC	ACAGCTCAGC	240
GaGwAGaTG cgccgtgggg	TTACGGGAGG	300
mmmmmmmm m* . mmmmmmm X x -Λ- - - y—Λ 'y.-y.yy χ y — „	m m m* m m* * — m yy—y-y—λα— —	360
AC yAz-.T TT CA GyT C GC GAT G		420
G\- y.-.’y—-.y—y
Gy-yGtsf-.yyy AGCGAGCAGG	AGCACCCCAC	480
CACCCyyTAA A.CACCCCAGA	C GC CAGyyT G	540
GCCGGGGTCC GC CGGGATCT	GGCGCGGGCG	600

m* * m·* * m* m Gw.Gft/UA.	AGATCTTTAC	GAAC C GyAT C	TCCCGGGGAC	CTGyGCTTCT	x TC«G—yyy—	660
GC7GGAGACC	CGGGAGGCGy	CCCCGGGGAT	CCTCGGCCTC	CGCCGCCGCC	mmmmmmm** m y— χ. . ———λλ w	720
—mmmmmmmmm ΧΆ—y— y x <.	mmmmmmmmmm x iyyy	GACACCCGGC	mmmmmmmmmm XX- *Xi	CACTTTCGGG	GATTCTCCAG	780
CCGCGTTCCA	TCTCACCAAC	TCTCCATCCA	AGGGC 'GC GC C	GCCACCAACT	TGGAGCTCAT	840
CTTCTCCCAA	GATCGTGCGT	CCCCGGGGCG	CCCGGGTCCC	CCCCCTCGCC	ATCTCAACCC	900
CGGCGCGACC	CGGGCGCTTC	CTGGAAAGAT	mm·* mmmmmmm	GGCTCTGCGC	TCCTCCCGGG	960
AGCGAGGGCG	GCCGGACGAC	TGGGACCCTC	CTCTCTCCAG	CCGTGAACTC	CTTGTCTCTC	1020
TGTCTCTCTC	TGCAGGAAAA	CTGGAGTTTG	CTTTTCCTCC	GGCCACGGAG	AGAACGCGGG	1080
TAACCTGTGT	GGGGGGCTCG	GGC GC CT GCG	CCCCCCTCCT	GCGCGCGCGC	TCTCCCTTCC	1140
AAAAATGGGA	TCTTCCCCCC	TTCGCACCAA	GGTGTACGGA	CGCCAAACAG	TGATGAAATG	1200

PL 194 248 B1

AGAAGAAAGC	CAATTGCCGG	C CT AjGGj^jT		CAGCG7CTC7	GCCTGCGTCC	1260
GCCGCG^AGC	CCCGAGACCA	GTAATTGCAC	CAGACAGGCA	G^GCATGv3Mvł	G\jCTGG%jCGA	1220
GCT C	fłłnł x mτ> ί Λ-ΛίΚ1.1Λν i	mrr-iriz-z-. irm.kif-x _ χ ws.-.	ATGGAAAGCC	GTAAATAACA	G^jCTGwTGn	1330
TCCACCCGCS	CGCACGGGCC	GTCCTCCCCG	CCCCGCCACA	CGCGCGCAIC	CACTAGCCCT	1440
GGCT GCT CGC	CAGCCCCG^w	CCCAG\<CATG	GAAGrtGCTCA	ULnjC x x x x cj.	AT C CAAGT CT	1500
TTTGACCAGA	AAAGCAAGGA	CCGTAACCGC	GGAGGCGjAG	G-GGCGjAjGj	TArJGAAGGAC	1560
TCCATTACCT	ACCGGGAAGT	TTTGGAGAGC	GGACT GGC’C\z	(ATC^C GvajA	GCTGj^tjACG	1620
TCGGATTCCA	GCCTCCAGjA	CAT CAC CvA.C	Gtj’** ·.	ACTGCCCGGT	/» “·* l^»R« w » izi HR -— x x Cx . '—	1680
AAGGAC _AC G	TAGnCAATGA	CAAGvirtGrtArt	CTGAAAGAAT	T C GGCACC GC	GAGAGT G\rCA	1740

1800

1360

1920 ι°εο

2040

2100

2160

2220

22S0

40

240C

4 60

2220

2640

TT GAAC ST CC ACCC TTC ATC T7GGCGAJAG C7G77GGG7C CA7AAAAACC AC773CGTGA 2700

GC GGAAjC Ar CCGGGATCTG GATGGGGCGC GA-CCkjCCCTT GCCCAACCTG GT GGCT TC CC 2 / 60

G-.AA— G.- - , 0 -	TAAGCCAAGG	TTGTCAGAGC	G^AG^-CGwx x	G x G*« Gv- <-	CCC-C-GGAC-CC	2820
CCCCTC7GGC	CCTTCCTCCT	GAGACC7CAG	T GGTGGGT CG	Ł lJVTX L?	GzAAICGGGj	2380
AGTAAGAGGC	7CAGAGAGAG	GGGC7GGCCC	CGGGGACCTC	TGTGCACACA	CGACAAC7C-G	2540
GCG<z—-*— ACA	TCTTAAGAAT	AAAATGGGC7	Gvj\-T GT G x C G	GGGCACAGCT	GjAGACGGCT	3000
ATGGACGCCT	GT^-	CATTACAAAG	AC GCAGAGAA	TCTAGCCTCG	GC7T77GC7G	3060
ATTC5CAGAG	TT GAGGT GCG	AGGGTGAA7G	CCCCAAAGGT	AATTCTTCCT	AAGAC2C7GG	3120
GvrCCAC—- CA.	TCTCCGGCCC	CCTGCAT7TG	Gvt\jT GT Gj^\G	T G\jT2 CC GGG	AAA7AGCCCT	3130

TGTATTCGTA GGAGGCACCA CCCAGCTTCC CAAGGCCCTG ACTTTGTCGA AGCAGAAAGC 3240

PL 194 248 B1

TGTGGCTACG	GT-TACAAAG	CAG x CCC C G\j	mmmmmm·· mmm Xx ix ΧΧΛ-kL-—J·	T CTAAGA^,cj^r—	AG\jAG— ccag	32GC
CCTGCCTTTG	ALA-UtT LłALeAaj	IjAJj X x UL· x’-'w	CTACACACZG	CT GCGjG—Al.	C X* xjvrk-xiL· 1' Lr x	3360
AATTCACACA	CAGAGAG7TG	GCCTTCCTGG	ACGCAAGGCT	GGGAGCCGCT	TGAGGGCCTG	3420
CGTGTAATTT	AAGAGGGTTC	G—AG—G— CCG	GCGGCCGCTT	CTGTGGGGTT	GCTTTTTGGT	3480
TGTCCTTCGC	AGACACCGTT	TTGCTCCTCT	GAACTCTCTC	TTCTCCCCCT	GGC C GT GGAC	3340
CCGGGAGAGC	AAAGTGTCCT	CCAGACCTTT	TGAAAGTGAG	AGGAAAATAA	AGAC CAGurC C	3600
AAAGACCCAG	GGCCACAGusA	GA.G^j^GaCAG	AGAGTCCCCG	^£»^m»«im m m	CCCTTGGCTC-	2 650
GGTGCAGAAA	J~ mmm^rnmrnm	C CAG\tACT gc	CACCCAGj\,T	•l mm* mmmm mm ACxAi X .ΛΧ X	CATCAGAT C C	2720

AAG7CA—AATC Αγ-AGv>j^srw^ AGTCTGmG\jx CAC—£« ¹ * m —.

CTGGAGTC

ΤΠ,Β1ι.>-Ί * m* r**·* x - kJWKrtAA-Λ uta

7GTC—CC G—-«juiG-—TG GuxrtG'—Cx

R -b mmmmm “mm — «νΐ.ΧΙ'ΛχίΛ ALa-——xvj—.jutu

TGTTTGAGGA CTTTGAAGAC ?CA ATTCCTGGGG TTCAGACT

GAGAAA7 GAA. G*—--vGv — m^.mm^n^, mm·* mmm* mmm m mm·» . —Τ.1ί\5^+-Η-Λ, L- XW“. X X —.-.X. - - <JVTxJUC aa:

wrw x '-j x

ZAiGssAGsjTGA aacags

CACG

T7GGAG7AAG ——A.GC· cc:

SW. -JW

-* mmmm m ·*·**..»» m -»*.** ·-*“*/· n m* * m* m m mm mmm* mm* mm m * mm mm mmmmm mmmm* m * m* .“.- wCj. juńAl; Λ^·ν«»Λ\ίν\?ι vv*AVW«xi x — — — — x _— — xuxrxisrt.L-rt—

3750

3540

Ξ SCO

2960

4020

4050

4140

4200

CCTGGA'

AGCTCCC

GT TG~.-.GCGj CCTTGCC2

GACTGTTTCC	AGACT.AA-.CT	7CCAAACG7C	AG— ——* CAC	C — X ΛΓ.¹—		4 2 5C
T CATTA.GGGC	m m m m mm	TC7CATCTGT	Gx.TCAG\—ΑΆτ	CCCGAGACAG	G.AACAGAGGG	4320
G^—xj x T jjAGt·.	TujCCACT. -C	ACCAGCCCTG	GGTTGAAGGG	GAGCGAGGGA	GACACC7TTT	4350
ACCCAAACCC	CTGAGCTTGG	T CAtr-. GAG-r—	T GAAT GT CTG.	AAAT GAGwA.	GAAAAGGT TT	4440
TTCACCTGGA	AACGCCCGAG	GGCTGAGTCT	m mm m m mmmmm .X. —	TGACTCCCCC	AGCAAATACA	4200
GA.CA.GGT CAC	CAACTACTGG	AGACGAGAAA	mmmmm* mmmm l?X Λ,'-Λ* XX-	CGGCACACCC	T GGC GGGGT A	4260
GGTGCCCGAC	CGCGTGC GAA	AA-.GTGGGAA	m — -X m * m * pnmm	C T G·—sj·—AC <rC	GGTTCAGCCC	4520

kG AC

-Cl G.?7.

T GAG.-AACAG

C—AAjC

GCCTC

ΓΑ GGC

4630

4740 .'-j.——.G*—_

CCCCGTGTCC

TCTTTCCCTT

AAAGGTTAGGGGCCAAGAAA

TCGGCTTTTG

GCCCCCTTTC

CCTCAGCCCT

ITCCTA GCTCCGCCAG ATCGCGGAGG GACCCCCAGC CCTCO

G\j\jAT AG.. GT	CTCTCCGTAG	GCCTAGAATC	TGCAACCCGC	mmmmmmmmmm X»X»x> χ χ.^ *	4300
i. . CCCio\?Kn— J	TCCCGCCGGG	GATCCCACAG	TTGGCAGCTC	TTCCTCAAAT	4860
AAAAATAGGA	TTTGACACCC	CACTCTCCTT	ΑΑΑΑΑΑΑΑΑΑ	AATAAGAAAA	4920
TTATGTCAAC	AGAGGT GAAG	TGGATAATTG	AGGAAACGAT	TCTGAGATGA	4980
ACAACGCTCC-	TGCAAAGCCC	AGGTTTTTGG	GAAAGCAGCG	AGTAICCTCC	5040
CSTTATGGAC	CCCACGCAGT	TTTTGCGTCA	AAGCGCAITG	GTTTTCGAGG	5100
CACCGCGGGA	TGCACGAAGG	GGTTCGCCAC	GTTGCGCAAA	ACCTCCCCGG	5160
GTGCCCTCCC-	CTCCCCACGC	AGGGATTTAT	GAATGCAAAG	AGAAGCGCGA	5220

PL 194 248 B1

GGAC GT GAAG	TCGGAGGACG AGGACGGGCA GACCAAGCTG AAACAGAGGC GCAGCCGCAC	5280
CAACTTCACG	CTGGAGCAGC TGAACGAGCT CGAGCGACTC TTCGACGAGA CCCATTACCC	5240
CGAC GCCTTC	ATGCGCGAGG AGCTCAGCCA GCGCCTGGGG CTCTCCGAGG CGCGCGTGCA	5400
GGTAGGAACC	CGGGCGCGGG ggcggggggc coggagccat cgcctggtcc tcgggagcgc	5460

ACAGCACGCG TACAGCCACC TGCGCCCGGG CCGCCGCCGT CCCCTTCCCG GAGCGCGGGG 5520

AGGTTGGGTG AGGGACGGGC TGGGGTTCCT GGACTTTTGG AGACGCCTGA GGCCTGTAGG 5580

ATGGGTTCAT	Xur<.Lrx χ χΤχ 1	TTTCACCAAC	AGCAAACAAA	TAIATA7ACA	TAIAIATTAT	5640
ACAAATAACA	AATAAATATA	TATGTTATAC	AGAT GGGTAT	ΓΠΦΦΓΠ7Ι m-71 φ> Λ- -'αΧΛ*ΛΐΛ	TTA7AGA2AT	5700
jji m z»» i iii i z^-1 ίι^·*·	T T GtT Gv-AAA	Gr\CACi. x	GAACCCATAT	ATTGGC7CC7	GACTGCCTTC	5760
GGTT CC CCT G	Λ» ΛΧ fTlT».<7 młl^ 7^ ΤΤΓΤ.Χ X TT X -Λ	TAGGGGCAAC	ACATGCAAAC	AAAACTTTCC	CTGGATTATA	5820
CTTAGGAGAC	GAAGCTACAG	Αινί-^i x x Trt	TCCAGAGTG7	7TTACAAGA7	^iTi mm m τ^φφ,ηι^	5880
.Ą/WWLT./t, T	TGTCTTTTGr	CCCCTGATTC	CCCTCCGTCT	TCCCGTGTGG	C_G_A7TGAA	5940
•7 71 — m ΛΛ'αν x . i 'x. ·_ x	TAGGAT GAAA	GtAGAGtttT	GTCCTCTGTC	CCTAGtTGGA	GAGAAACAGG	6000
GTCT7CTCTT	TCCTCCGTTT	TTTCACCTAC	CGTTTCTATC	7CCCTCCTCC	CCTCTCCAGC	6060
CCTGTCCTCT	GCTACAAACC	ACC C C C^mC CT	CCCTCCGtCT	G x Gmju-tGs. »j	CAGtAGCAC g	6120
T T GtGCAT C T	GtAT GACA. Gvj	AGACTATTAG	CGttt\-ACGt	tttCTCCCCG	AGGAGC GC GC	6180
GrW* -		GACCAGGCAC	C 3www Gt	-wTTG	GGT GT CCGCA	6240

6200

60

6420

6480

6540

6600

6650

6720

6730

6840

6900

6960

7020

7090

7140

7200

7260

PL 194 248 B1

CCACACTATT

ATTGGTTC

AAGCTGC cc:

CAC

CATTCAAACA

TGGAGAGwT

GGCTCCTGAI

GTTACGATTA

TACAGCCCAG

GGCGTCTGTG

ACCCCTCTGG

TCGCTAAAGG

CAATATATCC

AAAACAAACA .GTAA

CAACTTTTCC	ATCGATGTTG	C7TAGGAGAT	GAGGATACAG	ATGCGTTTGA	7320
TTTACAAGCT	CTTTCATTTA	AATAIAIAIA	TATATAIATA		7380
TCTCTTCCGT	CTTCCCATGT	GGCTGCATTT	TAAAAGGCTT	CCCTAAGATC	7440
AATCAACCCT	CCCCAGGCAT	CTTTACCGAG	GGC x GT GGT C	CCCAAAGCGA	7500
GAGGGAGAGA	mmmmmmmmmm	ACTTGGAGGA	AGGACTGTGT	CCCTCCTTAG	7560
GCCTCAGTGA	GGGAAGGAAG	CTGCATCAGA	CAGGGGTTTC	CTCGCTGTCC	7620
CAGAAGATGG	ATTGGGCTGC	CCCGTATAAA	TTAATGAAAA	GATTAAAGTT	7680
GGACATCGAG	TTTATGTGTC	ATCTCCTGGT	GTCTGTGTGC	CTGGwTCTG	7740
CAG- C C - 7 GA	TGTACTGTTT	CTATAAAAAT	AAATTACTTG	TAATTTAATT	7300
TCTTTCTGTA	GTCTATTACC	GACGAGAGCA	CGTTAGTTCA	G_±GCGGAAA	7360
GGGT GT GT GC	GuirG—C uiriG	AAC 'G— — C x -rA	AAT.-AAGACA	AA* C ij^rjyafkC	7920
m·* ipł^m» iimii m x -Λ- u—nx — G	CAG»jwT C	A.T GAAAAT T T	AAC GnC GjTA	AA7AATAATA	7930
TGGGAACGCA	ATA-AA.GAC-.	TAATT CT CCA	* C -r——śj⁴— »j*wj-ur	GGGAAAGGAT	8040
. A-G\jC »xAGT GC	GCTTTGAGGG	m m Z- -1 m * * -1 1 1 <J i Λ_	TOATTAGTT	CCAACACC-CA	8100

TGtłGvj\j\=ACG G«j\jACjAG\-3. G^jAC-.GAAA aag?aac:

G mmmmmm*, mm·** mmmmm··*· mm*. m *, mmmmm—,,— mm m —»m —« ~« m * m r.’—n._+r- ir_ L _'—-‘.□r λΙρ-—Gx&M..^wnC

- <ΛΛΛ4. ± .-ŁCW .GT TTCAATTTAC TGTGGAAAT7 mmmm.

C-TAAA

C-A—TGAG^-A TCT,=ATAGAA

ACCTTT TA77TTTAGC GTGGCCCTGC AAAG7CGTA7 CACCCAGCTC

CAGGCTTCT m Cis/\rtAGT TACG..G.“.C<-λ C^uri CAG^—ktGTAA

TAC.-.

i**i mm**· -Λ- U GTT TAT GGC

AGAGC

·. * λ rnmm * ’ .CTGTCTC-TA r*._

LA AAAGGAAA7C GCAZ .AtUZNn— Λ- χ GAAA

AGT GCTC T T 7

AATGAAG?

S1 so

8220 a 29 o

8340

3400

3460

5820

3580

TTG

CCGGTAGGAC

TGTTGGGTTC

CAACTGT — X j. ΛΛ —GT w A*—c-.Cł-iC — T CA C i Tr*.¹— —A7A.7 T 7 Gj*—-—TAa

TCATCACTTC

ATGAGGCTTT i m m — mm r* m, mrn . χ xr<j\j χ ŁrG— x

TGGAGAGGCA

AGCTTTGGAA

GuT GT GAG^nj

TGAGGGTTTT

AGGłjTGtaCTG

TCGT GAA.TCA	CTCCAAGACT	GATTTATTAG	CGCTTC-.CGC	AGC GGCTAAT	0640
γ *· rpm^——> m	jm·* mimum·!iminm	rnmmjmmmmmj-m		^-mm·· mrnm*.	P~nn
CCACGTTTCA	m m « m m <. mmmm x _ -	CTTTTTTGAA	AAATGCCCTT	mm* m* mmmmm Ux-A<sAx^y—x *	8760
m m—i m —m m m •Αλ* X X L 1 -	CT G^r^·—CCTG	GAGGAGACAG	GC GGAGAGT C	m * m mm m m — m x UikVjV7X A	8820
CAGTGnjCAGG	TCACCTGGAT	GGT CAGT GGA	GGT GGA.GGT C	T GAAGk?\„ ky—C	8880
ATTATTGGTG	AATTTCGATG	TCAGCACCAG	GCAGGGGCCT	TTTTGGCGGG	8940
AGGATGACTT	TGCTGGGAAA	CAGGATCAGG	TTCTCCAGGC	GCACTGCAGC	9000
CCACTTTGGA	AATGrAAAG-	CAGTTCCGAA	AGCT GGGCTG	GAAGCTTCCG	9060
AAGAGCAAGT	TCACGTTGCG	CTGTGTAGAC	TCC7GGCTGC	TCCCAAACTC	9120
CTGAGGTTCC	CTTCAIAGGG	G\-AC C GGC C C	TGGGCCATGC	ACAGTGCGTA	9180
TGjGCCGAGG	GACCCAGCAC	GTGTTTTGCC	CACAACAGCC	GGAGTGACTG	. 9240

PL 194 248 B1

GTTCACTCAC	CGC CTTGGCG	GAGGACGC CT	GTTCTCTGGA	mm* * mm * mmm ~ mj~ - . - , π j-i ΧνηΛΛ'-Ίχ _ _ L.l, iLjvAj-xG	9200
GTGACTGCCT	TGTGGGTCAA	GuTGCAGmTT	TTCTGCCACA	GAAAAC C T GT TAGGAGGAAC	9260
TAAGCGACTA	AGACTGTCAG	GGAGG7GGTG	GTGGGGGAGA	GGAGGGGGTG GTGTCCAGAT	9420
TACCAGGCAT	AGGCTAAACT	GCCTGCACTC	mmm* mmm»mmm X G —- -Λ71	CT GT CT GT GG AGGAGGGGAT	9430
TGTCAAIACT	GGGAGAGGAG	AGGAGGCTCG	TAGjAGGTGA	GAGm\j\j«j7 aattt gcat g	9540
CAAATCTTCA	CATGAGls%-CT	GTGTGAATTT	CTCCAGCCTC	CTGAGwTCC CCTGCGCTAT	9600
TGCACTCAAC	TTCTTGATAG	TTTACCCCAA	GACTCAGAAG	TCCTTAGAGG GGCAGAATGC	9660
CCCCACCACA	AAGCCTGCTA	TCCTTGGGCG	TCCTCAGGAC	CC7TGGTCA7 GAATGGGACC	9720
CTTTCATGTA	T GGGjAC c c t	T GGTAATAT G	AATGGGACGC	CTTCAGCTCC CCAGGGCTTC	9730
CGAGGAGGCC	GAGAAGGGCA	AAGACACTTC	C ŁjrtGjA.Gvj^- C	GAGAAGGlzCA aagacat ttt	93 40
CT GGGCT T Gj	TGTGTCAAGA	GC TAGAT TGG	AGAAGGGGC T	mm* mmrt^m·** * m mm mmm* OjkJiA— j, - *— - — . „ —“lGC —	9900
ATCAGCTCAC	CCTCTCCGTT	T GT Gj-'— - AAA	GT CT GAAGGT	GGAAA CT T C G GT T C T C C TA.C	9960
AG\jGT ctaca	GGA.GT T GGGG	GCCGCCCCCC	C mACACAGAA	C G- - GssAAAG TTC GACAGT C	10020
CACTTCCACT	GGCT C GGAA.C	TCACTTTTTC	ACCTTAAC-TT	CATCAGCGGT AACT-CATAGG	10030
TCTCACTTAG	G>_*—.Gwr-r—AC G	GA.TGATTTAA	CAATTTCTAC	T. C —rtC^s-C.-. G\jTG-<tGTGG	10140
CTCACACCTC	TAATCCCAGC	AC -TT G*j\m,G	CCAG\rA.Gv7	GT '•jkt.-.T C GC Τ T GAGG7 CAGG	10200
AGTTTGAGAC	CAGC C T GGC C	AACA7GG7GA	AACCCCGTCT	* * * m * mm* * * * mm*	10260

GGCAGC

- - ---.24.-C..TGTAATTC CAGCTACTCO

AGGC7GAG GCAGSAGAAT

Λ- Lr i —-

CGCTIŁ-ACC	TGGGAC-GTGJ	ACTTTGC.-.G7	GAGG7GAGA”
TC-GATGAGAC-	AC-2AAGAC7C	TGTCTC.-99A	ACAAAATAAA
AAAAAAGRAA	ACTTAATTTC	CA.GT T C TAGG	CGAGG7GGAG
AGGACTT72-G	GAGGCCCAGG	AGw χ G\jAT C	G—TT GA.Gv?T C
Gm -mAACAT G\r	TGAAACCCCA	TCTCTACTAA	AAATACAAAC

GACACGAC73 CACTCZAGCC

ACAAAA?

GTTAG

A AAC-.Aotcgg-.icco iTTCG--. GA

TGCS2C7C-7A ATCGGAGCTA CTCGGGAAGC 7GAGGC7GGA GAATTGG77G AATC7GGGAG Oi GWO·.·. . j Cr*.G\j^AG^j\.sT A.GA.TA.GTGCG ACTGCAGTCC AGCCTGGACG AGAGA

AAG

ACTCCGTCTC AAAAACAAAA GAAAGCA

111 ΙΓΣΣ11 .CAAAAAACA AGAGACCAGC CTGGCCAACA

TGGTGAAACC GCGTCTCTAC TAAAATACAA AATTAGCCGG GCATGGTGGT C-GGC-.CCTGT AGTCCCAGCT ACTCGGGAGG CTGAGGCAGG AGAATGGCTT GAACCTGGGA GGTGGAGCTT GCAGTGAGCC GAGATAGTGC CACTGCACTC CAGCCTGGGC GACAGAGCGA GACTTGATTT CAGAACCACC ACCACCACAA CAAAACAAAA CAAAAAAICC AAAAAAACCC CAATTTCCAG TACTAGjx^G TCAGTuLrtTGl·. AG^jGCTGGAG ACAGAGGGGC GGTAAGTGTC TGGGCGCCCA CCATCAGTCA CCTCCCAGCT CCCAGAGGTG CAAAGTGCTT GGTTCAGCCT CATGGGAAGG ATGCTCCCTG GGGAGGCTGG GCTGGGTTCA CAGGGCTCTT CACATCTCTC TCTGCTTCTC CCCAAGGTTT GGTTCCAGAA CCGGAGAGCC AAGTGCCGCA AACAAGAGAA TCAGATGCAT

102::

'.023 2

10441 ' π - r Λ

1023·:

10622

10662 ”l0740

10302

360

10920

109S0

11040

11100

11160

11220

11290

PL 194 248 B1

AAAGGTGGGT G7CGGGACTG GGGGGACCTG AAGCTGGGGG ATCCTGCTCC AGGAGGGATG	11340
GoGTCGACGA GGTGCTGGvx ACACCCAG^A CCACCACAC± GACAC—C— CTTTGyAC	11400
ACAGGCGTCA TCTTGGGCAC AGCCAACCAC CTAGACGCCT GCCGAGTGGC ACCCTACGTC	11460
AACATGGGAG CGTTACGGAT GCCTTTCCAA CAGGTAGCTC ACTTTTTCTT CCTCTGAAGA	11520
TCCCTAGGGA CCTGCTGCTC CCTTCCCCTT TCCCCTATTT GCTGCCGCAT CCTGACACTC	11530
CTAGTCCCTC CCTGCCCCTG CAGACTTCTC AGCTGGCCCT TAGAAAAAAA GCCTCTTTTC	11640
CGAGGAGGCA TTTACAGGCA CCTTGGCACC TATGAAATCA GyCTGyyyCA GGCGGGGTGG	11700
CTCACACCTG TCATCCCAGC ACTTTGGGAG GCTGAGGAGG GTGCATCACC TGAGATCAGG	11760
AGTTCAAGi-.C GAG—CTGy—— AAGTTAACGn AACCCCy^CT AT-AAAAATA CAAAATGGGT	11320
GTGyTGyCTC ACGs-CTGTCA TCCCAGyACT TTGGyAGyyC GAGy-AGyTG GATCACCTGA	11330
GGTCAGGAAT TCGAGACCAG CCTGACCAAC ATGGTGAAAC CCCGTCTCTA C7GAAAACAC	11943
Ary^G—7—-.G— CGyyy-jiGyχ Όχ.Ά.A—AC— TGxGA.TC—GyxA.Cx*Gyy .r.Gu-GAGAATC	120 CC
ACTTGAACCT GGGAGG7C-GA GGTTGCCGTG AGCCAATATC GCGCCACTGC AC7CGACTC7	12060
GyyTGACAGA GTGAGACTCC AAGACTCCAT CTCAAAAAAA AAAAAAAAAA TCAGGCTGTA-	12120
* * * * mm m* mm mm-mm m m * * m <* mm** m* m* z^-·* m* * m m m m·* ** m * m * * * m»-»m «* * m ****m m rtrtftn-UyWf. 1 χ x yyyru-iyy x WanftA* y * y aLA/waClλ	12130·
G?.GGG57GAA AAG7CCACAC AGTCAGGCSC CCCCACCTGG C773C7GCC7 C-2-77Ą-.-29.-.0-	12240
C-GCGCAGA.7G CC7G7GCC7C- GA7ACCAGAG A7GGGACAGA CACCCA77CC C7T7TCA7C.-.	123C0
Ci—-iC—.y——x=j-l GTG·— ——.GAGy GyCTGyyy—G TCTG— CTGyy CCCTGyyCC— TGGCTTGGGC	12360
TCTGCACCTC TGAA.CTGGAG ACACCCTACT CAGCTCCCCA CTTACTTTGG A.G7GAGCAGC	12420
ΑΊΤΟΑΙΆ CCAG-GTGGA. TTTGGGGCTT CCAGGGAGTC GGGGTTCGGT CGCGGAGCCC	12460
A-n-G—«C—AGyy— yv.CC— CG——CTG——C TGyyTTAGTG GTGyyGATGG GATGGGGGGA	12540'
AAC. TG-y_ Gjj-y.G GAGurTGAAGy G7CACAGGAG GAGAGAGCGC A.GCGCCCA.CG	12600
TGCGCCCTGC CTG.AACGCGC AGCGCAGCGC CCGGC7GCGG 7GCCCC7TGC CCCTTCGGTC	12 660
C —-λτϊ—x-yy Gw?y — TG—ATG—G\-y Gy— yynACyy GyTTGyGGGG GGGGCTCTGG
CAGGGCGGAC GCGTGGCCTC CCTTCTTCAC CGTTTTATTC CAAC-GGGACA GGCTGGGGAT	12760
7Gx ATT a yyy CG-yxG7TTG G-TGAGGyTG CAGGGACTTG GGGGGTGGCG GTGGGGAGCG	12940
CGGAAGGTAT AAACG7A.TAA ATCATAAGTA AACAACTCAG AAATGGACCC CGAGCGCTGG	12SOC
TCG--GCxA.G CTCTCCAG^-T CTCCCTGyCC CAGGCCCGAA GyAGAGGGGT CCGCATCCCT	12960
CCGCGGTTCT CCTCTCCTGG GTACCTGGCC TTGAGGTGGG GGAACGAGCC TACTTCTTGT	13020
ACCGTCTTTT GyCynCGGCG GGACCCAGTG AAATTAGGCC GTTGGAGCCC GCAGGCCTGC	13080
CTGGCTTTGC GCACCGGAGT CTTGGGGACC TGGTGTCCCC GGGAAAAACT TGGGGACCTG	13140
GTATCCCCGG GAGAGGCTTG GGGACCTGGT GTCCCGGGAG AGGCTTGGGT ACCTGGTTTC	13200
TCTGGAAGAG GCTTGGACAC CTGGTGTCCT GGGAGGGCCT 7TGGGACCTG GTGTCCTGGG	13260

PL 194 248 B1

AGAGGCTTGG	AGATCTGTTG	TCCTGovjAGA	GmCTT G^jutusA.	CCT Gm x Gx CC	CT GmAGAGGC	13320
TT GGGGAC CT	GGTGACCTTG	GAGAGGCTTG	GAGACCTGGT	GT TCT GGGAG		13380
	CTGGGAGAGm	CTTG^?vrtjAC'^.	TGGTGTCTCT	GGAAGAGGCT	TGGACACCTG	13440
GTGACCCGGG	AGmmmCTTGm	GGATCTGGTG	T C C C GGGAGA	GCCTTGGGGA	Cs,TG\jTGTCC	13500
TGGGAGAGGC	TTGGGGACCT	GGTGACCTTG	GAGAGGCTTG	GłjtaAC CT GGT	GTCCTGAGAG	13560
AGCCTTGGGG	ATCTGmTGTC	CCAGGAGAGG		TGGTGTCTCT	GGAAGAGGCT	13620
TGGACACCTG	GT GT CCT GGG	GAGAGGCTTG	GGGACCTGGT	GT C CT GmGAG	AGGCTTGGGG	13680
ACCTGGTGTC	CT GGmAGAGm·	CTTGGAGATC	TGGTGAGCCG	GGAGAGGCTT	GmGmAC C T GG	13740
TGTCCCGGGA	GAGGCTTGGG	GACTTGGTGT	CCCGGusriGAG	GmT T GAACAC	CTGGTGTCCC	133 00
AGGAGAGGCT	T GGGGAC CT G	GTGACCTTGG	AGAGur— C T A?	GuirtC CT GmT G	AC C C -ukjuiAGA	13860
GmCTT GmmmA	CCTGGTGTCC	T GGGGAGAG-	CT T GGGGACC		GmAGz-.GmmTT	13920

GGGGACCTGG TGTCTCGGGA GTGmCTTGmm GACCTA.GTGA CuCmmw-GAG GCTTGGGGAC

CTGGTGTCCC GGGAGAGGCT TGGGGACCTG GTGTCCTGGG A.GAGCCTTGG GGAT

μ. <jm.m

TCCTGGGGAG AGGCTGGGGG ACCTGmTGTC TCGmmAGAGA GmCTTGmGGA CCTGGTGACC

GA.GAGGCTTG GmGA.CCTGGT GACCC GGGAG

C G\jGAGt*.Gvj^	TTGGACACCT	ΜΜΧ U^ w-ww-Λί
AG^wC i._	ACCTGGTGTC	CT GGGGAGAG
CTTGGGGACC	TGmTGACCCm	GusAGł“*Gu=M T T
AGCCTGGTGT	CC CGMMr-iGAG	C CT T

G i G.-..	.-.G.-Jr-A, x Gm	Gusj-tC — . Gm χ m
GGAGAG.-_-.CG	X - 'J i «γΑλ. wA	AAGTCCCTGA

GCTGC

GGACACC*

CAGmx GrtC·—T

IATTT GT

i. Ul i w

Gh.Gm*— * _Λ Gm\7 .cr.krou _ i

CCCCTG?“Jjmm CC

G.AAGGAGGAA AGC ίτ.Γ_-.ι...Ί.

13S8G

1404C

14100'

14160

14220

1428C

1434C

- λ i rt r = “ “ k u

460

14=20

14580

1464C

14700

14760

14320

14880

14940

15000

15060

15120

15180

15240

15300

GCAGTGuCAG cgccaattct gggccagggg

GT Gvj\j\zT G\jT C_ CCACk j J..Ą.

GGGTTTCC

- C —-v.7.-.Cr..-.CCCCCAGTCC

CCATCCTGCG CCCTCACCCC GCC

GAAGGCGTGG CCCACC :ccg ctcc

CCCGCACCTG CACC

1AGG TCCAGGCTCA G2TGCAGCTG

TACO

CTGATGTTCC CCCCG\_CGv.<. CTTC-j*<rjCTG CCCATCG^GZ CG^TGGCCGA GTCCGCCTCG

GCCGCCGCCG TGGTCGCCGC CGCCGCCAAA AGCAACAGCA AGAAITCCAG CATCGCCGAC

CTGCGGCTCA AGGCGCGGAA GCACGCGGAG GCCCTGGGGC TCTGACCCGC CGCGCAGCCC

CCCGCGCGCC CGGACTCCCG GGCTCCGCGC AC CCC GC CT G CACCGCGCGT CCTGCACTCA

ACCCCGCCTG GAGCTCCTTC CGCGGCCACC GTGCTCCGGG CACCCCGGGA GCTCCTGCAA

GAGGCCTGrtG GAGvuAGGCT CCCGłjuACCG TCCACG—ACG ACCCAGCCAG ACCCTCGCGG

AGATGGTG^A GAAG^j^kjoAG CGGGTGAGCG GCCGTGCGTC CAG^CCGGGC CTCTCCAAGG

CTGCCCGTGC GT C k. ΪGGGAC CCTGGAGAAG GGTAAACCCC CGCCTGGCTG CGTCTTCCTC

PL 194 248 B1

TGC7A7ACCC 7A7GCATGCG GTTAACTACA CACGTTTGGA AGATCCTTAG AGTCTATTGA	15560
AACTGCAAAG ATCCCGGAGC TGGTCTCCGA TGAAAATGCC ATTTCTTCGT TGCCAACGAT	15420
TTTCTTTACT ACCATGCTCC TTCCTTCATC CCGAGAGGCT GCGGAACGGG TGTGGATTTG	15460
AATGTGGACT TCGGAATCCC AGGAGGCAGG GGCCGGGCTC TCCTCCACCG CTCCCCCGGA	15540
GCCTCCCAGG CAGCAATAAG GAAATAGTTC TCTGGCTGAG GCTGAGGACG TGAACCGCGG	15600
GCTTTGGAAA GGGAGGGGAG GGAGACCCGA ACCTCCCACG TTGGGACTCC CACCTTCCGG	15660
GGACCTGAAT GAGGACCGAC TTTATAACTT TTCCAGTGTT TGATTCCCAA ATTGGGTCTG	15720
GTTTTGTTTT GGATTGGTAT 7777777777 77777777^7 £77^7-77^	1575 0
CG^^^AAaGzia— Tx.\ov-A±AAGA GACG\w*rtCkj^M-kj TG^j-lTGw-AAG GxGTCATACT gatatgca.gc	15840
ATTAACTTTA. CTGACATGGA GTGAAGTGCA ATATTATAAA TATTATAGAT TAAAAAAAAA	15900
AC.'_. .'.mCw. CCviCAAC*jT CCAACGTGuA aaaggcgtta cctcttctcc	15960
C-rvG<,, . Gvz\_CA CiCACAnj-^^C TTTG^^AAAAA TCACGGGTGT AGAGATGGCC	16020
CTGGGCGCGC TGGGAGTGTG GTTGTGTTTC TGAAGGGGAT AAAAGAGGGC ACGGTGGTGC	1605 0
CAnGrv—ł..CA Gx x — G\jiJT.Ci— £οΛ&_.ν^ΤΤ C t AG^wkrTAAAAG CCAGGGAGAG	16140
ATCCAGAGAG TTTTCAAGTT TTTGCAGATG TAGGTGGTTC CAGCTTTTC7 TTCTCCCCTA	16203
CTCCATCTTC TGCGTTCCCC CAGTTCTTTT AT77G7T7G7 77777A7777 TGAGACAGAG	152 7 2
AC77GG777G TCGCCCAGGC TG3AGTGCAG TGGCGCAATG TCAGCTCACT GCGACCTCCA	16222
CCTCCCGGGT TCAAGCGATG CTCCTC-CCTC AGCCTCCCGA GTAGCTGGGA CTACAGGCAC	15280
CTGCCACCAC CCCCGGCTAA, 777T77G7A7 77ATAG7AGA GACGGGGTTT CACCGTGTTG	16440
GCCAGGCTCG TCTCGAACTC CTGACCTCAG G7GA7C7G77 CGCCTCGGCC TCCCAACGTG	16500
CCCCCAG7TT TATAAACAGC AGATAGCAAC TTG7CGTCAC AGCTGGCATG GGCTGGACAG	16 = 60
T7GC7TG-AA. TGACCTAACC AAAAACATTC AAGGG77C7G CCCCCA.GA77 TCGGGAGA.7C	1 c c 2 0
CACGTTCCAT G77CTGA7TG G7777C7GGG AACACAC-CAA C-GGGTTTGGT GACCTCCGAG	16650
AAGA7CCA7C TGCATGATTG GCAZTA.C-7TA. CCACAGCCTG CCCAGAGAŁA AAC7A7G777	„16740
TCCCAACATT TACTAACATC CACTGG7CAA CTCTCTTATT TCCAIAACAC ATTTGCATCT	168 00
TTCTGGATTC AAGCTTGGTG GTTTTCTTTC CTAACTTCTG ATTTAGATAC TTCTCCCTGA	16860
GGTGGGGATA AAAGAAAAAA AAAAAACAAC 7777777777 CTTCCGCATA ACACTTTCTA	15920
TCT7G7CAC7 GAGC7GAACT GTAGATCCAT TTGGACCCGT CTCATTTGTA TCTTCTGAIA	15980
TTC7TTA7AC AAACCAAAAG TCCCCTTCAA CAI77TTTAT GTCAAAAIGT TACAACCGCT	17040
GTAAAATGAC GGAGAGAGAG AGAAAGAATC CCAGACATTA ACGGTA77AG AGAG7TTGCC	17100
7CA77CA7CG ATTTTTCTTA AAAGCTGGAA ATTAAAAAAA AAAAAGAGAG AGAGAGGCTT	17160
TAATAGTTAA GCTGAAATTT TTATCGAAAA GnAGAAITGC ATTTTGAATC TTTGGGAAGT	17220
AGGTTCATTC ATCAGAGTAT GTAACCCTTT GGAAAAGTGG TTGGTAAGAT ATGTACAGCC	17280

PL 194 248 B1

CTAGA777T7 T777777TAA CCAAAAAGGC TGAG7AA777 TGAAAAA7CG AAACATAACA	17340
GTG7G7CA7C A77TCC7CCC AAGAAAAAGC 7CACTCCACG TGAG7AGAAA GACATCTACC	17400
7GG7CCC7GT AGAATCTGAA CGTT7C7C7T TAGAGACGGA ATTTCAATCT TGTTGCCCAG	17460
GC7GGAGTGC AGTGGCACAA TCTCGGCTCA CCGCAACCTC CGCCTCCCGG GTTCAAGCCA	17520
T7CTCCTGCC TCAGTCTCCC GAGTAGCTGG GATTACAGGC ACCTGCCACC AGGCCTGGGT	17580
AACTTTCTGG TATTTTTAGT AGAGACAGGG TTTCAGCCTC CCGAGTAGCT GGGATTACAG	17640
GCACCTGCCA CCAGGCCTGG GTAACTTTCT GGTATTTTTA GTAGAGACAG GGTTTCAGCC	177C0
TCCCGAGTAG CTGGjATTAC A&a^-ACCTG^ CACCAGj^-CT Gu^jTAACTTT CTGGTAGTTT	17760
TAGTAGAGAC AGGGTTTCGG CCTCCCGAGT AGCTGGGATT ACAGGCACCT GCCACCAGGC	17820
CTGGGTAACT TTCTGGTATT TTTA.GTAGAG ACAGGGTTTC GGCCTCCCGA GTAGCTGGGA	1788C
TTACAGGCAC CTGCCACCAG GCCTGGGTAA CTTTCTGGTA TTTTTAGTAC AGA.CAGGGTT	17940
TCGGCCTCCT GAGTAGCTG\j GACTACAG^j-C ACCTGCCACC AGGCCTGGGT AACTTTCTGG	laooo
TAGTCTTAGT AGAGACAGGG TTTCAGCCTC CCGAGTAGCT GGGATTACAG GCACCTGCCA	18060
CCAGGCCTGG GTAATTTTT7 TGCATTTTTG G7A.GAGACAG GTTTTTGCCG TGTTGGCCCG	18120
GCTGGTCTCA AACTCCTGAC CTCAGG77GA CCTGCCCGCT TTGTCCCTCG CAAAGTGCTG	18180'
GGAT7ACAGG CGTGAGCCAC CACACCTGGC C7GAATC7GA ACTTTTAAAA GGGAGTTACT	13240
GACTCTCAA.C TGxGv.\zxruvj^—Cx^jTTTCACx TTGATTTAAT A.TGGAAAGAG GGCCAAGTGT	18300
CATC· --CA r*-rs._krijvjxC<z<r <z^jrTJT.G\__-Arri_ C.-inzxC Gr_rt.C χ G X Cu-uG GGT GG-GACA-C	18360
GAGTGTCTGT GGACACTGGC TGCCTTTGGC TTTTCTCCCG CGAGAGAAGT 7GGG7GAC77	13 420
TCTGxA*G\jxG Grx.LifiGxGrt — CjTGTACGCT AGCTGCTTCT	184S0
TTCTCCCTGA AAC7CTCGGA TGGAAGGAAG TAr.GAAATTC AGCTTGGGCT GTGACCAGTT	195 40
CTCACCACCA ACCCCCTCTT CTCTCTCCCT TCTCCTTCCC TCCTTCCTTC CTTCCTTTCC	18 600
mm·· ipmmmmmm φχζζ’π.ζ'ζ’!”' mmmmmmmmw mmmmmmmmmm mrnmmmmmmmm mmmmmmmmxm - x<-i X X - i\*i X x ---x-X x X. J-- -.'w.--'-. X'_. . XX - α- i lUi x	13660
CTTTCTCTCT TTTTCTTTCT CTTTTCCTTT TTTGTT7CTT TCTTTCTTTT TCTCTCTTTC	18720
TTTTTCTTTC TTCTTTCTTT C7TCGA7GAA G7C7CACTCT GTCACCCAGG CTGGAGTGCA	13780
GTGGGGxAAT Cx<—--G—TCAC TGCATCCTCT ACCTCCTGGC TTCAAGAAAT TCTCCTGCCT	13340
CAGCCTCCCA AGTA_GCTGG\j ATGACAGGGA CCCA.CCACCA TTCCCGGATA A.TTTTTGTAT	18900
TTTTTAGTAG AGAC7GGG77 7CGCCA7G77 GGCCAGGC7G G7C77GAAC7 CCTGACCTCA	18960
CATGATCCAC CCGCCTCAGC CTCCCAGAGT GCTGGGATTA. CGGGGTGAGG CACCGCGCCC	19020
GGCCTCCTCT CTCTTTTTCT GAGATG777A GGAAGGAC7G GGCTGATGGG GACCCTCTG7	19080
ATGTGATGTG CGTGAATTTG GTTTCCCGGA AGGCCCTCCA GAGACACGTT TGCGTGAACA	19140
TTCAGCATGG AAACAACA7A CG7C7CTCCA CAGGAGG7GA GAAAT7GAA7 TTATGGGG7G	19200
GGTGTACGCT GGC5AT7C77 GGTGCTTTTT GCTCAAAACA AGG77CT7T7 GAAAG7CACG	19260
77CC7GC77T CCCTGTGGCT 7CCCGG7GAG C7CGC7CGCA GAGCAAGGAA TACCACCCAG	19320

PL 194 248 B1

AGAGCAA.CGT GG^rCTGTGTT CCGTTGaAAC Gv,CG77GCAG AGAGAG»jtATT TGmTGTGTGA 19380 GATCCG7ACC AGCTCCAGCA CACTGATAGG AACACG7TGC TGGCCGAAC7 GAACGATGCT 19440 GGGTTGGGTC CTGATTGATA CGTATTTTCT TCCCTCCTCT CCCCAAAACT TGGCCAAATA. 193 00 GTCCGTGGAG GGTTGTCAGT CGCCGCAGTT GAGCAAAAAA CACTTCTTCC 7TTGAGTGGC 19S60 TGTTCTGGTG AAATC7G7TT CTGACATATC CACTTTTCTC TCTCTTTTCT CTC7C7CTGA 19620 CTGCGAAGCA CCCACAjGGGA GAAGGAATTG GATGTATCGG ATGTTGGTAT TAGATTTTCT 19630 TTCTCCGTTC GAGTCTCTGA CTGGTGCATA CTTTGCAAAG GTGTGTTCCT GGCAATTGCC 19740 AAGAGTT^GA AAr*j^.TG\—rtC<- TTCTC-GsjiG (A-— GTTG\j\j\j TGTTGTTTCA CAGGCAGTGG 19Θ00 TGACAGj»jx.C CCTCGj-CTGT (AtCTGiCTTC TC<AGx.G\_,CG TGmATAAAGA GACGGGACAG L9S60 ATTCTGTGCC TCTSTACCAT TTAGA.GCGTA ACTGACCGCG TCCAACACCC GTTTTTCCAC 19920 TTACAAAGCT GGTGGTGCGA CGxjvCTTGGT GTCTCCCGTA CGGGAAGGAG GCCTTTGGGC 1993C

CGCTCCAAAG	ACSCCCTGTC	G χ. AG\xr\A2 Gu	CC7CTCCATC	CC3CCAAAGT	CCAGCCAGGC	2004C
CTCCSAAA2G	GTC-TATTTC	CTTGGAAGCC	mm* m mwiim mm i,ksn\jx i xxj	TTCTGGTCTT	G— T G—7 GT C C	2010C
T T Gvn- CAC «jT	C.-.Gu_.-,C/rx Gut	GACA—ATC * GT	C-GATACCGCA	GAGT C T GGGG	ACAGC7GGGC	20160
GTTTAA.C—'«jA	AAT Gz*AG\- — -σ	AGAC GxjvjT T T	CAGGTTTTGG	TGCCAAGCTC	* GjT CAGGA7	20220
GAAAGGGAAA	TACCAGAC-TC	mm mm mmm mm m L.-'— «σ ; i i χ	mmmmmmmmmm x^- - . X . i	mmm* mmmmm* X - x-tłx j. uiru	CCTT^C^-^C	202SC
* mm«r«mmmmm Ai - lk?- * * w	CCCTAAGAAC	AAG^wAGr^.Gs*	CTCCAGC7CC	CTTTAGCTCT	ACAG7T7TCC	23340
C'C-.T A	G*·— —x Gv	CACACGGCAG	CCACTCCCAC	GACACACATT	i --C	2040C

7 GTAGACAAT	ATCCTGTTTC	AAAGCTATGA	AATG7GCTAT	TTA.TTGAAAG	-- i	207CC
77CACGAG7T	h.—,S—T . G	TACGTGCAGG	TCCCGTGGGA	AGGAGGCAAA	AGCCCCTGCT	20760
mmmm* mmmmm X—- xaL· * - .	T 7.—-T GTAT GT	mmmmmmmm '•J'—.“XX, ilkJl 1Λ	TTTA.TTTTTT	mmmmi nmm —m i X ΧΧ,Χ, X l&d.	CGGACGTTCA	20820
TAAATATSTA	£-' — ——T, m — 2^^	TATGTCGAGT	G.AAATTTGA	CATCGCGTTG	mmm* mmmm	20880
TAIATTTCTG	AAAACTGTTG	CTTTTTCTTT	TTCCC7CCCC	CATTGACGAC	ATAGl-GGCCC	20940
CCGCGTCTGG	GTTACAAACA	CAICTACAGA	TATTTTCAGG	GATTGCTTCA	GATGAAAACA	21000
AATCACACAC	CGTTTCCCAA	ACCAACAGTC	TTCACATTTC	TATCCCTCTG	T ±A_ -G7CGG	21060
CAGGCGGTGA	GGGGTAGAAA	AAAAACAAAC	AAACAAACAG	AAAAAAAAAC	CAAAAAAAAC	21120
CACCCTGAGT	TTCTCTGGTG	ACGCCCTCAT	TCTCCTAACG	TTCAATAATC	TCAATGTTGA	21180
G7TGCAGCAA	CAGACTGTAT	TTTTGTGACG	CCCCGTAGTA	TGAATGTACA	TCTTGTAAAA	21240
CTGAGATA7A	AATAAACTTA	TAAATATTTG	TATTCAAGTG	TTAAAAAAAA	AAAAATTCTC	21300

PL 194 248 B1

AACCTCTCCC	CTGAGGACAG	GCTTATTGGA	AAAAAPAAAA	AAAAAAAAAA	ATCCTGAGTC	21360
GGCCGTGGCT	GAACACAGAG	TGTTGTTCTG	CTCCGTGCAT	TTCCAGGGTG	GGTA.CCCAGT	21420
GTTGCCCCCC	AGCCTTAGAT	CGm^eAG«jTAC	CATTGACTTT	TGCTTGTATC	CCATCCCCTT	21480
CCTTTACTGA	AACCTACCTC	CCCGCTTCTC	AGCCAACGTC	CCCCCAGRAG	GTGGCAAAAA	21540
AAACAGAGGA	AAAAGCCCTG	ATTTGAA2CA	AGTCAGAGCT	GCTARTTCTC	CACTTTCTTT	21600
AATTAATTAA	TTTATTTTTT	TTTTTGAGAC	TGAGTCTCGC	TCTGTCGCCC	AGGCCGGAGG	21660
AGTGCAGGGG	CGCGATCTCG	GCTCACCGCG	ACCTCCGCCT	CCCGGGTTCA	AGCGACTCTC	21720
CTGCCTCAGC	CTCCCGAG±A	GCTGGGATGA	CAGTCACCTG	CACCACCGCG	CCCGGCTCAT	21780
TTTTGTATTT	TTAGTAGCAA	TGGGGTTTCA	mmmmmmmmmm (--.ίτΧΝΤΧ x	CAGGCTGGTC	TCGAACTCCT	21340
GACCTCGTGA	TCCACCCGCG	TCTG^tjCCCG	G-— C GAT G	TGTGCGCTTT	TAACTTTTAT	21900
TTTGTTCGAG	TTT7CGACAG	TG·-——ACGjAT	TTTCTAGCAC	GG7CT7GCAA	mm* -nm* mmm* V5j“IX j,	21960
GTCATTTTTG	agacaaaaaa	TATAATAATA	ATAAAT GGAA	AAAGRAATCG	ACTTTTAAAA	22020

AT GACAAA77	TTTTTTTTTT	TTTTTTGCAT	mmmmmm	mm^-łmrpm* mm·*i — . _ J. UJ.	AAAiRjAAAGT	220S0
TCATGATTGG	* mmmm mmmmm A* * -	CCTGA.CTGC7	TCCCGGCTGT	GATAAAARAC	AC-.C GT GAGC	22140
TG\^—AGvn—λΑ	GT GGG—\jAGvj	GACA. CAG—T G	C—CACAG.-*Gv	GTT C CCACCG	CGGTTACAGG	22200
GT GGG—AGTG	CT	TTTCTCTGTG	G—T CAG	AGCCTGAC-GA	CAGGTGAGCC	22260
TCTCCGACAC	CTCCCCAGTT	GCCTGGAGTC	TAAA.C C GT C C	Ui X -JX >— Χ\?ΧΛ	CCGCCCGTTC	22220
TTCCTC-CTGA	CTCCTG^jTAG	TTCCTGAAAG	CTTCTCTTGG	C A.GAGAAGG	m—mmmm* m — m	22380
GCCGTGTCTC	CA-G^n— -_AT T C	T G<_ΑΑλ^Τ G—	-zrCT * GrtCC^j	TTCCTTTCCT	TTT CT GGCCT	22440
<TX KJVJXX·-	AAGCT CA.GAG	£ m mm mm mmmm	AC C CAGC CT G	TGTGTGTCTT	G— C G\=ACAGA.	225C0

AGAAAAATGG

CCATCTC—AG

CACAG7TA7T

225 60

620

22650

TGTCAT CCCA	&>-ACT T 7 Gvjvj	AGvj«— C —-.G.-7-—	± Ο-Ά1C.^-.	CCT GA GG^* CA	GGAGT7CGAG	22740
ACCAGCC - -j«j	CCAACACGGT	GAAACTCTAT	CTCTACTAAA	* -i m* m* * * * * ΛΛ.ΛΧΛΛΛΛΛ	x — .“.'G——	22SCC
GTGGTGm^ GT	- sJ i. /*-Α	—' — — — . — — ± — — —«T.L··— AJłU	TCAGGAAGCT	.-.«r\z.“.G	AAT C GCT TGG	22860'
ACCCAGGAG5	C G«jAGmT t gc	ACTGAGCCGA	GATCGCGCCA	TTGCACTCCA	G_— _ G,	22920
CAGAGCCAGA	CGCTGTCTCA	AAAAAATGAA	TAATAAAATA	AAATAACAGG	AACTAAATAA	22980
AATAAAACGT	TCAGCTTTGT	TCTGCAAATC	CACTCCTATT	GTTTTACGTG	G ± TTGAGAGA	23040
CTCTGTCCCT	TAGAAATAGA	TGTTTGTTGC	CAATTGTAAT	GAAICTGTTT	CAAAAATGAA	231C0
CAGAATATTC	AAATGGTTTG	AGAGATCTTT	TCCCTTAGAA	ATAGCTTGTT	GCCAATCACA	23160
AAGAATGCTT	TTCAAAAATG	AATGGAATCT	TCCTGGATAT	CGCTTCCAGA	TCTTCATTTT	23220
TTTTGCATAG	TTCAACCTGA	AAAGTAAGTG	TCTCAGCCCT	GAATTTCTTT	CTGATTTTTC	23280
CATGGG77GT	CTTGCAGACT	TCTCTGGRCT	TGACCACATT	TARAAAAAAA	AAAAITAACT	23340

PL 194 248 B1

TTTTCACACG	GACACGGTTT	CAATAGGAAT	GAGATCTTTG	AGTTTTTATG	TAACAGATTC	23400
TTACCATCAG	TTCTCAGAIT	CCCAAATTAC	ACACAAAAAG	CCACGGACTT	CjmGTCCTGm	23460
TAACATGTCC	TTCTGTTTCT	GAGGCTTCTG	TTGGTGTTAG	ACTTTCATC-T	TTGATAGCAG	23520
ACAATG7AGG	r mmm-Λ λ Tl uAl X a ΛΛΛνΐΛ	AAAAIGCAGA	GAAAGCAAAA	ACACTGACCA	AAC.-.CAC GGA	23580
GATAAGCTTT	C7AAAGCC77	TGTTCTTGGA	GTTGTCGTTA	AAAAAAAAAA	IfTPTTlTł-R ϋ	23643
ACTTTGCAAG	CATGmm -.ATA	TTGAACTCAT	AAGCAA.GAGA	GCCAAGAAAA	W ΓΓΤ* ΛΧΛ13 X X L, CU	23700
TCGTCTACTC	TACACGTTTT	CC CAAAACAG	ACGTATTTTA	ή ιιυιιιιΐ(τΐΜΐρττζ Al ΧΧΜΧΧΧ-Μ	» 1 j. -μλΑμλ'-λ	23750
CAGATGCTGA	GAGTTAAAAG	TTAAATTTTT	GTCATGAACA	ATA.GTGGCCA	AAACCACAC-T	23820
^R rtł ! X Λν X x _ wMG	t- χΛΧΛνν^Χ* A	ATAAGAAAAA	TACAGGCTGG	GCT CGGT GGC	T C»“»CAC C T GT	23330
AATCAAAGCA	C T T T T GmAGm	C GrAA.CA.G_	AGATCCCTTG	AGG C CAGGAG	ATTGAGACGA	23940
GCCTGmmCAA	CAT-AGC GAGA	CCCTCACCCC	TACAAAAAAG	<j _ TT G - ΤΑΟλ	TAT GT AACAA	24003
AC CT GCACAT	T GT GCACAT G	TACCCTAAAA	C T TAAAGTAT	AATAATAAnA	AAAT TAAAAA	24060
AAAATTCACC	AATCAACTGC	CTGCTGGTGC	CTTCAAGAGA	CTCACCTAAC	ACATAAGGAC	24120
TT GCATAAAC	τιmχ -π* η, ί >/-»· X —“—ΛΛΛΛ·—Ϊ	ATTCAATGGA	AGAAT C CTT G	A-A.C-TATTCT	GAGrtAGACAG	24180
TATAATAAAC	T GAT TT CTG A	AAAGGCTATA	AAAA AT T GAA	TAAA7CAZ7G	T T GGGCAT G G	24240

Gmrt^my··· * » rt»* xzv-.

* /τζ»τ*π»τ,^*** ·ηρη x * t my ^τ^ττ,τ,—T^m mmR «»-«-« /- — - —,

-vm χ^,τ.-^Λγ'Λ', ; .ALry-tfin,^· * χ -λ—-irxC.-^._w

AAAAAAAAGT CAAATAATTA.	GmmauGwMt-„T G	Gx Gm-Gm-C-	CCTACmm-TG	AAC-CTA.TTGA	2436C
GmAGm—ΟμλΤAC -TTG	TTTTTGTTTT	TTAATTTTTT	T T GA-GAlCA-GA	GTCTCGCTCT	2^420
GTTGCCA-GGC tggagtgcag	TGGCGTGATC	mz*«T «·»«τγ,-ττ rt·»»»	^»»1 » TT/TTrtrtrtrt	CCTCCCGGG'	? <2 -i g ~

TCAAGCAA

AGCCTCCCGA GTAC-0 *^=.“. i - A_CAG\r j. C

AC CC G\r-_Cr

4CCTC GGG7GACCCA CCCGC cc:

r.w i'λ,·.

660

ACAGGCC-7GA GCCACCC-CGC C7GGCCCAGG

OCAGGA GG7G3AGGC7 24720

4C CAC7GCACTC “C-7-2C GACAGAG7GA GACCACACC:

04730

CTAAATA-AC GAATAAA2AC AGGCAGAAAC rri iihw

GGAGTCT7GC 24840

TCTGT \GGAGTG CAGTGGTGCO

..... rtł f- -. , .,

Λ- M - —T.k7U * X.

4CTGCAACC7 CCACC7CC7C

24900

GGTTCAA.GCA ATCC7CCTGC CTCAGCCTCC CGAGTAGCCG GGAITACAGG TGCCCGCCAC 24960

CACGCCCGGC TAATTTTTTG TATGTTTAGT AGAGACGGGA TTTCACCGTG TTAGCCAGGA 25020

TGGTCT7GA7 CTCTTGAC7T TGTGATCTGC CTGCCTCAGC CTCCCAAAGT GCTGGGATTA 25080

CAGGCATGAG CCCAGGAG7T CAAGACCAGC CTCAGCAACA AAGTGAGACC TTTTCTCTCC 25140

AAAAAATCAA AAATTTAGCC AGCTG7GGTG GCTCCTGCCC GTGATCCCAG TACTGTGGGA 25200

GGCTGAGGCA GAATTGCTTG AGCCCAGGAG TTCGAGACCA ACCTCAGCAA AAAGGACTCT 252 60

CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTATAT ATATATATAT ATATATATAT 25320

PL 194 248 B1

GAGTTTCAAA	AATTGCTGGG	T GAC CAGCT C	ATCTACTGGT	TTTCCCCTTG	GuArAGTGAA	25330
ATTGTCATGT	ATTGAAGATT	TCGAAGmAAG	11 irt j ¹ * * L X 1\ϊΛΛ	TGAGAAACAA	AC-CAATCTG	25440
TTCGTGTTTA	AAGAGCTGCA	GT GC GT TT GC	TGTGTTTCCC	ATAAAACTGC	ACTTCCAAAA	25500
GACACGCTGA	GAAAGGAGAC	CAGGATTTGT	AATTCAGAAA	TTGGAAAGCA	AGTTAGGCTG	25560
GACGTGGTAG	CTCATGCTTG	TTGTAATCTC	AGCACTCTGG	GAGGCTGAGG	CAGGAGGAIC	25620
ACTTGAGCCC	AGGAGTTCAA	GACCAGCCCG	TGCCACATGG	TGAAACCCTG	TCTCTCCAAA	25630
AAATAAAACA	TTTAGCCAGA	rn^ 'mm# >nm* mm x Lr x x «atuL. x	CATGCCTGTA	ATCCCGGTAT	TCTGmGAGGC	25740
TGAGGCAGAG	TT GCTT GA-Gv-	CCA&jAGTTC	AAGACCAGC C	TGGGCAACAA	AGTGAGACCC	25300
TGTCTCTGCA	ΑΑΑγίΑΤλΑΑΑ	catttagcca	G— χ GTGvrx Gr\	C x G»-.T G. ·*. x G	TAATCTCAGT	25360

GCCCA.GGAG' i i --—V

GA.C-AA. CC7CAGCAA.C

ACTCTG\jwiG A-—Ά

AAA.GTGA.GAC CTTGTTTGTG CAA AAA A. TCA. AAAATTTA.GC CAGCTGTGCT GGCTCATGC

TGTAATCCCG GTA.CTCTG-^- A.G-·—-T GAT

A.G

-r-_—j- i

TT GA.C

GTTCGA.C-A.CC

AACC7CAGCA ACAAA.GTGA.G

- .ij; _ _.

TCAAAAA.T77 AGCCAGC7GT

25=20

25=30

6042

26100 ? cC-_ 70 —.

GC CTC

GGAGTTCAAG	AC CAGl- C7 —ά	GCAA.CAAA.GT	GA.GATCTTGT	TTCTCCAAAA	AATAAAA.CAT	l 5 Z 2 2
TTAGTCAGCT	G x Gvr X i. C	* * —m* ΛΛϋ'» w . U i Cif-	TCCCAGCATT	TTGGGAGGCC	G-.G—-- GGGCG	2 6 <, 5 0
GAT CAC	T CAT GAGAT C	GAGACCAICC	TGGCTAA.CAC	GGTGAAA.CCC	CGTCTCTA.CT	2'5Z4x
AAAAATACAA	AGAAAAT7A-G		TGGCGGGCGC	CTGTA.GTCCC	A.GCTA.CTCA.G	2G4CC
GAGGCTGAGG	CAGGAGAATG	CCGxv=AG~CT		C CAT GCAGT G	AGTCAAGATC	26480

GCGCCA.CTGC CTTC—.-.GC

GGGCCA.CA.GA. GCAAGA.C7CC GTCTCA.'*

Z 6 3 — 0

-.CT

CTCCC

AA.GCTGTGTT TGCACCA.CTG CCCTCCA.GGC

AA.CAG

CAA.GA.CTC C GT -1 CAAAA.

TTTGCA.C-A.C 7G--CC-C—-G CCTG---7—.-A.C .-.e-A.GCAA.GA.C TC

CCC

TGCACO

CCC7CCGGCG TGGGCAA.CA.G A.GCAA.GA.C7

CGTC7CAAAA AAAAAA

AATGCTGCCC

AGCTGTGTT TGCA.CCA.C7

TGGGCAACAA ACCAAGCCTC AGCTTTC7GC CATCTCCACA ACCAAGAAAG CAATTCA.CA.C

AGAAATCAGT GCATCGTGCA GTGACCTCTT CAGAAAACCA ATGAGTTTTC CACCTGAGGA

ACTGTTTCTG AGCCCCATTC AGAAAAACAC ATCCCTGTAA CTGCAGGGCA- GATTTACTCA

CTGTATGCCT GTTTAAAIAA AGCT7CCA.GC CTCTGCAIGG GGTCTGTCTG GAAGCTCCTG

TATCTGTCCC ACATTCTTGG AATCACAAIG CACCCTTGGC- AC-GAAGATAT GTATTTAAAG

GCAGTGGATG TTATGGTGAG AAAAIGCTGC CCATCCTTCT AGAAGACAAA AGCCACACAA

AATACATCAC AAGAACCAGT TTTTTTCAGA GAAGAACCTG CACAAAGAAC CTGCTCCCCC

267CG

67 60

26320

263 30

26=40

27000

27060

27120

271S0

27240

27300

27360

CACACCCCCA CACACAGGTG AATTAACAGG ATGTATGTTT TATCATAAAA GCACAGGTTT

PL 194 248 B1

GTTTCCTATG	CACTCTCTGA	GGATTTGGCC	ATATGCAAAG	ATGTACAAAA	ACCTTCTCTT	27420
TCCCCAGGGA	ACCG7AACCC	GTCTGAAAAG	ATGCCCTTCT	CAGAAGCGAG	TTGAACGATT	27480
GTTGGAAAAG	ATAAAATACG	ACGTGCACAC	ACACAGTAGA	GAAATGTCAC	CCATGCAAAT	27540
TATGTGTTTG	AATGGAACAC	ATTCAGGAAG	CTAAATGGGG	TATGACCACA	m*mmmmm mmm yy « — yyy χ ±	27600
GATTTATTTG	ACGAGTGGAA	GGGGCAGATG	GAAATGAATA	CTGCTGTTTT	CCTTTGGAAG	27650
mmm* mm mm bkLAiAŁH-l y	GGAATACCnA	GAGw^TTACT	TTGGAAGTTT	AGCTTCTCCA	m—mi—mmmmm by J. yy χ y y _χ	27720
CTCTCTCTCT	CTTTTTTTGA	GACAGAGTCT	CACTCTGTCA	CC CAGGCT GC	AGTC-CAATGG	27780
CGTGCTCTCG	GCTCACTGCA	ACCTCAGCCT	C C CAGGTACA	AGCGATTCTC	CTGCCTCAGC	27840
CTCCC3AGTA	GCTGGv=A7CA	CAGy T GT GyA	CCACCACGCC	TGGCTAATGT		27900
AGTAGAGAT G	AGGTTT7ACC	ATGTTGGCCA	GGC T GGT CT T	GAACTCC7GA	CCTCAGG7GA	27960
TCCGCCTGCC	rpmmm m mmmm m 1—yyyy	AAAGTGCTGG	GATGACAGAC	AT GAGy TAGC	żiC^;- — w C	28020
CCAGGTGGTC	TTTTTA.GCGG	GTATTAAAGC	AGCTTTCTCT	CTGAGCCTTA	AACCATGAAG	28080
AIAGACAGAC	TCAGTGTATG	mmmmmm* m* m yy χ χ χ χΛίϋΐί?	TTGTAATTTT	ATAAAAATAA	GAAAAAGT C C	28140
ACCTATCATT	— * mm—mm* mm yrtxyyx ir.L?.	ATTTTTT GTA	GCAGTTGCAT	GCAATATTAG	GATAAGGCA7	23200
GTTCTCAAAA	AGAAC7CTT7	mmmmmmmmmm	TTTGAGACGG	AGTCTCGCTC	TGTC.-.CCCAC-	29250
	AG7GGCACGA	TCTCCGCTCA	C7GCAAGC7C	CxC * X —yyy	GTT CAC GC CA	29220
TTCTCC_G-__	TCAGyy X C- y	CAG7AGC7GG	GACTACAC-GC	GyCyGy C.-.CC	ACGCCCGGCT	23280
mmmmm·*	AT TTT TA.G χ A	G.rtGAC GjGGT	TTCACCATGT	T.-.Gy <ytGy.~iA	C-GTCTCGATC	29440
7CCTGACCTC	AT GAT CC GT C	CC-CCTCAC-CC	TCCCAAAGTG	C T Gyy.-.C T A.C	AC-GC3TGAC-C	28500
CACTGCACTT	GGCCTTTTTT	TTTTTTTAGA	TGGAG7TTTG	CTCTTGaCGC	CCAC-GCTGGA	2SS60
GTATAAT GCC	Α.» yrtx — — y —m.	CTCACTGCAA	CCTCGGCCTC	CCGAG7TCAA		23 620
T Gy y χ y.-,G——	TC——yj-_G ir.G	CT3GGAI7AC	AGGTGCCCAC	CACCATGTCA	AGA.7AA7 GTT	29 esc
T G7AZ TT T CA	G x lGt-.GAT Gy	ggtttgacca	TG77GGCCAG	GyTGyTCTCG	AAC7CC7GAC	28740
CTCAGy x GAT	CCz-jCCCG—C x	TAGCCTCCCA	AAGTGC TGGG	A.T GACAGyC G	TGAGCCCCTG	29900
C Gy CC Gyy —T	T TGTAACTTT	Ą.7 *Τ—	TTTTTTTTTT	i - ιλλ^λλλ(ϊ	ACAŁ-.C-TCTT	”28860
GyT C x G x C-**s.y	CCAGyy . Gyrt	&_ACACTGjT	Gy yAT CAT AG	C x¹—ACGy.-,y	CCTCAAACTC	29 920
CT GGGCT CAA	, GCAATCCTCC	CACCTCAGCC	TCCTGAGTAG	C T GyGACT AC	AGGCACCCAC	29980

CACCACACCC	AGCTAATTTT	TTTGAITTTT	ACTAGAGACG	GGAICTTGCT	TTGCTGCTGA	'29040
GGCTGGTCTT	GAGCTCCTGA	GCTCCAAAGA	TCCTCTCACC	TCCACCTCCC	AAAGTGT7AG	29100
AATTACAAGC	ATGAACCACT	GCCCGTGGTC	TCCAAAAAAA	GGACTGTTAC	GTGGATGTTC	29160
TAGCTTCCTG	TTCTCGTCTT	TTCTTTGTTA	ATTGTACAGT	TTGAGGGTGT	GTG7GCGTGT	29220
mmmm* mmmmm yy yyjiy y a y a	GTGTGTGCAG	TCTCCTGATT	TCATGTATTT	AATTGTTATT	ACCACCACCT	29280
CCATCTCTCA	TTCTTTGTTA	CCCTCACTGT	GTAAAGATAC	ATGTTGTTTT	TAAATTTTAT	29340

PL 194 248 B1

GTATTTATAI TTATTTATTT GTATTTCTGA GACAGAGTCT CACTCTG7TG CCCAG3CTAG	29400
TGGCATGATC TCAGCTCACA GCAACC7TTG CCTCCTGGGT TCAAGCGATT C7CC7GCC7C	29460
AGCCTCCCGA GTAGCTGAGA TTACAGGCAC ACACCACCAC ACCCGGCTAG TTT7G7TT7G	29520
AGACGGAGTC TCGCTCTGTT GCAGGCTGCA GTGCAGTGGC GTGATCCTGG CTCACTGCAA	23580
CCTCTGCCTC CTGGATTCAA GCGATTCTCC TGCCTCAGCC TCCCAAG7AG CTGGGATTAC	29640
AGGCGCCCAC CGCCACACCT GGCTAAITTT TTATTGGTAG TAGAGACGGG GTTTCTCCAT	29700
GTTGACCAGA CTGGTCTTGA ACTCCCAACC TCGGGTGATC CACCCACCTG GGCC7CCCAA	2 97 60
AG· χ - Gwri TGr.CAGxj%-<zn. G-lCCA.Gv.Cx χ CTxCxxv._J.xC	2982C
TTTTTTTAAG ATGGAGTTTC ACTC7GT7GC CCAGGCTGGA GTGCAGTGGT GCAA7C7CGG	25S8C
CTCCCTGCAA CCTCCACCTC CCAGG7TCAA GAAA77C77T TGCCTCAGCC TCCCG-.GTAC-	29940
CTGGGACTAC AGC-TGCCCGC CACCACACCC ACCTAATGTT TGTATTTTTT TGGTAGAGAC	20000
GGGGCTCCAC CACACTGGCC AGGCCGGTCT TGAACTCCTG ACTCCA.Gj-.CG accctcctgg	300 60
CxCAGv-'-^C— C.-.Grt<jxGj,-v ..^m.C.gGv C-jiGi-.G'—C.-.T	20220
GTCTTAGGAA ACCAGAAAGG GuGTAGTTTC CGv_ACTCTGA G\or-.G.—AAA-.G AGAC3CCCGG	3C160
CGAAGAGrAA GGAGAGTGAA AGGACGTCTC CCCTTGTGTG TAGCCTGTTC TCAATCGTGA	20240
GTG.-.GCCSAT TGv.CAGAAr.C TGAG^?^ji.G^T TCATTTGG^C AG\j\-AA.G\-TT CTCAAC.-.G.~_-.	20200
TG7C7AAG7A CTTGTTAATG CTGAGAAGCT CTCCAAGCTA CTGCACTCCA GCCTGGGTG*.	20260
CAGAGCACSA CCTTGTCTGA AAACAATTAA TTAA.TCAATT AATTAATATA. ATG-.-A7CAT	20420'
ACTGf-r.C2CA Gvłp-.GACCz“.-T Gv5vt\jaGv?\tvA Gv^7VrTGv?vy\J4 TGyn-j-GGr.-.^-. CAZAA-ATAT	20420
GGTGCAATGG ACTTTGCTCC AGTCTCCCTC CCCATCTCTT CTCGCCAAGA GCCTCCGGAG	2054 0
GGAGCATGGG GAAGATGCTT TGGGAACCTG TAACT7C7TG 7C77G7AAAC AG.-ACACC7A	20 600
AGTAr·— -ii-* 2~_Γ·.—Gv- x Gv_’oa“. AG i T-^—. j.G.-. x iiC··__Gi_._ T__C_C._-w CTAC3GACA.—.	z C 6 c 0
GGGTCATGGG 77ACTCAG7G TTACAGAAAG AATC-ACATGG AGATG777G7 TACA7C77AA	2C72O
GGAACCATGru GG\=GCCAG-.G TA.TTTTACTC TAAGTGTA.GA 7GGTACACCG GCCACG2CTG	2 073 C
TCCCAACACC ACCAATGGTG 'GCACCTAACT TTTGTGTTTG TGCCCCACAT TTCTCC7TCT	2.? g δ 2
TTTCTG^-C^T AAATG^AAGa Gj~.TACCCC.lT G^jtAACCACG CTGvAGCAr.G AGGCCACCTG	20900
ACTACTAGCG ATACC^-TGlA GCTCACCTAC AGvAGv,TCAC ttgaagcagc tcacccatag	20560
CTCAGG7ATA GCTCACCTC-C AGCGGCTCAC CTGTAGCTCA CGTGTAGCTC ACTTGTAGCA	22020
GCTCACTGGT AGCTCACCTG CAGCAGCTCA CC7GTACC7C ACCTGTACCT CACCTGCAGC	21080
AGCTCACCTG TAGCTCACC7 GTACG7GAGC CACCGTACCC GGCCAGCAAG ACCCCA7T7C	21140
TAAAATAAnT ACACAAAAAT TAGCCGGACG CGGTGGCGCG TGTCTGTAGT TGTAC-CTACT	21200
CAGGAGjCCG AG«GxGuGAGj ATTGCTGGAG GCTGGwzAG\jT AGAGGCTGCA GTGAr.CCCTG	31260
AICCAGCCAC TGTACTCTAG CCTGGA7GAC ATAGCAAAAC CTTGTCTCAA AAAACAAAAA	21320
CAAAAAACAA AACAAAGAAA CAAACAAAAA ACCCACACAC ACCGGAAAAC AAAACAAAAA	31380

PL 194 248 B1

GCAAAAAGmA	AAGAAAAGAG	AGCCAGGTCC	CAAATATATA	TTTCCTTGGA	GAACCA7TTG	31440
CAAAGAGCAC	ACTTAAGGCC	GGGCGCGGTG	GCTCACGCCT	mmm.mmmmmm X ΧΛ-X wX<7\7	CAC77TGGGA	31500
G\jCCGAGGTG	GG7GGATCAC	GAGGTTG\mA	m.mmm.m.mm ksnx X tfftur.b x	ATCCTGGC2A	ACATGGCGAA	31560
ACCCCATCTC	TACTAAAAAT	ACAAAAAATC	AGCCAGGTGC	TGAGaCAGGT	GCCTGTAGTC	31620
CGAGCCACTC	AGGAGGCTGA	GGCAGoAGAA	TGGCATGAAC	mmmmm.mmmm X x \J\3\SAW X kj	GAGuTTGCAG	31680
TGAGCCGAGA	mmm mm mmmm*ł» 1X «x\- 1jx X«— s. X	GCACTCCAGC	CTGGGCGACA	GnGCGAGACT	CCTTCTCAAA	31740

ΤΑΑΑΤΑΆΑΤΑ AATAAATAAC AAAGAGCAAA CTTAAAATTG TC7CAGAAA7 CCCACGGGAI

ATTGGATCTC CCTCATGCCT ATCTGATGAC ACTTTGAGTG TCTGGGGCCC CG7GCCTA7T

TTCTGGGGTT CCCAGAAGC7 GCCG7TCTGA AAGTGTGGCT CTCGGGGACG TGGCACAGGT mmmm. mmmmm mmmmm. . Λ *T»m mm. m mmmmmm mm.mmmmm.m m. . mmmm. mm mmm. . mmmmm U· x'j\snxχ x . (σχ.ιχΛΛΛΧν i X-.X\r-r. x i UwAxaiicnv? m cnw X x c«awiC>j

CCTTCGCCGA CCCCCTGAGT TTAC-GGTCCT GCCTTTTA-A A7C77CCCAG CAC7C7G7TG mm m. /. m m. m m mm m .. m . mm m m m m mm m *. m m^ m m m m . m m^ m m m m. . m mm en m x . χλΧιλλ*⁴.^ X«jx Xv»x.-xx x x 'jj.-.irwiw x χ<.χλλΧ^χχχ

ACAGC777GC AGAATATCC7 GTTTCTCAAT ACGGA7GG.-.G .AAACACGAGA CGCGTTTTCT

Gm—mm. mmmm .mmmmmm.mm m. m. . mmmm. m . mm m.m mm m m m — m . . m m. m mmm. mm., mm \ϊ\7Χ-Λ-χ-. AUXw«? X kxr‘.<7.“.“S.Xsz«m«—.% Xof.X - x—X _ S? X. m-.. χΛΛχΧ· r— (ZC Ą C* m Cm*** C*”GC~ ^GA^C T^m ·* — CA r ·*“ ~ mmmmm, .j^mm mpmmmmmmmrn gT r CJS im~* Z. Z. T^Tm^Z^ZZC* tZ”* — (Z/Zp. Z. L Γ* ** g*** Z Z Z ' ^mmmmm.

T--.777G_A-.C Aw%t\j7GTAAC ADAAAcD

31800

31860

31920

31980

32040

32100

32160

32220

322S0

32340 (2) Informacja o SEQ. ID NO: 15:

(i) Charakterystyka sekwencji:

(A) Długość: 806 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „SHOT” (ix) Cechy:

(A) Nazwa/klucz: CDS (B) Położenie: 43 ... 615 (xi) Opis sekwencji: SEQ. ID NO: 15:

mmmmmmmmmm Xf X \J X XX x.X.‘%J\7	AGCTGAAAGA	TCGCAAAGAG	GAx Ńn- <snnnG	mm.mmm.mm. bwiA <j\znknsn	C GAAGGC CAG	60
ACCAA-A7CA	AGCAGAGGCG	AAGT CGGACC	AATTTCACCC	TGGAACAACT	m..mm.mmmm X“-*X \3ΛΟ\. 1	120
GAGAGGCTTT	TTGACGAGAC	CCACTATCCC	GACGCCTTCA	TGCGAGAGuA	ACTGAGCCAG	180
C xAC T GGGC C	TGTCGGAGGC	C C GAGT GCAG	GTTTGGTTTC	AAAATCGAAG	AGCTAAATG7	240
AGAAnACAAG	AAAATCAACT	CCATAAAGGT	GTTCTCATAG	GoGCCG-CAG	CCAGTTTGAA	300
GC77G7AGAG	TCGCACC7TA	TGTCAACG7A	mmmrnmmmm.. W i SJN. . . .ΛΛ	GGATGCCA77	mm.mm.mmmm X *	360
CAGxj\- <j\-AGx	TGxAGCTGvsA	CAGC GCT GT G	GCG-AC c\.	ACCACCACCT	GCATCCGCAC	420

PL 194 248 B1

CTGGCCGCGC	ACGCGCCCTA	m* mm* mmmmm LA.ć5t*x(jr .c	CCAGCACCGC	CCTTCGGACT	Gx. C <t\-T CS- C	480
AC GCT GGC CG	CGGATTCG^rC	TTCCGCCGCC	T C CAjTAGT gg	CGGCCGCAGC	AGC C GC CAAG	540
AC CACCAGCA	AGGACTCCAG	CATCG\-CGAT	CTCAGACTGA	AAGCCAAAAA	G\—AC C u7xA	600
Gx- C CT GGGT C	TGTGAC7CCA	ACGC CAG\-AC	CAATGTCGCG	CCTGTCCCGC	GGCACTCAGC	660
CTGCASNCCC	TNDDKANMCG	TTACTTHTCM	ATTACACTTT	GGuAC CZCGG	GDEAGVCCTT	720
TTNNAGACTT	YVATKGGSCW	CSCTGGSCCC	TBRKGAWAC	TT GS GHY C GA	GAACCGAKHT	780
GCCCABAYGA	GGACCRGTTT	GGAKTG				806

(2) Informacja o SEQ. ID NO: 16:

(i) Charakterystyka sekwencji:

(A) Długość: 190 aminokwasów (B) Typ: aminokwas (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: peptyd (xi) Opis sekwencji: SEQ. ID NO: 16:

Claims

1. Cząsteczka kwasu nukleinowego kodująca polipeptydy składające się z domeny homeoboks złożonej z 60 aminokwasów o sekwencji aminokwasów SEQ. ID NO: 1, wykazujące działanie regulujące ludzki wzrost oraz zawierająca co najmniej jedną sekwencję wybraną z grupy obejmującej sekwencję nukleotydów SHOX ET93 [SEQ. ID NO: 2], sekwencję nukleotydów SHOX G310 [SEQ. ID NO: 3], sekwencję nukleotydów SHOX ET45 [SEQ. ID NO: 4], sekwencję nukleotydów SHOX G108 [SEQ. ID NO: 5], sekwencję nukleotydów SHOX Va [SEQ. ID NO: 6] i sekwencję nukleotydów SHOX Vb [SEQ. ID NO: 7].

2. Cząsteczka DNA według zastrz. 1, kodująca polipeptyd o długości 150-350 aminokwasów.

3. Czą steczka DNA według zastrz. 1 albo 2, zawierają ca sekwencję nukleotydów SHOX G310 [SEQ. ID NO: 3].

4. Czą steczka DNA według zastrz. 1 albo 2, zawierają ca sekwencję nukleotydów SHOX G108 [SEQ. ID NO: 5].

5. Cząsteczka DNA według zastrz. 1 albo 2, zawierająca sekwencję nukleotydów SHOX Va [SEQ. ID NO: 6] lub SHOX Vb [SEQ. ID NO: 7].

6. Cząsteczka DNA kodują ca polipeptyd wybrany z grupy obejmuj ącej:

a) czynnik transkrypcyjny A mający sekwencję aminokwasów [SEQ. ID NO: 11] i

b) czynnik transkrypcyjny B mający sekwencję aminokwasów [SEQ. ID NO: 13].

7. Sekwencja DNA wedł ug zastrz. 6, gdzie DNA stanowi genomowy lub wyizolowany DNA odpowiedzialny za regulację ludzkiego wzrostu.

8. Sekwencja DNA wedł ug zastrz. 6, gdzie DNA stanowi cDNA.

9. cDNA wedł ug zastrz. 8, stanowią cy sekwencję nukleotydów SHOXa [SEQ. ID NO: 10] lub SHOXb [SEQ. ID NO: 12].

10. DNA według zastrz. 7, stanowiący sekwencję nukleotydową genu SHOX [SEQ. ID NO: 14].

11. Ludzkie białko wzrostu kodowane przez cząsteczkę DNA określoną w zastrz. 6 albo jego funkcjonalny fragment wykazujący działanie regulujące ludzki wzrost, znamienne tym, że białko ma sekwencję aminokwasów [SEQ. ID NO: 11] (czynnik transkrypcyjny SHOXa).

12. Ludzkie białko wzrostu kodowane przez cząsteczkę DNA określoną w zastrz. 6 albo jego funkcjonalny fragment wykazujący działanie regulujące ludzki wzrost, znamienne tym, że białko ma sekwencję aminokwasów [SEQ. ID NO: 13] (czynnik transkrypcyjny SHOXb).

13. Ludzkie białko wzrostu kodowane przez cząsteczkę DNA [SEQ. ID NO: 15] albo jego funkcjonalny fragment wykazujący działanie regulujące ludzki wzrost, znamienne tym, że białko ma sekwencję aminokwasów [SEQ. ID NO: 16] (czynnik transkrypcyjny SHOT).

14. cDNA kodujący ludzkie białko wzrostu określone w zastrz. 11 albo 12, albo 13, znamienny tym, że białko ma sekwencję aminokwasów [SEQ. ID NO: 11], [SEQ. ID NO: 13] lub [SEQ. ID NO: 16].

15. Środek farmaceutyczny, znamienny tym, że zawiera ludzkie białko wzrostu określone w zastrz. 11 albo 12 albo 13.

16. Zastosowanie ludzkiego białka wzrostu określonego w zastrz. 11 albo 12, albo 13, do wytwarzania środka farmaceutycznego do leczenia niskiego wzrostu.

17. Zastosowanie sekwencji DNA określonej w zastrz. 1 albo 6, albo 14, albo jej fragmentu, do wytwarzania środka farmaceutycznego do leczenia zaburzeń związanych z mutacjami genu niskiego wzrostu [genu SHOX] [SEQ. ID NO: 14].

18. Zastosowanie sekwencji DNA określonej w zastrz. 1 albo 6, albo 14, albo jej fragmentu, do wytwarzania zastawu do identyfikacji osób z genetycznym defektem odpowiedzialnym za zmniejszony ludzki wzrost.

19. Zastosowanie sekwencji DNA, określonej w zastrz. 1 albo 6, albo 14, albo jej fragmentu, do identyfikacji genu odpowiedzialnego za niski ludzki wzrost.

20. Sposób określania niskiego wzrostu na podstawie cząsteczek RNA lub DNA, znamienny tym, że cząsteczkę z próbki biologicznej, która ma być badana, amplifikuje się w obecności dwóch sond nukleotydowych komplementarnych z którąkolwiek z sekwencji DNA wybranych z [SEQ. ID NO: 2] do [SEQ. ID NO: 7], a następnie cząsteczkę tę wykrywa się za pomocą systemu detekcji wykrywającego amplifikowane kwasy nukleinowe.

21. Sposób identyfikacji defektu genetycznego w próbce biologicznej pobranej od człowieka podejrzewanego o przenoszenie mutacji genetycznej w genie SHOX, znamienny tym, że

a) pobiera się od człowieka próbkę genetyczną zawierającą polinukleotyd;

PL 194 248 B1

b) amplifikuje się polinukleotyd z części a) w obecności startera, przy czym ten starter stanowi starter flankujący egzon dla sekwencji nukleotydów egzonu genu SHOX [SEQ. ID NO: 14], przy czym sekwencja nukleotydów egzonu hybrydyzuje z polinukleotydową sekwencją [SEQ. ID NO: 14] w następujących ostrych warunkach hybrydyzacji: 0,5 M NaPi o pH 7,2, 7% SDS i 1 mM EDTA w 65°C, oraz

22. Komórki transformowane sekwencją DNA określoną w zastrz. 1 albo 6, albo 14.

23. Układ testowy do identyfikacji lub badań przesiewowych środków farmaceutycznych, przydatnych w leczeniu niskiego wzrostu u człowieka, znamienny tym, że układ ten zawiera komórkę określoną w zastrz. 22.

24. Sposób identyfikacji lub badań przesiewowych potencjalnych środków farmaceutycznych przydatnych w leczeniu zaburzeń związanych z mutacjami w genie niskiego wzrostu, znamienny tym, że stosuje się układ testowy zawierający komórkę transformowaną sekwencją DNA, określoną w zastrz. 1 albo 6, albo 14 oraz określa się zmiany w fenotypie tych komórek lub zmiany w produktach ekspresji tych komórek porównując fenotypy tych komórek lub produkty ekspresji tych komórek zarówno przed, jak i po skontaktowaniu tych komórek z potencjalnymi środkami farmaceutycznymi.

25. Wektor ekspresyjny zawierający cząsteczkę DNA określoną w zastrz. 1 albo 6, albo 14, zdolny do przeprowadzenia ekspresji kodowanego polipeptydu.

26. Zastosowanie ludzkich białek wzrostu określonych w zastrz. 11 albo 12, albo 13, albo ich funkcjonalnych fragmentów wykazujących działanie regulujące ludzki wzrost, do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOX [SEQ. ID NO: 14].

27. Zastosowanie według zastrz. 26, w którym mutacja genetyczna jest spowodowana gorącym miejscem mutacji w sekwencji DNA kodującej skrócenie białka w pozycji aminokwasu 195 w ludzkim genie wzrostu SHOX.

28. Zastosowanie ludzkiego hormonu wzrostu do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOX [SEQ. ID NO: 14], z wykluczeniem wytwarzania leków do leczenia pacjentów z zespołem Turnera.

29. Zastosowanie ludzkich białek wzrostu określonych w zastrz. 11 albo 12, albo 13, albo ich funkcjonalnych fragmentów wykazujących działanie regulujące ludzki wzrost, do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOT [SEQ. ID NO: 15].