PL194248B1 - Cząsteczka kwasu nukleinowego kodująca polipeptydy, ludzkie białko wzrostu kodowane przez cząsteczkę DNA, cDNA kodujący ludzkie białko wzrostu, środek farmaceutyczny, zastosowanie ludzkiego białka wzrostu oraz sekwencji DNA, sposób określania niskiego wzrostu, sposób identyfikacji defektu genetycznego, komórki transformowane sekwencją DNA, układ testowy i sposób identyfikacji lub badań przesiewowych, wektor ekspresyjny oraz zastosowanie ludzkichbiałek wzrostu - Google Patents
Cząsteczka kwasu nukleinowego kodująca polipeptydy, ludzkie białko wzrostu kodowane przez cząsteczkę DNA, cDNA kodujący ludzkie białko wzrostu, środek farmaceutyczny, zastosowanie ludzkiego białka wzrostu oraz sekwencji DNA, sposób określania niskiego wzrostu, sposób identyfikacji defektu genetycznego, komórki transformowane sekwencją DNA, układ testowy i sposób identyfikacji lub badań przesiewowych, wektor ekspresyjny oraz zastosowanie ludzkichbiałek wzrostuInfo
- Publication number
- PL194248B1 PL194248B1 PL97332568A PL33256897A PL194248B1 PL 194248 B1 PL194248 B1 PL 194248B1 PL 97332568 A PL97332568 A PL 97332568A PL 33256897 A PL33256897 A PL 33256897A PL 194248 B1 PL194248 B1 PL 194248B1
- Authority
- PL
- Poland
- Prior art keywords
- seq
- shox
- human growth
- dna
- human
- Prior art date
Links
- 230000012010 growth Effects 0.000 title claims abstract description 69
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 33
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 33
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 33
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 22
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 18
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 18
- 108090000623 proteins and genes Proteins 0.000 title claims description 149
- 108020004414 DNA Proteins 0.000 title claims description 51
- 102000004169 proteins and genes Human genes 0.000 title claims description 48
- 108091028043 Nucleic acid sequence Proteins 0.000 title claims description 45
- 238000000034 method Methods 0.000 title claims description 34
- 102000053602 DNA Human genes 0.000 title claims description 23
- 230000009395 genetic defect Effects 0.000 title claims description 15
- 238000012216 screening Methods 0.000 title claims description 13
- 238000012360 testing method Methods 0.000 title claims description 13
- 239000013604 expression vector Substances 0.000 title claims description 5
- 150000001875 compounds Chemical class 0.000 title description 5
- 239000002773 nucleotide Substances 0.000 claims abstract description 47
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 47
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 25
- 150000001413 amino acids Chemical class 0.000 claims abstract description 21
- 230000001105 regulatory effect Effects 0.000 claims abstract description 17
- 108700025071 Short Stature Homeobox Proteins 0.000 claims abstract description 15
- 102000001420 Homeobox domains Human genes 0.000 claims abstract description 3
- 108050009606 Homeobox domains Proteins 0.000 claims abstract description 3
- 101100477520 Homo sapiens SHOX gene Proteins 0.000 claims abstract 14
- 208000020221 Short stature Diseases 0.000 claims description 87
- 230000035772 mutation Effects 0.000 claims description 40
- 239000002299 complementary DNA Substances 0.000 claims description 35
- 230000014509 gene expression Effects 0.000 claims description 28
- 238000011282 treatment Methods 0.000 claims description 26
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 24
- 239000012634 fragment Substances 0.000 claims description 24
- 101150012871 SHOX gene Proteins 0.000 claims description 21
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 17
- 208000035475 disorder Diseases 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 17
- 239000000523 sample Substances 0.000 claims description 15
- 208000026928 Turner syndrome Diseases 0.000 claims description 14
- 239000003814 drug Substances 0.000 claims description 14
- 239000008177 pharmaceutical agent Substances 0.000 claims description 13
- 102000048489 Short Stature Homeobox Human genes 0.000 claims description 12
- 108091023040 Transcription factor Proteins 0.000 claims description 12
- 102000040945 Transcription factor Human genes 0.000 claims description 12
- 101000863841 Homo sapiens Short stature homeobox protein Proteins 0.000 claims description 10
- 101000703741 Homo sapiens Short stature homeobox protein 2 Proteins 0.000 claims description 9
- 230000003321 amplification Effects 0.000 claims description 9
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 9
- 238000009396 hybridization Methods 0.000 claims description 8
- 102000040430 polynucleotide Human genes 0.000 claims description 8
- 108091033319 polynucleotide Proteins 0.000 claims description 8
- 239000002157 polynucleotide Substances 0.000 claims description 8
- 230000002068 genetic effect Effects 0.000 claims description 7
- 239000012472 biological sample Substances 0.000 claims description 6
- 102000047121 human SHOX Human genes 0.000 claims description 6
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 4
- 102000002265 Human Growth Hormone Human genes 0.000 claims description 4
- 108010000521 Human Growth Hormone Proteins 0.000 claims description 4
- 239000000854 Human Growth Hormone Substances 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 229940079593 drug Drugs 0.000 claims description 4
- 102100031976 Short stature homeobox protein 2 Human genes 0.000 claims description 3
- 102000057072 human SHOX2 Human genes 0.000 claims description 3
- 230000000295 complement effect Effects 0.000 claims description 2
- 238000003556 assay Methods 0.000 claims 1
- 239000008194 pharmaceutical composition Substances 0.000 claims 1
- 102100029992 Short stature homeobox protein Human genes 0.000 abstract 3
- 239000003795 chemical substances by application Substances 0.000 description 40
- 239000013615 primer Substances 0.000 description 33
- 210000004027 cell Anatomy 0.000 description 31
- 235000013351 cheese Nutrition 0.000 description 28
- 238000012217 deletion Methods 0.000 description 22
- 230000037430 deletion Effects 0.000 description 22
- 210000001766 X chromosome Anatomy 0.000 description 17
- 210000000349 chromosome Anatomy 0.000 description 16
- 108700024394 Exon Proteins 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 14
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 11
- 206010053759 Growth retardation Diseases 0.000 description 11
- 210000002593 Y chromosome Anatomy 0.000 description 11
- 108700005087 Homeobox Genes Proteins 0.000 description 10
- 239000013598 vector Substances 0.000 description 9
- 210000001185 bone marrow Anatomy 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 210000002950 fibroblast Anatomy 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000008707 rearrangement Effects 0.000 description 8
- 241000699666 Mus <mouse, genus> Species 0.000 description 7
- 210000004556 brain Anatomy 0.000 description 7
- 238000007901 in situ hybridization Methods 0.000 description 7
- 210000002027 skeletal muscle Anatomy 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 102000018997 Growth Hormone Human genes 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- 230000001605 fetal effect Effects 0.000 description 6
- 239000000122 growth hormone Substances 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 230000031864 metaphase Effects 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 102100040004 Gamma-glutamylcyclotransferase Human genes 0.000 description 5
- 108010051696 Growth Hormone Proteins 0.000 description 5
- 101000886680 Homo sapiens Gamma-glutamylcyclotransferase Proteins 0.000 description 5
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 238000012300 Sequence Analysis Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 5
- 210000004072 lung Anatomy 0.000 description 5
- 210000002826 placenta Anatomy 0.000 description 5
- 239000003155 DNA primer Substances 0.000 description 4
- 102000009331 Homeodomain Proteins Human genes 0.000 description 4
- 108010048671 Homeodomain Proteins Proteins 0.000 description 4
- 102100029812 Protein S100-A12 Human genes 0.000 description 4
- 101710110949 Protein S100-A12 Proteins 0.000 description 4
- 101001009851 Rattus norvegicus Guanylate cyclase 2G Proteins 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 108091035539 telomere Proteins 0.000 description 4
- 102000055501 telomere Human genes 0.000 description 4
- 210000003411 telomere Anatomy 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 241001123946 Gaga Species 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- 102100022662 Guanylyl cyclase C Human genes 0.000 description 3
- 101710198293 Guanylyl cyclase C Proteins 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 206010072610 Skeletal dysplasia Diseases 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 3
- 108091036066 Three prime untranslated region Proteins 0.000 description 3
- 210000000988 bone and bone Anatomy 0.000 description 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical class O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 210000003754 fetus Anatomy 0.000 description 3
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- 230000016507 interphase Effects 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 230000008774 maternal effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- JTTIOYHBNXDJOD-UHFFFAOYSA-N 2,4,6-triaminopyrimidine Chemical compound NC1=CC(N)=NC(N)=N1 JTTIOYHBNXDJOD-UHFFFAOYSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 101000651036 Arabidopsis thaliana Galactolipid galactosyltransferase SFR2, chloroplastic Proteins 0.000 description 2
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 2
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 102100021257 Beta-secretase 1 Human genes 0.000 description 2
- 101710150192 Beta-secretase 1 Proteins 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- 101100436100 Caenorhabditis elegans asp-6 gene Proteins 0.000 description 2
- 208000031639 Chromosome Deletion Diseases 0.000 description 2
- 208000011359 Chromosome disease Diseases 0.000 description 2
- 108091029523 CpG island Proteins 0.000 description 2
- RGTVXXNMOGHRAY-WDSKDSINSA-N Cys-Arg Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RGTVXXNMOGHRAY-WDSKDSINSA-N 0.000 description 2
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 208000013558 Developmental Bone disease Diseases 0.000 description 2
- 108091008794 FGF receptors Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 2
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 2
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 102100040870 Glycine amidinotransferase, mitochondrial Human genes 0.000 description 2
- 102100028113 Granulocyte-macrophage colony-stimulating factor receptor subunit alpha Human genes 0.000 description 2
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 2
- XKIYNCLILDLGRS-QWRGUYRKSA-N His-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 XKIYNCLILDLGRS-QWRGUYRKSA-N 0.000 description 2
- 101000893303 Homo sapiens Glycine amidinotransferase, mitochondrial Proteins 0.000 description 2
- 101000916625 Homo sapiens Granulocyte-macrophage colony-stimulating factor receptor subunit alpha Proteins 0.000 description 2
- 101000581940 Homo sapiens Napsin-A Proteins 0.000 description 2
- 101000724418 Homo sapiens Neutral amino acid transporter B(0) Proteins 0.000 description 2
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- 208000006302 Laron syndrome Diseases 0.000 description 2
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 2
- SVJRVFPSHPGWFF-DCAQKATOSA-N Lys-Cys-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVJRVFPSHPGWFF-DCAQKATOSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 102100027343 Napsin-A Human genes 0.000 description 2
- 102100028267 Neutral amino acid transporter B(0) Human genes 0.000 description 2
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 208000037492 Sex Chromosome Aberrations Diseases 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010024668 arginyl-glutamyl-aspartyl-valine Proteins 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 210000002230 centromere Anatomy 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 208000024971 chromosomal disease Diseases 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 208000037516 chromosome inversion disease Diseases 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 208000002566 gonadal dysgenesis Diseases 0.000 description 2
- 231100000001 growth retardation Toxicity 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000002216 heart Anatomy 0.000 description 2
- 210000004090 human X chromosome Anatomy 0.000 description 2
- 210000003016 hypothalamus Anatomy 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000001672 ovary Anatomy 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- PHEDXBVPIONUQT-RGYGYFBISA-N phorbol 13-acetate 12-myristate Chemical compound C([C@]1(O)C(=O)C(C)=C[C@H]1[C@@]1(O)[C@H](C)[C@H]2OC(=O)CCCCCCCCCCCCC)C(CO)=C[C@H]1[C@H]1[C@]2(OC(C)=O)C1(C)C PHEDXBVPIONUQT-RGYGYFBISA-N 0.000 description 2
- 230000001817 pituitary effect Effects 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 230000000270 postfertilization Effects 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 210000003765 sex chromosome Anatomy 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 238000000123 temperature gradient gel electrophoresis Methods 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 239000005495 thyroid hormone Substances 0.000 description 2
- 229940036555 thyroid hormone Drugs 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- JKMPXGJJRMOELF-UHFFFAOYSA-N 1,3-thiazole-2,4,5-tricarboxylic acid Chemical compound OC(=O)C1=NC(C(O)=O)=C(C(O)=O)S1 JKMPXGJJRMOELF-UHFFFAOYSA-N 0.000 description 1
- 108010020567 12E7 Antigen Proteins 0.000 description 1
- 102000008482 12E7 Antigen Human genes 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- 102100026445 A-kinase anchor protein 17A Human genes 0.000 description 1
- 102100026397 ADP/ATP translocase 3 Human genes 0.000 description 1
- 101150014733 ASP5 gene Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- IAUSCRHURCZUJP-CIUDSAMLSA-N Ala-Lys-Cys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CS)C(O)=O IAUSCRHURCZUJP-CIUDSAMLSA-N 0.000 description 1
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- 102100022524 Alpha-1-antichymotrypsin Human genes 0.000 description 1
- 108010039224 Amidophosphoribosyltransferase Proteins 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 1
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 1
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 1
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 1
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 1
- MYVBTYXSWILFCG-BQBZGAKWSA-N Asn-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N MYVBTYXSWILFCG-BQBZGAKWSA-N 0.000 description 1
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 208000020084 Bone disease Diseases 0.000 description 1
- 102100039305 CPX chromosomal region candidate gene 1 protein Human genes 0.000 description 1
- 101100163949 Caenorhabditis elegans asp-3 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 206010008723 Chondrodystrophy Diseases 0.000 description 1
- 208000035970 Chromosome Breakpoints Diseases 0.000 description 1
- 208000016718 Chromosome Inversion Diseases 0.000 description 1
- 108010003384 Colony-Stimulating Factor Receptors Proteins 0.000 description 1
- 102000004626 Colony-Stimulating Factor Receptors Human genes 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 201000009343 Cornelia de Lange syndrome Diseases 0.000 description 1
- 208000004468 Craniofacial Abnormalities Diseases 0.000 description 1
- 241001301450 Crocidium multicaule Species 0.000 description 1
- FCKYPQBAHLOOJQ-UHFFFAOYSA-N Cyclohexane-1,2-diaminetetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)C1CCCCC1N(CC(O)=O)CC(O)=O FCKYPQBAHLOOJQ-UHFFFAOYSA-N 0.000 description 1
- NLCZGISONIGRQP-DCAQKATOSA-N Cys-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N NLCZGISONIGRQP-DCAQKATOSA-N 0.000 description 1
- QLCPDGRAEJSYQM-LPEHRKFASA-N Cys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)C(=O)O QLCPDGRAEJSYQM-LPEHRKFASA-N 0.000 description 1
- XBELMDARIGXDKY-GUBZILKMSA-N Cys-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CS)N XBELMDARIGXDKY-GUBZILKMSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 208000003471 De Lange Syndrome Diseases 0.000 description 1
- 206010012559 Developmental delay Diseases 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 206010013883 Dwarfism Diseases 0.000 description 1
- 241001646716 Escherichia coli K-12 Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 102000044168 Fibroblast Growth Factor Receptor Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 102100024375 Gamma-glutamylaminecyclotransferase Human genes 0.000 description 1
- 101710201613 Gamma-glutamylaminecyclotransferase Proteins 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- WVWZIPOJECFDAG-AVGNSLFASA-N Glu-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N WVWZIPOJECFDAG-AVGNSLFASA-N 0.000 description 1
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 1
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- 206010056438 Growth hormone deficiency Diseases 0.000 description 1
- HSRJKNPTNIJEKV-UHFFFAOYSA-N Guaifenesin Chemical compound COC1=CC=CC=C1OCC(O)CO HSRJKNPTNIJEKV-UHFFFAOYSA-N 0.000 description 1
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 1
- 101000718019 Homo sapiens A-kinase anchor protein 17A Proteins 0.000 description 1
- 101000718437 Homo sapiens ADP/ATP translocase 3 Proteins 0.000 description 1
- 101000678026 Homo sapiens Alpha-1-antichymotrypsin Proteins 0.000 description 1
- 101000745609 Homo sapiens CPX chromosomal region candidate gene 1 protein Proteins 0.000 description 1
- 101001075374 Homo sapiens Gamma-glutamyl hydrolase Proteins 0.000 description 1
- 101000856513 Homo sapiens Inactive N-acetyllactosaminide alpha-1,3-galactosyltransferase Proteins 0.000 description 1
- 101000957437 Homo sapiens Mitochondrial carnitine/acylcarnitine carrier protein Proteins 0.000 description 1
- 101000869690 Homo sapiens Protein S100-A8 Proteins 0.000 description 1
- 101000664737 Homo sapiens Somatotropin Proteins 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- TUYOFUHICRWDGA-CIUDSAMLSA-N Ile-Met Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCSC TUYOFUHICRWDGA-CIUDSAMLSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- 102100025509 Inactive N-acetyllactosaminide alpha-1,3-galactosyltransferase Human genes 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 1
- 102000004374 Insulin-like growth factor binding protein 3 Human genes 0.000 description 1
- 108090000965 Insulin-like growth factor binding protein 3 Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- 108010014691 Lithostathine Proteins 0.000 description 1
- 102100027361 Lithostathine-1-alpha Human genes 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 1
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 1
- 102100038738 Mitochondrial carnitine/acylcarnitine carrier protein Human genes 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100328158 Mus musculus Clmp gene Proteins 0.000 description 1
- 101100459248 Mus musculus Mxra8 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 208000001132 Osteoporosis Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102000005877 Peptide Initiation Factors Human genes 0.000 description 1
- 108010044843 Peptide Initiation Factors Proteins 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- PYOHODCEOHCZBM-RYUDHWBXSA-N Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 PYOHODCEOHCZBM-RYUDHWBXSA-N 0.000 description 1
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 1
- IEHDJWSAXBGJIP-RYUDHWBXSA-N Phe-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 IEHDJWSAXBGJIP-RYUDHWBXSA-N 0.000 description 1
- 102220619835 Pituitary-specific positive transcription factor 1_C77A_mutation Human genes 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- OIDKVWTWGDWMHY-RYUDHWBXSA-N Pro-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 OIDKVWTWGDWMHY-RYUDHWBXSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- 102100032442 Protein S100-A8 Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101150039863 Rich gene Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100489854 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) AAT2 gene Proteins 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 208000019001 Tall stature Diseases 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- IMMPMHKLUUZKAZ-WMZOPIPTSA-N Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 IMMPMHKLUUZKAZ-WMZOPIPTSA-N 0.000 description 1
- 241000287433 Turdus Species 0.000 description 1
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical class OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 1
- IWRMTNJCCMEBEX-AVGNSLFASA-N Tyr-Glu-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O IWRMTNJCCMEBEX-AVGNSLFASA-N 0.000 description 1
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 1
- AEOFMCAKYIQQFY-YDHLFZDLSA-N Tyr-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AEOFMCAKYIQQFY-YDHLFZDLSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- LZRWTJSPTJSWDN-FKBYEOEOSA-N Val-Trp-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LZRWTJSPTJSWDN-FKBYEOEOSA-N 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- FKNHDDTXBWMZIR-GEMLJDPKSA-N acetic acid;(2s)-1-[(2r)-2-amino-3-sulfanylpropanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(O)=O.SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O FKNHDDTXBWMZIR-GEMLJDPKSA-N 0.000 description 1
- 208000008919 achondroplasia Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- 238000012197 amplification kit Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 210000000709 aorta Anatomy 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 101150016874 asp3 gene Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 101150062912 cct3 gene Proteins 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000002559 cytogenic effect Effects 0.000 description 1
- SPTYHKZRPFATHJ-HYZXJONISA-N dT6 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 SPTYHKZRPFATHJ-HYZXJONISA-N 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 210000000744 eyelid Anatomy 0.000 description 1
- 102000052178 fibroblast growth factor receptor activity proteins Human genes 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- IXHBTMCLRNMKHZ-LBPRGKRZSA-N levobunolol Chemical compound O=C1CCCC2=C1C=CC=C2OC[C@@H](O)CNC(C)(C)C IXHBTMCLRNMKHZ-LBPRGKRZSA-N 0.000 description 1
- 210000000982 limb bud Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000003716 mesoderm Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 230000002297 mitogenic effect Effects 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 208000030454 monosomy Diseases 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- ZIUHHBKFKCYYJD-UHFFFAOYSA-N n,n'-methylenebisacrylamide Chemical compound C=CC(=O)NCNC(=O)C=C ZIUHHBKFKCYYJD-UHFFFAOYSA-N 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000008212 organismal development Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002188 osteogenic effect Effects 0.000 description 1
- 210000003254 palate Anatomy 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 239000002644 phorbol ester Substances 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000026267 regulation of growth Effects 0.000 description 1
- 108091035233 repetitive DNA sequence Proteins 0.000 description 1
- 102000053632 repetitive DNA sequence Human genes 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 229930002330 retinoic acid Natural products 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 229960001727 tretinoin Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/02—Drugs for disorders of the endocrine system of the hypothalamic hormones, e.g. TRH, GnRH, CRH, GRH, somatostatin
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/06—Drugs for disorders of the endocrine system of the anterior pituitary hormones, e.g. TSH, ACTH, FSH, LH, PRL, GH
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Animal Behavior & Ethology (AREA)
- Biomedical Technology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Diabetes (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pharmacology & Pharmacy (AREA)
- General Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Endocrinology (AREA)
- Obesity (AREA)
- Hematology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
1. Cz asteczka kwasu nukleinowego koduj aca polipeptydy sk ladaj ace si e z domeny homeoboks z lo zonej z 60 aminokwasów o sekwencji aminokwasów SEQ. ID NO: 1, wykazuj ace dzia lanie regulu- j ace ludzki wzrost oraz zawieraj aca co najmniej jedn a sekwencj e wybran a z grupy obejmuj acej se- kwencj e nukleotydów SHOX ET93 [SEQ. ID NO: 2], sekwencj e nukleotydów SHOX G310 [SEQ. ID NO: 3], sekwencj e nukleotydów SHOX ET45 [SEQ. ID NO: 4], sekwencj e nukleotydów SHOX G108 [SEQ. ID NO: 5], sekwencj e nukleotydów SHOX Va [SEQ. ID NO: 6] i sekwencj e nukleotydów SHOX Vb [SEQ. ID NO: 7]. PL PL PL PL PL PL PL PL PL
Description
Opis wynalazku
Przedmiotem wynalazku są cząsteczka kwasu nukleinowego kodująca polipeptydy, cząsteczka DNA kodująca polipeptyd, ludzkie białko wzrostu kodowane przez cząsteczkę DNA, cDNA kodujący ludzkie białko wzrostu, środek farmaceutyczny, zastosowanie ludzkiego białka wzrostu do wytwarzania środka farmaceutycznego, zastosowanie sekwencji DNA, sposób określania niskiego wzrostu, sposób identyfikacji defektu genetycznego, komórki transformowane sekwencją DNA, układ testowy do identyfikacji lub badań przesiewowych środków farmaceutycznych, przydatnych w leczeniu niskiego wzrostu u człowieka, sposób identyfikacji lub badań przesiewowych potencjalnych środków farmaceutycznych, przydatnych w leczeniu zaburzeń związanych z mutacjami w genie niskiego wzrostu, wektor ekspresyjny zawierający cząsteczkę DNA, zastosowanie ludzkich białek wzrostu, w tym ludzkiego hormonu wzrostu, do wytwarzania leków.
Wyizolowany genomowy DNA lub jego fragmenty można stosować w celach farmaceutycznych albo jako narzędzia lub reagenty diagnostyczne do identyfikacji lub charakteryzacji defektu genetycznego związanego z takimi zaburzeniami. Ludzkie białka wzrostu (czynniki transkrypcyjne A, B i C), eksprymowane po transkrypcji tego DNA w RNA lub mRNA, znajdują zastosowanie w terapii zaburzeń związanych z mutacjami w tych genach. Odpowiednie sekwencje cDNA, stanowiące przedmiot wynalazku, można stosować do wytwarzania zrekombinowanych białek nadających się do leczenia takich zaburzeń. Środki i sposoby według wynalazku znajdują wykorzystanie do genetycznego leczenia takich zaburzeń w dziedzinie medycyny molekularnej z użyciem plazmidu ekspresyjnego wytworzonego przez włączenie DNA według wynalazku poniżej promotora ekspresyjnego, który przeprowadza ekspresję w komórce ssaka-gospodarza.
Wzrost jest jednym z podstawowych aspektów rozwoju organizmu, regulowanym przez wysoce zorganizowany i złożony system. Wzrost jest cechą wieloczynnikową, na którą mają wpływ zarówno czynniki genetyczne, jak i środowiskowe. Zaburzenia rozwojowe dotyczące wzrostu są powszechnymi zjawiskami u ludzi wszystkich ras. Z częstością występowania 3 na 100 opóźnienie wzrostu powodujące niski wzrost odpowiada za dużą część wrodzonych niedoborów spotykanych u ludzi.
Z częstością występowania 1:2500 żywo urodzonych dzieci o fenotypie żeńskim, zespół Turnera jest powszechnym zburzeniem chromosomowym (Rosenfeld i wsp., 1996). Oszacowano, że 1-2% wszystkich zapłodnionych komórek jajowych u człowieka to 45,X i że aż 99% takich płodów nie rodzi się (Hall i Gilchrist, 1990; Robins, 1990). Istnieje znacząca kliniczna zmienność fenotypu osób z zespołem Turnera (lub zespołem Ullricha-Turnera) (Ullrich, 1930; Turner, 1938). Jednak zawsze stwierdza się niski wzrost i uważa się go wraz z dysgenezją gonad za wiodący objaw tego zaburzenia. Zespół Turnera jest prawdziwym zaburzeniem wieloczynnikowym. Zarówno letalność u zarodków, niski wzrost, dysgenezją gonad i charakterystyczne cechy somatyczne są uważane za efekt monosomii genów wspólnych dla chromosomów X i Y. Sugeruje się, że diploidalna dawka tych genów homologicznych na X i Y jest wymagana dla normalnego rozwoju człowieka. Oczekuje się, że geny Turnera (lub geny przeciwdziałające genom Turnera) będą eksprymowane u kobiet z zarówno czynnego i nieczynnego chromosomu X lub chromosomu Y, aby zapewnić prawidłową dawkę produktu genowego. Haploinsuficiencja (niedobór wynikający z tylko jednej czynnej kopii) byłaby więc sugerowanym mechanizmem genetycznym leżącym u podstaw tej choroby.
Dotychczas wyjaśniono różne mechanizmy związane z niskim wzrostem. Niedobory hormonu wzrostu i receptora hormonu wzrostu, jak i zaburzenia szkieletu zostały opisane jako przyczyny fenotypu niskiego wzrostu (Martial i wsp., 1979; Phillips i wsp., 1981; Leung i wsp., 1987; Goddard i wsp., 1995). Niedawno zidentyfikowano mutacje w trzech ludzkich genach kodujących receptor czynnika wzrostu fibroblastów (FGFR 1-3) jako przyczynę różnych zaburzeń szkieletu, przyjmujących najczęstszą postać karłowatości, achondroplazji (Shiang i wsp., 1994; Rousseau i wsp., 1994; Muenke i Schell, 1995). Dobrze znane i częste (1:2500 kobiet) zaburzenie chromosomowe, zespół Turnera (45, X), jest także nieodłącznie związane z niskim wzrostem. Razem wzięte, te wszystkie różne znane przyczyny stanowią wytłumaczenie tylko dla niewielkiej części niskich pacjentów, toteż dotychczas większość przypadków niskiego wzrostu pozostaje niewyjaśniona.
Uważa się, że chromosomy płci X i Y niosą geny wpływające na wzrost (Ogata i Matsuo, 1993). Można to było wydedukować z korelacji genotyp-fenotyp u pacjentów z anomaliami chromosomów płci. Badania cytogenetyczne dostarczyły dowodów, że terminalne delecje krótkich ramion chromosomu X lub Y nieodłącznie prowadzą do niskiego wzrostu u osób, u których to występuje (Zuffardi i wsp., 1982; Curry i wsp., 1984). Doniesiono o ponad 20 przegrupowaniach chromosomów związanych
PL 194 248 B1 z terminalnymi delecjami chromosomu Xp i Yp, które lokalizują gen(y) odpowiedzialne za niski wzrost do regionu pseudoautosomalnego (PAR1) (Ballabio i wsp., 1989; Schaefer i wsp., 1993). Ta lokalizacja została zawężona do najbardziej dystalnych 700 kb DNA regionu PAR1, z markerem flankującym DXYS15 (Ogata i wsp., 1992; 1995).
Regulacja wzrostu u ssaków jest zorganizowana jako złożony system. Można przypuszczać, że liczne geny (białka) sprzyjające wzrostowi oddziałują ze sobą w wysoce zorganizowany sposób. Jeden z takich genów kontrolujących wzrost został wstępnie zmapowany do regionu pseudoautosomalnego PAR1 (Ballabio i wsp., 1989), regionu, o którym wiadomo, że jest swobodnie wymieniany między chromosomami X i Y (patrz Rappold, 1993). Cały region PAR1 ma wielkość około 2700 kb.
Region krytyczny dla niskiego wzrostu zdefiniowano w przypadku pacjentów z delecjami. Niski wzrost jest konsekwencją delecji całego regionu 700 kb lub występuje wtedy, gdy specyficzny gen w obrę bie tego regionu jest obecny w stanie haploidalnym, jest przerwany lub zmutowany (tak jak w przypadku idiotypowego niskiego wzrostu, czy zespoł u Turnera). Czę stość zespoł u Turnera wynosi 1 na 2500 kobiet na całym ś wiecie, częstość idiopatycznego niskiego wzrostu tego typu można ocenić na 1 na 4000-5000 osób. Kobiety z zespołem Turnera i niektóre osoby o niskim wzroście na ogół są leczone w sposób niespecyficzny za pomocą hormonu wzrostu (GH) przez wiele lat aż do ponad dziesięciu, choć dobrze wiadomo, że mają normalne poziomy GH i że niedobór GH nie jest problemem. Leczenie takich pacjentów jest bardzo kosztowne (szacowany koszt około 30000 dolarów USA rocznie). Tak więc istniał problem dostarczenia sposobu i środków do rozróżnienia z jednej strony pacjentów o niskim wzroście, u których występuje defekt genetyczny w odpowiednim genie, a z drugiej strony pacjentów, którzy nie mają żadnego defektu genetycznego w tym genie. Pacjenci z defektem genetycznym w odpowiednim genie - z całkowitą delecją (jak w przypadku zespołu Turnera) lub z mutacją punktową (jak w idiopatycznym niskim wzroście) powinni być podatni na alternatywne terapie bez ludzkiego GH, które można obecnie opracować.
Korelacje genotyp/fenotyp podtrzymują istnienie genu wzrostu w proksymalnej części Yg i dystalnej części Yp. Niski wzrost jest także nieodłącznie wykrywany u osób z terminalnymi delecjami Xp. Niedawno podjęto rozległe poszukiwania pacjentów i pacjentek z częściowymi monosomiami regionu pseudoautosomalnego. Na podstawie korelacji genotyp-fenotyp stwierdzono minimalny wspólny region delecji 700 kb DNA przyległego do telomeru (Ogata i wsp., 1992; Ogata i wsp., 1995). Stwierdzono, że interesujący region jest położony między markerami genetycznymi DKYS20 (3cosPP) i DXYS15 (113D) i wykluczono wszystkie geny-kandydatów dla kontroli wzrostu z regionu PAR1 (np. receptor a hematopoetycznego czynnika wzrostu; CSF2RA) (Gough i wsp., 1992) na podstawie ich fizycznej lokalizacji (Rappold i wsp., 1992). Oznacza to, że geny mieściły się w obrębie delecji 700 kb regionu 2700 kb PAR1.
Niedawno wykryto delecje regionu pseudoautosomalnego (PAR1) chromosomów płci u osób o niskim wzroś cie, a nastę pnie zdefiniowano minimalny region wspólnej delecji o wielkoś ci 700 kb w obrębie PAR1. Analiza DNA pacjentów AK i SS techniką Southerna z użyciem różnych markerów pseudoautosomalnych zidentyfikowała terminalną delecje Xp o wielkości około 700 kb, dystalną w stosunku do DXYS15 (113D) (Ogata i wsp, 1992; Ogata i wsp., 1995).
Region genu odpowiadający za niski wzrost zidentyfikowano jako region około 500 kb, korzystnie około 170 kb w regionie PAR1 chromosomów X i Y. Trzy geny w tym regionie zidentyfikowano jako kandydatów na gen niskiego wzrostu. Geny te nazwano SHOX (także nazywany SHOX93 lub HOX93,
SHOX = short stature homeobox containing gene = gen niskiego wzrostu zawierający sekwencję homeotyczną), pET92 i SHOT (SHOX - like homeobox gene on chromosome three = gen homeotyczny podobny do SHOX na chromosomie trzecim). Gen SHOX, który ma dwa odrębne miejsca składania dające w efekcie dwa warianty (SHOX a i b) jest szczególnie ważny. We wstępnych badaniach możliwa była analiza istotnych części sekwencji nukleotydowej genu niskiego wzrostu (SEQ. ID NO: 8). Odpowiednie egzony lub ich części można było przewidzieć i zidentyfikować (np. egzon I [G310]; egzon II [ET93]; egzon IV [G108]; pET92). Uzyskane informacje o sekwencji można było następnie wykorzystać do zaprojektowania odpowiednich starterów lub sond nukleotydowych, które hybrydyzują z częściami genu SHOX lub z jego fragmentami. Wówczas gen SHOX można wyizolować z zastosowaniem znanych technik. W wyniku dalszej analizy sekwencji DNA genów odpowiedzialnych za niski wzrost możliwe było bardziej precyzyjne określenie sekwencji nukleotydowej egzonów I-V (p. fig. 1-3). Gen SHOX zawiera sekwencję homeoboks (SEQ. ID NO: 1) o około 180 bp (p. fig. 2 i fig. 3), zaczynającą się od nukleotydu kodującego pozycję aminokwasu 176 (E), to znaczy od CAG (440) do GAG (619). Sekwencja homeobox jest identyfikowana jako sekwencja homeoboks-pET93 (SHOX), przy
PL 194 248 B1 czym znaleziono dwie mutacje punktowe u pacjenta niemieckiego (A1) i japońskiego przez badania przesiewowe 250 osobników o idiopatycznym niskim wzroście. Obydwie mutacje punktowe wykryto w identycznych pozycjach i prowadzą one do obcięcia białka w pozycji aminokwasu 195, co sugeruje, że może istnieć „gorące miejsce” mutacji. Ze względu na to, że obie znalezione mutacje, które prowadzą do obciętego białka są w tej samej pozycji, istnieje prawdopodobieństwo, że występuje gorące miejsce rekombinacji w egzonie 4 (G108). Można więc stosować startery specyficzne w stosunku do egzonów tak jak wskazano poniżej, np. GCA CAG CCA ACC ACC TAG (do przodu) lub TGG AAA GGC ATC ATC CGT AAG (odwrotny).
Wymieniony powyżej nowy gen SHOX zawierający homeoboks, który jest zlokalizowany w obrębie regionu 170 kb, ulega alternatywnemu składaniu dając dwa białka o różnych funkcjach. Zastosowano analizę mutacji i sekwencjonowanie DNA dla wykazania, że niski wzrost może być spowodowany przez mutacje w SHOX.
Identyfikacja i klonowanie regionu istotnego dla niskiego wzrostu według wynalazku zostało przeprowadzone w sposób następujący.
Przeprowadzono rozległe badania map fizycznych u 15 osób z częściową monosomią w regionie pseudoautosomalnym (PAR1). Przez korelację wzrostu tych osób z ich punktami pęknięcia w delecji zdefiniowano krytyczny region dla niskiego wzrostu (SS) o wielkości około 700 kb. Region ten następnie sklonowano jako zachodzący na siebie kontig kosmidowy stosując sztuczne chromosomy drożdży (YAC) z PAR1 (Ried i wsp., 1996) i przez kroczenie kosmidami. Aby szukać genów-kandydatów na SS w tym regionie zastosowano różne techniki do regionu około 600 kb między dystalnym końcem kosmidu 56G10 i proksymalnym końcem 51D11. Stosując selekcję cDNA, pułapki na egzony i klonowanie wysp CpG zidentyfikowano dwa nowe geny.
Pozycję regionu istotnego dla niskiego wzrostu można było zawęzić do mniejszego przedziału 170 kb DNA przez scharakteryzowanie trzech dalszych konkretnych niskich osób (GA, AT i RY). Aby precyzyjnie zlokalizować punkty pęknięcia przy przegrupowaniu u tych osób, zastosowano fluorescencyjną hybrydyzację in situ (FISH) na chromosomach metafazowych za pomocą kosmidów z kontigu. Analiza pacjenta GA z terminalną delecją i normalnym wzrostem pozwoliła określić dystalną granicę krytycznego regionu (z punktem pęknięcia w kosmidzie 110E3), a pacjenta AT z inwersją chromosomu X i normalnym wzrostem, granicę proksymalną (z punktem pęknięcia w kosmidzie 34F5). Okazało się, że punkt pęknięcia na chromosomie Y pacjenta RY, z terminalną delecją i niskim wzrostem, także jest zawarty w kosmidzie 34F5, co sugeruje, że ten region zawiera sekwencje predysponujące do przegrupowania chromosomów.
Cały region, ograniczony przez telomer Xp/Yp, został sklonowany jako zestaw zachodzących na siebie kosmidów. Hybrydyzacja fluorescencyjna in situ (FISH) z kosmidami z tego regionu została użyta do badania sześciu pacjentów z przegrupowaniami chromosomu X, trzech z normalnym wzrostem i trzech o niskim wzroście. Korelacje genotyp-fenotyp zawęziły region istotny dla niskiego wzrostu do 270 kb DNA lub nawet mniej, np. 170 kb, zawierający gen lub geny o ważnej roli dla ludzkiego wzrostu. Minimalny zestaw sześciu do ośmiu kosmidów łączących ten region jest obecnie dostępny dla FISH w interfazie i metafazie, dostarczając cennego narzędzia do badań diagnostycznych pacjentów z idiopatycznie niskim wzrostem.
Krótki opis rysunków
Figura 1 przedstawia mapę genową genu SHOX zawierającą pięć egzonów, oznaczonych w sposób nastę pują cy: egzon I: G310, egzon II: ET93, egzon III: ET45, egzon IV: G108 i egzony Va i Vb, przy czym egzony Va i Vb są efektem dwóch różnych miejsc składania genu SHOX. Egzony II i III zawierają sekwencję homeoboks o d ł ugoś ci 180 nukleotydów.
Figury 2 i 3 przedstawiają sekwencję nukleotydów i przewidywaną sekwencją aminokwasów SHOXa i SHOXb.
SHOXa: przewidywany start translacji rozpoczyna się w nukleotydzie 92 z pierwszym kodonem stop (TGA) w ramce w nukleotydach 968-970, co daje otwartą ramkę odczytu 876 bp, która koduje przewidywane białko złożone z 292 aminokwasów (określone odpowiednio jako czynnik transkrypcyjny A lub białko SHOXa). Znajdujący się w ramce 5' kodon stop przy nukleotydzie 4, kodon start i przewidywany kodon terminacyjny stop są wytłuszczone. Homeoboks jest w ramce (począwszy od pozycji aminokwasu 117 (Q) do 176 (E), to znaczy w sekwencji nukleotydowej od CAG do GAG). Pozycje intronów są zaznaczone strzałkami. Dwa przypuszczalne sygnały poliadenylacji w regionie 3' nie ulegającym translacji podkreślono.
PL 194 248 B1
SHOXb: otwarta ramka odczytu 876 bp obejmuje region od A w pierwszej metioninie w nukleotydzie 92 do położonego w ramce kodonu stop przy nukleotydzie 767-769, co daje otwartą ramkę odczytu 675 bp, która koduje przewidywane białko złożone z 225 aminokwasów (określone odpowiednio jako czynnik transkrypcyjny B lub białko SHOXb). Położenia intronów są zaznaczone strzałkami. Egzony I-IV są identyczne jak w SHOXa, egzon V jest specyficzny dla SHOXb. Podkreślono przypuszczalny sygnał poliadenylacji w regionie 3' nie ulegającym translacji.
Figura 4 przedstawia sekwencję nukleotydów i przewidywaną sekwencję aminokwasów SHOT. Przewidywany start translacji rozpoczyna się przy nukleotydzie 43, a pierwszy położony w ramce odczytu kodon stop (TGA) jest w nukleotydach 613-615, co daje otwartą ramkę odczytu 573 bp, która koduje przewidywane białko o 190 aminokwasach (określane odpowiednio jako czynnik transkrypcyjny C lub białko SHOT). Homeoboks jest w ramce (począwszy od pozycji aminokwasu 11 (Q) do 70 (E), to znaczy od CAG do GAG w sekwencji nukleotydowej). Położenie intronów jest zaznaczone strzałkami. Dwa przypuszczalne sygnały poliadenylacji w regionie 3' nie ulegającym translacji podkreślono.
Figura 5 przedstawia organizację egzon/intron ludzkiego genu SHOX i odpowiednie pozycje w sekwencji nukleotydowej.
Krótki opis sekwencji
SEQ. ID NO: 1: sekwencja domeny homeoboks (180 bp) przetłumaczona na sekwencję aminokwasów
SEQ. ID NO: 2: egzon II (ET93) genu SHOX
SEQ. ID NO: 3: egzon I (G310) genu SHOX
SEQ. ID NO: 4: egzon III (ET45) genu SHOX
SEQ. ID NO: 5: egzon IV (G108) genu SHOX
SEQ. ID NO: 6: egzon Va genu SHOX
SEQ. ID NO: 7: egzon Vb genu SHOX
SEQ. ID NO: 8: wstępna sekwencja nukleotydowa genu SHOX
SEQ. ID NO: 9: gen ET92
SEQ. ID NO: 10: sekwencja SHOXa (patrz też fig. 2)
SEQ. ID NO: 11: czynnik transkrypcyjny A (patrz też fig. 2)
SEQ. ID NO: 12: sekwencja SHOXb (patrz też fig. 3)
SEQ. ID NO: 13: czynnik transkrypcyjny B (patrz też fig. 3)
SEQ. ID NO: 14: gen SHOX
SEQ. ID NO: 15: sekwencja SHOT (patrz też fig. 4)
SEQ. ID NO: 16: czynnik transkrypcyjny C (patrz też fig. 4)
W zwią zku z tym, ż e docelowy gen prowadz ą cy do zaburzeń wzrostu u ludzi (czyli region niskiego wzrostu) był nieznany przed wynalazkiem, biologiczne i kliniczne powiązanie pacjentów z tą delecją mogło dać wgląd w funkcję tego genu. W niniejszych badaniach zastosowano hybrydyzację fluorescencyjną in situ (FISH) do badania jąder limfocytów od sześciu pacjentów w metafazie i interfazie. Celem było przebadanie wszystkich kosmidów zestawu zachodzących na siebie kosmidów pod kątem ich przydatności jako sond do FISH i określenie regionów pęknięcia we wszystkich czterech przypadkach i w ten sposób ustalenie minimalnego regionu istotnego dla genu niskiego wzrostu.
Duplikację i delecję genomowego DNA można technicznie ocenić przez starannie kontrolowaną ilościową PCR lub ocenę dawki na filtrach sporządzonych techniką Southerna lub przez zastosowanie RFLP. Jednak szczególnie godną zaufania metodą do rozróżnienia pojedynczej i podwójnej dawki markerów jest FISH, którego zastosowanie kliniczne jest obecnie rutynowe. Podczas gdy dla FISH w interfazie można ocenić samą obecność lub nieobecność markera molekularnego, FISH na chromosomach metafazy może dostarczyć półilościowej miary delecji między kosmidami. Stwierdzono, że delecje około 10 kb (redukcja sygnału o 25%) mogą być nadal wykryte. Jest to o tyle ważne, że praktycznie wszystkie związane z chorobami geny na ludzkim chromosomie X zostały powiązane z wię kszymi i mniejszymi delecjami w zakresie od kilku kilozasad do kilku megazasad DNA (Nelson i wsp., 1995).
Wynalazek dotyczy cząsteczki kwasu nukleinowego kodującej polipeptydy składające się z domeny homeoboks złożonej z 60 aminokwasów o sekwencji aminokwasów SEQ. ID NO: 1 wykazujące działanie regulujące ludzki wzrost oraz zawierającej co najmniej jedną sekwencję wybraną z grupy obejmującej sekwencję nukleotydów SHOX ET93 [SEQ. ID NO: 2], sekwencję nukleotydów SHOX G310 [SEQ. ID NO: 3], sekwencję nukleotydów SHOX ET45 [SEQ. ID NO: 4], sekwencję nukleotydów
PL 194 248 B1
SHOX G108 [SEQ. ID NO: 5], sekwencję nukleotydów SHOX Va [SEQ. ID NO: 6] i sekwencję nukleotydów SHOX Vb [SEQ. ID NO: 7].
Korzystniej cząsteczka DNA według wynalazku koduje polipeptyd o długości 150-350 aminokwasów.
Korzystnie cząsteczka DNA według wynalazku zawiera sekwencję nukleotydów SHOX G310 [SEQ. ID NO: 3].
Korzystnie cząsteczka DNA według wynalazku zawiera sekwencję nukleotydów SHOX G108 [SEQ. ID NO: 5].
Korzystnie cząsteczka DNA według wynalazku zawiera sekwencję nukleotydów SHOXVa [SEQ. ID NO: 6] lub SHOXVb [SEQ. ID NO: 7].
Ponadto wynalazek dotyczy cząsteczki DNA kodującej polipeptyd wybrany z grupy obejmującej:
a) czynnik transkrypcyjny A mający sekwencję aminokwasów [SEQ. ID NO: 11] i
b) czynnik transkrypcyjny B mający sekwencję aminokwasów [SEQ. ID NO: 13].
Korzystnie DNA według wynalazku stanowi genomowy lub wyizolowany DNA odpowiedzialny za regulację ludzkiego wzrostu, a zwłaszcza DNA stanowi sekwencję nukleotydową genu SHOX [SEQ. ID NO: 14].
Korzystnie DNA według wynalazku stanowi cDNA, a zwłaszcza cDNA stanowiący sekwencję nukleotydów SHOXa [SEQ. ID NO: 10] lub SHOXb [SEQ. ID NO: 12].
Ponadto wynalazek dotyczy ludzkiego białka wzrostu kodowanego przez określoną powyżej cząsteczkę DNA albo jego funkcjonalnego fragmentu wykazującego działanie regulujące ludzki wzrost, które cechuje się tym, że ma sekwencję aminokwasów [SEQ. ID NO: 11] (czynnik transkrypcyjny SHOXa).
Ponadto wynalazek dotyczy ludzkiego białka wzrostu kodowanego przez określoną powyżej cząsteczkę DNA albo jego funkcjonalnego fragmentu wykazującego działanie regulujące ludzki wzrost, które cechuje się tym, że ma sekwencję aminokwasów [SEQ. ID NO: 13] (czynnik transkrypcyjny SHOXb).
Ponadto wynalazek dotyczy ludzkiego białka wzrostu kodowanego przez cząsteczkę DNA [SEQ. ID NO: 15] albo jego funkcjonalnego fragmentu wykazującego działanie regulujące ludzki wzrost, które cechuje się tym, że ma sekwencję aminokwasów [SEQ. ID NO: 16] (czynnik transkrypcyjny SHOT).
Ponadto wynalazek dotyczy cDNA kodującego określone powyżej ludzkie białko wzrostu, który cechuje się tym, że białko to ma sekwencję aminokwasów [SEQ. ID NO: 11], [SEQ. ID NO: 13] lub [SEQ. ID NO: 16].
Ponadto wynalazek dotyczy środka farmaceutycznego, którego cechą jest to, że zawiera określone powyżej ludzkie białko wzrostu.
Ponadto wynalazek dotyczy zastosowania określonego powyżej ludzkiego białka wzrostu do wytwarzania środka farmaceutycznego do leczenia niskiego wzrostu.
Ponadto wynalazek dotyczy zastosowania określonej powyżej sekwencji DNA albo jej fragmentu, do wytwarzania środka farmaceutycznego do leczenia zaburzeń związanych z mutacjami genu niskiego wzrostu [genu SHOX] [SEQ. ID NO: 14].
Ponadto wynalazek dotyczy zastosowania określonej powyżej sekwencji DNA albo jej fragmentu, do wytwarzania zastawu do identyfikacji osób z genetycznym defektem odpowiedzialnym za zmniejszony ludzki wzrost.
Ponadto wynalazek dotyczy zastosowania określonej powyżej sekwencji DNA albo jej fragmentu do identyfikacji genu odpowiedzialnego za niski ludzki wzrost.
Ponadto wynalazek dotyczy sposobu określania niskiego wzrostu na podstawie cząsteczek RNA lub DNA, który charakteryzuje się tym, że cząsteczkę z próbki biologicznej, która ma być badana, amplifikuje się w obecności dwóch sond nukleotydowych komplementarnych z którąkolwiek z sekwencji DNA wybranych z [SEQ. ID NO: 2] do [SEQ. ID NO: 7], a następnie cząsteczkę tę wykrywa się za pomocą systemu detekcji wykrywającego amplifikowane kwasy nukleinowe.
Ponadto wynalazek dotyczy sposobu identyfikacji defektu genetycznego w próbce biologicznej pobranej od człowieka podejrzewanego o przenoszenie mutacji genetycznej w genie SHOX, który charakteryzuje się tym, że
a) pobiera się od człowieka próbkę genetyczną zawierającą polinukleotyd;
b) amplifikuje się polinukleotyd z części a) w obecności startera, przy czym ten starter stanowi starter flankujący egzon dla sekwencji nukleotydów egzonu genu SHOX [SEQ. ID NO: 14], przy czym
PL 194 248 B1 sekwencja nukleotydów egzonu hybrydyzuje z polinukleotydową sekwencją [SEQ. ID NO: 14] w następujących ostrych warunkach hybrydyzacji: 0,5 M NaPi o pH 7,2, 7% SDS i 1 mM EDTA w 65°C oraz
c) identyfikuje się produkt amplifikacji polinukleotydu z a) jako oznakę mutacji genetycznej w genie SHOX tego człowieka.
Ponadto wynalazek dotyczy komórek transformowanych określoną powyżej sekwencją DNA.
Ponadto wynalazek dotyczy układu testowego do identyfikacji lub badań przesiewowych środków farmaceutycznych, przydatnych w leczeniu niskiego wzrostu u człowieka, który cechuje się tym, że zawiera określoną powyżej komórkę.
Ponadto wynalazek dotyczy sposobu identyfikacji lub badań przesiewowych potencjalnych środków farmaceutycznych, przydatnych w leczeniu zaburzeń związanych z mutacjami w genie niskiego wzrostu, który charakteryzuje się tym, że stosuje się układ testowy zawierający komórkę transformowaną określoną powyżej sekwencją DNA oraz określa się zmiany w fenotypie tych komórek lub zmiany w produktach ekspresji tych komórek porównując fenotypy tych komórek lub produkty ekspresji tych komórek zarówno przed, jak i po skontaktowaniu tych komórek z potencjalnymi środkami farmaceutycznymi.
Ponadto wynalazek dotyczy wektora ekspresyjnego zawierającego określoną powyżej cząsteczkę DNA, zdolnego do przeprowadzenia ekspresji kodowanego polipeptydu.
Ponadto wynalazek dotyczy zastosowania określonych powyżej ludzkich białek wzrostu albo ich funkcjonalnych fragmentów wykazujących działanie regulujące ludzki wzrost, do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOX [SEQ. ID NO: 14], przy czym korzystnie taka mutacja genetyczna jest spowodowana gorącym miejscem mutacji w sekwencji DNA kodującej skrócenie białka w pozycji aminokwasu 195 w ludzkim genie wzrostu SHOX.
Ponadto wynalazek dotyczy zastosowania ludzkiego hormonu wzrostu do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOX [SEQ. ID NO: 14], z wykluczeniem wytwarzania leków do leczenia pacjentów z zespołem Turnera.
Ponadto wynalazek dotyczy zastosowania określonych powyżej ludzkich białek wzrostu albo ich funkcjonalnych fragmentów wykazujących działanie regulujące ludzki wzrost, do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOT [SEQ. ID NO: 15].
Sekwencje DNA albo ich fragmenty, według wynalazku, stanowią część genów odpowiedzialnych za wzrost u ludzi (lub odpowiednio za niski wzrost w przypadku defektów genetycznych w tych genach). Zidentyfikowano trzy geny odpowiedzialne za ludzki wzrost: SHOX, pET92 i SHOT. Sekwencje DNA lub fragmenty tych genów, jak i odpowiednie sekwencje DNA pełnej długości tych genów mogą być wprowadzone do odpowiedniego wektora i transfekowane do komórek. Gdy takie wektory wprowadza się do komórek w odpowiedni sposób, tak jak są one obecne u zdrowych ludzi, można rozważyć leczenie chorób związanych z niskim wzrostem, np. zespołu Turnera, z zastosowaniem nowoczesnych technik terapii genowej. Tak przykładowo niski wzrost można leczyć przez usunięcie odpowiednich zmutowanych genów wzrostu odpowiedzialnych za niski wzrost. Można także stymulować odpowiednie geny, które kompensują działanie genów odpowiedzialnych za niski wzrost, np. przez wstawienie sekwencji DNA przed, za lub w obrębie genów wzrostu/niskiego wzrostu, aby zwiększyć ekspresję zdrowych alleli. Przez taką modyfikację genową geny wzrostu/niskiego wzrostu ulegają odpowiednio aktywacji lub wyciszeniu. Można to osiągnąć przez wstawienie sekwencji DNA w odpowiednich miejscach w obrębie genu lub w jego sąsiedztwie, tak by te wstawione sekwencje DNA interferowały z genami wzrostu/niskiego wzrostu i w ten sposób aktywowały ich transkrypcję lub jej zapobiegały. Można także rozważyć wprowadzenie elementu regulacyjnego (np. sekwencji promotora) przed tymi genami wzrostu, aby stymulować te geny tak, by stały się one aktywne. Można także rozważyć stymulację odpowiednich sekwencji promotorowych aby nadeksprymować - w przypadku zespołu Turnera - zdrowy czynny allel i skompensować brak drugiego allelu. Modyfikację genów może można zasadniczo osiągnąć przez insercję egzogennych sekwencji DNA do genu wzrostu/niskiego wzrostu za pomocą rekombinacji homologicznej.
Sekwencje DNA według wynalazku można także stosować do transformacji takich sekwencji do zwierząt, takich jak ssaki, poprzez odpowiedni układ wektora. Takie zwierzęta transgeniczne można wówczas stosować do badań in vitro przy selekcjonowaniu lub identyfikacji środków farmaceutycznych, przydatnych w leczeniu chorób związanych z niskim wzrostem. Jeśli zwierzęta reagują pozytywnie na podanie badanego związku lub środka, można rozważyć zastosowanie takiego środka lub związku albo jego pochodnych jako środków farmaceutycznych. Sekwencje DNA według wynalazku można także zastosować w odpowiedni sposób w eksperymentach genetycznych mających na celu
PL 194 248 B1 znalezienie sposobów kompensujących utratę genów odpowiedzialnych za niski wzrost (zwierzęta „knock-out”).
Sekwencje DNA według wynalazku można stosować do transformowania komórek. Komórki te można stosować do identyfikacji środków farmaceutycznych przydatnych w leczeniu chorób związanych z niskim wzrostem lub do selekcjonowania takich związków, lub zbioru związków. W odpowiednim układzie testowym można określić zmiany w fenotypie lub we wzorze ekspresji w tych komórkach, co umożliwia identyfikację interesujących potencjalnych środków w opracowywaniu leków.
Sekwencje DNA według wynalazku można także stosować w projektowaniu odpowiednich starterów, które hybrydyzują z odcinkami genów niskiego wzrostu lub ich fragmentami w warunkach ostrych. Można skonstruować sekwencje odpowiednich starterów, przydatne w diagnostyce ludzi z defektem genetycznym powodującym niski wzrost. W związku z tym należy podkreślić, że dwie wykryte mutacje znajdują się w identycznej pozycji, co sugeruje, że istnieje gorące miejsce dla mutacji.
Na ogół należy rozumieć, że sekwencje DNA według wynalazku obejmują także sekwencje DNA, które są zdegenerowane w stosunku do specyficznych przedstawionych sekwencji, w oparciu o degenerację kodu genetycznego lub które hybrydyzują w ostrych warunkach z konkretnymi przedstawionymi sekwencjami DNA.
W opisanym powyż ej sposobie oznaczania genu lub genów odpowiedzialnych za niski wzrost w biologicznej próbce tkanek ciała lub płynów ustrojowych korzystnie stosuje się znane fachowcom techniki amplifikacji nukleotydów, np. PCR, do detekcji specyficznych sekwencji nukleotydowych, opisane np. przez Mullisa i wsp. 1986, Cold Spring Harbor Symposium Quant. Biol. 51, 262-272 oraz Saiki i wsp., 1988, Science 239, 487-491, które przytacza się tu jako źródła literaturowe. Oznaczane sekwencje nukleotydowe niskiego wzrostu są głównie reprezentowane przez sekwencje SEQ. ID NO: 2 do SEQ. ID NO: 7.
Zasadniczo wszystkie startery i sondy oligonukleotydowe do amplifikacji i detekcji w próbce biologicznej defektu genetycznego odpowiedzialnego za zmniejszony wzrost człowieka nadają się dla amplifikacji docelowej sekwencji związanej z niskim wzrostem. W szczególności odpowiednie pary starterów specyficzne w stosunku do egzonów według wynalazku zamieszczono w tabeli 1. Następnie przeprowadza się odpowiednią detekcję, np. z użyciem znacznika radioaktywnego lub nie radioaktywnego.
T a b e l a 1
| Egzon | Starter sensowny | Starter antysensowny | Produkt (bp) | Ta (°C) |
| 5'-I(G310) | SPI | ASP1 | 194 | 58 |
| 3'-I(G310) | SP2 | ASP 2 | 295 | 58 |
| II(ET93) | SP3 | ASP 3 | 262 | 76/72/68 |
| III(ET45) | SP4 | ASP 4 | 120 | 65 |
| IV(G108) | SP5 | ASP 5 | 154 | 62 |
| Va(SHOXa) | SP6 | ASP 6 | 265 | 61 |
Objaśnienie skrótów starterów
SP 1: ATTTCCAATGGAAAGGCGTAAATAAC
SP2: ACGGCTTTTGTATCCAAGTCTTTTG
SP3: GCCCTGTGCCCTCCGCTCCC
SP4: GGCTCTTCACATCTCTCTCTGCTTC
SP5: CCACACTGACACCTGCTCCCTTTG
SP6: CCCGCAGGTCCAGGCTCAGCTG
ASP1: CGCCTCCGCCGTTACCGTCCTTG
ASP2: CCCTGGAGCCGGCGCGCAAAG
ASP3: CCCCGCCCCCGCCCCCGG
ASP4: CTTCAGGTCCCCCCAGTCCCG
ASP5: CTAGGGATCTTCAGAGGAAGAAAAAG ASP6: GCTGCGCGGCGGGTCAGAGCCCCAG
PL 194 248 B1
Jako cel można także użyć jednoniciowy RNA. Sposoby odwrotnej transkrypcji RNA do cDNA są dobrze znane i opisane w pracy Sambrooka i wsp., Molecular Cloning: A Laboratory Manual, New York, Cold Spring Harbor Laboratory 1989. Alternatywnie, korzystne sposoby odwrotnej transkrypcji obejmują zastosowanie termostabilnych polimeraz DNA wykazujących aktywność RT (odwrotnej transkryptazy).
Technikę opisaną powyżej można także zastosować do selekcji z grupy obejmującej osoby o niskim wzroście tych osób, u których występuje defekt genetyczny, co pozwala w konsekwencji na bardziej specyficzne terapie medyczne.
Czynniki transkrypcyjne A, B i C można stosować jako środki farmaceutyczne. Te czynniki transkrypcyjne inicjują nadal nieznaną kaskadę efektów biologicznych na poziomie molekularnym, dotyczących ludzkiego wzrostu. Te białka lub ich funkcjonalne fragmenty wywołują działanie mitogenne na różne komórki. W szczególności wykazują one działanie osteogenne. Można je stosować w terapii chorób kości, takich jak np. osteoporoza, a szczególnie tych chorób, które dotyczą zaburzeń w regulacji wapnia w kościach.
W uż ytym tu znaczeniu okreś lenie „izolowany” dotyczy wytwarzania oryginalnych pochodnych cząsteczki DNA przez klonowanie. Należy jednak zdawać sobie sprawę, że określenie to nie jest ograniczające i w rzeczywistości wynalazek dotyczy zarówno naturalnie występujących, jak i syntetycznie wytworzonych sekwencji, co jest zrozumiałe dla fachowców.
Cząsteczki DNA według wynalazku można stosować w formach terapii genowej, obejmujących stosowanie plazmidu ekspresyjnego wytworzonego przez włączenie odpowiedniej sekwencji DNA według wynalazku poniżej promotora ekspresyjnego, który przeprowadza ekspresję w komórce ssaka-gospodarza. Odpowiednimi gospodarzami są komórki prokariotyczne lub eukariotyczne. Prokariotycznymi komórkami gospodarza są np. E. coli, Bacillus subtilis itp. Przez transfekcję komórek gospodarza za pomocą replikonów pochodzących od gatunków adaptowalnych do gospodarza, to znaczy plazmidowych wektorów zawierających punkt startu replikacji i sekwencje regulatorowe, takie komórki gospodarza mogą być transfekowane żądanym genem lub cDNA. Do korzystnych należą te wektory, które zawierają sekwencję, która nadaje transfekowanym komórkom właściwość (fenotyp), za pomocą którego mogą być one wybrane. Przykładowo w przypadku E. coli jako gospodarzy zazwyczaj stosuje się szczep E. coli K12, a jako wektory można na ogół stosować plazmidy pBR322 lub pUC. Do przykładowych odpowiednich promotorów dla E. coli jako gospodarzy należą promotor trp, promotor lac lub promotor Ipp. Jeśli jest to pożądane, wydzielanie produktu ekspresji przez błonę komórkową można osiągnąć przez połączenie sekwencji DNA kodującej sekwencję peptydu sygnałowego ze strony powyżej 5' genu. Eukariotyczne komórki gospodarzy obejmują komórki pochodzące od kręgowców lub drożdży itp. Jako komórki gospodarza kręgowca można stosować komórki COS (Cell, 1981, 23: 175-182) lub komórki CHO. Korzystnie można stosować promotory usytuowane 5' powyżej genu, który ma ulec ekspresji i mające sekwencje do składania RNA, poliadenylacji i terminacji transkrypcji.
Czynniki transkrypcyjne A, B i C według wynalazku można stosować do leczenia zaburzeń powodowanych przez mutacje w ludzkich genach wzrostu i można je stosować jako czynniki sprzyjające wzrostowi. Ze względu na polimorfizm znany w przypadku genów eukariotycznych, jeden lub więcej aminokwasów może być zmieniony. Co więcej, jeden lub więcej aminokwasów w polipeptydach może być wydeletowanych lub wstawionych w sekwencji aminokwasów w polipeptydach SEQ. ID NO: 11, 13 i 16. Takie polipeptydy są na ogół okreś lane jako ekwiwalentne polipeptydy, o ile aktywność biologiczna niezmodyfikowanego polipeptydu pozostaje w zasadzie niezmieniona.
Wynalazek ilustrują następujące przykłady.
P r z y k ł a d 1
Pacjenci
Cała szóstka badanych pacjentów miała aberracje chromosomów płci de novo.
CC jest dziewczynką o kariotypie 45,X/46, X psu dic (X) (Xqter > Xp22.3::Xp22.3 > Xqter). Przy ostatnim badaniu w wieku 6 1/2 lat jej wzrost wynosił 114 cm (25-50 percentyl). Wzrost jej matki wynosił 155 cm, ojciec nie był dostępny dla badań. Szczegóły, patrz Henkel i wsp., 1991.
GA jest dziewczynką o kariotypie 46,X der X (3pter > 3p23::Xp22.3 > Xqter). Przy ostatnim badaniu w wieku 17 lat stwierdzono normalny wzrost (159 cm). Wzrost jej matki wynosi 160 cm, a wzrost jej ojca 182 cm. Szczegóły, patrz Kulharya i wsp., 1995.
SS jest dziewczynką o kariotypie 46,X rea(X) (Xqter > Xq26::Xp22.3 > Xq26:). W wieku 11 lat jej wzrost był poniżej 3 percentylu krzywej wzrostu dla dziewczynek japońskich; jej przewidywany
PL 194 248 B1 wzrost w wieku dorosłym (148,5 cm) był poniżej jej docelowego wzrostu (163 cm) i docelowego zakresu (155 do 191 cm). Szczegóły, patrz Ogata i wsp., 1992.
AK jest dziewczynką o kariotypie 46,Xrea(X) (Xqter > Xp22.3::Xp22.3 > Xp21.3:). W wieku 13 lat jej wzrost był poniżej 2 percentylu krzywej wzrostu dla dziewczynek japońskich; jej przewidywany wzrost w wieku dorosłym (142,8 cm) był poniżej jej docelowego wzrostu (155,5 cm) i docelowego zakresu (147,5-163,5 cm). Szczegóły, patrz Ogata i wsp., 1995.
RY: kariotyp pacjenta z pierścieniowym Y jest 46,X,r(Y)/46,Xdic r(Y)/45,X [95:3:2], jak stwierdzono w 100 limfocytach; w wieku 16 lat jego ostateczny wzrost wynosił 148; wzrost wszystkich jego trzech braci jest w normalnym zakresie - odpowiednio 170 cm (16 lat, brat 1), 164 cm (14 lat, brat 2) i 128 cm (9 lat, brat 3). Opóźnienie wzrostu u tego pacjenta jest tak silne, że pasuje także do dodatkowej delecji locus GCY na Yq.
AT: chłopiec z ataksją i inv(X); normalny wzrost 116 cm w wieku 7 lat, wzrost rodziców - odpowiednio 156 cm i 190 cm.
Pacjenci do analizy mutacji
250 osób o idiopatycznym niskim wzroście zbadano pod względem mutacji w SHOXa. Pacjentów wybrano na podstawie następujących kryteriów: wzrost dla wieku chronologicznego był poniżej 3 centyla narodowych standardów wzrostu, minus 2 odchylenia standardowe (SDS); brak jakiejkolwiek choroby przyczynowej, w szczególności normalna waga (długość) dla czasu trwania ciąży, normalne proporcje ciała, brak przewlekłych zaburzeń organicznych, normalne odżywianie, brak zaburzeń psychiatrycznych, brak zaburzenia dysplazyjnego szkieletu, brak niedoboru hormonu tarczycy lub hormonu wzrostu.
Rodzina A
Przypadki 1 i 2 są dziećmi o niskim wzroście niemieckiej rodziny nie spokrewnionej. Chłopiec (przypadek 1) urodził się w 38 tygodniu ciąży po cięciu cesarskim. Waga przy urodzeniu wynosiła 2660 g, długość przy urodzeniu 47 cm. Rozwijał się normalnie, z wyjątkiem wzrostu poniżej normy. Przy badaniu w wieku 6,4 lat był proporcjonalnie mały (106,8 cm, -2,6 SDS) i otyły (22,7 kg), ale poza tym normalny. Jego wiek kostny nie był opóźniony (6 lat), a dysplazję kości wykluczono na podstawie analizy zdjęć rentgenowskich. Poziomy IGF-1 i IGFBP-3, jak i parametry w surowicy czyniły niedobór GH lub hormonu tarczycy nieprawdopodobnym. Dziewczynka (przypadek 2) przyszła na świat po cięciu cesarskim. Waga urodzeniowa wynosiła 2920 g, długość przy urodzeniu 47 cm. Jej rozwój przebiegał normalnie, ale w wieku 12 miesięcy widoczny był niewielki wzrost (długość 67 cm, -3,0 SDS). W wieku 4 lat miała 89,6 cm wzrostu (-3,6 SDS). Nie stwierdzono cech dysmorficznych czy dysproporcji. Nie była otyła (13 kg). Jej wiek kostny wynosił 3,5 lat i wykluczono dysplazję kości. Parametry hormonalne były normalne.
Należy podkreślić, że zarówno chłopiec, jak i dziewczynka rosną na 50 percentylu krzywej wzrostu dla dziewczynek z zespołem Turnera. Matka jest najmniejsza z całej rodziny i ma umiarkowaną dysproporcję dotyczącą proksymalnych części kończyn (142,3 cm, -3,8 SDS). Jedna z jej dwu sióstr (150 cm, -2,5 SDS) i babcia po stronie matki (153 cm, -2,0 SDS) są niskie, bez jakiejkolwiek dysproporcji. Jedna siostra ma normalny wzrost (167 cm, +0,4 SDS). Wzrost ojca wynosi 166 cm (-1,8 SDS), a wzrost dziadka po stronie matki wynosi 165 cm (-1,9 SDS). Drugi pacjent pochodził z rodziny japońskiej i wykazywał identyczną mutację.
P r z y k ł a d 2
Identyfikacja genu niskiego wzrostu
A. Hybrydyzacja in situ
a) Fluorescencyjna hybrydyzacja in situ (FISH)
Przeprowadzono fluorescencyjną hybrydyzację in situ (FISH) z użyciem kosmidów występujących w regionie pseudoautosomalnym Xp/Yp (PAR1). Badania FISH z użyciem kosmidów 64/75cos (LLNLc110H032), E22cos (2e2), F1/14cos (110A7), M1/70cos (110E3), P99F2cos (43C11), P99cos (LLNLc110P2410), B6cosb (1CRFc104H0425), F20cos (34F5), F21cos (ICRFc104G0411), F3cos2 (9E3), F3cos1 (11e6), P117cos (29B11), P6cos1 (ICRFc104P0117), P6cos2 (LLNLc110E0625) i E4cos (15G7) przeprowadzono według opublikowanych metod (Lichter i Cremer, 1992). W skrócie, 1 μg odpowiedniego klonu kosmidowego znakowano biotyną i hybrydyzowano do ludzkich chromosomów metafazowych w warunkach, które tłumią sygnały z repetytywnych sekwencji DNA. Detekcję sygnału hybrydyzacji przeprowadzono stosując awidynę skoniugowaną z FITC. Obrazy FITC wykonywano stosując chłodzony układ kamery sprzężonej z ładunkiem (Photometrics, Tucson, AZ).
PL 194 248 B1
b) Mapowanie fizyczne
Kosmidy pochodziły z bibliotek chromosomów X i Y z Lawrence Livermore National Laboratory i biblioteki chromosomu X z Imperial Cancer Research Fund w Londynie (obecnie Max Planck Institute for Molecular Genetics w Berlinie). Stosując kosmidy dystalne do DXYS15, a mianowicie E4cos, P6cos2, P6cos1, P117cos i F3cos1 można ustalić, że w dalszym ciągu istnieją dwie kopie E4cos, P6cos2, P6cos1 i jedna kopia P117cos i F3cos1. Punkty pęknięcia dla obydwu pacjentów, AK i SS, mapują się na kosmidzie P6cos1, z maksymalną odległością fizyczną 10 kb od siebie. Wywnioskowano, że nienormalne chormosomy X AK i SS mają delecję około 630 kb DNA.
Dalsze kosmidy pochodzą z biblioteki kosmidowej specyficznej dla chromosomu X ICRF (ICRFc104), biblioteki kosmidowej specyficznej dla chromosomu X z Lawrence Livermore (LLNLc110) i biblioteki specyficznej dla chromosomu Y (LLCO3'M'), jak i sporządzonej we własnym zakresie biblioteki kosmidowej pokrywającej cały genom. Kosmidy identyfikowano metodą hybrydyzacji ze wszystkimi znanymi sondami mapującymi się do tego regionu i przez stosowanie całych YACów jako sond. Aby sprawdzić zachodzenie na siebie, stosowano sondy końcowe z kilku kosmidów, gdy zachodzenia na siebie nie można było udowodnić z użyciem znanych sond.
c) Hybrydyzacja metodą Southerna
Analiza metodą Southerna z użyciem różnych markerów pseudoautosomalnych dostarczyła dowodów, że punkt pęknięcia w chromosomie X pacjenta CC leży między DXYS20 (3cosPP) i DXYS60 (U7A) (Henke i wsp. 1991). Aby potwierdzić ten wynik oraz aby sprecyzować lokalizację punktu pęknięcia zastosowano kosmidy 64/75cos, E22cos, F1/14cos, M1/70cos, F2cos, P99F2cos i P99cos jako sondy FISH. Lokalizacja punktu pęknięcia na nienormalnym chromosomie pacjenta CC została określona między kosmidami 64/75cos (jedna kopia) i F1/14cos (dwie kopie) na E22PAC. Pacjent CC o normalnym wzroście w efekcie stracił około 260-290 kb DNA.
Hybrydyzacje metodą Southerna przeprowadzono w warunkach ostrych w buforze Churcha (0,5M NaPi pH 7,2, 7% SDS, 1 mM EDTA) w 65°C i płukano w 40 mM NaPi, 1% SDS w 65°C.
d) Analiza FISH
Biotynylowany DNA kosmidowy (wielkość wstawki 32-45 kb) lub fragmenty kosmidów (10-16 kb) hybrydyzowano do chromosomów metafazowych ze stymulowanych limfocytów pacjentów w warunkach jak opisano poprzednio (Lichter i Cremer, 1992). Hybrydyzowaną sondę wykrywano za pomocą FITC skoniugowanego z awidyną.
e) Amplifikacja PCR
Wszystkie PCR przeprowadzano w objętościach 50 μl zawierających 100 pg - 200 ng matrycy, 20 pmoli każdego startera, 200 μM dNTP (Pharmacia), 1,5 mM MgCl2, 75 mM Tris/HCl pH 9, 20 mM (NH4)2SO4, 0,01% (wag./obj.) Tween 20 i 2 U polimerazy DNA Goldstar (Eurogentec). Reakcję PCR przeprowadzono w aparacie Thermocycler GeneE (Techne).
f) Amplifikacja egzonów
Cztery pule kosmidów złożonych każdy z czterech lub pięciu klonów z kontigów kosmidowych zastosowano do eksperymentów z amplifikacją egzonów. Kosmidy w każdej puli kosmidowej strawiono częściowo Sau3A. Oczyszczone na żelu frakcje w zakresie wielkości 4-10 kb klonowano w trawionym BamHI wektorze pSPL3B (Burn i wsp., 1995) i stosowano do eksperymentów amplifikacji egzonów, jak opisano uprzednio (Church i wsp., 1994).
g) Sekwencjonowanie genomowe
Sonifikowane fragmenty dwóch kosmidów LLOYNCO3'M'15D10 i LLOYNCO3'M'34F5 subklonowano oddzielnie do wektorów M13mp18. Z każdej biblioteki kosmidowej wybrano co najmniej 1000 łysinek, wypreparowano z nich DNA M13 i poddano sekwencjonowaniu stosując barwniki terminujące, Thermo Sequenase (Amersham) i uniwersalny starter do M13 (MWG-Bio-Tech). Żele poddawano elektroforezie w sekwenserach ABI-377 i dane gromadzono i edytowano z zastosowaniem programu GAP4 (Staden).
Spośród wszystkich sześciu pacjentów GA miał najsłabiej scharakteryzowany punkt pęknięcia chromosomu. Najbardziej dystalnymi markerami, których obecność lub brak badano na X, były DXS1060 i DXS996, które mapują się około 6 Mb od telomeru (Nelson i wsp., 1995). Przebadano kilka różnych kosmidów zawierających różne sekwencje genów z obrębu PAR1 (MIC2, ANT3, CSF2RA i XE7) i wszystkie były obecne na kosmidach chromosomu z translokacją w regionie decydującym o niskim wzroście, np. w chromosomie i w ten sposób zlokalizowano punkt pęknięcia translokacji na kosmidzie M1/70cos. Ilościowe porównanie intensywności sygnałów M1/70cos między normalnymi i przegrupowanymi X wskazuje, że około 70% tego kosmidu uległo delecji.
PL 194 248 B1
T a b e l a 2
| CC | GA | AK | SS | |
| 64/75cos | - | - | ||
| E22cos | - | - | ||
| F1/14cos | + | - | ||
| M1/70cos | + | (+) | ||
| F2cos | + | + | ||
| P99F2cos | + | + | ||
| P99cos | + | + | ||
| B6cos | + | |||
| F20cos | ||||
| F21cos | ||||
| F3cos2 | ||||
| F3cos1 | - | - | ||
| P17cos | - | - | ||
| P6cos1 | + | + | ||
| P6cos2 | + | + | ||
| E4cos | + | + |
Tabela ta podsumowuje dane z FISH dla 16 zbadanych kosmidów od czterech pacjentów:
[-] jedna kopia; wskazuje, że odpowiedni kontrolny kosmid uległ delecji na przegrupowanym X, ale był obecny na normalnym chromosomie X;
[+] dwie kopie; wskazuje, że odpowiedni kosmid jest obecny zarówno na przegrupowanym, jak i na normalnym chromosomie X;
[(+)] punkt pęknięcia; wskazuje, że punkt pęknięcia jest obecny w obrębie kosmidu, jak wykazano za pomocą FISH
Podsumowując, analiza molekularna sześciu pacjentów z przegrupowaniami chromosomu X z uż yciem znakowanych fluorescencyjnie sond kosmidowych i hybrydyzacji in situ wskazuje, ż e region krytyczny dla niskiego wzrostu można zawęzić do przedziału 270 kb ograniczonego przez punkt pęknięcia pacjenta GA z dystalnej strony centromeru i pacjentów AK i SS z proksymalnej strony centromeru.
Korelacje genotyp-fenotyp mogą dostarczyć informacji, toteż wybrano je, aby określić przedział krytyczny dla niskiego wzrostu na ludzkim chromosomie X i Y. W badaniach analizę FISH zastosowano do zbadania rozmazów metafazowych i jąder interfazowych limfocytów pacjentów niosących delecje i translokacje w chromosomie X i punkty pęknięcia w obrębie Xp22.3. Okazało się, że te punkty pęknięcia są skupione u dwóch z czterech pacjentów (AK i SS) przypuszczalnie ze względu na obecność sekwencji predysponujących do przegrupowania chromosomowego. U pacjenta znaleziono dodatkowy pierścień Y z przerwą w krytycznym regionie 270 kb, w ten sposób zmniejszając krytyczny przedział do regionu 170 kb.
Wykorzystując korelację wzrostu wszystkich sześciu osób z ich punktem pęknięcia w delecji do regionu pseudoautosomalnego zmapowano przedział 170 kb, którego obecność lub brak ma znaczący wpływ na wzrost. Przedział ten jest ograniczony dystalnie przez chromosomalny punkt pęknięcia X pacjenta GA w odległości 340 kb od telomeru (Xptel) oraz proksymalnie przez punkty pęknięcia pacjentów AT i RY przy 510/520 kb Xptel.
Takie przyporządkowanie stanowi znaczne zmniejszenie krytycznego przedziału do prawie jednej czwartej jego poprzednio ustalonej wielkości (Ogata i wsp., 1992; Ogata i wsp., 1995). Mały zestaw sześciu do ośmiu kosmidów jest obecnie dostępny dla doświadczeń FISH, aby badać rozpowszechnienie i znaczenie tego locus genomowego na dużej serii pacjentów o idiopatycznym niskim wzroście.
PL 194 248 B1
B. Identyfikacja genu-kandydata odpowiedzialnego za niski wzrost
Poszukując jednostek transkrypcyjnych w najmniejszym regionie krytycznym 170 kb, zastosowano pułapki na egzony i selekcję cDNA na sześciu kosmidach (110E3, F2cos, 43C11, P2410, 15D10, 34F5). Wyizolowano trzy różne dodatnie klony (ET93, ET45 i G108) za pomocą pułapki na egzony; wszystkie mapowały się w kosmidzie 34F5. Uprzednie badania z zastosowaniem protokołów selekcji i nadmiaru 25 różnych bibliotek cDNA były bezowocne, co sugeruje, że geny w tym przedziale są eksprymowane na bardzo niskim poziomie.
Aby stwierdzić, czy jakiś gen tego przedziału nie został przeoczony, ustalono sekwencję nukleotydową regionu około 140 kb z tego regionu PAR1, stosując metodę losową z M13 i chemię barwnych terminatorów. Kosmidy do analizy sekwencji zostały wybrane tak, aby w minimalnym stopniu zachodziły na siebie i aby łącznie pokrywały krytyczny przedział. Przeprowadzono analizę sekwencji DNA i następne przewidywania białek za pomocą programu „X Grail” wersja 1.3c, a także za pomocą programu łapiącego egzony FEXHB i potwierdziły one wszystkie 3 uprzednio sklonowane egzony. Nie można było wykryć żadnych genów kodujących białka, innych niż uprzednio wyizolowane.
C. Izolowanie kandydata na gen niskiego wzrostu SHOX
Przyjmując, że wszystkie klony egzonowe, ET93, ET45 i G108 są częścią tego samego genu, zastosowano je łącznie jako sondy do przebadania 14 różnych bibliotek cDNA z 12 różnych tkanek płodowych (płuco, wątroba, mózg 1 i 2) i dorosłych (jajnik, łożysko 1 i 2, fibroblast, mięśnie szkieletowe, szpik kostny, mózg, pień mózgu, podwzgórze, przysadka). Nie wykryto ani jednego klonu spośród około 14 milionów wysianych na płytkach. Aby wyizolować transkrypt pełnej długości przeprowadzono 3' i 5' RACE. Dla 3' RACE zastosowano startery z egzonu G108 na RNA z łożyska, mięśni szkieletowych, fibroblastów szpiku kostnego, tkanek, w przypadku których stwierdzono, że G108 ulega ekspresji. Uzyskano dwa różne klony 3' RACE o wielkości 1173 i 652 bp ze wszystkich trzech tkanek co sugeruje, że istnieją dwa różne 3' egzony a i b. Dwie różne formy nazwano SHOXa i SHOXb.
Aby zwiększyć szansę wyizolowania całej 5' części genu, o którym wiadomo, że ulega ekspresji na niskim poziomie, poddano linię komórek HeLa działaniu kwasu retinowego i estru forbolowego PMA. RNA z takiej zaindukowanej linii komórkowej i RNA z łożyska i mięśni szkieletowych zastosowano do konstrukcji „bibliotek cDNA Marathon”. Wyizolowano identyczne klony 5' RACE cDNA ze wszystkich trzech tkanek.
Procedura doświadczalna
RT-PCR i konstrukcja biblioteki cDNA
Ludzki poliA+RNA z serca, trzustki, mięśni szkieletowych, nerek płodowych i wątroby nabyto od Clontech. Całkowity RNA wyizolowano z linii komórkowej fibroblastów szpiku kostnego za pomocą odczynnika TRLZOL (Gibco-BRL) według opisu producenta. Syntezę pierwszej nici cDNA wykonano z użyciem zestawu do syntezy pierwszej nici cDNA Superscript (Gibco-BRL) stosując 100 ng poliA+RNA lub 10 μg całkowitego RNA, z użyciem startera oligo(dt)adaptorowego (GGCCACGCGTCGACTAGTAC[dT]20N. Po syntezie pierwszej nici cDNA mieszaninę reakcyjną rozcieńczono 1/10. Dla dalszych eksperymentów PCR stosowano 5 μΐ tej rozcieńczonej mieszanki.
Skonstruowano „bibliotekę cDNA Marathon” z poliA+RNA z mięśni szkieletowych i łożyska z użyciem zestawu do amplifikacji cDNA Marathon (Clontech) według opisu producenta.
Biblioteki cDNA z mózgu płodowego (nr katalogowy HL5015b), płuca płodowego (HL3022a), jajnika (HL1098a), przysadki (HL1097v) i podwzgórza (HL1172b) nabyto od Clontech. Biblioteki cDNA mózgu, nerki, wątroby i płuc były częścią panelu bibliotek cDNA do szybkich badań przesiewowych (Clontech). Bibliotekę cDNA z mięśni płodowych uzyskano z UK Human Genome Mapping Project Resource Center.
D. Analiza sekwencji i budowa genu SHOX
Sekwencję najwyższej zgodności SHOXa i SHOXb (1349 i 1870 bp) zebrano na podstawie analizy sekwencji klonów pochodzących z 5' i 3' RACE. Zidentyfikowano pojedynczą otwartą ramkę odczytu 1870 bp (SHOXa) i 1349 bp (SHOXb), co daje dwa białka z 292 (SHOXa) i 225 (SHOXb) aminokwasów. Obydwa transkrypty a i b mają wspólny 5' koniec, ale mają inny 3' egzon, co sugeruje wykorzystywanie różnych sygnałów składania.
Uzyskano całkowite dopasowanie między dwoma cDNA i z sekwencjonowanym genomowym DNA z kosmidów LLOYNCO3M15D10 i LLOYNC3M34F5, co pozwala na ustalenie budowy egzon-intron (fig. 4). Gen składa się z 6 egzonów o wielkościach od 58 bp (egzon III) do 1146 bp (egzon Va). Egzon I zawiera wyspę CpG, kodon start i region 5'. Kodon stop, jak i region 3'-niekodujący jest położony w każdym z alternatywnie składanych egzonów Va i Vb.
PL 194 248 B1
P r z y k ł a d 3
Zidentyfikowano dwa cDNA, które mapują się do regionu 160 kb zidentyfikowanego jako krytyczny dla niskiego wzrostu. Te cDNA odpowiadają genom SHOX i pET92. cDNA zidentyfikowano przez hybrydyzację subklonów kosmidów do bibliotek cDNA.
Użycie zestawu kosmidów z całkowitym pokryciem krytycznego regionu dostarczyło obecnie materiału genetycznego do identyfikacji odpowiedzialnego genu. Projekty klonowania pozycyjnego mające na celu izolację genów z tego regionu przeprowadzono za pomocą pułapek na egzony i technik selekcji cDNA. Ze względu na ich lokalizację w obrębie regionu pseudoautosomalnego można założyć, że geny te uciekają przed X-inaktywacją i wywierają efekt zależny od dawki genu.
Klonowanie genu prowadzącego do niskiego wzrostu, gdy jest on nieobecny (haploidalny) lub występuje jego niedobór, stanowi kolejny krok naprzód w dokładności diagnozy i stanowi podstawę do analizy mutacyjnej w obrębie genu, np. w oparciu o polimorfizm konformacji pojedynczych nici (SSCP). Dodatkowo, klonowanie tego genu i jego dalsza biochemiczna charakterystyka otworzyły drogę dla głębszego zrozumienia procesów biologicznych związanych z kontrolą wzrostu.
Sekwencje DNA według wynalazku umożliwiają wykonanie pierwszego molekularnego testu w celu identyfikacji osób ze specyficznym zaburzeniem genetycznym w obrę bie zł o ż onej heterogennej grupy pacjentów o idiopatycznym niskim wzroście.
P r z y k ł a d 4
Wzory ekspresji SHOXa i SHOXb
Analiza metodą Northern z użyciem pojedynczych egzonów jako sond do hybrydyzacji wykazała inny profil ekspresji dla każdego egzonu, co wyraźnie sugeruje, że prążki o różnych wielkościach i intensywnoś ciach stanowią produkty hybrydyzacji krzyż owej do innych sekwencji genów bogatych w G, C. Aby uzyskać bardziej realny profil ekspresji obu genów SHOXa i b, przeprowadzono doświadczenia z RT-PCR dla RNA z różnych tkanek. Podczas gdy obserwowano ekspresję SHOXa w mięśniach szkieletowych, łożysku, trzustce, sercu i fibroblastach szpiku kostnego, ekspresja SHOXb była ograniczona do nerek płodowych, mięśni szkieletowych i fibroblastów szpiku kostnego, ze zdecydowanie najwyższą ekspresją w fibroblastach szpiku kostnego.
Ekspresja SHOXa w kilku bibliotekach cDNA sporządzonych z płodowego mózgu, płuca i mięśni oraz z dorosłego mózgu, płuca i przysadki, a także brak ekspresji SHOXb we wszystkich badanych bibliotekach stanowi dodatkowy dowód, że jedna forma składana (SHOXa) jest szerzej eksprymowana i ż e druga (SHOXb) jest eksprymowana przede wszystkim w sposób specyficzny tkankowo.
Aby ocenić aktywność transkrypcyjną SHOXa i SHOXb na chromosomie X i Y zastosowano RT-PCR RNA wyekstrahowanego z różnych linii komórkowych zawierających czynny X, nieczynny X lub chromosom Y, jako jedyne ludzkie chromosomy. Wszystkie linie komórkowe wykazywały produkt amplifikacji o spodziewanej długości 119 bp (SHOXa) i 541 bp (SHOXb), co dostarcza jasnych dowodów, że oba SHOXa i b uciekają przed inaktywacją X.
SHOXa i SHOXb kodują nowe białka z homeodomenami. SHOX jest wysoce konserwowany u gatunków od ssaków do ryb i much. Sam 5' koniec i 3' koniec oprócz homeodomeny są prawdopodobnie konserwowanymi regionami między człowiekiem a myszą, co sugeruje ich znaczenie funkcjonalne. W czasie ewolucji nie nagromadziły się różnice w tych regionach w sekwencji aminokwasów między człowiekiem i myszą.
Procedura eksperymentalna
a) 5' i 3' RACE
Aby sklonować 5' koniec transkryptów SHOXa i b przeprowadzono 5'RACE stosując skonstruowane „biblioteki cDNA Marathon”. Stosowano następujące startery oligonukleotydowe: SHOX B rev, GAAAGGCATCCGTAAGGCTCCC (pozycja 697-718, odwrotna nić [r]) i starter adaptorowy AP1. Przeprowadzono PCR stosując parametry typu „touchdown”: 94°C przez 2 min, 94°C przez 30 s, 70°C przez 30 s, 72°C przez 2 min przez 5 cykli, 94°C przez 30 s, 66°C przez 30 s, 72°C przez 2 min przez 5 cykli, 94°C przez 30 s, 62°C przez 30 s, 72°C przez 2 min przez 25 cykli. Przeprowadzono drugą rundę amplifikacji stosując 1/100 produktu PCR i następujące zakotwiczone startery oligonukleotydowe: SHOX A rev, GACGCCTTTATGCATCTGATTCTC (pozycje 617-640 r) i starter adaptorowy AP2. PCR przeprowadzono przez 35 cykli z temperaturą hybrydyzacji 60°C.
Aby sklonować 3' koniec transkryptów SHOXa i b przeprowadzono 3' RACE jak opisano uprzednio (Frohman i wsp., 1988) stosując startery adaptorowe oligo(dT) do syntezy pierwszej nici cDNA. Stosowano następujące startery oligonukleotydowe: SHOX A for, GAATCAGATGCATAAAGGCGTC (pozycje 619-640) i adaptor oligo(dT). PCR przeprowadzono stosując następujące paraPL 194 248 B1 metry: 94°C przez 2 min, 94°C przez 30 s, 62°C przez 30 s, 72°C przez 2 min przez 35 cykli. Przeprowadzono drugą rundę amplifikacji stosując 1/100 produktu PCR i następujące zakotwiczone startery oligonukleotydowe SHOX B for, GGGAGCCTTCACGGATGCCTTTC (pozycje 697-718) i adaptor oligo(dT). PCR przeprowadzono przez 35 cykli z temperaturą hy brydyzacji 62°C.
Aby potwierdzić sekwencje transkryptów SHOXa i SHOXb przeprowadzono PCR ze starterem oligonukleotydowym 5' i starterem oligonukleotydowym 3'. Dla SHOXa stosowano następujące startery: G310 for, AGCCCCGGCTGCTCGCCAGC (pozycje 59-78) i SHOX D rev, CTGCGCGGCGGGTCAGAGCCCCAG (pozycje 959-982 r). Dla SHOX b stosowano następujące startery: G310 for, AGCCCCGGCTGCTCGCCAGC i SHOX2A rev, GCCTCAGCAGCAAAGCAAGATCCC (pozycje 1215-1238 r). Oba PCR przeprowadzono stosując parametry typu „touchdown”: 94°C przez 2 min, 94°C przez 30 s, 70°C przez 30 s, 72°C przez 2 min przez 5 cykli, 94°C przez 30 s, 68°C przez 30 s, 72°C przez 2 min przez 5 cykli, 94°C przez 30 s, 65°C przez 30 s, 72°C przez 2 min przez 30 cykli. Produkty oczyszczono na żelu i sklonowano do analizy sekwencji.
b) Analiza SSCP
Przeprowadzono analizę SSCP na genomowym zamplifikowanym DNA od pacjentów według uprzednio opisanej metody (Orita i wsp., 1989). Zmieszano 1-5 μΐ produktów PCR z 5 μΐ roztworu denaturującego zawierającego 95% formamidu i 10 mM EDTA pH 8 i prowadzono denaturację w 95°C przez 10 minut. Próbki natychmiast oziębiano w lodzie i nakładano na 10% żel poliakryloamidowy (akryloamid:bisakryloamid = 37,5:1 i 29:1; Multislotgel, TGGE base, Quiagen) zawierający 2% gliceryny i 1 x TBE. Elektroforezę prowadzono w 15°C przy 500 V przez 3-5 godzin i barwiono srebrem jak opisano w instrukcji TGGE (Quiagen, 1993).
c) Klonowanie i sekwencjonowanie produktów PCR
Produkty PCR klonowano do pMOSBlue stosując zestaw do wektora pMOSBlueT z Amersham. Nocne hodowle pojedynczych kolonii lizowano w 100 μl H2O przez gotowanie przez 10 minut. Lizaty stosowano jako matryce do PCR z starterami specyficznymi dla sklonowanych produktów PCR. SSCP produktów PCR pozwoliło na identyfikację klonów zawierających różne allele. Klony sekwencjonowano za pomocą znakowanych CY5 starterów do wektora Uni i T7, metodą cyklicznego sekwencjonowania opisaną przez producenta (zestaw ThermoSequenase Kit) (Amersham) stosując automatyczny sekwenser ALF (Pharmiacia).
d) Przeszukiwanie za pomocą PCR bibliotek cDNA
Aby wykryć ekspresję SHOXa i b, przeprowadzono przeszukiwanie kilku bibliotek cDNA i pierwszej nici cDNA za pomocą PCR z zastosowaniem starterów specyficznych dla SHOXa i b. Dla bibliotek cDNA stosowano równoważnik DNA 5 x 108 pfu. Dla SHOXa stosowano startery SHOX E rev, GCTGAGCCTGGACCTGTTGGAAAGG (pozycje 713-737 r) i SHOX a for. Dla SHOXb zastosowano następujące startery: SHOX B for i SHOX2A rev. Obie reakcje PCR przeprowadzono stosując warunki „touchdown”. 94°C przez 2 min, 94°C przez 30 s, 68°C przez 30 s, 72°C przez 40 s, przez 5 cykli, 94°C przez 30 s, 65°C przez 30 s, 72°C przez 40 s, przez 5 cykli, 94°C przez 30 s, 62°C przez 30 s, 72°C przez 40 s, przez 35 cykli.
e) Przeszukiwanie bibliotek cDNA za pomocą PCR
Aby wykryć ekspresję SHOXa i b, przeprowadzono badania przesiewowe kilku bibliotek cDNA i pierwszej nici, za pomocą PCR z zastosowaniem starterów specyficznych dla SHOXa i b. Dla SHOXa zastosowano startery SHOXE rev, GCTGAGCCTGGACCTGTTGGAAAGG (pozycja 713-737 r) i SHOX a for. Dla SHOXb zastosowano następujące startery: SHOX B for i SHOX2A rev. Obie reakcje PCR przeprowadzono stosując parametry „touchdown”. 94°C przez 2 min, 94°C przez 30 s, 68°C przez 30 s, 72°C przez 40 s, przez 5 cykli, 94°C przez 30 s, 65°C przez 30 s, 72°C przez 40 s, przez 5 cykli, 94°C przez 30 s, 62°C przez 30 s, 72°C przez 40 s, przez 35 cykli.
P r z y k ł a d 5
Wzory ekspresji OG12, przypuszczalnego mysiego homologa SHOX i SHOT
Przeprowadzono hybrydyzację in situ na zarodkach myszy od 5 dni po zapłodnieniu do 18,5 dni po zapłodnieniu, jak i na płodach i nowonarodzonych zwierzętach, w celu ustalenia wzoru ekspresji. Ekspresję stwierdzono w rozwijających się zawiązkach kończyn, w mezodermie wyrostków nosowych, które mają udział w tworzeniu nosa i podniebienia, w powiece, w aorcie, w rozwijających się gonadach żeńskich, w rozwijającej się strunie grzbietowej (ograniczone do rozwijających się neuronów motorycznych) i w mózgu. W oparciu o ten wzór ekspresji i pozycję mapową jego ludzkiego homologu SHOT, można przyjąć, że SHOT stanowi prawdopodobnego kandydata dla zespołu Cornelia de Lange, który obejmuje niski wzrost.
PL 194 248 B1
P r z y k ł a d 6
Izolowanie nowego genu homeotycznego podobnego do SHOX na chromosomie 3 genu SHOT związanego z wzrostem/niskim wzrostem człowieka
Wyizolowano nowy gen u ludzi, nazwany SHOT (od SHOX - homolog on chromosome three - homolog SHOX na chromosomie trzecim). Gen ten wykazuje najwyż szą homologię do mysiego genu OG12 i ludzkiego genu SHOX. Ludzki gen SHOT i mysi gen OG12 są w wysokim stopniu homologiczne, z identycznością 99% na poziomie białka. Choć nie jest to jeszcze udowodnione, ze względu na uderzającą homologię między SHOT i SHOX (identyczność wyłącznie w regionie homeodomeny) jest prawdopodobne, że SHOT jest również genem związanym z niskim wzrostem lub z wzrostem człowieka.
SHOT wyizolowano z zastosowaniem starterów z dwóch nowych ludzkich EST (HS 1224703 i HS 126759) z bazy danych EMBL, w celu amplifikacji poddanego odwrotnej transkrypcji RNA z linii fibroblastów szpiku kostnego (Rao i wsp., 1997). 5' i 3' końce SHOT wygenerowano za pomocą RACE-PCR z biblioteki fibroblastów szpiku kostnego, która została zamplifikowana według Rao i wsp., 1997. SHOT zmapowano za pomocą analizy FISH do chromosomu 3q25/q26, a mysi homolog do syntenicznego regionu na mysim chromosomie 3. W oparciu o wzór ekspresji swego mysiego homologa OG12, SHOT jest kandydatem na zespół Cornelia Lange (który wykazuje niski wzrost i inne cechy, w tym anomalie twarzoczaszki) zmapowanym do tego przedziału chromosomowego w 3q25/26.
P r z y k ł a d 7
Poszukiwanie mutacji u pacjentów o idiopatycznym niskim wzroście
Sekwencje DNA według wynalazku stosuje się w PCR, LCR i innych znanych technikach, aby ustalić, czy takie osoby o niskim wzroście mają małe delecje lub mutacje punktowe w genie niskiego wzrostu.
Przebadano początkowo 91 (łącznie 250 osób) nie spokrewnionych pacjentów i pacjentek o idiopatycznym niskim wzroście (szacowana częstość występowania idiopatycznego niskiego wzrostu w populacji wynosi 2-2,5%) pod kątem występowania przegrupowania lub niewielkich mutacji punktowych w genie SHOXa. Zaprojektowano sześć zestawów starterów do PCR, nie tylko do amplifikacji pojedynczych egzonów, ale także sekwencji flankujących egzon i niewielkiej części 5'UTR. Dla największego egzonu, egzonu pierwszego, wygenerowano dwa dodatkowe startery wewnętrznych egzonów. Startery stosowane do PCR przedstawiono w tabeli 2.
Zbadano polimorfizm konformacji pojedynczych nici (SSCP) wszystkich zamplifikowanych egzonów o wielkości od 120 do 295 bp. Stwierdzono zmiany w ruchliwości prążków tylko u 2 osób o niskim wzroście (Y91 i A1). Fragmenty, które dały zmienione wzory SSCP (unikatowe konformery SSCP) sklonowano i poddano sekwencjonowaniu. Aby uniknąć artefaktów PCR i sekwencjonowania, przeprowadzono sekwencjonowanie na dwóch niciach stosując dwie niezależne reakcje PCR. Mutacja u pacjenta Y91 leż y 28 bp w stronę 5' od kodonu start w 5'UTR i obejmuje podstawienie cytydyny przez guaninę. Aby stwierdzić, czy ta mutacja stanowi rzadki polimorfizm, czy jest odpowiedzialna za fenotyp przez regulację ekspresji genu, np. przez słabsze wiązanie czynników inicjacji translacji, przebadano rodziców i jedną siostrę pacjenta. Ponieważ zarówno siostra, jak i ojciec o normalnym wzroście wykazują ten sam wariant SSCP (danych nie przedstawiono), takie podstawienie zasady jest rzadkim polimorfizmem, nie związanym z fenotypem.
Klonowanie i sekwencjonowanie unikatowego konformera SSCP dla pacjenta A1 wykazało przejście cytydyny do tymidyny (nukleotyd 674), która wprowadza kodon terminacyjny w pozycji aminokwasu 195 w przewidywanych sekwencjach odpowiednio z 225 i 292 aminokwasów. Aby ustalić, czy ta mutacja typu nonsens jest genetycznie związana z niskim wzrostem w tej rodzinie, przeprowadzono analizę rodowodu. Stwierdzono, że wszystkie sześć niskich osób (zdefiniowanych jako wzrost poniżej dwóch odchyleń standardowych) wykazywało zaburzenie w SSCP i przejście cytydyny w tymidynę. Ani ojciec, ani jedna ciotka i dziadek od strony matki z normalnym wzrostem nie wykazywali tej mutacji, co wskazywało, że babka przekazała zmutowany allel dwóm swoim córkom i dwóm wnukom. Tak więc, występuje zgodność między obecnością zmutowanego allelu i fenotypem niskiego wzrostu w tej rodzinie. Identyczną sytuację jak opisana powyż ej wykryto u innego pacjenta o niskim wzro ście z rodziny japoń skiej.
P r z y k ł a d 8
Sekwencje DNA według wynalazku stosuje się do charakterystyki funkcji genu lub genów. Sekwencje DNA można stosować do przeszukania baz danych sekwencji kwasów nukleinowych lub aminokwasów w celu identyfikacji spokrewnionych genów lub produktów genów. Częściową sekwencję aminokwasów SHOK93 zastosowano do przeszukiwania baz danych aminokwasów. Poszukiwania
PL 194 248 B1 wykazały bardzo wysoką homologię do wielu znanych białek homeotycznych. Sekwencje cDNA według wynalazku mogą być zastosowane do wytworzenia peptydu techniką rekombinacji. Różne systemy ekspresji znane fachowcom można zastosować do wytwarzania zrekombinowanych białek.
Z zastosowaniem znanej syntezy peptydów (syntezy białka według metody Merrifielda) zsyntetyzowano peptyd o sekwencji CSKSFDQKSKDGNGG i uzyskano poliklonalne przeciwciała zarówno u królików, jak i u kurcząt, według standardowych protokołów.
Literatura
W niniejszym opisie przytoczono następujące pozycje literaturowe.
Ashworth A, Rastan S, Lovell-Badge R, Kay G (1991): X-chromosome inactivation may explain the difference in viability of X0 humans and mice. Nature 351: 406-408.
Ballabio A, Bardoni A, Carrozzo R, Andria G, Bick D, Campbell L, Hamel B, Ferguson-Smith MA, Gimelli G, Fraccaro M, Maraschio P, Zuffardi O, Guilo S, Camerino G (1989): Contiguous gene syndromes due to deletions in the distal short arm of the human X chromosome. Proc. Natl. Acad. Sci. USA 86: 10001-10005.
Blagowidow N, Page DC, Huff D, Mennuti MT (1989): Ullrich-Turner syndrome in an XY female fetus with deletion of the sex-determining portion of the Y chromosome. Am. J. Med. Genet. 34: 159-162.
Cantrell MA, Bicknell JN, Pagon RA i inni (1989): Molecular analysis of 46,XY females and regional assignment of a new Y-chromosome-specific probe. Hum. Genet. 83: 88-92.
Connor JM, Loughlin SAR (1989): Molecular genetics of Turner's syndrome. Acta Pediatr. Scand. (Suppl.) 356: 77-80.
Disteche CM, Casanova M, Saal H, Friedmen C, Sybert V, Graham J, Thuline H, Page DC, Fellous M (1986) : Small deletions of the short arm of the Y-chromosome in 46,XY females. Proc. Natl.
Acad. Sci. USA 83:.7841-7844.
Ferguson-Smith MA (1965): Karyotype-phenotype correlations in gonadal dysgenesis and their bearing on the pathogenesis of malformations. J. Med. Genet. 2: 142-155.
Ferrari D, Kosher RA, Dealy CN (1994): Limb mesenchymal cells inhibited from undergoing cartilage differentiation by a tumor promoting phorbol ester maintain expression of the homeobox-containing gene MSX1 and fail to exhibit gap junctional communication. Biochemical and Biophysical Research Communications. 205 (1): 429-434.
Fischer M, Bur-Romero P, Brown LG i inni (1990): Homologous ribosomal protein genes in the human X- and Y-chromosomes escape from X-inactivation and possible implementation for Turner syndrome. Cell 63: 1205-1218.
Freund C, Horsford DJ, Mclnnes RR (1996): Transcription factor genes and the developing eye: a genetic perspective. Hum. Mol. Genet. 5: 1471-1488.
Gehring WJ, Qian YQ, Billeter M, Furukubo-Tokunaga K, Schier A F, Resendez-Perez D, Affolter M, Otting G, Wuthrich K (1994): Homeodomain-DNA recognition. Cell 78: 211-223.
Gough NM, Gearing DP, Nicola NA, Baker E, Pritchard M, Callen DF, Sutherland GR (1990). Localization of the human GM-CSF receptor gene to the X-Y pseudoautosomal region. Nature 345: 734736.
Grumbach MM, Conte FA (1992): Disorders of sexual differentiation. W: Williams textbook of endocrinology, wydanie ósme, pod red. Wilson JD, Foster DW, s. 853-952, Philadelphia, WB Saunders.
Hall JG, Gilchrist DM (1990): Turner syndrome and its variants. Pedriatr. Clin. North Am. 37: 1421-1436.
Henke A, Wapenaar M, van Ommen G-J, Maraschio P, Camerino O, Rappold GA (1991): Deletions within the pseudoautosomal region help map three new markers and indicate a possible role of this region in linear growth. Am. J. Hum. Genet. 49:.811-819.
Hernandez D, Fisher EMC (1996): Down syndrome genetics: unravelling a multifactorial disorder. Hum. Mol. Genet. 5: 1411-1416.
Kenyon C (1994): If birds can fly, why can't we? Homeotic genes and evolution. Cell 78: 175-180.
Krumlauf R (1994): Hox genes in vertebrate development. Cell 78: 191-201.
Kulharya AS, Roop H, Kukolich MK, Nachtman RG, Belmont JW, Garcia-Heras J (1995): Mild phenotypic effects of a de novo deletion Xpter > Xp22.3 and duplication 3pter > 3p23. Am. J. Med. Genet. 56 :16-21.
Lawrence PA, Morata G (1994): Homeobox genes: their function in Drosophila segmentation and pattern formation. Cell 78: 181-189.
PL 194 248 B1
Lehrach H, Drmnac R, Hoheisel JD, Larin Z, Lemon G, Monaco AP, Nizetic D i inni. Hybridization finger printing in genome mapping and sequencing. W Davies KE, Tilghman S, (red.), Genome Analysis 1990: 39-81 Cold Spring Harbor, NY.
Levilliers J, Quack B, Weissenbach J, Petit C (1989): Exchange of terminal portions of X- and Y-chromosomal short arms in human XY females. Proc. Natl. Acad. Sci. USA 86: 2296-2300.
Lichter P, Cremer T, Human Cytogenetics: A practical Approach, IRL Press 1992, Oxford, New York, Tokyo.
Lippe BM (1991): Turner Syndrome. Endocrinol. Metab. Clin. North Am. 20: 121-152. Magenis RE, Tochen ML Holahan KP, Carey T, Allen L, Brown MG (1984): Turner syndrome resulting from partial deletion of Y-chromosome short arm: localization of male determinanta. J. Pediatr. 105: 916-919.
Nelson DL, Ballabio A, Cremers F, Monaco AP, Schlessinger D (1995). Report of the sixth International Workshop on the X Chromosome Mapping. Cytogenet. Cell. Genet. 71: 308-342.
Ogata T, Goodfellow P, Petit, C, Aya M, Matsuo N (1992): Short stature in a girl with a terminal Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459.
Ogata T, Tyler-Smith C, Purvis-Smith S, Turner G (1993): Chromosomal localisation of a gene(s) for Turner stigmata on Yp. J. Med. Genet. 30: 918-922.
Ogata T, Yoshizawa A, Muroya K, Matsuo N, Fukushima Y, Rappold GA, Yokoya S (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834.
Ogata T, Matsuo N (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629.
Orita M, Suzuki Y, Sekiya T i Hayashi K (1989): Rapid and sensitive detection of point mutations and polymorphisms using the polymerase chain reaction. Genomics 5: 874-879.
Pohlschmidt M, Rappold GA, Krause M, Ahlert D, Hosenfeld D, Weissenbach J, Gal A (1991): Ring Y chromosome: Molecular characterization by DNA probes. Cytogenet. Cell. Genet. 56: 65-68.
Qiagen (1993) TGGE Handbook, Diagen GmbH, TGMA 4112 3/93.
Rao E, Weiss B, Mertz A i inni (1995): Construction of a cosmid contig spanning the short stature candidate region in the pseudoautosomal region PAR1. in: Turner syndrome in a life span perspective: Research and clinical aspects. Proceedings of the 4th International Symposium on Turner Syndrome, Gothenburg, Szwecja, 18-21 maja, 1995, pod red. Albertsson-Wikland K, Ranke MB, s. 19-24, Elsevier.
Rao E, Weiss B, Fukami M, Rump A, Niesler B, Mertz A, Muroya K, Binder G, Kirsch S, Winkelmann M, Nordsiek G, Heinrich U, Breuning MH, Ranke MB, Rosenthal A, Ogata T, Rappold GA (1997): Pseudoautosomal deletions encompassing a novel homeobox gene cause growth failure in idiopathic short stature and Turner syndrome. Nature Genet. 15: 54-62
Rappold GA (1993): The pseudoautosomal region of the human sex chromosomes. Hum. Genet. 92: 315-324.
Rappold GA, Willson TA, Henke A, Gough NM (1992): Arrangement and localization of the human GM-CSF receptor α chain gene CSF2RA within the X-Y pseudoautosomal region. Genomics 14: 455-461.
Ried K, Mertz A, Nagaraja R, Trusnich M, Riley J, Anand R, Page D, Lehrach H., Elliso J, Rappold GA (1995): Characterization of a yeast artificial chromosome contig spanning the pseudoautosomal region. Genomics 29: 787-792.
Robinson A (1990): Demography and prevalence of Turner syndrome. W: Turner Syndrome, pod red. Rosenfeld RG, Grumbach MM, s. 93-100, New York, Marcel Dekker.
Rosenfeld RG (1992): Turner syndrome: a guide for physicians. Wydanie drugie. The Turner's Syndrome Society.
Rosenfeld RG, Tesch L-G, Rodriguez-Rigau LJ, McCauley E, Albertsson-Wikland K, Asch R, Cara J, Conte F, Hall JG, Lippe B, Nagel TC, Neely EK, Page DC, Ranke M, Saenger P, Watkins JM, Wilson DM (1994): Recommendations for diagnosis, treatment, and management of individuals with Turner syndrome. The Endocrinologist 4 (5): 351-358.
Rovescalli AC, Asoh S, Nirenberg M (1996): Cloning and characterization of four murine homeobox genes. Proc. Natl. Acad. Sci. USA 93: 10691-10696.
PL 194 248 B1
Schaefer L, Ferrero GB, Grillo A, Bassi MT, Roth EJ, Wapenaar MC, van Ommen GJB, Mohandas TK, Rocchi M, Zoghbi HY, Ballabio A (1993): A high resolution deletion map of human chromosome Xp22. Nature Genetics 4: 272-279.
Shalet SM (1993): Leukemia in children treated with growth hormone. Journal of Pediatrie Endocrinology 6: 109-11
Vimpani GV, Vimpani AF, Lidgard GP, Cameron EHD, Farquhar JW (1977). Prevalence of severe growth hormone deficiency. Br. Med. J. 2: 427-430
Zinn AR, Page DC, Fisher EMC (1993): Turner syndrome: the case of the missing sex chromosome. TIG 9 (3): 90-93.
Wykaz sekwencji (1) Informacja ogólna:
(i) Zgłaszający:
(A) Nazwa: Rappold-Hoerbrand, Gudrun, Dr.
(B) Ulica: Hausackerweg 14 (C) Miasto: Heidelberg (E) Państwo: Niemcy (F) Kod pocztowy (ZIP): 69118 (ii) Tytuł zgłoszenia:
Cząsteczka kwasu nukleinowego kodująca polipeptydy, cząsteczka DNA kodująca polipeptyd, ludzkie białko wzrostu kodowane przez cząsteczkę DNA, cDNA kodujący ludzkie białko wzrostu, środek farmaceutyczny, zastosowanie ludzkiego białka wzrostu do wytwarzania środka farmaceutycznego, zastosowanie sekwencji DNA, sposób określania niskiego wzrostu, sposób identyfikacji defektu genetycznego, komórki transformowane sekwencją DNA, układ testowy do identyfikacji lub badań przesiewowych środków farmaceutycznych, sposób identyfikacji lub badań przesiewowych potencjalnych środków farmaceutycznych, wektor ekspresyjny zawierający cząsteczkę DNA, zastosowanie ludzkich białek wzrostu, w tym ludzkiego hormonu wzrostu, do wytwarzania leków (iii) Liczba sekwencji: 16 (iv) Sposób odczytu komputerowego:
(A) Typ nośnika: dyskietka (B) Komputer: kompatybilny z IBM PC (C) System operacyjny: PC-DOS/MS-DOS (D) Oprogramowanie: Patentln Release #1,0 wersja #1,30 (EPO) (vi) Dane o pierwszeństwie:
(A) Numer zgłoszenia: US 60/027633 (B) Data zgłoszenia: 1 października 1996 r.
(vi) Dane o pierwszeństwie:
(A) Numer zgłoszenia: EP 97100583.0 (B) Data zgłoszenia: 16 stycznia 1997 r.
(2) Informacja o SEQ. ID NO: 1:
(i) Charakterystyka sekwencji:
(A) Długość: 60 aminokwasów (B) Typ: aminokwas (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: peptyd (xi) Opis sekwencji: SEQ. ID NO: 1:
PL 194 248 B1
| Gin | Arg | Arg | Ser | Arg | Thr | Asn | Phe | Thr Leu | Giu | Gin | Leu | Asn | Giu | Leu |
| 1 | 5 | 10 | 15 | |||||||||||
| Giu | Arg | Leu | Phe | Aap | Giu | Thr | His | Tyr Pro | Asp | Aia | Phe | Met | Arg | Glu |
| 20 | 25 | 30 | ||||||||||||
| Giu | Leu | Ser | Gin | Arg | Leu | Giy | Leu | Ser Glu | Aia | Arg | Vai | Gin | Vai | |
| 35 | 40 | 45 | ||||||||||||
| Phe | Gin | Δ Q*> | G_rg | Arg | Aia | Lys | Cys | Arg Lys | Gin | Giu |
55 60 (2) Informacja o SEQ. ID NO: 2:
(i) Charakterystyka sekwencji:
(A) Długość: 209 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon II: ET93” (v) Typ fragmentu: liniowy (xi) Opis sekwencji: SEQ. ID NO: 2:
GGATTTATGA ATGCAAAGAG AAGCGCGAGG ACGTGAAGTC G\ru--G\=ACsiAG
GCAAGCTGAA ACAGAGGCGC AGCCGCACCA ACT7CACGC7 GGAGCAGCTG .-.«νσΛυ.ν-χ C'ssr».Uj«.t»n.U'w LfU^n'··.*^ .-ιν-σν»* -U.--x -«n^o/tiwnu
G^CTGG^rj^T CTC^^AG^j^kj C<j\»«jxGs-AG
120
ISO (2) Informacja o SEQ. ID NO: 3:
(i) Charakterystyka sekwencji:
(A) Długość: 368 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon I: G310” (xi) Opis sekwencji: SEQ. ID NO: 3:
| GTGATCCACC | C GC G\~ GCAC G | G\J\.wJX | T C C <j\- NT'- kOAUTur | GAGAC GC GC G | CATCCACCAG | 60 |
| CCCCGvrJ7GC | TCGCCAGCCC | C ArC c c cagc | C.-.- nj\jt\AGaG | CTCACGGCTT | x -L'iA. ^μΛΛ | 120 |
| 1H1 u ł'1 | CAGAAAAGCA | AG\sft,C GGT AA | CGGCGGAGGC | GGAGGCG\rCG | GAGG7AAGAA | ISO |
| mmm^^ mm \j\xrtl χ X | ACGTACCGGG | AAGTTTTGGA | GAGCGGACTG | GCGCGCTCCC | GGLAGCTGGG | 240 |
| GACGTCGGAT | mmm^ X X Cx | AG^jACAT cac | GurAG\r\rC GGC | GGC CACT GC C | O-jGT G\_AT TT | - 300 |
| Ισχ xUAruj\x.-\U | CACGTAGACA | ATGACAAGGA | GAAACTGAAA | GAATTCGGCA | C C GC GAGAGT | 360 |
| GGCAGA-.G | 3 63 |
PL 194 248 B1 (2) Informacja o SEQ. ID NO: 4:
(i) Charakterystyka sekwencji:
(A) Długość: 58 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon III: ET45” (xi) Opis sekwencji: SEQ. ID NO: 4:
GTTTGGTTCC AGAACCGGAG AGCCAAGTGC CGCAAACAAG AGAATCAGAT GCATAAAG 58 (2) Informacja o SEQ. ID NO: 5:
(i) Charakterystyka sekwencji:
(A) Długość: 89 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon IV: G108” (xi) Opis sekwencji: SEQ. ID NO: 5:
GCGTCATCTT GGGCACAGCC AACCACCTAG ACGCCTGCCG AGTGGCACCC TACGTCAACA 60 TGGGAGCCTT ACGGATGCCT TTCCAACAG 89 (2) Informacja o SEQ. ID NO: 6:
(i) Charakterystyka sekwencji:
(A) Długość: 1166 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon : Va” (xi) Opis sekwencji: SEQ. ID NO: 6:
PL 194 248 B1
| CTCCTCCACC | _ L. — — — <» xJV7 | AGC —TTC CA<j | GCAGCAATAA | <_. — - tr»?'— x <xr. | Θ 40 | |
| Gvt\.T Gr.c-c.-C | GTGAACCGCG | 1σ\σν^^ i. -i <Λ2ίνΐ | AGGGAGGGGA | Go\sAGAC—Ckj | AACCTCCCAC | 900 |
| GTT G\jGACT — | ws~Ak,xJi „ -<J | <7\J\JTV—— * 4λλ | TGAGGACCGA | m · /·*« U - X xAxAAt X | m | 960 |
| ?*λ- a. ’χϊ'^'σ x \- - | GGTTTT GTTT | X 'JC/Ł. x kJ<7 ΙΛ | TTTTTTTTTT | TTTTTTTTTT | 1020 | |
| i VJ\«, X <7 X łj· i -Λ | /·« / —/ 'ν.·*.υ\7Λ- i *—.“Aj | ACGv-AAAAGA | CTTGCATAAG | AGAC GGAC GC | <7X <3\7X . 'J^rtA | 1080 |
| GGTGTCATAC | »r»h m<—“·*> /— • CPUAi 'χΖν-Λ'-ϊ | CATTAACTTT | ACTGACATGG | AGTGAAGTGC | AATATTATAA | 1140 |
| <“· * Λ-Λ-. X.“L«.-.kS.“i. | TTAAAAAAAA | AATAGC | 1166 |
(2) Informacja o SEQ. ID NO : 7:
(i) Charakterystyka sekwencji:
(A) Długość: 625 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „exon Vb” (xi) Opis sekwencji: SEQ. ID NO: 7:
PL 194 248 B1
| ATGGAGCTCC | GCCCCCGCCG | C C CAG\oC7 gg | AGCACAACGG | CACGATCCCG |
| AC C C C C A-. C C | C C C Gr-.GC C CA | AGCGACCCCC | CCGCCCCAGC | m^**<***** mm* L· - wWw««UXA |
| CAGGC G\- C _A | CCACCACGCC | AAGACAACGC | CCGCACCCCC | AGCAGAGACG |
| ·* m <·***** ^ - X | GG^-C GGC CC C | GAACCCCCGA | CCCCAGGCGA | CCCACCCGCC |
| * * * mmmmmmm Annb i kr>- - <j\j· | GAC GACAGo\- | GCGAGCCCCC | w w | mmmmm* * mmm i. - xkixAAC* x |
| mmmmmmmmmm | CCCCAAGAAA | GACAGAGC C C | TGCCCCGCCA | C *- '-AGGCC Gut |
| C GC GAC GACA | GCCCACCGCA | GC CC CAAACC | CCC GG\jCT ca | * mm* * mmmmm ,u.tJVAiU *-* |
| CC C CC GAGCA | GCCGGGACCA | CAGGCACCCA | CCACCACACC | m* mmm* * mmm |
ACCCACCGCA mmmmmm* mm* i Ό\3\-ζ·.« Λ
GGGCTTGACC
CCAGCCCCCC
TACCCCCAAC
AGCACACCGG
C CAC CCCAGC ·Λ\ΛΛ«Λ^
120
180
240
300
360
420
480
540
600
625 (2) Informacja o SEQ. ID NO: 8:
(i) Charakterystyka sekwencji:
(A) Długość: 15577 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „HOX93” (ix) Cechy:
(A) Nazwa/klucz: egzon (B) Położenie: 1498 ...1807 (C) Inne informacje: /function= „part of the exon I (G310)” (ix) Cechy:
(A) Nazwa/klucz: misc_feature (B) Położenie: 3844 ... 4068 (C) Inne informacje: /function= „pET92 region (part one)” (ix) Cechy:
(A) Nazwa/klucz: misc_feature (B) Położenie: 4326 ... 4437 (C) Inne informacje: /function= „pET92 region (part two)” (ix) Cechy:
(A) Nazwa/klucz: misc_feature (B) Położenie: 4545 ... 4619 (C) Inne informacje: /function= „pET92 region (part three)” (ix) Cechy:
PL 194 248 B1 (A) Nazwa/klucz: egzon (B) Położenie: 5305 ... 5512 (C) Inne informacje: /function= „part of exon II (ET93)” (ix) Cechy:
(A) Nazwa/klucz: egzon (B) Położenie: 11620 ... 11729 (C) Inne informacje: /function= „part of exon IV (G108)” (xi) Opis sekwencji: SEQ. ID NO : 8:
CCGAC'•j-'-G TTTG^TTTCC AG\jAC7TG\jA. AAACGAAT77 CAGG7CGCGA TGGCGAGCAC 480
CGoCTTCCCC TGA-tG^-ACAT TCAATAGC'«jA GAGGCGGGAG G\xAGCGAGCA GGAGCA7CCC 540
| ACCATGAAAA | CCAAAAACAC | ΑΑΛσχΛ^ | X X X | AAATACCCCA | GACG^CAGGG | 600 |
| TGACAGCGCG | GCGCTAAGGG | AGGAGGC CT C | Uj\-» U <7^3ΆΛ7 X | CCGCCSGGAT | CT | 660 |
| CGGAAAGAAT | ATAGATCTT7 | AC GAAC C GGA | i ć . d « <7V7VS%7 | AC CT G\aGCTT | 720 | |
| GCGCTGGAAA | CCCGGGAGGC | GGCCCCGGGG | ATCCTCGGCC | TCCGCCGCCG | CCGCCTCCCA | 780 |
| AGCGCCCGCG | TCCCGGTT7G | GGGACACCCG | GCCCCTTCTT | CTCACTTTCG | GGGA7TCTCC | 840 |
| C G i T C | CATC7CACCA | ACTCTCCATC | kAA<JVJVJ\«. ij | CTTGGAGCTC | 900 | |
| A7CTTC7CCC | AAAATCG7GC | <71 | CGCCCGG^TC | CCCCCCCTCG | CCATCTCAAC | 960 |
| CCCGGCGCGA | C CCGjGC GCT | TCCTGGAAAG | ATCCAGGCGC | CGGGCTCTGC | GCTCCTCCCG | 1020 |
PL 194 248 B1
| GGAGCGAG^^» | CGGCCGGACA | ACTGGGACCC | TCCTCTCTCC | AGC CGT GAAC | TCCTTGTCTC | ioao |
| TCTGTCTCTC | TCT GCAGGAA | AACT GGAGT7 | TGCTTTTCCT | CCGGCCACGy | AAAGAAC GC G | 1140 |
| GGTAACCT GT | GTGGGGGGCT | CGGGCGCCTG | CGCCCCCCTC | CTGCG^GCGC | GCTCTCCCTT | 1200 |
| CCAAAAATGG | GATC7TTCCC | CCTTCGCACC | AAGGTGTACG | GACGCCAAAC | AGTGATGAAA | 1260 |
| TGAGAAGAAA | GCCAATTGCC | G\JU,CTG%?VTX^\J | GTGGGGGAGA | CACAGCGTCT | CTGCGTGCGT | 1220 |
| CCGCCGCGGA | GC C C GGAGAC | CAGTAATTGC | ACGAGAGAGG | CAGCGCATGG | GyyyCTGGGC | 1380 |
| GAGGTCGCCG | CGTATAAATA | GTGAGATTTC | CAATGGAAAG | GC GTAAATAA | CAGCGC7GG7 | 1440 |
| m-* mmm·» mmmm '•Jf-_ vGz*.C w — y | C GC GCAC GG*y | CGGTCCTCTC | CG^ G\w ΑνΆ | GACGCGC GCA | TG-ACCAGCC | 1300 |
| C—-Jy—7G<-.T C | GCGAGCCCCG | GC G G CAGC CA | λ G\iAAGAGt-.T | m·* m m m mmmmm t/u-w. _ _ _ _ | G i AT G CAAGT | 15 60 |
| CTTTTGACCA | GAAaAGA.AAG | GaC yy i AAC G | GCGGAGGCGG | AGGCGGCGGA | <5V k rtrtdr.-.&j | 1620 |
| A.T T C CA'” A- C | GTA.C G yj\sAA | GTT7TGGAGA | G— yjACT Gy— | G\- >y— G w G yy | GAy— Gyyy.—. | 1530 |
| CA.C-G GT G GAG | GACATGACGG | A.GGGCGGCGG | C,_-iJG * CAC --y | GT GCA7TT GT | 17-50 |
1SOO
| CAGAASGTAA | GTTCCTTTCC | Gtt^-C^-^TC | Cy.GGGyyyG C | C7CC7A.-CCT | T2GGCGCC7C | 15 60 |
| CTCC-CCACGG | AG xG'yy- w'w-w | GCCCGCCCCT | CGCTGTGCAC | r.j. * - - | GGGGTGTGGC | 1520 |
| CASGGTAAGG | CGG GGGCCGT | CACCC7TTGC | CTAAGAAAGC- | rtAGvaj-AG\r<A. | GG.-.GT GG.AG G | 1530 |
tSfŁ O y _ yy— X yU _ G\T— i AG-'yyy GT G— 3\ΛΓανα 'JwJkTUWJ ΓΙ'—'—·—y.yycrj-Ltj
G·-j. j^-—-.C C<=.-.CAC<rxjv?7·. A.GvTCCCGGG CTGGGjTGGG
mmmm#» i-.UiA^Ui- i kjr i _ i ν?Λ
G.-C .--S_'.^TmS- 7CTGTCCCCC AGGCTGGAGT
CCTCAGO
CCCAGTAGCT GGGATTACAG GCATGCACCA C2ACGCCTC-G C7AATTTTTG
£040
2100
2150
2220
2210
2240
2400 fW.tt.--V -r-f-f-J
| A-^yyT GAT G G | ACCCGCCTGG | GCCTCCCAAA. | GT GC T GGGAT | Gr\CAGy— j i v | AGGCACCGCG | 2450 |
| ·-. w — yy—— _ Ay | GT C GT GAC Gy | c* * λ Ca..—c g - | Giu*T.:-.3i | CTCTGCC7GT | CTGAGTTGT.A | 2520 |
| - - ——.Cyyx CA | C — —“ttznC <7xAt | CAGAGyy^G^ G | GT CTG GAC GC | GCCTTCCCAG | Cc— - C-AG\ws7^- | 2550 |
| G _ G—— kj\jv7\_ —. | CCCGGAGATC | AC GGGAAGAC | T C AJA- T GC | GT GGTAGGAG | AC iAG\ru | 2640 |
| CCCSCGTCAG | CTCGCTTCTG | m m m m\* mm m m 1 ♦ 'm.ł <> X X Χ.Λ | AGjAAC ·- -T T | tiU X Ax *A* - | mm* m^^m>imm J· ·—~— - J· * * . X | 2700 |
| CCTTTGAACG | T C GAGkjCT t g | ATCTTGGCGA | AAGCTGTTGG | GTCCATAAAA | ACGACTCCCG | 2760 |
| T GAGA GGAGG | T Άν, C GyyAT | CT GGAT GGGG | CGCGAGGGGC | CCC GGGGAAG | CT CA·^, GGCTT | 2320 |
| C k3\- yyy— 1Λ. iy | TCCTAAGTCA | AGGTTGTCAG | AGCGCAG— C tj- | G x T GTGCGC G | (ACCGGGGGN | 2SS0 |
| AGCTCCCCTC | TGGCCCTTCC | TCCTGAGACC | TCAGTGGTGG | GTCGTCCCGT | GG7GGAAATC | 2940 |
| G5GGAG7AAG | AGGCTCAGAG | AGAGyyy—TG | &-CCCGwGA | TCTCTGTGCA | CAGtCGACAA | 3000 |
| U. T sAA-A | TACATCTTAA | GAATAAAATG | LkT\, i Lr-y— i' ty i' | G x C GGGGCAC | AGCTGGAGAC | 3060 |
PL 194 248 B1
| G337A733AC G337G77A7G 7777CA77AC AAAGACG3AG AGAA7C7AG3 C733337777 | 3120 |
| G37GA77CG3 AAAG77GAG3 7G3GAGGG7G AA7GGCCCAA AG37AA77C7 TC37AA.GAC7 | 3180 |
| CTGGGGCCAC CCGCTCTCCG GG\j\-CCCGCA TCCG^j^j^riGT Gvw\G.lG«\-C— CGA3AAACAG | 3240 |
| CCCCTGCACC CGTAGGAGGC ACCAGG'—AG<- TCCCCAAG\j\- CCxGnC-xCG TCGAAGCAGA | 3300 |
| AAGOTGTGGC TACG\jTTTAC AAtń.G'—AGCCk- C—.^\jxCCC*.G AC—<jxC-A-lG AG^rCAGGAGC | 3360 |
| CCAGCCCGCC TTTGACAGCG AGAGGAGTTC CTCCCTACAC ACTG^,TGCG\j GCACCCGGCA | 3420 |
| C737AA77CA TACACAGAGA G77GG3C77C C7GGAC33AA GGC7G33AG3 CG377GAGGG | 3480 |
| CCTGCGTGTA ATTTAAGAGG GTTCGCANG- G~—CCCAr—«uren— CG'—TTCTGiiT GGGGTTGCTT | 3540 |
| 777GG7737C C77CNGCAAA CACCG7777G C7337C7NGN AAC7C73737 7*JC7CCCCCN | 3600 |
| 73333713733 GACCCGGGNA NGAG3AAAG7 G7CC7CCAGA C37477773AA A7IG7GAGAG3 | 3660 |
| AAAA7AAAGA CCAG33CAAA NNGACCCAGG GCCACAGGAG AGGAGAC.-.GA GA37CCCC37 | 3720 |
| TACATTCTNG CCCTTGGCTG GGTGCAGAAA. GAC — CCC—·<η— C—AG\=ACTGC CACCCA.GGCT | 3780 |
| AC7A777A77 CA7CAGA73G AAG77AAA7C GAGG77GGAG GGCAGGGGAG AG777GAGG7 | 3840 |
| TA-CCGTGGAA. GCCTGGAGTT TTTG^srjilAj-.C AG\-<rxGxC'—— C^r*—CGAG-CC GGGAGCCCGC | 3500 |
| GGGTTC — G-A AA.G'—CTG1—G^j GTGx -AC--TGr^z+.Gr·. C—rvGxTTG-C AGTTGGGGTC | 3960 |
| .-AG7NCC7GG GG77CAGACT 7AGAGAAA7G AAGGAG3GAG AGC7GGGG73 G737CCAGGA | 4020 |
| AACGA77CAC T7GGGGGGAA GGAATGGAG7 G77377GCAC- GCACA73737 G77.-.GGAGG7 | 4G80 |
| GAAACAGAA7 G7GAAA7CCA C377GGAG7A AGC37C7AGC GC7GAA737A G37333GG73 | 4140 |
| 33-37337,-3-3- 3333733737 G3A733733A AG33AAGAAA 3,333.3-3333 337337A37A | 4200 |
| 777A.333337 77J33G7G7.-.G AC3.333733-A 7773733.337 773333.3377 3773377333. | 4260 |
| 3333337733 C737333337 7733.33.3737 77333.GAC7A 33.37733333. 737333-3333 | 4220 |
| 773.C337733. C3.GGGAGGG3. C.373733.773. G333A7C333 7337737337 37373NC733. | 4380 |
| 333.33333713 AGA7AG3AAN C3NGAG3333 NG77GGNAGA 733NC3C773 3333333337 | 4440 |
| GGGN77G.33.G GGGANGGGAN GGG.3N33.37i3. C37777.3NC7 7AAAC33377I 333-3773373 | 4500 |
| CAGA.GA.GGAC TGAA.TGTCTA AA-ACGAGw-A Gr-A..-AGGTTC TTCA.CCCGGA AACGCTTGAG | 4560 |
| GG37G3.G737 7373333377 C7GACN7333 C323G33AA33. CAGACAGG73 A333ANC7AC | 4620 |
| TGGAGACGAG AAAGTGCCAT TTTTG^n—A.CA. CTCTG^rTGw GTAGGTGCCC GACCGCGTGT | 4630 |
| GAAAAANGTG GGAANNGGAG AGATTTCTGN CG\-ACC*—GGT TCAGCCCCCA GGCGCGGNTG | 4740 |
| G3NG3A77CN AGGN7AC7CA GACG3GG77C TG37G77C7G CTGAGAAACA G3377CGGG7 | 4800 |
| AGGGGCTCCT AGCTCCGCCA GACCGk-G^sAG Gv=ACCCCCAG CCCTCCTGCG CTGCAGCGGT | 4860 |
| GGGGATAGCG TCTCTCCGTA GGCCTAGAAC CTGCAACCCG CCCCGGGCCC TCCCCGTGTC | 4920 |
| C77CCCGGG3 G7CCCG33'3G GGA7CCCACA G77GGCAG37 C77CC7C.3AA 773777CCC7 | 4980 |
| TAAAAA7AGG A777GA33CC CCAC7C7C37 7AAAAAAAAA AAATAAGSAA AAA3GG7TAG | 5040 |
| GTTATGTCAA CAGAGGTGAA GTGGATAATT GAGoAAACGA TTCTGAGATG AGGCCAAGAA | 5100 |
PL 194 248 B1
| AACAACG-GTC G7GCAAAGC7 CAGG77TTTG GGAAAGCAGC GAG7A7CC7C CTCGGCTTTT | S160 |
| GGGT7ATGGA CGGGACGCAG TTT7TGCGTC AAAGCGGAIT GG7T77CGAG GGCGGGC7T7 | 5220 |
| CCACCGGG-GG A7GCACGAAG GGG7TCS2CA CGTTGCGCAA AACC7CCCGG GGC7CAGCCC | 5230 |
| TGTGCGC^CG G\--*CCCCACG CAGGGATTTA TGAAIGCAAA GAGAAGCGCG AGGn.CGTGAA | 5240 |
| GG CGGAGGAC GAGGACGijGG AGACCAAGCT GAAACAGAGG CGCAGCGGCA CG^ĄCGTCAC | 5400 |
| GCTGGAGCAG CTGAACGAGC TCGAGCGACT TTTTGACGAG ACCCATCACC CCGACGCCTT | 5460 |
| CATGGGCGAG GAGCTCAGCC AGCGCCTGGG GCCCTCCGAG GCGCGCGTGC AGGTAGGAAC | 5520 |
| CCGGGGGCGG GCAt^Gj-utGGG CCCGGAGCCA CCOCCTGGTC CTCGGGAGCG CACAGCACGC | 5520 |
| Ga.ACAGx^<~AC C- CCCCCTTCC-w Gk^-.GCGCGGG GAGGTTGGGT | 5 64 Q |
| GAGGGACGktG CTGvjvt\jTTCC tggactcttg gagacgcctg aggcctgtag GATGGGTTCA | 5700 |
| TCGCGTTCGT TTTTCACGAA CAGCAAACAA ATATATATAC ΆΤΑΤΑΤΑ7ΤΑ TACAAACAAC | 5760 |
| AAAZA.AAC.Ar A7A7G77A7A CAGA7GGGTA. 7A77G7A7A7 A77A7AGA7A T77G77CG7G | 5320 |
| C77GG7GCAA AGACACC2GG TGAACCGA7A 7A77GGC7G2 7GAC7GCG77 CGG77CCG2? | 53 20 |
| GGGAT7C-37T A7AGGGGCAA CACATGCAAA CAAAACTTTG CG7GGA77A7 AC77AGGAGA | 5540 |
| CGAAGG7A.CA GA7GCG777G A7CCAGAG7G T777ACAAGA 77777CA777 AGAA-AAAA7 | 60-00 |
| G7G7C7777G GCGCG7GA77 CGGG7GGG7C 77CGGG7G7G GC7GCA77GA AAAGG777CC | 6060 |
| 77A.GGA.7GAA. AG--.--GAGGGG 7G7CC7C7G7 CG27A.GGTGG AGAGAAACAG GG7G77C7C7 | 6120 |
| 77GG7CGG77 7777CACC7A CCG777C7AT C7CGG7CG7C CCC7C7CGAG C2G7G7CG7C | 61:0 |
| 7GG7ACA.-AC CACGCCG7GC TCCC7CCGGC 7G7GGGGA.GG GCAGGAGCAC G773GGCA7C | 6240 |
| 7GGA7GAGGG GNAGAC7A77 AGCGGGGCAC GGGGGC7G2G CGAGGAGC3C GCGAATTCAC | 6200 |
| GC7GCGG2A.7 G.-.G.-.CGAGGC ACGGGGGGGC GGAGGGGCC7 7GGG7G7C2G CAGAGGGACG | S-; cO |
| GGGGGGC.AGA GC277CG7GG GCA77C7AAA CA77CA.C77A AAGG7A7GAG 777A?777AG | 6420 |
| G%r^- a G^· - TCCAAAGG\^«. TTCTTCCAGC CCCTGCCCGA CAGTTCAGCT | 6480 |
| CGGC7GGAAG G7CAAC7G27 C7AG7CG777 C7GG7GG77G 7GGGC.AC-GAG AGA-.G7GGGG | 65 40 |
| GGAGGGAGAG AGAGAGAGAG AGAGAGAGAG ACGG7CAGGA TCGGGGGACG C7GGGGAACG | 6500 |
| CGTCAAAAAT AAA7GAAA77 AAGA77GCGG A.C2AGAGA.GA GAACCG7GAC AAAGCAAACG | 6660 |
| GCG77CAAAG CAAAGAGACG AACTGAAAGC CCG77CCCG7 AGGACTGGT7 ATGAGGTCAA | 6720 |
| CACATTCAAA CACAGCTTGC TCTGGATTTT GC7GAGCAGA GGAAGATACA GATC-CATTTG | 6780 |
| AICCAAAGTG TGT7ACATCT TTCATTATAT GTG7G7CTAT ATATATAAAC ATATATAAAC | 6840 |
| ATATAAACAT ACATAAATGT ATGTAAATAT ATATAATCTA TATACATATA TAAATATATA | 6200 |
| AACACATATA TAATATATAA ATCTATAAAC ATATATAATA TATAAACATA AATATATAAA | 6260 |
| CATATATAAT ΑΤΑΤΑΑΑΤΑΓ ATTAACATAT A7AAAA7A7G TATAAATATA TATAAACATA | 7020 |
| TAAACATATA TAAATATATA AACATATAAA TATATAAACA TATATAAATA TAIACAAACA | 7080 |
PL 194 248 B1
PL 194 248 B1
| AGGNCAGGGG CCTTTTTGGC GGGGGTGTGA GGGANGGATG ANCTTTGGTG GGAAANNCAG | 9180 |
| GATCAGG7TC TCCAGGCGCA CTGCAGCCCG GTAGGACCCA CTTTGGAAAT GAAAAGCGAG | 9240 |
| TTNCCGAAAG CTGGGCTGGA AGCTTCGGTG TTGGGTTCAA GAGCAAGTTC ACG7TGCGC7 | 9300 |
| GTGTAGACTC CTGGCTGCTC CCAAACTCTG AGGGTTTTCT GAGGTTCCCT TCATAGGGGC | 9360 |
| ACCGGCCCTG GGCCATGCAC AGTGCGTAAG GGTGGCTGTG GGGCGAGGGA CCCAGCACGT | 9420 |
| GTTTTGCCCA CAACAGCCGG AGTGACTGGT TCACTCACCG CCTTGGCGGA GGACGCCTGT | 9480 |
| mmmmmmm*mm **mm*mmmmm mmmm-—mm—”* m* mmm-mmmm mm-«—mm* * m — mm-*m — mmmm ΛΛΧΧΛϋΙΧ-. '-.L k=r.>— X\J\- »- χ X\J X X —X X x X x | 9540 |
| CTGCCACAGA AAACCTGTTA GGAGGAATTA AGCGACTAAG ACTGTCAGGG AC-GTGGTGGT | 9600 |
| GGGGGANGAG GłIAGG^jGGTG GTGTCCAGAT TACCAGG'—AT aG\3>-7AAAC7 GCCTGCACTC | 9660 |
| TCCAGCTGGT CTGTCTGTGG AGGAGGGGAT TG7CAATACT GGGAGAGGAG AGGAGGCTCG | 9720 |
| m*mm*m—mm* m * m m m —» mmm — * * mmm m m* m m m* * * mmmm m * m *mm*m—— mm .—mmmm* * mmm - .*dlk5XXTŁ\J'-y X UA Uxrttj%7k7vjvrxkjvr ΠΛΧ X - <J\—A— '-γ <—-λΑΑ- —*X L-ΠΧ «AWMwi L7ikjxss.-ir\x - χ | 9780 |
| £m mm* £· —mmm ¢-m^·»·* ζ· m —m^m ^mmm m m mm *^m mmm*^ ^*m^** m Τ m * £ mmm* £mmm* * | 9840 |
| GAC7CAGAAG TCCTTAGAGG GGCAGAA7GC CCCCACCACA A-.GCC7C-C7A. TCCTTGGGCG | 990C |
| mmmmm* m —* m m —mmm — mm* m m**mm——*m— mmmmm* mmm* mm — — — * m — m m mm-m* * m* mm • L.'—- X <3V7 X L*-.« Ι-ΛΛ* L. L7 X Λ X kTkTkrir.L. — — - - 'JUT | 9960 |
| * * mmmm* mmm mmmm* C m-m mm*mmmmmmrn mm*m—*m——— m* m* * m — mm* * «, m* m* mmmm .--r.— L. x - — L. —x - x- <— — <ir.kzr.r.Lr\rsr—r-rtLsr.'—-.*— - - -— | .0020 |
| mm* mm* m — —— rn* m* * mmmm* * * m ·* m* mmmm mm m m m mmm m m mmmmmm* * m* mmm* m* mmmm L-jr.wuzycw- łjxxtxrt/-jA?\5\s\m··. A2-.Lsm.L-.-1.- - - - L-- - k?x '^χ Lr— χζ.-.- * '-ζνζ | 10080 |
| AGAAGGGGCT GGATTTGGAA CTCTTTAGCC ATCAGCTCAC CCTCTCCGTT TG7GGC7AAA | 10140 |
| mmm»ł»m* * m—·*» mm*** mmmm- mmmmmm-m*m * mmmmmm* m* — — mmm-m —m mmmmmmmmmm Lr x <, - «w.w x wartAALi -L, — L..L.x-.r.L nbwiLiAL.-. L^r.—.u x _ x?\rsr\r Lr<r— | 10200 |
| CCACACAGAA CGCTGGAAAG TTCGACAGTG CAC77CCAC7 GGC7CGGAAC 7CAC77777C | 10260 |
| * m— mm* * mmm m* mrn* /— — — — «* ** mmm*m*m— mmmm* mmm* m —-** m — mm* m m m* mm* mmm** x - L-λ--_Lr\_.1— -.~.Lr\r x — - - x— Lr—-,xrvryr—-.-- _r x —- χλλ | 10320 |
| m** mmmmm* m mmmm* —mmm* mmmm - — — mmm mmm*m*rn—mm m** mmmm* mm *mmmmmmm*— 1 -„—.Lrxyx *—-. i—r—x'j*——x L. --—-.L--.»—— - — z*.L. - . --i\j\xr.G | 10380 |
| θ'—C—AG\sAG\r GCGGACCGCT CGAGGCCAGG AGTTCGAGAC CAGGCTGGC— AAGACGGTGA | 10440 |
| AACCCGGTG7 CCACTAAAAC A.CA-AAACCA GCGAGGCACG GTGGTGAGCA CG7GCAATTC | 10500 |
| C.-.G— lG - G — Gkir.G^r*— - Gr.G Gv—-i.G^jr-.G.—j-.G C —r— - - GrAC — _ G\j%xr.G\jCG\j A.CGTGGGAGT | 10560 |
| GAGGTGAGAT CACACGACCG CACTCGAGGG TGGACGAGAG AGGAAGAGTC CGCGCGAAAA | 10620 |
| ACAAAACAAA ACAAAAACAA AACAAAAATC AAAAAAGAAA ACGGAACCTG CAG7CCTAGG | 10680 |
| CGAGG7GCAG TGGC7CACGG C7GTCA7GCG AGCAC77TGG GAGGCGCAGG AGGG7GGA7G | 10740 |
| GC77GAGG7G AGGAG7TCGA GACCAGCC7G GCCAACATGG 7GAAACCCCA TC777AC7AA | 10800 |
| AAA7ACAAAC GTTAGC7GGG TG7GG7GG7G TGCGGC7GTA A7CGGAGC7A C7CGGGAAGC | 10860 |
| TGAGGOxG\sA GAATTGCT7G AATCTGGGAG GTGGAGoTTG CAG\jGAGGCG AGAIAG7GCC | 10920 |
| AC7GCAG7CC AGCCTGGACG AGAGAGCAAG ACTCCGTCTC AAAAACAAAA GAAAGCAAAA | 10980 |
| ACAAAAAACA AGAGACGAGC CTGGCCAACA TGGTGAAACC GCG7C777AC TAAAATACAA | 11040 |
| AATTAGCCGG GCA7GG7GG7 GGGCAC—TGT AGTCCCAGCT ACTCGGGAGG CTGAGGCAGG | 11100 |
PL 194 248 B1
| AGAAIGGCTT GAACCTGGGA GGTGGAGCTT GCAGTGAGCC GAGATAGTGC CACTGCACTC | 11160 |
| CAGCCTGGGC GACAGAGCGA GACTTGATTT CAGAACCACC ACCACCACAA CAAAACAAAA | 11220 |
| CAAAAAATCC AAAAAAACCC CAATTTCCAG TACTAGGTAG TCAGTGATGC AGGGCTGGAG | 11280 |
| ACAGAGGGGC GGTAAGTGTC TGGGCGCCCA CCATCAGTCA CCTCCCAGCT CCCANGAGGT | 11240 |
| G\—AAAGTGC7 TGGTTGAG—C TCATGGGAAG GA7GCTCCCT GGG\jAGGCTG GGGTGGGTTC | 11400 |
| ACAGGGCTCT TCACAICTCT CTCTGGTTCT NCCCCAAGGT TTGGTTNCCA GAACCGGAGA | 11460 |
| GCCAAGTGCC GNCAAACAAG AGAAICAGAT GCAIAAAGGT GGGTGTCGGG ACTGGGGGGA | 11520 |
| CCTGAAG\-TG G^^cATCCTG CTCCAGoAGG GAIGGGGTCG ACAAGGTGCT GGCTACACCC | 11530 |
| AGGACCACCA CACTGACACC TGC7CCCTTT GGACACAGGC G7CATCTTGG GGACAGCCAA | 11640 |
| CCACCTAGAC GGCTGGCNGA GTGGCACCCT ACGTCAACAT GGGAGGCTTA CGGATGGCTT | 11700 |
| TCGAACAGGT AC-CTCACTTT TTCTTCCTCT GNAAGATCCC TAGGGACCTG CTGCTCCCTT | 11760 |
| CCCCTTTCCC C7A7TTGC7G CCGCATCCTG ACACTCCTAG TCCCTCCCTG CCCCTGCAGA | 11820 |
| C77C7CAGCT GGCCCTTAGA AAAAAAGCCT CTTTTCCGAG GAGGCA7TTA CAGGCACCTT | 11880 |
| G\jx-ACCTATG AAATCAGGCI GGGCCAGGCG GGGTGGCTCA CACCTGTCAT CCCAGCACTT | 11940 |
| TG\jvxAGxyv— —A AG\jx iAG\=.—.G TTTGAGACCA GCCTGGACAA CATAGCAAAA GCCTGTCTCT | 12000 |
| A.C—i-AAAf-„A CAAhiUłAnrt x *AACnG\jxxn. GTG\tTGvj,xG\j G\1ACCTG7AA TCCCAGCTAC | 12060 |
| TTG\sv=AG\j\-T Gr'.G\j\—AG\=r-.G AA7CACTTGA ACCCGGGAG\y CCGAGGT7GC GGTGAGCCGA | 12120 |
| Gz~,x CGTG^—A T-G_ACTC_A G^j^TG^jm^GA CAGAGTGr-.GA CTCTGTCTCA AAAAATAAA.T | 12130 |
| ΑΑλ.λλλ«-Α λ.μχλΑλλ.-λ A.TAAAA.-.IAG GTCGG^CACG GTG\rCTCACG tctgtaatcc | 12240 |
| CAx^—ACx « x G GrAG%3^C.j.-Ay GTGvxjx G\xAT GACAG\j\jTCA AGAGA.TTGA.G ACCA7CC7GG | 12200 |
| CCAACATGv^ AAAATGCC<rT CTCTA.CTAAA AAATACAAAA ATTAGGCGGG CGTGGTGGCG | 12260 |
| 7.77-.17-.-. A- C— —A&-7A CTCG\jGAG\jC TGAGGCAGGA GAATCGGTTG AACCCGGGAT | 12420 |
| GCGv_-AG^TTG CAGTGAGCGG AGATCACATC ACTGCACTCC AGGCTGGGCA ACAAGAGCGA | 12480 |
| AACTGCGTCT TACAAIAAA7 AAATAGATAA ATAAATAAAC AAATAAACTT TACTTTAGAA | 12540 |
| ACAAATCCCT GTCCGTGTTT GTCTTTTCAC CTGTCCTGCA GGGAAAACAA AACATAAAAT | 12 600 |
| GTCAAGGCAA ATAGTAGTGA TTTCATTCCG GGAAAAAGAA AGTGGATGTT TGCCTTCACC | 12660 |
| CTTTCTCGTC CTTCCTCTGG TGCTCCTCAN GGCCCANGGG NAGAGGGTGG AAAGTNCAGA | 12720 |
| GGAAGAAAGA CGGGGCTGGG GGGGGGGGTC CGTGGGGACC CAGGCAGGCA TGTTCCCNAT | 12780 |
| TTCCNTGTCT TCACNTTCAA AGNAGGGGCC CCTCGNCTCT GGAATGAGGC CTACGGTTTC | 12840 |
| CTTTCCCNGA AGAGTTNCCC CTTTGTGAGC TTACGGCTTC GGAGTGAACC TCGGTGCAAC | 12900 |
| CTGTTATTAA AACACACAGA GGCTAATGCC AGCAAAAACA CGCCCCCCGC TCCTGGTTTC | 12960 |
| AGAGGGAAGA AAAAAATTCA TAAGCACGGC CATGCTTTTC TAATAAAAAT TCATTAAATA | 13020 |
| ATCGTTATAA GGGA7GAAGC CGGGAGGGGA GAGGAGAGGA ACACAATCAA GAGACTTTCT | 13080 |
| TTGAACTTTT TCTCCCTGCT TCAAATACAA AGCAAICTTC TGTGGGCCTG GGCCTGGGGG | 13140 |
PL 194 248 B1
| GTTTCCCCCT | TTCTCTGCAG | CCCATTGGGA | GGAAGAAAAT | GCTTCCCTGA | ANGTTGCTGC | 13200 |
| AAAATTGTTT | CTGTTTTTCT | TTTCTTTTTC | TTTTTTTTTT | TTTTTTGAGA | CGGAGTCTCG | 13260 |
| CTCTGTCACC | AGGCTGGAG7 | GCAATGGTAT | GATCTCAGCT | CACTGCAACC | TCCACGTTCC | 13320 |
| TGTTTCAAGT | CATTCTCCTG | CCTCAGCGTC | CTGAGTAGCT | GGGACTACAG | GCGCCCGCCA | 13380 |
| CCACGCCCGG | CTAGTGTTTG | TATTTTTAGA | AAAGACAGGG | TTTCCCCATG | TTGGCCAGGC | 13440 |
| TGGTCTTGAA | CTCCTGTCCT | CAAGTGATCT | GCCTGCCTCG | GCCTCCCAAA | GTGCTGTGTT | 13500 |
| TrTf.TTłpTW,r | τττγτγγγζγ' | TT^irar, | ΙΓ.ΙΔΤ'ΜΔΔΤ | 1 | ||
| τι t« —ιτ»/“·« ΛΛ<σ X - <Λ--Χ kj\- | AAAATTGTTT | TTTCTCTTTT | CTTT CTTTTT | GAGATGGAC-7 | 13620 | |
| CTCGCTCTTT | CACCCAGG^T | GGAGwCAGT | GtoC GC GAC C T | CGGCTCACTG | CAACCTCCGC | 13630 |
| <· **· ** ^--^^ m | CAAGCGATTC | TCCTGCCTCA | GCCTCCGGAG | TAGC7 GGGAT | T ACAGA2AC C | 13740 |
| TGCCACTATG | w X X ΛΠ · | TTTATTATTT | TTAGTAGAGA | χ - >-Λ | <· *· <- - '-J· X * <7ντ\-. | 13800 |
| CAGvt\-T G\jT c | TCAAACTCCT | GACCTCAGG7 | GATCCGCCCG | CCTCGCCTCC | CAAAGTGATG | 13 8 60 |
GGATGANCAG GNCATNGAGC NCACCGTGCC CGGCCCTC7A
TCTCCNNTTC CCCTTTCTAA ATG7A7A7AT TGTGTTTTTA
CACC7CA77N CCCCGCTNCT C7CCCCAAGA CCTGTCCTGC
GCCC7GGACA TATCCCAAAC CCACGCTGAA AGAAAGAGGG
CTGTGNATCC TTTAAACA7C TCCGTGGCTT CCAGGCAACA
ATGTCTGACA TGATACCGGG ACCATGTATG GGNAAATTCT
CCCCGCAGAG GCANCCAT7G CA7ACCC7CC AGAAACTCCC
CACAACACAA ACAGCNTCCG AGAGAGGG7G TCATTGAAAA £CmC'T'TT-Cr
AAAGTTAACA
AC GTT GCACA
TCTCACTACA
CAGCCATAAA
G\?\y7 GT GAAG
CTGCCGTTNC
CAGCAGG7G7
CGTA.T GAT AC rwn /--ί « rłi/-·*,TTCCAGCTAC
AAG\- CAAAGA
CATAAGAGCA
12920
13980
14040
14100
14160
14220
14280
142 40
| CACAGCACCG | TCTTTCTCTT CTGCZC3TTG A7AC-.CAAT7 A7GAGCAA77 7GC7AACAC7 | 14400 |
| GACAACTCGT | GGCAAGAACA GC7CG7G77G A7ACGG77GC C7CG7GAGGA CCCA7C7G7C | 14 4 60 |
| i - wi | 77GCG7GGAA CGGAGATCGG AG77CAGGG7 GGC7AA7AGA A7CA77AC7G | 14520 |
| ACCTAGGGAC | ACAGAA7NA7 GAGGG77ACC CGGAG77AAG TGCA7ACAG7 CAAACGGACG | 14580 |
| z-z-·* X <σ\- X x αν | AAGG7ACAG7 GACGTGAACA GC7777A7GA AA7GCC7AGA 7C7GGACC77 | 14640 |
| CCATACCTGA | GCCACCG77C CAAAGCAC7G GGCG777T7C AGATAC777C ATGAGAAATG | 14700 |
| TTG7CAACAC | CGCAAG7TTG CAG7ACACAG TCTGAAAGA7 A7TCT7G7AT ATG7AGATG7 | 1 Λ“7£Λ X 3 i W W |
| CTGTAGATGC | CCTGAAGG7G TG7AGACTT7 AGACACCCAG AAGGTGTG7A GA7G7CTG7A | 14820 |
| GACACC77C7 | ATGTGTGTAG ATGTCTGTAG ACGCCCTGCA GGTGTGTAGA TATATCTAGA | 14880 |
| GTG7AIGATA CAGGCTAAAA AGACATTTGT GGTGGACACT AGTTGATTAT | 14940 | |
| TTAGGACTAT | GAGATGGGAA AGGAAGNAGC AACCAGCAGT GAAAGGCATG TGGTGGGTGG | 15000 |
| GGGGTTGGCA | TTGCAGTGGG GTCCTCNTGA NGCAGGTGAC ACCCACTATA GGGCTGCCCT | 15060 |
| TGGNATGGAC | GCTTTGTNGA AGCTGTTTGA TTTCACCACA CCAAGCCTGG AGGCACGGAC | 15120 |
PL 194 248 B1
| A77CCAGGAT | GG7GAGGAG7 | CTGCAAAGGA | \Α2ΛμΛΧ X | GGAGGTGCAA | TATCCCTAGA | 15180 |
| GTACGAGAGA | TGAGATAGGA | GAGCTGTATA | AATAGCACTA | CCAGCCGGAT | GC GGT GGCT C | 15240 |
| ACGCCTGTCA | TCCCAGCACT | 1 iAŁjNSTiijtA.. | GAGGCAGGCG | GA7CACCTGA | GG7CAGGAG7 | 15300 |
| 7CCAGAACAG | CCTGGCCAAC | ACAA7GAAAC | CCCATCTTTA | CTAAAAATAC | AAGAT7AGC7 | 15360 |
| GGGCACGGTG | TCTCACGCCT | GTCA7CCC7G | CAL x ± . GGGn | GGT C GAGG7 G | CGCAGATCA7 | 15420 |
| GAGGTCAG77 | TGGCCAACGC | GGCGAAACCC | CGTCTCTACT | AAAAATACAA | AAAAGTAGCC | 15480 |
| GGGCG7GG7G | GT GGGCAC C T | GTAG7CCCAG | C7AC7AGGGA | GGCTGAGGCA | GGAGAATCGC | 15540 |
| 77GAACCCGG | ATGCGvsACAT | TGCAG7GAGC | Ukxrtkzr*xU | 15577 |
(2) Informacja o SEQ. ID NO: 9:
(i) Charakterystyka sekwencji:
(A) Długość: 753 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = ET92 gene segment (xi) Opis sekwencji: SEQ. ID NO: 9:
| ^Z· z· Z·· *V1 r™· ΛΖ | C CT77GAGAC | x x · x | CTAAACTTCC AAA7G7CAGC | 430 | |
| 7GACAGCAAG | GGACATCTCA | 7*^ GGGCAm C | >· mmmmm m «m \J^L?X X X. - <JX | CAGCAGjC c c | 540 |
| TAGGAA | CAGAG'jvj'j%x«j | <r»m,z- — X X \j\». | CACTTCCACC AGCCC7GGG7 | TGAAGGGGAG | 600 |
| C Gi-.GwAGAC | m m | TAAACCCC7G | AGC7TGGTCA GAGAGGC7GA | A7 G7 CTAAAA | 660 |
| TGAGGAAGAA | AAGGTTTTTC | ACC7GGAAAC | GCTTGAGGGC TGAG7CTTCT | GCCC7TCTGA | 720 |
| CTCCCCCAGC | AAATACAGAC | AGG7CACCAA | CTA | 753 |
(2) Informacja o SEQ. ID NO: 10:
(i) Charakterystyka sekwencji:
(A) Długość: 1890 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa
PL 194 248 B1 (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „SHOXa” (ix) Cechy:
(A) Nazwa/klucz: CDS (B) Położenie: 91 ... 968 (xi) Opis sekwencji: SEQ. ID NO: 10:
PL 194 248 B1
| AAC | ATG | GGA | GCC | TTA | CGG | ATG | CCT | TTC | CAA | CAG | GTC CAG | GCT | CAG | CTG | 738 |
| Asn | Met | Gly | Ala | Leu | Arg | Met | Pro | Phe | Gin | Gin | Val Gin | Ala | Gin | Leu | |
| 205 | 210 | 215 | |||||||||||||
| CAG | CTG | GAA | GGC | GTG | GCC | CAC | G— | CAC | CCG | CAC | CTG CAC | CCG | CAC | CTG | 786 |
| Gin | Leu | Glu | Gly | Val | Ala | Hi 3 | Al 3. | His | Pro | His | Leu ΗΪ3 | Pro | His | Leu |
220
223
220
GCG GCG CAC GCG CCC TAC CTG ATG TTC CCC CCG CCG CCC TTC GGG CTG
834
| Ala | Ala | His 225 | Ala | Pro | Tyr | Leu | Met 240 | Phe | Pro | Pro | Pro | Pro 245 | Phe | Gly | Leu | |
| CCC | ATC | GCG | TCG | CTG | GCC | GAG | TCC | GC— | TCG | <A_C | GCC | GCC | GTG | GTC | GCC | 882 |
| Pro | Ile | Ala | Ser | Leu | Ala | Glu | Ser | Ala | Ser | Ala | Ala | Ala | Val | Val | Ala |
260
250
255
| GCC | GC— | GCC | AAA | AGC | AAC | AGC | AAG | AAT TCC | AGC | ATC | GCC | GAC | CTC- | CG\3 | 930 |
| Ala | Ala | Ala | LVS | Ser | Asn | Ser | Lys | Asn Ser | Ser | Ile | Ala | Asp | Leu | Arg | |
| 265 | 270 | 275 | TG . | 280 | |||||||||||
| CTC | AAC- | Gcg | Cćrur | AAG | CAC | ten—<7 | ίσΑΙτ | GCC CTG | CxC | ri'-—i- m-—ur. | 978 | ||||
| Leu | Lvs | Ala | Arg | Lvs | KI 3 | Ala | Glu | Ala Leu | Gly | Leu | |||||
| 285 | 290 |
ΓΆGCC C C T T G CGCGC—CGGA CTCC—C—<r——.C—— C<j\-λ'— — (A~-<j
CACTCAACCC CGCCTGGAGC TC—TTC—GCG GCCAC—GTGC TC—GG\jCACC C—G\j\jAG\-TC
CTGCAAGAGG CCTGAGGAGG GAG\j*-TC——— G\s.-.^wu.C-A C-.o\—rt.Ck=AC—— j-.G-—.-.Gr*.C——
TCGCGGAGAT G\jTGCAGAAG —C.-.^— C—c\rc\,^TCCCAAGGCTGC C—GTGCGTCC TGGGA.CCCTG GAGAAGG^TA AACCCCCGCC TGGCTGCGTC
TTCCTCTGCT ATACCCTATG CATGCGGTTA ACTACACACG TTTGGAAGAT CCTTAGAGTC
TATTGAAACT GCAAAGATCC CGGAGCTGGT CTCCGATGAA AATGCCATTT CTTCGTTGCC ±038
1098 '1 53
1218
1278
1338
1398 mmm*«^ · mm mmm^ mmmmmm ' mmmrn^ '—Ti— - - ΑΛΧ’-Μ.ΜΛνΛΧΛ „TT TG\iAAAG\r\srt mm—
TTCAGACGCA AAA.GAC7TGC ATAAGAGACG Ł3CGCGTGGT
AAAAAAAIA.G CA (2) Informacja o SEQ. ID NO: 11:
(i) Charakterystyka sekwencji:
(A) Długość: 292 aminokwasów (B) Typ: aminokwas (D) Topologia: liniowa ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEQ. ID NO: 11:
| GAGGCTGCGG | 1 Z T | 1458 |
| GGGCTCTCCT | CC3.CCGCTCC | 1518 |
| GCC GAGGCT G | “ GGA C GT G- * | ±578 |
| CCCACGTTGG | GACTCCCACG | 1638 |
| * mmmmmmm^ m | __________ | 1698 |
| ΛΑ7Α <7- i X | X ΛΛΛχ - 17 | |
| m «τ' m m m ηη {·» «—«w m | mmrnm^ m^ mm* x ^7- -<-J—AGisr. | 1758 |
| mmm·» mmmmm X νΛΛΚΙίνΐ Cl | m·* m^» mmm^ m* U.-ix--.U x isri-.-i | 1818 |
| mr mu m·» mm | 1878 1890 | |
| ΧΛ-ΛΛΤνχ.-— - | A—AW-L ΧΛΛΛ |
PL 194 248 B1
| Met Glu 1 | Glu Leu | Thr 5 | Aia Phe | Val | Ser | Lys Ser 10 | Phe | Asp | Gin Lys Ser 15 |
| Lys Aro | Gly Asn ‘ 20 | Giy | Gly Gly | Gly | Gly 25 | Gly Gly | Gly | Lys | Lvs Aso Ser 30 ' |
| Ile Thr | Tyr Arg 35 | Giu | Yal Leu | Glu 40 | Ser | Gly Leu | Ala | Aro 45 | Ser Arg Giu |
| Leu Gly 50 | Thr Ser | Asp | Ser Ser 55 | Leu | Gin | Asp Ile | Thr 60 | Glu | Gly Gly Gly |
| His Cys zrr OJ | Pro Val | His | Leu Phe t U | Lys | Asp | His Val 7 | Asp | Asn | Asp Lys Giu A A □ U |
| Lys Leu | Lys Glu | Phe 85 | Gly Thr | Ala | Arg | Val Ala 90 | Glu | Gly | Ile Tyr Giu 95 |
| Cys Lys | Glu Lvs 100 | Arg | Glu Asp | Val | Lvs 105 | Ser Glu | Asp | Glu | Aso Glv Gin 110 ’ |
| Thr Lys | Leu Lvs 115 ‘ | Gin | Arg Arg | Ser 120 | Arg | Thr Am | Phe | Thr 125 | Leu Glu Gin |
| Leu Asn 130 | Glu Leu | Glu | Arg Leu 135 | Phe | Asp | Glu Thr | Hus 140 | Ty-»· | Pro Aro ATa |
| Phe o 145 | Glu | Leu Ser 150 | Gin | A . — | Leu Gly 155 | Leu | Ser | ' 160 | |
| Val Gin | Vai Cr? | Phe 165 | Gin Am | Aro | ATa Lvs 170 ~ | Cys | Arg | Lys Gin Glu | |
| Asn Gin | Meo H' s 13 0 | Lys | Gly Vai | lie | Leu 185 | Giy Thr | Ala | Asn | His Leu Am 190 ' |
| ATa Cys | Arg Yai | * i | Pro Tyr | Yai 200 | Am | Mer Gly | Ala | Leu 205 | Aro Mer Pro |
| Phe Gin 210 | Gin Yai | Gin | AT a Gin 215 | Leu | Gin | Leu Glu | Giv 220 | Yai | Ara .~rs Ara |
| « W 225 | His Leu | H' 2 | p »· Z' ’-d 230 | Leu | 225 | ATa | Pro | Tyr Leu Mer 2 40 | |
| Phe Pro | p ’Ό **O | Pro 245 | Phe Gly | Leu | Pro | Ile ATa 250 | Ser | Leu | ATa Glu Ser 255 |
| Ala Ser | Ala Ala 260 | Aia | Val Vai | Ala | AT a 265 | ATa Ala | Lys | Ser | Am Ser Lvs 270 “ |
| Asn Ser | Ser lie | Aia | . Am Leu | £ ł-Z» | Leu | . Lys Ala | Arg | Lys | His ATa Giu |
275 250 255
Ala Leu Giv Leu 290 ‘ (2) Informacja o SEQ. ID NO: 12:
(i) Charakterystyka sekwencji:
(A) Długość: 1354 pary zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza
PL 194 248 B1 (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „SHOXb” (ix) Cechy:
(A) Nazwa/klucz: CDS (B) Położenie: 91 ... 768 (xi) Opis sekwencji: SEQ. ID NO: 12:
GTGAiTCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC 60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA 114
Met Glu Glu Leu Thr Ala Phe Val
295 300
| TC— | AAG | TCT TTT | GAC | CAG | AAA AGC | AAG | GAC | GGT | AAC | GGC | GGA | G\xA | 162 | |
| Ser | Lys | Ser Phe | Asp | Gin | Lys Ser | Lys | Asp | Giv | Asn | Gly | Gly | C-iy | Gly | |
| 305 | 310 | 215 | ||||||||||||
| G^r— | GGA GGT | AAG | AA.G | GAT TCC | ATT | ACG | TAC | CGvx | GAA | ’<Ji - | - G | GAG | 210 | |
| >* > | i— ’ . > I—·’ » » | — reł | Λ e-0 S A | y a | Th.” | Tur | A | ni 11 | ΧΓ-ϋΤ | - | z— | |||
| uj—ν νζΐγ | jj V 15 | — | x 2 - | UJ — — | « ca— | i.ICU | UJ— | |||||||
| ' 320 | 325 | 320 |
AGC GGA CTG GCG CGC TCC CS.· GAG CTG Gxj\j ACG TCG GAT TCC AGC CTC 258
Ser Glv Leu Ala Arg Ser Aso Glu Leu Gly Thr Ser Asp Ser Ser Leu * 235 340 345
CAG GAC A.TC .ACG GAG GxrC Gxr. CAC TG\- CCG GTG CAC TTG TTC .AAG 20 6
Gin Aso Ile Thr Glu Gly Gly Gly Kra Cys Pro Val Kia Leu Phe Lvs
350 355 360
GA.C GAC GTA. GA.C AAT GA.C AA.G GA.G AAA CTG AAA GAA TTC GvrC A.CC GCG 254
Aso Kra Vai Asp Asn Asp Lys Glu Lys Leu Lys Glu Phe Gly Thr Aha
| 365 | 270 | 375 | 280 | |||
| A.GA | kJXUj ćj\—ζχπΛ Λ·. | TA.T G.-A. TGC .AAA GAG | AAG | CGC | GA.G GAC GT G | 402 |
| Vai A_a Glu Glv Ile 38Ś | Tyr Glu Cys Lys Glu 390 | Lys | Arg | Glu Asp Var | ||
| TCG GA.C- AAC GA.G GAC | GGC- GAG ACC AAG CTC- | AAA | CAG | A.G\j CGC A.GC | 450 | |
| ’ 7* | Ser Glu Asn Glu Asp 400 | Giy Gin Thr Lys Leu ’ 405 | Lys | Gin | Aso Aso Ser 41Ó | |
| CGC | ACC AAC TTC A.CG CTG | GA.G GAG CTG AAC GA.G | CTC | GAG | CGA. CTC TTC | 498 |
| -“—5 | Thr Asn Phe Thr Leu 412 | Glu Gin Leu Asn Glu 420 | Leu | Glu 425 | Aso Leu Phe | |
| GAC | GAG A.CC GAT TAC CCC | GAC C-CC TTC ATG CGC | GAG | GAG | CTC A.GC CAG | 546 |
| Asp | Glu Thr Kra Tvr Pro 43 C ' | Asp Aha Phe Met Asg 425 | Glu 440 | Glu | Leu Ser Gin | |
| CGC | CTG GGG CTC TCC GA.G | GCG CGC GTG CAG GTT | TGG | TTC | CAG AAC CGG | 594 |
| -45 | Leu Giv Leu Ser Glu * 450 | Ala Arg Val Gin Vai 455 | Trp | Phe | Gin Asn Asg 460 | |
| AGA | GCC AAG TGC CGC AAA | CAA GAG AAT CAG ATG | CAT | AAA | GGC GTC ATC | 642 |
| Arg | Aha Lys Cys Arg Lys 465 | Gin Glu Asn Gin Met 470 | His | Lys | Gly Vai Ile 475 | |
| TTG | GGC ACA GCC AAC CAC | CTA GAC GCC TGC CGA | GTG | GCA | CCC TAC GTC | 690 |
| Leu | Glv Thr Ala Asn His 480 | Leu Asp Aha Cys Arg 485 | Val | Ala | Pro Tvr Val 490 * | |
| AAC | ATG GGA GCC TTA CGG | ATG CCT TTC CAA CAG | ATG | GAG | TTT TGC TCT | 738 |
| Asn | Met Gly Aha Leu Arg 495 | Met Pro Phe Gin Gin 500 . | Met | Glu 505 | Phe Cys Ser | |
| TGT Cys | CGC CGA GGC TGG AGT Arg Pro Gly Trp Ser | ATA ATG GCA TGA TCTCGACTCA Ile Met Aha * | CTGCAACCTC | 788 |
PL 194 248 B1
510
515
| CGCCTCCCGA | GTTCAAGCGA | TTCTCCTGGC | TCAGCCTCCC | GAGTAGCTGG | GAITACAGGT | 843 |
| GCCCACCACC | ATGTCAAGAT | AATGTTTGTA | TTTTCAGTAG | AGAT GGGGTT | TGACCATGTT | 908 |
| GGCCAGGCTG | GTCTCGAACT | CCTGACC7CA | GGTGAT CuAC | CCGCGTTAGC | CTCCGAAAGT | 968 |
| GCTGGGATGA. | CAGGC GT GAG | CCCCTGCGCC | CGGCCTTTGT | AACTTTATTT | TTAAITTTTT | 1028 |
| ttttttttta | AGAAAGACAG | AGTCTTGCTC | TGTCACCCAG | GCTGGAGCAC | ACTGGTGGGA | 1083 |
| TCATAGCTCA | CTGCAGCCTC | AAACTCCTGG | GCTCAAGCAA | TCCTCCCACC | TCAGCCTCCT | 1148 |
| GAGTAGCT GG | GACTACAGGC | ACCCACCACG | ACACCCAGCT | AATTTTTTTG | AITTTTACTA | 1208 |
| GAGACGGGAT | CTTGCTTTGC | T GCT GAGG—T | GGTCTTGAGG | TCCTGAGCTC | CAAAGATCCT | 1268 |
| CTCACCTCCA | CCTCCCAAAG | T GT TAGAAT T | ACAAGCATGA | ACGACTGCCG | GTGGTCTCGA | 1228 |
| AAAAAAGoAC | 7 G77AC G7 G\j | AAAAAA | 1354 |
(2) Informacja o SEQ. ID NO: 13:
(i) Charakterystyka sekwencji:
(A) Długość: 226 aminokwasów (B) Typ: aminokwas (D) Topologia: liniowa (ii) Typ cząsteczki: białko (xi) Opis sekwencji: SEQ. ID NO: 13:
| Mer | Glu | Glu | Leu | Thr AA a | PKe | Val | Ser Lvs i o | Ser | Phe | Asp | Gir | Lys 15 | Ser |
| Tj ye | Asp | Gly | Λ2Γ- | Gly Gly | Gly | Gly | Glv GIv | Gly | Gly | Lys | 1',’Ξ | Asp | Ser |
| 20 | 25 ’ | 20 | |||||||||||
| T ? Ω | ψν. | Tyr | Aoc | Glu Val | Leu | Glu | Ser Gly | Leu | Ala | λτ g | c e ” | Arg | Glu |
| 25 | 40 | 45 | |||||||||||
| Leu | Glv | Ser | Asp Ser | Ser | Leu | Gir. Asp | * s | Thr | Glu | c-iy | Gly | Gly | |
| 50 | 60 | ||||||||||||
| Ki 2 | Cys | Pro | Vai | His Leu | Płie | Lys | Asp His | Val | r-.Sp | Asn | Asp | Lys | Glu |
| 65 | 70 | 75 | 80 | ||||||||||
| Lys | Leu | Lys | Glu | Phe Glv | Thr | Ala | Aro Val | Ale. | Glu | Gly | T ’ o | Tyr | Glu |
| 85 * | 90 | 95 | |||||||||||
| Cys | Lys | Glu | LV3 | Arg Glu | Asp | Val | Lys Ser | Glu | Asp | Glu | Asp | Gly | Gin |
105
110
100
| Thr | Lys | Leu | Lys | Gin | Arg | Arg | Ser | Arg | Thr | Asn | Phe | Thr | Leu | Glu | Gin |
| 115 | 120 | 125 | |||||||||||||
| Leu | Asn | Glu | Leu | Glu | Arg | Leu | Phe | Asp | Glu | Thr | His | Tyr | Pro | Asp | Ala |
| 130 | 135 | 140 | |||||||||||||
| Phe | Ket | Arg | Glu | Glu | Leu | Ser | Gin | Arg | Leu | Gly | Leu | Ser | Glu | Ala | Arg |
| 145 | 150 | 155 | 160 | ||||||||||||
| Val | Gin | Val | Trp | Phe | Gin | Asn | Arg | Arg | Ala | Lys | Cys | Arg | Lys | Gin | Glu |
| 165 | 170 | 175 | |||||||||||||
| Asn | Gin | Met | His | Lys | Gly | Val | Ile | Leu | Gly | Thr | Ala | Asn | His | Leu | Asp |
| 180 | 185 | 190 | ||||||||||
| Aro | Val | Ala | Pro | Tyr | Val | Asn | Met | Gly | Ala | Leu | Arg | Met Pro |
| 195 | 200 | 205 | ||||||||||
| Gin | Met | Glu | Phe | Cys | Ser | Cys | Arg | Pro | Gly | Trp | Ser | Ile Met |
Ala
225
21'
220
210
PL 194 248 B1 (2) Informacja o SEQ. ID NO: 14:
(i) Charakterystyka sekwencji:
(A) Długość: 32367 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „COSMID: LLNOYCO3'M'34F5” (xi) Opis sekwencji: SEQ. ID NO: 14:
| i - - 'w ·^ - ^-xkj 1·*- m « ki* | T CTCT CT CTT | 60 |
| mmmmmmmmmm mmmm·-·* mmmm | ||
| x yx — — | ||
| z-* i · - w | ACACACCCCA | ISO |
| GTGCCATCTC ACACAAGTTC | ACAGCTCAGC | 240 |
| GaGwAGaTG cgccgtgggg | TTACGGGAGG | 300 |
| mmm*mmmmm* m* *. mmmmmmm X x -Λ- - - y—Λ 'y.-y.yy χ y — * „ | m m m* m m* * — m yy—y-y—λα— — | 360 |
| AC yAz-.T TT CA GyT C GC GAT G | 420 | |
| G\- y.-.’y—-.y—y | ||
| Gy-yGtsf-.yyy AGCGAGCAGG | AGCACCCCAC | 480 |
| CACCCyyTAA A.CACCCCAGA | C GC CAGyyT G | 540 |
| GCCGGGGTCC GC CGGGATCT | GGCGCGGGCG | 600 |
| m* * m·* * m* m Gw.Gft/UA. | AGATCTTTAC | GAAC C GyAT C | TCCCGGGGAC | CTGyGCTTCT | x TC«G—yyy— | 660 |
| GC7GGAGACC | CGGGAGGCGy | CCCCGGGGAT | CCTCGGCCTC | CGCCGCCGCC | mmmmmmm** m y— χ. . ———λλ w | 720 |
| —mmmmmmmmm ΧΆ—y— y x <. | mmmmmmmmmm x iyyy | GACACCCGGC | mmmmmmmmmm XX- *Xi | CACTTTCGGG | GATTCTCCAG | 780 |
| CCGCGTTCCA | TCTCACCAAC | TCTCCATCCA | AGGGC 'GC GC C | GCCACCAACT | TGGAGCTCAT | 840 |
| CTTCTCCCAA | GATCGTGCGT | CCCCGGGGCG | CCCGGGTCCC | CCCCCTCGCC | ATCTCAACCC | 900 |
| CGGCGCGACC | CGGGCGCTTC | CTGGAAAGAT | mm·* mmmmmmm | GGCTCTGCGC | TCCTCCCGGG | 960 |
| AGCGAGGGCG | GCCGGACGAC | TGGGACCCTC | CTCTCTCCAG | CCGTGAACTC | CTTGTCTCTC | 1020 |
| TGTCTCTCTC | TGCAGGAAAA | CTGGAGTTTG | CTTTTCCTCC | GGCCACGGAG | AGAACGCGGG | 1080 |
| TAACCTGTGT | GGGGGGCTCG | GGC GC CT GCG | CCCCCCTCCT | GCGCGCGCGC | TCTCCCTTCC | 1140 |
| AAAAATGGGA | TCTTCCCCCC | TTCGCACCAA | GGTGTACGGA | CGCCAAACAG | TGATGAAATG | 1200 |
PL 194 248 B1
| AGAAGAAAGC | CAATTGCCGG | C CT AjGGj^jT | CAGCG7CTC7 | GCCTGCGTCC | 1260 | |
| GCCGCG^AGC | CCCGAGACCA | GTAATTGCAC | CAGACAGGCA | G^GCATGv3Mvł | G\jCTGG%jCGA | 1220 |
| GCT C | fłłnł x mτ> ί Λ-ΛίΚ1.1Λν i | mrr-iriz-z-. irm.kif-x _ χ ws.-. | ATGGAAAGCC | GTAAATAACA | G^jCTGwTGn | 1330 |
| TCCACCCGCS | CGCACGGGCC | GTCCTCCCCG | CCCCGCCACA | CGCGCGCAIC | CACTAGCCCT | 1440 |
| GGCT GCT CGC | CAGCCCCG^w | CCCAG\<CATG | GAAGrtGCTCA | ULnjC x x x x cj. | AT C CAAGT CT | 1500 |
| TTTGACCAGA | AAAGCAAGGA | CCGTAACCGC | GGAGGCGjAG | G-GGCGjAjGj | TArJGAAGGAC | 1560 |
| TCCATTACCT | ACCGGGAAGT | TTTGGAGAGC | GGACT GGC’C\z | (ATC^C GvajA | GCTGj^tjACG | 1620 |
| TCGGATTCCA | GCCTCCAGjA | CAT CAC CvA.C | Gtj’** ·. | ACTGCCCGGT | /» “·* l^»R« w » izi HR -— x x Cx . '— | 1680 |
| AAGGAC _AC G | TAGnCAATGA | CAAGvirtGrtArt | CTGAAAGAAT | T C GGCACC GC | GAGAGT G\rCA | 1740 |
1800
1360
1920 ι°εο
2040
2100
2160
2220
22S0
40
240C
4 60
2220
2220
2640
TT GAAC ST CC ACCC TTC ATC T7GGCGAJAG C7G77GGG7C CA7AAAAACC AC773CGTGA 2700
GC GGAAjC Ar CCGGGATCTG GATGGGGCGC GA-CCkjCCCTT GCCCAACCTG GT GGCT TC CC 2 / 60
| G-.AA— G.- - , 0 - | TAAGCCAAGG | TTGTCAGAGC | G^AG^-CGwx x | G x G*« Gv- <- | CCC-C-GGAC-CC | 2820 |
| CCCCTC7GGC | CCTTCCTCCT | GAGACC7CAG | T GGTGGGT CG | Ł lJVTX L? | GzAAICGGGj | 2380 |
| AGTAAGAGGC | 7CAGAGAGAG | GGGC7GGCCC | CGGGGACCTC | TGTGCACACA | CGACAAC7C-G | 2540 |
| GCG<z—-*— ACA | TCTTAAGAAT | AAAATGGGC7 | Gvj\-T GT G x C G | GGGCACAGCT | GjAGACGGCT | 3000 |
| ATGGACGCCT | GT^- | CATTACAAAG | AC GCAGAGAA | TCTAGCCTCG | GC7T77GC7G | 3060 |
| ATTC5CAGAG | TT GAGGT GCG | AGGGTGAA7G | CCCCAAAGGT | AATTCTTCCT | AAGAC2C7GG | 3120 |
| GvrCCAC—- CA. | TCTCCGGCCC | CCTGCAT7TG | Gvt\jT GT Gj^\G | T G\jT2 CC GGG | AAA7AGCCCT | 3130 |
TGTATTCGTA GGAGGCACCA CCCAGCTTCC CAAGGCCCTG ACTTTGTCGA AGCAGAAAGC 3240
PL 194 248 B1
| TGTGGCTACG | GT-TACAAAG | CAG x CCC C G\j | mmmmmm·· mmm Xx ix ΧΧΛ-kL-—J· | T CTAAGA,cj^r— | AG\jAG— ccag | 32GC |
| CCTGCCTTTG | ALA-UtT LłALeAaj | IjAJj X x UL· x’-'w | CTACACACZG | CT GCGjG—Al. | C X* xjvrk-xiL· 1' Lr x | 3360 |
| AATTCACACA | CAGAGAG7TG | GCCTTCCTGG | ACGCAAGGCT | GGGAGCCGCT | TGAGGGCCTG | 3420 |
| CGTGTAATTT | AAGAGGGTTC | G—AG—G— CCG | GCGGCCGCTT | CTGTGGGGTT | GCTTTTTGGT | 3480 |
| TGTCCTTCGC | AGACACCGTT | TTGCTCCTCT | GAACTCTCTC | TTCTCCCCCT | GGC C GT GGAC | 3340 |
| CCGGGAGAGC | AAAGTGTCCT | CCAGACCTTT | TGAAAGTGAG | AGGAAAATAA | AGAC CAGurC C | 3600 |
| AAAGACCCAG | GGCCACAGusA | GA.G^j^GaCAG | AGAGTCCCCG | *^£»*^m»«im m m | CCCTTGGCTC- | 2 650 |
| GGTGCAGAAA | J~ mmm^rnmrnm | C CAG\tACT gc | CACCCAGj\,T | •l mm* mmmm mm ACxAi X .ΛΧ X | CATCAGAT C C | 2720 |
AAG7CA—AATC Αγ-AGv>j^srw^ AGTCTGmG\jx CAC—£« 1 * m —.
CTGGAGTC
ΤΠ,Β1ι.>-Ί * m* r**·* x - kJWKrtAA-Λ uta
7GTC—CC G—-«juiG-—TG GuxrtG'—Cx
R -b mmmmm “mm — «νΐ.ΧΙ'ΛχίΛ ALa-——xvj—.jutu
TGTTTGAGGA CTTTGAAGAC ?CA ATTCCTGGGG TTCAGACT
GAGAAA7 GAA. G*—--vGv — m^.mm^n^, mm·* mmm* mmm m mm·» . —Τ.1ί\5^+-Η-Λ, L- XW“. X X —.-.X. - - <JVTxJUC aa:
wrw x '-j x
ZAiGssAGsjTGA aacags
CACG
T7GGAG7AAG ——A.GC· cc:
SW. -JW
-* mmmm m ·*·**..»» m -»*.** ·-*“*/· n m* * m* m m mm mmm* mm* mm m * mm mm mmmmm mmmm* m * m* .“.- wCj. juńAl; Λ^·ν«»Λ\ίν\?ι vv*AVW«xi x — — — — x _— — xuxrxisrt.L-rt—
3750
3540
Ξ SCO
2960
4020
4050
4140
4200
CCTGGA'
AGCTCCC
GT TG~.-.GCGj CCTTGCC2
| GACTGTTTCC | AGACT.AA-.CT | 7CCAAACG7C | AG— ——* CAC | C — X ΛΓ.1— | 4 2 5C | |
| T CATTA.GGGC | m m m m mm | TC7CATCTGT | Gx.TCAG\—ΑΆτ | CCCGAGACAG | G.AACAGAGGG | 4320 |
| G^—xj x T jjAGt·. | TujCCACT. -C | ACCAGCCCTG | GGTTGAAGGG | GAGCGAGGGA | GACACC7TTT | 4350 |
| ACCCAAACCC | CTGAGCTTGG | T CAtr-. GAG-r— | T GAAT GT CTG. | AAAT GAGwA. | GAAAAGGT TT | 4440 |
| TTCACCTGGA | AACGCCCGAG | GGCTGAGTCT | m mm m m mmmmm .X. — | TGACTCCCCC | AGCAAATACA | 4200 |
| GA.CA.GGT CAC | CAACTACTGG | AGACGAGAAA | mmmmm* mmmm l?X Λ,'-Λ* XX- | CGGCACACCC | T GGC GGGGT A | 4260 |
| GGTGCCCGAC | CGCGTGC GAA | AA-.GTGGGAA | m — -X m * m * pnmm | C T G·—sj·—AC <rC | GGTTCAGCCC | 4520 |
kG AC
-Cl G.?7.
T GAG.-AACAG
C—AAjC
GCCTC
ΓΑ GGC
4630
4740 .'-j.——.G*—_
CCCCGTGTCC
TCTTTCCCTT
AAAGGTTAGGGGCCAAGAAA
TCGGCTTTTG
GCCCCCTTTC
CCTCAGCCCT
ITCCTA GCTCCGCCAG ATCGCGGAGG GACCCCCAGC CCTCO
| G\j\jAT AG.. GT | CTCTCCGTAG | GCCTAGAATC | TGCAACCCGC | mmmmmmmmmm X»X»x> χ χ.^ * | 4300 |
| i. . CCCio\?Kn— J | TCCCGCCGGG | GATCCCACAG | TTGGCAGCTC | TTCCTCAAAT | 4860 |
| AAAAATAGGA | TTTGACACCC | CACTCTCCTT | ΑΑΑΑΑΑΑΑΑΑ | AATAAGAAAA | 4920 |
| TTATGTCAAC | AGAGGT GAAG | TGGATAATTG | AGGAAACGAT | TCTGAGATGA | 4980 |
| ACAACGCTCC- | TGCAAAGCCC | AGGTTTTTGG | GAAAGCAGCG | AGTAICCTCC | 5040 |
| CSTTATGGAC | CCCACGCAGT | TTTTGCGTCA | AAGCGCAITG | GTTTTCGAGG | 5100 |
| CACCGCGGGA | TGCACGAAGG | GGTTCGCCAC | GTTGCGCAAA | ACCTCCCCGG | 5160 |
| GTGCCCTCCC- | CTCCCCACGC | AGGGATTTAT | GAATGCAAAG | AGAAGCGCGA | 5220 |
PL 194 248 B1
| GGAC GT GAAG | TCGGAGGACG AGGACGGGCA GACCAAGCTG AAACAGAGGC GCAGCCGCAC | 5280 |
| CAACTTCACG | CTGGAGCAGC TGAACGAGCT CGAGCGACTC TTCGACGAGA CCCATTACCC | 5240 |
| CGAC GCCTTC | ATGCGCGAGG AGCTCAGCCA GCGCCTGGGG CTCTCCGAGG CGCGCGTGCA | 5400 |
| GGTAGGAACC | CGGGCGCGGG ggcggggggc coggagccat cgcctggtcc tcgggagcgc | 5460 |
ACAGCACGCG TACAGCCACC TGCGCCCGGG CCGCCGCCGT CCCCTTCCCG GAGCGCGGGG 5520
AGGTTGGGTG AGGGACGGGC TGGGGTTCCT GGACTTTTGG AGACGCCTGA GGCCTGTAGG 5580
| ATGGGTTCAT | Xur<.Lrx χ χΤχ 1 | TTTCACCAAC | AGCAAACAAA | TAIATA7ACA | TAIAIATTAT | 5640 |
| ACAAATAACA | AATAAATATA | TATGTTATAC | AGAT GGGTAT | ΓΠΦΦΓΠ7Ι m-71 φ> Λ- -'αΧΛ*ΛΐΛ | TTA7AGA2AT | 5700 |
| jji m z»» i iii i z-1 ίι^·*· | T T GtT Gv-AAA | Gr\CACi. x | GAACCCATAT | ATTGGC7CC7 | GACTGCCTTC | 5760 |
| GGTT CC CCT G | Λ» ΛΧ fTl*T».<7 m*łl^ 7^ ΤΤΓΤ.Χ X TT X -Λ | TAGGGGCAAC | ACATGCAAAC | AAAACTTTCC | CTGGATTATA | 5820 |
| CTTAGGAGAC | GAAGCTACAG | Αινί-^i x x Trt | TCCAGAGTG7 | 7TTACAAGA7 | ^iTi mm m τ^φφ,ηι^ | 5880 |
| .Ą/WWLT./t, T | TGTCTTTTGr | CCCCTGATTC | CCCTCCGTCT | TCCCGTGTGG | C_G_A7TGAA | 5940 |
| •7 71 — m ΛΛ'αν x . i 'x. ·_ x | TAGGAT GAAA | GtAGAGtttT | GTCCTCTGTC | CCTAGtTGGA | GAGAAACAGG | 6000 |
| GTCT7CTCTT | TCCTCCGTTT | TTTCACCTAC | CGTTTCTATC | 7CCCTCCTCC | CCTCTCCAGC | 6060 |
| CCTGTCCTCT | GCTACAAACC | ACC C C CmC CT | CCCTCCGtCT | G x Gmju-tGs. »j | CAGtAGCAC g | 6120 |
| T T GtGCAT C T | GtAT GACA. Gvj | AGACTATTAG | CGttt\-ACGt | tttCTCCCCG | AGGAGC GC GC | 6180 |
| GrW* - | GACCAGGCAC | C 3www Gt | -wTTG | GGT GT CCGCA | 6240 |
6200
60
6420
6480
6540
6600
6650
6720
6730
6840
6900
6960
7020
7090
7140
7200
7260
PL 194 248 B1
CCACACTATT
ATTGGTTC
AAGCTGC cc:
CAC
CATTCAAACA
TGGAGAGwT
GGCTCCTGAI
GTTACGATTA
TACAGCCCAG
GGCGTCTGTG
ACCCCTCTGG
TCGCTAAAGG
CAATATATCC
AAAACAAACA .GTAA
| CAACTTTTCC | ATCGATGTTG | C7TAGGAGAT | GAGGATACAG | ATGCGTTTGA | 7320 |
| TTTACAAGCT | CTTTCATTTA | AATAIAIAIA | TATATAIATA | 7380 | |
| TCTCTTCCGT | CTTCCCATGT | GGCTGCATTT | TAAAAGGCTT | CCCTAAGATC | 7440 |
| AATCAACCCT | CCCCAGGCAT | CTTTACCGAG | GGC x GT GGT C | CCCAAAGCGA | 7500 |
| GAGGGAGAGA | mmmmmmmmmm | ACTTGGAGGA | AGGACTGTGT | CCCTCCTTAG | 7560 |
| GCCTCAGTGA | GGGAAGGAAG | CTGCATCAGA | CAGGGGTTTC | CTCGCTGTCC | 7620 |
| CAGAAGATGG | ATTGGGCTGC | CCCGTATAAA | TTAATGAAAA | GATTAAAGTT | 7680 |
| GGACATCGAG | TTTATGTGTC | ATCTCCTGGT | GTCTGTGTGC | CTGGwTCTG | 7740 |
| CAG- C C - 7 GA | TGTACTGTTT | CTATAAAAAT | AAATTACTTG | TAATTTAATT | 7300 |
| TCTTTCTGTA | GTCTATTACC | GACGAGAGCA | CGTTAGTTCA | G_±GCGGAAA | 7360 |
| GGGT GT GT GC | GuirG—C uiriG | AAC 'G— — C x -rA | AAT.-AAGACA | AA* C ij^rjyafkC | 7920 |
| m*·** ipł^m» iimii m x -Λ- u—nx — G | CAG»jwT C | A.T GAAAAT T T | AAC GnC GjTA | AA7AATAATA | 7930 |
| TGGGAACGCA | ATA-AA.GAC-. | TAATT CT CCA | * C -r——śj4— »j*wj-ur | GGGAAAGGAT | 8040 |
| . A-G\jC »xAGT GC | GCTTTGAGGG | m m Z- -1 m * * -1 *1 *1 <J i Λ_ | TOATTAGTT | CCAACACC-CA | 8100 |
TGtłGvj\j\=ACG G«j\jACjAG\-3. G^jAC-.GAAA aag?aac:
G mmmmmm*, mm·** mmmmm··*· mm*. m *, mmmmm—,,— mm m —»m —« ~« m * m r.’—n._+r- ir_ L _'—-‘.□r λΙρ-—Gx&M..^wnC
- <ΛΛΛ4. ± .-ŁCW .GT TTCAATTTAC TGTGGAAAT7 mmmm.
C-TAAA
C-A—TGAG^-A TCT,=ATAGAA
ACCTTT TA77TTTAGC GTGGCCCTGC AAAG7CGTA7 CACCCAGCTC
CAGGCTTCT m Cis/\rtAGT TACG..G.“.C<-λ C^uri CAG^—ktGTAA
TAC.-.
i**i mm**· -Λ- U GTT TAT GGC
AGAGC
·. * λ rnmm * ’ .CTGTCTC-TA r*._
LA AAAGGAAA7C GCAZ .AtUZNn— Λ- χ GAAA
AGT GCTC T T 7
AATGAAG?
S1 so
8220 a 29 o
8340
3400
3460
5820
3580
TTG
CCGGTAGGAC
TGTTGGGTTC
CAACTGT — X j. ΛΛ —GT w A*—c-.Cł-iC — T CA C i Tr*.1— —A7A.7 T 7 Gj*—-—TAa
TCATCACTTC
ATGAGGCTTT i m m — mm r* m, mrn . χ xr<j\j χ ŁrG— x
TGGAGAGGCA
AGCTTTGGAA
GuT GT GAG^nj
TGAGGGTTTT
AGGłjTGtaCTG
| TCGT GAA.TCA | CTCCAAGACT | GATTTATTAG | CGCTTC-.CGC | AGC GGCTAAT | 0640 |
| γ *· rpm^——> m | jm·* mimum·!iminm | rnmmjmmmmmj-m | ^-mm·· mrnm*. | P~nn | |
| CCACGTTTCA | m m « m m <. mmmm x _ - | CTTTTTTGAA | AAATGCCCTT | mm* m* mmmmm Ux-A<sAx^y—x * | 8760 |
| m m—i m —m m m •Αλ* X X L 1 - | CT G^r^·—CCTG | GAGGAGACAG | GC GGAGAGT C | m * m mm m m — m x UikVjV7X A | 8820 |
| CAGTGnjCAGG | TCACCTGGAT | GGT CAGT GGA | GGT GGA.GGT C | T GAAGk?\„ ky—C | 8880 |
| ATTATTGGTG | AATTTCGATG | TCAGCACCAG | GCAGGGGCCT | TTTTGGCGGG | 8940 |
| AGGATGACTT | TGCTGGGAAA | CAGGATCAGG | TTCTCCAGGC | GCACTGCAGC | 9000 |
| CCACTTTGGA | AATGrAAAG- | CAGTTCCGAA | AGCT GGGCTG | GAAGCTTCCG | 9060 |
| AAGAGCAAGT | TCACGTTGCG | CTGTGTAGAC | TCC7GGCTGC | TCCCAAACTC | 9120 |
| CTGAGGTTCC | CTTCAIAGGG | G\-AC C GGC C C | TGGGCCATGC | ACAGTGCGTA | 9180 |
| TGjGCCGAGG | GACCCAGCAC | GTGTTTTGCC | CACAACAGCC | GGAGTGACTG | . 9240 |
PL 194 248 B1
| GTTCACTCAC | CGC CTTGGCG | GAGGACGC CT | GTTCTCTGGA | mm* * mm * mmm ~ mj~ - . - , π j-i ΧνηΛΛ'-Ίχ _ _ L.l, iLjvAj-xG | 9200 |
| GTGACTGCCT | TGTGGGTCAA | GuTGCAGmTT | TTCTGCCACA | GAAAAC C T GT TAGGAGGAAC | 9260 |
| TAAGCGACTA | AGACTGTCAG | GGAGG7GGTG | GTGGGGGAGA | GGAGGGGGTG GTGTCCAGAT | 9420 |
| TACCAGGCAT | AGGCTAAACT | GCCTGCACTC | mmm* mmm»mmm X G —- -Λ71 | CT GT CT GT GG AGGAGGGGAT | 9430 |
| TGTCAAIACT | GGGAGAGGAG | AGGAGGCTCG | TAGjAGGTGA | GAGm\j\j«j7 aattt gcat g | 9540 |
| CAAATCTTCA | CATGAGls%-CT | GTGTGAATTT | CTCCAGCCTC | CTGAGwTCC CCTGCGCTAT | 9600 |
| TGCACTCAAC | TTCTTGATAG | TTTACCCCAA | GACTCAGAAG | TCCTTAGAGG GGCAGAATGC | 9660 |
| CCCCACCACA | AAGCCTGCTA | TCCTTGGGCG | TCCTCAGGAC | CC7TGGTCA7 GAATGGGACC | 9720 |
| CTTTCATGTA | T GGGjAC c c t | T GGTAATAT G | AATGGGACGC | CTTCAGCTCC CCAGGGCTTC | 9730 |
| CGAGGAGGCC | GAGAAGGGCA | AAGACACTTC | C ŁjrtGjA.Gvj^- C | GAGAAGGlzCA aagacat ttt | 93 40 |
| CT GGGCT T Gj | TGTGTCAAGA | GC TAGAT TGG | AGAAGGGGC T | mm* mmrt^m·** * m mm mmm* OjkJiA— j, - *— - — . „ —“lGC — | 9900 |
| ATCAGCTCAC | CCTCTCCGTT | T GT Gj-'— - AAA | GT CT GAAGGT | GGAAA CT T C G GT T C T C C TA.C | 9960 |
| AG\jGT ctaca | GGA.GT T GGGG | GCCGCCCCCC | C mACACAGAA | C G- - GssAAAG TTC GACAGT C | 10020 |
| CACTTCCACT | GGCT C GGAA.C | TCACTTTTTC | ACCTTAAC-TT | CATCAGCGGT AACT-CATAGG | 10030 |
| TCTCACTTAG | G>_*—.Gwr-r—AC G | GA.TGATTTAA | CAATTTCTAC | T. C —rtC^s-C.-. G\jTG-<tGTGG | 10140 |
| CTCACACCTC | TAATCCCAGC | AC -TT G*j\m,G | CCAG\rA.Gv7 | GT '•jkt.-.T C GC Τ T GAGG7 CAGG | 10200 |
| AGTTTGAGAC | CAGC C T GGC C | AACA7GG7GA | AACCCCGTCT | * * * m * mm* * * * mm* | 10260 |
GGCAGC
- - ---.24.-C..TGTAATTC CAGCTACTCO
AGGC7GAG GCAGSAGAAT
Λ- Lr i —-
| CGCTIŁ-ACC | TGGGAC-GTGJ | ACTTTGC.-.G7 | GAGG7GAGA” |
| TC-GATGAGAC- | AC-2AAGAC7C | TGTCTC.-99A | ACAAAATAAA |
| AAAAAAGRAA | ACTTAATTTC | CA.GT T C TAGG | CGAGG7GGAG |
| AGGACTT72-G | GAGGCCCAGG | AGw χ G\jAT C | G—TT GA.Gv?T C |
| Gm -mAACAT G\r | TGAAACCCCA | TCTCTACTAA | AAATACAAAC |
GACACGAC73 CACTCZAGCC
ACAAAA?
GTTAG
A AAC-.Aotcgg-.icco iTTCG--. GA
TGCS2C7C-7A ATCGGAGCTA CTCGGGAAGC 7GAGGC7GGA GAATTGG77G AATC7GGGAG Oi GWO·.·. . j Cr*.G\j^AG^j\.sT A.GA.TA.GTGCG ACTGCAGTCC AGCCTGGACG AGAGA
AAG
ACTCCGTCTC AAAAACAAAA GAAAGCA
111 ΙΓΣΣ11 .CAAAAAACA AGAGACCAGC CTGGCCAACA
TGGTGAAACC GCGTCTCTAC TAAAATACAA AATTAGCCGG GCATGGTGGT C-GGC-.CCTGT AGTCCCAGCT ACTCGGGAGG CTGAGGCAGG AGAATGGCTT GAACCTGGGA GGTGGAGCTT GCAGTGAGCC GAGATAGTGC CACTGCACTC CAGCCTGGGC GACAGAGCGA GACTTGATTT CAGAACCACC ACCACCACAA CAAAACAAAA CAAAAAAICC AAAAAAACCC CAATTTCCAG TACTAGjx^G TCAGTuLrtTGl·. AG^jGCTGGAG ACAGAGGGGC GGTAAGTGTC TGGGCGCCCA CCATCAGTCA CCTCCCAGCT CCCAGAGGTG CAAAGTGCTT GGTTCAGCCT CATGGGAAGG ATGCTCCCTG GGGAGGCTGG GCTGGGTTCA CAGGGCTCTT CACATCTCTC TCTGCTTCTC CCCAAGGTTT GGTTCCAGAA CCGGAGAGCC AAGTGCCGCA AACAAGAGAA TCAGATGCAT
102::
'.023 2
10441 ' π - r Λ
1023·:
10622
10662 ”l0740
10302
360
10920
109S0
11040
11100
11160
11220
11290
PL 194 248 B1
| AAAGGTGGGT G7CGGGACTG GGGGGACCTG AAGCTGGGGG ATCCTGCTCC AGGAGGGATG | 11340 |
| GoGTCGACGA GGTGCTGGvx ACACCCAG^A CCACCACAC± GACAC—C— CTTTGyAC | 11400 |
| ACAGGCGTCA TCTTGGGCAC AGCCAACCAC CTAGACGCCT GCCGAGTGGC ACCCTACGTC | 11460 |
| AACATGGGAG CGTTACGGAT GCCTTTCCAA CAGGTAGCTC ACTTTTTCTT CCTCTGAAGA | 11520 |
| TCCCTAGGGA CCTGCTGCTC CCTTCCCCTT TCCCCTATTT GCTGCCGCAT CCTGACACTC | 11530 |
| CTAGTCCCTC CCTGCCCCTG CAGACTTCTC AGCTGGCCCT TAGAAAAAAA GCCTCTTTTC | 11640 |
| CGAGGAGGCA TTTACAGGCA CCTTGGCACC TATGAAATCA GyCTGyyyCA GGCGGGGTGG | 11700 |
| CTCACACCTG TCATCCCAGC ACTTTGGGAG GCTGAGGAGG GTGCATCACC TGAGATCAGG | 11760 |
| AGTTCAAGi-.C GAG—CTGy—— AAGTTAACGn AACCCCy^CT AT-AAAAATA CAAAATGGGT | 11320 |
| GTGyTGyCTC ACGs-CTGTCA TCCCAGyACT TTGGyAGyyC GAGy-AGyTG GATCACCTGA | 11330 |
| GGTCAGGAAT TCGAGACCAG CCTGACCAAC ATGGTGAAAC CCCGTCTCTA C7GAAAACAC | 11943 |
| Ary^G—7—-.G— CGyyy-jiGyχ Όχ.Ά.A—AC— TGxGA.TC—GyxA.Cx*Gyy .r.Gu-GAGAATC | 120 CC |
| ACTTGAACCT GGGAGG7C-GA GGTTGCCGTG AGCCAATATC GCGCCACTGC AC7CGACTC7 | 12060 |
| GyyTGACAGA GTGAGACTCC AAGACTCCAT CTCAAAAAAA AAAAAAAAAA TCAGGCTGTA- | 12120 |
| * * * * mm m* mm mm-mm m m * * m <* mm** m* m* z-·* m* * m m m m·* ** m * m * * * m»-»m «* * m *****m m* rtrtftn-UyWf. 1 χ x yyyru-iyy x WanftA* y * y aLA/waClλ | 12130· |
| G?.GGG57GAA AAG7CCACAC AGTCAGGCSC CCCCACCTGG C773C7GCC7 C-2-77Ą-.-29.-.0- | 12240 |
| C-GCGCAGA.7G CC7G7GCC7C- GA7ACCAGAG A7GGGACAGA CACCCA77CC C7T7TCA7C.-. | 123C0 |
| Ci—-iC—.y——x=j-l GTG·— ——.GAGy GyCTGyyy—G TCTG— CTGyy CCCTGyyCC— TGGCTTGGGC | 12360 |
| TCTGCACCTC TGAA.CTGGAG ACACCCTACT CAGCTCCCCA CTTACTTTGG A.G7GAGCAGC | 12420 |
| ΑΊΤΟΑΙΆ CCAG-GTGGA. TTTGGGGCTT CCAGGGAGTC GGGGTTCGGT CGCGGAGCCC | 12460 |
| A-n-G—«C—AGyy— yv.CC— CG——CTG——C TGyyTTAGTG GTGyyGATGG GATGGGGGGA | 12540' |
| AAC. TG-y_ Gjj-y.G GAGurTGAAGy G7CACAGGAG GAGAGAGCGC A.GCGCCCA.CG | 12600 |
| TGCGCCCTGC CTG.AACGCGC AGCGCAGCGC CCGGC7GCGG 7GCCCC7TGC CCCTTCGGTC | 12 660 |
| C —-λτϊ—x-yy Gw?y — TG—ATG—G\-y Gy— yynACyy GyTTGyGGGG GGGGCTCTGG | |
| CAGGGCGGAC GCGTGGCCTC CCTTCTTCAC CGTTTTATTC CAAC-GGGACA GGCTGGGGAT | 12760 |
| 7Gx ATT a yyy CG-yxG7TTG G-TGAGGyTG CAGGGACTTG GGGGGTGGCG GTGGGGAGCG | 12940 |
| CGGAAGGTAT AAACG7A.TAA ATCATAAGTA AACAACTCAG AAATGGACCC CGAGCGCTGG | 12SOC |
| TCG--GCxA.G CTCTCCAG^-T CTCCCTGyCC CAGGCCCGAA GyAGAGGGGT CCGCATCCCT | 12960 |
| CCGCGGTTCT CCTCTCCTGG GTACCTGGCC TTGAGGTGGG GGAACGAGCC TACTTCTTGT | 13020 |
| ACCGTCTTTT GyCynCGGCG GGACCCAGTG AAATTAGGCC GTTGGAGCCC GCAGGCCTGC | 13080 |
| CTGGCTTTGC GCACCGGAGT CTTGGGGACC TGGTGTCCCC GGGAAAAACT TGGGGACCTG | 13140 |
| GTATCCCCGG GAGAGGCTTG GGGACCTGGT GTCCCGGGAG AGGCTTGGGT ACCTGGTTTC | 13200 |
| TCTGGAAGAG GCTTGGACAC CTGGTGTCCT GGGAGGGCCT 7TGGGACCTG GTGTCCTGGG | 13260 |
PL 194 248 B1
| AGAGGCTTGG | AGATCTGTTG | TCCTGovjAGA | GmCTT G^jutusA. | CCT Gm x Gx CC | CT GmAGAGGC | 13320 |
| TT GGGGAC CT | GGTGACCTTG | GAGAGGCTTG | GAGACCTGGT | GT TCT GGGAG | 13380 | |
| CTGGGAGAGm | CTTG^?vrtjAC'^. | TGGTGTCTCT | GGAAGAGGCT | TGGACACCTG | 13440 | |
| GTGACCCGGG | AGmmmCTTGm | GGATCTGGTG | T C C C GGGAGA | GCCTTGGGGA | Cs,TG\jTGTCC | 13500 |
| TGGGAGAGGC | TTGGGGACCT | GGTGACCTTG | GAGAGGCTTG | GłjtaAC CT GGT | GTCCTGAGAG | 13560 |
| AGCCTTGGGG | ATCTGmTGTC | CCAGGAGAGG | TGGTGTCTCT | GGAAGAGGCT | 13620 | |
| TGGACACCTG | GT GT CCT GGG | GAGAGGCTTG | GGGACCTGGT | GT C CT GmGAG | AGGCTTGGGG | 13680 |
| ACCTGGTGTC | CT GGmAGAGm· | CTTGGAGATC | TGGTGAGCCG | GGAGAGGCTT | GmGmAC C T GG | 13740 |
| TGTCCCGGGA | GAGGCTTGGG | GACTTGGTGT | CCCGGusriGAG | GmT T GAACAC | CTGGTGTCCC | 133 00 |
| AGGAGAGGCT | T GGGGAC CT G | GTGACCTTGG | AGAGur— C T A? | GuirtC CT GmT G | AC C C -ukjuiAGA | 13860 |
| GmCTT GmmmA | CCTGGTGTCC | T GGGGAGAG- | CT T GGGGACC | GmAGz-.GmmTT | 13920 |
GGGGACCTGG TGTCTCGGGA GTGmCTTGmm GACCTA.GTGA CuCmmw-GAG GCTTGGGGAC
CTGGTGTCCC GGGAGAGGCT TGGGGACCTG GTGTCCTGGG A.GAGCCTTGG GGAT
μ. <jm.m
TCCTGGGGAG AGGCTGGGGG ACCTGmTGTC TCGmmAGAGA GmCTTGmGGA CCTGGTGACC
GA.GAGGCTTG GmGA.CCTGGT GACCC GGGAG
| C G\jGAGt*.Gvj^ | TTGGACACCT | ΜΜΧ U^ w-ww-Λί |
| AG^wC i._ | ACCTGGTGTC | CT GGGGAGAG |
| CTTGGGGACC | TGmTGACCCm | GusAGł“*Gu=M T T |
| AGCCTGGTGT | CC CGMMr-iGAG | C CT T |
| G i G.-.. | .-.G.-Jr-A, x Gm | Gusj-tC — . Gm χ m |
| GGAGAG.-_-.CG | X - 'J i «γΑλ. wA | AAGTCCCTGA |
GCTGC
GGACACC*
CAGmx GrtC·—T
IATTT GT
i. Ul i w
Gh.Gm*— * Λ Gm\7 .cr.krou _ i
CCCCTG?“Jjmm CC
G.AAGGAGGAA AGC ίτ.Γ_-.ι...Ί.
13S8G
1404C
14100'
14160
14220
1428C
1434C
- λ i rt r = “ “ k u
460
14=20
14580
1464C
14700
14760
14320
14880
14940
15000
15060
15120
15180
15240
15300
GCAGTGuCAG cgccaattct gggccagggg
GT Gvj\j\zT G\jT C_ CCACk j J..Ą.
GGGTTTCC
- C —-v.7.-.Cr..-.CCCCCAGTCC
CCATCCTGCG CCCTCACCCC GCC
GAAGGCGTGG CCCACC :ccg ctcc
CCCGCACCTG CACC
1AGG TCCAGGCTCA G2TGCAGCTG
TACO
CTGATGTTCC CCCCG\_CGv.<. CTTC-j*<rjCTG CCCATCG^GZ CG^TGGCCGA GTCCGCCTCG
GCCGCCGCCG TGGTCGCCGC CGCCGCCAAA AGCAACAGCA AGAAITCCAG CATCGCCGAC
CTGCGGCTCA AGGCGCGGAA GCACGCGGAG GCCCTGGGGC TCTGACCCGC CGCGCAGCCC
CCCGCGCGCC CGGACTCCCG GGCTCCGCGC AC CCC GC CT G CACCGCGCGT CCTGCACTCA
ACCCCGCCTG GAGCTCCTTC CGCGGCCACC GTGCTCCGGG CACCCCGGGA GCTCCTGCAA
GAGGCCTGrtG GAGvuAGGCT CCCGłjuACCG TCCACG—ACG ACCCAGCCAG ACCCTCGCGG
AGATGGTG^A GAAG^j^kjoAG CGGGTGAGCG GCCGTGCGTC CAG^CCGGGC CTCTCCAAGG
CTGCCCGTGC GT C k. ΪGGGAC CCTGGAGAAG GGTAAACCCC CGCCTGGCTG CGTCTTCCTC
PL 194 248 B1
| TGC7A7ACCC 7A7GCATGCG GTTAACTACA CACGTTTGGA AGATCCTTAG AGTCTATTGA | 15560 |
| AACTGCAAAG ATCCCGGAGC TGGTCTCCGA TGAAAATGCC ATTTCTTCGT TGCCAACGAT | 15420 |
| TTTCTTTACT ACCATGCTCC TTCCTTCATC CCGAGAGGCT GCGGAACGGG TGTGGATTTG | 15460 |
| AATGTGGACT TCGGAATCCC AGGAGGCAGG GGCCGGGCTC TCCTCCACCG CTCCCCCGGA | 15540 |
| GCCTCCCAGG CAGCAATAAG GAAATAGTTC TCTGGCTGAG GCTGAGGACG TGAACCGCGG | 15600 |
| GCTTTGGAAA GGGAGGGGAG GGAGACCCGA ACCTCCCACG TTGGGACTCC CACCTTCCGG | 15660 |
| GGACCTGAAT GAGGACCGAC TTTATAACTT TTCCAGTGTT TGATTCCCAA ATTGGGTCTG | 15720 |
| GTTTTGTTTT GGATTGGTAT 7777777777 77777777^7 £77^7-77^ | 1575 0 |
| CG^^^AAaGzia— Tx.\ov-A±AAGA GACG\w*rtCkj^M-kj TG^j-lTGw-AAG GxGTCATACT gatatgca.gc | 15840 |
| ATTAACTTTA. CTGACATGGA GTGAAGTGCA ATATTATAAA TATTATAGAT TAAAAAAAAA | 15900 |
| AC.'_. .'.mCw. CCviCAAC*jT CCAACGTGuA aaaggcgtta cctcttctcc | 15960 |
| C-rvG<,, . Gvz\_CA CiCACAnj-^^C TTTG^^AAAAA TCACGGGTGT AGAGATGGCC | 16020 |
| CTGGGCGCGC TGGGAGTGTG GTTGTGTTTC TGAAGGGGAT AAAAGAGGGC ACGGTGGTGC | 1605 0 |
| CAnGrv—ł..CA Gx x — G\jiJT.Ci— £οΛ&_.ν^ΤΤ C t AG^wkrTAAAAG CCAGGGAGAG | 16140 |
| ATCCAGAGAG TTTTCAAGTT TTTGCAGATG TAGGTGGTTC CAGCTTTTC7 TTCTCCCCTA | 16203 |
| CTCCATCTTC TGCGTTCCCC CAGTTCTTTT AT77G7T7G7 77777A7777 TGAGACAGAG | 152 7 2 |
| AC77GG777G TCGCCCAGGC TG3AGTGCAG TGGCGCAATG TCAGCTCACT GCGACCTCCA | 16222 |
| CCTCCCGGGT TCAAGCGATG CTCCTC-CCTC AGCCTCCCGA GTAGCTGGGA CTACAGGCAC | 15280 |
| CTGCCACCAC CCCCGGCTAA, 777T77G7A7 77ATAG7AGA GACGGGGTTT CACCGTGTTG | 16440 |
| GCCAGGCTCG TCTCGAACTC CTGACCTCAG G7GA7C7G77 CGCCTCGGCC TCCCAACGTG | 16500 |
| CCCCCAG7TT TATAAACAGC AGATAGCAAC TTG7CGTCAC AGCTGGCATG GGCTGGACAG | 16 = 60 |
| T7GC7TG-AA. TGACCTAACC AAAAACATTC AAGGG77C7G CCCCCA.GA77 TCGGGAGA.7C | 1 c c 2 0 |
| CACGTTCCAT G77CTGA7TG G7777C7GGG AACACAC-CAA C-GGGTTTGGT GACCTCCGAG | 16650 |
| AAGA7CCA7C TGCATGATTG GCAZTA.C-7TA. CCACAGCCTG CCCAGAGAŁA AAC7A7G777 | „16740 |
| TCCCAACATT TACTAACATC CACTGG7CAA CTCTCTTATT TCCAIAACAC ATTTGCATCT | 168 00 |
| TTCTGGATTC AAGCTTGGTG GTTTTCTTTC CTAACTTCTG ATTTAGATAC TTCTCCCTGA | 16860 |
| GGTGGGGATA AAAGAAAAAA AAAAAACAAC 7777777777 CTTCCGCATA ACACTTTCTA | 15920 |
| TCT7G7CAC7 GAGC7GAACT GTAGATCCAT TTGGACCCGT CTCATTTGTA TCTTCTGAIA | 15980 |
| TTC7TTA7AC AAACCAAAAG TCCCCTTCAA CAI77TTTAT GTCAAAAIGT TACAACCGCT | 17040 |
| GTAAAATGAC GGAGAGAGAG AGAAAGAATC CCAGACATTA ACGGTA77AG AGAG7TTGCC | 17100 |
| 7CA77CA7CG ATTTTTCTTA AAAGCTGGAA ATTAAAAAAA AAAAAGAGAG AGAGAGGCTT | 17160 |
| TAATAGTTAA GCTGAAATTT TTATCGAAAA GnAGAAITGC ATTTTGAATC TTTGGGAAGT | 17220 |
| AGGTTCATTC ATCAGAGTAT GTAACCCTTT GGAAAAGTGG TTGGTAAGAT ATGTACAGCC | 17280 |
PL 194 248 B1
| CTAGA777T7 T777777TAA CCAAAAAGGC TGAG7AA777 TGAAAAA7CG AAACATAACA | 17340 |
| GTG7G7CA7C A77TCC7CCC AAGAAAAAGC 7CACTCCACG TGAG7AGAAA GACATCTACC | 17400 |
| 7GG7CCC7GT AGAATCTGAA CGTT7C7C7T TAGAGACGGA ATTTCAATCT TGTTGCCCAG | 17460 |
| GC7GGAGTGC AGTGGCACAA TCTCGGCTCA CCGCAACCTC CGCCTCCCGG GTTCAAGCCA | 17520 |
| T7CTCCTGCC TCAGTCTCCC GAGTAGCTGG GATTACAGGC ACCTGCCACC AGGCCTGGGT | 17580 |
| AACTTTCTGG TATTTTTAGT AGAGACAGGG TTTCAGCCTC CCGAGTAGCT GGGATTACAG | 17640 |
| GCACCTGCCA CCAGGCCTGG GTAACTTTCT GGTATTTTTA GTAGAGACAG GGTTTCAGCC | 177C0 |
| TCCCGAGTAG CTGGjATTAC A&a^-ACCTG^ CACCAGj^-CT Gu^jTAACTTT CTGGTAGTTT | 17760 |
| TAGTAGAGAC AGGGTTTCGG CCTCCCGAGT AGCTGGGATT ACAGGCACCT GCCACCAGGC | 17820 |
| CTGGGTAACT TTCTGGTATT TTTA.GTAGAG ACAGGGTTTC GGCCTCCCGA GTAGCTGGGA | 1788C |
| TTACAGGCAC CTGCCACCAG GCCTGGGTAA CTTTCTGGTA TTTTTAGTAC AGA.CAGGGTT | 17940 |
| TCGGCCTCCT GAGTAGCTG\j GACTACAG^j-C ACCTGCCACC AGGCCTGGGT AACTTTCTGG | laooo |
| TAGTCTTAGT AGAGACAGGG TTTCAGCCTC CCGAGTAGCT GGGATTACAG GCACCTGCCA | 18060 |
| CCAGGCCTGG GTAATTTTT7 TGCATTTTTG G7A.GAGACAG GTTTTTGCCG TGTTGGCCCG | 18120 |
| GCTGGTCTCA AACTCCTGAC CTCAGG77GA CCTGCCCGCT TTGTCCCTCG CAAAGTGCTG | 18180' |
| GGAT7ACAGG CGTGAGCCAC CACACCTGGC C7GAATC7GA ACTTTTAAAA GGGAGTTACT | 13240 |
| GACTCTCAA.C TGxGv.\zxruvj^—Cx^jTTTCACx TTGATTTAAT A.TGGAAAGAG GGCCAAGTGT | 18300 |
| CATC· --CA r*-rs._krijvjxC<z<r <z^jrTJT.G\__-Arri_ C.-inzxC Gr_rt.C χ G X Cu-uG GGT GG-GACA-C | 18360 |
| GAGTGTCTGT GGACACTGGC TGCCTTTGGC TTTTCTCCCG CGAGAGAAGT 7GGG7GAC77 | 13 420 |
| TCTGxA*G\jxG Grx.LifiGxGrt — CjTGTACGCT AGCTGCTTCT | 184S0 |
| TTCTCCCTGA AAC7CTCGGA TGGAAGGAAG TAr.GAAATTC AGCTTGGGCT GTGACCAGTT | 195 40 |
| CTCACCACCA ACCCCCTCTT CTCTCTCCCT TCTCCTTCCC TCCTTCCTTC CTTCCTTTCC | 18 600 |
| mm·· ipmmmmmm φχζζ’π.ζ'ζ’!”' mmmmmmmmw mmmmmmmmmm mrnmmmmmmmm mmmmmmmmxm - x<-i X X - i\*i X x ---x-X x X. J-- -.'w.--'-. X'_. . XX - α- i lUi x | 13660 |
| CTTTCTCTCT TTTTCTTTCT CTTTTCCTTT TTTGTT7CTT TCTTTCTTTT TCTCTCTTTC | 18720 |
| TTTTTCTTTC TTCTTTCTTT C7TCGA7GAA G7C7CACTCT GTCACCCAGG CTGGAGTGCA | 13780 |
| GTGGGGxAAT Cx<—--G—TCAC TGCATCCTCT ACCTCCTGGC TTCAAGAAAT TCTCCTGCCT | 13340 |
| CAGCCTCCCA AGTA_GCTGG\j ATGACAGGGA CCCA.CCACCA TTCCCGGATA A.TTTTTGTAT | 18900 |
| TTTTTAGTAG AGAC7GGG77 7CGCCA7G77 GGCCAGGC7G G7C77GAAC7 CCTGACCTCA | 18960 |
| CATGATCCAC CCGCCTCAGC CTCCCAGAGT GCTGGGATTA. CGGGGTGAGG CACCGCGCCC | 19020 |
| GGCCTCCTCT CTCTTTTTCT GAGATG777A GGAAGGAC7G GGCTGATGGG GACCCTCTG7 | 19080 |
| ATGTGATGTG CGTGAATTTG GTTTCCCGGA AGGCCCTCCA GAGACACGTT TGCGTGAACA | 19140 |
| TTCAGCATGG AAACAACA7A CG7C7CTCCA CAGGAGG7GA GAAAT7GAA7 TTATGGGG7G | 19200 |
| GGTGTACGCT GGC5AT7C77 GGTGCTTTTT GCTCAAAACA AGG77CT7T7 GAAAG7CACG | 19260 |
| 77CC7GC77T CCCTGTGGCT 7CCCGG7GAG C7CGC7CGCA GAGCAAGGAA TACCACCCAG | 19320 |
PL 194 248 B1
AGAGCAA.CGT GG^rCTGTGTT CCGTTGaAAC Gv,CG77GCAG AGAGAG»jtATT TGmTGTGTGA 19380 GATCCG7ACC AGCTCCAGCA CACTGATAGG AACACG7TGC TGGCCGAAC7 GAACGATGCT 19440 GGGTTGGGTC CTGATTGATA CGTATTTTCT TCCCTCCTCT CCCCAAAACT TGGCCAAATA. 193 00 GTCCGTGGAG GGTTGTCAGT CGCCGCAGTT GAGCAAAAAA CACTTCTTCC 7TTGAGTGGC 19S60 TGTTCTGGTG AAATC7G7TT CTGACATATC CACTTTTCTC TCTCTTTTCT CTC7C7CTGA 19620 CTGCGAAGCA CCCACAjGGGA GAAGGAATTG GATGTATCGG ATGTTGGTAT TAGATTTTCT 19630 TTCTCCGTTC GAGTCTCTGA CTGGTGCATA CTTTGCAAAG GTGTGTTCCT GGCAATTGCC 19740 AAGAGTT^GA AAr*j^.TG\—rtC<- TTCTC-GsjiG (A-— GTTG\j\j\j TGTTGTTTCA CAGGCAGTGG 19Θ00 TGACAGj»jx.C CCTCGj-CTGT (AtCTGiCTTC TC<AGx.G\_,CG TGmATAAAGA GACGGGACAG L9S60 ATTCTGTGCC TCTSTACCAT TTAGA.GCGTA ACTGACCGCG TCCAACACCC GTTTTTCCAC 19920 TTACAAAGCT GGTGGTGCGA CGxjvCTTGGT GTCTCCCGTA CGGGAAGGAG GCCTTTGGGC 1993C
| CGCTCCAAAG | ACSCCCTGTC | G χ. AG\xr\A2 Gu | CC7CTCCATC | CC3CCAAAGT | CCAGCCAGGC | 2004C |
| CTCCSAAA2G | GTC-TATTTC | CTTGGAAGCC | mm* m mwiim mm i,ksn\jx i xxj | TTCTGGTCTT | G— T G—7 GT C C | 2010C |
| T T Gvn- CAC «jT | C.-.Gu_.-,C/rx Gut | GACA—ATC * GT | C-GATACCGCA | GAGT C T GGGG | ACAGC7GGGC | 20160 |
| GTTTAA.C—'«jA | AAT Gz*AG\- — -σ | AGAC GxjvjT T T | CAGGTTTTGG | TGCCAAGCTC | * GjT CAGGA7 | 20220 |
| GAAAGGGAAA | TACCAGAC-TC | mm mm mmm mm m L.-'— «σ ; i i χ | mmmmmmmmmm x^- - . X . i | mmm* mmmmm* X - x-tłx j. uiru | CCTT^C^-^C | 202SC |
| * mm«r«m*mmmm Ai - lk?- * * * w | CCCTAAGAAC | AAG^wAGr^.Gs* | CTCCAGC7CC | CTTTAGCTCT | ACAG7T7TCC | 23340 |
| C'C-.T A | G*·— —x Gv | CACACGGCAG | CCACTCCCAC | GACACACATT | i --C | 2040C |
| 7 GTAGACAAT | ATCCTGTTTC | AAAGCTATGA | AATG7GCTAT | TTA.TTGAAAG | -- i | 207CC |
| 77CACGAG7T | h.—,S—T . G | TACGTGCAGG | TCCCGTGGGA | AGGAGGCAAA | AGCCCCTGCT | 20760 |
| mmmm* mmmmm X—- xaL· * - . | T 7.—-T GTAT GT | mm*mmmmmm* '•J'—.“XX, ilkJl 1Λ | TTTA.TTTTTT | mmmmi nmm —m i X ΧΧ,Χ, X l&d. | CGGACGTTCA | 20820 |
| TAAATATSTA | £-' — ——T, m — 2^^ | TATGTCGAGT | G.AAATTTGA | CATCGCGTTG | mmm* mmmm | 20880 |
| TAIATTTCTG | AAAACTGTTG | CTTTTTCTTT | TTCCC7CCCC | CATTGACGAC | ATAGl-GGCCC | 20940 |
| CCGCGTCTGG | GTTACAAACA | CAICTACAGA | TATTTTCAGG | GATTGCTTCA | GATGAAAACA | 21000 |
| AATCACACAC | CGTTTCCCAA | ACCAACAGTC | TTCACATTTC | TATCCCTCTG | T ±A_ -G7CGG | 21060 |
| CAGGCGGTGA | GGGGTAGAAA | AAAAACAAAC | AAACAAACAG | AAAAAAAAAC | CAAAAAAAAC | 21120 |
| CACCCTGAGT | TTCTCTGGTG | ACGCCCTCAT | TCTCCTAACG | TTCAATAATC | TCAATGTTGA | 21180 |
| G7TGCAGCAA | CAGACTGTAT | TTTTGTGACG | CCCCGTAGTA | TGAATGTACA | TCTTGTAAAA | 21240 |
| CTGAGATA7A | AATAAACTTA | TAAATATTTG | TATTCAAGTG | TTAAAAAAAA | AAAAATTCTC | 21300 |
PL 194 248 B1
| AACCTCTCCC | CTGAGGACAG | GCTTATTGGA | AAAAAPAAAA | AAAAAAAAAA | ATCCTGAGTC | 21360 |
| GGCCGTGGCT | GAACACAGAG | TGTTGTTCTG | CTCCGTGCAT | TTCCAGGGTG | GGTA.CCCAGT | 21420 |
| GTTGCCCCCC | AGCCTTAGAT | CGm^eAG«jTAC | CATTGACTTT | TGCTTGTATC | CCATCCCCTT | 21480 |
| CCTTTACTGA | AACCTACCTC | CCCGCTTCTC | AGCCAACGTC | CCCCCAGRAG | GTGGCAAAAA | 21540 |
| AAACAGAGGA | AAAAGCCCTG | ATTTGAA2CA | AGTCAGAGCT | GCTARTTCTC | CACTTTCTTT | 21600 |
| AATTAATTAA | TTTATTTTTT | TTTTTGAGAC | TGAGTCTCGC | TCTGTCGCCC | AGGCCGGAGG | 21660 |
| AGTGCAGGGG | CGCGATCTCG | GCTCACCGCG | ACCTCCGCCT | CCCGGGTTCA | AGCGACTCTC | 21720 |
| CTGCCTCAGC | CTCCCGAG±A | GCTGGGATGA | CAGTCACCTG | CACCACCGCG | CCCGGCTCAT | 21780 |
| TTTTGTATTT | TTAGTAGCAA | TGGGGTTTCA | mmmmmmmmmm (--.ίτΧΝΤΧ x | CAGGCTGGTC | TCGAACTCCT | 21340 |
| GACCTCGTGA | TCCACCCGCG | TCTG^tjCCCG | G-— C GAT G | TGTGCGCTTT | TAACTTTTAT | 21900 |
| TTTGTTCGAG | TTT7CGACAG | TG·-——ACGjAT | TTTCTAGCAC | GG7CT7GCAA | mm* -nm* mmm* V5j“IX j, | 21960 |
| GTCATTTTTG | agacaaaaaa | TATAATAATA | ATAAAT GGAA | AAAGRAATCG | ACTTTTAAAA | 22020 |
| AT GACAAA77 | TTTTTTTTTT | TTTTTTGCAT | mmmmmm | mm^-łmrpm* mm·*i — . _ J. UJ. | AAAiRjAAAGT | 220S0 |
| TCATGATTGG | * mmmm mmmmm A* * - | CCTGA.CTGC7 | TCCCGGCTGT | GATAAAARAC | AC-.C GT GAGC | 22140 |
| TG\^—AGvn—λΑ | GT GGG—\jAGvj | GACA. CAG—T G | C—CACAG.-*Gv | GTT C CCACCG | CGGTTACAGG | 22200 |
| GT GGG—AGTG | CT | TTTCTCTGTG | G—T CAG | AGCCTGAC-GA | CAGGTGAGCC | 22260 |
| TCTCCGACAC | CTCCCCAGTT | GCCTGGAGTC | TAAA.C C GT C C | Ui X -JX >— Χ\?ΧΛ | CCGCCCGTTC | 22220 |
| TTCCTC-CTGA | CTCCTG^jTAG | TTCCTGAAAG | CTTCTCTTGG | C A.GAGAAGG | m—mmmm* m — m | 22380 |
| GCCGTGTCTC | CA-G^n— -_AT T C | T G<_ΑΑλ^Τ G— | -zrCT * GrtCC^j | TTCCTTTCCT | TTT CT GGCCT | 22440 |
| <TX KJVJXX·- | AAGCT CA.GAG | £ m mm mm mmmm | AC C CAGC CT G | TGTGTGTCTT | G— C G\=ACAGA. | 225C0 |
AGAAAAATGG
CCATCTC—AG
CACAG7TA7T
225 60
620
22650
| TGTCAT CCCA | &>-ACT T 7 Gvjvj | AGvj«— C —-.G.-7-— | ± Ο-Ά1C.-. | CCT GA GG^* CA | GGAGT7CGAG | 22740 |
| ACCAGCC - -j«j | CCAACACGGT | GAAACTCTAT | CTCTACTAAA | * -i m* m* * * * * ΛΛ.ΛΧΛΛΛΛΛ | x — .“.'G—— | 22SCC |
| GTGGTGm^ GT | - sJ i. /*-Α | —' — — — . — — ± — — —«T.L··— AJłU | TCAGGAAGCT | .-.«r\z.“.G | AAT C GCT TGG | 22860' |
| ACCCAGGAG5 | C G«jAGmT t gc | ACTGAGCCGA | GATCGCGCCA | TTGCACTCCA | G_— _ G, | 22920 |
| CAGAGCCAGA | CGCTGTCTCA | AAAAAATGAA | TAATAAAATA | AAATAACAGG | AACTAAATAA | 22980 |
| AATAAAACGT | TCAGCTTTGT | TCTGCAAATC | CACTCCTATT | GTTTTACGTG | G ± TTGAGAGA | 23040 |
| CTCTGTCCCT | TAGAAATAGA | TGTTTGTTGC | CAATTGTAAT | GAAICTGTTT | CAAAAATGAA | 231C0 |
| CAGAATATTC | AAATGGTTTG | AGAGATCTTT | TCCCTTAGAA | ATAGCTTGTT | GCCAATCACA | 23160 |
| AAGAATGCTT | TTCAAAAATG | AATGGAATCT | TCCTGGATAT | CGCTTCCAGA | TCTTCATTTT | 23220 |
| TTTTGCATAG | TTCAACCTGA | AAAGTAAGTG | TCTCAGCCCT | GAATTTCTTT | CTGATTTTTC | 23280 |
| CATGGG77GT | CTTGCAGACT | TCTCTGGRCT | TGACCACATT | TARAAAAAAA | AAAAITAACT | 23340 |
PL 194 248 B1
| TTTTCACACG | GACACGGTTT | CAATAGGAAT | GAGATCTTTG | AGTTTTTATG | TAACAGATTC | 23400 |
| TTACCATCAG | TTCTCAGAIT | CCCAAATTAC | ACACAAAAAG | CCACGGACTT | CjmGTCCTGm | 23460 |
| TAACATGTCC | TTCTGTTTCT | GAGGCTTCTG | TTGGTGTTAG | ACTTTCATC-T | TTGATAGCAG | 23520 |
| ACAATG7AGG | r mmm-Λ λ Tl uAl X a ΛΛΛνΐΛ | AAAAIGCAGA | GAAAGCAAAA | ACACTGACCA | AAC.-.CAC GGA | 23580 |
| GATAAGCTTT | C7AAAGCC77 | TGTTCTTGGA | GTTGTCGTTA | AAAAAAAAAA | IfTPTTlTł-R ϋ | 23643 |
| ACTTTGCAAG | CATGmm -.ATA | TTGAACTCAT | AAGCAA.GAGA | GCCAAGAAAA | W ΓΓΤ* ΛΧΛ13 X X L, CU | 23700 |
| TCGTCTACTC | TACACGTTTT | CC CAAAACAG | ACGTATTTTA | ή ιιυιιιιΐ(*τΐΜΐρττζ* Al ΧΧΜΧΧΧ-Μ | » 1 j. -μλΑμλ'-λ | 23750 |
| CAGATGCTGA | GAGTTAAAAG | TTAAATTTTT | GTCATGAACA | ATA.GTGGCCA | AAACCACAC-T | 23820 |
| ^R rtł ! X Λν X x _ wMG | t- χΛΧΛνν^Χ* A | ATAAGAAAAA | TACAGGCTGG | GCT CGGT GGC | T C»“»CAC C T GT | 23330 |
| AATCAAAGCA | C T T T T GmAGm | C GrAA.CA.G_ | AGATCCCTTG | AGG C CAGGAG | ATTGAGACGA | 23940 |
| GCCTGmmCAA | CAT-AGC GAGA | CCCTCACCCC | TACAAAAAAG | <j _ TT G - ΤΑΟλ | TAT GT AACAA | 24003 |
| AC CT GCACAT | T GT GCACAT G | TACCCTAAAA | C T TAAAGTAT | AATAATAAnA | AAAT TAAAAA | 24060 |
| AAAATTCACC | AATCAACTGC | CTGCTGGTGC | CTTCAAGAGA | CTCACCTAAC | ACATAAGGAC | 24120 |
| TT GCATAAAC | τιmχ -π* η, ί >/-»· X —“—ΛΛΛΛ·—Ϊ | ATTCAATGGA | AGAAT C CTT G | A-A.C-TATTCT | GAGrtAGACAG | 24180 |
| TATAATAAAC | T GAT TT CTG A | AAAGGCTATA | AAAA AT T GAA | TAAA7CAZ7G | T T GGGCAT G G | 24240 |
Gmrt^my··· * » rt»* xzv-.
* /τζ»τ*π»τ,^*** ·ηρη x * t my ^τ^ττ,τ,—T^m mmR «»-«-« /- — - —,
-vm χ^,τ.-^Λγ'Λ', ; .ALry-tfin,^· * χ -λ—-irxC.-^.w
| AAAAAAAAGT CAAATAATTA. | GmmauGwMt-„T G | Gx Gm-Gm-C- | CCTACmm-TG | AAC-CTA.TTGA | 2436C |
| GmAGm—ΟμλΤAC -TTG | TTTTTGTTTT | TTAATTTTTT | T T GA-GAlCA-GA | GTCTCGCTCT | 2^420 |
| GTTGCCA-GGC tggagtgcag | TGGCGTGATC | mz*«T «·»«τγ,-ττ rt·»»» | ^»»1 » TT/TTrtrtrtrt | CCTCCCGGG' | ? <2 -i g ~ |
TCAAGCAA
AGCCTCCCGA GTAC-0 *^=.“. i - A_CAG\r j. C
AC CC G\r-_Cr
4CCTC GGG7GACCCA CCCGC cc:
r.w i'λ,·.
660
ACAGGCC-7GA GCCACCC-CGC C7GGCCCAGG
OCAGGA GG7G3AGGC7 24720
4C CAC7GCACTC “C-7-2C GACAGAG7GA GACCACACC:
04730
CTAAATA-AC GAATAAA2AC AGGCAGAAAC rri iihw
GGAGTCT7GC 24840
TCTGT \GGAGTG CAGTGGTGCO
..... rtł f- -. , .,
Λ- M - —T.k7U * X.
4CTGCAACC7 CCACC7CC7C
24900
GGTTCAA.GCA ATCC7CCTGC CTCAGCCTCC CGAGTAGCCG GGAITACAGG TGCCCGCCAC 24960
CACGCCCGGC TAATTTTTTG TATGTTTAGT AGAGACGGGA TTTCACCGTG TTAGCCAGGA 25020
TGGTCT7GA7 CTCTTGAC7T TGTGATCTGC CTGCCTCAGC CTCCCAAAGT GCTGGGATTA 25080
CAGGCATGAG CCCAGGAG7T CAAGACCAGC CTCAGCAACA AAGTGAGACC TTTTCTCTCC 25140
AAAAAATCAA AAATTTAGCC AGCTG7GGTG GCTCCTGCCC GTGATCCCAG TACTGTGGGA 25200
GGCTGAGGCA GAATTGCTTG AGCCCAGGAG TTCGAGACCA ACCTCAGCAA AAAGGACTCT 252 60
CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTATAT ATATATATAT ATATATATAT 25320
PL 194 248 B1
| GAGTTTCAAA | AATTGCTGGG | T GAC CAGCT C | ATCTACTGGT | TTTCCCCTTG | GuArAGTGAA | 25330 |
| ATTGTCATGT | ATTGAAGATT | TCGAAGmAAG | 11 irt j 1 * * L X 1\ϊΛΛ | TGAGAAACAA | AC-CAATCTG | 25440 |
| TTCGTGTTTA | AAGAGCTGCA | GT GC GT TT GC | TGTGTTTCCC | ATAAAACTGC | ACTTCCAAAA | 25500 |
| GACACGCTGA | GAAAGGAGAC | CAGGATTTGT | AATTCAGAAA | TTGGAAAGCA | AGTTAGGCTG | 25560 |
| GACGTGGTAG | CTCATGCTTG | TTGTAATCTC | AGCACTCTGG | GAGGCTGAGG | CAGGAGGAIC | 25620 |
| ACTTGAGCCC | AGGAGTTCAA | GACCAGCCCG | TGCCACATGG | TGAAACCCTG | TCTCTCCAAA | 25630 |
| AAATAAAACA | TTTAGCCAGA | rn^ 'mm# >nm* mm x Lr x x «atuL. x | CATGCCTGTA | ATCCCGGTAT | TCTGmGAGGC | 25740 |
| TGAGGCAGAG | TT GCTT GA-Gv- | CCA&jAGTTC | AAGACCAGC C | TGGGCAACAA | AGTGAGACCC | 25300 |
| TGTCTCTGCA | ΑΑΑγίΑΤλΑΑΑ | catttagcca | G— χ GTGvrx Gr\ | C x G»-*.T G*. ·*. x G | TAATCTCAGT | 25360 |
GCCCA.GGAG' i i --—V
GA.C-AA. CC7CAGCAA.C
ACTCTG\jwiG A-—Ά
AAA.GTGA.GAC CTTGTTTGTG CAA AAA A. TCA. AAAATTTA.GC CAGCTGTGCT GGCTCATGC
TGTAATCCCG GTA.CTCTG-^- A.G-·—-T GAT
A.G
-r-_—j- i
TT GA.C
GTTCGA.C-A.CC
AACC7CAGCA ACAAA.GTGA.G
- .ij; _ _.
TCAAAAA.T77 AGCCAGC7GT
25=20
25=30
6042
26100 ? cC-_ 70 —.
GC CTC
| GGAGTTCAAG | AC CAGl- C7 —ά | GCAA.CAAA.GT | GA.GATCTTGT | TTCTCCAAAA | AATAAAA.CAT | l 5 Z 2 2 |
| TTAGTCAGCT | G x Gvr X i. C | * * —m* ΛΛϋ'» w . U i Cif- | TCCCAGCATT | TTGGGAGGCC | G-.G—-- GGGCG | 2 6 <, 5 0 |
| GAT CAC | T CAT GAGAT C | GAGACCAICC | TGGCTAA.CAC | GGTGAAA.CCC | CGTCTCTA.CT | 2'5Z4x |
| AAAAATACAA | AGAAAAT7A-G | TGGCGGGCGC | CTGTA.GTCCC | A.GCTA.CTCA.G | 2G4CC | |
| GAGGCTGAGG | CAGGAGAATG | CCGxv=AG~CT | C CAT GCAGT G | AGTCAAGATC | 26480 |
GCGCCA.CTGC CTTC—.-.GC
GGGCCA.CA.GA. GCAAGA.C7CC GTCTCA.'*
Z 6 3 — 0
-.CT
CTCCC
AA.GCTGTGTT TGCACCA.CTG CCCTCCA.GGC
AA.CAG
CAA.GA.CTC C GT -1 CAAAA.
TTTGCA.C-A.C 7G--CC-C—-G CCTG---7—.-A.C .-.e-A.GCAA.GA.C TC
CCC
TGCACO
CCC7CCGGCG TGGGCAA.CA.G A.GCAA.GA.C7
CGTC7CAAAA AAAAAA
AATGCTGCCC
AGCTGTGTT TGCA.CCA.C7
TGGGCAACAA ACCAAGCCTC AGCTTTC7GC CATCTCCACA ACCAAGAAAG CAATTCA.CA.C
AGAAATCAGT GCATCGTGCA GTGACCTCTT CAGAAAACCA ATGAGTTTTC CACCTGAGGA
ACTGTTTCTG AGCCCCATTC AGAAAAACAC ATCCCTGTAA CTGCAGGGCA- GATTTACTCA
CTGTATGCCT GTTTAAAIAA AGCT7CCA.GC CTCTGCAIGG GGTCTGTCTG GAAGCTCCTG
TATCTGTCCC ACATTCTTGG AATCACAAIG CACCCTTGGC- AC-GAAGATAT GTATTTAAAG
GCAGTGGATG TTATGGTGAG AAAAIGCTGC CCATCCTTCT AGAAGACAAA AGCCACACAA
AATACATCAC AAGAACCAGT TTTTTTCAGA GAAGAACCTG CACAAAGAAC CTGCTCCCCC
267CG
67 60
26320
263 30
26=40
27000
27060
27120
271S0
27240
27300
27360
CACACCCCCA CACACAGGTG AATTAACAGG ATGTATGTTT TATCATAAAA GCACAGGTTT
PL 194 248 B1
| GTTTCCTATG | CACTCTCTGA | GGATTTGGCC | ATATGCAAAG | ATGTACAAAA | ACCTTCTCTT | 27420 |
| TCCCCAGGGA | ACCG7AACCC | GTCTGAAAAG | ATGCCCTTCT | CAGAAGCGAG | TTGAACGATT | 27480 |
| GTTGGAAAAG | ATAAAATACG | ACGTGCACAC | ACACAGTAGA | GAAATGTCAC | CCATGCAAAT | 27540 |
| TATGTGTTTG | AATGGAACAC | ATTCAGGAAG | CTAAATGGGG | TATGACCACA | m*mmmmm mmm yy « — yyy χ ± | 27600 |
| GATTTATTTG | ACGAGTGGAA | GGGGCAGATG | GAAATGAATA | CTGCTGTTTT | CCTTTGGAAG | 27650 |
| mmm* m*m* mm bkLAiAŁH-l y | GGAATACCnA | GAGw^TTACT | TTGGAAGTTT | AGCTTCTCCA | m—mi*—mmmmm by J. yy χ y * y χ | 27720 |
| CTCTCTCTCT | CTTTTTTTGA | GACAGAGTCT | CACTCTGTCA | CC CAGGCT GC | AGTC-CAATGG | 27780 |
| CGTGCTCTCG | GCTCACTGCA | ACCTCAGCCT | C C CAGGTACA | AGCGATTCTC | CTGCCTCAGC | 27840 |
| CTCCC3AGTA | GCTGGv=A7CA | CAGy T GT GyA | CCACCACGCC | TGGCTAATGT | 27900 | |
| AGTAGAGAT G | AGGTTT7ACC | ATGTTGGCCA | GGC T GGT CT T | GAACTCC7GA | CCTCAGG7GA | 27960 |
| TCCGCCTGCC | rpmmm m mmmm m 1—yyyy | AAAGTGCTGG | GATGACAGAC | AT GAGy TAGC | żiC;- — w C | 28020 |
| CCAGGTGGTC | TTTTTA.GCGG | GTATTAAAGC | AGCTTTCTCT | CTGAGCCTTA | AACCATGAAG | 28080 |
| AIAGACAGAC | TCAGTGTATG | mmmmmm* m* m yy χ χ χ χΛίϋΐί? | TTGTAATTTT | ATAAAAATAA | GAAAAAGT C C | 28140 |
| ACCTATCATT | — * mm—mm* mm yrtxyyx ir.L?. | ATTTTTT GTA | GCAGTTGCAT | GCAATATTAG | GATAAGGCA7 | 23200 |
| GTTCTCAAAA | AGAAC7CTT7 | mmmmmmmmmm | TTTGAGACGG | AGTCTCGCTC | TGTC.-.CCCAC- | 29250 |
| AG7GGCACGA | TCTCCGCTCA | C7GCAAGC7C | CxC * X —yyy | GTT CAC GC CA | 29220 | |
| TTCTCC_G-__ | TCAGyy X C- y | CAG7AGC7GG | GACTACAC-GC | GyCyGy C.-.CC | ACGCCCGGCT | 23280 |
| mmmmm·* | AT TTT TA.G χ A | G.rtGAC GjGGT | TTCACCATGT | T.-.Gy <ytGy.~iA | C-GTCTCGATC | 29440 |
| 7CCTGACCTC | AT GAT CC GT C | CC-CCTCAC-CC | TCCCAAAGTG | C T Gyy.-.C T A.C | AC-GC3TGAC-C | 28500 |
| CACTGCACTT | GGCCTTTTTT | TTTTTTTAGA | TGGAG7TTTG | CTCTTGaCGC | CCAC-GCTGGA | 2SS60 |
| GTATAAT GCC | Α.» yrtx — — y —m. | CTCACTGCAA | CCTCGGCCTC | CCGAG7TCAA | 23 620 | |
| T Gy y χ y.-,G—— | TC——yj-_G ir.G | CT3GGAI7AC | AGGTGCCCAC | CACCATGTCA | AGA.7AA7 GTT | 29 esc |
| T G7AZ TT T CA | G x lGt-.GAT Gy | ggtttgacca | TG77GGCCAG | GyTGyTCTCG | AAC7CC7GAC | 28740 |
| CTCAGy x GAT | CCz-jCCCG—C x | TAGCCTCCCA | AAGTGC TGGG | A.T GACAGyC G | TGAGCCCCTG | 29900 |
| C Gy CC Gyy —T | T TGTAACTTT | Ą.7 *Τ— | TTTTTTTTTT | i - ιλλ^λλλ(ϊ | ACAŁ-.C-TCTT | ”28860 |
| GyT C x G x C-**s.y | CCAGyy . Gyrt | &_ACACTGjT | Gy yAT CAT AG | C x1—ACGy.-,y | CCTCAAACTC | 29 920 |
| CT GGGCT CAA | , GCAATCCTCC | CACCTCAGCC | TCCTGAGTAG | C T GyGACT AC | AGGCACCCAC | 29980 |
| CACCACACCC | AGCTAATTTT | TTTGAITTTT | ACTAGAGACG | GGAICTTGCT | TTGCTGCTGA | '29040 |
| GGCTGGTCTT | GAGCTCCTGA | GCTCCAAAGA | TCCTCTCACC | TCCACCTCCC | AAAGTGT7AG | 29100 |
| AATTACAAGC | ATGAACCACT | GCCCGTGGTC | TCCAAAAAAA | GGACTGTTAC | GTGGATGTTC | 29160 |
| TAGCTTCCTG | TTCTCGTCTT | TTCTTTGTTA | ATTGTACAGT | TTGAGGGTGT | GTG7GCGTGT | 29220 |
| mmmm* mmmmm yy yyjiy y a y a | GTGTGTGCAG | TCTCCTGATT | TCATGTATTT | AATTGTTATT | ACCACCACCT | 29280 |
| CCATCTCTCA | TTCTTTGTTA | CCCTCACTGT | GTAAAGATAC | ATGTTGTTTT | TAAATTTTAT | 29340 |
PL 194 248 B1
| GTATTTATAI TTATTTATTT GTATTTCTGA GACAGAGTCT CACTCTG7TG CCCAG3CTAG | 29400 |
| TGGCATGATC TCAGCTCACA GCAACC7TTG CCTCCTGGGT TCAAGCGATT C7CC7GCC7C | 29460 |
| AGCCTCCCGA GTAGCTGAGA TTACAGGCAC ACACCACCAC ACCCGGCTAG TTT7G7TT7G | 29520 |
| AGACGGAGTC TCGCTCTGTT GCAGGCTGCA GTGCAGTGGC GTGATCCTGG CTCACTGCAA | 23580 |
| CCTCTGCCTC CTGGATTCAA GCGATTCTCC TGCCTCAGCC TCCCAAG7AG CTGGGATTAC | 29640 |
| AGGCGCCCAC CGCCACACCT GGCTAAITTT TTATTGGTAG TAGAGACGGG GTTTCTCCAT | 29700 |
| GTTGACCAGA CTGGTCTTGA ACTCCCAACC TCGGGTGATC CACCCACCTG GGCC7CCCAA | 2 97 60 |
| AG· χ - Gwri TGr.CAGxj%-<zn. G-lCCA.Gv.Cx χ CTxCxxv.J.xC | 2982C |
| TTTTTTTAAG ATGGAGTTTC ACTC7GT7GC CCAGGCTGGA GTGCAGTGGT GCAA7C7CGG | 25S8C |
| CTCCCTGCAA CCTCCACCTC CCAGG7TCAA GAAA77C77T TGCCTCAGCC TCCCG-.GTAC- | 29940 |
| CTGGGACTAC AGC-TGCCCGC CACCACACCC ACCTAATGTT TGTATTTTTT TGGTAGAGAC | 20000 |
| GGGGCTCCAC CACACTGGCC AGGCCGGTCT TGAACTCCTG ACTCCA.Gj-.CG accctcctgg | 300 60 |
| CxCAGv-'*-^C— C.-*.Grt<jxGj,-v ..m.C.gGv C-jiGi-.G'—C.-.T | 20220 |
| GTCTTAGGAA ACCAGAAAGG GuGTAGTTTC CGv_ACTCTGA G\or-.G.—AAA-.G AGAC3CCCGG | 3C160 |
| CGAAGAGrAA GGAGAGTGAA AGGACGTCTC CCCTTGTGTG TAGCCTGTTC TCAATCGTGA | 20240 |
| GTG.-.GCCSAT TGv.CAGAAr.C TGAG^?^ji.G^T TCATTTGG^C AG\j\-AA.G\-TT CTCAAC.-.G.~_-. | 20200 |
| TG7C7AAG7A CTTGTTAATG CTGAGAAGCT CTCCAAGCTA CTGCACTCCA GCCTGGGTG*. | 20260 |
| CAGAGCACSA CCTTGTCTGA AAACAATTAA TTAA.TCAATT AATTAATATA. ATG-.-A7CAT | 20420' |
| ACTGf-r.C2CA Gvłp-.GACCz“.-T Gv5vt\jaGv?\tvA Gv^7VrTGv?vy\J4 TGyn-j-GGr.-.-. CAZAA-ATAT | 20420 |
| GGTGCAATGG ACTTTGCTCC AGTCTCCCTC CCCATCTCTT CTCGCCAAGA GCCTCCGGAG | 2054 0 |
| GGAGCATGGG GAAGATGCTT TGGGAACCTG TAACT7C7TG 7C77G7AAAC AG.-ACACC7A | 20 600 |
| AGTAr·— -ii-* 2~_Γ·.—Gv- x Gv_’oa“. AG i T-—. j.G.-. x iiC··__Gi_._ T__C_C._-w CTAC3GACA.—. | z C 6 c 0 |
| GGGTCATGGG 77ACTCAG7G TTACAGAAAG AATC-ACATGG AGATG777G7 TACA7C77AA | 2C72O |
| GGAACCATGru GG\=GCCAG-.G TA.TTTTACTC TAAGTGTA.GA 7GGTACACCG GCCACG2CTG | 2 073 C |
| TCCCAACACC ACCAATGGTG 'GCACCTAACT TTTGTGTTTG TGCCCCACAT TTCTCC7TCT | 2.? g δ 2 |
| TTTCTG^-C^T AAATG^AAGa Gj~.TACCCC.lT G^jtAACCACG CTGvAGCAr.G AGGCCACCTG | 20900 |
| ACTACTAGCG ATACC^-TGlA GCTCACCTAC AGvAGv,TCAC ttgaagcagc tcacccatag | 20560 |
| CTCAGG7ATA GCTCACCTC-C AGCGGCTCAC CTGTAGCTCA CGTGTAGCTC ACTTGTAGCA | 22020 |
| GCTCACTGGT AGCTCACCTG CAGCAGCTCA CC7GTACC7C ACCTGTACCT CACCTGCAGC | 21080 |
| AGCTCACCTG TAGCTCACC7 GTACG7GAGC CACCGTACCC GGCCAGCAAG ACCCCA7T7C | 21140 |
| TAAAATAAnT ACACAAAAAT TAGCCGGACG CGGTGGCGCG TGTCTGTAGT TGTAC-CTACT | 21200 |
| CAGGAGjCCG AG«GxGuGAGj ATTGCTGGAG GCTGGwzAG\jT AGAGGCTGCA GTGAr.CCCTG | 31260 |
| AICCAGCCAC TGTACTCTAG CCTGGA7GAC ATAGCAAAAC CTTGTCTCAA AAAACAAAAA | 21320 |
| CAAAAAACAA AACAAAGAAA CAAACAAAAA ACCCACACAC ACCGGAAAAC AAAACAAAAA | 31380 |
PL 194 248 B1
| GCAAAAAGmA | AAGAAAAGAG | AGCCAGGTCC | CAAATATATA | TTTCCTTGGA | GAACCA7TTG | 31440 |
| CAAAGAGCAC | ACTTAAGGCC | GGGCGCGGTG | GCTCACGCCT | mmm.mmmmmm X ΧΛ-X wX<7\7 | CAC77TGGGA | 31500 |
| G\jCCGAGGTG | GG7GGATCAC | GAGGTTG\mA | m.mmm.m.mm ksnx X tfftur.b x | ATCCTGGC2A | ACATGGCGAA | 31560 |
| ACCCCATCTC | TACTAAAAAT | ACAAAAAATC | AGCCAGGTGC | TGAGaCAGGT | GCCTGTAGTC | 31620 |
| CGAGCCACTC | AGGAGGCTGA | GGCAGoAGAA | TGGCATGAAC | mmmmm.mmmm X x \J\3\SAW X kj | GAGuTTGCAG | 31680 |
| TGAGCCGAGA | mmm mm mmmm*ł» 1X «x\- 1jx X«— s. X | GCACTCCAGC | CTGGGCGACA | GnGCGAGACT | CCTTCTCAAA | 31740 |
ΤΑΑΑΤΑΆΑΤΑ AATAAATAAC AAAGAGCAAA CTTAAAATTG TC7CAGAAA7 CCCACGGGAI
ATTGGATCTC CCTCATGCCT ATCTGATGAC ACTTTGAGTG TCTGGGGCCC CG7GCCTA7T
TTCTGGGGTT CCCAGAAGC7 GCCG7TCTGA AAGTGTGGCT CTCGGGGACG TGGCACAGGT mmmm. mmmmm mmmmm. . Λ *T»m mm. m mmmmmm mm.mmmmm.m m. . mmmm. mm mmm. . mmmmm U· x'j\snxχ x . (σχ.ιχΛΛΛΧν i X-.X\r-r. x i UwAxaiicnv? m cnw X x c«awiC>j
CCTTCGCCGA CCCCCTGAGT TTAC-GGTCCT GCCTTTTA-A A7C77CCCAG CAC7C7G7TG mm m. /. m m. m m mm m .. m . mm m m m m mm m *. m m^ m m m m . m m^ m m m m. . m mm en m x . χλΧιλλ*4.^ X«jx Xv»x.-xx x x 'jj.-.irwiw x χ<.χλλΧ^χχχ
ACAGC777GC AGAATATCC7 GTTTCTCAAT ACGGA7GG.-.G .AAACACGAGA CGCGTTTTCT
Gm—mm. mmmm .mmmmmm.mm m. m. . mmmm. m . mm m.m mm m m m — m . . m m. m mmm. mm., mm \ϊ\7Χ-Λ-χ-. AUXw«? X kxr‘.<7.“.“S.Xsz«m«—.% Xof.X - x—X _ S? X. m-.. χΛΛχΧ· r— (ZC Ą C* m Cm*** C*”GC~ ^GA^C Tm ·* — CA r ·*“ ~ mmmmm, .j^mm mpmmmmmmmrn gT r CJS im~* Z. Z. T^Tm^Z^ZZC* tZ”* — (Z/Zp. Z. L Γ* ** g*** Z Z Z ' ^mmmmm.
T--.777G_A-.C Aw%t\j7GTAAC ADAAAcD
31800
31860
31920
31980
32040
32100
32160
32220
322S0
32340 (2) Informacja o SEQ. ID NO: 15:
(i) Charakterystyka sekwencji:
(A) Długość: 806 par zasad (B) Typ: kwas nukleinowy (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: inny kwas nukleinowy (A) Opis: /desc = „SHOT” (ix) Cechy:
(A) Nazwa/klucz: CDS (B) Położenie: 43 ... 615 (xi) Opis sekwencji: SEQ. ID NO: 15:
| mmmmmmmmmm Xf X \J X XX x.X.‘%J\7 | AGCTGAAAGA | TCGCAAAGAG | GAx Ńn- <snnnG | mm.mmm.mm. bwiA <j\znknsn | C GAAGGC CAG | 60 |
| ACCAA-A7CA | AGCAGAGGCG | AAGT CGGACC | AATTTCACCC | TGGAACAACT | m..mm.mmmm X“-*X \3ΛΟ\. 1 | 120 |
| GAGAGGCTTT | TTGACGAGAC | CCACTATCCC | GACGCCTTCA | TGCGAGAGuA | ACTGAGCCAG | 180 |
| C xAC T GGGC C | TGTCGGAGGC | C C GAGT GCAG | GTTTGGTTTC | AAAATCGAAG | AGCTAAATG7 | 240 |
| AGAAnACAAG | AAAATCAACT | CCATAAAGGT | GTTCTCATAG | GoGCCG-CAG | CCAGTTTGAA | 300 |
| GC77G7AGAG | TCGCACC7TA | TGTCAACG7A | mmmrnmmmm.. W i SJN. . . .ΛΛ | GGATGCCA77 | mm.mm.mmmm X * | 360 |
| CAGxj\- <j\-AGx | TGxAGCTGvsA | CAGC GCT GT G | GCG-AC c\. | ACCACCACCT | GCATCCGCAC | 420 |
PL 194 248 B1
| CTGGCCGCGC | ACGCGCCCTA | m* mm* mmmmm LA.ć5t*x(jr .c | CCAGCACCGC | CCTTCGGACT | Gx. C <t\-T CS- C | 480 |
| AC GCT GGC CG | CGGATTCG^rC | TTCCGCCGCC | T C CAjTAGT gg | CGGCCGCAGC | AGC C GC CAAG | 540 |
| AC CACCAGCA | AGGACTCCAG | CATCG\-CGAT | CTCAGACTGA | AAGCCAAAAA | G\—AC C u7xA | 600 |
| Gx- C CT GGGT C | TGTGAC7CCA | ACGC CAG\-AC | CAATGTCGCG | CCTGTCCCGC | GGCACTCAGC | 660 |
| CTGCASNCCC | TNDDKANMCG | TTACTTHTCM | ATTACACTTT | GGuAC CZCGG | GDEAGVCCTT | 720 |
| TTNNAGACTT | YVATKGGSCW | CSCTGGSCCC | TBRKGAWAC | TT GS GHY C GA | GAACCGAKHT | 780 |
| GCCCABAYGA | GGACCRGTTT | GGAKTG | 806 |
(2) Informacja o SEQ. ID NO: 16:
(i) Charakterystyka sekwencji:
(A) Długość: 190 aminokwasów (B) Typ: aminokwas (C) Rodzaj nici: pojedyncza (D) Topologia: liniowa (ii) Typ cząsteczki: peptyd (xi) Opis sekwencji: SEQ. ID NO: 16:
Claims (29)
1. Cząsteczka kwasu nukleinowego kodująca polipeptydy składające się z domeny homeoboks złożonej z 60 aminokwasów o sekwencji aminokwasów SEQ. ID NO: 1, wykazujące działanie regulujące ludzki wzrost oraz zawierająca co najmniej jedną sekwencję wybraną z grupy obejmującej sekwencję nukleotydów SHOX ET93 [SEQ. ID NO: 2], sekwencję nukleotydów SHOX G310 [SEQ. ID NO: 3], sekwencję nukleotydów SHOX ET45 [SEQ. ID NO: 4], sekwencję nukleotydów SHOX G108 [SEQ. ID NO: 5], sekwencję nukleotydów SHOX Va [SEQ. ID NO: 6] i sekwencję nukleotydów SHOX Vb [SEQ. ID NO: 7].
2. Cząsteczka DNA według zastrz. 1, kodująca polipeptyd o długości 150-350 aminokwasów.
3. Czą steczka DNA według zastrz. 1 albo 2, zawierają ca sekwencję nukleotydów SHOX G310 [SEQ. ID NO: 3].
4. Czą steczka DNA według zastrz. 1 albo 2, zawierają ca sekwencję nukleotydów SHOX G108 [SEQ. ID NO: 5].
5. Cząsteczka DNA według zastrz. 1 albo 2, zawierająca sekwencję nukleotydów SHOX Va [SEQ. ID NO: 6] lub SHOX Vb [SEQ. ID NO: 7].
6. Cząsteczka DNA kodują ca polipeptyd wybrany z grupy obejmuj ącej:
a) czynnik transkrypcyjny A mający sekwencję aminokwasów [SEQ. ID NO: 11] i
b) czynnik transkrypcyjny B mający sekwencję aminokwasów [SEQ. ID NO: 13].
7. Sekwencja DNA wedł ug zastrz. 6, gdzie DNA stanowi genomowy lub wyizolowany DNA odpowiedzialny za regulację ludzkiego wzrostu.
8. Sekwencja DNA wedł ug zastrz. 6, gdzie DNA stanowi cDNA.
9. cDNA wedł ug zastrz. 8, stanowią cy sekwencję nukleotydów SHOXa [SEQ. ID NO: 10] lub SHOXb [SEQ. ID NO: 12].
10. DNA według zastrz. 7, stanowiący sekwencję nukleotydową genu SHOX [SEQ. ID NO: 14].
11. Ludzkie białko wzrostu kodowane przez cząsteczkę DNA określoną w zastrz. 6 albo jego funkcjonalny fragment wykazujący działanie regulujące ludzki wzrost, znamienne tym, że białko ma sekwencję aminokwasów [SEQ. ID NO: 11] (czynnik transkrypcyjny SHOXa).
12. Ludzkie białko wzrostu kodowane przez cząsteczkę DNA określoną w zastrz. 6 albo jego funkcjonalny fragment wykazujący działanie regulujące ludzki wzrost, znamienne tym, że białko ma sekwencję aminokwasów [SEQ. ID NO: 13] (czynnik transkrypcyjny SHOXb).
13. Ludzkie białko wzrostu kodowane przez cząsteczkę DNA [SEQ. ID NO: 15] albo jego funkcjonalny fragment wykazujący działanie regulujące ludzki wzrost, znamienne tym, że białko ma sekwencję aminokwasów [SEQ. ID NO: 16] (czynnik transkrypcyjny SHOT).
14. cDNA kodujący ludzkie białko wzrostu określone w zastrz. 11 albo 12, albo 13, znamienny tym, że białko ma sekwencję aminokwasów [SEQ. ID NO: 11], [SEQ. ID NO: 13] lub [SEQ. ID NO: 16].
15. Środek farmaceutyczny, znamienny tym, że zawiera ludzkie białko wzrostu określone w zastrz. 11 albo 12 albo 13.
16. Zastosowanie ludzkiego białka wzrostu określonego w zastrz. 11 albo 12, albo 13, do wytwarzania środka farmaceutycznego do leczenia niskiego wzrostu.
17. Zastosowanie sekwencji DNA określonej w zastrz. 1 albo 6, albo 14, albo jej fragmentu, do wytwarzania środka farmaceutycznego do leczenia zaburzeń związanych z mutacjami genu niskiego wzrostu [genu SHOX] [SEQ. ID NO: 14].
18. Zastosowanie sekwencji DNA określonej w zastrz. 1 albo 6, albo 14, albo jej fragmentu, do wytwarzania zastawu do identyfikacji osób z genetycznym defektem odpowiedzialnym za zmniejszony ludzki wzrost.
19. Zastosowanie sekwencji DNA, określonej w zastrz. 1 albo 6, albo 14, albo jej fragmentu, do identyfikacji genu odpowiedzialnego za niski ludzki wzrost.
20. Sposób określania niskiego wzrostu na podstawie cząsteczek RNA lub DNA, znamienny tym, że cząsteczkę z próbki biologicznej, która ma być badana, amplifikuje się w obecności dwóch sond nukleotydowych komplementarnych z którąkolwiek z sekwencji DNA wybranych z [SEQ. ID NO: 2] do [SEQ. ID NO: 7], a następnie cząsteczkę tę wykrywa się za pomocą systemu detekcji wykrywającego amplifikowane kwasy nukleinowe.
21. Sposób identyfikacji defektu genetycznego w próbce biologicznej pobranej od człowieka podejrzewanego o przenoszenie mutacji genetycznej w genie SHOX, znamienny tym, że
a) pobiera się od człowieka próbkę genetyczną zawierającą polinukleotyd;
PL 194 248 B1
b) amplifikuje się polinukleotyd z części a) w obecności startera, przy czym ten starter stanowi starter flankujący egzon dla sekwencji nukleotydów egzonu genu SHOX [SEQ. ID NO: 14], przy czym sekwencja nukleotydów egzonu hybrydyzuje z polinukleotydową sekwencją [SEQ. ID NO: 14] w następujących ostrych warunkach hybrydyzacji: 0,5 M NaPi o pH 7,2, 7% SDS i 1 mM EDTA w 65°C, oraz
c) identyfikuje się produkt amplifikacji polinukleotydu z a) jako oznakę mutacji genetycznej w genie SHOX tego człowieka.
22. Komórki transformowane sekwencją DNA określoną w zastrz. 1 albo 6, albo 14.
23. Układ testowy do identyfikacji lub badań przesiewowych środków farmaceutycznych, przydatnych w leczeniu niskiego wzrostu u człowieka, znamienny tym, że układ ten zawiera komórkę określoną w zastrz. 22.
24. Sposób identyfikacji lub badań przesiewowych potencjalnych środków farmaceutycznych przydatnych w leczeniu zaburzeń związanych z mutacjami w genie niskiego wzrostu, znamienny tym, że stosuje się układ testowy zawierający komórkę transformowaną sekwencją DNA, określoną w zastrz. 1 albo 6, albo 14 oraz określa się zmiany w fenotypie tych komórek lub zmiany w produktach ekspresji tych komórek porównując fenotypy tych komórek lub produkty ekspresji tych komórek zarówno przed, jak i po skontaktowaniu tych komórek z potencjalnymi środkami farmaceutycznymi.
25. Wektor ekspresyjny zawierający cząsteczkę DNA określoną w zastrz. 1 albo 6, albo 14, zdolny do przeprowadzenia ekspresji kodowanego polipeptydu.
26. Zastosowanie ludzkich białek wzrostu określonych w zastrz. 11 albo 12, albo 13, albo ich funkcjonalnych fragmentów wykazujących działanie regulujące ludzki wzrost, do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOX [SEQ. ID NO: 14].
27. Zastosowanie według zastrz. 26, w którym mutacja genetyczna jest spowodowana gorącym miejscem mutacji w sekwencji DNA kodującej skrócenie białka w pozycji aminokwasu 195 w ludzkim genie wzrostu SHOX.
28. Zastosowanie ludzkiego hormonu wzrostu do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOX [SEQ. ID NO: 14], z wykluczeniem wytwarzania leków do leczenia pacjentów z zespołem Turnera.
29. Zastosowanie ludzkich białek wzrostu określonych w zastrz. 11 albo 12, albo 13, albo ich funkcjonalnych fragmentów wykazujących działanie regulujące ludzki wzrost, do wytwarzania leków do leczenia pacjentów z mutacją genetyczną ludzkich genów wzrostu SHOT [SEQ. ID NO: 15].
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US2763396P | 1996-10-01 | 1996-10-01 | |
| EP97100583 | 1997-01-16 | ||
| PCT/EP1997/005355 WO1998014568A1 (en) | 1996-10-01 | 1997-09-29 | Human growth gene and short stature gene region |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| PL332568A1 PL332568A1 (en) | 1999-09-27 |
| PL194248B1 true PL194248B1 (pl) | 2007-05-31 |
Family
ID=26145174
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PL97332568A PL194248B1 (pl) | 1996-10-01 | 1997-09-29 | Cząsteczka kwasu nukleinowego kodująca polipeptydy, ludzkie białko wzrostu kodowane przez cząsteczkę DNA, cDNA kodujący ludzkie białko wzrostu, środek farmaceutyczny, zastosowanie ludzkiego białka wzrostu oraz sekwencji DNA, sposób określania niskiego wzrostu, sposób identyfikacji defektu genetycznego, komórki transformowane sekwencją DNA, układ testowy i sposób identyfikacji lub badań przesiewowych, wektor ekspresyjny oraz zastosowanie ludzkichbiałek wzrostu |
Country Status (20)
| Country | Link |
|---|---|
| US (2) | US7252974B2 (pl) |
| EP (2) | EP1260228A3 (pl) |
| JP (2) | JP2000515025A (pl) |
| KR (1) | KR20000048838A (pl) |
| CN (1) | CN1232499A (pl) |
| AT (1) | ATE230026T1 (pl) |
| AU (1) | AU744188C (pl) |
| BR (1) | BR9712185A (pl) |
| CA (2) | CA2647169A1 (pl) |
| CZ (1) | CZ297640B6 (pl) |
| DE (1) | DE69718052T2 (pl) |
| DK (1) | DK0946721T3 (pl) |
| ES (1) | ES2188992T3 (pl) |
| HU (1) | HU225131B1 (pl) |
| IL (1) | IL129015A0 (pl) |
| NO (1) | NO991554L (pl) |
| NZ (1) | NZ334970A (pl) |
| PL (1) | PL194248B1 (pl) |
| SI (1) | SI0946721T1 (pl) |
| WO (1) | WO1998014568A1 (pl) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000056765A1 (en) * | 1999-03-19 | 2000-09-28 | Human Genome Sciences, Inc. | 48 human secreted proteins |
| CA2368469A1 (en) * | 1999-03-26 | 2000-10-05 | Craig A. Rosen | 50 human secreted proteins |
| EP2280030A3 (en) | 2001-04-10 | 2011-06-15 | Agensys, Inc. | Nucleic acids and corresponding proteins useful in the detection and treatment of various cancers |
| US7927597B2 (en) | 2001-04-10 | 2011-04-19 | Agensys, Inc. | Methods to inhibit cell growth |
| EP1439225A4 (en) | 2001-10-04 | 2005-10-26 | Kansai Tech Licensing Org Co | DR5-GEN PROMOTER AND SIAH-1-GEN PROMOTER |
| US20060172929A1 (en) * | 2003-01-13 | 2006-08-03 | Gudrun Rappold-Hoerbrand | Use of natriuretic peptides for the treatment of stature disorders related to the shox gene |
| KR20080011287A (ko) | 2005-04-15 | 2008-02-01 | 에피제노믹스 아게 | 세포 증식 질환을 분석하기 위한 방법 및 핵산 |
| US7382944B1 (en) | 2006-07-14 | 2008-06-03 | The United States Of America As Represented By The Administration Of The National Aeronautics And Space Administration | Protective coating and hyperthermal atomic oxygen texturing of optical fibers used for blood glucose monitoring |
| DK2258871T3 (da) * | 2007-01-19 | 2014-08-11 | Epigenomics Ag | Fremgangsmåder og nukleinsyrer til analyse af celleproliferative lidelser |
| EP2994541A4 (en) | 2013-05-06 | 2017-01-18 | Capilet Genetics AB | Diagnostic test for skeletal atavism in horses |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE3445933A1 (de) * | 1984-12-17 | 1986-06-19 | Röhm GmbH, 6100 Darmstadt | Arzneimittel mit diuretischer wirksamkeit |
| US4983511A (en) * | 1989-01-09 | 1991-01-08 | Olin Corporation | Method and kit for detecting live microorganisms in chlorine- or bromine-treated water |
-
1997
- 1997-09-29 KR KR1019990702836A patent/KR20000048838A/ko not_active Withdrawn
- 1997-09-29 ES ES97944906T patent/ES2188992T3/es not_active Expired - Lifetime
- 1997-09-29 EP EP02011329A patent/EP1260228A3/en not_active Withdrawn
- 1997-09-29 AT AT97944906T patent/ATE230026T1/de active
- 1997-09-29 PL PL97332568A patent/PL194248B1/pl not_active IP Right Cessation
- 1997-09-29 WO PCT/EP1997/005355 patent/WO1998014568A1/en not_active Ceased
- 1997-09-29 NZ NZ334970A patent/NZ334970A/xx unknown
- 1997-09-29 CA CA002647169A patent/CA2647169A1/en not_active Abandoned
- 1997-09-29 IL IL12901597A patent/IL129015A0/xx unknown
- 1997-09-29 CA CA002267097A patent/CA2267097A1/en not_active Abandoned
- 1997-09-29 BR BR9712185-1A patent/BR9712185A/pt unknown
- 1997-09-29 CN CN97198471A patent/CN1232499A/zh active Pending
- 1997-09-29 JP JP10516222A patent/JP2000515025A/ja active Pending
- 1997-09-29 EP EP97944906A patent/EP0946721B1/en not_active Expired - Lifetime
- 1997-09-29 DK DK97944906T patent/DK0946721T3/da active
- 1997-09-29 SI SI9730485T patent/SI0946721T1/xx unknown
- 1997-09-29 DE DE69718052T patent/DE69718052T2/de not_active Expired - Lifetime
- 1997-09-29 CZ CZ0096699A patent/CZ297640B6/cs not_active IP Right Cessation
- 1997-09-29 AU AU46252/97A patent/AU744188C/en not_active Ceased
- 1997-09-29 HU HU9904175A patent/HU225131B1/hu not_active IP Right Cessation
-
1999
- 1999-03-30 NO NO991554A patent/NO991554L/no not_active Application Discontinuation
-
2002
- 2002-05-31 US US10/158,160 patent/US7252974B2/en not_active Expired - Fee Related
-
2004
- 2004-03-02 JP JP2004058276A patent/JP2004201692A/ja active Pending
-
2007
- 2007-05-15 US US11/748,769 patent/US20090111744A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| EP1260228A3 (en) | 2003-03-05 |
| DK0946721T3 (da) | 2003-04-14 |
| CA2647169A1 (en) | 1998-04-09 |
| PL332568A1 (en) | 1999-09-27 |
| CZ96699A3 (cs) | 1999-08-11 |
| WO1998014568A1 (en) | 1998-04-09 |
| AU744188B2 (en) | 2002-02-14 |
| NO991554D0 (no) | 1999-03-30 |
| KR20000048838A (ko) | 2000-07-25 |
| IL129015A0 (en) | 2000-02-17 |
| AU4625297A (en) | 1998-04-24 |
| EP0946721B1 (en) | 2002-12-18 |
| US7252974B2 (en) | 2007-08-07 |
| AU744188C (en) | 2003-07-24 |
| JP2004201692A (ja) | 2004-07-22 |
| NZ334970A (en) | 2000-12-22 |
| EP1260228A2 (en) | 2002-11-27 |
| DE69718052T2 (de) | 2003-07-31 |
| HUP9904175A2 (hu) | 2000-04-28 |
| BR9712185A (pt) | 1999-08-31 |
| DE69718052D1 (de) | 2003-01-30 |
| US20090111744A1 (en) | 2009-04-30 |
| CN1232499A (zh) | 1999-10-20 |
| JP2000515025A (ja) | 2000-11-14 |
| CZ297640B6 (cs) | 2007-02-21 |
| ES2188992T3 (es) | 2003-07-01 |
| NO991554L (no) | 1999-05-14 |
| CA2267097A1 (en) | 1998-04-09 |
| EP0946721A1 (en) | 1999-10-06 |
| US20030059805A1 (en) | 2003-03-27 |
| ATE230026T1 (de) | 2003-01-15 |
| HU225131B1 (en) | 2006-06-28 |
| HUP9904175A3 (en) | 2002-01-28 |
| SI0946721T1 (en) | 2003-06-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8962269B2 (en) | Spinal muscular atrophy diagnostic methods | |
| US5800998A (en) | Assays for diagnosing type II diabetes in a subject | |
| US20090111744A1 (en) | Human Growth Gene and Short Stature Gene Region | |
| US6630304B1 (en) | Human osteoporosis gene | |
| US20030190639A1 (en) | Genes involved in intestinal inflamatory diseases and use thereof | |
| CA2502359A1 (en) | Susceptibility gene for myocardial infarction | |
| US6566061B1 (en) | Identification of polymorphisms in the PCTG4 region of Xq13 | |
| JP2002510508A (ja) | 緑内障の治療剤および診断剤 | |
| WO2003076658A2 (en) | A susceptibility gene for late-onset idiopathic parkinson's disease | |
| US6350867B1 (en) | Compositions and methods for enhancing osseous growth, repair and regeneration | |
| US20030027153A1 (en) | Methods and compositions for diagnosing and treating neuropsychiatric disorders such as schizophrenia | |
| MXPA99002809A (en) | Human growth gene and short stature gene region | |
| WO1998021363A1 (en) | Compositions and methods for treating type ii diabetes involving hnf-4 | |
| Class et al. | Patent application title: Human Growth Gene and Short Stature Gene Region Inventors: Gudrun Rappold-Hoerbrand (Heidelberg, DE) Ercole Rao (Riedstadt, DE) | |
| US20030176344A1 (en) | Human osteoporosis gene | |
| WO2004065938A2 (en) | Human osteoporosis gene | |
| US20030082714A1 (en) | Novel nucleic acid and polypeptide | |
| WO1998040495A1 (en) | Doublin, a gene involved in neuronal development and uses therefor | |
| EP1585837A2 (en) | Human osteoporosis gene |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RECP | Rectifications of patent specification | ||
| LAPS | Decisions on the lapse of the protection rights |
Effective date: 20110929 |