CZ96699A3 - Isolovaná lidská molekula nukleové kyseliny kodující polypeptidy, růstový protein a jeho použití a způsob - Google Patents
Isolovaná lidská molekula nukleové kyseliny kodující polypeptidy, růstový protein a jeho použití a způsob Download PDFInfo
- Publication number
- CZ96699A3 CZ96699A3 CZ99966A CZ96699A CZ96699A3 CZ 96699 A3 CZ96699 A3 CZ 96699A3 CZ 99966 A CZ99966 A CZ 99966A CZ 96699 A CZ96699 A CZ 96699A CZ 96699 A3 CZ96699 A3 CZ 96699A3
- Authority
- CZ
- Czechia
- Prior art keywords
- seq
- human growth
- dna
- gene
- shox
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 157
- 230000012010 growth Effects 0.000 title claims abstract description 73
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 31
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 30
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 title claims abstract description 28
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 18
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 14
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 14
- 102000004169 proteins and genes Human genes 0.000 title claims description 35
- 230000008569 process Effects 0.000 title description 2
- 239000002299 complementary DNA Substances 0.000 claims abstract description 33
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 23
- 150000001413 amino acids Chemical class 0.000 claims abstract description 21
- 230000001105 regulatory effect Effects 0.000 claims abstract description 16
- 108020004414 DNA Proteins 0.000 claims description 46
- 108700025071 Short Stature Homeobox Proteins 0.000 claims description 44
- 101100477520 Homo sapiens SHOX gene Proteins 0.000 claims description 43
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 32
- 230000014509 gene expression Effects 0.000 claims description 31
- 239000002773 nucleotide Substances 0.000 claims description 31
- 230000035772 mutation Effects 0.000 claims description 30
- 125000003729 nucleotide group Chemical group 0.000 claims description 29
- 210000004027 cell Anatomy 0.000 claims description 28
- 208000026928 Turner syndrome Diseases 0.000 claims description 25
- 239000012634 fragment Substances 0.000 claims description 20
- 238000012360 testing method Methods 0.000 claims description 18
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 16
- 230000007547 defect Effects 0.000 claims description 16
- 101150012871 SHOX gene Proteins 0.000 claims description 14
- 108091023040 Transcription factor Proteins 0.000 claims description 13
- 102000040945 Transcription factor Human genes 0.000 claims description 13
- 239000000523 sample Substances 0.000 claims description 13
- 101000703741 Homo sapiens Short stature homeobox protein 2 Proteins 0.000 claims description 12
- 230000009395 genetic defect Effects 0.000 claims description 11
- 102000053602 DNA Human genes 0.000 claims description 10
- 102100031976 Short stature homeobox protein 2 Human genes 0.000 claims description 9
- 238000002360 preparation method Methods 0.000 claims description 9
- 241001465754 Metazoa Species 0.000 claims description 8
- 239000003795 chemical substances by application Substances 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 230000001747 exhibiting effect Effects 0.000 claims description 6
- 239000008177 pharmaceutical agent Substances 0.000 claims description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical class C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 5
- 241000282412 Homo Species 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 239000013613 expression plasmid Substances 0.000 claims description 4
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- 239000012472 biological sample Substances 0.000 claims description 3
- 229940079593 drug Drugs 0.000 claims description 3
- 230000009643 growth defect Effects 0.000 claims description 3
- 102000002265 Human Growth Hormone Human genes 0.000 claims description 2
- 108010000521 Human Growth Hormone Proteins 0.000 claims description 2
- 239000000854 Human Growth Hormone Substances 0.000 claims description 2
- 238000003556 assay Methods 0.000 claims description 2
- 230000033228 biological regulation Effects 0.000 claims description 2
- 239000013604 expression vector Substances 0.000 claims description 2
- 238000001415 gene therapy Methods 0.000 claims description 2
- 238000001727 in vivo Methods 0.000 claims description 2
- 230000009261 transgenic effect Effects 0.000 claims description 2
- 102100029992 Short stature homeobox protein Human genes 0.000 claims 7
- 230000000295 complement effect Effects 0.000 claims 1
- 210000005260 human cell Anatomy 0.000 claims 1
- 102000040430 polynucleotide Human genes 0.000 claims 1
- 108091033319 polynucleotide Proteins 0.000 claims 1
- 239000002157 polynucleotide Substances 0.000 claims 1
- 238000004904 shortening Methods 0.000 claims 1
- 208000020221 Short stature Diseases 0.000 abstract description 66
- 210000001766 X chromosome Anatomy 0.000 abstract description 26
- 210000002593 Y chromosome Anatomy 0.000 abstract description 14
- 238000011161 development Methods 0.000 abstract description 6
- 238000002560 therapeutic procedure Methods 0.000 abstract description 3
- 108050009606 Homeobox domains Proteins 0.000 abstract 1
- 102000001420 Homeobox domains Human genes 0.000 abstract 1
- 238000012217 deletion Methods 0.000 description 33
- 230000037430 deletion Effects 0.000 description 33
- 239000013615 primer Substances 0.000 description 31
- 102000048489 Short Stature Homeobox Human genes 0.000 description 27
- 210000000349 chromosome Anatomy 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 15
- 206010053759 Growth retardation Diseases 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 13
- 108700005087 Homeobox Genes Proteins 0.000 description 12
- 108700024394 Exon Proteins 0.000 description 11
- 230000003321 amplification Effects 0.000 description 11
- 238000003199 nucleic acid amplification method Methods 0.000 description 11
- 239000013598 vector Substances 0.000 description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- RGTVXXNMOGHRAY-WDSKDSINSA-N Cys-Arg Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RGTVXXNMOGHRAY-WDSKDSINSA-N 0.000 description 8
- 241000699666 Mus <mouse, genus> Species 0.000 description 8
- 210000001185 bone marrow Anatomy 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 230000001605 fetal effect Effects 0.000 description 8
- 210000002950 fibroblast Anatomy 0.000 description 8
- 238000007901 in situ hybridization Methods 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 102000018997 Growth Hormone Human genes 0.000 description 7
- 210000004556 brain Anatomy 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 239000000122 growth hormone Substances 0.000 description 7
- 230000004807 localization Effects 0.000 description 7
- 210000002027 skeletal muscle Anatomy 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 6
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 6
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 6
- 108010051696 Growth Hormone Proteins 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 230000031864 metaphase Effects 0.000 description 6
- 239000003155 DNA primer Substances 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 238000002105 Southern blotting Methods 0.000 description 5
- WXVIGTAUZBUDPZ-DTLFHODZSA-N Thr-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 WXVIGTAUZBUDPZ-DTLFHODZSA-N 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 4
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 4
- 208000031639 Chromosome Deletion Diseases 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 4
- 208000037492 Sex Chromosome Aberrations Diseases 0.000 description 4
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 4
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 4
- 210000002826 placenta Anatomy 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 208000011580 syndromic disease Diseases 0.000 description 4
- 208000035970 Chromosome Breakpoints Diseases 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 102000009331 Homeodomain Proteins Human genes 0.000 description 3
- 108010048671 Homeodomain Proteins Proteins 0.000 description 3
- 101000916625 Homo sapiens Granulocyte-macrophage colony-stimulating factor receptor subunit alpha Proteins 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 3
- 206010072610 Skeletal dysplasia Diseases 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 108020005038 Terminator Codon Proteins 0.000 description 3
- 108091036066 Three prime untranslated region Proteins 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 210000000988 bone and bone Anatomy 0.000 description 3
- 210000000133 brain stem Anatomy 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000002559 cytogenic effect Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 3
- 210000004090 human X chromosome Anatomy 0.000 description 3
- 230000016507 interphase Effects 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 230000008774 maternal effect Effects 0.000 description 3
- 230000008707 rearrangement Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 210000003765 sex chromosome Anatomy 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 108010027345 wheylin-1 peptide Proteins 0.000 description 3
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- 101150014733 ASP5 gene Proteins 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 102100021257 Beta-secretase 1 Human genes 0.000 description 2
- 101710150192 Beta-secretase 1 Proteins 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- 101100436100 Caenorhabditis elegans asp-6 gene Proteins 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 208000013558 Developmental Bone disease Diseases 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108091008794 FGF receptors Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 102100028113 Granulocyte-macrophage colony-stimulating factor receptor subunit alpha Human genes 0.000 description 2
- 101000746373 Homo sapiens Granulocyte-macrophage colony-stimulating factor Proteins 0.000 description 2
- 101000581940 Homo sapiens Napsin-A Proteins 0.000 description 2
- 101000863841 Homo sapiens Short stature homeobox protein Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 208000006302 Laron syndrome Diseases 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 2
- 101100328158 Mus musculus Clmp gene Proteins 0.000 description 2
- 101100459248 Mus musculus Mxra8 gene Proteins 0.000 description 2
- 102100027343 Napsin-A Human genes 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 101100489854 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) AAT2 gene Proteins 0.000 description 2
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 108010011559 alanylphenylalanine Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 101150016874 asp3 gene Proteins 0.000 description 2
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 208000037516 chromosome inversion disease Diseases 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- 230000019975 dosage compensation by inactivation of X chromosome Effects 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 208000002566 gonadal dysgenesis Diseases 0.000 description 2
- 231100000001 growth retardation Toxicity 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000002216 heart Anatomy 0.000 description 2
- 210000003917 human chromosome Anatomy 0.000 description 2
- 210000003016 hypothalamus Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000007479 molecular analysis Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004153 renaturation Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 231100001055 skeletal defect Toxicity 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 108091035539 telomere Proteins 0.000 description 2
- 102000055501 telomere Human genes 0.000 description 2
- 238000000123 temperature gradient gel electrophoresis Methods 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 229940036555 thyroid hormone Drugs 0.000 description 2
- 239000005495 thyroid hormone Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 108010020567 12E7 Antigen Proteins 0.000 description 1
- 102000008482 12E7 Antigen Human genes 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 102100026445 A-kinase anchor protein 17A Human genes 0.000 description 1
- 102100026397 ADP/ATP translocase 3 Human genes 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- MYVBTYXSWILFCG-BQBZGAKWSA-N Asn-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N MYVBTYXSWILFCG-BQBZGAKWSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 208000020084 Bone disease Diseases 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 208000016718 Chromosome Inversion Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 108010003384 Colony-Stimulating Factor Receptors Proteins 0.000 description 1
- 102000004626 Colony-Stimulating Factor Receptors Human genes 0.000 description 1
- 102000003712 Complement factor B Human genes 0.000 description 1
- 108090000056 Complement factor B Proteins 0.000 description 1
- 208000032170 Congenital Abnormalities Diseases 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 201000009343 Cornelia de Lange syndrome Diseases 0.000 description 1
- 208000004468 Craniofacial Abnormalities Diseases 0.000 description 1
- 241001301450 Crocidium multicaule Species 0.000 description 1
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 208000003471 De Lange Syndrome Diseases 0.000 description 1
- 206010013883 Dwarfism Diseases 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 102000044168 Fibroblast Growth Factor Receptor Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- MAJYPBAJPNUFPV-BQBZGAKWSA-N His-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MAJYPBAJPNUFPV-BQBZGAKWSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- 101000718019 Homo sapiens A-kinase anchor protein 17A Proteins 0.000 description 1
- 101000718437 Homo sapiens ADP/ATP translocase 3 Proteins 0.000 description 1
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 102000004374 Insulin-like growth factor binding protein 3 Human genes 0.000 description 1
- 108090000965 Insulin-like growth factor binding protein 3 Proteins 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- 108010014691 Lithostathine Proteins 0.000 description 1
- 102100027361 Lithostathine-1-alpha Human genes 0.000 description 1
- ZYTPOUNUXRBYGW-YUMQZZPRSA-N Met-Met Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCSC ZYTPOUNUXRBYGW-YUMQZZPRSA-N 0.000 description 1
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 208000001132 Osteoporosis Diseases 0.000 description 1
- 102000005877 Peptide Initiation Factors Human genes 0.000 description 1
- 108010044843 Peptide Initiation Factors Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 102100029812 Protein S100-A12 Human genes 0.000 description 1
- 101710110949 Protein S100-A12 Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 101150039863 Rich gene Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- 101000870345 Vasconcellea cundinamarcensis Cysteine proteinase 1 Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- 238000012197 amplification kit Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 210000000709 aorta Anatomy 0.000 description 1
- 108010068991 arginyl-threonyl-prolyl-prolyl-prolyl-seryl-glycine Proteins 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000007698 birth defect Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 230000014107 chromosome localization Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- SSJJWVREPZVNBF-DGXVIIAXSA-N dG10 Chemical compound C1=NC(C(NC(N)=N2)=O)=C2N1[C@H](O[C@@H]1COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C3=C(C(NC(N)=N3)=O)N=C2)CO)C[C@@H]1OP(O)(=O)OC[C@@H](O1)[C@@H](O)C[C@@H]1N1C(N=C(NC2=O)N)=C2N=C1 SSJJWVREPZVNBF-DGXVIIAXSA-N 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 231100001129 embryonic lethality Toxicity 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 210000000744 eyelid Anatomy 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 102000052178 fibroblast growth factor receptor activity proteins Human genes 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 235000012631 food intake Nutrition 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 102000046157 human CSF2 Human genes 0.000 description 1
- 102000047121 human SHOX Human genes 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- IXHBTMCLRNMKHZ-LBPRGKRZSA-N levobunolol Chemical compound O=C1CCCC2=C1C=CC=C2OC[C@@H](O)CNC(C)(C)C IXHBTMCLRNMKHZ-LBPRGKRZSA-N 0.000 description 1
- 238000002794 lymphocyte assay Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 230000036244 malformation Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 210000003716 mesoderm Anatomy 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 230000002297 mitogenic effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 208000030454 monosomy Diseases 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000008212 organismal development Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002188 osteogenic effect Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000003254 palate Anatomy 0.000 description 1
- 101150093826 par1 gene Proteins 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- PHEDXBVPIONUQT-RGYGYFBISA-N phorbol 13-acetate 12-myristate Chemical compound C([C@]1(O)C(=O)C(C)=C[C@H]1[C@@]1(O)[C@H](C)[C@H]2OC(=O)CCCCCCCCCCCCC)C(CO)=C[C@H]1[C@H]1[C@]2(OC(C)=O)C1(C)C PHEDXBVPIONUQT-RGYGYFBISA-N 0.000 description 1
- 239000002644 phorbol ester Substances 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 108091035233 repetitive DNA sequence Proteins 0.000 description 1
- 102000053632 repetitive DNA sequence Human genes 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 229930002330 retinoic acid Natural products 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000011896 sensitive detection Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 229960001727 tretinoin Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000036266 weeks of gestation Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/02—Drugs for disorders of the endocrine system of the hypothalamic hormones, e.g. TRH, GnRH, CRH, GRH, somatostatin
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/06—Drugs for disorders of the endocrine system of the anterior pituitary hormones, e.g. TSH, ACTH, FSH, LH, PRL, GH
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Animal Behavior & Ethology (AREA)
- Biomedical Technology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Diabetes (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pharmacology & Pharmacy (AREA)
- General Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Endocrinology (AREA)
- Hematology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Obesity (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Description
Oblast techniky
Vynález se týká izolace, identifikace a charakterizace nově identifikovaných lidských genů, které odpovídají za vady lidského růstu, zvláště za malou výšku postavy nebo Turnérův syndrom. Dále se vynález týká diagnózy a terapie takových vad. Izolovaná genomová DNA nebo její fragmenty se mohou použít pro farmaceutické účely nebo jako diagnostické nástroje nebo činidla pro identifikaci nebo charakterizaci genetických defektů, které se podílejí na uvedených vadách. Vynález dále popisuje lidské růstové proteiny (transkripční faktory A, B a C) , které se exprimují po transkripci uvedené DNA na RNA nebo mRNA a které se mohou použít při terapii vad spojených s mutacemi v uvedených genech. Dále se popisují vhodné sekvence cDNA, které se mohou použít při přípravě rekombinantních proteinů vhodných pro léčbu takových vad. Předmětem vynálezu jsou dále plazmidové vektory vhodné pro expresi DNA těchto genů a vhodné buňky, které obsahují takovou DNA. Dále se popisují metody genetické léčby uvedených vad v oboru molekulární medicíny za použití expresivního plazmidu připraveného inkorporací DNA dównstream expresivního promotoru, který umožňuje expresi v savčí hostitelské buňce.
Dosavadní stav techniky
Růst je základní aspekt vývoje organizmu. Je regulovaný vysoce organizovaným a komplexním systémem. Výška postavy je multifaktorový rys, který je ovlivněn faktory prostředí a genetickými faktory. Vývojové malformace, které zahrnují výšku postavy, jsou běžným jevem u lidí všech ras. V případě lidí je četnost výskytu 3 ze 100 a retardace růstu vede k malé • · · · · • · · · • · · · · · • · · · · · • · velikosti postavy, za což ve většině případů odpovídají vrozené vady.
Turnérův syndorm je běžná ohromo zoinální vada (Rosenfeld RG, Tesch L-G, Rodriguez-Rigau LJ, McCauley E, Albertsson-Wikland K, Asch R, Cara J, Conte F, Halí JG, Lippe B, Nagel TC, Neely EK, Page DC, Ranke M, Saenger P, Watkins JM, Wilson DM (1994): Recommendations for diagnosis, treatment, and management of individuals with Turner syndrom. The Endocrinologist 4(5) : 351-358) s četností výskytu 1:2 500 u živě narozených žen. Odhaduje se, že 1 až 2 % oplodnění u lidí má karyotyp 45,X a že až 99 % takových plodů nepřichází na svět v termínu (Halí J.G., Gilchrist D.M. (1990): Turner syndrome and its variants. Pedriatr. Clin. North Am. 37: obinson A (1990): Demography and prevalence of Turner syndrome. In: Turner Syndrome., edited by Rosenfield R.G., Grumbach M.M., pp. 93 - 100, New York, Marcel Dekker). U lidí s Turnérovým syndromem (nebo s UllrichTurnerovým syndromem) existuje podstatná klinická variabilita fenotypu (Ullrich, 1930; Turner, 1938). Malá výška postavy je konsistentní nález a spolu s gonádovou dysgenezí se považuje za vedoucí symptom uvedených vad. Turnerový syndrom je skutečná multifaktorová vada. Uvažuje se, že za embryonální letalitu, malou výšku postavy, gonodovou dysgenezi a charakteristické somatické rysy odpovídají monosomy genů, které jsou běžné u X a Y chromozomů. Ukazuje se, že pro normální vývoj člověka jsou nutné diploidy těchto homologních genů X-Y. Očekává se, že Turnérovy geny (nebo anti-Turnerovy geny) se u žen exprimují jak z aktivního tak z neaktivního chromozomu X nebo chromozomu Y, aby se zajistila správná dávka genového produktu. Haplo-nedostatečnost (nedostatečnost způsobená pouze jednou aktivní kopií) naznačuje mechanizmus vedoucí k onemocnění.
Dosud se objasnila řada mechanizmů, které vedou k malé výšce postavy. Nedostatečnost růstového hormonu a receptorů růstového hormonu, stejně jako vady skeletu se popisují jako • · · · · · · · · · ···· · ··· · ·· · • · · · · · ···· · ··· ··· ······ · · • · · · · ·· · ·· ·· příklady fenotypu s malou výškou postavy (Martial et al.,(1979; Phillips et al., 1981; Leung et al., 1987; Goddard et al., 1995). Identifikovaly se mutace ve třech genech, které kódují receptor lidského fibroblastového růstového faktoru (FGFR 1-3) a způsobují řadu vad skeletu. Tyto vady zahrnují většinu forem trpasličího vzrůstu, achondroplázie (Shiang et al. , 1994; Rousseau et al., 1994; Muenke and Schell, 1995) . Dobře známá a častá chromozomální vada ( objevuje se u jedné z 2 500 žen) Turnérův syndrom (45,X) je také spojena s malou výškou postavy. Všechny tyto důvody však odpovídají pouze za malou část pacientů s malou výškou postavy. Většina případů zatím zůstává nevysvětlena.
Věří se, že chromozomy X a Y nesou geny, které ovlivňují výšku postavy (Ogata T, Tyler-Smith C, Purvis-Smith S, Turner G. (1993): Chromosomal localisation of a gene(s) for Turner stigmata on Yp. J. Med. Genet. 30: 918-922). To se může u pacientů s abnormalitami pohlavních chromozomů odvodit ze vztahu genotyp-fenotyp. Cytogenetické studie dokazují, že delece konců krátkých ramen buď chromozomu X nebo Y vedou u některých jedinců k malé výšce postavy (Zuffardi et al., 1982); Curry et al., 1984). Uvádí se více než 20 uspořádání chromozomu, které se spojují s delecemi konců chromozomu Xp a Yp a které nesou gen(y) odpovědné za malou výšku postavy, s pseudoautozornálni oblastí (PARI) (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P., Zuffardi O., Guilo S., Camerino G., (1989): Contiguous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome . Proč. Nati. Acad. Sci USA 86: 10001-10005.; Schaefer L., Ferrero G.B., Grillo A., Bassi M.T. Roth E.J. Wapenaar M.C., Van Ommen -J.B., Mohandas T.K., Rocchi M., Zoghbi H.Y. Ballabio A. (1993): A high resolution deletion map of human chromosome Xp22. Nátuře genetics 4: 272279). Pozice těchto genů se zúžila na distální DNA o velikosti i
• · ·
700 kb oblasti PARI, kterou lemuje markér DXYS15 (Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T.,
Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834;
Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629) .
Regulace růstu u savců je organizována jako komplexní systém. Je možné, že vysoce organizovaným způsobem spolu reaguje více genů (proteinů), které podporují růst. Jeden z těchto genů, který odpovídá za výšku postavy, se zmapoval až do pseudoautozomální oblasti PARI (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P., Zuffardi O., Guilo S., Camerino G., (1989): Contiguous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome . Proč. Nati. Acad. Sci USA 86: 10001-10005) , což je oblast, o které se ví, že je volně zaměnitelná mezi chromozomy X a Y (Rappold G.A. (1993) : The pseudoautosomal region of the human sex chromosomes. Hum. Genet. 92: 315-324). Celá oblast RAPI je přibližně 2 700 kb velká.
U pacientů s delecí se definovala kritická oblast ovlivňující výšku postavy. K malé výšce postavy dochází v případě, když se deletuje celá oblast o velikosti 700 kb nebo když je specifický gen v této kritické oblasti přítomen v haploidním stavu nebo když je přerušen nebo mutován (jako je případ
*· ·· · · · ·· • · « · · · · · ··· · ··· · · · · • · · · · ···· · ··· ··· • · · · · · · ·· ·· · '♦· «· idiotypické malé výšky postavy nebo Turnérův syndrom). Frekvence výskytu Turnérova syndromu ve světě je jedna z 2 500 žen; četnost výskytu tohoto druhu idiopatické malé výšky postavy se odhaduje na 1 případ ze 4 000 až 5 000 osob. Ženám s Turnérovým syndromem a některým jednotlivcům s malou výškou postavy se obvykle po několik let až po několik desítek let aplikuje růstový hormon (GH) , ačkoli je známo, že jejich hladina růstového hormonu v těle je normální a nedostatečnost GH zde není problémem. Léčba takových pacientů je velmi nákladná (odhaduje se přibližně na 30 000 USD ročně). Proto je nutné získat způsob rozlišení pacientů malého vzrůstu, kteří mají genetický defekt a pacienti, kteří nevykazují genetický defekt uvedeného genu. U pacientů s genetickým defektem tohoto genu - buď s úplnou delecí genu (jako je v případě Turnérova syndromu) nebo s bodovou mutací (jako je tomu u idiopatické malé výšky postavy)- je možné aplikovat alternativní léčbu bez lidského růstového hormonu.
Korelace genotyp/fenotyp podporují existenci růstového genu v proximální části Yq a v distální části Yp. Malá výška postavy se také objevuje u jedinců s terminálními delecemi Xp. Proběhlo rozsáhlé vyhledávání pacientů s částečnými monosomiemi pseudoautozomální oblasti. Na základě korelací genotyp-fenotyp se stanovila minimální běžná delece oblasti DNA o velikosti 700 kb (Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P.,
Petit C., Aya M., Matsuo N. (1992) : Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N.,
Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the • 4 4 4 4 4 4 4 4 4
494 «49 9944
9444 4 994 9 49 · • 9 444 4 4444 4 444 444 • 44444 4 4
44444 44 4 44 44 critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834). Zjistilo se, že uvedená oblast leží mezi genetickými markéry DXYS20 (3cosPP) a DXYS15 (113D) a u všech genů, které aspirují na řízení růstu, a leží v oblasti PARI (například receptor hemopoietického růstového faktoru; CSF2RA) (Gough N.M., Gearing D.P., Nicola N.A., Baker E., Pritchard
M. , Callen D.F., Sutherland G.R. (1990). Localization of the human GM-CSF receptor gene to the X-Aby pseudoautosomal region. Nátuře 345: 734736), se odstranily na základě jejich fyzikální pozice (Rappold G. A., Wilson T.A., Henke A., Gough
N. M. (1992): Arrangment and localization of the human GM-CSF receptor achain gene CSF2RA within the X-Aby pseudoautosomal region. Genomics 14: 455-461). Geny se nacházely v deleční oblasti o velikosti 700 kb PARI oblasti o velikosti 2 700 kb. Nedávno se objevily u jednotlivců s malým vzrůstem delece pseudoautozomální oblasti (PARI) pohlavních chromozomů a následně se také definovala minimální běžná oblast delece o velikosti 700 kb. Na základě analýzy DNA Southernovým přenosem u pacientů TIK a SS za použití odlišných pseudoautozomální ch markérů se identifikovala Xp terminální delece přibližně 700 kb od DXYS15 (113D) (Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P.,
Petit C., Aya M., Matsuo N. (1992) : Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N.,
Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834) .
·
• 4 · ·>·
Podstata vynálezu
Oblast genu odpovídající za malý vzrůst postavy se identifikovala jako oblast o velikosti přibližně 500 kb , s výhodou o velikosti přibližně 170 kb v PARI oblasti chromozomů X a Y. V této oblasti se identifikovaly tři geny jako kandidáti, kteří odpovídají za malý vzrůst. Tyto geny se označily SHOX (také jako SHOX93 nebo HOX93) (SHOX znamená gen obsahující homeobox malého vzrůstu), pET92 a SHOT (gen nesoucí homeobox podobný SHOX na chromozomu 3) . Zvláště významný je gen SHOX, který má dvě oddělená místa sestřihu, což vede ke vzniku dvou variací (SHOXa a b) . Během předchozích výzkumů se analyzovala podstatná část nukleotidové sekvence genu malého vzrůstu (SEQ ID NO: 8) . Mohou se předpovědět a identifikovat exony nebo jejich části (například exon I [G310]/ exon II [ET93]; exon IV [G108]; pET92) . Získané informace o sekvenci se pak mohou použít pro navržení vhodných primerů nebo nukleotidových sond, které hybridizují s částmi genu SHOX nebo jeho fragmenty. Gen SHOX se pak může izolovat běžnými metodami. Na základě další analýzy sekvence DNA genů zodpovědných za malý vzrůst se izoluje nukleotidová sekvence exonu I až V (uvedeno na obrázku č. 1 až 2). Gen SHOX obsahuje homeobox (SEQ ID NO: 1) o velikosti přibližně 180 bp (obrázek č. 2 a obrázek č. 3). Začíná nukleotidem, který kóduje aminokyselinu v pozici 117 (Q) , končí nukleotidem kódujícím aminokyselinu v pozici 176 (E) , to znamená od CAG(440) do GAG(619). U pacientů z Německa (AI) s malou výškou postavy a u pacientů Japonska, kde se testovalo 250 jednotlivců s idiopatickým malým vzrůstem, se identifikoval homeobox jako sekvence homeobox-pET93(SHOX) a zjistily se dvě bodové mutace. Obě bodové mutace se našly ve stejné pozici a vedou ke zkrácení proteinu v pozici aminokyseliny 195. To naznačuje, že zde může existovat tzv. horké místo. Na základě skutečnosti, že obě mutace, které vedou ke zkrácení proteinu, se vyskytují • · •9 ·9 · « 9 9 9 9 · · ·
999 9 99« · 99 · • 99* 9 999· 9 999 999
9 9 9 9 · · • 99 9-9 9 9« 99 ve stejné pozici, je pravděpodobné, že putativní horké místo rekombinace existuje v exonu 4(G108). Primery specifické pro exon jsou například GCA CAG CCA ACC ACC TAG (forward) nebo TGG AAA GGC ATG ATC CGT AAG (reverzní) . Shora uvedený nový gen obsahující homeobox, SHOX, který se nachází v intervalu 170 kb, je alternativně sestřižen a dává vznik dvěma proteinům s odlišnými funkcemi. Při demonstraci skutečnosti, že malá výška postavy je způsobena mutacemi v SHOX, se použila analýza mutace a sekvenování DNA.
Identifikace a klonování kritické oblasti malého vzrůstu podle vynálezu se uskutečnila následujícím způsobem. U 15 jednotlivců s částečnými monosomy v pseudoautozomální oblasti (PARI) se provedla rozsáhlá fyzikální mapovací studie. Korelací výšky těchto jedinců s delečními body se definovala kritická oblast malého vzrůstu (SS) o přibližné velikosti 700 kb. Tato oblast se následně klonovala jako překrývající se kosmidový kontig za použiti kvasinkových umělých chromozomů (YAC) z PARI (Ried K., Mertz A., Nagaraja R., Trusnich M., Riley J., Anand R., Page D., Lehrach H., Elloiso J., Rappold G.A. (1995): Characterization of a yeast artificial chromosome conting spanning the pseudoautosomal region. Genomics 29: 787792) a pomocí metody „chodícího kosmidu (cosmid walking). Za účelem vyhledání genů odpovědných za SS v tomto intervalu se na přibližně 600 kb velkou oblast mezi distálním koncem kosmidu 56G10 a proximálním koncem 51D11 aplikovala řada metod. Za použití selekce cDNA, trapování exonu a CpG klonování se identifikovaly dva nové geny.
Pozice kritického intervalu malého vzrůstu se zúžila na menší interval DNA o velikosti 170 kb tím, že se charakterizovaly ' tři další jedinci (GA, AT a RY) , kteří vykazují malý vzrůst postavy. Za účelem přesného stanovení pozice bodu přerušení u těchto jedinců se provedla na chromozomech v metafázi za použití kosmidu vhodných pro kontig fluorescenční hybridizace in šitu (FISH). Pacient GA, který vykazuje terminální deleci a • · • · · 9 9 9 9 9 · ·
9 9 9 9 9 9 9 · · · 9 • 9 · · · 9 9999 9 999 999
99999* 9 9
99999 99 9 99 99 normální výšku vzrůstu, definuje distální hranici kritické oblasti (bod přerušení se nachází na kosmidu 110E3) a pacient AT vykazující inverzi X chromozomu a normální výšku vzrůstu definoval proximální hranici (bod přerušení se nachází na kosmidu 34F5). Bod přerušení chromozomu Y u pacienta RY, který vykazuje terminální deleci a malý vzrůst, se také nachází na kosmidu 34F5, což naznačuje, že tato oblast obsahuje sekvence s predispozicí k přestavění chromozomů.
Celá oblast ohraničená Xp/Yp se klonovala jako sada přesahujících kosmidu. Ke studiu šesti pacientů s přestavěným chromozomem X, kdy tři z nich jsou normálního vzrůstu a tři mají malou výšku vzrůstu, se použila fluorescenční hybridizace in šitu (FISH) s kosmidy s této oblasti. Korelace genotypufenotypu zúžily kritický interval pro malý vzrůst na 270 kb DNA nebo na dokonce menší interval, jako je 170 kb, který obsahuje gen nebo geny důležité pro růst člověka. Tento interval pokrývá minimálně šest až osm kosmidu a jsou nyní dostupné pro hybridizaci FISH interfáze a metafáze, která je dostupný nástroj pro diagnózu pacientů s idiopatickým malým vzrůstem postavy.
Skutečnost, že cílový gen vede k vadám růstu u lidí (např. oblast malého vzrůstu), nebyla dříve známa. Biologická a klinická asociace pacientů s uvedenou deleci vysvětluje funkci uvedeného genu. V této studii se použila fluorescenční in šitu hybridizace (FISH) za účelem testování metafáze a interfáze jádra lymfocytu u šesti pacientů. Cílem bylo testovat u všech přesahujících kosmidů jejich použitelnost jako sondy pro FISH hybridizaci a stanovit oblasti porušení genu u všech čtyř případů, a tímto způsobem stanovit minimální kritickou oblast genu malého vzrůstu.
Duplikace nebo delece genomové DNA se může uskutečnit kvantitativní PCR nebo odhadem dávky na Southernových blotech nebo použitím RFLP.
·4 444 44 44
444 4 4 4 4444
4444 4 4 4 4 4 4« 4 4 4 444 444444 444 444 • 44444 · 4
44444 44 4 «4 44
Zvláště vhodnou metodou pro přesné rozlišení mezi jednou a zdvojenou dávkou markérů je hybridizace FISH, přičemž její klinická aplikace je v současnosti rutinní záležitostí. Zatímco při FISH hybridizaci interfáze se může zhodnotit absence nebo přítomnost molekulového markéru, hybridizace FISH metafáze chromozomů může poskytnout semi-kvantitativní stanovení delecí uvnitř kosmidu. Uvedeným způsobem se může stanovit delece o velikosti přibližně 10 kb (což odpovídá 25 % redukci signálu). Zvláště je důležité, že prakticky všechny geny onemocnění na lidském X chromosomu jsou spojeny s menšími a většími delecemi v rozmezí od několika kilobazí do několika megabazí DNA (Nelson, D.L., Ballabio A., Cremers F., Monaco A.P., Schlessinger D., (1995). -Report of the sixth international workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342).
Vynález dále popisuje sekvence DNA nebo jejich fragmenty, které jsou části genů odpovědných za lidský růst (nebo v případě defektu v těchto genech odpovídají za malý vzrůst). Identifikovaly se tři geny odpovědné za lidský růst. Jsou to SHOX, pET92 a SHOT) . Sekvence DNA nebo fragmenty těchto genů stejně jako sekvence DNA těchto genů v plné délce se mohou transformovat do vhodného vektoru a mohou se dále transfekovat do buněk. Když se takové vektory zavedou do buněk vhodným způsobem, jako jsou přítomny u zdravých jedinců, je možné uvedeným způsobem léčit onemocnění spojené s malým vzrůstem, to znamená například Turnérův syndrom. Onemocnění spojené s malým vzrůstem se může léčit odstraněním nebo mutací růstových genů odpovědných za malý vzrůst. Je také možné stimulovat geny, které kompenzují působení genů odpovědných za malou výšku postavy, to znamená inzercí sekvencí DNA před, za nebo do růstových genů/genů odpovídajících za malou výšku za účelem zvýšit expresi zdravých alel. Uvedenými modifikacemi genů se růstové geny/geny odpovídajících za malou výšku aktivují nebo deaktivují. To se může uskutečnit inzercí • 44 ··· 4« • •4 4*4 « 4 4 4
4444 · 444 4 44 4 44 444 4 4*44 · 444 444
4444 4 4 · 4
4 4 4 4 44 4 44 44 sekvencí DNA do vhodných míst, které jsou v genu nebo blízko genu umístěny tak, že tyto inzerované sekvence DNA interferují s růstovými geny/geny odpovídajícími za malou výšku a tak aktivují nebo brání jejich transkripci. Je také možné před růstové geny začlenit regulační element (například promotorovou sekvenci), aby se geny stimulovaly a staly se aktivní. Dále je možné stimulovat promotorovou sekvenci za účelem nadměrné exprese - v případě Turnérova syndromusprávně fungujících alel a tak kompenzovat chybějící alely. Modifikace genů se může obecně dosáhnout inzercí exogenních sekvencí DNA do růstového genu/genu odpovídajícího za malý vzrůst prostřednictvím homologní rekombinace.
Sekvence DNA podle vynálezu se mohou také použít k transformaci uvedených sekvencí do zvířat, jako jsou savci, prostřednictvím vhodného vektorového systému. Tyto transgenni zvířata se pak mohou použít pro zkoumání in vivo při testování a identifikaci farmaceutických činidel, která jsou použitelná při léčbě onemocnění spojených s malým vzrůstem. Jestliže zvířata pozitivně reagují na aplikaci sloučeniny nebo činidla, pak uvedené činidlo nebo sloučenina nebo jejich deriváty jsou vhodná jako farmaceutická činidla. Sekvence DNA podle vynálezu se mohou také využívat v genetických experimentech za účelem nalezení způsobů, jak kompenzovat ztráty genů odpovědných za malý vzrůst postavy.
Dále vynález popisuje sekvence DNA, které se mohou využít při transformaci buněk. Tyto buňky se mohou použít k identifikaci farmaceutických činidel, jenž se mohou použít při léčbě onemocnění spojených s malou výškou postavy nebo k testování takových látek nebo knihovny látek. Ve vhodném testovacím systému se mohou identifikovat změny fenotypu nebo změny expresivního paternu těchto buněk, což umožňuje identifikaci činidla vhodného pro přípravu léků.
Sekvence DNA podle vynálezu se také mohou použít při tvorbě vhodných primerů, které za přísných podmínek hybridizují se
• 00 * · · • 000 | 0 0 0 0 · · 9 0 » · | • 9 «9 9 0 0 0 0 0 0 0 | ||
12 | 0 0» 00· 00 | 0 · 0 9 9 · | 9 9 0 · · · | |
segmenty genů odpovídajících za | malý | vzrůst | nebo s | jejich |
fragmenty. Mohou se konstruovat vhodné | sekvence | primerů, | které | |
se používají při diagnóze lidí, | které | mají genetický | defekt |
způsobující malý vzrůst. Proto je nutné poznamenat, že dvě mutace nalezené v identické pozici naznačují, že existuje mutační horké místo.
Sekvence DNA podle vynálezu zahrnují i takové sekvence, které se degenerovaly na specifické sekvence na základě degenerace genetického kódu nebo které hybridizují za přísných podmínek se specificky danými sekvencemi.
Vynález zdůrazňuje zvláště následující rysy:
a) Molekulu izolované nukleotidové kyseliny kódující polypeptidy obsahující oblast homeoboxu šedesáti amininokyselin, které mají aminokyselinovou sekvenci SEQ ID NO: 1 a vykazují regulující aktivitu lidského růstu.
b) Molekulu izolované DNA obsahující nukleotidovou sekvenci, jak je uvedeno na obrázku č. 2, 3 nebo 4 a zvláště, jak je uvedeno V SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15.
c) Molekuly DNA jsou schopny hybridizovat s molekulami DNA popsanými v odst. b).
d) Molekuly DNA podle odstavce c) jsou schopny hybridizovat s molekulami DNA podle odst. 2 při teplotě 60 °C až 70 °C a v přítomnosti roztoku standardního pufru.
e) Molekuly DNA obsahují nukleotidové sekvence, které vykazují % nebo vyšší homologii s nukleotidovou sekvencí SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15 a kódují polypeptid, který má regulační aktivitu lidského růstu.
f) Lidské růstové proteiny mají aminokyselinovou sekvenci SEQ ID NO: 11, 13 nebo 16 nebo jejich funkční fragment.
g) Protilátky získané při imunizaci zvířat lidskými růstovými proteiny podle odst. f) nebo jejich antigenní varianty.
h) Farmaceutické kompozice obsahující lidské růstové proteiny nebo jejich funkční fragmenty pro léčbu vad způsobených genetickými mutacemi lidského růstového genu.
* φ φφφ φ φφφφ • φ
ΦΦ 4
Φ Φ Φ • Φ Φ
ΦΦΦ 4
Způsob testování látky účinné při léčbě vad zmiňovaných shora v textu podle odst. h) zahrnující detekci mediátorové RNA hybridizující s libovolnými molekulami DNA popsanými v odstavcích a) až e) , přičemž se měří zesílení exprese molekuly DNA jako odezvy na léčbu hostitelské buňky substancí. Expresivní vektor nebo plazmid obsahující libovolné molekuly nukleové kyseliny popsané v odstavcích a) až e) , které umožňují, aby molekuly DNA se exprimovaly v savčích buňkách.
k) Způsob stanovení genu nebo genů v biologických vzorcích tkání nebo tělních tekutin odpovědných za malý vzrůst.
V případě metody popsané shora v textu v odstavci k) se pro detekci specifických nukleotidových sekvencí s výhodou používají nukleotidové amplifikační metody PCR, které jsou dobře známy v oboru a popisují se například v publikacích Mullis et al., 1986, Cold Spring Harbor Symposium Quant. Biol. 51, 263-273 a Saiki et al., Science 239, 487-491. Stanovené nukleotidové sekvence odpovídající za malý vzrůst jsou hlavně ty, které jsou reprezentovány sekvencemi SEQ ID NO: 2 až SEQ ID NO: 7.
V principu všechny oligonukleotidové primery a sondy vhodné pro amplifikaci a detekci genetického defektu, který odpovídá za poškození lidského růstu v biologických vzorcích, jsou vhodné pro amplifikaci cílové sekvence spojované s malým vzrůstem. V tabulce č. 1 jsou uvedeny vhodný pár primerů specifický pro exon podle vynálezu. Následuje vhodná detekce, přičemž se například provádí radioaktivní nebo jiné značení.
Tabulka č. 1
exon | Sense | Antisense | Produkt | Ta (°C) |
primer | primer | (bp) |
44
4 4
444 4 4
4 4 4 4
4 4 4 4
44 »4 4
44
4 4 4
4 4 4
444 444
4
5'-I(G310) | SPI | ASP1 | 194 | 58 |
3'-I(G310) | SP2 | ASP2 | 295 | 58 |
II (ET93) | SP3 | ASP3 | 262 | 76/72/68 |
III (ET45) | SP4 | ASP4 | 120 | 65 |
IV(GI08) | SP5 | ASP5 | 154 | 62 |
Va (SHOXa) | SP6 | ASP6 | 265 | 61 |
Vysvětlení zkratek u primerů:
SP 1: ATTTCCAATGGAAAGGCGTAAATAAC
SP 2: ACGGCTTTTGTATCCAAGTCTTTTG
SP 3: GCCCTGTGCCCTCCGCTCCC
SP 4: GGCTCTTCACATCTCTCTCTGCTTC
SP 5: CCACACATGACACCTGCTCCCTTTG
SP 6: CCCGCAGGTCCAGGCTAGCTG
ASP1: CGCCTCCGCCGTTACCGTCCTTG
ASP2 ; CCCTGGAGCCGGCGCGCAAAG
ASP3: CCCCGCCCCCGCCCCCGG
ASP4; CTTCAGGTCCCCCCAGTCCCG
ASP5: CTAGGGATCTTCAGAGGAAGAAATVkG
ASP6: GCTGCGCGGCGGGTCAGAGCCCCAG
Jako targetová DNA může také sloužit jednořetězcová RNA. Metody zpětné transkribce RNA na cDNA jsou dobře známy v oboru a popisuje je Sambrook et al., Molecular Cloning A Laboratory Manual, New York, Cold Spring Harbor Laboratory 1989. V jiném případě preferované metody reverzní transkripce využívají termostabilní DNA polymerázy, které vykazují RT aktivitu.
Shora popsaná metoda se může použít při selekci těch osob ze skupiny lidí, jejichž malý vzrůst postavy se spojuje s genetickým defektem, což umožňuje specifičtější léčbu.
Vynález dále popisuje transkripční faktory A, B a C, které se mohou použít jako farmaceutická činidla. Tyto transkripční faktory inicijují stále neznámou kaskádu biologických účinků na molekulární úrovni, které se spojují s lidským růstem. Tyto *
999 9 999 9 99 9
999 9 9999 · 999 999
9 9 9 9 9 9
9* 99 9 99 99 proteiny nebo jejich funkční fragmenty mají mitogenní účinek na různé buňky. Zvláště mají osteogenní účinek. Mohou se použít při léčbě onemocnění kostí, jako je například osteoporéza, a zvláště všech onemocnění spojených s poškozením regulace vápníku v kostech.
Termín „izolovaný'' znamená původní derivaci molekuly DNA klonováním. Vynález se týká jak přirozeně se vyskytujících sekvencí tak i synteticky připravených.
Molekuly DNA podle vynálezu se mohou použít ve formách genové terapie, která zahrnuje použití expresivních plazmidů připravených inkorporací vhodné sekvence DNA podle vynálezu downstream od expresivního promotoru, který ovlivňuje expresi v savčí hostitelské buňce. Vhodné hostitelské buňky jsou prokaryontní a eukaryontní buňky. Prokaryontní hostitelské buňky jsou například E. coli, Bacillus subtilis a podobně. Prostřednictvím transfekce hostitelských buněk replikony, které pocházejí z druhů adaptovatelných na hostitele, to jsou plazmidové vektory obsahující počáteční bod replikace a regulační sekvence, se mohou uvedené hostitelské buňky transfekovat požadovaným genem nebo cDNA. Takové vektory jsou s výhodou ty, které mají sekvenci, jenž vybaví transfekované buňky vlastnostmi (fenotypem), na jejichž základě se mohou selektovat. V typickém případě se používají jako hostitelé bakterie E. coli kmen K12a, z vektorů se používá buď pBR322 nebo plazmidy pUC. Příklady vhodných promotorů v případě hostitelů E. coli jsou promotor trp, lac promotor nebo lpp promotor. Jestliže je to nutné, sekrece expresivního produktu skrz buněčnou membránu se může ovlivnit spojením sekvence DNA kódující sekvenci signálního peptidu s 5'upstream částí genu. Eukaryontní hostitelské buňky zahrnují buňky získané z obratlovců nebo kvasinek, atd. Jako hostitelské buňky obratlovců se mohou použít buňky COS (Cell, 1981, 23: 175-182) nebo buňky CHO. Aby došlo k expresi mohou se s výhodou použít promotory, které jsou umístěny 5'upstream genu a mají místa
I 9 9 9 > · · · •99 999 sestřihu RNA, polyadenylační a transkripční terminační sekvence.
Při léčbě vad způsobených mutacemi lidských růstových genů se mohou použít jako činidla podporující růst transkripční faktory A, B a C podle vynálezu. Na základě polymorfizmu, který je znám u eukaryontních genů, se může substituovat jedna nebo více aminokyselin. Jedna nebo více aminokyselin v polypeptidech může být deletována nebo začleněna do jednoho nebo více míst aminokyselinové sekvence polypeptidů SEQ ID NO: 11, 13 nebo 16. Takové polypeptidy jsou nazývány ekvivalentní polypeptidy, pokud vykazují biologickou aktivitu nemodifikovaného polypeptidů, jenž zůstává v podstatě beze změn.
Přehled obrázků na výkrese
Na obrázku č. 1 je zobrazena genetická mapa genu SHOX, který zahrnuje pět exonů, které se označily následujícím způsobem: exon I: G310; exon 2: ET93; exon III: ET45; exon IV: G108; a exony Va a Vb, přičemž exony Va a Vb vedou ke vzniku dvou různých míst sestřihu genu SHOX. Exon II a III obsahuje homeobox o velikosti 180 nukleotidů.
Na obrázcích č. 2 a 3 jsou nukleotidy a předpovězené aminokyselinové sekvence SHOXa a SHOXb.
SHOXa: Předpovězený začátek translace začíná nukleotidem 92, první v rámci je stop kodon (TGA) - nukleotidy 968 - 970, přičemž vzniká otevřený čtecí rámec o velikosti 876 bp, který kóduje předpovězený protein tvořený 292 aminokyselinami (označený jako transkripční faktor A nebo protein SHOX). V rámci je 5'stop kodon v pozici nukleotidu 4, počáteční kodon a předpovězený terminační stop kodon znázorněný tučným písmem. Homeobox je ohraničen boxem (začínající aminokyselinou v pozici 117 (Q) až 176 (E), to v nukleotidové sekvenci odpovídá CAG až GAG) . Pozice intronů je označená šipkami. Dva
99 99 9 99
9 9 9 9 9 9
9999 9 999 9 99 9
999 9 9999 9 999 999
999999 9 9
99999 99 9 99 99 putativní polyadenylační signály v 3' nepřekládané oblasti jsou podtrženy.
SHOXb: Otevřený čtecí rámec o velikosti 876 bp se nachází od A v prvním metioninu nukleotidu 92 do terminačního kodonu v rámci v pozici 767 - 769, což tvoří otevřený čtecí rámec o velikosti 675 bp, který kóduje předpovězený protein o velikosti 225 aminokyselin (transkripčni faktor B nebo protein SHOXb). Pozice intronů jsou označeny šipkami. Exony I až IV jsou identické s SHOXa, exon V je specifický pro SHOXb. Putativní polyadenylační signál v 3' nepřekládané oblasti je podtržen.
Na obrázku č. 4 je nukleotidová sekvence a předpovězená aminokyselinová sekvence SHOT. Předpovězený počátek translace začíná v pozici nukleotidu 43, první v rámci je terminační kodon (TGA) - pozice nukleotidů 613 - 615, přičemž vzniká otevřený čtecí rámec o velikosti 573 bp, který kóduje předpovězený protein tvořený 190 aminokyselinami (označený jako transkripčni faktor C nebo protein SHOT). Homeobox je ohraničen boxem (začínající aminokyselinou v pozici 11(Q) až 70 (E), to v nukleotidové sekvenci odpovídá CAG až GAG).
Pozice intronů je označená šipkami. Dva putativní polyadenylační signály v 3' nepřekládané oblasti jsou podtrženy.
Na obrázku č. 5 je uvedena organizace exon/intron lidského genu SHOX a pozice v nukleotidové sekvenci.
Popis sekvencí SEQ ID:
SEQ ID NO. 1: překládaná aminokyselinová sekvence oblasti
homeoboxu | (180 | ' bp) | |||||
SEQ | ID | NO. | 2: | exon | II (ET93) | genu | SHOX |
SEQ | ID | NO. | 3: | exon | I (G310) | genu ; | SHOX |
SEQ | ID | NO. | 4 : | exon | III (ET45) | genu | SHOX |
SEQ | ID | NO. | 5: | exon | IV (G108) | genu | SHOX |
SEQ | ID | NO. | 6: | exon | Va genu SHOX |
«9 9* 9 99 ·· • •9 9 9 · 9999
9999 9 999 9 99 9
9 « 9 9 9999 9 999 99«
9 9 9 · 9 * 9 «99 9« 9« 9 9« «9
SEQ ID NO. | 7: exon Vb genu SHOX | ||
SEQ | ID | NO. | 8: předchozí nukleotidová sekvence genu SHOX |
SEQ | ID | NO. | 9: gen ET92 |
SEQ | ID | NO. | 10: sekvence SHOXa (také uvedeno na obrázku č. 2) |
SEQ | ID | NO. | 11: transkripční faktor A (také uvedeno na obrázku |
č. 2)
SEQ ID | NO. | 12: sekvence SHOXb | (také uvedeno na obrázku č. 3) |
SEQ ID | NO: | 13: transkripční | faktor B (také uvedeno na obrázku |
Č. 3) | |||
SEQ ID | NO. | 14: gen SHOX | |
SEQ ID | NO. | 15: sekvence SHOT | (také uvedeno na obrázku č. 4) |
SEQ ID | NO: | 16: transkripční | faktor C (také uvedeno na obrázku |
č. 4) .
Příklady provedeni vynálezu
Příklad 1: Pacienti
Všech šest studovaných pacientů vykazuje de novo odchylky na pohlavním chromozomu.
Pacient s označením CC je dívka s karyotypem 45,X/46,X psu dic (X) (Xqter ->Xp22.3 : : Xp22.3->Xqter) . Při posledním testu jí bylo 6 1/2 roku, její výška byla 114 cm (25 až 50 % percentil) . Výška postavy její matky je 155 cm, otec nebyl zařazen do analýzy. Detailněji je případ popsán v publikaci Henke A., Wapenaar M., van Ommen G-J., Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear growth. Am. J. Hum. Genet. 49: 811-819.
Pacient s označením GA je dívka s karyotypem 46,X der X (3pter-»3p23: :Xp22.3-»Xqter) . Při posledním testu jí bylo 17 let a zjistila se normální výška (159 cm). Výška její matky je 160 cm, její otec měří 182 cm. Detailněji se pacientka popisuje v publikaci Kulharya A.S., Roop H., Kukolich M.K., Nachtman R.G., Belmont J.W., Garcia-Heras J., (1995): Mild • 9 • Λ*
I ··>· «9
I 9 9 » 9 9
999
9 • 9 99 phenotypic effects of a de novo deletion Xpter—»Xp22.3 a duplication 3pter—>3p23. Am. J. Med. Genet. 56: 16-21.
Pacient s označením SS je dívka s karyotypem 46,X rea (X) (Xqter—»Xq26: :Xp22.3->Xq26: ) . V jedenácti letech její výška byla pod 3 percentil křivky růstu japonských dívek.; její předpovězená výška v dospělosti (148,5 cm) leží pod její cílovou výškou (163 cm) a cílové rozmezí je (155 až 191 cm) . Detailněji je případ popsán v publikaci Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992) girl with a terminál Xp deletion
Short stature in a distal to DXYS15:
localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459.
Pacient z označením AK je dívka s karyotypem 46,X rea (X) (Xqter-»Xp22.3: :Xp22.3->Xp21.3 :) . Ve 13-ti letech její výška je pod 2 percentil křivky růstu japonských děvčat; její předpovídaná výška v dospělosti (142,8 cm) je pod její cílovou výškou (155,5 cm) a cílové rozmezí je (147,5 až 163,5). Detailněji se případ popisuje v publikaci Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834. Pacient označený RY má karyotyp 46,X,r(Y)/46,Xdic r (Y)/45, X[95: 3: 2], jak se zjistilo testem 100 lymfocytů; V 16ti letech je její výška 148 cm; jeho tři bratři dosáhly normální výšky 170 cm (bratr 1, 16 let), 164 cm (bratr 2, 9 let) a 128 cm (bratr 3, 9 let) . Růstová retardace tohoto pacienta je tak silná, že by měla být kompatibilní s další delecí lokusu GCY na Yq.
Pacient s označením AT je chlapec s ataxii a inv(X); v sedmi letech dosahuje normální výšky 116 cm, výška rodičů je 156 cm a 190 cm.
• 9
«I ·· • ··
9
9
9 9 9
999 ·9·
Pacienti pro analýzu mutací
U 250 jednotlivců s idiopatickým malým vzrůstem postavy se vyšetřovaly mutace genu SHOXa. Pacienti se vybraly podle následujících kriterií: výška chronologického věku byla pod 3 centil národního výškového standardu mínus 2 standardní odchylky (SDS); nebylo známé žádné kauzativní onemocnění zvláště : normální váha (délka) v prenatálním stavu, normální tělesné proporce, žádné chronické onemocnění, normální příjem potravy, žádné psychiatrické obtíže, žádná dysplázie skeletu, žádná nedostatečnost růstového hormonu nebo hormonů štítné žlázy.
Rodina A:
Případy 1 a 2 jsou děti malého vzrůstu německé nepokrevné rodiny. Chlapec (případ 1) se narodil v 38 týdnu těhotenství císařským řezem. Porodní váha byla 2 660 g, porodní délka byla 47 cm. Vyvíjel se normálně s výjimkou subnormálního růstu. Při schůzce ve věku 6,4 roku byl proporcionálně malý (106,8 cm, 2,6 SDS) a obézní 22,7 kg) ale jinak normální. Stáří jeho kostí nebylo retardované (odpovídalo 6 letům) a dysplázie kostí se vyloučila na základě vyšetření X-paprsky. Nepravděpodobná je nedostatečnost v hladinách IGF-I a IGFBP-3 stejně jako parametry štítné žlázy, které se v séru prokazují GH nebo nedostatečnost hormonů štítné žlázy. Dívka (případ 2) se narodila v termínu císařským řezem. Porodní váha byla 2 920 g, porodní délka byla 47 cm. Její vývoj byl normální, ale ve 12 měsících se projevil její malý růst (délka 67 cm, -3,0 SDS). Ve čtyřech letech měřila 89,6 cm (-3,6 SDS). Neprojevily se žádné dysmorfní ani dysproporcionální rysy. Nebyla obézní (13 kg). Stáří jejich kostí odpovídalo 3,5 letům a vyloučila se dysplázie kostí. Hormonální parametry byly normální. Je zajímavé poznamenat, že růst děvčete i chlapce odpovídá 50 percentil růstové křivky žen s Turnérovým syndromem. Matka je nejmenší z rodiny a má střední rhizomelickou disproporci • · · · (142,3 cm, -3,8 SDS) . Jedna ze sester (150 cm, -2,5 SDS) a babička z matčiny strany (153 cm, -2,0 SDS) jsou malé postavy, aniž mají nějakou disproporci. Druhá sestra má normální výšku postavy (167 cm, +0,4 SDS). Výška otce je 166 cm (-1,8 cm) a výška dědečka z matčiny strany je 165 cm (-1,9 SDS). Další pacient je japonského původu a vykazuje identické mutace.
Příklad 2: Identifikace genu odpovídajícího za malý vzrůst
A. Hybridizace in sítu
a) Fluorescenční hybridizace in sítu
Provedla se fluorescenční hybridizace in sítu (FISH) za použití kosmidů, které leží v Xp/Yp pseudoautozomální oblasti (PARI). Uskutečnily se FISH studie za použití kosmidů 64/75cos (LLNlcll0H032), E22cos(2e2), Fl/14cos (110A7), Ml/70cos (110E3), P99F2cos(43C11), P99cos (LLNLcll0P2410), B6cosb (1CRFC104H0425), F20cos (34F5), F21cos (ICRFcl04G0411), F3cos2 (9E3), F3cosl (11E6), P117cos (29B11), P6cosl(ICRFcl04P0117), P6cos2 (LLNLcll0E0625) a E4cos (15G7) podle metody popsané v publikacích (Lichter P., Cremer T., Human Cytogenetics: A practical Approach, IRL Press 1992, Oxford, New York, Tokyo). Jeden mikrogram kosmidového klonu se značil biotinem a hybridizoval se s metafází lidských chromozomů za podmínek, které redukují signál z repetivních sekvencí DNA. Detekce hybridizačního signálu probíhá prostřednictvím avidinu spojeného s FITC. Zviditelnění FITC proběhlo za použití chlazeného zdvojeného kamerového sytému (Photometrics, Tucson, AZ) .
b) Fyzikální mapování
Kosmidy se získaly z Lawrence Livermore National Laboratory Xa Y-chromozomové knihovny a z X-chromozomové knihovny instituce Imperiál Cancer Research Fund London (nyní Max Plaňek Institute for Molecular Genetics Berlin). Za použití
• · ·
........
kosmidů distálních k DXYS15, jmenovitě E4cos, P6cos2, P6cosl, P117cos a F3cosl lze stanovit, že jsou stále přítomny dvě kopie E4cos, P6cos2, P6cosl a jedna kopie P117cos a F3cosl. Body porušení na mapě kosmidu P6cosl obou pacientů AK a SS jsou od sebe v maximální vzdálenosti lOkb. Zjistilo se, že abnormální X-chromozomy AK a SS měly deletováno přibližně 630 kb DNA.
Další kosmidy se získaly z ICRF X-chromozomové specifické kosmidové knihovny (ICRFclG4), z Lawrence Livermore Xchromosomové specifické kosmidové knihovny (LLNLcllO) a Ychromozomové specifické knihovny (LLCO3'M'), stejně jako ze samostatně připravené kosmidové knihovny zahrnující celý genom. Kosmidy se identifikovaly hybridizací se všemi známými sondami, které mapují uvedenou oblast a použitím celé YAC jako sondy. Za účelem ověření překryvů v případech, kde nebylo možno použít známých sond, se použily terminační sondy z několika kosmidů.
c) Hybridizace Southernovým přenosem
Analýza Southernovým přenosem za použití pseudoautozomálních markérů poskytuje důkaz, že bod porušení X-chromozomu u pacienta CC leží mezi DXYS20(3cosPP) a DXYS60(U7A ( Henke A., Wapenaar M., van Ommen G-J., Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear growth. Am. J. Hum. Genet. 49: 811-819). Za účelem potvrdit tento nález a definovat pozici bodu porušení, se použily kosmidy 64/75cos, E22cos, Fl/14cos, Ml/70cos, F2cos, P99F2cos a P99cos jako sondy při hybridizací FISH. Pozice bodu porušení na abnormálním chromozomu X u pacinta CC je mezi kosmidy 64/75cos (jedna kopie) a Fl/14cos (dvě kopie) na E22PAC. Pacient CC s normální výškou následně ztratil přibližně 269 až 290 kb DNA.
• ·
Hybridizace Southernovým přenosem se provedla za přísných podmínek v Churchově pufru (0,5 M NaPi pH7,2, 7 % SDS, 1 mM
EDTA) při teplotě 65 °C a promývání se provedlo 40 mM NaPi, 1 % SDS při teplotě 65 °C.
d) Analýza hybridizaci FISH
Biotinem značená kosmidová DNA (velikost inzertu 32 až 45 kb) nebo kosmidové fragmenty (10 až 16 kb) se hybridizovaly s metafází chromozomů, které pochází ze stimulovaných lymfocytů pacientů, za podmínek, jenž se popisují dříve v textu (Lichter P., Cremer T., Human Cytogenetics: A practical Approach, IRL Press 1992, Oxford, New York, Tokyo). Hybridizované sondy se detekovaly prostřednictvím avidinu spojeného s FITC.
e) Amplifikace pCR
Všechny reakce PCR se provedly v objemech 50 ul. V tomto objemu je obsaženo 100 pg až 200 pg templátu, 20 pmolkaždého primeru, 200 uM dNTP (Pharmacia), 1,5 mM MgC12, 75 mM Tris/Hcl pH9, 20 mM (NH4)2SO4 0,01 % (hmot. /objem) Tween 20 a 2 U
Goldstar DNA polymerázy (Eurogentec). Termocykly se provedly na zařízení GeneE (Techne).
f) Amplifikace exonu
Za účelem amplifikace exonu se použily čtyři kosmidové sebrané roztoky, kdy každý zahrnuje čtyři až pět klonů z kosmidových kontigů. Kosmidy v každém kosmidovém roztoku se částečně štěpily restrikčním enzymem Sau3A. Frakce čištěné na gelu v rozmezí velikostí 4 až 10 kb se klonovaly do vektoru pSPL3B štěpeného restrikčním enzymem BamHI (Burn et al., 1995) a použily se při experimentech amplifikace exonu, jak se popisuje dříve v textu (Church et al., 1994).
g) Sekvenování genů ·· ··
Sonifikované fragmenty dvou kosmidů LLOYNCO3'M'15D10 a LLOYNCO3'M'34F5 se odděleně sub-klónovaly do vektorů M13mpl8. Z každé kosmidové knihovny se vybralo alespoň 1 000 plaků, připravila se DNA M13 a sekvenovala se za použití barvivém značených terminátorů, termo-sekvenázy (Amersham) a univerzálního M13-primeru (MWG-BioTech). Gely se provedly na sekvenátoru ABI-377 a data se uspořádala a editovala pomocí programu GAP4 (Staden).
Ze všech šesti pacientů pacient GA měl nejméně chrakterizovaný bod porušení chromozomu. Nejvzdálenější markéry, jejichž přítomnost na chromozomu X se testovala dříve, byly DXS1060 a DXS996, mapují přibližně 6 Mb od telomeru (Nelson, D.L., Ballabio A., CremersF., Monaco A.P., Schlessinger D., (1995). -Report of the sixth International workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342). Testovalo se několik kosmidů, které obsahují odlišné sekvence genů z PARI (MIC2, ANT3, CSF2RA a XE7). Všechny byly přítomny na translokačním chromozomu. Kosmidy pokrývající kritickou oblast odpovídající za malý vzrůst postavy, například z chromozomu, přičemž translokační bod porušení je na kosmidů Ml/70cos. Kvantitaivní srovnání intenzity signálu Ml/70cos mezi normálním a znovu uspořádaným chromozomem X ukazuje, že je deletováno přibližně 70 % kosmidů.
Tabulka č. 2
CC | GA | AK | SS | |
64/75cos | - | - | ||
E22cos | - | - | ||
Fl/14cos | + | - | ||
Ml/70cos | + | (+) | ||
F2cos | + | + | ||
P99F2cos | + | + | ||
P99cos | + | + | ||
B6cos | + |
• · > · · · · • · > ·«
F20cos | ||||
F21cos | ||||
F3cos2 | ||||
F3cosl | — | |||
P117cos | — | |||
P6cosl | + | + | ||
P6cos2 | + | + | ||
E4cos | + | + |
Tabulka č. 2: Tabulka udává souhrn dat z hybridizace FISH pro 16 kosmidů testovaných u čtyř pacientů (-) jedna kopie; indikuje, že kosmid je deletován na znovu uspořádaném chromozomu X, ale je přítomen na normálním chromozomu X (+) dvě kopie; indikuje, že kosmid je přítomen na znovu uspořádaném i na normálním chromozomu X ((+)) oblast bodu porušení; indikuje, že bod porušení se vyskytuje na kosmidu, jak ukazuje hybridizace FISH.
Molekulová analýza u šesti pacientů se znovu uspořádaným chromozomem X za použití kosmidových fluoresčenčně značených kosmidových sond a hybridizace in šitu indikuje, že oblast odpovídající za malý vzrůst je zúžena na interval o velikosti 270 kb, který je ohraničený bodem porušení pacienta GA z jeho centromerové distální strany a u pacientů AK a SS na jeho centromerové proximální straně.
Korelace genotyp-fenotyp může být informativní a může posloužit k zobrazení kritického intervalu, který odpovídá za malý vzrůst postavy, na lidském chromozomu X a Y. V této studii se použila analýza hybridizací FISH ke studiu rozšíření metafáze a interfáze jádra lymfocytů u pacientů, kteří nesou delece a translokace na chromozomu X a body porušení v Xp22.3. Tyto body porušení se jeví být přítomny u dvou ze čtyř pacientů (AK a SS) , což je způsobeno přítomností sekvencí ·· ·· » · · « proximálně 510/520 podstatnou redukci s predispozicí k znovu uspořádání chromozomu. Zjistil se další pacient s kruhovým Y s porušením nacházejícím se v kritické oblasti o velikosti 270 kb, což redukuje kritický interval na 170 kb.
Korelací výšky šesti jedinců s jejich místem porušení se mapoval interval o velikosti 170 kb v pseudoautozomální oblasti, jehož přítomnost nebo absence má podstatný účinek na výšku vzrůstu. Tento interval je ohraničen místem porušení na chromozomu X pacienta GA v místě vzdáleném 340 kb distálně od telemoru (Xptel) a místem porušení u pacientů AT a RY kb Xptel. Toto uspořádání zahrnuje kritického intervalu na téměř jednu čtvrtinu jeho původní velikosti (Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992) : Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N.,
Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834; Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629). Pro experimenty FISH za účelem testování prevealence a signifikance uvedeného genomového lokusu na velké sérii pacientů s idiopatickým malým vzrůstem je nyní dostupná malá sada šesti až osmi kosmidů.
B. Identifikace kandidáta genu odpovídajícího za malý vzrůst Za účelem hledání transkripčních jednotek v nejmenší kritické oblasti o velikosti 170 kb se provedlo trapování exonu a selekce cDNA u šesti kosmidů (110E3, F2cos, 43C11, 02410, 15D10, 34F5). Trapováním exonu se izolovaly tři různé
pozitivní klony (ET93, ET45 a G108). Všechny z nich se mapovaly zpět ke kosmidu 34F5. Předchozí studie za použití cDNA selekčních protokolů a přístupu k 25 různým knihovnám cDNA vedly k neúspěchu, což naznačuje, že geny v tomto intervalu se exprimují s velmi malým nadbytkem.
Za účelem zjištění, zda nějaký gen v uvedeném intervalu chybí, se stanovila za použití náhodné M13 metody a terminátorové chemie nukleotidová sekvence vzdálená přibližně 140 kb od uvedené oblasti PARI. Za účelem sekvenční analýzy se vybraly kosmidy se vzájemným minimálním překryvem, aby spolu pokryly kritický interval. Provedla se sekvenční analýza a následná předpověď proteinu pomocí programu „X Grail, verze 1.3c, stejně jako trapování exonu pomocí programu FEXHB, což potvrdilo všechny 3 dříve klonované exony. Nedetekoval se žádný jiný gen kódující protein, než co už byl dříve izolován.
C. Izolace genu SHOX odpovídajícího za malý vzrůst
Za předpokladu, že všechny tři exonové klony ET93, ET45 a G108 jsou součástí stejného genu, použily se spolu jako sondy k testování 14 různých knihoven cDNA vytvořených z 12 různých fetálních (plíce, játra, mozek 1 a 2) a dospělých tkání (vaječníky, placenta 1 a 2, fibroblasty, skeletové svalstvo, kostní dřeň, mozek, mozkový kmen, hypotalamus, podvěsek mozkový). Mezi přibližně 14 milióny klony nanesenými na plotny se nedetekoval ani jeden klon. Za účelem izolace transkriptu v plné délce se uskutečnil 3'a 5'RACE. Za účelem 3'RACE se použily primery z exonu G108 na RNA z placenty, skeletového svalstva a fibroblastů z kostní dřeně a z tkáně, kde se exprimuje G108. Ze všech tří tkání se získaly dva různé 3'RACE klony velikosti 1173 a 652 bp, což naznačuje, že existují dva různé 3'exony a a b. Tyto dvě odlišné formy se nazývají SHOXa a SHOXb.
Za účelem zvýšení šancí pro izolaci celé 5'části genu, o kterém se ví, že je exprimován s malým přebytkem, se buněčná • ·0 00 0 000 000 • 000 0 ··* • · 000 0 0 0 0 1 ♦ 0 0 0 0 «
........
linie Hela ošetřila retinoovou kyselinou a forbolesterem ΡΜΆ. RNA z takové indukované buněčné linie a RNA z placenty a skeletového svalstva se použila ke konstrukci „Mararhonovy knihovny cDNA. Ze všech tří tkání se izolovaly identické klony 5'RACE cDNA.
Experimentální postup:
RT-PCR a konstrukce knihovny CDNA.
Od firmy Clontech se získala lidská polyA+RNA ze srdce, pankreasu, skeletového svalstva, fetálních ledvin a jater. Celková RNA se izolovala z buněčné linie fibroblastů z kostní dřeně činidlem TRIZOL (Gibco-BRL), způsobem, který popisuje výrobce. První řetězec syntézy cDNA se získal pomocí kitu „Superscript first strand cDNA synthesis kit (Gibco-BRL), kdy počátečním materiálem je 100 ng polyA+RNA nebo 10 ug celkové RNA za použití oligo (dt)-ada+RNAptorového primeru (GGCCACGCGTCGACTAGTAC[dT]2oN. Po syntéze prvního řetězce cDNA se reakce naředila 1/10. Při dalších experimentech PCR se použilo 5 ul tohoto ředění. „Marathonova knihovna cDNA se zkonstruovala z polyA+RNA skeletového svalstva a placenty amplifikačním kitem pro cDNA (Clontech), jak popisuje výrobce. Knihovny cDNA z fetálního mozku (katalogové číslo # HL5015b), fetální plíce (HL3022a), vaječníků (HLlO98a), podvěsku mozkového (HL1097v) a hypotalamu (HL1172b) se získaly od firmy Clontech. Knihovny cDNA mozku, ledvin, jater a plic se staly součástí rychlého testu panelu lidské cDNA knihovny (Clontech). cDNA knihovna fetálního svalstva se získala z instituce UK Human Genome Mapping Project Resources Center.
D. Sekvenační analýza a struktura genu SHOX
Na základě analýzy sekvencí získaných klonů pomocí 5' a 3'RACE se uspořádala sekvence SHOXa a SHOXb (1349 a 1870 bp). Identifikoval se jedne otevřený čtecí rámec o velikosti 1870 bp (SHOXa) a 1349 bp (SHOXb), který dává vzniku dvou proteinů ·· BB ► · B 4
BBB
B B o 292 aminokyselinách (SHOXa) a 225 aminokyselinách (SHOXb). Oba transkripty a i b se dělí o běžný 5'konec, ale mají odlišný poslední 3'exon . Toto zjištění naznačuje, že se používá alternativní signály sestřihu. Dosáhlo se úplného a sekvenovanou genomovou DNA LL0YNC3M34F5, což umožňuje uspořádání mezi dvěmi cDNA z kosmidů LL0YNCO3M15D10a ustanovení struktury exon-intron (obrázek č. 4) . Gen se skládá ze 6 exonů, jejichž velikost se pohybuje v rozmezí od 58 bp (exon III) do 1146 bp (exon Va). Exon I obsahuje CpG, startovací kodon a 5'oblast. Stop kodon stejně jako 3'nekódující oblast se nachází v každém alternativně sestřiženém exonu Va a Vb.
Příklad 3:
Identifikovaly se dvě cDNA, které tvoří 160 kb velkou oblast, která je kritická pro malý vzrůst. Tyto cDNA korespondují s geny SHOX a pET92. cDNA se se identifikovaly hybridizací subklónů kosmidů s knihovnami cDNA.
Sada kosmidových klonů, které úplně pokrývají kritickou oblast, je genetickým materiálem pro identifikaci kauzativního genu. Projekty pozičního klonování, které vedou k izolaci genů z uvedené oblasti, se uskutečnily trapováním exonu a selekcí cDNA. Zjištěním jejich polohy v pseudoatozomální oblasti se tyto geny mohou vyhnout X-deaktivaci a může se uplatnit účinek dávky.
Klonování genu, který když není přítomen (haploid) nebo je deficitní odpovídá za malý vzrůst, je dalším krokem přesnosti diagnózy a poskytuje základy pro analýzu mutací v genu pomocí například jednořetězcového konformačního polymorfizmu (SSCP). Navíc klonování uvedeného genu a jeho následná biochemická charakterizace otevřela cestu k hlubšímu porozumění biologických procesů, které jsou zahrnuty v řízení růstu. Sekvence DNA podle vynálezu poskytují první molekulový test pro identifikaci jednotlivců se specifickou vadou genu ·· ·· ·· • · · · • · · · • · · · ··♦ · · · >
• · · · · ···· · ··· • · · · · • ·· ·· · v komplexní heterogenní skupině pacientů, kteří vykazují idiopatický malý vzrůst.
Příklad 4: Expresní patern SHOXa a SHOXb
Analýza northernovým přenosem za použití jednotlivých exonů jako hybridizačních sond ukázala odlišný expresivní profil každého exonu, což silně naznačuje, že pruhy o různé velikosti a intenzitě reprezentují produkty křížové hybridizace s jinými genovými sekvencemi bohatými na G,C. Aby se dosáhlo více realistického expresivního profilu genů SHOXa a b, provedly se s RNA z různých tkání RT-PCR experimenty. Zatímco exprese SHOXa se pozorovala ve fibroblastech skeletového svalstva, placenty, pankreasu, srdce a kostní dřeně, exprese SHOXb se omezila na fibroblasty fetální ledviny, skeletového svalstva a kostní dřeně, přičemž zdaleka nej silnější expresi vykazují fibroblasty kostní dřeně.
Exprese SHOXa v několika cDNA knihovnách připravených z fetálního mozku a ze svalstva, z mozku dospělých, z plic a z podvěsku mozkového a skutečnost, že v žádné uvedené knihovně není exprimován SHOXb, podává další důkaz, že exprese jedné formy sestřihu (SHOXa) je více rozšířena než druhá (SHOXb), která se exprimuje převážně tkáňově specifickým způsobem.
K odhadu transkripční aktivity SHOXa a SHOXb na X a Y chromozomu se použila RT-PCR RNA, která se extrahovala z různých buněčných linií, jenž vykazují aktivní X, neaktivní X nebo Y chromozom. Všechny buněčné linie vykazují produkt amplifikace očekávané délky 119 bp (SHOXa) a 541 bp (SHOXb), což je důkaz, že jak SHOXa i b unikly deaktivaci chromozomu X. Geny SHOXa a b kódují nové proteiny homeodomén. Gen SHOX je vysoce konzervativní mezi jednotlivými živočišnými druhy od savců po ryby a ptáky. Na samém 5'konci a 3' konci vedle homeodomény jsou pravděpodobně konzervativní oblasti mezi člověkem a myší, což znamená funkční signifikanci. Během • 4 • ·· 4· 4 • 4444 4
4
• ··· 4 4
4
evoluce mezi člověkem a myší se v těchto oblastech aminokyselin neakumulovaly rozdíly.
Experimentální postupy:
a) 5'a 3 'RACE
Za účelem klonování transkriptů 5'konce SHOXa a b se provedla metoda 5'RACE za použití zkonstruované „Marathonových cDNA knihoven. Použily se následující oligonukleotidové primery: SHOX B rev. GAAAGGCATCCGTAAGGCTCCC (pozice 697-718, reverzní řetězec [r]) a adaptorový primer API. Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 66 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 25 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX A rev,
GACGCCTTTATGCATCTGATTCTC (pozice 617-640 r) a adaptorového primeru AP2. PCR se provedlo během 35 cyklů s teplotou renaturace 60 °C.
Za účelem klonování transkriptů 3'konce SHOXa a b se provedla metoda 3'RACE, jak popisuje v publikaci Frohman et al., 1988, za použití prvního řetězce cDNA s primerem oligo(dT)adaptoru. Použily se následující oligonukleotidové primery: SHOX A for GAATCAGATGCATAAAGGCGTC (pozice 619-640) a oligo(dT)adaptor. . Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX B for, GGGAGCCTTACGGATGCCTTTC (pozice 697-718) a oligo(dT)adaptoru. PCR se provedlo během 35 cyklů s teplotou renaturace 62 °C.
• ·· ··
4· t * ♦ · • 4 4 4 • · ···· · • · » ·· · • 4 * 4 • · • 44 »4 a· a « • 4 »44 4 • 4
Za účelem potvrdit sekvence transkriptů SHOXa a SHOXb se uskutečnila PCR 5'oligonukleotidovým primerem a
3'oligonukleotidovým primerem. V případě SHOXa se použily následující primery: G310 for AGCCCCGGCTGCTCGCCAGC (pozice 5978) a SHOX D rev CTGCGCGGCGGGTCAGAGCCCCAG (pozice 959-982 r) . V případě SHOXb se použily následující primery: G310 for AGCCCCGGCTGCTGCCAGC a SHOX2A rev GCCTCAGCAGCAAAGCAAGATCCC (pozice 1215-1238 r) . Obě PCR se provedly za podmínek: 94 °C po dobu 2 .minut, 94 °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřint, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Produkty se čistily na gelu a klonovaly se za účelem sekvenační analýzy.
b) Analýza SSCP
Amplifikovaná genomová DNA pocházející z pacientů se analyzovala způsobem SSCP, který se popisuje v publikaci Orita M., Suzuki Y., Sekiya T., and Hayashi K., (1989): Rapid and sensitive detection of point mutations and polymorphisms using the polymerase chain reaction. Genomics 5:874-879). 1 až 5 ul produktů PCR se smíchalo s 5 ul denaturačního roztoku, který obsahuje 95 % formamidu a 10 mM EDTA pH8, a denaturovaly se při teplotě 95 °C po dobu 10 minut. Vzorky se ihned ochladily na ledu a nanesly se na 10 % polyakrylamidový gel (akrylamid : bisakryamid = 37,5 : 1 a 29 : 1; gel s více sloty, báze TGGE, Qiagen), který obsahuje 2 % glycerol a 1 x TBE. Elektroforéza proběhla při teplotě 15 °C při napětí 500 V po dobu 3 až 5 hodin a obarvila se stříbrem, jak se popisuje TGGE manuálu (Qiagen, 1993).
c) Klonování a sekvenování produktů PCR
Produkty PCR se klonovaly do vektoru pMOSBlue za použití pMOSBlueT-sady vektorů od firmy Amersham. Kultura z jedné ·« 9 • · ·
kolonie kultivovaná přes noc se lyžovala povalením ve 100 ul vody po dobu 10 minut. Lyzáty se použily jako templáty pro PCR se specifickými primery. SSCP produktů PCR umožnila identifikaci klonů, které obsahují různé alely. Klony se sekvenovaly za použití vektorových primerů Uni a T7 značených CY5 způsobem sekvenování v cyklech, jak popisuje výrobce (ThermoSequenase Kit (Amersham)) na atomatickém sekvenétoru ALF (Pharmacia).
d) Testování cDNA knihoven pomocí PCR
Aby se detekovala exprese SHOXa a b provedlo se PCR testování několika knihoven cDNA a prvního řetězce cDNA s SHOXa a b specifickými primery. V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu. V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for. V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po
dobu 2 | minut, | 94 | 1 °c | po | dobu 30 | vteřin, 68 | °C po dobu | 30 |
vteřin, | 72 °C | PO | dobu | 40 | vteřin po | 5 cyklů. 94 | ° C po dobu | 30 |
vteřin, | 65 °C | PO | dobu | 30 | vteřin, 72 | ° C po dobu | 40 vteřin po | 5 |
cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů
e) PCR testování knihoven cDNA
Aby se detekovala exprese SHOXa a b provedlo se PCR testování několika knihoven cDNA s SHOXa a b specifickými primery.
V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu.
V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for.
V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 68 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů.
Příklad 5: Expresivní patern 0G12, což je putativní homolog SHOX a SHOT
Za účelem stanovení expresivního paternu se provedla hybridizace in šitu u embryí myší z 5. dne p.c. a 18,5 dne p.c. , u fetálních a u nově narozených zvířat. Expresi bylo možno ukázat u vyvíjejících se zárodků noh, v mesodermu nasalních postupů, které se podílejí na tvorbě nosu a patra, u očních víček, u aorty, ve vyvíjejících se žláz samic, ve vyvíjející se páteři (omezených na diferenciaci motorických neuronů) a v mozku. Na základě tohoto expresivního paternu a na mapování pozice jeho lidského homologu SHOT, SHOT reprezentuje pravděpodobně kandidáta Cornelia de Lange syndromu, který zahrnuje malý vzrůst.
Příklad 6: Izolace nového genu homeoboxu podobného SHOX SHOT na chromozomu 3, který souvisí s lidským růstem/s malým vzrůstem postavy.
U člověka se izoloval nový gen nazývaný SHOT (SHOX homolog na chromozomu 3), který vykazuje nejvíce homologie s myším genem OG12 a lidským SHOX. Lidský gen SHOT a myší OG12 jsou vysoce homologní. Vykazují 99 % identity na úrovni proteinu. Ačkoli se to ještě neprokázalo, díky homologii mezi SHOT a SHOX (jde o identitu pouze v homeooblasti) je pravděpodobné, že gen SHOT také odpovídá za malý vzrůst nebo lidský růst.
Gen SHOT se izoloval za použití primerů ze dvou nových lidských EST (HS 1224703 a HS 126759) z databáza EMBL, přičemž se amplifikuje reverzně přepsaná RNA z linie fibroblastů kostní dřeně (Rao E., Weiss B., Mertz A., et al., (1995): Construction of a cosmid conting spanning the short stature candidate region in the pseudosomal region PAR 1. In: Turner • ·
9 9 • 9 9 «
« ·» • 9 · · · · 9 • · · β 9 9 9 · • 9 9 9999 · ··· 999
9 9 9 9
Λ 9 9 9 9 9 syndrome in a life spán respective: Research and clinical aspects. Proceeding of the 4th International Symposium on Turner Syndrome, Gothenburg, Sweden, 18-21 May, 1995., edited by Albertsson-Wikland K., Ranke M.B., pp. 19-24, Elsevier. 5'a 3'konec genu SHOT se generoval RACE-PCR z fibroblastové knihovny kostní dřeně, která se zkonstruovala podle publikace Rao E., Weiss B., Fukami M., Rump A., Niesler B., Metz A.,
Muroya K., Binder G., Kirsch S., Winkelmann M., Nordsiek G., Heinrich U., Breuning Μ. H., Ranke M.B., Rosenthal A., Ogata T., Rappold G.A. (1997): Pseudoautosomal deletions encompassing a navel homeobox gene cause groxth failure in idiopathic short stature and Turner syndrome. Nátuře Genet 15:54-62. Gen SHOT se mapoval analýzou FISH chromozomu 3q25/q26 a dále se mapoval myší homolog syntetické oblasti na myším chromozomu 3. Na základě expresivního paternu OG12, což je myší homolog genu SHOT, gen SHOT reprezentuje kandidáta odpovídajícího za Cornelia Lange syndrom (který vykazuje malou výšku vzrůstu a další rysy, kam patří kraniofaciální abnormality) , který se mapoval v tomto intervalu na chromozomu 3q25/26.
Příklad 7: Vyhledávání mutací u pacientů s idiopatickým malým vzrůstem
Sekvence DNA podle vynálezu se používají při PCR, LCR a při jiných známých technologiích, za účelem stanovení, zda takoví jednotlivci s malou výškou vzrůstu vykazují malé delece nebo bodové mutace v genu odpovídajícím za malý vzrůst.
U 91 (z celkového počtu 250 jednotlivců) nezávislých pacientů mužského a ženského pohlaví s idiopatickou malou výškou vzrůstu (odhad četnosti idiopatické malé výšky vzrůstu v obecné populaci se odhaduje na 2 až 2,5 %) se testovala přítomnost malých změn v uspořádání nebo bodové mutace v genu SHOXa. Navrhlo se šest sad primerů PCR, ne pouze za účelem amplifikace jednotlivých exonů, ale také sekvencí, které ·· ·· t· ·« lemují exon a malé části 5ÚTR. V případě největšího exonu, exon I, se generovaly dva další primery uvnitř exonu. Primery, které se používaly při PCR, se uvádějí v tabulce č. 2.
Provedl se jednořetězcový konformační polymorfizmus (SSCP) všech amplifikováných exonů, jehož velikost se pohybuje v rozmezí od 120 do 295 bp. Pouze v případě dvou jednotlivců s malou výškou vzrůstu (Y91 a AI) se identifikoval posun pohyblivosti pruhů. Klonovaly se a sekvenovaly fragmenty, které vykazují pozměněné paterny SSCP (unikátní konformery SSCP) . Aby se zabránilo vzniku PCR a sekvenačních artifaktů, sekvenování se provedlo na dvou řetězcích za použití dvou nezávislých reakcí PCR. Mutace u pacienta Y91 se nachází v pozici 28 bp 5'konce startovacího kodonu v 5'UTR a zahrnuje substituci, kdy guanin se nahradí citidínem. Aby se zjistilo, jestli tato mutace reprezentuje řídký polymorfizmus nebo je odpovědná za fenotyp regulací exprese genu, například slabším navázáním translačních iniciačních faktorů, testovaly se pacientovi rodiče a sestra. Přestože sestra a otec pacienta dosahují normální CP (data nejsou uvedeny). Uvedená substituce bází reprezentuje řídký polymorfizmus, který neovlivňuje fenotyp.
Klonování a sekvenování unikátních konformerů SSCP pacienta Al vykazuje transici bází, kdy citidin nahradí thymidin (nukleotid 674), která zavede terminační kodon do pozice aminokyseliny 195 předpovězených aminokyselinových sekvencí 225 a 292. Aby se stanovilo, zda tato nesmyslná mutace je geneticky asociována s malou výškou vzrůstu rodiny, provedla se rodová analýza. Zjistilo se, že všech šest jednotlivců s malou výškou vzrůstu (definovanou jako výška nižší než 2 standardní odchylky) vykazuje nenormální posun SSCP a transici cytidinu za thymidin. Ani otec, ani jedna z tet a dědeček z matčiny strany, kteří dosáhly normální výšky nevykazují mutaci, což naznačuje, že babička přenesla mutovanou alelu na její dvě dcery a na jejich dvě vnoučata. U této rodiny * 4 • ·
4 44 44
4 4 4 4 4
4 4 4 4 4 4
44444 4 444 444 • · 4 4 <4 4 ·· «4 existuje shoda mezi přítomností mutovaných alel a fenotypu vykazujícího malou výšku vzrůstu.
Stejná situace, která se popisuje shora v textu, se zjistila u jiného pacienta s malou výškou vzrůstu, který je japonského původu.
Příklad 8:
Sekvence DNA podle vynálezu se používají pro charakterizaci funkce genu nebo genů. Sekvence DNA se mohou použít jako otázky při vyhledávání bází v databázích aminokyselin a nukleových kyselin za účelem identifikace příbuzných genů nebo genových produktů. Jako otázka pro vyhledávání v databázi aminokyselin se použila částečná aminokyselinová sekvence SHOX93. Test vykazuje velmi vysokou homologii s mnoha známými proteiny homeoboxů. Sekvence cDNA podle vynálezu se mohou použít při produkci peptidu rekombinantní metodou. Při produkci proteinu rekombinantním způsobem se mohou použít různé expresivní systémy, které jsou dobře známy v oboru.
Běžnou syntézou peptidu (syntéza proteinů podle Merrifieldovy metody) se syntetizoval peptid se sekvencí CSKSFDQKSKDGNGG a podle standardního protokolu se získaly polyklonální protilátky z králíků a kuřat.
6*4 4» 4 «4 44
38 | 4 4 4 4 4 4 «4444 «4 4 | 4 4 4 4 4 4 | |||
Seznam literatury | |||||
Ashworth A., Rastan S., | Lovell- | Badge R., | Kay | G., (1991): | X- |
chromosome inactivation | may | explain | the | difference | in |
viability of XO humans and mice. Nátuře 351: 406-408.
Blagowidow N., Page D.C., Huff D., Mennuti MT (1989): UllrichTurner syndrome in an XY female fetus with deletion of the sex-determining portio of the Y chromosome. Am. J. med. Genet. 34: 159-162.
Cantrell M.A., Bicknell J.N., Pagon RA et al. (1989): Molecular analysis 46,XY females and regional assignment of a new Y-chromosome-specific probe. Human. Genet. 83. 88-92.
ConnorJ.M., Loughlin S.A.R. (1989): Molecular genetics of Turner's syndrome.Acta Pediatr. Scand. (Suppl.) 356: 77-80.
Disteche C.M., Casanova M., Saal H., Friedman C., Sybert V., Graham J., Thline H., Page D.C., Fellous M., (1986): Smáli deletions of the short arm of the Y-chromosome in 46,XY females. Proč. Nati. Acad. Sci USA 83: 7841-7844.
Ferguson-Smith M.A. (1965) : Karyotype-phenotype correlations in gonadal dysgenesis and their bearing on the pathogenesis of malformations. J. med. Gent. 2: 142-155.
Ferrari D., Kosher R.A., Dealy C.N. (1994): Limb mesenchymal cells inhibited from undergoing cartilage differentiation by a tumor promoting phorbol ester maintain expression of the homeobox-containing gene MSX1 and fail to exhibit gap junctional communication. Biochemical and Biophysical Research
Communications. 205(1):429-434.
9
I 9 ·
99999 9 999 99« «
9> 9 99 99
Fischer M., Bur-Romero P., Brown L.G. et al., (1990): Homologous ribosomal protin genes in the human X- and Ychromosomes escape from X-inactivation and possible implementation for Turner syndrome. Cell 63: 1205-1218.
Freund C., Horsford D.J., Mclnnes R.R. (1996): Transcription factor genes and the developing eye: a genetic perspective: Hum. Mol. Genet. 5: 1471-1488.
Gehring W. J., Qian Y.Q., Billeter, Furukubo-Tokunaga K., Schier A. F., Resendez-Perez D., Affolter M., Otting G., Wuthrich K., (1994): Homeodomein-DNA recognition . Cell 78:
211-223.
Grumbach M.M., Conte F.A. ¢1992): Disorders of sexual differentation. In: Williams textbook of endocrinology, 8th edn.m edited by Wilson J.D., Foster D.W., pp. 853-952, Philadelphia, WB Saunders.
Hernandez D., Fisher E.M.C. (1996): Down syndrome genetics: unravelling a multifactorial disorder. Hum. Mol. Genet. 5: 1411-1416.
Kenyon C., (1994) : If birds can fly, why can't we? Homeotic genes and evolution . Cell 78: 175-180.
Krumlauf R., (1994): Hox genes in vertebrate development. Cell
78: 191-201.
Lawrence P.A., Morata G., (1994): Homeobox genes: their function in Drosophila segmentation and pattern formation. Cell 78: 181-189.
F FF FF F FF FF
FFF FFF FFFF
F F · · · FFF F FF F * F FFF F FFFF · FFF FFF FFFFFF F F
FFF FF <F F FF F-F
Lehrach H., Drmnac R., Hoheisel J.D., Larin Z., Lemon G.,
Monaco A.P., Nizetic D., et al., Hybridization finger printing in genome mapping and sequencing. In Davies K.E., Tilghman S.,
Eds. Genome Analysis 1990: 39-81 Cold Spring Harbor, NY.
Levilliers J., Quack B., Weissenbach J., Petit C., (1989):
Exchange of terminál pdrtions of X- and Y-chromosomal short arms in human XY females. Proč. Nati. Acad. Sci. USA 86: 22962300.
Lippe B.M. (1991) : Turner Syndrome. Endocrinol. Metab. Clin.
North Am. 20: 121-152. Magenis R.E., Tochen M.L. Holahan K.P.,
Carey T., Allen L., Brown M.G. (1984): Turner syndrome resulting from partial deletion of Y-chromosome short arm: localization of male determinantns. J. Pediatr 105: 916-919.
Pohlschmidt M., RappoldG.A., Krause M., Ahlert D., Hosenfeld D., Weissenbach J., Gal A. (1991): Ring Y chromosome: Molecular characterization by DNA probes. Cytogenet. Cell Genet. 56: 65-68.
Qiagen (1993) TGGE Handbook, Diagen GmbH, TGMA 41123/93.
Osenfeld R.G. (1992): Turner syndrome: a guide for physicians.
Second edition. The Turner's Syndrome Sciety.
Rovescalli A.C., Asoh S., Nirenberg M. (1996): Gloning and characterization four murine homeobox genes. Proč. Nati. Acad.
Sci. USA 93: 10691-10696.
Shalet S.M. (1993): Leukemia in children treated with growth hormone. Journal o fPediatric Endocrinology 6: 109-11
Vimpani G.' Farquhar J deficiency.
41 | • · · 4 4 · 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 | 44 4 44 44 4 4 4 4 4 4 4 4 444 4 44 4 4 4 4444 4 444 444 4 4 4 4 4 44 4 44 44 | ||
• / | Vimpani | A.F., Lidgard | G.P., Cameron | E.H.D., |
w. | (1977) | Prevalence of | severe growth | hormone |
Br. | Med. J. | 2: 427-430. |
Zinn A.R., Page D.C., Fisher E.M.C. (1993): Turner syndrome: the čase of the missing sex chromosome. TIG 9(3): 90-93.
• «» 9· 9 99 99
999 999 9 9 9 9 • · · · · 9 19 1 9 1 9 • 1 9 11 9 1111 1 111 111
199 19 19 1 9· «9
Sekvenční protokol (1)
Obecné informace:
Navrhovatel: | ||
(A) | JMÉNO | : Rappold-Hoerbrand, Gudrun |
(B) | ULICE | : Hausackerweg 14 |
(C) | MĚSTO | : Heidelberg |
(D) | ZEMĚ: | Německo |
(E) | ZIP: | 69118 |
(ii) Název vynálezu: Molekula nukleové kyseliny kódující polypeptidy a způsoby jejího použití.
(iii) Počet sekvencí: 16 (iv) Počítačem čitelná forma:
(A) TYP MÉDIA: disketa (B) POČÍTAČ: kompatibilní s IBM PC (C) OPERAČNÍ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, verze #1.30 EPO (2) (vi) Data předchozích přihlášek (A) PŘIHLÁŠKA č. US 60/027,633 (B) DATUM PODÁNÍ: 01-10-1996 (vi) Data předchozích přihlášek (A) PŘIHLÁŠKA č. US 60/027,633 (B) DAT UM PODÁNÍ: 01-10-1996
Informace o sekvenci SEQ ID NO: 1:
(i) CHARAKTERIŠTIKA SEKVENCE:
(A) DÉLKA: 60 aminokyselin (B) TYP: aminokyselinová (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární
9* ·· 4 44 44
4 4 4 4 4 4
4 4 4 « 44 4
4 · « 4 4 ···· 4 444 444 · » 4 · 4 4 4
........ ** ·’ (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 1
Gin 1 | Arg | Arg | Ser | Au:g 5 | Thr | Aan | Phe | Thr | Leu 10 | Glu | Gin | Leu | Aan | Glu 15 | Leu |
Glu | Arg | Leu | Phe 20 | Aap | Glu | Thr | Hia | Tyr 25 | Pro | Aap | Ala | Phe | Met 30 | Arg | Glu |
Glu | Leu | Ser 35 | Gin | Arg | Leu | Gly | Leu 40 | Ser | Glu | Ala | Arg | Val 45 | Gin | Val | Trp |
Phe | Gin 50 | Aan | Arg | Arg | Ala | Lya 55 | Cya | Arg | Ly3 | Gin | Glu 60 |
(2) Informace o sekvenci SEQ ID NO: 2:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 209 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon II: ET93 (v) TYP FRAGMENTU: lineární (xi) POPIS SEKVENCE: SEQ ID NO: 2
GGATTTATGA | ATGCAAAGAG | AAGCGCGAGG | ACGTGAAGTC | GGAGGACGAG | GACGGGCAGA | 60 |
CCAAGCTGAA | ACAGAGGCGC | AGCCGCACCA | ACTTCACGCT | GGAGCAGCTG | AACGAGCTCG | 120 |
AGCGACTCTT | CGACGAGACC | CATTAGCCCG | ACGCCTTCAT | GCGCGAGGAG | CTCAGCCAGC | 180 |
GCCTGGGGCT | CTCCGAGGCG | CGCGTGCAG | 209 |
(2) Informace o sekvenci SEQ ID NO: 3:
(i) CHARAKTERIŠTIKA SEKVENCE:
(A) DÉLKA: 368 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis= „exon I: G310 (xi) POPIS SEKVENCE: SEQ ID NO: 3:
• 9 • 9 • 999 • 9 k · > 9
9 » 9
I 9
9 9 9
9
GTGATCCACC | CGCGCGCACG | GGCCGTCCTC | TCCGCGCGGG | GAGACGCGCG | CATCCACCAG | 60 |
CCCCGGCTGC | TCGCCAGCCC | CGGCCCCAGC | CATGGAAGAG | CTCACGGCTT | TTGTATCCAA | 120 |
GTCTTTTGAC | CAGAAAAGCA | AGGACGGTAA | CGGCGGAGGC | GGAGGCGGCG | GAGGTAAGAA | 180 |
GGATTCCATT | ACGTACCGGG | AAGTTTTGGA | GAGCGGACTG | GCGCGCTCCC | GGGAGCTGGG | 240 |
GACGTCGGAT | TCCAGCCTCC | AGGACATCAC | GGAGGGCGGC | GGCCACTGCC | CGGTGCATTT | - 300 |
GTTCAAGGAC | CACGTAGACA | ATGACAAGGA | GAAACTGAAA | GAATTCGGCA | CCGCGAGAGT | 360 |
GGCAGAAG | r | 368 |
(3) Informace o sekvenci SEQ ID NO: 4:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 58 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon III: ET45 (xi) POPIS SEKVENCE: SEQ ID NO: 4:
GTTTGGTTCC AGAACCGGAG AGCCAAGTGC CGCAAACAAG AGAATCAGAT GCATAAAG (2) Informace o sekvenci SEQ ID NO: 5:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 89 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon IV: G108 (xi) POPIS SEKVENCE: SEQ ID NO: 5:
GCGTCATCTT GGGCACAGCC AACCACCTAG ACGCCTGCCG AGTGGCACCC TACGTCAACA
TGGGAGCCTT ACGGATGCCT TTCCAACAG •44 444
4» (2) Informace o sekvenci SEQ ID NO: 6:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1166 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon : Va (Xij POPIS SEKVENCE: SEQ ID NO: 6:
GTCCAGGCTC | AGCTGCAGCT | GGAÁGGCGTG | GCCCACGCGC | ACCCGCACCT | GCACCCGCAC |
CTGGCGGCGC | ACGCGCCCTA | cctgatgttc | CCCCCGCCGC | CCTTCGGGCT | GCCCATCGCG |
TCGCTGGCCG | AGTCCGCCTC | GGCCGCCGCC | GTGGTCGCCG | CCGCCGCCAA | AAGCAACAGC |
AAGAATTCCA | GCATCGCCGA | CCTGCGGCTC | AAGGCGCGGA | AGCACGCGGA | GGCCCTGGGG |
CTCTGACCCG | CCGCGCAGCC | CCCCGCGCGC | CCGGACTCCC | GGGCTCCGCG | CACCCCGCCT |
GCACCGCGCG | TCCTGCACTC | AACCCCGCCT | GGAGCTCCTT | CCGCGGCC^C | CGTGCTCCGG |
GCACCCCGGG | AGCTCCTGCA | AGAGGCCTGA | GGAGGGAGGC | TCCCGGGACC | GTCCACGCAC |
GACCCAGCCA | GACCCTCGCG | GAGATGGTGC | AGAAGGCGGA | GCGGGTGAGC | GGCCGTGCGT |
CCAGCCCGGG | CCTCTCCAAG | GCTGCCCGTG | CGTCCTGGGA | cCC.TGGAGAA | GGGTAAACCC |
CCGCCTGGCT | GCGTCTTCCT | CTGCTATACC | CTATGCATGC | GGTTAACTAC | ACACGTTTGG |
AAGATCCTTA | GAGTCTATTG | AAACTGCAAA | GATCCCGGAG | CTGGTCTCCG | ATGAAAATGC |
CATTTCTTCG | TTGCCAACGA | TTTTCTTTAC | TACCATGCTC | CTTCCTTCAT | CCCGAGAGGC |
TGCGGAACGG | GTGTGGATTT | GAATGTGGAC | TTCGGAATCC | CAGGAGGCAG | GGGCCGGGCT |
CTCCTCCACC | GCTCCCCCGG | AGCCTCCCAG | GCAGCAATAA | GGAAATAGTT | CTCTGGCTGA |
GGCTGAGGAC | GTGAACCGCG | GGCTTTGGAA | AGGGAGGGGA | GGGAGACCCG | AACCTCCCAC |
GTTGGGACTC | CGACGTTCCG | GGGACCTGAA | TGAGGACCGA | CTTTATAACT | TTTCCAGTGT |
TTGATTCCCA | AATTGGGTCT | GGTTTTGTTT | TGGATTGGTA | TTTTTTTTTT | TTTTTTTTTT |
TGCTGTGTTA | CAGGATTCAG | ACGCAAAAGA | CTTGCATAAG | AGACGGACGC | GTGGTTGCAA |
GGTGTCATAC | TGATATGCAG | CATTAACTTT | ACTGACATGG | AGTGAAGTGC | AATATTATAA |
ATATTATAGA | TTAAAAAAAA | AATAGC |
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1166 (2) Informace o sekvenci SEQ ID NO: 7:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 625 párů baží (E) TYP: nukleová kyselina (F) DRUH ŘETĚZCE: jednořetězcová
9-9
99
9 9 «9 9 9 · « 9 9
9 9 9 9
99 99 9
9 9 9 « 9 9 9
999 999
9
99 • 9 • 999 (G) TOPOLOGIE: lineární (iii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon Vb (xi) POPIS SEKVENCE: SEQ ID NO: 7:
ATGGAGTTTT GCTCTTGTCG CCCAGGCTGG AGTATAATGG CATGATCTCG ACTCACTGCA 60
ACCTCCGCCT CCCGAGTTCA AGCGATTCTC CTGCCTCAGC CTCCCGAGTA GCTGGGATTA 120
CAGGTGCCCA CCACCATGTC AAGATAATGT TTGTATTTTC AGTAGAGATG GGGTTTGACC 180
ATGTTGGCCA GGCTGGTCTC GAACTCCTGA CCTCAGGTGA TCCACCGGCC TTAGCCTCCC 240
AAAGTGCTGG GATGACAGGC GTGAGCCCCT GCGCGCGGCC TTTGTAACTT TATTTTTAAT 300
TTTTTTTTTT TTTTAAGAAA GACAGAGTCT TGCTCTGTCA CCCAGGCTGG AGCACACTGG 360
TGCGATCATA GCTCACTGCA GCCTCAAACT CCTGGGCTCA AGCAATCCTC CCACCTCAGC 420
CTCCTGAGTA GCTGGGACTA CAGGCACCCA CCACCACACC CAGCTAATTT TTTTGATTTT 480
TACTAGAGAC GGGATCTTGC TTTGCTGCTG AGGCTGGTCT TGAGCTCCTG AGCTCCAAAG 540
ATCCTCTCAC CTCCACCTCC CAAAGTGTTA GAATTACAAG CATGAACCAC TGCCCGTGGT 600
CTCCAAAAAA AGGACTGTTA CGTGG
625
B BB BB · BB BB ··· BBB BBBB • BBB B BBB B B B B
B B · B B B BBBB · BBB BBB BBBBBB B * (2) Informace o sekvenci SEQ ID NO: 8: (i) CHARAKTERISTIKA SEKVENCE:
(A) | DÉLKA: 15577 párů baží | |
(B) | TYP: nukleová kyselina | |
(C) | DRUH ŘETĚZCE: jednořetězcová | |
(D) | TOPOLOGIE: lineární | |
(ii) | TYP | MOLEKULY: jiná nukleová kyselina |
(A) | POPIS: /popis = „HOX93 | |
(ix) | RYSY: | |
(A) | NÁZEV/KLÍČ: exon | |
(B) | POZICE: 1498..1807 | |
(D) | JINÉ INFORMACE: /funkce = „část exonu I (G310) | |
(ix) | RYSY: | |
(A) | NÁZEV/KLÍČ: misc_ | |
(B) | POZICE: 3844..4068 | |
(D) | JINÉ INFORMACE: /funkce = „oblast pET92 (první |
část)
(ix) | RYSY: | |||
(A) (B) (D) část | NÁZEV/KLÍČ: misc_ POZICE: 4326..4437 | |||
JINÉ INFORMACE: /funkce = ) | „oblast pET92 | (druhá | ||
(ix) | RYSY: | |||
(A) | NÁZEV/KLÍČ: misc_ | |||
(B) | POZICE: 4545..4619 | |||
(D) | JINÉ INFORMACE: /funkce = | „oblast pET92 | (třetí |
část) (ix) RYSY:
(A) NÁZEV/KLÍČ: misc_ (B) POZICE: 5305..5512 (D) JINÉ INFORMACE: /funkce = „část exonu II (ET93) (ix) RYSY:
(A) NÁZEV/KLÍČ: mise
44
4 4
44
4 4 4
4 4 4
444 444
4 (B) POZICE: 11620..11729 (D) JINÉ INFORMACE: /funkce (G108) (xi) POPIS SEKVENCE: SEQ ID NO: 8:
„část exonu IV
CTCTCCCTGT | TGTGTCTCTC | TTTCTCTCTC | TCCATCTCTC | TCCGTCTTTC | CCCCTCTGTC | 60 |
TCTTTCTCTG | TCTCCATCCC | TCTGTCTCTC | CCTTTCTCTC | TGTCTTTCCT | TGTCTCTCTC | 120 |
TTTCTCTCTC | TCTCTCCATC | TCTCTCTCTC | CCGGTCTCTC | TCTCTCCATC | TCCCCGTCTC | 180 |
TCCGTTTCTC | TCTCTGCCTC | TCCCTGTCTG | TCTCTCTCTT | TGTGTGTGTT | ACACACACCC | 240 |
CAACCCACCG | TCACTCATGT | CCCCCCACTG | CTGTGCCATC | TCACACAAGT | TCACAGCTCA | 300 |
GCTGTCATCC | TGGGTCCCCA | GGCCCCGCCG | GGGAGGAAGA | TGCGCCGTGG | GGTTACGGGA | 360 |
GGAAGGGGAC | TCCGGGCCTC | CTGGTGCCCC | ACTTTATTTG | CAGAAGGTCC | TTGGCAGGAA | 420 |
CCGTGACGCG | TTTGGTTTCC | AGGACTTGGA | AAACGAATTT | CAGGTCGCGA | TGGCGAGCAC | 480 |
CGGCTTCCCC | TGAAGCACAT | TCAATAGCGA | GAGGCGGGAG | GGAGCGAGCA | GGAGCATCCC | 540 |
ACCATGAAAA | CCAAAAACAC | AAGTATTTTT | TTCACCCGGT | AAATACCCCA | GACGCCAGGG | 600 |
TGACAGCGCG | GCGCTAAGGG | AGGAGGCCTC | GCGCCGGGGT | CCGCCGGGAT | T CTGGCGCGGG | 660 |
CGGAAAGAAT | ATAGATCTTT | ACGAACCGGA | TCTCCCGGGG | ACCTGGGCTT | CTTTCTGCGG | 720 |
GCGCTGGAAA | CCCGGGAGGC | GGCCCCGGGG | ATCCTCGGCC | TCCGCCGCCG | CCGCCTCCCA | 780 |
AGCGCCCGCG | TCCCGGTTTG | GGGACACCCG | GCCCCTTCTT | CTCACTTTCG | GGGATTCTCC | 840 |
AGCCGCGTTC | CATCTCACCA | ACTCTCCATC | CAAGGGCGCG | CCGCCACCAA | CTTGGAGCTC | 900 |
ATCTTCTCCC | AAAATCGTGC | GTCCCCGGGG | CGCCCGGGTC | CCCCCCCTCG | CCATCTCAAC | 960 |
CCCGGCGCGA | CCCGGGCGCT | TCCTGGAAAG | ATCCAGGCGC | CGGGCTCTGC | GCTCCTCCCG | 1020 |
GGAGCGAGGG | CGGCCGGACA | ACTGGGACCC | TCCTCTCTCC | AGCCGTGAAC | TCCTTGTCTC | 1080 |
• 99 99 9 99 94
999 «99 9999
9 9« 9 999 9 99 9 • 9 9 9 9 9 9999 · 999 999
9499*9 9 9
999 99 99 9 99 99
TCTGTCTCTC | T C aGCAGGAA | AAC ± GGAGTT | TGCTTTTCCT | CCGGCCACGG | AAAGAACGCG | 1140 |
GGTAACCTGT | GTGGGGGGCT | CGGGCGCCTG | CGCCCCCCTC | CTGCGCGCGC | GCTCTCCCTT | 1200 |
CCAAAAATGG | GATCTTTCCC | CCTTCGCACC | AAGGTGTACG | GACGCCAAAC | AGTGATGAAA | 1260 |
TGAGAAGAAA | GCCAATTGCC | GGCCTGGGGG | GTGGGGGAGA | CACAGCGTCT | CTGCGTGCGT | 1320 |
CCGCCGCGGA | GCCCGGAGAC | CAGTAATTGC | ACCAGACAGG | CAGCGCATGG | GGGGCTGGGC | 1380 |
GAGGTCGCCG | CGTATAAATA | GTGAGATTTC | CAATGGAAAG | GCGTAAATAA | CAGCGCTGGT | 1440 |
GATCCACGCG | CGCGCACGGG | CCGTCCTCTC | CGCGCGGGGA | GACGCGCGCA | TCCACCAGCC | 1500 |
CCGGCTGCTC | GCCAGCCCCG | GCCCCAGCCA | TGGAAGAGCT | CACGGCTTTT | GTATCCAAGT | 1560 |
CTTTTGACCA | GAAAAGCAAG | GACGGTAACG | GCGGAGGCGG | AGGCGGCGGA | GGTAAGAAGG | 1620 |
ATTCCATTAC | GTACCGGGAA | GTTTTGGAGA | GCGGACTGGC | GCGCTCCCGG | GAGCTGGGGA | 1680 |
CGTCGGATTC | CAGCCTCCAG | GACATCACGG | AGGGCGGCGG | CCACTGCCCG | GTGCATTTGT | 1740 |
TCAAGGACCA | CGTAGACAAT | GACAAGGAGA | AACTGAAAGA | ATTCGGCACC | GCGAGAGTGG | 1800 |
CAGAAGGTAA | GTTCCTTTGC | GCGCCGGCTC | CAGGGGGGCC | CTCCTGGGGT | TCGGCGCCTC | 1860 |
CTCGCCACGG | AGTCGGCCCC | GCGCGCCCCT | CGCTGTGCAC | ATTTGCAGCT | CCCGTCTCGC | 1920 |
CAGGGTAAGG | CCCGGGCCGT | CAGGCTTTGC | CTAAGAAAGG | AAGGAAGGCA | GGAGTGGACC | 1980 |
CGACCGGAGA | CGCGGGTGGT | GGGTAGCGGG | GTGCGGGGGG | ACCCAGGGAG | GGTCGCAGCG | 2040 |
GGGGCCGCGC | GCGTGGGCAC | CGACACGGGA | AGGTCCCGGG | CTGGGGTGGA | TCCGGGTGGC | 2100 |
TGTGCCTGAA | GCCGTAGGGC | CTGAGATGTC | TTTTTCATTT | TCTTTTTCTT | TCCTTTCCTT | 2160 |
TTTTTGTTTG | TTTGTTTGTT | TGTTTGAGAC | AGAGTCTCGC | TCTGTCCCCC | AGGCTGGAGT | 2220 |
GCAGTGGTGC | GATCTCGGCT | CACTGCAACC | TCCGCCTCCT | GGGTTCAAGC | GATTCTCCTG | 2280 |
CCTCAGCCTC | CCCAGTAGCT | GGGATTACAG | GCATGCACCA | CCACGCCTGG | CTAATTTTTG | 2340 |
TGCTTTTAGT | AAAGACGGGG | ATTCACCATG | TTGGCCAGGC | TGGTCTCGAA | CTCCTGACCT | 2400 |
CAGGTGATCC | ACCCGCCTCG | GCCTCCCAAA | GTGCTGGGAT | GACAGGCGTG | AGGCACCGCG | 2 4 60 |
CCCGGCCTGG | GTCCTGACGG | CTTAGGATGT | gtgtttctgt | CTCTGCCTGT | CTGCCTTGTA | , 2520 |
TTTACGGTCA | CCCAGACGCA | CAGAGGAGCC | GTCTCCACGC | GCCTTCCCAG | CGCTCAGCGC | 2580 |
CTGCCGGGCC | CCCGGAGATC | ACGGGAAGAC | TCGAGGCTGC | GTGGTAGGAG | ACGGGAAGGC | 264 0 |
CCCGGGTCAG | CTCGGTTCTG | TTTCNCTTTA | AGGAACCCTT | CATTATTATT | TCATTGTTTT | 2700 |
CCTTTGAACG | TCGAGGCTTG | ATCTTGGCGA | AAGCTGTTGG | GTCCATAAAA | ACCACTCCCG | 2760 |
TGAGCGGAGG | TGGCCGGGAT | CTGGATGGGG | CGCGAGGGGC | CCCGGGGAAG | CTGGCGGCTT | 2820 |
CGCGGGCGCG | TCCTAAGTCA | AGGTTGTCAG | AGCGCAGCCG | GTTGTGCGCG | GCCCGGGGGN | 2880 |
AGCTCCCCTC | TGGCCCTTCC | TCCTGAGACC | TCAGTGGTGG | GTCGTCCCGT | GGTGGAAATC | 2940 |
GGGGAGTAAG | AGGCTCAGAG | AGAGGGGCTG | GCCCCGGGGA | TCTCTGTGCA | CACACGACAA | 3000 |
CTGGGCGGCA | TACATCTTAA | GAATAAAATG | GGCTGGCTGT | GTCGGGGCAC | AGCTGGAGAC | 3060 |
• 00 00 • · · 0 0
0 0 0 * 0 • · 0 0 0 0
0 0 0 0
0 0 0 0 00 ·· • · 0 · • · 0 · • 00 · · · 0
0 0
00 00
GGCTATGGAC | GCCTGTTATG | TTTTCATTAC | AAAGACGCAG | AGAATCTAGC | CTCGGCTTTT | 3120 |
GCTGATTCGC | AAAGTTGAGG | TGCGAGGGTG | AATGCCCCAA | AGGTAATTCT | TCCTAAGACT | 3180 |
CTGGGGCTAC | CTGCTCTCCG | GGGCCCTGCA | TTTGGGGTGT | GGAGTGGCCC | CGGGAAATAG | 3240 |
CCCTTGTATT | CGTAGGAGGC | ACCAGGCAGC | TTCCCAAGGC | CCTGACTTTG | TCGAAGCAGA | 3300 |
AAGCTGTGGC | TACGGTTTAC | AAAGCAGTCC | CCGGTTTCTG | ACCGTCTAAG | AGGCAGGAGC | 3360 |
CCAGCCTGCC | TTTGACAGTG | AGAGGAGTTC | CTCGCTACAC | ACTGCTGCGG | GCACCCGGCA | 3420 |
CTGTAATTCA | TACACAGAGA | GTTGGCCTTC | CTGGACGCAA | GGCTGGGAGC | CGCTTGAGGG | 3480 |
CCTGCGTGTA | ATTTAAGAGG | GTTCGCANGC | GCCCGGCGGC | CGCTTCTGNT | GGGGTTGCTT | 3540 |
TTTGGTTGTC | CTTCNGCAAA | CACCGTTTTG | CTCCTCTNGN | AACTCTCTCT | TNCTCCCCCN | 3600 |
TGGCCNGTNG | GACCCGGGNA | NGAGCAAAGT | GTCCTCCAGA | CCNTTTTGAA | ANGTGAGAGG | 3660 |
AAAATAAAGA | CCAGGCCAAA | NNGACCCAGG | GCCACAGGAG | AGGAGACAGA | GAGTCCCCGT | 3720 |
TACATTTTNC | CCCTTGGCTG | GGTGCAGAAA | GACCCCCGGG | CCAGGACTGC | CACCCAGGCT | 3780 |
ACTATTTATT | CATCAGATCC | AAGTTAAATC | GAGGTTGGAG | GGCAGGGGAG | AGTCTGAGGT | 3840 |
TACCGTGGAA | GCCTGGAGTT | TTTGGGNAAC | AGCGTGTCCC | CGCCGAGCCT | GGGAGCCCGT | 3900 |
GGGTTCTGCA | AAGCCTGCGG | GTGTTTGAGG | ACTTTGAAGA | CCAGTTTGTC | AGTTGGGCTC | 3960 |
AATTNCCTGG | GGTTCAGACT | TAGAGAAATG | AAGGAGGGAG | AGCTGGGGTC | GTCTCCAGGA | 4020 |
AACGATTCAC | TTGGGGGGAA | GGAATGGAGT | gttcttgcag | GCACATGTCT | GTTAGGAGGT | 4080 |
GAAACAGAAT | GTGAAATCCA | CGTTGGAGTA | AGCGTCCAGC | GCTGAATGTA | GCTCGGGGTG | 4140 |
GGGTGGGAGG | GCCCTGGTGT | GGATCGTGGA | AGGNAAGAAA | GACAGAACAG | GGTGCTAGTA | 4200 |
TTTACC.CCGT | TNCCCTGTAG | ACACCCTGGA | TTTGTCAGCT | TTGCAAGCTT | CTTGGTTGCA | 4260 |
GCGGCCTTGC | CTGTGCCCCT | TTGAGACTGT | TTCCAGACTA | AACTTCCAAA | TGTCAGCCGC | 4320 |
TTACCCTTGA | CAGCAAGGGA | CATCTCATTA | GGGCATCGCG | TGCTTCTCAT | CTGTGNCTCA | 4380 |
GCAGGCCCNG | AGATAGG/vAN | CANGAGGGGC | NGTTGGNAGA | TGCNCACTTC | CACCAGCCCT | 4440 |
GGGNTTGAAG | GGGANGCGAN | GGGANGACNA | CCTTTTANCT | TAAACCCCTN | GAGCTTGGTN | 4500 |
CAGAGAGGNC | TGAATGTCTA | AAATGAGGAA | GAAAAGGTTT | TTCACCTGGA | AACGCTTGAG | 4560 |
GGCTGAGTCT | TCTGGCCNTT | CTGACNTCCC | CCAGCAAATA | CAGACAGGTC | ACCAANCTAC ř GACCGCGTGT | 4620 |
TGGAGATGAG | AAAGTGCCAT | TTTTGGCACA | CTCTGGTGGG | GTAGGTGCCC | 4680 | |
GAAAAANGTG | GGAANNGGAG | AGATTTCTGN | CGCACGCGGT | TCAGCCCCCA | GGCGCGGNTG | 4740 |
GCNGCATTCN | AGGNTACTCA | GACGCGGTTC | TGCTGTTCTG | CTGAGAAACA | GGCTTGGGGT | 4800 |
AGGGGCTCCT | AGCTCCGCCA | GATCGCGGAG | GGACCCCCAG | CCCTCCTGCG | CTGCAGCGGT | 4860 |
GGGGATAGCG | TCTCTCCGTA | GGCCTAGAAT | CTGCAACCCG | CCCCGGGTCC | TCCCCGTGTC | 4920 |
CTTCCCGGGC | GTCCCGCCGG | GGATCCCACA | GTTGGCAGCT | CTTCCTCAAA | TTCTTTCCCT | 4980 |
TAAAAATAGG | ATTTGACACC | CCACTCTCCT | TAAAAAAAAA | AAATAAGAAA | AAAAGGTTAG | 5040 |
GTTATGTCAA | CAGAGGTGAA | GTGGATAATT | GAGGAAACGA | TTCTGAGATG | AGGCCAAGAA | 5100 |
9 9 9 9 • 99 9« • · ♦ · · • »99 · · • · 9 9 9 9 • 99 · 9 «
999 99 99 9
99
9 9 9
9 9 9
999 999
9
AACAACGCTC | GTGCAAAGCC | CAGGTTTTTG | GGAAAGCAGC | GAGTATCCTC | CTCGGCTTTT | 5160 |
GCGTTATGGA | CCCCACGCAG | TTTTTGCGTC | AAAGCGCATT | GGTTTTCGAG | GGCCCCCTTT | 5220 |
CCACCGCGGG | ATGCACGAAG | GGGTTCGCCA | CGTTGCGCAA | AACCTCCCCG | GCCTCAGCCC | 5280 |
TGTGCCCTCC | GCTCCCCACG | CAGGGATTTA | TGAATGCAAA | GAGAAGCGCG | AGGACGTGAA | 5340 |
GTCGGAGGAC | GAGGACGGGC | AGACCAAGCT | GAAACAGAGG | CGCAGCCGCA | CCAACTTCAC | 5400 |
GCTGGAGCAG | CTGAACGAGC | TCGAGCGACT | TTTTGACGAG | ACCCATTAGC | CCGACGCCTT | 5460 |
CATGCGCGAG | GAGCTCAGCC | AGCGCCTGGG | GCTTTCCGAG | GCGCGCGTGC | AGGTAGGAAC | 5520 |
GCGGGGGCGG | GGGCGGGGGG | CCCGGAGCCA | TCGCGTGGTC | CTCGGGAGCG | CACAGCACGC | 5580 |
GTACAGCCAC | CTGCGCCCGG | GCCGCCGCCG | TCCCCTTCCC | GGAGCGCGGG | GAGGTTGGGT | 5640 |
GAGGGACGGG | CTGGGGTTCC | TGGACTTTTG | GAGACGCCTG | AGGGCTGTAG | GATGGGTTCA | 5700 |
TTGCGTTTGT | TTTTCACCAA | CAGCAAACAA | ATATATATAC | ATATATATTA | TACAAATAAC | 57 60 |
ΑΑΑΤΑΑΑΤΑΤ | ATATGTTATA | CAGATGGGTA | TATTGTATAT | ATTATAGATA | TTTGTTCGTC | 5820 |
CTTGGTGCAA | AGACACCGGG | TGAACCCATA | TATTGGCTCC | TGACTGCCTT | CGGTTCCCCT | 5880 |
GGGATTGGTT | ATAGGGGGAA | CACATGCAAA | CAAAACTTTC | CCTGGATTAT | ACTTAGGAGA | 5940 |
CGAAGCTACA | GATGCGTTTG | ATGCAGAGTG | TTTTACAAGA | TTTTTCATTT | AAAAAAAAAT | 6000 |
GTGTCTTTTG | GCCCCTGATT | CCCCTCCGTC | TTCCCGTGTG | GCTGCATTGA | AAAGGTTTCC | 6060 |
TTAGGATGAA | AGGAGAGGGG | TGTCCTCTGT | CCCTAGGTGG | AGAGAAACAG | GGTCTTCTCT | 6120 |
TTCCTCCGTT | TTTTCACCTA | CCGTTTCTAT | CTCCCTCCTC | CCCTCTCCAG | CCCTGTCCTC | 6180 |
TGCTACAAAC | CACCCCCTCC | TCCCTCCGGC | TGTGGGGAGC | GCAGGAGCAC | GTTGGGCATC | 6240 |
TGGATGAGCG | GNAGACTATT | AGCGGGGCAC | GGGGGCTCCC | cgaggagcgc | GCGAATTCAC | 6300 |
GCTGCCCCAT | GAGACCAGGC | ACCGGGGGGC | GGAGGGGCCT | TGGGTGTCCG | CAGAGGGACG | 6360 |
GGCGGGCAGA | GCCTTCCTCC | GCATTCTAAA | CATTCACTTA | AiAGGTATGAG | TTTANTTTCA | 6420 |
GGGGTGCTGC | TGGGAGAGCC | TCCAAATGGC | TTCTTCCAGC | CCCTGCCTGA | CAGTTCAGCT | 6480 |
CCCCTGGAAG | GTCAACTCCT | CTAGTCCTTT | CTCCTGGTTC | TGGGCAGGAC | AGAAGTGGGG | 6540 |
GGAGGGAGAG | AGAGAGAGAG | AGAGAGAGAG | ACGGTCAGGA | TCCCCGGACC | CTGGGGAACC | 6600 |
CGTCAAAAAT | AAATGZvAATT | AAGATTGCCG | ACCAGAG/aGA | GAACCGTGAC | AAAGCAAACG r | 6660 |
GCGTTCAAAG | CAAAGAGACG | AACTGAAAGC | CCGTTCCCGT | AGGACTGGTT | ATGAGGTCAA | 6720 |
CACATTCAAA | CACAGCTTGC | TCTGGATTTT | GCTGAGCAGA | GGAAGATACA | GATGCATTTG | 67 80 |
ATCCAAAGTG | TGTTACATCT | TTCATTATAT | GTGTGTCTAT | ATATATAAAC | ATATATAAAT | 6840 |
ATATAAACAT | ACATAAATGT | ATGTAAATAT | ATATAATCTA | TATACATATA | ΤΑΑΑΤΛΤΑΤΑ | 6900 |
AACACATATA | TAATATATAA | ATCTATAAAC | ΑΤΑΤΑΤΛΑΤΑ | TATAAACATA | AATATATAAA | 6960 |
CATATATAAT | ATATAAATAT | ATTAACATAT | ATAAAATATG | ΤΑΤΛΑΑΤΑΤΑ | TATAAACATA | 7020 |
TAAACATATA | ΤΑΑΑΤΛΤΑΤΑ | AACATATAAA | TATATAAACA | ΤΑΤΛΤΑΑΑΤΑ | TATACAAACA | 7080 |
• 44 ··
4« 4 · ·
4444 4 ·
4 4 4 4 4
4 4 4 4
444 44 ·· '·»>
4 4 4
4 4 4
444 444
4 4
44 4 4 • · 4444
TATTGTATAT | ATATAAATAT | ATATAAAAAC | ATATATATAC | ATATAAAAAT | ATATATAAAC | 7140 |
ATATATACAT | ATAAAGAAAT | ATATATAAAC | ATATATACAT | ATAAATATAC | ATATATAAAC | 7200 |
ATATATATAC | ATAAAATATA | TATAAACATA | TATACATATA | AAAATATATA | TATATTAACA | 7260 |
TATATATACA | TATAAAAATA | TATATATTAA | CATATATATA | CATATAAAAA | TATATATATA | 7320 |
TTTTTGGCCC | CTGATTCCCT | TCGGTTCCTG | TGGGATGGGT | GATTGAGTCA | ACACATTCAA | 7380 |
ACACAACTTT | TCCATCGATG | TTGCTTAGGA | GATGAGGATA | CAGATGCGTT | TGATGGAGAG | 7440 |
GGTTTTACAA | GCTCTTTCAT | TTAAATATAT | ATATATATAT | ATATATATTT | TTTGGCTCCT | 7500 |
GATTCTCTTC | CGTCTTCCCA | TGTGGCTGCA | TTTTAAAAGG | CTTCCCTAAG | ATCGTTACGA | 7560 |
TTAAATCAAC | CCTCCCCAGG | CATCTTTACC | GAGGGCTGTG | GTCCCCAAAG | CGATACAGCC | 7620 |
CAGGAGGGAG | AGAGGCTTTG | GTGACTTGGA | GGAAGGACTG | TGTCCCTCCT | TAGGGCGTCT | 7680 |
GTGGCCTCAG | TGAGGGAAGG | AAGCTGCATC | AGACAGGGGT | TTCCTCGCTG | TCCACCCCTC | 7740 |
TGGGAGAAGA | TGGATTGGGC | TGCCCCGNTA | TAAATTAATG | AAAAGATTAA | AGTTTCGCTA | 7800 |
AAGGGGACAT | CGAGTTTATG | TGTCATCTCC | TGGTGNTCTG | TGTGCCNTGG | GATNCTGCAA | 7860 |
TATATCCCAN | NGCCCTTGAT | GNNNTACTGT | TTNCTATAAA | ΑΑ1ΊΝΤΑΑΑΤΝ | TACTTGTNNA | 7920 |
ATTTAANTTC | CNNNACACTA | TTTNCTTTCC | NNGTNAGTCT | NATTANCCGA | NCGAGAGCAN | 7980 |
CGNTTAGTTN | CAGCTNGCGG | AAAATTGGTT | GTGGGGTGTG | TGCGGACCCC | NGAGNAACGC | 8040 |
CCNNTAAAAT | NAAAGACAAA | NTCNGGGGAC | AAGNCTNGGG | GGTTATCGNN | ATTGCNNAGG | 8100 |
GGTCGNCATG | AAAANTTTAA | CGACGGTAAA | TAATAATAAA | AANNCAAACA | TGGGAATGNC | 8160 |
AATAAAAGAC | ATAATTCTCC | NNATCSCCGC | GG<jvjtG\jAAAG | GATCCTATAG | TAAAGGCGAG | 8220 |
TGCGCTTTGA | GGGGTCATAA | AAATCAATTA | GTTCCAACAC | CCACGTCCCG | CGTTGAGGGG | 8280 |
acggggacga | GCAGGGACAG | AAAAAGAAAC | CATATTTGAA | TCCCATCTCT | CTGTGAATTC | 8340 |
TTGGGTCACA | TGCGTCTCAG | TACAGCCCGT | CCCGTGCTGT | GACCGGATAG | AGTTTCAATT | 8400 |
TACTGTGGAA | ATTTGCTGTA | AATAAATTGA | GCATCCGATA | GAAGCTGŤTG | CTGATTAACC | 8460 |
TTTTATTTTT | AGCGTGGCCC | TGCAAAGTCG | TATCACCCAG | CTGTCAGGCT | TCTAATCGAA | 8520 |
AGTTATGAGA | CC.ACGGTGAG | GGGCAGGCGG | ΤΑΑΤΪΤΑΑΤΤ | ACAACAAATA | TCTTTGGGTT | 8580 |
TATGGCGCAG | AGCTAAATTA | AATGTCATTA | TTCACTGTCT | GTNAATGGNA | AATCAAAANN r TTTAATNGAA | 8640 |
GGAAATCGCA | NTTACGGNCA | TTTGGGNNAA | ANGAAAGCGG | GGNAGTGCTC | 8700 | |
NNGAAATAAC | TGTCTTAAGC | AGTGTCACAC | ACTTCACTTA | CCATATTCGN | GGCCTNAATT | 8760 |
GGAANNTGGA | TCGTNNGAAT | CACTCCNAAG | ACTNGATTTA | TTANGCGCTT | CACGNCAGCN | 8820 |
NGGCNTAATT | CATCNACTTN | NGTATTCTTC | ATCNNNNATT | TTTTTTTTTC | CTCTCNNGCC | 8880 |
GTGTTNNGAA | GGGAGAGTGA | ATGAGGCTTT | CCACGTTTCA | GGAGGATTTT | CTTTTTTGAA | 8940 |
AAATGCCCTT | CCAGAGGCTT | TTGGGTGGCT | GGCTTGCTTT | CTGGGCCCTG | GAGGANGACA | 9000 |
GGCGGANGAG | TCCAGGTGGG | CATGGAGAGG | CACAGTGGCA | GGTCACCTGG | ATGGTCAGTG | 9060 |
GAGGTGGAGG | TCTGAAGGCG | CCAGCTTTGG | AAATTATTGG | TGAATTTCGA | TGTCAGCACC | 9120 |
• ·4 ·
• 444 ·· r ·
4 4
444 44 ♦
4
4
4 • · 4444 • 4
4
4
444
4
4
444
AGGNCAGGGG | CCTTTTTGGC | GGGGGTGTGA | GGGANGGATG | ANCTTTGCTG | GGAAANNCAG | 9180 |
GATCAGGTTC | TCCAGGCGCA | CTGCAGCCCG | GTAGGACCCA | CTTTGGAAAT | GAAAAGCCAG | 9240 |
TTNCCGAAAG | CTGGGCTGGA | AGCTTCCGTG | TTGGGTTCAA | GAGCAAGTTC | ACGTTGCGCT | 9300 |
GTGTAGACTC | CTGGCTGCTC | CCAAACTCTG | AGGGTTTTCT | GAGGTTCCCT | TCATAGGGGC | 9360 |
ACCGGCCCTG | GGCCATGCAC | AGTGCGTAAG | GGTGGCTGTG | GGCCGAGGGA | CCCAGCACGT | 9420 |
GTTTTGCCCA | CAACAGCCGG | AGTGACTGGT | TCACTCACCG | CCTTGGCGGA | GGACGCCTGT | 9480 |
TCTCTGGACG | AATCATTTCT | CTTGGGTGGT | GACTGCCTTG | TGGGTCAAGG | TGCAGGTTTT | 9540 |
CTGCCACAGA | AAACCTGTTA | GGAGGAATTA | AGCGACTAAG | ACTGTCAGGG | AGGTGGTGGT | 9600 |
GGGGGANGAG | GNAGGGGGTG | GTGTCCAGAT | TACCAGGCAT | AGGCTAAACT | GCCTGCACTC | 9660 |
TCCAGCTGGT | CTGTCTGTGG | AGGAGGGGAT | TGTCAATACT | GGGAGAGCAG | AGGAGGCTCG | 9120 |
TAGGAGGTGA | GAGGGGGTGG | AATTTGCATG | CAAATCTTCA | CATGAGGCCT | GTGTGAATTT | 9780 |
CTCCAGCCTC | CTGAGGGTCC | CCTGCGCTAT | TGCACTCAAC | TTCTTGATAG | TTTACCCCAA | 9840 |
GACTCAGAAG | TCCTTAGAGG | GGCAGAATGC | CCCCACCACA | AAGCCTGCTA | TCCTTGGGCG | 9900 |
TCCTCAGGAC | CCTTGGTCAT | GAATGGGACC | CTTTCATGTA | TGGGGACCCT | TGGTAATATG | 9960 |
AATGGGACGC | CTTCAGCTCC | CCAGGGCTTC | CGAGGAGGCC | GAGAAGGGCA | AAGACACTTC | 10020 |
CGAGGAGGCC | GAGAAGGGCA | AAGACATTTT | CTGGGCTTGG | TGTGTCAAGA | GCTAGATTGG | 10080 |
AGAAGGGGCT | GGATTTGGAA | CTCTTTAGCC | ATCAGCTCAC | CCTCTCCGTT | TGTGGCTAAA | 10140 |
GTCTGAAGGT | GGAAACTTCG | GTTCTCCTAC | AGGGTCTACA | GGAGTTGGGG | GGCGGGGCGC | 10200 |
CCACACAGAA | CGCTGGAAAG | TTCGACAGTC | CACTTCCACT | GGCTCGGAAC | TCACTTTTTC | 10260 |
ACCTTAAGTT | CATCAGCGGT | AACGCATAGG | TCTCACTTAG | GCAGGGCACG | GATGATTTAA | 10 320 |
CAATTTCTAC | TTCTAGGTCA | GGTGCGGTGG | CTCACACCTC | TAATCCCAGC | ACTTTGGGAG | 0380 |
GCCCAGGAGG | GTGGATCGCT | TGAGGTCAGG | AGTTTGAGAC | CAGCCTGGCC | AACATGGTGA | 10440 |
AACCCCGTCT | CTACTAAAAT | ACGAAAATTA | GCCAGGCATG | GTGGTGAGCA | CCTGTAATTC | 10500 |
CAGCTACTCG | GGAGGCTGAG | GCAGGACAAT | CGCTTGAACC | TGGGAGGTGG | ACGTTGCAGT | 10560 |
GAGGTGAGAT | CACACCACTG | CACTCCAGCC | TGGATGAGAG | AGCAAGACTC | TGTCTCAAAA | 10620 |
ACAAAATAAA | ACAAAAACAA | AACAAAAATC | AAAAAAGAAA | ACCCAATTTC | CAGTTCTAGG | 10680 |
CCAGGTGCAG | TGGCTCACGC | CTGTCATCCC | AGCACTTTGG | GAGGCCCAGG | AGGGTGGATC | 10740 |
GCTTGAGGTC | AGGAGTTCGA | GACCAGCCTG | GCCAACATGG | TGAAACCCCA | TCTTTACTAA | 10800 |
AAATACAAAC | GTTAGCTGGG | TGTGGTGGTG | TGCGCCTGTA | ATCCCAGCTA | CTCGGGAAGC | 10860 |
TGAGGCTGGA | GAATTGCTTG | AATCTGGGAG | GTGGAGGTTG | CAGGGAGGCG | AGATAGTGCC | 10920 |
ACTGCAGTCC | AGCCTGGACC | AGAGAGCAAG | ACTCCGTCTC | AAAAACAAAA | GAAAGCAAAA | 10980 |
ACAAAAAACA | AGAGACCAGC | CTGGCCAACA | TGGTGAAACC | GCGTCTTTAC | TAAAATACAA | 11040 |
AATTAGCCGG | GCATGGTGGT | GGGCACCTGT | AGTCCCAGCT | ACTCGGGAGG | CTGAGGCAGG | 11100 |
• φ • φ
54 | Φ | 1 Φ Φ Φ · · · | • | |||
AGAATGGCTT | GAACCTGGGA | GGTGGAGCTT | GCAGTGAGCC | GAGATAGTGC | CACTGCACTC | 11160 |
CAGCCTGGGC | GACAGAGCGA | GACTTGATTT | CAGAACCACC | ACCACCACAA | CAAAACAAAA | 11220 |
CAAAAAATCC | AAAAAAACCC | CAATTTCCAG | TAGTAGGTAG | TCAGTGATGC | AGGGCTGGAG | 11280 |
ACAGAGGGGC | GGTAAGTGTC | TGGGCGCCCA | CCATCAGTCA | CCTCCCAGCT | CCCANGAGGT | 11340 |
GCAAAGTGCT | TGGTTCAGCC | TCATGGGAAG | GATGCTCCCT | GGGGAGGCTG | GGCTGGGTTC | 11400 |
ACAGGGCTCT | TCACATCTCT | CTCTGCTTCT | NCCCCAAGGT | TTGGTTNCCA | GAACCGGAGA | 11460 |
GCCAAGTGCC | GNCAAACAAG | AGAATCAGAT | GCATAAAGGT | GGGTGTCGGG | ACTGGGGGGA | 11520 |
CCTGAAGCTG | GGGGATCCTG | GTCCAGGAGG | GATGGGGTCG | ACAAGGTGCT | GGCTACACCC | 11580 |
AGGACCACCA | CACTGACACC | TGCTCCCTTT | GGACACAGGC | GTCATCTTGG | GCACAGCCAA | 11640 |
CCACCTAGAC | GCCTGCCNGA | GTGGCACCCT | ACGTCAACAT | GGGAGCCTTA | CGGATGCCTT | 11700 |
TCCAACAGGT | AGCTCACTTT | TTCTTCCTCT | GNAAGATCCC | TAGGGACCTG | CTGCTCCCTT | 11760 |
CCCCTTTCCC | CTATTTGCTG | CCGCATCGTG | ACACTCCTAG | TCCCTCCCTG | CCCCTGCAGA | 11820 |
CTTCTCAGCT | GGCCCTTAGA | AAAAAAGCCT | CTTTTCCGAG | GAGGCATTTA | CAGGCACCTT | 11880 |
GGCACCTATG | AAATCAGGCT | GGGCCAGGCG | GGGTGGCTCA | CACCTGTCAT | CCCAGCACTT | 11940 |
TGGGAGGCCA | AGGTTAGGAG | TTTGAGACCA | GCCTGGACAA | CATAGCAAAA | GCCTGTCTCT | 12000 |
ACTAAAAATA | CAAAAAAAAA | TTAACAGGGA | GTGGTGGTGG | GCACCTGTAA | TCCCAGCTAC | 12060 |
TTGGGAGGCT | GAGGCAGGAG | AATCACTTGA | ACCCGGGAGG | CCGAGGTTGC | GGTGAGCCGA | 12120 |
GATCGTGCCA | TTGCACTCCA | GGCTGGGCGA | CAGAGTGAGA | CTCTGTCTCA | AAAAATAAAT | 12180 |
ΑΑΑΤΛΛΑΤΑΛ | ATGTAAAAAA | ATAAAAATAG | GTCGGGCACG | GTGGCTCACG | TCTGTAATCC | 12240 |
CAGCACTTTG | GAAGGCCGAG | GTGGGTGGAT | GACAGGGTCA | AGAGATTGAG | ACCATCCTGG | 12300 |
CCAACATGGC | AAAATGCCGT | CTCTACTAAA | AAATACAAAA | ATTAGGCGGG | CGTGGTGGCG | 12360 |
.GGTGCCTGTA | ATCCCAGCTA | CTCGGGAGGC | TGAGGCAGGA | GAATCGGTTG | AACCCGGGAT | 12420 |
GCGGAGGTTG | CAGTGAGCGG | AGATCACATC | ACTGCACTCC | AGGCTGGGCA | ACAAGAGCGA | 12480 |
AACTGCGTCT | TACAATAAAT | AAATAGATAA | ATAAATAAAC | AAATAAACTT | TACTTTAGAA | 12540 |
ACAAATCCCT | GTCCGTGTTT | GTCTTTTCAC | CTGTCCTGCA | GGGAAAACAA | AACATAAAAT | 12600 |
GTCAAGGCAA | ATAGTAGTG/3 | TTTCATTCCG | GGAAAAAGAA | AGTGGATGTT | TGCCTTCACC | 12660 |
ctttctcgtc | CTTCCTCTGG | TGCTCCTCAN | GGCCCANGGG | NAGAGGGTGG | AAAGTNCAGA | 12720 |
GGAAGAAAGA | CGGGGCTGGG | GGGGGGGGTC | CGTGGGGACC | CAGGCAGGCA | TGTTCCCNAT | 12780 |
TTCCNTGTCT | TCACNTTCAA | AGNAGGGGCC | CCTCGNCTCT | GGAATGAGGC | CTACGGTTTC | 12840 |
CTTTCCCNGA | AGAGTTNCCC | CTTTGTGAGC | TTACGGCTTC | GGAGTGAACC | TCGGTGCAAC | 12900 |
CTGTTATTAA | AACACACAGA | GGCTAATGCC | AGCAAAAACA | CGCCCCCCGC | TCCTGGTTTC | 12960 |
AGAGGGAAGA | AAAAAATTCA | TAAGCACGGC | CATGCTTTTC | TAATAAAAAT | TCATTAAATA | 13020 |
ATCGTTATAA | GGGATGAAGC | CGGGAGGGGA | GAGGAGAGGA | ACACAATCAA | GAGACTTTCT | 13080 |
TTGAACTTTT TCTCCCTGCT TCAAATACAA AGCAATCTTC TGTGGGCCTG GGCCTGGGGG 13140 • ·
GTTTCCCCCT | TTCTCTGCAG | CCCATTGGGA | GGAAGAAAAT | GCTTCCCTGA | ANGTTGCTGC | 13200 |
AAAATTGTTT | CTGTTTTTCT | TTTCTTTTTC | TTTTTTTTTT | TTTTTTGAGA | CGGAGTCTCG | 13260 |
CTCTGTCACC | AGGCTGGAGT | GCAATGGTAT | GATCTCAGCT | CACTGCAACC | TCCACGTTCC | 13320 |
TGTTTCAAGT | CATTCTCCTG | CCTCAGCCTC | CTGAGTAGCT | GGGACTACAG | GCGCCCGCCA | 13380 |
CCACGCCCGG | CTAGTGTTTG | TATTTTTAGA | AAAGACAGGG | TTTCCCCATG | TTGGCCAGGC | 13440 |
TGGTCTTGAA | CTCCTGTCCT | CAAGTGATCT | GCCTGCCTCG | GCCTCCCAAA | GTGCTGTGTT | 13500 |
TCTGTTTTTC | TTTCCCCGCT | TTCTTAGGAG | GCCATCGGGA | AGAATAAAAT | GCTTTCCTTG | 13560 |
AAGTTGATGC | AAAATTGTTT | CTGTTTTTCT | TTTCTCTTTT | CTTTCTTTTT | GAGATGGAGT | 13620 |
CTCGCTCTTT | CACCCAGGCT | GGAGGGCAGT | GGCGCGACCT | CGGCTCACTG | CAACCTCCGC | 13680 |
CTCCCGGGTT | CAAGCGATTC | TCCTGCCTCA | GCCTCCGGAG | TAGCTGGGAT | TACAGGCACC | 13740 |
TGCCAGTATG | CCTGGCTAAT | TTTATTATTT | TTAGTAGAGA | CGGGGTTTCA | CCATGTTGGC | 13800 |
CAGGCTGGTC | TCAAACTCCT | GACCTCAGGT | GATCCGCCCG | CCTCGCCTCC | CAAAGTGATG | 13860 |
GGATGANCAG | GNCATNGAGC | NCACCGTGCC | CGGCCCTCTA | ACTCTTTACC | AGACATAAAG | 13920 |
TCTCCNNTTC | CCCTTTCTAA | ATGTATATAT | TGTGTTTTTA | AAAGTTAACA | GCAGGGATCC | 13980 |
CACCTCATTN | CCCCGCTNCT | CTCCCCAAGA | CCTGTCCTGC | ACGTTGCACA | CAGCAGGTGT | 14040 |
GCCCTGGACA | TATCCCAAAC | CCACGCTGAA | AGAAAGAGGG | TCTCACTACA | CGTATGATAT | 14100 |
CTGTGNATCC | TTTAAACATC | TCCGTGGCTT | CCAGGCAACA | CAGCCATAAA | TAGGAATCTC | 14160 |
ATGTCTGACA | TGATACCGGG | ACCATGTATG | GGNAAATTCT | GGGTGTGAAG | TTCCAGCTAC | 14220 |
CCCCGCAGAG | GCANCCATTG | CATACCCTCC | AGAAACTCCC | CTGCCGTTNC | AAGCCAAAGA | 14280 |
CACAACACAA | ACAGCNTCCG | AGAGAGGGTG | TCATTGAAAA | TCAATACCAT | CATAAGAGCA | 14340 |
CACAGCACCG | TCTTTCTCTT | CTGCCCGTTG | ATACACAATT | ATGAGCAATT | TGCTAACACT | 14400 |
GACAACTCGT | GGCAAGAACA. | GGTCGTGTTG | ATACGGTTGC | CTCGTGAGGA | CCCATCTGTC | 14460 |
TTCTGGGGTC | TTGCCTGGAA | CGGAGATCGG | AGTTCAGGGT | GGCTAATAGA | ATCATTACTC | 14520 |
ACCTAGGGAC | ACAGAATNAT | GAGGGTTACC | CCCAGTTAAG | TGCATACAGT | CAAACGGACG | 14580 |
GCTGCTCTGG | AAGGTACAGT | GACGTGAACA | GCTTTTATGA | AATGCCTAGA | TCTGGACCTT | 14 640 |
CCATACCTGA | GCCACCGTTC | CAAAGCACTG | GGCGTTTTTC | AGATACTTTC | ATGAGAA7ÝTG | 14700 |
TTGTCAACAC | CGCAAGTTTG | CAGTACACAG | TCTGAAAGAT | ATTCTTGTAT | ATGTAGATGT | 14760 |
CTGTAGATGC | CCTGAAGGTG | TGTAGACTTT | AGACACCCAG | AAGGTGTGTA | GATGTCTGTA | 14820 |
GACACCTTCT | ATGTGTGTAG | ATGTCTGTAG | ACGCCCTGCA | GGTGTGTAGA | TATATCTAGA | 14880 |
TGGTCTGCCT | GTGTATGATA | CACGCTAAAA | AGACATTTGT | GGTGGACACT | AGTTGATTAT | 14940 |
TTAGGACTAT | GAGATGGGAA | AGGAAGNAGC | AACCAGCAGT | GAAAGGCATG | TGGTGGGTGG | 15000 |
GGGGTTGGCA | TTGCAGTGGG | GTCCTCNTGA | NGCAGGTGAC | ACCCACTATA | GGGCTGCCCT | 15060 |
TGGNATGGAC | gctttgtnga | AGCTGTTTGA | TTTCACCACA | CCAAGCCTGG | AGGCACGGAC | 15120 |
56 | • · 9 · • · · · * • · « · « • » · « • · · · · | • » • · · • · · · · • · • · « | ||||
ATTCCAGGAT | GGTGAGGAGT | CTGCAAAGGA | GGAGATTGGA | GGAGGTG£AA | TATCCCTAGA | 15180 |
GTACGAGAGA | TGAGATAGGA | GAGCTGTATA | AATAGCACTA | CCAGCCGGAT | GCGGTGGCTC | 15240 |
ACGCCTGTCA | TCCCAGCAGT | TTAGGAGGCT | GAGGCAGGCG | GATCACCTGA | GGTCAGGAGT | 15300 |
TCCAGAACAG | CCTGGCCAAC | ACAATGAAAC | CCGATCTTTA | CTAAAAATAC | AAGATTAGCT | 15360 |
GGGCACGGTG | TCTCACGCCT | GTCATCCCTG | CACTTTGGGA | GGTCGAGGTG | CGOAGATCAT | 15420 |
GAGGTCAGTT | TGGCCAACGC | GGCGAAACCC | CGTCTCTACT | AAAAATACAA | AAAAGTAGCC | 15480 |
GGGCGTGGTG | GTGGGCACCT | GTAGTCCCAG | CTACTAGGGA | GGCTGAGGCA | GGAGAATCGC | 15540 |
TTGAACCCGG | ATGCGGACAT | TGCAGTGAGC | CGAGATC | 15577 |
(2) Informace o sekvenci SEQ ID NO: 9:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 753 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „segment genu ET92 (xi) POPIS SEKVENCE: SEQ ID NO: 9:
CGTGGAAGCC | TGGAGTTTTT | GGGAACAGCG | TGTCCCCGCC | GAGCCTGGGA | GCCCGTGGGT | 60 |
TCTGCAAAGC | CTGCGGGTGT | TTGAGGACTT | TGAAGACCAG | TTTGTCAGTT | GGGCTCAATT | 120 |
CCTGGGGTTC | AGACTTAGAG | AAATGAAGGA | GGGAGAGCTG | GGGTCGTCTC | CAGGAAACGA | 180 |
TTCACTTGGG | GGGAAGGAAT | GGAGTGTTCT | TGCAGGCAGA | TGTCTGTTAG | GAGGTGAAAC | 240 |
AGAATGTGAA | ATCCACGTTG | GAGTAAGCGT | CCAGCGCTGA | ATGTAGCTCG | GGGTGGGGTG | 300 |
GGAGGGCCCT | GGTGTGGATC | GTGGAAGGAA | GAAAGACAGA | ACAGGGTGCT | AGTATTTACC | 360 |
CCGTTCCCTG | TAGACACCCT | GGATTTGTCA | GCTTTGCAAG | CTTCTTGGTT | GCAGCGGCCT | 420 |
TGCCTGTGCC | CCTTTGAGAC | TGTTTCCAGA | CTAAACTTCC | AAATGTCAGC | CCCTTACCCT | 480 |
TGACAGCAAG | GGACATCTCA | TTAGGGCATC | GCGTGCTTCT | CATCTGTGCT | CAGCAGGCCC | 54 0 |
GAGATAGGAA | CAGAGGGGCG | TTGGAGATGC | CACTTCCACC | AGCCCTGGGT | TGAAGGGGAG | 600 |
CGAGGGAGAC | ACCTTTTACT | TAAACCCCTG | AGCTTGGTCA | GAGAGGCTGA | ATGTCTAAAA | 660 |
TGAGGAAGAA | AAGGTTTTTC | ACCTGGAAAC | GCTTGAGGGC | TGAGTCTTCT | GCCCTTCTGA | 720 |
CTCCCCCAGC AAATACAGAC AGGTCACCAA CTA
753 • · • · (2) Informace o sekvenci SEQ ID NO: 10:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1890párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOXa (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91..968 (xi) POPIS SEKVENCE: SEQ ID NO: 10:
GTGATCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC 60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA 114
Met Glu Glu Leu Thr Ala Phe Val
5
TCC Ser | AAG Lys 10 | TCT Ser | TTT Phe | GAC CAG AAA | AGC AAG GAC | GGT Gly | AAC Asn 20 | GGC Gly | GGA Gly | GGC Gly | GGA Gly | 162 | ||||
Asp | Gin | Ly3 15 | Ser | Lys | Asp | |||||||||||
GGC | GGC | GGA | GGT | AAG | AAG | GAT | TCC | ATT | ACG | TAC | CGG | GAA | GTT | TTG | GAG | 210 |
Gly 25 | Gly | Gly | Gly | Lys | Lys 30 | Asp | Ser | Ile | Thr | Tyr 35 | Arg | Glu | Val | Leu | Glu 40 | |
AGC | GGA | CTG | GCG | CGC | TCC | CGG | GAG | CTG | GGG | ACG | TCG | GAT | TCC | AGC | CTC | 258 |
Ser | Gly | Leu | Ala | Arg 45 | Ser | Arg | Glu | Leu | Gly 50 | Thr | Ser | Asp | Ser | Ser 55 | Leu | |
CAG | GAC | ATC | ACG | GAG | GGC | GGC | GGC | CAC | TGC | CCG | GTG | CAT | TTG | TTC | AAG | 306 |
Gin | Asp | Ile | Thr 60 | Glu | Gly | Gly | Gly | His 65 | Cys | Pro | Val | His | Leu 70 | Phe | Lys | |
GAC | CAC | GTA | GAC | AAT | GAC | AAG | GAG | A7A | CTG | AAA | GAA | TTC | GGC | ACC | GCG | 354 |
Asp | His | Val 75 | Asp | Asn | Asp | Lys | Glu 80 | Lys | Leu | Lys | Glu | Phe 85 | Gly | Thr | Ala | |
AGA | GTG | GCA | GAA | GGG | ATT | TAT | GAA | TGC | AAA | GAG | AAG | CGC | GAG | GAC | GTG | 402 |
Arg | Val 90 | Al a | Glu | Gly | Ile | Tyr 95 | Glu | Cys | Lys | Glu | Lys 100 | Arg | Glu | Asp | Val | |
AAG | TCG | GAG | GAC | GAG | GAC | GGG | CAG | ACC | AAG | CTG | AAA | CAG | AGG | CGC | AGC | 450 |
Lys 105 | Ser | Glu | Asp | Glu | Asp 110 | Gly | Gin | Thr | Lys | Leu 115 | Lys | Gin | Arg | Arg | Ser 120 | |
CGC | ACC | AAC | TTC | ACG | CTG | GAG | CAG | CTG | AAC | GAG | CTC | GAG | CGA | CTC | TTC | 498 |
Arg | Thr | Asn | Phe | Thr 125 | Leu | Glu | Gin | Leu | Asn 130 | Glu | Leu | Glu | Arg | Leu 135 | Phe | |
GAC | GAG | ACC | CAT | TAC | CCC | GAC | GCC | TTC | ATG | CGC | GAG | GAG | CTC | AGC | CAG | 546 |
Asp | Glu | Thr | His 140 | Tyr | Pro | Asp | Ala | Phe 145 | Met | Arg | Glu | Glu | Leu 150 | Ser | Gin r | |
CGC | CTG | GGG | CTC | TCC | GAG | GCG | CGC | GTG | CAG | GTT | TGG | TTC | CAG | AAC | CGG | 594 |
Arg | Leu | Gly 155 | Leu | Ser | Glu | Ala | Arg 160 | Val | Gin | Val | Trp | Phe 165 | Gin | Asn | Arg | |
AGA | GCC | AAG | TGC | CGC | AAA | CAA | GAG | AAT | CAG | ATG | CAT | AAA | GGC | GTC | ATC | 642 |
Arg | Al a 170 | Lys | Cys | Arg | Lys | Gin 175 | Glu | Asn | Gin | Met | His 180 | Lys | Gl y | Val | I le |
• · • · >
690
TTG GGC ACA GCC AAC CAC CTA GAC GCC TGC CGA GTG GCA CCC TAC GTC Leu Gly Thr Ala Aan His Leu Asp Ala Cys Arg Val Ala Pro Tyr Val 185 190 195 200
AAC ATG GGA GCC TTA CGG ATG CCT TTC CAA CAG GTC CAG GCT CAG CTG Asn Met Gly Ala Leu Arg Met Pro Phe Gin Gin Val Gin Ala Gin Leu
738
205 | 210 | 215 | ||||||||||||||
CAG | CTG | GAA | GGC | .GTG | GCC | CAC | GCG | CAC | CCG | CAC | CTG | CAC | CCG | CAC | CTG | 786 |
Gin | Leu | Glu | Gly | Val | Ala | His | Ala | His | Pro | His | Leu | HÍ3 | Pro | His | Leu | |
220 | 225 | 230 | ||||||||||||||
GCG | GCG | CAC | GCG | CCC | TAC | CTG | ATG | TTC | CCC | CCG | CCG | CCC | TTC | GGG | CTG | 834 |
Ala | Ala | His | Ala | Pro | Tyr | Leu | Met | Phe | Pro | Pro | Pro | Pro | Phe | Gly | Leu | |
235 | 240 | 245 | ||||||||||||||
CCC | ATC | GCG | TCG | CTG | GCC | GAG | TCC | GCC | TCG | GCC | GCC | GCC | GTG | GTC | GCC | 882 |
Pro | Ile | Ala | Ser | Leu | /Via | Glu | Ser | Ala | Ser | Ala | Ala | Ala | Val | Val | Ala | |
2S0 | 255 | 260 | ||||||||||||||
GCC | GCC | GCC | AAA | AGC | AAC | AGC | AAG | AAT | TCC | AGC | ATC | GCC | GAC | CTG | CGG | 930 |
Ala | Ala | Ala | Lys | Ser | Asn | Ser | Lys | Asn | Ser | Ser | Ile | Ala | Asp | Leu | Arg | |
265 | 270 | 275 | 280 | |||||||||||||
CTC | AAG | GCG | CGG | AAG | CAC | GCG | GAG | GCC | CTG | GGG | CTC | TG ACCCGCCGCG | 978 | |||
Leu | Lya | Ala | Arg | Lys | His | Ala | Glu | Ala | Leu | Gly | Leu |
285
290
CAGCCCCCCG | CGCGCCCGGA | CTCCCGGGCT | CCGCGCACCC | CGCCTGCACC | GCGCGTCCTG | 1038 |
CACTCAACCC | CGCCTGGAGC | TCCTTCCGCG | GCCACCGTGC | TCCGGGCACC | CCGGGAGCTC | 1098 |
CTGCAAGAGG | CCTGAGGAGG | GAGGCTCCCG | GGACCGTCCA | CGCACGACCC | AGCCAGACCC | 1158 |
TCGCGGAGAT | GGTGCAGAAG | GCGGAGCGGG | TGAGCGGCCG | TGCGTCCAGC | CCGGGCCTCT | 1218 |
CCAAGGCTGC | CCGTGCGTCC | TGGGACCCTG | GAGAAGGGTA | AACCCCCGCC | TGGCTGCGTC | 1278 |
TTCCTCTGCT | ATACCCTATG | CATGCGGTTA | ACTACACACG | TTTGGAAGAT | CCTTAGAGTC | 1338 |
TATTGAAACT | GCAAAGATCC | CGGAGCTGGT | CTCCGATGAA | AATGCCATTT | CTTCGTTGCC | 1398 |
AACGATTTTC | TTTACTACCA | 'PQ/’' 'Τ' f* c' 'Γ *Γ f* | TTCATCCCGA | GAGGCTGCGG | AACGGGTGTG | 1458 |
GATTTGAATG | TGGACTTCGG | AATCCCAGGA | GGCAGGGGCC | GGGCTCTCCT | CCACCGCTCC | 1518 |
CCCGGAGCCT | CCCAGGCAGC | AATAAGGAAA | TAGTTCTCTG | GCTGAGGCTG | AGGACGTGAA | 1578 |
CCGCGGGCTT | TGGAAAGGGA | GGGGAGGGAG | ACCCGAACCT | CCCACGTTGG | GACTCCCACG | 1638 |
TTCCGGGGAC | CTGAATGAGG | ACCGACTTTA | TAACTTTTCC | AGTGTTTGAT | TCCCAAATTG | 1698 |
GGTCTGGTTT | TGTTTTGGAT | TGGTATTTTT | T T T T T T | TTTTTTGCTG | TGTTACAGGA | 1758 |
TTCAGACGCA | AAAGACTTGC | ATAAGAGACG | GACGCGTGGT | TGCAAGGTGT | CATACTGATA | 1818 |
TGCAGCATTA | ACTTTACTGA | CATGGAGTGA | AGTGCAATAT | ΤΛΤΑΑΑΤΑΤΤ | ATAGATTAAA | 1878 |
f
AAAAAAATAG CA
1890 ·· • A 9 • 9 9 9 • 9 9 • 9 9
9 9 9 9
9« 9
9
9.9
99
9 9 9 • 9 9 9 (2) Informace o sekvenci SEQ ID NO: 11:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 292 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 11:
Met 1 | Glu | Glu | Leu | Thr 5 | Ala | Phe | Val | Ser | Lys 10 | Ser | Phe | Asp | Gin | Lys 15 | Ser |
Lys | Asp | Gly | Asn 20 | Gly | Gly | Gly | Gly | Gly 25 | Gly | Gly | Gly | Lys | Lys 30 | Asp | Ser |
Xle | Thr | Tyr 35 | Arg | Glu | Val | Leu | Glu 40 | Ser | Gly | Leu | Ala | Arg 45 | Ser | Arg | Glu |
Leu | Gly 50 | Thr | Ser | Asp | Ser | Ser 55 | Leu | Gin | Asp | Ile | Thr 60 | Glu | Gly | Gly | Gly |
His 65 | Cys | Pro | Val | His | Leu 70 | Phe | Lys | Asp | His | Val 75 | Asp | Asn | Asp | Lys | Glu 80 |
Ly3 | Leu | Lys | Glu | Phe 85 | Gly | Thr | Ala | Arg | Val 90 | Ala | Glu | Gly | Ile | Tyr 95 | Glu |
Cy3 | Ly3 | Glu | Lys 100 | Arg | Glu | Asp | Val | Lys 105 | Ser | Glu | Asp | Glu | Asp 110 | Gly | Gin |
Thr | Lys | Leu 115 | Lys | Gin | Arg | Arg | Ser 120 | Arg | Thr | Asn | Phe | Thr 125 | Leu | Glu | Gin |
Leu | Asn 130 | Glu | Leu | Glu | Arg | Leu 135 | Phe | Asp | Glu | Thr | His 140 | Tyr | Pro | Asp | Ala |
Phe 145 | Met | Arg | Glu | Glu | Leu 150 | Ser | Gin | Arg | Leu | Gly 155 | Leu | Ser | Glu | Ala | Arg 160 |
Val | Gin | Val | Trp | Phe 165 | Gin | Asn | Arg | Arg | Ala 170 | Lys | Cys | Arg | Lys | Gin 175 | Glu |
Asn | Gin | Met | His 180 | Lys | Gly | Val | Ile | Leu 185 | Gly | Thr | Ala | Asn | His 190 | Leu | Asp |
Ala | Cys | Arg 195 | Val | Ala | Pro | Tyr | Val 200 | Asn | Met | Gly | Ala | Leu 205 | Arg | Met | Pro |
Phe | Gin 210 | Gin | Val | Gin | Ala | Gin 215 | Leu | Gin | Leu | Glu | Gly 220 | Val | Ala | His | Ala |
His 225 | Pro | His | Leu | His | Pro 230 | His | Leu | Ala | Ala | His 235 | Ala | Pro | Tyr | Leu | Met 240 |
Phe | Pro | Pro | Pro | Pro 245 | Phe | Gly | Leu | Pro | Ile 250 | Ala | Ser | Leu | Ala | Glu 255 | Ser |
Ala | Ser | Ala | Ala 260 | Ala | Val | Val | Ala | Ala 265 | Ala | Ala | Lys | Ser | Asn 270 | Ser | Ly3 |
Asn | Ser | Ser 275 | Ile | Ala | Asp | Leu | Arg 280 | Leu | Lys | Ala | Arg | Lys 285 | His | Ala | Glu |
Ala Leu Gly Leu 290 ·· ·· « « · · ··* ·· (2) Informace o sekvenci SEQ ID NO: 12:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 1354 párů bázi (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOXb (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91..768 (xi) POPIS SEKVENCE: SEQ ID NO: 12:
GTGATCCACC CGGCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC 60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA 114
Met Glu Glu Leu Thr Ala Phe Val
295 300
TCC Ser | AAG Lys | TCT Ser | TTT Phe | GAC Asp 305 | CAG AAA AGC AAG GAC | GGT AAC Gly Asn | GGC Gly | GGA Gly | GGC Gly 315 | GGA Gly | 162 | |||||
Gin | Lys | Ser | Lys | Asp 310 | ||||||||||||
GGC | GGC | GGA | GGT | AAG | AAG | GAT | TCC | ATT | ACG | TAC | CGG | GAA | GTT | TTG | GAG | 210 |
Gly | Gly | Gly | Gly | Lys | Lys | Asp | Ser | Ile | Thr | Tyr | Arg | Glu | Val | Leu | Glu | |
320 | 325 | 330 | ||||||||||||||
AGC | GGA | CTG | GCG | CGC | TCC | CGG | GAG | CTG | GGG | ACG | TCG | GAT | TCC | AGC | CTC | 258 |
Ser | Gly | Leu | Ala | Arg | Ser | Arg | Glu | Leu | Gly | Thr | Ser | Asp | Ser | Ser | Leu | |
335 | 340 | 345 | ||||||||||||||
CAG | GAC | ATC | ACG | GAG | GGC | GGC | GGC | CAC | TGC | CCG | GTG | CAT | TTG | TTC | AAG | 306 |
Gin | Asp | Ile | Thr | Glu | Gly | Gly | Gly | His | Cys | Pro | Val | His | Leu | Phe | Lys | |
350 | 355 | 360 | ||||||||||||||
GAC | CAC | GTA | GAC | AAT | GAC | AAG | GAG | AAA | CTG | AAA | GAA | TTC | GGC | ACC | GCG | 354 |
Asp | His | Val | Asp | Asn | A3p | Lys | Glu | Lys | Leu | Lys | Glu | Phe | Gly | Thr | Ala | |
365 | 370 | 375 | 380 | |||||||||||||
AGA | GTG | GCA | GAA | GGG | ATT | TAT | GAA | TGC | AAA | GAG | AAG | CGC | GAG | GAC | GTG | 402 |
Arg | Val | Ala | Glu | Gly | Ile | Tyr | Glu | Cys | Lys | Glu | Lys | Arg | Glu | Asp | Val | |
385 | 390 | 395 | ||||||||||||||
AAG | TCG | GAG | GAC | GAG | GAC | GGG | CAG | ACC | AAG | CTG | AAA | CAG | AGG | CGC | AGC | 450 |
Lys | Ser | Glu | Asp | Glu | Asp | Gly | Gin | Thr | Lys | Leu | Lys | Gin | Arg | Arg | Ser | |
400 | 4 05 | 4 10 | ||||||||||||||
CGC | ACC | AAC | TTC | ACG | CTG | GAG | CAG | CTG | AAC | GAG | CTC | GAG | CGA | CTC | TTC | 498 |
Arg | Thr | Asn | Phe | Thr | Leu | Glu | Gin | Leu | Asn | Glu | Leu | Glu | Arg | Leu | Phe | |
415 | 420 | 425 | ||||||||||||||
GAC | GAG | ACC | CAT | TAC | CCC | GAC | GCC | TTC | ATG | CGC | GAG | GAG | CTC | AGC | CAG | 546 |
Asp | Glu | Thr | His | Tyr | Pro | Asp | Ala | Phe | Met | Arg | Glu | Glu | Leu | Ser | Gin | |
430 | 435 | 440 | ||||||||||||||
CGC | CTG | GGG | CTC | TCC | GAG | GCG | CGC | GTG | CAG | GTT | TGG | TTC | CAG | AAC | CGG | 594 |
Arg | Leu | G1 y | Leu | Ser | Glu | Ala | Arg | Val | Gin | Val | Trp | Phe | Gin | Asn | Arg | |
445 | 450 | 455 | 4 60 r |
• 9
9 · 9
AGA GCC AAG TGC | CGC AAA CAA GAG AAT | CAG ATG | CAT His | AAA Lys | GGC Gly | GTC Val 475 | ATC Ile | 642 | ||||||||
Arg Ala Lys | Cys | Arg 465 | Lya | Gin | Glu | Asn | Gin 470 | Met | ||||||||
TTG | GGC | ACA | GCC | AAC | CAC | CTA | GAC | GCC | TGC | CGA | GTG | GCA | CCC | TAC | GTC | 690 |
Leu | Gly | Thr | Ala | Aan | HÍ3 | Leu | Asp | Ala | Cys | Arg | Val | Ala | Pro | Tyr | Val | |
480 | 485 | 4 90 | ||||||||||||||
AAC | ATG | GGA | GCC | TTA | CGG | ATG | CCT | TTC | CAA | CAG | ATG | GAG | TTT | TGC | TCT | 738 |
Asn | Met | G1 y | Ala | Leu | Arg | Met | Pro | Phe | Gin | Gin | Met | Glu | Phe | Cys | Ser | |
495 | 500 | 505 | ||||||||||||||
TGT | CGC | CCA | GGC | TGG | AGT | ATA | ATG | GCA | TGA | TCTCGACTCA CTGCAACCTC | 788 | |||||
Cy3 | Arg | Pro | Gly | Trp | Ser | Ile | Met | Ala | * | |||||||
510 | 515 |
CGCCTCCCGA GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC GAGTAGCTGG GATTACAGGT 848
GCCCACCACC ATGTCAAGAT AATGTTTGTA TTTTCAGTAG AGATGGGGTT TGACCATGTT 908
GGCCAGGCTG GTCTCGAACT CCTGACCTCA GGTGATCCAC CCGCCTTAGC CTCCCAAAGT 968
GCTGGGATGA CAGGCGTGAG CCCCTGCGCC CGGCCTTTGT AACTTTATTT TTAATTTTTT 1028
TTTTTTTTTA AGAAAGACAG AGTCTTGCTC TGTCACCCAG GCTGGAGCAC ACTGGTGCGA 1088
TCATAGCTCA CTGCAGCCTC AAACTCCTGG GCTCAAGCAA TCCTCCCACC TCAGCCTCCT 1148
GAGTAGCTGG GACTACAGGC ACCCACCACC ACACCCAGCT AATTTTTTTG ATTTTTACTA 1208
GAGACGGGAT CTTGCTTTGC TGCTGAGGCT GGTCTTGAGC TCCTGAGCTC CAAAGATCCT 1268
CTCACCTCCA CCTCCCAAAG TGTTAGAATT ACAAGCATGA ACCACTGCCC GTGGTCTCCA 1328
AAAAAAGGAC TGTTACGTGG AAAAAA 1354 (2) Informace o sekvenci SEQ ID NO: 13:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 226 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 13:
· • F FF F F · F • · F ·
FFF FFF
F F
F · ··
Met 1 | Glu | Glu | Leu | Thr 5 | Ala | Phe | Val | Ser | Lys 10 | Ser | Phe | Asp | Gin | Lys 15 | Ser |
Lys | Asp | Gly | Asn 20 | Gly | Gly | Gly | Glv | Gly 25 | Gly | Gly | Gly | Lys | Lys 30 | Asp | Ser |
Xle | Thr | Tyr 35 | Arg | Glu | Val | Leu | Glu 40 | Ser | Gly | Leu | Ala | Arg 45 | Ser | Arg | Glu |
Leu | Gly 50 | Thr | Ser | Asp | Ser | Ser 55 | Leu | Gin | Asp | Ile | Thr 60 | Glu | Gly | Gly | Gly |
His 65 | Cys | Pro | Val | His | Leu 70 | Phe | Lys | Asp | His | Val 75 | Asp | Asn | Asp | Lys | Glu 80 |
Ly3 | Leu | Lys | Glu | Phe 85 | Gly | Thr | Ala | Arg | Val 90 | Ala | Glu | Gly | Ile | Tyr 95 | Glu |
Cys | Lys | Glu | Lys 100 | Arg | Glu | Asp | Val | Lys 105 | Ser | Glu | Asp | Glu | Asp 110 | Gly | Gin, r |
Thr | Lys | Leu 115 | Lys | Gin | Arg | Arg | Ser 120 | Arg | Thr | Asn | Phe | Thr 125 | Leu | Glu | Gin |
Leu | Asn 130 | Glu | Leu | Glu | Arg | Leu 135 | Phe | Asp | Glu | Thr | His 140 | Tyr | Pro | Asp | Ala |
Phe 145 | Met | Arg | Glu | Glu | Leu 150 | Ser | Gin | Arg | Leu | Gly 155 | Leu | Ser | Glu | Ala | Arg 160 |
Val | Gin | Val | Trp | Phe 165 | Gin | Asn | Arg | Arg | Ala 170 | Lys | Cys | Arg | Lys | Gin 175 | Glu |
Asn | Gin | Met | His | Lys | Gly | Val | I le | Leu | Gly | Thr | Al a | Asn | Hi 3 | Leu | Asp |
180 | 185 | 190 | |||||||||||||
Ala | Cys | Arg 195 | Val | Ala | Pro | Tyr | Val 200 | Asn | Met | Gly | Ala | Leu 205 | Arg | Met | Pro |
Phe | Gin 210 | Gin | Met | Glu | Phe | Cys 215 | Ser | Cys | Arg | Pro | Gly 220 | Trp | Ser | Ile | Met |
Ala
225
4 4 4 4
4 4 ··
4444 * 4
4 4 4 4 4
4 4 4 4 4 •«•44 4 4 4 (2) Informace o sekvenci SEQ ID NO: 14:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 32367 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „kosmid: LLNOYCO3'M'34F5 (xi) POPIS SEKVENCE: SEQ ID NO: 14:
TTTCTCTGTC | TCCATCCCTC | TGTCTCTCCC | TTTCTCTCTG | TCTTTCCTTG | TCTCTCTCTT | 60 |
TCTCTCTCTC | TCTCCATCTC | TCTCTCTCCC | TGTCTCTCTC | TCTCCATCTC | CCCGTCTCTC | 120 |
CGTTTCTCTC | TCTGCCTCTC | CCTGTCTGTC | TCTCTCTTTC | TGTGTCTTAC | ACACACCCCA | 180 |
ACCCACCGTC | ACTCATGTCC | CCCCACTGCT | GTGCCATCTC | ACACAAGTTC | ACAGCTCAGC | 240 |
TGTCATCCTG | GGTCCCCAGG | CCGCGCCGGG | GAGGAAGATG | CGCCGTGGGG | TTACGGGAGG | 300 |
AAGGGGACTC | CGGGCCTCCT | GGTGCCCCAC | TTTATTTGCA | GAAGGTCCTT | GGCAGGAACC | 360 |
GTGACGCGTT | TGGTTTCCAG | GACTTGGAAA | ACGAATTTCA | GGTCGCGATG | GCGAGCACCG | 420 |
GCTTCCCCTG | AAGCACATTC | AATAGCGAGA | GGCGGGAGGG | AGCGAGCAGG | AGCATCCCAC | 480 |
CATGAAAACC | AAAAACACAA | gtattttttt | CACCCGGTAA | ATACCCCAGA | CGCCAGGGTG | 540 |
ACAGCGCGGC | GCTAAGGGAG | GAGGCCTCGC | GCCGGGGTCC | GCCGGGATCT | GGCGCGGGCG | 600 |
GAAAGAATAT | AGATCTTTAC | GAACCGGATC | TCCCGGGGAC | CTGGGCTTCT | TTCTGCGGGC | 660 |
GCTGGAGACC | CGGGAGGCGG | CCCCGGGGAT | CCTCGGCCTC | CGCCGCCGCC | GCCTCCCAAG | 720 |
CGCCCGCGTC | CCGGTTTGGG | GACACCCGGC | CCCTTCTTCT | CACTTTCGGG | GATTCTC^AG | 780 |
CCGCGTTCCA | TCTCACCAAC | TCTCCATCCA | AGGGCGCGCC | GCCACCAACT | TGGAGCTCAT | 840 |
CTTCTCCCAA | GATCGTGCGT | CCCCGGGGCG | CCCGGGTCCC | CCCCCTCGCC | ATCTCAACCC | 900 |
CGGCGCGACC | CGGGCGCTTC | CTGGAAAGAT | CCAGGCGCCG | GGCTCTGCGC | TCCTCCCGGG | 960 |
AGCGAGGGCG | GCCGGACGAC | TGGGACCCTC | CTCTCTCCAG | CCGTGAACTC | CTTGTCTCTC | 1020 |
TGTCTCTCTC | TGCAGGAAAA | CTGGAGTTTG | CTTTTCCTCC | GGCCACGGAG | AGAACGCGGG | 1080 |
TAACCTGTGT | GGGGGGCTCG | GGCGCCTGCG | CCCCCCTCCT | GCGCGCGCGC | TCTCCCTTCC | 1140 |
AAAAATGGGA | TCTTTCCCCC | TTCGCACCAA | GGTGTACGGA | CGCCAAACAG | TGATGAAATG | 1200 |
• Β Β ·»· ·· ·· •« · #·· BBBB • BBB » Β Β · Β · · · » · · « · · ···· · BBB BBB • Β Β Β Β Β · · • Β · · Β Β Β * Β· · *
AGAAGAAAGC | CAATTGCCGG | CCTGGGGGGT | GGGGGAGACA | CAGCGTCTCT | GCGTGCGTCC | 1260 |
GCCGCGGAGC | CCGGAGACCA | GTAATTGCAC | CAGACAGGCA | GCGCATGGGG | GGCTGGGCGA | 1320 |
GGTCGCCGCG | TATAAATAGT | GAGATTTCCA | ATGGAAAGGC | GTAAATAACA | GCGCTGGTGA | 1380 |
TCCACCCGCG | CGCACGGGCC | GTGCTCTCCG | CGCGGGGAGA | CGCGCGCATC | CACCAGCCCC | 1440 |
GGCTGCTCGC | CAGCCCCGGC | CCCAGCCATG | GAAGAGCTCA | CGGCTTTTGT | ATCCAAGTCT | 1500 |
TTTGACCAGA | AAAGCAAGGA | CGGTAACGGC | GGAGGCGGAG | GCGGCGGAGG | TAAGAAGGAT | 1560 |
TCCATTACGT | ACCGGGAAGT | TTTGGAGAGC | GGACTGGCGC | GCTCCCGGGA | GCTGGGGACG | 1620 |
TCGGATTCCA | GCCTCCAGGA | CATCACGGAG | GGCGGCGGCC | ACTGCCCGGT | gcatttgttc | 1680 |
AAGGACCACG | TAGACAATGA | CAAGGAGAAA | CTGAAAGAAT | TCGGCACCGC | GAGAGTGGCA | 1740 |
GAAGGTAAGT | TCCTTTGCGC | GCCGGCTCCA | GGGGGGCCCT | CCTGGGGTTC | GGCGCCTCGT | 1800 |
CGCCACGGAG | TCGGCCCCGC | GCGCCCCTCG | CTGTGCACAT | TTGCAGCTCC | CGTCTCGCCA | 1860 |
GGGTAAGGCC | CGGGCCGTCA | GGCTTTGCCT | AAGAAAGGAA | GGAAGGCAGG | AGTGGACCCG | 1920 |
ACCGGAGACG | CGGGTGGTGG | GTAGCGGGGT | GCGGGGGGAC | CCAGGGAGGG | TCGCAGCGGG | 1980 |
GGCCGCGCGC | GTGGGCACCG | ACACGGGAAG | GTCCCGGGCT | GGGGTGGATC | CGGGTGGCTG | 2040 |
TGCCTGAAGC | CGTAGGGCCT | GAGATGTCTT | TTTCATTTTC | TTTTTCTTTC | CTTTCCTTTT | 2100 |
TTTGTTTGTT | TGTTTGTTTG | TTTGAGACAG | AGTCTCGCTC | TGTCCCCCAG | GCTGGAGTGC | 2160 |
AGTGGTGCGA | TCTCGGCTCA | CTGCAACCTC | CGCCTCCTGG | GTTCAAGCGA | TTCTCCTGCC | 2220 |
TCAGCCTCCC | CAGTAGCTGG | GATTACAGGC | ATGCAGCACC | ACGCCTGGCT | AATTTTTGTG | 2280 |
CTTTTAGTAA | AGACGGGGAT | TCACCATGTT | GGCCAGGCTG | GTCTCGAACT | CCTGACCTCA | 2340 |
GGTGATCCAC | CCGCCTCGGC | CTCCCAAAGT | GCTGGGATGA | CAGGCGTGAG | GCACCGCGCC | 2400 |
CGGCCTGGGT | CCTGACGGCT | TAGGATGTGT | GTTTCTGTCT | CTGCCTGTCT | GCCTTGTATT | 2460 |
TACGGTCACC | CAGACGCACA | GAGGAGCCGT | CTCCACGCGC | CTTCCCAGCG | CTCAGCGCCT | 2520 |
GCCGGGCCCC | CGGAGATCAC | GGGAAGACTC | GAGGCTGCGT | GGTAGGAGAC | GGGAAGGCCC | 2580 |
CGGGTCAGCT | CGGTTCTGTT | TCCTTTAAGG | AACCCTTCAT | TATTATTTCA | TTGTTTTCCT | 2640 |
TTGAACGTCG | AGGCTTGATC | TTGGCGAAAG | CTGTTGGGTC | CATAAAAACC | ACTCCCGTGA | 2700 |
GCGGAGGTGG | CCGGGATCTG | GATGGGGCGC | GAGGGGCCCC | GGGGAAGCTG | GCGGCTTCGC | 2760 |
GGGCGCGTCC | TAAGTCAAGG | TTGTCAGAGC | GCAGCCGGTT | GTGCGCGGCC | r CGGGGGAGCT | 2820 |
CCCCTCTGGC | CCTTCCTCCT | GAGACCTCAG | TGGTGGGTCG | TCCCGTGGTG | GAAATCGGGG | 2880 |
AGTAAGAGGC | TCAGAGAGAG | GGGCTGGCCC | CGGGGATCTC | TGTGCACACA | CGACAACTGG | 2940 |
GCGGCATACA | TCTTAAGAAT | AAAATGGGCT | GGCTGTGTCG | GGGCACAGCT | GGAGACGGCT | 3000 |
ATGGACGCCT | GTTATGTTTT | CATTACAAAG | ACGGAGAGAA | TCTAGCCTCG | gcttttgctg | 3060 |
ATTCGCAGAG | TTGAGGTGCG | AGGGTGAATG | CCCCAAAGGT | aattcttcct | AAGACTCTGG | 3120 |
GGCTACCTGC | TCTCCGGGGC | CCTGCATTTG | GGGTGTGGAG | TGGCCCCGGG | AAATAGCCCT | 3180 |
TGTATTCGTA | GGAGGCACCA | GGCAGCTTCC | CAAGGCCCTG | ACTTTGTCGA | AGCAGAAAGC | 3240 |
• 9 •
• 9 · · * · · · 9
9« 9 • · · 9 9 »9 99 • 9 9 9 9
9 9 9 9 9 >99· 9 »·· 999 • 9 9 • 9 9 9 9
TGTGGCTACG | GTTTACAAAG | CAGTCCCCGG | TTTCTGACCG | TCTAAGAGGC | AGGAGCCCAG | 3300 |
CCTGCCTTTG | ACAGTGAGAG | GAGTTCCTCC | CTACACACTG | CTGCGGGCAC | CCGGCACTGT | 3360 |
AATTCATACA | CAGAGAGTTG | GCCTTCCTGG | ACGCAAGGCT | GGGAGCCGCT | TGAGGGCCTG | 3420 |
CGTGTAATTT | AAGAGGGTTC | GCAGCGCCCG | GCGGCCGCTT | CTGTGGGGTT | GCTTTTTGGT | 3480 |
TGTCCTTCGC | AGACACCGTT | TTGCTCCTCT | GAACTCTCTC | TTCTCCCCCT | GGCCGTGGAC | 3540 |
CCGGGAGAGC | AAAGTGTCCT | CCAGACCTTT | TGAAAGTGAG | AGGAAAATAA | AGACCAGGCC | 3600 |
AAAGACCCAG | GGCCACAGGA | GAGGAGACAG | AGAGTCCCCG | TTACATTTTC | CCCTTGGGTG | 3660 |
GGTGCAGAAA | GACCCCCGGG | CCAGGACTGC | CACCCAGGCT | ACTATTTATT | CATCAGATCC | 3720 |
AAGTTAAATC | GAGGTTGGAG | GGCAGGGGAG | AGTCTGAGGT | TACCGTGGAA | GCCTGGAGTT | 3780 |
TTTGGGAACA | GCGTGTCCCC | GCCGAGCCTG | GGAGCCCGTG | GGTTCTGCAA | AGCCTGCGGG | 3840 |
TGTTTGAGGA | CTTTGAAGAC | CAGTTTGTCA | GTTGGGCTCA | ATTCCTGGGG | TTCAGACTTA | 3900 |
GAGAAATGAA | GGAGGGAGAG | CTGGGGTCGT | CTCCAGGAAA | CGATTCACTT | GGGGGGAAGG | 3960 |
AATGGAGTGT | TCTTGCAGGC | ACATGTCTGT | TAGGAGGTGA | AACAGAATGT | GAAATCCACG | 4020 |
TTGGAGTAAG | CGTCCAGCGC | TGAATGTAGC | TCGGGGTGGG | GTGGGAGGGC | CCTGGTGTGG | 4080 |
ATCGTGGAAG | GAAGAAAGAC | AGAACAGGGT | GCTAGTATTT | ACCCCGTTCC | CTGTAGACAC | 4140 |
CCTGGATTTG | TCAGCTTTGC | AAGCTTCTTG | GTTGCAGCGG | CCTTGCCTGT | GCCCCTTTGA | 4200 |
GACTGTTTCC | AGACTAAACT | TCCAAATGTC | AGCCCCTTAC | CCTTGACAGC | AAGGGACATC | 4260 |
TCATTAGGGC | ATCGCGTGCT | TCTCATCTGT | GCTCAGCAGG | CCCGAGATAG | GAACAGAGGG | 4320 |
GCGTTGGAGA | TGCCACTTCC | ACCAGCCCTG | GGTTGAAGGG | GAGCGAGGGA | GACACCTTTT | 4380 |
ACTTAAACCC | CTGAGCTTGG | TCAGAGAGGC | TGAATGTCTA | AAATGAGGAA | GAAAAGGTTT | 4440 |
TTCACCTGGA | AACGCTTGAG | GGCTGAGTCT | TCTGCCCTTC | TGACTCCCCC | AGCAAATACA | 4500 |
GACAGGTCAC | CAACTACTGG | AGATGAGAAA | GTGCCATTTT | TGGCACACTC | TGGTGGGGTA | 4560 |
GGTGCCCGAC | CGCGTGTGAA | AAAGTGGGAA | GGAGAGATTT | CTGCGCACGC | GGTTCAGCCC | 4620 |
CCAGGCGCGG | TGGCGCATTC | AGGTACTCAG | ACGCGGTTCT | GCTGTTCTGC | TGAGAAACAG | - 4 680 |
GCTTCGGGTA | GGGGCTCCTA | GCTCCGCCAG | ATCGCGGAGG | GACCCCCAGC | CCTCCTGCGC | 4740 |
TGCAGCGGTG | GGGATAGCGT | CTCTCCGTAG | GGCTAGAATC | TGCAACCCGC | CCCGGGTCeT | 4800 |
CCCCGTGTCC | TTCCCGGGCG | TCCCGCCGGG | GATCCCACAG | TTGGCAGCTC | TTCCTCAAAT | 4860 |
TCTTTCCCTT | AAAAATAGGA | TTTGACACCC | CACTCTCCTT | AAAAAAAAAA | AATAAGAAAA | 4920 |
AAAGGTTAGG | TTATGTCAAC | AGAGGTGzAAG | TGGATAATTG | AGGAAACGAT | TCTGAGATGA | 4980 |
GGCCAAGAAA | ACAACGCTCG | TGCAAAGCCC | AGGTTTTTGG | GAAAGCAGCG | AGTATCCTCC | 5040 |
TCGGCTTTTG | CGTTATGGAC | CCCACGCAGT | TTTTGCGTCA | AAGCGCATTG | GTTTTCGAGG | 5100 |
GCCCCCTTTC | CACCGCGGGA | TGCACGAAGG | GGTTCGCCAC | GTTGCGCAAA | ACCTCCCCGG | 5160 |
CCTCAGCCCT | GTGCCCTCCG | CTCCCCACGC | AGGGATTTAT | GAATGCAAAG | AGAAGCGCGA | 5220 |
99 9· 9
66 | * · · « • · ·· * • · * · · • · · » ··« ·· ·< | 9 9 • 9 9 9 99 9 9 • 9 9 | ||||
GGACGTGAAG | TCGGAGGACG | AGGACGGGCA | GACCAAGCTG | AAACAGAGGC | GCAGCCGCAC | 5280 |
CAACTTCACG | CTGGAGCAGC | TGAACGAGCT | CGAGCGACTC | TTCGACGAGA | CCCATTACCC | 5340 |
CGACGCCTTC | ATGCGCGAGG | AGCTCAGCCA | GCGCCTGGGG | CTCTCCGAGG | CGCGCGTGCA | 5400 |
GGTAGGAACC | CGGGGGCGGG | GGCGGGGGGC | CCGGAGCCAT | CGCCTGGTCC | TCGGGAGCGC | 5460 |
ACAGCACGCG | TACAGCCACC | TGCGCCCGGG | CCGCCGCCGT | CCCCTTCCCG | GAGCGCGGGG | 5520 |
AGGTTGGGTG | AGGGACGGGC | TGGGGTTCCT | GGACTTTTGG | AGACGCCTGA | GGCCTGTAGG | 5580 |
ATGGGTTCAT | TGCGTTTGTT | TTTCACCAAC | AGCAAACAAA | TATATATACA | TATATATTAT | 5640 |
ACAAATAACA | AATAAATATA | TATGTTATAC | AGATGGGTAT | ATTGTATATA | TTATAGATAT | 5700 |
TTGTTCGTCC | TTGGTGCAAA | GACACCCGGT | GAACGCATAT | ATTGGCTCCT | GACTGCCTTC | 5760 |
GGTTCCCCTG | GGATTGGTTA | TAGGGGCAAC | ACATGCAAAC | AAAACTTTCC | CTGGATTATA | 5820 |
CTTAGGAGAC | GAAGCTACAG | ATGCGTTTGA | TCCAGAGTGT | TTTACAAGAT | TTTTCATTTA | 5880 |
AAAAAAAATG | TGTCTTTTGG | CCCCTGATTC | CCCTCCGTCT | TCCCGTGTGG | CTGCATTGAA | 5940 |
AAGGTTTCCT | TAGGATGAAA | GGAGAGGGGT | GTGCTCTGTC | CCTAGGTGGA | GAGAAACAGG | 6000 |
GTCTTCTCTT | TCCTCCGTTT | TTTCAGCTAC | GGTTTGTATC | TCCCTCCTCC | CCTCTCCAGC | 6060 |
CCTGTCCTCT | GCTACAAACC | ACCCCCTCCT | CCCTCCGGCT | GTGGGGAGCG | CAGGAGCACG | 6120 |
TTGGGCATCT | GGATGAGCGG | AGACTATTAG | CGGGGCACGG | GGGCTCCCCG | AGGAGCGCGC | 6180 |
GAATTCACGC | TGCCCCATGA | GACCAGGCAC | CGGGGGGCGG | AGGGGCCTTG | GGTGTCCGCA | 6240 |
GAGGGACGGG | CGGGCAGAGC | CTTCCTCCGC | ATTCTAAACA | TTCACTTAAA | GGTATGAGTT | 6300 |
TATTTCAGGG | GTGCTGCTGG | GAGAGCCTCC | AAATGGCTTC | TTCCAGCCCC | TGCCTGACAG | 6360 |
TTCAGCTCCC | CTGGAAGGTC | ZáACTCCTCTA | GTCCTTTCTC | CTGGTTCTGG | GCAGGACAGA | 6420 |
AGTGGGGGGA | GGGAGAGAGA | GAGAGAGAGA | GAGAGAGACG | GTCAGGATCC | CCGGACCCTG | 6480 |
GGGAACCCGT | CAAAAATAAA | TGAAATTAAG | ATTGCCGACC | AGAGAGAGAA | CCGTGACAAA | 6540 |
GCAAACGGCG | TTCAAAGCAA | AGAGACGAAC | TGAAAGCCCG | TTCCCGTAGG | ACTGGTTATG | 6600 |
AGGTCAACAC | ATTCAAACAC | AGGTTGCTCT | GGATTTTGCT | GAGCAGAGGA | AGATACAGAT | 6660 |
GCATTTGATC | CAAAGTGTGT | TACATCTTTC | ATTATATGTG | TGTCTATATA | TATAAACATA | 6720 |
ΤΑΤΛΑΑΤΑΤΑ | TAAACATACA | TAAATGTATG | TAAATATATA | TAATCTATAT | ACATATATAA | 6780 |
ATATATAAAC | ACATATATAA | TATATAAATC | TATAAACATA | TATAATATAT | AAACATAAAT | 6840 |
ATATAAACAT | ATATAATATA | TAAATATATT | AACATATATA | AAATATGTAT | AAATATATAT | 6900 |
AAACATATAA | ACATATATAA | ATATATAAAC | ATATAAATAT | ATAAACATAT | ATAAATATAT | 6960 |
ACAAACATAT | TGTATATATA | TAAATATATA | TAAAAACATA | TATATACATA | TAAAAATATA | 7020 |
TATAAACATA | TATACATATA | AAGAAATATA | TATAAACATA | TATACATATA | AATATACATA | 7080 |
TATAAACATA | TATATACATA | AAATATATAT | AAACATATAT | ACATATAAAA | ATATATATAT | 7140 |
ATTAACATAT | ATATACATAT | AAAAATATAT | ATATTAACAT | ATATATACAT | ATAAAAATAT | 7200 |
ATATATATTT | TTGGCCCCTG | ATTCCCTTCG | GTTCCTGTGG | GATGGGTGAT | TGAGTCAACA | 7260 |
9« 99 • 9 '9 • *4
4 ·
4 44 4
4 · fl ·
4 · 4
.....
• ·« ·· • · » · · · « # · « · · · • •««v * ··· · · · • « · *
CATTCAAACA
TGGAGAGGGT
GGCTCCTGAT
GTTACGATTA
TACAGCCCAG
GGCGTCTGTG
ACCCCTCTGG
TCGCTAAAGG
CAATATATCC
CCACACTATT
ATTGGTTGTG
AAGCTGGGGG
AAAACAAACA
CCTATAGTAA
CGTCCCGCGT
CATCTCTCTG
CGGATAGAGT
GCTGTTGCTG
TCAGGCTTCT
ACAAATATCT z\TGGAAATCA
AATGAAGAAA
TTGGAATGGA
TCATCACTTG
ATGAGGCTTT
TTGGGTGGCT
TGGAGAGGCA
AGCTTTGGAA
GGTGTGAGGG
CCGGTAGGAC
TGTTGGGTTC
TGAGGGTTTT
AGGGTGGCTG
CAACTTTTCC
TTTACAAGCT
TCTCTTCCGT
AATCAACCCT
GAGGGAGAGA
GCCTCAGTGA
CAGAAGATGG
GGACATCGAG
CAGCCCTTGA
TCTTTCCGTA
GGGTGTGTGC
TTATCGATTG
TGGGAATGCA
AGGCGAGTGC
TGAGGGGACG
TGAATTCTTG
TTCAATTTAC
ATTAACCTTT
AATCGAAAGT
TTGGGTTTAT
AAAGGAAATC
TAACTGTCTT
TCGTGAATCA
TATTCTTCAT
CCACGTTTCA
GGCTTGCTTT
CAGTGGCAGG
ATTATTGGTG
AGGATGACTT
CCACTTTGGA
AAGAGCAAGT
CTGAGGTTCC
TGGGCCGAGG
ATCGATGTTG
CTTTCATTTA
CTTCCCATGT
CCCCAGGCAT
GGCTTTGGTG
GGGAAGGAAG
ATTGGGCTGC
TTTATGTGTC
TGTACTGTTT
GTCTATTACC
GGACCCCGAG
CAGGGGTGGC
ATAAAAGACA
GCTTTGAGGG
GGGACGAGCA
GGTCACATGC
TGTGGAAATT
TATTTTTAGC
TATGAGACCA
GGCGCAGAGC
GCATTACGGC
AAGCAGTGTC
CTCCAAGACT
CATTTTTTTT
GGAGGATTTT
CTGGGCCCTG
TCACCTGGAT
AATTTCGATG
TGCTGGGAAA
AATGAAAAGC
TCACGTTGCG
CTTCATAGGG
GACCCAGCAC
CTTAGGAGAT
AATATATATA
GGCTGCATTT
CTTTACCGAG
ACTTGGAGGA
CTGCATCAGA
CCCGTATAAA
ATCTCCTGGT
CTATAAAAAT
GACGAGAGCA
AACGCCCTAA
ATGAAAATTT
TAATTCTCCA
GTCATAAAAA
GGGACAGAAA
GTCTCAGTAC
TGCTGTAAAT
GTGGCCCTGC
CGGTGAGGGG
TAAATTAAAT
ATTTGGGAAA
ACACACTTCA
GATTTATTAG
TTTCCTCTCG
CTTTTTTGAA
GAGGAGACAG
GGTCAGTGGA
TCAGCACCAG
CAGGATCAGG
CAGTTCCGAA
CTGTGTAGAC
GCACCGGCCC
GTGTTTTGCC
GAGGATACAG
TATATATATA
TAAAAGGCTT
GGCTGTGGTC
AGGACTGTGT
CAGGGGTTTC
TTAATGAAAA
GTCTGTGTGC
AAATTACTTG
CGTTAGTTCA
AATAAAGACA
AACGACGGTA
TCGCCGCGGG
TCAATTAGTT
AAGAAACCAT
AGCCCGTCCC
AAATTGAGCA
AAAGTCGTAT
CAGGCGGTAA
GTCATTATTC
GAAAGCGGGG
CTTACCATAT
CGCTTCACGC
CCGTGTTGAA
AAATGCCCTT
GCGGAGAGTC
GGTGGAGGTC
GCAGGGGCCT
TTCTCCAGGC
AGCTGGGCTG
TCCTGGCTGC
TGGGCCATGC
CACAACAGCC
ATGCGTTTGA
TATATTTTTT
GCCTAAGATC
CCCAAAGCGA
CCCTCCTTAG
CTCGCTGTCC
GATTAAAGTT
CTGGGATCTG
TAATTTAATT
GCTGCGGAAA
AATCGGGGAC
AATAATAATA
GGGAAAGGAT
CCAACACCCA
ATTTGAATCC
GTGCTGTGAC
TCCGATAGAA
CACCCAGCTG
TTTAATTACA
ACTGTCTGTA
AGTGCTCTTT
TCGGGCCTAA
AGCGGCTAAT
GGGAGAGTGA
CCAGAGGCTT
CAGGTGGGCA r
TGAAGGCGCC
TTTTGGCGGG
GCACTGCAGC
GAAGCTTCCG
TCCCAAACTC
ACAGTGCGTA
GGAGTGACTG
7320
7380
7440
7500
7560
7620
7680
7740
7800
7860
7920
7980
8040
8100
8160
8220
8280
8340
8400
8460
8520
8580
8640
8700
8760
8 20
8880
8940
9000
9060
9120
9180
9240 » 9 » 9
999 *
• 9 9 ·
68 | • 9 9 9 9 •9999 9« | • « | ||||
GTTCACTCAC | CGCCTTGGCG | GAGGACGCCT | GTTCTCTGGA | CGAATCATTT | CTCTTGGGTG | 9300 |
GTGACTGCCT | TGTGGGTCAA | GGTGCAGGTT | TTCTGCCACA | GAAAACCTGT | TAGGAGGAAT | 9360 |
TAAGCGACTA | AGACTGTCAG | GGAGGTGGTG | GTGGGGGAGA | GGAGGGGGTG | GTGTCCAGAT | 9420 |
TACCAGGCAT | AGGCTAAACT | GCCTGCACTC | TCCAGCTGGT | CTGTCTGTGG | AGGAGGGGAT | 9480 |
TGTCAATACT | GGGAGAGCAG | AGGAGGCTCG | TAGGAGGTGA | GAGGGGGTGG | AATTTGCATG | 9540 |
caaatcttca | CATGAGGCCT | GTGTGAATTT | CTCCAGCCTC | CTGAGGGTCC | CCTGCGCTAT | 9600 |
TGCACTCAAC | TTCTTGATAG | TTTACCCCAA | GACTCAGAAG | TCCTTAGAGG | GGCAGAATGC | 9660 |
CCCCACCACA | AAGCCTGCTA | TCCTTGGGCG | TCCTCAGGAC | CCTTGGTCAT | GAATGGGACC | 9720 |
CTTTCATGTA | TGGGGACCCT | TGGTAATATG | AATGGGACGC | CTTCAGCTCC | CCAGGGCTTC | 9780 |
CGAGGAGGCC | GAGAAGGGCA | AAGACACTTC | CGAGGAGGCC | GAGAAGGGCA | AAGACATTTT | 9840 |
CTGGGCTTGG | TGTGTCAAGA | GCTAGATTGG | AGAAGGGGCT | GGATTTGGAA | CTCTTTAGCC | 9900 |
ATCAGCTCAC | CCTCTCCGTT | TGTGGCTAAA | GTCTGAAGGT | GGAAACTTCG | GTTCTCCTAC | 9960 |
AGGGTGTACA | GGAGTTGGGG | GGCGGGGCGC | CCACACAGAA | CGCTGGAAAG | TTCGACAGTC | 10020 |
CACTTCCACT | GGCTCGGAAC | TCACTTTTTC | ACCTTAAGTT | CATCAGCGGT | AACGCATAGG | 10080 |
TCTCACTTAG | GCAGGGCACG | GATGATTTAA | CAATTTCTAC | TTCTAGGTCA | GGTGCGGTGG | 10140 |
CTCACACCTC | TAATCCCAGC | ACTTTGGGAG | GCCCAGGAGG | GTGGATCGCT | TGAGGTCAGG | 10200 |
AGTTTGAGAC | CAGCCTGGCC | AACATGGTGA | AACCCCGTCT | CTACTAAAAT | ACGAAAATTA | 10260 |
GCCAGGCATG | GTGGTGAGCA | CCTGTAATTC | CAGCTACTCG | GGAGGCTGAG | GCAGGAGAAT | 10320 |
CGCTTGAACC | TGGGAGGTGG | ACGTTC-CAGT | GAGGTGAGAT | CACACCACTG | CACTCCAGCC | 10380 |
TGGATGAGAG | AGCAAGACTC | TGTCTCAAAA | ACAAAATAAA | ACAAAAACAA | AACAAAAATC | 10440 |
AAAAAAGzAAA | ACCCAATTTC | CAGTTCTAGG | CCAGGTGCAG | TGGCTCACGC | CTGTCATCCC | 10500 |
AGCACTTTGG | GAGGCCCAGG | AGGGTGGATC | GCTTGAGGTC | AGGAGTTCGA | GACCAGCCTG | 10560 |
GCCAACATGG | TGAAACCCCA | TCTCTACTAA | AAATACAAAC | GTTAGCTGGG | TGTGGTGGTG | 10620 |
TGCGCCTGTA | ATCCCAGCTA | CTCGGGAAGC | TGAGGCTGGA | GAATTGCTTG | AATCTGGGAG | 10680 |
GTGGAGGTTG | CAGGGAGGCG | AGATAGTGCC | ACTGCAGTCC | AGCCTGGACC | AGAGAGCAAG | 10740 |
ACTCCGTCTC | AAAAACAAAA | GAAAGCAAAA | ACAAAAAACA | AGAGAC.CAGC | CTGGCCAACA | 10800 |
TGGTGAAACC | GCGTCTCTAC | TAAAATACAA | AATTAGCCGG | GCATGGTGGT | r GGGCACCTGT | 10860 |
AGTCCCAGCT | ACTCGGGAGG | CTGAGGCAGG | AGAATGGCTT | GAACCTGGGA | GGTGGAGCTT | 10920 |
GCAGTGAGCC | GAGATÁGTGC | CACTGCACTC | CAGCCTGGGC | GACAGAGCGA | GACTTGATTT | 10980 |
CAGAACCACC | ACCACCACAA | CAAAACAAAA | CAAAAAATCC | AAAAAAACCC | CAATTTCCAG | 11040 |
TACTAGGTAG | TCAGTGATGC | AGGGCTGGAG | ACAGAGGGGC | GGTAAGTGTC | TGGGCGCCCA | 11100 |
CCATCAGTCA | CCTCCCAGCT | CCCAGAGGTG | CAAAGTGCTT | GGTTCAGCCT | CATGGGAAGG | 11160 |
ATGCTCCCTG | GGGAGGCTGG | GCTGGGTTCA | CAGGGCTCTT | CACATCTCTC | TCTGCTTCTC | 11220 |
CCCAAGGTTT | GGTTCCAGAA | CCGGAGAGCC | AAGTGCCGCA | AACAAGAGAA | TCAGATGCAT | 11280 |
• 99
9
999
9 9
9 9
999 9· • ·
AAAGGTGGGT | GTCGGGACTG | GGGGGACCTG | AAGCTGGGGG | ATCCTGCTCC | AGGAGGGATG | 11340 |
GGGTCGACGA | GGTGCTGGCT | ACACCCAGGA | CCACCACACT | GACACCTGCT | CGCTTTGGAC | 11400 |
ACAGGCGTCA | TCTTGGGCAC | AGCCAACCAC | CTAGACGCCT | GCCGAGTGGC | ACGCTACGTC | 11460 |
AACATGGGAG | CCTTACGGAT | GCCTTTCCAA | CAGGTAGCTC | ACTTTTTCTT | CCTCTGAAGA | 11520 |
TCCCTAGGGA | CCTGCTGCTC | CCTTCCCCTT | TCCCGTATTT | GCTGGCGCAT | CCTGACACTC | 11580 |
CTAGTCCCTC | CCTGCCCCTG | CAGACTTCTC | AGCTGGCCCT | TAGAAAAAAA | GCCTCTTTTC | 11640 |
CGAGGAGGCA | TTTACAGGCA | CCTTGGCACC | TATGAAATCA | GGCTGGGCCA | GGCGGGGTGG | 11700 |
CTCACACCTG | TCATCCCAGC | ACTTTGGGAG | GCTGAGGAGG | GTGCATCACC | TGAGATCAGG | 11760 |
AGTTCAAGAC | CAGCCTGGCC | AACTTAACGA | AACCCCGTCT | ATTAAAAATA | CAAAATGGGT | 11820 |
GTGGTGGCTC | ACGCCTGTCA | TCCCAGCACT | TTGGGAGGCC | GAGGCAGGTG | GATCACCTGA | 11880 |
GGTCAGGAAT | TCGAGACCAG | CCTGACCAAC | ATGCTGAAAC | CCCGTCTGTA | CTGAAAACAC | 11940 |
AAAGCTTAGC | CGGGCGTGGT | GGTGCACACC | TGTGATCCCA | GGTACTTGGG | AGGGAGAATC | 12000 |
ACTTGAACCT | GGGAGGTGGA | GGTTGCCGTG | AGCCAATATC | GCGCCACTGC | ACTCCACTCT | 12060 |
GGGTGACAGA | GTGAGACTCC | AAGACTCCAT | CTCAAAAAAA | AAAAAAAAAA | TCAGGCTGTA | 12120 |
AAAATCCACT | TTTGGGAAGG | TGAACACACA | CAAGCCCAAA | CAGAAATCTG | ACAAAAACCA | 12180 |
GAGGGGTGAA | AAGTCCACAC | AGTCAGGCAC | CCCCACCTGG | CTTGCTGCCT | GGTTAAGAAG | 12240 |
GGCGCAGATG | CCTGTGCCTG | GATACCAGAG | ATGGGACAGA | CACCCATTCC | CTTTTCATCA | 12300 |
CCACCCCCGA | GTGCCCGAGG | GCCTGGGGCG | TCTGCCTGGC | CCCTGGCCCC | TGGCTTGGGC | 12360 |
TCTGCACCTC | TGAACTGGAG | ACACCCTACT | CAGCTCCCCA | CTTACTTTGG | AGTGAGCAGC | 12420 |
GCTTGGGTGC | CCAGCGTGGA | TTTGGGGCTT | CCAGGGAGTC | GGGGTTCGGT | CGCGGAGCCC | 12480 |
AAGCTTCCCA | AGGGCGCCCC | CGCCCTGCCC | TGGCTTAGTG | GTGGGGATGG | GATGGGGGGA | 12540 |
AACGGGGAGC | TGCGTGGAAG | GAGGTGAAGG | GTCACAGGAG | GAGAGAGCGC | AGCGCCCACG | 12600 |
TGCGCCCTGC | CTGAACGCGC | AGCGCAGCGC | CCGGGTGCGG | TGCCCCTTGC | CCCTTCGGTC | 12660 |
CCTAATTTGG | GGATCGGGAG | TGCATGCGCG | GGCGGAACGG | GCTTGGGGGG | GGGGGTCTGG | 12720 |
CAGGGCGGAC | GCGTGGCCTC | CCTTCTTCAC | cgttttattc | CAAGGGGACA | GGCTGGGGAT | 12780 |
TGTATTTGGG | CGCGTGTTTG | GCTGAGGGTG | CAGGGACTTG | GGGGGTGGCG | GTGGGGAGGG | 12840 |
CGGAAGGTAT | AAACGTATAA | ATCATAAGTA | AACAACTCAG | AAATGGACCC | CGAGCGCTGG | 12900 |
TCGCCGCTAG | CTCTCCAGCT | CTCCCTGGCC | CAGGCCCGAA | GGAGAGGGGT | CCGCATCCCT | 12960 |
CCGCGGTTCT | CCTCTCCTGG | GTACCTGGCC | TTGAGGTGGG | GGAACGAGCC | TACTTCTTGT | 13020 |
ACCGTCTTTT | GCCGACGGCG | GGACCCAGTG | AAATTAGGCC | GTTGGAGCCC | GCAGGCCTGC | 13080 |
CTGGCTTTGC | GCACCGGAGT | CTTGGGGACC | TGGTGTCCCC | GGGAAAAACT | TGGGGACCTG | 13140 |
GTATCCCCGG | GAGAGGCTTG | GGGACCTGGT | GTCCCGGGAG | AGGCTTGGGT | ACCTGGTTTC | 13200 |
TCTGGAAGAG | GCTTGGACAC | CTGGTGTCCT | GGGAGGGCCT | TTGGGACCTG | GTGTCCTGGG | 13260 |
« 4 44
4 4 • 4 ·
44
4 4 4
4 4 4
444 444
4
44
AGAGGCTTGG | AGATCTGTTG | TCCTGGGAGA | GGCTTGGGGA | CCTGGTGTCC | CTGGAGAGGC | 13320 |
TTGGGGACCT | GGTGACCTTG | GAGAGGCTTG | GAGACCTGGT | GTTCTGGGAG | AGCCTTGGGG | 13380 |
ACCTGGTGTT | CTGGGAGAGG | CTTGGGGACC | TGGTGTCTCT | GGAAGAGGCT | TGGACACCTG | 13440 |
GTGACCCGGG | AGGGCCTTGG | GGATCTGGTG | TCCCGGGAGA | GCCTTGGGGA | CCTGGTGTCC | 13500 |
TGGGAGAGGC | TTGGGGACCT | GGTGACCTTG | GAGAGGCTTG | GGGACCTGGT | GTCCTGAGAG | 13560 |
AGCCTTGGGG | ATCTGGTGTC | CCAGGAGAGG | CTTGGGGACC | TGGTGTCTCT | GGAAGAGGCT | 13620 |
TGGACACCTG | GTGTCCTGGG | GAGAGGCTTG | GGGACCTGGT | GTCCTGGGAG | AGGCTTGGGG | 13680 |
ACCTGGTGTC | CTGGGAGAGG | CTTGGAGATC | TGGTGAGCCG | GGAGAGGCTT | GGGGACCTGG | 13740 |
TGTCCCGGGA | GAGGCTTGGG | GACTTGGTGT | CCCGGGAGAG | GCTTGAACAC | CTGGTGTCCC | 13800 |
AGGAGAGGCT | TGGGGACCTG | GTGACCTTGG | AGAGGCCTGG | GGACCTGGTG | ACCCGGGAGA | 13860 |
GCCTTGGGGA | CCTGGTGTCC | TGGGGAGAGC | CTTGGGGACC | TGGTGACCTT | GGAGAGGCTT | 13920 |
GGGGACCTGG | TGTCTCGGGA | GTGCCTTGGG | GACCTAGTGA | CCCGGGAGAG | GCTTGGGGAC | 13980 |
CTGGTGTCCC | GGGAGAGGCT | TGGGGACCTG | GTGTCCTGGG | AGAGCCTTGG | GGATCTGGTG | 14040 |
TCCTGGGGAG | AGGCTGGGGG | ACCTGGTGTC | TCGGGAGAGA | GCCTTGGGGA | CCTGGTGACC | 14100 |
CGGGAGAGGC | TTGGACACCT | GGTGTCCCGG | GAGAGGCTTG | GGGACCTGGT | GACCCGGGAG | 14160 |
AGCCTTGGGG | ACCTGGTGTC | CTGGGGAGAG | GCTGGGGGAC | CTGGTGTCTC | GGGAGAGAGC | 14220 |
CTTGGGGACC | TGGTGACCCG | GGAGAGGCTT | GGACACCTGG | TGTCCCGGGA | GAGGCTTGGG | 14280 |
AGCCTGGTGT | CCCGGGAGAG | CCTTGGGGAC | CAGGTGACCT | TGGAGAGGCT | TGGGGACCTG | 14340 |
GTGATCTTGG | AGAGGCTTC-G | GGACCTGGTG | TCTCGGGAGA | GGTTACGGGG | GCTGGTTGGG | 14400 |
GGAGAGAACG | TTGTGAGCCA | AAGTCCCTGA | ATCCCTGCGA | AAAGÁGCGCA | TCGGGAGCTC | 14460 |
CCCCTGAGGG | CGTTCCATTT | GTGGACCCCC | CTCCCATGCG | CTTTGCAGGG | AGCTGTTCGG | 14520 |
ATTCCCCTGG | CCCGGCTCCC | GCGGATGCAT | CCAGTGGCAG | CGCCAATTCT | GGGCCAGGGG | 14580 |
GAAGGAGGAA | AGGCGGGTGT | GGGGTGGTCT | CCACGGCTGG | AGAAGGGGCG | ACGCTCCCTA | 14640 |
GGGGAGAAGA | GGCACGTTGG | GGGTTTCCGG | GGGCGCGGGG | CGGAGCAGGC | CCCCCAGTCC | 14700 |
CCATCCTGCG | CCCTCACCCC | GCCGGGTCCG | CTCCCGCAGG | TCCAGGCTCA | GCTGCAGCTG | 14760 |
GAAGGCGTGG | CCCACGCGCA | CCCGCACCTG | CACCCGCACC | TGGCGGCGCA | CGCGCCCTAC r GTCCGCCTCG | 14820 |
CTGATGTTCC | CCCCGCCGCC | CTTCGGGCTG | CCCATCGCGT | CGCTGGCCGA | 14880 | |
GCCGCCGCCG | TGGTCGCCGC | CGCCGCCAAA | AGCAACAGCA | AGAATTCCAG | CATCGCCGAC | 14940 |
CTGCGGCTCA | AGGCGCGGAA | GCACGCGGAG | GCCCTGGGGC | TCTGACCCGC | CGCGCAGCCC | 15000 |
CCCGCGCGCC | CGGACTCCCG | GGCTCCGCGC | ACCCCGCCTG | CACCGCGCGT | CCTGCACTCA | 15060 |
ACCCCGCCTG | GAGCTCCTTC | CGCGGCCACC | GTGCTCCGGG | CACCCCGGGA | GCTCCTGCAA | 15120 |
GAGGCCTGAG | GAGGGAGGCT | CCCGGGACCG | TCCACGCACG | ACCCAGCCAG | ACCCTCGCGG | 15180 |
AGATGGTGCA | GAAGGCGGAG | CGGGTGAGCG | GCCGTGCGTC | CAGCCCGGGC | CTCTCCAAGG | 15240 |
CTGCCCGTGC GTCCTGGGAC CCTGGAGAAG GGTAAACCCC CGCCTGGCTG CGTCTTCCTC 15300
999· • 9
9
9
999 9 9 • 9 99 • 99
TGCTATACCC | TATGCATGCG | GTTAACTACA | CACGTTTGGA | AGATCCTTAG | AGTCTATTGA | 15360 |
AACTGCAAAG | ATCCCGGAGC | TGGTCTCCGA | TGAAAATGCC | ATTTCTTCGT | TGCCAACGAT | 15420 |
TTTCTTTACT | ACCATGCTCC | TTCCTTCATC | CCGAGAGGCT | GCGGAACGGG | TGTGGATTTG | 15480 |
AATGTGGACT | TCGGAATCCC | AGGAGGCAGG | GGCCGGGCTC | TCCTCCACCG | CTCCCCCGGA | 15540 |
GCCTCCCAGG | CAGCAATAAG | GAAATAGTTC | TCTGGCTGAG | GCTGAGGACG | TGAACCGCGG | 15600 |
GCTTTGGAAA | GGGAGGGGAG | GGAGACCGGA | ACCTCCCACG | TTGGGACTCC | CACGTTCCGG | 15660 |
GGACCTGAAT | GAGGACCGAC | TTTATAACTT | TTCCAGTGTT | TGATTCCCAA | ATTGGGTCTG | 15720 |
GTTTTGTTTT | GGATTGGTAT | TTTTTTTTTT | TTTTTTTTTT | GCTGTGTTAC | AGGATTCAGA | 15780 |
CGCAAAAGAC | TTGCATAAGA | GACGGACGCG | TGGTTGCAAG | GTGTCATACT | GATATGCAGC | 15840 |
ATTAACTTTA | CTGACATGGA | GTGAAGTGCA | ATATTATAAA | TATTATAGAT | ΤΑΑΑΑΑΆΑΑΑ | 15900 |
ATAGCCGTGC | ACTCTTGACC | CCGTCAACGT | CCAACGTGGA | AAAGGCGTTA | CCTCTTCTCC | 15960 |
CAGCGCTGGC | CGCCTGGCCA | CTGAGGGCCC | TTTGCAAAAA | TCACGGGTGT | AGAGATGGCC | 16020 |
CTGGGCGCGC | TGGGAGTGTG | GTTGTGTTTC | TGAAGGGGAT | AAAAGAGGGC | ACGGTGGTGC | 16080 |
CAAGATATCA | GTTTGGTACC | TGAGCTGTTT | GTGGTTGGGA | AGCGTAAAAG | CCAGGGAGAG | 16140 |
ATCCAGAGAG | TTTTCAAGTT | TTTGCAGATG | TAGGTGGTTC | CAGCTTTTCT | TTCTCCCCTA | 16200 |
CTCCATCTTC | TGCGTTCCCC | CAGTTCTTTT | ATTTCTTTGT | TTTTTATTTT | TGAGACAGAG | 16260 |
ACTTGCTTTG | TCGCCCAGGC | TGGAGTGCAG | TGGCGCAATG | TCAGCTCACT | GCCACCTCCA | 16320 |
CCTCCCGGGT | TCAAGCGATG | CTCCTGCCTC | AGCCTCCCGA | GTAGCTGGGA | CTACAGGCAC | 16380 |
CTGCCACCAC | CCCCGGCTAA | TTTTTTGTAT | TTATAGTAGA | GACGGGGTTT | CACCGTGTTG | 16440 |
GCCAGGCTCG | TCTCGAACTC | CTGACCTCAG | GTGATCTGCC | CGCCTCGGCC | TCCCAACGTG | 16500 |
CCCCCAGTTT | TATAAACAGC | AGATAGCAAC | TTGTCGTCAC | AGCTGGCATG | GGCTGGACAG | 16560 |
TTGCTTGAAA | TGACCTAACC | AAAAACATTC | AAGGGTTCTG | CCCCCAGATT | TCGGGAGATC | 16620 |
CACGTTCCAT | GTTCTGATTG | GTTTTCTGGG | AACACAGCAA | GGGGTTTGGT | GAGCTCCGAG | 16680 |
AAGATCCATC | TGCATGATTG | GCATTAGTTA | CCACAGCCTG | CCCAGAGAGA | AACTATCTTC | _16740 |
TCCCAACATT | TACTAACATC | CACTGGTCAA | CTCTCTTATT | TCCATAACAC | ATTTGCATCT | 16800 |
TTCTGGATTC | AAGCTTGGTG | GTTTTCTTTC | CTAACTTCTG | ATTTAGATAC | TTCTCCCfGA | 16860 |
GGT GvjGoAT A | AAAGAAAAAA | AAAAAACAAC | *£* | CTTCCGCATA | ACACTTTCTA | 16920 |
TCTTGTCACT | GAGCTGAACT | GTAGATCCAT | TTGGACCCGT | CTCATTTGTA | TCTTCTGATA | 16980 |
TTCTTTATAC | AAACCAAAAG | TCCCCTTCAA | CATTTTTTAT | GTCAAAATGT | TACAACCGCT | 17040 |
GTAAAATGAC | GGAGAGAGAG | AGAAAGAATC | CCAGACATTA | ACGGTATTAG | AGAGTTTGCC | 17100 |
TCATTCATCC | ATTTTTCTTA | AAAGCTGGAA | ATTAAAAAAA | AAAAAGAGAG | AGAGAGGCTT | 17160 |
TAATAGTTAA | GCTGAAATTT | TTATCGAAAA | GAAGAATTGC | ATTTTGAATC | TTTGGGAAGT | 17220 |
AGGTTCATTC | ATCAGAGTAT | GTAACCCTTT | GGAAAAGTGG | TTGGTAAGAT | ATGTACAGCC | 17280 |
9
72 | 9 9 9 9 9 9 99 9 9 9 «99 • 9 9 9 999 99 9 | 9 9 9 9 9 99999 · 9 9 9 9 | ||||
CTAGATTTTT | TTTTTTTTAA | CCAAAAAGGC | TGAGTAATTT | TGAAAAATCG | AAACATAACA | 17340 |
GTGTGTCATC | ATTTCCTCCC | AAGAAAAAGC | TCACTCCACG | TGAGTAGAAA | GACATCTACC | 17400 |
TGGTCCCTGT | AGAATCTGAA | CGTTTCTCTT | TAGAGACGGA | ATTTCAATCT | TGTTGCCCAG | 17460 |
GCTGGAGTGC | AGTGGCACAA | TCTCGGCTCA | CCGCAACCTC | CGCCTCCCGG | GTTCAAGCCA | 17520 |
TTCTCCTGCC | TCAGTCTCCC | GAGTAGCTGG | GATTACAGGC | ACCTGCCACC | AGGCCTGGGT | 17580 |
AACTTTCTGG | TATTTTTAGT | AGAGACAGGG | TTTCAGCCTC | CCGAGTAGCT | GGGATTACAG | 17640 |
GCACCTGCCA | CCAGGCCTGG | GTAACTTTCT | GGTATTTTTA | GTAGAGACAG | GGTTTCAGCC | 17700 |
TCCGGAGTAG | CTGGGATTAC | AGGCACCTGC | CACCAGGCCT | GGGTAACTTT | CTGGTAGTTT | 17760 |
TAGTAGAGAC | AGGGTTTCGG | CCTCCCGAGT | AGCTGGGATT | ACAGGCACCT | GCCACCAGGC | 17820 |
CTGGGTAACT | TTCTGGTATT | TTTAGTAGAG | ACAGGGTTTC | GGCCTCCCGA | GTAGCTGGGA | 17880 |
TTACAGGCAC | CTGCCACCAG | GCCTGGGTAA | CTTTCTGGTA | TTTTTAGTAC | AGACAGGGTT | 17940 |
TCGGCCTCCT | GAGTAGCTGG | GATTACAGGC | ACCTGCCACC | AGGCCTGGGT | AACTTTCTGG | 18000 |
TAGTTTTAGT | AGAGACAGGG | TTTCAGCCTC | CCGAGTAGCT | GGGATTACAG | GCACCTGCCA | 18060 |
CCAGGCCTGG | GTAATTTTTT | TGCATTTTTG | GTAGAGACAG | GTTTTTGCCG | TGTTGGCCCG | 18120 |
GCTGGTCTCA | AACTCCTGAC | CTCAGGTTGA | CCTGCCCGCT | TTGTCCCTCG | CAAAGTGCTG | 18180 |
GGATTACAGG | CGTGAGCCAC | CACACCTGGC | CTGAATCTGA | ACTTTTAAAA | GGGAGTTACT | 18240 |
GACTCTCAAC | TGTGCGGGGA | CGGTTTCACT | TTGATTTAAT | ATGGAAAGAG | GGCCAAGTGT | 18300 |
CATCCTCACA | AATGGGTCCC | CGAAGCAGAT | CAAACGCAGA | GAACTGTGAG | GGTGGGACAC | 18360 |
GAGTGTCTGT | GGACACTGGC | TGCCTTTGGC | TTTTCTCCTG | CGAGAGAAGT | TGGGTGACTT | 18420 |
TCTGTAGGTG | GATGAGTGAT | CCCTGAATGA | GTGTGGGGTA | CGTGTATGCT | AGCTGCTTCT | 18480 |
TTCTCCCTGA | AACTCTCGGA | T GvrAAGv, A/^G | TAAGAAATTC | AGCTTGGGCT | G j GACCAG l Γ | 18540 |
CTCACCACCA | ACGCCCTCTT | CTCTCTCCCT | TCTCCTTCCT | TCCTTCCTTC | CTTCCTTTCT | 18600 |
TTCTTTTTCT | TTCTTTCTCT | CTTTCTTTCT | TTTCTTTCTT | TCTGTTTCTT | TCCTTTTTAT | 18660 |
CTTTCTCTCT | TTTTCTTTCT | CTTTTCCTTT | TTTGTTTCTT | TCTTTCTTTT | TCTTTCTTTC | 18720 |
TTTTTCTTTC | TTCTTTCTTT | CTTCGATGAA | GTCTCACTCT | GTCACCCAGG | CTGGAGTGCA | *18780 |
GTGGTGCAAT | CCCAGCTCAC | 1 <jGA I CCl C Γ | ACCTCCTGGC | TTCAAGAAAT | TCTCCTGCCT | 18840 |
CAGCCTCCCA | AGTAGCTGGG | ATGACAGGCA | CCCACCACCA | TTCCCGGATA | ATTTTTGTAT | 18900 |
TTTTTAGTAG | AGACTGGGTT | TCGCCATGTT | GGCCAGGCTG | GTCTTGAACT | CCTGACCTCA | 18960 |
CATGATCCAC | CCGCCTCAGC | CTCCCAGAGT | GCTGGGATTA | CGGGGTGAGG | CACCGCGCCC | 19020 |
GGCCTCCTCT | CTCTTTTTCT | GAGATGTTTA | GGAAGGACTG | GGCTGATGGG | GACCCTCTGT | 19080 |
ATGTGATGTG | CGTGGGTTTG | GTTTCCCGGA | AGGCCCTCCA | GAGACACGTT | TGCGTGAACA | 19140 |
TTCAGCATGG | AAACAACATA | CGTCTCTCCA | CAGGAGGTGA | GAAATTGAAT | TTATGGGGTG | 19200 |
GGTGTACGCT | GGCGATTCTT | GGTGCTTTTT | GCTCAAAACA | AGGTTCTTTT | GAAAGTCACG | 19260 |
TTCCTGCTTT CCCTGTGGCT TCCCGGTGAG CTCGCTCGCA GAGCAAGGAA TACCACCCAG 19320
9 9 9
9
73 | 4 4 4 4 « 444 4 4 4 · 4 4 4*4 * 44444 4 | 4 4 4 4 4 4 44 44 4 4 4 4 | ||||
AGAGCAACGT | GGGCTGTGTT | CCGTTGTAAC | GCCGTTGCAG | AGAGAGGATT | TGGTGTGTGA | 19380 |
GATCCGTACC | AGCTCCAGCA | CACTGATAGG | AACACGTTGC | TGGCCGAACT | GAACGATGCT | 19440 |
GGGTTGGGTC | CTGATTGATA | CGTATTTTCT | TCCCTCCTCT | CCCCAAAACT | TGGCCAAATA | 19500 |
GTCCGTGGAG | GGTTGTCAGT | CGCCGCAGTT | GAGCAAAAAA | CACTTCTTCC | TTTGAGTGGC | 19560 |
TGTTCTGGTG | AAATCTGTTT | CTGACATATC | CACTTTTCTC | TCTCTTTTCT | CTCTCTCTGA | 19620 |
CTGCGAAGCA | CCCACAGGGA | GAAGGAATTG | GATGTATCGG | ATGTTGGTAT | TAGATTTTCT | 19680 |
TTCTCCGTTC | GAGTCTCTGA | CTGGTGCATA | CTTTGCAAAG | GTGTGTTCCT | GGCAATTGCC | 19740 |
AAGAGTTAGA | AAAATGCACC | TTCTCTGGTG | GCCGTTGGGG | TGTTGTTTCA | CAGGCAGTGG | 19800 |
TGACAGGGCC | CCTTGGCTGT | GGCTGTCTTC | TCCAGCGCCG | TGGATAAAGA | GACGGGACAG | 19860 |
ATTCTGTGCC | TCTGTACGAT | TTAGAGCGTA | ACTGACCGCG | TCCAACACCC | GTTTTTCCAC | 19920 |
TTACAAAGCT | GGTGGTGCGA | CGGGCTTGGT | GTCTCCCGTA | CGGGAAGGAG | GCCTTTGGGC | 19980 |
CGCTCCAAAG | ACGCCCTGTC | GTAGGAATGG | CCTCTCCATC | CCGCCAAAGT | CCAGCCAGGC | 20040 |
CCCCGAAATG | GTCCCATTTC | CTTGGAAGCC | TGAGTTTCTG | TTCTGGTCTT | GCTGCTGTCC | 20100 |
TTGGCCACGT | CAGCACGTGG | GAGCATCTGT | GGATACCGCA | GAGTCTGGGG | ACAGCTGGGC | 20160 |
GTTTAACCGA | AATGAAGCCG | AGACGGGTTT | CAGGTTTTGG | TGCCAAGCTC | TGGTCAGGAT | 20220 |
GAAAGGGAAA | TACCAGAGTC | CTCTGTCCTC | GCCTCTGGGT | TTCATGCTGA | CCTTTCTAAC | 20280 |
ATTTGTTTTC | CCCTAAGAAC | AAGCAGAAGC | CTCCAGCTCC | CTTTAGCTCC | ACAGTTTTCC | 20340 |
CGGGGACATA | GCGAGGATGG | CACACGGCAG | CCACTCCCAC | GACACACATT | TCGGAGGCAC | 2Ό4ΟΟ |
TTTGCTGGAA | GCCGCTTGTC | TCCTCCAGCT | TTGGGAGGTC | TGGGGAGGAG | AGAGGCTTTC | 20460 |
GGTGGACACG | TTTGACATTA | AAAAAAAAAA | AAAAAAAAAA | AAAAAAACTG | GTGCCTAATT | 20520 |
TATTAAAGAG | AATTAGCTTA | GCGAGTATAT | GCTGATATTC | TTCGACACAC | GTGGGTAAGT | 20580 |
TGATGCCATT | TATAAATGTT | TTATTGAAAT | TTGATATTTA | ATGAGAAGCC | GGTTAAGGAA | 2064 0 |
TGTAGACAAT | ATCCCGTTTC | AAAGCTATGA | AATGTGCTAT | TTATTGAAAG | GGGATGTGGC | 20700 |
TTCACGAGTT | CAGCCCATTG | TACGTGCAGG | TCCCGTGGGA | AGGAGGCAAA | AGCCCCTGCT | 20760 |
TCTTACTTTG | TGATGTATGT | GCATTTGTTA | TTTATTTTTT | TTTCCTTGGT | CGGACGTTCA | *20820 |
TAAATATGTA | CTATTTTAAT | TATGTCGAGT | GTAAATTTGA | CATCGCGTTG | CATTTATTTT | 20880 |
TATATTTCTG | AAAACTGTTG | CTTTTTCTTT | TTCCCTCCCC | CATTGACGAC | ATAGCGGtCC | 20940 |
CCGCGTCCGG | GTTACAAATA | CATCTACAGA | TATTTTCAGG | GATTGCTTCA | GATGAAAACA | 21000 |
AATCACACAC | CGTTTCCCAA | ACCAACAGTC | TTCACATTTC | TATCCCTCTG | TTATTGTCGG | 21060 |
CAGGCGGTGA | GGGGTAGAAA | AAAAACAAAC | AAACAAACAG | AAAAAAAAAC | CAAAAAAAAC | 21120 |
CACCCTGAGT | TTCTCTGGTG | ACGCCCTCAT | TCTCCTAACG | TTCAATAATC | TCAATGTTGA | 21180 |
GTTGCAGCAA | CAGACTGTAT | TTTTGTGACG | CCCCGTAGTA | TGAATGTACA | TCTTGTAAAA | 21240 |
• 4
4 «44
CTGAGATATA AATAAACTTA TAAATATTTG TATTCAAGTG TTAAAAAAAA AAAAATTCTC 21300
4 4 4 *
• 44 » 44 44
4 4 4 4
4444 4 ·
4 444 444444
4 4 4 4 4 ·*· ·* ·* * • 44 4
4
AACCTCTCCC | CTGAGGACAG | gcttattgga | AAAAAAAAAA | AAAAAAAAAA | ATCCTGAGTC | 21360 |
GGCCGTGGCT | GAACACAGAG | TGTTGTTCTG | CTGCGTGCAT | TTCCAGGGTG | GGTACCCAGT | 21420 |
GTTGCCCCCC | AGCCTTAGAT | CGGGAGGTAC | CATTGACTTT | TGGTTGTATC | CCATCCCCTT | 21480 |
CCTTTACTGA | AACCTACCTC | CCCGCTTCTC | AGCCAACGTC | CCCCCAGAAG | GTGGCAAAAA | 21540 |
AAACAGAGGA | AAAAGCCCTG | ATTTGAATCA | AGTCAGAGCT | GCTAATTCTC | CACTTTCTTT | 21600 |
ΑΑΤΤ7ΆΤΤΑΑ | TTTATTTTTT | TTTTTGAGAC | TGAGTCTCGC | TCTGTCGCCC | AGGCCGGAGG | 21660 |
AGTGCAGGGG | CGCGATCTCG | GCTCACCGCG | ACCTCCGCCT | CCCGGGTTCA | AGCGACTCTC | 21720 |
CTGCCTCAGC | CTCCCGAGTA | GCTGGGATGA | CAGTCACCTG | CACCACCGCG | CCGGGCTCAT | 21780 |
TTTTGTATTT | TTAGTAGCAA | TGGGGTTTCA | CCGTGTTGGT | CAGGCTGGTC | TCGAACTCCT | 21840 |
GACCTCGTGA | TCCACCCGCG | TCTGGGCCCG | GCCGGTGATG | TGTGTGCTTT | TAACTTTTAT | 21900 |
TTTGTTCCAG | TTTTCGACAG | TGGGACGGAT | TTTCCAGCAC | GGTCTTGCAA | GGATGATTGA | 21960 |
GTCATTTTTG | AGACAAAAAA | TATAATAATA | ATAAATGGAA | AAAGAAATCG | ACTTTTAAAA | 22020 |
ATGACAAATT | TTTTTTTTTT | TTTTTTGCAT | AGATTTTTCT | CTCTTTATGT | AAAGGAAAGT | 22080 |
TCATGATTGG | ATTTGGCCGG | CCTGACTGCT | TCCCGGCTGT | GATAAAAAAC | ACATGTGAGC | 22140 |
TGGGAGGGAA | GTGGGGGAGG | GACACAGCTG | CCCACACAGG | GTTCCCACCG | CGGTTACAGG | 22200 |
GTGGGCAGTG | CTGGGGGAGC | TTTCTCTGTG | GGGGGCTCAG | AGCCTGAGGA | CAGGTGAGGC | 22260 |
TCTCCGACAC | CTCCCCAGTT | GCCTGGAGTC | TAAACCGTCC | GTTGTCTGTA | CCGTCCGTTC | 22320 |
TTCCTGCTGA | CTCCTGGTAG | TTCCTGAAAG | CTTCTCTTGG | CCAGAGAAGG | GGTTTCAGAG | 22380 |
GCCGTGTGTC | CAGGCCATTC | TGCAAAGTGC | AACTTGACCG | TTCCTTTCCT | TTTCTGGCCT | 22440 |
GCGTGGTCTG | AAGCTCAGAG | CCCTCTCTTC | ACCCAGCCTG | TGTGTGTCTT | GCCGGACAGA | 22500 |
AGAAAAATGG | TGCTTTTTGC | GTGTTAGCAG | AGGTGCTTTT | CATGGCTGAC | CTCAACGCGT | 22560 |
CCATCTCCAG | CCTTGACCAA | GCTGTTTTTT | AGGGGCAAAC | GCAGGCAAGT | TCTGAATGCA | 22620 |
CACAGTTATT | TCATGGTTAA | ACTATTCAGC | TTTGGCCGGG | CGCAGTGTGG | CTCTCACGCC | 22680 |
TGTCATCCCA | GCACTTTGGG | AGGCCGAGGC | GGGTGGATCA | CCTGAGGTCA | GGAGTTCGAG | 22740 |
ACCAGCCTGG | CCAACACGGT | GAAACTCTAT | CTCTACTAAA | AATACAAAAA | TTAGCCGGGC | 22800 |
GTGGTGGTGT | GTATCTGTAA | TCCCAGCTAC | TCAGGAAGCT | GAGGCAGGAG | AATCGCTTGG | 22860 |
ACCCAGGAGG | CGGAGGTTGC | ACTGAGCCGA | GATCGCGCCA | TTGCACTCCA | GCCTGGGCG/A | 22920 |
CAGAGCCAGA | CGCTGTCTCA | AAAAAATGAA | ΤΑΑΤΑΑΛΑΤΑ | AAATAACAGG | AACTAAATAA | 22980 |
AATAAAACGT | TCAGCTTTGT | TCTGCAAATC | CACTCCTATT | GTTTTACGTG | GTTTGAGAGA | 23040 |
CTCTGTCCCT | TAGAAATAGA | TGTTTGTTGC | CAATTGTAAT | GAATCTGTTT | CAAAAATGAA | 23100 |
CAGAATATTC | AAATGGTTTG | AGAGATCTTT | TCCCTTAGAA | ATAGCTTGTT | GCCAATCACA | 23160 |
AAGAATGTTT | TTCAAAAATG | AATGGAATCT | TCCTGGATAT | CGCTTCCAGA | TCTTCATTTT | 23220 |
TTTTGCATAG | TTCAACCTGA | AAAGTAAGTG | TCTCAGCCCT | GAATTTCTTT | CTGATTTTTC | 23280 |
CATGGGTTGT | CTTGCAGACT | TCTCTGGACT | TGACCACATT | TAAAAAAAAA | AAAATTAACT | 23340 |
«9
9 4
9 4«
4 4
4 4
94« ··
9994 9
4 • 4 4«
4 4
4 ·
444 944 «
94
TTTTCACACG | GACACGGTTT | CAATAGGAAT | GAGATCTTTG | AGTTTTTATG | TAACAGATTC | 23400 |
TTACCATCAG | TTCTCAGATT | CCCAAATTAC | ACACAAAAAG | CCACGGACTT | CGCCTCCTGC | 234 60 |
TAACATGTCC | TTCTGTTTCT | GAGGCTTCTG | TTGGTGTTAG | ACTTTCATGT | TTAATAGCAG | 23520 |
ACAATGTAGG | GATTTAAAGA | AAAATGCAGA | GAAAGCAAAA | ACACTGACCA | AACACACGGA | 23580 |
GATAAGCTTT | CTAAAGCCTT | TGTTCTTGGA | GTTGTCGTTA | AAAAAAAAAA | GTTGTTTTAA | 23640 |
ACTTTGCAAG | CATGCCTATA | TTGAACTCAT | AAGCAAGAGA | GCCAAGAAAA | ATAGTGTCGG | 23700 |
TCGTCTACTC | TACACGTTTT | CCCAAAACAG | ACGTATTTTA | ATTTCTTTTG | TTTGAACTCA | 23760 |
CAGATGCTGA | GAGTTAAAAG | TTAAATTTTT | GTCATGAACA | ATAGTGGCCA | AAACCACAGT | 23820 |
TACTTTTGCA | CTATAGCATA | AT7VAGAAAAA | TACAGGCTGG | GCTCGGTGGC | TCACACCTGT | 23880 |
AATCAAAGCA | CTTTTGGAGG | CGAAACAGCC | AGATCCCTTG | AGCCCAGGAG | ATTGAGACCA | 23940 |
GCCTGGGCAA | CATAGCGAGA | CCCTCATCTC | TACAAAAAAG | GTTTGTTACA | TATGTAACAA | 2 4000 |
ACCTGCACAT | TGTGCACATG | TACCCTAAAA | CTTAAAGTAT | AATAATAAAA | AAATTAAAAA | 24060 |
AAAATTCACC | AATCAACTGC | CTGCTGGTGC | CTTCAAGAGA | CTCACCTAAC | ACATAAGGAC | 24120 |
TTGCATAAAC | TTATAAAACA | ATTCAATGGA | AGAATCCTTG | AAAGTATTCT | GAGAAGACAG | 24180 |
TATAATAAAC | TGATTTCTAA | AAAGGCTATA | AAAAATTGAA | TAAATCATTG | TTGGGCATCC | 24240 |
TGTGCTGAAA | TATAATGCAG | CCAATAAAAA | TTACAAAATG | AATAAACATT | TTATAACAAT | 24300 |
AAAAAAAAGT | CAAATAATTA | GGCAGGCATG | GTGGTGCTCT | CCTACGGTTG | AAGCTATTCA | 24360 |
GCAGGCAAGA | GGATACTTTG | TTTTTGTTTT | TTAATTTTTT | TTGAGACAGA | GTCTCGCTCT | 24420 |
GTTGCCAGGC | TGGAGTGCAG | TGGCGTGATC | TCAGCTCACT | GTAATTTCTG | CCTCCCGGGT | 24480 |
TCAAGCGATT | TTCCTGCCCC | AGCCTCCCGA | GTAGCTGGGA | TTACAGGTGC | CCGCCACCAC | 24540 |
ACCTGGCTAA | TTTCTTTTGT | ATTTTTAGTA | GAGACGAGGT | TTCCCCATGT | TGGCCAGGCT | 24600 |
GGTTTTGAGC | TCCCGACCTC | GGGTGATCCA | CCCGCCTCAG | CCTCCCAAAG | TGCTGGGATG | 24660 |
ACAGGCGTGA | GCCACCGCGC | CTGGCCCAGG | AGGATTATTT | GATCCCAGGA | GGTGGAGGCT | 24720 |
GCAGGAAGCC | ATGATTGCAC | CACTGCACTC | CAGCCTGGCT | GACAGAGTGA | GACCACATCT | 24780 |
CTAAATAAAT | GAATAAATAC | AGGCAGAAAC | TTTTTTTGTT | TTGTTTTGAT | GGAGTCTTGC | *24840 |
TCTGTCACCA | GGCAGGAGTG | CAGTGGTGCC | ATCTCAGCTC | ACTGCAACCT | CCACCTCCTG | 2 4 900 |
GGTTCAAGCA | ATCCTCCTGC | CTCAGCCTCC | CGAGTAGCTG | GGATTACAGG | TGCCCGCGAC | 24960 |
CACGCCCGGC | TAATTTTTTG | TATGTTTAGT | AGAGACGGGA | TTTCACCGTG | TTAGCCAGGA | 25020 |
TGGTCTTGAT | CTCTTGACTT | TGTGATCTGC | CTGCCTCAGC | CTCCCAAAGT | GCTGGGATTA | 25080 |
CAGGCATGAG | CCCAGGAGTT | CAAGACCAGC | CTCAGCAACA | AAGTGAGACC | TTTTCTCTCC | 25140 |
AAAAAATCAA | AAATTTAGCC | AGCTGTGGTG | GCTCCTGCCC | GTGATCCCAG | TACTGTGGGA | 25200 |
GGCTGAGGCA | GAATTGCTTG | AGCCCAGGAG | TTCGAGACCA | ACCTCAGCAA | AAAGGACTCT | 25260 |
CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTATAT ATATATATAT ATATATATAT 25320
• 76 | • ·« ·· • · · • · ·· · • · · « · • · · * «· ·· ·« | • ·» • · * * • · · · · ···*· · ·»· • « · • ·· | »· « * • · • · · • ·· | |||
GAGTTTCAAA | AATTGCTGGG | TGACCAGCTC | ATCTACTGGT | TTTCCCCTTG | GGAAAGTGAA | 25380 |
ATTGTCATGT | ATTGAAGATT | TCCAAGGAAG | TTGTATTGAA | TGAGAAACAA | ACTCAATCTG | 25440 |
TTCGTGTTTA | AAGAGCTGCA | GTGCGTTTGC | TGTGTTTCCC | ATAAAACTGC | ACTTCCAAAA | 25500 |
GACACGCTGA | GAAAGGAGAC | CAGGATTTGT | AATTCAGAAA | TTGGAAAGCA | AGTTAGGCTG | 25560 |
GACGTGGTAG | CTCATGCTTG | TTGTAATCTC | AGCACTCTGG | GAGGCTGAGG | CAGGAGGATC | 25620 |
ACTTGAGCCC | AGGAGTTCAA | GACCAGCCCG | TGCCACATGG | TGAAACCCTG | TCTCTCCAAA | 25680 |
AAATAAAACA | TTTAGCCAGA | TGTGGTGACT | CATGCCTGTA | ATCCCGGTAT | TCTGGGAGGC | 25740 |
TGAGGCAGAG | TTGCTTGAGC | CCAGGAGTTC | AAGACCAGCC | TCGGCAACAA | AGTGAGACCC | 25800 |
TGTCTCTCCA | AAAAATAAAA | CATTTAGCCA | GCTGTGGTGA | CTCATGCCTG | TAATCTCAGT | 25860 |
ACTCTGGGAG | GCTGGGGCAG | AATGGCTTGA | GCCCAGGAGT | TCGAGACCAA | CCTCAGCAAC | 25920 |
AAAGTGAGAT | CTTGTTTGTC | CAAAAAATCA | AAAATTTAGC | CAGCTGTGCT | GGCTCATGCC | 25980 |
TGTAATCCCG | GTACTCTGGG | AGGCTGAGGC | AGAATCGTTT | GAGCCCAGGA | GTTCGAGACC | 2 6040 |
AACCTCAGCA | ACAAAGTGAG | ATCTTGTTTC | TCCAAAAAAA | TCAAAAATTT | AGCCAGCTGT | 26100 |
GCTGGCTGGT | GCCTGTAATC | CCGGTACTCT | GGGAGGCTGA | GGCGGAATTG | CTTGAGCCCA | 2 6160 |
GGAGTTCAAG | ACCAGCCTCA | GCAACAAAGT | GAGATCTTGT | TTCTCCAAAA | AATAAAACAT | 26220 |
TTAGTCAGCT | GTGGTGGGTC | AAGCCTGTGA | TCCCAGCATT | TTGGGAGGCC | GAGGCGGGCG | 26280 |
GATCACGAGG | TCATGAGATC | GAGACCATCC | TGGCTAACAC | GGTGAAACCC | CGTCTCTACT | 26340 |
AAAAATACAA | AGAAAATTAG | CCGGGCGTGG | TGGCGGGCGC | CTGTAGTCCC | AGCTACTCAG | 26400 |
GAGGCTGAGG | CAGGAGAÁTG | CCGTGAGCCT | GGGAGGCGGA | CCATGCAGTG | AGTCAAGATC | 26460 |
GCGCCACTGC | CCTCCAGCCT | GGGCCACAGA | GCAAGACTCC | GTCTCAAAAA | /AAAAAAAAAA | 26520 |
AAAACTGCTG | CCCAACCTGT | GTTTGCACCA | CTGCCCTCCA | GCCTGGGCAA | CAGAGCAAGA | 26580 |
CTCCGTCTCA | AAAAAAAAAA | AATGCTGCCC | AAGCTGTGTT | TGCACCACTG | CCCTCCAGCC | 26640 |
TGGGCAACAG | AGCAAGACTC | CGTCTCAAAA | AAAAAAAAAA | AAAATGCTGC | CCAAGCTGTG | 26700 |
TTTGCACCAC | TGCCCTCCAG | CCTGGGCAAC | AGAGCAAGAC | TCTGTCTCAA | /AAAAAAAAAA | 26760 |
AATGCTGCCC | AAGCTGTGTT | TGCACCACTG | CCCTCCGGCC | TGGGCAACAG | AGCAAGACTC | _ 26820 |
CGTCTCAAAA | AAAAAAAAAA | AATGCTGCCC | AAGCTGTGTT | TGCACCACTG | CCCTCCAGCC | 26880 |
TGGGCAACAA | AGCAAGCCTC | AGCTTTCTGC | CATCTCCACA | ACCAAGAAAG | CAATTCACAC | 26940 |
AGAAATCAGT | GGATCGTGCA | GTGACCTCTT | CAGAAAACCA | ATGAGTTTTC | CACCTGAGGA | 27000 |
ACTGTTTCTG | AGCCCCATTC | AGAAAAACAC | ATCCCTGTAA | CTGCAGGGCA | GATTTACTCA | 27060 |
CTGTATGCCT | GTTTAAATAA | AGCTTCCAGC | CTCTGCATGG | GGTCTGTCTG | GAAGCTCCTG | 27120 |
TATCTGTCCC | ACATTCTTGG | AATCACAATG | CACCCTTGGG | AGGAAGATAT | GTATTTAAAG | 27180 |
GGAGTGGATG | TTATGGTGAG | AAAATGCTGC | CCATCCTTCT | AGAAGACAAA | AGCCACACAA | 27240 |
AATACATCAC | AAGAACCAGT | TTTTTTCAGA | GAAGAACCTG | CACAAAGAAC | CTGCTCCCCC | 27300 |
CACACCCCCA | CACACAGGTG | AATTAACAGG | ATGTATGTTT | TATCATAAAA | GCACAGGTTT | 27360 |
·· • · • · • 9 · 9 9 9
9 9 9 9 ·
9·· 99 99 9 • ·· ·· · • ··· • · ···· • 9 99
9 9 9
9 9 9
999 999
9
99
GTTTCCTATG | CACTCTCTGA | GGATTTGGCC | ATATGCAAAG | ATGTACAAAA | ACCTTCTCTT | 27420 |
TCCCCAGGGA | ACCGTAACCC | GTCTGAAAAG | ATGCCCTTCT | CAGAAGCGAG | TTGAACGATT | 27480 |
GTTGGAAAAG | ATAAAATACG | ACGTGCACAC | ACACAGTAGA | GAAATGTCAC | CCATGCAAAT | 27540 |
TATGTGTTTG | AATGGAACAC | ATTCAGGAAG | CTAAATGGGG | TATGACCACA | CATTTGGGTT | 27600 |
GATTTATTTG | ACGAGTGGAA | GGGGCAGATG | GAAATGAATA | CTGCTGTTTT | CCTTTGGAAG | 27660 |
GCCATATATG | GGAATACGAA | GAGGATTACT | TTGGAAGTTT | AGCTTCTCCA | GGTGGTCTCT | 27720 |
CTCTCTCTCT | CTTTTTTTGA | GACAGAGTCT | CACTCTGTCA | CCCAGGCTGC | AGTGCAATGG | 27780 |
CGTGCTCTCG | GCTCACTGCA | ACCTCAGCCT | CCCAGGTACA | AGCGATTCTC | CTGCCTCAGC | 27840 |
CTCCCGAGTA | GCTGGGATCA | CAGGTGTGCA | CCACCACGGC | TGGCTAATGT | TTGTATTTTC | 27900 |
AGTAGAGATG | AGGTTTTACC | ATGTTGGGCA | GGCTGGTCTT | GAACTCGTGA | CCTCAGGTGA | 27960 |
TCCGCCTGCC | TCGGCCTCCC | AAAGTGCTGG | GATGACAGAC | ATGAGCTAGC | ACGCCCGGCC | 28020 |
CCAGGTGGTC | TTTTTAGCGG | GTATTAAAGC | AGCTTTCTCT | CTGAGCCTTA | AACCATGAAG | 28080 |
ATAGACAGAC | TCAGTGTATG | GGTTTTAGAG | TTGTAATTTT | ATAAAAATAA | GAAAAAGTCG | 28140 |
ACCTATCATT | GATGGTTAGT | ATTTTTTGTA | GCAGTTGCAT | GCAATATTAG | GATAAGGCAT | 28 200 |
GTTCTCAAAA | AGAACTCTTT | 3? T T T 3? *5* T | TTTGAGACGG | AGTCTGGCTC | TGTCACCCAG | 28260 |
GCTGGAGTGC | AGTGGCACGA | TCTCCGCTCA | CTGCAAGCTC | CTCTTCCCGG | GTTCACGCCA | 28320 |
TTCTCCTGCC | TCAGGCTCCC | CAGTAGCTGG | GACTACAGGC | GCCCGCCACC | ACGGCCGGCT | 28380 |
AATTTTTTGT | ATTTTTAGTA | GAGACGGGGT | TTCACCATGT | TAGCCAGGAA | GGTCTCGATC | 28440 |
TCC7GACCTC | ATGATCCC-TC | CGCCTCAGCC | TCCCAAAGTG | CTGGGACTAC | AGGCGTGAGC | 28500 |
CACTGCACTT | GGCCTTTTTT | TTTTTTTAGA | TGGACTTTTG | CTCTTGTCGC | CCAGGCTGGA | 28560 |
GTATAATGGC | ATGATCTCGA | CTCACTGCAA | CCTCCGCCTC | CCGAGTTCAA | GCGATTCTCC | 2 8 620 |
TGCCTCAGCC | TCCCGAGTAG | CTGGGATTAC | AGGTGCCCAC | CACCATGTCA | AGATAATGTT | 2 8 680 |
TGTATTTTCA | GTAGAGATGG | GGTTTGACCA | TGTTGGCCAG | GCTGGTCTCG | AACTCCTGAC | 28740 |
CTCAGGTGAT | CCACCCGCCT | TAGCCTCCCA | AAGTGCTGGG | ATGACAGGCG | TGAGCCCCTG | 28800 |
CGCCCGGCCT | TTGTAACTTT | ATTTTTAATT | TTTTTTTTTT | TTTAAGAAAG | ACAGAGTCTT | *28860 |
GCTCTGTCAC | CCAGGCTGGA | GGAGAC Γ Gvj Γ | GGGATCATAG | CTCACTGCAG | CC I CzWAC I C | 28920 |
CTGGGCTCAA | GCAATCCTCC | CACCTCAGCC | TCCTGAGTAG | CTGGGACTAC | AGGCACCČAC | 2 8980 |
CACCACACCC | AGCTAATTTT | TTTGATTTTT | ACTAGAGACG | GGATCTTGCT | TTGCTGCTGA | 29040 |
GGCTGGTCTT | GAGCTCCTGA | GCTCCAAAGA | TCCTCTCACC | TCCACCTCCC | AAAGTGTTAG | 29100 |
AATTACAAGC | ATGAACCACT | GCCCGTGGTC | TCCAAAAAAA | GGACTGTTAC | GTGGATGTTC | 29160 |
TAGCTTCCTG | TTCTCGTCTT | TTCTTTGTTA | ATTGTACAGT | TTGAGGGTGT | GTGTGCGTGT | 29220 |
GCGCACGTGT | GTGTGTGCAG | TCTCCTGATT | TCATGTATTT | AATTGTTATT | ACCACCACCT | 29280 |
CCATCTCTCA | TTCCTTCTTA | CCCTCACTGT | GTAAAGATAC | ATGTTGTTTT | TAAATTTTAT | 29340 |
GTATTTATAT | TTATTTATTT | GTATTTCTGA | GACAGAGTCT | CACTCTGTTG | CCCAGGCTAG | 29400 |
TGGCATGATC | TCAGCTCACA | GCAACCTTTG | CCTCCTGGGT | TCAAGCGATT | CTCCTGCCTC | 29460 |
AGCCTCCCGA | GTAGCTGAGA | TTACAGGCAC | ACACCACCAC | ACCCGGCTAG | TTTTGTTTTG | 29520 |
AGACGGAGTC | TCGCTCTGTT | GCAGGCTGCA | GTGCAGTGGC | GTGATCCTGG | CTCACTGCAA | 29580 |
CCTCTGCCTC | CTGGATTCAA | GCGATTCTCC | TGCCTCAGCC | TCCCAAGTAG | CTGGGATTAC | 29640 |
AGGCGCCCAC | CGCCACACCT | GGCTAATTTT | TTATTGGTAG | TAGAGACGGG | GTTTCTCCAT | 29700 |
GTTGACCAGA | CTGGTCTTGA | ACTCCCAACC | TCGGGTGATC | CACCCACCTG | GGCCTCCCAA | 29760 |
AGTGCTGGGA | TGACAGGCGA | GGGCCACCGC | GTCCAGCCTT | CTTCTTCTTC | TTCTTTTTTT | 29820 |
TTTTTTTAAG | ATGGAGTTTC | ACTCTGTTGC | CCAGGCTGGA | GTGCAGTGGT | GCAATCTCGG | 29880 |
CTCCCTGGAA | CCTCCACCTC | CCAGGTTCAA | GAAATTCTTT | TGCCTCAGCC | TCCCGAGTAG | 29940 |
CTGGGACTAC | AGGTGCCCGC | CACCACACCC | ACCTAATGTT | TGTATTTTTT | TGGTAGAGAC | 30000 |
GGGGCTTCAC | CACATTGGCC | AGGCTGGTCT | TGAACTCCTG | ACTTCAGATG | ATCCTCCTGC | 30060 |
CTCAGCCTCC | CAGAGTGTTG | GGATTACAGG | CGTGAGCCAC | GGTGCCCGGC | CAGACGTCAT | 30120 |
GTCTTAGGAA | ATCAGAAAGT | GGGTAGTTTC | CGCACTCTGA | GGAGAAAAAG | AGACGTCCGG | 30180 |
CGAAGAGAAA | GGAGAGTGAA | AGGATGTCTC | CTCTTGTCTG | TAGCCTGTTC | TCAATCGTGA | 30240 |
GTGAGCCAAT | TGCCAGAAAC | TGAGGGTGCT | TCATTTGGCC | AGGCAAGCTT | CTCAACAGAA | 30300 |
TGTCTAAGTA | CTTGTTAATG | CTGAGAAGCT | CTCCAAGCTA | CTGCACTCCA | GCCTGGGTGA | 30360 |
CAGAGCACGA | CCTTGTCTGA | AAACAATTAA | TTAATCAATT | AATTAATATA | ATGAAATCAT | 30420 |
ACTGAACTCA | GGAGACCATT | GGGGTGGGCA | GGGCTGGGGT | TGGAAAGGAA | CATAAAATAT | 30480 |
GGTGCAATGG | actttgctcc | AGTCTCCCTC | CCCATCTCTT | CTCGCCAAGA | GTCTCTGGAG | 30540 |
GGAGCATGGG | GAAGATGCTT | TGGGAATCTG | TAACTTCTTG | TCTTGTAAAC | AGAATATCTA | 30600 |
AGTAATTGTT | AATGCTGAGA | AGTTATAGAT | TTCCAAAGCC | TTTCTCCAGG | CTACGGACAA | 30660 |
GGGTCATGGG | TTACTCAGTG | TTACAGAAAG | AATGACATGG | AGATGTTTGT | TACATCTTAA | 30720 |
GGAACCATGA | GGGGCCAGAG | TATTTTACTC | TAAGTG7AGA | TGGTACATTG | GCCACGCCTG | 30780 |
TCCCAACACC | ACCAATGGTG | GCACCTAACT | TTTGTGTTTG | TGCCCCACAT | TTCTTCTTCT | 30840 |
TTTCTGACGT | AAATGCAAGT | GATATTCCTT | GGAAACCATG | CTGCAGCAAG | AGGCCATCTG | 30900 |
ACTACTAGTG | ATACCCTGTA | GCTCACCTAC | AGCAGCTCAC | TTGAAGCAGC | TCACČCATAG | 30960 |
CTCAGGTATA | GCTCACCTGC | AGCGGCTCAC | CTGTAGCTCA | CGTGTAGCTC | ACTTGTAGCA | 3 1020 |
GCTCACTGGT | AGCTCACCTG | CAGCAGCTCA | CCTGTACCTC | ACCTGTACCT | CACCTGCAGC | 31080 |
AGCTCACCTG | TAGCTCACCT | GTACGTGAGC | CACCGTACCC | GGCCAGCAAG | ACCCCATTTC | 31140 |
TAAAATAAAT | ACACAAAAAT | TAGCCGGACG | CGGTGGCGCG | TGTCTGTAGT | TGTAGCTACT | 31200 |
CAGGAGGCTG | AGGTGGGAGG | ATTGCTGGAG | GCTGGGAGGT | AGAGGCTGCA | GTGAACCGTG | 31260 |
ATCCAGCCAC | TGTACTCTAG | CCTGGATGAC | ATAGCAAAAC | CTTGTCTCAA | AAAACAAAAA | 31320 |
CAAAAAACAA | AACAAAGAAA | CAAACAAAAA | ACCCACACAC | ACCGGAAAAC | AAAACAAAAA | 31380 |
• ·0 · ··· · · · · • 0 Q · 0 0000 0 000 000
0 0 0 0 · ·
79 | •to ·· ·· | 0 | ||||
GCAAAAAGGA | AAGAAAAGAG | AGCCAGGTCC | CAAATATATA | TTTCCTTGGA | GAACCATTTG | 31440 |
CAAAGAGCAC | ACTTAAGGCC | GGGCGCGGTG | GCTCACGCCT | GTCATCCCGG | CACTTTGGGA | 31500 |
GGCCGAGGTG | GGTGGATCAC | GAGGTTGGGA | GATCGÁGACC | ATCCTGGCCA | ACATGGCGAA | 31560 |
ACCCCATCTC | TACTAAAAAT | ACAAAAAATC | AGCCAGGTGC | TGAGGCAGGT | GCCTGTAGTC | 31620 |
CCAGCCACTC | AGGAGGCTGA | GGCAGGAGAA | TGGCATGAAC | CTGGGAGGTG | GAGGTTGGAG | 31680 |
TGAGCCGAGA | TCGCGCCCCT | GCACTCCAGC | CTGGGCGACA | GAGCGAGACT | CCTTCTCAAA | 31740 |
TAAATAAATA | AATAAATAAC | AAAGAGCAAA | CTTAAAATTG | TCTCAGAAAT | CCCACGGGAT | 31800 |
ATTGGATCTC | CCTCATGCCT | ATCTGATGAC | ACTTTGAGTG | TCTGGGGCCC | CGTGCCTATT | 318 60 |
TTCTGGGGTT | CCCAGAAGCT | GCCGTTCTGA | AAGTGTGGCT | CTCGGGGACG | TGGCACAGGT | 31920 |
GTGGATGTCT | GTTTTAAATG | TCAGGCGTTT | GGACGTTGAG | GAACGTGAGG | CTGAAGGTCG | 31980 |
GCTTCGCCGA | CCCCCTGAGT | TTAGGGTCCT | gccttttaaa | ATCTTCCCAG | CACTCTGTTG | 32040 |
TTCACGCAAG | CGTCCCATCT | GTTTGGGTGG | CCGTGCCGTC | TGCATCTGTC | TCGAACCTTC | 32100 |
ACAGCTTTGC | AGAATATCCT | GTTTCTCAAT | ACGGATGGAG | AAACACGAGA | CGCGTTTTCT | 32160 |
GGGTTATTTT | AGCCGTCACG | GAGAACCCCA | GACTGATGTG | TGCTAATGAC | CTCATTAATG | 32220 |
ATACTCTGAG | GCAGACAGCC | CTGCCTGATC | TTAACAACAT | TTTTTAAATT | TCTTTTTTTG | 32280 |
TTGTTGTTGT | TACAGCATCA | TTCATATAAC | GTAGGAAACC | GTGATCAGTA | GCTTTTAGGA | 32340 |
TATTTGCAAC | AGGGTGTAAC | ADAAABD | 32367 |
(2) Informace o sekvenci SEQ ID NO: 15:
(i) CHARAKTERISTIKA SEKVENCE:
(A) DÉLKA: 806 párů baží (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (iii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOT (ix) RYSY:
(A) NÁZEV/KLÍČ: CDS (B) POZICE: 43..615 (xi) POPIS SEKVENCE: SEQ ID NO: 15:
GTGTCCCCGG | AGCTGAAAGA | TCGCAAAGAG | GATGCGAAAG | GGATGGAGGA | CGAAGGCCAG | 60 |
ACCAAAATCA | AGCAGAGGCG | AAGTCGGACC | AATTTCACCC | TGGAACAACT | CAATGAGCTG | 120 |
GAGAGGCTTT | TTGACGAGAC | CCACTATCCC | GACGCCTTCA | TGCGAGAGGA | ACTGAGCCAG | 180 |
CGACTGGGCC | TGTCGGAGGC | CCGAGTGCAG | GTTTGGTTTC | AAAATCGAAG | AGCTAAATGT | 240 |
AGAAAACAAG | AAAATCAACT | CCATAAAGGT | GTTCTCATAG | GGGCCGCCAG | CCAGTTTGAA | 300 |
GCTTGTAGAG | TCGCACCTTA | TGTCAACGTA | GGTGCTTTAA | GGATGCCATT | TCAGCAGGTT | 360 |
CAGGCGCAGC | TGCAGCTGGA | CAGCGCTGTG | GCGCACGCGC | ACCACCACCT | GCATCCGCAC | 420 |
«· »44 ·· • 4 4 4 4 4
4 4 * 4 ·
4 4 4 4 »44 44 44 ř» 4 4 4 4 4 4
4
4 4
CTGGCCGCGC | ACGCGCCCTA | CATGATGTTC | CCAGCACCGC | CCTTCGGACT | GCCGCTCGCC | 480 |
ACGCTGGCCG | CGGATTCGGC | TTCCGCCGCC | TCGGTAGTGG | CGGCCGCAGC | AGCCGCCAAG | 540 |
ACCACCAGCA | AGGACTGCAG | CATCGCCGAT | CTCAGACTGA | AAGCCAAAAA | GCACGCCGCA | 600 |
GCCCTGGGTC | TGTGACVCCA | ACGCCAGCAC | CAATGTCGCG | CCTGTCCCGC | GGCACTCAGC | 660 |
CTGCASNCCC | TNDDKANMCG | TTRCTYHTCM | ATTACACTTT | GGGACCYCGG | GDBAGVCCTT | 720 |
TTNNAGACTT | YVATKGGSCW | CSCTGGBCCC | TBRKGAWAC | TTGSGHYCGR | GAACCGAKHT | 780 |
GCCCABAYGA | GGACCRGTTT | GGAKDG | 806 |
(2) Informace o sekvenci SEQ ID NO: 16:
(i) CHARAKTERISTIKA SEKVENCE:
(A) | DÉLKA: 190 aminokyselin | |
(B) | TYP: aminokyselina | |
(C) | DRUH ŘETĚZCE: jednořetě | |
(D) | TOPOLOGIE: lineární | |
(ii) | TYP | MOLEKULY: peptid |
(xi) | POPIS | SEKVENCE: SEQ ID NO: 16: |
Met 1 | Glu | Asp | Glu | Gly 5 | Gin | Thr | Lys | Ile | Lys 10 | Gin | Arg | Arg | Ser | Arg 15 | Thr |
Asn | Phe | Thr | Leu 20 | Glu | Gin | Leu | Asn | Glu 25 | Leu | Glu | Arg | Leu | Phe 30 | Asp | Glu |
Thr | His | Tyr 35 | Pro | A3p | Ala | Phe | Met 40 | Arg | Glu | Glu | Leu | Ser 4 5 | Gin | Arg | Leu |
Gly | Leu 60 | Ser | Glu | Ala | Arg | Val 55 | Gin | Val | Trp | Phe | Gin 60 | Asn | Arg | Arg | Ala |
Lys 65 | Cys | Arg | Lys | Gin | Glu 70 | Asn | Gin | Leu | His | Lys 75 | Gly | Val | Leu | Ile | Gly 80 |
Ala | Al a | Ser | Gin | Phe 85 | Glu | Ala | Cys | Arg | Val 90 | Ala | Pro | Tyr | Val | Asn 95 | Val |
Gly | Ala | Leu | Arg 100 | Met | Pro | Phe | Gin | Gin 105 | Val | Gin | Ala | Gin | Leu 110 | Gin | Leu |
Asp | Ser | Ala 115 | Val | Ala | Hi 3 | Ala | His 120 | His | Hi 3 | Leu | His | Pro 125 | His | Leu T | Ala |
Ala | His 130 | Ala | Pro | Tyr | Met | Met 135 | Phe | Pro | Ala | Pro | Pro 140 | Phe | Gly | Leu | Pro |
Leu 145 | Ala | Thr | Leu | Ala | Ala 150 | Asp | Ser | Ala | Ser | Ala 155 | Ala | Ser | Val | Val | Ala 160 |
Ala | Ala | Ala | Ala | Ala 165 | Ly3 | Thr | Thr | Ser | Ly3 170 | Asp | Ser | Ser | Ile | Ala 175 | Asp |
Leu | Arg | Leu | Lys | Ala | Lys | Lys | His | Ala | Ala | Ala | Leu | Gly | Leu |
180 185 .. 190
Změněné nároky
·«· ····♦· ·· • · · * 99 9 99· • · 9 9
Claims (35)
- PATENTOVÉ NÁROKY1. Molekula nukleové kyseliny kódující polypeptidy, které obsahují oblast homeoboxu tvořenou 60-ti aminokyselinami a mají aminokyselinovou sekvenci SEQ ID NO: 1 a vykazují regulační aktivitu lidského růstu a dále obsahují nukleotidovou sekvenci SHOX ET93 (SEQ ID NO:2) a nukleotidovou sekvenci SHOX ET45 (SEQ ID NO: 4).
- 2. Molekula DNA podle nároku 1, která kóduje polypeptid, jehož délka je 150 až 350 aminokyselin.
- 3. Molekula DNA podle libovolného z nároků 1 nebo 2, která dále obsahuje nukleotidovou sekvenci SHOX G310 (SEQ ID NO: 3).
- 4. Molekula DNA podle libovolného z nároků 1 až 3, která dále obsahuje nukleotidovou sekvenci SHOX G108 (SEQ ID NO: 5).
- 5. Molekula DNA podle libovolného z nároků 1 až 4, která dále obsahuje nukleotidovou sekvenci SHOX Va (SEQ ID NO: 6) nebo SHOX Vb (SEQ ID NO: 7) .
- 6. Molekula DNA podle libovolného z nároků 1 až 5, která kóduje polypeptid vybraný ze skupina, která zahrnuje:a) transkripční faktor A, který má v podstatě aminokyselinovou sekvenci (SEQ ID NO: 11),b) transkripční faktor B, který má v podstatě aminokyselinovou sekvenci (SEQ ID NO: 13).
- 7. Sekvence DNA podle libovolného z nároků 1 až 6, přičemž DNA je genomová nebo izolovaná DNA odpovědná za regulaci lidského růstu.φφ φφ φ φ φ φ Φ· φ · • φφφ φ φ φ φ φ φφ φφΦΦΦΦ φφφ φφ r φ φ φ » φ φ φ φφφ φφφΦ φ φ φ φ φ
- 8. Sekvence DNA podle libovolného z nároků 1 až 6, přičemž DNA je cDNA.
- 9. cDNA podle nároku 8, která v podstatě obsahuje nukleotidovou sekvenci SHOXa (SEQ ID NO: 10) nebo SHOXb (SEQ ID NO: 12).
- 10. DNA podle nároku 7, která v podstatě obsahuje nukleotidovou sekvenci genu SHOX (SEQ ID NO: 14).
- 11. Lidský růstový protein, který má aminokyselinovou sekvenci danou v sekvenci (SEQ ID NO: 11) (transkripční faktor SHOXa), nebo jeho funkční fragment vykazující regulační aktivitu lidského růstu
- 12. Lidský růstový protein, který má aminokyselinovou sekvenci danou v sekvenci (SEQ ID NO: 13) (transkripční faktor SHOXb), nebo jeho funkční fragment vykazující regulační aktivitu lidského růstu.
- 13. Lidský růstový protein, který má aminokyselinovou sekvenci danou v sekvenci (SEQ ID NO: 16) (transkripční faktor SHOT) , nebo jeho funkční fragment vykazující regulační aktivitu lidského růstu.
- 14. cDNA kódující protein, který má aminokyselinovou sekvenci danou v (SEQ ID NO: 11), (SEQ ID NO: 13) nebo (SEQ ID NO: 16).
- 15. Farmaceutická kompozice, vyznačuj ící se tím, že obsahuje protein podle libovolného z nároků11, 12 nebo 13..)99 99 99 9 9 9 9 ·9999 9 99« 99 999 999999999999 9 9 • 9999 99 » 99 999 99 9999 999
- 16. Způsob léčby malé výšky vyznačující se tím, že zahrnuje subjektu, je-li to nutné, terapeuticky účinné proteinu podle nároku 11, 12 nebo 13.postavy, aplikaci množství
- 17. Použití proteinu podle nároku 11, 12 nebo 13 při přípravě farmaceutické kompozice vhodné pro léčbu malé výšky postavy.
- 18. Použití sekvence DNA podle libovolného z nároků 1 až 10 nebo 14 nebo jejího fragmentu, která vykazuje regulační aktivitu lidského růstu, při přípravě farmaceutické kompozice pro léčbu vad spojených s mutacemi genu odpovídajícího za malou výšku postavy.
- 19. Použití sekvence DNA podle libovolného z nároků 1 až 10 nebo 14 nebo jejího fragmentu, která vykazuje regulační aktivitu lidského růstu, při přípravě kitu pro identifikaci jedinců, kteří mají genetický defekt odpovědný za poškození lidského růstu.
- 20. Použití sekvence DNA podle libovolného z nároků 1 až 10 nebo 14 nebo jejího fragmentu, která vykazuje regulační aktivitu lidského růstu, při identifikaci genu odpovědného za malou výšku lidské postavy.
- 21. Způsob stanovení malé výšky postavy na základě molekul RNA nebo DNA, vyznačující se tím, že molekula biologického vzorku, který se zkoumá, se amplifikuje v přítomnosti dvou nukleotidových sond komplementárních s libovolnou ze sekvencí DNA uvedených v SEQ ID NO: 2 až SEQ ID NO: 7 a následně se stanoví pomocí vhodného detekčního systému.<*99 9· 99 9 9 · • 999 9 9999 999 9 9 9 99 9 9 9 999999 99 9 ·99 9 99 9 9
- 22. Použití způsobu podle nároku 21 při identifikaci osob, které mají genetický defekt odpovědný za malou výšku postavy.
- 23. Transgenní zvíře nebo zvíře s deaktivovaným genem, vyznačující se tím, že je transformované genem odpovědným za malou výšku postavy, který obsahuje sekvenci DNA podle libovolného z nároků 1 až 10 nebo 14.
- 24. Buňky transformované sekvencí DNA podle libovolného z nároků 1 až 10 nebo 14.
- 25. Testovací systém, vyznačující se tím, že je vhodný pro identifikaci nebo testování činidel použitelných při léčbě malé výšky lidské postavy, který zahrnuje buňky podle nároku 24.
- 26. Způsob identifikace nebo testování kandidátů farmaceutických činidel použitelných při léčbě vad vztahujících se k mutacím genu odpovídajícího za malou výšku postavy, vyznačující se tím, že zahrnuje testovací systém podle nároku 25 a stanovení změn fenotypu uvedených buněk nebo změn produktů exprese uvedených buněk po té, co se uvedené buňky dostanou do kontaktu s uvedenými kandidáty farmaceutických činidel.
- 27. Expresivní vektor, vyznačující se tím, že obsahuje molekulu DNA podle nároků 1 až 10 nebo 14, která je schopna způsobit expresi kódovaného polypeptidu.
- 28. Způsob in vivo léčby genovou terapií vad růstu u lidí spojených alespoň s jednou mutací v genu SHOX nebo SHOT, vyznačující se tím, že zahrnuje zavedení expresivního plazmidu do lidských buněk, ve kterém molekula DNA podle libovolného z nároků 1 až 10 nebo 14 je začleněna ve • »· »· · • ·»«9 9 99»99» 9 * »· « • 9 99 9 99 99999» ·» ·999 9 99 9 9999 999999 směru 3'konce polynukleotidu od expresivního promotoru, jenž způsobuje expresi v lidské hostitelské buňce.
- 29. Způsob podle nároku 28, vyznačuj ící se tím, zeje vhodný pro léčbu Turnérova syndromu nebo malé výšky postavy.
- 30. Použití lidských růstových proteinů nebo jejich funkčních fragmentů, které mají regulační aktivitu lidského růstu, při přípravě léků pro léčbu pacientů, jenž vykazují genetickou mutaci genů lidského růstu SHOX (SEQ ID NO: 8) nebo SHOT (SEQ ID NO: 15) s tou podmínkou, že je vyloučena příprava léků pro léčbu pacientů trpících Turnérovým syndromem.
- 31. Použití lidských růstových proteinů nebo jejich funkčních fragmentů, které mají regulační aktivitu lidského růstu, při přípravě léků pro léčbu pacientů, jenž vykazují genetickou mutaci genů lidského růstu SHOX (SEQ ID NO: 8) nebo SHOT (SEQ ID NO: 15) a u nichž se použitím molekul DNA schopných hybridizovat se sekvencí DNA genů lidského růstu SHOX nebo SHOT zjistilo, že mají genetický defekt odpovědný za malou výšku postavy, s tou podmínkou, že je vyloučena příprava léků pro léčbu pacientů trpících Turnérovým syndromem.
- 32. Použití podle nároků 30 až 31, kde genetická mutace je způsobena horkým místem mutace v sekvenci DNA kódující bod zkrácení proteinu v pozici aminokyseliny 195 v lidském růstovém genu SHOX.
- 33. Použití podle libovolného z nároků 30 až 32, kde lidský růstový protein je lidský růstový hormon.
- 34. Způsob léčby pacientů vykazujících vady způsobené mutacemi lidských růstových genů SHOX (SEQ ID NO: 8) nebo SHOT • 44 • 4 44444 4 4 444444 4444 (SEQ ID NO: 15) , vyznačující se tím, že zahrnuje aplikaci pacientovi, je-li to nutné, farmaceuticky aktivní množství lidského růstového proteinu s tou podmínkou, že se vyloučí léčba pacientů trpících Turnérovým syndromem.
- 35. Způsob léčby pacientů vykazujících vady způsobené mutacemi lidských růstových genů SHOX (SEQ ID NO: 8) nebo SHOT (SEQ ID NO: 15) a u nichž se použitím molekul DNA schopných hybridizovat se sekvencí DNA lidských růstových genů SHOX nebo SHOT zjistilo, že mají genetický defekt odpovědný za malou výšku postavy, vyznačující se tím, že zahrnuje aplikaci pacientovi, je-li to nutné, farmaceuticky aktivní množství lidského růstového proteinu s tou podmínkou, že je vyloučena léčba pacientů trpících Turnérovým syndromem.• ·« ·· * . ·· ·· · φ φ φ φφφφ φ φ · · φ φφφ « φφ · • φ φφφ φ φφφφ · φφφ φφφ ···«·· · φΦΦΦ·· φφ « φ» φφ
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US2763396P | 1996-10-01 | 1996-10-01 | |
EP97100583 | 1997-01-16 | ||
PCT/EP1997/005355 WO1998014568A1 (en) | 1996-10-01 | 1997-09-29 | Human growth gene and short stature gene region |
Publications (2)
Publication Number | Publication Date |
---|---|
CZ96699A3 true CZ96699A3 (cs) | 1999-08-11 |
CZ297640B6 CZ297640B6 (cs) | 2007-02-21 |
Family
ID=26145174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CZ0096699A CZ297640B6 (cs) | 1996-10-01 | 1997-09-29 | Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití |
Country Status (20)
Country | Link |
---|---|
US (2) | US7252974B2 (cs) |
EP (2) | EP0946721B1 (cs) |
JP (2) | JP2000515025A (cs) |
KR (1) | KR20000048838A (cs) |
CN (1) | CN1232499A (cs) |
AT (1) | ATE230026T1 (cs) |
AU (1) | AU744188C (cs) |
BR (1) | BR9712185A (cs) |
CA (2) | CA2267097A1 (cs) |
CZ (1) | CZ297640B6 (cs) |
DE (1) | DE69718052T2 (cs) |
DK (1) | DK0946721T3 (cs) |
ES (1) | ES2188992T3 (cs) |
HU (1) | HU225131B1 (cs) |
IL (1) | IL129015A0 (cs) |
NO (1) | NO991554L (cs) |
NZ (1) | NZ334970A (cs) |
PL (1) | PL194248B1 (cs) |
SI (1) | SI0946721T1 (cs) |
WO (1) | WO1998014568A1 (cs) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1169346A4 (en) * | 1999-03-19 | 2003-02-26 | Human Genome Sciences Inc | 48 HUMAN SECRETED PROTEINS |
CA2368469A1 (en) * | 1999-03-26 | 2000-10-05 | Craig A. Rosen | 50 human secreted proteins |
WO2002083921A2 (en) | 2001-04-10 | 2002-10-24 | Agensys, Inc. | Nuleic acids and corresponding proteins useful in the detection and treatment of various cancers |
US7927597B2 (en) | 2001-04-10 | 2011-04-19 | Agensys, Inc. | Methods to inhibit cell growth |
EP1439225A4 (en) | 2001-10-04 | 2005-10-26 | Kansai Tech Licensing Org Co | DR5-GEN PROMOTER AND SIAH-1-GEN PROMOTER |
WO2004062555A2 (en) * | 2003-01-13 | 2004-07-29 | Gudrun Rappold-Hoerbrand | Use of natriuretic peptides for the treatment of stature disorders related to the shox gene |
SG183708A1 (en) | 2005-04-15 | 2012-09-27 | Epigenomics Ag | Methods and nucleic acids for analyses of cellular proliferative disorders |
US7382944B1 (en) | 2006-07-14 | 2008-06-03 | The United States Of America As Represented By The Administration Of The National Aeronautics And Space Administration | Protective coating and hyperthermal atomic oxygen texturing of optical fibers used for blood glucose monitoring |
PL2258871T3 (pl) * | 2007-01-19 | 2014-10-31 | Epigenomics Ag | Sposoby i kwasy nukleinowe do analizy zaburzeń proliferacyjnych komórki |
WO2014182595A1 (en) * | 2013-05-06 | 2014-11-13 | Mikko Sofia | Diagnostic test for skeletal atavism in horses |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3445933A1 (de) * | 1984-12-17 | 1986-06-19 | Röhm GmbH, 6100 Darmstadt | Arzneimittel mit diuretischer wirksamkeit |
US4983511A (en) * | 1989-01-09 | 1991-01-08 | Olin Corporation | Method and kit for detecting live microorganisms in chlorine- or bromine-treated water |
-
1997
- 1997-09-29 SI SI9730485T patent/SI0946721T1/xx unknown
- 1997-09-29 CZ CZ0096699A patent/CZ297640B6/cs not_active IP Right Cessation
- 1997-09-29 DK DK97944906T patent/DK0946721T3/da active
- 1997-09-29 EP EP97944906A patent/EP0946721B1/en not_active Expired - Lifetime
- 1997-09-29 JP JP10516222A patent/JP2000515025A/ja active Pending
- 1997-09-29 CA CA002267097A patent/CA2267097A1/en not_active Abandoned
- 1997-09-29 BR BR9712185-1A patent/BR9712185A/pt unknown
- 1997-09-29 WO PCT/EP1997/005355 patent/WO1998014568A1/en active IP Right Grant
- 1997-09-29 DE DE69718052T patent/DE69718052T2/de not_active Expired - Lifetime
- 1997-09-29 CN CN97198471A patent/CN1232499A/zh active Pending
- 1997-09-29 ES ES97944906T patent/ES2188992T3/es not_active Expired - Lifetime
- 1997-09-29 EP EP02011329A patent/EP1260228A3/en not_active Withdrawn
- 1997-09-29 KR KR1019990702836A patent/KR20000048838A/ko not_active Application Discontinuation
- 1997-09-29 IL IL12901597A patent/IL129015A0/xx unknown
- 1997-09-29 CA CA002647169A patent/CA2647169A1/en not_active Abandoned
- 1997-09-29 NZ NZ334970A patent/NZ334970A/xx unknown
- 1997-09-29 AU AU46252/97A patent/AU744188C/en not_active Ceased
- 1997-09-29 PL PL97332568A patent/PL194248B1/pl not_active IP Right Cessation
- 1997-09-29 HU HU9904175A patent/HU225131B1/hu not_active IP Right Cessation
- 1997-09-29 AT AT97944906T patent/ATE230026T1/de active
-
1999
- 1999-03-30 NO NO991554A patent/NO991554L/no not_active Application Discontinuation
-
2002
- 2002-05-31 US US10/158,160 patent/US7252974B2/en not_active Expired - Fee Related
-
2004
- 2004-03-02 JP JP2004058276A patent/JP2004201692A/ja active Pending
-
2007
- 2007-05-15 US US11/748,769 patent/US20090111744A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
SI0946721T1 (en) | 2003-06-30 |
IL129015A0 (en) | 2000-02-17 |
AU744188C (en) | 2003-07-24 |
BR9712185A (pt) | 1999-08-31 |
PL194248B1 (pl) | 2007-05-31 |
NO991554D0 (no) | 1999-03-30 |
NZ334970A (en) | 2000-12-22 |
CA2267097A1 (en) | 1998-04-09 |
DK0946721T3 (da) | 2003-04-14 |
CN1232499A (zh) | 1999-10-20 |
US7252974B2 (en) | 2007-08-07 |
EP1260228A2 (en) | 2002-11-27 |
AU744188B2 (en) | 2002-02-14 |
EP0946721A1 (en) | 1999-10-06 |
KR20000048838A (ko) | 2000-07-25 |
DE69718052D1 (de) | 2003-01-30 |
NO991554L (no) | 1999-05-14 |
WO1998014568A1 (en) | 1998-04-09 |
HUP9904175A3 (en) | 2002-01-28 |
US20090111744A1 (en) | 2009-04-30 |
DE69718052T2 (de) | 2003-07-31 |
CZ297640B6 (cs) | 2007-02-21 |
PL332568A1 (en) | 1999-09-27 |
US20030059805A1 (en) | 2003-03-27 |
CA2647169A1 (en) | 1998-04-09 |
EP1260228A3 (en) | 2003-03-05 |
HUP9904175A2 (hu) | 2000-04-28 |
JP2000515025A (ja) | 2000-11-14 |
AU4625297A (en) | 1998-04-24 |
ES2188992T3 (es) | 2003-07-01 |
ATE230026T1 (de) | 2003-01-15 |
HU225131B1 (en) | 2006-06-28 |
EP0946721B1 (en) | 2002-12-18 |
JP2004201692A (ja) | 2004-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2745324C2 (ru) | Композиции и способы модулирования экспрессии tau | |
AU2021200783B2 (en) | Mitigating tissue damage and fibrosis via latent transforming growth factor beta binding protein (LTBP4) | |
TWI834177B (zh) | 用於減少tau表現之組合物及方法 | |
RU2768285C1 (ru) | Олигонуклеотиды для модуляции экспрессии тау-белка | |
CN115181778A (zh) | 选择治疗性分子的方法 | |
ES2792126T3 (es) | Método de tratamiento basado en polimorfismos del gen KCNQ1 | |
AU744188C (en) | Human growth gene and short stature gene region | |
KR20130123357A (ko) | 저산소증과 관련된 질환의 진단방법 및 키트 | |
US6566061B1 (en) | Identification of polymorphisms in the PCTG4 region of Xq13 | |
US6262334B1 (en) | Human genes and expression products: II | |
US20160250182A1 (en) | Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson's disease risk | |
CN111278468A (zh) | 用于脂肪营养不良的自体细胞疗法的人脂肪组织祖细胞 | |
CA2348657C (fr) | Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante | |
CA2433869C (en) | Gene for identifying individuals with familial dysautonomia | |
Class et al. | Patent application title: Human Growth Gene and Short Stature Gene Region Inventors: Gudrun Rappold-Hoerbrand (Heidelberg, DE) Ercole Rao (Riedstadt, DE) | |
US20160184454A1 (en) | Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson's disease risk | |
MXPA99002809A (en) | Human growth gene and short stature gene region | |
KR100968360B1 (ko) | Her-2 유전자 복제수 변화에 의해 발생되는 유방암의 진단 방법 | |
RU2805557C2 (ru) | Варианты b4galt1 и их применение | |
US20030203380A1 (en) | Gene linked to osteoarthritis | |
CN116606920A (zh) | 一种定性分析和定量分析基因rilpl1的试剂盒 | |
CN115362255A (zh) | 用无七之子2(sos2)抑制剂治疗眼科疾患 | |
CA2439155A1 (en) | Isolated human tumor supressor proteins, nucleic acid molecules encoding these human tumor supressor proteins, and uses thereof | |
US20020173459A1 (en) | Isolated human secreted proteins, nucleic acid molecules encoding human secreted proteins, and uses thereof | |
JP2002345493A (ja) | 新規遺伝子及びそれにコードされる蛋白質 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PD00 | Pending as of 2000-06-30 in czech republic | ||
MM4A | Patent lapsed due to non-payment of fee |
Effective date: 20110929 |