CZ297640B6 - Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití - Google Patents
Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití Download PDFInfo
- Publication number
- CZ297640B6 CZ297640B6 CZ0096699A CZ96699A CZ297640B6 CZ 297640 B6 CZ297640 B6 CZ 297640B6 CZ 0096699 A CZ0096699 A CZ 0096699A CZ 96699 A CZ96699 A CZ 96699A CZ 297640 B6 CZ297640 B6 CZ 297640B6
- Authority
- CZ
- Czechia
- Prior art keywords
- seq
- nucleic acid
- acid molecule
- shox
- gene
- Prior art date
Links
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 64
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 64
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 64
- 241000282414 Homo sapiens Species 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 25
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 20
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 16
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 16
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 141
- 239000002299 complementary DNA Substances 0.000 claims abstract description 29
- 150000001413 amino acids Chemical class 0.000 claims abstract description 22
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 21
- 239000002773 nucleotide Substances 0.000 claims description 44
- 125000003729 nucleotide group Chemical group 0.000 claims description 43
- 108020004414 DNA Proteins 0.000 claims description 31
- 210000004027 cell Anatomy 0.000 claims description 31
- 230000014509 gene expression Effects 0.000 claims description 27
- 238000009396 hybridization Methods 0.000 claims description 25
- 101150012871 SHOX gene Proteins 0.000 claims description 23
- 230000035772 mutation Effects 0.000 claims description 23
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 22
- 230000007547 defect Effects 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 13
- 230000009395 genetic defect Effects 0.000 claims description 13
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 7
- 241001465754 Metazoa Species 0.000 claims description 6
- 239000013613 expression plasmid Substances 0.000 claims description 6
- 239000008177 pharmaceutical agent Substances 0.000 claims description 6
- 238000005406 washing Methods 0.000 claims description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical group C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 5
- 239000012472 biological sample Substances 0.000 claims description 5
- 239000013604 expression vector Substances 0.000 claims description 4
- 102100021257 Beta-secretase 1 Human genes 0.000 claims description 3
- 101710150192 Beta-secretase 1 Proteins 0.000 claims description 3
- 102100021277 Beta-secretase 2 Human genes 0.000 claims description 3
- 101710150190 Beta-secretase 2 Proteins 0.000 claims description 3
- 101100436100 Caenorhabditis elegans asp-6 gene Proteins 0.000 claims description 3
- 101000581940 Homo sapiens Napsin-A Proteins 0.000 claims description 3
- 101000863841 Homo sapiens Short stature homeobox protein Proteins 0.000 claims description 3
- 101100459248 Mus musculus Mxra8 gene Proteins 0.000 claims description 3
- 102100027343 Napsin-A Human genes 0.000 claims description 3
- 101150016874 asp3 gene Proteins 0.000 claims description 3
- 230000009261 transgenic effect Effects 0.000 claims description 2
- 101100477520 Homo sapiens SHOX gene Proteins 0.000 claims 14
- 102000048489 Short Stature Homeobox Human genes 0.000 claims 14
- 108700025071 Short Stature Homeobox Proteins 0.000 claims 14
- 101150082072 14 gene Proteins 0.000 claims 1
- 101150044182 8 gene Proteins 0.000 claims 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 claims 1
- 238000009007 Diagnostic Kit Methods 0.000 claims 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 claims 1
- 230000012010 growth Effects 0.000 abstract description 50
- 210000001766 X chromosome Anatomy 0.000 abstract description 23
- 208000020221 Short stature Diseases 0.000 abstract description 14
- 210000002593 Y chromosome Anatomy 0.000 abstract description 11
- 230000001105 regulatory effect Effects 0.000 abstract description 7
- 238000011161 development Methods 0.000 abstract description 5
- 230000001747 exhibiting effect Effects 0.000 abstract description 3
- 238000002560 therapeutic procedure Methods 0.000 abstract description 2
- 108050009606 Homeobox domains Proteins 0.000 abstract 1
- 102000001420 Homeobox domains Human genes 0.000 abstract 1
- 238000012217 deletion Methods 0.000 description 31
- 230000037430 deletion Effects 0.000 description 31
- 239000013615 primer Substances 0.000 description 30
- 208000026928 Turner syndrome Diseases 0.000 description 22
- 102000004169 proteins and genes Human genes 0.000 description 21
- 210000000349 chromosome Anatomy 0.000 description 20
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 15
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 13
- 108700005087 Homeobox Genes Proteins 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- 108700024394 Exon Proteins 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 108091023040 Transcription factor Proteins 0.000 description 10
- 102000040945 Transcription factor Human genes 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 101000829171 Hypocrea virens (strain Gv29-8 / FGSC 10586) Effector TSP1 Proteins 0.000 description 9
- 238000010367 cloning Methods 0.000 description 9
- 230000001605 fetal effect Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 210000001185 bone marrow Anatomy 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 210000002950 fibroblast Anatomy 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 102000018997 Growth Hormone Human genes 0.000 description 7
- 108010051696 Growth Hormone Proteins 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 7
- 239000000122 growth hormone Substances 0.000 description 7
- 230000031864 metaphase Effects 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 210000002027 skeletal muscle Anatomy 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 6
- 108020004635 Complementary DNA Proteins 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 210000004556 brain Anatomy 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000007901 in situ hybridization Methods 0.000 description 6
- 230000004807 localization Effects 0.000 description 6
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 5
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 5
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 238000012300 Sequence Analysis Methods 0.000 description 5
- 208000037492 Sex Chromosome Aberrations Diseases 0.000 description 5
- IMMPMHKLUUZKAZ-WMZOPIPTSA-N Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 IMMPMHKLUUZKAZ-WMZOPIPTSA-N 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 5
- 210000004072 lung Anatomy 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 4
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 4
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 239000003155 DNA primer Substances 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- 101000703741 Homo sapiens Short stature homeobox protein 2 Proteins 0.000 description 4
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 4
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 4
- SVJRVFPSHPGWFF-DCAQKATOSA-N Lys-Cys-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVJRVFPSHPGWFF-DCAQKATOSA-N 0.000 description 4
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 4
- NSTPXGARCQOSAU-VIFPVBQESA-N N-formyl-L-phenylalanine Chemical compound O=CN[C@H](C(=O)O)CC1=CC=CC=C1 NSTPXGARCQOSAU-VIFPVBQESA-N 0.000 description 4
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 210000004090 human X chromosome Anatomy 0.000 description 4
- 230000016507 interphase Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 208000011580 syndromic disease Diseases 0.000 description 4
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 3
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 3
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 3
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 3
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- TUTIHHSZKFBMHM-WHFBIAKZSA-N Glu-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O TUTIHHSZKFBMHM-WHFBIAKZSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 3
- 108010048671 Homeodomain Proteins Proteins 0.000 description 3
- 102000009331 Homeodomain Proteins Human genes 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 3
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 3
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- CTVJSFRHUOSCQQ-DCAQKATOSA-N Met-Arg-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTVJSFRHUOSCQQ-DCAQKATOSA-N 0.000 description 3
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 3
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 3
- 206010072610 Skeletal dysplasia Diseases 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 108020005038 Terminator Codon Proteins 0.000 description 3
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 210000000988 bone and bone Anatomy 0.000 description 3
- 230000002559 cytogenic effect Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 210000002826 placenta Anatomy 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 210000003765 sex chromosome Anatomy 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000000123 temperature gradient gel electrophoresis Methods 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 101150014733 ASP5 gene Proteins 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 2
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- DIIGDGJKTMLQQW-IHRRRGAJSA-N Arg-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N DIIGDGJKTMLQQW-IHRRRGAJSA-N 0.000 description 2
- MYVBTYXSWILFCG-BQBZGAKWSA-N Asn-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N MYVBTYXSWILFCG-BQBZGAKWSA-N 0.000 description 2
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 2
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 2
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 208000035970 Chromosome Breakpoints Diseases 0.000 description 2
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 208000013558 Developmental Bone disease Diseases 0.000 description 2
- 108091008794 FGF receptors Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 2
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 2
- ISXJHXGYMJKXOI-GUBZILKMSA-N Glu-Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O ISXJHXGYMJKXOI-GUBZILKMSA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 2
- 102100028113 Granulocyte-macrophage colony-stimulating factor receptor subunit alpha Human genes 0.000 description 2
- 206010053759 Growth retardation Diseases 0.000 description 2
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 2
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 2
- 101000746373 Homo sapiens Granulocyte-macrophage colony-stimulating factor Proteins 0.000 description 2
- 101000916625 Homo sapiens Granulocyte-macrophage colony-stimulating factor receptor subunit alpha Proteins 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 2
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 2
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 2
- 101100328158 Mus musculus Clmp gene Proteins 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- 101100489854 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) AAT2 gene Proteins 0.000 description 2
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 2
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- 102100031976 Short stature homeobox protein 2 Human genes 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- AUYYCJSJGJYCDS-LBPRGKRZSA-N Thyrolar Chemical class IC1=CC(C[C@H](N)C(O)=O)=CC(I)=C1OC1=CC=C(O)C(I)=C1 AUYYCJSJGJYCDS-LBPRGKRZSA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 210000002230 centromere Anatomy 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 208000037516 chromosome inversion disease Diseases 0.000 description 2
- 238000003200 chromosome mapping Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 231100000001 growth retardation Toxicity 0.000 description 2
- 210000002216 heart Anatomy 0.000 description 2
- 210000003917 human chromosome Anatomy 0.000 description 2
- 210000003016 hypothalamus Anatomy 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000001672 ovary Anatomy 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- PHEDXBVPIONUQT-RGYGYFBISA-N phorbol 13-acetate 12-myristate Chemical compound C([C@]1(O)C(=O)C(C)=C[C@H]1[C@@]1(O)[C@H](C)[C@H]2OC(=O)CCCCCCCCCCCCC)C(CO)=C[C@H]1[C@H]1[C@]2(OC(C)=O)C1(C)C PHEDXBVPIONUQT-RGYGYFBISA-N 0.000 description 2
- 230000001817 pituitary effect Effects 0.000 description 2
- 230000003169 placental effect Effects 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000004153 renaturation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 231100001055 skeletal defect Toxicity 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 229940036555 thyroid hormone Drugs 0.000 description 2
- 239000005495 thyroid hormone Substances 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 108010027345 wheylin-1 peptide Proteins 0.000 description 2
- ZDSRFXVZVHSYMA-CMOCDZPBSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-carboxybutanoyl]amino]pentanedioic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 ZDSRFXVZVHSYMA-CMOCDZPBSA-N 0.000 description 1
- ALBODLTZUXKBGZ-JUUVMNCLSA-N (2s)-2-amino-3-phenylpropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound NCCCC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CC1=CC=CC=C1 ALBODLTZUXKBGZ-JUUVMNCLSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- JKMPXGJJRMOELF-UHFFFAOYSA-N 1,3-thiazole-2,4,5-tricarboxylic acid Chemical compound OC(=O)C1=NC(C(O)=O)=C(C(O)=O)S1 JKMPXGJJRMOELF-UHFFFAOYSA-N 0.000 description 1
- BTFMCMVEUCGQDX-UHFFFAOYSA-N 1-[10-[3-[4-(2-hydroxyethyl)-1-piperidinyl]propyl]-2-phenothiazinyl]ethanone Chemical compound C12=CC(C(=O)C)=CC=C2SC2=CC=CC=C2N1CCCN1CCC(CCO)CC1 BTFMCMVEUCGQDX-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- 108010020567 12E7 Antigen Proteins 0.000 description 1
- 102000008482 12E7 Antigen Human genes 0.000 description 1
- JTTIOYHBNXDJOD-UHFFFAOYSA-N 2,4,6-triaminopyrimidine Chemical compound NC1=CC(N)=NC(N)=N1 JTTIOYHBNXDJOD-UHFFFAOYSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 102100026445 A-kinase anchor protein 17A Human genes 0.000 description 1
- 102100026397 ADP/ATP translocase 3 Human genes 0.000 description 1
- 241000023308 Acca Species 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- HGRBNYQIMKTUNT-XVYDVKMFSA-N Ala-Asn-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HGRBNYQIMKTUNT-XVYDVKMFSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- JQDFGZKKXBEANU-IMJSIDKUSA-N Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(O)=O JQDFGZKKXBEANU-IMJSIDKUSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 1
- IQTUDDBANZYMAR-WDSKDSINSA-N Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O IQTUDDBANZYMAR-WDSKDSINSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 1
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 208000020084 Bone disease Diseases 0.000 description 1
- 101150039729 CSF2RA gene Proteins 0.000 description 1
- 101100129088 Caenorhabditis elegans lys-2 gene Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 206010008723 Chondrodystrophy Diseases 0.000 description 1
- 208000031639 Chromosome Deletion Diseases 0.000 description 1
- 208000016718 Chromosome Inversion Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 208000032170 Congenital Abnormalities Diseases 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 201000009343 Cornelia de Lange syndrome Diseases 0.000 description 1
- 208000004468 Craniofacial Abnormalities Diseases 0.000 description 1
- 241001301450 Crocidium multicaule Species 0.000 description 1
- NLCZGISONIGRQP-DCAQKATOSA-N Cys-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N NLCZGISONIGRQP-DCAQKATOSA-N 0.000 description 1
- QLCPDGRAEJSYQM-LPEHRKFASA-N Cys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)C(=O)O QLCPDGRAEJSYQM-LPEHRKFASA-N 0.000 description 1
- BCWIFCLVCRAIQK-ZLUOBGJFSA-N Cys-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O BCWIFCLVCRAIQK-ZLUOBGJFSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 208000003471 De Lange Syndrome Diseases 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 102000044168 Fibroblast Growth Factor Receptor Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- 241001554172 Gonodes Species 0.000 description 1
- 108010009202 Growth Factor Receptors Proteins 0.000 description 1
- 102000009465 Growth Factor Receptors Human genes 0.000 description 1
- 102100020948 Growth hormone receptor Human genes 0.000 description 1
- FRJIAZKQGSCKPQ-FSPLSTOPSA-N His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 FRJIAZKQGSCKPQ-FSPLSTOPSA-N 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- WYWBYSPRCFADBM-GARJFASQSA-N His-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O WYWBYSPRCFADBM-GARJFASQSA-N 0.000 description 1
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 1
- 101000718019 Homo sapiens A-kinase anchor protein 17A Proteins 0.000 description 1
- 101000718437 Homo sapiens ADP/ATP translocase 3 Proteins 0.000 description 1
- 101100168722 Homo sapiens CSF2RA gene Proteins 0.000 description 1
- 101000724418 Homo sapiens Neutral amino acid transporter B(0) Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 1
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 1
- 102000004218 Insulin-Like Growth Factor I Human genes 0.000 description 1
- 102000004374 Insulin-like growth factor binding protein 3 Human genes 0.000 description 1
- 108090000965 Insulin-like growth factor binding protein 3 Proteins 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 1
- 208000035752 Live birth Diseases 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 1
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 1
- DYTWOWJWJCBFLE-IHRRRGAJSA-N Met-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CNC=N1 DYTWOWJWJCBFLE-IHRRRGAJSA-N 0.000 description 1
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 1
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- PKFBJSDMCRJYDC-GEZSXCAASA-N N-acetyl-s-geranylgeranyl-l-cysteine Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\CSC[C@@H](C(O)=O)NC(C)=O PKFBJSDMCRJYDC-GEZSXCAASA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 101100404023 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) arg-14 gene Proteins 0.000 description 1
- 102100028267 Neutral amino acid transporter B(0) Human genes 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 208000001132 Osteoporosis Diseases 0.000 description 1
- 102000005877 Peptide Initiation Factors Human genes 0.000 description 1
- 108010044843 Peptide Initiation Factors Proteins 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 206010035148 Plague Diseases 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108020005067 RNA Splice Sites Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 101150039863 Rich gene Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- SBMNPABNWKXNBJ-BQBZGAKWSA-N Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO SBMNPABNWKXNBJ-BQBZGAKWSA-N 0.000 description 1
- 108010068542 Somatotropin Receptors Proteins 0.000 description 1
- 201000008754 Tenosynovial giant cell tumor Diseases 0.000 description 1
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- YDWLCDQXLCILCZ-BWAGICSOSA-N Thr-His-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YDWLCDQXLCILCZ-BWAGICSOSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 1
- DAOREBHZAKCOEN-ULQDDVLXSA-N Tyr-Leu-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O DAOREBHZAKCOEN-ULQDDVLXSA-N 0.000 description 1
- HNERGSKJJZQGEA-JYJNAYRXSA-N Tyr-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HNERGSKJJZQGEA-JYJNAYRXSA-N 0.000 description 1
- KVRLNEILGGVBJX-IHRRRGAJSA-N Val-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CN=CN1 KVRLNEILGGVBJX-IHRRRGAJSA-N 0.000 description 1
- LZRWTJSPTJSWDN-FKBYEOEOSA-N Val-Trp-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LZRWTJSPTJSWDN-FKBYEOEOSA-N 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 208000008919 achondroplasia Diseases 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- 238000012197 amplification kit Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108010068991 arginyl-threonyl-prolyl-prolyl-prolyl-seryl-glycine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007698 birth defect Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000014107 chromosome localization Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000035647 diffuse type tenosynovial giant cell tumor Diseases 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 231100001129 embryonic lethality Toxicity 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 210000000744 eyelid Anatomy 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 102000052178 fibroblast growth factor receptor activity proteins Human genes 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 235000012631 food intake Nutrition 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 230000009643 growth defect Effects 0.000 description 1
- 230000002607 hemopoietic effect Effects 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 102000046157 human CSF2 Human genes 0.000 description 1
- 102000047121 human SHOX Human genes 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- DVCSNHXRZUVYAM-BQBZGAKWSA-N leu-asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- IXHBTMCLRNMKHZ-LBPRGKRZSA-N levobunolol Chemical compound O=C1CCCC2=C1C=CC=C2OC[C@@H](O)CNC(C)(C)C IXHBTMCLRNMKHZ-LBPRGKRZSA-N 0.000 description 1
- 238000002794 lymphocyte assay Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 230000036244 malformation Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 230000002297 mitogenic effect Effects 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000008212 organismal development Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002188 osteogenic effect Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 210000003254 palate Anatomy 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 239000002644 phorbol ester Substances 0.000 description 1
- 229960004265 piperacetazine Drugs 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000026267 regulation of growth Effects 0.000 description 1
- 108091035233 repetitive DNA sequence Proteins 0.000 description 1
- 102000053632 repetitive DNA sequence Human genes 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000017702 response to host Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 229930002330 retinoic acid Natural products 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000011896 sensitive detection Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 208000002918 testicular germ cell tumor Diseases 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 229960001727 tretinoin Drugs 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010068794 tyrosyl-tyrosyl-glutamyl-glutamic acid Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/02—Drugs for disorders of the endocrine system of the hypothalamic hormones, e.g. TRH, GnRH, CRH, GRH, somatostatin
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/06—Drugs for disorders of the endocrine system of the anterior pituitary hormones, e.g. TSH, ACTH, FSH, LH, PRL, GH
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Animal Behavior & Ethology (AREA)
- Biomedical Technology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Diabetes (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pharmacology & Pharmacy (AREA)
- General Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Endocrinology (AREA)
- Hematology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Obesity (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
Molekula izolované nukleové kyseliny obsahující nukleotidovou sekvenci SHOX ET93 - SEQ ID NO: 2 a nukleotidovou sekvenci vybranou ze skupiny sestávající z SHOX G310 - SEQ ID NO: 3, SHOX ET45 - SEQ IDNO: 4, SHOX G108 - SEQ ID NO: 5, SHOX Va - SEQ IDNO: 6 a SHOX Vb - SEQ ID NO: 7. cDNA odpovídajícítomuto genu se muže použít jako diagnostický nástroj pri další charakterizaci molekulární podstaty fenotypu s malou výškou postavy. Identifikace genového produktu genu poskytuje nový zpusob vývoje dokonalejší lécby malé výšky postavy.
Description
Molekula izolované nukleové kyseliny kódující polypeptidy a způsob jejího použití
Oblast techniky
Vynález se týká izolace, identifikace a charakterizace nově identifikovaných lidských genů, které odpovídají za vady lidského růstu, zvláště za malou výšku postavy nebo Turnérův syndrom. Dále se vynález týká diagnózy s terapie takových vad. Izolovaná genomová DNA nebo její fragmenty se mohou použít pro farmaceutické účely nebo jako diagnostické nástroje nebo činidla pro idenio tifikaci nebo charakterizaci genetických defektů, které se podílejí na uvedených vadách. Vynález dále popisuje lidské růstové proteiny (transkripční faktory A, B a C), které se exprimují po transkripci uvedené DNA na RNA nebo mRNA a které se mohou použít při terapii vad spojených s mutacemi v uvedených genech. Dále se popisují vhodné sekvence cDNA, které se mohou použít při přípravě rekombinantních proteinů vhodných pro léčbu takových vad. Předmětem 15 vynálezu jsou dále plazmidové vektory vhodné pro expresi DNA těchto genů a vhodné buňky, které obsahují takovou DNA. Dále se popisuji metody genetické léčby uvedených vad v oboru molekulární medicíny za použití expresního plazmidu připraveného inkorporací DNA downstream expresivního promotoru, který umožňuje expresi v savčí hostitelské buňce.
Dosavadní stav techniky
Růst je základní aspekt vývoje organizmu. Je regulovaný vysoce organizovaným a komplexním systémem. Výška postavy je multifaktorový rys, který je ovlivněn faktory prostředí a genetický25 mi faktory. Vývojové malformace, které zahrnují výšku postavy, jsou běžným jevem u lidí všech ras. V případě lidí je četnost výskytu 3 ze 100 a retardace růstu vede k malé velikosti postavy, za což ve většině případů odpovídají vrozené vady.
Turnérův syndrom je běžná chromozomální vada (Rosenfeld RG, Tesch L-G, Rodriguez-Rigau 30 LJ, McCauley E, Albertsson-Wikland K. Ach R, Cara J, Conte F, Halí, JG, Lippe G, Nagel TC,
Neely EK, Page DC, Ranke M, Saenger P, Watkins JM, Wilson DM (1994): Recommendation for diagnosis, treatment, and management of individuals with Turner syndrom. The Endocrinologist 4(5): 351-358) s četností výskytu 1:2 50 u živě narozených žen. Odhaduje se, že 1 až 2 % oplodnění u lidí má karyotyp 45,X a že až 99 % takových plodů nepřichází na svět v termínu 35 (Hal J.G., Gilchrist D.M. (1990): Turner syndrome and its variants. Pedriatr. Clin. North Am. 37:
obinson A (1990): Demography and prevalence of Turner syndrome. In: Turner Syndrome., edited by Rosenfield R.G., Grumbach M.NM., pp. 93-100, New York, Marcel Dekker). (J lidí s Turnérovým syndromem (nebo s Ullrich-Tumerovým syndromem) existuje podstatná klinická variabilita fenotypu (Ullrich, 1930; Turner, 1938). Malá výška postavy je konsistentní nález 40 a spolu s gonádovou dysgenezí se považuje za vedoucí symptom uvedených vad. Tumerový syndrom je skutečná muitifaktorová vada. Uvažuje se, že za embryonální letalitu, malou výšku postavy, gonodovou dysgenezí a charakteristické somatické rysy odpovídají monosomy genů, které jsou běžné u X a Y chromozomů. Ukazuje se, že pro normální vývoj člověka jsou nutné diploidy těchto homologních genů X-Y. Očekává se, že Turnérovy geny (nebo anti-Tumerovy 45 geny) se u žen exprimují jak z aktivního, tak z neaktivního chromozomu X nebo chromozomu Y, aby se zajistila správná dávka genového produktu. Haplo-nedostatečnost (nedostatečnost způsobená pouze jednou aktivní kopií) naznačuje mechanizmus vedoucí k onemocnění.
Dosud se objasnila řada mechanizmů, které vedou k malé výšce postavy. Nedostatečnost růsto50 vého hormonu a receptorů růstového hormonu, stejně jako vady skeletu se popisují jako příklady fenotypu s malou výškou postavy (Martial et al., (1979; Phillips et al., 1981; Leung et al., 1987; Goddard et al., 1995). Identifikovaly se mutace ve třech genech, které kódují receptor lidského fibroblastového růstového faktoru (FGFR 1-3) a způsobují řadu vad skeletu. Tylo vady zahrnují většinu forem trpasličího vzrůstu, achondroplázie (Shiang et al., 1994; Rousseau et al., 1994; 55 Muenke and Schell, 1995). Dobře známá a častá chromozomální vada (objevuje se u jedné z
- 1 CZ 297640 B6
2500 žen) Turnérův syndrom (45,X) je také spojena s malou výškou postavy. Všechny tyto důvody však odpovídají pouze za malou část pacientů s malou výškou postavy. Většina případů zatím zůstává nevysvětlena.
Věří se, že chromozomy X a Y nesou geny, které ovlivňují výšku postavy (Ogata T, Tyler-Smith C, Purvis-Smith S, Turner G. (1993): Chromosomal localisation of a gene(s) for Turner stigmata on Yp. J. Med. Genet. 30: 918-922). To se může u pacientů s abnormalitami pohlavních chromozomů odvodit ze vztahu genotyp-fenotyp. Cytogenetické studie dokazují, že delece konců krátkých ramen buď chromozomu X, nebo Y vedou u některých jedinců k malé výšce postavy (Zuffardi et al., 1982); Curry et al., 1984). Uvádí se více než 20 uspořádání chromozomu, které se spojují s delecemi konců chromozomu Xp a Yp a které nesou gen(y) odpovědné za malou výšku postavy, s pseudoautozomální oblastí (PARI) (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P„ Zuffardi O., Guilo S., Camerino G., (1989): Contiquous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome. Proč. Nati. Acad. Sci USA 86: 10001 — 10005.; Schaefer L., Ferrero G.B., Grillo A., Bassi M.T. Roth E.J. Wapenaar M.C., Van Ommen -J.B., Mohandas T.K., Rocchi M.. Zoghbi H.Y. Ballabio A. (1993): A high resolution deletion map of human chromosome Xp22. Nátuře genetics 4: 272-279). Pozice těchto genů se zúžila na distální DNA o velikosti 700 kb oblasti PARI, kterou lemuje markér DXYS15 (Ogata T., Goodfellow, P., Petit C., Aya M., Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal do DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834; Ogata T., Matsuo N. (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629).
Regulace růstu u savců je organizována jako komplexní systém. Je možné, že vysoce organizovaným způsobem spolu reaguje více genů (proteinů), které podporují růst. Jeden z těchto genů, který odpovídá za výšku postavy, se zmapoval až do pseudoautozomální oblasti PARI (Ballabio A., Bardoni A., Carrozzo R., Andria G., Bick D., Campbell L., Hamel B., Ferguson-Smith M.A., Gimelli G., Fraccaro M., Maraschio P., Zuffardi O., Guilo S., Camerio G., (1989): Contiguous gene syndromes due to deletions in the distal short arm of the arm of the human X chromosome. Proč. Natí. Acad. Sci USA 86: 10001-10005), což je oblast, o které se ví, že je volně zaměnitelná mezi chromozomy X a Y (Rappold G.A. (1993): The pseudoautosomal region of the human sex chromosomes. Hum. Genet. 92: 315-324). Celá oblast RAPI je přibližně 2700 kb velká.
U pacientů s delecí se definovala kritická oblast ovlivňující výšku postavy. K malé výšce postavy dochází v případě, když se deletuje celá oblast o velikosti 700 kb nebo když je specifický gen v této kritické oblasti přítomen v haploidním stavu nebo když je přerušen nebo mutován (jako je případ idiotypické malé výšky postavy nebo Turnérův syndrom). Frekvence výskytu Turnérova syndromu ve světě je jedna z 2500 žen; četnost výskytu tohoto druhu idiopatické malé výšky postavy se odhaduje na 1 případ ze 4000 až 5000 osob. Ženám s Turnérovým syndromem a některým jednotlivcům s malou výškou postavy se obvykle po několik let až po několik desítek let aplikuje růstový hormon (GH), ačkoli je známo, že jejich hladina růstového hormonu v těle je normální a nedostatečnost GH zde není problémem. Léčba takových pacientů je velmi nákladná (odhaduje se přibližně na 30 000 USD ročně). Proto je nutné získat způsob rozlišení pacientů malého vzrůstu, kteří mají genetický defekt a pacienti, který nevykazují genetický defekt uvedeného genu. U pacientů s genetickým defektem tohoto genu - buď s úplnou delecí genu (jako je v případě Turnérova syndromu), nebo s bodovou mutací (jako je tomu u idiopatické malé výšky postavy)-je možné aplikovat alternativní léčbu bez lidského růstového hormonu.
Korelace genotyp/fenotyp podporují existenci růstového genu v proximální části Yq a v distální části Yp. Malá výška postavy se také objevuje u jedinců s terminálními delecemi Xp. Proběhlo rozsáhlé vyhledávání pacientů s částečnými monosomiemi pseudoautozomální oblasti. Na základě korelací genotyp-fenotyp se stanovila minimální běžná delece oblasti DNA o velikosti 700 kb (Ogata T., Matsuo N., (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of ciinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P., Petit C., Aya M., Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995); Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834). Zjistilo se, že uvedená oblast leží mezi genetickými markéry DXYS20 (3cosPP) a DXYS15 (113D) a u všech genů, které aspirují na řízení růstu, a leží v oblasti PARI (například receptor hemopoietického růstového faktoru; CSF2RA) (Gough N.M., Gearing D.P., Nicola N.A., Baker E., Pritchard M., Callen D.F., Sutherland G.R. (1990). Localization of the human GM-CSF receptor gene to the X-Aby pseudoautosomal region. Nátuře 345: 734736), se odstranily na základě jejich fyzikální pozice (Rappold G. A., Wilson T.A., Henke A., Gough N.M. (1992): Arrangment and localization of the human GM-CSF receptor achain gene CSF2RA within the X-Aby pseudoautosomal region. Genomics 14: 455-461). Geny se nacházely v deleční oblasti o velikosti 700 kb PARI oblasti o velikosti 2700 kb. Nedávno se objevily u jednotlivců s malým vzrůstem delece pseudoautozomální oblasti (PARI) pohlavních chromozomů a následně staké definovala minimální běžný oblast delece o velikosti 700 kb. Na základě analýzy DNA Southemovým přenosem u pacientů AK a SS za použití odlišných pseudoautozomálních markérů se identifikovala Xp terminální delece přibližně 700 kb od DXYS15 (113D) (Ogata T., Matsuo N., (1995): Turner syndrome and female sex chromosome aberrations: deduction of the principle factors involved in the development of ciinical features. Hum. Genet. 95: 607-629; Ogata T., Goodfellow P., Petit C., Aya M. Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal to DXYS15: logalization of a growth gene(s) in the pseudoautosomoal region. J. Med. Genet. 29: 455-459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S., (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s). J. Med. Genet. 32: 831-834).
Podstata vynálezu
Vynález se týká molekuly izolované nukleové kyseliny obsahující nukleotidovou sekvenci SHOX ET93 - SEQ ID NO: 2 a nukleotidovou sekvenci vybranou ze skupiny sestávající z SHOX G310 - SEQ ID NO: 3, SHOX ET45 - SEQ ID NO: 4, SHOX G108 - SEQ ID NO: 5, SHOX Va - SEQ ID NO: 6 a SHOX Vb - SEQ ID NO: 7.
Oblast genu odpovídající za malý vzrůst postavy se identifikovala jako oblast o velikosti přibližně 500 kb, s výhodou o velikosti přibližně 170 kb v PARI oblasti chromozomů X a Y. V této oblasti se identifikovaly tři geny jako kandidáti, kteří odpovídají za malý vzrůst. Tyto geny se označily SHOX (také jako SHOX93 nebo HOX93) (SHOX znamená gen obsahující homeobox malého vzrůstu), pET92 a SHOT (gen nesoucí homeobox podobný SHOX na chromozomu 3). Zvláště významný je gen SHOX, který má dvě oddělená místa sestřihu, což vede ke vzniku dvou variací (SHOXa a b). Během předchozích výzkumů se analyzovala podstatná část nukleotidové sekvence genu malého vzrůstu (SEQ ID NO: 8). Mohou se předpovědět a identifikovat exony nebo jejich části (například exon I [G310J; exon II [ET93J; exon IV [G108]; pET92). Získané informace o sekvenci se pak mohou použít pro navržení vhodných primerů nebo nukleotidových sond, které hybridizují s částmi genu SHOX nebo jeho fragmenty. Gen SHOX se pak může izolovat běžnými metodami. Na základě další analýzy sekvence DNA genů zodpovědných za malý vzrůst se izoluje nukleotidová sekvence exonu I a V (uvedeno na obrázku č. 1 až 2). Gen SHOX obsahuje homeobox (SEQ ID NO: 1) o velikosti přibližně 180 bp (obrázek č. 2 a obrázek č. 3). Začíná nukleotid, který kóduje aminokyselinu v pozici 117 (Q), končí nukleotidem kódujícím
- J CZ 297640 B6 aminokyselinu v pozici 176 (E), to znamená od CAG (440) do GAG (619). U pacientů z Německa (Al) s malou výškou postavy a u pacientů Japonska, kde se testovalo 250 jednotlivců s idiopatickým malým vzrůstem, se identifikoval homeobox jako sekvence homeobox-pEP93 (SHOX) a zjistily se dvě bodové mutace. Obě bodové mutace se našly ve stejné pozici a vedou ke zkrácení proteinu v pozici aminokyseliny 195. To naznačuje, že zde může existovat tzv. horké místo. Na základě skutečnosti, že obě mutace, které vedou ke zkrácení proteinu, se vyskytují ve stejné pozici, je pravděpodobné, že putativní horké místo rekombinace existuje v exonu 4(G108). Primery specifické pro exon jsou například GCA CAG CCA ACC ACC TAG (forward) nebo TGG AA GGC ATG ATC CGT AAG (reverzní). Shora uvedený nový gen obsahující homeobox, SHOX, který se nachází v intervalu 170 kb, je alternativně sestřižen a dává vznik dvěma proteinům s odlišnými funkcemi. Při demonstraci skutečnosti, že malá výška postavy je způsobena mutacemi v SHOX, se použila analýza mutace a sekvenování DNA.
Identifikace a klonování kritické oblasti malého vzrůstu podle vynálezu se uskutečnila následujícím způsobem. U 15 jednotlivců s částečnými monosomy v pseudoautozomální oblasti (PARI) se provedla rozsáhlá fyzikální mapovací studie. Korelací výšky těchto jedinců s delečními body se definovala kritická oblast malého vzrůstu (SS) o přibližné velikosti 700 kb. tato oblast se následně klonovala jako překiývací se kosmidový kontig za použití kvasinkových umělých chromozomů (YAC) z PARI (Ried K., Mertz A., Nagaraja R., Trusnich M. Riley J., Anand R., Page D., Lehrach H., Elloiso J., Rappold G.A. (1995): Characterization of a yeast artificial chromosome conting spanning the pseudoautosomal region. Genomics 29: 787-792) a pomocí metody „chodícího kosmidu“ (cosmid walking). Za účelem vyhledání genů odpovědných za SS v tomto intervalu se na přibližně 600 kb velkou oblast mezi distálním koncem kosmidu 56G10 a proximálním koncem 51 Dl 1 aplikovala řada metod. Za použití sekvence cDNA, trapování exonu a GpG klonování se identifikovaly dva nové geny.
Pozice kritického intervalu malého vzrůstu se zúžila na menší interval DNA o velikosti 170 kb tím, že se charakterizovaly tři další jedinci (GA, AT a RY), kteří vykazují malý vzrůst postavy. Za účelem přesného stanovení pozice bodu přerušení u těchto jedinců se provedla na chromozomech v metafázi za použité kosmidů vhodných pro kontig fluorescenční hybridizace in šitu (F1SH). Pacient GA, který vykazuje terminální deleci a normální výšku vzrůstu, definuje distální hranici kritické oblasti (bod přerušení se nachází na kosmidu 110E3) a pacient AT vykazují inverzi X chromozomu a normální výšku vzrůstu definoval proximální hranici (bod přerušení se nachází na kosmidu 34F5). Bod přerušení chromozomu Y u pacienta RY, který vykazuje terminální deleci a malý vzrůst, se také nachází na kosmidu 34F5, což naznačuje, že tato oblast obsahuje sekvence s predispozicí k přestavění chromozomů.
Celá oblast ohraničená Xp/Yp se klonovala jako sada přesahujících kosmidů. Ke studiu šesti pacientů s přestavěným chromozomem X, kdy tři z nich jsou normálního vzrůstu a tři mají malou výšku vzrůstu, se použila fluorescenční hybridizace in sítu (FISH) s kosmidy s této oblasti. Korelace genotypu fenotypu zúžily kritický interval pro malý vzrůst na 270 kb DNA nebo na dokonce menší interval, jako je 170 kb, který obsahuje gen nebo geny důležité pro růst člověka. Tento interval pokrývá minimálně šest až osm kosmidů a jsou nyní dostupné pro hybridizaci FISH interfáze a metafáze, která je dostupný nástroj pro diagnózu pacientů s idiopatickým malým vzrůstem postavy.
Skutečnost, že cílový gen vede k vadám růstu u lidí (např. oblast malého vzrůstu), nebyla dříve známá. Biologická a klinická asociace pacientů s uvedenou deleci vysvětluje funkci uvedeného genu. V této studii se použila fluorescenční in šitu hybridizace (FISH) za účelem testování metafáze a interfáze jádra lymfocyty u šesti pacientů. Cílem bylo testovat u všech přesahujících kosmidů jejich použitelnost jako sondy pro FISH hybridizaci a stanovit oblasti porušení genu u všech čtyř případů, a tímto způsobem stanovit minimální kritickou oblast genu malého vzrůstu.
Duplikace nebo delece genomové DNA se může uskutečnit kvantitativní PCR nebo odhadem dávky na Southernových blotech nebo použitím RFLP.
-4CZ 297640 B6
Zvláště vhodnou metodou pro přesné rozlišení mezi jednou a zdvojenou dávkou markérů je hybridizace FISH, přičemž její klinická aplikace je současnosti rutinní záležitostí. Zatímco při FISH hybridizaci interfáze se může zhodnotit absence nebo přítomnost molekulového markéru, hybridizace FISH metafáze chromozomů může poskytnou třemi-kvantitativní stanovení delece uvnitř kosmidu. Uvedeným způsobem se může stanovit delece o velikosti přibližně 10 kb (což odpovídá 25 % redukci signálu). Zvláště je důležité, že prakticky všechny geny onemocnění na lidském X chromosomu jsou spojeny s menšími a většími delecemi v rozmezí od několika kilobazí do několika megabází DNA (Nelson, D. L., Ballabio A., Cremers F., Monaco A.P., Schlessinger D., (1995). -Report of the sixth intemational workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342).
Vynález dále popisuje sekvence DNA nebo jejich fragmenty, které jsou části genů odpovědných za lidských růst (nebo v případě defektu v těchto genech odpovídají za malý vzrůst). Identifikovaly se tři geny odpovědné za lidský růst. Jsou to SHOX, pET92 a SHOT). Sekvence DNA nebo fragmenty těchto genů stejně jako sekvence DNA těchto genů v plné délce se mohou transformovat do vhodného vektoru a mohou se dále transfekovat do buněk. Když se takové vektory zavedou do buněk vhodným způsobem, jako jsou přítomny u zdravých jedinců, je možné uvedeným způsobem léčit onemocnění spojené s malým vzrůstem, to znamená například Turnérův syndrom. Onemocnění spojené s malým vzrůstem se může léčit odstraněním nebo mutací růstových genů odpovědných za malý vzrůst. Je také možné stimulovat geny, které kompenzují působení genů odpovědných za malou výšku postavy, to znamená inzercí sekvencí DNA před, za nebo do růstových genů/genů odpovídajících za malou výšku za účelem zvýšit expresi zdravých alel. Uvedenými modifikacemi genů se růstové geny/geny odpovídajících za malou výšku aktivují nebo deaktivují. To se může uskutečnit inzercí sekvencí DNA do vhodných míst, které jsou v genu nebo blízko genu umístěny tak, že tyto inzerované sekvence DNA interferují s růstovými geny/geny odpovídajícími za malou výšku a tak aktivují nebo brání jejich transkripci. Je také možné před růstové geny začlenit regulační element (například promotorovou sekvenci), aby se geny stimulovaly a staly se aktivní. Dále je možné stimulovat promotorovou sekvenci za účelem nadměrné exprese - v případě Turnérova syndromu-správně fungujících alel a tak kompenzovat chybějící alely. Modifikace genů se může obecně dosáhnout inzerci exogenních sekvencí DNA do růstového genu/genu odpovídajícího za malý vzrůst prostřednictvím homologní rekombinace.
Sekvence DNA podle vynálezu se mohou také použít k transformaci uvedených sekvencí do zvířat, jako jsou savci, prostřednictvím vhodného vektorového systému. Tyto transgenní zvířata se pak mohou použít pro zkoumání in vivo při testování a identifikaci farmaceutických činidel, která jsou použitelná při léčbě onemocnění spojených s malým vzrůstem. Jestliže zvířata pozitivně reagují na aplikaci sloučeniny nebo činidla, pak uvedené činidlo nebo sloučenina nebo jejich deriváty jsou vhodná jako farmaceutická činidla. Sekvence DNA podle vynálezu se mohou také využívat v genetických experimentech za účelem nalezení způsobů, jak kompenzovat ztráty genů odpovědných za malý vzrůst postavy.
Dále vynález popisuje sekvence DNA, které se mohou využít při transformaci buněk. Tyto buňky se mohou použít k identifikaci farmaceutických činidel, jenž se mohou použít při léčbě onemocnění spojených s malou výškou postavy nebo k testování takových látek nebo knihovny látek. Ve vhodném testovacím systému se mohou identifikovat změny fenotypu nebo změny expresivniho paternu těchto buněk, což umožňuje identifikaci činidla vhodného pro přípravu léků.
Sekvence DNA podle vynálezu se také mohou použít při tvorbě vhodných primerů, které za přísných podmínek hybridizují se segmenty genů odpovídajících za malý vzrůst nebo s jejich fragmenty. Mohou se konstruovat vhodné sekvence primerů, které se používají při diagnóze lidí, které mají genetický defekt způsobující malý vzrůst. Proto je nutné poznamenat, že dvě mutace nalezené v identické pozici naznačují, že existuje mutační horké místo.
-5 CZ 297640 B6
Sekvence DNA podle vynálezu zahrnují i takové sekvence, které se degenerovaly na specifické sekvence na základě degenerace genetického kódu nebo které hybridizují za přísných podmínek se specificky danými sekvencemi.
Vynález zdůrazňuje zvláště následující rysy:
a) Molekulu izolované nukleotidové kyseliny kódující polypeptidy obsahující oblast homeoboxu šedesáti aminokyselin, které mají aminokyselinovou sekvenci SEQ ID NO: 1 a vykazují regulující aktivitu lidského růstu.
b) Molekulu izolované DNA obsahující nukleotidovou sekvenci, jak je uvedeno na obrázku č. 2, 3 nebo 4 a zvláště, jak je uvedeno v SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15:
c) Molekuly DNA podle odstavce c) jsou schopny hybridizovat s molekulami DNA podle odst. 2 při teplotě 60 až 70 °C a v přítomnosti roztoku standardního pufru.
e) Molekuly DNA obsahují nukleotidové sekvence, které vykazují 70 % nebo vyšší homologii s nukleotidovou sekvencí SEQ ID NO: 10; SEQ ID NO: 12 nebo SEQ ID NO: 15 a kódují polypeptid, který má regulační aktivitu lidského růstu.
f) Lidské růstové proteiny mají aminokyselinovou sekvenci SEQ ID NO: 11,13 nebo 16 nebo jejich funkční fragment.
g) Protilátky získané při imunizaci zvířat lidskými růstovými proteiny podle odst. f) nebo jejich antigenní varianty.
h) Farmaceutické kompozice obsahující lidské růstové proteiny nebo jejich funkční fragmenty pro léčbu vad způsobených genetickými mutacemi lidského růstového genu.
i) Způsob testování látky účinné při léčbě vad zmiňovaných shora v textu podle odst. h) zahrnující detekci mediátorové RNA hybridizující s libovolnými molekulami DNA popsanými v odstavcích a) až e), přičemž se měří zesílení exprese molekuly DNA jako odezvy na léčbu hostitelské buňky substitucí.
j) Expresivní vektor nebo plazmid obsahující libovolné molekuly nukleové kyseliny popsané v odstavcích a) až e), které umožňují, aby molekuly DNA se exprimovaly v savčích buňkách.
k) Způsob stanovení genu nebo genů v biologických vzorcích tkání nebo tělních tekutin odpovědných za malý vzrůst.
V případě metody popsané shora v textu v odstavci k) se pro detekci specifických nukleotidových sekvencí s výhodou používají nukleotidové amplifikační metody PCR, které jsou dobře známy v oboru a popisují se například v publikacích Mullis et al., 1986, Cold Spring Harbor Symposium Quant. Biol. 51, 263-273 a Saiki et al., Science 239, 487^491. Stanovené nukleotidové sekvence odpovídají za malý vzrůst jsou hlavně ty, které jsou reprezentovány sekvencemi SEQ ID NO: 2 až SEQ ID NO: 7.
V principu všech oligonukleotidové primery a sondy vhodné pro amplifikaci a detekci genetického defektu, který odpovídá za poškození lidského růstu v biologických vzorcích, jsou vhodné pro amplifikaci cílové sekvence spojované s malým vzrůstem. V tabulce č. 1 jsou uvedeny vhodný pár primerů specifický pro exon podle vynálezu. Následuje vhodná detekce, přičemž se například provádí radioaktivní nebo jiné značení.
-6CZ 297640 B6
Tabulka č. 1
exon | Sense primer | Antisense primer | Produkt (bp) | Ta (’C) |
5'-I(G310) | SPI | ASP1 | 194 | 58 |
3'-I (G310) | SP2 | ASP2 | 295 | 58 |
II(ET93) | SP3 | ASP3 | 262 | 76/72/68 |
III(ET45) | SP4 | ASP4 | 120 | 65 |
IV(G108) | SP5 | ASP5 | 154 | 62 |
Va(SHOXa) | SP6 | ASP6 | 265 | 61 |
Vysvětlení zkratek u primerů:
SP 1: ATTTCCAATGGAAAGGCGTAAATAAC
SP 2: ACGGCTTTTGTATCCAAGTCTTTTG
SP 3: GCCCTGTGCCCTCCGCTCCC
SP 4: GGCTCTTCACATCTCTCTCTGCTTC
SP 5: CCACACATGACACCTGCTCCCTTTG
SP 6: CCCGCAGGTCCAGGCTAGCTG
ASP1: CGCCTCCGCCGTTACCGTCCTTG
ASP2: CCCTGGAGCCGGCGCGCAAAG
ASP3: CCCCGCCCCCGCCCCCGG
ASP4: CTTCAGGTCCCCCCAGTCCCG
ASP5: CTAGGGATCTTCAGAGGAAGAAAAAG
ASP6: GCTGCGCGGCGGGTCAGAGCCCCAG
Jako targetová DNA může také sloužit jednořetězcová RNA. Metody zpětné transkribce RNA a cDNA jsou dobře známy v oboru a popisuje je Sambrook et al., Molecular Cloning“ A Laboratory Manual, New York, Cold Spring Harbor Laboratory 1989. V jiném případě preferované metody reverzní transkripce využívají termostabilní DNA polymerázy, které vykazují RT aktivitu.
Shora popsaná metoda se může použít při selekci těch osob ze skupiny lidí, jejichž malý vzrůst postavy se spojuje s genetickým defektem, což umožňuje specifičtější léčbu.
Vynález dále popisuje transkripční faktory A, B a C, které se mohou použít jako farmaceutická činidla. Tyto transkripční faktory iniciují stále neznámou kaskádu biologických účinků na molekulární úrovni, které se spojují s lidským růstem. Tyto proteiny nebo jejich funkční fragmenty mají mitogenní účinek na různé buňky. Zvláště mají osteogenní účinek. Mohou se použít při léčbě onemocnění kostí, jako je například osteoporóza, a zvláště všech onemocnění spojených s poškozením regulace vápníku v kostech.
Termín „izolovaný“ znamená původní derivaci molekuly DNA klonováním. Vynález se týká jak přirozeně se vyskytujících sekvencí tak i synteticky připravených.
Molekuly DNA podle vynálezu se mohou použít ve formách genové terapie, která zahrnuje 5 použití expresivních plazmidů připravených inkorporací vhodné sekvence DNA podle vynálezu downstream od expresivního promotoru, který ovlivňuje expresi v savčí hostitelské buňce. Vhodné hostitelské buňky jsou prokaryontní a eukaryontní buňky. Prokaryontní hostitelské buňky jsou například E. coli, Bacillus subtilis a podobně. Prostřednictvím transfekce hostitelských buněk replikony, které pocházejí z druhů adaptovatelných na hostitele, to jsou plazmidové vektory obsa10 hující počáteční bod replikace a regulační sekvence, se mohou uvedené hostitelské buňky transfekovat požadovaným genem nebo cDNA. Takové vektory jsou s výhodou ty, které mají sekvenci, jenž vybaví transfekované buňky vlastnostmi (fenotypem), na jejichž základě se mohou selektovat. V typickém případě se používají jako hostitele bakterie E. coli kmen K12a, z vektorů se používá buď pBK322, nebo plazmidy pUC. Příklady vhodných promotorů v případě hostitelů 15 E. coli jsou promotor trp, lac promotor nebo lpp promotor. Jestliže je to nutné, sekrece expresivního produktu skrz buněčnou membránu se může ovlivnit spojením sekvence DNA kódující sekvenci signálního peptidu s 5' upstream částí genu. Eukaryontní hostitelské buňky zahrnují buňky získané z obratlovců nebo kvasinek, atd. Jako hostitelské buňky obratlovců se mohou použít buď COS (Cell, 1981, 23: 175-182) nebo buňky CHO. Aby došlo k expresi mohou se 20 s výhodou použít promotory, které jsou umístěny 5'upstream genu a mají místa sestřihu RNA, polyadenylační a transkripční terminační sekvence.
Při léčbě vad způsobených mutacemi lidských růstových genů se mohou použít jako činidla podporující růst transkripční faktory A, Ba C podle vynálezu. Na základě polymorfizmu, který je 25 znám u eukaryontních genů, se může substituovat jedna nebo více aminokyselin. Jedna nebo více aminokyselin v polypeptidech může být deletována nebo začleněna do jednoho nebo více míst aminokyselinové sekvence polypeptidů SEQ ID NO: 11, 13 nebo 16. Takové polypeptidy jsou nazývány ekvivalentní polypeptidy, pokud vykazují biologicky aktivitu nemodifikovaného polypeptidu, jenž zůstává v podstatě beze změn.
Přehled obrázků na výkresech
Na obrázku č. 1 je zobrazena genetická mapa genu SHOX, který zahrnuje pět exonů, které se 35 označily následujícím způsobem: exon I: G310; exon 2: ET93; exon III: ET45; exon IV: G108; a exony Va a Vb, přičemž exony Va a Vb vedou ke vzniku dvou různých míst sestřihu genu SHOX. Exon II a III obsahuje homeobox o velikosti 180 nukleotidů.
Na obrázcích č. 2 a 3 jsou nukleotidy a předpovězené aminokyselinové sekvence SHOX 40 a SHOXb.
SHOXa: Předpovězený začátek translace začíná nukleotidem 92, první v rámci je stop kodon (TGA) - nukleotidy 968 - 970, přičemž vzniká otevřený čtecí rámec velikosti 876 bp, který kóduje předpovězený protein tvořený 292 aminokyselinami (označený jako transkripční faktor A 45 nebo protein SHOX). V rámci je 5' stop kodon v pozici nukleotidu 4, počáteční kodon a předpovězený terminační stop kodon znázorněný tučným písmem. Homeobox je ohraničen boxem (začínající aminokyselinou v pozici 117 (Q) až 176 (E), to v nukleotidové sekvenci odpovídá CAG až GAG). Pozice intronů je označený šipkami. Dva putativní polyadenylační signály v 3' nepředkládané oblasti jsou podtrženy.
SHOXb: Otevřený čtecí rámec o velikosti 876 bp se nachází od A v prvním metioninu nukleotidu 92 do terminačního kodonu v rámci v pozici 767 - 769, což tvoří otevřený čtecí rámec o velikosti 675 bp, který kóduje předpovězený protein o velikosti 225 aminokyselin (transkripční faktor B nebo protein SHOXb). Pozice intronů jsou označeny šipkami. Exony I až IV jsou identické
-8CZ 297640 B6 s SHOXa, exon V je specifický pro SHOXb. Putativní polyadenylační signál v 3' nepředkládané oblasti je podtržen.
Na obrázku č. 4 je nukleotidová sekvence a předpovězená aminokyselinová sekvence SHOT. Předpovězený počátek translace začíná v pozici nukleotidu 43, první v rámci je terminační kodon (TGA) - pozice nukleotidů 613-615, přičemž vzniká otevřený čtecí rámec o velikosti 573 bp, který kóduje předpovězený protein tvořený 190 aminokyselinami (označený jako transkripční faktor C nebo protein SHOT). Homeobox je označen boxem (začínající aminokyselinou v pozici 11 (Q) až 70 (E), to v nukleotidové sekvenci odpovídá CAG až GAG). Pozice intronů je označená šipkami. Dva putativní polyadenylační signály v 3' nepřekládané oblasti jsou podtrženy.
Na obrázku č. 5 je uvedena organizace exon/intron lidského genu SHOX a pozice v nukleotidové sekvenci.
Popis sekvencí SEQ ID:
SEQ ID NO. 1: předkládaná aminokyselinová sekvence oblasti homeobox (180 bp)
SEQ ID NO. 2: exon Π (ET93) genu SHOX
SEQ ID NO. 3: exon 1 (G310) genu SHOX
SEQ ID NO. 4: exon III (ET45) genu SHOX
SEQ ID NO. 5: exon IV (G108) genu SHOX
SEQ ID NO. 6: exon Va genu SHOX
SEQ ID NO. 7: exon Vb genu SHOX
SEQ ID NO. 8: předchozí nukleotidová sekvence genu SHOX
SEQ ID NO. 9: gen ET92
SEQ ID NO. 10: sekvence SHOXa (také uvedeno na obrázku č. 2)
SEQ ID NO. 11: transkripční faktor A (také uvedeno na obrázku č. 2)
SEQ ID NO. 12: sekvence SHOXb (také uvedeno na obrázku č. 3)
SEQ ID NO. 13: transkripční faktor B (také uvedeno na obrázku č. 3)
SEQ ID NO. 14: gen SHOX
SEQ ID NO. 15: sekvence SHOT (také uvedeno na obrázku č. 4)
SEQ ID NO. 16: transkripční faktor C (také uvedeno na obrázku č.4).
Příklady provedení vynálezu
Příklad 1: Pacienti
Všech šest studovaných pacientů vykazuje de novo odchylky na pohlavním chromozomu.
Pacient s označením CC je dívka s karyotypem 45,X/46,X psu dic (X) (Xqter ->Xp22.3:;Xp22.3->Xqter). Při posledním testuji bylo 6 1/2 roku, její výška byl 114 cm (25 až 50 percentil). Výška postavy její matky je 155 cm, otec nebyl zařazen do analýzy. Detailněji je případ popsán v publikaci Henke A., Wapenaar M„ van Ommen G-J. Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear growth. Am. J. Hum. Genet. 49: 811-819.
-9CZ 297640 B6
Pacient s označením GA je dívka s karyotypem 46,X der X (3pter—>3p23::Xp23.3—>Xpter). Při posledním testu jí bylo 17 let a zjistila se normální výška (159 cm). Výška její matky je 160 cm, její otec měří 182 cm. Detailněji se pacientka popisuje v publikaci Kulharya A.S., Roop H., Kukolich M.K., Nachtman R.G., Belmont J. W., Garcia-Heras J., (1995): Mild phenotypic effects of a de novo deletion Xpter—>Xp22.3 a duplication 3pter—>3p23. Am. J. Med. Genet. 56: 16-1.
Pacient s označením SS je dívka s karyotypem 46,X rea (X) (Xpter->Xp26:.Xp22.3->Xp26). V dedenácti letech její výška byla pod 3 percentil křivky růstu japonských dívek.; její předpovězená výška v dospělosti (148,5 cm) leží pod její cílovou výškou (163 cm) a cílové rozmezí je (155 až 191cm). Detailněji je případ popsán v publikaci Ogata T., Goodfellow P., petit C., Aya M., Matsuo N. (1992): Short Statute in a girl with a terminál xp deletion distal to DXYS15: localization of a growth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455—459.
Pacient z označením AK. je dívka s karyotypem 46,X rea (X) (Xqter->Xp22.3::Xp22.3-»Xp21.3). Ve 13-ti letech její výška je pod 2 percentil křivky růstu japonských děvčat; její předpovídaná výška v dospělosti (142,8cm) je pod její cílovou výškou (155,5 cm) a cílové rozmezí je (147,5 až 163,5). Detailněji se případ popisuje v publikaci Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene(s): J. Med. Genet. 32: 831-834. Pacient označený RY má karyotyp 46,X,r(Y)/46,Xdic r(Y)/45,X[95:3:2], jak se zjistilo testem 100 lymfocytů; V 16-ti letech je její výška 148 cm; jeho tři bratři dosáhly normální výšky 170 cm (bratr 1,16 let), 164 (bratr 2, 9 let) a 128 cm (bratr 3, 9 let). Růstová retardace tohoto pacienta je tak silná, že by měla být kompatibilní s další delecí lokusu GCY na Yq.
Pacient s označením AT je chlapec s ataxii a inv(X); v sedmi letech dosahuje normální výšky 116 cm, výška rodičů je 156 cm a 190 cm.
Pacienti pro analýzu mutací
U 250 jednotlivců s idiopatickým malým vzrůstem postavy se vyšetřovaly mutace genu SHOXa. Pacienti se vybraly podle následujících kriterií: výška chronologického věku byla pod 3 centil národního výškového standardu mínus 2 standardní odchylky (SDS); nebylo známé žádné kauzativní onemocnění zvláště: normální váha (délka) v prenatálním stavu, normální tělesné proporce, žádné chronické onemocnění, normální příjem potravy, žádné psychiatrické obtíže, žádné dysplázie skeletu, žádná nedostatečnost růstového hormonu nebo hormonů štítné žlázy.
Rodina A:
Případy 1 a 2 jsou děti malého vzrůstu německé nepokrevné rodiny. Chlapec (případ 1) se narodil v 38 týdnu těhotenství císařským řezem. Porodní váha je 2 660 g, porodní délka byla 47 cm. Vyvíjel se normálně s výjimkou subnormálního růstu. Při schůzce ve věku 6,4 roku byl proporcionálně malý (106,8 cm, - 2, SDS) a obézní 22,7 kg) ale jinak normální. Stáří jeho kostí nebylo retardované (odpovídalo 6 letům) a dysplázie kostí je vyloučila na základě vyšetření X-paprsky. Nepravděpodobná je nedostatečnost v hladinách IGF-1 a IGFBP-3 stejně jako parametry štítné žlázy, které se v séru prokazují GH nebo nedostatečnost hormonů štítné žlázy. Dívka (případ 2) se narodila v termínu císařským řezem. Porodní váha byla 2 920 g, porodní délka byla 47 cm. Její vývoj byl normální, ale ve 12 měsících se projevil její malý růst (délka 67 cm, -3,0 SDS). Ve čtyřech letech měřila 89,6 cm (-3,6 SDS). Neprojevily se žádné dysmorfní ani dysproporcionální rysy. Nebyla obézní (13 kg). Stáří jejich kostí odpovídalo 3,5 letů a vyloučila se dysplázie kostí. Hormonální parametry byly normální. Je zajímavé poznávat, že růst děvčata i chlapce odpovídá 50 percentil růstové křivky žen s Turnérovým syndromem. Matka je nejmenší z rodiny a má
- 10CZ 297640 B6 střední rhizomelickou disproperci (142,3 cm, -3,8 SDS). Jedna ze sester (150 cm, -2,5 SDS) a babička z matčiny strany (153 cm, -2,0 SDS) jsou malé postavy, aniž mají nějakou disproporci. Druhá sestra má normální výšku postavy 167 cm, +0,4 SDS). Výška otce je 166 cm (-1,8 cm) a výška dědečka z matčiny strany je 165 cm (-1,9 SDS). Další pacient je japonského původu a vykazuje identické mutace.
Příklad 2: Identifikace genu odpovídajícího za malý vzrůst
A. Hybridizace in šitu
a) Fluorescenční hybridizace in silu
Provedla se fluorescenční hybridizace in šitu (FISH) za použití kosmidů, které leží v Xp/Yp pseudoautozomální oblasti (PARI). Uskutečnily se FISH studie za použití kosmidů 64/75cos (LLNlcl 10H032), E22COS(2e2). Fl/14cos (110A7), Ml/70cos (110E3), P99F2cos(43C11), P99cos (LLNLcl 10P2410), B6cosb (lCRFcl04H0425), F20cos (34F5), F21cos (ICRFcl04G0411), F3cos2 (9E3), F3cosl (11E6), P117cos (29B11), P6cosl(ICRFcl04P0117), P6cos2 (LLNLcl 10E0625) a E4cos (15G7) podle metody popsané v publikacích (Lichter P., Cremer T., Human Cytogenetics: A. practical Approach, IRL Press 1992, Oxford, New York, Tokyo) Jeden mikrogram kosmidového klonu se značil biotinem a hybridizoval se s metafází lidských chromozomů za podmínek, které redukují signál z repetivních sekvencí DNA. Detekce hybridizačního signálu probíhá prostřednictvím avidinu spojeného s FITC. Zviditelnění F1TC proběhlo za použití chlazeného zdvojeného kamerového systému (Photometrics, Tucson, AZ).
b) Fyzikální mapování
Kosmidy se získaly z Lawrence Livermore National Laboratory X- a Y-chromozomové knihovny a z X-chromozomové knihovny instituce Imperiál Cancer Research Fund London (nyní Max Plaňek Institute for Molecular Genetics Berlin). Za použití kosmidů distálních kDXYS15, jmenovitě E4cos, P6cos2, P6cosl, P117cos a P3cosl lze stanovit, že jsou stále přítomny dvě kopie E4cos, p6cos2, P6cosl a jedna kopie PÍ I7cos a F3cosl. Body porušení na mapě kosmidů P6cosl obou pacientů AK a SS jsou od sebe v maximální vzdálenosti lOkb. Zjistilo se, že abnormální X-chromozomy AK a SS měly deletováno přibližně 630 kb DNA.
Další kosmidy se získaly zZCRF X-chromozomové specifické kosmidové knihovny (ICRFclO4), z Lawrence Livermore X-chromosomové specifické knihovny (LLCO3'M'), stejně jako ze samostatně připravené kosmidové knihovny zahrnující celý genom. Kosmidy se identifikovaly hybridizací se všemi známými sondami, které mapují uvedenou oblast a použití celé YAC jako sondy. Za účelem ověření překrytů v případech, kde nebylo možno použít známých sond, se použily terminační sondy z několika kosmidů.
c) Hybridizace Southemovým přenosem
Analýza Southemovým přenosem za použití pseudoautozomálních markérů poskytuje důkaz, že bod porušení X-chromozomu u pacienta CC leží mezi DXYS20(3cosPP) a DXYS60(U7A) (Henke A., Wapenaar M., van Ommen G-J., Maraschio P., Camerino O., Rappold G.A. (1991): Deletions within the pseudoautosomal region help map three new markers and indicate role of this region in linear groth. Am. J. Hum. Genet. 49: 811-819). Za účelem potvrdit tento nález a definovat pozici bodu porušení, se použily kosmidy 64/75cos, E22cos, Fl/14cos, Ml/70cos, F2cos, P99F2cos a P99cos jako sondy při hybridizací FISH. Pozice bodu porušení na abnormálním chromozomu X u pacienta CC je mezi kosmidy 64/75cos (jedna kopie) a Fl/14cos (dvě kopie) na E22PAC. Pacient CC s normální výškou následně ztratil přibližně 269 až 290 kb DNA.
- 11 CZ 297640 B6
Hybridizace Southernovým přenosem se provedla za přísných podmínek v Churchově pufru (0,5 M NaPi pH7,2, 7 % SDS, 1 mM EDTA) při teplotě 65 °C a promývání se provedlo 40 mM NaPi, 1 % SDS při teplotě 65 °C.
d) Analýza hybridizací F1SH
Biotinem značená kosmidová DNA (velikost inzertu 32 až 45 kb) nebo kosmidové fragmenty (10 až 16 kb) se hybridizovaly s metafází chromozomů, které pochází ze stimulovaných lymfocytů pacientů, za podmínek, jenž se popisují dříve v textu (Lichter P., Cremer T., Human Cytogenetics: A practical Approach, 1RL Press, 1929, Oxford, New York, Tokyo). Hybridizované sondy se detekovaly prostřednictvím avidinu spojeného s FITC.
e) Amplifikace pCR
Všechny reakce PCR se provedly v objemech 50 ul. V tomto objemu je obsaženo 100 pg až 200 pg templátu, 20 pmol každého primeru, 200 uM dNTP (Pharmacia), 1,5 mM MgC12, 75 mM Tris/Hcl pH9, 20 mM (NH4)2SO4 0,01 % (hmotn./objem) Tween 20 a 2 U Goldstar DNA polymerázy (Eurogentec). Termocykly se provedly na zařízení GeneE (Techne).
f) Amplifikace exonu
Za účelem amplifikace exonu se použily čtyři kosmidové sebrané roztoky, kdy každý zahrnuje čtyři až pět klonů z kosmidových kontigů. Kosmidy v každém kosmidovém roztoku se částečně štěpily restrikčním enzymem Sau3A. Frakce čištěné na genu v rozmezí velikosti 4 až 10 kb se klonovaly do vektoru pSPL3B štěpeného restrikčním enzymem BamHI (Bum et al., 1995) a použily se při experimentech amplifikace exonu, jak se popisuje dříve v textu (Church et al., 1994).
g) Sekvenování genů
Sonifikované fragmenty dvou kosmidů LLOYNCO3'M'15D10 a LLOYNCO3'M34F5 se odděleně sub-klonovaly do vektorů M13mpl8. Z každé kosmidové knihovny se vybralo alespoň 1000 plaků, připravila se DNA Ml3 a sekvenovala se za použití barvivém značených terminátorů, termo-sekvenázy (Amersham) a univerzálního M13-primeru (MWG-BioTech). Gely se provedly na sekvenátoru ABI-377 a data se uspořádala a editovala pomocí programu GAP4 (Staden).
Ze všech šesti pacientů pacient GA měl nejméně charakterizovaný bod porušení chromozomu. Nejvzdálenější markéry, jejichž přítomnost na chromozomu X se testovala dříve, byly DXS1060 a DXS996, mapují přibližně 6 Mb od telomeru (Nelson, D.L., Ballabio A., CremersF., Monaco A.P., Schlessinger D., (1995). -Report of the sixth intemational workshop on the X chromosome mapping. Cytogenet. Cell Genet. 71: 308-342). Testovalo se několik kosmidů, které obsahují odlišné sekvence gen z PARI (MIC2, ANT3, CSF2RA a XE7). Všechny byly přítomny natranslokačním chromozomu. Kosmidy pokrývající kritickou oblast odpovídající za malý vzrůst postavy, například z chromozomu, přičemž translokační bod porušení je na kosmidů Ml/70cos. Kvantitativní srovnání intenzity signálu Ml/70cos mezi normálním a znovu uspořádaným chromozomem X ukazuje, že je deletováno přibližně 70 % kosmidů.
- 12 CZ 297640 B6
Tabulka č. 2
CC | GA | AK | SS | |
64/75cos | - | - | ||
E22cos | - | - | ||
Fl/14cos | + | |||
Ml/70cos | + | ( + ) | ||
F2COS | + | + | ||
P99F2cos | + | + | ||
P99cos | 4 | 4 | ||
B6cos | + |
F20COS | ||||
F21cos | ||||
F3cos2 | ||||
F3cosl | - | - | ||
P117cos | - | |||
P6cosl | + | + | ||
P6cos2 | + | + | ||
E4cos | + | 4 |
Tabulka č. 2: Tabulka udává souhrn dat z hybridizace FISH pro 16 kosmidů testovaných u čtyř pacientů (-) jedna kopie; indikuje, že kosmid je deletován a znovu uspořádán chromozomu X, aleje přítomen na normálním chromozomu X (+) dvě kopie; indikuje, že kosmid je přítomen na znovu uspořádaném i na normálním chromo15 zomu X ((+)) oblast bodu porušení; indikuje, že bod porušení se vyskytuje na kosmidu, jak ukazuje hybridizace FISH.
Molekulová analýza u šesti pacientů se znovu uspořádaným chromozomem X za použití kosmidových fluorescenčně značených kosmidových sond a hybridizace in šitu indikujeme oblast odpovídající za malý vzrůst je zúžena na interval o velikosti 270kb, který je ohraničený bodem porušení pacienta GA zjeho centromerové distální strany a u pacientů AK a SS na jeho centromerové proximální straně.
Korelace genotyp-fenotyp může být informativní a může posloužit k zobrazení kritického intervalu, kteiý odpovídá za malý vzrůst postavy, na lidském chromozomu X a Y. V této studii se použila analýza hybridizací FISH ke studiu rozšíření metafáze a interfáze jádra lymfocytů u pacientů, kteří nejsou delece a translokace na chromozomu X a body porušení v Xp22.3. Tyto 30 body porušení se jeví být přítomny u dvou ze čtyř pacientů (AK a SS), což je způsobeno přítomností sekvencí s predispozicí k znovu uspořádání chromozomu. Zjistil se další pacient s kruho
- 13 CZ 297640 B6 vým Y s porušením nacházejícím se v kritické oblasti o velikosti 270 kb, což redukuje kritický interval na 170 kb.
Korelací výšky šesti jedinců s jejich místem porušení se mapoval interval o velikosti 170 kb v pseudoautozomální oblasti, jehož přítomnost nebo absence má podstatný účinek na výšku vzrůstu. Tento interval je ohraničen místem porušení na chromozomu X pacienta GA v místě vzdáleném 340 kb distálně od telemoru (Xpteil) a místem porušení u pacientů AT a RY proximálně 510/520 kb Xptel. Toto uspořádání zahrnuje podstatnou redukci kritického intervalu na téměř jednu čtvrtinu jeho původní velikosti (Ogata T., Goodfellow P., Petic C., Aya M. Matsuo N. (1992): Short stature in a girl with a terminál Xp deletion distal do DXYS15: localization of agrowth gene(s) in the pseudoautosomal region. J. Med. Genet. 29: 455 459; Ogata T., Yoshizawa A., Muroya K., Matsuo N., Fukushima Y., Rappold G.A., Yokoya S. (1995): Short Stature in a girl with partial monosomy of the pseudoautosomal region distal to DXYS15: further evidence for the assignment of the critical region for a pseudoautosomal growth gene (s). J. Meg. Genet. 32: 831-834; Ogata T., Matsuo N. (1995): Turner Syndrome and female sex chromosome aberrations. deduction of the principle factors involved in the development of clinical features. Hum. Genet. 95: 607-629). Pro experimenty FISH za účelem testování prevealence a signifikance uvedeného genomového lokusu na velké sérii pacientů s idiopatickým malým vzrůstem je nyní dostupná malá sada šesti až osmi kosmidů.
B. Identifikace kandidáta genu odpovídajícího za malý vzrůst
Za účelem hledání transkripčních jednotek v nejmenší kritické oblasti o velikosti 170 kb se provedlo trapování exonu a selekce cDNA u šesti kosmidů (110E3, F2cos, 43C11, 02410, 15D15, 34F5). Trapování exonu se izolovaly tři různé pozitivní klony (ET93, ET45, a G108). Všechny z nich se mapovaly zpět ke kosmidů 34F5. Předchozí studie za použití cDNA selekčních protokolů a přístupu k 25 různým knihovnám cDNA vedly k neúspěchu, což naznačuje, že geny v tomto intervalu se exprimují s velmi malým nadbytkem.
Za účelem zjištění, zda nějaký gen v uvedeném intervalu chybí, se stanovila za použití náhodné M13 metody a terminátové chemie nukleotidové sekvence vzdálené přibližně 140 kb od uvedené oblasti PARI. Za účelem sekvenční analýzy se vybraly kosmidy se vzájemným minimálním překryvem, aby spolu pokryly kritický interval. Provedla se sekvenční analýza a následná předpověď proteinu pomocí programu „X Grail“, verze 1.3c, stejně jako trapování exonu pomocí programu FEXHB, což potvrdilo všechny 3 dříve klonované exony. Nedetekoval se žádný jiný gen kódující protein, než co už byl dříve izolován.
C. Izolace genu SHOX odpovídající za malý vzrůst
Za předpokladu, že všechny tři exonové klony ET93, ET45 a G108 jsou součástí stejného genu, použily se spolu jako sondy k testování 14 různých knihoven cDNA vytvořených z 12 různých fetálních (plíce, játra, mozek 1 a 2), a dospělých tkání (vaječníky, placenta 1 a 2, fibroblasty, skeletové svalstvo, kostní dřeň, mozek, mozkový kmen, hypotalamus, podvěsek mozkový). Mezi přibližně 14 miliony klony nanesenými na plotny se nedetekoval ani jeden klon. Za účelem izolace transkriptu v plné délce se uskutečnil 3' a 5'RACE. Za účelem 3'RACE se použily primery z exonu 108 na RNA z placenty, skeletového svalstva a fibroblastů z kostní dřeně a z tkáně, kde se exprimuje GI08. Ze všech tří tkání se získaly dva různé 3'RACE klony velikosti 1173 a 652 bp, což naznačuje, že existují dva různé 3' exony a a b. Tyto dvě odlišné formy se nazývají SHOXa a SHOXb.
Za účelem zvýšení šancí pro izolaci celé 5' části genu, o kterém se ví, že je exprimován s malým přebytkem, se buněčná linie Hela ošetřila retinoovou kyselinou a forbolesterem PMA. RNA z takové indukované buněčné linie a RNA z placenty a skeletového svalstva se použila ke konstrukci „Mararhonovy knihovny cDNA“. Ze všech tří tkání se izolovaly identické klony 5'RACE cDNA.
- 14CZ 297640 B6
Experimentální postup:
RT-PCR a konstrukce knihovny CDNA.
OD firmy Clontech se získala lidská polyA'RNA ze srdce, pankreasu, skeletového svalstva, fetálních ledvin a jater. Celková RNA se izolovala z buněčné linie fibroblastů z kostní dřeně činidlem TR1ZOL (Gibco-BRL), způsobem, který popisuje výrobce. První řetězec syntézy cDNA se získal pomocí kitu „Superscript first strand cDNA synthesis kit (Gibco-BRL), kdy počátečním materiálem je 100 ng polyA1 RNA nebo 10 ug celkové RNA za použití oligofdtj-adaRNAptorového primem (GGCCACGCGTCGACTAGTAC[dT]2oN. Po syntéze prvního řetězce dDNA se reakce naředila 1/10. Při dalších experimentech PCR se použila 5 ul tohoto ředění. „Marathonova knihovna cDNA“ se zkonstruovala z polyA'RNA skeletového svalstva a placenty amplifikačním kitem pro cDNA (Clontech), jak popisuje výrobce. Knihovny cDNA zfetálního mozku (katalogové číslo # HL5015b), fetální plíce (HL3022a), vaječníků (HL 1098a), podvěsku mozkového (HLI097v) a hypotalamu (HL 1172b) se získaly od firmy Clontech. Knihovny cDNA mozku, ledvin, jater a plic se staly součástí rychlého testu pomalu lidské cDNA knihovny (Clontech). cDNA knihovna fetálního svalstva se získala z instituce UK Human Genome Mapping Project Resources Center.
D. Sekvenační analýza a struktura genu SHOX
Na základě analýzy sekvencí získaných klonů pomocí 5' a 3'RACE se uspořádala sekvence SHOXa a SHOXb (1349 a 1870 bp). Identifikoval se jeden otevřený čtecí rámec o velikosti 1870 bp (SHOXa) a 1349 bp (SHOXb), který dává vzniku dvou proteinů o 292 aminokyselinách (SHOXa) a 225 aminokyselinách (SHOXb). Oba transkripty a i b se dělí o běžný 5'konec, ale mají odlišný poslední 3' exon. Toto zjištění naznačuje, že se používá alternativní signály sestřihu. Dosáhlo se úplného uspořádání mezi dvěmi cDNA a sekvenovanou genomovou DNA zkosmidů LL0YNCO3M15D10a LL0YNC3''M34F5, což umožňuje ustanovení struktury exon-intron (obrázek č. 4). Gen se skládá ze 6 exonů, jejichž velikost se pohybuje v rozmezí od 58 bp (exon III) do 1146 bp (exon VA). Exon 1 obsahuje CpG, startovací kodon a 5'oblast. Stop kodon stejně jako 3'-nekódující oblast se nachází v každém alternativně sestřiženém exonu Va a Vb.
Příklad 3
Identifikovaly se dvě cDNA, které tvoří 160 kb velkou oblast, která je kritická pro malý vzrůst. Tyto cDNA korespondují s geny SHOX a pET92. cDNA se se identifikovaly hybridizací subklonů kosmidů s knihovnami cDNA.
Sada kosmidových klonů, které úplně pokrývají kritickou oblast, je genetickým materiálem pro identifikaci kauzativního genu. Projekty pozičního klonování, které vedou k izolaci genů z uvedené oblasti, se uskutečnily trapováním exonu a selekcí cDNA. Zjištěním jejich polohy v pseudoatozomální oblasti se tyto geny mohou vyhnout X-deaktivaci a může se uplatnit účinek dávky.
Klonování genu, který když není přítomen (haploid) neboje deficitní odpovídá za malý vzrůst je delším krokem přesnosti diagnózy a poskytuje základny pro analýzu mutací v genu pomocí například jednořetězcového konformačního polymorfizmu (SSCP). Navíc klonování uvedeného genu a jeho následná biochemická charakterizace otevřela cestu k hlubšímu porozumění biologických procesů, které jsou zahrnuty v řízení růstu. Sekvence DNA podle vynálezu poskytuje první molekulový test pro identifikaci jednotlivců se specifickou vadou genu v komplexní heterogenní skupině pacientů, kteří vykazují idiopatický malý vzrůst.
- 15 CZ 297640 B6
Příklad 4: Expresní patern SHOXa a SHOXb
Analýza northernovým přenosem za použití jednotlivých exonů jako hybridizačních sond ukázala odlišný expresivní profil každého exonu, což silně naznačuje, že pruhy o různé velikosti a inten5 zitě reprezentují produkty křížové hybridizace s jinými genovými sekvencemi bohatými na G, C.
Aby se dosáhlo více realistického expresivního profilu genů SHOXa a b, provedly se s RNA z různých tkání RT-PCR experimenty. Zatímco exprese SHOXa se pozorovala ve fibroblastech skeletového svalstva, placenty, pankreasu, srdce a kostní dřeně, exprese SHOXb se omezila na fibroblasty fetální ledviny, skeletového svalstva a kostní dřeně, přičemž zdaleka nejsilnější expreio si vykazují fibroblasty kostní dřeně.
Exprese SHOXa v několika cDNA knihovnách připravených zfetálního mozku a ze svalstva, z mozku dospělých, z plic a z podvěsku mozkového a skutečnost, že v žádné uvedené knihovně není exprimován SHOXb, podává další důkaz, že exprese jedné formy sestřihu (SHOXa) je více 15 rozšířena než druhá (SHOXb), která se exprimuje převážně tkáňově specifickým způsobem.
K. odhadu transkripční aktivity SHOXa a SHOXb na X a Y chromozomu se použila RT-PCR RNA, která se extrahovala z různých buněčných linií, jenž vykazují aktivní X, neaktivní X nebo Y chromozom. Všechny buněčné linie vykazují produkt amplifikace očekávané délky 119 bp 20 (SHOXa) a 541 bp (SHOXb), což je důkaz, že jak SHOXa, i b unikly deaktivaci chromozomu X.
Geny SHOXa a b kódují nové proteiny homeodomén. Gen SHOX je vysoce konzervativní mezi jednotlivými živočišnými druhy od savců po ryby a ptáky. Na samém 5'konci a 3'konci vedle homeodomény jsou pravděpodobně konzervativní oblasti mezi člověkem a myši, což znamená funkční signifikanci. Během evoluce mezi člověkem a myší se v těchto oblastech aminokyselin 25 neakumulovaly rozdíly.
Experimentální postupy:
a) 5' a 3'RACE
Za účelem klonování transkriptů 5' konce SHOXa a b se provedla metoda 5'RACE za použití zkonstruované „Marathonových cDNA knihoven“. Použily se následující oligonukleotidy příměry: SHOX B. rev. GAAAGGCATCCGTAAGGCTCC (pozice 697-718, reverzní řetězec [r]) a adaptorový primer API. Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po 35 dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu vteřin, 66 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 25 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX A rev, GACGCCTTTATGCATCTGATT40 CTC (pozice 617-640 r) a adaptorového primeru AP2. PCR se provedlo během 35 cyklů s teplotou renaturace 60 °C.
Za účelem klonování transkriptů 3' konce SHOXa a b provedla metoda 3'RACE, jak popisuje v publikaci Frohman et al., 1988, za použití prvního řetězce cDNA s primerem oligo(dT)adapto45 ru. Použily se následující oligonukleotidové primery: SHOX A for GAATCAGATGCATAAAGGCGTC (pozice 619-640) a oligo(dT)adaptor. Proběhla PCR za těchto podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Druhé kolo amplifikace se uskutečnilo za použití 1/100 produktu PCR a následujících oligonukleotidových primerů: SHOX B for, GGGAGCCTTACGGATGCCTTTC (pozice 697-718) 50 a oligo(dT) adaptoru. PCR se provedlo během 35 cyklů s teplou renaturace 62 °C.
Za účelem potvrdit sekvence transkriptů SHOXa a SHOXb se uskutečnila PCR 5'oligonukleotidovým primerem a 3'oligonukleotidovým primerem. V případě SHOXa se použily následující primery: G310 for AGCCCCGGCTGCTCGCCAGC (pozice 59-78) a SHOX D rev CTGCGCG
- 16CZ 297640 B6
GCGGGTCAGAGCCCCAG (pozice 959-982 r). V případě SHOXb se použily následující příměry: T310 for AGCCCCGGCTGCTGCCAGC a SHOX2A rev GCCTCAGCAGCAAAGCAAGATCCC (pozice 1215-1238 r). Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut, °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 70 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 2 minut po 35 cyklů. Produkty se čistily na gelu a klonovaly se za účelem sekvenační analýzy.
b) Analýza SSCP
Amplifikovaná gcnomová DNA pocházející z pacientů se analyzovala způsobem SSCP, který se popisuje v publikaci Orita M., Suzuki Y., Sekiya T., and Hayashi K., (1989): Rapid and sensitive detection of point mutations and polymorphisms using the polymerase chain reaction. Genomics 5:874-879). 1 až 5 ul produktů PCR se smíchalo s 5 ul denaturačního roztoku, který obsahuje % formamidu a 10 mM EDTA pH8, a denaturovaly se při teplotě 95 °C po dobu 10 minut, vzorky se ihned ochladily na ledu a nanesly se na 10% polyakrylamidový gel (akrylamid: bisakryamid = 37,5 : 1 a 29 : 1; gel s více sloty, báze TGGE, Qiagen), který obsahuje 2% glycerol a 1 x TBE. Elektroforéza proběhla při teplotě 15 °C při napětí 500 V po dobu 3 až 5 hodin a obarvila se stříbrem, jak se popisuje TGGE manuálu (Qiagen, 1993).
c) Klonování a sekvenování produktů PCR
Produkty PCR se klonovaly do vektoru pM0S5/we za použití pMOSfí/weT-sady vektorů od firmy Amersham. Kultura z jedné kolonie kultivována přes noc se lyžovala povařením ve 100 ml vody po dobu 10 minut. Lyzáty se použily jako templáty pro PCR se specifickými primery. SSCP produktů PCR umožnila identifikaci klonů, které obsahují různé alely. Klony se sekvenovaly za použití vektorových primerů Uni a T7 značených CY5 způsobem sekvenování v cyklech, jak popisuje výrobce (ThermoSequenase Kit (Amersham)) na automatickém sekvenátoru ALF (Pharmacia).
d) Testování cDNA knihoven pomocí PCR
Aby se detekovala exprese SHOXa a b provedlo se PCR testování několika knihoven cDNA a prvního řetězce cDNA s SHOXa a b specifickými primery. V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu. V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for. V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut, 94 °C po dobu 30 vteřin, 68 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů
e) PCR testování knihoven cDNA
Aby se detekovala expresse SHOXa a b provedlo se PCR testování několika knihoven cDNA s SHOXa a b specifickými primery. V případě knihoven cDNA se použil ekvivalent DNA 5 x 108 pfu. V případě SHOXa se použily primery SHOX E rev GCTGAGCCTGGACCTGTTGGAAAGG (pozice 713-737 r) a SHOX a for. V případě SHOXb se použily následující primery SHOX B for a SHOX2A rev. Obě PCR se provedly za podmínek: 94 °C po dobu 2 minut. 94 °C po dobu 30 vteřin, 68 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 65 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 5 cyklů. 94 °C po dobu 30 vteřin, 62 °C po dobu 30 vteřin, 72 °C po dobu 40 vteřin po 35 cyklů.
- 17CZ 297640 B6
Příklad 5: Expresivní patern OG12, což je putativní homolog SHOX a SHOT
Za účelem stanovení expresivního paternu se provedla hybridizace in šitu u embryí myší z 5. dne p.c. a 18,5 dne p.c., u fetálních a u nově narozených zvířat. Expresi bylo možno ukázat u vyvíjejících se zárodků noh, v mesodermu nasalních postupů, které se podílejí na tvorbě nosu a patra, u očních víček u aorty, ve vyvíjejících se žláz samic, ve vyvíjející se páteři (omezených na diferenciaci motorických neuronů) a v mozku. Na základě tohoto expresního patentu a na mapování pozice jeho lidského homologu SHOT, SHOT, reprezentuje pravdě podobně kandidáta Comelia de Lange syndromu, který zahrnuje malý vzrůst.
Příklad 6: Izolace nového genu homeoboxu podobného SHOX SHOT na chromozomu 3, který souvisí s lidským růstem/s malým vzrůstem postavy.
U člověka se izoloval nový gen nazývaný SHOT (SHOX homolog na chromozomu 3), který vykazuje nejvíce homologie s myším genem OG12 a lidským SHOX. Lidský gen SHOT a myší OG12 jsou vysoce homologní. Vykazují 99% identity na úrovni proteinu. Ačkoli se to ještě neprokázalo, díky homologii mezi SHOT a SHOX (jde o identitu pouze v homeooblasti) je pravděpodobné, že gen SHOT také odpovídá za malý vzrůst nebo lidský růst.
Gen SHOT se izoloval za použití primerů ze dvou nových lidských EST (HS 1224703 a HS 126759) z databáze EMBL, přičemž se amplifikuje reverzně přepsaná RNA z linie fibroblastů kostní dřeně (Rao E., Weiss B., Mertz A., et al., (1995): Construction of a cosmid conting spanning the short stature condidate region in the pseudosomal region PAR 1. In: Turner syndrome in a life spán respective: Research and clinical aspects. Proceeding of the 4,h Intemational Symposium on Turner Syndrome, Gothenburg, Sweden, 18-21 May, 1995., edited by Aíbertsson-Wikland K., Ranke M.B., pp. 19-24, Elsevier. 5' a 3'konec genu SHOT se generoval RACE-PCR z fibroblastové knihovny kostní dřeně, která se zkonstruovala podle publikace Rao E., Weiss B., Fukami M., Rump A., Niesler B., Metz A., Muroya, K., Binder G.,. Kirsch S., Winkelmann M., Nordsiek G., Heinrich U., Breuning Μ. H., Ranke M.B., Rosenthal A., Ogata T., Rappold G.S. (1997): Pseudoautosomal deletions encompassing a navel homeobox gene cause groxth failure in idiopathic short stature and Turner syndrome. Nátuře Genet 15:54-62. Gen SHOT se mapoval analýzou FISH chromozomu 3q25/q26 a dále se mapoval myší homolog syntetické oblasti na myším chromozomu 3. Na základě expresivního patentu OG12, což je myší homolog genu SHOT, gen SHOT reprezentuje kandidáta odpovídajícího za Comelia Lange syndrom (který vykazuje malou výšku vzrůstu a další rysy, kam patří kraniofaciální abnormality), který se mapoval v tomto intervalu na chromozomu 3q25/26.
Příklad 7: Vyhledávání mutací u pacientů s idiopatickým malým vzrůstem
Sekvence DNA podle vynálezu se používají při PCR, LCR a při jiných známých technologiích, za účelem stanovení, zda takoví jednotlivci s malou výškou vzrůstu vykazují malé delece nebo bodové mutace v genu odpovídajícím za malý vzrůst.
U 91 (z celkového počtu 259 jednotlivců) nezávislých pacientů mužského a ženského pohlaví s idiopatickou malou výškou vzrůstu (odhad četnosti idiopatickou malé výšky vzrůstu v obecné populaci se odhaduje na 2 až 2,5 %) se testovala přítomnost malých změn v uspořádání nebo bodové mutace v genu SHOXa. Navrhlo se šest sad primerů PCR, ne pouze za účelem amplifikace jednotlivých exonů, ale také sekvencí, které lemují exon a malé části 5ÚTR. V případě největšího exonu, exon 1, se generovaly dva další primery uvnitř exonu. Primery, které se používaly při PCR, se uvádějí na tabulce č. 2.
- 18CZ 297640 B6
Provedl se jednořetězcový konformační polymorfizmus (SSCP) všech amplifikovaných exonů, jehož velikost se pohybuje v rozmezí od 120 do 295 bp. Pouze v případě dvou jednotlivců s malou výškou vzrůstu (Y91 a Al) se identifikoval posun pohyblivosti pruhů. Klonovaly se a sekvenovaly fragmenty, které vykazují pozměněné paterny SSCP (unikátní konformery SSCP). Aby se zabránilo vzniku PCR a sekvenaěních artifaktů, sekvenování se provedlo na dvou řetězcích za použití dvou nezávislých reakcí PCR. Mutace u pacienta Y91 se nachází v pozici 28 bp 5' konce startovacího kodonu v 5'UTR a zahrnuje substituci, kdy quannin se nahradí citidinem. Aby se zjistilo, jestli tato mutace reprezentuje řídký polymorfizmus neboje odpovědná za fenotyp regulací exprese genu, například slabším navázáním translačních iniciačních faktorů, testovaly se pacientovi rodiče a sestra. Přestože sestra a otec pacienta dosahují normální CP (data nejsou uvedeny). Uvedená substituce bází reprezentuje řídký polymorfizmus, který neovlivňuje fenotyp.
Klonování a sekvenování unikátních konformerů SSCP pacienta Al vykazuje transici bází, kdy citidin nahradí thymidin (nukleotid 674), která zavede terminační kodon do pozice aminokyseliny 195 předpovězených aminokyselinových sekvencí aminokyseliny 195 předpovězených aminokyselinových sekvencí 225 a 292. Aby se stanovilo, zda tato nesmyslná mutace je geneticky asociována s malou výškou vzrůstu rodiny, provedla se rodová analýza. Zjistilo se, že všech šest jednotlivců s malou výškou vzrůstu (definovanou jako výška nižší než 2 standardní odchylky) vykazuje nenormální posun SSCP a transici cytidinu za thymidin. Ani otec, ani jedna z tet a dědeček z matčiny strany, kteří dosáhly normální výšky nevykazují mutaci, což naznačuje, že babička přenesla mutovanou alelu na její dvě dcery a na jejich dvě vnoučata. U této rodiny existuje shoda mezi přítomností mutovaných alel a fenotypu vykazujícího malou výšku vzrůstu.
Stejná situace, která se popisuje shora v textu, se zjistila u jiného pacienta s malou výškou vzrůstu, který je japonského původu.
Příklad 8
Sekvence DNA podle vynálezu se používají pro charakterizaci funkce genu nebo genů. Sekvence DNA se mohou použít jak otázky při vyhledávání bází v databázích aminokyselin a nukleových kyselin za účelem identifikace příbuzných genů nebo genových produktů. Jako otázka pro vyhledávání v databázi aminokyselin se použila částečná aminokyselinová sekvence SHOX93. Test vykazuje velmi vysokou homologii s mnoha známými proteiny homeoboxů. Sekvence cDNA podle vynálezu se mohou použít při produkci peptidu rekombinantní metodou. Při produkci proteinu rekombinantním způsobem se mohou použít různé expresivní systémy, které jsou dobře známy v oboru.
Běžnou syntézou peptidu (syntéza proteinů podle Merrifieldovy metody) se syntetizoval peptid se sekvencí CSKSFDQKSKDGNGG a podle standardních protokolu se získaly polyklonální protilátky z králíků a kuřat.
Seznam literatury
Ashworth A., Rastan S., Lovell-Badge R., Kay G., (1991): X-chromosome inactivation may explain the difference in viability of X0 humans and mice. Nátuře 351: 406-408:
Blagowidow N., Page D.C., Huff D., Mennuti MT (1989): Ullrich-Tumer syndrome in an XY female fetus with deletion of the sex-determining portio of the Y chromosome. Am J. med. Genet. 34: 159-162.
Cantrell M.A., Bicknell J.N., Pagon RA et al. (1989): Molecular analysis 46, XY females and regional assignment of a new Y-chromosome-specific probe. Human. Genet. 83: 88-92.
- 19CZ 297640 B6
ConnorJ.M., Loughlin S.A.R. (1989): Molecular genetics of Turner's syndrome. Acta Pediatr. Scand. (Suppl.) 356: 77-80.
Disteche C.M., Casanova M., Saal H., Friedman C., Sybert V., Graham J., Thline H., Page D.C., Fellous M„ (1986): Smáli deletions of the short arm of the Y-chromosome in 46,XY females. Proč. Nati. Acad. Sci USA 83: 7841-7844.
Ferguson-Smith M.A. (1965): Karyotype-phenotype correlations in gonadal dysgenesis and their bearing on the pathogenesis of malformations. J. med. Gent. 2: 142-155:
Ferrari D., Kosher R.A. Dealy C.N. (1994): Limb mesenchymal cells inhibited from undergoing cartilage differentiation by a tumor promoting phorbol ester maintain expression of the homeobox-containing gene MSX1 and fail to exhibit gap junctional communication. Biochemical and Biophysical Research Communications. 205 (1):429-434.
Fischer M., Bur-Romero P., Brown L.G. et al., (1990): Homologous ribosomal protin genes in the human X- and Y-chromosomes escape from X-inactivation and possible implementation for Turner syndrome. Cell 63: 1205-1218.
Freund C., Horsford D.J., Mclnnes R.R. (1996): Transcription factor genes and the developing eye: a genetic perspective: Hum. Mol. Genet. 5: 1471-1488.
Gehring W., J., Qian Y.Q., Billeter, Furukubo-Tokunaga K.., Schier A. F., Resendez-Preze D., Affolter M., Otting G., Wuthrich K., (1994): Homeodomein-DNA recognition. Cell 78: 211-223.
Grumbach M.M., Conte F.A. (1992). Disorders of sexual differentation. In: Williams textbook of endocrinology, 8th edn.m edited by Wilson J.D., Foster D.W., pp. 853-952, Philadelphia, WB Saunders.
Hernandez, D., Fisher E.M.C (1996): Down syndrome genetics: unravelling a multifactorial disorder. Hum. Mol. Genet. 5: 1411-1416.
Kenyon C., (1994): If birds can fly, why can't we? Homeotic genes and evolution. Cell 78: 175180.
KumlaufR., (1994): Hox genes in vertebrate development. Cell 78: 191-201.
Lawrence P.A., Morata G., (1994): Homeobox genes: their function in Drosophila segmentation and pattem formation. Cell 78: 181-189.
Lehrach H., Drmnac R., Hoheisel J.D., Larin Z., Lemon G., Monaco A.P., Nizetic D„ et al., Hybridization finger printing in genome mapping and sequencing. In Davies K.E., Tilghman S., Eds. Genome Analysis 1990: 39-81 Cold Spring Harbor, NY.
Levilliers J., Quack B., Weissenbach J., Petit C., (1989): Exchange of terminál portions of Xand Y-chromosomal short arms in human XY females. Proč. Nati. Acad. Sci. USA 86: 22962300.
Lippe B.M. (1991): Turner Syndrome. Endocrinol. Metab. Clin., North Am., 20: 121-152. Magenis R.E., Tochen M.L. Holahan K.P., Carey T., Allen L., Brown M.G. (1984): Turner syndrome resulting from partial deletion of Y-chromosome short arm: localization of male determinantns. J. Pediatr 105: 916-919.
-20CZ 297640 B6
Pohlschmidt M., Rappold G.A., Krause M., Ahlert D., Hosenfeld D., Weissenbach J., Gal A. (1991): Ring Y chromosoine: Molecular characterization by DNA probes. Cytogenet. Cell Genet. 56: 65-68.
Qiagen (1993) TGGE Handbook, Diagen GmbH, TGMA 41123/93. Osenfeld R.G. (1992): Turner syndrome: a quide for physicians. Second edition. The Turner's Syndrome Sciety.
Rovescalli A.C., Asoh S„ Nirenberg M. (1996): Cloning and characterization four murine homeobox genes. Proč. Nati. Acad. Sci. USA 93: 10691-10696.
Shalet S.M. (1993): Leukemia in children treated with growth hormone. Journal of Pediatrie Endocrinology 6: 109-11 Vimpani G.V., Vimpani A.F., Lidgard G.P., Cameron E.H.D., Farquhar J.W. (1977) Prevalence of severe growth hormone deficiency. Br. Med. J. 2: 427-430.
Zin A.R., Page D.C., Fisher E.M.C. (1993): Turner syndrome: the čase of the missing sex chromosomc. T1G 9 (3): 90-93.
Sekvenční protokol (1) Obecné informace (i) Navrhovatel:
(A) JMÉNO: Rappold-Hoerbrand, Gudrun, Dr.
(B) ULICE: Hauseckerweg 14 (C) MĚSTO: Heidelberg (D) ZEMĚ: Německo (E) ZIP:6918 (ii) Název vynálezu: Molekula nukleové kyseliny kódující polypeptidy a způsoby jejího použití.
(i i i) Počet sekvencí: 16 (iv) Počítačem čitelná forma:
(A) TYP MÉDIA: disketa (B) POČÍTAČ: kompatibilní s IBM PC (C) OPERAČNÍ SYSTÉM: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, verze #1.30 EPO (vi) Data předchozích přihlášek (A) PŘIHLÁŠKA č. US 60/027,633 (B) DAT UM PODÁNÍ: 01-10-1996 (2) Informace o sekvenci SEQ ID NO: 1:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 60 aminokyselin (B) TYP: aminokyselinová
-21 CZ 297640 B6 (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid (xi) POPIS SEKVENCE: SEQ ID NO: 1
Gin I | Arg | Arg | Ser | Arg 5 | Thr | Asn | Phe | Thr | Leu 10 | Glu | Gin | Leu | Asn | Glu 15 | Leu |
Giu | Arg | Leu | Phe 20 | Asp | Glu | Thr | His | Tyr 25 | Pro | Asp | Ala | Phe | Met 30 | Arg | Glu |
Glu | Leu | Ser 35 | Gin | Arg | Leu | Gly | Leu 40 | Ser | Glu | Ala | Arg | Val 45 | Gin | Val | Trp |
Phe | Gin 50 | Asn | Arg | Arg | Ala | Lys 55 | Cys | Arg | Lys | Gin | Glu 60 |
(2) Informace o sekvenci SEQ ID NO: 2:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 209 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon II: ET93“ (v) TYP FRAGMENTU: lineární (xi) POPIS SEKVENCE: SEQ ID NO: 2
GGATTTATGA | ATGCAAAGAG | AAGCGCGAGG | ACGTGAAGTC | GGAGGACGAG | GACGGGCAGA | 60 |
CCAAGCTGAA | ACAGAGGCGC | AGCCGCACCA | ACTTCACGCT | GGAGCAGCTG | AACGAGCTCG | 120 |
AGCGACTCTT | CGACGAGACC | CATTACCCCG | ACGCCTTCAT | GCGCGAGGAG | CTCAGCCAGC | 180 |
GCCTGGGGCT | CTCCGAGGCG | CGCGTGCAG | 209 |
(2) Informace o sekvenci SEQ ID NO: 3:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 368 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon I: G310“
-22 CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 3:
GTGATCCACC | CGCGCGCACG | GGCCGTCCTC | TCCGCGCGGG | GAGACGCGCG | CATCCACCAG | 60 |
CCCCGGCTGC | TCGCCAGCCC | CGGCCCCAGC | CATGGAAGAG | CTCACGGCTT | TTGTATCCAA | 120 |
GTCTTTTGAC | CAGAAAAGCA | AGGACGGTAA | CGGCGGAGGC | GGAGGCGGCG | GAGGTAAGAA | 180 |
GGATTCCATT | ACGTACCGGG | AAGTTTTGGA | GAGCGGACTG | GCGCGCTCCC | GGGAGCTGGG | 240 |
GACGTCGGAT | TCCAGCCTCC | AGGACATCAC | GGAGGGCGGC | GGCCACTGCC | CGGTGCATTT | 300 |
GTTCAAGGAC | CACGTAGACA | ATGACAAGGA | GAAACTGAAA | GAATTCGGCA | CCGCGAGAGT | 360 |
GGCAGAAG | 368 |
(2) Informace o sekvenci SEQ ID NO: 4:
(i) | CHARAKTERISTIKA SEKVENCE |
10 | (A) DÉLKA: 58 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární |
15 (ii) | TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon III: ET45“ |
(xi) | POPIS SEKVENCE: SEQ ID NO: 4: |
GTTTGGTTCC AGAACCGGAG AGCCAAGTGC CGCAAAGAAG AGAATCAGAT GCATAAAG (2) Informace o sekvenci SEQ ID NO: 5:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 89 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon IV: G108“ (xi) POPIS SEKVENCE: SEQ ID NO: 5:
GCGTCATCTT GGGCACAGCC AACCACCTAG ACGCCTGCCG AGTGGCACCC TACGTCAACA
TGGGAGCCTT ACGGATGCCT TTCCAACAG
-23CZ 297640 B6 (2) Informace o sekvenci SEQ ID NO: 6:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 1166 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina o
(A) POPIS: /popis = „exon: Va“ (xi) POPIS SEKVENCE: SEQ ID NO: 6:
GTCCAGGCTC | AGCTGCAGCT | GGAAGGCGTG | GCCCACGCGC | ACCCGCACCT | GCACCCGCAC | 60 |
CTGGCGGCGC | ACGCGCCCTA | CCTGATGTTC | CCCCCGCCGC | CCTTCGGGCT | GCCCATCGCG | 120 |
TCGCTGGCCG | AGTCCGCCTC | GGCCGCCGCC | GTGGTCGCCG | CCGCCGCCAA | AAGCAACAGC | 180 |
AAGAATTCCA | GCATCGCCGA | CCTGCGGCTC | AAGGCGCGGA | AGCACGCGGA | GGCCCTGGGG | 240 |
CTCTGACCCG | CCGCGCAGCC | CCCCGCGCGC | CCGGACTCCC | GGGCTCCGCG | CACCCCGCCT | 300 |
GCACCGCGCG | TCCTGCACTC | AACCCCGCCT | GGAGCTCCTT | CCGCGGCC&C | CGTGCTCCGG | 360 |
GCACCCCGGG | AGCTCCTGCA | AGAGGCCTGA | GGAGGGAGGC | TCCCGGGACC | GTCCACGCAC | 420 |
GACCCAGCCA | GACCCTCGCG | GAGATGGTGC | AGAAGGCGGA | GCGGGTGAGC | GGCCGTGCGT | 480 |
CCAGCCCGGG | CCTCTCCAAG | GCTGCCCGTG | CGTCCTGGGA | CCCTGGAGAA | GGGTAAACCC | 540 |
CCGCCTGGCT | GCGTCTTCCT | CTGCTATACC | CTATGCATGC | GGTTAACTAC | ACACGTTTGG | 600 |
AAGATCCTTA | GAGTCTATTG | AAACTGCAAA | GATCCCGGAG | CTGGTCTCCG | ATGAAAATGC | 660 |
catttcttcg | TTGCCAACGA | TTTTCTTTAC | TACGATGCTC | CTTCCTTGAT | CCCGAGAGGC | 720 |
TGCGGAACGG | GTGTGGATTT | GAATGTGGAC | TTCGGAATCC | CAGGAGGCAG | GGGCCGGGCT | 780 |
CTCCTCCACC | GCTCCCCCGG | AGCCTCCCAG | GCAGCAATAA | GGAAATAGTT | CTCTGGCTGA | 840 |
GGCTGAGGAC | GTGAACCGCG | GGCTTTGGAA | AGGGAGGGGA | GGGAGACCCG AACCTCCCAC | 900 | |
GTTGGGACTC | CCACGTTCCG | GGGACCTGAA | TGAGGACCGA | CTTTATAACT TTTCCAGTGT | 960 | |
TTGATTCCCA | AATTGGGTCT | GGTTTTGTTT | TGGATTGGTA | TTTTTTTTTT TTTTTTTTTT | 1020 | |
TGCTGTGTTA | CAGGATTCAG | ACGCAAAAGA | CTTGCATAAG | AGACGGACGC GTGGTTGCAA | 1080 | |
GGTGTCATAC | TGATATGCAG | CATTAACTTT | ACTGACATGG | AGTGAAGTGC AATATTATAA | 1140 | |
ATATTATAGA | ΤΤΑΑΑΛΑΑΑΑ | AATAGC | 1166 |
(2) Informace o sekvenci SEQ ID NO: 7:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 625 párů bází (B) TYP: nukleová kyselina
-24CZ 297640 B6 (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „exon: Vb“ (xi) POPIS SEKVENCE: SEQ ID NO: 7:
io
ATGGAGTTTT | GCTCTTGTCG | CCCAGGCTGG | AGTATAATGG | CATGATCTCG | ACTCACTGCA | 60 |
ACCTCCGCCT | CCCGAGTTCA | AGCGATTCTC | CTGCCTCAGC | CTCCCGAGTA | GCTGGGATTA | 120 |
CAGGTGCCCA | CCACCATGTC | AAGATAATGT | TTGTATTTTC | AGTAGAGATG | GGGTTTGACC | 180 |
ATGTTGGCCA | GGCTGGTCTC | GAACTCCTGA | CCTCAGGTGA | TCCACCCGCC | TTAGCCTCCC | 240 |
AAAGTGCTGG | GATGACAGGC | GTGAGCCCCT | GCGCCCGGCC | TTTGTAACTT | TATTTTTAAT | 300 |
TTTTTTTTTT | TTTTAAGAAA | GACAGAGTCT | TGCTCTGTCA | CCCAGGCTGG | AGCACACTGG | 360 |
TGCGATCATA | GCTCACTGCA | GCCTCAAACT | CCTGGGCTCA | AGCAATCCTC | CCACCTCAGC | 420 |
CTCCTGAGTA | GCTGGGACTA | CAGGCACCCA | CCACCACACC | CAGCTAATTT | TTTTGATTTT | 480 |
TACTAGAGAC | «XiATCTTGC | TTTGCTGCTG | AGGCTGGTCT | TGAGCTCCTG | AGCTCCAAAG | 540 |
ATCCTCTCAC | CTCCACCTCC | CAAAGTGTTA | GAATTACAAG | CATGAACCAC | TGCCCGTGGT | 600 |
CTCCAAAAAA | AGGACTGTTA | CGTGG | 625 |
(2) Informace o sekvenci SEQ ID NO: 8:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 15577 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „HOX93“ (ix) RYSY:
(A) NÁZEV/KLÍČ: exon (B) POZICE: 1498..1807 (D) JINÉ INFORMACE: /funkce = „část exonu 1 (G310)“ (ix) RYSY:
(A) NÁZEV/KLÍČ: misc(B) POZICE: 3844..4068 (D) JINÉ INFORMACE: /funkce = „oblast pET92 (první část)“
-25CZ 297640 B6 (ix) RYSY:
(A) NÁZEV/KLÍČ: mise- (B) POZICE: 4326..4437 (D) JINÉ INFORMACE: /funkce = „oblast pET92 (druhá část)“ (ix) RYSY:
(A) NÁZEV/KLÍČ: misc- (B) POZICE: 4545..4619 (D) JINÉ INFORMACE: /funkce = „oblast pET92 (třetí část)“ (ix) RYSY:
(A) NÁZEV/KLÍČ: misc- (B) POZICE: 5305..5512 (D) JINÉ INFORMACE: /funkce = „část exonu Π (ET93)“ (ix) RYSY:
(A) NÁZEV/KLÍČ: misc- (B) POZICE: 11620..11729 (D) JINÉ INFORMACE: /funkce = „část exonu IV (G108)“ (xi) POPIS SEKVENCE: SEQ ID NO: 8:
CTCTCCCTGT | TGTGTCTCTC | TTTCTCTCTC | TCCATCTCTC | TCCGTCTTTC | CCCCTCTGTC | 60 |
TCTTTCTCTG | TCTCCATCCC | TCTGTCTCTC | CCTTTCTCTC | TGTCTTTCCT | TGTCTCTCTC | 120 |
TTTCTCTCTC | TCTCTCCATC | TCTCTCTCTC | CCGGTCTCTC | TCTCTCCATC | TCCCCGTCTC | 180 |
TCCGTTTCTC | TCTCTGCCTC | TCCCTGTCTG | TCTCTCTCTT | TGTGTGTGTT | ACACACACCC | 240 |
CAACCCACCG | TCACTCATGT | CCCCCCACTG | CTGTGCCATC | TCACACAAGT | TCACAGCTCA | 300 |
GCTGTCATCC | TGGGTCCCCA | GGCCCCGCCG | GGGAGGAAGA | TGCGCCGTGG | GGTTACGGGA | 360 |
GGAAGGGGAC | TCCGGGCCTC | CTGGTGCCCC | ACTTTATTTG | CAGAAGGTCC | TTGGCAGGAA | 420 |
CCGTGACGCG | TTTGGTTTCC | AGGACTTGGA | AAACGAATTT | CAGGTCGCGA | TGGCGAGCAC | 480 |
CGGCTTCCCC | TGAAGCACAT | TCAATAGCGA | GAGGCGťXiAG | GGAGCGAGCA | GGAGCATCCC | 540 |
ACCATGAAAA | CCAAAAACAC | AAGTATTTTT | TTCACCCGGT | AAATACCCCA | GACGCCAGGG | 600 |
TGACAGCGCG | GCGCTAAGGG | AGGAGGCCTC | gcgccggggt | CCGCCGGGAT | CTGGCGCGGG | 660 |
CGGAAAGAAT | ATAGATCTTT | ACGAACCGGA | TCTCCCGGGG | ACCTGGGCTT | CTTTCTGCGG | 720 |
GCGCTGGAAA | CCCGGGAGGC | GGCCCCGGGG | ATCCTCGGCC | TCCGCCGCCG | CCGCCTCCCA | 780 |
AGCGCCCGCG | TCCCGGTTTG | GGGACACCCG' | GCCCCTTCTT | CTCACTTTCG | GGGATTCTCC | 840 |
AGCCGCGTTC | CATCTCACCA | ACTCTCCATC | CAAGGGCGCG | CCGCCACCAA | CTTGGAGCTC | 900 |
ATCTTCTCCC | AAAATCGTGC | GTCCCCGGGG | CGCCCGGGTC | CCCCCCCTCG | CCATCTCAAC | 960 |
CCCGGCGCGA | CCCGGGCGCT | TCCTGGAAAG | ATCCAGGCGC | CGGGCTCTGC | GCTCCTCCCG | 1020 |
GGAGCGAGGG | CGGCCGGACA | ACTGGGACCC | TCCTCTCTCC | AGCCGTGAAC | TCCTTGTCTC | 1080 |
-26CZ 297640 B6
TCTGTCTCTC | TCTGCAGGAA | AACTGGAGTT | TGCTTTTCCT | CCGGCCACGG | AAAGAACGCG | 1140 |
GGTAACCTGT | GTGGGGGGCT | CGGGCGCCTG | CGCCCCCCTC | CTGCGCGCGC | GCTCTCCCTT | 1200 |
CCAAAAATGG | GATCTTTCCC | CCTTCGCACC | AAGGTGTACG | GACGCCAAAC | AGTGATGAAA | 1260 |
TGAGAAGAAA | GCCAATTGCC | GGCCTGGGGG | GTGGGGGAGA | CACAGCGTCT | CTGCGTGCGT | 1320 |
CCGCCGCGGA | GCCCGGAGAC | CAGTAATTGC | ACCAGACAGG | CAGCGCATGG | GGGGCTGGGC | 1380 |
GAGGTCGCCG | CGTATAAATA | GTGAGATTTC | CAATGGAAAG | GCGTAAATAA | CAGCGCTGGT | 1440 |
GATCCACCCG | CGCGCACGGG | CCGTCCTCTC | CGCGCGGGGA | GACGCGCGCA | TCCACCAGCC | 1500 |
CCGGCTGCTC | GCCAGCCCCG | GCCCCAGCCA | TGGAAGAGCT | CACGGCTTTT | GTATCCAAGT | 1560 |
CTTTTGACCA | GAAAAGCAAG | GACGGTAACG | GCGGAGGCGG | AGGCGGCGGA | GGTAAGAAGG | 1620 |
ATTCCATTAC | GTACCGGGAA | GTTTTGGAGA | GCGGACTGGC | GCGCTCCCGG | GAGCTGGGGA | 1680 |
CGTCGGATTC | CAGCCTCCAG | GACATCACGG | AGGGCGGCGG | CCACTGCCCG | GTGCATTTGT | 1740 |
TCAAGGACCA | CGTAGACAAT | GACAAGGAGA | AACTGAAAGA | ATTCGGCACC | GCGAGAGTGG | 1800 |
CAGAAGGTAA | GTTCCTTTGC | GCGCCGGCTC | CAGGGGGGCC | CTCCTGGGGT | TCGGCGCCTC | 1860 |
CTCGCCACGG | AGTCGGCCCC | GCGCGCCCCT | CGCTGTGCAC | ATTTGCAGCT | CCCGTCTCGC | 1920 |
CAGGGTAAGG | CCCGGGCCGT | CAGGCTTTGC | CTAAGAAAGG | AAGGAAGGCA | GGAGTGGACC | 1980 |
CGACCGGAGA | CGCGGGTGGT | GGGTAGCGGG | GTGCGGGGGG | ACCCAGGGAG | GGTCGCAGCG | 2040 |
(XGGCCGCGC | GCGTGGGCAC | CGACACGGGA | AGGTCCCGGG | CTGGGGTGGA | TCCGGGTGGC | 2100 |
TGTGCCTGAA | GCCGTAGGGC | CTGAGATGTC | TTTTTCATTT | TCTTTTTCTT | TCCTTTCCTT | 2160 |
TTTTTGTTTG | TTTGTTTGTT | TGTTTGAGAC | AGAGTCTCGC | TCTGTCCCCC | AGGCTGGAGT | 2220 |
GCAGTGGTGC | GATCTCGGCT | CACTGCAACC | TCCGCCTCCT | GGGTTCAAGC | GATTCTCCTG | 2280 |
CCTCAGCCTC | CCCAGTAGCT | GGGATTACAG | GCATGCACCA | CCACGCCTGG | CTAATTTTTG | 2340 |
TGCTTTTAGT | AAAGACGGGG | ATTCACCATG | TTGGCCAGGC | TGGTCTCGAA | CTCCTGACCT | 2400 |
CAGGTGATCC | ACCCGCCTCG | GCCTCCCAAA | GTGCTGGGAT | GACAGGCGTG | AGGGACCGCG | 2460 |
CCCGGCCTGG | GTCCTGACGG | CTTAGGATGT | GTGTTTCTGT | CTCTGCCTGT | CTGCCTTGTA | 2520 |
tttaccx;tc-a | C C CAG AC í A A | CAGACX. AGG € | GTGTCGACGC | GCCTTCCCAG | c<x:tcagcgc | 2 580 |
CTGCCGGGCC | CCCGGAGATC | ACGCXiAAGAC | TCGAGGCTGC | GTGGTAGGAG | ACGGGAAGGC | 2640 |
cccgggtcag | CTCGGTTCTG | TTTCNGTTTA | AGGAACCCTT | CATTATTATT | TCATTGTTTT | 2700 |
CCTTTGAACG | TCGAGGCTTG | ATCTTGGCGA | AAGCTGTTGG | GTCCATAAAA | ACCACTCCCG | 2760 |
TGAGCGGAGG | TGGCCGGGAT | CTGGATGGGG | CGCGAGGGGC | CCCGGGGAAG | CTGGCGGCTT | 2820 |
CGCGGGCGCG | TCCTAAGTCA | AGGTTGTCAG | AGCGCAGCCG | GTTGTGCGCG | GCCCGGGGGN | 2880 |
AGCTCCCCTC | TGGCCCTTGC | TCCTGAGACC | TCACTGGTGG | GTCGTCCCGT | GGTGGAAATC | 2940 |
GGGGAGTAAG | AGGCTCAGAG | AGAGGGGCTG | GCCCCGGGGA | TCTCTGTGGA | CACACGACAA | 3000 |
CTGGGCGGCA | TACATCTTAA | GAATAAAATG | GGCTGGCTGT | GTCGGGGCAC | AGCTGGAGAC | 3060 |
-27CL 297640 B6
GGCTATGGAC | GCCTGTTATG | TTTTCATTAC | AAAGACGCAG | AGAATCTAGC | CTCGGCTTTT | 3120 |
GCTGATTCGC | AAAGTTGAGG | TGCGAGGGTG | AATGCCCCAA | AGGTAATTCT | TCCTAAGACT | 3180 |
CTGGGGCTAC | CTGCTCTCCG | GGGCCCTGCA | TTTGGGGTGT | GGAGTGGCCC | CGGGAAATAG | 3240 |
CCCTTGTATT | CGTAGGAGGC | ACCAGGCAGC | TTCCCAAGGC | CCTGACTTTG | TCGAAGCAGA | 3300 |
AAGCTGTGGC | TACGGTTTAC | AAAGCAGTCC | CCGGTTTCTG | ACCGTCTAAG | AGGCAGGAGC | 3360 |
CCAGCCTGCC | TTTGACAGTG | AGAGGAGTTC | CTCCCTACAC | ACTGCTGCGG | GCACCCGGCA | 3420 |
CTGTAATTCA | TACACAGAGA | GTTGGCCTTC | CTGGACGCAA | GGCTGGGAGC | CGCTTGAGGG | 3480 |
CCTGCGTGTA | ATTTAAGAGG | GTTCGCANGC | GCCCGGCGGC | CGCTTCTGNT | GGGGTTGCTT | 3540 |
TTTGGTTGTC | CTTCNGCAAA | CACCGTTTTG | CTCCTCTNGN | AACTCTCTCT | TNCTCCCCCN | 3600 |
TGGCCNGTNG | GACCCGGGNA | NGAGCAAAGT | GTCCTCCAGA | CCNTTTTGAA | ANGTGAGAGG | 3660 |
AAAATAAAGA | CCAGGCCAAA | NNGACCCAGG | GCCACAGGAG | AGGAGACAGA | GAGTCCCCGT | 3720 |
TACATTTTNC | CCCTTGGCTG | GGTGCAGAAA | GACCCCCGGG | CCAGGACTGC | CACCCAGGCT | 3780 |
ACTATTTATT | CATCAGATCC | AAGTTAAATC | GAGGTTGGAG | GGCAGGGGAG | AGTCTGAGGT | 3840 |
TACCGTGGAA | GCCTGGAGTT | TTTGGGNAAC | AGCGTGTCCC | CGCCGAGCCT | GGGAGCCCGT | 3900 |
GGGTTCTGCA | AAGCCTGCGG | GTGTTTGAGG | ACTTTGAAGA | CCAGTTTGTC | AGTTGGGCTC | 3960 |
AATTNCCTGG | GGTTCAGACT | TAGAGAAATG | AAGGAGGGAG | AGCTGGGGTC | GTCTCCAGGA | 4020 |
AACGATTCAC | TTGGGGGGAA | GGAATGGAGT | GTTCTTGCAG | GCACATGTCT | GTTAGGAGGT | 4080 |
GAAACAGAAT | GTGAAATCCA | CGTTGGAGTA | AGCGTCCAGC | GCTGAATGTA | GCTCGGGGTG | 4140 |
GGGTGGGAGG | GCUrTGGTGT | GGATCGTGGA | AGGNAAGAAA | gacagaacag | GGTGCTAGTA | 4700 |
TTTACCCCGT | TNCCCTGTAG | AGACCCTGGA | TTTGTCAGCT | TTGCAAGCTT | CTTGGTTGCA | 4260 |
GCGGCCTTGC | CTGTGGCCCT | TTGAGACTGT | TTCCAGACTA | ZiACTTCCAAA | TGTCAGCCCC | 4320 |
TTACCCTTGA | CAl/CAAGGGA | CATCTCATTA | GGGCATCGCG | tgcttctcat | CTGTGNCTCA | 4380 |
GCAGGCCCNG | AGATAGGAAN | CANGAGGGGC | NGTTGGNAGA | TGCNCACTTC | CACCAGCCCT | 4440 |
GGGNTTGAAG | GGGANGCGAN | GGGANGACNA | CCTTTTANCT | TAAACCCCTN | GAGCTTGGTN | 4500 |
CAGAGAGGNC | TGAATGTCTA | AAATGAGGAA | GAAAAGGTTT | TTCACCTGGA | AACGCTTGAG | 4560 |
UXTGAGTCT | tctggccntt | CTGACNTCCC | CCAGCAAATA | CAGACAGGTC | ACCAANCTAC | 4620 |
TGGAGATGAG | AAAGTGCCAT | TTTTGWLACA | CTCTGGTGGG | GTAGGTGCCC | GACCGCGTGT | 4680 |
GAAAAANGTG | GGAANNGGAG | AGATTTCTGN | CGCACGCGGT | TCAGCCCCC-A | GGCGCGGNTG | 4740 |
GCNGCATTCN | AGGNTACTCA | GACGCGGTTC | TGCTGTTCTG | CTGAGAAAGA | GGCTTCGGGT | 4800 |
AGGGGCTCCT | AGCTCCGCCA | GATCGCGGAG | GGACCCCCAG | CCCTCCTGCG | CTGCAGCGGT | 4 U 60 |
GGGGATAGCG | TCTCTCCGTA | GGCCTAGAAT | CTGCAACCCG | CCCCGGGTCC | TCCCCGTGTC | 4920 |
CTTCCCGGGC | GTCCCGCCGG | GGATCCCACA | GTTGGCAGCT | CTTCCTCAAA | TTCTTTCCCT | 4980 |
TAAAAATAGG | ATTTGACACC | CCACTCTCCT | TAAAAAAAAA | AAATAAGAAA | AAAAGGTTAG | 5040 |
GTTATGTCAA | CAGAGGTGAA | GTGGATAATT | GAGGAAACGA | TTCTGAGATG | AGGCCAAGAA | 5100 |
-28CZ 297640 B6
AACAACGCTC | GTGCAAAGCC | CAGGTTTTTG | GGAAAGCAGC | GAGTATCCTC | CTCGGCTTTT | 5160 |
GCGTTATGGA | CCCCACGCAG | TTTTTGCGTC | AAAGCGCATT | GGTTTTCGAG | GGCCCCCTTT | 5220 |
CCACCGCGGG | ATGCACGAAG | GGGTTCGCCA | CGTTGCGCAA | AACCTCCCCG | GCCTC1AGCCC | 5280 |
TGTGCCCTCC | GCTCCCCACG | CAGGGATTTA | TGAATGCAAA | GAGAAGCGCG | AGGACGTGAA | 5340 |
GTCGGAGGAC | GAGGACGGGC | AGACCAAGCT | GAAACAGAGG | CGCAGCCGCA | CCAACTTCAC | 5400 |
GCTGGAGCAG | CTGAACGAGC | TCGAGCGACT | TTTTGACGAG | ACCCATTACC | CCGACGCCTT | 5460 |
CATGCGCGAG | GAGCTCAGCC | AGCGCCTGGG | GCTTTCCGAG | GCGCGCGTGC | AGGTAGGAAC | 5520 |
CCGGGGGCGG | GGGCGGGGGG | CCCGGAGCCA | TCGCCTGGTC | CTCGGGAGCG | CACAGCACGC | 5580 |
GTACAGCCAC | CTGCGCCCGG | GCCGCCGCCG | TCCCCTTCCC | GGAGCGCGGG | gaggttgggt | $640 |
GAGGGACGGG | CTGGGGTTCC | TGGACTTTTG | GAGACGCCTG | AGGCCTGTAG | GATGGGTTCA | 5700 |
TTGCGTTTGT | TTTTCACCAA | CAGCAAACAA | ATATATATAC | ATATATATTA | TACAAATAAC | 5760 |
AAATAAATAT | ATATGTTATA | C.AGATGGGTA | TATTGTATAT | ATTATAGATA | TTTGTTCGTC | 5820 |
CTTGGTGCAA | AGACACCCGG | TGAACCCATA | TATTGGCTCC | TGACTGCCTT | CGGTTCCCCT | 5860 |
GGGATTGGTT | ATAGGGGCAA | CACATGCAAA | CAAAACTTTC | CCTGGATTAT | ACTTAGGAGA | 5940 |
CGAAGCTACA | GATGCGTTTG | ATCCAGZiGTG | TTTTACAAGA | TTTTTCATTT | ΆΑΑΑΑΛΛΆΑΤ | 6000 |
GTGTCTTTTG | GCCCCTGATT | CCCCTCCGTC | TTCCCGTGTG | GCTGCATTGA | AAAGGTTTCC | 6060 |
TTAGGATGAA | AGGAGAGGGG | TGTCCTCTGT | CCCTAGGTGG | AGAGAAACAG | GGTCTTCTCT | 6120 |
TTCCTCCGTT | TTTTCACCTA | CCGTTTCTAT | CTCCCTCCTC | ccctctccag | CCCTGTCCTC | 6180 |
1 írGTZGAAAC | CACCCCCTCC | tccctccggc | TGTGGGGAGC | GCAGGAGCAC | GTTGGGCATC | 624 0 |
ZGGATGAGt G | GNAGACTATT | AGCGGGGCAí | GGGGGGTCCC | (ΧΜΛΜΧΜ: | GCGZvATTCAC | 6300 |
<,< T(/:c<.<.7-.t | GAGACC.AGGC | A< CGGGGGGC | GGAGGGGCCT | TGGGTGTCCG | CAGAíXíGALG | 6360 |
GGCGGGť AGA | GCCTTCCTCC | G< ATTCTAAA | CATTCACTTA | /vAGGTATGAG | TTTAHTTTCA | 6420 |
GGGGTGC TGC | TGGGAGAGCC | TCCAAATGGC | TTCTTCCAGC | CCCTGCCTGA | CAGTTCAGCT | 6480 |
( CCCTGGAAG | GTCAACTCC r | CTAGTCCTTT | CTCCTGGTTC | TGGGCAGGAC | AGAAGTGGGG | 6540 |
..gagggagag | AGAGAGAGAG | AGAGAGAGAG | ACfíGTCAGGA | TCCCCGGACC | ΓΤ(χκχ/Λ< c | 6600 |
C.i,T( AA/kAAT | AAATGAAATT | AAGATTGCC G | ACCAGAGAGA | GAACCGTGAC | AAAGGAAACG | 6660 |
GCGTTGAAAG | CAAAGAGACG | AACTGAAAGC | CCGTTCCCGT | AGGACTGGTT | ATGAGGTCAA | 6720 |
CACATTCAAA | CACAGCTTGC | TCTGGATTTT | GCTGAGCAGA | ggaagataga | GATGCATTTG | 6780 |
ATCCAAAGTG | TGTTAGATCT | TTCATTATAT | GTGTGTCTAT | ATATATAAAC | ατατατ/λατ | 6840 |
ΑΤΛΤΛΛΛί.ΛΤ | ACATAAATGT | ATGTAAATAT | ATATAATCTA | TATACATATA | ΤΑΑΑΤΑΤΛΤΑ | 6900 |
AACACATATA | TAATATATAA | ATCTATAAAC | ΛΤΑΤΑΤΑΑΤΆ | TATAAACATA | ΑΑΤΑΤΑΤΆΑΑ | 6960 |
CATATATAAT , | ΑΤΛΤΑΑΑΤΛΤ | ATTAACATAT | ATAAAATATG | ΤΑΤΛΆΑΤΑΤΆ | TATAAACATA | 7020 |
TAAACATATA | ΤΑΑΑΤΆΤΛΤΑ | AACATATAAA | TATATAAACA | ΤΛΤΆΤΑΑΑΤΛ | TATACAAACA | 7080 |
-29CZ 297640 B6
TATTGTATAT | ATATAAATAT | ATATAAAAAC | ATATATATAC | ΑΤΛΤΑΑΑΑΑΤ | ATATATAAAC | 7140 |
ATATATACAT | ATAAAGAAAT | ATATATAAAC | ATATATACAT | ATAAATATAC | ATATATAAAC | 7200 |
ATATATATAC | ATAAAATATA | TATAAACATA | TATACATATA | AAAATATATA | TATATTAACA | 7260 |
TATATATACA | ΤΑΤΑΑΑΑΑΤΛ | ΤΑΤΑΤΆΤΤΑΑ | CATATATATA | CATATAAAAA | ΤΛΤΑΤΑΤΑΤΑ | 7320 |
TTTTTGGCCC | CTGATTCCCT | TCGGTTCCTG | TGGGATGGGT | GATTGAGTCA | ACACATTCAA | 7300 |
ACACAACTTT | TCCATCGATG | TTGCTTAGGA | GATGAGGATA | CAGATGCGTT | TGATGGAGAG | 7440 |
GGTTTTACAA | GCTCTTTCAT | TTAAATATAT | ATATATATAT | ΑΤΛΤΑΤΑΤΤΤ | TTTGGCTCCT | 7500 |
GATTCTCTTC | CGTCTTCCCA | TGTGGCTGCA | TTTTAAAAGG | CTTCCCTAAG | ATCGTTACGA | 7560 |
TTAAATCAAC | CCTCCCCAGG | catctttacc | GAGGGCTGTG | GTCCCCAAAG | CGATACAGCC | 7620 |
CAGGAGGGAG | AGAGGCTTTC | GTGACTTGGA | GGAAGGACTG | TGTCCCTCCT | TAGGGCGTCT | 7680 |
GTGGCCTCAG | TGAGGGAAGG | AAGCTGCATC | AGACAGGGGT | TTCCTCGCTG | TCCACCCCTC | 7740 |
TGGCAGAAGA | TGGATTGGGC | TGCCCCGNTA | TAAATTAATG | AAAAGATTAA | AGTTTCGCTA | 7800 |
AAGGGGACAT | CGAGTTTATG | TGTCATCTCC | TGGTGNTCTG | TGTGCCNTGG | GATNCTGCAA | 7860 |
TATATCCCAN | NGCCCTTGAT | GNNNTACTGT | TTNCTATAAA | ΑΑΝΝΤΆΑΛΤΝ | TACTTGTNNA | 7920 |
ATTTAANTTC | CNNNACACTA | TTTNCTTTCC | NNGTNAGTCT | NATTANCCGA | NCGAGAGCAN | 7980 |
CGNTTAGTTN | CAGCTNGCGG | AAAATTGGTT | GTGGGGTGTG | TGCGGACCCC | NGAGNAACGC | 8040 |
CCNNTAAAAT | NAAAGACAAA | NTCNGGGGAC | AAGNCTNGGG | GGTTATCGNN | ATTGCNNAGG | 8100 |
GGTCGNCATG | ΆΑΑΛΝΤΤΤΑΑ | CGACGGTAAA | ΤΑΑΤΆΆΤΆΆΑ | AANNCAAACA | TGGGAATGNC | 8160 |
AAT A/iAAOAC | ΛΤΑΑΓΤΤί | WATCGCCGC | C A a rvzG' /V, A G | GATCCTATAG | TAAAGGCGA.G | o ·’ -> p |
TGCGCTTTGA | GGGGTCATAA | AAATCAATTA | GTTCCAACAC | CCACGTCCCG | CGTTC.AGGGG | 8280 |
acgg<x;acga | GCAGGGACAG | AAAAAGAAAC | CATATTTGAA | TCCCATCTCT | CTGTGAATTG | 8340 |
ttgggtcaca | TGCGTCTCAG | TACAGCCCGT | CCCGTGCTGT | GACCGGATAG | AGTTTCAATT | 8400 |
tactgtggaa | ATTTGCTGTA | AATAAATTGA | GCATCCGATA | GAAGCTGTTG | CTGATTAACC | 8460 |
TTTTATTTTT | AGCGTGGCCC | TGCAAAGTCG | TATCACCCAG | CTGTCAGGCT | TCTAATCGAA | 8520 |
AGTTATGAGA | CCACGGTGAG | GGGCAGGCGG | ΤΑΆΤΤΤΑΑΤΤ | ACAACAAATA | TCTTTGGGTT | ÍJS80 |
TATGGCW . | AGCTZwXATTA | AAT< >7' ΆΤΤΆ | TTCZiGTGTct | UTNAATGGNA | AATCAAAANN | 8·> 40 |
GGAAATCGCA | NTTACGGNCA | TTTGGGNNAA | ANGAAAGCGG | GGNAGTGCTC | TTTAATNGAA | 8700 |
NNGAAATAAC | TGTCTTAAGC | AGTGTCACAC | ACTTCACTTA | CCATATTCGN | GGCCTNAATT | 8760 |
GGAANNTGGA | TCGTNNGAAT | CACTCCNAAG | ACTNGATTTA | TTANGCGCTT | CACGNCAGCN | 8820 |
NGGCNTAATT | CATCHACTTN | NGTATTCTTC | ATCMNNNATT | TTTTTTTTTC | CTCTCNNGCC | 8880 |
GTGTTNNGAA | gggagagtga | ATGAGGCTTT | CCACGTTTCA | GGAGGATTTT | CTTTTTTGAA | 8940 |
AAATGCCCTT | CCAGAGGCTT | TTGGGTGGCT | GGCTTGCTTT | CTGGGCCCTG | GAGGANGACA | 9000 |
GGCGGANGAG | TCCAGGTGGG | CATGGAGAGG | CACAGTGGCA | GGTCACCTGG | ATGGTGAGTG | 9060 |
GAGGTGGAGG | TCTGAAGGCG | CCAGCTTTGG | AAATTATTGG | TGAATTTCGA | TGTCAGCACC | 9120 |
-30CZ 297640 B6
AGGNCAGGGG | CCTTTTTGGC | GGGGGTGTGA | GGGANGGATG | ANCTTTGCTG | GGAAANNCAG | 9180 |
GATCAGGTTC | TCCAGGCGCA | CTGCAGCCCG | GTAGGACCCA | CTTTGGAAAT | GAAAAGCCAG | 9240 |
TTNCCGAAAG | CTGGGCTGGA | AGCTTCCGTG | TTGGGTTCAA | GAGCAAGTTC | ACGTTGCGCT | 9300 |
GTGTAGACTC | CTGGCTGCTC | CCAAACTCTG | AGGGTTTTCT | GAGGTTCCCT | TCATAGGGGC | 9360 |
ACCGGCCCTG | GGCCATGCAC | AGTGCGTAAG | GGTGGCTGTG | GGCCGAGGGA | CCCAGCACGT | 9420 |
GTTTTGCCCA | CAACAGCCGG | AGTGACTGGT | TCACTCACCG | CCTTGGCGGA | GGACGCCTGT | 9480 |
TCTCTGGACG | AATCATTTCT | CTTGGGTGGT | GACTGCCTTG | TGGGTCAAGG | TGCAGGTTTT | 954 0 |
CTGCCACAGA | AAACCTGTTA | GGAGGAATTA | AGCGACTAAG | ACTGTCAGGG | AGGTGGTGGT | 9600 |
GGGGGANGAG | GNAGGGGGTG | GTGTCCAGAT | TACCAGGCAT | AGGCTAAACT | GCCTGCACTC | 9660 |
TCCAGCTGGT | CTGTCTGTGG | AGGAGGGGAT | TGTCAATACT | GGGAGAGCAG | AGGAGGCTCG | 9720 |
TAGGAGGTGA | GAGGGGGTGG | AATTTGCATG | CAAATCTTCA | CATGAGGCCT | GTGTGAATTT | 9780 |
CTCCAGCCTC | CTGAGGGTCC | CCTGCGCTAT | TGCACTCAAC | TTCTTGATAG | TTTACCCCAA | 9840 |
GACTCAGAAG | TCCTTAGAGG | GGCAGAATGC | CCCCACCACA | AAGCCTGCTA | TCCTTGGGCG | 9900 |
TCCTCAGGAC | CCTTGGTCAT | GAATGGGACC | CTTTCATGTA | TGGGGACCCT | TGGTAATATG | 9960 |
AATGGGACGC | CTTCAGCTCC | CCAGGGCTTC | CGAGGAGGCC | GAGAAGGGCA | AAGACACTTC | 10020 |
CGAGGAGGCC | GAGAAGGGCA | AAGACATTTT | CTGGGCTTGG | TGTGTCAAGA | GCTAGATTGG | 10080 |
AGAAGGGGCT | GGATTTGGAA | CTCTTTAGCC | ATCAGCTCAC | CCTCTCCGTT | TGTGGCTAAA | 10140 |
GTCTGAAGGT | GGAAACTTCG | GTTCTCCTAC | AGGGTCTACA | GGAGTTGGGG | GGCGGGGCGC | 10200 |
CCACACAGAA | CGCTGGAAAG | TTCGACAGTC | CACTTCCACT | GGCTCGGAAC | TCACTTTTTC | 10260 |
ACCTTAAGTT | CATCAGCGGT | AACGCATAGG | TCTCACTTAG | GCAGGGCACG | GATGATTTAA | 10320 |
gziatttctac | TTCTAGGTCzT | GGTGCGGTGG | CTCACACCTC | TAATCCCAGC | ACTTTG<>GAG | 10380 |
GCCCAGGAGG | GTGGATCGCT | TGAGGTCAGG | AGTTTGAGAC | CAGCCTGGCC | AACATGGTGA | 10440 |
AACCCCGTCT | CTACTAAAAT | ACGAAAATTA | GCCAGGCATG | GTGGTGAGCA | CCTGTAATTC | 10500 |
CAGCTACTCG | GGAGC,CTGAG | gcaggagaat | CGC.TTGAACC | TGGGAGGTGG | ACGTTGCAGT | 10560 |
GAGGTGAGAT | CACACCACTG | CACTCCAGCC | TGGATGAGAG | AGCAAGACTC | TGTCTCAAAA | 10620 |
ACAAAATAAA | ACAAAAACAA | AACAAAAATC | aaaaaagaaa | ACCCAATTTC | cagttctaLg | 10680 |
CCAGGTGCAG | TGGCTCACGC | CTGTCATCCC | AGCACTTTGG | GAGGCCCAGG | AGGGTGGATC | 10740 |
GCTTGAGGTC | AGGAGTTCGA | GACCAGCCTG | GCCAACATGG | TGAAACCCCA | TCTTTACTAA | 10800 |
AAATACAAAC | GTTAGCTGGG | TGTGGTGGTG | TGCGCCTGTA | ATCCCAGCTA | CTCGGGAAGC | 10860 |
TGAGGCTGGA | GAATTGCTTG | AATCTGGGAG | GTGGAGGTTG | CAGGGAGGCG | AGATAGTGCC | 10920 |
ACTGCAGTCC | AGCCTGGACC | AGAGAGCAAG | ACTCCGTCTC | AAAAACAAAA | GAAAGCAAAA | 10980 |
ACAAAAAACA | AGAGACCAGC | CTGGCCAACA | TGGTGAAACC | GCGTCTTTAC | TAAAATACAA | 11040 |
AATTAGCCGG | GCATGGTGGT | GGGCACCTGT | AGTCCCAGCT | ACTCGGGAGG | CTGAGGCAGG | 11100 |
-31 CZ 297640 B6
AGAATGGCTT | GAACCTGGGA | GGTGGAGCTT | GCAGTGAGCC | GAGATAGTGC | CACTGCACTC | 11160 |
CAGCCTGGGC | GACAGAGCGA | GACTTGATTT | CAGAACCACC | ACCACCACAA | CAAAACAAAA | 11220 |
CAAAAAATCC | AAAAAAACCC | CAATTTCCAG | TACTAGGTAG | TCAGTGATGC | AGGGCTGGAG | 11280 |
ACAGAGGGGC | GGTAAGTGTC | TGGGCGCCCA | CCATCAGTCA | CCTCCCAGCT | CCCANGAGGT | 11340 |
GCAAAGTGCT | TGGTTCAGCC | TCATGGGAAG | GATGCTCCCT | GGGGAGGCTG | GGCTGGGTTC | 11400 |
ACAGGGCTCT | TCACATCTCT | CTCTGCTTCT | NCCCCAAGGT | TTGGTTNCCA | GAACCGGAGA | 11460 |
GCCAAGTGCC | GNCAAACAAG | AGAATCAGAT | GCATAAAGGT | GGGTGTCGGG | ACTGGGGGGA | 11520 |
CCTGAAGCTG | GGGGATCCTG | CTCCAGGAGG | GATGGGGTCG | ACAAGGTGCT | GGCTACACCC | 11580 |
AGGACCACCA | CACTGACACC | TGCTCCCTTT | GGACACAGGC | GTCATCTTGG | GCACAGCCAA | 11640 |
CCACCTAGAC | GCCTGCCNGA | GTGGCACCCT | ACGTCAACAT | GGGAGCCTTA | CGGATGCCTT | 11700 |
TCCAACAGGT | AGCTCACTTT | TTCTTCCTCT | GNAAGATCCC | TAGGGACCTG | CTGCTCCCTT | 11760 |
CCCCTTTCCC | CTATTTGCTG | CCGCATCCTG | ACACTCCTAG | TCCCTCCCTG | CCCCTGCAGA | 11820 |
CTTCTCAGCT | GGCCCTTAGA | AAAAAAGCCT | CTTTTCCGAG | GAGGCATTTA | CAGGCACCTT | 11880 |
GGCACCTATG | AAATCAGGCT | GGGCCAGGCG | GGGTGGCTCA | CACCTGTCAT | CCCAGCACTT | 11940 |
TGGGAGGCCA | AGGTTAGGAG | TTTGAGACCA | GCCTGGACAA | CATAGCAAAA | GCCTGTCTCT | 12000 |
ACTAAAAATA | CAAAAAAAAA | TTAACAGGGA | GTGGTGGTGG | GGACCTGTAA | TCCCAGCTAC | 12060 |
TTGGGAGGCT | GAGGCAGGAG | AATCACTTGA | ACCCGGGAGG | CCGAGGTTGC | GGTGAGCCGA | 12120 |
GATCGTGCGA | TTGCACTCCA | GGCTGGGCGA | CAGAGTGAGA | CTCTGTCTCA | ΑΑΑΑΑΤΆΆΆΤ | 12180 |
ΛΑΆΤΆΆΆΤΆΑ | ATGTAAAAAA | ATAAAAATAG | GTCGGGCACG | GTGGGTCACG | TCTGTAATCC | 12240 |
CAíXLAGTTTG | GAAGGCCGAG | GTGGGTGGAT | GACAGGGTCA | AGAGATTGAG | ACCATCCTGG | 12300 |
< caacatggc | AAAATGCCGT | CTCTACTAAA | AAATACAAAA | ATTAGGCGGG | CGTGGTGGCG | 12360 |
GGTGCCTGTA | ATCCCAGCTA | CTUGGGAGGC | TGAGGCAGGA | GAATCGGTTG | AACCCGGGAT | 12420 |
GCGGAGGTTG | CAGTGAGCGG | AGATCACATC | ACTGCACTCC | AGGCTGGGGA | ACAAGAGCGA | 12480 |
AACTGCGTCT | TACAATAAAT | ΛΛΑΤΛβΑΤΛΑ | ATAAATAAAC | AAATAAACTT | TACTTTAGAA | 12540 |
ACAAATCIXT | GTCCG7GTTT | GTCTTTTCAC | CTGTCCTGCA | (X X3 t \AAACA A | AACATAAAAT | 12600 |
1 1 -7\A | ATAGTAGT', A | TTTCATTCCG | GGAAAAAGAA | AG”GGA i*g ΓΓ | TGCCTTCACt: | 1 'λ 660 |
CT7TCTCGTC | CTTCVTCTGG | TGCTCCTGAN | GGCCCANGGG | NAGAGGGTGG | AAAGTNCAGA | 12720 |
ggaagaaaga | CGGGGCTGGG | GGGGGGGGTC | CGTGGGGACC | GAGGGAGGCA | TGTTCCCNAT | 12780 |
TTCCNTGTCT | TCACNTTCAA | AGNAGGGGCC | CCTCGNCTCT | GGAATGAGGC | CTACGGTTTC | 12840 |
CTTTCCCNGA | AGAGTTNCCC | CTTTGTGAGC | TTACGGCTTC | GGAGTGAACC | TCGGTGCAAC | 12900 |
CTGTTATTAA | AACACACAGA | GGCTAATGCC | AGCAAAAACA | CGCUCCCCGC | TCCTGGTTTC | 12960 |
AGAGGGAAGA | AAAAAATTCA | TAAGCACGGC | CATGCTTTTC | TAATAAAAAT | TCATTAAATA | 13020 |
ATCGTTATAA | GGGATGAAGC | CGGGAGGGGA | GAGGAGAGGA | ACACAATCAA | GAGACTTTCT | 13080 |
TTGAACTTTT | TCTCCC/TGCT | TCAAATACAA | AGCAATCTTC | TGTGGGCCTG | GGCCTGGGGG | 13140 |
-32CZ 297640 B6
GTTTCCCCCT | TTCTCTGCAG | CCCATTGGGA | GGAAGAAAAT | GCTTCCCTGA | ANGTTGCTGC | 13200 |
AAAATTGTTT | CTGTTTTTCT | TTTCTTTTTC | T T T? T | TTTTTTGAGA | CGGAGTCTCG | 13260 |
CTCTGTCACC | AGGCTGGAGT | GCAATGGTAT | GATCTCAGCT | CACTGCAACC | TCCACGTTCC | 13320 |
TGTTTCAAGT | CATTCTCCTG | CCTCAGCCTC | CTGAGTAGCT | GGGACTACAG | GCGCCCGCCA | 13380 |
CCACGCCCGG | CTAGTGTTTG | TATTTTTAGA | AAAGACAGGG | TTTCCCCATG | TTGGCCAGGC | 13440 |
TGGTCTTGAA | CTCCTGTCCT | CAAGTGATCT | GCCTGCCTCG | GCCTCCCAAA | GTGCTGTGTT | 13500 |
TCTGTTTTTC | TTTCCCCGCT | TTCTTAGGAG | GCCATCGGGA | AGAATAAAAT | GGTTTCCTTG | 13560 |
AAGTTGATGC | AAAATTGTTT | CTGTTTTTCT | TTTCTCTTTT | CTTTCTTTTT | GAGATGGAGT | 13620 |
CTCGCTCTTT | CACCCAGGCT | GGAGGGCAGT | GGCGCGACCT | CGGCTCACTG | CAACCTCCGC | 13680 |
CTCCCGGGTT | CAAGCGATTC | TCCTGCCTCA | GCCTCCGGAG | TAGCTGGGAT | TACAGGCACC | 13740 |
TGCCACTATG | CCTGGCTAAT | TTTATTATTT | TTAGTAGAGA | CGGGGTTTCA | CCATGTTGGC | 13800 |
CAGGCTGGTC | TCAAACTCCT | GACCTCAGGT | GATCCGCCCG | CCTCGCCTCC | CAAAGTGATG | 13860 |
GGATGANCAG | GNCATNGAGC | NCACCGTGCC | CGGCCCTCTA | ACTCTTTACC | AGACATAAAG | 13920 |
TCTCCNNTTC | CCCTTTCTAA | ATGTATATAT | TGTGTTTTTA | AAAGTTAACA | GCAGGGATCC | 13980 |
CACCTCATTN | CCCCGCTNCT | CTCCCCAAGA | CCTGTCCTGC | ACGTTGCACA | CAGCAGGTGT | 14040 |
GCCCTGGACA | TATCCCAAAC | CCACGCTGAA | AGAAAGAGGG | TCTCACTACA | CGTATGATAT | 14100 |
CTGTGNATCC | TTTAAACATC | TCCGTGGCTT | CCAGGCAACA | CAGCCATAAA | TAGGAATCTC | 14160 |
ATGTCTGACA | TGATACCGGG | ACCATGTATG | GGNAAATTCT | MIGTGTGAAG | TTCCAGCTAC | 14220 |
CCCCGGAGAG | GGANCCATTG | CATACCCTCC | AGAAACTCCC | CTGCCGTTNC | AAGCCAAAGA | 14280 |
U AC AA< GAC AA | ACAGGNTCGG | AGAGAGGGTG | TCATTGAAAA | TCAATACGAT | CATAAGAGCA | 1 4340 |
CACAGCA.CCG | tctttctctt | CTGCCCGTTG | ATACACAATT | ATGAGCAATT | TGCTAACACT | 14400 |
GACAACTCGT | GGCAAGAACA | GGTCGTGTTG | ATACGGTTGC | CTCGTGAGGA | CCCATCTGTC | 14460 |
TTCTGGGGTC | TTGCCTGGAA | CGGAGATCGG | AGTTCAGGGT | GGCTAATAGA | ATCATTACTC | 14520 |
ACCTAGGGAC | ACAGAATNA'!’ | GAGGGTTACC | CCCAGTTAAG | TGCATACAGT | CAAACGGACG | 14580 |
GCTtJCTCTGG | AAGGTACAGT | GACGTGAACA | GCTTTTATGA | AATGCCTAGA | TCTGGACCTT | 14640 |
CCATACCTGA | GCCACCGTTC | CAAAGCACTG | GGCGTTTTTC | AGATACTTTC | ATGAGAAAřlG | 14700 |
TTGTCAACAC | CGCAAGTTTG | CAGTACACAG | TCTGAAAGAT | ATTCTTGTAT | ATGTAGATGT | 14760 |
CTGTAGATGC | CCTGAAGGTG | TGTAGACTTT | AGACACCCAG | AAGGTGTGTA | GATGTCTGTA | 14820 |
GACACCTTCT | ATGTGTGTAG | ATGTCTGTAG | ACGCCCTGCA | GGTGTGTAGA | TATATCTAGA | 14880 |
TGGTCTGCCT | GTGTATGATA | CAGGCTAAAA | AGACATTTGT | GGTGGACACT | AGTTGATTAT | 14940 |
TTAGGACTAT | GAGATGGGAA | AGGAAGNAGC | AACCAGCAGT | GAAAGGCATG | TGGTGGGTGG | 15000 |
GGGGTTGGCA | TTGCAGTGGG | GTCCTCNTGA | NGCAGGTGAC | ACCCACTATA | GGGCTGCCCT | 15060 |
TGGNATGGAC | GCTTTGTNGA | AGCTGTTTGA | TTTCACCACA | CCAAGCCTGG | AGGCACGGAC | 15120 |
-33CZ 297640 B6
ATTCCAGGAT | GGTGAGGAGT | CTGCAAAGGA | GGAGATTGGA | GGAGGTGfAA | TATCCCTAGA | 15180 |
GTACGAGAGA | TGAGATAGGA | GAGCTGTATA | AATAGCACTA | CCAGCCGGAT | GCGGTGGCTC | 15240 |
ACGCCTGTCA | TCCCAGCACT | TTAGGAGGCT | GAGGCAGGCG | GATCACCTGA | GGTCAGGAGT | 15300 |
TCCAGAACAG | CCTGGCCAAC | ACAATGAAAC | CCCATCTTTA | CTAAAAATAC | AAGATTAGCT | 15360 |
GGGCACGGTG | TCTCACGCCT | GTCATCCCTG | CACTTTGGGA | GGTCGAGGTG | CGCAGATCAT | 15420 |
GAGGTCAGTT | TGGCCAACGC | GGCGAAACCC | CGTCTCTACT | AAAAATACAA | AAAAGTAGCC | 15480 |
GGGCGTGGTG | GTGGGCACCT | GTAGTCCCAG | CTACTAGGGA | GGCTGAGGCA | GGAGAATCGC | 15540 |
TTGAACCCGG | ATGCGGACAT | TGCAGTGAGC | CGAGATC | 15577 |
(2) Informace o sekvenci SEQ ID NO: 9:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 753 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „segment genu ET92“ (xi) POPIS SEKVENCE: SEQ ID NO: 9:
CGTGGAAGCC | TGGAGTTTTT | GGGAACAGCG | TGTCCCCGCC | GAGCCTGÍXSA | GCCCGTGGGT | 60 |
TCTGGAAAGC | CTGCGGGTGT | TTGAGGACTT | TGAAGACCAG | TTTGTCAGTT | GGGCTCAATT | 120 |
CCTGGGGTTC | AGACTTAGAG | AAATGAAGGA | GGGAGAGCTG | GGGTCGTCTC | CAGGAAACGA | 180 |
TTCACTTGCíG | GGGAAGGAAT | GGAGTGTTCT | TGCAGGCACA | TGTCTGTTAG | GAGGTGAAAC | 240 |
AGAATGTGAA | ATCCACGTTG | GAGTAAGCGT | CCAGCGCTGA | ATGTAGCTCG | GGGTGGGGTG | 300 |
GGAGGGCCCT | GGTGTGGATC | GTGGAAGGAA | GAAAGACAGA | ACAGGGTGCT | AGTATTTACC | 360 |
CCGTTCCCTG | TAC.ACACCCT | GGATTTGTCA | GCTTTGCAAG | CTTCTTGGTT | GCAGCGGCCT | 420 |
TGCCTGTGCC | CCTTTGAGAC | TGTTTCCAGA | CTAAACTTCC | AAATGTCAGC | CCCTTACCCT | 480 |
TGACAGCAAG | GGACATCTCA | TTAGGGCATC | GCGTGCTTCT | CATCTGTGCT | CAGCAGGCCC | 540 |
GAGATAGGAA | CAGAGGGGCG | TTGGAGATGC | CACTTCCACC | AGCCCTGGGT | TGAAGGGGAG | 600 |
CGAGGGAGAU | ACCTTTTACT | TAAACCCCTG | AGCTTGGTCA | GAGAGGCTGA | ATGTCTAAĎXA | 660 |
TGAGGAAGAA | AAGGTTTTTC | ACCTGGAAAC | GCTTGAGGGC | TGAGTCTTCT | gcccttctga | 720 |
CTCCCCCAGC | AAATACAGAC | AGGTCACCAA | CTA | 753 |
-34CZ 297640 B6 (2) Informace o sekvenci SEQ ID NO: 10:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 1890 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina o
(A) POPIS: /popis = „SHOXa“ (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91...968 (xi) POPIS SEKVENCE: SEQ ID NO: 10:
-35CZ 297640 B6
GTGATCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA114
Met Glu Glu Leu Thr Ala Phe Val
TCC Ser | AAG Lys 10 | tct ttt | GAC Asp | CAG Gin | AAA Lys 15 | AGC Ser | AAG Lys | GAC GGT AAC | GGC Gly | GGA Gly | GGC Gly | GGA Gly | 162 | |||
Ser | Phe | Asp | Gly | Asn 20 | ||||||||||||
GGC | GGC | GGA | GGT | AAG | AAG | GAT | TCC | ATT | ACG | TAC | CGG | GAA | GTT | TTG | GAG | 210 |
Gly 25 | Gly | Gly | GJy | Lys | Lys 30 | Asp | Ser | Ile | Thr | Tyr 35 | Arq | Glu | Val | Leu | Glu 40 | |
AGC | GGA | CTG | GCG | CGC | TCC | CGG | GAG | CTG | GGG | ACC, | TCG | GAT | TCC | MX | CTC | 258 |
Ser | Gly | Leu | Ala | Arg 45 | Ser | Arg | Glu | Leu | Gly 50 | Thr | Ser | Asp | ser | Ser 55 | Leu | |
CAG | GAC | ATC | ACG | GAG | GGC | GGC | GGC | CAC | TGC | GCG | GTG | CAT | TTG | TTC | AAG | 306 |
Gin | Asp | Ile | Thr 60 | G1 u | Gly | Gly | G1 y | Hj s 65 | Cys | Pro | vai | His | Leu 70 | Phe | Lys | |
GAC | CAC | GTA | GAC | AAT | GAC | AAG | GAG | AAA | CTG | AAA | GAA | TTC | GGC | ACC | GCG | 354 |
Asp | His | val 75 | Asp | Asn | Asp | Lys | Glu 80 | Lys | Leu | Lys | Glu | Phe 85 | Gly | Thr | Ala | |
GTG | GCA | GAA | GGG | ATT | ΤΆΤ | GAA | TGC | AAA | GAG | AAG | CGC | GAG | GAC | GTG | 402 | |
Arq | Vai 9(1 | Ala | Glu | Gly | Ile | Tyr 95 | Glu | Cys | Lys | G1 u | Lys 100 | Arq | G1 u | Asp | Val | |
AAG | TCG | GAG | GAC | GAG | GAC | CX.,G | GAG | ACC | AAG | CTG | AAA | GAG | AGG | CGC | AGC | 450 |
Lys 105 | Sei | Glu | Asp | Glu | Asp 110 | Gly | Gin | Thr | Lys | Leu US | Lys | Gin | Arg | Arg | Ser 1 20 | |
CGC | ACC | AAC | TTC | ACG | CTG | GAG | CAG | CTG | AAC | GAG | CTC | GAG | CGA | crc | TTC | 498 |
Arq | Thr | Asn | Phe | Thr 125 | Leu | Glu | Gin | Leu | Asn 130 | Glu | Leu | Glu | Arg | Leu 135 | Phe | |
GAC | GAG | ACC | CAT | TAC | GCC | GAC | GCC | TTC | ATG | CGC | GAG | GAG | CTC | AGC | CAG | 546 |
Asp | Glu | Thr | His 140 | Tyr | Pro | Asp | Ala | Phe 145 | Met | Arg | Glu | Glu | Leu 150 | Ser | Gin | |
CGC | CTC, | ggg | CTC | TCC | GAG | GCG | CGC | GTG | CAG | GTT | TGG | TTC | CAG | AAC | CGG | 594 |
Arq | Leu | Gly 155 | Leu | Ser | Glu | Ala | Arg 160 | Val | Gin | Val | Trp | Phe 165 | Gin | Asn | Arg | |
AGA | GCC | AAG | TGC | CGC | AAA | CAA | GAG | AAT | CAG | ATG | CAT | AAA | GGC | GTC | ATC | 642 |
Arq | A) a 170 | Lys | Cys | Arg | Lys | Gin 175 | Glu | Asn | Gin | Met | His 180 | Lys | G1 y | Val | Ile |
-36CZ 297640 B6
TTG GGC Leu Gly 135
AAC ATG Asn Met
ACA GCC Thr Ala
GGA GCC
Gly Ala
AAC CAC Asn His
190
TTA CGG Leu Arg
CTA GAC Leu Asp
ATG CCT Met Pro
GCC TGC
Ala Cys
TTC CAA Phe Gin
CGA GTG
Arg Val
195
CAG GTC Gin val
GCA CCC Ala Pro
CAG GCT Gin Ala
TAC GTC
Tyr Val
200
CAG CTG Gin Leu
205
210
215
CAG CTG GAA GGC. GTG GCC CAC | GCG Ala | CAC CCG CAC CTG | CAC His | CCG CAC | CTG Leu | 786 | ||||||||||
Gin | Leu | Glu | Gly Val 220 | Ala | His | His 225 | Pro | His | Leu | Pro 230 | His | |||||
GCG | GCG | CAC | GCG | CCC | TAC | CTG | ATG | TTC | CCC | CCG | CCG | CCC | TTC | GGG | CTG | 834 |
Ala | Al a | His | Ala | Pro | Tyr | Leu | Mec | Phe | Pro | Pro | Pro | Pro | Phe | Gly | Leu | |
235 | 240 | 245 | ||||||||||||||
CCC | ATC | GCG | TCG | CTG | GCC | GAG | TCC | GCC | TCG | GCC | GCC | GCC | GTG | GTC | GCC | 882 |
Pro | Ile | Ala | Ser | Leu | Ala | Glu | Ser | Ala | Ser | Ala | Ala | Ala | Val | Val | Ala | |
250 | 255 | 260 | ||||||||||||||
GCC | GCC | GCC | AAA | AGC | AAC | AGC | AAG | AAT | TCC | AGC | ATC | GCC | GAC | CTG | CGG | 930 |
Aid | Ala | Ala | Lys | Ser | Asn | Ser | Lys | Asn | Ser | Ser | Ile | Ala | Asp | Leu | Arg | |
265 | 270 | 275 | 280 | |||||||||||||
CTC | AAG | GCG | CGG | AAG | CAC | GCG | GAG | GCC | CTG | GGG | CTC | TG ACCCGCCGCG | 978 | |||
Leu | Lys | Ala | Arg | Lys | His | Ala | Glu | Ala | Leu | Gly | Leu | |||||
285 | 290 |
CAGCCCCCCG | CGCGCCCGGA | CTCCCGGGCT | CCGCGCACCC | CGCCTGCACC | GCGCGTCCTG | 1038 |
CACTCAACCC | CGCCTGGAGC | TCCTTCCGCG | GCCACCGTGC | TCCGGGCACC | CCGGGAGCTC | 1098 |
CTGCAAGAGG | CCTGAGGAGG | GAGGCTCCCG | GGACCGTCCA | CGCACGACCC | AGCCAGACCC | 1158 |
TCGCGGAGAT | GGTGCAGAAG | GCGGAGCGGG | TGAGCGGCCG | TGCGTCCAGC | CCGGGCCTCT | 1218 |
CCAAGGCTGC | CCGTGCGTCC | TGGGACCCTG | GAGAAGGGTA | AACCCCCGCC | TGGCTGCGTC | 1278 |
TTCCTCTGCT | ATACCCTATG | CATGCGGTTA | ACTACACACG | TTTGGAAGAT | CCTTAGAGTC | 1338 |
TATTGAAACT | GCAAAGATCC | CGG/XGCTGGT | CTCCGATGAA | AATGCCATTT | CTTCGTTGCC | 1398 |
AACGATTTTC | TTTACTACCA | TGCTCCTTCC | TTCATCCCGA | GAGGCTGCGG | AACGGGTGTG | 1458 |
gatttgaatg | TGGACTTCGG | AATCCCAGGA | GGCAGGGGCC | GGGCTCTCCT | CCACCGCTCC | 1518 |
CCCGGAGCCT | CCCAGGCAGC | AATAAGGAAA | TAGTTCTCTG | GCTGAGGCTG | AGGACGTGAA | 1578 |
CCGCGGGCTT | TGGAAAGGGA | CXJGGAGGGAG | ACCCGAACCT | CCCACGTTGG | GACTCCCACG | 1638 |
TTCCGGGGAC | CTGAATGAGG | ACCGACTTTA | TAACTTTTCC | AGTGTTTGAT | TCCCAAATTG | 1698 |
GGTCTGGTTT | TGTTTTGGAT | TGGTATTTTT | TTTTTTTTTT | TTTTTTGCTG | TGTTACAGGA | 17S8 |
TTCAGACGCA | AAAGACTTGC | ATAAGAGACG | GACGCGTGGT | TGCAAGGTGT | CATACTGATA | 1818 |
TGCAGCATTA | ACTTTACTGA | CATGGAGTGA | AGTGCAATAT | ΤΑΤΆΑΑΤΆΤΤ | ATAGATTAAA | 1878 |
AAAAAAATAG | CA | 1890 |
-37CZ 297640 B6 (2) Informace o sekvenci SEQ ID NO: 11:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 292 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 11:
Met Glu 1 | Glu Leu Thr Ala 5 | Phe val | Ser Lys 10 | Ser | Phe Asp Gin Lys 15 | Ser | |||||||
Lys Asp | Gly Asn | Gly | Gly | Gly | Gly | Gly | Gly | Gly | Gly | Lys | Lvs | Asp | Ser |
20 | 25 | 30 | |||||||||||
Ile Thr | Tyr Arg | Glu | Val | Leu | Glu | Ser | Gly | Leu | Ala | Arg | Ser | Arg | Glu |
35 | 40 | 45 | |||||||||||
Leu Gly | Thr Ser | Asp | Ser | Ser | Leu | Gin | Asp | Ile | Thr | Glu | Gly | Gly | Gly |
90 | 55 | 60 | |||||||||||
His Cys | Pro Val | His | Leu | Phe | Lys | Asp | His | Val | Asp | Asn | Asp | Lys | Glu |
65 | 70 | 75 | 80 | ||||||||||
Lys Leu | Lys Glu | Phe | Gly | Thr | Ala | Arg | Val | Ala | Glu | Gly | Ile | Tyr | Glu |
85 | 90 | 95 | |||||||||||
Cys Lys | Glu Lys | Arg | Glu | Asp | Val | Lys | Ser | Glu | Asp | Glu | Asp | Gly | Gin |
100 | 105 | I 10 | |||||||||||
Thr Lys | Leu Lys | Gin | Arg | Arg | Ser | Arg | Thr | Asn | Phe | Thr | Leu | Glu | Gin |
115 | 120 | 125 | |||||||||||
Leu Asn | Glu Leu | Glu | Arq | Leu | Phe | Asp | Glu | Thr | His | Tyr | Pro | Asp | Ala |
110 | 135 | 140 | |||||||||||
Phe Me t | Arg Glu | G1 u | Leu | Ser | Gin | Arg | Leu | Gly | Leu | Ser | Glu | Al a | Arg |
145 | 150 | 155 | 160 | ||||||||||
Val Gin | val Trp | Phe | Gin | Asn | Arg | Arg | Al a | Lys | Cys | Arg | Lys | Gin | Glu |
165 | 170 | 175 | |||||||||||
Asn Gin | Met His | Ly3 | cly | Val | Ile | Leu | Gly | Thr | Ala | Asn | His | Leu | Asp |
180 | 185 | 190 | |||||||||||
Ala Cys | Arg Val | Al a | Pro | Tyr | val | Asii | Met | Gly | Al a | Leu | Arg | Met | Pro |
195 | 200 | 205 | |||||||||||
Phe Gin | Gin Val | Gin | Ala | Gin | Leu | Gin | Leu | Glu | Gly | Val | Ala | His | Ala |
210 | 215 | 220 | |||||||||||
His Pro | His Leu | His | Pro | His | Leu | Ala | Ala | His | Ala | Pro | Tyr | Leu | Met |
225 | 2 30 | 235 | 240 | ||||||||||
Phe Pro | Pro Pro | Pro | Phe | G1 y | Leu | Pro | Ile | Ala | Ser | Leu | Ala | Glu | Ser |
245 | 250 | 255 | |||||||||||
Ala Ser | Ala Ala | Ala | Val | Val | Ala | Al a | Ala | Ala | Lys | Ser | Asn | Ser | Lys |
2 60 | 265 | 270 | |||||||||||
Asn Ser | Ser Ile | Al a | Asp | Leu | Arg | Leu | Lys | Ala | Arg | Lys | His | Ala | Glu |
275 | 280 | 285 |
Ala Leu Gly Leu
290
-38CL 297640 B6 (2) Informace o sekvenci SEQ ID NO: 12:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 1354 párů bází s (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina io (A) POPIS:/popis = „SHOXb“ (ix) RYSY:
(A) NÁZEV/KLÍČ: cds (B) POZICE: 91..768 (xi) POPIS SEKVENCE: SEQ ID NO: 12:
GTGATCCACC CGCCGCACGG GCCGTCCTCT CCGCGCGGGG AGACGCGCGC ATCCACCAGC60
CCCGGCTGCT CGCCAGCCCC GGCCCCAGCC ATG GAA GAG CTC ACG GCT TTT GTA114
Met Glu Glu Leu Thr Ala Phe Val
295300
TCC Ser | AAG TCT TTT GAC | CAG AAA | AGC Ser | AAG Lys | GAC Asp 310 | GGT AAC GGC | GGA GGC | GGA Gly | 162 | |||||||
Lys | Ser | Phe Asp .305 | Gin | Lys | Gly | Asn | Gly | Gly | Gly 315 | |||||||
GGC | GGC | GGA | GGT | AAG | AAG | GAT | TCC | ATT | ACG | TAC | CGG | GAA | GTT | TTG | GAG | 210 |
Gly | Gly | Gly | Gly | Lys | Lys | Asp | Ser | Ile | Thr | Tyr | Arg | Glu | Val | Leu | Glu | |
320 | 325 | 330 | ||||||||||||||
AGC | GGA | CTG | <;cg | CGC | TCC | CGG | GAG | CTG | W.G | ACG | TCG | GAT | TCC | AGC | CTC | 258 |
Ser | Gly | Leu | Ala | Arg | Ser | Arg | Glu | Leu | Gly | Thr | Ser | Asp | Ser | Ser | Leu | |
335 | 340 | 345 | ||||||||||||||
CAG | GAC | ATC | ACG | GAG | GGC | GGC | GGC | CAC | TGC | CCG | GTG | CAT | TTG | TTC | AAG | 306 |
Gin | Asp | Ile | Thr | Glu | Gly | G1 y | Gly | His | Cys | Pro | Val | His | Leu | Phe | Lys | |
350 | 355 | 360 | ||||||||||||||
GAC | CAC | GTA | GAC | AAT | GAC | AAG | GAG | AAA | CTG | AAA | GAA | TTC | GGC | ACC | GCG | 354 |
Asp | H1 3 | Val | Asp | Asn | Asp | Lys | G1 u | Lys | Leu | Lys | G1 u | Phe | Gly | Thr | Al a | |
365 | 370 | 375 | 380 | |||||||||||||
AGA | GTG | GCA | GAA | GGG | ATT | TAT | GAA | TGC | AAA | GAG | AAG | CGC | GAG | GAC | GTG | 402 |
Arg | Val | Ala | Glu | Gly | Ile | Tyr | Glu | Cys | Lys | Glu | Lys | Arq | Glu | Asp | Val | |
385 | 390 | 395 | ||||||||||||||
AAG | TCG | GAG | GAC | GAG | GAC | GGG | CAG | ACC | AAG | CTG | AAA | CAG | AGG | CGC | AGC | 450 |
Lys | Ser | Glu | Asp | Glu | Asp | G1 y | Gin | Thr | Lys | Leu | Lys | Gin | Arg | Arg | Ser | |
400 | 405 | 4 10 | ||||||||||||||
CGC | ACC | AAC | TTC | ACG | CTG | GAG | GAG | CTG | AAC | GAG | CTC | GAG | CG7\ | CTC | TTC | 498 |
Arg | Thr | Asn | Phe | Thr | Leu | Glu | Gin | Leu | Asn | Glu | Leu | Glu | Arg | Leu | Phe | |
415 | 420 | 425 | ||||||||||||||
GAC | GAG | ACC | CAT | TAC | CCC | GAC | GCC | TTC | ATG | CGC | GAG | GAG | CTC | AGC | CAG | S46 |
ASp | Glu | Thr | His | Tyr | Pro | Asp | Ala | Phe | Met | Arg | Glu | Glu | Leu | Ser | Gin | |
430 | 435 | 440 | ||||||||||||||
CGC | CTG | GGG | CTC | TCC | GAG | GCG | CGC | GTG | CAG | GTT | TGG | TTC | CAG | AAC | CGG | 594 |
Arg | Leu | Gly | Leu | Ser | Glu | Al a | Arg | Val | Gin | Val | Trp | Phe | G’s n | Asn | Arg | |
14 5 | 4 50 | 455 | 4 60 |
-39CZ 297640 B6
AGA GCC AAG TGC CGC AAA CAA GAG AAT CAG ATG CAT AAA GGC GTC ATC642
Arg Ala Lys Cys Arg Lys Gin Glu Asn Gin Met His Lys Gly Val Ile
465 470475
TTG GGC ACA GCC AAC CAC CTA GAC GCC TGC CGA GTG GCA CCC TAC GTC690
Leu Gly Thr Ala Asn His Leu Asp Ala Cys Arg Val Ala Pro TyrVal
480 485490
AAC ATG GGA GCC TTA CGG ATG CCT TTC CAA CAG ATG GAG TTT TGC TCT738
Asn Met Gly Ala Leu Arg Met Pro Phe Gin Gin Met Glu Phe CysSer
495 500505
TGT CGC CCA GGC TGG AGT ATA ATG GCA TGA TCTCGACTCA CTGCAACCTC788
Cys Arg Pro Gly Trp Ser Ile Met Ala ·
S10515
CGCCTCCCGA GTTCAAGCGA TTCTCCTGCC TCAGCCTCCC GAGTAGCTGG GATTACAGGT848
GCCCACCACC ATGTCAAGAT AATGTTTGTA TTTTCAGTAG AGATGGGGTT TGACCATGTT908
GGCCAGGCTG GTCTCGAACT CCTGACCTCA GGTGATCCAC CCGCCTTAGC CTCCCAAAGT968
GCTGGGATGA CAGGCGTGAG CCCCTGCGCC CGGCCTTTGT AACTTTATTT ΤΤΛΆΤΤΤΤΤΤ1028
ΤΤΤΤΤΤΤΤΤΛ AGAAAGACAG AGTCTTGCTC TGTCACCCAG GCTGGAGCAC ACTGGTGCGA1088
TCATAGCTCA CTGCAGCCTC AAACTCCTGG GCTCAAGCAA TCCTCCCACC TCAGCCTCCT1148
GAGTAGCTGG GACTACAGGC ACCCACCACC ACACCCAGCT AATTTTTTTG ATTTTTACTA1208
GAGACGGGAT CTTGCTTTGC TGCTGAGGCT GGTCTTGAGC TCCTGAGCTC CAAAGATCCT1268
CTCACCTCCA CCTCCCAAAG TGTTAGAATT ACAAGCATGA ACCACTGCCC GTGGTCTCCA1328
AAAAAAGGAC TGTTACGTGG AAAAAA1354 (2) Informace o sekvenci SEQ ID NO: 13:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 226 aminokyselin (B) TYP: aminokyselinová (D) TOPOLOGIE: lineární io (ii) TYP MOLEKULY: protein (xi) POPIS SEKVENCE: SEQ ID NO: 13:
-40CZ 297640 B6
Met 1 | Glu | Glu | Leu Thr Ala S | Phe | Val | Ser | Lys 10 | Ser | Phe | Asp | Gin | Lys 15 | Ser | ||
Lys | Asp | Gly | Asn 20 | Gly | G1 y | G1 y | Gly | Gly 25 | Gly | G1 y | Gly | Lys | Lys 30 | Asp | Ser |
Ile | Thr | Tyr 35 | Arq | Glu | Val | Leu | Glu 40 | Ser | Gly | Leu | Ala | Arg 45 | Ser | Arg | Glu |
Leu | G1 y 50 | Thr | Ser | Asp | Ser | Ser 55 | Leu | Gin | Asp | Ile | Thr 60 | Glu | Gly | Gly | Gly |
His 65 | Cys | Pro | Val | His | Leu 70 | Phe | Lys | Asp | Hi3 | val 75 | Asp | Asn | Asp | Lys | Glu 80 |
Lys | Leu | Lys | Glu | Phe 85 | GLy | Thr | A] a | Arg | Val 90 | Ala | Glu | Gly | Ile | Tyr 95 | Glu |
Cys | Lys | Glu | Lys 100 | Arq | Glu | Asp | Val | Lys 105 | Ser | Glu | Asp | Glu | Asp 110 | Gly | Gin. r |
Thr | Lys | Leu 115 | Lys | Gin | Arg | Arq | Ser 120 | Arg | Thr | Asn | Phe | Thr 125 | Leu | Glu | Gin |
Leu | Asn 130 | Glu | Leu | Glu | Arg | Leu 135 | Phe | Asp | Glu | Thr | His 140 | Tyr | Pro | Asp | Ala |
Phe 145 | Met | Arg | Glu | Glu | Leu 150 | Ser | Gin | Arq | Leu | Gly 155 | Leu | ser | Glu | Ala | Arg 160 |
Val | Gin | Val | Trp | Phe 165 | Gin | Asn | Arg | Arg | Al a 170 | Lys | Cys | Arg | Lys | Gin 175 | Glu |
Asn | Gin | Met | His | Lys | G1 y | Val | Ile | Leu | G1 y | Thr | Ala | Asn | His | Leu | Asp |
180 185 190
Ala | Cys | Arg | Val | Ala | Pro | Tyr | Val | Asn | Met | Gly | Ala | Leu | Arg | Met | Pro |
195 | 200 | 205 | |||||||||||||
Phe | Gin | Gin | Met | Glu | Phe | cys | Ser | Cys | Arg | Pro | Gly | Trp | Ser | Ile | Met |
210 | 215 | 220 |
Ala
225 (2) Informace o sekvenci SEQ ID NO: 14:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 32367 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „kosmid: LLNOYCO3'34F5“
-41 CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 14:
TTTCTCTGTC | TCCATCCCTC | TGTCTCTCCC | TTTCTCTCTG | TCTTTCCTTG | TCTCTCTCTT | 60 |
TCTCTCTCTC | TCTCCATCTC | TCTCTCTCCC | TGTCTCTCTC | TCTCCATCTC | CCCGTCTCTC | 120 |
CGTTTCTCTC | TCTGCCTCTC | CCTGTCTGTC | TCTCTCTTTC | TGTGTCTTAC | ACACACCCCA | 180 |
ACCCACCGTC | ACTCATGTCC | CCCCACTGCT | GTGCCATCTC | ACACAAGTTC | ACAGCTCAGC | 240 |
TGTCATCCTG | GGTCCCCAGG | CCCCGCCGGG | GAGGAAGATG | CGCCGTGGGG | TTACGGGAGG | 300 |
AAGGGGACTC | CGGGCCTCCT | GGTGCCCCAC | TTTATTTGCA | GAAGGTCCTT | GGCAGGAACC | 360 |
GTGACGCGTT | TGGTTTCCAG | GACTTGGAAA | ACGAATTTCA | GGTCGCGATG | GCGAGCACCG | 420 |
(XTTCCCCTG | AAGCACATTC | AATAGCGAGA | GGCGGGAGGG | AGCGAGCAGG | AGCATCCCAC | 480 |
CATGAAAACC | AAAAACACAA | GTATTTTTTT | CACCCGGTAA | ATACCCCAGA | CGCCAGGGTG | 540 |
ACAGCGCGGC | GCTAAGGGAG | GAGGCCTCGC | gccggggtcc | GCCGGGATCT | GGCGCGGGCG | 600 |
GAAAGAATAT | AGATCTTTAC | GAACCGGATC | TCCCGGGGAC | C7GGGCTTCT | TTCTGCGGGC | 660 |
GCTGGAGACC | CGGGAGGCGG | CCCCGCGGAT | CCTCGGCCTC | CGCCGCCGCC | GCCTCCCAAG | 720 |
CGCCCGCGTC | CCGGTTTGGG | GACACCCGGC | CCCTTCTTCT | CACTTTCGGG | GATTCTCGAG | 780 |
CCGCGTTCCA | TCTCACCAAC | TCTCCATCCA | AGGGCGCGCC | GCCACCAACT | TGGAGCTCAT | 840 |
CTTCTCCCAA | GATCGTGCGT | CCCCGGGGCG | CCCGGGTCCC | CCCCCTCGCC | ATCTCAACCC | 900 |
CGGCGCGACC | cgggcgcttc | CTGGAAAGAT | CCAGGCGCCG | GGCTCTGCGC | TCCTCCCGGG | 960 |
AGCGAGGGCG | GCCGGACGAC | TGGGACCCTC | CTCTCTCCAG | CCGTGAACTC | CTTGTCTCTC | 1020 |
TGTCTCTCTC | TGCAGGAAAA | CTGGAGTTTG | CTTTTCCTCC | GGCCACGGAG | AGAACGCGGG | 1080 |
TAACCTGTGT | GGGGGGCTCG | GGCGCCTGCG | CCCCCCTCCT | GCGCGCGCGC | TCTCCCTTCC | 1140 |
AAAAATGGGA | TCTTTCCCCC | TTCGCACCAA | GGTGTACGGA | CGCCAAACAG | TGATGAAATG | 1200 |
-42CZ 297640 B6
AGAAGAAAGC | CAATTGCCGG | CCTGGGGGGT | GGGGGAGACA | CAGCGTCTCT | GCGTGCGTCC | 1260 |
GCCGCGGAGC | CCGGAGACCA | GTAATTGCAC | CAGACAGGCA | GCGCATGGGG | GGCTGGGCGA | 1320 |
GGTCGCCGCG | TATAAATAGT | GAGATTTCCA | ATGGAAAGGC | GTAAATAACA | GCGCTGGTGA | 1380 |
TCCACCCGCG | CGCACGGGCC | GTCCTCTCCG | CGCGGGGAGA | CGGGCGCATC | CACCAGCCCC | 1440 |
GGCTGCTCGC | CAGCCCCGGC | CCCAGCCATG | GAAGAGCTCA | CGGCTTTTGT | ATCCAAGTCT | 1500 |
TTTGACCAGA | AAAGCAAGGA | CGGTAACGGC | GGAGGCGGAG | GCGGCGGAGG | TAAGAAGGAT | 1560 |
TCCATTACGT | ACCGGGAAGT | TTTGGAGAGC | GGACTGGCGC | GCTCCCGGGA | GCTGGGGACG | 1620 |
TCGGATTCCA | GCCTCCAGGA | CATCACGGAG | GGCGGCGGCC | ACTGCCCGGT | gcatttgttc | 1680 |
AAGGACCACG | TAGACAATGA | CAAGGAGAAA | CTGAAAGAAT | TCGGCACCGC | GAGAGTGGCA | 1740 |
GAAGGTAAGT | TCCTTTGCGC | GCCGGCTCCA | GGGGGGCCCT | CCTGGGGTTC | GGCGCCTCCT | 1800 |
CGCCACGGAG | TCGGCCCCGC | GCGCCCCTCG | CTGTGCACAT | TTGCAGCTCC | CGTCTCGCCA | 1860 |
GGGTAAGGCC | CGGGCCGTCA | GGCTTTGCCT | AAGAAAGGAA | GGAAGGCAGG | AGTGGACCCG | 1920 |
ACCGGAGACG | CGGGTGGTGG | GTAGCGGGGT | GCGGGGGGAC | CCAGGGAGGG | TCGCAGCGGG | 1960 |
GGCCGCGCGC | GTGGGCACCG | ACACGGGAAG | GTCCCGGGCT | GGGGTGGATC | CGGGTGGCTG | 2040 |
TGCCTGAAGC | CGTAGGGCCT | GAGATGTCTT | TTTCATTTTC | TTTTTCTTTC | CTTTCCTTTT | 2100 |
TTTGTTTGTT | TGTTTGTTTG | TTTGAGACAG | AGTCTCGCTC | TGTCCCCCAG | GCTGGAGTGC | 2160 |
AGTGGTGCGA | TCTCGGCTCA | CTGCAACCTC | CGCCTCCTGG | GTTCAAGCGA | TTCTCCTGCC | 2220 |
TCAGCCTCCC | CAGTAGCTGG | GATTACAGGC | ATGCACCACC | ACGCCTGGCT | AATTTTTGTG | 2280 |
CTTTTAGTAA | AGACGGGGAT | tcaccatgtt | GGCCAGGCTG | GTCTCGAACT | CCTGACCTCA | 2340 |
GGTGATCC/3C | CCGCCTCGGC | CTCCCAAAGT | GCTGGGATGA | CAGGCGTGAG | GCACCGCGCC | 2400 |
CGGCCTGGGT | CCTGACGGCT | TAGGATGTGT | GTTTCTGTCT | CTGCCTGTCT | GCCTTGTATT | 2460 |
TACGGTCACC | CAGACGCACA | GAGGAGCCGT | CTCCACGCGC | CTTCCGAGCG | CTCAGCGCCT | 2520 |
GCCGGGCCCC | CGGAGATCAC | GGGAAGACTC | GAGGCTGCGT | GGTAGGAGAC | GGGAAGGCCC | 2580 |
CCXjGTGAGCT | CGGTTCTGTT | TCCTTTAAGG | AACCCTTCAT | TATTATTTCA | TTGTTTTCCT | 2640 |
TTGAAGGTCG | AGG-CTTGATC | TTGGCGAAAG | {.TGTTGGGTC | CATAAAAACC | ACTCCCGTGA | 2700 |
‘ . 1 »4_rZ\( r Ϊ ' Áf | CCGÍiGATCTG | ( íM 1^7* A.7* X. | gzVx;g<x.(.;:c | (z*x*j^./AAíjv, I Cj | GCGGCTTCGC | 2760 |
GÍXCGCGTCC | TAAGTCAAGG | TTGTCAGAGC | GCAGCCGGTT | GTGGGCGGCC | CGGGGGAGCT | 2820 |
CCÍXTCTGGC | CCTTCCTCCT | GAGACCTCAG | TGGTGGGTCG | TCCCGTGGTC | GAAATCGGGG | 2880 |
AGTAAGAGGC | TCAGAGAGAG | GGGCTGGCCC | CGGGGATCTC | TGTGCACACA | CGACAACTGG | 2940 |
gcggcataca | TCTTAAGAAT | AAAATGGGCT | GGCTGTGTCG | GGGGACAGCT | GGAGACGGCT | 3000 |
ATGGACGCCT | GTTATGTTTT | CATTACAAAG | ACGCAGAGAA | TCTAGCCTCG | GCTTTTGCTG | 3060 |
ATTCGCAGAG | TTGAGGTGCG | AGGGTGAATG | CCCCAAAGGT | AATTCTTCCT | AAGACTCTGG | 3120 |
GGCTACCTGC | TCTCCGGGGC | CCTGCATTTG | GGGTGTGGAG | TGGCCCCGGG | AAATAGCCCT | 3180 |
TGTATTCGTA | GGAGGCACCA | GGCAGCTTCC | CAAGGCCCTG | ACTTTGTCGA | AGCAGAAAGC | 3240 |
-43CZ 297640 B6
TGTGGCTACG | GTTTACAAAG | CAGTCCCCGG | TTTCTGACCG | TCTAAGAGGC | AGGAGCCCAG | 3300 |
CCTGCCTTTG | ACAGTGAGAG | GAGTTCCTCC | CTACACACTG | CTGCGGGCAC | CCGGCACTGT | 3360 |
AATTCATACA | CAGAGAGTTG | GCCTTCCTGG | ACGCAAGGCT | GGGAGCCGCT | TGAGGGCCTG | 3420 |
CGTGTAATTT | AAGAGGGTTC | GCAGCGCCCG | GCGGCCGCTT | CTGTGGGGTT | GCTTTTTGGT | 3460 |
TGTCCTTCGC | AGACACCGTT | TTGCTCCTCT | GAACTCTCTC | TTCTCCCCCT | GGCCGTGGAC | 3540 |
CCGGGAGAGC | AAAGTGTCCT | CCAGACCTTT | TGAAAGTGAG | AGGAAAATAA | AGACCAGGCC | 3600 |
AAAGACCCAG | GGCCACAGGA | GAGGAGACAG | AGAGTCCCCG | TTACATTTTC | CCCTTGGCTG | 3660 |
GGTGCAGAAA | GACCCCCGGG | CCAGGACTGC | CACCCAGGCT | ACTATTTATT | CATCAGATCC | 3720 |
AAGTTAAATC | GAGGTTGGAG | GGCAGGGGAG | AGTCTGAGGT | TACCGTGGAA | GCCTGGAGTT | 3780 |
TTTGGGAACA | GCGTGTCCCC | GCCGAGCCTG | GGAGCCCGTG | GGTTCTGCAA | AGCCTGCGGG | 3840 |
TGTTTGAGGA | CTTTGAAGAC | CAGTTTGTCA | GTTGGGCTCA | ATTCCTGGGG | TTCAGACTTA | 3900 |
GAGAAATGAA | GGAGGGAGAG | CTGGGGTCGT | CTCCAGGAAA | CGATTCACTT | GGGGGGAAGG | 3960 |
AATGGAGTGT | TCTTGCAGGC | ACATGTCTGT | TAGGAGGTGA | AACAGAATGT | GAAATCCACG | 4020 |
TTGGAGTAAG | CGTCCAGCGC | TGAATGTAGC | TCGGGGTGGG | GTGGGAGGGC | CCTGGTGTGG | 4080 |
ATCGTGGAAG | GAAGAAAGAC | AGAACAGGGT | GCTAGTATTT | ACCCCGTTCC | CTGTAGACAC | 4140 |
CCTGGATTTG | TCAGCTTTGC | AAGCTTCTTG | GTTGGAGCGG | CCTTGCCTGT | GCCCCTTTGA | 4200 |
GACTGTTTCC | AGACTAAACT | TCCAAATGTC | AGCCCCTTAC | CCTTGACAGC | AAGGGACATC | 4260 |
TCATTAGGGC | ATCGCGTGCT | TCTCATCTGT | GCTCAGCAGG | CCCGAGATAG | GAACAGAGGG | 4320 |
GCGTTGGAGA | TGCCACTTCC | ACCAGCCCTG | GGTTGAAGGG | GAGCGAGGGA | GACACCTTTT | 4380 |
ACTTAAACCC | CTGAGCTTC/. | TGAGAGAGGC | TGAATGTCTA | AAATGAGGAA | GAAAAGGTTT | 4 4 40 |
TTCACCTGGA | aacgcttgag | GGCTGAGTCT | TCTGCCCTTC | TGAC7CCCCC | AGCAAATACA | 4500 |
GACAGGTCAC | CAACTACTGG | AGATGAGAAA | ÚTGCCATTTT | TGGCACACTC | TGGTGGGGTA | 4 560 |
GGTGCCCGAC | CGCGTGTGAA | AAAGTGGGAA | GGAGAGATTT | CTGCGCACGG | GGTTCAGCCC | 4620 |
CCAGGCGCGG | TGGCGCATTC | AGGTACTCAG | ACGCGGTTCT | GCTGTTCTGC | TGAGAAACAG | 4680 |
GCTTCGGGTA | GGGGCTCCTA | ΤΓ··<χ : A(, | r~(GCGGAGG | GACCCCCAGC | CCTCCTGCGC | 4740 |
TGCAGCGGTG | GGGATAGCGT | CTCTCCGTAG | (VCTAGAATC | TGCAACCCGC | CCCGGGTCCT | 4800 |
CCCCGTGTCC | TTCCCGGGCG | TCCCGCCGGG | GAT C CCA CAG | TTGGCAGCTC | TTCCTCAAAT | 4860 |
TCTTTCCCTT | AAAAATAGGA | TTTGACACCC | CACTCTCCTT | AAAAAAAAAA | AATAAGAAAA | 4920 |
AAAGGTTAGG | TTATGTCAAC | AGAGGTGAAG | TGGATAATTG | AGGAAACGAT | TCTGAGATGA | 4 980 |
GGCCAAGAAA | ACAACGCTCG | TGCAAAGCCC | AGGTTTTTGG | GAAAGCAGCG | AGTATCCTCC | 5040 |
TCGGCTTTTG | CGTTATGGAC | CCCACGCAGT | TTTTGCGTCA | AAGCGCATTG | GTTTTCGAGG | 5100 |
GCCCCCTTTC | CACCGCGGGA | TGCACGAAGG | GGTTCGCCAC | GTTGCGCAAA | ACCTCCCCGG | 5160 |
CCTCAGCCCT | GTGCCCTCCG | CTCCCCACGC | AGGGATTTAT | GAATGCAAAG | AGAAGCGCGA | 5220 |
-44CZ 297640 B6
GGACGTGAAG | TCGGAGGACG | AGGACGGGCA | GACCAAGCTG | AAACAGAGGC | GCAGCCGCAC | 5280 |
CAACTTCACG | CTGGAGCAGC | TGAACGAGCT | CGAGCGACTC | TTCGACGAGA | CCCATTACCC | 5340 |
CGACGCCTTC | ATGCGCGAGG | AGCTCAGCCA | GCGCCTGGGG | CTCTCCGAGG | CGCGCGTGCA | 5400 |
GGTAGGAACC | CGGGGGCGGG | GGCGGGGGGC | CCGGAGCCAT | CGCCTGGTCC | TCGGGAGCGC | 5460 |
ACAGCACGCG | TACAGCCACC | TGCGCCCGGG | CCGCCGCCGT | CCCCTTCCCG | GAGCGCGGGG | S520 |
AGGTTGGGTG | AGGGACGGGC | TGGGGTTCCT | GGACTTTTGG | AGACGCCTGA | GGCCTGTAGG | SS80 |
ATGGGTTCAT | TGCGTTTGTT | TTTCACCAAC | AGCAAACAAA | TATATATACA | TATATATTAT | 5640 |
ACAAATAACA | AATAAATATA | TATGTTATAC | AGATGGGTAT | ATTGTATATA | TTATAGATAT | 5700 |
TTGTTCGTCC | TTGGTGCAAA | GACACCCGGT | GAACCCATAT | ATTGGCTCCT | GACTGCCTTC | 5760 |
GGTTCCCCTG | GGATTGGTTA | TAGGGGCAAC | ACATGCAAAC | AAAACTTTCC | CTGGATTATA | 5820 |
CTTAGGAGAC | GAAGCTACAG | ATGCGTTTGA | TCCAGAGTGT | TTTACAAGAT | TTTTCATTTA | 5880 |
AAAAAAAATG | TGTCTTTTGG | CCCCTGATTC | CCCTCCGTCT | TCCCGTGTGG | CTGCATTGAA | $940 |
AAGGTTTCCT | TAGGATGAAA | GGAGAGGGGT | GTCCTCTGTC | CCTAGGTGGA | GAGAAACAGG | 6000 |
GTCTTCTCTT | TCCTCCGTTT | TTTCACCTAC | CGTTTCTATC | TCCCTCCTCC | CCTCTCCAGC | 6060 |
CCTGTCCTCT | GCTACAAACC | ACCCCCTCCT | CCCTCCGGCT | GTGGGGAGCG | CAGGAGCACG | 6120 |
TTGGGCATCT | GGATGAGCGG | AGACTATTAG | CGGGGCACGG | GGGCTCCCCG | AGGAGCGCGC | 6180 |
GAATTCACGC | TGCCCCATGA | GACCAGGCAC | CGGGGGGCGG | AGGGGCCTTG | GGTGTCCGCA | 6240 |
GAGGGACGGG | CGGGCAGAGC | CTTCCTCCGC | ATTCTAAACA | TTCACTTAAA | GGTATGAGTT | 6300 |
TATTCAGGG | GTGCTGCTGG | GAGACCCTCC | .ΑΛ.ΛΤGGv.. TC. | TTCCAGCCCC | TGCCTGACAG | 6360 |
TTCAGCTCCC | CTGGAAGGTC | AACTCCTCTA | GTCCTTTCTC | CTGGTTCTGG | GCAGGACAGA | 6420 |
AGTG'X^Z,G;\ | GGGAGAGAGA | GAGAGAGAGA | GAGAGAGACG | GTCAGGATCC | CCGGACCCTG | 6480 |
GGGAACCCGT | CAAAAATAAA | TGAAATTAAG | ATTGCCGACC | AGAGAGAGAA | CCGTGACAAA | 6540 |
GCAAACGGCG | TTCAAAGCAA | AGAGACGAAC | TGAAAGCCCG | TTCCCGTAGG | ACTGGTTATG | 6600 |
AGGTCAACAC | ATTCAAACAC | AGCTTGCTCT | GGATTTTGCT | GAGCAGAGGA | AGATACAGAT | 6660 |
GCATTTGATC | CAAAGTGTGT | TACATCTTTC | ATTATATGTG | TGTCTATATA | TATAAACATA | 6720 |
ΤΑΤΑΑΑΓΛΤΑ | TAAACATACA | TAAATGTATG | TAAATATATA | T/iATCTATAT | ACATATATAA | 6780 |
ATATATAAAC | ACATATATAA | TATATAAATC | TATAAACATA | TATAATATAT | AAACATAAAT | 6840 |
ATATAAACAT | ΛΤΛΤΆΑΤΑΤΑ | ΤΛΛΑΤΑΤΑΤΤ | AACATATATA | AAATATGTAT | AAATATATAT | 6900 |
AAACATATAA | ACATATATAA | ATATATAAAC | ΑΤΛΤΑΑΑΤΑΤ | ATAAACATAT | ATAAATATAT | 6960 |
ACAAACATAT | TGTATATATA | ΤΑΑΑΤΑΤΑΤΛ | TAAAAACATA | TATATACATA | ΤΑΑΑΑΑΤΑΤΛ | 7020 |
TATAAACATA | TATACATATA | AAGAAATATA | TATAAACATA | TATACATATA | AATATACATA | 7080 |
TATAAACATA | TATATACATA | AAATATATAT | AAACATATAT | ACATATAAAA | ATATATATAT | 7140 |
ATTAACATAT | ATATACATAT | AAAAATATAT | ATATTAACAT | ATATATACAT | ATAAAAATAT | 7200 |
ATATATATTT | TTGGCCCCTG | ATTCCCTTCG | GTTCCTGTGG | GATGGGTGAT | TGAGTCAACA | 7260 |
-45 CZ 297640 B6
CATTCAAACA | CAACTTTTCC | ATCGATGTTG | CTTAGGAGAT | GAGGATACAG | ATGCGTTTGA | 7320 |
TGGAGAGGGT | TTTACAAGCT | CTTTCATTTA | AATATATATA | TATATATATA | TATATTTTTT | 7380 |
GGCTCCTGAT | TCTCTTCCGT | CTTCCCATGT | GGCTGCATTT | TAAAAGGCTT | CCCTAAGATC | 7440 |
GTTACGATTA | AATCAACCCT | CCCCAGGCAT | CTTTACCGAG | GGCTGTGGTC | CCCAAAGCGA | 7500 |
TACAGCCCAG | GAGGGAGAGA | GGCTTTGGTG | ACTTGGAGGA | AGGACTGTGT | CCCTCCTTAG | 7560 |
GGCGTCTGTG | GCCTCAGTGA | GGGAAGGAAG | CTGCATCAGA | CAGGGGTTTC | CTCGCTGTCC | 7620 |
ACC.CCTCTGG | CAGAAGATGG | ATTGGGCTGC | CCCGTATAAA | TTAATGAAAA | GATTAAAGTT | 7680 |
TCGCTAAAGG | GGACATCGAG | TTTATGTGTC | ATCTCCTGGT | GTCTGTGTGC | CTGGGATCTG | 7740 |
CAATATATCC | CAGCCCTTGA | TGTACTGTTT | CTATAAAAAT | AAATTACTTG | ΤΆΆΤΤΤΛΑΤΤ | 7800 |
CCACACTATT | TCTTTCCGTA | GTCTATTACC | GACGAGAGCA | CGTTAGTTCA | GCTGCGGAAA | 7860 |
ATTGGTTGTG | GGGTGTGTGC | GGACCCCGAG | AACGCCCTAA | AATAAAGACA | AATCGGGGAC | 7920 |
AAGCTGGGGG | TTATCGATTG | CAGGGGTCGC | ATGAAAATTT | AACGACGGTA | AATAATAATA | 7980 |
AAAACAAACA | TGGGAATGCA | ATAAAAGACA | TAATTCTCGA | TCGCCGCGGG | GGGAAAGGAT | 8040 |
CCTATAGTAA | AGGCGAGTGC | GCTTTGAGGG | GTCATAAAAA | TCAATTAGTT | CCAACACCCA | 8100 |
CGTCCCGCGT | TGAGGGGACG | GGGACGAGCA | GGGACAGAAA | AAGAAACCAT | ATTTGAATCC | 8160 |
CATCTCTCTG | TGAATTCTTG | GGTCACATGG | GTCTCAGTAC | AGCCCGTCCC | GTGCTGTGAC | 8220 |
CGGATAGAGT | TTCAATTTAC | TGTGGAAATT | TGCTGTAAAT | AAATTGAGCA | TCCGATAGAA | 8280 |
GCTGTTGCTG | ATTAACCTTT | TATTTTTAGC | GTGGCCCTGC | AAAGTCGTAT | GACCCAGCTG | 8340 |
TCAGGCTTCT | AATCGAAAGT | TATGAGACCA | CGGTGAGGGG | CAGGCGGTAA | TTTAATTACA | 8 4 00 |
ACAAATATCT | TTGGGTTTAT | GGCGCAGAGC | ΤΑΛΑΤΤΆΑΑΤ | GTCATTATTC | ACTGTCTGTA | 8460 |
A7GGAAATCA | AAAGGAAATC | GGATTACGGC | ATTTGGGAAA | GAAAGCGGGG | AGTGCTCTTT | 8520 |
AATGAAGAAA | TAACTGTGTT | AAGCAGTGTC | ACACACTTCA | CTTACCATAT | TCGGGCCTAA | 8580 |
TTGGAATGGA | TCGTGAATCA | CTCCAAGACT | GATTTATTAG | CGCTTCACGC | AGCGGCTAAT | 8640 |
TCATCACTTG | TATTCTTCAT | CATTTTTTTT | TTTCCTCTCG | CCGTGTTGAA | GGGAGAGTGA | 8700 |
ATGAGGCTTT | CCACGTTTCA | GGAGGATTTT | CTTTTTTGAA | AAATGCCCTT | CCAGAGGCTT | 8 760 |
TTGGGTGGCT | GGCTTGCTTT | CTGGGCCCTG | GAGGAGACAG | GCGGAGAGTC | CAGGTGGGCA | 8820 |
TGGAGAGGCA | CAGTGGCAGG | TCACCTGGAT | GGTCAGTGGA | GGTGGAGGTC | TGAAGGCGCC | 8880 |
agctttggaa | ATTATTGGTG | AATTTCGATG | TCAGGACCAG | GCAGGGGCCT | TTTTGGCGGG | 8940 |
GGTGTGAGGG | AGGATGACTT | TGCTGGGAAA | CAGGATCAGG | TTCTCCAGGC | GCACTGCAGC | 9000 |
CCGGTAGGAC | CCACTTTGGA | AATGAAAAGC | CAGTTCCGAA | AGCTGGGCTG | GAAGCTTCCG | 9060 |
TGTTGGGTTC | AAGAGCAAGT | TCACGTTGCG | CTGTGTAGAC | TCCTGGCTGC | TCCCAAACTC | 9120 |
TGAGGGTTTT | CTGAGGTTCC | CTTCATAGGG | GCACCGGCCC | TGGGCCATGC | ACAGTGCGTA | 9180 |
AGGGTGGCTG | TGGGCCGAGG | GACCCAGCAC | GTGTTTTGCC | CACAACAGCC | GGAGTGACTG | 9240 |
-46CZ 297640 B6
GTTCACTCAC | CGCCTTGGCG | GAGGACGCCT | GTTCTCTGGA | CGAATCATTT | CTCTTGGGTG | 9300 |
GTGACTGCCT | TGTGGGTGAA | GGTGCAGGTT | TTCTGCCACA | GAAAACCTGT | TAGGAGGAAT | 9360 |
TAAGCGACTA | AGACTGTCAG | GGAGGTGGTG | GTGGGGGAGA | GGAGGGGGTG | GTGTCCAGAT | 9420 |
TACCAGGCAT | AGGCTAAACT | GCCTGCACTC | TCCAGCTGGT | CTGTCTGTGG | AGGAGGGGAT | 9480 |
TGTCAATACT | GGGAGAGCAG | AGGAGGCTCG | TAGGAGGTGA | GAGGGGGTGG | AATTTGCATG | 9540 |
CAAATCTTCA | CATGAGGGCT | GTGTGAATTT | CTCCAGCCTC | CTGAGGGTCC | CCTGCGCTAT | 9600 |
TGCACTCAAC | TTCTTGATAG | TTTACCCCAA | GACTCAGAAG | TCCTTAGAGG | GGCAGAATGC | 9660 |
CCCCACCACA | AAGCCTGCTA | TCCTTGGGCG | TCCTCAGGAC | CCTTGGTCAT | GAATGGGACC | 9720 |
CTTTCATGTA | TGGGGACCCT | TGGTAATATG | AATGGGACGC | CTTCAGCTCC | CCAGGGCTTC | 9780 |
CGAGGAGGCC | GAGAAGGGCA | AAGACACTTC | CGAGGAGGCC | GAGAAGGGCA | AAGACATTTT | 9840 |
CTGGGCTTGG | TGTGTCAAGA | GCTAGATTGG | AGAAGGGGCT | GGATTTGGAA | CTCTTTAGCC | 9900 |
ATCAGCTCAC | CCTCTCCGTT | TGTGGCTAAA | GTCTGAAGGT | GGAAACTTCG | GTTCTCCTAC | 9960 |
AGGGTCTACA | GGAGTTGGGG | GGCGGGGCGC | CCACACAGAA | CGCTGGAAAG | TTCGACAGTC | 10020 |
CACTTCCACT | GGCTCGGAAC | TCACTTTTTC | ACCTTAAGTT | CATCAGCGGT | AACGCATAGG | 10080 |
TCTCACTTAG | GCAGGGCACG | GATGATTTAA | CAATTTCTAC | TTCTAGGTCA | GGTGCGGTGG | 10140 |
CTCACACCTC | TAATCCCAGC | ACTTTGGGAG | GCCCAGGAGG | GTGGATCGCT | TGAGGTCAGG | 10200 |
AGTTTGAGAC | CAGCCTGGCC | AACATGGTGA | AACCCCGTCT | CTACTAAAAT | ACGAAAATTA | 10260 |
GCCAGGCATG | GTGGTGAGCA | CCTGTAATTC | CAGCTACTCG | GGAGGCTGAG | GCAGGAGAAT | 10320 |
CGCTTGAACC | TGGGA^TGG | ACGTTGCA.GT | GAGGTGAGAT | CACACfACTG | CACTCTAGCC | 10380 |
TGGATGAGAG | AGCAAGACTC | TGTCTCAAAA | ACAAAATAAA | ACAAAAACAA | AACAAAAATC | 10440 |
/AAA AAAGAAA | ACCCAATTTC | CAGTTCTAGG | CCAGGTGCAG | TGGCTCACGC | CTGTCATCCC | 10500 |
AGCACTTTGG | GAGGCCCAGG | AGGGTGGATU | GCTTGAGGTC | AGGAGTTCGA | GACCAGCCTG | 10560 |
GCCAACATGG | TGAAACCCCA | TCTCTACTAA | AAATACAAAC | GTTAGCTGGG | TGTGGTGGTG | 10620 |
TGCGCCTGTA | ATCCCAGCTA | CTCGGGAAGC | TGAGGCTGGA | GAATTGCTTG | AATCTGGGAG | 10680 |
GTGGAGGTTG | <'A<Y,GAG<X.G | AGATAGTG·'C | ACTGCAGTCC | A(A'CTí.GACC | AGAGAGCAAG | 10740 |
ACTCCGT: :TC | AAAAACAAAA | GAAAÍ žCAAAA | ACAAAAAACA | AGAGACCAGC | CTGGCCAACA | 10800 |
TGGTGAAACC | :x:gtctctac | TAAAATACAA | AATTAGCCGG | GCATGGTGGT | GGGCACCTGT | 10860 |
AGTCCCAGCT | ACTCGGGAGG | CTGAGGCAGG | AGAATGGCTT | GAACCTGGGA | GGTGGAGCTT | 10920 |
GCAGTGAGCC | GAGATAGTGC | CACTGCACTC | CAGCCTGGGC | GACAGAGCGA | GACTTGATTT | 10980 |
CAGAACCACC | ACCACCACAA | CAAAACAAAA | CAAAAAATCC | AAAAAAACCC | CAATTTCCAG | 1 1040 |
TACTAGGTAG | TCAGTGATGC | AGGGCTGGAG | ACAGAGGGGC | GGTAAGTGTC | TGGGCGCCCA | 11100 |
CCATCAGTCA | CCTCCCAGCT | CCCAGAGGTG | CAAAGTGCTT | GGTTCAGCCT | CATGGGAAGG | 11160 |
ATGCTCCCTG | GGGAGGCTGG | GCTGGGTTCA | CAGGGCTCTT | CACATCTCTC | TCTGCTTCTC | 11220 |
CCCAAGGTTT | GGTTCCAGAA | CCGGAGAGCC | AAGTGCCGCA | AACAAGAGAA | TCAGATGCAT | 11280 |
-47CZ 297640 B6
AAAGGTGGGT GTCGGGACTG GGGGGACCTG AAGCTGGGGG ATCCTGCTCC AGGAGGGATG | 11340 |
GGGTCGACGA GGTGCTGGCT ACACCCAGGA CCACCACACT GACACCTGCT CCCTTTGGAC | 11400 |
ACAGGCGTCA TCTTGGGCAC AGCCAACCAC CTAGACGCCT GCCGAGTGGC ACCCTACGTC | 11460 |
AACATGGGAG CCTTACGGAT GCCTTTCCAA CAGGTAGCTC ACTTTTTCTT CCTCTGAAGA | 11520 |
TCCCTAGGGA CCTGCTGCTC CCTTCCCCTT TCCCCTATTT GCTGCCGCAT CCTGACACTC | 11580 |
CTAGTCCCTC CCTGCCCCTG CAGACTTCTC AGCTGGCCCT TAGAAAAAAA GCCTCTTTTC | 11640 |
CGAGGAGGCA TTTACAGGCA CCTTGGCACC TATGAAATCA GGCTGGGCCA GGCGGGGTGG | 11700 |
CTCACACCTG TCATCCCAGC ACTTTGGGAG GCTGAGGAGG GTGCATCACC TGAGATCAGG | 11760 |
AGTTCAAGAC CAGCCTGGCC AACTTAACGA AACCCCGTCT ΛΤΤΑΑΑΑΑΤΑ CAAAATGGGT | 11820 |
GTGGTGGCTC ACGCCTGTCA TCCCAGCACT TTGGGAGGCC GAGGGAGGTG GATCACCTGA | 11880 |
GGTCAGGAAT TCGAGACCAG CCTGACCAAC ATGCTGAAAC CCCGTCTCTA CTGAAAACAC | 11940 |
AAAGCTTAGC CGGGCGTGGT GGTGCACACC TGTGATCCCA GGTACTTGGG AGGGAGAATC | 12000 |
ACTTGAACCT GGGAGGTGGA GGTTGCCGTG AGCCAATATC GCGCCACTGC ACTCCACTCT | 12060 |
GGGTGACAGA GTGAGACTCC AAGACTCCAT CTCAAAAAAA AAAAAAAAAA TCAGGCTGTA | 12120 |
AAAATCCACT TTTGGGAAGG TGAACACACA CAAGCCCAAA CAGAAATCTG ACAAAAACCA | 12180 |
GAGGGGTGAA AAGTCCACAC AGTCAGGCAC CCCCACCTGG CTTGCTGCCT GGTTAAGAAG | 12240 |
GGCGCAGATG CCTGTGCCTG GATACCAGAG ATGGGACAGA CACCCATTCC CTTTTCATCA | 12300 |
CCACCCCCGA GTGCCCGAGG GCCTGGGGCG TCTGCCTGGC CCCTGGCCCC TGGCTTGGGC | 12360 |
TCTGCACCTC TGAACTGGAG ACACCCTACT CAGCTCCCCA CTTACTTTGG AGTGAGCAGC | 12420 |
GCTTGGGTGC CCAGCGTGGA TTTGGGGCTT CCAGGGAGTC GGGGTTCGGT CGCGGAGCCC | 12480 |
AAGCTTCCGA IXXiXtXCC.C CGCCCTGCCC TrXCTTAGTG GTGGGGATGG GATGGGGGGA | 12540 |
AACGGGGAGC TGCGTGGAAG GAGGTGAAGG GTCACAGGAG GAGAGAGCGt AGCGCCCACG | 12600 |
TGCGCCCTGC ctgaacgcgc agcgcagcgc ccggctgcgg tgccccttgc CCCTTCGGTt: | 12660 |
CCTAATTTGG GGATCGGGAG TGCATGCGCG GGCGGAACGG GCTTGGGGGG GGGGCTCTGG | J 272.0 |
GAGGGCGGAC GTGTGGCCTC CCTTCTTCAC CGTTTTATTC CAAGGGGACzX GG< :TGGGGAT | 12780 |
TGTATTTGGG ClXGTGTTTG GCTGAGGGTG CAGGGACTTG GGGGGTGGCG GTGGGGAGGG | 12840 |
CGGAAGGTAT AAACGTATAA ATCATAAGTA AACAACTCAG AAATGGACCC CGAGCGCTGG | 12900 |
TCGCCGCTAG CTCTCCAGCT CTCCCTGGCC CAGGCCCGAA GGAGAGGGGT GCGCATCCCT | 12960 |
CCGCGGTTCT CCTCTCCTGG GTACCTGGCC TTGAGGTGGG GGAACGAGCC TACTTCTTGT | 13020 |
ACCGTCTTTT GCCGACGGCG GGACCCAGTG AAATTAGGCC GTTGGAGCGC GCAGGCCTCX | 13080 |
CTGGCTTTGC GCACCGGAGT CTTGGGGACC TGGTGTCCCC GGGAAAAACT TGGGGACCTG | 13140 |
GTATCCCCGG GAGAGGCTTG GGGACCTGGT GTCCCGGGAG AGGCTTGGGT ACCTGGTTTC | 13200 |
TCTGGAAGAG GCTTGGACAC CTGGTGTCCT GGGAGGGCCT TTGGGACCTG GTGTCCTGGG | 13260 |
-48CZ 297640 B6
AGAGGCTTGG | AGATCTGTTG | TCCTGGGAGA | GGCTTGGGGA | CCTGGTGTCC | CTGGAGAGGC | 13320 |
TTGGGGACCT | GGTGACCTTG | GAGAGGCTTG | GAGACCTGGT | GTTCTGGGAG | AGGCTTGGGG | 13380 |
ACCTGGTGTT | CTGGGAGAGG | CTTGGGGACC | TGGTGTCTCT | GGAAGAGGCT | TGGACACCTG | 13440 |
GTGACCCGGG | AGGGCCTTGG | GGATCTGGTG | TCCCGGGAGA | GCCTTGGGGA | CCTGGTGTCC | 13500 |
TGGGAGAGGC | TTGGGGACCT | GGTGACCTTG | GAGAGGCTTG | GGGACCTGGT | GTCCTGAGAG | 13560 |
AGGCTTGGGG | ATCTGGTGTC | CCAGGAGAGG | CTTGGGGACC | TGGTGTCTCT | GGAAGAGGCT | 13620 |
TGGACACCTG | GTGTCCTGGG | GAGAGGCTTG | GGGACCTGGT | GTCCTGGGAG | AGGCTTGGGG | 13680 |
ACCTGGTGTC | CTGGGAGAGG | CTTGGAGATC | TGGTGAGCCG | GGAGAGGCTT | GGGGACCTGG | 13740 |
TGTCCCGGGA | GAGGCTTGGG | GACTTGGTGT | CCCGGGAGAG | GCTTGAACAC | CTGGTGTCCC | 13800 |
AGGAGAGGCT | TGGGGACCTG | GTGACCTTGG | AGAGGCCTGG | GGACCTGGTG | ACCCGGGAGA | 13860 |
GCCTTGGGGA | CCTGGTGTCC | TGGGGAGAGC | CTTGGGGACC | TGGTGACCTT | GGAGAGGCTT | 13920 |
GGGGACCTGG | TGTCTCGGGA | GTGCCTTGGG | GACCTAGTGA | CCCGGGAGAG | GCTTGGGGAC | 13980 |
CTGGTGTCCC | GGGAGAGGCT | TGGGGACCTG | GTGTCCTGGG | AGAGGCTTGG | GGATCTGGTG | 14040 |
TCCTGGGGAG | AGGCTGGGGG | ACCTGGTGTC | TCGGGAGAGA | GCCTTGGGGA | CCTGGTGACC | 14100 |
CGGGAGAGGC | TTGGACACCT | GGTGTCCCGG | GAGAGGCTTG | GGGACCTGGT | GACOCGGGAG | 14160 |
AGGCTTGGGG | ACCTGGTGTC | CTGGGGAGAG | GCTGGGGGAC | CTGGTGTCTC | GGGAGAGAGC | 14220 |
CTTGGGGACC | TGGTGACCCG | GGAGAGGCTT | GCACACCTGG | TGTCCCGGGA | GAGGCTTGGG | 14280 |
AGCCTGGTGT | CCCGGGAGAG | CCTTGGGGAC | CAGGTGACCT | TGGAGAGGCT | TGGGGACCTG | 14340 |
GTGATCTTGG | AGAíiGCTTGG | ίΧΑΓΓ'ΤΛτη | Trrc/íAGA | fGTTA.CGGGG | gctggttggg | L44OO |
GGAGAGAACG | TTGTGAGCCA | AAGTCCCTGA | ATCCCTGCGzA | AAAGAGCGCA | TCGGGAGCTC | 14460 |
CCCCTGA.GGG | CGTTCCATTT | GTGGACCCCC | CTCCCATGCG | CTTTGCAGGG | AGCTGTTCGG | 14520 |
AT TCCCCTGG | CCCGGCTCCC | GCGGATGCAT | CCAGTGGCAG | CGCCAATTCT | GGGCCAGGGG | 14580 |
(./A AGGAGGAA | AGGCGGGTGT | GGGGTGGTCT | CCACGGCTGG | AGAAGGGGCG | ACGCTCCCTA | 14640 |
GGGGAGAAGA | GGCACGTTGG | GGGTTTCCGG | GGGCGCGGGG | CGGAGCAGGC | CCCCCAGTCC | 14700 |
CCATCCTGCG | CCCTCACCCC | GCCGGGTCCG | CTCCCGCAGG | TCCAGGCTCA | GCTGCAGCTG | 14760 |
* ZG7GG | CCCACGCGCA | CCCGCACCTG | CACCCGCAC' | TGGCGGCGCA | CGCGCCCTAC | 14820 |
CTGATGTTCC | CCCCGCCGCC | CTTCGGGCTG | CCCATCGCGT | CGCTGGCCGA | GTCCGCCTCG | 14880 |
GCCGCCGCCG | TGGTCGCCGC | CGCCGCCAAA | AGCAACAGCA | AGAATTCCAG | CATCGCCGAC | 14940 |
C.TGCGGCTCA | AGGCGCGGAA | GCACGCGGAG | GCCCTGGGGC | TCTGACCCGC | CGCGCAGCCC | 15000 |
CCCGCGCGCC | CGGACTCCCG | GGCTCCGCGC | ACCCCGCCTG | CACCGCGCGT | CCTGCACTCA | 15060 |
ACCCCGCCTG | GAGCTCCTTC | CGCGGCCACC | GTGCTCCGGG | CACCCCGGGA | GCTCCTGCAA | 15120 |
GAGGCCTGAG | GAGGGAGGCT | CCCGGGACCG | TCCACGCACG | ACCCAGCCAG | ACCCTCGCGG | 15180 |
AGATGGTGCA | GAAGGCGGAG | CGGGTGAGCG | GCCGTGCGTC | CAGCCCGGGC | CTCTCCAAGG | 15240 |
CTGCCCGTGC | GTCCTGGGAC | CCTGGAGAAG | GGTAAACCCC | CGCCTGGCTG | CGTCTTCCTC | 15300 |
-49CZ 297640 B6
TGCTATACCC | TATGCATGCG | GTTAACTACA | CACGTTTGGA | AGATCCTTAG | AGTCTATTGA | 15360 |
AACTGCAAAG | ATCCCGGAGC | TGGTCTCCGA | TGAAAATGCC | ATTTCTTCGT | TGCCAACGAT | 15420 |
TTTCTTTACT | ACCATGCTCC | TTCCTTCATC | CCGAGAGGCT | GCGGAACGGG | TGTGGATTTG | 15480 |
AATGTGGACT | TCGGAATCCC | AGGAGGCAGG | GGGCGGGCTC | TCCTCCACCG | CTCCCCCGGA | 15540 |
GCCTCCCAGG | CAGCAATAAG | GAAATAGTTC | TCTGGCTGAG | GCTGAGGACG | TGAACCGCGG | 15600 |
GCTTTGGAAA | GGGAGGGGAG | GGAGACCCGA | ACCTCCCACG | TTGGGACTCC | CACGTTCCGG | 15660 |
GGACCTGAAT | GAGGACCGAC | TTTATAACTT | TTCCAGTGTT | TGATTCCCAA | ATTGGGTCTG | 15720 |
GTTTTGTTTT | GGATTGGTAT | ΤΓΤΤΤΤΤΤΤΤ | TTTTTTTTTT | GCTGTGTTAC | AGGATTCAGA | 15780 |
CGCAAAAGAC | TTGCATAAGA | GACGGACGCG | TGGTTGCAAG | GTGTCATACT | GATATGCAGC | 15840 |
ATTAACTTTA | CTGACATGGA | GTGAAGTGCA | ATATTATAAA | TATTATAGAT | ΤΆΛΑΛΑΑΑΑΑ | 15900 |
ATAGCCGTGC | ACTCTTGACC | CCGTCAACGT | CCAACGTGGA | AAAGGCGTTA | CCTCTTCTCC | 15960 |
CAGCGCTGGC | CGCCTGGCCA | CTGAGGGCCC | TTTGCAAAAA | TCACGGGTGT | AGAGATGGCC | 16020 |
CTGGGCGCGC | TGGGAGTGTG | GTTGTGTTTC | TGAAGGGGAT | AAAAGAGGGC | ACGGTGGTGC | 16080 |
CAAGATATCA | GTTTGGTACC | TGAGCTGTTT | CTGGTTGGGA | AGCGTAAAAG | CCAGGGAGAG | 16140 |
ATCCAGAGAG | TTTTCAAGTT | TTTGCAGATG | TAGGTGGTTC | CAGCTTTTCT | TTCTCCCCTA | 16200 |
CTCCATCTTC | TGCGTTCCCC | CAGTTCTTTT | ATTTCTTTGT | ΤΤΤΤΤΆΤΤΤΤ | TGAGACAGAG | 16260 |
ACTTGCTTTG | TCGCCCAGGC | TGGAGTGCAG | TGGCGCAATG | TCAGCTCACT | GCCACCTCCA | 16320 |
CCTCCCCJGGT | TCAAGCGATG | CTCCTCCCTC | AGCCTCCCGA | GTAGCTGGGA | CTACAGGCAC | 16380 |
CTGCíACGAC | CCCCGGCTAA | TTTTTTGTAT | TTATAGTAGA | GACGGGGTTT | CACCGTGTTG | 16440 |
ÍXCAGGCTCG | TCTCGAACTC | CTGACCTCAG | GTGATCTGCC | CGCCTCGGCC | TCCCAACGTG | 16500 |
crcccAGTrr | TATAAACAGC | AGATAÍXIAAC | TTGTCGTCAC | AGCTGGCATG | GGCTGGACAG | 16560 |
TTGCTTGAAA | TGACCTAACC | AAAAACATTC | AAGGGTTCTG | CCCCCAGATT | TCGGGAGATC | 16620 |
CACGTTCCAT | GTTCTGATTG | GTTTTCTGGG | AACACAGCAA | GGGGTTTGGT | GACCTCCGAG | 16680 |
AAGATCCATC | TGCATGATTG | GGATTAGTTA | CCACAGCCTG | fCCAGAGAGZ» | AACTATCTTC | 16740 |
TCCCAAGATT | TACTAACATC | CAC > i C ziA | CTGTCTTATT | TCCATAACAC | ATTTGCATCT | 16800 |
TTGTGGATTC | AAGCTTGGTG | GTTTTCTTTC | CTAACTTCTG | ATTTAGATAC | TTCTCCCTGA | 16860 |
GGTGGGGATA | AAAGAAAAAA | ZiAAAAACAAC | ttcttttttt | CTTCCGCATA | AGACTTTCTZ» | 16920 |
TCTTGTCACT | GAGCTGAACT | GTAGATCCAT | TTGGACCCGT | CTCATTTGTA | TCTTCTGATA | 16980 |
TTCTTTATAC | AAACCAAAAG | TCCCCTTCAA | CATTTTTTAT | GTCAAAATGT | TACAACCGCT | 17040 |
GTAAAATGAC | GGAGAGAGAG | AGAAAGAATC | CCAGACATTA | ACGGTATTAG | AGAGTTTGCC | 17100 |
TCATTCATCC | ATTTTTCTTA | AAAGCTGGAA | ATTAAAAAAA | AAAAAGAGAG | AGAGAGGCTT | 17160 |
TAATAGTTAA | GCTGAAATTT | TTATCGAAAA | GAAGAATTGC | ATTTTGAATC | TTTGGGAAGT | 17220 |
AGGTTCATTC | ATCAGAGTAT | GTAACCCTTT | GGAAAAGTGG | TTGGTAAGAT | ATGTACAGCC | 17280 |
-50CZ 297640 B6
CTAGATTTTT | TTTTTTTTAA | CCAAAAAGGC | TGAGTAATTT | TGAAAAATCG | AAACATAACA | 17340 |
GTGTGTCATC | ATTTCCTCCC | AAGAAAAAGC | TCACTCCACG | TGAGTAGAAA | GACATCTACC | 17400 |
TGGTCCCTGT | AGAATCTGAA | CGTTTCTCTT | TAGAGACGGA | ATTTCAATCT | TGTTGCCCAG | 17460 |
GCTGGAGTGC | AGTGGCACAA | TCTCGGCTCA | CCGCAACCTC | CGCCTCCCGG | GTTCAAGCCA | 17520 |
TTCTCCTGCC | TCAGTCTCCC | GAGTAGCTGG | GATTACAGGC | ACCTGCCACC | AGGCCTGGGT | 17580 |
AACTTTCTGG | TATTTTTAGT | AGAGACAGGG | TTTCAGCCTC | CCGAGTAGCT | GGGATTACAG | 17640 |
GCACCTGCCA | CCAGGCCTGG | GTAACTTTCT | GGTATTTTTA | GTAGAGACAG | GGTTTCAGCC | 177OQ |
TCCCGAGTAG | CTGGGATTAC | AGGCACCTGC | CACCAGGCCT | GGGTAACTTT | CTGGTAGTTT | 17760 |
TAGTAGAGAC | AGGGTTTCGG | CCTCCCGAGT | AGCTGGGATT | ACAGGCACCT | GCCACCAGGC | 17820 |
CTGGGTAACT | TTCTGGTATT | TTTAGTAGAG | ACAGGGTTTC | GGCCTCCCGA | GTAGCTGGGA | 17080 |
TTACAGGCAC | CTGCCACCAG | GCCTGGGTAA | CTTTCTGGTA | TTTTTAGTAC | AGACAGGGTT | 17940 |
TCGGCCTCCT | GAGTAGCTGG | GATTACAGGC | ACCTGCCACC | AGGCCTGGGT | AACTTTCTGG | 18000 |
TAGTTTTAGT | AGAGACAGGG | TTTCAGCCTC | CCGAGTAGCT | GGGATTACAG | GCACCTGCCA | 18060 |
CCAGGCCTGG | GTAATTTTTT | TGCATTTTTG | GTAGAGACAG | GTTTTTGCCG | TGTTGGCCCG | 18120 |
GCTGGTCTCA | AACTCCTGAC | CTCAGGTTGA | CCTGCCCGCT | TTGTCCCTCG | CAAAGTGCTG | 18180 |
GGATTACAGG | CGTGAGCCAC | CACACCTGGC | CTGAATCTGA | ACTTTTAAAA | GGGAGTTACT | 18240 |
GACTCTCAAC | TGTGCGGGGA | CGGTTTCACT | TTGATTTAAT | ATGGAAAGAG | GGCCAAGTGT | 18300 |
CATCCTCACA | AATGGGTCCC | CGAAGCAGAT | CAAACGCAGA | GAACTGTGAG | GGTGGGACAC | 18360 |
GAGTGTCTGT | GGACACTGGC | TGCCTTTGGC | TTTTCTCCTG | CGAGAGAAGT | TGGGTGACTT | 18420 |
TCTGTAGGTG | GATGAGTGAT | CCCTGAATGzX | GTGTGGGGTA | CGTGTATGCT | AGCTGCTTCT | 18480 |
TTCTCCCTGA | AACTCTCGGA | TGoAAGG/vaG | TAAGAAATTC | AGCTTGÍXX1T | <> GACCAGT T | 18540 |
CTCACCAUGA | ACGCCCTCTT | CTCTCTCCCT | tctccttcct | TCCTTCCTTX | CTTCCTTTCT | 18600 |
TTCTTTTTCT | TTCTTTCTCT | CTTTCTTTCT | TTTCTTTCTT | TCTGTTTCTT | TCCTTTTTAT | 18660 |
CTTTCTCTCT | TTTTCTTTCT | CTTTTCCTTT | TTTGTTTCTT | TCTTTCTTTT | TCTTTCTTTC | 18720 |
TTTTTCTTTC | TTCTTTCTTT | CTTCGATGAA | GTCTCACTCT | GTCACCCAGG | CTGGAGTGCA | 18780 |
< *TGGTf ιΙ-.Α/χ'; | !:ua</:tgac | TGCA'ÍC'_T: T | zTCCTCCTGGC | FTGAzV »AAAT | r:tcctgcct | > 884 0 |
CAGCCTCCCA | AGTAGCTGGG | ATGACAGGCA | CCCACCACCA | TTCCCC«GATA | ATTTTTČTAT | 18900 |
TTTTTAGTAG | AGACTGGGTT | TCGCCATGTT | GGCCAGGCTG | GTCTTGAACT | CCTGACCTCA | 18960 |
GATGATCCAC | CCGCCTCAGC | CTCCCAGAGT | GCTGGGATTA | CGGGGTGAGG | CACCGCGCCC | 19020 |
GGCCTCCTCT | CTCTTTTTCT | GAGATGTTTA | GGAAGGACTG | GGCTGATGCG | GACCCTCTGT | 19080 |
ATGTGATGTG | CGTGGGTTTG | GTTTCCCGGA | AGGCCCTCCA | GAGACACGTT | TGCGTGAACA | 19140 |
TTCAGCATGG | AAACAACATA | CGTCTCTCCA | CAGGAGGTGA | GAAATTGAAT | TTATGGGGTG | 19200 |
GGTGTACGCT | GGCGATTCTT | GGTGCTTTTT | GCTCAAAACA | AGGTTCTTTT | GAAAGTCACG | 19260 |
TTCCTGCTTT | CCCTGTGGCT | TCCCGGTGAG | CTCGCTCGCA | GAGCAAGGAA | TACCACCCAG | 19320 |
-51 CZ 297640 B6
AGAGCAACGT | GGGCTGTGTT | CCGTTGTAAC | GCCGTTGCAG | AGAGAGGATT | TGGTGTGTGA | 19380 |
GATCCGTACC | AGCTCCAGCA | CACTGATAGG | AACACGTTGC | TGGCCGAACT | GAACGATGCT | 19440 |
GGGTTGGGTC | CTGATTGATA | CGTATTTTCT | TCCCTCCTCT | CCCCAAAACT | TGGCCAAATA | 19500 |
GTCCGTGGAG | GGTTGTCAGT | CGCCGCAGTT | GAGCAAAAAA | CACTTCTTCC | TTTGAGTGGC | 19560 |
TGTTCTGGTG | AAATCTGTTT | CTGACATATC | CACTTTTCTC | TCTCTTTTCT | CTCTCTCTGA | 19620 |
CTGCGAAGCA | CCCACAGGGA | GAAGGAATTG | GATGTATCGG | ATGTTGGTAT | TAGATTTTCT | 19680 |
TTCTCCGTTC | GAGTCTCTGA | CTGGTGCATA | CTTTGCAAAG | GTGTGTTCCT | GGCAATTGCC | 19740 |
AAGAGTTAGA | AAAATGCACC | TTCTCTGGTG | GCCGTTGGGG | TGTTGTTTCA | CAGGCAGTGG | 19800 |
TGACAGGGCC | CCTTGGCTGT | GGCTGTCTTC | TCCAGCGCCG | TGGATAAAGA | GACGGGACAG | 19860 |
attctgtgcc | TCTGTACGAT | TTAGAGCGTA | ACTGACCGCG | TCCAACACCC | GTTTTTCCAC | 19920 |
TTACAAAGCT | GGTGGTGCGA | CGGGCTTGGT | GTCTCCCGTA | CGGGAAGGAG | GCCTTTGGGC | 19980 |
CGCTCCAAAG | ACGCCCTGTC | GTAGGAATGG | CCTCTCCATC | CCGCCAAAGT | CCAGCCAGGC | 20040 |
CCCCGAAATG | GTCCCATTTC | CTTGGAAGCC | TGAGTTTCTG | TTCTGGTCTT | GCTGCTGTCC | 20100 |
TTGGCCACGT | CAGCACGTGG | GAGCATCTGT | GGATACCGCA | GAGTCTGGGG | ACAGCTGGGC | 20160 |
CTTTAACCGA | AATGAAGCCG | AGACGGGTTT | GAGGTTTTGG | TGCCAAGCTC | TGGTCAGGAT | 20220 |
GAAAGGGAAA | TACCAGAGTC | CTCTGTCCTC | GCCTCTGGGT | TTCATGCTGA | CCTTTCTAAC | 20280 |
ATTTGTTTTC | CCCTAAGAAC | AAGCAGAAGC | CTCCAGCTCC | CTTTAGCTCC | ACAGTTTTCC | 20340 |
CGGGGACATA | GCGAGGATGG | CACACGGCAG | CCACTCCCAC | GACACACATT | 7CGGAGGCAC | 20400 |
''-VTGrTGCA Λ | rX.'í*rXTTGTC | TCCTCCAGCT | TGGGGAGGAG | AGAG-GCTTTC | 20460 | |
GGTGGACACG | TTTGACATTA | AAAAAAAAAA | AAAAAAAAAA | AAAAAAACTG | GTGCCTAATT | 20520 |
TATTAAAGAG | AATTAGCTTA | GCGAGTATAT | GCTGATATTC | TTCGACACAC | GTGGG7AAGT | 20580 |
TGATGCCATT | TATAAATGTT | TTATTGAAAT | TTGATATTTA | ATGA.GAAGCC | GGTTAA<X>AA | 20640 |
TGTAGACAAT | ATCCCGTTTC | AAAGCTATGA | AATGTGCTAT | TTATTGAAAG | GGGATGTGGC | 20700 |
TTCACGAGTT | CAGCCCATTG | TACGTGCAGG | TCCCGTGGGA | AGGAGGCAAA | AGCCCCTGCT | 20760 |
TCTTACTTTG | tgatgtatgt | GCATTTGTTA | TTTATTTTTT | TTTCCTTGGT | CGGACI.TTCA | 20820 |
TAAATATGTA | υΤΑΓΤΤΤΑΛΤ | TATGTCGAGT | GTAAATTTGA | CATCGCGTTG | CATT7ATTTT | 0880 |
TATATTTCTG | AAAACTGTTG | CTTTTTCTTT | TTCCCTCCCC | CATTGACGAC | ATAGCGGtcC | 20940 |
CCGCGTCCGG | GTTACAAATA | CATCTACAGA | TATTTTCAGG | GATTGCTTCA | GATGAAAACA | 21000 |
AATCACACAC | CGTTTCCCAA | ACCAACAGTC | TTCACAT7TC | TATCCCTCTG | TTATTGTCGG | 21060 |
CAGGCGGTGA | GGín »T AGAAA | AAAAACAAAC | AAACAAACAC, | AAAAAAAAAC | CAAAAAAAAC | 21120 |
CACCCTGAGT | TTCTCTGGTG | ACGCCCTCAT | TCTCCTAACG | TTCAATAATC | TCAATGTTGA | 21180 |
GTTGCAGCAA | CAGACTGTAT | TTTTGTGACG | CCCCGTAGTA | TGAATGTACA | TCTTGTAAAA | 21240 |
CTGAGATATA | AATAAACTTA | TAAATATTTG | TATTCAAGTG | TTAAAAAAAA | AAAAATTCTC | 21300 |
-52CZ 297640 B6
AACCTCTCCC | CTGAGGACAG | GCTTATTGGA AAAAAAAAAA | AAAAAAAAAA | ATCCTGAGTC | 21360 | |
GGCCGTGGCT | GAACACAGAG | TGTTGTTCTG | CTCCGTGCAT | TTCCAGGGTG | GGTACCCAGT | 21420 |
GTTGCCCCCC | AGCCTTAGAT | CGGGAGGTAC | CATTGACTTT | TGGTTGTATC | CCATCCCCTT | 21480 |
CCTTTACTGA | AACCTACCTC | CCCGCTTCTC | AGCCAACGTC | CCCCCAGAAG | GTGGCAAAAA | 21540 |
AAACAGAGGA | AAAAGCCCTG | ATTTGAATCA | AGTCAGAGCT | GCTAATTCTC | CACTTTCTTT | 21600 |
AATTAATTAA | ΤΤΤΑΤΤΓΤΤΤ | TTTTTGAGAC | TGAGTCTCGC | TCTGTCGCCC | AGGCCGGAGG | 21660 |
AGTGCAGGGG | CGCGATCTCG | GCTCACCGCG | ACCTCCGCCT | CCCGGGTTCA | AGCGACTCTC | 21720 |
CTGCCTCAGC | CTCCCGAGTA | GCTGGGATGA | CAGTCACCTG | CACCACCGCG | CCCGGCTCAT | 21780 |
TTTTGTATTT | TTAGTAGCAA | TGGGGTTTCA | CCGTGTTGGT | CAGGCTGGTC | TCGAACTCCT | 21840 |
GACCTCGTGA | TCCACCCGCG | TCTGGGCCCG | GCCGGTGATG | TGTGTGCTTT | TAACTTTTAT | 21900 |
TTTGTTCCAG | TTTTCGACAG | TGGCACGGAT | TTTCCAGCAC | GGTCTTGCAA | CXÍATGATTGA | 21960 |
GTCATTTTTG | AGACAAAAAA | ΤΑΤΆΆΤΆΑΤΆ | ATAAATGGAA | AAAGAAATCG | ACTTTTAAAA | 22020 |
ATGACAAATT | TTTTTTTTTT | TTTTTTGCAT | AGATTTTTCT | CTCTTTATGT | AAAGGAAAGT | 22080 |
TCATGATTGG | ATTTGGCCGG | CCTGACTGCT | TCCCGGCTGT | GATAAAAAAC | ACATGTGAGC | 22140 |
TGGGAGGGAA | GTGGGGGAGG | GACACAGCTG | CCCACACAGG | GTTCCCACCG | CGGTTACAGG | 22200 |
GTGGGCAGTG | CTGGGGGAGC | TTTCTCTGTG | GGGGGCTCAG | AGCCTGAGGA | CAGGTGAGCC | 22260 |
TCTCCGACAC | CTCCCCAGTT | GCCTGGAGTC | TAAACCGTCC | GTTGTCTGTA | CCGTCCGTTC | 22320 |
TTCCTGCTGA | CTCCTGGTAG | TTCCTGAAAG | CTTCTCTTGG | CCAGAGAAGG | GGTTTCAGAG | 22380 |
íx:cgtgtgtc | (_ACXX:CATTC | TGCAAAGTGC | AACTTC.ACCG | TTCCTTTCCT | TTTCTGGCCT | 22440 |
(iCGTGGTCTG | AAGCTCAGAG | CCUTCTCTTC | ACCCAGCCTG | TGTGTGTCTT | GCCGGACAGA | 22 500 |
AGmAAAA I úG | TGCTTTTTCC | GTGTTAGCAG | AGGTGCTTTT | CATGGCTGAC | CTCAACGCGT | 22560 |
CCATCTCCAG | CCTTGACCAA | GCTGTTTTTT | a<xxxx:aaac | GCAGGGAAGT | TCTGAATGCA | 22620 |
CACAGTTATT | TCATGGTTAA | ACTATTCAGC | TTTGGCCGGG | CGCAGTGTGG | CTCTCACGCC | 22680 |
TGTCATCCCA | GCACTTTGGG | AGGCCGAGGC | CXXiTGGATCA | CCTGAGGTCA | GGAGTTCGAG | 22740 |
ACCAGCCTGG | CCAACACGGT | GAAACTCTAT | CTCTACTAAA | AATAC-ΛΛΛΆΛ | TTAGCCfXXX: | 22800 |
GTGGTGGTGT | GTATCTGTAA | TCCCAGCTAC | TCAGGAAGCT | GA(X>(. AfX iAí» | AATCCX-.TTGG | 2 2860 |
ACCCAGGAGG | CGGAGGTTGC | ACTGAGCCGA | GATCGCGCCA | TTGCACTCCA | cx:ctgggí.ga | 2 2 920 |
CAGAÍXJCAGA | CGCTGTCTCA | AAAAAATGAA | ΤΑΑΤΑΑΑΑΤΛ | AAATAACAGG | AACTAAATAA | 22980 |
AATAAAACGT | TCAGCTTTGT | TCTGCAAATC | CACTCCTATT | GTTTTACGTG | GTTTGAGAGA | 23040 |
CTCTGTCCCT | TAGAAATAGA | TGTTTGTTGC | CAATTGTAAT | GAATCTGTTT | CAAAAATGAA | 23100 |
CAGAATATTC | AAATGGTTTG | AGAGATCTTT | TCCCTTAGAA | ATAGCTTGTT | GCCAATCACA | 23160 |
AAGAATGTTT | TTCAAAAATG | AATGGAATCT | TCCTGGATAT | CGCTTCCAGA | TCTTCATTTT | 23220 |
TTTTGCATAG | TTCAACCTGA | AAAGTAAGTG | TCTCAGCCCT | GAATTTCTTT | CTGATTTTTC | 23280 |
CATGGGTTGT | CTTGCAGACT | TCTCTGGACT | TGACCACATT | ΤΑΑΑΑΑΑΑΑΛ | AAAATTAACT | 23340 |
-53 CZ 297640 B6
TTTTCACACG | GACACGGTTT | CAATAGGAAT | GAGATCTTTG | AGTTTTTATG | TAACAGATTC | 23400 |
TTACCATCAG | TTCTCAGATT | CCCAAATTAC | ACACAAAAAG | ccacggactt | CGCCTCCTGC | 23460 |
TAACATGTCC | TTCTGTTTCT | GAGGCTTCTG | TTGGTGTTAG | actttcatgt | TTAATAGCAG | 23S20 |
ACAATGTAGG | GATTTAAAGA | AAAATGCAGA | gaaagcaaaa | acactgacca | AACACACGGA | 23580 |
GATAAGCTTT | CTAAAGCCTT | TGTTCTTGGA | GTTGTCGTTA | aaaaaaaaaa | GTTGTTTTAA | 23640 |
ACTTTGCAAG | CATGCCTATA | TTGAACTCAT | AAGCAAGAGA | GCCAAGAAAA | ATAGTGTCGG | 2 3700 |
TCGTCTACTC | TACACGTTTT | CCCAAAACAG | ACGTATTTTA | ATTTCTTTTG | TTTGAACTCA | 2 3760 |
CAGATGCTGA | GAGTTAAAAG | TTAAATTTTT | GTCATGAACA | ATAGTGGCCA | AAACCACAGT | 23820 |
TACTTTTGCA | CTATAGCATA | ATAAGAAAAA | TACAGGCTGG | GCTCGGTGGC | TCACACCTGT | 23880 |
AATCAAAGCA | CTTTTGGAGG | CGAAACAGCC | AGATCCCTTG | AGCCCAGGAG | ATTGAGACCA | 23940 |
GCCTCÍGGCAA | CATAGCGAGA | CCCTCATCTC | TACAAAAAAG | GTTTGTTACA | TATGTAACAA | 24000 |
ACCTGCACAT | TGTGCACATG | TACCCTAAAA | CTTAAAGTAT | ΑΑΤΛΑΤΑΑΑΑ | ΆΑΑΤΤΑΑΆΑΑ | 24060 |
AAAATTCACC | AATCAACTGC | CTGCTGGTGC | CTTCAAGAGA | CTCACCTAAC | ACATAAGGAC | 2 4120 |
TTGCATAAAC | TTATAAAACA | ATTCAATGGA | AGAATCCTTG | AAAGTATTCT | GAGAAGACAG | 24180 |
TATAATAAAC | TGATTTCTAA | AAAGGCTATA | AAAAATTGAA | TAAATCATTG | TTGGGCATCC | 24240 |
TGTGCTGAAA | TATAATGCAG | CCAATAAAAA | TTACAAAATG | AATAAACATT | TTATAACAAT | 24300 |
AAAAAAAAGT | CAAATAATTA | GGCAGGCATG | GTGGTGCTCT | CCTACGGTTG | AAGCTATTCA | 24360 |
GCAGGCAAGA | GGATACTTTG | TTTTTGTTTT | ΤΤΆΑΤΤΤΤΤΤ | TTGAGACAGA | GTCTCGCTCT | 24420 |
GTTGCCAGGC | TGGAGTGCAG | TGGCGTGATC | TCAGCTCACT | GTAATTTCTG | CCTCCCGGGT | 24480 |
TCAAGCGATT | TTCCTGCCCC | AGCCTCCCGA | GTAGCTGGGA | TTACAÍXiTGC | CCGCCACCAC | 24540 |
AC C1GG<TAA | TTTCTTTTGT | ATTTTTAGTA | gagacgaggt | TTCCCCATGT | TGGCCAGGCT | 24600 |
GGTTTTGAGC | TCCCGACCTC | GGGTGATCCA | CCCGCCTVAG | CCTCCCAAAG | TGCTGGGATG | 24660 |
ACAGGCGTGA | GCCACCGCGC | CTGGCCCAGG | aggattattt | GATCCCAGGA | GGTGGAGGCT | 24720 |
GCAGGAAGCC | ATGATTGCAC | CACTGCACTC | cagcctggct | GACAGAGTGA | GACCACATCT | 2 4 780 |
CTAAATAAAT | GAATAAATAC | AGGCAGAAAC | tttttttgtt | TTGTTTTGAT | GGAGTCTTGC | 2 4840 |
TCTGT' ACCA | A: »GAGT(» | CAGTGGTrX. t. | atc.tcagctc | ACTGCAACCT | CCACCTCCTG | 2 4 900 |
GGTTCAAGCA | ATCCTCCTGC | CTCAGCCTCC | cgagtagctg | GGATTACAGG | TGCCCGCCÁC | 2 4 960 |
CACGCCCGGC | TAATTTTTTG | TATGTTTAGT | agagacggga | TTTCACCGTG | TTAGCCAGGA | 25020 |
TGGTCTTGAT | CTCTTGACTT | TGTGATCTGC | ctgcctcagc | CTCCCAAAGT | GCTGGGATTA | 25080 |
CAGGCATGAG | CCCAGGAGTT | CAAGACCAGC | ctcagcaaca | AAGTGAGACC | TTTTCTCTCC | 25140 |
AAAAAATCAA | AAATTTAGCC | AGCTGTGGTG | gctcctgccc | GTGATCCCAG | TACTGTGGGA | 25200 |
GGCTGAGGGA | GAATTGCTTG | AGCCCAGGAG | ttcgagacca | ACCTCAGCAA | AAAGGACTCT | 25260 |
CTCTCTCTCT | CTCTCTCTCT | CTCTCTCTCT | ctctctatat | ΑΤΑΤΛΤΑΤΑΤ | ΛΤΑΤΑΤΑΤΛΤ | 25320 |
-54CZ 297640 B6
GAGTTTCAAA | AATTGCTGGG | TGACCAGCTC | ATCTACTGGT | TTTCCCCTTG | GGAAAGTGAA | 25380 |
ATTGTCATGT | ATTGAAGATT | TCCAAGGAAG | TTGTATTGAA | TGAGAAACAA | ACTCAATCTG | 25440 |
TTCGTGTTTA | AAGAGCTGCA | GTGCGTTTGC | TGTGTTTCCC | ATAAAACTGC | ACTTCCAAAA | 25500 |
GACACGCTGA | GAAAGGAGAC | CAGGATTTGT | AATTCAGAAA | TTGGAAAGCA | AGTTAGGCTG | 25560 |
GACGTGGTAG | CTCATGCTTG | TTGTAATCTC | AGCACTCTGG | GAGGCTGAGG | CAGGAGGATC | 25620 |
ACTTGAGCCC | AGGAGTTCAA | GACCAGCCCG | TGCCACATGG | TGAAACCCTG | TCTCTCCAAA | 25680 |
AAATAAAACA | TTTAGCCAGA | TGTGGTGACT | CATGCCTGTA | ATCCCGGTAT | TCTGGGAGGC | 25740 |
TGAGGCAGAG | TTGCTTGAGC | CCAGGAGTTC | AAGACCAGCC | TCGGCAACAA | AGTGAGACCC | 25800 |
TGTCTCTCCA | ΛΑΑΑΆΤΑΑΑΑ | CATTTAGCCA | GCTGTGGTGA | CTCATGCCTG | TAATCTCAGT | 25860 |
ACTCTGGGAG | GCTGGGGCAG | AATGGCTTGzA | GCCCAGGAGT | TCGAGACCAA | CCTCAGCAAC | 2S920 |
AAAGTGAGAT | CTTGTTTCTC | CAAAAAATCA | AAAATTTAGC | CAGCTGTGCT | GGCTCATGCC | 25980 |
TGTAATCCCG | GTACTCTGGG | AGGCTGAGGC | AGAATCGTTT | GAGCCCAGGA | GTTCGAGACC | 26040 |
AACCTCAGCA | ACAAAGTGAG | ATCTTGTTTC | TCCAAAAAAA | TCAAAAATTT | AGCCAGCTGT | 26100 |
GCTGGCTGGT | GCCTGTAATC | CCGGTACTCT | GGGAGGCTGA | GGCGGAATTG | CTTGAGCCCA | 2 6160 |
GGAGTTCAAG | ACCAGCCTCA | GCAACAAAGT | GAGATCTTGT | TTCTCCAAAA | AATAAAACAT | 26220 |
TTAGTCAGCT | GTGGTGGCTC | AAGCCTGTGA | TCCCAGCATT | TTGGGAGGCC | GAGGCGGGCG | 26280 |
GATCACGAGG | TCATGAGATC | GAGACCATCC | TGGCTAACAC | GGTGzAAACCC | CGTCTCTACT | 2 6340 |
AAAAATACAA | AGAAAATTAG | CCGGGCGTGG | TGGCGGGCGC | CTGTAGTCCC | ŽYGCTACTCAG | 2 6400 |
GAGGCTGAGG | CAGGAGAATG | CCGTGACX.CT | GGGAGGCGGA | CCATGCAGTG | AGTCAAGATC | 26460 |
GCGCCACTGC | CCTCCAGCCT | CACAG/ | GCAAGACTCC | GTCTGAAAAA | ΑΑΑΑΑΑΑΑΑΑ | 2 6520 |
AAAACTGCTG | CCCAACCTGT | GTTTGCACCA | CTGCCCTCCA | Cjí. ; c | CAGAGCAAGA | 2 6580 |
CTCCGTCTCA | AzAAAAAAAAA | /XATGCTGCCC | AAGCTGTGTT | TGCACCACTG | CCCTCCAGCC | 2 664 0 |
TCGGCAACAG | AGCAAGACTC | CGTCTCAAAA | ΑΑΑΑΛΑΑΑΆΑ | AAzAATGCTGC | CCAAGCTGTG | 2 6700 |
TTTGCACCAC | TGCCCTCCAG | CCTGGGCAAC | AGAGCAAGzAC | TCTGTCTCAA | z\AAAAAAAAA | 26760 |
AATGCTGCCC | AAGCTGTGTT | TGCACCACTG | CCCTCCGGCC | TGGGCAACAG | AGCAAGACTC | 26820 |
CGTCTCAAAA | ΑΆΛΑΑΑΛΛΆΑ | AATGCTGCCC | AAGCTGTGTT | TGCzACCACTG | CCCTCCAGCC | 2 6880 |
TGGGCAACAA | AGCAAGCCTC | AGCTTTCTGC | CATCTCCACzA | ACCAAGzWW. | CAATTCACAC | 26940 |
AGAAzVTCAGT | GCATCGTGCA | GTGACCTCTT | CAGAAAACCA | zVTGzTGTTTTC | cacctgagga | 27000 |
ACTGTTTCTG | AGCCCCATTC | AGAAAAACAC | ATCCCTGTAA | CTGCAGGGCA | GATTTACTCA | 27060 |
CTGTATGCCT | GTTTAAATAA | AGCTTCCAGC | CTCTGCATGC. | GGTCTGTCTG | GAAGCTCCTG | 27120 |
TATCTGTCCC | ACATTCTTGG | AATCACAATG | CACCCTTGGG | AGGAAGATAT | GTATTTAAAG | 27180 |
GGAGTGGATG | TTATGGTGAG | AAAATGCTGC | CCATCCTTCT | AGAAGACAAA | AGCCACACAA | 2724 0 |
AATACATCAC | AAGAACCAGT | TTTTTTCAGA | GAAGAACCTG | CACAAAGAAC | CTGCTCCCCC | 27300 |
CACACCCCCA | CACACAGGTG | AATTAACAGG | ATGTATGTTT | TATCATAAAA | GCACAGGTTT | 27360 |
-55 CZ 297640 B6
GTTTCCTATG | CACTCTCTGA | GGATTTGGCC | ATATGCAAAG | atgtacaaaa | ACCTTCTCTT | 27420 |
TCCCCAGGGA | ACCGTAACCC | GTCTGAAAAG | ATGCCCTTCT | CAGAAGCGAG | TTGAACGATT | 27480 |
GTTGGAAAAG | ATAAAATACG | ACGTGCACAC | ACACAGTAGA | GAAATGTCAC | CGATGCAAAT | 27540 |
TATGTGTTTG | AATGGAACAC | ATTCAGGAAG | CTAAATGGGG | TATGACCACA | CATTTGGGTT | 27600 |
GATTTATTTG | ACGAGTGGAA | GGGGCAGATG | GAAATGAATA | CTGCTGTTTT | CCTTTGGAAG | 27660 |
GCCATATATG | GGAATACCAA | GAGGATTACT | TTGGAAGTTT | AGCTTCTCCA | GGTGGTCTCT | 27720 |
CTCTCTCTCT | CTTTTTTTGA | GACAGAGTCT | CACTCTGTCA | CCCAGGCTGC | AGTGCAATGG | 27780 |
CGTGCTCTCG | GCTCACTGCA | ACCTCAGCCT | CCCAGGTACA | AGCGATTCTC | CTGCCTCAGC | 27840 |
CTCCCGAGTA | GCTGGGATCA | CAGGTGTGCA | CCACCACGCC | TGGCTAATGT | TTGTATTTTC | 27900 |
AGTAGAGATG | AGGTTTTACC | ATGTTGGCCA | GGCTGGTCTT | GAACTCCTGA | CCTCAGGTGA | 27960 |
TCCGCCTGCC | TCGGCCTCCC | AAAGTGCTGG | GATGACAGAC | ATGAGCTAGC | ACGCCCGGCC | 28020 |
CCAGGTGGTC | TTTTTAGCGG | GTATTAAAGC | AGCTTTCTCT | CTGAGCCTTA | AACCATGAAG | 28080 |
ATAGACAGAC | TCAGTGTATG | GGTTTTAGAG | TTGTAATTTT | ATAAAAATAA | GAAAAAGTCG | 28140 |
ACCTATCATT | GATGGTTAGT | ATTTTTTGTA | GCAGTTGCAT | GGAATATTAG | GATAAGGCAT | 28200 |
GTTCTCAAAA | AGAACTCTTT | TTTTTTTTTT | TTTGAGACGG | AGTCTCGCTC | TGTCACCCAG | 28260 |
GCTGGAGTGC | AGTGGGACGA | TCTCCGCTCA | CTGCAAGCTC | GTCTTCCCGG | GTTCACGCGA | 28320 |
TTCTCCTGCC | TCAGCCTCCC | CAGTAGCTGG | GACTACAGGC | GCCCGCCACC | ACGCCCGGCT | 28380 |
AATTTTTTGT | ATTTTTAGTA | GAGACGGGGT | TTCACCATGT | TAGCCAGGAA | (X.TCTCGATC | 28440 |
T*-rr AAAGTG | AGGCGTGAGC | |||||
CACTGCACTT | GGCCTTTTTT | TTTTTTTAG/A | TGGAGTTTTG | CTCTTGTCGG | CGAGGCTGGA | 28560 |
GTATAATGGC | AIGAΓC TC GA | CTCACTGCAA | CCTCCGCCTC | CCGAGTTCAA | GCCATTCTCC | 2 9 620 |
TGCCTCAGCC | TCCCGAGTAG | CTGGGATTAC | AGGTGCCGAC | CACGATGTCA | AGATAATGTT | 2 8 680 |
TGTATTTTCA | GTAGAGATGG | GGTTTGACCA | TGTTGGCCAG | GCTGGTCTCG | AACTCCTGAC | 28740 |
CTCAGGTGAT | CCACCCGCCT | TAGCCTCCGA | AAGTGCTGGG | ATGACAGGCG | TGAGCCCCTG | 28800 |
CGCCCGGCCT | TTGTAACTTT | ΑΤΤΤΤΤΆΑΤΤ | τπτττττττ | TTTAAGAAAG | ACAGAGTCTT | 28860 |
GGTCTGTCAC | 'GAGM.TGGA | GC/ií ACTCA» Γ | GCGATCATAG | CTGACTGCAG | Í_CTCAAA< ;< | 2 8920 |
CTGGGCTCAA | GCAATCCTCC | CACGTGAGCC | TCCTGAGTAG | CTCrGGACTAC | aggcaccCac | 29 980 |
CACCACACCC | AGCTAATTTT | TTTGATTTTT | ACTAGAGACG | GGATCTTGCT | TTGCTGCTGA | 29040 |
GGCTGGTCTT | gacx:tcctga | GCTCCAAAGA | tcctctcacc | TCCACCTCCC | AAAGTGTTAG | 29100 |
AATTACAAGC | atgaacgact | GCCCGTGGTC | TCCAAAAAAA | GGACTGTTAC | GTGGATGTTC | 29160 |
TACXJTTCCTG | TTCTCGTCTT | TTCTTTGTTA | ATTGTACAGT | TTGAGGGTGT | GTGTGCGTGT | 29220 |
GCGCACGTGT | GTGTGTGCAG | TCTCCTGATT | TCATGTATTT | AATTGTTATT | ACCACCACCT | 29280 |
CCATCTCTCA | TTCCTTCTTA | CCCTCACTGT | GTAAAGATAC | ATGTTGTTTT | ΤΛΑΑΤΤΤΤΑΤ | 29340 |
-56CZ 297640 B6
GTATTTATAT | TTATTTATTT | GTATTTCTGA | GACAGAGTCT | CACTCTGTTG | CCCAGGCTAG | 29400 |
TGGCATGATC | TCAGCTCACA | GCAACCTTTG | CCTCCTGGGT | TCAAGCGATT | CTCCTGCCTC | 29460 |
AGCCTCCCGA | GTAGCTGAGA | TTACAGGCAC | ACACCACCAC | ACCCGGCTAG | TTTTGTTTTG | 29520 |
AGACGGAGTC | TCGCTCTGTT | GCAGGCTGCA | GTGCAGTGGC | GTGATCCTGG | CTCACTGCAA | 29580 |
CCTCTGCCTC | CTGGATTCAA | GCGATTCTCC | TGCCTCAGCC | TCCCAAGTAG | CTGGGATTAC | 29640 |
AGGCGCCCAC | CGCCACACCT | GGCTAATTTT | TTATTGGTAG | TAGAGACGGG | GTTTCTCCAT | 29700 |
GTTGACCAGA | CTGGTCTTGA | ACTCCCAACC | TCGGGTGATC | CACCCACCTG | GGCCTCCCAA | 29760 |
AGTGCTGGGA | TGACAGGCGA | GGGCCACCGC | GTCCAGCCTT | CTTCTTCTTC | TTCTTTTTTT | 29820 |
TTTTTTTAAG | ATGGAGTTTC | ACTCTGTTGC | CCAGGCTGGA | GTGCAGTGGT | GCAATCTCGG | 29880 |
CTCCCTGCAA | CCTCCACCTC | CCAGGTTCAA | GAAATTCTTT | TGCCTCAGCC | TCCCGAGTAG | 29940 |
CTGGGACTAC | AGGTGCCCGC | CACCACACCC | ACCTAATGTT | TGTATTTTTT | TGGTAGAGAC | 30000 |
GGGGCTTCAC | CACATTGGCC | AGGCTGGTCT | TGAACTCCTC. | ACTTCAGATG | ATCCTCCTGC | 30060 |
CTCAGCCTCC | CAGAGTGTTG | GGATTACAGG | CGTGAGCCAC | GGTGCCCGGC | CAGACGTCAT | 30120 |
GTCTTAGGAA | ATCAGAAAGT | GGGTAGTTTC | CGCACTCTGA | GGAGAAAAAG | AGACGTCCGG | 30180 |
CGAAGAGAAA | GGAGAGTGAA | AGGATGTCTC | CTCTTGTCTG | TAGCCTGTTC | TCAATCGTGA | .302 40 |
GTGAGCCAAT | TGCCAGAAAC | TGAGGGTGCT | TCATTTGGCC | AGGCAAGCTT | CTCAACAGAA | 30300 |
TGTCTAAGTA | CTTGTTAATG | CTGAGAAGCT | CTCCAAGCTA | CTGCACTCCA | GCCTGGGTGA | 30360 |
CAGAGCACGA | CCTTGTCTGA | AAACAATTAA | TTAATCAATT | AATTAATATA | ATGAAATCAT | 30420 |
ACTGAACTC-A | GUAGACCATT | GGGGTGGGCA | GGGC T GGT X > T | TGGAAAGGAA | CATAAAATAT | 30480 |
GGTGCAATGG | ACTTTGCTCC | AGTCTCCCT'2 | UCCATCTCTT | CTCGCCAAGA | GTCTCTGGAG | 30540 |
GGAGCATGGG | GAAGATGCTT | TGGGAATCTG | TAACTTCTTG | TCTTGTAAAC | AGAA.TATCTA | 30600 |
AGTAATTGTT | AATGCTGAGA | AGTTATAGAT | 7 TC:.AA#\GC*. | TTTCTCCAGG | CTACGGACAA | 30660 |
GGGTCATGGG | TTACTCAGTG | TTACAGAAAG | AATGACATGG | AGATGTTTGT | TACATCTTAA | 30720 |
GGAACCATGA | GGGGCCAGAG | TATTTTACTC | TAAGTGTAGA | TGGTACATTG | GCCACGCCTG | 30780 |
TCCCAACACC | ACCAATGGTG | GCACCTAACT | TTTGTGTTTG | TGCCCCACAT | TTCTTCTTCT | 30840 |
TTTCTGACGT | AAATGCAAGT | GATATTCCTT | cx;aaac-„atg | CTGCAGCAAG | AGGCCATCTG | 10900 |
ACTACTAGTG | ATACCCTGTA | GCTCACCTAC | AGCAGCTCAC | TTGAAGCAGC | TCACCCJ>TAG | 30960 |
CTCAGGTATA | GCTCACCTGC | AGCGGCTCAC | CTGTAGCTCA | CGTC.TAGCTC | ACTTGTAGCA | 3 1020 |
GCTCACTGGT | AGCTCACCTG | CAGCAGCTCA | CCTGTACÍ.TC | ACCTGTACCT | CACCTGCAGC | 31080 |
AGCTCACCTG | TAGCTCACCT | GTACGTGAGC | CACCGTACCC | GGCCAGCAAG | ACCCCATTTC | 31140 |
ΤΛΑΑΑΤΛΛΛΤ | ACACAAAAAT | TAGCCGGACG | CGGTGGCGCG | TGTCTGTAGT | TGTAGCTACT | 31200 |
CAGGAGGCTG | AGGTGGGAGG | ATTGCTGGAG | GCTGGGAGGT | AGAGGCTGCA | GTGAACCGTG | 31260 |
ATCCAGCCAC | TGTACTCTAG | CCTGGATGAC | ATAGCAAAAC | CTTGTCTCAA | AAAACAAAAA | 31320 |
CAAAAAACAA | AACAAAGAAA | CAaACAAAAA | ACCCACACAC | ACCGGAAAAC | AAAACAAAAA | 31380 |
-57CZ 297640 B6
GCAAAAAGGA | AAGAAAAGAG | AGCCAGGTCC | CAAATATATA | TTTCCTTGGA | GAACCATTTG | 31440 |
CAAAGAGCAC | ACTTAAGGCC | GGGCGCGGTG | GCTCACGCCT | GTCATCCCGG | CACTTTGGGA | 31500 |
GGCCGAGGTG | GGTGGATCAC | GAGGTTGGGA | GATCGAGACC | ATCCTGGCCA | ACATGGCGAA | 31560 |
ACCCCATCTC | TACTAAAAAT | ACAAAAAATC | AGCCAGGTGC | TGAGGCAGGT | GCCTGTAGTC | 31620 |
CCAGCCACTC | AGGAGGCTGA | GGCAGGAGAA | TGGCATGAAC | CTGGGAGGTG | GAGGTTGCAG | 31680 |
TGAGCCGAGÁ | TCGCGCCCCT | GCACTCCAGC | CTGGGCGACA | GAGCGAGACT | CCTTCTCAAA | 31740 |
TAAATAAATA | AATAAATAAC | AAAGAGCAAA | CTTAAAATTG | TCTCAGAAAT | CCCACGGGAT | 33800 |
ATTGGATCTC | CCTCATGCCT | ATCTGATGAC | ACTTTGAGTG | TCTGGGGCCC | CGTGCCTATT | 31860 |
TTCTGGGGTT | CCCAGAAGCT | GCCGTTCTGA | AAGTGTGGCT | CTCGGGGACG | TGGCACAGGT | 31920 |
GTGGATGTCT | GTTTTAAATG | TCAGGCGTTT | GGACGTTGAG | GAACGTGAGG | CTGAAGGTCG | 31980 |
CCTTCGCCGA | CCCCCTGAGT | TTAGGGTCCT | GCCTTTTAAA | ATCTTCCCAG | CACTCTGTTG | 32040 |
TTCACGCAAG | CGTCCCATCT | GTTTGGGTGG | CCGTGCCGTC | TGCATCTGTC | TCGAACCTTC | 32100 |
ACAGCTTTGC | AGAATATCCT | GTTTCTCAAT | ACGGATGGAG | AAACACGAGA | CGCGTTTTCT | 32160 |
GGGTTATTTT | AGCCGTCACG | GAGAACCCCA | GACTCATGTG | TGCTAATGAC | CTCATTAATG | 32220 |
ATACTCTGAG | GCAGACAGCC | CTGCCTGATC | TTAACAACAT | ΤΤΤΤΤΆΑΑΤΤ | TCTTTTTTTG | 32280 |
TTGTTGTTGT | TACAGCATCA | TTCATATAAC | GTAGGAAACC | GTGATCAGTA | GCTTTTAGGA | 32340 |
TATTTGCAAC | AGGGTGTAAC | ADAAABD | 32367 |
(2) Informace o sekvenci SEQ ID NO: 15:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 806 párů bází (B) TYP: nukleová kyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: jiná nukleová kyselina (A) POPIS: /popis = „SHOT“ (ix) RYSY:
(A) NÁZEV/KLÍČ: CDS (B) POZICE: 43..615
-58CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 15:
GTGTCCCCGG | AÍXTGAAAGA | TCGCAAAGAG | GATGCGAAAG | GGATGCAGGA | CGAAGGCCAG | 60 |
ACCAAAATCA | ACXIAGAGGCG | AAGTCGGACC | AATTTCACCC | TGGAACAACT | CAATGAGGTG | 120 |
GAGAGGCTTT | TTGACGAGAC | CCACTATCCC | GACGCCTTCA | TGCGAGAGGA | ACTGAGCCAG | 180 |
CGACTGGGCC | TGTCGGAGGC | CCGAGTGCAG | GTTTGGTTTC | AAAATCGAAG | AGCTAAATGT | 240 |
AGAAAACAAG | AAAATCAACT | CCATAAAGGT | GTTCTCATAG | GGGCCGCCAG | CCAGTTTGAA | 300 |
GCTTGTAGAG | TCGCACCTTA | TGTCAACGTA | GGTGCTTTAA | GGATGCCATT | TCAGCAGGTT | 360 |
CAGGCGCACX. | TGCAGCTGGA | CAGCGCTGTG | GCGCACGCGC | ACCACCACCT | GCATCCGCAC | 420 |
CTGGCCGCGC | ACGCGCCCTA | CATGATGTTC | CCAGCACCGC | CCTTCGGACT | GCCGCTCGCC | 480 |
ACGCTGGCCG | CGGATTCGGC | TTCCGCCGCC | TCGGTAGTGG | CGGCCGCAGC | AGCCGCCAAG | 540 |
ACCACCAGCA | AGGACTCCAG | CATCGCCGAT | CTCAGACTGA | AAGCGAAAAA | GCACGCCGCA | 600 |
GCCCTGGGTC | TGTGACVCCA | ACGCCAGCAC | CAATGTCGCG | CCTGTCCCGC | GGCACTCAGC | 660 |
CTGCASNCCC | TNDDKANMCG | TTRCTYHTCM | ATTACACTTT | GGGACCYCGG | GDBAGVCCTT | 720 |
TTNNAGACTT | YVATKGGSCW | CSCTGGBCCC | TBRKGAWAC | TTGSGHYCGR | GAACCGAKHT | 780 |
GCCCABAYGA | GGACCRGTTT | GGAKDG | 806 |
(2) Informace o sekvenci SEQ ID NO: 16:
(i) CHARAKTERISTIKA SEKVENCE (A) DÉLKA: 190 aminokyselin ίο (B) TYP: aminokyselina (C) DRUH ŘETĚZCE: jednořetězcová (D) TOPOLOGIE: lineární (ii) TYP MOLEKULY: peptid
-59CZ 297640 B6 (xi) POPIS SEKVENCE: SEQ ID NO: 16:
Met 1 | Glu | Asp | Glu Gly Gin 5 | Thr | Lys | Ile | Lys 10 | Gin Arg | Arg | Ser | Arg 15 | Thr | |||
Asn | Phe | Thr | Leu | Gj u | G1 n | Leu | Asn | Glu | Leu | Glu | Arg | Leu | Phe | Asp | G1 u |
20 | 25 | 30 | |||||||||||||
Thr | His | Tyr | 1’ r. o | Asp | Ala | Phe | Mor. | Arq | Glu | Glu | Leu | Ser | Gin | Axg | Leu |
3 5 | 40 | 45 | |||||||||||||
Gly | Leu | Ser | Glu | Al a | Arg | Val | Gin | Val | Trp | Phe | Gin | Asn | Arg | Arq | AJ a |
50 | 55 | 60 | |||||||||||||
Lys | Cys | Arg | Lys | Gin | Glu | Asn | Gin | Leu | His | Lys | G1 y | Val | Leu | Ile | Gly |
65 | 70 | 75 | 80 | ||||||||||||
Ala | Al a | Se r | Gin | Phe | Glu | Ala | Cys | Arg | Val | Ala | Pro | Tyr | Val | Asn | Val |
85 | 90 | 95 | |||||||||||||
Gly | Ala | Leu | Axg | Met | Pro | Phe | Gin | Gin | Val | Gin | Al a | Gin | Leu | Gin | Leu |
100 | 105 | 110 | |||||||||||||
Asp | Ser | AJ a | Val | Ala | Hl 3 | Ala | Hl 3 | His | His | Leu | His | Pro | His | Leu | Ala |
115 | 120 | 125 | |||||||||||||
Ala | His | AJ a | Pro | Tyr | Met | Met | Phe | Pro | Ala | Pro | Pro | Phe | Gly | Leu | Pro |
110 | 135 | 140 | |||||||||||||
Leu | Ala | Thr | Leu | Ala | Ala | Asp | Ser | Ala | Sec | Ala | Ala | Ser | Val | Val | Ala |
145 | 150 | 1S5 | 160 | ||||||||||||
Al a | Ala | Ala | Al a | Ala | Lys | Thr | Thr | Ser | Lys | Asp | Ser | Ser | Ile | Ala | Asp |
165 | 170 | 175 | |||||||||||||
Leu | Arg | Leu | Lys | Ala | Lys | Lys | His | Ala | Ala | Ala | Leu | Gly | Leu | ||
180 | 185 | 190 |
PATENTOVÉ NÁROKY
Claims (28)
- PATENTOVÉ NÁROKY1. Molekula izolované nukleové kyseliny obsahující nukleotidovou sekvenci SHOX ET93 SEQ ID NO: 2 a nukleotidovou sekvenci vybranou ze skupiny sestávající z SHOX G310 - SEQ ID NO: 3, SHOX ET45 - SEQ ID NO: 4, SHOX G108 - SEQ ID NO: 5, SHOX Va - SEQ ID NO: 6 a SHOX Vb - SEQ ID NO: 7.
- 2. Molekula nukleové kyseliny podle nároku 1 obsahující nukleotidové sekvence SHOX ET93 - SEQ ID NO: 2, SHOX ET45 - SEQ ID NO: 4 a SHOX G108 - SEQ ID NO: 5.
- 3. Molekula nukleové kyseliny podle nároku 2 dále obsahující nukleotidovou sekvenci SHOX G310-SEQ IDNO: 3.
- 4. Molekula nukleové kyseliny podle nároku 3 dále obsahující nukleotidovou sekvenci SHOX Va-SEQ ID NO: 6.
- 5. Molekula nukleové kyseliny podle nároku 3 dále obsahující nukleotidovou sekvenci SHOX Vb-SEQ ID NO: 7.-60CZ 297640 B6
- 6. Molekula izolované nukleové kyseliny kódující polypeptidy obsahující oblast homeoboxu z šedesáti aminokyselin mající aminokyselinovou sekvenci SEQ ID NO: 1 a dále obsahující nukleotidovou sekvenci SHOX ET93 - SEQ ID NO: 2 a nukleotidovou sekvenci SHOX ET45 SEQ ID NO: 4.
- 7. Molekula nukleové kyseliny podle nároku 6, která kóduje polypeptid mající N-koncové a/nebo C-koncové aminokyselinové prodloužení oblasti homeoboxu z šedesáti aminokyselin SEQ ID NO: 1 a mající délku 150 až 350 aminokyselin.
- 8. Molekula nukleové kyseliny podle nároku 4, která kóduje polypeptid mající aminokyselinovou sekvenci SEQ ID NO: 11.
- 9. Molekula nukleové kyseliny podle nároku 5, která kóduje polypeptid mající aminokyselinovou sekvenci SEQ ID NO: 13.
- 10. Molekula nukleové kyseliny podle kteréhokoliv z nároků 1 až 9, přičemž molekula nukleové kyseliny je molekula genomové nukleové kyseliny.
- 11. Molekula nukleové kyseliny podle kteréhokoliv z nároků 1 až 9, přičemž molekula nukleové kyseliny je cDNA.
- 12. Molekula nukleové kyseliny podle nároku 11 obsahující nukleotidovou sekvenci SHOXa SEQ ID NO: 10.
- 13. Molekula nukleové kyseliny podle nároku 11 obsahující nukleotidovou sekvenci SHOXb SEQ ID NO: 12.
- 14. Molekula izolované nukleové kyseliny sestávající z částečné nukleotidové sekvence genu SHOX-SEQ ID NO: 8.
- 15. Molekula izolované nukleové kyseliny sestávající z částečné nukleotidové sekvence genu SHOX-SEQ ID NO: 14.
- 16. Molekula izolované nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízené hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C s tím, že sekvence - SEQ ID NO: 17, která je popsána v práci M. Marra a kol., EMBL, databázový vstup MMA59929, a sekvence SEQ ID NO: 18, která je popsána v M. Marra a kol., EMBL, databázový vstup MMA3349, jsou vyloučeny.
- 17. Polypeptid mající aminokyselinovou sekvenci - SEQ ID NO: 11.
- 18. Polypeptid mající aminokyselinovou sekvenci - SEQ ID NO: 13.
- 19. Expresní vektor nebo plazmid obsahující molekulu nukleové kyseliny podle kteréhokoliv z nároků 1 až 16.
- 20. Buňka transformovaná expresním vektorem nebo plazmidem podle nároku 19.
- 21. Transgenní živočich jiný než člověk nebo živočich jiný než člověk s deaktivovaným genem transformovaný expresním vektorem nebo plazmidem podle nárok 19.-61 CZ 297640 B6
- 22. Způsob identifikace nebo testování kandidátů farmaceutických činidel použitelných při léčbě vad vztahujících se k mutacím genu odpovídajícího za malou výšku postavy - SEQ ID NO: 8 nebo SEQ ID NO: 14, vyznačující se tím, že zahrnuje poskytnutí transformované buňky podle nároku 20 a stanovení změn fenotypu uvedených buněk nebo změn v produktech exprese uvedených buněk poté, co se uvedené buňky dostanou do kontaktu s uvedenými kandidáty farmaceutických činidel.
- 23. Použití molekuly nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekuly nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízené hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C jako primerů pro přípravu diagnostické sady pro identifikaci jednotlivců podezřelých z toho, že mají genetickou vadu v genu SHOX - SEQ ID NO: 8 nebo SEQ ID NO: 14.
- 24. Použití molekuly nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekuly nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízení hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C, jako primerů pro analýzu biologického vzorku izolovaného z lidského pacienta pro identifikaci jednotlivců podezřelých z toho, že mají genetickou vadu v genu SHOX - SEQ ID NO: 8 nebo SEQ ID NO: 14.
- 25. Použití molekuly nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekuly nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za následujících podmínek přísně řízení hybridizace: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPi a 1 % SDS při 65 °C, pro stanovení množství produktu exprese nebo sekvence z lidského genu SHOX v biologickém vzorku izolovaném z lidského pacienta pro identifikaci jednotlivců podezřelých z toho, že mají genetickou vadu v genu SHOX, přičemž tento gen SHOX má nukleotidovou sekvenci danou v SEQ ID NO: 8 nebo SEQ ID NO: 14.
- 26. Použití podle nároků 23, 24 nebo 25, ve kterém je molekula nukleové kyseliny vybrána ze skupiny sestávající z:GCA CAG CCA ACC ACC TAG;TGG AAA GGC ATC ATC CGT AAG;ATT TCC AAT GGA AAG GCG TAA ATA AC (SPI);ACG GCT ΊΤΤ GTA TCC AAG TCT ΤΊΤ G (SP2);GCC CTG TGC CCT CCG CTC CC (SP3);GGC TCT TCA CAT CTC TCT C1G CTT C (SP4);CCA CAC TG A CAC CTG CTC CCT TTG (SP5);CCC GCA GGT CCA GGC TCA GCT G (SP6);CGC CTC CGC CGT TAC CGT CCT TG (ASP1);CCC TGG AGC CGG CGC GCA AAG (ASP2);CCC CGC CCC CGC CCC CGG (ASP3);CIT CAG GTC CCC CCA GTC CCG (ASP4);CTA GGG ATC TTC AGA GGA AGA AAA AG (ASP5); aGCT GCG CGG CGG GTC AGA GCC CCA G (ASP6).-62CZ 297640 B6
- 27. Způsob stanovení genetické vady v biologickém vzorku izolovaném z lidského pacienta, který je podezřelý z toho, že má genetickou vadu v genu SHOX, přičemž tento gen SHOX má nukleotidovou sekvenci danou v SEQ ID NO: 8 nebo SEQ ID NO: 14, vyznačující se tím, že se provádí na základě molekul RNA nebo DNA.
- 28. Způsob podle nároku 27, vyznačující se tím, že molekula nukleové kyseliny podle kteréhokoliv z nároků 1 až 13 nebo molekula nukleové kyseliny obsahující nukleotidovou sekvenci, která se hybridizuje k molekule nukleové kyseliny podle nároku 14 nebo 15 za podmínek přísně řízené hybridizace je použita jako primer pro stanovení genetické vady v genu SHOX io - SEQ ID NO: 8 nebo SEQ ID NO: 14, přičemž podmínky přísně řízené hybridizace jsou následující: 0,5 M NaPi pH 7,2, 7 % SDS a 1 mM EDTA při 65 °C následováno promytím 40 mM NaPia 1 % SDS při 65 °C.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US2763396P | 1996-10-01 | 1996-10-01 | |
EP97100583 | 1997-01-16 | ||
PCT/EP1997/005355 WO1998014568A1 (en) | 1996-10-01 | 1997-09-29 | Human growth gene and short stature gene region |
Publications (2)
Publication Number | Publication Date |
---|---|
CZ96699A3 CZ96699A3 (cs) | 1999-08-11 |
CZ297640B6 true CZ297640B6 (cs) | 2007-02-21 |
Family
ID=26145174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CZ0096699A CZ297640B6 (cs) | 1996-10-01 | 1997-09-29 | Molekula izolované nukleové kyseliny kódující polypeptidy a zpusob jejího použití |
Country Status (20)
Country | Link |
---|---|
US (2) | US7252974B2 (cs) |
EP (2) | EP0946721B1 (cs) |
JP (2) | JP2000515025A (cs) |
KR (1) | KR20000048838A (cs) |
CN (1) | CN1232499A (cs) |
AT (1) | ATE230026T1 (cs) |
AU (1) | AU744188C (cs) |
BR (1) | BR9712185A (cs) |
CA (2) | CA2267097A1 (cs) |
CZ (1) | CZ297640B6 (cs) |
DE (1) | DE69718052T2 (cs) |
DK (1) | DK0946721T3 (cs) |
ES (1) | ES2188992T3 (cs) |
HU (1) | HU225131B1 (cs) |
IL (1) | IL129015A0 (cs) |
NO (1) | NO991554L (cs) |
NZ (1) | NZ334970A (cs) |
PL (1) | PL194248B1 (cs) |
SI (1) | SI0946721T1 (cs) |
WO (1) | WO1998014568A1 (cs) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2368223A1 (en) * | 1999-03-19 | 2000-09-28 | Craig A. Rosen | 48 human secreted proteins |
AU3913100A (en) * | 1999-03-26 | 2000-10-16 | Human Genome Sciences, Inc. | 50 human secreted proteins |
US7927597B2 (en) | 2001-04-10 | 2011-04-19 | Agensys, Inc. | Methods to inhibit cell growth |
EP2280030A3 (en) | 2001-04-10 | 2011-06-15 | Agensys, Inc. | Nucleic acids and corresponding proteins useful in the detection and treatment of various cancers |
US20040248132A1 (en) | 2001-10-04 | 2004-12-09 | Toshiyuki Sakai | DR5 gene promoter and siah-1 gene promoter |
EP1583554A2 (en) * | 2003-01-13 | 2005-10-12 | Gudrun Rappold-Hoerbrand | Use of natriuretic peptides for the treatment of stature disorders related to the shox gene |
BRPI0607508B8 (pt) | 2005-04-15 | 2021-07-27 | Epigenomics Ag | método para detecção e/ou classificação de distúrbios proliferativos celulares colorretais ou hepatocelulares, e uso do mesmo |
US7382944B1 (en) | 2006-07-14 | 2008-06-03 | The United States Of America As Represented By The Administration Of The National Aeronautics And Space Administration | Protective coating and hyperthermal atomic oxygen texturing of optical fibers used for blood glucose monitoring |
DK2258871T3 (da) * | 2007-01-19 | 2014-08-11 | Epigenomics Ag | Fremgangsmåder og nukleinsyrer til analyse af celleproliferative lidelser |
EP2994541A4 (en) * | 2013-05-06 | 2017-01-18 | Capilet Genetics AB | Diagnostic test for skeletal atavism in horses |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3445933A1 (de) * | 1984-12-17 | 1986-06-19 | Röhm GmbH, 6100 Darmstadt | Arzneimittel mit diuretischer wirksamkeit |
US4983511A (en) * | 1989-01-09 | 1991-01-08 | Olin Corporation | Method and kit for detecting live microorganisms in chlorine- or bromine-treated water |
-
1997
- 1997-09-29 CA CA002267097A patent/CA2267097A1/en not_active Abandoned
- 1997-09-29 WO PCT/EP1997/005355 patent/WO1998014568A1/en active IP Right Grant
- 1997-09-29 HU HU9904175A patent/HU225131B1/hu not_active IP Right Cessation
- 1997-09-29 PL PL97332568A patent/PL194248B1/pl not_active IP Right Cessation
- 1997-09-29 ES ES97944906T patent/ES2188992T3/es not_active Expired - Lifetime
- 1997-09-29 AU AU46252/97A patent/AU744188C/en not_active Ceased
- 1997-09-29 EP EP97944906A patent/EP0946721B1/en not_active Expired - Lifetime
- 1997-09-29 CN CN97198471A patent/CN1232499A/zh active Pending
- 1997-09-29 IL IL12901597A patent/IL129015A0/xx unknown
- 1997-09-29 NZ NZ334970A patent/NZ334970A/xx unknown
- 1997-09-29 BR BR9712185-1A patent/BR9712185A/pt unknown
- 1997-09-29 EP EP02011329A patent/EP1260228A3/en not_active Withdrawn
- 1997-09-29 CA CA002647169A patent/CA2647169A1/en not_active Abandoned
- 1997-09-29 DK DK97944906T patent/DK0946721T3/da active
- 1997-09-29 CZ CZ0096699A patent/CZ297640B6/cs not_active IP Right Cessation
- 1997-09-29 SI SI9730485T patent/SI0946721T1/xx unknown
- 1997-09-29 JP JP10516222A patent/JP2000515025A/ja active Pending
- 1997-09-29 KR KR1019990702836A patent/KR20000048838A/ko not_active Application Discontinuation
- 1997-09-29 DE DE69718052T patent/DE69718052T2/de not_active Expired - Lifetime
- 1997-09-29 AT AT97944906T patent/ATE230026T1/de active
-
1999
- 1999-03-30 NO NO991554A patent/NO991554L/no not_active Application Discontinuation
-
2002
- 2002-05-31 US US10/158,160 patent/US7252974B2/en not_active Expired - Fee Related
-
2004
- 2004-03-02 JP JP2004058276A patent/JP2004201692A/ja active Pending
-
2007
- 2007-05-15 US US11/748,769 patent/US20090111744A1/en not_active Abandoned
Non-Patent Citations (2)
Title |
---|
Marra, M. et al.: "mb68b03.rl Soares mouse p3NMF19.5 Mus musculus cDNA clone 334541 5asimilar to SW: HPR1-chick q05437 homeobox protein PRX-1", EMBL DATABASE ACCESSION NUMBER W18334, 4.5.1996 * |
Marra, M. et al.: "mj75d03.rl Soares mouse p3NMF19.5 Mus musculus cDNA clone 481925 5asimilar to TR:G1002491 G1002494 ARIXI", EMBL DATABASE ACCESSION NUMBER AA059929, 24.9.1996 * |
Also Published As
Publication number | Publication date |
---|---|
HUP9904175A3 (en) | 2002-01-28 |
DK0946721T3 (da) | 2003-04-14 |
DE69718052T2 (de) | 2003-07-31 |
WO1998014568A1 (en) | 1998-04-09 |
ATE230026T1 (de) | 2003-01-15 |
EP1260228A3 (en) | 2003-03-05 |
EP0946721A1 (en) | 1999-10-06 |
US7252974B2 (en) | 2007-08-07 |
BR9712185A (pt) | 1999-08-31 |
ES2188992T3 (es) | 2003-07-01 |
US20030059805A1 (en) | 2003-03-27 |
EP1260228A2 (en) | 2002-11-27 |
NO991554D0 (no) | 1999-03-30 |
IL129015A0 (en) | 2000-02-17 |
EP0946721B1 (en) | 2002-12-18 |
US20090111744A1 (en) | 2009-04-30 |
PL194248B1 (pl) | 2007-05-31 |
SI0946721T1 (en) | 2003-06-30 |
AU744188B2 (en) | 2002-02-14 |
NO991554L (no) | 1999-05-14 |
AU4625297A (en) | 1998-04-24 |
CN1232499A (zh) | 1999-10-20 |
AU744188C (en) | 2003-07-24 |
CA2647169A1 (en) | 1998-04-09 |
HU225131B1 (en) | 2006-06-28 |
JP2004201692A (ja) | 2004-07-22 |
JP2000515025A (ja) | 2000-11-14 |
CA2267097A1 (en) | 1998-04-09 |
KR20000048838A (ko) | 2000-07-25 |
CZ96699A3 (cs) | 1999-08-11 |
NZ334970A (en) | 2000-12-22 |
HUP9904175A2 (hu) | 2000-04-28 |
PL332568A1 (en) | 1999-09-27 |
DE69718052D1 (de) | 2003-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102526525B1 (ko) | 타우 발현 조절 조성물 | |
RU2745324C2 (ru) | Композиции и способы модулирования экспрессии tau | |
KR20220062517A (ko) | 결합 변형된 올리고머 화합물 및 이의 용도 | |
CA3119065A1 (en) | Use of adeno-associated viral vectors to correct gene defects/ express proteins in hair cells and supporting cells in the inner ear | |
AU2021200783A1 (en) | Mitigating tissue damage and fibrosis via latent transforming growth factor beta binding protein (LTBP4) | |
ES2792126T3 (es) | Método de tratamiento basado en polimorfismos del gen KCNQ1 | |
AU2016325030A1 (en) | Novel biomarkers and methods of treating cancer | |
KR20130123357A (ko) | 저산소증과 관련된 질환의 진단방법 및 키트 | |
AU744188C (en) | Human growth gene and short stature gene region | |
WO2006022629A1 (en) | Methods of identifying risk of type ii diabetes and treatments thereof | |
EP1347992A2 (en) | Polymorphic bone morphogenetic protein 2 | |
US6262334B1 (en) | Human genes and expression products: II | |
US6566061B1 (en) | Identification of polymorphisms in the PCTG4 region of Xq13 | |
IL179831A (en) | In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders | |
PT1939287T (pt) | Método de transferência de genes específico para células trofectodérmicas | |
US20160250182A1 (en) | Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson's disease risk | |
CA2433869C (en) | Gene for identifying individuals with familial dysautonomia | |
CA2348657C (fr) | Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante | |
US20160184454A1 (en) | Rab7l1 interacts with lrrk2 to modify intraneuronal protein sorting and parkinson's disease risk | |
Class et al. | Patent application title: Human Growth Gene and Short Stature Gene Region Inventors: Gudrun Rappold-Hoerbrand (Heidelberg, DE) Ercole Rao (Riedstadt, DE) | |
CN111278468A (zh) | 用于脂肪营养不良的自体细胞疗法的人脂肪组织祖细胞 | |
US6627745B1 (en) | Pyrin gene and mutants thereof, which cause familial Mediterranean fever | |
MXPA99002809A (en) | Human growth gene and short stature gene region | |
RU2805557C2 (ru) | Варианты b4galt1 и их применение | |
US20030203380A1 (en) | Gene linked to osteoarthritis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PD00 | Pending as of 2000-06-30 in czech republic | ||
MM4A | Patent lapsed due to non-payment of fee |
Effective date: 20110929 |