KR20210045513A - 줄기 세포-기반 장기 및 조직 생성 방법 - Google Patents
줄기 세포-기반 장기 및 조직 생성 방법 Download PDFInfo
- Publication number
- KR20210045513A KR20210045513A KR1020217011287A KR20217011287A KR20210045513A KR 20210045513 A KR20210045513 A KR 20210045513A KR 1020217011287 A KR1020217011287 A KR 1020217011287A KR 20217011287 A KR20217011287 A KR 20217011287A KR 20210045513 A KR20210045513 A KR 20210045513A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- ser
- leu
- thr
- gly
- Prior art date
Links
- 210000000130 stem cell Anatomy 0.000 title claims abstract description 291
- 210000000056 organ Anatomy 0.000 title claims abstract description 62
- 238000000034 method Methods 0.000 title claims description 87
- 241000282414 Homo sapiens Species 0.000 claims abstract description 436
- 210000004027 cell Anatomy 0.000 claims abstract description 262
- 241001465754 Metazoa Species 0.000 claims abstract description 145
- 210000001519 tissue Anatomy 0.000 claims abstract description 93
- 210000002459 blastocyst Anatomy 0.000 claims abstract description 42
- 210000002257 embryonic structure Anatomy 0.000 claims abstract description 15
- 238000003306 harvesting Methods 0.000 claims abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 236
- 101001128732 Homo sapiens Nucleoside diphosphate kinase 7 Proteins 0.000 claims description 198
- 102000004169 proteins and genes Human genes 0.000 claims description 178
- 102100032115 Nucleoside diphosphate kinase 7 Human genes 0.000 claims description 170
- 101000979629 Homo sapiens Nucleoside diphosphate kinase A Proteins 0.000 claims description 151
- 102100023252 Nucleoside diphosphate kinase A Human genes 0.000 claims description 134
- 239000000539 dimer Substances 0.000 claims description 99
- 239000002609 medium Substances 0.000 claims description 83
- 101001128739 Homo sapiens Nucleoside diphosphate kinase 6 Proteins 0.000 claims description 66
- 210000000472 morula Anatomy 0.000 claims description 50
- 241000894007 species Species 0.000 claims description 50
- 210000005260 human cell Anatomy 0.000 claims description 40
- 239000003795 chemical substances by application Substances 0.000 claims description 39
- 102100032113 Nucleoside diphosphate kinase 6 Human genes 0.000 claims description 38
- 239000003102 growth factor Substances 0.000 claims description 33
- 235000013601 eggs Nutrition 0.000 claims description 24
- 230000001580 bacterial effect Effects 0.000 claims description 23
- 241001494479 Pecora Species 0.000 claims description 22
- 210000001161 mammalian embryo Anatomy 0.000 claims description 20
- 239000003112 inhibitor Substances 0.000 claims description 19
- 210000001671 embryonic stem cell Anatomy 0.000 claims description 18
- 241000283984 Rodentia Species 0.000 claims description 16
- 241000288906 Primates Species 0.000 claims description 14
- 239000012679 serum free medium Substances 0.000 claims description 14
- 241000282898 Sus scrofa Species 0.000 claims description 12
- 239000000178 monomer Substances 0.000 claims description 12
- 241000283690 Bos taurus Species 0.000 claims description 11
- -1 NME7-AB Proteins 0.000 claims description 10
- 238000012239 gene modification Methods 0.000 claims description 6
- 230000005017 genetic modification Effects 0.000 claims description 6
- 235000013617 genetically modified food Nutrition 0.000 claims description 6
- 210000003754 fetus Anatomy 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 abstract description 15
- 239000000463 material Substances 0.000 abstract description 6
- 102100034256 Mucin-1 Human genes 0.000 description 142
- 101001133056 Homo sapiens Mucin-1 Proteins 0.000 description 138
- 230000014509 gene expression Effects 0.000 description 130
- 108020004414 DNA Proteins 0.000 description 90
- 241000699666 Mus <mouse, genus> Species 0.000 description 70
- 150000001413 amino acids Chemical class 0.000 description 54
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 48
- 210000002950 fibroblast Anatomy 0.000 description 46
- 241000588724 Escherichia coli Species 0.000 description 41
- 102000043772 human NME7 Human genes 0.000 description 41
- 108090000765 processed proteins & peptides Proteins 0.000 description 40
- 241000124008 Mammalia Species 0.000 description 35
- 108010029485 Protein Isoforms Proteins 0.000 description 34
- 102000001708 Protein Isoforms Human genes 0.000 description 34
- 108010087924 alanylproline Proteins 0.000 description 32
- 241000282560 Macaca mulatta Species 0.000 description 31
- 108010005652 splenotritin Proteins 0.000 description 31
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 29
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 29
- 238000011161 development Methods 0.000 description 29
- 230000018109 developmental process Effects 0.000 description 29
- 108010070944 alanylhistidine Proteins 0.000 description 28
- 230000004069 differentiation Effects 0.000 description 28
- 108010089804 glycyl-threonine Proteins 0.000 description 28
- 102000044316 human NME6 Human genes 0.000 description 28
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 27
- 206010028980 Neoplasm Diseases 0.000 description 26
- 108091005625 BRD4 Proteins 0.000 description 25
- 102100023962 Bifunctional arginine demethylase and lysyl-hydroxylase JMJD6 Human genes 0.000 description 25
- 102100029895 Bromodomain-containing protein 4 Human genes 0.000 description 25
- 101000975541 Homo sapiens Bifunctional arginine demethylase and lysyl-hydroxylase JMJD6 Proteins 0.000 description 25
- 210000001082 somatic cell Anatomy 0.000 description 25
- 241000282693 Cercopithecidae Species 0.000 description 24
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 24
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 24
- 230000009261 transgenic effect Effects 0.000 description 24
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 23
- 230000012010 growth Effects 0.000 description 23
- 108010037850 glycylvaline Proteins 0.000 description 22
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 21
- 102100038214 Chromodomain-helicase-DNA-binding protein 4 Human genes 0.000 description 21
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 21
- 101000883749 Homo sapiens Chromodomain-helicase-DNA-binding protein 4 Proteins 0.000 description 21
- 101100346929 Homo sapiens MUC1 gene Proteins 0.000 description 21
- 101710126211 POU domain, class 5, transcription factor 1 Proteins 0.000 description 21
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 21
- 102000057860 human MUC1 Human genes 0.000 description 21
- 230000001939 inductive effect Effects 0.000 description 21
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 20
- 102000009465 Growth Factor Receptors Human genes 0.000 description 20
- 108010009202 Growth Factor Receptors Proteins 0.000 description 20
- 108010060035 arginylproline Proteins 0.000 description 20
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 19
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 description 19
- 108010013835 arginine glutamate Proteins 0.000 description 19
- 201000011510 cancer Diseases 0.000 description 19
- 101000615495 Homo sapiens Methyl-CpG-binding domain protein 3 Proteins 0.000 description 18
- 102100021291 Methyl-CpG-binding domain protein 3 Human genes 0.000 description 18
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 17
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 17
- 102000052119 human NME1 Human genes 0.000 description 17
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 16
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 16
- 241000282412 Homo Species 0.000 description 16
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 16
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 16
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 16
- 108010036387 trimethionine Proteins 0.000 description 16
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 15
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 15
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 15
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 15
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 15
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 15
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 15
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 15
- 108010093581 aspartyl-proline Proteins 0.000 description 15
- 210000004602 germ cell Anatomy 0.000 description 15
- 108010027338 isoleucylcysteine Proteins 0.000 description 15
- 230000008672 reprogramming Effects 0.000 description 15
- 239000003590 rho kinase inhibitor Substances 0.000 description 15
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 14
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 14
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 14
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 14
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 14
- WUYLWZRHRLLEGB-AVGNSLFASA-N Met-Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O WUYLWZRHRLLEGB-AVGNSLFASA-N 0.000 description 14
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 14
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 14
- OWSLLRKCHLTUND-BZSNNMDCSA-N Phe-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OWSLLRKCHLTUND-BZSNNMDCSA-N 0.000 description 14
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 14
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 14
- 108010050848 glycylleucine Proteins 0.000 description 14
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 13
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 13
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 13
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 13
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 13
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 13
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 13
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 13
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 13
- 241000282576 Pan paniscus Species 0.000 description 13
- 241000282577 Pan troglodytes Species 0.000 description 13
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 13
- 238000012258 culturing Methods 0.000 description 13
- 229940079593 drug Drugs 0.000 description 13
- 239000003814 drug Substances 0.000 description 13
- 108010051110 tyrosyl-lysine Proteins 0.000 description 13
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 12
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 12
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 12
- 238000002073 fluorescence micrograph Methods 0.000 description 12
- 108010036413 histidylglycine Proteins 0.000 description 12
- 230000002401 inhibitory effect Effects 0.000 description 12
- 239000002773 nucleotide Substances 0.000 description 12
- 125000003729 nucleotide group Chemical group 0.000 description 12
- 239000000126 substance Substances 0.000 description 12
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 11
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 11
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 11
- 108050002132 Nucleoside diphosphate kinase 7 Proteins 0.000 description 11
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 11
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 11
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 11
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 11
- 230000006698 induction Effects 0.000 description 11
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 11
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 11
- 238000010186 staining Methods 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 108010061238 threonyl-glycine Proteins 0.000 description 11
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 10
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 10
- XRJFPHCGGQOORT-JBDRJPRFSA-N Cys-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N XRJFPHCGGQOORT-JBDRJPRFSA-N 0.000 description 10
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 10
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 10
- 101000979623 Homo sapiens Nucleoside diphosphate kinase B Proteins 0.000 description 10
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 10
- FCWFBHMAJZGWRY-XUXIUFHCSA-N Ile-Leu-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N FCWFBHMAJZGWRY-XUXIUFHCSA-N 0.000 description 10
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 10
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 10
- CNAGWYQWQDMUGC-IHRRRGAJSA-N Met-Phe-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CNAGWYQWQDMUGC-IHRRRGAJSA-N 0.000 description 10
- PNHRPOWKRRJATF-IHRRRGAJSA-N Met-Tyr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 PNHRPOWKRRJATF-IHRRRGAJSA-N 0.000 description 10
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 10
- FCCBQBZXIAZNIG-LSJOCFKGSA-N Pro-Ala-His Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O FCCBQBZXIAZNIG-LSJOCFKGSA-N 0.000 description 10
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 10
- 241000700159 Rattus Species 0.000 description 10
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 10
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 10
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 10
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 10
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 10
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 10
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 10
- 125000003275 alpha amino acid group Chemical group 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 201000010099 disease Diseases 0.000 description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 10
- 210000002216 heart Anatomy 0.000 description 10
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 10
- 108020004707 nucleic acids Proteins 0.000 description 10
- 102000039446 nucleic acids Human genes 0.000 description 10
- 150000007523 nucleic acids Chemical class 0.000 description 10
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 9
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 9
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 9
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 9
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 9
- KGSJCPBERYUXCN-BPNCWPANSA-N Arg-Ala-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KGSJCPBERYUXCN-BPNCWPANSA-N 0.000 description 9
- NVCIXQYNWYTLDO-IHRRRGAJSA-N Arg-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N NVCIXQYNWYTLDO-IHRRRGAJSA-N 0.000 description 9
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 9
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 9
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 9
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 9
- QHHVSXGWLYEAGX-GUBZILKMSA-N Asp-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QHHVSXGWLYEAGX-GUBZILKMSA-N 0.000 description 9
- ZLFRUAFDAIFNHN-LKXGYXEUSA-N Cys-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O ZLFRUAFDAIFNHN-LKXGYXEUSA-N 0.000 description 9
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 9
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 9
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 9
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 9
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 9
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 9
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 9
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 9
- 241000282575 Gorilla Species 0.000 description 9
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 9
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 9
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 9
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 9
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 9
- 108700021430 Kruppel-Like Factor 4 Proteins 0.000 description 9
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 9
- VVQJGYPTIYOFBR-IHRRRGAJSA-N Leu-Lys-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N VVQJGYPTIYOFBR-IHRRRGAJSA-N 0.000 description 9
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 9
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 9
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 9
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 9
- 102100023258 Nucleoside diphosphate kinase B Human genes 0.000 description 9
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 9
- DBALDZKOTNSBFM-FXQIFTODSA-N Pro-Ala-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DBALDZKOTNSBFM-FXQIFTODSA-N 0.000 description 9
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 9
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 9
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 9
- 101100247004 Rattus norvegicus Qsox1 gene Proteins 0.000 description 9
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 9
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 9
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 9
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 9
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 9
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 9
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 9
- 108010077515 glycylproline Proteins 0.000 description 9
- 108010034529 leucyl-lysine Proteins 0.000 description 9
- 108010015796 prolylisoleucine Proteins 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- 108010026333 seryl-proline Proteins 0.000 description 9
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 8
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 8
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 8
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 8
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 8
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 8
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 8
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 8
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 8
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 8
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 8
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 8
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 8
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 8
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 8
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 8
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 8
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 8
- 241000699670 Mus sp. Species 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 8
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 8
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 8
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 8
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 8
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 8
- MVHHTXAUJCIOMZ-WDSOQIARSA-N Trp-Arg-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N MVHHTXAUJCIOMZ-WDSOQIARSA-N 0.000 description 8
- PNHABSVRPFBUJY-UMPQAUOISA-N Trp-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PNHABSVRPFBUJY-UMPQAUOISA-N 0.000 description 8
- HTHCZRWCFXMENJ-KKUMJFAQSA-N Tyr-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HTHCZRWCFXMENJ-KKUMJFAQSA-N 0.000 description 8
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 8
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 8
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 8
- 108010049041 glutamylalanine Proteins 0.000 description 8
- 230000005764 inhibitory process Effects 0.000 description 8
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 8
- 210000001778 pluripotent stem cell Anatomy 0.000 description 8
- 102000005962 receptors Human genes 0.000 description 8
- 108020003175 receptors Proteins 0.000 description 8
- 238000010361 transduction Methods 0.000 description 8
- 230000026683 transduction Effects 0.000 description 8
- 238000001262 western blot Methods 0.000 description 8
- GOKFTBDYUJCCSN-QEJZJMRPSA-N Cys-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N GOKFTBDYUJCCSN-QEJZJMRPSA-N 0.000 description 7
- NYCVMJGIJYQWDO-CIUDSAMLSA-N Gln-Ser-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NYCVMJGIJYQWDO-CIUDSAMLSA-N 0.000 description 7
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 7
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 7
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 7
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 7
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 7
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 7
- 241000282553 Macaca Species 0.000 description 7
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 7
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 7
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 7
- 108020004459 Small interfering RNA Proteins 0.000 description 7
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 7
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 7
- 108010047495 alanylglycine Proteins 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 7
- 108010079547 glutamylmethionine Proteins 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 238000003757 reverse transcription PCR Methods 0.000 description 7
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 6
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 6
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 6
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 6
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 6
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 6
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 6
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 6
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 6
- 102000000905 Cadherin Human genes 0.000 description 6
- 108050007957 Cadherin Proteins 0.000 description 6
- 108010077544 Chromatin Proteins 0.000 description 6
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 6
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 6
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 6
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 6
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 6
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 6
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 6
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 6
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 6
- 241000282567 Macaca fascicularis Species 0.000 description 6
- 241000699660 Mus musculus Species 0.000 description 6
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 6
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 6
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 6
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 6
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 6
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 6
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 6
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 6
- DGOJNGCGEYOBKN-BWBBJGPYSA-N Thr-Cys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O DGOJNGCGEYOBKN-BWBBJGPYSA-N 0.000 description 6
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 6
- FHHYVSCGOMPLLO-IHPCNDPISA-N Trp-Tyr-Asp Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 FHHYVSCGOMPLLO-IHPCNDPISA-N 0.000 description 6
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 6
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 6
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 6
- 210000001766 X chromosome Anatomy 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 210000003483 chromatin Anatomy 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 210000001728 clone cell Anatomy 0.000 description 6
- 108010016616 cysteinylglycine Proteins 0.000 description 6
- 230000000447 dimerizing effect Effects 0.000 description 6
- 108010018006 histidylserine Proteins 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 108010078274 isoleucylvaline Proteins 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 238000007747 plating Methods 0.000 description 6
- 108010031719 prolyl-serine Proteins 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 150000003384 small molecules Chemical class 0.000 description 6
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 5
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 5
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 5
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 5
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 5
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 5
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 5
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 5
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 5
- MDDXKBHIMYYJLW-FXQIFTODSA-N Asn-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N MDDXKBHIMYYJLW-FXQIFTODSA-N 0.000 description 5
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 5
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 5
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 5
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 5
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 5
- 238000000116 DAPI staining Methods 0.000 description 5
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 5
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 5
- DFRYZTUPVZNRLG-KKUMJFAQSA-N Gln-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DFRYZTUPVZNRLG-KKUMJFAQSA-N 0.000 description 5
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 5
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 5
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 5
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 5
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 5
- BHXSLRDWXIFKTP-SRVKXCTJSA-N Glu-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BHXSLRDWXIFKTP-SRVKXCTJSA-N 0.000 description 5
- ZTVGZOIBLRPQNR-KKUMJFAQSA-N Glu-Met-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZTVGZOIBLRPQNR-KKUMJFAQSA-N 0.000 description 5
- WVWZIPOJECFDAG-AVGNSLFASA-N Glu-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N WVWZIPOJECFDAG-AVGNSLFASA-N 0.000 description 5
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 5
- XOEKMEAOMXMURD-JYJNAYRXSA-N Glu-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O XOEKMEAOMXMURD-JYJNAYRXSA-N 0.000 description 5
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 5
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 5
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 5
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 5
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 5
- UJWYPUUXIAKEES-CUJWVEQBSA-N His-Cys-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UJWYPUUXIAKEES-CUJWVEQBSA-N 0.000 description 5
- QEYUCKCWTMIERU-SRVKXCTJSA-N His-Lys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QEYUCKCWTMIERU-SRVKXCTJSA-N 0.000 description 5
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 5
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 5
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 5
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 5
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 5
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 5
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 5
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 5
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 5
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 5
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 5
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 5
- 108010008707 Mucin-1 Proteins 0.000 description 5
- 101100079638 Mus musculus Nme7 gene Proteins 0.000 description 5
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 5
- WKLMCMXFMQEKCX-SLFFLAALSA-N Phe-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O WKLMCMXFMQEKCX-SLFFLAALSA-N 0.000 description 5
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 5
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 5
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 5
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 5
- 241000282887 Suidae Species 0.000 description 5
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 5
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 5
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 5
- 108700019146 Transgenes Proteins 0.000 description 5
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 5
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 5
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 5
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 5
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 5
- ZQGPWORGSNRQLN-NHCYSSNCSA-N Val-Asp-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZQGPWORGSNRQLN-NHCYSSNCSA-N 0.000 description 5
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 5
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 5
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 5
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 5
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 5
- 239000011248 coating agent Substances 0.000 description 5
- 238000000576 coating method Methods 0.000 description 5
- 230000001086 cytosolic effect Effects 0.000 description 5
- 238000003255 drug test Methods 0.000 description 5
- 210000003981 ectoderm Anatomy 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 238000010348 incorporation Methods 0.000 description 5
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 5
- 108010091871 leucylmethionine Proteins 0.000 description 5
- 108010051242 phenylalanylserine Proteins 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 230000008707 rearrangement Effects 0.000 description 5
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 4
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 4
- VJIQPOJMISSUPO-BVSLBCMMSA-N Arg-Trp-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VJIQPOJMISSUPO-BVSLBCMMSA-N 0.000 description 4
- KWQPAXYXVMHJJR-AVGNSLFASA-N Asn-Gln-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KWQPAXYXVMHJJR-AVGNSLFASA-N 0.000 description 4
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 4
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 4
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 4
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 4
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 4
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 4
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 4
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 4
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 4
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 4
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 4
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 4
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 4
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 4
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 4
- BCSGDNGNHKBRRJ-ULQDDVLXSA-N His-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N BCSGDNGNHKBRRJ-ULQDDVLXSA-N 0.000 description 4
- 101001139134 Homo sapiens Krueppel-like factor 4 Proteins 0.000 description 4
- 102100020677 Krueppel-like factor 4 Human genes 0.000 description 4
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 4
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 4
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 4
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 4
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 4
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 4
- BXNZDLVLGYYFIB-FXQIFTODSA-N Met-Asn-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BXNZDLVLGYYFIB-FXQIFTODSA-N 0.000 description 4
- XDGFFEZAZHRZFR-RHYQMDGZSA-N Met-Leu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDGFFEZAZHRZFR-RHYQMDGZSA-N 0.000 description 4
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 4
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 4
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 4
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 4
- 101100224408 Mus musculus Dpep3 gene Proteins 0.000 description 4
- 101100346932 Mus musculus Muc1 gene Proteins 0.000 description 4
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 4
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 4
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 4
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 4
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 4
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 4
- STGVYUTZKGPRCI-GUBZILKMSA-N Pro-Val-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 STGVYUTZKGPRCI-GUBZILKMSA-N 0.000 description 4
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 4
- GRSLLFZTTLBOQX-CIUDSAMLSA-N Ser-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N GRSLLFZTTLBOQX-CIUDSAMLSA-N 0.000 description 4
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 4
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 4
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 4
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 4
- CRCHQCUINSOGFD-JBACZVJFSA-N Trp-Tyr-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CRCHQCUINSOGFD-JBACZVJFSA-N 0.000 description 4
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 4
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 239000003124 biologic agent Substances 0.000 description 4
- 230000021164 cell adhesion Effects 0.000 description 4
- 210000003855 cell nucleus Anatomy 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 108010069495 cysteinyltyrosine Proteins 0.000 description 4
- 230000004720 fertilization Effects 0.000 description 4
- 239000007850 fluorescent dye Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 210000002307 prostate Anatomy 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 231100000419 toxicity Toxicity 0.000 description 4
- 230000001988 toxicity Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000002054 transplantation Methods 0.000 description 4
- 210000002993 trophoblast Anatomy 0.000 description 4
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 4
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 3
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 3
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 3
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 3
- WZUZGDANRQPCDD-SRVKXCTJSA-N Asp-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N WZUZGDANRQPCDD-SRVKXCTJSA-N 0.000 description 3
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 3
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 3
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 3
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 3
- VCUNGPMMPNJSGS-JYJNAYRXSA-N Gln-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VCUNGPMMPNJSGS-JYJNAYRXSA-N 0.000 description 3
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 3
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 3
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 3
- DVRDRICMWUSCBN-UKJIMTQDSA-N Ile-Gln-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DVRDRICMWUSCBN-UKJIMTQDSA-N 0.000 description 3
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 3
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 3
- MIJPAVRNWPDMOR-ZAFYKAAXSA-N L-ascorbic acid 2-phosphate Chemical compound OC[C@H](O)[C@H]1OC(=O)C(OP(O)(O)=O)=C1O MIJPAVRNWPDMOR-ZAFYKAAXSA-N 0.000 description 3
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 3
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 3
- LFXSPAIBSZSTEM-PMVMPFDFSA-N Leu-Trp-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LFXSPAIBSZSTEM-PMVMPFDFSA-N 0.000 description 3
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 3
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 3
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 3
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 3
- 206010027476 Metastases Diseases 0.000 description 3
- 101100079633 Mus musculus Nme6 gene Proteins 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 3
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 3
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 3
- CKJACGQPCPMWIT-UFYCRDLUSA-N Phe-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CKJACGQPCPMWIT-UFYCRDLUSA-N 0.000 description 3
- 108091000080 Phosphotransferase Proteins 0.000 description 3
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 3
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 3
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 3
- 206010043276 Teratoma Diseases 0.000 description 3
- VASYSJHSMSBTDU-LKXGYXEUSA-N Thr-Asn-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O VASYSJHSMSBTDU-LKXGYXEUSA-N 0.000 description 3
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 3
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 3
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 3
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000003712 anti-aging effect Effects 0.000 description 3
- 108010057412 arginyl-glycyl-aspartyl-phenylalanine Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 210000004204 blood vessel Anatomy 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 210000005220 cytoplasmic tail Anatomy 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000006471 dimerization reaction Methods 0.000 description 3
- 238000007876 drug discovery Methods 0.000 description 3
- 210000003414 extremity Anatomy 0.000 description 3
- 239000012091 fetal bovine serum Substances 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 108010092114 histidylphenylalanine Proteins 0.000 description 3
- 238000002513 implantation Methods 0.000 description 3
- 102000006495 integrins Human genes 0.000 description 3
- 108010044426 integrins Proteins 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 244000144972 livestock Species 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 230000009401 metastasis Effects 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 210000005036 nerve Anatomy 0.000 description 3
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 3
- 102000020233 phosphotransferase Human genes 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 230000035755 proliferation Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000000392 somatic effect Effects 0.000 description 3
- 238000010998 test method Methods 0.000 description 3
- 230000001228 trophic effect Effects 0.000 description 3
- OYHQOLUKZRVURQ-NTGFUMLPSA-N (9Z,12Z)-9,10,12,13-tetratritiooctadeca-9,12-dienoic acid Chemical compound C(CCCCCCC\C(=C(/C\C(=C(/CCCCC)\[3H])\[3H])\[3H])\[3H])(=O)O OYHQOLUKZRVURQ-NTGFUMLPSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 2
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 2
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 2
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 2
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 2
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 2
- UPAGTDJAORYMEC-VHWLVUOQSA-N Asn-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)N)N UPAGTDJAORYMEC-VHWLVUOQSA-N 0.000 description 2
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 2
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 2
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 2
- 102100032528 C-type lectin domain family 11 member A Human genes 0.000 description 2
- 101710167766 C-type lectin domain family 11 member A Proteins 0.000 description 2
- XMTDCXXLDZKAGI-ACZMJKKPSA-N Cys-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N XMTDCXXLDZKAGI-ACZMJKKPSA-N 0.000 description 2
- FIADUEYFRSCCIK-CIUDSAMLSA-N Cys-Glu-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIADUEYFRSCCIK-CIUDSAMLSA-N 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 2
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 2
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- PCKOTDPDHIBGRW-CIUDSAMLSA-N Gln-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N PCKOTDPDHIBGRW-CIUDSAMLSA-N 0.000 description 2
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 2
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 2
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 2
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 2
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 2
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 2
- DHCLVCXQIBBOPH-UHFFFAOYSA-N Glycerol 2-phosphate Chemical compound OCC(CO)OP(O)(O)=O DHCLVCXQIBBOPH-UHFFFAOYSA-N 0.000 description 2
- WCNXUTNLSRWWQN-DCAQKATOSA-N His-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WCNXUTNLSRWWQN-DCAQKATOSA-N 0.000 description 2
- KDDKJKKQODQQBR-NHCYSSNCSA-N His-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N KDDKJKKQODQQBR-NHCYSSNCSA-N 0.000 description 2
- 241001272567 Hominoidea Species 0.000 description 2
- 101001011886 Homo sapiens Matrix metalloproteinase-16 Proteins 0.000 description 2
- 101000591312 Homo sapiens Putative MORF4 family-associated protein 1-like protein UPP Proteins 0.000 description 2
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 2
- BALLIXFZYSECCF-QEWYBTABSA-N Ile-Gln-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N BALLIXFZYSECCF-QEWYBTABSA-N 0.000 description 2
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 2
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 2
- FHPZJWJWTWZKNA-LLLHUVSDSA-N Ile-Phe-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N FHPZJWJWTWZKNA-LLLHUVSDSA-N 0.000 description 2
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 2
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 2
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 2
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 2
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 2
- 102000043136 MAP kinase family Human genes 0.000 description 2
- 108091054455 MAP kinase family Proteins 0.000 description 2
- 102100030200 Matrix metalloproteinase-16 Human genes 0.000 description 2
- BKIFWLQFOOKUCA-DCAQKATOSA-N Met-His-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N BKIFWLQFOOKUCA-DCAQKATOSA-N 0.000 description 2
- VWWGEKCAPBMIFE-SRVKXCTJSA-N Met-Met-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VWWGEKCAPBMIFE-SRVKXCTJSA-N 0.000 description 2
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 2
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 2
- 101150076359 Mhc gene Proteins 0.000 description 2
- 241000711408 Murine respirovirus Species 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 102220484604 Nucleoside diphosphate kinase A_P96S_mutation Human genes 0.000 description 2
- 241000282579 Pan Species 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- PTLMYJOMJLTMCB-KKUMJFAQSA-N Phe-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N PTLMYJOMJLTMCB-KKUMJFAQSA-N 0.000 description 2
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 2
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 2
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 2
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 2
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 2
- 102000003946 Prolactin Human genes 0.000 description 2
- 108010057464 Prolactin Proteins 0.000 description 2
- 102100034096 Putative MORF4 family-associated protein 1-like protein UPP Human genes 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 2
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 2
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- LKEKWDJCJSPXNI-IRIUXVKKSA-N Thr-Glu-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LKEKWDJCJSPXNI-IRIUXVKKSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108090000901 Transferrin Proteins 0.000 description 2
- 102000004338 Transferrin Human genes 0.000 description 2
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- STTVVMWQKDOKAM-YESZJQIVSA-N Tyr-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O STTVVMWQKDOKAM-YESZJQIVSA-N 0.000 description 2
- CVXURBLRELTJKO-BWAGICSOSA-N Tyr-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O CVXURBLRELTJKO-BWAGICSOSA-N 0.000 description 2
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 2
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 2
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 2
- WJVLTYSHNXRCLT-NHCYSSNCSA-N Val-His-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WJVLTYSHNXRCLT-NHCYSSNCSA-N 0.000 description 2
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 229910002091 carbon monoxide Inorganic materials 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 238000000749 co-immunoprecipitation Methods 0.000 description 2
- 230000006957 competitive inhibition Effects 0.000 description 2
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 2
- 229960003957 dexamethasone Drugs 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 229940126864 fibroblast growth factor Drugs 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010078144 glutaminyl-glycine Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 239000012133 immunoprecipitate Substances 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- CGIGDMFJXJATDK-UHFFFAOYSA-N indomethacin Chemical compound CC1=C(CC(O)=O)C2=CC(OC)=CC=C2N1C(=O)C1=CC=C(Cl)C=C1 CGIGDMFJXJATDK-UHFFFAOYSA-N 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 2
- 229940043355 kinase inhibitor Drugs 0.000 description 2
- 239000010410 layer Substances 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 108010082117 matrigel Proteins 0.000 description 2
- 238000010946 mechanistic model Methods 0.000 description 2
- 230000001394 metastastic effect Effects 0.000 description 2
- 208000037819 metastatic cancer Diseases 0.000 description 2
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 2
- 206010061289 metastatic neoplasm Diseases 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000004681 ovum Anatomy 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 239000003757 phosphotransferase inhibitor Substances 0.000 description 2
- 210000002826 placenta Anatomy 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 229940097325 prolactin Drugs 0.000 description 2
- 230000002062 proliferating effect Effects 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 239000012581 transferrin Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000011830 transgenic mouse model Methods 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- WEZDRVHTDXTVLT-GJZGRUSLSA-N 2-[[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WEZDRVHTDXTVLT-GJZGRUSLSA-N 0.000 description 1
- LOTUZERZUQHMGU-UHFFFAOYSA-N 2-butoxy-6-[(4-methoxyphenyl)methyl]-1h-pyrimidin-4-one Chemical compound N1C(OCCCC)=NC(=O)C=C1CC1=CC=C(OC)C=C1 LOTUZERZUQHMGU-UHFFFAOYSA-N 0.000 description 1
- APIXJSLKIYYUKG-UHFFFAOYSA-N 3 Isobutyl 1 methylxanthine Chemical compound O=C1N(C)C(=O)N(CC(C)C)C2=C1N=CN2 APIXJSLKIYYUKG-UHFFFAOYSA-N 0.000 description 1
- 208000037068 Abnormal Karyotype Diseases 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- WYPUMLRSQMKIJU-BPNCWPANSA-N Ala-Arg-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WYPUMLRSQMKIJU-BPNCWPANSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 1
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- UIUXXFIKWQVMEX-UFYCRDLUSA-N Arg-Phe-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UIUXXFIKWQVMEX-UFYCRDLUSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- XMZZGVGKGXRIGJ-JYJNAYRXSA-N Arg-Tyr-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O XMZZGVGKGXRIGJ-JYJNAYRXSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 1
- FMWHSNJMHUNLAG-FXQIFTODSA-N Asp-Cys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FMWHSNJMHUNLAG-FXQIFTODSA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- KNOGLZBISUBTFW-QRTARXTBSA-N Asp-Trp-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O KNOGLZBISUBTFW-QRTARXTBSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 1
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 1
- 108010083123 CDX2 Transcription Factor Proteins 0.000 description 1
- 102000006277 CDX2 Transcription Factor Human genes 0.000 description 1
- AQGNHMOJWBZFQQ-UHFFFAOYSA-N CT 99021 Chemical compound CC1=CNC(C=2C(=NC(NCCNC=3N=CC(=CC=3)C#N)=NC=2)C=2C(=CC(Cl)=CC=2)Cl)=N1 AQGNHMOJWBZFQQ-UHFFFAOYSA-N 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 101800004419 Cleaved form Proteins 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 102000016736 Cyclin Human genes 0.000 description 1
- 108050006400 Cyclin Proteins 0.000 description 1
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 1
- YRKJQKATZOTUEN-ACZMJKKPSA-N Cys-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N YRKJQKATZOTUEN-ACZMJKKPSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 101800003838 Epidermal growth factor Proteins 0.000 description 1
- 102400001368 Epidermal growth factor Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 101150021185 FGF gene Proteins 0.000 description 1
- 108090000381 Fibroblast growth factor 4 Proteins 0.000 description 1
- 102000003969 Fibroblast growth factor 4 Human genes 0.000 description 1
- 108090000368 Fibroblast growth factor 8 Proteins 0.000 description 1
- 102000003956 Fibroblast growth factor 8 Human genes 0.000 description 1
- 102000001267 GSK3 Human genes 0.000 description 1
- 108060006662 GSK3 Proteins 0.000 description 1
- 241001663880 Gammaretrovirus Species 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- SSWAFVQFQWOJIJ-XIRDDKMYSA-N Gln-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N SSWAFVQFQWOJIJ-XIRDDKMYSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 1
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- MWTGQXBHVRTCOR-GLLZPBPUSA-N Glu-Thr-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MWTGQXBHVRTCOR-GLLZPBPUSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- DENRBIYENOKSEX-PEXQALLHSA-N Gly-Ile-His Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DENRBIYENOKSEX-PEXQALLHSA-N 0.000 description 1
- 108010009504 Gly-Phe-Leu-Gly Proteins 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 1
- 241000206596 Halomonas Species 0.000 description 1
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 1
- 102000003745 Hepatocyte Growth Factor Human genes 0.000 description 1
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 1
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 1
- ZNNNYCXPCKACHX-DCAQKATOSA-N His-Gln-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZNNNYCXPCKACHX-DCAQKATOSA-N 0.000 description 1
- PYNUBZSXKQKAHL-UWVGGRQHSA-N His-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O PYNUBZSXKQKAHL-UWVGGRQHSA-N 0.000 description 1
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 1
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 1
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 1
- GUXQAPACZVVOKX-AVGNSLFASA-N His-Lys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GUXQAPACZVVOKX-AVGNSLFASA-N 0.000 description 1
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 1
- JMSONHOUHFDOJH-GUBZILKMSA-N His-Ser-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 JMSONHOUHFDOJH-GUBZILKMSA-N 0.000 description 1
- IXQGOKWTQPCIQM-YJRXYDGGSA-N His-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O IXQGOKWTQPCIQM-YJRXYDGGSA-N 0.000 description 1
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 241001676635 Lepidorhombus whiffiagonis Species 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- YSKSXVKQLLBVEX-SZMVWBNQSA-N Leu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 YSKSXVKQLLBVEX-SZMVWBNQSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- MKBIVWXCFINCLE-SRVKXCTJSA-N Lys-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N MKBIVWXCFINCLE-SRVKXCTJSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- LXNPMPIQDNSMTA-AVGNSLFASA-N Lys-Gln-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 LXNPMPIQDNSMTA-AVGNSLFASA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- MSSABBQOBUZFKZ-IHRRRGAJSA-N Lys-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O MSSABBQOBUZFKZ-IHRRRGAJSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 1
- OBCRZLRPJFNLAN-DCAQKATOSA-N Met-His-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OBCRZLRPJFNLAN-DCAQKATOSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- 241000551546 Minerva Species 0.000 description 1
- 102000007298 Mucin-1 Human genes 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 101150051466 Nme7 gene Proteins 0.000 description 1
- 102000013901 Nucleoside diphosphate kinase Human genes 0.000 description 1
- 102300034004 Nucleoside diphosphate kinase 7 isoform 2 Human genes 0.000 description 1
- 108090000630 Oncostatin M Proteins 0.000 description 1
- 102000004140 Oncostatin M Human genes 0.000 description 1
- 240000007019 Oxalis corniculata Species 0.000 description 1
- MRNRMSDVVSKPGM-AVGNSLFASA-N Phe-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRNRMSDVVSKPGM-AVGNSLFASA-N 0.000 description 1
- ZKSLXIGKRJMALF-MGHWNKPDSA-N Phe-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N ZKSLXIGKRJMALF-MGHWNKPDSA-N 0.000 description 1
- SPXWRYVHOZVYBU-ULQDDVLXSA-N Phe-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N SPXWRYVHOZVYBU-ULQDDVLXSA-N 0.000 description 1
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 1
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 1
- XMQSOOJRRVEHRO-ULQDDVLXSA-N Phe-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMQSOOJRRVEHRO-ULQDDVLXSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 1
- YVIVIQWMNCWUFS-UFYCRDLUSA-N Phe-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N YVIVIQWMNCWUFS-UFYCRDLUSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 1
- GOUWCZRDTWTODO-YDHLFZDLSA-N Phe-Val-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O GOUWCZRDTWTODO-YDHLFZDLSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- SYCFMSYTIFXWAJ-DCAQKATOSA-N Ser-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N SYCFMSYTIFXWAJ-DCAQKATOSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- XDARBNMYXKUFOJ-GSSVUCPTSA-N Thr-Asp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XDARBNMYXKUFOJ-GSSVUCPTSA-N 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 1
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 1
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 1
- IJVNLNRVDUTWDD-MEYUZBJRSA-N Thr-Leu-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IJVNLNRVDUTWDD-MEYUZBJRSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- PCMDGXKXVMBIFP-VEVYYDQMSA-N Thr-Met-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMDGXKXVMBIFP-VEVYYDQMSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- XEVHXNLPUBVQEX-DVJZZOLTSA-N Thr-Trp-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N)O XEVHXNLPUBVQEX-DVJZZOLTSA-N 0.000 description 1
- 102000056172 Transforming growth factor beta-3 Human genes 0.000 description 1
- 108090000097 Transforming growth factor beta-3 Proteins 0.000 description 1
- DNUJCLUFRGGSDJ-YLVFBTJISA-N Trp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N DNUJCLUFRGGSDJ-YLVFBTJISA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 1
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- 101710100179 UMP-CMP kinase Proteins 0.000 description 1
- 101710119674 UMP-CMP kinase 2, mitochondrial Proteins 0.000 description 1
- SMKXLHVZIFKQRB-GUBZILKMSA-N Val-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N SMKXLHVZIFKQRB-GUBZILKMSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- MANXHLOVEUHVFD-DCAQKATOSA-N Val-His-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N MANXHLOVEUHVFD-DCAQKATOSA-N 0.000 description 1
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- MNSSBIHFEUUXNW-RCWTZXSCSA-N Val-Thr-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N MNSSBIHFEUUXNW-RCWTZXSCSA-N 0.000 description 1
- UFCHCOKFAGOQSF-BQFCYCMXSA-N Val-Trp-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N UFCHCOKFAGOQSF-BQFCYCMXSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 102100035140 Vitronectin Human genes 0.000 description 1
- 108010031318 Vitronectin Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 239000012790 adhesive layer Substances 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 210000004703 blastocyst inner cell mass Anatomy 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 239000003183 carcinogenic agent Substances 0.000 description 1
- 210000000845 cartilage Anatomy 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 239000002771 cell marker Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000032459 dedifferentiation Effects 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 239000013583 drug formulation Substances 0.000 description 1
- 230000002828 effect on organs or tissue Effects 0.000 description 1
- 230000001700 effect on tissue Effects 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 210000004039 endoderm cell Anatomy 0.000 description 1
- 229940116977 epidermal growth factor Drugs 0.000 description 1
- 230000008472 epithelial growth Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000012637 gene transfection Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 102000052121 human NME2 Human genes 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 229960000905 indomethacin Drugs 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000027056 interspecies interaction between organisms Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 101150111214 lin-28 gene Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 210000003716 mesoderm Anatomy 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 210000002198 morula cell Anatomy 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- NFVJNJQRWPQVOA-UHFFFAOYSA-N n-[2-chloro-5-(trifluoromethyl)phenyl]-2-[3-(4-ethyl-5-ethylsulfanyl-1,2,4-triazol-3-yl)piperidin-1-yl]acetamide Chemical compound CCN1C(SCC)=NN=C1C1CN(CC(=O)NC=2C(=CC=C(C=2)C(F)(F)F)Cl)CCC1 NFVJNJQRWPQVOA-UHFFFAOYSA-N 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000000508 neurotrophic effect Effects 0.000 description 1
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000003118 sandwich ELISA Methods 0.000 description 1
- QYHFIVBSNOWOCQ-UHFFFAOYSA-N selenic acid Chemical compound O[Se](O)(=O)=O QYHFIVBSNOWOCQ-UHFFFAOYSA-N 0.000 description 1
- MCAHWIHFGHIESP-UHFFFAOYSA-N selenous acid Chemical compound O[Se](O)=O MCAHWIHFGHIESP-UHFFFAOYSA-N 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 210000001988 somatic stem cell Anatomy 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 231100000041 toxicology testing Toxicity 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011820 transgenic animal model Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 102000035160 transmembrane proteins Human genes 0.000 description 1
- 108091005703 transmembrane proteins Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0271—Chimeric vertebrates, e.g. comprising exogenous cells
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0276—Knock-out vertebrates
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
- A61K35/48—Reproductive organs
- A61K35/54—Ovaries; Ova; Ovules; Embryos; Foetal cells; Germ cells
- A61K35/545—Embryonic stem cells; Pluripotent stem cells; Induced pluripotent stem cells; Uncharacterised stem cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/28—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
- C07K16/30—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells
- C07K16/3076—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells against structure-related tumour-associated moieties
- C07K16/3092—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells against structure-related tumour-associated moieties against tumour-associated mucins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0603—Embryonic cells ; Embryoid bodies
- C12N5/0606—Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0696—Artificially induced pluripotent stem cells, e.g. iPS
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/02—Animal zootechnically ameliorated
- A01K2267/025—Animal producing cells or organs for transplantation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Cell Biology (AREA)
- Engineering & Computer Science (AREA)
- Developmental Biology & Embryology (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Environmental Sciences (AREA)
- Reproductive Health (AREA)
- Animal Behavior & Ethology (AREA)
- Genetics & Genomics (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- Gynecology & Obstetrics (AREA)
- Biochemistry (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Virology (AREA)
- Pharmacology & Pharmacy (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Transplantation (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Materials For Medical Uses (AREA)
Abstract
본 발명은 비-인간 동물에서 인간 조직을 생성시키는 방법으로서,
(i) 인간 나이브 상태 줄기 세포를 생성시키고, 이들을 비-인간 동물의 배반포 또는 배아에 주입하여, 키메라 동물이 생성되도록 하는 단계;
(ii) 인간 조직 또는 키메라 동물의 세포에 의해 분비되거나 이로 제조된 인간 조직, 장기, 세포 또는 인자를 수확하는 단계; 및
(iii) 상기 수확된 물질을 인간에게 이식 또는 투여하여, 비-인간 동물에 인간 조직을 생성하는 단계를 포함하는, 방법에 관한 것이다.
(i) 인간 나이브 상태 줄기 세포를 생성시키고, 이들을 비-인간 동물의 배반포 또는 배아에 주입하여, 키메라 동물이 생성되도록 하는 단계;
(ii) 인간 조직 또는 키메라 동물의 세포에 의해 분비되거나 이로 제조된 인간 조직, 장기, 세포 또는 인자를 수확하는 단계; 및
(iii) 상기 수확된 물질을 인간에게 이식 또는 투여하여, 비-인간 동물에 인간 조직을 생성하는 단계를 포함하는, 방법에 관한 것이다.
Description
본 출원은 비-인간 동물에서 인간 조직을 생성시키는 방법에 관한 것이다. 본 출원은 또한 비-인간 동물에 존재하는 인간 조직과 관련된 비-인간 동물에 대한 약물 시험에 관한 것이다. 본 출원은 또한 비-인간 동물로부터 수득된 인간 조직 또는 장기를 갖는 환자를 치료하는 방법에 관한 것이다. 본 출원은 또한 인간 세포 및 조직의 혼입을 가능하게하는 형질전환 동물을 생성하는 방법에 관한 것이다.
현재, 발달중인 배아 또는 배반포에 줄기 세포를 삽입하여 키메라 동물을 제조하는 분야에 대한 상당한 연구가 있다. 최종 목표는 소, 양 또는 돼지와 같은 동물에서 인간의 장기 또는 조직을 생성할 수 있는 것이며, 이로 인해 생성된 장기 또는 조직은 인간에게 이식하는데 사용된다. 공여자 줄기 세포는 새로운 간, 심장 등을 필요로 하는 환자로부터 유래될 수 있다. 성공할 경우, 기술은 장기 공여자의 필요를 대체할 것이며; 현재는 적절한 장기 공여자가 확인되기 전에 대부분의 환자가 사망한다.
기술은 다음과 같은 이유로: 1) 심장, 췌장, 폐 또는 다른 장기 또는 조직을 발달시키지 않을 녹아웃 동물을 제조하기 위해; 2) 공여자 줄기 세포를 다른 것의 상실배 또는 배반포에 주입하여 키메라 동물을 제조하기 위해; 3) 수정란 또는 수정되지 않은 난자가 특정 장기 또는 조직을 형성하는 능력을 더 이상 갖지 않도록 유전자(들) 녹아웃된 키메라 동물을 제조하기 위해 존재하지만, 공여자 줄기 세포가 그 특정 장기 또는 조직을 형성할 수 있는 능력을 갖는 경우, 키메라 동물은 표적 장기의 공여자 줄기 세포 DNA를 100%까지 가질 수 있다. 이 기술은 마우스에서 래트로, 및 래트에서 마우스로와 같은 종 용도에 걸쳐 작동하는 것으로 보였다. 생성된 장기의 크기는 수혜자 동물의 크기에 따라 다르다. 그러나, 래트와 마우스는 가까운 종이다.
윤리적 문제는 비-인간 영장류-인간 키메라의 생성을 방해할 수 있다. 더 먼 포유동물-인간 키메라가 특정 윤리적 문제를 극복할 수도 있지만, 비-영장류 종-인간 키메라를 생성하려는 시도는 지금까지 실패했다.
한 가지 문제점은, 적어도 설치류 예에서, 단지 나이브(naive) 상태 줄기 세포만이 상실배 또는 내부세포괴로 통합되어 키메라를 형성할 수 있다는 것이다. 프라임드(primed) 상태 줄기 세포는 할 수 없었다.
본 발명은 비인간-인간 키메라 동물의 생성을 위한 나이브 상태의 인간 줄기 세포를 생성시키는 방법을 제공함과 동시에 비-인간 환경에서 다능성 인간 줄기 세포의 성장에 적합한 환경을 제공하는 방법을 제공함으로써 상기 문제점을 해결한다. 본 발명은 비-인간 숙주 동물에서 인간 세포의 성장 및 확대를 가능하게하는 인간 인자를 발현하도록 유전적으로 변형시킴으로써 숙주 동물을 "인간화"하는 방법을 제공함으로써 상기 문제점을 해결한다.
I. 일 양태에서, 본 발명은 일부 인간 DNA 또는 일부 인간 조직을 발현하는 키메라 동물에서 잠재적인 약물 제제의 효능 또는 독성을 시험하는 방법에 관한 것이다. 이 방법에서, 일부 인간 DNA 또는 조직을 발현하는 동물은 인간 나이브 상태의 줄기 세포를 비-인간 세포 또는 세포들에 도입하여 생성된다. 일 양태에서, 비-인간 세포는 난이고, 다른 양태에서는 수정란이며, 또다른 양태에서, 세포는 상실배, 배반포 또는 배아이다. 윤리적인 우려 또는 다른 이유로 인해, 통합적인 나이브 상태 줄기 세포가 비-인간이지만, 수혜자 세포, 세포들, 상실배, 배반포 또는 배아와 다른 종의 세포인 키메라 동물을 생성하는 것이 유리할 수 있다. 상기 방법에서, 줄기 세포를 나이브 상태로 유지하거나 프라임드 줄기 세포를 나이브 상태로 되돌리는 제제는 NME 단백질, 2i, 5i, 또는 억제제, 화학 물질 또는 핵산의 다른 칵테일일 수 있다. NME 단백질은 NME1 이량체, NME7 단량체, NME7-AB, NME7-X1, NME6 이량체 또는 박테리아 NME일 수 있다.
비-인간 포유동물은 설치류, 예컨대 마우스 또는 래트, 짧은꼬리 원숭이(macaque), 붉은털 원숭이(rhesus monkey), 유인원, 침팬지, 보노보 등을 포함하는 영장류, 또는 돼지, 양, 소, 등을 포함하는 가축일 수 있다. 키메라 동물은 유전 질환을 가질 수 있거나, 인간으로부터 유래된 세포로부터 자발적으로 생성되거나 이식될 수 있는 암 또는 유발된 질병을 가질 수 있다.
상기 방법에 있어서, 상기 비-인간 동물은 형질전환 동물일 수 있으며, 여기서 상기 동물은 생식 세포 또는 체세포에서 인간 MUC1 또는 MUC1* 또는 NME 단백질을 발현하며, 생식 세포 및 체세포는 재조합 인간 MUC1 또는 MUC1* 또는 상기 동물에게 도입된 NME 유전자 서열을 함유한다. 인간 MUC1 또는 MUC1* 또는 NME 단백질을 발현하는 유전자는 유도성 프로모터의 제어하에 있을 수 있다. 프로모터는 비-인간 동물의 자연 발생 단백질 또는 발달 전후, 또는 발달 중에 동물에게 투여될 수 있는 제제에 대해 유도적으로 반응할 수 있다. 대안적으로는, 비-인간 동물은 형질전환 동물일 수 있으며, 여기서 동물은 생식 세포 또는 체세포에서 천연 서열 MUC1 또는 MUC1* 또는 NME 단백질을 발현하며, 상기 생식 세포 및 체세포는 상기 포유동물에 도입된 재조합 천연 종 MUC1 또는 MUC1* 또는 NME 유전자 서열을 함유한다. NME 종은 NME7, NME7-X1, NME1, NME6 또는 박테리아 NME일 수 있다.
상기 방법에서, 줄기 세포를 나이브 상태로 유지하거나 프라임드 줄기 세포를 나이브 상태로 되돌리는 제제는 NME 단백질, 2i, 5i 또는 억제제, 화학 물질 또는 핵산의 다른 칵테일일 수 있다. NME 단백질은 NME1 이량체, NME7 단량체, NME7-AB, NME7-X1, NME6 이량체 또는 박테리아 NME일 수 있다.
이 방법에서, 상기 제제는 MBD3, CHD4, BRD4 또는 JMJD6의 발현을 억제할 수 있다. 상기 제제는 MBD3, CHD4, BRD4 또는 JMJD6에 대해 제조된 siRNA, 또는 MBD3, CHD4, BRD4 또는 JMJD6의 발현을 상향 조절하는 단백질을 코딩하는 임의의 유전자에 대해 제조된 siRNA일 수 있다. 암 줄기 세포는 암 세포 또는 정상 세포와 비교하여 CXCR4 또는 E-캐드헤린(CDH1)의 발현이 증가하는 특징이 있을 수 있다.
또 다른 양태에서, 본 발명은 (i) 형질전환 비-인간 포유동물을 생성하는 단계로서, 포유동물이 생식 세포 및 체세포에서 인간 MUC1 또는 MUC1* 또는 NME 단백질을 발현하고, 생식 세포 및 체세포가 상기 포유동물에 도입된 재조합 인간 MUC1 또는 MUC1* 또는 NME 유전자 서열을 함유하고, 상기 유전자 서열의 발현이 유도성 및 억제성 조절 서열의 제어하에 있을 수 있는 단계; (ii) 기원이 이종인 줄기 세포 또는 전구 세포를 비-인간 포유동물에 전이시켜, 유전자가 줄기 세포 또는 전구 세포의 수를 증가시키도록 발현되도록 유도할 수 있는 단계; 및 (iii) 이종이식된 줄기 세포로부터 조직을 생성하도록 유전자 발현을 억제하는 단계를 포함하는, 비-인간 포유동물에서 이종이식으로부터 조직을 생성하는 방법에 관한 것이다.
이 방법에서, 단계 (iii)에서, 줄기 세포를 조직 분화 인자와 접촉시킴으로써 유전자 발현 억제가 수행될 수 있으며, 또는, 단계 (iii)에서 자연적으로 생성된 숙주 조직 분화 인자에 반응하여, 유전자 발현 억제가 포유동물에서 자연적으로 수행될 수 있다. 전이된 세포는 인간일 수 있다. 조직은 장기일 수 있다. NME 단백질은 NME7, NME7-AB, NME7-X1, NME1, NME6 또는 박테리아 NME일 수 있다. 동물은 포유동물, 설치류, 영장류 또는 돼지, 양 또는 소 종과 같은 가축일 수 있다.
II. 다른 양태에서, 본 발명은 적어도 일부 인간 세포 또는, DNA의 적어도 일부가 인간 기원인 세포를 갖는 동물을 제조하는 것에 관한 것이다. 상기 동물은 인간 조직, 일부 인간 세포 또는, 인간 또는 인간-유사 조직의 생성을 위한 일부 인간 DNA를 함유하는 세포를 함유하는 조직을 성장시킬 것이다. 다른 경우, 상기 동물은 적어도 일부 인간 세포를 포함하는 장기를 성장시킬 것이다. 다른 경우, 상기 동물은 인간 세포로만 구성된 장기를 성장시킬 것이다. 또다른 경우, 숙주 동물은 발달 후에도 인간의 사지를 성장시키기 위해 유전적으로 또는 분자적으로 조작될 수 있다. 사지, 신경, 혈관, 조직, 장기, 또는 이들내에서 제조되거나 이들로부터 분비된 인자는 동물로부터 수확되어, 다음을 포함하는 다수의 목적으로 사용되지만, 이에 한정되지 않는다: 1) 인간으로의 이식; 2) 노화-방지를 포함한 의료적 이익을 위해 인간에게 투여; 3) 약물 검사 및 질병 모델링을 포함한 과학 실험.
일 양태에서, 본 발명은 비-인간 동물에서 인간 조직을 생성시키는 방법에 관한 것으로서, 상기 방법은 (i) 인간 나이브 상태 줄기 세포를 생성시키고, 이들을 비-인간 동물의 수정란, 상실배, 배반포 또는 배아에 주입하여, 키메라 동물이 생성되도록 하는 단계; (ii) 키메라 동물의 인간 조직 또는 세포에 의해 분비되거나 이로 제조된 인간 조직, 장기, 세포 또는 인자를 수확하는 단계; 및 (iii) 상기 수확된 물질을 인간에게 이식 또는 투여하는 단계를 포함한다. 나이브 상태 줄기 세포는 NME7, NME7-AB, NME7-X1 또는 이량체 NME1을 사용하여 생성될 수 있다. 나이브 줄기 세포는 NME7, NME7-AB, NME7-X1 또는 이량체 NME1을 함유하는 배지에서 재프로그래밍된 iPS 세포일 수 있다. 또는, 나이브 줄기 세포는 NME7, NME7-AB, NME7-X1 또는 이량체 NME1을 함유하는 배지에서 배양된 배아 줄기 세포일 수 있다. 배반포 또는 배아의 비-인간 세포는 유전적으로 변형되었을 수 있다. 그리고 유전자 변형은 숙주 동물이 특정 조직이나 장기를 생성하지 못하게 할 수 있다. 유전자 변형은 비-인간 숙주 동물에서 인간 줄기 세포 또는 전구 세포의 혼입 또는 성장을 촉진 또는 강화시키는 인간 분자를 비-인간 동물이 발현하게 할 수 있다. 또한, 줄기 세포를 나이브 상태로 유지하거나 프라임드 줄기 세포를 나이브 상태로 되돌리는 제제는 NME 단백질, 2i, 5i, 화학물질 또는 핵산일 수 있다. NME 단백질은 NME1 이량체, NME7 단량체, NME7-AB, NME6 이량체 또는 박테리아 NME 또는 NME7-X1일 수 있다. 비-인간 동물은 설치류, 마우스, 래트, 돼지, 양, 비-인간 영장류, 짧은 꼬리 원숭이, 침팬지, 보노보, 고릴라 또는 임의의 비-인간 포유동물일 수 있다. 본 발명의 일 양태에서, 비-인간 동물은 인간 NME 단백질, 특히 인간 NME7-AB 또는 NME7-X1에 대한 높은 서열 상동성 또는 인간 MUC1* 세포외 도메인에 대한 높은 서열 상동성을 위해 선택된다. 어떤 경우에는, NME 단백질은 무혈청 배지에 단일 성장 인자로서 존재할 수 있다.
키메라 동물이 생성될 수 있는지 여부에 대한 한가지 시험은 제1 종으로부터의 줄기 세포가 제2 종의 내부세포괴(ICM)에 혼입될 수 있는지 여부이다. 키메라 동물은 2개의 다른 종, 예를 들어 두 설치류들이 밀접하게 관련되어 있을 때 더 쉽게 생성된다. 본 발명자들은 인간의 나이브 상태 줄기 세포를 마우스 상실배에 주사하여 이들이 내부세포괴에 혼입되었음을 보여주었다. 특정 예에서, 인간 NME7-AB에서 생성된 후 인간에서 배양된 인간 나이브 상태 줄기 세포를, 난자를 수정한지 2.5일 후에 마우스 상실배에 주입하였다. 이것은 내부세포괴가 형성하기 이전이다. 48시간 후, 상실배를 분석하였으며, 상기 분석은 인간 줄기 세포가 내부세포괴에 혼입되어 키메라 동물이 발생한다는 것을 보여주었다.
본 발명은 비인간-인간 키메라 동물의 생성을 위한 나이브 상태의 인간 줄기 세포를 생성시키는 방법을 제공함과 동시에 비-인간 환경에서 다능성 인간 줄기 세포의 성장에 적합한 환경을 제공한다.
또한, 본 발명은 비-인간 숙주 동물에서 인간 세포의 성장 및 확대를 가능하게하는 인간 인자를 발현하도록 유전적으로 변형시킴으로써 숙주 동물을 "인간화"하는 방법을 제공한다.
본 발명은 이하에 주어진 상세한 설명 및 단지 설명을 위해 제공된 첨부 도면으로부터 보다 충분히 이해될 것이며, 따라서 본 발명을 제한하지 않는다;
도 1은 정상 섬유아세포 성장 배지, 또는 NME1 이량체, NME7-AB 또는 HSP593 박테리아 NME1 이량체로도 불리는 인간 재조합 NM23을 첨가한 무혈청 최소 배지에서 배양된 체세포 섬유아세포, 'fbb' 세포에서의 마스터 다능성 조절 유전자 Oct4 및 Nanog의 발현에 대한 RT-PCR 측정의 그래프를 도시한다. '+ROCi'는 일부 세포에 첨가되어, 표면에 부착시키는 Rho 키나아제 억제제를 지칭한다.
도 2는 정상 섬유아세포 성장 배지, 또는 NME1 이량체, NME7-AB 또는 HSP593 박테리아 NME1 이량체로도 불리는 인간 재조합 NM23을 첨가한 무혈청 최소 배지에서 배양된 체세포 섬유아세포, 'fbb' 세포에서의 염색질 재배열 인자 BRD4, JMJD6, MBD3 및 CHD4를 코딩하는 유전자의 발현에 대한 RT-PCR 측정의 그래프를 도시한다. '+ROCi'는 일부 세포에 첨가되어, 표면에 부착시키는 Rho 키나아제 억제제를 지칭한다.
도 3은 정상 섬유아세포 성장 배지, 또는 NME1 이량체, NME7-AB 또는 HSP593 박테리아 NME1 이량체로도 불리는 인간 재조합 NM23을 첨가한 무혈청 최소 배지에서 배양된 체세포 섬유아세포, 'fbb' 세포에서의 다능성 유전자 OCT4 및 NANOG, 염색질 재배열 인자 BRD4, JMJD6, MBD3 및 CHD4, 및 NME1 및 NME7의 발현에 대한 RT-PCR 측정의 그래프를 도시한다. '+ROCi'는 일부 세포에 첨가되어, 표면에 부착시키는 Rho 키나아제 억제제를 지칭한다.
도 4(4A-4B)는 첨가된 유일한 성장 인자로서 재조합 인간 NME1 이량체를 갖는 무혈청 최소 배지에서 줄기 세포가 배양된 다능성 형태를 갖는 인간 배아 줄기 세포의 사진을 도시한다. 도 4의 4A는 4X 배율로 촬영한 사진을 도시하며, 도 4의 4B는 20X 배율로 촬영한 사진을 도시한다.
도 5(5A-5C)는 첨가된 유일한 성장 인자로서 재조합 인간 NME7-AB를 갖는 무혈청 최소 배지에서 줄기 세포가 배양된 다능성 형태를 갖는 인간 배아 줄기 세포의 사진을 도시한다. 도 5의 5A는 4X 배율로 촬영한 사진을 도시하며, 도 5의 5B는 20X 배율로 촬영한 사진을 도시한다.
도 6(6A-6B)는 ELISA 샌드위치 분석으로부터의 HRP 신호 그래프로서, NME7-AB가 MUC1* 세포외 도메인 펩타이드를 이량화하는 것을 보여준다. 도 6의 6A는 MUC1* 세포외 도메인 펩타이드 PSMGFR로 코팅된 표면에 결합된 NME7-AB의 양을 도시하고, 도 6의 6B는 결합된 NME7-AB 상의 제2 부위에 결합하는 제2 MUC1* 펩타이드를 도시한다.
도 7은 후기 단계의 프라임드 줄기 세포와 비교하여 가장 초기 단계의 나이브 인간 줄기 세포에서의 전사 인자 BRD4 및 공동-인자 JMJD6의 발현 수준의 RT-PCR 측정 그래프를 나타낸다.
도 8은 4X 배율에서 이량체 형태의 인간 NME1을 함유하는 무혈청 배지에서 18일 배양 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 9는 20X 배율에서 이량체 형태의 인간 NME1을 함유하는 무혈청 배지에서 18일 배양 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 10은 4X 배율에서 인간 NME7-AB를 함유하는 무혈청 배지에서 18일 배양 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 11은 20X 배율에서 인간 NME7-AB를 함유하는 무혈청 배지에서 18일 배양 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 12는 4X 배율에서 NME 단백질이 없는 표준 배지에서 18일 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 13은 20X 배율에서 NME 단백질이 없는 표준 배지에서 18일 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 14(14A-14C)는 인간 줄기 세포가 자기-복제를 제한하는 방법을 발명가가 발견한 기계론적 모델의 만화를 도시한다. 도 14의 14A는 나이브 줄기 세포로부터 NME7-AB가 분비되고, NME7-AB가 단량체로서 MUC1* 성장 인자 수용체를 이량화하는 방법을 나타내지만, 나중에 BRD4에 의해 억제되는 반면 공동-인자 JMJD6은 NME1을 상향조절함을 보여주며, 도 14의 14B는 NME1이 후기 나이브 상태의 줄기 세포에 의해 분비되지만 이량체로서 MUC1*에만 결합하는 것을 보여주며, 도 14의 14C는 줄기 세포의 수가 증가함에 따라 NME1의 농도가 MUC1*에 결합하지 않는 헥사머를 형성시키고 분화를 유도한다는 것을 보여준다.
도 15(15A-15B)는 NME7-AB 및 NME7-X1을 인식하는 본 발명자가 개발한 항체로 염색된 인간 배반포의 사진을 나타낸 것이다. 도 15의 15A는 NME7-AB 또는 NME7-X1의 존재에 대해 모든 세포가 양성으로 염색되는 3일 배반포를 나타내며, 도 15의 15B는 NME7-AB 또는 NME7-X1의 존재에 대해 내세포괴의 나이브 세포만 양성으로 염색되는 5일 배반포를 나타낸다.
도 16(16A-16B)는 인간 나이브 상태 유도 다능성 줄기(iPS) 세포 및 배아 줄기(ES) 세포가 용해되고, MUC1의 세포질 꼬리에 대한 항체(Ab5)를 사용하여 MUC1에 결합하는 종을 동시-면역침전시키는 동시-면역침전 실험에서의 웨스턴 블롯 겔의 사진을 나타낸다. 이어서, 면역침전물을 웨스턴 블롯으로 분석하였다. 도 16의 16A는 항-MNE7 항체로 프로빙되고, 분자량 30kDa 및 다른 하나 33kDa를 갖고, MUC1에 결합되는 반면, 조 세포 용해물내 전장 NME7은 분자량 42 kDa를 가지는 2개의 NME7 종을 나타내는 웨스턴 블롯의 사진을 나타내며, 도 16의 16B는 도 16A의 겔을 항-MUC1* 세포외 도메인 항체로 박리 및 재프로빙한 웨스턴 블롯의 사진으로, MUC1*으로 불리는, MUC1의 절단된 형태에 결합된 NME7-AB 또는 NME7-X1은 글리코실화에 따라 17-25 kDa의 분자량으로 동작하는 것을 보여준다.
도 17은 MNC3 항-MUC1* 세포외 도메인 항체의 접착 표면상의 유일한 성장 인자로서 NME7-AB를 사용하여 나이브 상태의 인간 줄기 세포를 성장시키는 본 발명의 방법의 만화를 도시한다. 분화를 유도하고자 하는 경우, 합성 MUC1* 세포외 도메인 펩타이드를 첨가하여 모든 NME7-AB를 결합시킨다.
도 18(18A-18C)는 FGF에서 유래된, 프라임드 상태에서, 인간 배아 줄기(ES) 세포가 NME7-AB 또는 NME1 이량체에서 배양함으로써 덜 성숙된 나이브 상태로 되돌아가는, RNA SEQ 실험으로부터의 열지도를 나타낸다. 도 18의 18A는 모 FGF-배양된 ES 세포의 열지도를 도시하고, 도 18B는 NME7-AB에서 10 계대 배양된 모 세포의 열지도를 도시하고, 도 18C는 NME1 이량체에서 10 계대 배양된 모 세포의 열지도를 도시한다.
도 19(19A-19B)는 히스톤 3상의 트리메틸화 리신 27에 결합하는 항체로 염색된 인간 배아 줄기(ES) 세포의 사진을 도시하며, 붉은 초점의 존재는 암(female) 공급원 줄기 세포의 두번째 X 염색체가 불활성화되었으며(XaXi), 이것이 세포가 프라임드 상태이고 조기 분화를 시작했으며 일부 세포 운명 결정을 내렸음을 나타내는 신호임을 나타내며; 레드 클라우드(red cloud)의 존재 또는 적색 염색의 부재는 X 염색체가 여전히 활성임을 나타내므로(XaXa) 아직 분화 결정이 이루어지지 않았으며, 그래서 나이브하다. 도 19의 19A는 FGF 배지에서 적어도 10 계대 배양된 암 공급원 줄기 세포의 사진을 나타내고, 도 19B는 NME7-AB 배지에서 10 계대 배양된 동일한 세포의 사진을 나타낸다.
도 20(20A-20B)는 프라임드 상태 줄기 세포보다 훨씬 빠른 성장 속도이며 NME7-AB에서 배양된 줄기 세포가 나이브 상태임을 나타내는 또다른 지표인, 4일 동안 10-20배의 팽창 속도를 나타내는 두 시점에서 MNC3 항-MUC1* 항체 표면상에서 NME7-AB 배지에서 배양된 인간 다능성 줄기 세포의 사진을 보여준다. 도 20A는 4일째의 줄기 세포를 나타내고, 도 20B는 4일째의 줄기 세포를 나타낸다.
도 21(21A-21C)는 센다이 바이러스 형질도입을 사용하여 전달된 야마나카(Yamanaka) 마스터 재프로그래밍 인자 OCT4, NANOG, KLF4 및 c-Myc를 사용하여 다능성 줄기 세포가 되도록 재프로그래밍된 섬유아세포의 사진을 나타내며, 새로 재프로그래밍된 유도된 다능성 줄기 세포는 알칼리성 포스파타제에 의한 염색을 통해 가시화된다. 도 21A는 MEF 피더 세포 상에서 FGF 배지에서 수행된 재프로그래밍을 나타내고, 도 21B는 마트리겔(Matrigel) 상에서 mTeSR 배지에서 수행된 재프로그래밍을 나타내며, 도 21C는 MNC3 항-MUC1* 항체 표면 상에서 NME7-AB 배지에서 수행된 재프로그래밍을 나타낸다.
도 22(22A-22D)는 NME7-AB에서 유도되고 배양된 형광성 마커인 황색 세포를 갖고, 마우스 배반포에 2.5일에 주사한 다음, 48시간 후에 4.5일에 이미징한 인간 iPS 세포의 사진을 나타내며, 이는 NME7-AB에서 배양된 인간 iPS 세포가 마우스 배아의 내부세포괴로 통합할 수 있는 능력을 가짐을 보여준다. 도 22A는 나이브 줄기 세포를 함유하는 마우스 배아의 내부세포괴 안으로의 경로가 발견된 클론 E 인간 iPS 세포(황색)의 형광 현미경 사진을 도시하고, 도 22B는 동일한 사진이지만 모든 세포를 보여주고 NME7-AB 세포가 태반으로 발달될 영양외배엽(trophectoderm)에서 내부세포괴 플러스 휘프(whiff)에 오로지 통합되어 있음을 보여주는 DAPI를 영상화(청색)하도록 열린 다른 형광 채널을 가진 사진을 나타내며, 도 22C는 나이브 줄기 세포를 함유하는 마우스 배아의 내부세포괴로의 경로를 발견한 클론 R 인간 iPS 세포(노란색)의 형광 현미경 사진을 나타내고, 도 22D는 동일한 사진이지만 모든 세포를 보여주고 NME7-AB 세포가 태반으로 발달될 영양외배엽에서 내부세포괴 플러스 휘프에 오로지 통합되어 있음을 보여주는 DAPI를 영상화하도록 열린 다른 형광 채널을 가진 사진을 나타낸다.
도 23(23A-23J)는 2.5일 마우스 상실배에 주사된, NME7-AB 생성된 인간 iPS 세포, 클론 E의 공초점 이미지를 보여준다. 48시간 후에 인간 Tra 1-81에 대한 염색(적색)은 NME7-AB 인간 줄기 세포가 마우스 상실배의 내부세포괴에 혼입되었음을 보여준다. 도 23A, 도 23C, 도 23E, 도 23G 및 도 23I는 형광 이미지이다. 도 23B, 도 23D, 도 23F, 도 23H 및 도 23J는 명 시야 이미지이다.
도 24(24A-24J)는 2.5일 마우스 상실배에 주사된 NME7-AB 생성된 인간 iPS 세포, 클론 R의 공초점 이미지를 도시한다. 48시간 후에 인간 Tra 1-81에 대한 염색(적색)은 NME7-AB 인간 줄기 세포가 마우스 상실배의 내부세포괴에 혼입되었음을 보여준다. 도 24A, 도 24C, 도 24E, 도 24G 및 도 24I는 형광 이미지이다. 화살표는 나이브 상태 NME7-AB 인간 줄기 세포를 마우스 상실배에 혼입하는 것을 가리키며, 이는 키메라 동물의 형성을 나타낸다. 도 24B, 도 24D, 도 24F, 도 24H 및 도 24J는 명 시야 이미지이다.
도 25(25A-25D)는 2.5일 마우스 상실배에 주사된 FGF 생성된 인간 iPS 세포의 공초점 이미지를 도시한다. 48시간 후에 인간 Tra 1-81에 대한 염색(적색) 및 영양외배엽에 대한 염색(녹색)은 일부 흩어져있는 인간 줄기 세포를 보여주지만, 마우스 상실배의 내부세포괴에 프라임드 상태 인간 줄기 세포가 혼입되지 않아 키메라 동물을 형성하기 시작하는데 실패함을 보여준다. 도 25A 및 도 25C는 형광 이미지이며, 도 25B 및 도 25D는 명 시야 이미지이다.
도 26(26A-26D)는 50% NME7-AB 배지 및 50% KSOM, 칼륨 심플렉스 최적화 배지에서 배양한 다음, 2.5일째 마우스 상실배에 주사된 인간 iPS 세포의 공초점 이미지를 나타낸다. 48시간 후에 형광 이미지 뿐만 아니라 명 시야 이미지를 촬영했다. 48시간 후에 인간 Tra 1-81에 대한 염색(적색) 및 영양외배엽에 대한 염색(녹색)은 필요하다면, 프라임드 상태 인간 줄기 세포가 마우스 상실배의 내부세포괴 내로 혼입되는, 및 혼입되지않는 최소 개수의 인간 세포를 나타내며, 이는 키메라 동물을 형성하기 시작하는데 실패함을 나타낸다. 도 26A, 26C, 26E 및 26G는 형광 이미지이고, 도 26B, 26D, 26F 및 26H는 DAP 염색을 포함한다.
도 27(27A-27F)는 형광 라벨, tdtomato로 트랜스펙션되어 적색을 자가-형광화하는 NME7-AB 생성된 인간 iPS 세포, 클론 E의 공초점 형광 이미지를 나타낸다. 그들은 2.5일째 마우스 상실배에 주사되었다. 48시간 후에 이미지를 촬영하고, NME7-AB 인간 세포를 마우스 상실배의 내부세포괴로 통합하는 것을 보여준다. 도 27A, 도 27B 및 도 27C는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽을 나타내며, 및 도 27D, 27E 및 27F는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽 및 청색의 모든 세포핵을 나타낸다.
도 28(28A-28J)는 형광 라벨, tdtomato로 트랜스펙션되어 적색을 자가-형광화하는 NME7-AB 생성된 인간 iPS 세포, 클론 E의 공초점 형광 이미지를 나타낸다. 그들은 2.5일째 마우스 상실배에 주사되고, 48시간 후에 이미지를 촬영하였다. 상기 사진은 NME7-AB 인간 세포를 마우스 상실배의 내부세포괴로 통합하는 것을 보여준다. 도 28A, 28C, 28E, 28G 및 28I는 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽을 나타내고, 도 28B, 28D, 28F 및 28H는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽, 및 청색의 모든 세포핵을 나타낸다.
도 29(29A-29J)는 형광 라벨, tdtomato로 트랜스펙션되어 적색을 자가-형광화하는 NME7-AB 생성된 인간 iPS 세포, 클론 R의 공초점 형광 이미지를 나타낸다. 그들은 2.5일째 마우스 상실배에 주사되고, 48시간 후에 이미지를 촬영하였다. 상기 사진은 NME7-AB 인간 세포를 마우스 상실배의 내부세포괴로 통합하는 것을 보여준다. 화살표는 인간 세포가 마우스 내부세포괴에 혼입된 것을 가리킨다. 도 29A, 29C, 29E, 29G 및 29I는 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽을 나타내고, 도 29B, 29D, 29F 및 29H는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽, 및 청색의 모든 세포핵을 나타낸다.
도 30(30A-30J)는 형광 라벨, tdtomato로 트랜스펙션되어 적색을 자가-형광화하는 NME7-AB 생성된 인간 iPS 세포, 클론 R의 공초점 형광 이미지를 나타낸다. 그들은 2.5일째 마우스 상실배에 주사된다. 48시간 후에 이미지를 촬영하였다. 상기 사진은 NME7-AB 인간 세포를 마우스 상실배의 내부세포괴로 통합하는 것을 보여준다. 화살표는 인간 세포가 마우스 내부세포괴에 혼입된 것을 가리킨다. 도 30A, 30C, 30E, 30G 및 30I는 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽을 나타내고, 도 30B, 30D, 30F 및 30H는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽, 및 청색의 모든 세포핵을 나타낸다.
도 31(31A-31F)는 비-인간 영장류 유도된 다능성 줄기 세포의 생성을 입증하는 실험용 대조군 플레이트의 사진을 나타낸 것이다. 상기 대조군 실험에서, 필리핀 원숭이(crab-eating macaques)의 섬유아세포가 배양되었지만 코어 다능성 유전자는 형질도입되지 않았다. 이미지는 줄기 세포가 아닌 섬유아세포의 형태를 보여준다. 도 31A 및 도 31D는 4X 배율로 촬영하고, 도 31B 및 31E는 10X 배율로 촬영하고, 도 31C 및 31F는 20X 배율로 촬영하였다.
도 32(32A-32C)는 NME7 배지, 이 경우에는 NME7-AB에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면 상에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 필리핀 원숭이로부터의 섬유아세포의 6일 사진을 나타낸 것이다. 필리핀 원숭이의 섬유아세포 50,000개를 6-웰 플레이트의 웰마다 플레이팅하였다. 줄기 모양의 형태를 가진 신흥 콜로니는 원형이다. 도 32A는 4X 배율로 촬영하고, 도 32B는 10X 배율로 촬영하고, 도 32C는 20X 배율로 촬영했다.
도 33(33A-33F)는 NME7 배지, 이 경우에는 NME7-AB에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면 상에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 필리핀 원숭이로부터의 섬유아세포의 6일 사진을 나타낸 것이다. 필리핀 원숭이의 섬유아세포 100,000개를 6-웰 플레이트의 웰마다 플레이팅하였다. 줄기 모양의 형태를 가진 신흥 콜로니는 원형이다. 도 33A 및 33D는 4X 배율로 촬영하고, 도 33B 및 33E는 10X 배율로 촬영하고, 도 33C 및 33F는 20X 배율로 촬영했다.
도 34(34A-34F)는 NME7 배지, 이 경우에는 NME7-AB에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면 상에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 필리핀 원숭이로부터의 섬유아세포의 14일 사진을 나타낸 것이다. 줄기 세포 콜로니가 명확하게 보인다. 도 34A, 34B 및 34C는 10X 배율로 촬영하고, 도 34D, 34E 및 34F는 20X 배율로 촬영하고, 도 34A 및 34D는 24,000개의 원숭이(macaque) 섬유아세포를 플레이팅한 결과이며, 도 34B 및 34E는 6,000개의 원숭이 섬유아세포를 플레이팅한 결과이며, 도 34C 및 34F는 12,000개의 원숭이 섬유아세포를 플레이팅한 결과를 나타낸다.
도 35(35A-35D)는 항-MUC1* 항체 표면 상에서 NME7-AB 배지에서 2차 계대 배양 1일째에 유일한 성장 인자로서 NME7-AB를 함유하는 무혈청 배지에서 증식된 붉은털 원숭이 배아 줄기(ES) 세포의 사진을 나타낸다. 배아 줄기 세포 콜로니가 명확하게 보인다. 도 35A 및 도 35B는 4X 배율로 촬영하고, 도 35C 및 35D는 10X 배율로 촬영하였다.
도 36(36A-36D)는 항-MUC1* 항체 표면 상에서 NME7-AB 배지에서 2차 계대 배양 3일째에 유일한 성장 인자로서 NME7-AB를 함유하는 무혈청 배지에서 증식된 붉은털 원숭이 배아 줄기(ES) 세포의 사진을 나타낸다. 배아 줄기 세포 콜로니가 명확하게 보인다. 도 36A 및 도 36B는 4X 배율로 촬영하고, 도 36C 및 36D는 10X 배율로 촬영하였다.
도 37(37A-37B)는 계대배양 3, 1일째에 유일한 성장 인자로서 NME7-AB를 함유하는 무혈청 배지에서 증식된 붉은털 원숭이 배아 줄기(ES) 세포의 사진을 나타낸다. 도 37A는 1000um에서의 축척 막대(scale bar)를 나타내고, 및 도 37B는 400um에서의 축척 막대를 나타낸다.
도 38(38A-38H)는 계대배양 3, 4일째에 유일한 성장 인자로서 NME7-AB를 함유하는 무혈청 배지에서 증식된 붉은털 원숭이 배아 줄기(ES) 세포의 사진을 나타낸다. 도 38A, 38C 및 38F는 4X 배율로 촬영하고, 도 38B, 38D 및 38G는 10X 배율로 촬영하고, 도 38E 및 38H는 20X 배율로 촬영하였다.
도 39(39A-39C)는 NME7 배지, 이 경우에는 NME7-AB내에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입함으로써 유도된 다능성 줄기(iPS) 세포로 재프로그래밍된 붉은털 원숭이로부터의 섬유아세포의 14일 사진으로서, 다능성 유전자 형질도입후 14일 후 사진을 나타낸다. 도 39A는 4X에서 촬영되었고, 도 39B는 10X에서 촬영되었고, 도 39C는 20X에서 촬영되었다.
도 40(40A-40C)는 NME7 배지, 이 경우에는 NME7-AB에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면 상에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 붉은털 원숭이로부터의 섬유아세포의 연속 계대배양 사진을 나타낸 것이다. 도 40A는 4X에서 촬영했고, 도 40B는 10X에서 촬영했으며, 도 40C는 20X에서 촬영했다.
도 41(41A-41D)는 하나의 경우에는 원숭이 섬유아세포를 MNC3 항-MUC1* 항체 표면에, 및 다른 경우에는 마우스 배아 피더 세포, MEF 상에 플레이팅한 것을 제외하고는 동일한 조건하에, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc를 갖는 세포를 형질도입함으로써, NMDA7-AB 배지에서 원숭이 iPS 세포를 16일 유도한 사진을 나타낸다. 마우스 피더 세포의 부재하에 플레이팅될때 비-인간 영장류의 iPS 유도가 더욱 효율적임이 분명하게 관찰되었다. 도 41A 및 41B는 MNC3 항체 표면 상에 플레이팅한 것이며, 도 41C 및 41D는 마우스 피더 세포 상에 플레이팅한 것이다.
도 42(42A-42B)는 NME7 배지, 이 경우 NME7-AB에서, MEF의 표면 상에서 배양하고, 및 코어 다능성 유전자, 이 경우 Oct4, Sox2, Klf4 및 c-Myc에 의해 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 붉은털 원숭이로부터의 섬유아세포의 14일 사진을 나타낸다. 도 42A는 10X 배율로 촬영하고, 도 42B는 20X 배율로 촬영하였다.
도 43(43A-43E)는 3일째 계대배양 1에서, 항-MUC1* 항체, 이 경우 MN-C3의 표면 상에서, 붉은털 원숭이로부터의 NME7-AB 유도된 다능성 줄기 세포의 사진을 나타낸다. 도 43A는 4X 배율로 촬영되었으며, 도 43B는 10X 배율로 촬영되었으며, 도 43C는 20X 배율로 촬영되었고, 도 43D 및 43E는 40X 배율로 촬영했다.
도 44(44A-44F)는 1일째 계대배양 2에서, 항-MUC1* 항체, 이 경우 MN-C3의 표면 상에서, 붉은털 원숭이로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 명확하게 볼 수 있는 바와 같이, 줄기 세포 콜로니가 존재한다. 도 44A 및 44D는 10X 배율로 촬영하고, 도 44B 및 44E는 20X 배율로 촬영하고, 도 44C 및 44F는 40X 배율로 촬영했다.
도 45(45A-45H)는 2일째 계대배양 2에서, 마우스 피더 세포, MEF의 표면 상에서, 붉은털 원숭이 섬유아세포로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 도 45A 및 45E는 4X 배율로 촬영하고, 도 45B 및 45F는 10X 배율로 촬영하고, 도 45C 및 45G는 20X 배율로 촬영하고, 도 45D 및 45H는 40X 배율로 촬영하였다.
도 46(46A-46H)는 3일째 계대배양 2에서, 마우스 피더 세포, MEF의 표면 상에서, 붉은털 원숭이로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 도 46A 및 46E는 4X 배율로 촬영하였으며, 도 46B 및 46F는 10X 배율로 촬영하고, 도 46C 및 46G는 20X 배율로 촬영하고, 도 46D 및 46H는 40X 배율로 촬영하였다.
도 47(47A-47G)는 2일째 계대배양 3에서, 마우스 피더 세포, MEF의 표면 상에서, 붉은털 원숭이로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 도 47A, 47B, 47C 및 47D는 1일째 계대배양 3에 촬영되었으며, 도 47E, 47F 및 47G는 2일째 계대배양 3에 촬영되었으며, 도 47A 및 47E는 4X 배율로 촬영되었으며, 도 47B 및 47F는 10X 배율로 촬영되었으며, 도 47C 및 47G는 20X 배율로 촬영되고, 도 47D는 40X 배율로 촬영되었다.
도 48(48A-48D)는 3일째 계대배양 4에서, 붉은털 원숭이 마우스 피더 세포, MEF로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 도 48A는 4X 배율로 촬영되었으며, 도 48B 및 도 48C는 10X 배율로 촬영되었으며, 도 48D는 20X 배율로 촬영되었다.
도 1은 정상 섬유아세포 성장 배지, 또는 NME1 이량체, NME7-AB 또는 HSP593 박테리아 NME1 이량체로도 불리는 인간 재조합 NM23을 첨가한 무혈청 최소 배지에서 배양된 체세포 섬유아세포, 'fbb' 세포에서의 마스터 다능성 조절 유전자 Oct4 및 Nanog의 발현에 대한 RT-PCR 측정의 그래프를 도시한다. '+ROCi'는 일부 세포에 첨가되어, 표면에 부착시키는 Rho 키나아제 억제제를 지칭한다.
도 2는 정상 섬유아세포 성장 배지, 또는 NME1 이량체, NME7-AB 또는 HSP593 박테리아 NME1 이량체로도 불리는 인간 재조합 NM23을 첨가한 무혈청 최소 배지에서 배양된 체세포 섬유아세포, 'fbb' 세포에서의 염색질 재배열 인자 BRD4, JMJD6, MBD3 및 CHD4를 코딩하는 유전자의 발현에 대한 RT-PCR 측정의 그래프를 도시한다. '+ROCi'는 일부 세포에 첨가되어, 표면에 부착시키는 Rho 키나아제 억제제를 지칭한다.
도 3은 정상 섬유아세포 성장 배지, 또는 NME1 이량체, NME7-AB 또는 HSP593 박테리아 NME1 이량체로도 불리는 인간 재조합 NM23을 첨가한 무혈청 최소 배지에서 배양된 체세포 섬유아세포, 'fbb' 세포에서의 다능성 유전자 OCT4 및 NANOG, 염색질 재배열 인자 BRD4, JMJD6, MBD3 및 CHD4, 및 NME1 및 NME7의 발현에 대한 RT-PCR 측정의 그래프를 도시한다. '+ROCi'는 일부 세포에 첨가되어, 표면에 부착시키는 Rho 키나아제 억제제를 지칭한다.
도 4(4A-4B)는 첨가된 유일한 성장 인자로서 재조합 인간 NME1 이량체를 갖는 무혈청 최소 배지에서 줄기 세포가 배양된 다능성 형태를 갖는 인간 배아 줄기 세포의 사진을 도시한다. 도 4의 4A는 4X 배율로 촬영한 사진을 도시하며, 도 4의 4B는 20X 배율로 촬영한 사진을 도시한다.
도 5(5A-5C)는 첨가된 유일한 성장 인자로서 재조합 인간 NME7-AB를 갖는 무혈청 최소 배지에서 줄기 세포가 배양된 다능성 형태를 갖는 인간 배아 줄기 세포의 사진을 도시한다. 도 5의 5A는 4X 배율로 촬영한 사진을 도시하며, 도 5의 5B는 20X 배율로 촬영한 사진을 도시한다.
도 6(6A-6B)는 ELISA 샌드위치 분석으로부터의 HRP 신호 그래프로서, NME7-AB가 MUC1* 세포외 도메인 펩타이드를 이량화하는 것을 보여준다. 도 6의 6A는 MUC1* 세포외 도메인 펩타이드 PSMGFR로 코팅된 표면에 결합된 NME7-AB의 양을 도시하고, 도 6의 6B는 결합된 NME7-AB 상의 제2 부위에 결합하는 제2 MUC1* 펩타이드를 도시한다.
도 7은 후기 단계의 프라임드 줄기 세포와 비교하여 가장 초기 단계의 나이브 인간 줄기 세포에서의 전사 인자 BRD4 및 공동-인자 JMJD6의 발현 수준의 RT-PCR 측정 그래프를 나타낸다.
도 8은 4X 배율에서 이량체 형태의 인간 NME1을 함유하는 무혈청 배지에서 18일 배양 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 9는 20X 배율에서 이량체 형태의 인간 NME1을 함유하는 무혈청 배지에서 18일 배양 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 10은 4X 배율에서 인간 NME7-AB를 함유하는 무혈청 배지에서 18일 배양 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 11은 20X 배율에서 인간 NME7-AB를 함유하는 무혈청 배지에서 18일 배양 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 12는 4X 배율에서 NME 단백질이 없는 표준 배지에서 18일 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 13은 20X 배율에서 NME 단백질이 없는 표준 배지에서 18일 후의 인간 섬유아세포 세포의 사진을 나타낸다.
도 14(14A-14C)는 인간 줄기 세포가 자기-복제를 제한하는 방법을 발명가가 발견한 기계론적 모델의 만화를 도시한다. 도 14의 14A는 나이브 줄기 세포로부터 NME7-AB가 분비되고, NME7-AB가 단량체로서 MUC1* 성장 인자 수용체를 이량화하는 방법을 나타내지만, 나중에 BRD4에 의해 억제되는 반면 공동-인자 JMJD6은 NME1을 상향조절함을 보여주며, 도 14의 14B는 NME1이 후기 나이브 상태의 줄기 세포에 의해 분비되지만 이량체로서 MUC1*에만 결합하는 것을 보여주며, 도 14의 14C는 줄기 세포의 수가 증가함에 따라 NME1의 농도가 MUC1*에 결합하지 않는 헥사머를 형성시키고 분화를 유도한다는 것을 보여준다.
도 15(15A-15B)는 NME7-AB 및 NME7-X1을 인식하는 본 발명자가 개발한 항체로 염색된 인간 배반포의 사진을 나타낸 것이다. 도 15의 15A는 NME7-AB 또는 NME7-X1의 존재에 대해 모든 세포가 양성으로 염색되는 3일 배반포를 나타내며, 도 15의 15B는 NME7-AB 또는 NME7-X1의 존재에 대해 내세포괴의 나이브 세포만 양성으로 염색되는 5일 배반포를 나타낸다.
도 16(16A-16B)는 인간 나이브 상태 유도 다능성 줄기(iPS) 세포 및 배아 줄기(ES) 세포가 용해되고, MUC1의 세포질 꼬리에 대한 항체(Ab5)를 사용하여 MUC1에 결합하는 종을 동시-면역침전시키는 동시-면역침전 실험에서의 웨스턴 블롯 겔의 사진을 나타낸다. 이어서, 면역침전물을 웨스턴 블롯으로 분석하였다. 도 16의 16A는 항-MNE7 항체로 프로빙되고, 분자량 30kDa 및 다른 하나 33kDa를 갖고, MUC1에 결합되는 반면, 조 세포 용해물내 전장 NME7은 분자량 42 kDa를 가지는 2개의 NME7 종을 나타내는 웨스턴 블롯의 사진을 나타내며, 도 16의 16B는 도 16A의 겔을 항-MUC1* 세포외 도메인 항체로 박리 및 재프로빙한 웨스턴 블롯의 사진으로, MUC1*으로 불리는, MUC1의 절단된 형태에 결합된 NME7-AB 또는 NME7-X1은 글리코실화에 따라 17-25 kDa의 분자량으로 동작하는 것을 보여준다.
도 17은 MNC3 항-MUC1* 세포외 도메인 항체의 접착 표면상의 유일한 성장 인자로서 NME7-AB를 사용하여 나이브 상태의 인간 줄기 세포를 성장시키는 본 발명의 방법의 만화를 도시한다. 분화를 유도하고자 하는 경우, 합성 MUC1* 세포외 도메인 펩타이드를 첨가하여 모든 NME7-AB를 결합시킨다.
도 18(18A-18C)는 FGF에서 유래된, 프라임드 상태에서, 인간 배아 줄기(ES) 세포가 NME7-AB 또는 NME1 이량체에서 배양함으로써 덜 성숙된 나이브 상태로 되돌아가는, RNA SEQ 실험으로부터의 열지도를 나타낸다. 도 18의 18A는 모 FGF-배양된 ES 세포의 열지도를 도시하고, 도 18B는 NME7-AB에서 10 계대 배양된 모 세포의 열지도를 도시하고, 도 18C는 NME1 이량체에서 10 계대 배양된 모 세포의 열지도를 도시한다.
도 19(19A-19B)는 히스톤 3상의 트리메틸화 리신 27에 결합하는 항체로 염색된 인간 배아 줄기(ES) 세포의 사진을 도시하며, 붉은 초점의 존재는 암(female) 공급원 줄기 세포의 두번째 X 염색체가 불활성화되었으며(XaXi), 이것이 세포가 프라임드 상태이고 조기 분화를 시작했으며 일부 세포 운명 결정을 내렸음을 나타내는 신호임을 나타내며; 레드 클라우드(red cloud)의 존재 또는 적색 염색의 부재는 X 염색체가 여전히 활성임을 나타내므로(XaXa) 아직 분화 결정이 이루어지지 않았으며, 그래서 나이브하다. 도 19의 19A는 FGF 배지에서 적어도 10 계대 배양된 암 공급원 줄기 세포의 사진을 나타내고, 도 19B는 NME7-AB 배지에서 10 계대 배양된 동일한 세포의 사진을 나타낸다.
도 20(20A-20B)는 프라임드 상태 줄기 세포보다 훨씬 빠른 성장 속도이며 NME7-AB에서 배양된 줄기 세포가 나이브 상태임을 나타내는 또다른 지표인, 4일 동안 10-20배의 팽창 속도를 나타내는 두 시점에서 MNC3 항-MUC1* 항체 표면상에서 NME7-AB 배지에서 배양된 인간 다능성 줄기 세포의 사진을 보여준다. 도 20A는 4일째의 줄기 세포를 나타내고, 도 20B는 4일째의 줄기 세포를 나타낸다.
도 21(21A-21C)는 센다이 바이러스 형질도입을 사용하여 전달된 야마나카(Yamanaka) 마스터 재프로그래밍 인자 OCT4, NANOG, KLF4 및 c-Myc를 사용하여 다능성 줄기 세포가 되도록 재프로그래밍된 섬유아세포의 사진을 나타내며, 새로 재프로그래밍된 유도된 다능성 줄기 세포는 알칼리성 포스파타제에 의한 염색을 통해 가시화된다. 도 21A는 MEF 피더 세포 상에서 FGF 배지에서 수행된 재프로그래밍을 나타내고, 도 21B는 마트리겔(Matrigel) 상에서 mTeSR 배지에서 수행된 재프로그래밍을 나타내며, 도 21C는 MNC3 항-MUC1* 항체 표면 상에서 NME7-AB 배지에서 수행된 재프로그래밍을 나타낸다.
도 22(22A-22D)는 NME7-AB에서 유도되고 배양된 형광성 마커인 황색 세포를 갖고, 마우스 배반포에 2.5일에 주사한 다음, 48시간 후에 4.5일에 이미징한 인간 iPS 세포의 사진을 나타내며, 이는 NME7-AB에서 배양된 인간 iPS 세포가 마우스 배아의 내부세포괴로 통합할 수 있는 능력을 가짐을 보여준다. 도 22A는 나이브 줄기 세포를 함유하는 마우스 배아의 내부세포괴 안으로의 경로가 발견된 클론 E 인간 iPS 세포(황색)의 형광 현미경 사진을 도시하고, 도 22B는 동일한 사진이지만 모든 세포를 보여주고 NME7-AB 세포가 태반으로 발달될 영양외배엽(trophectoderm)에서 내부세포괴 플러스 휘프(whiff)에 오로지 통합되어 있음을 보여주는 DAPI를 영상화(청색)하도록 열린 다른 형광 채널을 가진 사진을 나타내며, 도 22C는 나이브 줄기 세포를 함유하는 마우스 배아의 내부세포괴로의 경로를 발견한 클론 R 인간 iPS 세포(노란색)의 형광 현미경 사진을 나타내고, 도 22D는 동일한 사진이지만 모든 세포를 보여주고 NME7-AB 세포가 태반으로 발달될 영양외배엽에서 내부세포괴 플러스 휘프에 오로지 통합되어 있음을 보여주는 DAPI를 영상화하도록 열린 다른 형광 채널을 가진 사진을 나타낸다.
도 23(23A-23J)는 2.5일 마우스 상실배에 주사된, NME7-AB 생성된 인간 iPS 세포, 클론 E의 공초점 이미지를 보여준다. 48시간 후에 인간 Tra 1-81에 대한 염색(적색)은 NME7-AB 인간 줄기 세포가 마우스 상실배의 내부세포괴에 혼입되었음을 보여준다. 도 23A, 도 23C, 도 23E, 도 23G 및 도 23I는 형광 이미지이다. 도 23B, 도 23D, 도 23F, 도 23H 및 도 23J는 명 시야 이미지이다.
도 24(24A-24J)는 2.5일 마우스 상실배에 주사된 NME7-AB 생성된 인간 iPS 세포, 클론 R의 공초점 이미지를 도시한다. 48시간 후에 인간 Tra 1-81에 대한 염색(적색)은 NME7-AB 인간 줄기 세포가 마우스 상실배의 내부세포괴에 혼입되었음을 보여준다. 도 24A, 도 24C, 도 24E, 도 24G 및 도 24I는 형광 이미지이다. 화살표는 나이브 상태 NME7-AB 인간 줄기 세포를 마우스 상실배에 혼입하는 것을 가리키며, 이는 키메라 동물의 형성을 나타낸다. 도 24B, 도 24D, 도 24F, 도 24H 및 도 24J는 명 시야 이미지이다.
도 25(25A-25D)는 2.5일 마우스 상실배에 주사된 FGF 생성된 인간 iPS 세포의 공초점 이미지를 도시한다. 48시간 후에 인간 Tra 1-81에 대한 염색(적색) 및 영양외배엽에 대한 염색(녹색)은 일부 흩어져있는 인간 줄기 세포를 보여주지만, 마우스 상실배의 내부세포괴에 프라임드 상태 인간 줄기 세포가 혼입되지 않아 키메라 동물을 형성하기 시작하는데 실패함을 보여준다. 도 25A 및 도 25C는 형광 이미지이며, 도 25B 및 도 25D는 명 시야 이미지이다.
도 26(26A-26D)는 50% NME7-AB 배지 및 50% KSOM, 칼륨 심플렉스 최적화 배지에서 배양한 다음, 2.5일째 마우스 상실배에 주사된 인간 iPS 세포의 공초점 이미지를 나타낸다. 48시간 후에 형광 이미지 뿐만 아니라 명 시야 이미지를 촬영했다. 48시간 후에 인간 Tra 1-81에 대한 염색(적색) 및 영양외배엽에 대한 염색(녹색)은 필요하다면, 프라임드 상태 인간 줄기 세포가 마우스 상실배의 내부세포괴 내로 혼입되는, 및 혼입되지않는 최소 개수의 인간 세포를 나타내며, 이는 키메라 동물을 형성하기 시작하는데 실패함을 나타낸다. 도 26A, 26C, 26E 및 26G는 형광 이미지이고, 도 26B, 26D, 26F 및 26H는 DAP 염색을 포함한다.
도 27(27A-27F)는 형광 라벨, tdtomato로 트랜스펙션되어 적색을 자가-형광화하는 NME7-AB 생성된 인간 iPS 세포, 클론 E의 공초점 형광 이미지를 나타낸다. 그들은 2.5일째 마우스 상실배에 주사되었다. 48시간 후에 이미지를 촬영하고, NME7-AB 인간 세포를 마우스 상실배의 내부세포괴로 통합하는 것을 보여준다. 도 27A, 도 27B 및 도 27C는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽을 나타내며, 및 도 27D, 27E 및 27F는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽 및 청색의 모든 세포핵을 나타낸다.
도 28(28A-28J)는 형광 라벨, tdtomato로 트랜스펙션되어 적색을 자가-형광화하는 NME7-AB 생성된 인간 iPS 세포, 클론 E의 공초점 형광 이미지를 나타낸다. 그들은 2.5일째 마우스 상실배에 주사되고, 48시간 후에 이미지를 촬영하였다. 상기 사진은 NME7-AB 인간 세포를 마우스 상실배의 내부세포괴로 통합하는 것을 보여준다. 도 28A, 28C, 28E, 28G 및 28I는 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽을 나타내고, 도 28B, 28D, 28F 및 28H는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽, 및 청색의 모든 세포핵을 나타낸다.
도 29(29A-29J)는 형광 라벨, tdtomato로 트랜스펙션되어 적색을 자가-형광화하는 NME7-AB 생성된 인간 iPS 세포, 클론 R의 공초점 형광 이미지를 나타낸다. 그들은 2.5일째 마우스 상실배에 주사되고, 48시간 후에 이미지를 촬영하였다. 상기 사진은 NME7-AB 인간 세포를 마우스 상실배의 내부세포괴로 통합하는 것을 보여준다. 화살표는 인간 세포가 마우스 내부세포괴에 혼입된 것을 가리킨다. 도 29A, 29C, 29E, 29G 및 29I는 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽을 나타내고, 도 29B, 29D, 29F 및 29H는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽, 및 청색의 모든 세포핵을 나타낸다.
도 30(30A-30J)는 형광 라벨, tdtomato로 트랜스펙션되어 적색을 자가-형광화하는 NME7-AB 생성된 인간 iPS 세포, 클론 R의 공초점 형광 이미지를 나타낸다. 그들은 2.5일째 마우스 상실배에 주사된다. 48시간 후에 이미지를 촬영하였다. 상기 사진은 NME7-AB 인간 세포를 마우스 상실배의 내부세포괴로 통합하는 것을 보여준다. 화살표는 인간 세포가 마우스 내부세포괴에 혼입된 것을 가리킨다. 도 30A, 30C, 30E, 30G 및 30I는 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽을 나타내고, 도 30B, 30D, 30F 및 30H는 DAPI 염색에서 적색의 NME7-AB 인간 세포, 녹색의 마우스 세포의 영양외배엽, 및 청색의 모든 세포핵을 나타낸다.
도 31(31A-31F)는 비-인간 영장류 유도된 다능성 줄기 세포의 생성을 입증하는 실험용 대조군 플레이트의 사진을 나타낸 것이다. 상기 대조군 실험에서, 필리핀 원숭이(crab-eating macaques)의 섬유아세포가 배양되었지만 코어 다능성 유전자는 형질도입되지 않았다. 이미지는 줄기 세포가 아닌 섬유아세포의 형태를 보여준다. 도 31A 및 도 31D는 4X 배율로 촬영하고, 도 31B 및 31E는 10X 배율로 촬영하고, 도 31C 및 31F는 20X 배율로 촬영하였다.
도 32(32A-32C)는 NME7 배지, 이 경우에는 NME7-AB에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면 상에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 필리핀 원숭이로부터의 섬유아세포의 6일 사진을 나타낸 것이다. 필리핀 원숭이의 섬유아세포 50,000개를 6-웰 플레이트의 웰마다 플레이팅하였다. 줄기 모양의 형태를 가진 신흥 콜로니는 원형이다. 도 32A는 4X 배율로 촬영하고, 도 32B는 10X 배율로 촬영하고, 도 32C는 20X 배율로 촬영했다.
도 33(33A-33F)는 NME7 배지, 이 경우에는 NME7-AB에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면 상에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 필리핀 원숭이로부터의 섬유아세포의 6일 사진을 나타낸 것이다. 필리핀 원숭이의 섬유아세포 100,000개를 6-웰 플레이트의 웰마다 플레이팅하였다. 줄기 모양의 형태를 가진 신흥 콜로니는 원형이다. 도 33A 및 33D는 4X 배율로 촬영하고, 도 33B 및 33E는 10X 배율로 촬영하고, 도 33C 및 33F는 20X 배율로 촬영했다.
도 34(34A-34F)는 NME7 배지, 이 경우에는 NME7-AB에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면 상에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 필리핀 원숭이로부터의 섬유아세포의 14일 사진을 나타낸 것이다. 줄기 세포 콜로니가 명확하게 보인다. 도 34A, 34B 및 34C는 10X 배율로 촬영하고, 도 34D, 34E 및 34F는 20X 배율로 촬영하고, 도 34A 및 34D는 24,000개의 원숭이(macaque) 섬유아세포를 플레이팅한 결과이며, 도 34B 및 34E는 6,000개의 원숭이 섬유아세포를 플레이팅한 결과이며, 도 34C 및 34F는 12,000개의 원숭이 섬유아세포를 플레이팅한 결과를 나타낸다.
도 35(35A-35D)는 항-MUC1* 항체 표면 상에서 NME7-AB 배지에서 2차 계대 배양 1일째에 유일한 성장 인자로서 NME7-AB를 함유하는 무혈청 배지에서 증식된 붉은털 원숭이 배아 줄기(ES) 세포의 사진을 나타낸다. 배아 줄기 세포 콜로니가 명확하게 보인다. 도 35A 및 도 35B는 4X 배율로 촬영하고, 도 35C 및 35D는 10X 배율로 촬영하였다.
도 36(36A-36D)는 항-MUC1* 항체 표면 상에서 NME7-AB 배지에서 2차 계대 배양 3일째에 유일한 성장 인자로서 NME7-AB를 함유하는 무혈청 배지에서 증식된 붉은털 원숭이 배아 줄기(ES) 세포의 사진을 나타낸다. 배아 줄기 세포 콜로니가 명확하게 보인다. 도 36A 및 도 36B는 4X 배율로 촬영하고, 도 36C 및 36D는 10X 배율로 촬영하였다.
도 37(37A-37B)는 계대배양 3, 1일째에 유일한 성장 인자로서 NME7-AB를 함유하는 무혈청 배지에서 증식된 붉은털 원숭이 배아 줄기(ES) 세포의 사진을 나타낸다. 도 37A는 1000um에서의 축척 막대(scale bar)를 나타내고, 및 도 37B는 400um에서의 축척 막대를 나타낸다.
도 38(38A-38H)는 계대배양 3, 4일째에 유일한 성장 인자로서 NME7-AB를 함유하는 무혈청 배지에서 증식된 붉은털 원숭이 배아 줄기(ES) 세포의 사진을 나타낸다. 도 38A, 38C 및 38F는 4X 배율로 촬영하고, 도 38B, 38D 및 38G는 10X 배율로 촬영하고, 도 38E 및 38H는 20X 배율로 촬영하였다.
도 39(39A-39C)는 NME7 배지, 이 경우에는 NME7-AB내에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입함으로써 유도된 다능성 줄기(iPS) 세포로 재프로그래밍된 붉은털 원숭이로부터의 섬유아세포의 14일 사진으로서, 다능성 유전자 형질도입후 14일 후 사진을 나타낸다. 도 39A는 4X에서 촬영되었고, 도 39B는 10X에서 촬영되었고, 도 39C는 20X에서 촬영되었다.
도 40(40A-40C)는 NME7 배지, 이 경우에는 NME7-AB에서 항-MUC1* 항체, 이 경우에는 MN-C3의 표면 상에서 배양하고, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc로 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 붉은털 원숭이로부터의 섬유아세포의 연속 계대배양 사진을 나타낸 것이다. 도 40A는 4X에서 촬영했고, 도 40B는 10X에서 촬영했으며, 도 40C는 20X에서 촬영했다.
도 41(41A-41D)는 하나의 경우에는 원숭이 섬유아세포를 MNC3 항-MUC1* 항체 표면에, 및 다른 경우에는 마우스 배아 피더 세포, MEF 상에 플레이팅한 것을 제외하고는 동일한 조건하에, 코어 다능성 유전자, 이 경우에는 Oct4, Sox2, Klf4 및 c-Myc를 갖는 세포를 형질도입함으로써, NMDA7-AB 배지에서 원숭이 iPS 세포를 16일 유도한 사진을 나타낸다. 마우스 피더 세포의 부재하에 플레이팅될때 비-인간 영장류의 iPS 유도가 더욱 효율적임이 분명하게 관찰되었다. 도 41A 및 41B는 MNC3 항체 표면 상에 플레이팅한 것이며, 도 41C 및 41D는 마우스 피더 세포 상에 플레이팅한 것이다.
도 42(42A-42B)는 NME7 배지, 이 경우 NME7-AB에서, MEF의 표면 상에서 배양하고, 및 코어 다능성 유전자, 이 경우 Oct4, Sox2, Klf4 및 c-Myc에 의해 세포를 형질도입하여, 유도된 다능성 줄기(iPS) 세포로 재프로그래밍한 붉은털 원숭이로부터의 섬유아세포의 14일 사진을 나타낸다. 도 42A는 10X 배율로 촬영하고, 도 42B는 20X 배율로 촬영하였다.
도 43(43A-43E)는 3일째 계대배양 1에서, 항-MUC1* 항체, 이 경우 MN-C3의 표면 상에서, 붉은털 원숭이로부터의 NME7-AB 유도된 다능성 줄기 세포의 사진을 나타낸다. 도 43A는 4X 배율로 촬영되었으며, 도 43B는 10X 배율로 촬영되었으며, 도 43C는 20X 배율로 촬영되었고, 도 43D 및 43E는 40X 배율로 촬영했다.
도 44(44A-44F)는 1일째 계대배양 2에서, 항-MUC1* 항체, 이 경우 MN-C3의 표면 상에서, 붉은털 원숭이로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 명확하게 볼 수 있는 바와 같이, 줄기 세포 콜로니가 존재한다. 도 44A 및 44D는 10X 배율로 촬영하고, 도 44B 및 44E는 20X 배율로 촬영하고, 도 44C 및 44F는 40X 배율로 촬영했다.
도 45(45A-45H)는 2일째 계대배양 2에서, 마우스 피더 세포, MEF의 표면 상에서, 붉은털 원숭이 섬유아세포로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 도 45A 및 45E는 4X 배율로 촬영하고, 도 45B 및 45F는 10X 배율로 촬영하고, 도 45C 및 45G는 20X 배율로 촬영하고, 도 45D 및 45H는 40X 배율로 촬영하였다.
도 46(46A-46H)는 3일째 계대배양 2에서, 마우스 피더 세포, MEF의 표면 상에서, 붉은털 원숭이로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 도 46A 및 46E는 4X 배율로 촬영하였으며, 도 46B 및 46F는 10X 배율로 촬영하고, 도 46C 및 46G는 20X 배율로 촬영하고, 도 46D 및 46H는 40X 배율로 촬영하였다.
도 47(47A-47G)는 2일째 계대배양 3에서, 마우스 피더 세포, MEF의 표면 상에서, 붉은털 원숭이로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 도 47A, 47B, 47C 및 47D는 1일째 계대배양 3에 촬영되었으며, 도 47E, 47F 및 47G는 2일째 계대배양 3에 촬영되었으며, 도 47A 및 47E는 4X 배율로 촬영되었으며, 도 47B 및 47F는 10X 배율로 촬영되었으며, 도 47C 및 47G는 20X 배율로 촬영되고, 도 47D는 40X 배율로 촬영되었다.
도 48(48A-48D)는 3일째 계대배양 4에서, 붉은털 원숭이 마우스 피더 세포, MEF로부터의 NME7-AB 유도된 다능성 줄기 세포의 연속 계대 사진을 나타낸다. 도 48A는 4X 배율로 촬영되었으며, 도 48B 및 도 48C는 10X 배율로 촬영되었으며, 도 48D는 20X 배율로 촬영되었다.
정의
본원에서 사용된 "MUC1*" 세포외 도메인은 주로 PSMGFR 서열((SEQ ID NO: 6))에 의해 정의된다. MUCl 절단의 정확한 부위는 그것을 절단하는 효소에 의존하고, 절단 효소는 세포 유형, 조직 유형 또는 세포의 진화시간에 따라 다양하기 때문에, MUC1* 세포외 도메인의 정확한 서열은 N-말단에서 다양할 수 있다.
본원에 사용된 용어 "PSMGFR"은 (SEQ ID NO: 6)으로 개시된 바와 같이, MUC1 성장 인자 수용체의 1차 서열에 대한 약어이다. 이와 관련하여, "N-10 PSMGFR", "N-15 PSMGFR" 또는 "N-20 PSMGFR"에서와 같은 "N- 숫자"는 PSMGFR의 N-말단에서 결실된 아미노산 잔기의 수를 지칭한다. 마찬가지로, "C-10 PSMGFR", "C-15 PSMGFR" 또는 "C-20 PSMGFR"에서와 같은 "C-숫자"는 PSMGFR의 C-말단에서 결실된 아미노산 잔기의 수를 지칭한다.
본원에서 사용된 "MUC1*의 세포외 도메인"은 탠덤 반복 도메인이 없는 MUC1 단백질의 세포외 부분을 지칭한다. 대부분의 경우, MUC1*은 MUC1* 부분이 탠덤 반복이 없는 짧은 세포외 도메인, 막관통 도메인 및 세포질 꼬리로 구성되는 분열 생성물이다. MUCl의 정확한 절단 위치는 아마도 그것이 하나 이상의 효소에 의해 절단될 수 있는 것으로 여겨지기 때문에 알려져 있지 않다. MUC1*의 세포외 도메인은 대부분의 PSMGFR 서열을 포함할 것이지만, 추가적인 10-20개의 N-말단 아미노산을 가질 수 있다.
본원에서 사용된, 번호 1-10인 "NME 계통의 단백질" 또는 "NME 계통의 구성원 단백질"은 모두 하나 이상의 NDPK(뉴클레오타이드 디포스페이트 키나아제) 도메인을 가지기 때문에 함께 그룹화된 단백질이다. 일부의 경우, NDPK 도메인은 ATP의 ADP로의 전환을 촉매할 수 있다는 측면에서 기능적이지 않다. NME 단백질은 공식적으로 H1, H2 등으로 넘버링된 NM23 단백질로 알려져 있다. 여기서, 용어 NM23 및 NME는 상호교환가능하다. 본 명세서에서, 용어 NME1, NME2, NME6 및 NME7은 천연 단백질뿐만 아니라 NME 변이체를 지칭하는데 사용된다. 일부의 경우, 상기 변이체는 대장균(E. coli)에서 보다 용해성이거나, 더 잘 발현되거나, 천연 서열 단백질보다 가용성이다. 예를 들어, 본 명세서에서 사용되는 NME7은 천연 단백질 또는 변이체, 예컨대 변이가 대장균(E. coli)에서 적절히 폴딩된 가용성 단백질의 고수율 발현을 허용하기 때문에 우수한 상업적 응용성을 갖는 NME7-AB를 의미할 수 있다. 본원에서 언급된 "NME1"은 "NM23-H1"과 상호 교환 가능하다. 또한, 본 발명은 NME 단백질의 정확한 서열에 의해 제한되지 않는 것으로 의도된다. NM23-S120G로도 불리우는 돌연변이체 NME1-S120G는 본원 전체적으로 서로 바꾸어 사용할 수 있다. S120G 돌연변이체 및 P96S 돌연변이체는 이량체 형성에 대한 선호때문에 바람직하지만, 본원에서는 NM23 이량체 또는 NME1 이량체로 지칭될 수 있다.
인위적으로 생성된 다양한 NME1 이량체는 "Genetically Growth Factor Variants"라는 발명의 명칭으로 2012년 5월 8일자로 출원된 PCT/US2012/036975에 개시되어 있으며, 이의 내용은 본원에 개시된 이량체 성장 인자와 관련된 참고문헌으로 통합된다.
본원에 언급된 NME7은 약 42kDa의 분자량을 갖는 천연 NME7, 25 내지 33kDa의 분자량을 갖는 분열된 형태, DM10 리더 서열이 없는 변이체, NME7-AB 또는 재조합 NME7 단백질, 또는 효율적으로 발현하도록 변경되거나, NME7을 보다 효과적으로 또는 상업적으로 더 실용적으로 만드는 수율, 용해도 또는 다른 특성을 증가시키는 그의 변이체를 의미하는 것으로 의도된다.
본원에 사용된 바와 같이, "NM23-H1 이량체"로도 알려진 "NME1 이량체"는 서로 공유 결합되지 않은 2개의 NME1 단백질, 서로 공유 결합된 2개의 NME1 단백질 또는 링커를 통해, 함께 유전적으로 융합된 2개의 NME1 단백질일 수 있다. NME1 이량체는 플렉서블 링커에 의해 분리될 수 있는, 2개의 NME1 단백질로 구성된 DNA 구조물을 제조함으로써 유전적으로 조작될 수 있다. 2개의 NME 단백질은 전체 단백질 또는 천연 서열일 필요는 없다. 예를 들어, 이량체 형성 및 안정성을 촉진하는 C-말단 결실이 사용될 수 있다. 이량체 형성 및 안정성을 촉진하는 S120G 및/또는 P96S와 같은 돌연변이가 사용될 수 있다. NME2 또는 NME6 이량체와 같은 다른 NME 계통의 구성원 이량체는 서로 공유 결합되지 않은 유사하게, 2개의 NME 단백질, 서로 공유 결합된 2개의 NME 단백질, 또는 링커를 통해 유전적으로 융합된 2개의 NME 단백질이다.
본원에 사용된 바와 같이, "나이브 상태에서 줄기 세포를 유지하거나 프라임드 줄기 세포를 나이브 상태로 되돌리는 제제"는 배아의 내부세포괴의 세포를 닮은, 나이브 상태에서 줄기 세포를 단독으로 또는 조합하여 유지하는 단백질, 소분자 또는 핵산을 지칭한다. 예로는 MBD3, CHD4, BRD4 또는 JMJD6의 발현을 억제하는 siRNA와 같은, NME1 이량체, 인간 또는 박테리아성, NME7, NME7-AB, 2i, 5i, 핵산이 포함되지만, 이에 한정되지 않는다.
본원에서 사용된 바와 같이, "소분자"로 지칭되는 제제와 관련하여, 이는 50Da 내지 2000Da, 보다 바람직하게는 150Da 내지 1000Da, 더더욱 바람직하게는 200Da 내지 750Da의 분자량을 갖는 합성 화학물 또는 화학적 기초 분자일 수 있다.
본원에 사용된 바와 같이, "천연 생성물"로 지칭되는 제제와 관련하여, 이는 분자가 자연계에 존재하는 한 화학적 분자 또는 생물학적 분자일 수 있다.
본원에 사용된 "2i 억제제"는 MAP 키나아제 신호전달 경로의 GSK3-β 및 MEK의 소분자 억제제를 지칭한다. 2i라는 명칭은 연구 논문(Silva J et al 2008)에서 만들어졌지만, 본원에서 "2i"는 GSK3-베타 또는 MEK의 임의의 억제제를 지칭하며, 상기 표적들을 억제한다면, 다능성 또는 종양형성에 동일한 효과를 가지는 많은 소분자들 또는 생물학적 제제들이 있다.
본 명세서에서 사용된, FGF, FGF-2 또는 bFGF는 섬유아세포 성장 인자를 지칭한다.
본 명세서에서 사용된, "Rho 관련 키나아제 억제제"는 소분자, 펩타이드 또는 단백질일 수 있다(Rath N, et al, 2012). Rho 키나아제 억제제는 본원에서 ROCi 또는 ROCKi 또는 Ri로 약칭한다. 특정 ρ 키나아제 억제제의 사용은 예시적인 것으로 의미되며, 임의의 다른 ρ 키나아제 억제제를 대체할 수 있다.
본 명세서에서, 용어 "줄기-유사(stem-like)"는 줄기 세포 또는 전구 세포의 세포 획득 특성이 줄기 세포 또는 전구 세포의 유전자 발현 프로파일의 중요한 요소를 공유하는 상태를 지칭한다. 줄기-유사 세포는 다능성 유전자의 발현이 증가하는 것과 같이 덜 성숙한 상태로 유도되는 체세포일 수 있다. 줄기-유사 세포는 또한 일부 탈-분화를 겪은 세포 또는 그들이 말단 분화를 변경할 수 있는 준-안정 상태에 있는 세포를 지칭한다.
서열 목록 프리 텍스트
a, g, c, t 이외의 뉴클레오타이드 기호의 사용에 관해서는, WIPO 표준 ST.25 부록 2, 표 1에 기재된 관례를 따르며, 여기서 k는 t 또는 g을 나타내고; n은 a, c, t 또는 g을 나타내고; m은 a 또는 c를 나타내고; r은 a 또는 g을 나타내고; s는 c 또는 g을 나타내고; w는 a 또는 t를 나타내고, 및 y는 c 또는 t를 나타낸다.
는 전장 인간 MUC1 수용체(뮤신 1 전구체, Genbank 수탁번호: P15941)를 기술한다.
SEQ ID NO: 2, 3 및 4는 MUC1 수용체 및 절단된 이소형태를 세포막 표면으로 유도하기 위한 N-말단 MUC-1 신호전달 서열을 기술한다. SEQ ID NO: 2, 3 및 4의 변이체에 의해 표시된 바와 같이, C-말단에 3개 이하의 아미노산 잔기가 부재할 수 있다.
는 그의 N-말단에 nat-PSMGFR를 갖고, 인간 전장 MUC1 수용체의 막관통 및 세포질 서열을 포함하는 절단 MUC1 수용체 이소형태를 기술한다.
(SEQ ID NO: 6)는 인간 MUC1 성장 인자 수용체의 천연 일차 서열(nat-PSMGFR-"PSMGFR"의 예)의 세포외 도메인을 기술한다:
(SEQ ID NO: 7)는 SEQ ID NO: 6의 N-말단에서 단일 아미노산 결실을 갖는, 인간 MUC1 성장 인자 수용체의 천연 일차 서열(nat-PSMGFR-"PSMGFR"의 예)의 세포외 도메인을 기술한다.
(SEQ ID NO: 8)는 개선된 안정성을 갖는 MUC1 성장 인자 수용체의 천연 일차 서열의 "SPY" 기능적 변이체(var-PSMGFR-"PSMGFR"의 예)의 세포외 도메인을 기술한다.
(SEQ ID NO: 9)는 개선된 안정성을 갖고 SEQ ID NO: 8의 C-말단에서의 단일 아미노산 결실을 갖는 MUC1 성장 인자 수용체의 천연 일차 서열의 "SPY" 기능적 변이체(var-PSMGFR-"PSMGFR"의 예)의 세포외 도메인을 기술한다.
는 인간 MUC1 세포질 도메인 뉴클레오타이드 서열을 기술한다.
은 인간 MUC1 세포질 도메인 아미노산 서열을 기술한다.
는 인간 NME7 뉴클레오타이드 서열(NME7: GENBANK 수탁 AB209049)을 기술한다.
는 인간 NME7 아미노산 서열(NME7: GENBANK 수탁 AB209049)을 기술한다.
는 NMEl 뉴클레오타이드 서열로도 알려져 있는 인간 NM23-H1(NM23-H1: GENBANK 수탁 AF487339)을 기술한다.
NM23-H1은 아미노산 서열(NME1로도 알려져 있는 NM23-H1: GENBANK 수탁 AF487339)을 기술한다.
는 인간 NM23-H1 S120G 돌연변이체 뉴클레오타이드 서열(NM23-H1: GENBANK 수탁 AF487339)을 기술한다.
은 NM23-H1 S120G 돌연변이체 아미노산 서열(NM23-H1: GENBANK 수탁 AF487339)을 기술한다.
는 인간 NM23-H2 뉴클레오타이드 서열(NM23-H2: GENBANK 수탁 AK313448)을 기술한다.
(SEQ ID NO:19)는 NM23-H2 아미노산 서열(NM23-H2: GENBANK 수탁 AK313448)을 기술한다.
대장균(E. coli) 발현을 위해 최적화된 인간 NM23-H7-2 이소형태 b 서열:
(DNA)
(아미노산)
인간 NME7-A:
(DNA)
(아미노산)
인간 NME7-A1:
*(DNA)
(아미노산)
인간 NME7-A2:
(DNA)
(아미노산)
인간 NME7-A3:
(DNA)
(SEQ ID NO: 28)
(아미노산)
인간 NME7-B:
(DNA)
(아미노산)
인간 NME7-B1:
(DNA)
(아미노산)
인간 NME7-B2:
(DNA)
(아미노산)
인간 NME7-B3:
(DNA)
(아미노산)
(SEQ ID NO: 37)
인간 NME7-AB:
(DNA)
(아미노산)
인간 NME7-AB1:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-A 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-A1 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-A2 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-A3 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-B 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-B1 서열:
(DNA)
(SEQ ID NO: 52)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-B2 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-B3 서열:
(DNA)
(아미노산)
(SEQ ID NO: 57)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-AB 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME7-AB1 서열:
(DNA)
(아미노산)
마우스 NME6
(DNA)
(아미노산)
인간 NME6:
(DNA)
(아미노산)
인간 NME6 1:
(DNA)
(아미노산)
인간 NME6 2:
(DNA)
(아미노산)
(SEQ ID NO: 69)
인간 NME6 3:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME6 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME6 1 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME6 2 서열:
(DNA)
(아미노산)
대장균(E. coli) 발현을 위해 최적화된 인간 NME6 3 서열:
(DNA)
(아미노산)
히스티딘 태그
스트렙트 II 태그
PSMGFR N-10 펩타이드:
PSMGFR C-10 펩타이드
인간 NME7
뉴클레오시드 디포스페이트 키나아제 7 이소형태 a [호모 사피엔스](Hu_7)
SEQ ID NO: 84로 표시되는 인간 NME7 이소형태 a는 376개의 아미노산 중첩 영역에서 SEQ ID NO: 21로 표시되는 인간 NME7 이소형태 b와 90.4%의 서열 동일성을 갖는다.
인간 NME7-X1
(DNA)
(아미노산)
마우스 MUC1 및 NME7
마우스 MUC1* 세포외 도메인 PSMGFR은 45개의 아미노산 중첩 영역에서 인간과 51.1% 동일하다.
마우스 이소형태 1 NME7은 395개의 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 84.3% 동일하다
뉴클레오시드 디포스페이트 키나아제 7 (마우스 NME7) 이소형태 1 무스 무스쿨루스(Mus musculus)(Mo_7)
마우스 이소형태 2 NME7은 253개의 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 88.4% 동일하다
뉴클레오시드 디포스페이트 키나아제 7 이소형태 2 [Mus musculus](Mo2-7)
돼지
Sus scrofa
MUC1 및 NME7
돼지 MUC1* PSMGFR은 46개의 아미노산 중첩에서 인간과 52.2% 동일하다
돼지 NME7은 453개의 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 65.6% 동일하다
예측됨: 뉴클레오시드 디포스페이트 키나아제 7 [Sus scrofa, 돼지](Pi_7)
양 MUC1 및 NME7
양 MUC1* 세포외 도메인 PSMGFR은 인간과 46.8% 동일하다.
양 NME7은 395개의 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 88.4% 동일하다
예측됨: 뉴클레오시드 디포스페이트 키나아제 7 이소형태 X1 [Ovis aries, 양](Sh_7)
필리핀 원숭이 마카카 파시큘라리스(
Macaca fascicularis)
MUC1 및 NME7
필리핀 원숭이 MUC1* 세포외 도메인 PSMGFR은 인간과 88.9% 동일하다
필리핀 원숭이 NME7은 251개의 아미노산 중첩에서 인간 NME7 이소형태 a와 98% 동일하다
명명되지 않은 단백질 생성물 [Macaca fascicularis](Ma_7)(서열 불완전, 유일한 NME7A)
붉은털 원숭이 MUC1 및 NME7
붉은털 원숭이 MUC1* PSMGFR
붉은털 원숭이 MUC1* 세포외 도메인 PSMGFR은 인간과 88.9% 동일하다
붉은털 원숭이 NME7은 376개 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 98.4% 동일하다.
히말라야 원숭이(Macaca mulatta(Rhesus macaque))(Mm_7)
보노보 MUC1 및 NME7
보노보 Pan paniscus MUC1
보노보 MUC1* 세포외 도메인 PSMGFR은 인간과 100% 동일하다.
보노보 NME7은 376개 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 100% 동일하다
보노보 예측됨: 뉴클레오시드 디포스페이트 키나아제 7[Pan paniscus, 보노보](Bo_7)
침팬지 MUC1 및 NME7
침팬지(Pan troglodytes) MUC1
침팬지 MUC1* 세포외 도메인 PSMGFR은 인간과 100% 동일하다
침팬지 NME7은 376개의 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 99.7% 동일하다
뉴클레오시드 디포스페이트 키나아제 7[Pan troglodytes, Chimp](CH_7)
고릴라 MUC1 및 NME7
고릴라(Gorilla gorilla) MUC1
고릴라 MUC1* PSMGFR은 인간과 100% 동일하다
고릴라 NME7은 376개의 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 78.2% 동일하다
NME7[ENSGGOP00000002464], 고릴라(Gorilla gorilla)(Go_7)
마우스
뉴클레오시드 디포스페이트 키나아제 7 [Mus musculus](Mo_7)
마우스 NME7은 378개 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 87.8% 동일하다
뉴클레오시드 디포스페이트 키나아제 7 이소형태 X1 [Mus musculus](MoX1-7)
마우스 NME7은 376개 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 79.8% 동일하다
필리핀 원숭이(Macaca fascicularis)
명명되지 않은 단백질 생성물 [Macaca fascicularis](Ma_7)(서열 불완전, 유일한 NME7A)
마카카 NME7은 251개 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 98.0% 동일하다
히말라야 원숭이(Macaca mulatta)(붉은털 원숭이)(Mm_7)
히말라야 원숭이(Macaca) NME7은 376개 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 98.4% 동일하다
침팬지
뉴클레오시드 디포스페이트 키나아제 7b [Pan troglodytes, 침팬지](CHb_7)
침팬지 NME7은 376개 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 90.2% 동일하다
양(Ovis aries)
예측됨: 뉴클레오시드 디포스페이트 키나아제 7 이소형태 X2(Shx2_7) [Ovis aries, 양]
양 NME7은 377개 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 92.6% 동일하다
예측됨: 뉴클레오시드 디포스페이트 키나아제 7 이소형태 X3 [Ovis aries, 양](Shx3_7)
양 NME7은 377개 아미노산 중첩 영역에서 인간 NME7 이소형태 a와 83.6% 동일하다
마우스
마우스 MUC1
히말라야 원숭이(붉은털 원숭이) MUC1, 부분적
필리핀 원숭이_MUC1(이소형태 X1)
미니돼지(Sus scrofa) MUC1, 부분적
양 MUC1(양)
I. 일 양태에서, 본 발명은 일부 인간 DNA 또는 일부 인간 조직을 발현하는 키메라 동물에서 잠재적인 약물 제제의 효능 또는 독성을 시험하는 방법에 관한 것이다. 이 방법에서, 일부 인간 DNA 또는 조직을 발현하는 동물은 인간 나이브 상태의 줄기 세포를 비-인간 세포 또는 세포들로 도입하여 생성된다. 일 양태에서, 비-인간 세포는 난이고, 다른 양태에서는 수정란이고, 다른 양태에서, 세포는 상실배, 배반포 또는 배아이다. 윤리적인 우려 또는 다른 이유로 인해, 통합적인 나이브 상태 줄기 세포가 비-인간이지만 수혜자 세포, 세포들, 상실배, 배반포 또는 배아와 다른 종의 키메라 동물을 생성하는 것이 유리할 수 있다. 상기 방법에서, 줄기 세포를 나이브 상태로 유지하거나 프라임드 줄기 세포를 나이브 상태로 되돌리는 제제는 NME 단백질, 2i, 5i 또는 억제제, 화학 물질 또는 핵산의 다른 칵테일일 수 있다. NME 단백질은 NME1 이량체, NME7 단량체, NME7-AB, NME7-X1, NME6 이량체 또는 박테리아 NME일 수 있다.
비-인간 포유동물은 마우스 또는 래트와 같은 설치류, 짧은 꼬리 원숭이, 붉은털 원숭이, 유인원, 침팬지, 보노보 등을 포함하는 영장류, 또는 돼지, 양, 소 등을 포함하는 가축일 수 있다. 키메라 동물은 유전 질환을 가질 수 있거나, 인간으로부터 유래된 세포로부터 자발적으로 생성되거나 이식될 수 있는 암 또는 유발된 질병을 가질 수 있다.
상기 방법에서, 비-인간 동물은 형질전환 동물일 수 있으며, 여기서 상기 동물은 생식 세포 또는 체세포에서 인간 MUC1 또는 MUC1* 또는 NME 단백질을 발현하며, 생식 세포 및 체세포는 재조합 인간 MUC1 또는 MUC1* 또는, 상기 동물에게 도입된 NME 유전자 서열을 함유한다. 인간 MUC1 또는 MUC1* 또는 NME 단백질을 발현하는 유전자는 유도성 프로모터의 제어하에 있을 수 있다. 프로모터는 비-인간 동물의 자연 발생 단백질 또는 발달 전후, 또는 발달 중에 동물에게 투여될 수 있는 제제에 대해 유도적으로 반응할 수 있다. 대안적으로, 상기 비-인간 동물은 형질전환 동물일 수 있으며, 여기서 상기 동물은 생식 세포 또는 체세포에서 그의 천연 서열 MUC1 또는 MUC1* 또는 NME 단백질을 발현하며, 상기 생식 세포 및 체세포는 상기 포유동물 내로 도입된 재조합 천연 종 MUC1 또는 MUC1* 또는 NME 유전자 서열을 함유한다. NME 종은 NME7, NME7-X1, NME1, NME6 또는 박테리아 NME일 수 있다.
상기 방법에서, 줄기 세포를 나이브 상태로 유지하거나 프라임드 줄기 세포를 나이브 상태로 되돌리는 제제는 NME 단백질, 2i, 5i 또는 억제제, 화학 물질 또는 핵산의 다른 칵테일일 수 있다. NME 단백질은 NME1 이량체, NME7 단량체, NME7-AB, NME7-X1, NME6 이량체 또는 박테리아 NME일 수 있다.
이 방법에서, 상기 제제는 MBD3, CHD4, BRD4 또는 JMJD6의 발현을 억제할 수 있다. 상기 제제는 MBD3, CHD4, BRD4 또는 JMJD6에 대해 제조된 siRNA, 또는 MBD3, CHD4, BRD4 또는 JMJD6의 발현을 상향 조절하는 단백질을 코딩하는 임의의 유전자에 대해 제조된 siRNA일 수 있다. 암 줄기 세포는 암 세포 또는 정상 세포와 비교하여 CXCR4 또는 E-캐드헤린(CDH1)의 발현이 증가하는 특징이 있을 수 있다.
다른 양태에서, 본 발명은 (i) 형질전환 비-인간 포유동물을 생성하는 단계로서, 포유동물이 생식세포 및 체세포에서 인간 MUC1 또는 MUC1* 또는 NME 단백질을 발현하고, 생식세포 및 체세포가 상기 포유동물에 도입된 재조합 인간 MUC1 또는 MUC1* 또는 NME 유전자 서열을 함유하고, 상기 유전자 서열의 발현이 유도성 및 억제성 조절 서열의 제어하에 있을 수 있는 단계; (ii) 기원이 이종인 줄기 세포 또는 전구 세포를 비-인간 포유동물에 전이시켜, 유전자가 줄기 세포 또는 전구 세포의 수를 증가시키도록 발현 유도될 수 있는 단계; 및 (iii) 이종이식된 줄기 세포로부터 조직을 생성하도록 유전자 발현을 억제하는 단계를 포함하는, 비-인간 포유동물에서 이종이식으로부터 조직을 생성하는 방법에 관한 것이다.
이 방법에서, 단계 (iii)에서, 줄기 세포를 조직 분화 인자와 접촉시킴으로써 유전자 발현 억제가 수행될 수 있으며, 또는 단계 (iii)에서 자연적으로 생성된 숙주 조직 분화 인자에 반응하여, 유전자 발현 억제가 포유동물에서 자연적으로 수행될 수 있다. 전이된 세포는 인간일 수 있다. 조직은 장기일 수 있다. NME 단백질은 NME7, NME7-AB, NME7-X1, NME1, NME6 또는 박테리아 NME일 수 있다. 동물은 포유동물, 설치류, 영장류 또는, 돼지, 양 또는 소 종과 같은 가축일 수 있다.
II. 다른 양태에서, 본 발명은 적어도 일부 인간 세포 또는, DNA의 적어도 일부가 인간 기원인 세포를 갖는 동물을 제조하는 것에 관한 것이다. 상기 동물은 인간 조직, 일부 인간 세포 또는, 인간 또는 인간-유사 조직의 생성을 위한 일부 인간 DNA를 함유하는 세포를 함유하는 조직을 성장시킬 것이다. 다른 경우, 상기 동물은 적어도 일부 인간 세포를 포함하는 장기를 성장시킬 것이다. 다른 경우, 상기 동물은 인간 세포로만 구성된 장기를 성장시킬 것이다. 또다른 경우, 숙주 동물은 발달 후에도 인간의 사지를 성장시키기 위해 유전적으로 또는 분자적으로 조작될 수 있다. 사지, 신경, 혈관, 조직, 장기, 또는 이들 내에서 제조되거나 이들로부터 분비된 인자는 동물로부터 수확되어, 다음을 포함하는 다수의 목적으로 사용되지만, 이에 한정되지 않는다: 1) 인간으로의 이식; 2) 노화-방지를 포함한 의료적 이익을 위해 인간에게 투여; 및 3) 약물 검사 및 질병 모델링을 포함한 과학 실험.
일 양태에서, 본 발명은 비-인간 동물에서 인간 조직을 생성하기 위한 방법에 관한 것으로서, 상기 방법은: (i) 인간 나이브 상태 줄기 세포를 생성시키고, 이들을 비-인간 동물의 수정란, 상실배, 배반포 또는 배아에 주입하여, 키메라 동물이 생성되도록 하는 단계; (ii) 키메라 동물의 인간 조직 또는 세포에 의해 분비되거나 이로 제조된 인간 조직, 장기, 세포 또는 인자를 수확하는 단계; 및 (iii) 상기 수확된 물질을 인간에게 이식 또는 투여하는 단계를 포함한다. 나이브 상태 줄기 세포는 NME7, NME7-AB, NME7-X1 또는 이량체 NME1을 사용하여 생성될 수 있다. 나이브 줄기 세포는 NME7, NME7-AB, NME7-X1 또는 이량체 NME1을 함유하는 배지에서 재프로그래밍된 iPS 세포일 수 있다. 또는 나이브 줄기 세포는 NME7, NME7-AB, NME7-X1 또는 이량체 NME1을 함유하는 배지에서 배양된 배아 줄기 세포일 수 있다. 배반포 또는 배아의 비-인간 세포는 유전적으로 변형되었을 수 있다. 그리고 유전자 변형은 숙주 동물이 특정 조직이나 장기를 생성하지 못하게 할 수 있다. 유전자 변형은 비-인간 숙주 동물에서 인간 줄기 세포 또는 전구 세포의 혼입 또는 성장을 촉진 또는 강화시키는 인간 분자를 비-인간 동물이 발현하게 할 수 있다. 또한, 줄기 세포를 나이브 상태로 유지하거나 프라임드 줄기 세포를 나이브 상태로 되돌리는 제제는 NME 단백질, 2i, 5i, 화학물질 또는 핵산일 수 있다. NME 단백질은 NME1 이량체, NME7 단량체, NME7-AB, NME6 이량체 또는 박테리아 NME 또는 NME7-X1일 수 있다. 비-인간 동물은 설치류, 마우스, 래트, 돼지, 양, 비-인간 영장류, 짧은꼬리 원숭이, 침팬지, 보노보, 고릴라 또는 임의의 비-인간 포유동물일 수 있다. 본 발명의 일 양태에서, 비-인간 동물은 인간 NME 단백질, 특히 인간 NME7-AB 또는 NME7-X1에 대한 높은 서열 상동성 또는 인간 MUC1* 세포외 도메인에 대한 높은 서열 상동성을 위해 선택된다. 어떤 경우에는 NME 단백질은 무혈청 배지에 단일 성장 인자로서 존재할 수 있다.
키메라 동물이 생성될 수 있는지 여부에 대한 한 가지 시험은 제1 종으로부터 줄기 세포가 제2 종의 내부세포괴(ICM)에 혼입될 수 있는지 여부이다. 키메라 동물은 2개의 다른 종, 예를 들어, 두 설치류들이 밀접하게 관련되어 있을 때 더 쉽게 생성된다. 본 발명자들은 인간 나이브 상태 줄기 세포를 마우스 상실배에 주사하여 이들이 내부세포괴에 혼입되었음을 보여주었다. 특정 예에서, 인간 NME7-AB에서 생성된 후 인간에서 배양된 인간 나이브 상태 줄기 세포를, 난자를 수정한지 2.5일 후에 마우스 상실배에 주입하였다. 이것은 내부세포괴가 형성되기 이전이다. 48시간 후, 상실배를 분석하였으며, 상기 분석은 인간 줄기 세포가 내부세포괴에 혼입되어 키메라 동물이 발생한다는 것을 보여 주었다.
III. 일 양태에서, 본 발명은 비-인간 동물 숙주에서 인간 조직 또는 장기를 생성시키는 방법에 관한 것으로서, 상기 방법은: (i) 인간 나이브 상태 줄기 세포를 생성시키고, 이들을 비-인간 동물 숙주의 수정란, 상실배, 배반포, 배아 또는 발생중 태아에 주입하여, 키메라 동물이 생성되도록 하는 단계; (ii) 키메라 동물의 인간 조직 또는 세포에 의해 분비되거나 이로부터 제조된 인간 조직, 장기, 세포 또는 인자를 수확하는 단계; (iii) 상기 수확된 물질을 인간에게 이식 또는 투여하여 인간 조직을 생성시키는 단계를 포함한다. 나이브 상태 줄기 세포는 NME7, NME7-AB, NME7-X1, NME6 또는 이량체 NME1을 사용하여 생성된다. 나이브 줄기 세포는 NME7, NME7-AB, NME6, NME7-X1 또는 이량체 NME1을 함유하는 배지에서 재프로그래밍한 iPS 세포이다. 나이브 줄기 세포는 NME7, NME7-AB, NME6, NME7-X1 또는 이량체 NME1을 함유하는 배지에서 배양된 배아 줄기 세포이다. 배반포 또는 배아의 비-인간 세포가 유전적으로 변형되었다. 유전자 변형은 숙주 동물이 특정 조직 또는 장기를 생성할 수 없도록 한다. 줄기 세포를 나이브 상태로 유지하거나 프라임드 줄기 세포를 나이브 상태로 되돌리는 제제는 NME 단백질, 2i, 5i, 화학물질 또는 핵산이다. NME 단백질은 NME1 이량체, NME7 단량체, NME7-AB, NME6 이량체 또는 박테리아 NME이다. 비-인간 동물은 설치류, 돼지 소, 양 또는 영장류이다. 설치류는 마우스 또는 래트이다. NME 단백질은 단일 성장 인자로서 무혈청 배지에 존재한다. 비-인간 동물 숙주는 생성될 줄기 세포 종의 천연 서열에 상동인 서열을 갖는 NME 단백질을 발현한다. NME 단백질은 NME7, NME7-AB, NME7-X1 또는 이량체 NME1 또는 NME6이다. NME 단백질은 NME7이다. NME 단백질은 생성될 줄기 세포 종의 천연 NME 단백질 서열과 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 상동이다. NME 단백질은 생성될 줄기 세포 종의 천연 서열과 적어도 60% 상동이다. NME 단백질은 생성될 줄기 세포 종의 천연 서열과 적어도 70% 상동이다.
본 발명의 다른 양태는 천연 마우스 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, 천연 래트 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, 천연 돼지 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, 천연 양 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, 천연 소 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, 천연 필리핀 원숭이 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, 천연 붉은털 원숭이 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, 천연 침팬지 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, 천연 보노보 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, 천연 고릴라 NME 단백질과 적어도 75% 상동인 서열을 갖는 NME 단백질, MUC1* 세포외 도메인의 서열을 포함하는 펩타이드에 결합하는 항체에 관한 것이며, 상기 서열은 MUC1*의 세포외 도메인 서열을 포함하는 펩타이드에 결합하는 비-인간 항체이며, 상기 서열은 MUC1*의 세포외 도메인 서열을 포함하는 펩타이드에 결합하는 영장류 항체이며, 상기 서열은 MUC1*의 세포외 도메인 서열을 포함하는 펩타이드에 결합하는, 짧은꼬리 원숭이, 침팬지, 유인원, 보노보 또는 고릴라 항체이며, 상기 서열은 MUC1*의 세포외 도메인의 서열을 포함하는 펩타이드에 결합하는 비-영장류 항체이며, 상기 서열은 MUC1*의 세포외 도메인의 서열을 포함하는 펩타이드에 결합하는 설치류 항체이며, 상기 서열은 MUC1*의 세포외 도메인 서열을 포함하는 펩타이드에 결합하는 마우스 또는 래트 항체이며, 상기 서열은 MUC1*의 세포외 도메인의 서열을 포함하는 펩타이드에 결합하는 포유동물 항체이며, 상기 서열은 돼지, 소 또는 양이다.
또 다른 양태에서, 본 발명은 세포를 NME 단백질 및/또는 항-MUC1* 항체와 접촉시키는 단계를 포함하는, 줄기 세포를 생성하고 체세포에서 다능성을 유도하거나 줄기 세포를 배양하는 방법에 관한 것으로서, 상기 NME 단백질은 공여자 세포의 서열과 적어도 75% 상동이고, 항-MUC1* 항체는 MUC1* 세포외 도메인의 서열을 포함하는 펩타이드에 결합하며, 상기 서열은 세포를 기증한 종의 천연 서열과 적어도 75% 상동이다.
또 다른 양태에서, 본 발명은 생성된 조직 또는 장기를 필요로 하는 인간을 치료하는 방법에 관한 것으로, 상기 단계들을 수행하는 단계를 포함한다.
또 다른 양태에서, 본 발명은 제1 비-인간 포유동물과 동일한 종 또는 속에 속하거나 또는 속하지 않는 제2 포유동물로부터 특이적으로 유래하는 DNA, 분자, 세포, 조직 또는 장기를 포함하는 제1 비-인간 포유동물을 생성하는 방법에 관한 것으로서, 제2 포유동물로부터의 세포를 제1 비-인간 포유동물로 도입하는 단계를 포함한다. 제2 포유동물로부터의 세포는 전구 세포, 줄기 세포 또는 나이브 상태 줄기 세포이다. 나이브 상태 줄기 세포는 NME를 함유하는 배지에서 세포를 배양하여 생성된다. NME는 이량체 NME1, 이량체 NME6, NME7-X1 또는 NME7-AB이다. NME는 제2 포유동물에 대하여 내생적인 서열을 가지고있다. 제2 포유동물은 인간이다. 제1 비-인간 포유동물은 설치류, 가축, 돼지, 소 또는 비-인간 영장류이다. 전구 세포, 줄기 세포 또는 나이브 줄기 세포는 제1 비-인간 포유동물의 수정란, 상실배, 배반포, 배아 또는 발생중 태아로 도입된다.
상기 방법에서, 추가의 단계는 제1 비-인간 포유동물을 발생시키고, 및 일부 제2 포유동물 DNA가 혼입된 제1 비-인간 포유동물 분자, 세포, 조직 또는 장기로부터 수확하는 단계; 및 질병 또는 질환의 치료 또는 예방을 위한 분자, 세포, 조직 또는 장기를 이들을 필요로하는 제2 포유동물에 투여하는 단계를 추가로 포함한다. 전구 세포, 줄기 세포 또는 나이브 줄기 세포는 iPS 세포이다. iPS 세포가 생성되는 체세포는 질병 또는 질환의 치료 또는 예방을 위해 수득된 분자, 세포, 조직 또는 장기가 투여되는 제2 포유동물로부터 유래된다.
상기 방법에서, 추가의 단계는 장기의 발생과 관련된 장기 발달 기간 및 내인성 유전자를 결정하는 단계; 및 제1 비-인간 포유동물의 장기 발달 기간 동안 상기 내인성 유전자를 녹아웃 또는 녹다운시키는 단계로서 상기 제2 포유동물의 세포로부터 장기가 생성되도록 하는 단계를 포함한다.
상기 방법에서, 제1 비-인간 포유동물은 70%, 75%, 80%, 85%, 90% 또는 95%보다 큰 전체 서열 동일성, 또는 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%보다 큰 NME 서열 동일성을 갖는 제2 포유동물에 가깝다.
상기 기술된 방법에서, 추가의 단계는 장기의 발생과 관련된 장기 발달 기간 및 내인성 유전자를 결정하는 단계; 및 제2 포유동물 세포가 비-포유동물 NME7-AB 또는 NME1에 대한 반응으로 적시에 확장하도록, 제2 포유동물 NME7-AB 또는 NME1이 유도성 또는 억제성 프로모터로부터 발현되도록 제1 비-인간 포유동물의 수정란, 상실배 세포, 배반포 세포, 또는 배아 또는 발생중 태아의 세포를 유전적으로 변형시키는 단계를 포함한다. 추가의 단계는 원하는 장기 또는 조직이 정상적으로 발달하는 위치에서 발달의 후기 단계에서 제2 포유동물 줄기 세포를 배아에 주입하는 단계를 포함한다. 추가의 단계는 제1 비-인간 포유동물 또는 제2 포유동물 NME7 또는 NME1의 발현을 그 위치에서 유도함으로써 포유동물 줄기 세포를 확장시키는 단계를 포함한다. 추가의 단계는 제1 비-인간 포유동물 또는 제2 포유동물 NME1의 발현을 그 위치에서 유도함으로써 포유동물 줄기 세포를 확장시키는 단계를 포함한다. 제2 포유동물 프로모터는 내생적인 제1 비-인간 포유동물 단백질에 연결되고, 원하는 시간 및 위치에서 발현되어, 이어서 원하는 조직의 발달을 지시하는 제제를 도입한다. 내생적인 제1 비-인간 포유동물 단백질은 NME1 또는 NME7, 바람직하게는 NME1의 발현을 유도하는 단백질이다.
다른 양태에서, 본 발명은 일부 제2 포유동물 DNA 또는 일부 제2 포유동물 조직을 발현하는 키메라 동물에서 잠재적인 약물 제제의 효능 또는 독성을 시험하는 방법에 관한 것으로서, 상기 방법은: (i) 제1 비-인간 포유동물과 동일한 종 또는 속에 속하거나 또는 속하지 않는 제2 포유동물로부터 특이적으로 유래하는 DNA, 분자, 세포, 조직 또는 장기를 포함하는 제1 비-인간 포유동물을 생성하는 단계로서, 제2 포유동물로부터의 세포를 제1 비-인간 포유동물에 도입하는 단계를 포함하는 단계; 및 (ii) 제2 포유동물로부터 유래된 조직 또는 장기에 대한 효과를 위해 시험 약물을 제1 비-인간 포유동물에 투여하는 단계를 포함한다. NME는 제2 포유동물에서 유래한 세포의 증식을 촉진하는 제1 비-인간 포유동물에서 발현된다.
또 다른 양태에서, 본 발명은 일부 포유동물 DNA 또는 일부 제2 포유동물 조직을 발현하는 키메라 동물에서 잠재적인 약물 제제를 발견하는 방법에 관한 것으로서, 상기 방법은: (i) 제1 비-인간 포유동물과 동일한 종 또는 속에 속하거나 또는 속하지 않는 제2 포유동물로부터 특이적으로 유래하는 DNA, 분자, 세포, 조직 또는 장기를 포함하는 제1 비-인간 포유동물을 생성하는 단계로서, 제2 포유동물로부터의 세포를 제1 비-인간 포유동물에 도입하는 단계를 포함하는 단계; 및 (ii) 제2 포유동물로부터 유래된 조직 또는 장기에 대한 효과를 위해 화합물을 제1 비-인간 포유동물에 투여하는 단계를 포함하며, 상기 효과적인 효과는 잠재적인 약물의 존재를 나타낸다. NME는 제2 포유동물에서 유래한 세포의 증식을 증진시키는 제1 비-인간 포유동물에서 발현된다.
줄기 세포의 증식 및 유도에서의 MUC1*/NME
본 발명자들은 인간 줄기 세포가 강력한 성장 인자 수용체인 MUC1*을 과발현한다는 것을 발견했다. NME1이라고도 불리는, 이량체 형태의 MUC1*의 리간드, NM23-H1은 인간 줄기 세포가 피더 세포, 조건화된 배지 또는 임의의 다른 성장 인자 또는 사이토카인을 필요로 하지 않으면서 다능성 상태로 자라게 하는데 단독으로도 충분하다(Mahanta S et al 2008; Hikita S et al 2008). 본 발명자들은 NME1 이량체가 MUC1* 성장 인자 수용체의 리간드인 것을 이미 보여주었으며, 상기 MUC1*은 세포외 영역의 대부분이 분해되어 세포 표면으로부터 흘러나온 후에 남은 막통과 부분이다. 세포외 도메인의 나머지 부분은 본질적으로 PSMGFR 서열로 구성된다. NME1 이량체는 MUC1* 수용체에 결합하고 이량체화한다. 합성 PSMGFR 펩타이드를 이용한 NME-MUC1* 상호 작용의 경쟁적 억제는 다능성 줄기 세포의 분화를 유도하였으며, 이는 다능성 줄기 세포의 성장이 NME1 이량체와 MUC1* 성장 인자 수용체 사이의 상호 작용에 의해 매개됨을 보여준다. 인간 줄기 세포는 NME1을 분비하며, 이는 이량체화 후에 MUC1* 수용체에 결합하여 인간 줄기 세포의 성장과 다능성을 자극한다. PSMGFR 펩타이드의 첨가 또는 항-MUC1*(항-PSMGFR) 항체의 Fab 첨가에 의한 상호 작용의 경쟁적 억제는 시험관내에서 세포 사멸 및 분화를 유도하였다(Hikita et al 2008).
본 발명자들은 FGF 또는 임의의 다른 성장 인자의 부재하에 인간 줄기 세포를 성장시키고 그의 분화를 억제시키는 NME 계열의 새로운 성장 인자인 NME7을 발견했다. 본 발명자들은 NME7-AB 또는 rhMNE7-AB라고 부르는, 잘린, 재조합 인간 NME7을 제조하였다. 그것은 N-말단 DM10 도메인이 없고, 약 33kDa의 분자량을 갖는다. 줄기 세포로부터 분비되는 자연 발생 NME7 분열 생성물은 본원의 재조합 NME7-AB와 본질적으로 동일한 것으로 나타났다. NME7-X1이라 불리는 NME7의 대안적인 스플라이스 변형이 이론화되었다. 본 발명자들은 NME7-X1이 자연계에 존재하고, 또한 인간 줄기 세포에 의해 분비되며, 30kDa임을 PCR에 의해 입증했다. 본 발명자들은 또한 인간 재조합 NME7-X1을 제조하였다. 또한 본 발명자들은 인간 NME1과 서열 상동성이 높은 일부 박테리아 NME1 단백질이 인간 NME1과 동일한 작용을 한다는 것을 보여주었다. 그들은 MUC1* 세포외 도메인에 결합하고 이량화하여 다능성을 유도한다. 본 발명자들이 인간 줄기 세포 성장을 지원하고, 다능성을 유도한다고 보여준 상기 박테리아 NME1 단백질 중 하나는 HSP593으로도 알려져 있는 할로모나스(Halomonas) Sp. 593이다. 섬유아세포는 줄기 세포가 아닌 체세포이다. 그러나, 본 발명자들은 NME7-AB, NME7-X1, NME1 이량체 및 HSP593 이량체가 체세포가 덜 성숙한 상태로 되돌아 가도록 유도할 수 있음을 발견했다. 도 1은 NME7-AB, NME1 이량체 또는 HSP593 NME1 이량체에서 인간 섬유아세포를 단순히 배양하면 줄기 세포 마커인 OCT4와 NANOG의 상향 조절이 일어남을 보여준다. 도 2는 상기 NME 단백질이 MBD3 및 CHD4의 발현을 억제하고; 상기 유전자들의 억제가 이전에 인간 줄기 세포를 보다 나이브한 상태로 되돌리게 하는 것으로 나타났다(Rais Y et al, 2013). BRD4는 NME7의 발현을 억제하는 것으로 나타났으며, 그의 공동-인자인 JMJD6은 NME1을 상향조절한다. 도 3의 PCR 그래프는 NME7-AB 또는 NME1 이량체가 다능성 유전자를 상향조절함으로써, 및 나이브 상태 줄기 세포에서 억제되는 것으로 보고된 다른 것들을 억제함으로써 다능성을 유도함을 보여준다. 도 4의 4A 및 4B는 유일하게 첨가된 성장 인자가 다능성 줄기 세포 성장을 완전히 지지하기 때문에 NME1 이량체에서 인간 줄기 세포를 배양하는 것을 보여준다. 도 5의 5A-5C는 유일하게 첨가된 성장 인자가 다능성 줄기 세포 성장을 완전히 지지하기 때문에 NME7-AB 단량체에서 인간 줄기 세포를 배양하는 것을 보여준다. NME1이 MUC1* 성장 인자 수용체에 결합하고 이를 이량화하기 위해 이량체여야 하는 반면, 단량체 NME7-AB 및 NME7-X1은 MUC1*에 대해 2개의 결합 부위를 갖는다. 도 6의 6A 및 6B는 샌드위치 ELISA 분석에서 NME7-AB가 본원에서 PSMGFR 펩타이드(JHK SEQ ID?)로도 지칭되는 2개의 MUC1* 세포외 도메인 펩타이드에 동시에 결합할 수 있음을 보여준다. BRD4 및 공동-인자 JMJD6은 도 2 및 도 7에 도시된 바와 같이 나이브 상태의 줄기 세포에서 억제된다. 도 8-11은 줄기 세포 형태와 유사한 형태의 극적인 변화에 의해 볼 수 있으며 도 12-13에 도시된 섬유아세포 형태와는 달리 의심의 여지가 없이, NME1 이량체 및 NME7-AB가 인간 섬유아세포를 유도하여 보다 덜 성숙하고 줄기-유사 상태로 복귀시키는 것을 보여준다.
본 발명자들은 가장 초기의 인간 줄기 세포에서 NME7-AB와 NME7-X1이 분비되어 MUC1* 성장 인자 수용체의 세포외 도메인에 결합하고 이를 이량화할 수 있다고 이론화했다. 따라서 NME7-AB는 첫 나이브 상태를 안정화시킨다. 나중 단계에서 BRD4는 NME7을 억제하고, 그의 공동-인자 JMJD6은 MUC1* 성장 인자 수용체에 결합하고 이를 이량화하는 이량체가 되어야하는 NME1의 발현을 상향조절한다. 따라서, NME1 이량체는 두 번째 나이브-유사 상태를 안정화시킨다. 발달중인 상실배 또는 배반포의 줄기 세포가 번식함에 따라, 분비되는 NME1의 양이 증가하고, 이량체가 헥사머가 된다. 헥사머 NME1은 MUC1*에 결합하지 않고, 분화를 유도한다(Smagghe et al 2013). 도 14는 줄기 세포가 자가-복제를 제한하는 방법의 기계론적 모델을 보여준다. 이전에는 NME7이 고환에서만 발현되었다고 보고되었다. 본 발명자들은 인간 상실배의 초기 세포와 인간 배반포의 내부세포괴가 NME7을 발현한다는 것을 발견했다. 도 15A는 3일 인간 상실배의 모든 세포가 NME7에 대해 양성으로 염색되었음을 보여준다(실시예 섹션 #61의 항체를 말함). 도 15B는 5일째에 상실배가 배반포로 발달되고, 이 발달 단계에서 NME7-양성 세포가 나이브 상태에 있는 것으로 알려진 내부세포괴로 제한된다는 것을 보여준다. 본 발명자들은 나이브 상태의 인간 줄기 세포가 N-말단 DM10 도메인이 없는, 두개의 절단된 형태의 NME7을 발현 및 분비한다는 것을 발견했다. 이 절단된 NME7 종은 MUC1* 성장 인자 수용체의 세포외 도메인과 결합한다. 본 발명자들이 NME7-AB라고 부르는 한개의 NME7 형태는 ~33kDa의 겉보기 분자량으로 동작하는 NME7 종을 생산하기 위해 번역 후 절단을 거쳤다. 다른 절단된 형태는 -30kDa인 NME7-X1이라고 불리는 대체 스플라이스 이소형태가다. 이것은 ~42kDa의 계산된 분자량을 갖고 세포질로 제한되는 것으로 보이는 전장 NME7과는 대조적이다. NME1 이량체, NME6 이량체, NME7-AB 및 NME7-X1은 인간 줄기 세포의 성장 인자로서 기능한다. 그들은 MUC1* 성장 인자 수용체에 결합하고 이를 이량화함으로써 성장, 다능성 및 나이브 상태의 유도를 촉진한다. 그러나, NME7-AB와 NME7-X1은 MUC1*의 세포외 도메인에 대한 2개의 결합 부위를 가지고 있기 때문에 단량체로 작용한다. 도 16의 16A-16B는 인간 나이브 상태 유도 다능성 줄기(iPS) 세포 및 배아 줄기(ES) 세포가 용해되고 MUC1(Ab5)의 세포질 꼬리에 대한 항체가 MUC1에 결합하는 종을 동시-면역침전시키는데 사용된, 동시-면역침전 실험으로부터의 웨스턴 블롯 겔의 사진을 나타낸 것이다. 이어서, 면역침전물을 웨스턴 블롯으로 분석하였다. 도 16A는 항-MNE7 항체로 프로빙된 웨스턴 블롯의 사진을 나타내고, MUC1에 결합된 2개의 NME7 종(하나는 분자량 30kDa이며, 다른 하나는 분자량 33kDa임)을 보여주는 반면, 조 세포 용해물에서의 전장 NME7은 분자량 42 kDa를 가지며, 도 16B는 도 16A의 겔을 항-MUC1* 세포외 도메인 항체로 박리 및 재-프로빙한 웨스턴 블롯의 사진을 나타내며, NME7-AB 또는 NME7-X1은 글리코실화에 따라 17-25 kDa의 분자량으로 동작하는 MUC1*으로 불리는 MUC1의 절단된 형태에 결합하는 것을 보여준다.
도 17은 가장 초기의 나이브 상태에서 줄기 세포를 증식시키기 위한 본 발명의 방법을 도시한다. NME7-AB 또는 NME7-X1은 1nM-60nM 사이의 낮은 나노몰 농도 범위의 무혈청 배지에 첨가되며, 2nM-32nM이 보다 바람직하고, 2nM-10nM이 더욱 바람직하고, 4nM이 가장 바람직하다. 피더 세포 및 세포외 기질 단백질 및 혼합물은 신호를 전달하는 성장 인자 및 기타 생물학적 분자를 함유하므로, 나이브 상태를 유도하거나 안정화할 때 이들의 사용을 피하는 것이 바람직하다. 표면에 줄기 세포를 부착시키는 표면 코팅으로서, MN-C3, MN-C8 또는 MN-C3 또는 MN-C8의 인간화된 버전 또는 단편과 같은 항-MUC1* 항체 또는 NME 단백질을 사용하는 것이 바람직하다. 대안적으로, 세포는 접착층을 필요로 하지 않도록 현탁 배양될 수 있다. 분화를 유도하고자 하는 경우, PSMGFR 펩타이드의 대부분 또는 전부를 포함하는 펩타이드가 첨가된다. MUC1* 성장 인자 수용체의 세포외 도메인의 대부분 또는 전부의 서열을 갖는 펩타이드를 첨가하는 것은 리간드 싱크(ligand sink)로서 작용하고, 모든 NME 성장 인자를 결합시켜 분화가 동조되고 보다 완전하게된다. 이 펩타이드의 첨가는 또한 모든 OCT4 양성 세포가 기형종 형성의 위험을 최소화하거나 제거하는 분화로 유도되도록 한다. 이 방법은 연구, 약물 발견, 치료 용도를 위한 줄기 세포를 생산하는데 사용되거나 일부 인간의 DNA, 분자, 세포, 조직 또는 장기를 갖는 비-인간 동물의 생성을 위해 수정란, 상실배, 배반포, 배아 또는 태아에 이식될 수 있다. 적어도 일부 인간 DNA를 함유하는 상기 분자, 세포, 조직 또는 장기는 연구, 약물 발견, 약물 검사를 위해 사용될 수 있거나, 질병 또는 질환의 치료 또는 예방을 위해 인간에게 투여될 수 있다. 인간 줄기 세포를 비-인간 숙주에 삽입하기 위해, NME7-AB 또는 NME7-X1은 인간 서열 또는, 천연 인간 서열과 적어도 80% 동일한 서열을 가져야한다. 그러나, 비-인간 종 사이에 키메라를 생성하는 것이 바람직할 수 있다. 예를 들어, 윤리적인 우려를 피하기 위해 비-인간 영장류-비-영장류 키메라가 생성될 수 있다. 이 경우, NME 단백질의 서열은 높은 서열 상동성때문에 인간 또는 비-인간 영장류의 서열일 수 있다. 그러나, 하위 포유동물의 키메라를 생성하고자 한다면, NME7 서열은 줄기 세포가 숙주 상실배 또는 배반포에 삽입된 포유동물의 서열이어야 한다. 대안적으로, 낮은 퍼센트로 또는 숙주 동물의 특정 영역에서만 발현되는 인간 세포 및 조직을 갖는 것이 바람직할 수 있다. 상기 경우, 가장 초기의 나이브 상태가 아니라 후기의 나이브 상태에 있는 줄기 세포를 삽입하는 것이 바람직할 수 있다. 이러한 경우 NME1 이량체는 위에서 설명한 방법으로 줄기 세포를 배양하는데 사용된다.
진실한 키메라 동물의 생성을 위해, 수정란, 상실배, 또는 배반포에 주입되는 줄기 세포는 나이브 상태여야 한다. 도 18은 RNA-SEQ 실험으로부터 생성된 열지도를 도시한다. FGF에서 유래되고 성장한 인간 배아 줄기 세포를 프라임드 상태로 두었고, 이어서 추가된 성장 인자가 NME7-AB 또는 NME1 이량체인 상기 배양 시스템으로 옮겼다. 유전자 발현의 열지도는 프라임드 상태로 성장한 FGF가 NME7-AB 성장 세포 또는 NME1 성장 세포와 완전히 다른 유전자 발현 시그니처를 가짐을 보여주며, 이들은 프라임드 세포와는 상이하고, 나이브하다는 것을 나타낸다. NME7 및 NME1 성장 세포가 나이브 상태에 있다는 또다른 증거는 NME7-AB, NME1 이량체 또는 NME7-X1의 iPS 세포 생성이 FGF 기반 배지에서 iPS 생성보다 훨씬 효율적이라는 것이다. 도 19의 19A-19C는 FGF-기반 매질에서 유도된 다능성 줄기 세포(iPS 세포)가되도록 체세포를 재프로그래밍하는 것이 매우 낮은 효율을 갖는다는 것을 보여준다. 줄기 세포 콜로니는 알칼리성 포스파타아제로 염색되어 가시화된다. 마우스 배아 섬유아세포(MEFs)와 함께 사용된 FGF-기반 배지는 초기 단계에서 비교적 효율적으로 보이지만, 집락된 콜로니의 약 15%만이 선천적인 줄기 세포주가 된다(도 19A). 또한, 마우스 피더 층은 비-인간 비-정량화가능성 및 비-인간 종을 인간의 세포 또는 자손의 궁극적인 치료적 사용을 위해 위태로운 상태가 되는(frowned up) 방법으로 도입한다. mTeSR은 마트리겔 상에 세포를 플레이팅함으로써 피더-프리(feeder-free)로 사용될 수 있는 FGF-기반 배지이지만, 이 방법은 도 19B의 희소하고 작은 콜로니에서 볼 수 있는 바와 같이 매우 비효율적이다. 대조적으로, 항-MUC1* 항체의 층 위에서 NME7-AB에서의 iPS 재프로그래밍은 FGF-기반 방법보다 빨리 발생하고 빠르게 성장하는 줄기 세포 콜로니가 풍부하여 매우 효율적이다(도 19C). 또한, NME7-생성된 iPS 콜로니로부터 86% 이상의 콜로니가 선발되어 진짜 나이브 상태 iPS 줄기 세포주가 된다. 나이브 상태에 있는 줄기 세포의 다른 지표는 여성 소스 세포의 두 번째 X 염색체가 여전히 활성화되어있는 경우이다. 줄기 세포가 만들어내는 가장 초기의 분화 결정 중 하나는 여성 세포에서 X 염색체가 턴 오프되는 것이다. 하나의 X 염색체의 발현을 턴-오프(turn off)시키기 위해, 히스톤 3의 리신 27이 트리-메틸화된다. 도 20A는 FGF 배지에서 유래 및 성장된 여성 소스 배아 줄기 세포를 나타낸다. 각 세포의 핵에 있는 초점 적점은 히스톤 3의 트리-메틸화 리신 27에 결합하는 형광 항체이며, 이는 XaXi라고 불리는, 프라임드 상태 줄기 세포에서 제2 X 염색체가 턴-오프되어 있음을 보여준다. 도 20B는 NME7-AB에서 상기 동일한 세포를 배양한 후 제2 X(XaXa)가 재활성화되어, 초점 적점이 사라지는 것을 보여준다. NME1 이량체의 배양 후 동일한 결과가 얻어졌다. 줄기 세포가 나이브 상태에 있는지 아닌지에 대해 더 논란의 여지가 있는 척도는 다른 종의 상실배 또는 배반포의 내부세포괴로 혼입될 수 있는지 여부이다. 도 21A-21D는 마우스 배반포의 내부세포괴에 혼입된 본원의 인간 NME7-AB 줄기 세포의 형광 이미지를 도시한다. 나이브 상태 줄기 세포의 또다른 지표는 자발적 분화없이 성장할 수 있는지와 프라임드 상태 세포보다 빠르게 성장하는지의 여부이다. 도 20A-20B는 인간 NME7-AB 성장된 줄기 세포가 프라임드 줄기 세포보다 훨씬 빠른 성장 속도를 갖는다는 것을 보여준다. 그들은 4일 만에 10-20배의 확장을 겪으며, 이는 프라임드 상태의 세포보다 2~3배 빠르다.
NME 단백질은 배아 및 iPS 세포의 성장 및 다능성을 촉진할뿐만 아니라 세포를 줄기-유사 상태 또는 나이브 상태로 복귀시키도록 유도한다. 바람직한 구현예에서, NME 계통의 구성원 단백질은 NME1 또는, NME1과 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 97% 이상의 서열 동일성을 갖는 NME 단백질이며, 상기 단백질은 이량체이다. 보다 바람직한 구현예에서, NME 계통의 구성원 단백질은 NME7 또는, NME7 도메인 A 또는 B 중 적어도 하나와 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 97% 이상의 서열 동일성을 갖는 NME 단백질이며, MUC1* 성장 인자 수용체를 이량화시킬 수 있다.
본원에서, 본 발명자들은 이량체 형태의 NME1, NME7-AB 또는 NME7-X1이: a) 분화를 억제하면서 인간 ES 또는 iPS 성장 및 다능성을 완전히 지원하고; b) 체세포를 더 줄기-유사 또는 나이브-유사 상태로 되돌리고; c) 다른 종의 배반포에 통합될 수 있는 나이브 상태 인간 줄기 세포를 생산할 수 있다고 보고하고 있다. NME7-AB 나이브 인간 줄기 세포를 2.5일째에 마우스 상실배에 주사했다. 도 22의 22A-22D는 48시간 후에 상실배가 배반포로 발달될 때, 인간 세포(황색)가 마우스 나이브 세포가 있는 내부세포괴(원형) 내에 있음을 보여준다. 이러한 내부세포괴로의 혼입은 키메라 동물의 형성에 필요하다. 도 23의 23A-23J 및 도 24의 24A-24J는 인간 NME7-나이브 세포가 2.5일에 주사된 다른 마우스 배반포의 공초점 이미지를 도시하며, 또한 내부세포괴로의 통합을 나타낸다. 도 25의 25A-25D 및 도 26의 도 26A-26H는 프라임드 상태의, FGF 성장된 인간 줄기 세포가 동일한 조건 하에서 마우스 배반포의 내부세포괴로 혼입되지않는 것을 도시한다. 도 27의 27A-27F, 도 28의 28A-26J, 도 29의 29A-29J 및 도 30의 30A-30J는 마우스 상실배 내로 2.5일째에 주사된 인간 NME7-AB 성장된 나이브 줄기 세포가 4.5일째에 48시간후에 배반포의 내부세포괴에 농축되어 발견됨을 보여준다.
본 발명자들은 이량체를 안정화시키는 S120G 돌연변이를 갖는 이량체인 재조합 인간 NME1을 제조하였다. 본 발명자들은 이전에 인간 NME1 이량체가 MUC1* 수혜자의 세포외 도메인의 PSMGFR 부분에 결합한다고 보고했다(Smagghe et al., 2013). 본 발명자들은 또한 다능성 줄기 세포에서 MUC1* 수혜자의 세포외 도메인의 PSMGFR 부분에 단량체로 결합하고 이량화하여 재조합 인간 NME7-AB와 NME7-X1을 제조하였으며, 이는 성장과 다능성을 자극하고 줄기 세포를 최초의 나이브 상태로 되돌리도록 자극한다.
NME는 일반적인 줄기 세포 성장 인자이다
NME7 및 절단된 형태는 많은 종에서 일반적인 줄기 세포 및 다능성 성장 인자이다. 예를 들어, 본 발명자들은 인간 NME7-AB를 사용하여 배아 및 iPS 줄기 세포를 포함한 붉은털 원숭이 및 필리핀 원숭이 줄기 세포를 증식시킬 수 있었다. 본 발명자들은 표면 부착을 촉진시키기 위해 항-MUC1* 항체인 MN-C3를 사용하는, 피더 세포의 부재하에 야마나카 또는 톰슨(Thomson)의 재프로그래밍 인자와 함께 NME7-AB를 사용하여 붉은털 원숭이 및 필리핀 원숭이에서 iPS 세포를 생성하는데 성공했다. 두 원숭이 NME7의 서열은 인간 NME7과 98% 동일하며, 그의 표적 성장 인자 수용체인 MUC1* 세포외 도메인은 인간 PSMGFR과 90% 동일하다. 도 31의 31A-31F는 야마나카 다능성 인자인 OCT4, SOX2, NANOG 및 c-Myc의 형질도입 없이, NME7-AB에서 6일 동안 배양한 필리핀 원숭이로부터의 섬유아세포를 함유하는 대조군 플레이트의 사진을 나타낸다. 도 32의 32A-32C, 도 33의 33A-33F 및 도 34의 34A-34F는 야마나카 인자 및 NME7-AB에 의해 재프로그래밍된 필리핀 원숭이로부터의 섬유아세포를 나타낸다. 6일 이후, 생긴 iPS 콜로니가 항-MUC1* 항체 표면으로 옮겨지며, 각 클론이 추출되어 확장될 때 약 14-17일까지 계속 확장된다. 본 발명자들이 아는 한, 이것은 과학자들이 마우스 또는 인간 피더 세포의 부재하에 비-인간 영장류 iPS 세포를 생성하는데 성공한 최초의 사례이다. 연구원은 비-인간 영장류 줄기 세포를 배양하는데 극도의 어려움을 겪고 있다. 그들은 자발적으로 분화하며, FGF-기반의 배지에서 잘 자라지 않는다. 도 35의 35A-35D, 도 36의 36A-36D, 도 37의 37A-37B 및 도 38의 38A-38H에 도시된 바와 같이, 본 발명자들은 비-인간 영장류 세포를 NME7-AB 배지로 옮길 때 상기 모든 문제를 극복했다. MN-C3 항체 표면 또는 MEF 상에서 무 혈청, FGF-없는 NME7-AB 배지에서의 야마나카 인자 또는 톰슨 인자의 형질도입에 의한 붉은털 원숭이 iPS 세포의 생성은 도 39의 39A-39C, 도 40의 40A-40C, 도 41의 41A-41D, 도 42의 42A-42B, 도 43의 43A-43E, 도 44의 44A-44F, 도 45의 45A-45H, 도 46의 46A-46H, 도 47의 47A-47G 및 도 48의 48A-48D에서 다양한 단계로 도시되어 있다.
본 발명의 또다른 양태에서, 배아 또는 iPS 줄기 세포는 수정란 또는 배아를 배양하거나 NME 단백질을 함유하는 배지를 사용하여 세포를 재프로그래밍함으로써 다른 비-인간 종에서 증식, 유지 또는 생성된다. NME 단백질은 NME1 이량체 또는 NME6 이량체, NME7, NME7-AB 또는 NME7-X1일 수 있다. 일부의 경우, NME 단백질의 서열은 인간 서열일 수 있다. 다른 경우, NME 단백질의 서열은 재프로그램을 위한 줄기 세포, 배아 또는 세포가 유래한 비-인간 종의 서열이다. 비-인간 종에서의 NME7의 서열이 인간 NME7의 서열과 너무 다르면, 비-인간 표적 종에 대한 서열 동일성이 더 높은 서열을 갖는 NME 단백질 또는 그 종의 천연 NME 단백질의 서열을 갖는 NME 단백질을 사용하여 보다 양호한 결과들이 얻어진다. 본 발명의 일 양태에서, NME 단백질은 NME1 또는 NME6 이량체, NME7, NME7-AB 또는 NME7-X1이다. 특정 NME 단백질이 다능성 성장 인자로서 작용할 종을 결정하는 방법은 NME 단백질이 표적 종의 서열을 갖는 PSMGFR 펩타이드에 결합하는지 여부를 시험하는 것이다. NME 단백질이 표적 종의 PSMGFR 펩타이드에 결합하면, NME 단백질은 줄기 세포 성장 인자 또는 다능성 인자로서 작용할 것이다.
본 발명의 일 양태에서, 비-인간 줄기 세포는 비-인간 종의 NME 단백질을 함유하는 배지에서 세포를 배양함으로써 증식 또는 유지된다. 본 발명의 또다른 양태에서, 비-인간 종 줄기 세포의 서열과 적어도 40% 상동인 서열을 갖는 NME 단백질을 함유하는 배지에서 세포를 배양함으로써 비-인간 줄기 세포가 증식 또는 유지된다. 본 발명의 다른 양태에서, 비-인간 줄기 세포는 PSMGFR 펩타이드라고도 불리는, 종의 MUC1* 세포외 도메인의 서열을 갖는 펩타이드에 결합할 수 있는 NME 단백질을 함유하는 배지에서 세포를 배양함으로써 증식 또는 유지된다. 본 발명의 또다른 양태에서, 비-인간 줄기 세포는 인간 서열 NME 단백질을 함유하는 배지에서 세포를 배양함으로써 증식 또는 유지된다. NME 단백질은 NME1 또는 NME6 이량체, NME7, NME7-AB 또는 NME7-X1일 수 있다.
본 발명의 또다른 양태에서, 비-인간 종의 NME 단백질을 함유하는 배지의 존재하에, 비-인간 줄기 세포는 Oct4, Sox2, Klf4, c-Myc, Nanog, Lin28을 포함하는 유전자 또는 유전자 산물의 조합을 도입하는 것과 같은 재프로그래밍 기술을 사용하여 생성된다. 본 발명의 다른 양태에서, 비-인간 줄기 세포의 서열과 적어도 40% 상동인 서열을 갖는 NME 단백질을 함유하는 배지에서 재프로그래밍 기술을 사용하여 비-인간 줄기 세포가 생성된다. 본 발명의 다른 양태에서, 비-인간 줄기 세포는 PSMGFR 펩타이드로도 불리는 종의 MUC1* 세포외 도메인의 서열을 갖는 펩타이드에 결합할 수 있는 NME 단백질을 함유하는 배지에서 재프로그래밍 기술을 사용하여 생성된다. 본 발명의 다른 양태에서, 비-인간 줄기 세포는 인간 서열 NME 단백질을 함유하는 배지에서 재프로그래밍 기술을 사용하여 생성된다. NME 단백질은 NME1 또는 NME6 이량체, NME7, NME7-AB 또는 NME7-X1일 수 있다.
본 발명의 또다른 양태에서, 비-인간 배아 줄기 세포는 비-인간 종의 NME 단백질을 함유하는 배지에서 수정란 또는 배아를 배양함으로써 생성된다. 본 발명의 다른 양태에서, 비-인간 종 줄기 세포의 서열과 적어도 40% 상동성인 서열을 갖는 NME 단백질을 함유하는 배지에서 수정란 또는 배아를 배양함으로써 비-인간 배아 줄기 세포가 생성된다. 본 발명의 또다른 양태에서, 비-인간 배아 줄기 세포는 PSMGFR 펩타이드로도 불리우는 종의 MUC1* 세포외 도메인의 서열을 갖는 펩타이드에 결합할 수 있는 NME 단백질을 함유하는 배지에서 수정란 또는 배아를 배양함으로써 생성된다. 본 발명의 다른 양태에서, 비-인간 배아 줄기 세포는 인간 서열 NME 단백질을 함유하는 배지에서 수정란 또는 배아를 배양함으로써 생성된다. NME 단백질은 NME1 이량체 또는 NME6 이량체, NME7, NME7-AB 또는 NME7-X1일 수 있다.
본 발명의 또다른 양태에서, NME 단백질 또는 MUC1* 단백질이 인간과 낮은 서열 동일성을 갖는 비-인간 종의 발생중 배반포 또는 배아에 인간 줄기 세포가 혼입되기를 원하는 경우, 비-인간 종이 인간화된다. 비-인간 종의 수정란 또는 수정되지않은 난 또는 줄기 세포는 인간 NME 단백질 및/또는 인간 MUC1* 단백질의 발현을 가능하게하는 벡터로 형질도입되며, 이들의 발현은 유도성 또는 억제성일 수 있다.
키메라 동물에서 잠재적인 약물 제제에 대한 시험
마우스 및 다른 동물에서 암 제제를 시험하기 위한 현재의 실습은 인간 암세포를 동물에게 주사하고, 즉시 또는 며칠 또는 수 주간의 생착 후에 동물에게 시험 약물을 주사하는 것이다. 그러나, 이 접근법은 근본적으로 결함이 있는데, 왜냐하면 인간 암세포가 성장하거나 생장하는데 필요한 성장 인자를 숙주가 자연적으로 생산하지 않기 때문이다. 또한, 숙주가 성장 인자 또는 동일한 수준의 성장 인자 또는 인간 형태의 성장 인자를 생산하지 않기 때문에, 동물에서 시험되는 약물은 인간에서와 동일한 효과를 갖지 않을 것이다. 마우스 NME7은 인간 NME7과 겨우 84% 상동하며, 성인에서는 발현되지 않는다. 따라서, 항암제 테스트를 위한 현재의 이종이식법은 종종 이러한 약물에 대한 인간의 반응을 예측하는 데는 부족하다. 이 문제는 NME1 이량체 또는 NME7을 마우스에 도입하여 인간 종양 세포가, 종양을 공급할 수 있는 동족 성장 인자를 갖도록 하여 해결될 수 있다. NME1 이량체 또는 NME7은 다양한 방법에 의해 동물에게 도입될 수 있다. 이식 전에 종양 세포와 혼합되거나 종양이 있는 동물에게 주사될 수 있다.
바람직한 구현예에서, 인간 NME7 또는 이의 단편을 발현하는 형질전환 동물이 생성된다. NME7은 동물이 자연적으로 발달할 수 있도록 유도성 프로모터 상에 운반될 수 있지만, NME7 또는 NME7 단편의 발현은 인간 종양의 이식 또는 약물 효능 또는 독성 평가동안 턴 온(turn on)될 수 있다. 바람직한 구현예에서, 시험 동물에 도입되는 NME7 종은 NME7-AB이다.
대안적으로, 인간 MUC1, MUC1*, NME7 및/또는 NME1 또는 NME2, 이량체 형성을 선호하는 NME1 또는 NME2의 변이체, 단일 사슬 구조물 또는, 이량체를 형성하는 다른 변이체를 동물이 발현하는 형질전환 동물이 제조될 수 있다. NME 단백질과 MUC1은 인간의 피드백 루프의 일부분이므로, 하나의 발현이 다른 발현의 상향 조절을 일으킬 수 있으며, 인간 NME 단백질(들)과 MUC1 또는 절단된 형태 MUC1*를 발현하는 형질전환 동물을 생성하는 것이 유리할 수 있다. 자연적 또는 조작된 NME 종은 형질전환 동물을 생성하는 단계, 천연 또는 재조합 NME 단백질 또는 NME 단백질의 변이체를 동물에 주입하는 단계를 포함하는 다양한 방법 중 임의의 방법에 의해 마우스와 같은 동물에 도입될 수 있으며, NME1, NME6 및 NME7 단백질 또는 변이체가 바람직하며, MUC1*, 특히 PSMGFR 펩타이드를 이량화할 수 있는 NME1, NME6 및 NME7 단백질 또는 변이체가 특히 바람직하다. 바람직한 구현예에서, NME 종은 근사 분자량이 33kDa인 절단된 형태의 NME7이다. 보다 바람직한 구현예에서, NME7 종은 그의 N-말단의 DM10 도메인이 없다. 보다 더 바람직한 구현예에서, NME7 종은 인간이다.
NME 계통의 단백질, 특히 NME1, NME6 및 NME7은 인간 암에서 발현되며, 여기서 이들은 인간 암의 성장 및 전이를 촉진시키는 성장 인자로서 기능한다. 따라서, 인간 암의 적절한 성장, 진화 및 평가를 위해, 및 화합물, 생물 제제 또는 약물에 대한 그들의 반응을 측정하기 위해서는 인간 NME 단백질 또는 활성 형태의 NME 단백질이 존재해야한다.
인간화 동물
일부 경우, NME 단백질의 발현 타이밍을 조절할 수 있는 것이 바람직하다. 이러한 경우, 단백질 발현은 조절가능한 프로모터와 같은 유도성 유전자 요소에 연결될 수 있다. 바람직한 구현예에서, 인간 줄기 세포 또는 암세포의 접종(engraftment)을 증가시키기 위해 동물에게 도입되는 NME 단백질은 인간 NME7이다. 보다 바람직한 구현예에서, NME7 단백질은 ~ 33kDa인 단편이다. 보다 바람직한 구현예에서, NME 단백질은 인간 NME7-AB이다.
다른 것은 '2i'(Silva J et al 2008) 및 '5i'(Theunissen TW et al 2014)라고 불리우는 억제제가 줄기 세포를 나이브-유사 상태로 유지할 수 있다고 보고한 바 있다. '2i' 억제제 또는 '5i' 억제제로 치료하면 줄기 세포를 더 나이브한 상태로 되돌린다. 2i는 MAP 키나아제 경로의 억제제 및 PD0325901 및 CHIR99021과 같은 GSK3 억제제를 지칭한다. 그러나, 생화학적 억제제의 사용에 의존하는 이 방법과 다른 방법은 다른 종의 내부세포괴로 통합할 수 있는 것과 같이 나이브하기 위한 기준을 충족시키지 못했고, 또한 만연하는 자발적 분화 또는 비정상적인 핵형 또는 둘 다를 갖지 않는 10회 이상의 계대 배양을 위해 줄기 세포를 증식시킬 수 없다고 보고했다.
나이브 상태
줄기 세포를 나이브 상태로 유지시키거나 프라임드 줄기 세포를 나이브 상태로 되돌리기 위한 다른 제제가 보고되었다. 염색질 재배열 인자인 MBD3과 CHD4는 최근 다능성 유도를 차단한다고 보고되었다(Rais Y et al, 2013). 예를 들어, 염색질 재배열 인자인 MBD3 및 CHD4의 siRNA 억제는 인간 프라임드 줄기 세포를 나이브 상태로 되돌리는 방법의 핵심 구성 요소인 것으로 나타났다. 전사 인자 BRD4 및 공동-인자 JMJD6는 NME7을 억제하고 NME1을 상향-조절한다고 보고되었다(Lui W et al, 2013). 본 발명자들은 상기 인자들이 후기 단계 프라임드 줄기 세포에서보다 나이브 줄기 세포에서 낮은 수준으로 발현된다는 것을 발견했다. 본 발명자들은 NME1 이량체, NME7 또는 NME7-AB 또는 NME7-X1에서 배양된 암 세포에서 상기 4개의 유전자들, MBD3, CHD4, BRD4 및 JMJD6이 자연적으로 억제됨을 관찰했다(도 3).
본 발명자들은 NM23-H1로도 불리는 인간 NME1 이량체, 박테리아 NME1, NME6, NME7-X1 및 NME7-AB가 배아 줄기 세포 및 유도된 다능성 줄기 세포의 성장을 촉진하고, 이들의 분화를 억제하고, 줄기 세포 공여자가 인간인 경우 활성 상태의 X 염색체를 모두 가지고 있으며 숙주 동물에서 기형종을 형성할 수 있는 능력을 가짐으로써 전반적인 유전자 분석에 의해 입증된 바와 같이, 이들을 나이브 상태로 유지한다는 것을 입증하였다.
줄기 세포를 프라임드 상태에서 덜 성숙한 나이브 상태로 되돌릴 수 있는 제제 또는 제제(들)과 세포를 접촉시키면, 또한 다양한 세포 유형을 덜 성숙한 상태로: 체세포를 줄기 세포 또는 전구 세포로, 및 줄기 세포를 나이브 상태로, 되돌릴 수 있음을 나타내는 몇 가지 예가 본원에 제시되었다.
바람직한 구현예에서, 인간 NME7 또는 NME7-AB를 발현하는 형질전환 동물이 생성된다. NME1, 인간 또는 세균 및 NME7이 줄기 세포의 분화를 억제하기 때문에, 형질전환 동물에서 NME 단백질, 바람직하게는 NME7 또는 NME7-항체의 발현 타이밍을 제어할 수 있는 기술을 사용하는 것이 유리할 수 있다. 예를 들어, 동물의 발생 중에 NME7 발현의 잠재적인 문제점을 피하기 위해, 유도성 프로모터 상에 인간 NME7을 갖는 것이 유리할 것이다. 숙주 동물에서 유도가능한 외래 유전자의 발현을 만드는 방법은 당업자에게 공지되어있다. NME7 또는 NME7-AB의 발현은 당 분야에 공지된 형질전환 유전자의 발현을 조절하는 많은 방법 중 임의의 하나를 사용하여 유도할 수 있다.
대안적으로, NME7의 발현 또는 발현 타이밍은 포유동물에 의해 자연적으로 발현될 수 있는 또다른 유전자의 발현에 의해 조절될 수 있다. 예를 들어, NME7 또는 NME7 변이체가 심장과 같은 특정 조직에서 발현되는 것이 바람직할 수 있다. NME7 유전자는 MHC와 같은 심장에서 발현된 단백질의 발현과 동작가능하게 연결되어있다. 이 예에서, NME7의 발현은 MHC 유전자 산물이 발현될 때 및 그 자리에서 턴 오프된다. 유사하게, 인간 NME1, NME6 또는 NME7의 발현이 전립선에서 턴 온되거나 턴 오프되어서 그 발현 위치 및 타이밍이 예를 들어 전립선 특이적 단백질의 발현에 의해 조절되도록 하는 것이 바람직할 수 있다. 유사하게, 비-인간 포유동물에서 인간 NME6 또는 NME7의 발현은 유방 조직에서 발현되는 유전자에 의해 조절될 수 있다. 예를 들어, 형질전환 마우스에서, 인간 NME6 또는 인간 NME7은 프롤락틴 프로모터 또는 유사한 유전자로부터 발현된다. 이러한 방식으로, 부위 특이적 방식으로 인간 NME 단백질의 발현을 유도하거나 억제하는 것이 가능할 것이다.
인간 종양을 접종하고, 및 인간 NME7을 주사한 동물은 전이성 암이 발병했다. 따라서, 인간 NME7 또는 보다 바람직하게는 NME7-AB를 발현하는 형질전환 동물을 제조함으로써 암 전이의 발생을 위한 동물 모델이 생성된다. 최적으로 NME7은 동물이 올바르게 발달할 수 있도록 유도성 프로모터 상에 놓여 있다. 대안으로, 전이 동물 모델, 바람직하게는 설치류는 인간 NME 또는 인간 NME7 또는 NME7-AB를 발현하는 형질전환 동물을 제조함으로써 제조된다. 대안적으로, 동물은 2i 또는 5i에 의해 억제된 키나아제가 유도성 프로모터를 통해 억제되거나, 키나아제를 억제하는 제제가 시험 동물에 투여된 형질전환 동물이다. 전이 동물 모델은 암 발달에 대한 화합물, 생물학적 제제, 약물 등의 효과를 시험할뿐만 아니라 암의 발달 또는 진행의 기초 과학을 연구하는데 사용된다.
인간 조직을 발현하는 동물의 생성
인간 NME1, 박테리아 NME1 또는 인간 NME7, 바람직하게는 NME7-AB를 위한 동물 형질전환이 줄기 세포 또는 전구 세포 또는 초기 중배엽 세포일 수 있는 인간 세포로 이식되거나 접목되는 다른 응용예가 고려되고 있다. 예를 들어 어떤 경우에는 마우스, 돼지, 양, 소 동물 및 영장류와 같이, 심장, 간, 피부 또는 다른 장기에서 인간의 조직을 성장시킬 동물을 생성하는 것이 바람직하다.
그렇게 하기 위한 한 가지 방법은 인간 NME7 또는 인간 NME7-AB를 발현하도록 만든 동물에 인간 줄기 세포를 이식하여 일종의 키메라 동물을 생성하는 것이다. 인간 줄기 세포 또는 전구 세포는 생체외 및 생체내를 포함하여, 발달 중 배반포, 배아 또는 태아 단계에서 동물 발달의 다양한 단계에 이식될 수 있다. NME7이 분화를 억제하기 때문에, NME7 또는 NME7-AB 형질전환 유전자는 그 발현 타이밍을 조절할 수 있는 방법과 관련이 있다. 분화 또는 성숙이 일어나는 것이 바람직한 시간 또는 위치에서 인간 NME7 또는 NME7-AB의 발현이 턴 오프 또는 감소되도록 사용될 수 있는 방법은 당업자에게 공지되어있다. 형질전환 유전자, 바람직하게는 NME7을 유도성 또는 억제성으로 만드는 한가지 방법은 발달 후기에 오로지 발현되는 유전자의 발현에, 그의 발현 또는 억제를 연결시키는 것이다. 상기 경우, NME7 또는 NME7-AB의 발현이 심장 또는 심장 전구 세포에서 발현되는 후기 유전자의 발현에 연결되는 형질전환 동물을 제조하게 된다. 따라서, NME7의 발현 또는 발현 타이밍은 포유동물에 의해 자연적으로 발현될 수 있는 또다른 유전자의 발현에 의해 조절된다. 예를 들어, NME7 또는 NME7 변이체가 심장과 같은 특정 조직에서 발현되는 것이 바람직할 수 있다. NME7에 대한 유전자는 MHC와 같은, 심장에서 발현된 단백질의 발현과 동작가능하게 연결되어있다. 이 경우, NME7의 발현은 MHC 유전자 산물이 발현될 때 또는 발현되는 곳에서 감소되거나 턴 오프된다. 마찬가지로, 인간 NME1, NME6 또는 NME7의 발현이 그의 발현 위치 및 타이밍이 예를 들어 전립선 특이적 단백질의 발현에 의해 조절되도록 전립선에서 턴 온되기를 원할 수 있다. 유사하게, 비-인간 포유동물에서의 인간 NME1 또는 NME7의 발현은 유방 조직에서 발현된 유전자에 의해 조절될 수 있다. 예를 들어, 형질전환 마우스에서, 인간 NME1 또는 인간 NME7은 프롤락틴 프로모터 또는 유사한 유전자에 의해 발현 또는 억제될 수 있다.
이러한 방식으로, 인간 NME7 또는 NME7-AB에 대해 형질전환인 동물은 한 지점까지 성장된 다음, 인간 줄기 또는 전구 세포가 이식될 수 있으며, 여기에서 인간 NME 단백질과의 접촉으로 인해 증식된다. 그 다음, 인간 NME의 발현은 턴 오프되어, 동물의 특정 장기 또는 장기의 일부가 인간 조직으로서 발달된다.
다른 측면에서, 인간에 대해 가까운 전반적인 서열 동일성을 공유하는 임의의 동물 또는 영장류는 종간 상호작용이 발생할 수 있고 따라서 윤리적인 문제가 발생할 수 있으므로 좋은 숙주 동물 후보가 아닐 수도 있다고 고려된다.
본 발명은 인간 NME1, 박테리아 NME1 또는 인간 NME7 또는 NME7-AB에 대해 형질전환된 동물의 많은 응용을 고려한다. 본 발명의 일 양태에서, 인간 줄기 세포 또는 전구 세포는 NME 형질전환 동물 또는 형질전환 동물이 될 생식 세포에 이식된다. NME의 발현은 유도성 또는 억제성일 수 있다. 줄기 세포 또는 전구 세포의 이식 부위와 시기에 따라 최종 수득된 동물은 인간의 심장, 간, 신경 세포 또는 피부를 발현시킬 수 있다.
따라서, 인간 조직은 형질전환 비-인간 포유동물에서 생성될 수 있으며, 포유동물은 생식 세포 또는 체세포에서 인간 MUC1 또는 MUC1* 또는 NME 단백질을 발현하며, 생식 세포 또는 체세포는 재조합 인간 MUC1 또는 MUC1* 또는, 상기 포유동물에 도입된 NME 유전자 서열을 함유하며, 상기 유전자 서열의 발현은 외부 조성물의 도입에 의해, 또는 그의 발현 또는 억제를 숙주 동물의 자연 발생 유전자의 발현 또는 억제에 연결함으로써 유도 또는 억제될 수 있다. 비-인간 포유동물에 대하여 기원이 이질성인 줄기 세포 또는 전구 세포는 형질전환 동물에게 전달되어, 줄기 세포 또는 전구 세포를 증식시키기 위해 유전자가 발현되도록 유도된 다음 이종이식된 줄기 세포로부터 조직을 생성하도록 유전자 발현을 억제한다. 형질전환 유전자의 억제가 수행되는 한 가지 방법은 줄기 세포 또는 전구 세포를 조직 분화 인자와 접촉시키는 것이다. 형질전환 유전자의 억제는 또한 자연적으로 생성된 숙주 조직 분화 인자에 대한 반응으로 포유동물에서 자연적으로 수행된다.
상기 동물은 약물 발견을 위해 사용될 수 있다. 또한 동물을 사용하여 인간 조직 또는 인간 조직의 발달에 대한 화합물, 생물학적 제제 또는 약물의 효과를 측정하는 독성 시험을 위해 사용될 수 있다. 대안적으로, 인간 줄기 세포 또는 전구 세포가 이식된 형질전환 동물은 인간 환자에게 이식하기 위한 인간 조직을 성장시키는데 사용된다. 어떤 경우에는, 이식된 줄기 세포 또는 전구 세포는 형질전환 동물로부터 수확된 인간 조직의 수혜자가 될 환자로부터 유래한 것이다.
일 양태에서, MUC1, MUC1* 또는 NME 단백질 발현은 전달된 줄기 세포 또는 전구 세포의 양이 충분히 많아질 때까지 유도될 수 있다. MUC1, MUC1* 또는 NME 단백질 발현을 억제하는 물질을 숙주 포유동물에 주사함으로써 MUC1, MUC1* 또는 NME 단백질 발현이 정지될 수 있다. 줄기 세포 또는 전구 세포의 집단은 특정 조직 또는 장기 유형에 대한 분화 유도 인자의 마우스에서의 발현과 같은 자연적 방법에 의해 분화되도록 유도될 수 있으며, 또는 화학 물질 또는 단백질 물질이 줄기 세포 또는 전구 세포 전이의 부위에 숙주에 주사되어, 원하는 조직 유형으로 분화되도록 할 수 있다.
내배엽 세포 조직에 대한 유도, 분화/형질전환 제제는 하기 세포 유형: 간, 폐, 췌장, 갑상선 및 장 세포에 대한 하기 제제: 간세포 성장 인자, 온코스타틴-M, 표피 성장 인자, 섬유아세포 성장 인자-4, 염기성-섬유아세포 성장 인자, 인슐린, 트랜스페린, 셀렌산(selenius acid), BSA, 리놀레산, 아스코르베이트 2-포스페이트, VEGF 및 덱사메타손을 포함할 수 있지만, 이에 한정되지 않는다.
중배엽 조직을 위한 유도, 분화/형질전환 제제는 하기 세포 유형: 연골, 뼈, 지방, 근육 및 혈액 세포에 대한 하기 제제: 인슐린, 트랜스페린, 셀레노우스 산(selenous acid), BSA, 리놀레산, TGF-β1, TGF-β3, 아스코르베이트 2-포스페이트, 덱사메타손, β-글리세로포스페이트, 아스코르베이트 2-포스페이트, BMP 및 인도메타신을 포함하지만, 이에 한정되지 않는다.
외배엽 조직을 위한 유도, 분화/형질전환 제제는 하기 세포 유형: 신경 세포, 피부 세포, 뇌 세포 및 눈 세포에 대한 하기 제제: 디부티릴 사이클린 AMP, 이소부틸 메틸크산틴, 인간 상피 성장 인자, 기본 섬유아세포 성장 인자, 섬유아세포 성장 인자-8, 뇌-유도된 신경영양성 인자 및/또는 다른 신경영양성 성장 인자를 포함하지만, 이에 한정되지 않는다.
NME 단백질의 조절 인자 또는 NME 단백질의 다운스트림 효과기는 NME 단백질을 대체할 수 있다
본 연구들은 NME 단백질이 줄기-유사 또는 암-유사 성장을 촉진시키는 기능을 하는 한 가지 방법은 본 명세서에서 MUC1*으로 지칭되는, 주로 PSMGFR 서열로 구성된 MUC1 막관통 단백질의 절단된 형태에 결합시키는 것임을 보여준다. MUC1* 세포외 도메인의 이량화는 체세포, 줄기 세포 및 암세포의 성장 및 탈 분화를 자극하여 이들을 보다 전이성으로 만든다.
NME 단백질이 그 효과를 발휘하는 또다른 방법은 다른 유전자를 자극하거나 억제하기 위해 직접 또는 간접적으로 기능하는 핵으로 수송되는 것이다. OCT4와 SOX2가 MUC1과 그의 절단 효소 MMP16의 프로모터 부위에 결합한다는 것이 이전에 보고된 바있다(Boyer et al, 2005). 같은 연구에서 SOX2와 NANOG가 NME7의 프로모터 부위에 결합한다고 보고했다. 본 발명자들은 이 실험을 토대로 상기 '야마나카' 다능성 인자(Takahashi and Yamanaka, 2006)가 MUC1, 그의 절단 효소 MMP16 및 그의 활성화 리간드 NME7을 상향 조절한다고 결론짓는다. BRD4가 NME7을 억제하는 반면, 그의 공동-인자 JMJD6은 NME1(Thompson et al)을 상향 조절하는 것으로 이전에 보고된 바 있으며, 본 발명자들이 입증한 것은 배아 발생에서 NME7보다 늦게 발현되는 자가-조절 줄기 세포 성장 인자이다. 또다른 연구원들은 최근에 Mbd3 또는 Chd4의 siRNA 억제가 iPS 생성에 대한 저항성을 크게 감소시켰으며(Rais Y et al., 2013 et al.), 줄기 세포를 나이브 상태에서 유지할 수 있다고 보고했다. 여기에 제시된 증거는 NME7이 BRD4 및 JMJD6을 억제하면서 다능성 Mbd3 및 CHD4의 억제제를 억제하는 상호간의 피드백 고리가 있다는 것을 보여준다. 본 발명자들은 나이브 인간 줄기 세포에서 BRD4, JMJD6, Mbd3 및 CHD4의 4가지 인자가 후기의 '프라임드' 줄기 세포에서의 발현과 비교하여 억제되어 있음을 주목했다. 본 발명자들은 또한 마우스 프라임드 줄기 세포를 나이브 상태로 되돌리는 2i 억제제(Gsk3β 및 MEK의 억제제)가 또한, 동일한 4가지 인자 BRD4, JMJD6, Mbd3 및 CHD4를 하향조절한다는 것을 주목한다.
본 발명자들은 또한 NME7이 SOX2(> 150X), NANOG(~ 10X), OCT4(~ 50X), KLF4(4X) 및 MUC1(10X)를 상향 조절한다는 것을 발견했다. 중요하게는, 본 발명자들은 NME7이 CXCR4(~200X)와 E-캐드헤린(CDH1)을 포함한 암 줄기 세포 마커를 상향 조절한다는 것을 나타냈다. 이 여러 증거들은 NME7이 가장 초기의 줄기 세포 성장과 다능성 매개체라는 결론을 내리고, 체세포를 암 상태로 형질전환시키는 것뿐만 아니라 암세포를 보다 전이성 있는 암 줄기 세포로 전환시키는 강력한 요소라고 지적한다.
따라서, 본 발명은 NME7의 발현을 증가시키는 유전자 및 유전자 생성물을 NME7에 대해 대체하는 것을 고려한다. 유사하게, 본 발명은 NME7의 다운스트림 효과기를 NME7에 대해 대체하는 것을 고려한다. 예를 들어, 단독으로 또는 조합하여, 본 발명자들이 MBD3, CHD4, BRD4 또는 JMJD6를 억제하는 제제는 MBD3, CHD4, BRD4 또는 JMJD6을 억제하는 것으로 나타난, NMD7에 대해 본원에 기술된 임의의 방법에서 치환될 수 있다.
줄기 세포-기반 장기 및 조직 생성
본 발명은 비-인간 숙주의 DNA 및 인간 공여자 줄기 세포의 DNA로 구성된 키메라 생물 또는 동물을 생성하기 위해, 비-인간 숙주 동물의 결과물 세포 또는 비-인간 동물의 수정란, 배반포 또는 배아를 사용하여 나이브 상태의 인간 줄기 세포를 생성, 유지 또는 증식시키는 방법을 개시한다. 일부 인간 DNA를 포함하는 키메라 종의 사지, 신경, 혈관, 조직, 장기 또는 상기에서 제조되거나, 또는 상기로부터 분비된 인자는 인간에게 이식되거나, 노화 방지를 포함한 의료적 이익을 위해 인간에게 투여되거나, 및 약물 검사 및 질병 모델링을 포함한 과학 실험을 포함한 여러 용도를 위해 수확될 수 있다.
제1 방법에서, NME 계통의 단백질 또는, MUC1* 성장 인자 수용체를 이량화시키는 제제와 인간 프라임드 상태 줄기 세포를 접촉시킴으로써 인간 나이브 상태 줄기 세포가 생성, 유지 또는 증식된다.
제2 방법에서, 예컨대 iPS 기술의 사용을 통해 체세포가 덜 성숙한 상태로 복귀하도록 유도함으로써 인간 나이브 상태 줄기 세포가 생성, 유지 또는 증식되며, 여기에서 세포는 NME 계통의 단백질, 또는 MUC1* 성장 인자 수용체를 이량화하는 제제의 존재하에 재프로그래밍된다.
제3 방법에서, NME 계통의 단백질, 또는 MUC1* 성장 인자 수용체를 이량화하는 제제의 존재하에 인간 배아, 배반포 또는 수정란으로부터 수득한 세포를 배양함으로써, 인간 나이브 상태 줄기 세포가 생성, 유지 또는 증식된다.
상기 NME 단백질, 또는 MUC1*을 이량화하는 제제는 인간 프라임드 상태 줄기 세포를 나이브 상태로 전환시킨다. 상기 NME 단백질, 또는 MUC1*을 이량화하는 제제는 또한 인간 배아에서 채취한 세포로부터의 나이브 상태 배아 줄기 세포주의 유도를 지원한다. 상기 NME 단백질, 또는 MUC1*을 이량화하는 제제는 나이브 상태 유도된 다능성 줄기 세포주의 생성을 지원하며, 여기에서 분화된 세포가 줄기 세포 상태로 재프로그래밍된다.
바람직한 구현예에서, NME 계통의 단백질은 NME7이다. 보다 더 바람직한 구현예에서, NME 계통의 구성원은 NME7-AB 또는 NME7-X1 또는 다른 이소형태 또는 NME7의 절단물이다. 또다른 구현예에서, NME 계통의 구성원은 NME1로도 알려진 이량체 NM23이다. 또다른 구현예에서, NME 계통의 구성원은 NME6이다. 바람직한 구현예에서, MUC1*를 이량화하는 제제는 MUC1* 세포외 도메인의 PSMGFR 펩타이드에 결합하는 항체이다.
본 발명의 일 양태에서, 인간 세포를 NME1 이량체, NME6 이량체, NME7, NME7-AB 또는 NME7-X1과 접촉시킨 후, 상기 세포를 비-인간 동물의 상실배, 배반포, 배아 또는 태아에 삽입 또는 주입하는 단계를 포함하는 방법에 의해 나이브 상태 인간 줄기 세포가 생성된다. 적어도 부분적으로 인간 기원이고 배반포 또는 배아에 삽입된 인간 줄기 세포로부터 유래된 일부 조직, 장기 또는 기타 신체 부위를 갖는 키메라 동물이 생성된다. 조직, 장기 또는 기타 신체 부위는 완전히 발달되었을때 또는 발달의 임의의 초기 단계에서 숙주 동물로부터 수확된다. 상기 인체 부분에 의해 생성된 조직, 장기 또는 신체 부위 또는 인자는 새로운 장기를 필요로 하거나 또는 숙주 비-인간의 인간 조직 또는 장기에 의해 분비된 인자의 재생 특성을 필요로 하는 인간 수혜자에게 이식되거나 투여된다.
본 발명의 일 양태에서, 비-인간 동물의 세포는 유전적으로 변형되었거나, 예를 들어, 생화학적 억제제로 처리되어, 비-인간 동물의 발달이 특정 조직 또는 장기를 생성할 수 없다. 이러한 양태에서, 키메라 동물은 인간 공여자 줄기 세포로부터 유출되거나 인간 공여자 줄기 세포로부터 현저하게 기여하는 특정 조직 또는 장기를 생성하며 부분적으로 또는 전체적으로 인간일 것이다.
본 발명의 일 양태에서, 공여자 줄기 세포는 비-인간 동물에서 생성된 조직 또는 장기를 필요로 하는 공여자로부터의 것이고, 발달의 일부 단계에서 또는 동물이 성숙한 후, 조직 또는 장기가 수확되어, 공여자 인간에게 이식한다. 본 발명의 다른 양태에서, 상기 공여자 줄기 세포는 상기 키메라 종에서 생성된 조직, 장기 또는 기타 물질의 의도된 수혜자가 아닌 공여자로부터 유래된다. 일 양태에서, 공여자 줄기 세포는 iPS 세포이고, 또다른 양태에서 줄기 세포는 배아 줄기 세포이다.
본 발명의 일 양태에서, 줄기 세포는 NME 단백질을 함유하는 배지에서 배양된다. NME 단백질은 이량체 NME1, 이량체 NME6, NME7, NME7의 이량체 B 도메인, NME7-X1 또는 NME7-AB일 수 있다. 바람직한 구현예에서, NME 단백질은 이량체 NME1이다.
보다 바람직한 구현예에서, NME 단백질은 NME7-X1이다. 보다더 바람직한 구현예에서, NME 단백질은 NME7-AB이다. 일부 경우, PSMGFR 서열의 적어도 15개의 연속적인 아미노산을 포함하는 펩타이드에 결합하는 능력을 갖는 항-MUC1* 항체로 상기 표면을 코팅함으로써 표면에 대한 줄기 세포 부착이 촉진된다. 또다른 경우에, 표면에 대한 줄기 세포 부착은 NME 단백질로 상기 표면을 코팅함으로써 촉진되며, 일부 경우에는 히스티딘-표지되고, 금속-킬레이트-금속 모이어티, 예컨대 니트릴-트리-아세트산-니켈, 일명 NTA-Ni++을 나타내는 표면 상에 코팅될 수 있다. 다른 예에서, 표면에 대한 줄기 세포 부착은 상기 표면을 인테그린 또는 인테그린 단편으로 코팅함으로써 촉진되며, 여기서 인테그린은 비트로넥틴, 피브리넥틴, 콜라겐 등이다. 다른 경우, 표면에 대한 줄기 세포 부착은 상기 표면을 펩타이드, 소분자 또는 중합체로 코팅함으로써 촉진된다. 어떤 경우에는, Rho I 키나아제 억제제가 배양 배지에 첨가되어 표면 부착을 더욱 강화시킨다.
줄기 세포의 생성, 유도 또는 유지는 상기 기술된 방법의 일부 또는 전부에 따라 달성된다. 그러나, 비-인간 줄기 세포의 생성, 유도 또는 유지를 위해, 그의 서열이 비-인간 종의 서열인 NME 단백질과 세포를 접촉시키는 것이 유리할 수 있다. 예를 들어, 다능성을 생성시키거나 유도하거나, 돼지 줄기 세포를 유지하기 위해, 그의 서열이 천연 돼지 NME6, NME1, NME7, NME7-X1 또는 NME7-AB의 서열인 NME 단백질을 사용하는 것이 유리할 수 있다. 표면 부착을 용이하게 하기 위해, MUC1* 세포외 도메인의 PSMGFR 영역의 적어도 15개의 인접한 아미노산을 포함하는 펩타이드에 결합하는 능력을 위해 선택된 항체로 표면을 코팅하는 것이 유리할 수 있으며, 상기 펩타이드의 서열은 돼지 MUC1* 세포외 도메인의 천연 서열이다.
실시예
실시예 1
최소 배지
무혈청 최소 배지 500 mL는 하기 성분을 포함한다:
394mL DMEM/F12, 글루타맥스(GlutaMAX); 100 mL Knockout™ 혈청 대체; 5.0 mL 100x MEM 비-필수 아미노산 용액;
0.9 ㎖ β-머캅토에탄올, 55 mM 스톡.
rho 키나아제 억제제, "Ri" 또는 "ROCi"가 첨가될 때, Stemgent(Cambridge, MA)로부터의 Y27632가 사용 직전에 첨가되어 최종 농도가 10μM이 되었다.
실시예 2
NME 배지에서 줄기 세포를 배양한다.
실시예 1에 기술된 무혈청 최소 배지에, 하기 NME 단백질 중 하나: 바람직하게는 안정한 이량체를 보장하기 위한 S120G 돌연변이를 갖는 8nM(최종 농도)의 이량성 rhNME1(일명, NM23), 8nM 이량성 NME6, 8nM 박테리아 HSP593 재조합 NME1, 4nM NME7AB 또는 4nM NME7-X1을 첨가한다. 줄기 세포는 NME 배지의 현탁액에서 또는 세포 배양 플레이트 상에서 배양될 수 있다. 줄기 세포가 MN-C3과 같은 항-MUC1* 항체로 코팅된 세포 배양 플레이트 상에서 배양되는 경우, Y-26732와 같은 Rho 키나제 억제제가 10uM의 최종농도로 첨가된다.
줄기 세포를 플레이팅하기 적어도 1일 전에 세포 배양 플레이트를 제조하였다. ~12.5 ug/mL의 MN-C3 항-MUC1* 항체를 함유하는 용액으로 세포 배양 플레이트를 코팅하였다. 코팅된 플레이트를 4도에서 하룻밤 동안 배양한 후, 줄기 세포를 사전-세척 단계없이 그들 위에 플레이팅하였다. 줄기 세포는 6-웰 플레이트의 웰당 100,000개 내지 300,000개의 세포를 플레이팅할 때 얻어지는 밀도에 대체로 상응하는 밀도로 플레이팅되었다. Rho 키나아제 억제제가 첨가된 NME 배지에 세포를 현탁한다. 세포를 5% CO2/5% O2 배양기에서 48시간 동안 그대로 배양하였다. 그 후, 세포가 ~80%의 컨플루언시(confluency)에 도달할 때까지 매 24 또는 48시간마다 배지를 교환했다(도 20B). 트립신/EDTA 또는 TryplE를 사용하여 세포를 단일 세포로 해리시켰다. 시작부터 확장하기까지 프로세스를 반복한다.
실시예 3
NME 배지에서의 iPS 생성
-2일(재프로그래밍 전 48시간): 섬유아세포 배지(글루타민, 10% FBS가 함유된 DMEM 고 글루코스) 2ml/웰의 표준 조직 배양-처리된 6-웰 플레이트 상에 섬유아세포를 웰 당 25,000-100,000개의 세포로 시딩하였다. 5% CO2에서 48시간동안 배양한다.
0일: 섬유아세포 배지를 NME 배지로 변경하였다(실시예 2). 표준 프로토콜에 따라 야마나카 인자 또는 톰슨 인자와 같은 마스터 재프로그래밍 인자로 섬유아세포를 형질도입하였다. 원하는 경우, OCT4, SOX2, NANOG 또는 KLF4 및 c-Myc의 발현을 일으키는 핵산을 도입하는 임의의 방법으로 충분할 것이다.
일반적인 방법은 렌티(lenti) 바이러스, 센다이(Sendai) 바이러스, 감마 레트로바이러스 또는 잠자는 미녀(Sleeping Beauty)와 같은 트랜스포손과 같은 비-통합 바이러스 전달 시스템을 사용한다.
1일째: 세포를 최소 배지로 세척하여 바이러스 및 세포 파편을 제거한 후, Rho 키나아제 억제제없이 NME 배지 웰 당 2 mL-4 mL로 대체하였다.
3일째: Rho 키나아제 억제제없이, NME 배지의 웰 당 2 mL-4 mL로 배지를 교환한다.
5일째: Rho 키나아제 억제제없이, NME 배지의 웰 당 2 mL-4 mL로 배지를 교환한다.
6일째: 3.25ug/mL 내지 24ug/mL의 농도(약 12.5ug/mL이 바람직함)로 세포 배양 플레이트 상에 코팅된 MN-C3과 같은 항-MUC1* 항체를 사용하여 세포 배양 플레이트를 제조하고, 항체 코팅된 플레이트 4℃에서 하룻밤 배양한다.
7일째: 이 시기까지 줄기 세포 형태로 변화하는 형질도입 세포를 트립신/EDTA로 해리시키고, 세포 스트레이너(cell strainer)를 통과시킨 후, NME 배지와 Rho 키나아제 억제제(예컨대, 10uM Y-26732)의 MN-C3 코팅된 플레이트 상에 시딩하였다. 재프로그래밍된 세포를 웰 당 5×104 - 1×105로 플레이팅하였다. 이 시점 이후에, 세포를 10uM Y-26732와 같은 Rho 키나아제 억제제가 첨가된 NME 배지에서 배양하고 5% CO2/5% 02에서 첫 48시간동안 손대지않고 그대로 배양하였다.
9일 이후: 10uM Y-26732와 같은 Rho 키나아제 억제제를 통해 동일한 NME 배지를 사용하여 배지를 매일 교체한다.
16일째-21일째: 콜로니를 골라낸 후, 각 클론을 MN-C3로 코팅한 표면에서 첫째로 96-웰 플레이트에서, 그후 24-웰, 12-웰, 6-웰 및 대형 포맷에서 배양한 다음 줄기 세포를 특성화하고, 모든 정상 다능성 유전자, 나이브 유전자를 발현하고, 동물에 이식되고 정상 핵형을 가질 때 기형종을 형성한다는 것이 밝혀졌다. 또한 1일 이후와 동일한 과정을 사용하여 혈액으로부터 iPS 세포가 생성되었다.
도 21의 21A, 21B 및 21C에 도시된 세포에서 신생아 수컷 섬유아세포를 사용하였다. 도 21C에서, 사용된 NME 배지는 4nM NME7-AB를 갖는 최소 배지였다.
실시예 4
*마스터 다능성 조절인자 OCT4, SOX2, KLF4 또는 c-Myc의 부재하에 NME 단백질의 재프로그래밍 능력.
본 실시예에서, 섬유아세포 세포는 재조합 인간 NME1/NM23 이량체, 박테리아 HSP593 NME1 이량체 또는 인간 재조합 NME7-AB가 첨가된 최소 배지에서 배양하였다. 대조군으로서, 섬유아세포를 500 mL에 대해, 445 mL의 DMEM 고 글루코스 베이스 배지, 5 mL GlutaMAX 및 50 mL의 소태아 혈청(FBS)인, 정상적인 배지에서 배양하였다. NME1/NM23 이량체, 박테리아 HSP593 NME1 이량체 또는 NME7-AB를 갖는 최소 배지에서 15-20일 배양 후, RT-PCR은 결과 세포가 줄기 세포 표지 유전자 OCT4 및 NANOG의 발현을 크게 증가시킨다는 것을 보여 주었으며, 도 1을 참조한다. 암 세포와 마찬가지로, BRD4, JMJD6, MBD3 및 CHD4의 발현도 감소했다. 도 2는 염색질 재배열 인자 BRD4, JMJD6, MBD3 및 CHD4를 코딩하는 유전자의 발현에 대한 RT-PCR 측정의 그래프를 도시한다. 도 3은 염색질 재배열 인자 BRD4, JMJD6, MBD3 및 CHD4 및 NME 단백질을 코딩하는 유전자인 다능성 유전자의 발현에 대한 RT-PCR 측정의 그래프를 도시한다. 여기에서 '마이너스(-)ROCi'는 비-부착성이 되어, 표면에서 떠다니는 세포를 지칭한다. 세포의 형태는 또한 완전히 변화하여, 섬유아세포로 더 이상 인식할 수 없으며, 줄기 세포처럼 보인다(도 8-11).
실시예 5
NME7-AB 배양된 인간 줄기 세포는 마우스 상실배의 내부세포괴로 통합된다. 마우스 난은 체외에서 수정되었다. 수정 후 2.5일째에, NME7-AB에서 생성되고 배양된 10개의 인간 줄기 세포가 수정란에 개별적으로 주입되었다. 2.5일은 내부세포괴가 형성되기 전이다. 48시간 후, 4.5일에, 인간의 Tra 1-81을 염색하는 형광 항체로 상실배를 염색하였다. 일부 도면에서 화살표는 키메라 동물의 발달을 나타내는, 내부세포괴에 혼입된 인간 나이브 NME7-AB 세포를 가리킨다. 도 22의 22A-22D, 도 23의 23A-23J 및 도 24의 24A-24J는 인간 NME7-나이브 세포가 2.5일에 주사된 다른 마우스 배반포의 공초점 이미지를 보여주며, 또한 4.5일 배반포의 내부세포괴로의 통합을 나타낸다. 또한, 도 27의 27A-27F, 도 28의 28A-26J, 도 29의 29A-29J 및 도 30의 30A-30J를 참조하면, 마우스 상실배에 2.5일에 주사된 인간 NME7-AB 배양된 나이브 줄기 세포를 나타내며, 4.5일에 48시간후 배반포의 내부세포괴에 집중되는 것으로 밝혀졌다. 대조군으로서, FGF-성장된 프라임드 상태 인간 줄기 세포를 2.5일째에 수정란에 주사하고, 4.5일째에 항-인간 Tra 1-81로 염색하고, 및 영양외배엽이라 불리는 비-내부세포괴 영역을 염색하는 CDX2로 염색하였다. 도 25의 25A-25D 및 도 26의 26A-26H는 상기 프라임드 상태 줄기 세포가 내부세포괴로 통합되지는 않았지만, 영양외배엽에 있음을 보여준다.
실시예 6
NME7-AB 배양된 인간 줄기 세포를 토마토 레드(tomato red) 또는 TDtomato라고 불리는 적색 형광체로 형질감염시켰다. 그후, 상기 형광 인간 나이브 세포를 2.5일 마우스 수정란에 주입하고 4.5일에 영상화하였다. 상실배를 또한 DAPI, 및 영양외배엽을 염색하는 형광 항체로 염색하였다. 도 27의 27A-27F, 도 28의 28A-26J, 도 29의 29A-29J, 및 도 30의 30A-30J는 마우스 상실배 내로 2.5일째에 주사된 인간 NME7-AB 배양된 나이브 줄기 세포를 나타내며, 4.5일째에 48시간 후 배반포의 내부세포괴에 농축되어있음이 밝혀졌다. 화살표는 인간 세포가 내부세포괴로 통합되어 키메라 동물이 형성되었음을 나타낸다.
실시예 7
비-인간 영장류 종 줄기 세포는 bFGF의 부재하에 NME7-AB 배지에서 생성되었다. 붉은털 원숭이 및 필리핀 원숭이 섬유아세포는 NME7-AB를 함유하는 배지에서, 및 bFGF 또는 피더 세포의 부재하에, 코어 다능성 인자로 형질감염시켰다. 이 경우 야마나카 인자 Oct4, Sox2, Klf4 및 c-Myc가 사용되었지만, 유전자 또는 유전자 산물과 같은 다른 다능성 인자로 대체될 수 있었다. 유전자 형질감염후, 5일 내지 7일 사이에, 세포가 표면에서 분리되기 시작했을 때, 세포를 항-MUC1* 항체(이 경우 MN-C3)로 코팅된 표면 상에 재-플레이팅하였다. 필리핀 원숭이에 대해 6일 및 붉은털 원숭이에 대해 14일에 시작하여, 콜로니가 나타나기 시작했다. 도 31의 31A-31F는 야마나카 다능성 인자 OCT4, SOX2, NANOG 및 c-Myc의 형질도입없이 6일동안 NME7-AB에서 배양된 필리핀 원숭이로부터의 섬유아세포를 함유하는 대조군 플레이트의 사진이다. 도 32의 32A-32C, 도 33의 33A-33F 및 도 34의 34A-34F는 야마나카 인자 및 NME7-AB에 의해 재프로그래밍된 필리핀 원숭이로부터의 섬유아세포를 나타낸다. 6일 이후, 신생하는 iPS 콜로니를 항-MUC1* 항체 표면으로 옮기고, 각 클론이 채취되어 확장될 때 약 14-17일까지 계속 확장된다. 우리가 아는 한, 이것은 과학자들이 마우스 또는 인간 피더 세포의 부재하에 비-인간 영장류 iPS 세포를 생성하는데 성공한 최초의 사례이다. 연구원들은 비-인간 영장류 줄기 세포를 배양하는데 극도의 어려움을 겪고 있다. 그들은 자발적으로 분화하며, FGF-기반의 배지에서 잘 자라지 않는다. 도 35의 35A-35D, 도 36의 36A-36D, 도 37의 37A-37B 및 도 38의 38A-38H에 도시된 바와 같이, 비-인간 영장류 세포를 NME7-AB 배지로 옮길 때 이러한 모든 문제를 극복했다. MN-C3 항체 표면 또는 MEF 상에서, 무혈청, FGF-없는 NME7-AB 배지에서의 야마나카 인자 또는 톰슨 인자의 형질도입에 의한 붉은털 원숭이 iPS 세포의 생성은 도 39의 39A-39C, 도 40의 40A-40C, 도 41의 41A-41D 및 도 42의 42A-42B에 다양한 단계로 도시되어 있다. 섬유아세포가 MN-C2 항체 표면에서 또는 MEF 상에서 재프로그래밍되었는지는 중요하지 않았지만, 표면이 항-MUC1* 항체 표면일 때 더 많은 콜로니가 생성되었다.
실시예 8
영장류 종 배아 줄기 세포가 증식하여, NME7-AB 배지에서 유지된다. 콜로니를 채취한 후, MN-C3 항체 코팅 표면 또는 MEF 상에 다시 플레이팅하고, NME7-AB를 함유하는 무혈청 배지에서 2nM 내지 32nM의 농도로 무한히 연속적으로 계대 배양할 수 있었으며, 여기에서 4nM에서 최상으로 작업하였다. 도 43의 43A-43E, 도 44의 44A-44F, 도 45의 45A-45H, 도 46의 46A-46H, 도 47의 47A-47G 및 도 48의 48A-48D를 참조한다.
본원에 인용된 모든 문헌은 그 전체가 참고문헌으로 인용된다.
참고문헌 목록
<110> MINERVA BIOTECHNOLOGIES CORPORATION
BAMDAD, Cynthia
CARTER, Mark
STEWART, Andrew
SMAGGHE, Benoit
<120> METHOD OF STEM CELL-BASED ORGAN AND TISSUE GENERATION
<130> 13150-70139PCT
<160> 120
<170> PatentIn version 3.5
<210> 1
<211> 1255
<212> PRT
<213> Artificial Sequence
<220>
<223> full-length MUC1 Receptor
<400> 1
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His
50 55 60
Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu
65 70 75 80
Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln
85 90 95
Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr
100 105 110
Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro
115 120 125
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
130 135 140
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
145 150 155 160
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
165 170 175
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
180 185 190
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
195 200 205
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
210 215 220
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
225 230 235 240
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
245 250 255
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
260 265 270
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
275 280 285
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
290 295 300
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
305 310 315 320
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
325 330 335
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
340 345 350
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
355 360 365
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
370 375 380
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
385 390 395 400
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
405 410 415
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
420 425 430
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
435 440 445
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
450 455 460
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
465 470 475 480
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
485 490 495
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
500 505 510
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
515 520 525
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
530 535 540
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
545 550 555 560
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
565 570 575
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
580 585 590
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
595 600 605
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
610 615 620
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
625 630 635 640
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
645 650 655
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
660 665 670
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
675 680 685
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
690 695 700
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
705 710 715 720
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
725 730 735
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
740 745 750
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
755 760 765
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
770 775 780
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
785 790 795 800
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
805 810 815
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
820 825 830
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
835 840 845
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr
850 855 860
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
865 870 875 880
Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His
885 890 895
Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala
900 905 910
Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro
915 920 925
Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Asn
930 935 940
Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser
945 950 955 960
Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly
965 970 975
Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe
980 985 990
Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His
995 1000 1005
Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro
1010 1015 1020
Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val
1025 1030 1035 1040
Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser
1045 1050 1055
Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp
1060 1065 1070
Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly
1075 1080 1085
Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr
1090 1095 1100
Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln
1105 1110 1115 1120
Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile
1125 1130 1135
Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser
1140 1145 1150
Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys
1155 1160 1165
Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys
1170 1175 1180
Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg
1185 1190 1195 1200
Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly
1205 1210 1215
Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val
1220 1225 1230
Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val
1235 1240 1245
Ala Ala Ala Ser Ala Asn Leu
1250 1255
<210> 2
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> N-terminal MUC-1 signaling sequence
<400> 2
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr
<210> 3
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> N-terminal MUC-1 signaling sequence
<400> 3
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Ala
20
<210> 4
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> N-terminal MUC-1 signaling sequence
<400> 4
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly
20
<210> 5
<211> 146
<212> PRT
<213> Artificial Sequence
<220>
<223> truncated MUC1 receptor isoform
<400> 5
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys
1 5 10 15
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val
20 25 30
Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro
35 40 45
Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu
50 55 60
Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg Lys
65 70 75 80
Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp Thr Tyr His Pro
85 90 95
Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg Tyr Val Pro Pro
100 105 110
Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser Ala Gly Asn Gly
115 120 125
Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Ala Ala Ala Ser Ala
130 135 140
Asn Leu
145
<210> 6
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> extracellular domain of Native Primary Sequence
<400> 6
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys
1 5 10 15
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val
20 25 30
Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
35 40 45
<210> 7
<211> 44
<212> PRT
<213> Artificial Sequence
<220>
<223> extracellular domain of Native Primary Sequence
<400> 7
Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr
1 5 10 15
Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser
20 25 30
Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
35 40
<210> 8
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> extracellular domain of "SPY" functional variant
<400> 8
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys
1 5 10 15
Thr Glu Ala Ala Ser Pro Tyr Asn Leu Thr Ile Ser Asp Val Ser Val
20 25 30
Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
35 40 45
<210> 9
<211> 44
<212> PRT
<213> Artificial Sequence
<220>
<223> extracellular domain of "SPY" functional variant
<400> 9
Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr
1 5 10 15
Glu Ala Ala Ser Pro Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser
20 25 30
Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
35 40
<210> 10
<211> 216
<212> DNA
<213> Artificial Sequence
<220>
<223> MUC1 cytoplasmic domain nucleotide sequence
<400> 10
tgtcagtgcc gccgaaagaa ctacgggcag ctggacatct ttccagcccg ggatacctac 60
catcctatga gcgagtaccc cacctaccac acccatgggc gctatgtgcc ccctagcagt 120
accgatcgta gcccctatga gaaggtttct gcaggtaacg gtggcagcag cctctcttac 180
acaaacccag cagtggcagc cgcttctgcc aacttg 216
<210> 11
<211> 72
<212> PRT
<213> Artificial Sequence
<220>
<223> MUC1 cytoplasmic domain amino acid sequence
<400> 11
Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala
1 5 10 15
Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His
20 25 30
Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys
35 40 45
Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala
50 55 60
Val Ala Ala Ala Ser Ala Asn Leu
65 70
<210> 12
<211> 854
<212> DNA
<213> Artificial Sequence
<220>
<223> NME7 nucleotide sequence
<400> 12
gagatcctga gacaatgaat catagtgaaa gattcgtttt cattgcagag tggtatgatc 60
caaatgcttc acttcttcga cgttatgagc ttttatttta cccaggggat ggatctgttg 120
aaatgcatga tgtaaagaat catcgcacct ttttaaagcg gaccaaatat gataacctgc 180
acttggaaga tttatttata ggcaacaaag tgaatgtctt ttctcgacaa ctggtattaa 240
ttgactatgg ggatcaatat acagctcgcc agctgggcag taggaaagaa aaaacgctag 300
ccctaattaa accagatgca atatcaaagg ctggagaaat aattgaaata ataaacaaag 360
ctggatttac tataaccaaa ctcaaaatga tgatgctttc aaggaaagaa gcattggatt 420
ttcatgtaga tcaccagtca agaccctttt tcaatgagct gatccagttt attacaactg 480
gtcctattat tgccatggag attttaagag atgatgctat atgtgaatgg aaaagactgc 540
tgggacctgc aaactctgga gtggcacgca cagatgcttc tgaaagcatt agagccctct 600
ttggaacaga tggcataaga aatgcagcgc atggccctga ttcttttgct tctgcggcca 660
gagaaatgga gttgtttttt ccttcaagtg gaggttgtgg gccggcaaac actgctaaat 720
ttactaattg tacctgttgc attgttaaac cccatgctgt cagtgaaggt atgttgaata 780
cactatattc agtacatttt gttaatagga gagcaatgtt tattttcttg atgtacttta 840
tgtatagaaa ataa 854
<210> 13
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> NME7 amino acid sequence
<400> 13
Asp Pro Glu Thr Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu
1 5 10 15
Trp Tyr Asp Pro Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe
20 25 30
Tyr Pro Gly Asp Gly Ser Val Glu Met His Asp Val Lys Asn His Arg
35 40 45
Thr Phe Leu Lys Arg Thr Lys Tyr Asp Asn Leu His Leu Glu Asp Leu
50 55 60
Phe Ile Gly Asn Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile
65 70 75 80
Asp Tyr Gly Asp Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu
85 90 95
Lys Thr Leu Ala Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu
100 105 110
Ile Ile Glu Ile Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys
115 120 125
Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His
130 135 140
Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly
145 150 155 160
Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp
165 170 175
Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala
180 185 190
Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala
195 200 205
Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu
210 215 220
Phe Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe
225 230 235 240
Thr Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly
245 250 255
Met Leu Asn Thr Leu Tyr Ser Val His Phe Val Asn Arg Arg Ala Met
260 265 270
Phe Ile Phe Leu Met Tyr Phe Met Tyr Arg Lys
275 280
<210> 14
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> NM23-H1 nucleotide sequence
<400> 14
atggtgctac tgtctacttt agggatcgtc tttcaaggcg aggggcctcc tatctcaagc 60
tgtgatacag gaaccatggc caactgtgag cgtaccttca ttgcgatcaa accagatggg 120
gtccagcggg gtcttgtggg agagattatc aagcgttttg agcagaaagg attccgcctt 180
gttggtctga aattcatgca agcttccgaa gatcttctca aggaacacta cgttgacctg 240
aaggaccgtc cattctttgc cggcctggtg aaatacatgc actcagggcc ggtagttgcc 300
atggtctggg aggggctgaa tgtggtgaag acgggccgag tcatgctcgg ggagaccaac 360
cctgcagact ccaagcctgg gaccatccgt ggagacttct gcatacaagt tggcaggaac 420
attatacatg gcagtgattc tgtggagagt gcagagaagg agatcggctt gtggtttcac 480
cctgaggaac tggtagatta cacgagctgt gctcagaact ggatctatga atga 534
<210> 15
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<223> NM23-H1 describes amino acid sequence
<400> 15
Met Val Leu Leu Ser Thr Leu Gly Ile Val Phe Gln Gly Glu Gly Pro
1 5 10 15
Pro Ile Ser Ser Cys Asp Thr Gly Thr Met Ala Asn Cys Glu Arg Thr
20 25 30
Phe Ile Ala Ile Lys Pro Asp Gly Val Gln Arg Gly Leu Val Gly Glu
35 40 45
Ile Ile Lys Arg Phe Glu Gln Lys Gly Phe Arg Leu Val Gly Leu Lys
50 55 60
Phe Met Gln Ala Ser Glu Asp Leu Leu Lys Glu His Tyr Val Asp Leu
65 70 75 80
Lys Asp Arg Pro Phe Phe Ala Gly Leu Val Lys Tyr Met His Ser Gly
85 90 95
Pro Val Val Ala Met Val Trp Glu Gly Leu Asn Val Val Lys Thr Gly
100 105 110
Arg Val Met Leu Gly Glu Thr Asn Pro Ala Asp Ser Lys Pro Gly Thr
115 120 125
Ile Arg Gly Asp Phe Cys Ile Gln Val Gly Arg Asn Ile Ile His Gly
130 135 140
Ser Asp Ser Val Glu Ser Ala Glu Lys Glu Ile Gly Leu Trp Phe His
145 150 155 160
Pro Glu Glu Leu Val Asp Tyr Thr Ser Cys Ala Gln Asn Trp Ile Tyr
165 170 175
Glu
<210> 16
<211> 534
<212> DNA
<213> Artificial Sequence
<220>
<223> NM23-H1 S120G mutant nucleotide sequence
<400> 16
atggtgctac tgtctacttt agggatcgtc tttcaaggcg aggggcctcc tatctcaagc 60
tgtgatacag gaaccatggc caactgtgag cgtaccttca ttgcgatcaa accagatggg 120
gtccagcggg gtcttgtggg agagattatc aagcgttttg agcagaaagg attccgcctt 180
gttggtctga aattcatgca agcttccgaa gatcttctca aggaacacta cgttgacctg 240
aaggaccgtc cattctttgc cggcctggtg aaatacatgc actcagggcc ggtagttgcc 300
atggtctggg aggggctgaa tgtggtgaag acgggccgag tcatgctcgg ggagaccaac 360
cctgcagact ccaagcctgg gaccatccgt ggagacttct gcatacaagt tggcaggaac 420
attatacatg gcggtgattc tgtggagagt gcagagaagg agatcggctt gtggtttcac 480
cctgaggaac tggtagatta cacgagctgt gctcagaact ggatctatga atga 534
<210> 17
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<223> NM23-H1 S120G mutant amino acid sequence
<400> 17
Met Val Leu Leu Ser Thr Leu Gly Ile Val Phe Gln Gly Glu Gly Pro
1 5 10 15
Pro Ile Ser Ser Cys Asp Thr Gly Thr Met Ala Asn Cys Glu Arg Thr
20 25 30
Phe Ile Ala Ile Lys Pro Asp Gly Val Gln Arg Gly Leu Val Gly Glu
35 40 45
Ile Ile Lys Arg Phe Glu Gln Lys Gly Phe Arg Leu Val Gly Leu Lys
50 55 60
Phe Met Gln Ala Ser Glu Asp Leu Leu Lys Glu His Tyr Val Asp Leu
65 70 75 80
Lys Asp Arg Pro Phe Phe Ala Gly Leu Val Lys Tyr Met His Ser Gly
85 90 95
Pro Val Val Ala Met Val Trp Glu Gly Leu Asn Val Val Lys Thr Gly
100 105 110
Arg Val Met Leu Gly Glu Thr Asn Pro Ala Asp Ser Lys Pro Gly Thr
115 120 125
Ile Arg Gly Asp Phe Cys Ile Gln Val Gly Arg Asn Ile Ile His Gly
130 135 140
Gly Asp Ser Val Glu Ser Ala Glu Lys Glu Ile Gly Leu Trp Phe His
145 150 155 160
Pro Glu Glu Leu Val Asp Tyr Thr Ser Cys Ala Gln Asn Trp Ile Tyr
165 170 175
Glu
<210> 18
<211> 459
<212> DNA
<213> Artificial Sequence
<220>
<223> NM23-H2 nucleotide sequence
<400> 18
atggccaacc tggagcgcac cttcatcgcc atcaagccgg acggcgtgca gcgcggcctg 60
gtgggcgaga tcatcaagcg cttcgagcag aagggattcc gcctcgtggc catgaagttc 120
ctccgggcct ctgaagaaca cctgaagcag cactacattg acctgaaaga ccgaccattc 180
ttccctgggc tggtgaagta catgaactca gggccggttg tggccatggt ctgggagggg 240
ctgaacgtgg tgaagacagg ccgagtgatg cttggggaga ccaatccagc agattcaaag 300
ccaggcacca ttcgtgggga cttctgcatt caggttggca ggaacatcat tcatggcagt 360
gattcagtaa aaagtgctga aaaagaaatc agcctatggt ttaagcctga agaactggtt 420
gactacaagt cttgtgctca tgactgggtc tatgaataa 459
<210> 19
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<223> NM23-H2 amino acid sequence
<400> 19
Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val
1 5 10 15
Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly
20 25 30
Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu
35 40 45
Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu
50 55 60
Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Val Trp Glu Gly
65 70 75 80
Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro
85 90 95
Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val
100 105 110
Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Lys Ser Ala Glu Lys
115 120 125
Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Asp Tyr Lys Ser
130 135 140
Cys Ala His Asp Trp Val Tyr Glu
145 150
<210> 20
<211> 1023
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NM23-H7-2 sequence optimized for E. coli expression
<400> 20
atgcatgacg ttaaaaatca ccgtaccttt ctgaaacgca cgaaatatga taatctgcat 60
ctggaagacc tgtttattgg caacaaagtc aatgtgttct ctcgtcagct ggtgctgatc 120
gattatggcg accagtacac cgcgcgtcaa ctgggtagtc gcaaagaaaa aacgctggcc 180
ctgattaaac cggatgcaat ctccaaagct ggcgaaatta tcgaaattat caacaaagcg 240
ggtttcacca tcacgaaact gaaaatgatg atgctgagcc gtaaagaagc cctggatttt 300
catgtcgacc accagtctcg cccgtttttc aatgaactga ttcaattcat caccacgggt 360
ccgattatcg caatggaaat tctgcgtgat gacgctatct gcgaatggaa acgcctgctg 420
ggcccggcaa actcaggtgt tgcgcgtacc gatgccagtg aatccattcg cgctctgttt 480
ggcaccgatg gtatccgtaa tgcagcacat ggtccggact cattcgcatc ggcagctcgt 540
gaaatggaac tgtttttccc gagctctggc ggttgcggtc cggcaaacac cgccaaattt 600
accaattgta cgtgctgtat tgtcaaaccg cacgcagtgt cagaaggcct gctgggtaaa 660
attctgatgg caatccgtga tgctggcttt gaaatctcgg ccatgcagat gttcaacatg 720
gaccgcgtta acgtcgaaga attctacgaa gtttacaaag gcgtggttac cgaatatcac 780
gatatggtta cggaaatgta ctccggtccg tgcgtcgcga tggaaattca gcaaaacaat 840
gccaccaaaa cgtttcgtga attctgtggt ccggcagatc cggaaatcgc acgtcatctg 900
cgtccgggta ccctgcgcgc aatttttggt aaaacgaaaa tccagaacgc tgtgcactgt 960
accgatctgc cggaagacgg tctgctggaa gttcaatact ttttcaaaat tctggataat 1020
tga 1023
<210> 21
<211> 340
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NM23-H7-2 sequence optimized for E. coli expression
<400> 21
Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys Arg Thr Lys Tyr
1 5 10 15
Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn Lys Val Asn Val
20 25 30
Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp Gln Tyr Thr Ala
35 40 45
Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala Leu Ile Lys Pro
50 55 60
Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala
65 70 75 80
Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu Ser Arg Lys Glu
85 90 95
Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro Phe Phe Asn Glu
100 105 110
Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala Met Glu Ile Leu
115 120 125
Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn
130 135 140
Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe
145 150 155 160
Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro Asp Ser Phe Ala
165 170 175
Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser Ser Gly Gly Cys
180 185 190
Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr Cys Cys Ile Val
195 200 205
Lys Pro His Ala Val Ser Glu Gly Leu Leu Gly Lys Ile Leu Met Ala
210 215 220
Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met Gln Met Phe Asn Met
225 230 235 240
Asp Arg Val Asn Val Glu Glu Phe Tyr Glu Val Tyr Lys Gly Val Val
245 250 255
Thr Glu Tyr His Asp Met Val Thr Glu Met Tyr Ser Gly Pro Cys Val
260 265 270
Ala Met Glu Ile Gln Gln Asn Asn Ala Thr Lys Thr Phe Arg Glu Phe
275 280 285
Cys Gly Pro Ala Asp Pro Glu Ile Ala Arg His Leu Arg Pro Gly Thr
290 295 300
Leu Arg Ala Ile Phe Gly Lys Thr Lys Ile Gln Asn Ala Val His Cys
305 310 315 320
Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val Gln Tyr Phe Phe Lys
325 330 335
Ile Leu Asp Asn
340
<210> 22
<211> 399
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-A
<400> 22
atggaaaaaa cgctagccct aattaaacca gatgcaatat caaaggctgg agaaataatt 60
gaaataataa acaaagctgg atttactata accaaactca aaatgatgat gctttcaagg 120
aaagaagcat tggattttca tgtagatcac cagtcaagac cctttttcaa tgagctgatc 180
cagtttatta caactggtcc tattattgcc atggagattt taagagatga tgctatatgt 240
gaatggaaaa gactgctggg acctgcaaac tctggagtgg cacgcacaga tgcttctgaa 300
agcattagag ccctctttgg aacagatggc ataagaaatg cagcgcatgg ccctgattct 360
tttgcttctg cggccagaga aatggagttg tttttttga 399
<210> 23
<211> 132
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-A
<400> 23
Met Glu Lys Thr Leu Ala Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala
1 5 10 15
Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys
20 25 30
Leu Lys Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val
35 40 45
Asp His Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr
50 55 60
Thr Gly Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys
65 70 75 80
Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr
85 90 95
Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg
100 105 110
Asn Ala Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met
115 120 125
Glu Leu Phe Phe
130
<210> 24
<211> 444
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-A1
<400> 24
atggaaaaaa cgctagccct aattaaacca gatgcaatat caaaggctgg agaaataatt 60
gaaataataa acaaagctgg atttactata accaaactca aaatgatgat gctttcaagg 120
aaagaagcat tggattttca tgtagatcac cagtcaagac cctttttcaa tgagctgatc 180
cagtttatta caactggtcc tattattgcc atggagattt taagagatga tgctatatgt 240
gaatggaaaa gactgctggg acctgcaaac tctggagtgg cacgcacaga tgcttctgaa 300
agcattagag ccctctttgg aacagatggc ataagaaatg cagcgcatgg ccctgattct 360
tttgcttctg cggccagaga aatggagttg ttttttcctt caagtggagg ttgtgggccg 420
gcaaacactg ctaaatttac ttga 444
<210> 25
<211> 147
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-A1
<400> 25
Met Glu Lys Thr Leu Ala Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala
1 5 10 15
Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys
20 25 30
Leu Lys Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val
35 40 45
Asp His Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr
50 55 60
Thr Gly Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys
65 70 75 80
Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr
85 90 95
Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg
100 105 110
Asn Ala Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met
115 120 125
Glu Leu Phe Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala
130 135 140
Lys Phe Thr
145
<210> 26
<211> 669
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-A2
<400> 26
atgaatcata gtgaaagatt cgttttcatt gcagagtggt atgatccaaa tgcttcactt 60
cttcgacgtt atgagctttt attttaccca ggggatggat ctgttgaaat gcatgatgta 120
aagaatcatc gcaccttttt aaagcggacc aaatatgata acctgcactt ggaagattta 180
tttataggca acaaagtgaa tgtcttttct cgacaactgg tattaattga ctatggggat 240
caatatacag ctcgccagct gggcagtagg aaagaaaaaa cgctagccct aattaaacca 300
gatgcaatat caaaggctgg agaaataatt gaaataataa acaaagctgg atttactata 360
accaaactca aaatgatgat gctttcaagg aaagaagcat tggattttca tgtagatcac 420
cagtcaagac cctttttcaa tgagctgatc cagtttatta caactggtcc tattattgcc 480
atggagattt taagagatga tgctatatgt gaatggaaaa gactgctggg acctgcaaac 540
tctggagtgg cacgcacaga tgcttctgaa agcattagag ccctctttgg aacagatggc 600
ataagaaatg cagcgcatgg ccctgattct tttgcttctg cggccagaga aatggagttg 660
tttttttga 669
<210> 27
<211> 222
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-A2
<400> 27
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe
210 215 220
<210> 28
<211> 714
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-A3
<400> 28
atgaatcata gtgaaagatt cgttttcatt gcagagtggt atgatccaaa tgcttcactt 60
cttcgacgtt atgagctttt attttaccca ggggatggat ctgttgaaat gcatgatgta 120
aagaatcatc gcaccttttt aaagcggacc aaatatgata acctgcactt ggaagattta 180
tttataggca acaaagtgaa tgtcttttct cgacaactgg tattaattga ctatggggat 240
caatatacag ctcgccagct gggcagtagg aaagaaaaaa cgctagccct aattaaacca 300
gatgcaatat caaaggctgg agaaataatt gaaataataa acaaagctgg atttactata 360
accaaactca aaatgatgat gctttcaagg aaagaagcat tggattttca tgtagatcac 420
cagtcaagac cctttttcaa tgagctgatc cagtttatta caactggtcc tattattgcc 480
atggagattt taagagatga tgctatatgt gaatggaaaa gactgctggg acctgcaaac 540
tctggagtgg cacgcacaga tgcttctgaa agcattagag ccctctttgg aacagatggc 600
ataagaaatg cagcgcatgg ccctgattct tttgcttctg cggccagaga aatggagttg 660
ttttttcctt caagtggagg ttgtgggccg gcaaacactg ctaaatttac ttga 714
<210> 29
<211> 237
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-A3
<400> 29
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr
225 230 235
<210> 30
<211> 408
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-B
<400> 30
atgaattgta cctgttgcat tgttaaaccc catgctgtca gtgaaggact gttgggaaag 60
atcctgatgg ctatccgaga tgcaggtttt gaaatctcag ctatgcagat gttcaatatg 120
gatcgggtta atgttgagga attctatgaa gtttataaag gagtagtgac cgaatatcat 180
gacatggtga cagaaatgta ttctggccct tgtgtagcaa tggagattca acagaataat 240
gctacaaaga catttcgaga attttgtgga cctgctgatc ctgaaattgc ccggcattta 300
cgccctggaa ctctcagagc aatctttggt aaaactaaga tccagaatgc tgttcactgt 360
actgatctgc cagaggatgg cctattagag gttcaatact tcttctga 408
<210> 31
<211> 135
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-B
<400> 31
Met Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly
1 5 10 15
Leu Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile
20 25 30
Ser Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe
35 40 45
Tyr Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr
50 55 60
Glu Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn
65 70 75 80
Ala Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile
85 90 95
Ala Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr
100 105 110
Lys Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu
115 120 125
Leu Glu Val Gln Tyr Phe Phe
130 135
<210> 32
<211> 426
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-B1
<400> 32
atgaattgta cctgttgcat tgttaaaccc catgctgtca gtgaaggact gttgggaaag 60
atcctgatgg ctatccgaga tgcaggtttt gaaatctcag ctatgcagat gttcaatatg 120
gatcgggtta atgttgagga attctatgaa gtttataaag gagtagtgac cgaatatcat 180
gacatggtga cagaaatgta ttctggccct tgtgtagcaa tggagattca acagaataat 240
gctacaaaga catttcgaga attttgtgga cctgctgatc ctgaaattgc ccggcattta 300
cgccctggaa ctctcagagc aatctttggt aaaactaaga tccagaatgc tgttcactgt 360
actgatctgc cagaggatgg cctattagag gttcaatact tcttcaagat cttggataat 420
tagtga 426
<210> 33
<211> 140
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-B1
<400> 33
Met Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly
1 5 10 15
Leu Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile
20 25 30
Ser Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe
35 40 45
Tyr Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr
50 55 60
Glu Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn
65 70 75 80
Ala Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile
85 90 95
Ala Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr
100 105 110
Lys Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu
115 120 125
Leu Glu Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
130 135 140
<210> 34
<211> 453
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-B2
<400> 34
atgccttcaa gtggaggttg tgggccggca aacactgcta aatttactaa ttgtacctgt 60
tgcattgtta aaccccatgc tgtcagtgaa ggactgttgg gaaagatcct gatggctatc 120
cgagatgcag gttttgaaat ctcagctatg cagatgttca atatggatcg ggttaatgtt 180
gaggaattct atgaagttta taaaggagta gtgaccgaat atcatgacat ggtgacagaa 240
atgtattctg gcccttgtgt agcaatggag attcaacaga ataatgctac aaagacattt 300
cgagaatttt gtggacctgc tgatcctgaa attgcccggc atttacgccc tggaactctc 360
agagcaatct ttggtaaaac taagatccag aatgctgttc actgtactga tctgccagag 420
gatggcctat tagaggttca atacttcttc tga 453
<210> 35
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-B2
<400> 35
Met Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr
1 5 10 15
Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu
20 25 30
Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser
35 40 45
Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr
50 55 60
Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr Glu
65 70 75 80
Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn Ala
85 90 95
Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala
100 105 110
Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys
115 120 125
Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu
130 135 140
Glu Val Gln Tyr Phe Phe
145 150
<210> 36
<211> 471
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-B3
<400> 36
atgccttcaa gtggaggttg tgggccggca aacactgcta aatttactaa ttgtacctgt 60
tgcattgtta aaccccatgc tgtcagtgaa ggactgttgg gaaagatcct gatggctatc 120
cgagatgcag gttttgaaat ctcagctatg cagatgttca atatggatcg ggttaatgtt 180
gaggaattct atgaagttta taaaggagta gtgaccgaat atcatgacat ggtgacagaa 240
atgtattctg gcccttgtgt agcaatggag attcaacaga ataatgctac aaagacattt 300
cgagaatttt gtggacctgc tgatcctgaa attgcccggc atttacgccc tggaactctc 360
agagcaatct ttggtaaaac taagatccag aatgctgttc actgtactga tctgccagag 420
gatggcctat tagaggttca atacttcttc aagatcttgg ataattagtg a 471
<210> 37
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-B3
<400> 37
Met Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr
1 5 10 15
Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu
20 25 30
Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser
35 40 45
Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr
50 55 60
Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr Glu
65 70 75 80
Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn Ala
85 90 95
Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala
100 105 110
Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys
115 120 125
Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu
130 135 140
Glu Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
145 150 155
<210> 38
<211> 864
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-AB
<400> 38
atggaaaaaa cgctagccct aattaaacca gatgcaatat caaaggctgg agaaataatt 60
gaaataataa acaaagctgg atttactata accaaactca aaatgatgat gctttcaagg 120
aaagaagcat tggattttca tgtagatcac cagtcaagac cctttttcaa tgagctgatc 180
cagtttatta caactggtcc tattattgcc atggagattt taagagatga tgctatatgt 240
gaatggaaaa gactgctggg acctgcaaac tctggagtgg cacgcacaga tgcttctgaa 300
agcattagag ccctctttgg aacagatggc ataagaaatg cagcgcatgg ccctgattct 360
tttgcttctg cggccagaga aatggagttg ttttttcctt caagtggagg ttgtgggccg 420
gcaaacactg ctaaatttac taattgtacc tgttgcattg ttaaacccca tgctgtcagt 480
gaaggactgt tgggaaagat cctgatggct atccgagatg caggttttga aatctcagct 540
atgcagatgt tcaatatgga tcgggttaat gttgaggaat tctatgaagt ttataaagga 600
gtagtgaccg aatatcatga catggtgaca gaaatgtatt ctggcccttg tgtagcaatg 660
gagattcaac agaataatgc tacaaagaca tttcgagaat tttgtggacc tgctgatcct 720
gaaattgccc ggcatttacg ccctggaact ctcagagcaa tctttggtaa aactaagatc 780
cagaatgctg ttcactgtac tgatctgcca gaggatggcc tattagaggt tcaatacttc 840
ttcaagatct tggataatta gtga 864
<210> 39
<211> 286
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-AB
<400> 39
Met Glu Lys Thr Leu Ala Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala
1 5 10 15
Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys
20 25 30
Leu Lys Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val
35 40 45
Asp His Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr
50 55 60
Thr Gly Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys
65 70 75 80
Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr
85 90 95
Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg
100 105 110
Asn Ala Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met
115 120 125
Glu Leu Phe Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala
130 135 140
Lys Phe Thr Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser
145 150 155 160
Glu Gly Leu Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe
165 170 175
Glu Ile Ser Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu
180 185 190
Glu Phe Tyr Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met
195 200 205
Val Thr Glu Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln
210 215 220
Asn Asn Ala Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro
225 230 235 240
Glu Ile Ala Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly
245 250 255
Lys Thr Lys Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp
260 265 270
Gly Leu Leu Glu Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
275 280 285
<210> 40
<211> 846
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-AB1
<400> 40
atggaaaaaa cgctagccct aattaaacca gatgcaatat caaaggctgg agaaataatt 60
gaaataataa acaaagctgg atttactata accaaactca aaatgatgat gctttcaagg 120
aaagaagcat tggattttca tgtagatcac cagtcaagac cctttttcaa tgagctgatc 180
cagtttatta caactggtcc tattattgcc atggagattt taagagatga tgctatatgt 240
gaatggaaaa gactgctggg acctgcaaac tctggagtgg cacgcacaga tgcttctgaa 300
agcattagag ccctctttgg aacagatggc ataagaaatg cagcgcatgg ccctgattct 360
tttgcttctg cggccagaga aatggagttg ttttttcctt caagtggagg ttgtgggccg 420
gcaaacactg ctaaatttac taattgtacc tgttgcattg ttaaacccca tgctgtcagt 480
gaaggactgt tgggaaagat cctgatggct atccgagatg caggttttga aatctcagct 540
atgcagatgt tcaatatgga tcgggttaat gttgaggaat tctatgaagt ttataaagga 600
gtagtgaccg aatatcatga catggtgaca gaaatgtatt ctggcccttg tgtagcaatg 660
gagattcaac agaataatgc tacaaagaca tttcgagaat tttgtggacc tgctgatcct 720
gaaattgccc ggcatttacg ccctggaact ctcagagcaa tctttggtaa aactaagatc 780
cagaatgctg ttcactgtac tgatctgcca gaggatggcc tattagaggt tcaatacttc 840
ttctga 846
<210> 41
<211> 281
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-AB1
<400> 41
Met Glu Lys Thr Leu Ala Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala
1 5 10 15
Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys
20 25 30
Leu Lys Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val
35 40 45
Asp His Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr
50 55 60
Thr Gly Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys
65 70 75 80
Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr
85 90 95
Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg
100 105 110
Asn Ala Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met
115 120 125
Glu Leu Phe Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala
130 135 140
Lys Phe Thr Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser
145 150 155 160
Glu Gly Leu Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe
165 170 175
Glu Ile Ser Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu
180 185 190
Glu Phe Tyr Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met
195 200 205
Val Thr Glu Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln
210 215 220
Asn Asn Ala Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro
225 230 235 240
Glu Ile Ala Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly
245 250 255
Lys Thr Lys Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp
260 265 270
Gly Leu Leu Glu Val Gln Tyr Phe Phe
275 280
<210> 42
<211> 399
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-A sequence optimized for E. coli expression
<400> 42
atggaaaaaa cgctggccct gattaaaccg gatgcaatct ccaaagctgg cgaaattatc 60
gaaattatca acaaagcggg tttcaccatc acgaaactga aaatgatgat gctgagccgt 120
aaagaagccc tggattttca tgtcgaccac cagtctcgcc cgtttttcaa tgaactgatt 180
caattcatca ccacgggtcc gattatcgca atggaaattc tgcgtgatga cgctatctgc 240
gaatggaaac gcctgctggg cccggcaaac tcaggtgttg cgcgtaccga tgccagtgaa 300
tccattcgcg ctctgtttgg caccgatggt atccgtaatg cagcacatgg tccggactca 360
ttcgcatcgg cagctcgtga aatggaactg tttttctga 399
<210> 43
<211> 132
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-A sequence optimized for E. coli expression
<400> 43
Met Glu Lys Thr Leu Ala Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala
1 5 10 15
Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys
20 25 30
Leu Lys Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val
35 40 45
Asp His Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr
50 55 60
Thr Gly Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys
65 70 75 80
Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr
85 90 95
Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg
100 105 110
Asn Ala Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met
115 120 125
Glu Leu Phe Phe
130
<210> 44
<211> 444
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-A1 sequence optimized for E. coli expression
<400> 44
atggaaaaaa cgctggccct gattaaaccg gatgcaatct ccaaagctgg cgaaattatc 60
gaaattatca acaaagcggg tttcaccatc acgaaactga aaatgatgat gctgagccgt 120
aaagaagccc tggattttca tgtcgaccac cagtctcgcc cgtttttcaa tgaactgatt 180
caattcatca ccacgggtcc gattatcgca atggaaattc tgcgtgatga cgctatctgc 240
gaatggaaac gcctgctggg cccggcaaac tcaggtgttg cgcgtaccga tgccagtgaa 300
tccattcgcg ctctgtttgg caccgatggt atccgtaatg cagcacatgg tccggactca 360
ttcgcatcgg cagctcgtga aatggaactg tttttcccga gctctggcgg ttgcggtccg 420
gcaaacaccg ccaaatttac ctga 444
<210> 45
<211> 147
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-A1 sequence optimized for E. coli expression
<400> 45
Met Glu Lys Thr Leu Ala Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala
1 5 10 15
Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys
20 25 30
Leu Lys Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val
35 40 45
Asp His Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr
50 55 60
Thr Gly Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys
65 70 75 80
Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr
85 90 95
Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg
100 105 110
Asn Ala Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met
115 120 125
Glu Leu Phe Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala
130 135 140
Lys Phe Thr
145
<210> 46
<211> 669
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-A2 sequence optimized for E. coli expression
<400> 46
atgaatcact ccgaacgctt tgtttttatc gccgaatggt atgacccgaa tgcttccctg 60
ctgcgccgct acgaactgct gttttatccg ggcgatggta gcgtggaaat gcatgacgtt 120
aaaaatcacc gtacctttct gaaacgcacg aaatatgata atctgcatct ggaagacctg 180
tttattggca acaaagtcaa tgtgttctct cgtcagctgg tgctgatcga ttatggcgac 240
cagtacaccg cgcgtcaact gggtagtcgc aaagaaaaaa cgctggccct gattaaaccg 300
gatgcaatct ccaaagctgg cgaaattatc gaaattatca acaaagcggg tttcaccatc 360
acgaaactga aaatgatgat gctgagccgt aaagaagccc tggattttca tgtcgaccac 420
cagtctcgcc cgtttttcaa tgaactgatt caattcatca ccacgggtcc gattatcgca 480
atggaaattc tgcgtgatga cgctatctgc gaatggaaac gcctgctggg cccggcaaac 540
tcaggtgttg cgcgtaccga tgccagtgaa tccattcgcg ctctgtttgg caccgatggt 600
atccgtaatg cagcacatgg tccggactca ttcgcatcgg cagctcgtga aatggaactg 660
tttttctga 669
<210> 47
<211> 222
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-A2 sequence optimized for E. coli expression
<400> 47
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe
210 215 220
<210> 48
<211> 714
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-A3 sequence optimized for E. coli expression
<400> 48
atgaatcact ccgaacgctt tgtttttatc gccgaatggt atgacccgaa tgcttccctg 60
ctgcgccgct acgaactgct gttttatccg ggcgatggta gcgtggaaat gcatgacgtt 120
aaaaatcacc gtacctttct gaaacgcacg aaatatgata atctgcatct ggaagacctg 180
tttattggca acaaagtcaa tgtgttctct cgtcagctgg tgctgatcga ttatggcgac 240
cagtacaccg cgcgtcaact gggtagtcgc aaagaaaaaa cgctggccct gattaaaccg 300
gatgcaatct ccaaagctgg cgaaattatc gaaattatca acaaagcggg tttcaccatc 360
acgaaactga aaatgatgat gctgagccgt aaagaagccc tggattttca tgtcgaccac 420
cagtctcgcc cgtttttcaa tgaactgatt caattcatca ccacgggtcc gattatcgca 480
atggaaattc tgcgtgatga cgctatctgc gaatggaaac gcctgctggg cccggcaaac 540
tcaggtgttg cgcgtaccga tgccagtgaa tccattcgcg ctctgtttgg caccgatggt 600
atccgtaatg cagcacatgg tccggactca ttcgcatcgg cagctcgtga aatggaactg 660
tttttcccga gctctggcgg ttgcggtccg gcaaacaccg ccaaatttac ctga 714
<210> 49
<211> 237
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-A3 sequence optimized for E. coli expression
<400> 49
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr
225 230 235
<210> 50
<211> 408
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-B sequence optimized for E. coli expression
<400> 50
atgaattgta cgtgctgtat tgtcaaaccg cacgcagtgt cagaaggcct gctgggtaaa 60
attctgatgg caatccgtga tgctggcttt gaaatctcgg ccatgcagat gttcaacatg 120
gaccgcgtta acgtcgaaga attctacgaa gtttacaaag gcgtggttac cgaatatcac 180
gatatggtta cggaaatgta ctccggtccg tgcgtcgcga tggaaattca gcaaaacaat 240
gccaccaaaa cgtttcgtga attctgtggt ccggcagatc cggaaatcgc acgtcatctg 300
cgtccgggta ccctgcgcgc aatttttggt aaaacgaaaa tccagaacgc tgtgcactgt 360
accgatctgc cggaagacgg tctgctggaa gttcaatact ttttctga 408
<210> 51
<211> 135
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-B sequence optimized for E. coli expression
<400> 51
Met Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly
1 5 10 15
Leu Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile
20 25 30
Ser Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe
35 40 45
Tyr Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr
50 55 60
Glu Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn
65 70 75 80
Ala Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile
85 90 95
Ala Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr
100 105 110
Lys Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu
115 120 125
Leu Glu Val Gln Tyr Phe Phe
130 135
<210> 52
<211> 423
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-B1 sequence optimized for E. coli expression
<400> 52
atgaattgta cgtgctgtat tgtcaaaccg cacgcagtgt cagaaggcct gctgggtaaa 60
attctgatgg caatccgtga tgctggcttt gaaatctcgg ccatgcagat gttcaacatg 120
gaccgcgtta acgtcgaaga attctacgaa gtttacaaag gcgtggttac cgaatatcac 180
gatatggtta cggaaatgta ctccggtccg tgcgtcgcga tggaaattca gcaaaacaat 240
gccaccaaaa cgtttcgtga attctgtggt ccggcagatc cggaaatcgc acgtcatctg 300
cgtccgggta ccctgcgcgc aatttttggt aaaacgaaaa tccagaacgc tgtgcactgt 360
accgatctgc cggaagacgg tctgctggaa gttcaatact ttttcaaaat tctggataat 420
tga 423
<210> 53
<211> 140
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-B1 sequence optimized for E. coli expression
<400> 53
Met Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly
1 5 10 15
Leu Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile
20 25 30
Ser Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe
35 40 45
Tyr Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr
50 55 60
Glu Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn
65 70 75 80
Ala Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile
85 90 95
Ala Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr
100 105 110
Lys Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu
115 120 125
Leu Glu Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
130 135 140
<210> 54
<211> 453
<212> DNA
<213> Artificial Sequence
<220>
<223> human NME7-B2 sequence optimized for E. coli expression
<400> 54
atgccgagct ctggcggttg cggtccggca aacaccgcca aatttaccaa ttgtacgtgc 60
tgtattgtca aaccgcacgc agtgtcagaa ggcctgctgg gtaaaattct gatggcaatc 120
cgtgatgctg gctttgaaat ctcggccatg cagatgttca acatggaccg cgttaacgtc 180
gaagaattct acgaagttta caaaggcgtg gttaccgaat atcacgatat ggttacggaa 240
atgtactccg gtccgtgcgt cgcgatggaa attcagcaaa acaatgccac caaaacgttt 300
cgtgaattct gtggtccggc agatccggaa atcgcacgtc atctgcgtcc gggtaccctg 360
cgcgcaattt ttggtaaaac gaaaatccag aacgctgtgc actgtaccga tctgccggaa 420
gacggtctgc tggaagttca atactttttc tga 453
<210> 55
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> human NME7-B2 sequence optimized for E. coli expression
<400> 55
Met Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr
1 5 10 15
Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu
20 25 30
Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser
35 40 45
Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr
50 55 60
Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr Glu
65 70 75 80
Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn Ala
85 90 95
Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala
100 105 110
Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys
115 120 125
Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu
130 135 140
Glu Val Gln Tyr Phe Phe
145 150
<210> 56
<211> 468
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-B3 sequence optimized for E. coli expression
<400> 56
atgccgagct ctggcggttg cggtccggca aacaccgcca aatttaccaa ttgtacgtgc 60
tgtattgtca aaccgcacgc agtgtcagaa ggcctgctgg gtaaaattct gatggcaatc 120
cgtgatgctg gctttgaaat ctcggccatg cagatgttca acatggaccg cgttaacgtc 180
gaagaattct acgaagttta caaaggcgtg gttaccgaat atcacgatat ggttacggaa 240
atgtactccg gtccgtgcgt cgcgatggaa attcagcaaa acaatgccac caaaacgttt 300
cgtgaattct gtggtccggc agatccggaa atcgcacgtc atctgcgtcc gggtaccctg 360
cgcgcaattt ttggtaaaac gaaaatccag aacgctgtgc actgtaccga tctgccggaa 420
gacggtctgc tggaagttca atactttttc aaaattctgg ataattga 468
<210> 57
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-B3 sequence optimized for E. coli expression
<400> 57
Met Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr
1 5 10 15
Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu
20 25 30
Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser
35 40 45
Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr
50 55 60
Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr Glu
65 70 75 80
Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn Ala
85 90 95
Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala
100 105 110
Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys
115 120 125
Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu
130 135 140
Glu Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
145 150 155
<210> 58
<211> 861
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-AB sequence optimized for E. coli expression
<400> 58
atggaaaaaa cgctggccct gattaaaccg gatgcaatct ccaaagctgg cgaaattatc 60
gaaattatca acaaagcggg tttcaccatc acgaaactga aaatgatgat gctgagccgt 120
aaagaagccc tggattttca tgtcgaccac cagtctcgcc cgtttttcaa tgaactgatt 180
caattcatca ccacgggtcc gattatcgca atggaaattc tgcgtgatga cgctatctgc 240
gaatggaaac gcctgctggg cccggcaaac tcaggtgttg cgcgtaccga tgccagtgaa 300
tccattcgcg ctctgtttgg caccgatggt atccgtaatg cagcacatgg tccggactca 360
ttcgcatcgg cagctcgtga aatggaactg tttttcccga gctctggcgg ttgcggtccg 420
gcaaacaccg ccaaatttac caattgtacg tgctgtattg tcaaaccgca cgcagtgtca 480
gaaggcctgc tgggtaaaat tctgatggca atccgtgatg ctggctttga aatctcggcc 540
atgcagatgt tcaacatgga ccgcgttaac gtcgaagaat tctacgaagt ttacaaaggc 600
gtggttaccg aatatcacga tatggttacg gaaatgtact ccggtccgtg cgtcgcgatg 660
gaaattcagc aaaacaatgc caccaaaacg tttcgtgaat tctgtggtcc ggcagatccg 720
gaaatcgcac gtcatctgcg tccgggtacc ctgcgcgcaa tttttggtaa aacgaaaatc 780
cagaacgctg tgcactgtac cgatctgccg gaagacggtc tgctggaagt tcaatacttt 840
ttcaaaattc tggataattg a 861
<210> 59
<211> 286
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-AB sequence optimized for E. coli expression
<400> 59
Met Glu Lys Thr Leu Ala Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala
1 5 10 15
Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys
20 25 30
Leu Lys Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val
35 40 45
Asp His Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr
50 55 60
Thr Gly Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys
65 70 75 80
Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr
85 90 95
Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg
100 105 110
Asn Ala Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met
115 120 125
Glu Leu Phe Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala
130 135 140
Lys Phe Thr Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser
145 150 155 160
Glu Gly Leu Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe
165 170 175
Glu Ile Ser Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu
180 185 190
Glu Phe Tyr Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met
195 200 205
Val Thr Glu Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln
210 215 220
Asn Asn Ala Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro
225 230 235 240
Glu Ile Ala Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly
245 250 255
Lys Thr Lys Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp
260 265 270
Gly Leu Leu Glu Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
275 280 285
<210> 60
<211> 846
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-AB1 sequence optimized for E. coli expression
<400> 60
atggaaaaaa cgctggccct gattaaaccg gatgcaatct ccaaagctgg cgaaattatc 60
gaaattatca acaaagcggg tttcaccatc acgaaactga aaatgatgat gctgagccgt 120
aaagaagccc tggattttca tgtcgaccac cagtctcgcc cgtttttcaa tgaactgatt 180
caattcatca ccacgggtcc gattatcgca atggaaattc tgcgtgatga cgctatctgc 240
gaatggaaac gcctgctggg cccggcaaac tcaggtgttg cgcgtaccga tgccagtgaa 300
tccattcgcg ctctgtttgg caccgatggt atccgtaatg cagcacatgg tccggactca 360
ttcgcatcgg cagctcgtga aatggaactg tttttcccga gctctggcgg ttgcggtccg 420
gcaaacaccg ccaaatttac caattgtacg tgctgtattg tcaaaccgca cgcagtgtca 480
gaaggcctgc tgggtaaaat tctgatggca atccgtgatg ctggctttga aatctcggcc 540
atgcagatgt tcaacatgga ccgcgttaac gtcgaagaat tctacgaagt ttacaaaggc 600
gtggttaccg aatatcacga tatggttacg gaaatgtact ccggtccgtg cgtcgcgatg 660
gaaattcagc aaaacaatgc caccaaaacg tttcgtgaat tctgtggtcc ggcagatccg 720
gaaatcgcac gtcatctgcg tccgggtacc ctgcgcgcaa tttttggtaa aacgaaaatc 780
cagaacgctg tgcactgtac cgatctgccg gaagacggtc tgctggaagt tcaatacttt 840
ttctga 846
<210> 61
<211> 281
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-AB1 sequence optimized for E. coli expression
<400> 61
Met Glu Lys Thr Leu Ala Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala
1 5 10 15
Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys
20 25 30
Leu Lys Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val
35 40 45
Asp His Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr
50 55 60
Thr Gly Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys
65 70 75 80
Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr
85 90 95
Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg
100 105 110
Asn Ala Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met
115 120 125
Glu Leu Phe Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala
130 135 140
Lys Phe Thr Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser
145 150 155 160
Glu Gly Leu Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe
165 170 175
Glu Ile Ser Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu
180 185 190
Glu Phe Tyr Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met
195 200 205
Val Thr Glu Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln
210 215 220
Asn Asn Ala Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro
225 230 235 240
Glu Ile Ala Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly
245 250 255
Lys Thr Lys Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp
260 265 270
Gly Leu Leu Glu Val Gln Tyr Phe Phe
275 280
<210> 62
<211> 570
<212> DNA
<213> Artificial Sequence
<220>
<223> Mouse NME6
<400> 62
atgacctcca tcttgcgaag tccccaagct cttcagctca cactagccct gatcaagcct 60
gatgcagttg cccacccact gatcctggag gctgttcatc agcagattct gagcaacaag 120
ttcctcattg tacgaacgag ggaactgcag tggaagctgg aggactgccg gaggttttac 180
cgagagcatg aagggcgttt tttctatcag cggctggtgg agttcatgac aagtgggcca 240
atccgagcct atatccttgc ccacaaagat gccatccaac tttggaggac actgatggga 300
cccaccagag tatttcgagc acgctatata gccccagatt caattcgtgg aagtttgggc 360
ctcactgaca cccgaaatac tacccatggc tcagactccg tggtttccgc cagcagagag 420
attgcagcct tcttccctga cttcagtgaa cagcgctggt atgaggagga ggaaccccag 480
ctgcggtgtg gtcctgtgca ctacagtcca gaggaaggta tccactgtgc agctgaaaca 540
ggaggccaca aacaacctaa caaaacctag 570
<210> 63
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<223> Mouse NME6
<400> 63
Met Thr Ser Ile Leu Arg Ser Pro Gln Ala Leu Gln Leu Thr Leu Ala
1 5 10 15
Leu Ile Lys Pro Asp Ala Val Ala His Pro Leu Ile Leu Glu Ala Val
20 25 30
His Gln Gln Ile Leu Ser Asn Lys Phe Leu Ile Val Arg Thr Arg Glu
35 40 45
Leu Gln Trp Lys Leu Glu Asp Cys Arg Arg Phe Tyr Arg Glu His Glu
50 55 60
Gly Arg Phe Phe Tyr Gln Arg Leu Val Glu Phe Met Thr Ser Gly Pro
65 70 75 80
Ile Arg Ala Tyr Ile Leu Ala His Lys Asp Ala Ile Gln Leu Trp Arg
85 90 95
Thr Leu Met Gly Pro Thr Arg Val Phe Arg Ala Arg Tyr Ile Ala Pro
100 105 110
Asp Ser Ile Arg Gly Ser Leu Gly Leu Thr Asp Thr Arg Asn Thr Thr
115 120 125
His Gly Ser Asp Ser Val Val Ser Ala Ser Arg Glu Ile Ala Ala Phe
130 135 140
Phe Pro Asp Phe Ser Glu Gln Arg Trp Tyr Glu Glu Glu Glu Pro Gln
145 150 155 160
Leu Arg Cys Gly Pro Val His Tyr Ser Pro Glu Glu Gly Ile His Cys
165 170 175
Ala Ala Glu Thr Gly Gly His Lys Gln Pro Asn Lys Thr
180 185
<210> 64
<211> 585
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME6
<400> 64
atgacccaga atctggggag tgagatggcc tcaatcttgc gaagccctca ggctctccag 60
ctcactctag ccctgatcaa gcctgacgca gtcgcccatc cactgattct ggaggctgtt 120
catcagcaga ttctaagcaa caagttcctg attgtacgaa tgagagaact actgtggaga 180
aaggaagatt gccagaggtt ttaccgagag catgaagggc gttttttcta tcagaggctg 240
gtggagttca tggccagcgg gccaatccga gcctacatcc ttgcccacaa ggatgccatc 300
cagctctgga ggacgctcat gggacccacc agagtgttcc gagcacgcca tgtggcccca 360
gattctatcc gtgggagttt cggcctcact gacacccgca acaccaccca tggttcggac 420
tctgtggttt cagccagcag agagattgca gccttcttcc ctgacttcag tgaacagcgc 480
tggtatgagg aggaagagcc ccagttgcgc tgtggccctg tgtgctatag cccagaggga 540
ggtgtccact atgtagctgg aacaggaggc ctaggaccag cctga 585
<210> 65
<211> 194
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME6
<400> 65
Met Thr Gln Asn Leu Gly Ser Glu Met Ala Ser Ile Leu Arg Ser Pro
1 5 10 15
Gln Ala Leu Gln Leu Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ala
20 25 30
His Pro Leu Ile Leu Glu Ala Val His Gln Gln Ile Leu Ser Asn Lys
35 40 45
Phe Leu Ile Val Arg Met Arg Glu Leu Leu Trp Arg Lys Glu Asp Cys
50 55 60
Gln Arg Phe Tyr Arg Glu His Glu Gly Arg Phe Phe Tyr Gln Arg Leu
65 70 75 80
Val Glu Phe Met Ala Ser Gly Pro Ile Arg Ala Tyr Ile Leu Ala His
85 90 95
Lys Asp Ala Ile Gln Leu Trp Arg Thr Leu Met Gly Pro Thr Arg Val
100 105 110
Phe Arg Ala Arg His Val Ala Pro Asp Ser Ile Arg Gly Ser Phe Gly
115 120 125
Leu Thr Asp Thr Arg Asn Thr Thr His Gly Ser Asp Ser Val Val Ser
130 135 140
Ala Ser Arg Glu Ile Ala Ala Phe Phe Pro Asp Phe Ser Glu Gln Arg
145 150 155 160
Trp Tyr Glu Glu Glu Glu Pro Gln Leu Arg Cys Gly Pro Val Cys Tyr
165 170 175
Ser Pro Glu Gly Gly Val His Tyr Val Ala Gly Thr Gly Gly Leu Gly
180 185 190
Pro Ala
<210> 66
<211> 525
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME6 1
<400> 66
atgacccaga atctggggag tgagatggcc tcaatcttgc gaagccctca ggctctccag 60
ctcactctag ccctgatcaa gcctgacgca gtcgcccatc cactgattct ggaggctgtt 120
catcagcaga ttctaagcaa caagttcctg attgtacgaa tgagagaact actgtggaga 180
aaggaagatt gccagaggtt ttaccgagag catgaagggc gttttttcta tcagaggctg 240
gtggagttca tggccagcgg gccaatccga gcctacatcc ttgcccacaa ggatgccatc 300
cagctctgga ggacgctcat gggacccacc agagtgttcc gagcacgcca tgtggcccca 360
gattctatcc gtgggagttt cggcctcact gacacccgca acaccaccca tggttcggac 420
tctgtggttt cagccagcag agagattgca gccttcttcc ctgacttcag tgaacagcgc 480
tggtatgagg aggaagagcc ccagttgcgc tgtggccctg tgtga 525
<210> 67
<211> 174
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME6 1
<400> 67
Met Thr Gln Asn Leu Gly Ser Glu Met Ala Ser Ile Leu Arg Ser Pro
1 5 10 15
Gln Ala Leu Gln Leu Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ala
20 25 30
His Pro Leu Ile Leu Glu Ala Val His Gln Gln Ile Leu Ser Asn Lys
35 40 45
Phe Leu Ile Val Arg Met Arg Glu Leu Leu Trp Arg Lys Glu Asp Cys
50 55 60
Gln Arg Phe Tyr Arg Glu His Glu Gly Arg Phe Phe Tyr Gln Arg Leu
65 70 75 80
Val Glu Phe Met Ala Ser Gly Pro Ile Arg Ala Tyr Ile Leu Ala His
85 90 95
Lys Asp Ala Ile Gln Leu Trp Arg Thr Leu Met Gly Pro Thr Arg Val
100 105 110
Phe Arg Ala Arg His Val Ala Pro Asp Ser Ile Arg Gly Ser Phe Gly
115 120 125
Leu Thr Asp Thr Arg Asn Thr Thr His Gly Ser Asp Ser Val Val Ser
130 135 140
Ala Ser Arg Glu Ile Ala Ala Phe Phe Pro Asp Phe Ser Glu Gln Arg
145 150 155 160
Trp Tyr Glu Glu Glu Glu Pro Gln Leu Arg Cys Gly Pro Val
165 170
<210> 68
<211> 468
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME6 2
<400> 68
atgctcactc tagccctgat caagcctgac gcagtcgccc atccactgat tctggaggct 60
gttcatcagc agattctaag caacaagttc ctgattgtac gaatgagaga actactgtgg 120
agaaaggaag attgccagag gttttaccga gagcatgaag ggcgtttttt ctatcagagg 180
ctggtggagt tcatggccag cgggccaatc cgagcctaca tccttgccca caaggatgcc 240
atccagctct ggaggacgct catgggaccc accagagtgt tccgagcacg ccatgtggcc 300
ccagattcta tccgtgggag tttcggcctc actgacaccc gcaacaccac ccatggttcg 360
gactctgtgg tttcagccag cagagagatt gcagccttct tccctgactt cagtgaacag 420
cgctggtatg aggaggaaga gccccagttg cgctgtggcc ctgtgtga 468
<210> 69
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME6 2
<400> 69
Met Leu Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ala His Pro Leu
1 5 10 15
Ile Leu Glu Ala Val His Gln Gln Ile Leu Ser Asn Lys Phe Leu Ile
20 25 30
Val Arg Met Arg Glu Leu Leu Trp Arg Lys Glu Asp Cys Gln Arg Phe
35 40 45
Tyr Arg Glu His Glu Gly Arg Phe Phe Tyr Gln Arg Leu Val Glu Phe
50 55 60
Met Ala Ser Gly Pro Ile Arg Ala Tyr Ile Leu Ala His Lys Asp Ala
65 70 75 80
Ile Gln Leu Trp Arg Thr Leu Met Gly Pro Thr Arg Val Phe Arg Ala
85 90 95
Arg His Val Ala Pro Asp Ser Ile Arg Gly Ser Phe Gly Leu Thr Asp
100 105 110
Thr Arg Asn Thr Thr His Gly Ser Asp Ser Val Val Ser Ala Ser Arg
115 120 125
Glu Ile Ala Ala Phe Phe Pro Asp Phe Ser Glu Gln Arg Trp Tyr Glu
130 135 140
Glu Glu Glu Pro Gln Leu Arg Cys Gly Pro Val
145 150 155
<210> 70
<211> 528
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME6 3
<400> 70
atgctcactc tagccctgat caagcctgac gcagtcgccc atccactgat tctggaggct 60
gttcatcagc agattctaag caacaagttc ctgattgtac gaatgagaga actactgtgg 120
agaaaggaag attgccagag gttttaccga gagcatgaag ggcgtttttt ctatcagagg 180
ctggtggagt tcatggccag cgggccaatc cgagcctaca tccttgccca caaggatgcc 240
atccagctct ggaggacgct catgggaccc accagagtgt tccgagcacg ccatgtggcc 300
ccagattcta tccgtgggag tttcggcctc actgacaccc gcaacaccac ccatggttcg 360
gactctgtgg tttcagccag cagagagatt gcagccttct tccctgactt cagtgaacag 420
cgctggtatg aggaggaaga gccccagttg cgctgtggcc ctgtgtgcta tagcccagag 480
ggaggtgtcc actatgtagc tggaacagga ggcctaggac cagcctga 528
<210> 71
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME6 3
<400> 71
Met Leu Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ala His Pro Leu
1 5 10 15
Ile Leu Glu Ala Val His Gln Gln Ile Leu Ser Asn Lys Phe Leu Ile
20 25 30
Val Arg Met Arg Glu Leu Leu Trp Arg Lys Glu Asp Cys Gln Arg Phe
35 40 45
Tyr Arg Glu His Glu Gly Arg Phe Phe Tyr Gln Arg Leu Val Glu Phe
50 55 60
Met Ala Ser Gly Pro Ile Arg Ala Tyr Ile Leu Ala His Lys Asp Ala
65 70 75 80
Ile Gln Leu Trp Arg Thr Leu Met Gly Pro Thr Arg Val Phe Arg Ala
85 90 95
Arg His Val Ala Pro Asp Ser Ile Arg Gly Ser Phe Gly Leu Thr Asp
100 105 110
Thr Arg Asn Thr Thr His Gly Ser Asp Ser Val Val Ser Ala Ser Arg
115 120 125
Glu Ile Ala Ala Phe Phe Pro Asp Phe Ser Glu Gln Arg Trp Tyr Glu
130 135 140
Glu Glu Glu Pro Gln Leu Arg Cys Gly Pro Val Cys Tyr Ser Pro Glu
145 150 155 160
Gly Gly Val His Tyr Val Ala Gly Thr Gly Gly Leu Gly Pro Ala
165 170 175
<210> 72
<211> 585
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME6 sequence optimized for E. coli expression
<400> 72
atgacgcaaa atctgggctc ggaaatggca agtatcctgc gctccccgca agcactgcaa 60
ctgaccctgg ctctgatcaa accggacgct gttgctcatc cgctgattct ggaagcggtc 120
caccagcaaa ttctgagcaa caaatttctg atcgtgcgta tgcgcgaact gctgtggcgt 180
aaagaagatt gccagcgttt ttatcgcgaa catgaaggcc gtttctttta tcaacgcctg 240
gttgaattca tggcctctgg tccgattcgc gcatatatcc tggctcacaa agatgcgatt 300
cagctgtggc gtaccctgat gggtccgacg cgcgtctttc gtgcacgtca tgtggcaccg 360
gactcaatcc gtggctcgtt cggtctgacc gatacgcgca ataccacgca cggtagcgac 420
tctgttgtta gtgcgtcccg tgaaatcgcg gcctttttcc cggacttctc cgaacagcgt 480
tggtacgaag aagaagaacc gcaactgcgc tgtggcccgg tctgttattc tccggaaggt 540
ggtgtccatt atgtggcggg cacgggtggt ctgggtccgg catga 585
<210> 73
<211> 194
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME6 sequence optimized for E. coli expression
<400> 73
Met Thr Gln Asn Leu Gly Ser Glu Met Ala Ser Ile Leu Arg Ser Pro
1 5 10 15
Gln Ala Leu Gln Leu Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ala
20 25 30
His Pro Leu Ile Leu Glu Ala Val His Gln Gln Ile Leu Ser Asn Lys
35 40 45
Phe Leu Ile Val Arg Met Arg Glu Leu Leu Trp Arg Lys Glu Asp Cys
50 55 60
Gln Arg Phe Tyr Arg Glu His Glu Gly Arg Phe Phe Tyr Gln Arg Leu
65 70 75 80
Val Glu Phe Met Ala Ser Gly Pro Ile Arg Ala Tyr Ile Leu Ala His
85 90 95
Lys Asp Ala Ile Gln Leu Trp Arg Thr Leu Met Gly Pro Thr Arg Val
100 105 110
Phe Arg Ala Arg His Val Ala Pro Asp Ser Ile Arg Gly Ser Phe Gly
115 120 125
Leu Thr Asp Thr Arg Asn Thr Thr His Gly Ser Asp Ser Val Val Ser
130 135 140
Ala Ser Arg Glu Ile Ala Ala Phe Phe Pro Asp Phe Ser Glu Gln Arg
145 150 155 160
Trp Tyr Glu Glu Glu Glu Pro Gln Leu Arg Cys Gly Pro Val Cys Tyr
165 170 175
Ser Pro Glu Gly Gly Val His Tyr Val Ala Gly Thr Gly Gly Leu Gly
180 185 190
Pro Ala
<210> 74
<211> 525
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME6 1 sequence optimized for E. coli expression
<400> 74
atgacgcaaa atctgggctc ggaaatggca agtatcctgc gctccccgca agcactgcaa 60
ctgaccctgg ctctgatcaa accggacgct gttgctcatc cgctgattct ggaagcggtc 120
caccagcaaa ttctgagcaa caaatttctg atcgtgcgta tgcgcgaact gctgtggcgt 180
aaagaagatt gccagcgttt ttatcgcgaa catgaaggcc gtttctttta tcaacgcctg 240
gttgaattca tggcctctgg tccgattcgc gcatatatcc tggctcacaa agatgcgatt 300
cagctgtggc gtaccctgat gggtccgacg cgcgtctttc gtgcacgtca tgtggcaccg 360
gactcaatcc gtggctcgtt cggtctgacc gatacgcgca ataccacgca cggtagcgac 420
tctgttgtta gtgcgtcccg tgaaatcgcg gcctttttcc cggacttctc cgaacagcgt 480
tggtacgaag aagaagaacc gcaactgcgc tgtggcccgg tctga 525
<210> 75
<211> 174
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME6 1 sequence optimized for E. coli expression
<400> 75
Met Thr Gln Asn Leu Gly Ser Glu Met Ala Ser Ile Leu Arg Ser Pro
1 5 10 15
Gln Ala Leu Gln Leu Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ala
20 25 30
His Pro Leu Ile Leu Glu Ala Val His Gln Gln Ile Leu Ser Asn Lys
35 40 45
Phe Leu Ile Val Arg Met Arg Glu Leu Leu Trp Arg Lys Glu Asp Cys
50 55 60
Gln Arg Phe Tyr Arg Glu His Glu Gly Arg Phe Phe Tyr Gln Arg Leu
65 70 75 80
Val Glu Phe Met Ala Ser Gly Pro Ile Arg Ala Tyr Ile Leu Ala His
85 90 95
Lys Asp Ala Ile Gln Leu Trp Arg Thr Leu Met Gly Pro Thr Arg Val
100 105 110
Phe Arg Ala Arg His Val Ala Pro Asp Ser Ile Arg Gly Ser Phe Gly
115 120 125
Leu Thr Asp Thr Arg Asn Thr Thr His Gly Ser Asp Ser Val Val Ser
130 135 140
Ala Ser Arg Glu Ile Ala Ala Phe Phe Pro Asp Phe Ser Glu Gln Arg
145 150 155 160
Trp Tyr Glu Glu Glu Glu Pro Gln Leu Arg Cys Gly Pro Val
165 170
<210> 76
<211> 468
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME6 2 sequence optimized for E. coli expression
<400> 76
atgctgaccc tggctctgat caaaccggac gctgttgctc atccgctgat tctggaagcg 60
gtccaccagc aaattctgag caacaaattt ctgatcgtgc gtatgcgcga actgctgtgg 120
cgtaaagaag attgccagcg tttttatcgc gaacatgaag gccgtttctt ttatcaacgc 180
ctggttgaat tcatggcctc tggtccgatt cgcgcatata tcctggctca caaagatgcg 240
attcagctgt ggcgtaccct gatgggtccg acgcgcgtct ttcgtgcacg tcatgtggca 300
ccggactcaa tccgtggctc gttcggtctg accgatacgc gcaataccac gcacggtagc 360
gactctgttg ttagtgcgtc ccgtgaaatc gcggcctttt tcccggactt ctccgaacag 420
cgttggtacg aagaagaaga accgcaactg cgctgtggcc cggtctga 468
<210> 77
<211> 155
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME6 2 sequence optimized for E. coli expression
<400> 77
Met Leu Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ala His Pro Leu
1 5 10 15
Ile Leu Glu Ala Val His Gln Gln Ile Leu Ser Asn Lys Phe Leu Ile
20 25 30
Val Arg Met Arg Glu Leu Leu Trp Arg Lys Glu Asp Cys Gln Arg Phe
35 40 45
Tyr Arg Glu His Glu Gly Arg Phe Phe Tyr Gln Arg Leu Val Glu Phe
50 55 60
Met Ala Ser Gly Pro Ile Arg Ala Tyr Ile Leu Ala His Lys Asp Ala
65 70 75 80
Ile Gln Leu Trp Arg Thr Leu Met Gly Pro Thr Arg Val Phe Arg Ala
85 90 95
Arg His Val Ala Pro Asp Ser Ile Arg Gly Ser Phe Gly Leu Thr Asp
100 105 110
Thr Arg Asn Thr Thr His Gly Ser Asp Ser Val Val Ser Ala Ser Arg
115 120 125
Glu Ile Ala Ala Phe Phe Pro Asp Phe Ser Glu Gln Arg Trp Tyr Glu
130 135 140
Glu Glu Glu Pro Gln Leu Arg Cys Gly Pro Val
145 150 155
<210> 78
<211> 528
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME6 3 sequence optimized for E. coli expression
<400> 78
atgctgaccc tggctctgat caaaccggac gctgttgctc atccgctgat tctggaagcg 60
gtccaccagc aaattctgag caacaaattt ctgatcgtgc gtatgcgcga actgctgtgg 120
cgtaaagaag attgccagcg tttttatcgc gaacatgaag gccgtttctt ttatcaacgc 180
ctggttgaat tcatggcctc tggtccgatt cgcgcatata tcctggctca caaagatgcg 240
attcagctgt ggcgtaccct gatgggtccg acgcgcgtct ttcgtgcacg tcatgtggca 300
ccggactcaa tccgtggctc gttcggtctg accgatacgc gcaataccac gcacggtagc 360
gactctgttg ttagtgcgtc ccgtgaaatc gcggcctttt tcccggactt ctccgaacag 420
cgttggtacg aagaagaaga accgcaactg cgctgtggcc cggtctgtta ttctccggaa 480
ggtggtgtcc attatgtggc gggcacgggt ggtctgggtc cggcatga 528
<210> 79
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME6 3 sequence optimized for E. coli expression
<400> 79
Met Leu Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ala His Pro Leu
1 5 10 15
Ile Leu Glu Ala Val His Gln Gln Ile Leu Ser Asn Lys Phe Leu Ile
20 25 30
Val Arg Met Arg Glu Leu Leu Trp Arg Lys Glu Asp Cys Gln Arg Phe
35 40 45
Tyr Arg Glu His Glu Gly Arg Phe Phe Tyr Gln Arg Leu Val Glu Phe
50 55 60
Met Ala Ser Gly Pro Ile Arg Ala Tyr Ile Leu Ala His Lys Asp Ala
65 70 75 80
Ile Gln Leu Trp Arg Thr Leu Met Gly Pro Thr Arg Val Phe Arg Ala
85 90 95
Arg His Val Ala Pro Asp Ser Ile Arg Gly Ser Phe Gly Leu Thr Asp
100 105 110
Thr Arg Asn Thr Thr His Gly Ser Asp Ser Val Val Ser Ala Ser Arg
115 120 125
Glu Ile Ala Ala Phe Phe Pro Asp Phe Ser Glu Gln Arg Trp Tyr Glu
130 135 140
Glu Glu Glu Pro Gln Leu Arg Cys Gly Pro Val Cys Tyr Ser Pro Glu
145 150 155 160
Gly Gly Val His Tyr Val Ala Gly Thr Gly Gly Leu Gly Pro Ala
165 170 175
<210> 80
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Histidine Tag
<400> 80
ctcgagcacc accaccacca ccactga 27
<210> 81
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Strept II Tag
<400> 81
accggttgga gccatcctca gttcgaaaag taatga 36
<210> 82
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> PSMGFR N-10 peptide
<400> 82
Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr
1 5 10 15
Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln
20 25 30
Ser Gly Ala
35
<210> 83
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> PSMGFR C-10 peptide
<400> 83
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys
1 5 10 15
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val
20 25 30
Ser Asp Val
35
<210> 84
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> nucleoside diphosphate kinase 7 isoform a [Homo sapiens] (Hu_7)
<400> 84
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr
225 230 235 240
Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu Leu Gly Lys
245 250 255
Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met Gln
260 265 270
Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr Glu Val Tyr
275 280 285
Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr Glu Met Tyr Ser
290 295 300
Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn Ala Thr Lys Thr
305 310 315 320
Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala Arg His Leu
325 330 335
Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys Ile Gln Asn
340 345 350
Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val Gln
355 360 365
Tyr Phe Phe Lys Ile Leu Asp Asn
370 375
<210> 85
<211> 759
<212> DNA
<213> Artificial Sequence
<220>
<223> Human NME7-X1
<400> 85
atgatgatgc tttcaaggaa agaagcattg gattttcatg tagatcacca gtcaagaccc 60
tttttcaatg agctgatcca gtttattaca actggtccta ttattgccat ggagatttta 120
agagatgatg ctatatgtga atggaaaaga ctgctgggac ctgcaaactc tggagtggca 180
cgcacagatg cttctgaaag cattagagcc ctctttggaa cagatggcat aagaaatgca 240
gcgcatggcc ctgattcttt tgcttctgcg gccagagaaa tggagttgtt ttttccttca 300
agtggaggtt gtgggccggc aaacactgct aaatttacta attgtacctg ttgcattgtt 360
aaaccccatg ctgtcagtga aggactgttg ggaaagatcc tgatggctat ccgagatgca 420
ggttttgaaa tctcagctat gcagatgttc aatatggatc gggttaatgt tgaggaattc 480
tatgaagttt ataaaggagt agtgaccgaa tatcatgaca tggtgacaga aatgtattct 540
ggcccttgtg tagcaatgga gattcaacag aataatgcta caaagacatt tcgagaattt 600
tgtggacctg ctgatcctga aattgcccgg catttacgcc ctggaactct cagagcaatc 660
tttggtaaaa ctaagatcca gaatgctgtt cactgtactg atctgccaga ggatggccta 720
ttagaggttc aatacttctt caagatcttg gataattag 759
<210> 86
<211> 252
<212> PRT
<213> Artificial Sequence
<220>
<223> Human NME7-X1
<400> 86
Met Met Met Leu Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His
1 5 10 15
Gln Ser Arg Pro Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly
20 25 30
Pro Ile Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp
35 40 45
Lys Arg Leu Leu Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala
50 55 60
Ser Glu Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala
65 70 75 80
Ala His Gly Pro Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu
85 90 95
Phe Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe
100 105 110
Thr Asn Cys Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly
115 120 125
Leu Leu Gly Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile
130 135 140
Ser Ala Met Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe
145 150 155 160
Tyr Glu Val Tyr Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr
165 170 175
Glu Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn
180 185 190
Ala Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile
195 200 205
Ala Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr
210 215 220
Lys Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu
225 230 235 240
Leu Glu Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
245 250
<210> 87
<211> 44
<212> PRT
<213> Artificial Sequence
<220>
<223> Mouse MUC1* extracellular domain PSMGFR
<400> 87
Gly Thr Phe Ser Ala Ser Asp Val Lys Ser Gln Leu Ile Gln His Lys
1 5 10 15
Lys Glu Ala Asp Asp Tyr Asn Leu Thr Ile Ser Glu Val Lys Val Asn
20 25 30
Glu Met Gln Phe Pro Pro Ser Ala Gln Ser Arg Pro
35 40
<210> 88
<211> 395
<212> PRT
<213> Artificial Sequence
<220>
<223> nucleoside diphosphate kinase 7 (mouse NME7) isoform 1 Mus
musculus (Mo_7)
<400> 88
Met Arg Ala Cys Gln Gln Gly Arg Ser Ser Ser Leu Val Ser Pro Tyr
1 5 10 15
Met Ala Pro Lys Asn Gln Ser Glu Arg Phe Ala Phe Ile Ala Glu Trp
20 25 30
Tyr Asp Pro Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr
35 40 45
Pro Thr Asp Gly Ser Val Glu Met His Asp Val Lys Asn Arg Arg Thr
50 55 60
Phe Leu Lys Arg Thr Lys Tyr Glu Asp Leu Arg Leu Glu Asp Leu Phe
65 70 75 80
Ile Gly Asn Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp
85 90 95
Tyr Gly Asp Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys
100 105 110
Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ser Lys Ala Gly Glu Ile
115 120 125
Ile Glu Met Ile Asn Lys Ser Gly Phe Thr Ile Thr Lys Leu Arg Met
130 135 140
Met Thr Leu Thr Arg Lys Glu Ala Ala Asp Phe His Val Asp His His
145 150 155 160
Ser Arg Pro Phe Tyr Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro
165 170 175
Val Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys
180 185 190
Arg Leu Leu Gly Pro Ala Asn Ser Gly Leu Ser Arg Thr Asp Ala Pro
195 200 205
Gly Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Val Arg Asn Ala Ala
210 215 220
His Gly Pro Asp Thr Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe
225 230 235 240
Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr
245 250 255
Asn Cys Thr Cys Cys Ile Ile Lys Pro His Ala Ile Ser Glu Gly Met
260 265 270
Leu Gly Lys Ile Leu Ile Ala Ile Arg Asp Ala Cys Phe Gly Met Ser
275 280 285
Ala Ile Gln Met Phe Asn Leu Asp Arg Ala Asn Val Glu Glu Phe Tyr
290 295 300
Glu Val Tyr Lys Gly Val Val Ser Glu Tyr Asn Asp Met Val Thr Glu
305 310 315 320
Leu Cys Ser Gly Pro Cys Val Ala Ile Glu Ile Gln Gln Ser Asn Pro
325 330 335
Thr Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala
340 345 350
Arg His Leu Arg Pro Glu Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys
355 360 365
Val Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu
370 375 380
Glu Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
385 390 395
<210> 89
<211> 277
<212> PRT
<213> Artificial Sequence
<220>
<223> nucleoside diphosphate kinase 7 isoform 2 [Mus musculus] (Mo2-7)
<400> 89
Met Arg Ala Cys Gln Gln Gly Arg Ser Ser Ser Leu Val Ser Pro Tyr
1 5 10 15
Met Ala Pro Lys Asn Gln Ser Glu Arg Phe Ala Phe Ile Ala Glu Trp
20 25 30
Tyr Asp Pro Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr
35 40 45
Pro Thr Asp Gly Ser Val Glu Met His Asp Val Lys Asn Arg Arg Thr
50 55 60
Phe Leu Lys Arg Thr Lys Tyr Glu Asp Leu Arg Leu Glu Asp Leu Phe
65 70 75 80
Ile Gly Asn Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp
85 90 95
Tyr Gly Asp Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys
100 105 110
Thr Leu Ala Leu Ile Lys Pro Asp Ala Val Ser Lys Ala Gly Glu Ile
115 120 125
Ile Glu Met Ile Asn Lys Ser Gly Phe Thr Ile Thr Lys Leu Arg Met
130 135 140
Met Thr Leu Thr Arg Lys Glu Ala Ala Asp Phe His Val Asp His His
145 150 155 160
Ser Arg Pro Phe Tyr Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro
165 170 175
Val Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys
180 185 190
Arg Leu Leu Gly Pro Ala Asn Ser Gly Leu Ser Arg Thr Asp Ala Pro
195 200 205
Gly Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Val Arg Asn Ala Ala
210 215 220
His Gly Pro Asp Thr Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe
225 230 235 240
Phe Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr
245 250 255
Asn Cys Thr Cys Cys Ile Ile Lys Pro His Ala Ile Ser Glu Asp Leu
260 265 270
Phe Ile His Tyr Met
275
<210> 90
<211> 213
<212> PRT
<213> Artificial Sequence
<220>
<223> Pig Sus scrofa MUC1
<400> 90
Met Thr Arg Asp Ile Gln Ala Pro Phe Phe Phe Gly Leu Leu Leu Leu
1 5 10 15
Pro Val Leu Thr Gly Glu Gly Asn Lys Gln Thr Asn Lys Asn Leu Ala
20 25 30
Leu Ser Leu Ser Ser Gln Phe Leu Gln Val Tyr Lys Glu Asp Gly Leu
35 40 45
Leu Gly Leu Phe Tyr Ile Lys Phe Arg Pro Gly Ser Val Leu Val Glu
50 55 60
Leu Ile Leu Ala Phe Gln Asp Ser Ala Ala Ala His Asn Leu Lys Thr
65 70 75 80
Gln Phe Asp Arg Leu Lys Ala Glu Ala Gly Thr Tyr Asn Leu Thr Ile
85 90 95
Ser Glu Val Ser Val Ile Asp Ala Pro Phe Pro Ser Ser Ala Gln Pro
100 105 110
Gly Ser Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys
115 120 125
Ile Leu Val Ala Leu Ala Ile Ile Tyr Val Ile Ala Leu Ala Val Cys
130 135 140
Gln Cys Arg Arg Lys Asn Cys Gly Gln Leu Asp Ile Phe Pro Thr Arg
145 150 155 160
Asp Ala Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly
165 170 175
Arg Tyr Val Pro Pro Gly Ser Thr Lys Arg Asn Pro Tyr Glu Gln Val
180 185 190
Ser Ala Gly Asn Gly Gly Gly Ser Leu Ser Tyr Ser Asn Leu Ala Ala
195 200 205
Thr Ser Ala Asn Leu
210
<210> 91
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Pig MUC1* PSMGFR
<400> 91
Gln Asp Ser Ala Ala Ala His Asn Leu Lys Thr Gln Phe Asp Arg Leu
1 5 10 15
Lys Ala Glu Ala Gly Thr Tyr Asn Leu Thr Ile Ser Glu Val Ser Val
20 25 30
Ile Asp Ala Pro Phe Pro Ser Ser Ala Gln Pro Gly Ser
35 40 45
<210> 92
<211> 453
<212> PRT
<213> Artificial Sequence
<220>
<223> PREDICTED: nucleoside diphosphate kinase 7 [Sus scrofa, Pig]
(Pi_7)
<400> 92
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Phe Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Glu Asp Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Lys Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Val Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Leu Thr Lys Leu Lys Met Met Thr Leu
115 120 125
Ser Arg Lys Glu Ala Thr Asp Phe His Ile Asp His Gln Ser Arg Pro
130 135 140
Phe Leu Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Lys Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Leu Ala Arg Thr Asp Ala Pro Gly Ser Ile
180 185 190
Arg Ala Val Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Leu Ser Cys Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Val Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr
225 230 235 240
Thr Cys Cys Ile Val Lys Pro His Ala Ile Ser Glu Gly Leu Leu Gly
245 250 255
Lys Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met
260 265 270
Gln Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr Glu Val
275 280 285
Tyr Lys Gly Val Val Ser Glu Tyr Asn Glu Met Val Thr Glu Met Tyr
290 295 300
Phe Ser Ala Pro Ser Ser Ser Ala Ile Trp Arg Ser Pro Thr Val Leu
305 310 315 320
Asn Ser Leu Gln Ser Asp Ile Ser Ser Arg Asp Phe Ser Ser Gly Pro
325 330 335
Arg Ser Ile Pro Arg Ser Asn Phe Tyr Trp Leu Thr Asn His Leu Leu
340 345 350
Glu Met Leu Ser Leu Leu Leu Leu Gly Val His Lys Gly Val Pro Lys
355 360 365
Glu Val Phe Val Gly Glu Ala His Val Ser Pro Gly Cys Ala Pro Val
370 375 380
Leu Val Gly Gly Thr Leu Ser Arg Val Lys Asp Arg Lys Lys Glu Asn
385 390 395 400
His Phe Ser Leu Val Phe Val Met Leu Ser Ser Val Ser Leu Pro Ala
405 410 415
Ser Ser Arg Tyr Val Lys Ala Ala Lys Gly Pro Gln Leu Ile Lys Gly
420 425 430
Phe Ser Arg Gly Arg Gly Leu Leu Leu Ala Leu Asn Thr Gly Cys Gly
435 440 445
Asn Cys Phe Trp Leu
450
<210> 93
<211> 640
<212> PRT
<213> Artificial Sequence
<220>
<223> Sheep MUC1
<400> 93
Met Thr Pro Asp Ile Gln Ala Pro Phe Leu Ser Leu Leu Leu Leu Phe
1 5 10 15
Gln Val Leu Thr Val Ala Asn Val Thr Met Leu Thr Ala Ser Val Ser
20 25 30
Thr Ser Pro Asn Ser Thr Val Gln Val Ser Ser Thr Gln Ser Ser Pro
35 40 45
Thr Ser Ser Pro Thr Lys Glu Thr Ser Trp Ser Thr Thr Thr Thr Leu
50 55 60
Leu Arg Thr Ser Ser Pro Ala Pro Thr Pro Thr Thr Ser Pro Gly Arg
65 70 75 80
Asp Gly Ala Ser Ser Pro Thr Ser Ser Ala Ala Pro Ser Pro Ala Ala
85 90 95
Ser Ser Ser His Asp Gly Ala Leu Ser Leu Thr Gly Ser Pro Ala Pro
100 105 110
Ser Pro Thr Ala Ser Pro Gly His Gly Gly Thr Leu Thr Thr Thr Ser
115 120 125
Ser Pro Ala Pro Ser Pro Thr Ala Ser Pro Gly His Asp Gly Ala Ser
130 135 140
Thr Pro Thr Ser Ser Pro Ala Pro Ser Pro Ala Ala Ser Pro Gly His
145 150 155 160
Asp Gly Ala Leu Ser Leu Thr Gly Ser Pro Ala Pro Ser Pro Thr Ala
165 170 175
Ser Pro Gly His Gly Gly Thr Leu Thr Thr Thr Ser Ser Pro Ala Pro
180 185 190
Ser Pro Thr Ala Ser Pro Gly His Asp Gly Ala Ser Thr Pro Thr Ser
195 200 205
Ser Pro Ala Pro Ser Pro Ala Ala Ser Ser Ser His Asp Gly Ala Leu
210 215 220
Ser Leu Thr Gly Ser Pro Ala Pro Ser Pro Pro Ala Ser Pro Gly His
225 230 235 240
Gly Gly Thr Leu Thr Thr Thr Ser Ser Pro Ala Pro Ser Pro Thr Ala
245 250 255
Ser Pro Gly His Gly Gly Thr Leu Thr Thr Thr Ser Ser Pro Ala Pro
260 265 270
Ser Pro Thr Ala Ser Pro Gly His Asp Gly Ala Ser Thr Pro Thr Ser
275 280 285
Ser Pro Ala Pro Thr Ala His Ser Ser His Asp Gly Ala Leu Thr Thr
290 295 300
Thr Gly Ser Pro Ala Pro Ser Pro Ala Ala Ser Pro Gly His Asp Ser
305 310 315 320
Val Pro Pro Arg Ala Thr Ser Pro Ala Pro Ser Pro Ala Ala Ser Pro
325 330 335
Gly Gln His Ala Ala Ser Ser Pro Thr Ser Ser Asp Ile Ser Ser Val
340 345 350
Thr Thr Ser Ser Met Ser Ser Ser Met Val Thr Ser Ala His Lys Gly
355 360 365
Thr Ser Ser Arg Ala Thr Thr Thr Pro Val Ser Lys Gly Thr Pro Ser
370 375 380
Ser Val Pro Ser Ser Glu Thr Ala Pro Thr Ala Ala Ser His Ser Thr
385 390 395 400
Arg Thr Ala Ala Ala Ser Thr Ser Pro Ser Thr Ala Leu Ser Thr Ala
405 410 415
Ser His Pro Lys Thr Ser Gln Gln Leu Ser Val Gln Val Ser Leu Phe
420 425 430
Phe Leu Ser Phe Arg Ile Thr Asn Leu Gln Phe Asn Ser Ser Leu Glu
435 440 445
Asn Pro Gln Thr Ser Tyr Tyr Gln Glu Leu Gln Arg Ser Ile Leu Asp
450 455 460
Val Ile Leu Gln Thr Tyr Lys Gln Arg Asp Phe Leu Gly Leu Ser Glu
465 470 475 480
Ile Lys Phe Arg Pro Gly Ser Val Leu Val Asp Leu Thr Leu Ala Phe
485 490 495
Arg Glu Gly Thr Thr Ala Glu Leu Val Lys Ala Gln Phe Ser Gln Leu
500 505 510
Glu Ala His Ala Ala Asn Tyr Ser Leu Thr Ile Ser Gly Val Ser Val
515 520 525
Arg Asp Ala Gln Phe Pro Ser Ser Ala Pro Ser Ala Ser Gly Val Pro
530 535 540
Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu
545 550 555 560
Ala Ile Ile Tyr Leu Ile Ala Leu Val Val Cys Gln Cys Gly Arg Lys
565 570 575
Lys Cys Glu Gln Leu Asp Ile Phe Pro Thr Leu Gly Ala Tyr His Pro
580 585 590
Met Ser Glu Tyr Ser Ala Tyr His Thr His Gly Arg Phe Val Pro Pro
595 600 605
Gly Ser Thr Lys Arg Ser Pro Tyr Glu Glu Val Ser Ala Gly Asn Gly
610 615 620
Gly Ser Asn Leu Ser Tyr Thr Asn Leu Ala Ala Thr Ser Ala Asn Leu
625 630 635 640
<210> 94
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Sheep MUC1* extracellular domain PSMGFR
<400> 94
Arg Glu Gly Thr Thr Ala Glu Leu Val Lys Ala Gln Phe Ser Gln Leu
1 5 10 15
Glu Ala His Ala Ala Asn Tyr Ser Leu Thr Ile Ser Gly Val Ser Val
20 25 30
Arg Asp Ala Gln Phe Pro Ser Ser Ala Pro Ser Ala Ser
35 40 45
<210> 95
<211> 395
<212> PRT
<213> Artificial Sequence
<220>
<223> PREDICTED: nucleoside diphosphate kinase 7 isoform X1 [Ovis
aries, Sheep] (Sh_7)
<400> 95
Met Asn Pro Thr Phe Val Leu Leu Ser Leu Glu Arg Asn Val Thr Glu
1 5 10 15
Ser Leu Gly Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Phe
20 25 30
Asp Pro Asn Ala Ser Leu Phe Arg Arg Tyr Glu Leu Leu Phe Tyr Pro
35 40 45
Gly Asp Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe
50 55 60
Leu Lys Arg Thr Lys Tyr Glu Asp Leu His Leu Glu Asp Leu Phe Ile
65 70 75 80
Gly Asn Lys Val Asn Ile Phe Ser Arg Gln Leu Val Leu Leu Asp Tyr
85 90 95
Gly Asp Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr
100 105 110
Leu Ala Leu Ile Lys Pro Asp Ala Val Ser Lys Ala Gly Glu Ile Ile
115 120 125
Glu Ile Ile Asn Lys Ala Gly Phe Thr Leu Thr Lys Leu Lys Met Met
130 135 140
Thr Leu Ser Arg Lys Glu Ala Thr Asp Phe His Ile Asp His Gln Ser
145 150 155 160
Arg Pro Phe Leu Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro Ile
165 170 175
Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg
180 185 190
Leu Leu Gly Pro Ala Asn Ser Gly Leu Ala Arg Thr Asp Ala Pro Glu
195 200 205
Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Ile Lys Asn Ala Ala His
210 215 220
Gly Pro Asp Ser Phe Ala Cys Ala Ala Arg Glu Met Glu Leu Phe Phe
225 230 235 240
Pro Ser Ser Gly Val Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn
245 250 255
Cys Thr Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu
260 265 270
Leu Gly Lys Ile Leu Ile Thr Ile Arg Asp Ala Gly Phe Glu Ile Ser
275 280 285
Ala Met Gln Met Phe Asn Met Asp Arg Ile Asn Val Glu Glu Phe Tyr
290 295 300
Glu Val Tyr Lys Gly Val Val Ser Glu Tyr Asn Glu Met Val Thr Glu
305 310 315 320
Met Tyr Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Thr Asn Pro
325 330 335
Thr Met Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala
340 345 350
Arg His Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys
355 360 365
Ile Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu
370 375 380
Glu Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
385 390 395
<210> 96
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Crab-eating macaque MUC1* extracellular domain PSMGFR
<400> 96
Gly Thr Thr Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Arg Lys
1 5 10 15
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Ile Ser Val
20 25 30
Arg Asp Val Pro Phe Pro Phe Ser Ala Gln Thr Gly Ala
35 40 45
<210> 97
<211> 256
<212> PRT
<213> Artificial Sequence
<220>
<223> unnamed protein product [Macaca fascicularis] (Ma_7) (sequence
incomplete, only NME7A)
<400> 97
Met Ser His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Ser Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro Val Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Gly Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr
225 230 235 240
Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Val Arg Arg Asn Pro
245 250 255
<210> 98
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Rhesus macaque MUC1* extracellular domain PSMGFR
<400> 98
Gly Thr Thr Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Arg Lys
1 5 10 15
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Ile Ser Val
20 25 30
Arg Asp Val Pro Phe Pro Phe Ser Ala Gln Thr Gly Ala
35 40 45
<210> 99
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> Macaca mulatta (Rhesus macaque) (Mm_7)
<400> 99
Met Ser His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Ser Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro Val Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Gly Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr
225 230 235 240
Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu Leu Gly Lys
245 250 255
Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met Gln
260 265 270
Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr Glu Val Tyr
275 280 285
Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr Glu Met Tyr Ser
290 295 300
Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn Ala Thr Lys Thr
305 310 315 320
Phe Arg Glu Phe Cys Gly Pro Val Asp Pro Glu Ile Ala Arg His Leu
325 330 335
Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys Ile Gln Asn
340 345 350
Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val Gln
355 360 365
Tyr Phe Phe Lys Ile Leu Asp Asn
370 375
<210> 100
<211> 484
<212> PRT
<213> Artificial Sequence
<220>
<223> Bonobo Pan paniscus MUC1
<400> 100
Met Thr Pro Gly Val Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Ala Thr Thr Ala Pro Lys Pro Ala Thr Val Val Thr Gly
20 25 30
Ser Gly His Ala Ser Ser Ala Pro Gly Gly Glu Lys Glu Thr Ser Ala
35 40 45
Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys Asn Ala Val Ser
50 55 60
Met Thr Ser Ser Val Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser
65 70 75 80
Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro Ala Thr Glu Pro Ala
85 90 95
Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val Pro Val
100 105 110
Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His Asp Val Thr
115 120 125
Ser Ala Leu Asp Asn Lys Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala
130 135 140
His Asp Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr
145 150 155 160
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala
165 170 175
Leu Gly Ser Thr Ala Pro Pro Val His Asn Val Thr Ser Ala Ser Gly
180 185 190
Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala
195 200 205
Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro
210 215 220
Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys
225 230 235 240
Thr Asp Ala Ser Ser Thr His His Ser Thr Val Pro Pro Leu Thr Ser
245 250 255
Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe
260 265 270
Phe Leu Ser Phe His Ile Ser Asn Leu Arg Phe Asn Ser Ser Leu Glu
275 280 285
Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu
290 295 300
Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn
305 310 315 320
Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe
325 330 335
Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln
340 345 350
Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val
355 360 365
Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly
370 375 380
Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val
385 390 395 400
Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg
405 410 415
Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Ala Arg Asp Thr Tyr
420 425 430
His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg Tyr Val
435 440 445
Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser Ala Gly
450 455 460
Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Ala Ala Thr
465 470 475 480
Ser Ala Asn Leu
<210> 101
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Bonobo MUC1* extracellular domain PSMGFR
<400> 101
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys
1 5 10 15
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val
20 25 30
Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
35 40 45
<210> 102
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> Bonobo PREDICTED: nucleoside diphosphate kinase 7 [Pan paniscus,
Bonobo] (Bo_7)
<400> 102
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr
225 230 235 240
Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu Leu Gly Lys
245 250 255
Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met Gln
260 265 270
Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr Glu Val Tyr
275 280 285
Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr Glu Met Tyr Ser
290 295 300
Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn Ala Thr Lys Thr
305 310 315 320
Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala Arg His Leu
325 330 335
Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys Ile Gln Asn
340 345 350
Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val Gln
355 360 365
Tyr Phe Phe Lys Ile Leu Asp Asn
370 375
<210> 103
<211> 475
<212> PRT
<213> Artificial Sequence
<220>
<223> Pan troglodytes MUC1
<400> 103
Met Thr Pro Gly Ile Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Ala Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His
50 55 60
Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu
65 70 75 80
Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln
85 90 95
Asp Val Thr Ser Val Pro Val Thr Arg Pro Ala Leu Gly Ser Thr Thr
100 105 110
Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Asn Lys Pro Ala Pro
115 120 125
Gly Ser Thr Ala Pro Pro Ala His Asp Val Thr Ser Ala Pro Asp Thr
130 135 140
Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser
145 150 155 160
Ala Pro Asp Thr Arg Pro Ala Leu Gly Ser Thr Ala Pro Pro Val His
165 170 175
Asn Val Thr Ser Ala Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu
180 185 190
Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys
195 200 205
Ser Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr Thr
210 215 220
Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His Ser
225 230 235 240
Thr Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu
245 250 255
Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu
260 265 270
Arg Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu
275 280 285
Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly
290 295 300
Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val
305 310 315 320
Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp
325 330 335
Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr
340 345 350
Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe
355 360 365
Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu
370 375 380
Val Leu Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala
385 390 395 400
Leu Ala Val Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile
405 410 415
Phe Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr
420 425 430
His Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro
435 440 445
Tyr Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr
450 455 460
Asn Pro Ala Val Ala Ala Thr Ser Ala Asn Leu
465 470 475
<210> 104
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Chimpanzee MUC1* extracellular domain PSMGFR
<400> 104
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys
1 5 10 15
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val
20 25 30
Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
35 40 45
<210> 105
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> nucleoside diphosphate kinase 7 [Pan troglodytes, Chimp] (CH_7)
<400> 105
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr
225 230 235 240
Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu Leu Gly Lys
245 250 255
Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met Gln
260 265 270
Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr Glu Val Tyr
275 280 285
Lys Gly Val Val Thr Glu Tyr His Asn Met Val Thr Glu Met Tyr Ser
290 295 300
Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn Ala Thr Lys Thr
305 310 315 320
Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala Arg His Leu
325 330 335
Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys Ile Gln Asn
340 345 350
Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val Gln
355 360 365
Tyr Phe Phe Lys Ile Leu Asp Asn
370 375
<210> 106
<211> 486
<212> PRT
<213> Artificial Sequence
<220>
<223> Gorilla gorilla MUC1
<400> 106
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Ala Thr Thr Ala Pro Lys Pro Thr Thr Val Val Thr Gly
20 25 30
Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala
35 40 45
Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys Asn Ala Val Ser
50 55 60
Met Thr Ser Ser Ile Leu Ser Ser His Ser Pro Gly Ser Gly Ser Ser
65 70 75 80
Thr Thr Gln Gly Gln Asp Val Thr Pro Ala Pro Ala Thr Glu Pro Ala
85 90 95
Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val Thr Ser Val Pro Val
100 105 110
Thr Arg Pro Ala Leu Gly Ser Thr Thr Pro Pro Ala His Asp Val Thr
115 120 125
Ser Ala Pro Asp Asn Lys Pro Ala Pro Gly Ser Thr Thr Pro Pro Ala
130 135 140
His Gly Val Ser Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr
145 150 155 160
Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala
165 170 175
Pro Gly Ser Thr Ala Pro Pro Ala His Val His Asn Val Thr Ser Ala
180 185 190
Ser Gly Ser Ala Ser Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr
195 200 205
Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser
210 215 220
Ile Pro Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Asn His Ser
225 230 235 240
Thr Lys Thr Asp Ala Ser Ser Thr His His Ser Thr Val Pro Pro Leu
245 250 255
Thr Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser
260 265 270
Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser
275 280 285
Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile
290 295 300
Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu
305 310 315 320
Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu
325 330 335
Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe
340 345 350
Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser
355 360 365
Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly
370 375 380
Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val
385 390 395 400
Leu Val Val Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln
405 410 415
Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe Pro Val Arg Asp
420 425 430
Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg
435 440 445
Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr Glu Lys Val Ser
450 455 460
Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Ala
465 470 475 480
Ala Thr Ser Ala Asn Leu
485
<210> 107
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> Gorilla MUC1* PSMGFR
<400> 107
Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys
1 5 10 15
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val
20 25 30
Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala
35 40 45
<210> 108
<211> 294
<212> PRT
<213> Artificial Sequence
<220>
<223> NME7 [ENSGGOP00000002464], Gorilla gorilla (Go_7)
<400> 108
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Leu Leu Gly Lys Ile Leu Met Ala
210 215 220
Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met Gln Met Phe Asn Met
225 230 235 240
Asp Arg Val Asn Val Glu Glu Phe Tyr Glu Val Tyr Lys Gly Val Val
245 250 255
Thr Glu Tyr His Asp Met Val Thr Glu Met Tyr Ser Gly Pro Cys Val
260 265 270
Ala Met Glu Ile Gln Gln Asn Asn Ala Thr Lys Thr Phe Arg Glu Phe
275 280 285
Cys Gly Pro Ala Asp Pro
290
<210> 109
<211> 378
<212> PRT
<213> Artificial Sequence
<220>
<223> nucleoside diphosphate kinase 7 [Mus musculus] (Mo_7)
<400> 109
Met Lys Thr Asn Gln Ser Glu Arg Phe Ala Phe Ile Ala Glu Trp Tyr
1 5 10 15
Asp Pro Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro
20 25 30
Thr Asp Gly Ser Val Glu Met His Asp Val Lys Asn Arg Arg Thr Phe
35 40 45
Leu Lys Arg Thr Lys Tyr Glu Asp Leu Arg Leu Glu Asp Leu Phe Ile
50 55 60
Gly Asn Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr
65 70 75 80
Gly Asp Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr
85 90 95
Leu Ala Leu Ile Lys Pro Asp Ala Val Ser Lys Ala Gly Glu Ile Ile
100 105 110
Glu Met Ile Asn Lys Ser Gly Phe Thr Ile Thr Lys Leu Arg Met Met
115 120 125
Thr Leu Thr Arg Lys Glu Ala Ala Asp Phe His Val Asp His His Ser
130 135 140
Arg Pro Phe Tyr Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro Val
145 150 155 160
Ile Ala Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg
165 170 175
Leu Leu Gly Pro Ala Asn Ser Gly Leu Ser Arg Thr Asp Ala Pro Gly
180 185 190
Ser Ile Arg Ala Leu Phe Gly Thr Asp Gly Val Arg Asn Ala Ala His
195 200 205
Ser Pro Asp Thr Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe
210 215 220
Pro Ser Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn
225 230 235 240
Cys Thr Cys Cys Ile Ile Lys Pro His Ala Ile Ser Glu Gly Met Leu
245 250 255
Gly Lys Ile Leu Ile Ala Ile Arg Asp Ala Cys Phe Gly Met Ser Ala
260 265 270
Ile Gln Met Phe Asn Leu Asp Arg Ala Asn Val Glu Glu Phe Tyr Glu
275 280 285
Val Tyr Lys Gly Val Val Ser Glu Tyr Asn Asp Met Val Thr Glu Leu
290 295 300
Cys Ser Gly Pro Cys Val Ala Ile Glu Ile Gln Gln Ser Asn Pro Thr
305 310 315 320
Lys Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala Arg
325 330 335
His Leu Arg Pro Glu Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys Val
340 345 350
Gln Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu
355 360 365
Val Gln Tyr Phe Phe Lys Ile Leu Asp Asn
370 375
<210> 110
<211> 340
<212> PRT
<213> Artificial Sequence
<220>
<223> nucleoside diphosphate kinase 7 isoform X1 [Mus musculus]
(MoX1-7)
<400> 110
Met His Asp Val Lys Asn Arg Arg Thr Phe Leu Lys Arg Thr Lys Tyr
1 5 10 15
Glu Asp Leu Arg Leu Glu Asp Leu Phe Ile Gly Asn Lys Val Asn Val
20 25 30
Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp Gln Tyr Thr Ala
35 40 45
Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala Leu Ile Lys Pro
50 55 60
Asp Ala Val Ser Lys Ala Gly Glu Ile Ile Glu Met Ile Asn Lys Ser
65 70 75 80
Gly Phe Thr Ile Thr Lys Leu Arg Met Met Thr Leu Thr Arg Lys Glu
85 90 95
Ala Ala Asp Phe His Val Asp His His Ser Arg Pro Phe Tyr Asn Glu
100 105 110
Leu Ile Gln Phe Ile Thr Ser Gly Pro Val Ile Ala Met Glu Ile Leu
115 120 125
Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn
130 135 140
Ser Gly Leu Ser Arg Thr Asp Ala Pro Gly Ser Ile Arg Ala Leu Phe
145 150 155 160
Gly Thr Asp Gly Val Arg Asn Ala Ala His Gly Pro Asp Thr Phe Ala
165 170 175
Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser Ser Gly Gly Cys
180 185 190
Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr Cys Cys Ile Ile
195 200 205
Lys Pro His Ala Ile Ser Glu Gly Met Leu Gly Lys Ile Leu Ile Ala
210 215 220
Ile Arg Asp Ala Cys Phe Gly Met Ser Ala Ile Gln Met Phe Asn Leu
225 230 235 240
Asp Arg Ala Asn Val Glu Glu Phe Tyr Glu Val Tyr Lys Gly Val Val
245 250 255
Ser Glu Tyr Asn Asp Met Val Thr Glu Leu Cys Ser Gly Pro Cys Val
260 265 270
Ala Ile Glu Ile Gln Gln Ser Asn Pro Thr Lys Thr Phe Arg Glu Phe
275 280 285
Cys Gly Pro Ala Asp Pro Glu Ile Ala Arg His Leu Arg Pro Glu Thr
290 295 300
Leu Arg Ala Ile Phe Gly Lys Thr Lys Val Gln Asn Ala Val His Cys
305 310 315 320
Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val Gln Tyr Phe Phe Lys
325 330 335
Ile Leu Asp Asn
340
<210> 111
<211> 256
<212> PRT
<213> Artificial Sequence
<220>
<223> unnamed protein product [Macaca fascicularis] (Ma_7) (sequence
incomplete, only NME7A)
<400> 111
Met Ser His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Ser Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro Val Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Gly Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr
225 230 235 240
Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Val Arg Arg Asn Pro
245 250 255
<210> 112
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> Macaca mulatta (Rhesus macaque) (Mm_7)
<400> 112
Met Ser His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Tyr Asp Pro
1 5 10 15
Asn Ala Ser Leu Leu Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Asp Ser Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Val Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu
115 120 125
Ser Arg Lys Glu Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro
130 135 140
Phe Phe Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro Val Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Val Ala Arg Thr Asp Ala Ser Gly Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Gly Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr
225 230 235 240
Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu Leu Gly Lys
245 250 255
Ile Leu Met Ala Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met Gln
260 265 270
Met Phe Asn Met Asp Arg Val Asn Val Glu Glu Phe Tyr Glu Val Tyr
275 280 285
Lys Gly Val Val Thr Glu Tyr His Asp Met Val Thr Glu Met Tyr Ser
290 295 300
Gly Pro Cys Val Ala Met Glu Ile Gln Gln Asn Asn Ala Thr Lys Thr
305 310 315 320
Phe Arg Glu Phe Cys Gly Pro Val Asp Pro Glu Ile Ala Arg His Leu
325 330 335
Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys Ile Gln Asn
340 345 350
Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val Gln
355 360 365
Tyr Phe Phe Lys Ile Leu Asp Asn
370 375
<210> 113
<211> 340
<212> PRT
<213> Artificial Sequence
<220>
<223> nucleoside diphosphate kinase 7 b [Pan troglodytes, Chimp]
(CHb_7)
<400> 113
Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys Arg Thr Lys Tyr
1 5 10 15
Asp Asn Leu His Leu Glu Asp Leu Phe Ile Gly Asn Lys Val Asn Val
20 25 30
Phe Ser Arg Gln Leu Val Leu Ile Asp Tyr Gly Asp Gln Tyr Thr Ala
35 40 45
Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala Leu Ile Lys Pro
50 55 60
Asp Ala Ile Ser Lys Ala Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala
65 70 75 80
Gly Phe Thr Ile Thr Lys Leu Lys Met Met Met Leu Ser Arg Lys Glu
85 90 95
Ala Leu Asp Phe His Val Asp His Gln Ser Arg Pro Phe Phe Asn Glu
100 105 110
Leu Ile Gln Phe Ile Thr Thr Gly Pro Ile Ile Ala Met Glu Ile Leu
115 120 125
Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn
130 135 140
Ser Gly Val Ala Arg Thr Asp Ala Ser Glu Ser Ile Arg Ala Leu Phe
145 150 155 160
Gly Thr Asp Gly Ile Arg Asn Ala Ala His Gly Pro Asp Ser Phe Ala
165 170 175
Ser Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser Ser Gly Gly Cys
180 185 190
Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr Cys Cys Ile Val
195 200 205
Lys Pro His Ala Val Ser Glu Gly Leu Leu Gly Lys Ile Leu Met Ala
210 215 220
Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met Gln Met Phe Asn Met
225 230 235 240
Asp Arg Val Asn Val Glu Glu Phe Tyr Glu Val Tyr Lys Gly Val Val
245 250 255
Thr Glu Tyr His Asp Met Val Thr Glu Met Tyr Ser Gly Pro Cys Val
260 265 270
Ala Met Glu Ile Gln Gln Asn Asn Ala Thr Lys Thr Phe Arg Glu Phe
275 280 285
Cys Gly Pro Ala Asp Pro Glu Ile Ala Arg His Ser Arg Pro Gly Thr
290 295 300
Leu Arg Ala Ile Phe Gly Lys Thr Lys Ile Gln Asn Ala Val His Cys
305 310 315 320
Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val Gln Tyr Phe Phe Lys
325 330 335
Ile Leu Asp Asn
340
<210> 114
<211> 377
<212> PRT
<213> Artificial Sequence
<220>
<223> PREDICTED: nucleoside diphosphate kinase 7 isoform X2 (Shx2_7)
[Ovis aries, Sheep]
<400> 114
Met Asn His Ser Glu Arg Phe Val Phe Ile Ala Glu Trp Phe Asp Pro
1 5 10 15
Asn Ala Ser Leu Phe Arg Arg Tyr Glu Leu Leu Phe Tyr Pro Gly Asp
20 25 30
Gly Ser Val Glu Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys
35 40 45
Arg Thr Lys Tyr Glu Asp Leu His Leu Glu Asp Leu Phe Ile Gly Asn
50 55 60
Lys Val Asn Ile Phe Ser Arg Gln Leu Val Leu Leu Asp Tyr Gly Asp
65 70 75 80
Gln Tyr Thr Ala Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala
85 90 95
Leu Ile Lys Pro Asp Ala Val Ser Lys Ala Gly Glu Ile Ile Glu Ile
100 105 110
Ile Asn Lys Ala Gly Phe Thr Leu Thr Lys Leu Lys Met Met Thr Leu
115 120 125
Ser Arg Lys Glu Ala Thr Asp Phe His Ile Asp His Gln Ser Arg Pro
130 135 140
Phe Leu Asn Glu Leu Ile Gln Phe Ile Thr Ser Gly Pro Ile Ile Ala
145 150 155 160
Met Glu Ile Leu Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu
165 170 175
Gly Pro Ala Asn Ser Gly Leu Ala Arg Thr Asp Ala Pro Glu Ser Ile
180 185 190
Arg Ala Leu Phe Gly Thr Asp Gly Ile Lys Asn Ala Ala His Gly Pro
195 200 205
Asp Ser Phe Ala Cys Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser
210 215 220
Ser Gly Val Cys Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr
225 230 235 240
Thr Cys Cys Ile Val Lys Pro His Ala Val Ser Glu Gly Leu Leu Gly
245 250 255
Lys Ile Leu Ile Thr Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met
260 265 270
Gln Met Phe Asn Met Asp Arg Ile Asn Val Glu Glu Phe Tyr Glu Val
275 280 285
Tyr Lys Gly Val Val Ser Glu Tyr Asn Glu Met Val Thr Glu Met Tyr
290 295 300
Ser Gly Pro Cys Val Ala Met Glu Ile Gln Gln Thr Asn Pro Thr Met
305 310 315 320
Thr Phe Arg Glu Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala Arg His
325 330 335
Leu Arg Pro Gly Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys Ile Gln
340 345 350
Asn Ala Val His Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val
355 360 365
Gln Tyr Phe Phe Lys Ile Leu Asp Asn
370 375
<210> 115
<211> 341
<212> PRT
<213> Artificial Sequence
<220>
<223> PREDICTED: nucleoside diphosphate kinase 7 isoform X3 [Ovis
aries, Sheep] (Shx3_7)
<400> 115
Met His Asp Val Lys Asn His Arg Thr Phe Leu Lys Arg Thr Lys Tyr
1 5 10 15
Glu Asp Leu His Leu Glu Asp Leu Phe Ile Gly Asn Lys Val Asn Ile
20 25 30
Phe Ser Arg Gln Leu Val Leu Leu Asp Tyr Gly Asp Gln Tyr Thr Ala
35 40 45
Arg Gln Leu Gly Ser Arg Lys Glu Lys Thr Leu Ala Leu Ile Lys Pro
50 55 60
Asp Ala Val Ser Lys Ala Gly Glu Ile Ile Glu Ile Ile Asn Lys Ala
65 70 75 80
Gly Phe Thr Leu Thr Lys Leu Lys Met Met Thr Leu Ser Arg Lys Glu
85 90 95
Ala Thr Asp Phe His Ile Asp His Gln Ser Arg Pro Phe Leu Asn Glu
100 105 110
Leu Ile Gln Phe Ile Thr Ser Gly Pro Ile Ile Ala Met Glu Ile Leu
115 120 125
Arg Asp Asp Ala Ile Cys Glu Trp Lys Arg Leu Leu Gly Pro Ala Asn
130 135 140
Ser Gly Leu Ala Arg Thr Asp Ala Pro Glu Ser Ile Arg Ala Leu Phe
145 150 155 160
Gly Thr Asp Gly Ile Lys Asn Ala Ala His Gly Pro Asp Ser Phe Ala
165 170 175
Cys Ala Ala Arg Glu Met Glu Leu Phe Phe Pro Ser Ser Gly Val Cys
180 185 190
Gly Pro Ala Asn Thr Ala Lys Phe Thr Asn Cys Thr Thr Cys Cys Ile
195 200 205
Val Lys Pro His Ala Val Ser Glu Gly Leu Leu Gly Lys Ile Leu Ile
210 215 220
Thr Ile Arg Asp Ala Gly Phe Glu Ile Ser Ala Met Gln Met Phe Asn
225 230 235 240
Met Asp Arg Ile Asn Val Glu Glu Phe Tyr Glu Val Tyr Lys Gly Val
245 250 255
Val Ser Glu Tyr Asn Glu Met Val Thr Glu Met Tyr Ser Gly Pro Cys
260 265 270
Val Ala Met Glu Ile Gln Gln Thr Asn Pro Thr Met Thr Phe Arg Glu
275 280 285
Phe Cys Gly Pro Ala Asp Pro Glu Ile Ala Arg His Leu Arg Pro Gly
290 295 300
Thr Leu Arg Ala Ile Phe Gly Lys Thr Lys Ile Gln Asn Ala Val His
305 310 315 320
Cys Thr Asp Leu Pro Glu Asp Gly Leu Leu Glu Val Gln Tyr Phe Phe
325 330 335
Lys Ile Leu Asp Asn
340
<210> 116
<211> 630
<212> PRT
<213> Artificial Sequence
<220>
<223> Mouse MUC1
<400> 116
Met Thr Pro Gly Ile Arg Ala Pro Phe Phe Leu Leu Leu Leu Leu Ala
1 5 10 15
Ser Leu Lys Gly Phe Leu Ala Leu Pro Ser Glu Glu Asn Ser Val Thr
20 25 30
Ser Ser Gln Asp Thr Ser Ser Ser Leu Ala Ser Thr Thr Thr Pro Val
35 40 45
His Ser Ser Asn Ser Asp Pro Ala Thr Arg Pro Pro Gly Asp Ser Thr
50 55 60
Ser Ser Pro Val Gln Ser Ser Thr Ser Ser Pro Ala Thr Arg Ala Pro
65 70 75 80
Glu Asp Ser Thr Ser Thr Ala Val Leu Ser Gly Thr Ser Ser Pro Ala
85 90 95
Thr Thr Ala Pro Val Asn Ser Ala Ser Ser Pro Val Ala His Gly Asp
100 105 110
Thr Ser Ser Pro Ala Thr Ser Leu Ser Lys Asp Ser Asn Ser Ser Pro
115 120 125
Val Val His Ser Gly Thr Ser Ser Ala Ala Thr Thr Ala Pro Val Asp
130 135 140
Ser Thr Ser Ser Pro Val Val His Gly Gly Thr Ser Ser Pro Ala Thr
145 150 155 160
Ser Pro Pro Gly Asp Ser Thr Ser Ser Pro Asp His Ser Ser Thr Ser
165 170 175
Ser Pro Ala Thr Arg Ala Pro Glu Asp Ser Thr Ser Thr Ala Val Leu
180 185 190
Ser Gly Thr Ser Ser Pro Ala Thr Thr Ala Pro Val Asp Ser Thr Ser
195 200 205
Ser Pro Val Ala His Asp Asp Thr Ser Ser Pro Ala Thr Ser Leu Ser
210 215 220
Glu Asp Ser Ala Ser Ser Pro Val Ala His Gly Gly Thr Ser Ser Pro
225 230 235 240
Ala Thr Ser Pro Leu Arg Asp Ser Thr Ser Ser Pro Val His Ser Ser
245 250 255
Ala Ser Ile Gln Asn Ile Lys Thr Thr Ser Asp Leu Ala Ser Thr Pro
260 265 270
Asp His Asn Gly Thr Ser Val Thr Thr Thr Ser Ser Ala Leu Gly Ser
275 280 285
Ala Thr Ser Pro Asp His Ser Gly Thr Ser Thr Thr Thr Asn Ser Ser
290 295 300
Glu Ser Val Leu Ala Thr Thr Pro Val Tyr Ser Ser Met Pro Phe Ser
305 310 315 320
Thr Thr Lys Val Thr Ser Gly Ser Ala Ile Ile Pro Asp His Asn Gly
325 330 335
Ser Ser Val Leu Pro Thr Ser Ser Val Leu Gly Ser Ala Thr Ser Leu
340 345 350
Val Tyr Asn Thr Ser Ala Ile Ala Thr Thr Pro Val Ser Asn Gly Thr
355 360 365
Gln Pro Ser Val Pro Ser Gln Tyr Pro Val Ser Pro Thr Met Ala Thr
370 375 380
Thr Ser Ser His Ser Thr Ile Ala Ser Ser Ser Tyr Tyr Ser Thr Val
385 390 395 400
Pro Phe Ser Thr Phe Ser Ser Asn Ser Ser Pro Gln Leu Ser Val Gly
405 410 415
Val Ser Phe Phe Phe Leu Ser Phe Tyr Ile Gln Asn His Pro Phe Asn
420 425 430
Ser Ser Leu Glu Asp Pro Ser Ser Asn Tyr Tyr Gln Glu Leu Lys Arg
435 440 445
Asn Ile Ser Gly Leu Phe Leu Gln Ile Phe Asn Gly Asp Phe Leu Gly
450 455 460
Ile Ser Ser Ile Lys Phe Arg Ser Gly Ser Val Val Val Glu Ser Thr
465 470 475 480
Val Val Phe Arg Glu Gly Thr Phe Ser Ala Ser Asp Val Lys Ser Gln
485 490 495
Leu Ile Gln His Lys Lys Glu Ala Asp Asp Tyr Asn Leu Thr Ile Ser
500 505 510
Glu Val Lys Val Asn Glu Met Gln Phe Pro Pro Ser Ala Gln Ser Arg
515 520 525
Pro Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Ile
530 535 540
Leu Val Ala Leu Ala Ile Val Tyr Phe Leu Ala Leu Ala Val Cys Gln
545 550 555 560
Cys Arg Arg Lys Ser Tyr Gly Gln Leu Asp Ile Phe Pro Thr Gln Asp
565 570 575
Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg
580 585 590
Tyr Val Pro Pro Gly Ser Thr Lys Arg Ser Pro Tyr Glu Glu Val Ser
595 600 605
Ala Gly Asn Gly Ser Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Val
610 615 620
Thr Thr Ser Ala Asn Leu
625 630
<210> 117
<211> 553
<212> PRT
<213> Artificial Sequence
<220>
<223> Macaca mulatta (rhesus macaque) MUC1, partial
<400> 117
Val Thr Gly Ser Gly His Thr Asn Ser Thr Pro Gly Gly Glu Lys Glu
1 5 10 15
Thr Ser Ala Thr Gln Arg Ser Ser Met Pro Ile Ser Thr Lys Asn Ala
20 25 30
Val Ser Met Thr Ser Arg Leu Ser Ser His Ser Pro Val Ser Gly Ser
35 40 45
Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Leu Ala Thr Glu Pro
50 55 60
Ala Thr Gly Ser Ala Thr Thr Leu Gly His Asn Val Thr Ser Ala Pro
65 70 75 80
Asp Thr Ser Ala Ala Pro Gly Ser Thr Gly Pro Pro Ala Gly Val Val
85 90 95
Thr Ser Ala Pro Asp Thr Ser Ala Ala Pro Gly Ser Thr Gly Pro Pro
100 105 110
Ala Arg Val Val Thr Ser Ala Pro Asp Thr Ser Ala Ala Pro Gly Ser
115 120 125
Thr Gly Pro Pro Ala Arg Val Val Thr Ser Ala Pro Asp Thr Ser Ala
130 135 140
Ala Pro Gly Ser Thr Gly Pro Pro Ala Arg Val Val Thr Ser Ala Pro
145 150 155 160
Asp Thr Ser Ala Ala Pro Gly Ser Thr Gly Pro Pro Ala Arg Val Val
165 170 175
Thr Ser Ala Pro Asp Thr Ser Ala Ala Pro Gly Ser Thr Gly Pro Pro
180 185 190
Ala Arg Val Val Thr Ser Ala Pro Asp Thr Ser Ala Ala Pro Gly Ser
195 200 205
Thr Gly Pro Pro Ala Arg Val Val Thr Ser Ala Pro Asp Thr Ser Ala
210 215 220
Ala Pro Gly Ser Thr Gly Pro Pro Ala Arg Val Val Thr Ser Ala Pro
225 230 235 240
Asp Thr Ser Ala Ala Pro Gly Ser Thr Gly Pro Pro Ala Arg Val Val
245 250 255
Thr Ser Ala Pro Gly Thr Ser Ala Ala Pro Gly Ser Thr Ala Pro Pro
260 265 270
Gly Ser Thr Ala Pro Pro Ala His Asp Val Thr Ser Ala Ser Asp Ser
275 280 285
Ala Ser Gly Ser Ala Ser Thr Leu Val His Ser Thr Thr Ser Ala Arg
290 295 300
Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser
305 310 315 320
His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr
325 330 335
Asp Ala Ser Ser Thr His His Ser Thr Val Pro Pro Phe Thr Ser Asn
340 345 350
His Ser Thr Ser Pro Gln Leu Ser Leu Gly Val Ser Phe Phe Phe Leu
355 360 365
Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro
370 375 380
Ser Thr Asn Tyr Tyr Gln Gln Leu Gln Arg Asp Ile Ser Glu Leu Phe
385 390 395 400
Leu Gln Ile Tyr Lys Gln Gly Asp Phe Leu Gly Leu Ser Asn Ile Met
405 410 415
Phe Arg Pro Gly Ser Val Val Val Gln Ser Thr Leu Val Phe Arg Glu
420 425 430
Gly Thr Thr Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Arg Lys
435 440 445
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Ile Ser Val
450 455 460
Arg Asp Val Pro Phe Pro Phe Ser Ala Gln Thr Gly Ala Gly Val Pro
465 470 475 480
Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Val Leu
485 490 495
Ala Ile Val Tyr Phe Ile Ala Leu Ala Val Cys Gln Cys Arg Gln Lys
500 505 510
Asn Tyr Arg Gln Leu Asp Ile Phe Pro Ala Arg Asp Ala Tyr His Pro
515 520 525
Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg Tyr Val Pro Ala
530 535 540
Gly Gly Thr Asn Arg Ser Pro Tyr Glu
545 550
<210> 118
<211> 482
<212> PRT
<213> Artificial Sequence
<220>
<223> Macaca fascicularis_MUC1 (isoform X1)
<400> 118
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Ile Leu Thr
1 5 10 15
Val Leu Thr Ala Ala Thr Val Pro Glu Pro Thr Thr Val Val Thr Gly
20 25 30
Ser Gly His Thr Asn Ser Thr Pro Gly Gly Glu Lys Glu Thr Ser Ala
35 40 45
Thr Gln Arg Ser Ser Met Pro Ile Ser Thr Lys Asn Ala Val Ser Met
50 55 60
Thr Ser Arg Leu Ser Ser His Ser Pro Val Ser Gly Ser Ser Thr Thr
65 70 75 80
Gln Gly Gln Asp Val Thr Leu Ala Leu Ala Met Glu Ser Ala Thr Gly
85 90 95
Ser Ala Thr Thr Leu Gly His Val Val Thr Ser Ala Pro Asp Thr Ser
100 105 110
Ala Ala Pro Gly Ser Thr Gly Pro Pro Ala His Val Val Thr Ser Ala
115 120 125
Pro Asp Thr Ser Ala Ala Pro Gly Ser Thr Gly Pro Pro Ala His Val
130 135 140
Val Thr Ser Ala Pro Asp Thr Ser Ala Ala Pro Gly Ser Thr Ala Pro
145 150 155 160
Pro Ala His Val Val Thr Ser Ala Pro Asp Thr Ser Ala Ala Pro Gly
165 170 175
Ser Thr Ala Pro Pro Ala His Asp Val Thr Ser Ala Ser Asp Ser Ala
180 185 190
Ser Gly Ser Ala Ser Thr Leu Val His Ser Thr Thr Ser Ala Arg Ala
195 200 205
Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His
210 215 220
His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp
225 230 235 240
Ala Ser Ser Thr His His Ser Thr Val Pro Pro Phe Thr Ser Ser Asn
245 250 255
His Ser Thr Ser Pro Gln Leu Ser Leu Gly Val Ser Phe Phe Phe Leu
260 265 270
Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro
275 280 285
Ser Thr Asn Tyr Tyr Gln Gln Leu Gln Arg Asp Ile Ser Glu Leu Phe
290 295 300
Leu Gln Ile Tyr Lys Gln Gly Asp Phe Leu Gly Leu Ser Asn Ile Met
305 310 315 320
Phe Arg Pro Gly Ser Val Val Val Gln Ser Thr Leu Val Phe Arg Glu
325 330 335
Gly Thr Thr Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Arg Lys
340 345 350
Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Ile Ser Val
355 360 365
Arg Asp Val Pro Phe Pro Phe Ser Ala Gln Thr Gly Ala Gly Val Pro
370 375 380
Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Val Met
385 390 395 400
Ala Ile Val Tyr Phe Ile Ala Leu Ala Val Cys Gln Cys Arg Gln Lys
405 410 415
Asn Tyr Arg Gln Leu Asp Ile Phe Pro Ala Arg Asp Ala Tyr His Pro
420 425 430
Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly Arg Tyr Ala Pro Ala
435 440 445
Gly Gly Thr Asn Arg Ser Pro Tyr Glu Glu Val Ser Ala Gly Asn Gly
450 455 460
Gly Ser Ser Leu Ser Tyr Thr Asn Pro Ala Val Ala Ala Thr Ser Ala
465 470 475 480
Asn Leu
<210> 119
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> Sus scrofa MUC1, partial
<400> 119
Asn Ser Ser Leu Glu Asp Pro Thr Thr Ser Tyr Tyr Lys Asp Leu Gln
1 5 10 15
Arg Arg Ile Ser Glu Leu Phe Leu Gln Val Tyr Lys Glu Asp Gly Leu
20 25 30
Leu Gly Leu Phe Tyr Ile Lys Phe Arg Pro Gly Ser Val Leu Val Glu
35 40 45
Leu Ile Leu Ala Phe Gln Asp Ser Ala Ala Ala His Asn Leu Lys Thr
50 55 60
Gln Phe Asp Arg Leu Lys Ala Glu Ala Gly Thr Tyr Asn Leu Thr Ile
65 70 75 80
Ser Glu Val Ser Val Ile Asp Ala Pro Phe Pro Ser Ser Ala Gln Pro
85 90 95
Gly Ser Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys
100 105 110
Ile Leu Val Ala Leu Ala Ile Ile Tyr Val Ile Ala Leu Ala Val Cys
115 120 125
Gln Cys Arg Arg Lys Asn Cys Gly Gln Leu Asp Ile Phe Pro Thr Arg
130 135 140
Asp Ala Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His Thr His Gly
145 150 155 160
Arg Tyr Val Pro Pro Gly Ser Thr Lys Arg Asn Pro Tyr Glu Gln Val
165 170 175
Ser Ala Gly Asn Gly Gly Gly Ser Leu Ser Tyr Ser Asn Leu Ala Ala
180 185 190
Thr Ser Ala Asn Leu
195
<210> 120
<211> 640
<212> PRT
<213> Artificial Sequence
<220>
<223> Ovis aries MUC1 (Sheep)
<400> 120
Met Thr Pro Asp Ile Gln Ala Pro Phe Leu Ser Leu Leu Leu Leu Phe
1 5 10 15
Gln Val Leu Thr Val Ala Asn Val Thr Met Leu Thr Ala Ser Val Ser
20 25 30
Thr Ser Pro Asn Ser Thr Val Gln Val Ser Ser Thr Gln Ser Ser Pro
35 40 45
Thr Ser Ser Pro Thr Lys Glu Thr Ser Trp Ser Thr Thr Thr Thr Leu
50 55 60
Leu Arg Thr Ser Ser Pro Ala Pro Thr Pro Thr Thr Ser Pro Gly Arg
65 70 75 80
Asp Gly Ala Ser Ser Pro Thr Ser Ser Ala Ala Pro Ser Pro Ala Ala
85 90 95
Ser Ser Ser His Asp Gly Ala Leu Ser Leu Thr Gly Ser Pro Ala Pro
100 105 110
Ser Pro Thr Ala Ser Pro Gly His Gly Gly Thr Leu Thr Thr Thr Ser
115 120 125
Ser Pro Ala Pro Ser Pro Thr Ala Ser Pro Gly His Asp Gly Ala Ser
130 135 140
Thr Pro Thr Ser Ser Pro Ala Pro Ser Pro Ala Ala Ser Pro Gly His
145 150 155 160
Asp Gly Ala Leu Ser Leu Thr Gly Ser Pro Ala Pro Ser Pro Thr Ala
165 170 175
Ser Pro Gly His Gly Gly Thr Leu Thr Thr Thr Ser Ser Pro Ala Pro
180 185 190
Ser Pro Thr Ala Ser Pro Gly His Asp Gly Ala Ser Thr Pro Thr Ser
195 200 205
Ser Pro Ala Pro Ser Pro Ala Ala Ser Ser Ser His Asp Gly Ala Leu
210 215 220
Ser Leu Thr Gly Ser Pro Ala Pro Ser Pro Pro Ala Ser Pro Gly His
225 230 235 240
Gly Gly Thr Leu Thr Thr Thr Ser Ser Pro Ala Pro Ser Pro Thr Ala
245 250 255
Ser Pro Gly His Gly Gly Thr Leu Thr Thr Thr Ser Ser Pro Ala Pro
260 265 270
Ser Pro Thr Ala Ser Pro Gly His Asp Gly Ala Ser Thr Pro Thr Ser
275 280 285
Ser Pro Ala Pro Thr Ala His Ser Ser His Asp Gly Ala Leu Thr Thr
290 295 300
Thr Gly Ser Pro Ala Pro Ser Pro Ala Ala Ser Pro Gly His Asp Ser
305 310 315 320
Val Pro Pro Arg Ala Thr Ser Pro Ala Pro Ser Pro Ala Ala Ser Pro
325 330 335
Gly Gln His Ala Ala Ser Ser Pro Thr Ser Ser Asp Ile Ser Ser Val
340 345 350
Thr Thr Ser Ser Met Ser Ser Ser Met Val Thr Ser Ala His Lys Gly
355 360 365
Thr Ser Ser Arg Ala Thr Thr Thr Pro Val Ser Lys Gly Thr Pro Ser
370 375 380
Ser Val Pro Ser Ser Glu Thr Ala Pro Thr Ala Ala Ser His Ser Thr
385 390 395 400
Arg Thr Ala Ala Ala Ser Thr Ser Pro Ser Thr Ala Leu Ser Thr Ala
405 410 415
Ser His Pro Lys Thr Ser Gln Gln Leu Ser Val Gln Val Ser Leu Phe
420 425 430
Phe Leu Ser Phe Arg Ile Thr Asn Leu Gln Phe Asn Ser Ser Leu Glu
435 440 445
Asn Pro Gln Thr Ser Tyr Tyr Gln Glu Leu Gln Arg Ser Ile Leu Asp
450 455 460
Val Ile Leu Gln Thr Tyr Lys Gln Arg Asp Phe Leu Gly Leu Ser Glu
465 470 475 480
Ile Lys Phe Arg Pro Gly Ser Val Leu Val Asp Leu Thr Leu Ala Phe
485 490 495
Arg Glu Gly Thr Thr Ala Glu Leu Val Lys Ala Gln Phe Ser Gln Leu
500 505 510
Glu Ala His Ala Ala Asn Tyr Ser Leu Thr Ile Ser Gly Val Ser Val
515 520 525
Arg Asp Ala Gln Phe Pro Ser Ser Ala Pro Ser Ala Ser Gly Val Pro
530 535 540
Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu
545 550 555 560
Ala Ile Ile Tyr Leu Ile Ala Leu Val Val Cys Gln Cys Gly Arg Lys
565 570 575
Lys Cys Glu Gln Leu Asp Ile Phe Pro Thr Leu Gly Ala Tyr His Pro
580 585 590
Met Ser Glu Tyr Ser Ala Tyr His Thr His Gly Arg Phe Val Pro Pro
595 600 605
Gly Ser Thr Lys Arg Ser Pro Tyr Glu Glu Val Ser Ala Gly Asn Gly
610 615 620
Gly Ser Asn Leu Ser Tyr Thr Asn Leu Ala Ala Thr Ser Ala Asn Leu
625 630 635 640
Claims (16)
- 비-인간 동물 숙주에서 인간 조직 또는 장기를 생성시키는 방법으로서,
(i) 인간 나이브 상태 줄기세포를 비-인간 동물 숙주의 수정란, 상실배, 배반포, 배아 또는 발생중 태아에 주입하여, 키메라 동물이 생성되도록 하는 단계;
(ii) 키메라 동물의 인간 조직 또는 세포에 의해 분비되거나 이로 제조된 인간 조직, 장기, 세포 또는 인자를 수확하는 단계;를 포함하고,
상기 나이브 상태 줄기세포는 NME7, NME7-AB, NME7-X1, NME6 및 이량성 NME1로 이루어진 군으로부터 선택된 하나 이상의 NME 단백질, 또는 2i 억제제를 분리된 인간 줄기세포에 처리하여 생성된 나이브 상태 줄기세포인 것인, 방법. - 제1항에 있어서, 상기 나이브 줄기 세포는 NME7, NME7-AB, NME6, NME7-X1 또는 이량성 NME1을 함유하는 배지에서 재프로그래밍된 iPS 세포인, 방법.
- 제1항에 있어서, 상기 나이브 줄기 세포는 NME7, NME7-AB, NME6, NME7-X1 또는 이량성 NME1을 함유하는 배지에서 배양된 배아 줄기 세포인, 방법..
- 제1항에 있어서, 상기 배반포 또는 배아의 비-인간 세포가 유전적으로 변형된, 방법.
- 제4항에 있어서, 상기 유전적 변형으로 인해 특정 조직 또는 장기를 생성할 수 없는 숙주 동물이 생성되는, 방법.
- 제1항에 있어서, 줄기 세포를 나이브 상태로 유지하거나, 프라임드 줄기 세포를 나이브 상태로 되돌리는 제제가 NME 단백질 또는 2i 억제제인, 방법.
- 제6항에 있어서, 상기 NME 단백질은 NME1 이량체, NME7 단량체, NME7-AB, NME6 이량체 또는 박테리아 NME인, 방법.
- 제1항에 있어서, 비-인간 동물은 설치류, 돼지, 소, 양 또는 영장류인, 방법.
- 제8항에 있어서, 상기 설치류는 마우스 또는 래트인, 방법.
- 제2항에 있어서, 상기 NME 단백질이 단일 성장 인자로서 무혈청 배지내에 존재하는, 방법.
- 제1항에 있어서, 상기 비-인간 동물 숙주는 생성되는 줄기 세포의 종의 천연 서열과 상동인 서열을 갖는 NME 단백질을 발현하는, 방법.
- 제11항에 있어서, 상기 NME 단백질은 NME7, NME7-AB, NME7-X1 또는 이량성 NME1 또는 NME6인, 방법.
- 제12항에 있어서, 상기 NME 단백질이 NME7인, 방법.
- 제11항에 있어서, 상기 NME 단백질은 생성되는 줄기 세포의 종의 천연 NME 단백질 서열과 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 또는 95% 상동인, 방법.
- 제14항에 있어서, 상기 NME 단백질은 생성되는 줄기 세포의 종의 천연 서열과 적어도 60% 상동인, 방법.
- 제14항에 있어서, 상기 NME 단백질은 생성되는 줄기 세포의 종의 천연 서열과 적어도 70% 상동인, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562187638P | 2015-07-01 | 2015-07-01 | |
US62/187,638 | 2015-07-01 | ||
US201562234035P | 2015-09-29 | 2015-09-29 | |
US62/234,035 | 2015-09-29 | ||
PCT/US2016/040880 WO2017004601A1 (en) | 2015-07-01 | 2016-07-01 | Method of stem cell-based organ and tissue generation |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187003027A Division KR20180032583A (ko) | 2015-07-01 | 2016-07-01 | 줄기 세포-기반 장기 및 조직 생성 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210045513A true KR20210045513A (ko) | 2021-04-26 |
Family
ID=57609442
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217011287A KR20210045513A (ko) | 2015-07-01 | 2016-07-01 | 줄기 세포-기반 장기 및 조직 생성 방법 |
KR1020187003027A KR20180032583A (ko) | 2015-07-01 | 2016-07-01 | 줄기 세포-기반 장기 및 조직 생성 방법 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020187003027A KR20180032583A (ko) | 2015-07-01 | 2016-07-01 | 줄기 세포-기반 장기 및 조직 생성 방법 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20180235193A1 (ko) |
EP (1) | EP3316682A4 (ko) |
JP (1) | JP2018520682A (ko) |
KR (2) | KR20210045513A (ko) |
CN (1) | CN107920501A (ko) |
AU (1) | AU2016287603A1 (ko) |
CA (1) | CA2991125A1 (ko) |
IL (1) | IL256549A (ko) |
WO (1) | WO2017004601A1 (ko) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120156246A1 (en) * | 2010-06-16 | 2012-06-21 | Bamdad Cynthia C | Reprogramming cancer cells |
CN102397115A (zh) * | 2011-07-10 | 2012-04-04 | 黄必录 | 避免器官移植排斥的方案 |
CN109456932A (zh) * | 2011-10-17 | 2019-03-12 | 米纳瓦生物技术公司 | 用于干细胞增殖和诱导的培养基 |
CN105164249A (zh) * | 2012-07-13 | 2015-12-16 | 米纳瓦生物技术公司 | 用于诱导细胞至较不成熟状态的方法 |
EP2954777A4 (en) * | 2013-01-29 | 2016-11-09 | Univ Tokyo | METHOD FOR PRODUCING A CHIMERIC ANIMAL |
AU2014218872A1 (en) * | 2013-02-20 | 2015-10-08 | Minerva Biotechnologies Corporation | NME inhibitors and methods of using NME inhibitors |
-
2016
- 2016-07-01 EP EP16818944.7A patent/EP3316682A4/en not_active Withdrawn
- 2016-07-01 CN CN201680050194.3A patent/CN107920501A/zh active Pending
- 2016-07-01 KR KR1020217011287A patent/KR20210045513A/ko not_active Application Discontinuation
- 2016-07-01 CA CA2991125A patent/CA2991125A1/en not_active Abandoned
- 2016-07-01 US US15/740,654 patent/US20180235193A1/en not_active Abandoned
- 2016-07-01 KR KR1020187003027A patent/KR20180032583A/ko not_active IP Right Cessation
- 2016-07-01 AU AU2016287603A patent/AU2016287603A1/en not_active Abandoned
- 2016-07-01 JP JP2018500321A patent/JP2018520682A/ja active Pending
- 2016-07-01 WO PCT/US2016/040880 patent/WO2017004601A1/en unknown
-
2017
- 2017-12-25 IL IL256549A patent/IL256549A/en unknown
Also Published As
Publication number | Publication date |
---|---|
KR20180032583A (ko) | 2018-03-30 |
US20180235193A1 (en) | 2018-08-23 |
CA2991125A1 (en) | 2017-01-05 |
EP3316682A4 (en) | 2019-01-23 |
WO2017004601A1 (en) | 2017-01-05 |
JP2018520682A (ja) | 2018-08-02 |
CN107920501A (zh) | 2018-04-17 |
IL256549A (en) | 2018-02-28 |
EP3316682A1 (en) | 2018-05-09 |
AU2016287603A1 (en) | 2018-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11976295B2 (en) | Media for stem cell proliferation and induction | |
WO2005090557A1 (ja) | 多能性幹細胞の増殖方法 | |
US20220193270A1 (en) | Method for enhancing tumor growth | |
AU2021200429B2 (en) | Method for enhancing tumor growth | |
AU2019203098B2 (en) | NME variant species expression and suppression | |
JP2022101564A (ja) | より未分化状態への細胞の誘導方法 | |
KR20210045513A (ko) | 줄기 세포-기반 장기 및 조직 생성 방법 | |
WO2009055868A1 (en) | Process and compositions for culturing cells |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |