MXPA00010275A - Proteinas humanas que tienen dominios de transmembrana y adns que codifican para estas - Google Patents
Proteinas humanas que tienen dominios de transmembrana y adns que codifican para estasInfo
- Publication number
- MXPA00010275A MXPA00010275A MXPA/A/2000/010275A MXPA00010275A MXPA00010275A MX PA00010275 A MXPA00010275 A MX PA00010275A MX PA00010275 A MXPA00010275 A MX PA00010275A MX PA00010275 A MXPA00010275 A MX PA00010275A
- Authority
- MX
- Mexico
- Prior art keywords
- leu
- val
- gly
- glu
- ser
- Prior art date
Links
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 289
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 289
- 102000003839 Human Proteins Human genes 0.000 title abstract description 14
- 108090000144 Human Proteins Proteins 0.000 title abstract description 14
- 229920002676 Complementary DNA Polymers 0.000 claims abstract description 99
- 239000002299 complementary DNA Substances 0.000 claims abstract description 74
- 230000014509 gene expression Effects 0.000 claims abstract description 51
- 229920003013 deoxyribonucleic acid Polymers 0.000 claims abstract description 48
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 2
- 210000004027 cells Anatomy 0.000 claims description 122
- 238000000338 in vitro Methods 0.000 claims description 22
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 14
- 230000001131 transforming Effects 0.000 claims description 7
- 241000282414 Homo sapiens Species 0.000 abstract description 71
- 239000012528 membrane Substances 0.000 abstract description 18
- 235000018102 proteins Nutrition 0.000 description 279
- 230000000694 effects Effects 0.000 description 57
- 241000880493 Leptailurus serval Species 0.000 description 40
- 229940014598 TAC Drugs 0.000 description 39
- 229920000023 polynucleotide Polymers 0.000 description 39
- 239000002157 polynucleotide Substances 0.000 description 39
- 210000001519 tissues Anatomy 0.000 description 39
- STTYIMSDIYISRG-WDSKDSINSA-N Val-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(O)=O STTYIMSDIYISRG-WDSKDSINSA-N 0.000 description 35
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 34
- 150000001413 amino acids Chemical class 0.000 description 34
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 33
- 108010057821 leucylproline Proteins 0.000 description 33
- 108010061238 threonyl-glycine Proteins 0.000 description 32
- 108010062796 arginyllysine Proteins 0.000 description 30
- 108010054155 lysyllysine Proteins 0.000 description 30
- 108010050848 glycylleucine Proteins 0.000 description 29
- IOUPEELXVYPCPG-UHFFFAOYSA-N val-gly Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 29
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 28
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 28
- JYOAXOMPIXKMKK-UHFFFAOYSA-N Leucyl-Glutamine Chemical compound CC(C)CC(N)C(=O)NC(C(O)=O)CCC(N)=O JYOAXOMPIXKMKK-UHFFFAOYSA-N 0.000 description 27
- 210000001744 T-Lymphocytes Anatomy 0.000 description 26
- 125000000539 amino acid group Chemical group 0.000 description 26
- 230000027455 binding Effects 0.000 description 26
- 239000000243 solution Substances 0.000 description 25
- RFCVXVPWSPOMFJ-UHFFFAOYSA-N 2-[(2-azaniumyl-3-phenylpropanoyl)amino]-4-methylpentanoate Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-UHFFFAOYSA-N 0.000 description 24
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 24
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 24
- 239000000047 product Substances 0.000 description 24
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 23
- 239000000427 antigen Substances 0.000 description 23
- 102000038129 antigens Human genes 0.000 description 23
- 108091007172 antigens Proteins 0.000 description 23
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 22
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 22
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 22
- GVRKWABULJAONN-UHFFFAOYSA-N Valyl-Threonine Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(O)=O GVRKWABULJAONN-UHFFFAOYSA-N 0.000 description 22
- 238000004166 bioassay Methods 0.000 description 22
- 108010034529 leucyl-lysine Proteins 0.000 description 22
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 21
- 108010089804 glycyl-threonine Proteins 0.000 description 21
- 230000002401 inhibitory effect Effects 0.000 description 21
- 108010090894 prolylleucine Proteins 0.000 description 21
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 20
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 20
- 102000005962 receptors Human genes 0.000 description 20
- 108020003175 receptors Proteins 0.000 description 20
- 230000015572 biosynthetic process Effects 0.000 description 19
- 201000010099 disease Diseases 0.000 description 19
- 239000003446 ligand Substances 0.000 description 19
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 18
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 18
- 210000002435 Tendons Anatomy 0.000 description 18
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 18
- 230000000875 corresponding Effects 0.000 description 18
- 108010081551 glycylphenylalanine Proteins 0.000 description 18
- 108010073101 phenylalanylleucine Proteins 0.000 description 18
- 108010073969 valyllysine Proteins 0.000 description 18
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 17
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 17
- 108010047857 aspartylglycine Proteins 0.000 description 17
- 239000000203 mixture Substances 0.000 description 17
- 108010080629 tryptophan-leucine Proteins 0.000 description 17
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 16
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 16
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 16
- YKRQRPFODDJQTC-UHFFFAOYSA-N Threoninyl-Lysine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CCCCN YKRQRPFODDJQTC-UHFFFAOYSA-N 0.000 description 16
- 108010038633 aspartylglutamate Proteins 0.000 description 16
- 210000003041 Ligaments Anatomy 0.000 description 15
- 108010077245 asparaginyl-proline Proteins 0.000 description 15
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 15
- 230000028993 immune response Effects 0.000 description 15
- 230000001939 inductive effect Effects 0.000 description 15
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 15
- YOKVEHGYYQEQOP-QWRGUYRKSA-N 2-[[(2S)-2-[[(2S)-2-azaniumyl-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]acetate Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 14
- UKGGPJNBONZZCM-WDSKDSINSA-N Aspartyl-L-proline Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 14
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 14
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 14
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 14
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 14
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 14
- 125000000267 glycino group Chemical group [H]N([*])C([H])([H])C(=O)O[H] 0.000 description 14
- 230000012010 growth Effects 0.000 description 14
- 230000003993 interaction Effects 0.000 description 14
- 108010000761 leucylarginine Proteins 0.000 description 14
- 238000000034 method Methods 0.000 description 14
- 108010051242 phenylalanylserine Proteins 0.000 description 14
- 229920000160 (ribonucleotides)n+m Polymers 0.000 description 13
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 13
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 13
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 13
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 13
- JPNRPAJITHRXRH-UHFFFAOYSA-N Lysyl-Asparagine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC(N)=O JPNRPAJITHRXRH-UHFFFAOYSA-N 0.000 description 13
- 102000018697 Membrane Proteins Human genes 0.000 description 13
- 108010052285 Membrane Proteins Proteins 0.000 description 13
- FADYJNXDPBKVCA-UHFFFAOYSA-N Phenylalanyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 13
- 230000004069 differentiation Effects 0.000 description 13
- 238000005755 formation reaction Methods 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 13
- 230000035755 proliferation Effects 0.000 description 13
- LQJAALCCPOTJGB-YUMQZZPRSA-N (2S)-1-[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 12
- ICYRCNICGBJLGM-HJGDQZAQSA-N (2S)-2-[[(2S,3R)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 12
- MGHKSHCBDXNTHX-UHFFFAOYSA-N 4-amino-5-[(4-amino-1-carboxy-4-oxobutyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CCC(N)=O)C(O)=O MGHKSHCBDXNTHX-UHFFFAOYSA-N 0.000 description 12
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 12
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 12
- OMSMPWHEGLNQOD-UHFFFAOYSA-N Asparaginyl-Phenylalanine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UHFFFAOYSA-N 0.000 description 12
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 12
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 12
- 206010028980 Neoplasm Diseases 0.000 description 12
- PWIQCLSQVQBOQV-AAEUAGOBSA-N Trp-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 PWIQCLSQVQBOQV-AAEUAGOBSA-N 0.000 description 12
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 12
- 108010060035 arginylproline Proteins 0.000 description 12
- 108010093581 aspartyl-proline Proteins 0.000 description 12
- 230000000903 blocking Effects 0.000 description 12
- 239000003795 chemical substances by application Substances 0.000 description 12
- 108010091871 leucylmethionine Proteins 0.000 description 12
- 230000036961 partial Effects 0.000 description 12
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 11
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 11
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 11
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 11
- KAKJTZWHIUWTTD-VQVTYTSYSA-N Met-Thr Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)O)C([O-])=O KAKJTZWHIUWTTD-VQVTYTSYSA-N 0.000 description 11
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 11
- 239000001963 growth media Substances 0.000 description 11
- 108010017391 lysylvaline Proteins 0.000 description 11
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 10
- NPDLYUOYAGBHFB-UHFFFAOYSA-N Asparaginyl-Arginine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N NPDLYUOYAGBHFB-UHFFFAOYSA-N 0.000 description 10
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 10
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 10
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 10
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 10
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 10
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 10
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 10
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 10
- 108010068380 arginylarginine Proteins 0.000 description 10
- 230000001413 cellular Effects 0.000 description 10
- 239000003814 drug Substances 0.000 description 10
- STKYPAFSDFAEPH-LURJTMIESA-N gly-val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 10
- 108010077515 glycylproline Proteins 0.000 description 10
- 230000001900 immune effect Effects 0.000 description 10
- 108010038320 lysylphenylalanine Proteins 0.000 description 10
- 108010056582 methionylglutamic acid Proteins 0.000 description 10
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 10
- UKKNTTCNGZLJEX-UHFFFAOYSA-N γ-glutamyl-Serine Chemical compound NC(=O)CCC(N)C(=O)NC(CO)C(O)=O UKKNTTCNGZLJEX-UHFFFAOYSA-N 0.000 description 10
- QXRNAOYBCYVZCD-BQBZGAKWSA-N (2S)-6-amino-2-[[(2S)-2-aminopropanoyl]amino]hexanoic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN QXRNAOYBCYVZCD-BQBZGAKWSA-N 0.000 description 9
- 102100010034 AKAP17A Human genes 0.000 description 9
- 101710037404 AKAP17A Proteins 0.000 description 9
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 9
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 9
- VGRHZPNRCLAHQA-UHFFFAOYSA-N Aspartyl-Asparagine Chemical compound OC(=O)CC(N)C(=O)NC(CC(N)=O)C(O)=O VGRHZPNRCLAHQA-UHFFFAOYSA-N 0.000 description 9
- ZVDPYSVOZFINEE-UHFFFAOYSA-N Aspartyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(O)=O ZVDPYSVOZFINEE-UHFFFAOYSA-N 0.000 description 9
- 210000000988 Bone and Bones Anatomy 0.000 description 9
- 241000244203 Caenorhabditis elegans Species 0.000 description 9
- SSHIXEILTLPAQT-UHFFFAOYSA-N Glutaminyl-Aspartate Chemical compound NC(=O)CCC(N)C(=O)NC(CC(O)=O)C(O)=O SSHIXEILTLPAQT-UHFFFAOYSA-N 0.000 description 9
- ARPVSMCNIDAQBO-UHFFFAOYSA-N Glutaminyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CCC(N)=O ARPVSMCNIDAQBO-UHFFFAOYSA-N 0.000 description 9
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 9
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 9
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 9
- XUJNEKJLAYXESH-REOHCLBHSA-N L-cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 9
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 9
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 9
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 9
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 9
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 9
- 229920000320 RNA (poly(A)) Polymers 0.000 description 9
- 108020004412 RNA 3' Polyadenylation Signals Proteins 0.000 description 9
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 9
- XXDVDTMEVBYRPK-XPUUQOCRSA-N Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O XXDVDTMEVBYRPK-XPUUQOCRSA-N 0.000 description 9
- 108010092854 aspartyllysine Proteins 0.000 description 9
- 229940079593 drugs Drugs 0.000 description 9
- 239000003102 growth factor Substances 0.000 description 9
- 230000003394 haemopoietic Effects 0.000 description 9
- 108010064235 lysylglycine Proteins 0.000 description 9
- 108010005942 methionylglycine Proteins 0.000 description 9
- 238000002360 preparation method Methods 0.000 description 9
- 230000002265 prevention Effects 0.000 description 9
- 108010031719 prolyl-serine Proteins 0.000 description 9
- 230000001629 suppression Effects 0.000 description 9
- 210000004881 tumor cells Anatomy 0.000 description 9
- 108010078580 tyrosylleucine Proteins 0.000 description 9
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 8
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 8
- 102000004127 Cytokines Human genes 0.000 description 8
- 108090000695 Cytokines Proteins 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- 206010017758 Gastric cancer Diseases 0.000 description 8
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 8
- MRVYVEQPNDSWLH-UHFFFAOYSA-N Glutaminyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O MRVYVEQPNDSWLH-UHFFFAOYSA-N 0.000 description 8
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 8
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 8
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 8
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 8
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 8
- XWOBNBRUDDUEEY-UWVGGRQHSA-N Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XWOBNBRUDDUEEY-UWVGGRQHSA-N 0.000 description 8
- NTISAKGPIGTIJJ-IUCAKERBSA-N Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C NTISAKGPIGTIJJ-IUCAKERBSA-N 0.000 description 8
- BQVUABVGYYSDCJ-ZFWWWQNUSA-N Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-ZFWWWQNUSA-N 0.000 description 8
- 210000004698 Lymphocytes Anatomy 0.000 description 8
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 8
- SBMNPABNWKXNBJ-UHFFFAOYSA-N Serinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CO SBMNPABNWKXNBJ-UHFFFAOYSA-N 0.000 description 8
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 8
- UBAQSAUDKMIEQZ-QWRGUYRKSA-N Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBAQSAUDKMIEQZ-QWRGUYRKSA-N 0.000 description 8
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 8
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 8
- 102000004965 antibodies Human genes 0.000 description 8
- 108090001123 antibodies Proteins 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- KZNQNBZMBZJQJO-YFKPBYRVSA-N gly pro Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 8
- 108010037850 glycylvaline Proteins 0.000 description 8
- 239000003112 inhibitor Substances 0.000 description 8
- 238000009114 investigational therapy Methods 0.000 description 8
- 108010053725 prolylvaline Proteins 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 230000003248 secreting Effects 0.000 description 8
- 108010026333 seryl-proline Proteins 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 201000011549 stomach cancer Diseases 0.000 description 8
- PVMPDMIKUVNOBD-CIUDSAMLSA-N (3S)-3-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-[[(1S)-1-carboxy-2-hydroxyethyl]amino]-4-oxobutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 7
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 7
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 7
- OELDIVRKHTYFNG-UHFFFAOYSA-N Cysteinyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CS OELDIVRKHTYFNG-UHFFFAOYSA-N 0.000 description 7
- CLSDNFWKGFJIBZ-UHFFFAOYSA-N Glutaminyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CCC(N)=O CLSDNFWKGFJIBZ-UHFFFAOYSA-N 0.000 description 7
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 7
- 241000282412 Homo Species 0.000 description 7
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 7
- DVCSNHXRZUVYAM-BQBZGAKWSA-N Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O DVCSNHXRZUVYAM-BQBZGAKWSA-N 0.000 description 7
- 210000004185 Liver Anatomy 0.000 description 7
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 7
- 229960000856 Protein C Drugs 0.000 description 7
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 7
- FFOKMZOAVHEWET-UHFFFAOYSA-N Serinyl-Cysteine Chemical compound OCC(N)C(=O)NC(CS)C(O)=O FFOKMZOAVHEWET-UHFFFAOYSA-N 0.000 description 7
- LDEBVRIURYMKQS-UHFFFAOYSA-N Serinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CO LDEBVRIURYMKQS-UHFFFAOYSA-N 0.000 description 7
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfizole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 7
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 7
- CKHWEVXPLJBEOZ-UHFFFAOYSA-N Threoninyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)C(C)O CKHWEVXPLJBEOZ-UHFFFAOYSA-N 0.000 description 7
- LYMVXFSTACVOLP-ZFWWWQNUSA-N Trp-Leu Chemical compound C1=CC=C2C(C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 LYMVXFSTACVOLP-ZFWWWQNUSA-N 0.000 description 7
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 7
- ZSXJENBJGRHKIG-UHFFFAOYSA-N Tyrosyl-Serine Chemical compound OCC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UHFFFAOYSA-N 0.000 description 7
- BNQVUHQWZGTIBX-IUCAKERBSA-N Val-His Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CN=CN1 BNQVUHQWZGTIBX-IUCAKERBSA-N 0.000 description 7
- WPSXZFTVLIAPCN-UHFFFAOYSA-N Valyl-Cysteine Chemical compound CC(C)C(N)C(=O)NC(CS)C(O)=O WPSXZFTVLIAPCN-UHFFFAOYSA-N 0.000 description 7
- 235000001014 amino acid Nutrition 0.000 description 7
- 108010013835 arginine glutamate Proteins 0.000 description 7
- 230000001419 dependent Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 108010078144 glutaminyl-glycine Proteins 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine zwitterion Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 108010012581 phenylalanylglutamate Proteins 0.000 description 7
- 238000001556 precipitation Methods 0.000 description 7
- 108010029020 prolylglycine Proteins 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- LZDNBBYBDGBADK-KBPBESRZSA-N (2S)-2-[[(2S)-2-amino-3-methylbutanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-KBPBESRZSA-N 0.000 description 6
- DGVVWUTYPXICAM-UHFFFAOYSA-N 2-mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 6
- XMBSYZWANAQXEV-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-phenylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 6
- TUTIHHSZKFBMHM-UHFFFAOYSA-N 4-amino-5-[(3-amino-1-carboxy-3-oxopropyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O TUTIHHSZKFBMHM-UHFFFAOYSA-N 0.000 description 6
- MPZWMIIOPAPAKE-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-4-(diaminomethylideneamino)butyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CCCN=C(N)N MPZWMIIOPAPAKE-UHFFFAOYSA-N 0.000 description 6
- JQDFGZKKXBEANU-UHFFFAOYSA-N Alanyl-Cysteine Chemical compound CC(N)C(=O)NC(CS)C(O)=O JQDFGZKKXBEANU-UHFFFAOYSA-N 0.000 description 6
- XNSKSTRGQIPTSE-UHFFFAOYSA-N Arginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCCNC(N)=N XNSKSTRGQIPTSE-UHFFFAOYSA-N 0.000 description 6
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 6
- GSMPSRPMQQDRIB-WHFBIAKZSA-N Asp-Gln Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O GSMPSRPMQQDRIB-WHFBIAKZSA-N 0.000 description 6
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 6
- QJMCHPGWFZZRID-UHFFFAOYSA-N Asparaginyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC(N)=O QJMCHPGWFZZRID-UHFFFAOYSA-N 0.000 description 6
- 206010003816 Autoimmune disease Diseases 0.000 description 6
- 210000003719 B-Lymphocytes Anatomy 0.000 description 6
- 101700060761 COS7 Proteins 0.000 description 6
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 6
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 6
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 6
- AJHCSUXXECOXOY-NSHDSACASA-N Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-NSHDSACASA-N 0.000 description 6
- 108010004250 Inhibins Proteins 0.000 description 6
- 102000002746 Inhibins Human genes 0.000 description 6
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 6
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 6
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 6
- PBOUVYGPDSARIS-IUCAKERBSA-N Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C PBOUVYGPDSARIS-IUCAKERBSA-N 0.000 description 6
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 6
- JMEWFDUAFKVAAT-UHFFFAOYSA-N Methionyl-Asparagine Chemical compound CSCCC(N)C(=O)NC(C(O)=O)CC(N)=O JMEWFDUAFKVAAT-UHFFFAOYSA-N 0.000 description 6
- 108010066427 N-valyltryptophan Proteins 0.000 description 6
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 6
- KLAONOISLHWJEE-UHFFFAOYSA-N Phenylalanyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KLAONOISLHWJEE-UHFFFAOYSA-N 0.000 description 6
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 6
- LZLREEUGSYITMX-UHFFFAOYSA-N Serinyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CO)N)C(O)=O)=CNC2=C1 LZLREEUGSYITMX-UHFFFAOYSA-N 0.000 description 6
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 6
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 6
- 108010068265 aspartyltyrosine Proteins 0.000 description 6
- 230000003399 chemotactic Effects 0.000 description 6
- 108010016616 cysteinylglycine Proteins 0.000 description 6
- 108010060199 cysteinylproline Proteins 0.000 description 6
- 108010020688 glycylhistidine Proteins 0.000 description 6
- 108010015792 glycyllysine Proteins 0.000 description 6
- 108010084389 glycyltryptophan Proteins 0.000 description 6
- 108010036413 histidylglycine Proteins 0.000 description 6
- 230000002209 hydrophobic Effects 0.000 description 6
- 239000000893 inhibin Substances 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 6
- 108010044655 lysylproline Proteins 0.000 description 6
- 102000027675 major histocompatibility complex family Human genes 0.000 description 6
- 108091007937 major histocompatibility complex family Proteins 0.000 description 6
- 108010085203 methionylmethionine Proteins 0.000 description 6
- 201000008968 osteosarcoma Diseases 0.000 description 6
- 108010084572 phenylalanyl-valine Proteins 0.000 description 6
- 102000004196 processed proteins & peptides Human genes 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 108010077112 prolyl-proline Proteins 0.000 description 6
- 108010070643 prolylglutamic acid Proteins 0.000 description 6
- 108010071207 serylmethionine Proteins 0.000 description 6
- 230000000638 stimulation Effects 0.000 description 6
- 108010038745 tryptophylglycine Proteins 0.000 description 6
- 108010051110 tyrosyl-lysine Proteins 0.000 description 6
- 108010020532 tyrosyl-proline Proteins 0.000 description 6
- SITLTJHOQZFJGG-XPUUQOCRSA-N α-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 6
- SOYWRINXUSUWEQ-DLOVCJGASA-N (4S)-4-amino-5-[[(2S)-1-[[(1S)-1-carboxy-2-methylpropyl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-oxopentanoic acid Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 5
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 5
- QADCERNTBWTXFV-JSGCOSHPSA-N Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(O)=O)=CNC2=C1 QADCERNTBWTXFV-JSGCOSHPSA-N 0.000 description 5
- JSLGXODUIAFWCF-UHFFFAOYSA-N Arginyl-Asparagine Chemical compound NC(N)=NCCCC(N)C(=O)NC(CC(N)=O)C(O)=O JSLGXODUIAFWCF-UHFFFAOYSA-N 0.000 description 5
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 5
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 5
- VBKIFHUVGLOJKT-UHFFFAOYSA-N Asparaginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(N)=O VBKIFHUVGLOJKT-UHFFFAOYSA-N 0.000 description 5
- NTQDELBZOMWXRS-UHFFFAOYSA-N Aspartyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(O)=O NTQDELBZOMWXRS-UHFFFAOYSA-N 0.000 description 5
- 210000000845 Cartilage Anatomy 0.000 description 5
- ZSRSLWKGWFFVCM-WDSKDSINSA-N Cys-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O ZSRSLWKGWFFVCM-WDSKDSINSA-N 0.000 description 5
- 229950003499 FIBRIN Drugs 0.000 description 5
- 102000009123 Fibrin Human genes 0.000 description 5
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 5
- 108010073385 Fibrin Proteins 0.000 description 5
- 229940028334 Follicle Stimulating Hormone Drugs 0.000 description 5
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 5
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 5
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 5
- 206010018651 Graft versus host disease Diseases 0.000 description 5
- 208000009329 Graft vs Host Disease Diseases 0.000 description 5
- 206010022114 Injury Diseases 0.000 description 5
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 5
- ZUKPVRWZDMRIEO-VKHMYHEASA-N L-cysteinylglycine zwitterion Chemical compound SC[C@H]([NH3+])C(=O)NCC([O-])=O ZUKPVRWZDMRIEO-VKHMYHEASA-N 0.000 description 5
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 5
- XBZOQGHZGQLEQO-IUCAKERBSA-N Lys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN XBZOQGHZGQLEQO-IUCAKERBSA-N 0.000 description 5
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- 108020004999 Messenger RNA Proteins 0.000 description 5
- WEDDFMCSUNNZJR-WDSKDSINSA-N Met-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O WEDDFMCSUNNZJR-WDSKDSINSA-N 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 229920000272 Oligonucleotide Polymers 0.000 description 5
- 102000017975 Protein C Human genes 0.000 description 5
- 241000700159 Rattus Species 0.000 description 5
- PBUXMVYWOSKHMF-WDSKDSINSA-N Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO PBUXMVYWOSKHMF-WDSKDSINSA-N 0.000 description 5
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 5
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 5
- RZEQTVHJZCIUBT-UHFFFAOYSA-N Serinyl-Arginine Chemical compound OCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-UHFFFAOYSA-N 0.000 description 5
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 5
- APIDTRXFGYOLLH-VQVTYTSYSA-N Thr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O APIDTRXFGYOLLH-VQVTYTSYSA-N 0.000 description 5
- AUEJLPRZGVVDNU-STQMWFEESA-N Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-STQMWFEESA-N 0.000 description 5
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 5
- 229960005356 Urokinase Drugs 0.000 description 5
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 5
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 5
- 108010044940 alanylglutamine Proteins 0.000 description 5
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 239000007853 buffer solution Substances 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 201000009910 diseases by infectious agent Diseases 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 239000000727 fraction Substances 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 102000037240 fusion proteins Human genes 0.000 description 5
- 238000001415 gene therapy Methods 0.000 description 5
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 5
- 239000008187 granular material Substances 0.000 description 5
- 230000001976 improved Effects 0.000 description 5
- 230000004054 inflammatory process Effects 0.000 description 5
- 230000001404 mediated Effects 0.000 description 5
- 229920002106 messenger RNA Polymers 0.000 description 5
- 108010068488 methionylphenylalanine Proteins 0.000 description 5
- 244000005700 microbiome Species 0.000 description 5
- 108060005018 mobB Proteins 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 210000000056 organs Anatomy 0.000 description 5
- 230000001737 promoting Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 108010048818 seryl-histidine Proteins 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 230000004936 stimulating Effects 0.000 description 5
- 230000002194 synthesizing Effects 0.000 description 5
- SIGGQAHUPUBWNF-UHFFFAOYSA-N γ-glutamyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CCC(N)=O SIGGQAHUPUBWNF-UHFFFAOYSA-N 0.000 description 5
- VKVDRTGWLVZJOM-DCAQKATOSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 4
- AAKRWBIIGKPOKQ-ONGXEEELSA-N 2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 4
- PMGDADKJMCOXHX-BQBZGAKWSA-N Arg-Gln Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PMGDADKJMCOXHX-BQBZGAKWSA-N 0.000 description 4
- ROWCTNFEMKOIFQ-YUMQZZPRSA-N Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N ROWCTNFEMKOIFQ-YUMQZZPRSA-N 0.000 description 4
- 210000000170 Cell Membrane Anatomy 0.000 description 4
- NXTYATMDWQYLGJ-UHFFFAOYSA-N Cysteinyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CS NXTYATMDWQYLGJ-UHFFFAOYSA-N 0.000 description 4
- 102000033147 ERVK-25 Human genes 0.000 description 4
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 4
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 4
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 4
- HHSJMSCOLJVTCX-UHFFFAOYSA-N Glutaminyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCC(N)=O HHSJMSCOLJVTCX-UHFFFAOYSA-N 0.000 description 4
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 4
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 4
- 210000003734 Kidney Anatomy 0.000 description 4
- JXNRXNCCROJZFB-RYUDHWBXSA-N L-tyrosyl-L-arginine Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JXNRXNCCROJZFB-RYUDHWBXSA-N 0.000 description 4
- 101700021119 LEUC Proteins 0.000 description 4
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 4
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 4
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 4
- YZMPDHTZJJCGEI-BQBZGAKWSA-N Ser-His Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 YZMPDHTZJJCGEI-BQBZGAKWSA-N 0.000 description 4
- 210000003491 Skin Anatomy 0.000 description 4
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 4
- LWFWZRANSFAJDR-JSGCOSHPSA-N Trp-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 LWFWZRANSFAJDR-JSGCOSHPSA-N 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 238000002512 chemotherapy Methods 0.000 description 4
- 230000000295 complement Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N edta Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 4
- 230000035558 fertility Effects 0.000 description 4
- 230000002068 genetic Effects 0.000 description 4
- VPZXBVLAVMBEQI-VKHMYHEASA-N gly ala Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 4
- 230000035876 healing Effects 0.000 description 4
- 230000011132 hemopoiesis Effects 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 230000001506 immunosuppresive Effects 0.000 description 4
- 238000000099 in vitro assay Methods 0.000 description 4
- 108010053037 kyotorphin Proteins 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 4
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 4
- QLROSWPKSBORFJ-BQBZGAKWSA-N pro glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 230000002829 reduced Effects 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000002054 transplantation Methods 0.000 description 4
- 200000000019 wound Diseases 0.000 description 4
- ZQFAGNFSIZZYBA-UHFFFAOYSA-N γ-glutamyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CCC(N)=O)N)C(O)=O)=CNC2=C1 ZQFAGNFSIZZYBA-UHFFFAOYSA-N 0.000 description 4
- VNYDHJARLHNEGA-RYUDHWBXSA-N (2S)-1-[(2S)-2-azaniumyl-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carboxylate Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 3
- YFBBUHJJUXXZOF-UWVGGRQHSA-N (2S)-1-[2-[[(2S)-2-azaniumyl-4-methylpentanoyl]amino]acetyl]pyrrolidine-2-carboxylate Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 3
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-phenylpropanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxypropanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- PDQDCFBVYXEFSD-SRVKXCTJSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]butanedioic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 3
- LCNASHSOFMRYFO-WDCWCFNPSA-N (2S)-5-amino-2-[[(2S,3R)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]-5-oxopentanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 3
- DXQOQMCLWWADMU-ACZMJKKPSA-N (3S)-3-amino-4-[[(2S)-5-amino-1-[[(1S)-1-carboxy-2-hydroxyethyl]amino]-1,5-dioxopentan-2-yl]amino]-4-oxobutanoic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 3
- SJPMNHCEWPTRBR-BQBZGAKWSA-N (4S)-4-amino-5-[[(2S)-4-carboxy-1-(carboxymethylamino)-1-oxobutan-2-yl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 3
- GJSURZIOUXUGAL-UHFFFAOYSA-N 2-((2,6-Dichlorophenyl)imino)imidazolidine Chemical compound ClC1=CC=CC(Cl)=C1NC1=NCCN1 GJSURZIOUXUGAL-UHFFFAOYSA-N 0.000 description 3
- 108010059616 Activins Proteins 0.000 description 3
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N Ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 3
- WYBVBIHNJWOLCJ-IUCAKERBSA-N Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N WYBVBIHNJWOLCJ-IUCAKERBSA-N 0.000 description 3
- PQBHGSGQZSOLIR-RYUDHWBXSA-N Arg-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PQBHGSGQZSOLIR-RYUDHWBXSA-N 0.000 description 3
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 3
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 3
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 3
- CPMKYMGGYUFOHS-FSPLSTOPSA-N Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O CPMKYMGGYUFOHS-FSPLSTOPSA-N 0.000 description 3
- HXWUJJADFMXNKA-UHFFFAOYSA-N Asparaginyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(N)=O HXWUJJADFMXNKA-UHFFFAOYSA-N 0.000 description 3
- IQTUDDBANZYMAR-UHFFFAOYSA-N Asparaginyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CC(N)=O IQTUDDBANZYMAR-UHFFFAOYSA-N 0.000 description 3
- 210000004369 Blood Anatomy 0.000 description 3
- 108091003117 Bovine Serum Albumin Proteins 0.000 description 3
- RGTVXXNMOGHRAY-UHFFFAOYSA-N Cysteinyl-Arginine Chemical compound SCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RGTVXXNMOGHRAY-UHFFFAOYSA-N 0.000 description 3
- OOULJWDSSVOMHX-UHFFFAOYSA-N Cysteinyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CS OOULJWDSSVOMHX-UHFFFAOYSA-N 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 229940110715 ENZYMES FOR TREATMENT OF WOUNDS AND ULCERS Drugs 0.000 description 3
- 229940088598 Enzyme Drugs 0.000 description 3
- LOJYQMFIIJVETK-WDSKDSINSA-N Gln-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LOJYQMFIIJVETK-WDSKDSINSA-N 0.000 description 3
- VHLZDSUANXBJHW-UHFFFAOYSA-N Glutaminyl-Phenylalanine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-UHFFFAOYSA-N 0.000 description 3
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 3
- 206010062016 Immunosuppression Diseases 0.000 description 3
- 206010061218 Inflammation Diseases 0.000 description 3
- ZPNFWUPYTFPOJU-LPYSRVMUSA-N Iniprol Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@H]2CSSC[C@H]3C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC=4C=CC=CC=4)C(=O)N[C@@H](CC=4C=CC(O)=CC=4)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC=4C=CC=CC=4)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC2=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CSSC[C@H](NC(=O)[C@H](CC=2C=CC=CC=2)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H]2N(CCC2)C(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N2[C@@H](CCC2)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N2[C@@H](CCC2)C(=O)N3)C(=O)NCC(=O)NCC(=O)N[C@@H](C)C(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@H](C(=O)N1)C(C)C)[C@@H](C)O)[C@@H](C)CC)=O)[C@@H](C)CC)C1=CC=C(O)C=C1 ZPNFWUPYTFPOJU-LPYSRVMUSA-N 0.000 description 3
- KFKWRHQBZQICHA-STQMWFEESA-N Leu-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 3
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 3
- RVKIPWVMZANZLI-ZFWWWQNUSA-N Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-ZFWWWQNUSA-N 0.000 description 3
- MUMXFARPYQTTSL-BQBZGAKWSA-N Met-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O MUMXFARPYQTTSL-BQBZGAKWSA-N 0.000 description 3
- ZYTPOUNUXRBYGW-YUMQZZPRSA-N Met-Met Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCSC ZYTPOUNUXRBYGW-YUMQZZPRSA-N 0.000 description 3
- XYVRXLDSCKEYES-JSGCOSHPSA-N Met-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 XYVRXLDSCKEYES-JSGCOSHPSA-N 0.000 description 3
- PESQCPHRXOFIPX-RYUDHWBXSA-N Met-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-RYUDHWBXSA-N 0.000 description 3
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L MgCl2 Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 3
- 210000001616 Monocytes Anatomy 0.000 description 3
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 3
- 238000000636 Northern blotting Methods 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- MIDZLCFIAINOQN-WPRPVWTQSA-N Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 MIDZLCFIAINOQN-WPRPVWTQSA-N 0.000 description 3
- OZILORBBPKKGRI-RYUDHWBXSA-N Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 OZILORBBPKKGRI-RYUDHWBXSA-N 0.000 description 3
- GKZIWHRNKRBEOH-HOTGVXAUSA-N Phe-Phe Chemical compound C([C@H]([NH3+])C(=O)N[C@@H](CC=1C=CC=CC=1)C([O-])=O)C1=CC=CC=C1 GKZIWHRNKRBEOH-HOTGVXAUSA-N 0.000 description 3
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 3
- GVUVRRPYYDHHGK-UHFFFAOYSA-N Prolyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C1CCCN1 GVUVRRPYYDHHGK-UHFFFAOYSA-N 0.000 description 3
- 108010079005 RDV peptide Proteins 0.000 description 3
- 101710042981 SHMT1 Proteins 0.000 description 3
- 229920000978 Start codon Polymers 0.000 description 3
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 3
- UQTNIFUCMBFWEJ-UHFFFAOYSA-N Threoninyl-Asparagine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-UHFFFAOYSA-N 0.000 description 3
- CUTPSEKWUPZFLV-UHFFFAOYSA-N Threoninyl-Cysteine Chemical compound CC(O)C(N)C(=O)NC(CS)C(O)=O CUTPSEKWUPZFLV-UHFFFAOYSA-N 0.000 description 3
- IMMPMHKLUUZKAZ-WMZOPIPTSA-N Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 IMMPMHKLUUZKAZ-WMZOPIPTSA-N 0.000 description 3
- QZOSVNLXLSNHQK-UHFFFAOYSA-N Tyrosyl-Aspartate Chemical compound OC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UHFFFAOYSA-N 0.000 description 3
- 108010064997 VPY tripeptide Proteins 0.000 description 3
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 3
- VEYJKJORLPYVLO-RYUDHWBXSA-N Val-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VEYJKJORLPYVLO-RYUDHWBXSA-N 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- 230000003466 anti-cipated Effects 0.000 description 3
- 230000003110 anti-inflammatory Effects 0.000 description 3
- 230000000692 anti-sense Effects 0.000 description 3
- 229940019336 antithrombotic Enzymes Drugs 0.000 description 3
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 3
- 235000019622 astringency Nutrition 0.000 description 3
- 235000019606 astringent taste Nutrition 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- UIIMBOGNXHQVGW-UHFFFAOYSA-M buffer Substances [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 230000000747 cardiac effect Effects 0.000 description 3
- 230000001659 chemokinetic Effects 0.000 description 3
- 230000035605 chemotaxis Effects 0.000 description 3
- 230000001332 colony forming Effects 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- 108010054813 diprotin B Proteins 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- KGNSGRRALVIRGR-UHFFFAOYSA-N gln-tyr Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-UHFFFAOYSA-N 0.000 description 3
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 3
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 3
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 3
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 3
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 3
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- 210000002865 immune cell Anatomy 0.000 description 3
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 3
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 230000035800 maturation Effects 0.000 description 3
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 3
- 108010034507 methionyltryptophan Proteins 0.000 description 3
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 3
- 108010058453 phenylalanyl-glutamyl-glycine Proteins 0.000 description 3
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 3
- 108010024607 phenylalanylalanine Proteins 0.000 description 3
- 108010018625 phenylalanylarginine Proteins 0.000 description 3
- OZAIFHULBGXAKX-UHFFFAOYSA-N precursor Substances N#CC(C)(C)N=NC(C)(C)C#N OZAIFHULBGXAKX-UHFFFAOYSA-N 0.000 description 3
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 3
- 108010079317 prolyl-tyrosine Proteins 0.000 description 3
- 108091007521 restriction endonucleases Proteins 0.000 description 3
- 210000001995 reticulocyte Anatomy 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 108010005652 splenotritin Proteins 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 230000001225 therapeutic Effects 0.000 description 3
- 230000002537 thrombolytic Effects 0.000 description 3
- 108010044292 tryptophyltyrosine Proteins 0.000 description 3
- 230000004614 tumor growth Effects 0.000 description 3
- 108010077037 tyrosyl-tyrosyl-phenylalanine Proteins 0.000 description 3
- 108010009962 valyltyrosine Proteins 0.000 description 3
- OPINTGHFESTVAX-UHFFFAOYSA-N γ-glutamyl-Arginine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N OPINTGHFESTVAX-UHFFFAOYSA-N 0.000 description 3
- MQIGTEQXYCRLGK-BQBZGAKWSA-N (2S)-1-[2-[[(2S)-2-azaniumylpropanoyl]amino]acetyl]pyrrolidine-2-carboxylate Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- DSTWKJOBKSMVCV-UWVGGRQHSA-N (2S)-2-[[(2R)-2-amino-3-sulfanylpropanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DSTWKJOBKSMVCV-UWVGGRQHSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N (2S)-2-[[(2S)-2-[[(2S)-2-amino-4-carboxybutanoyl]amino]-4-carboxybutanoyl]amino]pentanedioic acid Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- XMAUFHMAAVTODF-STQMWFEESA-N (2S)-2-[[(2S)-2-amino-3-(1H-imidazol-5-yl)propanoyl]amino]-3-phenylpropanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XMAUFHMAAVTODF-STQMWFEESA-N 0.000 description 2
- VHJLVAABSRFDPM-UHFFFAOYSA-N 1,4-dimercaptobutane-2,3-diol Chemical compound SCC(O)C(O)CS VHJLVAABSRFDPM-UHFFFAOYSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N 2-[[(2S)-2-[[(2S)-2-azaniumylpropanoyl]amino]propanoyl]amino]acetate Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- HKTRDWYCAUTRRL-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-2-(1H-imidazol-5-yl)ethyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 HKTRDWYCAUTRRL-UHFFFAOYSA-N 0.000 description 2
- 102000005606 Activins Human genes 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 2
- 206010059512 Apoptosis Diseases 0.000 description 2
- 206010003246 Arthritis Diseases 0.000 description 2
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 2
- FKBFDTRILNZGAI-UHFFFAOYSA-N Aspartyl-Cysteine Chemical compound OC(=O)CC(N)C(=O)NC(CS)C(O)=O FKBFDTRILNZGAI-UHFFFAOYSA-N 0.000 description 2
- 208000006673 Asthma Diseases 0.000 description 2
- 102000003852 Autoantibodies Human genes 0.000 description 2
- 108090000206 Autoantibodies Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 210000001772 Blood Platelets Anatomy 0.000 description 2
- 210000003169 Central Nervous System Anatomy 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 210000000349 Chromosomes Anatomy 0.000 description 2
- 229920001405 Coding region Polymers 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 241000557626 Corvus corax Species 0.000 description 2
- WXOFKRKAHJQKLT-UHFFFAOYSA-N Cysteinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CS WXOFKRKAHJQKLT-UHFFFAOYSA-N 0.000 description 2
- SYELGNBERZZXAG-UHFFFAOYSA-N Cysteinyl-Tryptophan Chemical compound C1=CC=C2C(CC(NC(=O)C(CS)N)C(O)=O)=CNC2=C1 SYELGNBERZZXAG-UHFFFAOYSA-N 0.000 description 2
- 210000004443 Dendritic Cells Anatomy 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-N Deoxycytidine triphosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 2
- 206010012601 Diabetes mellitus Diseases 0.000 description 2
- 210000003038 Endothelium Anatomy 0.000 description 2
- 230000036826 Excretion Effects 0.000 description 2
- 206010017533 Fungal infection Diseases 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N HCl Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 2
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 2
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 2
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 2
- NIKBMHGRNAPJFW-UHFFFAOYSA-N Histidinyl-Arginine Chemical compound NC(=N)NCCCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 NIKBMHGRNAPJFW-UHFFFAOYSA-N 0.000 description 2
- WRPDZHJNLYNFFT-UHFFFAOYSA-N Histidinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WRPDZHJNLYNFFT-UHFFFAOYSA-N 0.000 description 2
- 102000008949 Histocompatibility Antigens Class I Human genes 0.000 description 2
- 108010088652 Histocompatibility Antigens Class I Proteins 0.000 description 2
- 108010027412 Histocompatibility Antigens Class II Proteins 0.000 description 2
- 102000018713 Histocompatibility Antigens Class II Human genes 0.000 description 2
- 210000000936 Intestines Anatomy 0.000 description 2
- 102000004310 Ion Channels Human genes 0.000 description 2
- 108090000862 Ion Channels Proteins 0.000 description 2
- JAQGKXUEKGKTKX-HOTGVXAUSA-N L-tyrosyl-L-tyrosine Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 2
- 206010024324 Leukaemias Diseases 0.000 description 2
- HGCNKOLVKRAVHD-RYUDHWBXSA-N Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-RYUDHWBXSA-N 0.000 description 2
- 210000001589 Microsomes Anatomy 0.000 description 2
- 206010028417 Myasthenia gravis Diseases 0.000 description 2
- 210000000066 Myeloid Cells Anatomy 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 210000000944 Nerve Tissue Anatomy 0.000 description 2
- 206010029331 Neuropathy peripheral Diseases 0.000 description 2
- 210000000440 Neutrophils Anatomy 0.000 description 2
- 229920001850 Nucleic acid sequence Polymers 0.000 description 2
- 102000037283 Organic cation transporters Human genes 0.000 description 2
- 108091006679 Organic cation transporters Proteins 0.000 description 2
- 210000000496 Pancreas Anatomy 0.000 description 2
- 108091005771 Peptidases Proteins 0.000 description 2
- 108010033276 Peptide Fragments Proteins 0.000 description 2
- 102000007079 Peptide Fragments Human genes 0.000 description 2
- 210000001428 Peripheral Nervous System Anatomy 0.000 description 2
- 208000001293 Peripheral Nervous System Disease Diseases 0.000 description 2
- 206010034606 Peripheral neuropathy Diseases 0.000 description 2
- OHUXOEXBXPZKPT-STQMWFEESA-N Phe-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 OHUXOEXBXPZKPT-STQMWFEESA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 229920000582 Polyisocyanurate Polymers 0.000 description 2
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 2
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 2
- BEPSGCXDIVACBU-UHFFFAOYSA-N Prolyl-Histidine Chemical compound C1CCNC1C(=O)NC(C(=O)O)CC1=CN=CN1 BEPSGCXDIVACBU-UHFFFAOYSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 206010063837 Reperfusion injury Diseases 0.000 description 2
- SSJMZMUVNKEENT-IMJSIDKUSA-N Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CO SSJMZMUVNKEENT-IMJSIDKUSA-N 0.000 description 2
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 2
- 206010051379 Systemic inflammatory response syndrome Diseases 0.000 description 2
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 2
- 208000007536 Thrombosis Diseases 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K Tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- UYKREHOKELZSPB-JTQLQIEISA-N Trp-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(O)=O)=CNC2=C1 UYKREHOKELZSPB-JTQLQIEISA-N 0.000 description 2
- YBRHKUNWEYBZGT-UHFFFAOYSA-N Tryptophyl-Threonine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(C(O)C)C(O)=O)=CNC2=C1 YBRHKUNWEYBZGT-UHFFFAOYSA-N 0.000 description 2
- OYOQKMOWUDVWCR-RYUDHWBXSA-N Tyr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OYOQKMOWUDVWCR-RYUDHWBXSA-N 0.000 description 2
- MFEVVAXTBZELLL-UHFFFAOYSA-N Tyrosyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-UHFFFAOYSA-N 0.000 description 2
- 206010068760 Ulcers Diseases 0.000 description 2
- 208000001756 Virus Disease Diseases 0.000 description 2
- 239000000488 activin Substances 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010078114 alanyl-tryptophyl-alanine Proteins 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- 230000001363 autoimmune Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000024245 cell differentiation Effects 0.000 description 2
- 230000003915 cell function Effects 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 238000001516 cell proliferation assay Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 108091006028 chimera Proteins 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 2
- 238000002316 cosmetic surgery Methods 0.000 description 2
- 230000016396 cytokine production Effects 0.000 description 2
- 238000004163 cytometry Methods 0.000 description 2
- YSYKRGRSMLTJNL-URARBOGNSA-L dTDP-α-D-glucose(2-) Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@@H](O)C1 YSYKRGRSMLTJNL-URARBOGNSA-L 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000029142 excretion Effects 0.000 description 2
- 230000001605 fetal Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 230000000025 haemostatic Effects 0.000 description 2
- 230000002439 hemostatic Effects 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 101710011541 hrg-7 Proteins 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000002458 infectious Effects 0.000 description 2
- 230000028709 inflammatory response Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003834 intracellular Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 210000004962 mammalian cells Anatomy 0.000 description 2
- 238000007799 mixed lymphocyte reaction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006011 modification reaction Methods 0.000 description 2
- 230000000051 modifying Effects 0.000 description 2
- 210000002569 neurons Anatomy 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000001105 regulatory Effects 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000004083 survival Effects 0.000 description 2
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 230000017423 tissue regeneration Effects 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000000472 traumatic Effects 0.000 description 2
- 231100000397 ulcer Toxicity 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 230000003612 virological Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000029663 wound healing Effects 0.000 description 2
- LNAZSHAWQACDHT-XIYTZBAFSA-N (2R,3R,4S,5R,6S)-4,5-dimethoxy-2-(methoxymethyl)-3-[(2S,3R,4S,5R,6R)-3,4,5-trimethoxy-6-(methoxymethyl)oxan-2-yl]oxy-6-[(2R,3R,4S,5R,6R)-4,5,6-trimethoxy-2-(methoxymethyl)oxan-3-yl]oxyoxane Chemical compound CO[C@@H]1[C@@H](OC)[C@H](OC)[C@@H](COC)O[C@H]1O[C@H]1[C@H](OC)[C@@H](OC)[C@H](O[C@H]2[C@@H]([C@@H](OC)[C@H](OC)O[C@@H]2COC)OC)O[C@@H]1COC LNAZSHAWQACDHT-XIYTZBAFSA-N 0.000 description 1
- ZFXQNADNEBRERM-BJDJZHNGSA-N (2S)-1-[(2S)-1-[(2S)-2-[[(2S)-2-aminopropanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZFXQNADNEBRERM-BJDJZHNGSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-2-amino-3-methylbutanoyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-pyrrolidin-1-ium-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylate Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N (2S)-1-[2-[[(2S)-2-amino-3-carboxypropanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- OPCHFPHZPIURNA-MFERNQICSA-N (2S)-2,5-bis(3-aminopropylamino)-N-[2-(dioctadecylamino)acetyl]pentanamide Chemical compound CCCCCCCCCCCCCCCCCCN(CC(=O)NC(=O)[C@H](CCCNCCCN)NCCCN)CCCCCCCCCCCCCCCCCC OPCHFPHZPIURNA-MFERNQICSA-N 0.000 description 1
- FAQVCWVVIYYWRR-WHFBIAKZSA-N (2S)-2-[[(2S)-2,5-diamino-5-oxopentanoyl]amino]propanoic acid Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O FAQVCWVVIYYWRR-WHFBIAKZSA-N 0.000 description 1
- GHBSKQGCIYSCNS-NAKRPEOUSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-aminopropanoyl]amino]-4-methylpentanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 1
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-aminopropanoyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxypropanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N (2S)-2-[[(2S,3R)-2-[[(2S)-2-amino-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]propanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N (2S)-2-[[2-[[(2S)-2-aminopropanoyl]amino]acetyl]amino]-3-(1H-imidazol-5-yl)propanoic acid Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- JEDIEMIJYSRUBB-FOHZUACHSA-N (3S)-3-[[(2S,3R)-2-amino-3-hydroxybutanoyl]amino]-4-(carboxymethylamino)-4-oxobutanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 1
- BUXAPSQPMALTOY-UHFFFAOYSA-N 2-[(2-amino-3-sulfanylpropanoyl)amino]pentanedioic acid Chemical compound SCC(N)C(=O)NC(C(O)=O)CCC(O)=O BUXAPSQPMALTOY-UHFFFAOYSA-N 0.000 description 1
- VUFNLQXQSDUXKB-DOFZRALJSA-N 2-[4-[4-[bis(2-chloroethyl)amino]phenyl]butanoyloxy]ethyl (5Z,8Z,11Z,14Z)-icosa-5,8,11,14-tetraenoate Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)OCCOC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 VUFNLQXQSDUXKB-DOFZRALJSA-N 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N 2-[[(2S)-2-[[(2S)-2-amino-3-phenylpropanoyl]amino]propanoyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- VADKRMSMGWJZCF-UHFFFAOYSA-N 2-bromophenol Chemical compound OC1=CC=CC=C1Br VADKRMSMGWJZCF-UHFFFAOYSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 206010001488 Aggression Diseases 0.000 description 1
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 1
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 1
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 1
- ALZVPLKYDKJKQU-XVKPBYJWSA-N Ala-Tyr Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ALZVPLKYDKJKQU-XVKPBYJWSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 206010027654 Allergic conditions Diseases 0.000 description 1
- 102000030762 Alpha family Human genes 0.000 description 1
- 108091014317 Alpha family Proteins 0.000 description 1
- 206010001897 Alzheimer's disease Diseases 0.000 description 1
- 206010002026 Amyotrophic lateral sclerosis Diseases 0.000 description 1
- 206010002198 Anaphylactic reaction Diseases 0.000 description 1
- 208000003455 Anaphylaxis Diseases 0.000 description 1
- 208000007502 Anemia Diseases 0.000 description 1
- 206010002967 Aplastic anaemia Diseases 0.000 description 1
- WVRUNFYJIHNFKD-WDSKDSINSA-N Arg-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N WVRUNFYJIHNFKD-WDSKDSINSA-N 0.000 description 1
- OSASDIVHOSJVII-UHFFFAOYSA-N Arginyl-Cysteine Chemical compound SCC(C(O)=O)NC(=O)C(N)CCCNC(N)=N OSASDIVHOSJVII-UHFFFAOYSA-N 0.000 description 1
- BNODVYXZAAXSHW-UHFFFAOYSA-N Arginyl-Histidine Chemical compound NC(=N)NCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 BNODVYXZAAXSHW-UHFFFAOYSA-N 0.000 description 1
- DVUFTQLHHHJEMK-IMJSIDKUSA-N Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O DVUFTQLHHHJEMK-IMJSIDKUSA-N 0.000 description 1
- 208000005783 Autoimmune Thyroiditis Diseases 0.000 description 1
- 102100015648 BACE2 Human genes 0.000 description 1
- 101700051947 BACE2 Proteins 0.000 description 1
- 240000008371 Bacillus subtilis Species 0.000 description 1
- 229940075615 Bacillus subtilis Drugs 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 206010060945 Bacterial infection Diseases 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 208000010392 Bone Fractures Diseases 0.000 description 1
- 206010065553 Bone marrow failure Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 229940098773 Bovine Serum Albumin Drugs 0.000 description 1
- 210000004556 Brain Anatomy 0.000 description 1
- 102000001902 CC Chemokines Human genes 0.000 description 1
- 108010040471 CC Chemokines Proteins 0.000 description 1
- 108010041397 CD4 Antigens Proteins 0.000 description 1
- 108050006947 CXC chemokine Proteins 0.000 description 1
- 102000019388 CXC chemokine Human genes 0.000 description 1
- 102100002212 CXCR4 Human genes 0.000 description 1
- 108010061299 CXCR4 Receptors Proteins 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 206010007134 Candida infection Diseases 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 208000003295 Carpal Tunnel Syndrome Diseases 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000016289 Cell Adhesion Molecules Human genes 0.000 description 1
- 108010067225 Cell Adhesion Molecules Proteins 0.000 description 1
- 229920002168 Chimeric RNA Polymers 0.000 description 1
- 208000003044 Closed Fractures Diseases 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000020504 Collagenase family Human genes 0.000 description 1
- 108060005980 Collagenase family Proteins 0.000 description 1
- 206010010099 Combined immunodeficiency Diseases 0.000 description 1
- 208000002573 Connective Tissue Disease Diseases 0.000 description 1
- 208000008208 Craniocerebral Trauma Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 206010011401 Crohn's disease Diseases 0.000 description 1
- HAYVTMHUNMMXCV-UHFFFAOYSA-N Cysteinyl-Alanine Chemical compound OC(=O)C(C)NC(=O)C(N)CS HAYVTMHUNMMXCV-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N Cysteinyl-Phenylalanine Chemical compound SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 101710028159 DNTT Proteins 0.000 description 1
- 102100002445 DNTT Human genes 0.000 description 1
- 206010011968 Decreased immune responsiveness Diseases 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N Deoxyguanosine triphosphate Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- 206010012401 Depressive disease Diseases 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 108010092799 EC 2.7.7.49 Proteins 0.000 description 1
- 101710003775 ERVK-10 Proteins 0.000 description 1
- 101710037030 ERVK-11 Proteins 0.000 description 1
- 101710009283 ERVK-18 Proteins 0.000 description 1
- 101710009286 ERVK-19 Proteins 0.000 description 1
- 101710035700 ERVK-25 Proteins 0.000 description 1
- 101710038044 ERVK-6 Proteins 0.000 description 1
- 101710014468 ERVK-7 Proteins 0.000 description 1
- 101710014482 ERVK-8 Proteins 0.000 description 1
- 206010014599 Encephalitis Diseases 0.000 description 1
- 210000002889 Endothelial Cells Anatomy 0.000 description 1
- 210000003989 Endothelium, Vascular Anatomy 0.000 description 1
- 210000003979 Eosinophils Anatomy 0.000 description 1
- 210000003013 Erythroid Precursor Cells Anatomy 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 229920000665 Exon Polymers 0.000 description 1
- 206010015866 Extravasation Diseases 0.000 description 1
- 206010015943 Eye inflammation Diseases 0.000 description 1
- 241000272184 Falconiformes Species 0.000 description 1
- 229940012952 Fibrinogen Drugs 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 229940019698 Fibrinogen containing hemostatics Drugs 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 241001200922 Gagata Species 0.000 description 1
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 1
- JZOYFBPIEHCDFV-UHFFFAOYSA-N Glutaminyl-Histidine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 JZOYFBPIEHCDFV-UHFFFAOYSA-N 0.000 description 1
- MFBYPDKTAJXHNI-VKHMYHEASA-N Gly-Cys Chemical compound [NH3+]CC(=O)N[C@@H](CS)C([O-])=O MFBYPDKTAJXHNI-VKHMYHEASA-N 0.000 description 1
- 210000003714 Granulocytes Anatomy 0.000 description 1
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N Guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 1
- 208000002183 Guillain-Barre Syndrome Diseases 0.000 description 1
- 101710043924 HERVK_113 Proteins 0.000 description 1
- 208000005721 HIV Infections Diseases 0.000 description 1
- 102100005784 HLA-DOA Human genes 0.000 description 1
- 101710007992 HLA-DOA Proteins 0.000 description 1
- 101710029866 HLA-DPA1 Proteins 0.000 description 1
- 102100005615 HLA-DQA1 Human genes 0.000 description 1
- 101710031487 HLA-DQA1 Proteins 0.000 description 1
- 101710031278 HLA-DRB3 Proteins 0.000 description 1
- 206010061992 Haemophilia Diseases 0.000 description 1
- 208000003579 Hashimoto's encephalitis Diseases 0.000 description 1
- 210000003958 Hematopoietic Stem Cells Anatomy 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 208000006454 Hepatitis Diseases 0.000 description 1
- 206010061205 Hereditary disease Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 1
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 1
- CTCFZNBRZBNKAX-UHFFFAOYSA-N Histidinyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CN=CN1 CTCFZNBRZBNKAX-UHFFFAOYSA-N 0.000 description 1
- 208000006572 Human Influenza Diseases 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 210000000987 Immune System Anatomy 0.000 description 1
- 102000018358 Immunoglobulins Human genes 0.000 description 1
- 108060003951 Immunoglobulins Proteins 0.000 description 1
- 206010061216 Infarction Diseases 0.000 description 1
- 208000000509 Infertility Diseases 0.000 description 1
- 206010021972 Inflammatory bowel disease Diseases 0.000 description 1
- 206010022000 Influenza Diseases 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 102000003815 Interleukin-11 Human genes 0.000 description 1
- 108090000177 Interleukin-11 Proteins 0.000 description 1
- 229940074383 Interleukin-11 Drugs 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 102000000588 Interleukin-2 Human genes 0.000 description 1
- 102000004388 Interleukin-4 Human genes 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 229940028885 Interleukin-4 Drugs 0.000 description 1
- 108010002335 Interleukin-9 Proteins 0.000 description 1
- 102000000585 Interleukin-9 Human genes 0.000 description 1
- 229940118526 Interleukin-9 Drugs 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 229920002459 Intron Polymers 0.000 description 1
- 108020004391 Introns Proteins 0.000 description 1
- 210000004153 Islets of Langerhans Anatomy 0.000 description 1
- 210000001503 Joints Anatomy 0.000 description 1
- 210000000822 Killer Cells, Natural Anatomy 0.000 description 1
- 125000000998 L-alanino group Chemical group [H]N([*])[C@](C([H])([H])[H])([H])C(=O)O[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- LHSGPCFBGJHPCY-STQMWFEESA-N Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-STQMWFEESA-N 0.000 description 1
- 206010065433 Ligament rupture Diseases 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 206010024774 Localised infection Diseases 0.000 description 1
- 210000004072 Lung Anatomy 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 210000001165 Lymph Nodes Anatomy 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 1
- IGRMTQMIDNDFAA-UHFFFAOYSA-N Lysyl-Histidine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UHFFFAOYSA-N 0.000 description 1
- 210000002540 Macrophages Anatomy 0.000 description 1
- 206010025650 Malignant melanoma Diseases 0.000 description 1
- 210000000138 Mast Cells Anatomy 0.000 description 1
- 210000003593 Megakaryocytes Anatomy 0.000 description 1
- 230000036740 Metabolism Effects 0.000 description 1
- 208000001089 Multiple System Atrophy Diseases 0.000 description 1
- 210000003205 Muscles Anatomy 0.000 description 1
- FFEARJCKVFRZRR-ZLINWBGDSA-N N[C@@H](CC[33S]C)C(=O)O Chemical compound N[C@@H](CC[33S]C)C(=O)O FFEARJCKVFRZRR-ZLINWBGDSA-N 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 240000008962 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 208000002565 Open Fractures Diseases 0.000 description 1
- 208000001132 Osteoporosis Diseases 0.000 description 1
- 206010025310 Other lymphomas Diseases 0.000 description 1
- 210000001672 Ovary Anatomy 0.000 description 1
- 241000283898 Ovis Species 0.000 description 1
- 101700037337 PIGA Proteins 0.000 description 1
- 102100012341 PIGA Human genes 0.000 description 1
- 101710039569 POLM Proteins 0.000 description 1
- 101700021280 PREB Proteins 0.000 description 1
- 241000164466 Palaemon adspersus Species 0.000 description 1
- 210000000578 Peripheral Nerves Anatomy 0.000 description 1
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 1
- IEHDJWSAXBGJIP-RYUDHWBXSA-N Phe-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 IEHDJWSAXBGJIP-RYUDHWBXSA-N 0.000 description 1
- 102000030951 Phosphotransferases Human genes 0.000 description 1
- 108091000081 Phosphotransferases Proteins 0.000 description 1
- 206010062080 Pigmentation disease Diseases 0.000 description 1
- 206010035534 Platelet disease Diseases 0.000 description 1
- 229940037179 Potassium Ion Drugs 0.000 description 1
- 102400000745 Potential peptide Human genes 0.000 description 1
- 101800001357 Potential peptide Proteins 0.000 description 1
- 208000004210 Pressure Ulcer Diseases 0.000 description 1
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 1
- HXNYBZQLBWIADP-UHFFFAOYSA-N Prolyl-Cysteine Chemical compound OC(=O)C(CS)NC(=O)C1CCCN1 HXNYBZQLBWIADP-UHFFFAOYSA-N 0.000 description 1
- 229940082622 Prostaglandin cardiac therapy preparations Drugs 0.000 description 1
- 229940077717 Prostaglandin drugs for peptic ulcer and gastro-oesophageal reflux disease (GORD) Drugs 0.000 description 1
- 102000014961 Protein Precursors Human genes 0.000 description 1
- 108010078762 Protein Precursors Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 101710006375 RNASEH1 Proteins 0.000 description 1
- 101700078434 RT67 Proteins 0.000 description 1
- 101000431870 RTN1 Proteins 0.000 description 1
- 101700077911 RTN1 Proteins 0.000 description 1
- 102100003513 RTN4 Human genes 0.000 description 1
- 101700014436 RTN4 Proteins 0.000 description 1
- 102000007312 Recombinant Proteins Human genes 0.000 description 1
- 108010033725 Recombinant Proteins Proteins 0.000 description 1
- 206010039073 Rheumatoid arthritis Diseases 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102100003386 S100A12 Human genes 0.000 description 1
- 101710023382 S100A12 Proteins 0.000 description 1
- 101710044433 SAG Proteins 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 102000003800 Selectins Human genes 0.000 description 1
- 108090000184 Selectins Proteins 0.000 description 1
- 206010053879 Sepsis syndrome Diseases 0.000 description 1
- 206010040070 Septic shock Diseases 0.000 description 1
- 208000009106 Shy-Drager Syndrome Diseases 0.000 description 1
- 241000580858 Simian-Human immunodeficiency virus Species 0.000 description 1
- 206010061367 Spinal cord disease Diseases 0.000 description 1
- 210000000952 Spleen Anatomy 0.000 description 1
- 210000002536 Stromal Cells Anatomy 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 231100000617 Superantigen Toxicity 0.000 description 1
- 208000002847 Surgical Wound Diseases 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 206010043255 Tendonitis Diseases 0.000 description 1
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 1
- 229960003766 Thrombin (Human) Drugs 0.000 description 1
- 206010043554 Thrombocytopenia Diseases 0.000 description 1
- 210000000515 Tooth Anatomy 0.000 description 1
- FPKOPBFLPLFWAD-UHFFFAOYSA-N Trinitrotoluene Chemical compound CC1=CC=C([N+]([O-])=O)C([N+]([O-])=O)=C1[N+]([O-])=O FPKOPBFLPLFWAD-UHFFFAOYSA-N 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K Trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 240000008529 Triticum aestivum Species 0.000 description 1
- NZCPCJCJZHKFGZ-UHFFFAOYSA-N Tryptophyl-Glutamine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CCC(N)=O)C(O)=O)=CNC2=C1 NZCPCJCJZHKFGZ-UHFFFAOYSA-N 0.000 description 1
- 101700053022 VGC Proteins 0.000 description 1
- 229940029983 VITAMINS Drugs 0.000 description 1
- 206010054880 Vascular insufficiency Diseases 0.000 description 1
- 206010047461 Viral infection Diseases 0.000 description 1
- 229940021016 Vitamin IV solution additives Drugs 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000001154 acute Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 201000009961 allergic asthma Diseases 0.000 description 1
- 201000005794 allergic hypersensitivity disease Diseases 0.000 description 1
- 230000000735 allogeneic Effects 0.000 description 1
- 235000005550 amino acid supplement Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000000202 analgesic Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000036783 anaphylactic response Effects 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 230000002491 angiogenic Effects 0.000 description 1
- 230000003172 anti-dna Effects 0.000 description 1
- 230000000259 anti-tumor Effects 0.000 description 1
- 230000000840 anti-viral Effects 0.000 description 1
- 230000030741 antigen processing and presentation Effects 0.000 description 1
- 230000000890 antigenic Effects 0.000 description 1
- 230000036528 appetite Effects 0.000 description 1
- 235000019789 appetite Nutrition 0.000 description 1
- 101700065210 asp1 Proteins 0.000 description 1
- 238000000376 autoradiography Methods 0.000 description 1
- 230000001580 bacterial Effects 0.000 description 1
- 108010003152 bacteriophage T7 RNA polymerase Proteins 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000003542 behavioural Effects 0.000 description 1
- 230000037237 body shape Effects 0.000 description 1
- 238000010322 bone marrow transplantation Methods 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L cacl2 Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 230000003327 cancerostatic Effects 0.000 description 1
- 201000003984 candidiasis Diseases 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 201000009030 carcinoma Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000035569 catabolism Effects 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 201000001084 cerebrovascular disease Diseases 0.000 description 1
- 230000000973 chemotherapeutic Effects 0.000 description 1
- 210000000038 chest Anatomy 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 230000001684 chronic Effects 0.000 description 1
- 230000035591 circadian rhythms Effects 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 201000007368 coagulation protein disease Diseases 0.000 description 1
- 229960005188 collagen Drugs 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 201000009230 common cold Diseases 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002254 contraceptive Effects 0.000 description 1
- 239000003433 contraceptive agent Substances 0.000 description 1
- 230000004940 costimulation Effects 0.000 description 1
- 238000010192 crystallographic characterization Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 201000003883 cystic fibrosis Diseases 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000001461 cytolytic Effects 0.000 description 1
- 230000001086 cytosolic Effects 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-J dATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-J 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000005860 defense response to virus Effects 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing Effects 0.000 description 1
- 230000002255 enzymatic Effects 0.000 description 1
- 210000002919 epithelial cells Anatomy 0.000 description 1
- 230000000925 erythroid Effects 0.000 description 1
- 210000000267 erythroid cells Anatomy 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 238000001400 expression cloning Methods 0.000 description 1
- 230000036251 extravasation Effects 0.000 description 1
- 230000020764 fibrinolysis Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 230000004761 fibrosis Effects 0.000 description 1
- 230000003176 fibrotic Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 125000002485 formyl group Chemical group [H]C(*)=O 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 201000002406 genetic disease Diseases 0.000 description 1
- 238000010448 genetic screening Methods 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 230000037308 hair color Effects 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000003054 hormonal Effects 0.000 description 1
- 102000035228 human RTN1 protein Human genes 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 230000003463 hyperproliferative Effects 0.000 description 1
- 230000009610 hypersensitivity Effects 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 230000001861 immunosuppresant Effects 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 231100000535 infertility Toxicity 0.000 description 1
- 230000004968 inflammatory condition Effects 0.000 description 1
- 230000000977 initiatory Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 108010028930 invariant chain Proteins 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000011031 large scale production Methods 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 230000021633 leukocyte mediated immunity Effects 0.000 description 1
- 101710030587 ligN Proteins 0.000 description 1
- 101700077585 ligd Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 231100000516 lung damage Toxicity 0.000 description 1
- 230000003526 lymphopoietic Effects 0.000 description 1
- 230000002934 lysing Effects 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 239000002609 media Substances 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 230000035786 metabolism Effects 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 201000009240 nasopharyngitis Diseases 0.000 description 1
- 201000008383 nephritis Diseases 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000000955 neuroendocrine Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000000771 oncological Effects 0.000 description 1
- 150000002892 organic cations Chemical class 0.000 description 1
- 201000008482 osteoarthritis Diseases 0.000 description 1
- 230000001599 osteoclastic Effects 0.000 description 1
- 230000002188 osteogenic Effects 0.000 description 1
- 229940094443 oxytocics Prostaglandins Drugs 0.000 description 1
- 244000045947 parasites Species 0.000 description 1
- 201000003045 paroxysmal nocturnal hemoglobinuria Diseases 0.000 description 1
- 230000002093 peripheral Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 238000005554 pickling Methods 0.000 description 1
- 230000019612 pigmentation Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 230000001817 pituitary Effects 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229910001414 potassium ion Inorganic materials 0.000 description 1
- NPYPAHLBTDXSSS-UHFFFAOYSA-N potassium ion Chemical compound [K+] NPYPAHLBTDXSSS-UHFFFAOYSA-N 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000002062 proliferating Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 150000003180 prostaglandins Chemical class 0.000 description 1
- 235000005974 protein supplement Nutrition 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 201000004681 psoriasis Diseases 0.000 description 1
- 230000002685 pulmonary Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000036647 reaction Effects 0.000 description 1
- 239000000018 receptor agonist Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000000241 respiratory Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 229920002033 ribozyme Polymers 0.000 description 1
- 101700086982 rnh Proteins 0.000 description 1
- 238000009938 salting Methods 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000036303 septic shock Effects 0.000 description 1
- 239000003352 sequestering agent Substances 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 238000003530 single readout Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- FKNQFGJONOIPTF-UHFFFAOYSA-N sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000021595 spermatogenesis Effects 0.000 description 1
- 230000003068 static Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000012134 supernatant fraction Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 238000009210 therapy by ultrasound Methods 0.000 description 1
- 200000000020 tissue injury Diseases 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 102000035402 transmembrane proteins Human genes 0.000 description 1
- 108091005683 transmembrane proteins Proteins 0.000 description 1
- 238000004642 transportation engineering Methods 0.000 description 1
- 235000019798 tripotassium phosphate Nutrition 0.000 description 1
- 239000011778 trisodium citrate Substances 0.000 description 1
- 230000001875 tumorinhibitory Effects 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 229960005486 vaccines Drugs 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 230000017613 viral reproduction Effects 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamins Natural products 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 235000021307 wheat Nutrition 0.000 description 1
Abstract
Una proteína que comprende cualquiera de las secuencias de aminoácidos representadas por las Secuencias Nos. 1 a 9, un ADN que codifica para dicha Proteína ejemplificada por un ADNc que comprende cualquiera de las secuencias de Bases representadas por las Secuencias Nos. 10 a 18, y un vector de expresión de dicho ADNc, asícomo también una ce1ula eucariótica que expresa dicho ADNc. Dicha proteína y ce1ula eucariótica que tiene dicha proteína sobre, la superficie de la membrana puede ser proveída mediante expresión de un ADNc que codifica para una proteína humana que tiene un dominio de transmembrana y de un recombinante del ADNc humano.
Description
PROTEÍNAS HUMANAS QUE TIENEN DOMINIOS DE TRANSMEMBRANA Y ADNs QUE CODIFICAN PARA ÉSTAS
Campo de la Invención La presente invención se refiere a proteínas humanas que tienen dominios de transmembrana, ADNcs que codifican para estas proteínas, y vectores de expresión de dichos ADNcs, así como también células eucarioticas que expresan dichos ADNcs. Las proteínas de la presente invención pueden ser usadas como compuestos farmacéuticos o como antígenos para la preparación de anticuerpos contra dichas proteínas. Los ADNcs humanos de la presente invención pueden ser usados como sondas para la diagnosis de genes y como fuentes de genes para la terapia génica.. Además, los ADNcs pueden ser usados como fuentes de genes para la producción a gran escala de las proteínas codificadas por dichos ADNcs. Las células, en donde estos genes de proteínas de membrana son introducidos y proteínas de membrana son expresadas en grandes cantidades, pueden ser usadas para la detección de los ligandos correspondientes, así como para el tamizaje de nuevos productos farmacéuticos de bajo peso molecular, y similares.
Antecedentes de la Invención Las proteínas de membrana juegan papeles importantes, como receptores de señal, canales de iones, transportadores, etc., en la transportación de material y en la transmisión de información que es mediada por la membrana celular. Sus ejemplos incluyen receptores para una variedad de citocinas, canales de iones para el ion sodio, ion potasio, ion cloro, etc., transportadores para sacáridos y aminoácidos y similares, y así sucesivamente, en donde los genes de muchos de ellos ya han sido clonados. Se ha aclarado que las anormalidades de estas proteínas de membrana están asociados con un número de enfermedades hasta ahora criptógenas. Por ejemplo, un gene de una proteína de membrana que tiene doce dominios de transmembrana fue identificado como el gene responsable de la fibrosis cística [Romens, J. M. et al., Science 245: 1059-1065 (1989)].
Además, se ha aclarado que varias proteínas de membrana actúan como receptores cuando un virus infecta las células. Por ejemplo, se ha revelado que el VIH-1 infecta las células a través de la mediación de una fusina de proteína de membrana, que tiene una proteína de membrana
en la membrana de células T, un antígeno de CD-4 y siete dominios de transmembrana [Feng, Y. Et al., Science 272: 872-877 (1996)]. Por lo tanto, se anticipa que el descubrimiento de una nueva proteína de membrana conduce a la aclaración de las causas de muchas enfermedades, de manera que ha sido deseable el aislamiento de un nuevo gene que codifique para la proteína de membrana. Hasta ahora, debido a la dificultad que existe en la purificación, muchas de las proteínas de membrana han sido aisladas a través de un planteamiento procedente de lado de los genes. Un método general es la así denominada clonación de expresión, la cual comprende la transfección de una biblioteca de ADNc en células eucarioticas para expresar ADNcs y la posterior detección de las células que expresan la proteína de membrana objetivo en la membrana mediante una técnica inmunológica que utiliza un anticuerpo, o una técnica fisiológica en el cambio en la permeabilidad de la membrana. Sin embargo, este método es aplicable solamente a la clonación de un gene de una proteína de membrana con una función conocida. En general, las proteínas de membrana poseen dominios de transmembrana hidrofóbicos dentro de las proteínas, en donde, después de la síntesis de ellas en el ribosoma, estos dominios permanecen en la membrana de fosfolípido para ser atrapados en la membrana. En consecuencia, la evidencia del ADNc para la codificación de la proteína de membrana es proveída mediante la determinación de toda la secuencia de bases de un ADNc de longitud completa, seguida por la detección de dominios de transmembrana altamente hidrofóbicos en la secuencia de aminoácidos de la proteína codificada por dicho ADNc.
Objetivos de la Invención El objetivo de la presente invención consiste en proveer nuevas proteínas humanas que tienen dominios de transmembrana, ADNs que codifican para dichas proteínas, y vectores de expresión de dichos ADNs, así como también células eucarioticas de transformación que son capaces de expresar los ADNs referidos. Como resultado de estudios intensos, los presentes inventores han tenido éxito en la clonación de ADNcs que codifican para proteínas que tienen dominios de transmembrana procedentes del banco de ADNc humano de longitud completa, llevando a cabo de esta
manera la presente invención. En otras palabras, la presente invención proporciona proteínas humanas que tienen dominios de transmembrana, es decir, proteínas que contienen cualquiera de las secuencias de aminoácidos representadas por las Secuencias Números 1 a 9. Más aún, la presente invención proporciona ADNs que codifican para las proteínas que anteriormente fueron mencionadas y que son ejemplificadas por ADNcs que contienen cualquiera de las secuencias de bases representadas por las Secuencias Números 10 a 19, 21, 23, 25, 27, 29, 31, 33 y 35, así como también vectores de expresión que son capaces de expresar cualquiera de dichos ADNs mediante traducción in vitro o en células eucarioticas y células eucarióticas de transformación que son capaces de expresar dichos ADNs y de producir las proteínas antes mencionadas.
Breve Descripción de los Dibujos La Figura 1 es una ilustración del perfil de hidrofobicidad/hidrofilicidad de la proteína codificada por la clona HP02000. La Figura 2 es una ilustración del perfil de hidrofobicidad hidrofilicidad de la proteína codificada por la clona HP02061. La Figura 3 es una ilustración del perfil de hidrofobicidad/hidrofilicidad de la proteína codificada por la clona HP02163. La Figura 4 es una ilustración del perfil de hidrofobicidad/hidrofilicidad de la proteína codificada por la clona HP02219. La Figura 5 es una ilustración del perfil de hidrofobicidad/hidrofilicidad de la proteína codificada por la clona HP02256. La Figura 6 es una ilustración del perfil de hidrofobicidad/hidrofilicidad de la proteína codificada por la clona HP 10390. La Figura 7 es una ilustración del perfil de hidrofobicidad/hidrofilicidad de la proteína codificada por la clona HP 10474. La Figura 8 es una ilustración del perfil de hidrofobicidad/hidrofilicidad de la proteína codificada por la clona HP 10527. La Figura 9 es una ilustración del perfil de hidrofobicidad/hidrofilicidad de la proteína codificada por la clona HP 10528.
Descripción Detallada de las Modalidades Preferidas Las proteínas de la presente invención pueden ser obtenidas, por ejemplo, mediante un método para su aislamiento a partir de órganos humanos, líneas celulares, etc., un método para la preparación de péptidos mediante síntesis química, o un método para su producción con la tecnología de ADN recombinante usando los ADNs que codifican para los dominios de transmembrana de la presente invención, en donde preferiblemente se emplea el método de obtención mediante la tecnología de ADN recombinante. Por ejemplo, la expresión in vitro de las proteínas puede lograrse mediante la preparación de un ARN mediante transcripción in vitro a partir de un vector que tiene uno de los ADNcs de la presente invención, seguida por la traducción in vitro usando este ARN como un modelo. También, la recombinación de la región de traducción dentro de un vector de expresión apropiado por el método conocido en la técnica conduce a la expresión de una gran cantidad de la proteína codificada mediante el uso de células procarióticas tales como Escherichia coh, Bacillus subtilis, etc. y células eucarioticas tales como levaduras, células de insecto, células de mamíferos, etc. En el caso en el que una de las proteínas de la presente invención es producida por la expresión del ADN mediante traducción in vitro, la proteína de la presente invención puede ser producida in vitro, cuando la región de traducción de dicho ADNc es sometida a recombinación a un vector que tiene un promotor de poiimerasa de ARN, seguida de la adición a un sistema de traducción in vitro tal como un lisato de reticulocito de conejo o un extracto de germen de trigo, conteniendo una polimerasa de ARN correspondiente al promotor. Los inhibidores de polimerasa de ARN son ejemplificados por T7, T3, SP6 y similares. Los vectores que contienen dichos inhibidores de polimerasa de ARN son ejemplificados por pKAl, pCDM8, pT3/7 18, pT7/3 19, pBluescript II, y similares. Además, una proteína de membrana de la presente invención puede ser expresada como la forma incorporada en la membrana del microsoma, cuando un microsoma de páncreas canino o similar es agregado dentro del sistema de reacción. En el caso en el que una proteína de la presente invención es producida por la expresión del ADN usando un microorganismo tal como la Escherichia coli, etc., un vector de expresión recombinante que porta la región de traducción en el ADNc de la presente invención es construido en un vector de expresión que tiene un origen, un promotor, un sitio de unión de ribosoma, un sitio de clonación de ADNc, un finalizador, etc. que pueda ser replicado en el
microorganismo y, después de la transformación de las células hospederas con dicho vector de expresión, el transformante así obtenido es incubado, mediante lo cual la proteína codificada por dicho ADNc puede ser producida a gran escala en el microorganismo. En ese caso, un fragmento de proteína conteniendo una región opcional puede ser obtenido realizando la expresión con la inserción de un codón de iniciación y un codón de terminación enfrente de y detrás de una región de traducción opcional. Alternativamente, una proteína de fusión con otra proteína puede ser expresada. Solamente una porción de proteína que codifica para dicho ADNc puede ser obtenida mediante la división de dicha proteína de fusión con una proteasa apropiada. Ejemplos del vector de expresión para la Escherichia coli incluyen el sistema pUC, pBluescript II, el sistema de expresión pET, el sistema de expresión pGEX, y similares. En el caso en el que una de las proteínas de la presente invención es producida mediante expresión del ADN en células eucarioticas, la proteína de la presente invención puede ser producida como una proteína de transmembrana en la superficie de la membrana celular, cuando la región de traducción de dicho ADNc es sometida a recombinación a un vector de expresión para células eucarioticas, que tenga un promotor, una región de empalme, un sitio de inserción de poli(A), etc., seguida de la introducción dentro de las células eucarioticas. El vector de expresión es ejemplificado por pKAl, pED6dcp2, pCDM8, pSVK3, pMSG, pSVL, pBK-CMV, pB -RSV, vector EBV, pRS, pYES2, y similares Ejemplos de las células eucarioticas que pueden ser utilizadas, en general, incluyen células de cultivos de mamíferos, tales como células de riñon de mono COS7, células de ovario de hámster Chino CHO, etc., levaduras de gemación, levaduras de escisión, células de gusano de seda, células de huevecillo de Xenopus laevis, y similares, pero pueden emplearse cualesquiera células eucarioticas, siempre y cuando dichas células sean capaces de expresar las presentes proteínas sobre la superficie de la membrana. El vector de expresión puede ser introducido dentro de las células eucarioticas por métodos que se conocen en el estado de la técnica, tales como el método de la electroforesia, el método del fosfato de potasio, el método de la liposoma, o el método de DEAE-dextrano, etc. Después de que una de las proteínas de la presente invención es expresada en células procarióticas o eucarioticas, la proteína objetivo puede ser aislada del medio de cultivo y purificada mediante una combinación de procesos de separación conocidos en la técnica. Tales ejemplos incluyen el tratamiento con un agente desnaturalizador tal como urea, o un agente
tensoactivo, tratamiento ultrasónico, digestión enzimática, salazón o precipitación con solvente, diálisis, centrifugación, ultrafiltración, filtración en gel, SDS-PAGE, enfoque de punto isoeléctrico, cromatografía de intercambio iónico, cromatografía hidrofóbica, cromatografía de afinidad, cromatografía de fase inversa, etc. Las proteínas de la presente invención incluyen fragmentos de péptido (más de 5 residuos aminoácido) que contienen cualquier secuencia parcial de aminoácidos en las secuencias de aminoácidos que son representadas por las Secuencias Nos. 1 a 9. Estos fragmentos de péptido pueden ser empleados como antígenos para la preparación de los anticuerpos. Por consiguiente, entre las proteínas de la presente invención, aquellas que tienen la secuencia señal son secretadas en la forma de proteínas de maduración sobre la superficie de las células, después de que las secuencias señal son eliminadas. Por lo tanto, estas proteínas de maduración caerán dentro del alcance de la presente invención. Las secuencias de aminoácidos con terminación N de las proteínas de maduración pueden ser fácilmente identificadas empleando el método para la determinación del sitio de división en una secuencia señal [Publicación Kokai de Patente Japonesa No. 1996-187100]. Además, algunas proteínas de membrana son sometidas a procesamiento sobre la superficie celular para ser convertidas a las formas secretoras. Estos péptidos o proteínas en las formas secretoras también caerán dentro del alcance de la presente invención. Cuando los sitios de unión a la cadena de azúcar están presentes en las secuencias de aminoácidos, la expresión en células eucarioticas apropiadas proporcionará proteínas en donde las cadenas de azúcar están agregadas. En consecuencia, tales proteínas o péptidos en donde las cadenas azúcar están agregadas, de igual manera, caerán dentro del alcance de la presente invención. Los ADNs de la presente invención incluyen todos los ADNs que codifican para las proteínas anteriormente mencionadas. Dichos ADNs pueden ser obtenidos usando un método de síntesis química, un método de clonación de ADN y similares. Los ADNcs de la presente invención pueden ser clonados, por ejemplo, a partir de bibliotecas de ADNc de origen de células humanas. Estos ADNcs son sintetizados usando como modelos ARNs poli(A)+ extraídos de células humanas. Las células humanas pueden ser células liberadas del cuerpo humano, por ejemplo, mediante operación o pueden ser células que han sido cultivadas. Los ADNcs pueden ser sintetizados usando cualquier método seleccionado del
método de Okayama-Berg [Okayama, H. and Berg, P. Mol. Cell. Biol. 2: 161-170 (1982)], el método de Gubler-Hoffman [Gubler, U. and Hoffman, J. Gene 25: 263-269 (1983)] y métodos similares, pero se prefiere emplear el método capping [Kato, S. et al., Gene 150: 243-250 (1994)] como se ilustró en los Ejemplos, con el objeto de obtener una clona de longitad completa en una forma efectiva. Además, pueden utilizarse bibliotecas de ADNc humano comercialmente disponibles. La clonación de los ADNcs de la presente invención a partir de bibliotecas de ADNc puede ser llevada a cabo mediante síntesis de un oligonucleótido sobre la base de una porción opcional en las secuencias de bases de ADNc de la presente invención, seguida por tamizaje usando este oligonucleótido como la sonda de acuerdo con la hibridación de colonia o placa por un método conocido en la técnica. Además, los fragmentos de ADNc de la presente invención pueden ser preparados mediante síntesis de un oligonucleótido que va a ser hibridado en ambas terminaciones del fragmento de ADNc objetivo, seguida por el uso de este oligonucleótido como el primario para el método de RT-PCR a partir de un ARNm que es aislado a partir de células humanas. Los ADNcs de la presente invención están caracterizados por contener cualquiera de las secuencias de bases representadas por las Secuencias Nos. 10 a 18 o las secuencias de bases representadas por las Secuencias Nos. 19, 21, 23, 25, 27, 29, 31, 33 y 35. La Tabla 1 resume el número de clona (número HP), las células que proporcionan el ADNc, el número de bases totales del ADNc y el número de los residuos de aminoácido de la proteína codificada, para cada uno de los ADNcs. Tabla 1
1 Número de Número Número de Número de I Secuencia HP Células Bases Aminoácido 1, 10, 19 HP02000 Hígado 1705 268 2, 11, 20 HP02061 Saos-2 1759 236 3, 12, 21 HP02163 Saos-2 1069 261 4, 13, 22 HP02219 Cáncer de estomago 1759 328 5, 14, 23 HP02256 Cáncer de estomago 1697 300 6, 15, 24 HP 10390 Cáncer de estomago 814 182 7, 16, 25 HP 10474 Saos-2 511 66 8, 17, 26 HP 10527 Saos-2 1 126 183 9, 18, 27 HP 10528 Saos-2 2015 324
Por consiguiente, las mismas clonas como los ADNcs de la presente invención pueden ser fácilmente obtenidas mediante tamizaje de las bibliotecas de ADNc construidas a partir de las líneas celulares humanas y tejidos humanos utilizados en la presente invención mediante el uso de una sonda de oligonucleótido sintetizada sobre la base de la secuencia de bases de ADNc descrita en cualquiera de las Secuencias Nos. 10 a 19, 21, 23, 25, 27, 29, 31, 33 y 35. En general, el polimorfismo debido a la diferencia individual es frecuentemente observado en genes humanos. Por lo tanto, cualquier ADNc que sea sometido a inserción o deleción de uno o varios nucleótidos y/o substitución con otros nucleótidos en las Secuencias Nos. 10 a 19, 21, 23, 25, 27, 29, 31, 33 y 35 caerá dentro del alcance de la presente invención. En una forma similar, cualquier proteína que sea producida por estas modificaciones que comprenden la inserción o deleción de uno o múltiples aminoácidos y/o la substitución con otros aminoácidos caerá dentro del alcance de esta invención, mientras dicha proteína posea la actividad de cualquier proteína que tenga las secuencias de aminoácidos de las Secuencias 1 a 9.
Los ADNcs de la presente invención incluyen fragmentos de ADNc (más de 10 bp) conteniendo cualquier secuencia de bases parcial en la secuencia de bases representada por las
Secuencias Nos. 10 a 18 o en las secuencias de bases representadas por las Secuencias Nos. 19,
21, 23, 25, 27, 29, 31, 33 y 35. También, fragmentos de ADN consistentes en una cadena de sentido y una cadena de anti-sentido caerán dentro de este alcance. Estos fragmentos de ADN pueden ser usados como las sondas para la diagnosis de genes. Además de las actividades y usos descritos anteriormente, los polinucleótidos y proteínas de la presente invención pueden presentar uno o más de los usos o actividades biológicas
(incluyendo aquellas asociadas con ensayos citados aquí) identificadas más adelante. Los usos o actividades descritas para las proteínas de la presente invención pueden ser proveídos mediante la administración o uso de tales proteínas o mediante la administración o uso de polinucleótidos que codifican para tales proteínas (tal como, por ejemplo, en terapias de genes o vectores apropiados para la introducción de ADN).
Usos y Utilidades en Investigación Los polinucleótidos proveídos por la presente invención pueden ser utilizados por la comunidad investigadora para varios propósitos. Los polinucleótidos pueden ser usados para
expresar proteína recombinante para análisis, caracterización o uso terapéutico; como marcadores para tejidos en los que la proteína correspondiente es expresada preferencialmente (ya sea constitutivamente o en una etapa particular de diferenciación o desarrollo del tejido o en estados enfermizos); como marcadores de peso molecular en geles Southern; como marcadores o banderas de cromosomas (cuando se marcan) para identificar cromosomas o para mapeo de posiciones de genes relacionados; para comparación con secuencias de ADN endógenas en pacientes para identificar desordenes genéticos potenciales; como sondas para hibridación y así descubrir nuevas secuencias de ADN relacionadas; como una fuente de información para derivar primarios PCR para rastreo genético; como una sonda para "substraer" secuencias conocidas en el proceso de descubrimiento de otros nuevos polinucleótidos; para la selección y mareaje de oligómeros para unión a un "chip genético" u otro soporte, incluyendo para el examen de patrones de expresión; para generar anticuefos de anti-proteína usando técnicas de inmunización de ADN; y como un antígeno para generar anticuerpos de anti-ADN o para estimular otra respuesta inmune. En donde el polinucleótido codifica para una proteína que se une o potencialmente se unirá a otra proteína (tal como, por ejemplo, en una interacción receptor-ligando), el polinucleótido también puede ser usado en ensayos de trampa por interacción (tal como, por ejemplo, aquel descrito en Guris et al., Cell 75: 791-803 (1993)) para identificar polinucleótidos que codifican para la otra proteína con la cual ocurre la unión o para identificar inhibidores de la interacción de unión. Las proteínas proveídas por la presente invención pueden de manera similar ser usadas en ensayos para determinar actividad biológica, incluyendo en un panel de múltiples proteínas para tamizaje de alto rendimiento; para generar anticuerpos o para producir otra respuesta inmune; como un reactivo (incluyendo el reactivo marcador) en ensayos diseñados para determinar en forma cuantitativa los niveles de la proteína (o su receptor) en fluidos biológicos; como marcadores para tejidos en los que la correspondiente proteína es preferencialmente expresada (ya sea constitutivamente o en una etapa particular de diferenciación o desarrollo de tejido o en un estado enfermizo); y, por supuesto, para aislar receptores o ligandos correlativos. En donde la proteína se une o potencialmente se une a otra proteína (tal como, por ejemplo, en una interacción receptor-ligando), la proteína puede ser usada para identificar la otra proteína con la cual ocurre la unión o para identificar inhibidores
de la interacción de unión. Las proteínas involucradas en estas interacciones de unión también pueden ser utilizadas para tamizar péptidos o pequeños inhibidores de moléculas o agonistas de la interacción de unión. Cualesquiera de estas utilidades en investigación son capaces de ser desarrolladas en grado reactivo o en formato de juego (kit) para la comercialización como productos de investigación. Los métodos para realizar los usos enlistados anteriormente son bastante conocidos por aquellos capacitados en la técnica. Las referencias que describen tales métodos incluyen, sin limitación, "Molecular Cloning: A Laboratory Manual", 2nd ed. Cold Spring Harbor Laboratory Press, Sambrook, J., E.F. Fritsch and T. Maniatis eds., 1989, y "Methods in Enzymology: Guide to Molecular Cloning Techniques", Academic Press, Berger, S.L. and A.R. Kimmel eds., 1987.
Usos Nutricionales Los polinucleótidos y proteínas de la presente invención también pueden ser utilizados como fuentes o suplementos nutricionales. Tales usos incluyen, sin limitación, el uso como un suplemento de aminoácidos o proteínas, el uso como fuente de carbono, el uso como fuente de nitrógeno y el uso como una fuente de carbohidratos. En tales casos la proteína o polinucleótido de la invención puede ser agregado a la alimentación de un organismo particular o puede ser administrado como una preparación sólida o líquida separada, tal como en la forma de un polvo, pildoras, soluciones, suspensiones o cápsulas. En el caso de microorganismos, la proteína o polinucleótido de la invención puede ser agregado al medio en o sobre el cual el microorganismo es cultivado
Actividad de Citocina y de Proliferación/Diferenciación Celular Una proteína de la presente invención puede exhibir actividad de proliferación de célula, citocina (ya sea de inducción o inhibición) o de diferenciación celular (ya sea de inducción o inhibición), o puede inducir la producción de otras citocinas en ciertas poblaciones de células. Muchos factores de proteínas descubiertos hasta la fecha, incluyendo todas las citocinas conocidas, han presentado actividad en uno o más ensayos de proliferación
de células dependientes de factor, y de aquí que los ensayos sirven como una confirmación conveniente de actividad de citocina. La actividad de una proteína de la presente invención es evidenciada por uno de un número de ensayos rutinarios de proliferación de células dependientes de factor para líneas celulares que incluyen, sin limitación, 32D, DA2, DA1G, 5 TÍO, B9, B9/11, BaF3, MC9/G, M+ (preB M+), 2E8, RB5, DA1, 123, TI 165, HT2, CTLL2, TF-l, Mo7e y CM . La actividad de una proteína de la invención puede, entre otros medios, ser medida por los siguientes métodos: Los ensayos para proliferación de timocitos o células T incluyen, sin limitación, 10 aquellos descritos en Current Protocols in Immunology, Ed. by J.E. Coligan, A.M. Kruisbeek, D.H. Marguiles, E.M. Shevach, W. Strober, Pub. Greene Publishing Associates and Wiley Interscience (Chapter 3, In Vitro assays for Mouse Lymphocyte Function 3.1-3.19; Chapter 7, Immunologic studies in Humans); Takai et al., J. Immunol. 137:3494-3500, 1986; Bertagnolli et al., J. Immunol. 145:1706-1712, 1990; Bertagnolli et al., Cellular Immunology 133:327-15 341, 1991; Bertagnolli, et al., J. Immunol 149 3778-3783, 1992; Bowman et al., J. Immunol. 152:1756-1761, 1994. Los ensayos para determinar producción de citocina y/o proliferación de células del bazo, células del nodo linfático o timocitos incluyen, sin limitación, aquellos descritos en: Polyclonal T cell stimulation, Kruisbeek, A.M. and Shevach, E.M. In Current Protocols in 20 Immunology. J.E.e.a. Coligan eds. Vol. 1 pp. 3.12.1-3.12.14, John Wiley and Sons, Toronto, 1994; y Measurements of mouse and human Interferon ?, Schreiber, R.D. In Current Protocols in Immunology, J.E.e.a. Coligan eds. Vol 1 pp. 6.8.1-6.8.8, John Wiley and Sons, Toronto, 1994. Los ensayos para determinar la proliferación y diferenciación de células 25 hematopoiéticas y linfopoiéticas incluyen, sin limitación, aquellos descritos en : Measurement of Human and Murine Interleukin 2 and Interleukin 4, Bottomly, K., Davis, L.S. and Lipsky, P.E. In Current Protocols in Immunology. J.E.e.a Coligan eds. Vol 1 pp. 6.3.1-6.3.12, John Wiley and Sons, Toronto. 1991; deVries et al., J. Exp. Med. 173:1205-1211, 1991; Moreau et al., Nature 336:690-692, 1988; Greenberger et al., Proc. Nati. Acad. Sci. U.S.A. 80:2931-30 2938, 1983; Measurement of mouse and human interleukin 6- Nordan, R. In Current
Protocols in Immunology. J.E.e.a Coligan eds. Vol 1 pp. 6.6.1-6.6.5, John Wiley and Sons, Toronto. 1991; Smith et al., Proc. Nati. Acad. Sci. U.S.A. 83:1857-1861, 1986; Measurement of human Interleukin 11 - Bennett, F. Giannotti, J. Clark, S.C. and Turner, K.J. In Current Protocols in Immunology. J.E.e.a Coligan eds. Vol 1 pp. 6.15.1, John Wiley and Sons, Toronto. 1991. Measurement of mouse and human Interleukin 9 - Ciarletta, A. Giannotti, J., Clark, S.C. and Turner, K.J. In Current Protocols in Immunology. J.E.e.a Coligan eds. Vol 1 pp. 6.13.1, John Wiley and Sons, Toronto. 1991. Los ensayos para determinar las respuestas de clonas de células T a antígenos (los cuales identificarán, entre otros, proteínas que afectan las interacciones de células APC-T así como los efectos de células T directas midiendo la proliferación y producción de citocina) incluyen, sin limitación, aquellos descritos en: Current Protocols in Immunology, Ed by J.E.e.a Coligan, A.M. Kruisbeek, D.H. Margulies, E.M. Shevach, W. Strober, Pub. Greene Publishing Associates and Wiley-Interscience (Chapter 3, In Vitro assays for Mouse Lymphocyte Function; Chapter 6, Cytokines and their cellular receptors; Chapter 7, Immunologic studies in Humans); Weinberger et al., Proc. Nati. Acad. Sci. U.S.A. 77:6091-6095, 1980; Weinberger et al., Eur. J. Immun. 11 :405-411, 1981; Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512, 1988.
Actividad de Estimulación o Supresión Inmunológica Una proteína de la presente invención puede también exhibir actividad de estimulación inmunológica o de supresión de inmunológica, incluyendo sin limitación las actividades para las cuales se han descrito aquí ensayos. Una proteína puede ser útil en el tratamiento de varias deficiencias y desórdenes inmunológicos (incluyendo la inmunodeficiencia combinada severa (SCID)), por ejemplo, en la regulación (hacia arriba o hacia abajo) del crecimiento y proliferación de linfocitos T y/o B, así como efectuar la actividad citolítica de células NK y otras poblaciones de células. Estas deficiencias inmunológicas pueden ser genéticas o de causa viral (por ejemplo, VIH) así como también por infecciones bacterianas o por hongos, o pueden resultar de desórdenes autoinmunológicos. Más específicamente, las enfermedades infecciosas causadas por virus, bacterias, hongos u otra infección pueden ser tratadas usando una proteína de la presente invención, incluyendo infecciones por VIH, virus de hepatitis, virus de herpes,
micobacterias, Leishmania spp, malaria spp y diversas infecciones por hongos como la candidiasis. Por supuesto, en este sentido, una proteína de la presente invención también puede ser útil en donde generalmente fuese indicado reforzar el sistema inmunológico, por ejemplo, en el tratamiento del cáncer. Los desórdenes autoinmunológicos que pueden ser tratados usando una proteína de la presente invención incluyen, por ejemplo, enfermedad de tejido conectivo, esclerosis múltiple, lupus eritematoso sistémico, artritis reumatoidea, inflamación pulmonar autoinmune, síndrome de Guillain-Barre, tiroiditis autoinmune, diabetes mellitus dependiente de insulina, miastenia gravis, enfermedad de injerto versus huésped y enfermedad de inflamación de ojos por autoinmunidad. Dicha proteína de la presente invención también pude ser útil en el tratamiento de reacciones y condiciones alérgicas, tales como el asma (particularmente asma alérgica) u otros problemas respiratorios. Otras condiciones, en las que se desea supresión inmunológica (incluyendo, por ejemplo, trasplante de órganos) también pueden ser tratadas usando una proteína de la presente invención. El uso de las proteínas de la invención también puede ser posible para respuestas inmunes, en un número de formas. La hiporegulación puede estar en la forma de inhibición o bloqueo de una respuesta inmune ya en curso, o puede involucrar la prevención de la inducción de una respuesta inmune. Las funciones de células T activadas pueden ser inhibidas mediante la supresión de respuestas de células T o induciendo la tolerancia específica en células T, o ambas. La inmunosupresión de respuestas de células T es generalmente un proceso activo, no antígeno-específico, el cual requiere de exposición continua de las células T al agente de supresión. La tolerancia, que involucra la inducción de no-respuesta o anergia en células T, es susceptible de distinción a partir de la inmunosupresión porque es generalmente específica a antígeno y persiste después de que ha terminado la exposición al agente creador de tolerancia. Operacionalmente, la tolerancia puede ser demostrada por la falta de una respuesta de célula T bajo re-exposición a un antígeno específico en la ausencia del agente creador de tolerancia. La hiporegulación o prevención de una o más funciones antígenas (incluyendo sin limitación funciones de antígeno de linfocito B (tal como, por ejemplo, B7)), por ejemplo, previniendo la síntesis de linfocina de alto nivel mediante células T activadas, será útil en
situaciones de transplantes de tejido, piel y órganos y en enfermedad de injerto versus huésped (GVHD). Por ejemplo, el bloqueo de la función de células T debería resultar en la destrucción reducida de tejido en transplantes de tejido. Típicamente, en transplantes de tejido, el rechazo del transplante es iniciado a través del reconocimiento como extraño por las células T, seguido por una reacción inmune que destruye el transplante. La administración de una molécula que inhiba o bloquee la interacción de un antígeno de linfocito B7 con su(s) ligando(s) natural(es) en células inmunes (tales como una forma monomérica soluble de un péptido que tiene actividad B7-2 sola o en conjunto con una forma monomérica de un péptido que tiene una actividad de otro antígeno de linfocito B (por ejemplo, B7-1, B7-3) o anticuerpo de bloqueo), antes del transplante puede conducir a la unión de la molécula al(los) ligando(s) natural(es) en las células inmunes sin la transmisión de la correspondiente señal co-estimulante. El bloqueo de la función antígeno del linfocito B en este caso previene la síntesis de citocina por células inmunes, tales como células T, y así actúa como un inmunosupresor. Más aún, la falta de coestimulación también puede ser suficiente para anergizar las células T, induciendo así tolerancia en un sujeto. La inducción de tolerancia de larga duración por reactivos de bloqueo de antígeno de linfocito B puede evitar la necesidad de administración repetida de estos reactivos de bloqueo. Para lograr suficiente inmunosupresión o tolerancia en un sujeto, puede también ser necesario bloquear la función de una combinación de antígenos de linfocito B.
La eficacia de reactivos de bloqueo particulares en la prevención de un rechazo del transplante de un órgano o GVHD puede ser evaluada usando modelos animales que sean capaces de predecir la eficacia en humanos. Ejemplos de sistemas apropiados que pueden ser usados incluyen injertos cardiacos alogeneicos en ratas e injertos de células isleta pancreáticas xenogenéicas en ratones, ambas de las cuales han sido usadas para examinar los efectos inmunosupresores de proteínas de fusión CTLA4Ig in vivo como se describe en Lenschow et al., Science 257:789-792 (1992) y Turka et al., Proc. Nati. Acad. Sci. USA, 89:11102-11105 (1992). Además, pueden usarse modelos de murino de GVHD (ver Paul ed., Fundamental Immunology, Raven Press, New York, 1989, pp. 846-847) para determinar el efecto de bloqueo de la función antígeno de linfocito B in vivo en el desarrollo de esa enfermedad.
El bloqueo de la función antígeno también puede ser terapéuticamente útil para el tratamiento de enfermedades autoinmunes. Muchos desórdenes autoinmunes son el resultado
de la activación inapropiada de células T que son reactivas contra el mismo tejido y la cual promueve la producción de citocinas y auto-anticuerpos involucrados en la patología de las enfermedades. La prevención de la activación de células T autoreactivas puede reducir o eliminar síntomas de la enfermedad. La administración de reactivos que bloquean la coestimulación de células T rompiendo las interacciones receptopligando de los antígenos de linfocitos B, puede utilizarse para inhibir la activación de células T y prevenir la producción de autoanticuerpos o citocinas derivadas de células T que pueden estar involucradas en el proceso enfermizo. Adicionalmente, los reactivos de bloqueo pueden inducir la tolerancia específica al antígeno, de células T autoreactivas que podría conducir al alivio de larga duración de la enfermedad. La eficacia de los reactivos de bloqueo en la prevención o mejoramiento de los desórdenes autoinmunes puede ser determinada usando un número de modelos de animal bien caracterizados de enfermedades autoinmunes humanas. Los ejemplos incluyen encefalitis autoinmune experimental de murino, eritematosis de lupus sistémica en ratones MRL/lpr/lpr o ratones NZB híbridos, artritis de colágeno autoinmune de murino, diabetes mellitus en ratones NOD y ratas BB, y miastenia gravis experimental de murino (ver Paul ed., Fundamental Immunology, Raven Press, New York, 1989, pp. 840-856). La sobreregulación de una función antígeno (preferiblemente una función antígeno de linfocito B), como un medio de sobre regular respuestas inmunes, también puede ser útil en terapias. La sobreregulación de respuestas inmunes puede ser en la forma de mejorar una respuesta inmune existente o provocar una respuesta inmune inicial. Por ejemplo, el mejorar una respuesta inmune a través de la estimulación de la función antígeno de linfocito B puede ser útil en casos de infección viral. Además, enfermedades virales sistémicas tales como la influenza, el resfriado común y la encefalitis podrían ser aliviadas mediante la administración sistémica de formas estimulantes de antígenos de linfocitos B. Alternativamente, las respuestas inmunes anti-virales pueden ser mejoradas en un paciente infectado mediante la remoción de células T del paciente, coestimulando las células T in vitro con APCs pulsadas de antígeno viral ya sea expresando un péptido de la presente invención o conjuntamente con una forma estimulante de un péptido soluble de la presente invención y reintroduciendo las células T activadas in vitro dentro del paciente. Otro método para mejorar las respuestas inmune anti-virales consistiría en aislar células infectadas de un
paciente, transfectarlas con un ácido nucleico que codifica para una proteína de la presente invención como se describió aquí, de manera que las células expresen toda o una parte de la proteína sobre su superficie, y reintroducir las células transfectadas dentro del paciente. Las células infectadas serían ahora capaces de entregar una señal co-estimulante a, y de esta forma activar, las células T in vivo. En otra aplicación, la sobreregulación o mejoramiento de la función antígeno (preferiblemente función antígeno de linfocitos B) podría ser útil en la inducción de inmunidad tumoral. Las células de tumor (por ejemplo, sarcoma, melanoma, linfoma, leucemia, neuroblastoma, carcinoma) transfectadas con un ácido nucleico que codifica para cuando menos un péptido de la presente invención pueden ser administradas a un sujeto para superar la tolerancia especifica al tumor en el sujeto Si se desea, las células de tumor pueden ser transfectadas para expresar una combinación de péptidos. Por ejemplo, las células de tumor obtenidas de un paciente pueden ser transfectadas ex vivo con un vector de expresión que dirige la expresión de un péptido que tiene actividad similar a B7-2, solo o en combinación con un péptido que tiene actividad similar a B7-1 y/o actividad similar a B7-3. Las células tumorales transfectadas son regresadas al paciente para que resulte en la expresión de los péptidos sobre la superficie de las células transfectadas. Alternativamente, pueden usarse técnicas de terapia de genes para señalar como objetivo una célula de tumor para transfección in vivo. La presencia del péptido de la presente invención, que tiene la actividad de un(os) antígeno(s) de linfocitos B sobre la superficie de las células de tumor provee la señal de coestimulación necesaria para que las células T induzcan una respuesta inmune mediada por células T contra las células de tumor transfectadas. Además, las células de tumor que carecen de moléculas MHC clase I o MHC clase II, o que no re-expresan suficientes cantidades de moléculas MHC clase I o MHC clase II, pueden ser transfectadas con ácido nucleico que codifica para todo o una porción de (por ejemplo, una porción truncada de dominio citoplásmico) de una proteína de cadena a de MHC clase I y proteína de microglobulina p2 o una proteína de cadena a de MHC clase II y una proteína de cadena ß de MHC clase II para expresar de esta forma proteínas MHC clase I o MHC clase II sobre la superficie de la célula. La expresión de la MHC clase I o clases II apropiada, en conjunto con un péptido que tiene la
actividad de un antígeno de linfocito B (por ejemplo, B7-1, B7-2, B7-3) induce una respuesta inmune mediada por células T contra la célula de tumor transfectada. Opcionalmente, un gene que codifica una construcción antisentido que bloquea la expresión de una proteína asociada MHC clase II, tal como la cadena invariante, también puede ser cotransfectado con un ADN 5 que codifica para un péptido que tiene la actividad de un antígeno de linfocito B para promover la presentación de antígenos asociados a tumor e inducir inmunidad específica a tumor. Así, la inducción de una respuesta inmune mediada por células T en un sujeto humano puede ser suficiente para superar tolerancia específica a tumor en el sujeto. La actividad de una proteína de la invención también puede, entre otros medios, ser
medida por los siguientes métodos: Los ensayos adecuados para determinar citotoxicidad de esplenocitos o timocitos incluyen, sin limitación, aquellos descritos en Current Protocols in Immunology, Editado por J.E. Coligan, A.M. Kruisbeek, D.H. Margulies, E.M. Shevach, W. Strober, Pub. Greene Publishing Associates and Wiley-Interscience (Chapter 3, In Vitro assays for Mouse
Lymphocyte Function 3.1.-3.19; Chapter 7, Immunologic studies in Humans); Herrmann et al., Proc. Nati. Acad. Sci. USA 78:2488-2492, 1981; Herrmann et al., J. Immunol. 128:1968- 1974, 1982; Handa et al., J. Immunol. 135-1564-1572, 1985; Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512. 1988; Herrmann et al., Proc. Nati. Acad. Sci. USA 78:2488-2492, 1981; Herrmann et al., J. Immunol. 128:1968-1974,
1982; Handa et al., J. Immunol. 135:1564-1572, 1985; Takai et al., J. Immunol. 137:3494- 3500, 1986; Bowman et al., J. Virology 61 :1992-1998; Takai et al., J. Immunol. 140:508-512, 1988; Bertagnolli et al., Cellular Immunology 133:327-341, 1991; Brown et al., J. Immunol. 153:3079-3092, 1994. Los ensayos para determinar las respuestas de inmunoglobulina dependiente de células
T y conmutación isotipo (las cuales identificarán, entre otras, a las proteínas que modulan respuestas de anticuerpos dependientes de células T y que afectan perfiles Thl/Th2) incluyen, sin limitación, aquellos descritos en: Maliszewski, J. Immunol. 144:3028-3033, 1990; y Assays for B cell function: In vitro antibody production, Mond, J.J. and Brunswick, M. In Current Protocols in Immunology. J.E.e.a. Coligan eds. Vol 1 pp. 3.8.1-3.8.16, John Wiley
and Sons, Toronto. 1994.
Las pruebas mezcladas de reacción de linfocitos (MLR) (las cuales identificarán, entre otras, proteínas que generan predominantemente respuestas de Thl y CTL) incluyen, sin limitación, aquellas descritas en Current Protocols in Immunology, Editado por J.E. Coligan, A.M. Kruisbeek, D.H. Margulies, E.M. Shevach, W. Strober, Pub. Greene Publishing 5 Associates and Wiley-Interscience (Chapter 3, In Vitro assays for Mouse Lymphocyte Function 3.1-3.19; Chapter 7, Immunologic studies in Humans); Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512, 1988; Bertagnolli et al., J. Immunol. 149:3778-3783, 1992. Ensayos dependientes de células dendríticas (los cuales identificarán, entre otras,
proteínas expresadas por células dendríticas que activan células T naturales) incluyen, sin limitación, aquellos descritos en: Guery et al., J. Immunol. 134:536-544, 1995; Inaba et al., Journal of Experimental Medicine 173:549-559, 1991; Macatonia et al., Journal of Immunology 154:5071-5079, 1995; Porgador et al., Journal of Experimental Medicine 182:255-260, 1995; Nair et al., Journal of Virology 67:4062-4069, 1993; Huang et al., Science
264:961-965, 1994; Macatonia et al., Journal of Experimental Medicine 169:1255-1264, 1989; Bhardwaj et al., Journal of Clinical Investigation 94:797-807, 1994; e Inaba et al., Journal of Experimental Medicine 172:631-640, 1990. Las pruebas para determinar la sobrevivencia/apoptosis de linfocitos (las cuales identificarán, entre otras, las proteínas que previenen la apoptosis después de la inducción de 0 superantígeno y las proteínas que regulan la homeóstasis de linfocitos) incluyen, sin limitación, aquellas descritas en: Darzynkiewicz et al., Cytometry 13:795-808, 1992; Gorczyca et al., Leukemia 7:659-670, 1993 Gorczyca et al, Cáncer Research 53:1945-1951, 1993; Itoh et al., Cell 66:233-243, 1991; Zacharchuk, Journal of Immunology 145:4037-4045, 1990; Zamai et al., Cytometry 14:891-897, 1993; Gorczyca et al., International Journal of 5 Oncology 1:639-648, 1992. Las pruebas para las proteínas que influencian etapas tempranas de desarrollo y confinamiento de células T incluyen, sin limitación, aquellas descritas en Antica et al., Blood 84;111-1 17, 1994; Fine et al., Cellular Immunology 155:111-122, 1994; Galy et al., Blood 85:2770-2778, 1995; Toki et al., Proc. Nat. Acad. Sci. USA 88:7548-7551, 1991. 0
Actividad de Regulación de Hematopoyesis Una proteína de la presente invención puede ser útil en la regulación de la hematopoyesis y, en consecuencia, en el tratamiento de deficiencias de células mieloides o linfoides. Aún una actividad biológica marginal en apoyo de células formadoras de colonias o de líneas celulares dependientes de factor, indica envolvimiento en la regulación de hematopoyesis, esto es, en el soporte del crecimiento y la proliferación de células progenitoras eritroides solas o en combinación con otras citocinas, indicando utilidad de esta manera, por ejemplo, en el tratamiento de diversas anemias o para usarse en conjunto con irradiación/quimioterapia para estimular la producción de precursores eritroides y/o células eritroides; en soportar el crecimiento y proliferación de células mieloides tales como los granulocitos y monocitos/macrófagos (esto es, actividad CSF tradicional) útil, por ejemplo, en conjunto con la quimioterapia para prevenir o tratar la mielo-supresión consecuente; en soportar el crecimiento y proliferación de megacariocitos y consecuentemente de plaquetas, permitiendo así la prevención o tratamiento de diversos desordenes de plaquetas tales como la trombocitopenia y, en general, para utilizarse en lugar o en forma complementaria a transfusiones de plaquetas; y/o para sostener el crecimiento y proliferación de células pluripotenciales hematopoyéticas que sean capaces de madurar a todas y cada una de las células hematopoyéticas anteriormente mencionadas y por lo tanto encuentran utilidad terapéutica en diversos desordenes de células pluripotenciales (tales como aquellos usualmente tratados con trasplantes, incluyendo, sin limitación, anemia aplástica y hemoglobinuria nocturna paroxismal) así como en el repoblamiento de la división de células pluripotenciales que resulta de la irradiación/quimioterapia, ya sea in vivo o ex vivo (esto es, en conjunto con transplante de médula ósea o con el transplante de células progemtoras periféricas (homologas o heterólogas)) como células normales o genéticamente manipuladas para terapia de genes.
La actividad de una proteína de la invención puede, entre otros medios, ser medida por los siguientes métodos: Pruebas apropiadas para determinar la proliferación y diferenciación de varias líneas hematopoiéticas se han citado anteriormente. Las pruebas para la diferenciación de células pluripotenciales embrionarias (las cuales identificarán, entre otras, proteínas que influencian la hematopoyesis de diferenciación
embrionaria) incluyen, sin limitación, aquellas descritas en Johansson et al. Cellular Biology 15: 141-151, 1995; Keller et al., Molecular and Cellular Biology 13:473-486, 1993; McClanahan et al., Blood 81 :2903-2915, 1993. Las pruebas para determinar la supervivencia y diferenciación de células pluripotenciales (que identificarán, entre otras, proteínas que regulan la hnfo-hematopoyésis) incluyen, sin limitación, aquellas descritas en: Methylcellulose colony forming assays, Freshney, M.G. In Culture of Hematopoietic Cells, R.I. Freshney, et al eds. Vol pp 265-268, Wiley-Liss, Inc., New York, NY 1994; Hirayama et al., Proc Nati. Acad. Sci. USA 89:5907-591 1, 1992; Primitive hematopoietic colony forming cells with high proliferative potential, McNiece, I.K. y Briddell, R.A. In Culture of Hematopoietic Cells. R.I. Freshney, et al. eds. Vol pp. 23-39, Wiley-Liss, Inc. New York, NY 1994; Neben et al., Experimental Hematology 22:353-359, 1994; Cobblestone área forming cell assay, Ploemacher, R.E. In Culture of Hematopoietic Cells. R.I. Freshney et al., eds. Vol pp. 1-21, Wiley-Liss, Inc. New York, NY 1994; Long term bone marrow cultures in the presence of stromal cells, Spooncer, E., Dexter, M. and Alien, T. In Culture of Hematopoietic Cells. R.I. Freshney et al., eds. Vol pp. 163-179, Wiley-Liss, Inc., New York, NY 1994; Long term culture initiating cell assay, Sutherland, H.J. In Culture of Hematopietic Cells, R.I. Freshney et al., eds. Vol pp. 139-162, Wiley-Liss, Inc. New York, N Y. 1994.
Actividad de Crecimiento de Tejido Una proteína de la presente invención también puede tener utilidad en composiciones usadas para el crecimiento o regeneración de tejido óseo, de cartílago, de tendón, de ligamento y/o de nervio, así como para curar heridas y reparación o reemplazo de tejido, y en el tratamiento de quemaduras, incisiones y úlceras. Una proteína de la presente invención, la cual induce el crecimiento de cartílago y/o hueso en circunstancias en las que normalmente no hay hueso formado, tiene aplicación en la curación de fracturas óseas y daños o defectos a cartílago en humanos y otros animales. Dicha preparación empleando una proteína de la invención puede tener uso profiláctico en la reducción tanto de fracturas cerradas como abiertas y también en la fijación mejorada de uniones artificiales. La formación de hueso nuevo inducida por un agente osteogénico
contribuye a la reparación de defectos craneofaciales congénitos, inducidos por traumatismo, o inducidos por resección oncológica, y también es útil en cirugía plástica cosmética. Una proteína de esta invención también puede ser útil en el tratamiento de enfermedad periodental y en otros procesos de reparación de dientes. Tales agentes pueden proveer un ambiente para atraer células formadoras de hueso, estimular el crecimiento de células formadoras de hueso o inducir la diferenciación de progenitores de células formadoras de hueso. Una proteína de la invención también puede ser útil en el tratamiento de osteoporosis u osteoartritis, tal como a través de la estimulación de la reparación de hueso y/o cartílago o mediante el bloqueo de la inflamación o procesos de destrucción de tejido (actividad colagenasa, actividad osteoclástica, etc.) mediada por procesos inflamatorios. Otra categoría de actividad de regeneración de tejido que puede ser atribuible a la proteína de la presente invención es la formación de tendón/ligamento. Una proteína de la presente invención, la cual induce tejido similar a tendón/ligamento u otra formación de tejido en circunstancias en las que dicho tejido no es normalmente formado, tiene aplicación en la curación de desgarres de tendón o ligamento, deformidades y otros defectos de tendón o ligamento en humanos y otros animales. Dicha preparación empleando una proteína inductora de tejido similar a tendón/ligamento puede tener uso profiláctico en la prevención de daños a tejido de tendón o ligamento, así como en el uso para fijación mejorada de tendón o ligamento a hueso u otros tejidos, y en la reparación de defectos de tejido de tendón o ligamento. La formación de tejido nuevo de tendón/ligamento, inducida por una composición de la presente invención contribuye a la reparación de defectos de tendón o ligamento congénitos, inducidos por traumatismo o de otro origen, y también es útil en cirugía plástica cosmética para la fijación o reparación de tendones o ligamentos. Las composiciones de la presente invención pueden proveer un ambiente para atraer células formadoras de tendón o ligamento, estimular el crecimiento de células formadoras de tendón o ligamento, inducir la diferenciación de progenitores de células formadoras de tendón o ligamento, o inducir el crecimiento de células o progenitores de tendón/ligamento ex vivo para retorno in vivo para efectuar la reparación de tejido. Las composiciones de la invención también pueden ser útiles en el tratamiento de tendonitis, síndrome de túnel carpiano y otros defectos de tendón o ligamento. Las
composiciones también pueden incluir una matriz apropiada y/o un agente secuestrante como un portador como se conoce bien en la técnica. La proteína de la presente invención también puede ser útil para la proliferación de células nerviosas y para la regeneración de tejido nervioso y del cerebro, esto es, para el tratamiento de enfermedades y neuropatías del sistema nervioso central y periférico, así como de desordenes mecánicos y traumáticos que involucren la degeneración, muerte o lesión a células nerviosas o al tejido nervioso. Más específicamente, una proteína puede ser empleada en el tratamiento de enfermedades del sistema nervioso periférico, tales como daños al nervio periférico, neuropatía periférica y neuropatías localizadas, y enfermedades del sistema nervioso central, tales como la enfermedad de Alzheimer, Parkinson, Huntington, esclerosis lateral amiotrópica y el síndrome de Shy-Drager. Condiciones adicionales que pueden ser tratadas de acuerdo con la presente invención incluyen desordenes mecánicos y traumáticos, tales como desordenes de la médula espinal, lesiones de la cabeza y enfermedades cerebrovasculares tales como ataque apopléjico. También pueden ser tratables usando una proteína de la presente invención neuropatías periféricas que resultan de quimioterapia u otras terapias médicas. Las proteínas de la invención también pueden ser útiles para promover el mejor y más rápido cierre de heridas sin sanar, incluyendo sin limitación, úlceras por presión, úlceras asociadas con insuficiencia vascular, heridas por traumatismo y por cirugía, y similares. Se espera que una proteína de la presente invención también puede exhibir actividad para la generación o regeneración de otros tejidos tales como tejidos de órganos (incluyendo, por ejemplo, páncreas, hígado, intestino, riñon, piel, endotelio), de músculo (liso, esquelético o cardiaco) y vascular (incluyendo endotelio vascular), o para promover el crecimiento de células que comprenden dichos tejidos. Parte de los efectos deseados puede ser mediante la inhibición o modulación de la cicatrización fibriótica para permitir que el tejido normal se regenere. Una proteína de la invención también puede presentar actividad angiogénica.
Una proteína de la presente invención también puede ser útil para la protección o regeneración del intestino y para el tratamiento de la fibrosis de pulmón o hígado, daño por reperfusión en varios tejidos y condiciones resultantes de daño sistémico de citocina.
Una proteína de la presente invención también puede ser útil para promover o inhibir la diferenciación de tejidos descritos anteriormente de tejidos o células precursoras; o para inhibir el crecimiento de los tejidos descritos anteriormente. La actividad de una proteína de la invención puede, entre otros medios, ser medida por los siguientes métodos: Los ensayos para determinar la actividad de generación de tejido incluyen, sin limitación, aquellos descritos en la Publicación de Patente Internacional No. W095/ 16035 (hueso, cartílago, tendón); Publicación de Patente Internacional No. WO95/05846 (nervio, nervioso); Publicación de Patente Internacional No. WO91/07491 (piel, endotelio). Los ensayos para determinar actividad de curación de heridas incluyen, sin limitación, aquellos descritos en: Winter, Epidemial Wound Healing, pps. 71-112 (Maibach, Hl and Rovee, DT, eds.) Year Book Medical Publishers, Inc., Chicago, según fue modificado por Eaglstein and Mertz, J. Invest. Dermatol 71:382-84 (1978).
Actividad de Activina Inhibina Una proteína de la presente invención también puede exhibir actividades relacionadas con adivina o inhibina. Las inhibinas se caracterizan por su capacidad de inhibir la liberación de la hormona estimulante del folículo (FSH), mientras que las activinas están caracterizadas por su capacidad de estimular la liberación de la hormona estimulante del folículo (FSH). Por lo tanto, una proteína de la presente invención, sola o en heterodímeros con un miembro de la familia alfa de inhibinas, puede ser útil como un anticonceptivo basado en la capacidad de inhibir o disminuir la fertilidad en mamíferos hembras y disminuir la espermatogénesis en mamíferos machos. La administración de cantidades suficientes de otras inhibinas puede inducir la infertilidad en estos mamíferos. Alternativamente, la proteína de la invención, como un homodímero o como un heterodímero con otras subunidades de proteína del grupo de inhibinas beta, puede ser útil como un terapéutico inductor de la fertilidad, basado en la capacidad de las moléculas de adivina en la estimulación de la liberación de FSH de células de la pituitaria anterior. Ver, por ejemplo, la Patente de los E.U.A. No. 4,798,885. Una proteína de la presente invención también puede ser útil para adelantar el comienzo de la
fertilidad en mamíferos sexualmente inmaduros, con el propósito de incrementar el ciclo de desempeño productivo de animales domésticos tales como vacas, ovejas y cerdos. La actividad de una proteína de la invención puede, entre otros medios, ser medida por los siguientes métodos: Los ensayos para determinar la actividad de activina/inhibina incluyen, sin limitación, aquellos descritos en Vale et al., Endocrinology 91:562-572, 1972; Ling et al., Nature 321 :779-782, 1986; Vale et al., Nature 321:776-779, 1986; Masón et al., Nature, 318:659-663, 1985; Forage et al., Proc. Nati. Acad. Sci. USA 83:3091-3095, 1986.
Actividad Ouimiotáctica/Quimiocmética Una proteína de la presente invención puede tener actividad qumiocinética o quimiotáctica (por ejemplo, actuar como una quimiocina) para células de mamífero, incluyendo, por ejemplo, monocitos, fibroblastos, neutrófilos, células T, células mast, eosinófilas, y células epiteliales y/o endoteliales. Las proteínas quimiocinéticas y quimiotácticas pueden utilizarse para movilizar o atraer una población de células deseadas a un sitio de acción deseado. Las proteínas quimiotácticas o quimiocinéticas proveen ventajas particulares en el tratamiento de heridas y otras lesiones de tejidos, así como en el tratamiento de infecciones localizadas. Por ejemplo, la atracción de linfocitos, monocitos o neutrófilos hacia tumores o sitios de infección puede resultar en respuestas inmunes mejoradas contra el tumor o agente infeccioso. Una proteína o péptido tiene actividad quimiotáctica para una población celular particular sí ésta puede estimular, directa o indirectamente, la orientación o movimiento dirigido de dicha población celular. Preferiblemente, la proteína o péptido tiene la capacidad de estimular directamente el movimiento dirigido de células. El que una proteína particular tenga actividad quimiotáctica para una población de células puede ser fácilmente determinado empleando dicha proteína o péptido en cualquier ensayo conocido para quimiotaxia celular.
La actividad de una proteína de la invención puede, entre otros medios, ser medida por los siguientes métodos: Los ensayos para determinar la actividad quimiotáctica (que identificarán proteínas que inducen o previenen la quimiotaxia) consisten en ensayos que miden la capacidad de una
proteína para inducir la migración de células a través de una membrana así como también la capacidad de una proteína para inducir la adhesión de una población de células a otra población de células. Los ensayos apropiados para determinar el movimiento y adhesión incluyen, sin limitación, aquellos descritos en Current Protocols in Immunology, Editado por J. E. Coligan, A.M. Kruisbeek, D.H. Margulies, E.M. Shevach, W. Strober, Publicado por Greene Publishing Associates and Wiley-Interscience (Chapter 6.12, Measurement of alpha and beta Chemokines 6.12.1-6.12.28; Taub et al., J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS 103:140-146, 1995; Muller et al., Eur J. Immunol. 25; 1744-1748; Gruber et al., J. Of lmmunol. 152:5860-5867, 1994; Johnston et al., J. of lmmunol. 153:1762-1768, 1994.
Actividad Hemostática y Trombolítica Una proteína de la invención también puede presentar actividad hemostática o trombolítica. Como resultado de esto, se espera que dicha proteína sea útil en el tratamiento de diversos desordenes de la coagulación (incluyendo desordenes hereditarios, tales como hemofilias) o para mejorar la coagulación y otros eventos hemostáticos en el tratamiento de heridas resultantes de traumas, cirugías u otras causas. Una proteína de la invención también puede ser útil para disolver o inhibir la formación de trombosis y para el tratamiento y prevención de condiciones resultantes de ella (tales como, por ejemplo, infarto de los vasos del sistema nervioso central o cardiaco (e. g., ataque). La actividad de una proteína de la presente invención puede, entre otros medios, ser medida por los siguientes métodos: Los ensayos para determinar la actividad hemostática y trombolítica incluyen, sin limitación, aquellos descritos en: Linet et al., J. Clin. Pharmacol. 26:131-140, 1986; Burdick et al., Thrombosis Res. 45:413-419, 1987; Humphrey et al., Fibrinolysis 5:71-79 (1991); Schaub, Prostaglandins 35:467-474, 1988.
Actividad de Receptor/Ligando Una proteína de la presente invención también puede demostrar actividad como receptores, ligandos o inhibidores de receptores o agonistas de interacciones de receptor/ligando Los ejemplos de tales receptores y ligandos incluyen, sin limitación,
receptores de atocinas y sus hgandos, receptores de quinasas y sus ligandos, receptores de fosfatasas y sus ligandos, receptores involucrados en interacciones de celula-celula y sus ligandos (incluyendo, sin limitación, moléculas de adhesión celular (tales como selectinas, integrinas y sus hgandos) y parejas receptor/ligando involucradas en presentación de antigeno, reconocimiento de antigeno y desarrollo de respuestas inmunes celulares y humorales) Los receptores y ligandos también son útiles para el tamizaje de peptido potencial o inhibidores de moléculas pequeñas de la interacción relevante receptor/ligando Una protema de la presente invención (incluyendo, sin limitación, fragmentos de receptores y gandos) puede por ella misma ser util como inhibidor de las interacciones de receptor/ligando La actividad de una proteina de la presente invención puede, entre otros medios, ser medida por los siguientes métodos Las pruebas adecuadas para determinar actividad de receptor-ligando incluyen, sin limitación las descritos en Current Protocols ín Immunology, editado por J E Coligan, A M Kruisbeek, D H Marguhes, E M Shevach, W Strober, Pub Greene Publishing Associates and Wiley-Interscience (Chapter 7 28, Measurements of Cellular Adhesión under static conditions 7 28 1-7 28 22), Takai et al , Proc Nati Acad Sci USA 84 6864-6868, 1987, Bierer et al , J Exp Med 168 1145-1156, 1988, Rosenstein et al , J Exp Med 169 149-160 1989, Stoltenborg et al , J Immunol Methods 175 59-68, 1994, Stitt et al , Cell 80 661-670, 1995
Actividad Anti-Inflamatopa Las proteínas de la presente invención también pueden presentar actividad anti-ínflamatona La actividad anti-inflamatopa puede ser lograda proveyendo un estimulo a las células involucradas en la respuesta inflamatoria, inhibiendo o promoviendo las interacciones celula-celula (tal como, por ejemplo, la adhesión celular), inhibiendo o promoviendo la quirmotaxis de células involucradas en el proceso inflamatorio, inhibiendo o promoviendo la extravasación celular, o estimulando o suprimiendo la producción de otros factores que inhiben o promueven mas directamente una respuesta inflamatoria Las proteínas que presentan dichas actividades pueden ser utilizadas para tratar condiciones inflamatorias (incluyendo condiciones crónicas o agudas) incluyendo, sin limitación, la inflamación
— - - ^--
asociada a infecciones (tales como el choque séptico, sepsis o el síndrome de respuesta inflamatoria sistémica (SIRS)), daño por isquemia-reperfusión, mortalidad por endotoxina, artritis, rechazo hiperagudo mediado por complemento, nefritis, daño pulmonar inducido por citocina o quimiocina, enfermedad inflamatoria del intestino, enfermedad de Crohn o resultante de la sobre-producción de citocinas tales como el TNF o la IL-1. Las proteínas de la invención también pueden ser útiles para tratar la anafiláxis y la hipersensibihdad a una substancia o material antígeno.
Actividad de Inhibición de Tumores Además de las actividades descritas anteriormente para el tratamiento inmunológico o de prevención de tumores, una proteína de la presente invención puede exhibir otras actividades anti-tumores. Una proteína puede inhibir el crecimiento de tumores directa o indirectamente (tal como, por ejemplo, vía ADCC). Una proteína puede presentar su actividad inhibitoria de tumores actuando sobre el tejido del tumor o el tejido precursor del tumor, inhibiendo la formación de los tejidos necesarios para sostener el crecimiento del tumor (tal como, por ejemplo, inhibiendo la angiogénesis), causando la producción de otros factores, agentes o tipos de células que inhiben el crecimiento del tumor, o suprimiendo, eliminando o inhibiendo factores, agentes o tipos de células que promueven el crecimiento del tumor.
Otras Actividades Una proteína de la invención también puede presentar una o más de las siguientes actividades o efectos: inhibir el crecimiento, infección o función de, o exterminación de, agentes infecciosos, incluyendo, sin limitación, bacterias, virus, hongos y otros parásitos; afectar (supresión o mejoramiento) características corporales, incluyendo, sin limitación, altura, peso, color de pelo, color de ojos, piel, proporción grasa carne o pigmentación de otros tejidos, o tamaño o forma parcial del cuerpo (tal como, por ejemplo, aumento o disminución del pecho, cambios en la forma o configuración de huesos); afectar bioritmos o ciclos o ritmos circadianos; afectar la fertilidad de sujetos machos o hembras, afectar el metabolismo, catabolismo, anabolismo, procesamiento, utilización, almacenamiento o eliminación de grasa, lípidos, proteínas, carbohidratos, vitaminas, minerales, cofactores u otros factores o
componentes nutrimentales de la dieta; afectar características del comportamiento, incluyendo, sin limitación, apetito, libido, estrés, percepción (incluyendo desordenes de la percepción), depresión (incluyendo desordenes depresivos) y comportamientos violentos; provisión de efectos analgésicos u otros efectos reductores del dolor; promoción de la diferenciación y crecimiento de células progenitoras embriónicas en linajes distintos a los linajes hematopoiéticos; actividad hormonal o endocrina; en el caso de enzimas, corregir deficiencias de las enzimas y el tratamiento de enfermedades relacionadas con las deficiencias; tratamiento de desórdenes hiperproliferativos (tales como, por ejemplo, la psoriasis); actividad similar a inmunoglobulina (por ejemplo, la capacidad de unirse a antígenos o complementos); y la capacidad de actuar como un antígeno en una vacuna para elevar la respuesta inmune contra dicha proteína u otro material o entidad que sea reactivo de alguna forma con dicha proteína.
Ejemplos La presente invención es materializada con mayor detalle por los siguientes ejemplos, pero esta modalidad no pretende restringir la presente invención. Las operaciones básicas y las reacciones de enzima con relación a la recombinación de ADN son llevadas a cabo de acuerdo con la literatura ["Molecular Cloning. A Laboratory Manual", Cold Spring Harbor Laboratory, 1989]. A menos que se especifique otra cosa, las enzimas de restricción y una variedad de enzimas de modificación a ser utilizadas fueron aquellas disponibles en TAKARA SHUZO. Las instrucciones del fabricante fueron usadas para las composiciones reguladoras así como para las condiciones de reacción, en cada una de las reacciones de enzima. La síntesis de ADNc fue llevada a cabo de acuerdo con la literatura [Kato, S. et al., Gene 150: 243-250 (1994)].
(1) Preparación de ARN PolvfA)+ La línea celular de osteosarcoma Saos-2 (ATCC HTB 85), tejidos de cáncer de estómago obtenidos por operación, y el hígado fueron usados para células de humano para extraer ARNms. La línea celular fue incubada mediante un procedimiento convencional. Después de que aproximadamente 1 g de células de humano fue homogeneizado en 20 ml de solución de tiocianato de guanidina 5.5 M, se preparó ARNm total de acuerdo con la literatura [Okayama, H. et al , "Methods in Enzimology", vol. 164, Academic Press, 1987]. Este fue
sometido a cromatografía usando una columna de oligo(dT)-celulosa lavada con solución reguladora de Tris-ácido clorhídrico 20 mM (pH 7.6), NaCl 0. 5 M, y EDTA 1 mM para obtener un ARN poly(A)+ de acuerdo con la literatura antes mencionada.
(2) Construcción de una Biblioteca de ADNc Diez microgramos del ARN poli(A)+ antes mencionado fueron disueltos en una solución reguladora de Tris-ácido clorhídrico 100 mM (pH 8), fue agregada una unidad de fosfatasa alcalina de origen bacteriano y libre de RNasa y la solución resultante se dejó reaccionar a 37 °C durante una hora. Después la solución de reacción experimentó la extracción de fenol, seguida por precipitación de etanol, los granulos obtenidos fueron disueltos en una solución conteniendo acetato de sodio 50 mM (pH 6), EDTA 1 mM, 2-mercaptoetanol al 0.1% y Tritón X- 100 al 0.01%. A esto le fue agregada una unidad de una pirofosfatasa acida originaria de tabaco (Epicentre Technologies) y la solución resultante en un volumen total de 100 µl fue dejada que reaccionara a 37 °C durante una hora. Después de que la solución de reacción experimentó la extracción con fenol seguida por la precipitación con etanol, los granulos así obtenidos fueron disueltos en agua para obtener una solución de ARN poli(A)+ decapado. El ARN poli(A)+ decapado y 3 nmol de un oligonucleótido quimérico de ADN-ARN (5'-dG-dG-dG-dG-dA-dA-dT-dT-dC-dG-dA-G-G-A-3') fueron disueltos en una solución conteniendo solución reguladora de Tris-ácido clorhídrico 50 mM (pH 7.5), ATP 0.5 mM, MgC^ 5 mM, 2-mercaptoetanol 10 mM y 25% de polietilenglicol, a lo cual se agregaron 50 unidades de ligasa de ARN T4 y la solución resultante en un volumen total de 30 µl fue dejada que reaccionara a 20 °C durante 12 horas. Después de que la solución de reacción experimentó la extracción con fenol seguida por la precipitación con etanol, los granulos así obtenidos fueron disueltos en agua para obtener un ARN quimérico poli(A)+ oligo-caped. Después de que el vector pKAl desarrollado por los presentes inventores (Publicación
Kokai de Patente Japonesa No. 1992-1 17292) fue digerido con Kpnl, una cola de aproximadamente 60 dT fue agregada usando una transferasa terminal. Un primario de vector a ser utilizado más adelante fue preparado mediante digestión de este producto con EcoRV para eliminar una cola dT en un costado.
.«IJ^.^-^, , _^?±
Después de que 6 µg del ARN poli(A)+ oligo-caped quimérico, preparado con anterioridad, fuera recocido con 1.2 µg del primario vectorial, el producto resultante fue disuelto en una solución conteniendo solución reguladora de Tris-ácido clorhídrico 50 mM (pH 8.3), KCl 75 mM, MgCl2 3 mM, ditiotreitol 10 mM y dNTP 1.25 mM (dATP + dCTP + dGTP + dTTP), fueron agregadas 200 unidades de una transcriptasa inversa (GIBCO-BRL), y la reacción en un volumen total de 20 µl se dejó correr a 42 °C durante una hora. Después de que la solución de reacción experimentó la extracción con fenol seguida por la precipitación con etanol, los granulos obtenidos de esta forma fueron disueltos en una solución conteniendo solución reguladora de Tris-ácido clorhídrico 50 mM (pH 7.5), NaCl 100 mM, MgCl2 10 mM y ditíotreitol 1 mM. A esto se le agregaron 100 unidades de EcoRI y la solución resultante en un volumen total de 20 µl se dejó reaccionar a 37 °C por una hora. Después de que la solución de reacción sufrió la extracción con fenol seguida por la precipitación con etanol, los granulos así obtenidos fueron disueltos en una solución conteniendo solución reguladora de Tris-ácido clorhídrico 20 mM (pH 7.5), KCl 100 mM, MgCl2 4 mM, (NH4)2S?4 10 mM y 50 µg/ml de albúmina de suero bovino. A esto se le agregaron 60 unidades de una ligasa de ADN de Escherichia coli y la mezcla resultante se dejó que reaccionara a 16 CC durante 16 horas. A la solución de reacción se agregaron 2 µl de dNTP 2 mM, 4 unidades de polimerasa I de ADN de Escherichia coli y 0.1 unidades de RNasa H de Escherichia coli, y la mezcla resultante se dejó reaccionar a 12 °C durante una hora y posteriormente a 22 °C durante una hora. Enseguida, la solución de la reacción de la síntesis del ADNc fue usada para la transformación de Escherichia coli DH12S(GIBCO-BRL). La transformación fue llevada a cabo mediante el método de electroforación. Una parte del transformante fue asperjada sobre el medio de cultivo de agar 2xYT conteniendo 100 µg/ml de ampicilina y la mezcla fue incubada a 37 °C durante toda la noche. Una colonia formada en el medio de cultivo de agar fue tomada aleatoriamente y se inoculó en 2 mi del medio de cultivo 2xYT conteniendo 100 µg/ml de ampicilina. Después de incubación a 37 °C durante toda la noche, el medio de cultivo fue centrifugado para separar la ñúscela, a partir de la cual se preparó un ADN de plásmido mediante el método de lísis alcalina. El ADN de plásmido fue sometido a digestión doble con EcoRI y Notl, seguida de electroforesia en gel de agarosa al 8%, para determinar el tamaño del inserto de ADNc. Además, usando el plásmido así obtenido como un modelo, la reacción de secuencia fue
at-w-H.^ -MaMa W^_^^üH^^^M-i
llevada a cabo usando un primario universal M13 marcado con un tinte fluorescente y polimerasa Taq (un equipo de Applied Biosistems Inc.) y posteriormente el producto se examinó mediante un secuenciador de ADN fluorescente (Applied Biosystems Inc.) para determinar una secuencia de bases de aproximadamente 400 bp en ia terminación 5' del ADNc. La información de la 5 secuencia fue presentada como una base de datos de un banco de ADNc de homo/proteína.
(31 Selección de ADNcs que Codifican para Proteínas que Tienen Dominios de transmembrana. Una secuencia de bases registrada en el banco de ADNc de homo/proteína fue convertida
a tres marcos de secuencias de aminoácidos y se examinó la presencia o ausencia de un marco de lectura abierta (ORF) comenzando desde el codón de iniciación. Posteriormente, la selección fue hecha para la presencia de una secuencia señal que es característica para una proteína secretada en la terminación N de la porción codificada por el ORF. Estas clonas fueron secuenciadas desde ambas direcciones 5' y 3' usando el método de deleción y utilizando exonucleasa III para
determinar la secuencia de bases completa. Los perfiles de bidrofobicidad/hidrofilicidad fueron obtenidos para proteínas codificadas por el ORF mediante el método de Kyte-Doolittle (Kyte, J.
& Doolittle, R. F., J. Mol. Biol. 157: 105-132 (1982)] para examinar la presencia o ausencia de una región hidrofóbica. En el caso en el que existe una región hidrofóbica de un dominio de transmembrana putativa en la secuencia de aminoácidos de una proteína codificada, esta proteína
fue considerada como una proteína de membrana.
(4) Verificación Funcional de Secuencia de Señal Secretoria o Dominios de Transmembrana. Se verificó por el método descrito en la literatura [Yokoyama-Kobayashi, M. et al., Gene
163: 193-196 (1995)] el que la región hidrofóbica con terminación N en el candidato de clona de proteína secretada obtenido en las etapas antes mencionadas funciona como una secuencia de señal secretoria. Primero, el plásmido conteniendo el ADNc objetivo fue dividido en un sitio de enzima de restricción apropiado que existía corriente abajo de la porción esperada para la codificación de la secuencia de señal secretoria. En el caso en que este sitio de restricción era una
terminación sobresaliendo, el sitio fue hecho que terminara romo mediante el tratamiento Klenow
o tratamiento con la polimerasa de T4DNA. La digestión con HindIII fue adicionalmente llevada a cabo y un fragmento de ADN conteniendo el promotor SV40 y un ADNc que codificaba para la secuencia de señal secretoria corriente abajo del promotor fue separado mediante electroforesia en gel de agarosa. El fragmento resultante fue insertado entre el sitio HindIII en pSSD3 (DDBJ/EMBL/Registro GenBank No. AB007632) y un sitio de enzima de restricción seleccionado a fin de empatar con el marco de codificación de uroquinasa, construyendo de esta forma un vector que expresa una proteína de fusión de la secuencia de señal secretoria del ADNc objetivo y el dominio proteasa de uroquinasa. Después de que la Escherichia coli (hospedero: JMl 09) portando el vector de expresión de proteína de fusión fue incubada a 37 °C durante 2 horas en 2 ml del medio de cultivo 2xYT conteniendo 100 µg/ml de ampicilina, el fago auxiliador M13K07 (50 µl) fue agregado y la incubación fue continuada a 37 °C durante toda la noche. Un sobrenadante separado por centrifugación se sometió a precipitación con polietilenglicol para obtener partículas fago de una sola cadena. Estas partículas fueron suspendidas en 100 µl de Tris 1 mM-EDTA 0.1 mM, pH 8 (TE). También, se utilizaron como controles unas suspensiones de partículas de fago de una sola cadena preparada en la misma forma de pSSD3 y a partir del vector pKAl-UPA conteniendo un ADNc de longitud completa de uroquinasa [Yokoyama-Kobayashi, M. et al., Gene 163: 193-196 (1995)]. Las células del cultivo de origen de riñon de simio, COS7, fueron incubadas a 37 °C en la presencia de 5% de C02 en el medio de cultivo de Eagle modificado por Dulbecco's (DMEM) conteniendo 10% de albúmina de bovino fetal. En un plato de 6 pozos (Nunc. Inc., 3 cm de diámetro de pozo) fueron inoculadas 1 x 105 células COS7 y la incubación se llevó a cabo a 37 °C durante 22 horas en la presencia de 5% de C02. Después de que el medio de cultivo fue retirado, la superficie celular fue lavada con una solución reguladora de fosfato y posteriormente lavada otra vez con DMEM conteniendo Tris-ácido clorhídrico 50 mM (pH 7.5) (TDMEM). A las células resultantes les fue agregado 1 µl de la suspensión de fago de una sola cadena, 0.6 ml de medio de cultivo DMEM, y 3 µl de TRANSFECTAM™ (IBF Inc.) y la mezcla resultante fue incubada a 37 °C durante 3 horas en la presencia de 5% de C02. Después de que la solución muestra fue retirada, la superficie de las células fue lavada con TDMEM, 2 ml por pozo de
DMEM conteniendo 10% de albúmina de bovino fetal fueron agregados, y la incubación se llevó a cabo a 37 °C durante 2 días en la presencia de 5% de C0 . A 10 ml de solución reguladora de fosfato 50 mM (pH 7.4) conteniendo 2% de fibrinógeno de bovino (Miles Inc.), 0.5% de agarosa y cloruro de calcio 1 mM fueron agregadas 10 unidades de trombina humana (Mochida Pharmaceutical Co., Ltd.) y la mezcla resultante fue solidificada en un plato de 9 cm de diámetro para preparar una placa de fibrina. Diez microlitros del sobrenadante del medio de cultivo de las células COS7 transfectadas fueron dispersados sobre la placa de fibrina, la cual fue incubada a 37 °C durante 15 horas. En el caso en el que aparece un circulo claro sobre la placa de fibrina, se considera que un fragmento de ADNc codifica para la secuencia de aminoácidos que funciona como una secuencia de señal secretoria. Por otro lado, en el caso en el que no se formó un circulo claro, las células fueron lavadas bien, posteriormente la lámina de fibrina fue colocada sobre las células, y la incubación se llevó a cabo a 37 °C durante 15 horas. En el caso en el que se formó una porción clara sobre la lámina de fibrina, esto indica que la actividad de uroquinasa era expresada en la superficie de las células. En otras palabras, el fragmento de ADNc es considerado como que codifica para los dominios de transmembrana.
(5) Síntesis de Proteína por Traducción In Vitro El vector plásmido portando el ADNc de la presente invención fue utilizado para la transcripción/traducción in vitro con un equipo de lisato de reticulocito de conejo TNT (Promega). En este caso, se agregó [33S]metionina para marcar el producto de expresión con un radioisótopo. Cada una de las reacciones fue llevada a cabo siguiendo los protocolos anexos al equipo. Dos microgramos del plásmido se dejaron reaccionar a 30 °C durante 90 minutos en 25 µl totales de una solución de reacción conteniendo 12.5 µl del lisato de reticulocito de conejo TNT, 0.5 µl de la solución reguladora (anexa al equipo), 2 µl de una mezcla de aminoácidos (libres de metionina), 2 µl de [35S]metionina (Amersham) (0.37 MBq/µl), 0.5 µl de polimerasa de ARN T7 y 20 U de RNsina. A 3 µl de la solución de reacción resultante les fueron agregados 2 µl del regulador de muestra SDS (solución reguladora de Tris-ácido clorhídrico 125 mM, pH 6.8, 2-mercaptoetanol 120 mM, 2% de solución SDS, 0.025% de azul de bromofenol y 20% de glicerol) y la solución resultante fue calentada a 95 °C durante 3 minutos y posteriormente sometida a electroforesia en
' "irÉrt
gel de SDS-poliacrilamida. El peso molecular del producto de traducción fue determinado llevando a cabo la autoradiografía.
(6) Expresión mediante CQS7 Escherichia coli poseyendo un vector de expresión de la proteína de la invención fue infectada con el fago auxiliador M13K07 y se obtuvieron partículas de fago de una sola cadena mediante el método anteriormente mencionado. El fago así obtenido se utilizó para la introducción de cada vector de expresión en las células de cultivo de origen de riñon de mono, C0S7. Después de la incubación a 37 °C en la presencia de 5% de C02 durante 2 días, la incubación se continuó durante una hora en el medio de cultivo conteniendo [35S]cisteína o [3 Sjmetionina. La recolección y disolución de las células, seguida del sometimiento a SDS-PAGE, permitió observar la presencia de una banda correspondiente al producto de expresión de cada proteína, la cual no existía en las células COS7.
(7) Hibridación de Northern Blot Se llevó a cabo hibridación de Northern Blot con el objeto de examinar el patrón de expresión en los tejidos humanos. Se adquirieron en Clontech filtros en donde ARNs Poly(A)+ aislados de cada uno de los tejidos humanos estaban manchados (blotted) Después de la división de un fragmento de ADNc de la clona objetivo, seguido de electroforesia en agarosa-gel para aislar el fragmento de ADNc, se llevó a cabo marcado con [32P]dCTP (Amersham) usando un equipo de marcado de cebador aleatorio (TAKARA SHUZO). La hibridación se llevó a cabo usando una solución unida al papel blot de acuerdo con el protocolo.
(8) Ejemplos de Clonas <HP02000> (Secuencias Nos. 1 , 10 y 19) La determinación de la secuencia de bases completa del inserto de ADNc de la clona
HP02000 obtenida a partir de bibliotecas de ADNc de cáncer de estómago humano reveló la estructura consistente en una región de no traducción 5' de 186 bp, un ORF de 807 bp, y una región de no traducción 3' de 712 bp. El ORF codifica para una proteína consistente en 268 residuos de aminoácido y existían dos dominios de transmembrana putativos. La Fig. 1 describe
el perfil de hidrofobicidad/hidrofilicidad de esta proteína obtenido por el método de Kyte-Doolittle. La traducción in vitro resultó en la formación de un producto de traducción de 31 kDa que era casi idéntico con el peso molecular de 30,481 pronosticado a partir de ORF. Cuando se expresó en células COS 7 se observó un producto de expresión de aproximadamente 32 kDa en la fracción de transmembrana. La investigación de la base de datos de la proteína usando la secuencia de aminoácidos de esta proteína reveló que la proteína era análoga al transportador de catión orgánico de rata (No. de acceso EMBL Y09945). La Tabla 2 índica la comparación de la secuencia de aminoácidos entre la proteína humana de la presente invención (HP) y la proteína del transportador de catión orgánico de rata (RN). Allí, las marcas de "-", " * " y " . " representan un vacío, un residuo de aminoácido idéntico a aquel en la proteína de la presente invención y un residuo de aminoácido análogo a aquel en la proteína de la presente invención, respectivamente. Ambas proteínas poseían una homología de 67.5% en los 169 residuos aminoácido de la terminación N. Tabla 2 HS MAFEELLSQVGGLGRFQMLHLVFILPSLMLLIPHILLENFAAAIPGHRCWVHMLDNNTGS *** ** *** ***** * *** ** ***** * ** ***** *** * *
RN MAFQDLLNQVGSLGRFQILQMTFILIFNIIISPHSLLENFTAVIPNHRC VPILDNDTVS
HS GNETGILSEDALLRISIPLDSNLRPEKCRRFVHPQWQLLHLNGTIHSTSEADTEPCVDGW ** * ** * *** ****** ********** *** ******* * * ********* RN GNDNGNLSQDDLLRVSIPLDSDLRPEKCRRFVQPQWDLLHLNGTFSSVTEPDTEPCVDG HS VYDQSYFPSTIVTKWDLVCDYQSLKSWQFLLLTGMLVGGIIGGHVSDRWLVESARWLII ***** * *** * ***** *** * ** *** ***^* *<<>** RN VYDQSTFLSTIITEWDLVCESQS DSIAKFLFLTGI VGNILYGPLTDRFGRRLILICAS HS TNKLDEGLKALRKVARTNGIKNAEETLNIEWRSTMQEELDAAQTKTTVCDLFRNPSMRK
RN LQMAVTETCAAFAPTFLIYCSLRFLAGISFSTVLTNS7?LLIIEWTRPKFQALATG LLCA HS RICILVFLRKKISRKRHKNDCYTKVTKF
RN GAIGQTVLAGLAFTVRNWHHLHLñMSVPI FFLLVPTRWLSESARWLI TNKLQKGLKELI
^^j^
Además, la investigación del GenBank usando la secuencia de bases del presente ADNc reveló el registro de secuencias que poseían una analogía de 90% o más (por ejemplo, No. de Acceso AA680184) en EST, pero ninguna de las secuencias era más corta que los presentes ADNcs y no se encontró que contuvieran el codón de iniciación. 5 Una investigación de patrón de expresión en los tejidos mediante hibridación northern blot usando el fragmento de ADNc de la presente invención ha revelado la expresión únicamente en el hígado. El transportador de catión orgánico de rata se ha encontrado como una proteína de membrana asociada con una excreción de fármaco en el riñon [Grundermann, D. Et al., Nature
372: 549-552 (1994)]. En consecuencia, la proteína de la presente invención que es su homologa se considera que posee una función similar y puede ser utilizada para el diagnóstico y tratamiento de enfermedades que están asociadas con anormalidades de esta enzima. Además, esto se considera que está asociado con una excreción de fármaco, de manera que las células que expresan esta proteína pueden ser usadas como una herramienta para el diseño de este fármaco.
Además, puesto que esta proteína es expresada específicamente en el hígado, una substancia preparada así para que tenga una afinidad con esta proteína puede ser aplicada al sistema de liberación del fármaco al hígado.
<HP02061> (Secuencias Nos.2, 11 y 21) 0 La determinación de la secuencia de bases completa para el inserto de ADNc de la clona
HP02061 obtenida de bibliotecas de ADNc de línea celular Saos-2 de osteosarcoma humano reveló la estructura consistente en una región de no traducción 5' de 141 bp, un ORF de 711 bp, y una región de no traducción 3' de 907 bp. El ORF codifica para una proteína consistente en 236 residuos de aminoácido y existían dos dominios de transmembrana putativos. La Figura 2 ilustra 5 el perfil de hidrofobicidad/hidrofilicidad de la presente protema obtenida por el método de Kyte- Doolittle. La traducción in vitro resultó en la formación de un producto de traducción de 26 kDa que era casi idéntico con el peso molecular de 25,593 pronosticado a partir de ORF. La investigación de la base de datos de la proteína usando la secuencia de aminoácidos de la presente proteína reveló que la proteína era análoga a la proteína C específica neuroendócrina 0 humana (No. de acceso PIR 160904). La Tabla 3 indica la comparación de la secuencia de
aminoácidos entre la proteína humana de la presente invención (HP) y la proteína C específica neuroendócrina (PC). Allí, las marcas de "-", " * " y " . " representan un vacío, un residuo de aminoácido idéntico a aquel en la proteína de la presente invención y un residuo de aminoácido análogo a aquel en la proteína de la presente invención, respectivamente. Los 187 aminoácidos residuos de la terminación C poseían una homología de 59.9% con la proteína C específica neuroendócrina humana. Tabla 3 HS MAEPSAATQSHSISSSSFGAEPSAPGGGGSPGACPALGTKSCSSSCAVHDLIFWRDVKKT ** ** * * * PC MQATADSTKMDCV SNWKSQAID LYWRDIKQT
HS GFVFGTTLIMLLSLAAFSVISWSYLILALLSVTISFRIYKSVIQAVQKSEEGHPFKAYL * ^ *** * * ** *** *** ** * * ** ********* * ***** *********
PC GIVFGSFLLLLFSLTQFSWSWAYLALAALSATISFRIYKSVLQAVQKTDEGHPFKAYL
HS DVDITLSSF?FHNYMNA^WHINRAKLIIRLFLVEDLVDSLKLAVFMWLMTYVGAVFNG **** * * * ** ***** ******* ** *** ***** ***
PC ELEITLSQEQIQKYTDCLQFYV STLKELRRLFLVQDLVDSLKFAVLM LLTYVGALFNG HS ITLLILAELLIFSVPIVYEKYKTQIDHYVGIARDQTKSIVEKIQAKLPGIAKKKAE *** * * * ** * *** * * * * ***** ** ** **
PC LTLLLMAWSMFTLPWYVKHQAQIDQYLGLVRTHINAWAKIQAKIPG-AKRHAE
Además, la búsqueda en GenBank usando la secuencia de bases de este ADNc reveló secuencias que tenían una homología de 90% o más (por ejemplo, Acceso No. AA362885) en EST, pero puesto que éstas eran secuencias parciales, no podía juzgarse si cualquiera de estas secuencias codificaba o no para la misma proteína que la proteína de la presente invención.
<HP02163> (Secuencias Nos. 3, 12, 23) La determinación de la secuencia de bases completa para el inserto de ADNc de la clona
HP02163 que fue obtenida a partir de bibliotecas de ADNc de la línea celular Saos-2 de osteosarcoma humano reveló la estructura que consistía en una región de no traducción 5' de 179 bp, un ORF de 786 bp, y una región de no traducción 3' de 104 bp. El ORF codifica para una
^^ ^
proteína consistente en 261 residuos de aminoácido y existía un dominio de transmembrana putativo La Figura 3 describe el perfil de hidrofobicidad/hidrofilicidad de la presente proteína obtenida por el método de Kyte-Doolittle. La traducción in vitro resultó en la formación de un producto de traducción de 30 kDa que era casi consistente con el peso molecular de 29,932 pronosticado a partir de ORF. Cuando se expresó en células COS 7 se observó un producto de expresión de aproximadamente 28 kDa en la fracción de transmembrana. La búsqueda de la proteína en la base de datos, haciendo uso de la secuencia de aminoácidos de esta proteína reveló la presencia de secuencias que eran análogas a una proteína hipotética de levadura de 29.4 kDa (No. de Acceso SWISS-PROT P36039). La Tabla 4 indica la comparación de la secuencia de aminoácidos entre la proteína humana de la presente invención (HP) y la proteína hipotética de levadura de 29.4 kDa (SC). Allí, las marcas de "-", " * " y " . " representan un vacío, un residuo de aminoácido idéntico a aquel en la proteína de la presente invención y un residuo de aminoácido análogo a aquel en la proteína de la presente invención, respectivamente. Las dos proteínas poseían una homología de 33.2% en la región completa. Tabla 4 HS MAGPELLLDSNIRLWWLPIVIITFFVGMIRHYVSI * *** ** *** * * *
SC MTINQHLQQLLFNRIDKTTSSIQQARAPQMLLDDQLKYWVLLPISIVMVLTGVLKQYIMT HS LL QSDKKLTQEQVSDSQVLIRSRVLRENGKYIPKQSFLTRK-YYFNN-PEDGFFKKT
SC LITGSSANEAQPRVKLTEWQYLQWAQLLIGNGGNLSSDAFAAKKEFLVKDLTEERHLAKA HS KRK WPPSPMTDPTM LTDIYMKGNVTNVLPMILIGGWINMTFSGFVTTKVPFP * * * ** * * ** * . * . . * * * * . ** . . ***
SC KQQDGSQAGEVPNP™DPSMSNA^ MNImKGNIffiSFIPQTIIMW VNHFFAGFILMQLPFP HS LTLRFKPMLQQGIELLTLDAS VSSASWYFLNVFGLRSIYSLI-LGQDNAADQSRMMQEQ
** ** *** ** ** **** **** * ** ^ * ^ ** * , , , , *. SC LTAKFKEMLQTGIICQDLDVRWVSSISWYFISVLGLNPVYNLIGLNDQDMGIQAGIGGPQ HS MTGAAMAMPADTNKAFKTEWEALELTDHQWA DDVEEELMAKDLHFEGMFKKELQTSIF
SC APKALHNHRLTKQCMR LTI
Además, la búsqueda en GenBank utilizando la secuencia de bases del presente ADNc reveló el registro de secuencias que presentaban una homología de 90% o más (por ejemplo,
Acceso No. Z43161) en EST, pero puesto que éstas eran secuencias parciales, no podía juzgarse si alguna de estas secuencias codificaba o no para la misma proteína que la proteína de la invención.
<HP02219> (Secuencias Nos 4, 13 y 25) La determinación de la secuencia de bases completa para el inserto de ADNc de la clona HP02219 obtenida a partir de bibliotecas de ADNc de cáncer de estómago humano reveló la estructura consistente en una región de no traducción 5' de 58 bp, un ORF de 987 bp, y una región de no traducción 3' de 714 bp. El ORF codifica para una proteína consistente en 328 residuos de aminoácido y existía un dominio de transmembrana putativo. La Figura 4 ilustra el perfil de hidrofobicidad/hidrofilicidad de la presente proteína obtenida por el método de Kyte-Doolittle. La traducción in vitro resultó en la formación de un producto de traducción de 39 kDa que era casi idéntico con el peso molecular de 37,299 pronosticado a partir de ORF. Cuando se expresó en células COS 7 se observó un producto de expresión de aproximadamente 39 kDa en la fracción de transmembrana. La investigación de la base de datos de la proteína usando la secuencia de aminoácidos de la presente proteína reveló que la proteína era análoga al homólogo de 4-6-dehidratasa de dTDP-glucosa de Alabidopsis thaliana (No. de Acceso PIR S58282). La Tabla 5 indica la comparación de la secuencia de aminoácidos entre la proteína humana de la presente invención (HP) y el homólogo de 4-6-dehidratasa de dTDP-glucosa de Alabidopsis thaliana (AT). Allí, las marcas de " * " y " . " representan un residuo de aminoácido idéntico a aquel en la proteína de la presente invención y un residuo de aminoácido análogo a aquel en la proteína de la presente invención, respectivamente. Las dos proteínas poseían una homología de 57.2% en 145 residuos de aminoácido en la región de la terminación C.
Tabla 5 HS MVSKALLRLVSAVNRRRMKLLLGIALLAYVASVWGNFVNMSFLLNRSIQENGELKIE
AT RVWTGGAGFVGSHLVDRL ARGDTVIWDNFFTGRKENVMHHFSNPNFEMIRHDWEPI HS SKIEEMVEPLREKIRD EKSFTQKYPPVKFLSEKDRKRILITGGAGFVGSHLTDKLMMDG
AT LLEVDQIYHLACPASPVHYKFNPVKTIKTNWGTLNMLGLAKRVGARFLLTSTSEVYGDP HS HEVTWDNFFTGRKRNVEH IGHENFELINHDWEPLYIEGVEVRVARIFNTFGPRMHMN **** ****** _ **** AT LQHPQVETYWGNVNPIGVRSCYDEGKRTAETLTMDYHRGSNVEVRIARIFNTYGPRMCID HS DGRWSNFILQALQGEPLTVYGSGSQTP?FQYVSDLTOGLVALMNSNVSSPVNLGNPEEH ******** *** ******* * *** ** ***** ** ** * ***** *
AT DGR WSN FVAQALRKE PLTVYG DGKQTRS FQFVS DLVEGLMRLMEGEH VG PFNLGNPGEF HS TILEFAQLIKNLVGSGSEIQFLSEAQDDPQKRKPDIKKAKLMLGWEPWPLEEGLNKAIH * * * * * * ** * * * **** *** * **** * * ** AT TMLELAKWQETIDPNANIEFRPNTEDDPHKRKPDITKAKELLGWEPKVSLRQGLP MVK HS YFRKELEYQANNQYIPKPKPARIKKGRTRHS
AT DFRQRVFGDQKEGSSAAATTTKTTSA
Además, la búsqueda en GenBank usando la secuencia de bases del presente ADNc reveló el registro de secuencias que poseían una homología de 90% o más (por ejemplo, Acceso
No. U46355) en EST, pero puesto que éstas eran secuencias parciales, no podía juzgarse si alguna de estas secuencias codificaba o no para la misma proteína que la proteína de la presente invención.
<HP02256> (Secuencias Nos. 5, 14 y 27) La determinación de la secuencia de bases completa para el inserto de ADNc de la clona HP02256 obtenida de bibliotecas de ADNc de cáncer de estómago humano reveló la estructura consistente en una región de no traducción 5' de 131 bp, un ORF de 903 bp, y una región de no
traducción 3' de 663 bp. El ORF codifica para una proteína consistente en 300 residuos de aminoácido y existía un dominio de transmembrana en la terminación N. La Fig. 5 ilustra el perfil de hidrofobicidad/hidrofilicidad de esta proteína obtenida por el método de Kyte-Doolittle. La traducción in vitro resultó en la formación de un producto de traducción de 33 kDa que era casi idéntico con el peso molecular de 32,943 pronosticado a partir de ORF. Cuando se expresó en células COS 7 se observó un producto de expresión de aproximadamente 30 kDa en la fracción de transmembrana. La investigación de la base de datos de la proteína usando la secuencia de aminoácidos de la presente proteína reveló que la proteína era análoga a la proteína T11F9.11 hipotética de la Caenorhabditis elegans (No. de Acceso PID 1403260). La Tabla 6 indica la comparación de la secuencia de aminoácidos entre la proteína humana de la presente invención (HP) y la proteína T1 1F9.11 hipotética de la Caenorhabditis elegans (CE). Allí, las marcas de "-", " * " y " . " representan un vacío, un residuo de aminoácido idéntico a aquel en la proteína de la presente invención y un residuo de aminoácido análogo a aquel en la proteína de la presente invención, respectivamente. Ambas proteínas poseían una homología de 41.7% en la región completa.
m^^^i
Tabla 6 HS MKFLLDILLLLPLLIVCSLESFVKLFIPK RRKSVTGEIVLITGAGHGIGRLTAYEFA ** * * * * **** * ***** * ***** * ***
CE MDRALDFVKMVVGTLFFIVLNFFKNFLPNGVLPRKSVEGKKVLITGSGSGIGRLMALEFA HS KLKSKLVLWDINKHGLEETAAKCKGLGAKVHTFWDCSNREDIYSSAKKVKAEIGDVSI ** * ** ** * *** * * ***** * ** ** * ** **
CE KLGAEWIWDVNKDGAEETKNQWKAGGKASTFWDLSQYKDIHKVAKETKEAVGDIDI HS VNNAGWYTSDLFATQDPQIEKTFEVNVLAHF TTKAFLPAMTKNNHGHIVTVASAAGHV
CE INNAGIVTGKKLFDCPDELMEKTMAVNTNALFYTAKNFLPSMLEKDNGHLVTIASMAGKT
HS SVPFLLAYCSSKFAAVGFHKTLTDELAALQITGVKTTCLCPNFVNTG-F— IKNPSTSLG * ** ** * * * * * ** ** ** * ** * *
CE GCVGLVDYCASKHGAIGCHDSIAMEILAQKKYGVNTTLVCPFFIDTGMFHGVTTKCPALF HS PTLEPEEWNRLMHGILTEQKMIFIPSSIAF TTLERILPERFLAVLKRKISVKFDAVIG
CE PILEANYAVECIVEAILTNRPLLCMPKASYLILALIGLLPIESQVMMADFFGTNESMNDF HS YK KAQ
CE KGRQKND
Además, la búsqueda en GenBank usando la secuencia de bases del presente ADNc reveló el registro de secuencias que poseían una homología de 90% o más (por ejemplo, Acceso No. H61494) en EST, pero puesto que ellas eran secuencias parciales no pudo juzgarse si alguna de esta secuencias codificaba o no para la misma proteína de la presente invención.
<HP10390> (Secuencias Nos. 6, 15 y 29) La determinación de la secuencia de bases completa del inserto de ADNc de la clona
HP 10390 obtenida a partir de bibliotecas de ADNc de cáncer de estómago humano reveló la estructura consistente en una región de no traducción 5' de 144 bp, un ORF de 549 bp, y una región de no traducción 3' de 121 bp. El ORF codifica para una proteína consistente en 182
1-a*"^- ' ~*-
residuos de aminoácido y poseía un dominio de transmembrana en la terminación N. La Figura 6 ilustra el perfil de hidrofobicidad/hidrofilicidad de la presente proteína obtenida por el método de Kyte-Doolittle. La introducción de un vector de expresión, en donde el fragmento de HindlII-BstXi (tratado con polimerasa T4RNA) conteniendo una porción de ADNc que codifica para los 50 residuos de aminoácido de la terminación N de la presente proteína estaba insertado dentro del sitio HindIII-Smal de pSSD3, dentro de células COS7 reveló la actividad de uroquinasa sobre la superficie de las células para indicar que la presente proteína es la proteína de membrana tipo II. La traducción in vitro resultó en la formación de un producto de traducción de 20 kDa que era casi idéntico con el peso molecular de 20,639 pronosticado a partir del ORF. Cuando se expresó en células COS, se observó un producto de expresión de aproximadamente 19 kDa en la fracción sobrenadante y en la fracción de membrana. La investigación de la base de datos de la proteína usando la secuencia de aminoácidos de la presente proteína no identificó ninguna proteína conocida que tuviera analogía. Además, la búsqueda en GenBank usando la secuencia de bases del presente ADNc reveló la presencia de secuencias que poseían una homología de 90% o más (por ejemplo, Acceso No. AA315322) en EST, pero puesto que éstas eran secuencias parciales, no podía juzgarse si alguna de estas secuencias codificaba o no para la misma proteína que la proteína de la presente invención.
<HP10474> (Secuencias Nos. 7, 16 y 31) La determinación de la secuencia de bases completa para el inserto de ADNc de la clona
HP 10474 obtenida de bibliotecas de ADNc de la línea celular Saos-2 de osteosarcoma humano reveló la estructura que consistía en una región de no traducción 5' de 22 bp, un ORF de 201 bp, y una región de no traducción 3' de 288 bp. El ORF codifica para una proteína consistente en 66 residuos de aminoácido y poseía un dominio de transmembrana en la terminación C. La Figura 7 describe el perfil de hidrofobicidad/hidrofilicidad de la presente proteína obtemda por el método de Kyte-Doolittle. La traducción in vitro resultó en la formación de un producto de traducción de 10 kDa que era casi idéntico con el peso molecular de 7,599 pronosticado a partir de ORF.
La búsqueda de la proteína en la base de datos, haciendo uso de la secuencia de aminoácidos de la presente proteína no reveló la presencia de ninguna proteína que tuviera analogía. También, la búsqueda en GenBank usando la secuencia de bases del presente ADNc
reveló la presencia de secuencias que poseían una homología de 90% o más (por ejemplo, Acceso No. H30340) en EST, pero puesto que éstas eran secuencias parciales, no podía juzgarse si alguna de estas secuencias codificaba o no para la misma proteína que la proteína de la invención.
<HP10527> (Secuencias Nos. 8, 17 y 33) La determinación de la secuencia de bases completa para el inserto de ADNc de la clona HP 10527 de bibliotecas de ADNc de la línea celular Saos-2 de osteosarcoma humano reveló la estructura que consistía en una región de no traducción 5' de 113 bp, un ORF de 552 bp, y una región de no traducción 3' de 461 bp. El ORF codifica para una proteína de 183 residuos de aminoácido y con tres dominios putativos de transmembrana. La Fig. 8 describe el perfil de hidrofobicidad/hidrofilicidad de esta proteína obtenido por el método de Kyte-Doolittle. Como resultado de la traducción in vitro, se produjo un producto de traducción de aproximadamente 21 kDa que era casi idéntico con el peso molecular de 21,111 como se esperaba a partir del ORF La búsqueda de la proteína en la base de datos, haciendo uso de la secuencia de aminoácidos de la presente proteína no reveló la presencia de ninguna proteína que tuviera analogía. También, la búsqueda en GenBank usando la secuencia de bases del presente ADNc reveló la presencia de secuencias que poseían una homología de 90% o más (por ejemplo, Acceso No. AA310892) en EST, pero puesto que éstas eran secuencias parciales, no podía juzgarse si alguna de estas secuencias codificaba o no para la misma proteína que la proteína de la invención.
<HP10474> (Secuencias Nos. 9, 18 y 35) La determinación de la secuencia de bases completa para el inserto de ADNc de la clona HP 10528 obtenida a partir de bibliotecas de ADNc de la línea celular Saos-2 de osteosarcoma humano reveló la estructura que consistía en una región de no traducción 5' de 53 bp, un ORF de
975 bp, y una región de no traducción 3' de 987 bp. El ORF codifica para una proteína consistente en 324 residuos de aminoácido y poseía siete dominios de transmembrana putativos. La Figura 9 describe el perfil de hidrofobicidad/hidrofilicidad de la presente proteína obtenida por el método de Kyte-Doolittle. Como resultado de la traducción in vitro se produjo un producto de traducción de aproximadamente 32 kDa que es casi idéntico al peso molecular de 34,227 como se
esperaba a partir del ORF.
La búsqueda de la proteína en la base de datos, haciendo uso de la secuencia de aminoácidos de la presente proteína reveló que tenía una analogía con el producto del gene capaz de ser inducido por la interrupción del factor de crecimiento epitelial (No. de Acceso PID 998569). La Tabla 7 indica la comparación de la secuencia de aminoácidos entre la proteína humana de la presente invención (HP) y el producto del gene capaz de ser inducido por la interrupción del factor de crecimiento epitelial (GA). Allí, las marcas de "-", " * " y " . " representan un vacío, un residuo de aminoácido idéntico a aquel en la proteína de la presente invención y un residuo de aminoácido análogo a aquel en la proteína de la presente invención, respectivamente. Ambas proteínas poseían una homología de 34.7% en la región completa.
Tabla 7 HS MGPWGEPELLV RPEAVASEPPVPVGLEVKLGALVLLLVLTLLCSLVPICVLRRPGANHE * *** * ** *** * * *** GA MEQLLGIKLGCLFALALTLGCGLTPICFKWFQIDAAR HS GSASRQKALSLVSCFAGGVFATC LDLLPDYLAAIDEALAALHV * . * .*.*..*...**** *..* * GA GHHRR—VLRLLGCISAGVFLGAGFMHMTAEALEEIESQIQKFMVQNRSASERNSSGDAD HS —TLQFPLQEFILAMGFFLVLVMEQITLAYKEQSGPSPLEETRALLGTVNGGPQH HDGP * * * ***** * * * ** . GA SAHMEYPYGELIISLGFFLVFFLESLALQC CPGA-AGGSTVQDEE GGAHIF E
HS GVPQASGAPATPSALRACVLVFSLALHSVFEGAVGLQRDRARAMELCLALLLHKGILAV *** ** ** ************ * **** * ***
GA LHSHGHLPSPSKGPLRALVLLLSLSFHSVFEGLAVGLQPTVAATVQLCLAVLAHKGLWF
HS SLSLRLLQSHLRAQWAGCGILFSCMTPLGIGLGAALAES-AGPLHQLAQSVLEGMAAGT *--*- * * *** * * *** **** ****
GA GVGMRLVHLGTSSRAVFSILLLALMSPLGLAVGLAVTGGDSEGGRGLAQAVLEGVAAGT HS FLYITFLEILPQELASSEQRILKVILLLAGFALLTGLLFIQI ** ******* **** * * GA ELYVTFLEILPRELASPEAPLAKWSCVAAGEAFMAFIALWA
La búsqueda de la base de datos de la proteína usando la secuencia de aminoácidos de la presente proteína no reveló la presencia de ninguna proteína que tuviera analogía. También, la búsqueda en GenBank usando la secuencia de bases del presente ADNc reveló la presencia de secuencias que poseían una homología de 90% o más (por ejemplo, Acceso No. AA20651 1) en EST, pero puesto que éstas eran secuencias parciales, no podía juzgarse si alguna de estas secuencias codificaba o no para la misma proteína que la proteína de la presente invención.
Aplicación Industrial La presente invención provee proteínas humanas que tienen dominios de transmembrana, ADNcs que codifican para dichas proteínas, y vectores de expresión de dichos ADNcs, así como también células eucarioticas que expresan dichos ADNcs. La totalidad de las proteínas de la presente invención existen en la membrana celular, de manera que son consideradas como que son proteínas que controlan la proliferación y la diferenciación de las células. En consecuencia, las proteínas de la presente invención pueden ser usadas como compuestos farmacéuticos tales como agentes carcinostáticos relacionados con el control de la proliferación y diferenciación de las células, o como antígenos para la preparación de anticuerpos contra dichas proteínas. Los ADNcs de la presente invención pueden ser utilizados como sondas para la diagnosis de genes y como fuentes de genes para terapia de genes. Además, los ADNcs pueden ser usados para la expresión de grandes cantidades de dichas proteínas. Las células en donde estos genes de proteínas de membrana son introducidos para poseer dichas proteínas en la superficie de la membrana, pueden ser empleadas para la detección de los ligandos correspondientes, el tamizaje de novedosas medicinas de bajo peso molecular, y similares. La presente invención también provee genes correspondientes a las secuencias de polinucleótidos descritos aquí. "Genes correspondientes" son las regiones del genoma que son transcritas para producir los ARNms a partir de los cuales secuencias de polinucleótidos de ADNc son derivados y pueden incluir regiones contiguas del genoma necesario para la expresión regulada de tales genes. Los genes correspondientes pueden por lo tanto incluir, pero no se limitan a, secuencias de codificación, regiones sin traducción 5' y 3', exones empalmados alternativamente, intrones, promotores, mejoradores y silenciadores o elementos supresores. Los genes correspondientes pueden ser aislados de acuerdo con métodos conocidos usando la
información de secuencia descrita aquí. Tales métodos incluyen la preparación de sondas o primarios a partir de la información de secuencias descrita para la identificación y/o amplificación de genes en bibliotecas genómicas apropiadas u otras fuentes de materiales genómicos. Un "gene aislado" es un gene que ha sido separado de las secuencias de codificación adyacentes, si las hay, presentes en el genoma del organismo a partir del cual el gene fue aislado. Se proveen organismos que tienen expresión mejorada, reducida o modificada de los genes correspondientes a las secuencias de polinucleótidos descritos aquí. El cambio deseado en la expresión de gene puede ser logrado a través del uso de polinucleótidos de antisentido o ribozimas que unen y/o separan el ARNm transcrito a partir del gene (Albert and Morris, 1994, Trends Pharmacol. Sci., 15(7): 250-254; Lavarosky et al., 1997, Biochem, Mol. Med. 62(1); 11-22; y Hampel, 1998, Prog. Nucleic Acid Res. Mol. Biol. 58: 1-39; la totalidad de los cuales se incorpora aquí como referencia). Se proveen animales transgénicos que tienen copias múltiples del(los) gene(s) correspondiente(s) a las secuencias de polinucleótidos descritas aquí, preferiblemente producidos mediante la transformación de células con construcciones genéticas que son establemente mantenidas dentro de las células transformadas y su progenie. También se proveen animales transgénicos que tienen regiones de control genético modificadas que incrementan o reducen los niveles de expresión de genes, o que cambian temporal o espacialmente los patrones de expresión de genes (ver Patente Europea No. 0 649 464 Bl, incorporada a la presente como referencia). Además se proveen organismos en los que el(los) gene(s) correspondiente(s) a las secuencias de polinucleótidos descritas aquí han sido parcial o totalmente inactivados, a través de la inserción de secuencias extrañas dentro del(los) gene(s) correspondiente(s) o a través de la deleción de todos o parte de los genes correspondientes. La inactivación de genes parcial o completa puede ser llevada a cabo a través de la inserción, preferiblemente seguida de corte impreciso, de elementos transposables (Plasterk, 1992, Bioessays 14(9): 629-633; Zwaal et al., 1993, Proc. Nati. Acad. Sci. USA 90(16): 7431-7435; Clark et al., 1994, Proc. Nati. Acad. Sci. USA 91(2): 719-722; la totalidad de los cuales se incorpora a la presente como referencias), o a través de recombinación homologa, preferiblemente detectada mediante estrategias de selección genética positiva/negativa (Mansour et al , 1988, Nature 336: 348-352; Patentes de los E.U.A. Nos. 5,464,764; 5,487,992; 5,627,059; 5,631,153; 5,614,396; 5,616,491 y 5,679,523, la totalidad de las cuales se incorpora a la presente
como referencias). Estos organismos con expresión de genes alterada son preferiblemente eucariotes y, más preferiblemente, son mamíferos. Tales organismos son útiles para el desarrollo de modelos no humanos para el estudio de desordenes que involucran los genes correspondientes, y para el desarrollo de sistemas de prueba para la identificación de moléculas que interactúan con la(s) proteína(s) producto del(los) correspondiente(s) gene(s). En donde la proteína de la presente invención está unida a membrana (por ejemplo, es un receptor), la presente invención también proporciona formas solubles de tales proteínas. En dichas formas, parte o la totalidad de los dominios intracelulares y de transmembrana de la proteína son eliminados de manera tal que la proteína es totalmente secretada a partir de la célula en la que es expresada. Los dominios intracelulares y de transmembrana de proteínas de la invención pueden ser identificados de acuerdo con técnicas conocidas para la determinación de tales dominios a partir de información de secuencia. Proteínas y fragmentos de proteínas de la presente invención incluyen proteínas con longitudes de las secuencias de aminoácidos que son cuando menos 25% (más preferiblemente cuando menos 50%, y más preferiblemente cuando menos 75%) de la longitud de una proteína descrita y tienen cuando menos 60% de identidad de secuencia (más preferiblemente, cuando menos 75% de identidad, más preferiblemente cuando menos 90% o 95% de identidad) con aquella proteína descrita, en donde la identidad de secuencia es determinada comparando las secuencias de aminoácidos de las proteínas cuando se alinean a fin de maximizar el traslape y la identidad en tanto que se reduce las aberturas de secuencia. También se incluyen la presente invención proteínas y fragmentos de proteínas que contienen un segmento preferiblemente comprendiendo 8 o más (más preferiblemente 20 o más, más preferiblemente 30 o más) aminoácidos contiguos que comparten cuando menos 75% de identidad de secuencia (más preferiblemente, cuando menos 85% de identidad, más preferiblemente cuando menos 95% de identidad) con cualquier segmento de cualquiera de las proteínas descritas. Los homólogos de especie de los polinucleótidos y proteínas descritas también son proveídas por la presente invención. Como se emplea aquí, una "especie homologa" es una proteína o polinucleótido con una especie diferente de origen a partir de aquel de una proteína o polinucleótido dado, pero con similitudes de secuencia importantes para la proteína o polinucleótido dado, según se determinó por aquellos capacitados en la técnica. Los homólogos
de especie pueden ser aislados e identificados elaborando sondas o primarios adecuados a partir de las secuencias proveídas por la presente y tamizando una fuente de ácido nucleico adecuada a partir de las especies deseadas. La invención también abarca variantes alélicas de los polinucleótidos o proteínas descritas; esto es, formas alternativas que ocurren de manera natural, de los polinucleótidos aislados que también codifican para proteínas que son idénticas, homologas o están relacionadas con aquella codificada por los polinucleótidos. La invención también incluye polinucleótidos con secuencias complementarias a aquellas de los polinucleótidos descritos aquí. La presente invención también incluye polinucleótidos capaces de hibridizar bajo condiciones de astringencia reducida, más preferiblemente condiciones astringentes, y más preferiblemente condiciones altamente astringentes, a los polinucleótidos descritos aquí. Ejemplos de condiciones de astringencia son mostradas en la tabla siguiente: condiciones de alta astringencia son aquellas que son cuando menos tan astringentes como, por ejemplo, las condiciones A-F; condiciones astringentes son cuando menos tan astringentes como, por ejemplo las condiciones G-L; y condiciones de astringencia reducida con cuando menos tan astringentes como, por ejemplo las condiciones M-R.
Tabla
' La longitud del híbrido es aquella anticipada por la(s) región(es) hibridizada(s) de los polinucleótidos de hibridación. Cuando hibrida un polinucleótido a un polinucleótido objetivo de secuencia desconocida, se supone que la longitud del híbrido es aquella del polinucleótido de hibridación. Cuando polinucleótidos de secuencia conocida son hibridados, la longitad del híbrido puede ser determinada alineando las secuencias de los polinucleótidos e identificando la región o regiones de complementariedad óptima de secuencia.
2 SSPE (lxSSPE es 0.15M NaCl, 10 mM NaH2P0 , y 1.25 mM EDTA, pH 7.4) puede ser substituido por SSC (lxSSC es 0.15M NaCl y 15 mM citrato de sodio) en la hibridación y se realizan lavados con reguladores de lavado durante 15 minutos después de que la hibpdación es completa. *Tb-TR: la temperatura de hibridación para híbridos que se anticipa son menores de 50 pares de bases en longitud, debe ser de 5-10 °C menos que la temperatura de fusión (Tm) del híbrido. En donde Tm es determinada de acuerdo con las siguientes ecuaciones. Para híbridos menores de 18 pares de bases de longitad, Tm(°C)=2(# de A + T bases) + 4(# de G + C bases). Para híbridos entre 18 y 49 pares de bases de longitud, Tm(°C)=81.5 + 16.6(log?0[Na+]) + 0.41 (%G+C)-(600/N). En donde N es el número de bases en el híbrido, y [Na+] es la concentración de iones sodio en el regulador de hibridación ([Na+] para lxSSC=0.165M).
Ejemplos adicionales de condiciones de astringencia para la hibridación de polinucleótidos se proveen en Sambrook, J., E. F. Fritsch, y T. Maniatis, 1989, Molecular Cloning. A Laboratory Manuel, Cold Spring Harbor Laboratory Press, Cold Spring Harbor NY, capítulos 9 y 11 y en Current Protocols in Molecular Biology, 1995, F.M. Ausubel et al., eds. John Wiley & Sons, Inc., secciones 2.10 y 6.3-6.4., incorporados aquí como referencia. Preferiblemente, cada uno de tales polinucleótido de hibridación tiene una longitud que es cuando menos 25% más (más preferiblemente cuando menos 50%, y más preferiblemente cuando menos 75%) de la longitud del polinucleótido de la presente invención al cual híbrida, y tiene cuando menos 60% de identidad de secuencia (más preferiblemente, cuando menos 75% de identidad; más preferiblemente cuando menos 90% o 95% de identidad) con el polinucleótido de la presente invención al cual híbrida, en donde la identidad de secuencia es determinada comparando las secuencias de los polinucleótidos de hibridación cuando se alinean a fin de maximizar el traslape e identidad en tanto que se reducen las aberturas de secuencia.
Listado de Secuencias Nombre del Solicitante: Sagami Chemical Research Center Título de la Invención: Proteínas humanas teniendo dominios de transmembrana y ADNs que codifican para éstas.
Expediente de referencia: 661099 Solicitud de patente actual: Fecha de presentación actual: Primera solicitud de patente: JP 10-119395 Primera fecha de presentación: 1998-04-28 Número se secuencias: 36 Programa de computación: Windows 95 (Word 98) Información para: SEQ ID NO: 1 Longitud: 268 Tipo: PRT Organismo: Homo sapiens Secuencia: 1 Met Ala Phe Glu Glu Leu Leu Ser Gln Val Gly Gly Leu Gly Arg Phe 1 5 10 15 Gln Met Leu His Leu Val Phe lie Leu Pro Ser Leu Met Leu Leu lie 20 25 30 Pro His lie Leu Leu Glu Asn Phe Ala Ala Ala lie Pro Gly His Arg 35 40 45 Cys Trp Val His Met Leu Asp Asn Asn Thr Gly Ser Gly Asn Glu Thr 50 55 60 Gly lie Leu Ser Glu Asp Ala Leu Leu Arg lie Ser lie Pro Leu Asp 65 70 75 80
Ser Asn Leu Arg Pro Glu Lys Cys Arg Arg Phe Val His Pro Gln Trp 85 90 95 Gln Leu Leu His Leu Asn Gly Thr lie His Ser Thr Ser Glu Ala Asp 100 105 110
Thr Glu Pro Cys Val Asp Gly Trp Val Tyr Asp Gln Ser Tyr Phe Pro 115 120 1S5 Ser Thr lie Val Thr Lys Trp Asp Leu Val Cys Asp Tyr Gln Ser Leu 130 135 140 Lys Ser Val Val Gln Phe Leu Leu Leu Thr Gly Met Leu Val Gly Gly 145 150 155 160 lie lie Gly Gly His Val Ser Asp Arg Trp Leu Val Glu Ser Ala Arg 165 170 175
Trp Leu lie lie Thr Asn Lys Leu Asp Glu Gly Leu Lys Ala Leu Arg 180 185 190
Lys Val Ala Arg Thr Asn Gly lie Lys Asn Ala Glu Glu Thr Leu Asn 195 200 205 He Glu Val Val Arg Ser Thr Met Gln Glu Glu Leu Asp Ala Ala Gln 210 215 220 Thr Lys Thr Thr Val Cys Asp Leu Phe Arg Asn Pro Ser Met Arg Lys 225 230 235 240
Arg He Cys He Leu Val Phe Leu Arg Lys Lys He Ser Arg Lys Arg 245 250 255
His Lys Asn Asp Cys Tyr Thr Lys Val Thr Lys Phe 260 265 Información para: SEQ ID NO: 2 Longitad: 236 Tipo: PRT Organismo: Homo sapiens Secuencia: 2 Met Ala Glu Pro Ser Ala Ala Thr Gln Ser His Ser He Ser Ser Ser
1 5 10 15
Ser Phe Gly Ala Glu Pro Ser Ala Pro Gly Gly Gly Gly Ser Pro Gly
25 30
Ala Cys Pro Ala Leu Gly Thr Lys Ser Cys Ser Ser Ser Cys Ala Val
40 45 His Asp Leu He Phe Trp Arg Asp Val Lys Lys Thr Gly Phe Val Phe
50 55 60
Gly Thr Thr Leu He Met Leu Leu Ser Leu Ala Ala Phe Ser Val He 65 70 75 80
Ser Val Val Ser Tyr Leu He Leu Ala Leu Leu Ser Val Thr He Ser 85 90 95
Phe Arg He Tyr Lys Ser Val He Gln Ala Val Gln Lys Ser Glu Glu 100 105 110
Gly His Pro Phe Lys Ala Tyr Leu Asp Val Asp He Thr Leu Ser Ser 115 120 125 Glu Ala Phe His Asn Tyr Met Asn Ala Ala Met Val His He Asn Arg 130 135 140 Ala Leu Lys Leu He He Arg Leu Phe Leu Val Glu Asp Leu Val Asp 145 150 155 160
Ser Leu Lys Leu Ala Val Phe Met Trp Leu Met Thr Tyr Val Gly Ala 165 170 175
Val Phe Asn Gly He Thr Leu Leu He Leu Ala Glu Leu Leu He Phe 180 185 190
Ser Val Pro He Val Tyr Glu Lys Tyr Lys Thr Gln He Asp His Tyr 195 200 205 Val Gly He Ala Arg Asp Gln Thr Lys Ser He Val Glu Lys He Gln 210 215 220 Ala Lys Leu Pro Gly He Ala Lys Lys Lys Ala Glu 225 230 235 Información para: SEQ ID NO: 3 Longitud: 261 Tipo: PRT Organismo: Homo sapiens Secuencia: 3 Met Ala Gly Pro Glu Leu Leu Leu Asp Ser Asn He Arg Leu Trp Val
1 5 10 15
Val Leu Pro He Val He He Thr Phe Phe Val Gly Met He Arg His
25 30
Tyr Val Ser He Leu Leu Gln Ser Asp Lys Lys Leu Thr Gln Glu Gln
40 45
Val Ser Asp Ser Gln Val Leu He Arg Ser Arg Val Leu Arg Glu Asn 50 55 60 Gly Lys Tyr He Pro Lys Gln Ser Phe Leu Thr Arg Lys Tyr Tyr Phe 65 70 75 80
Asn Asn Pro Glu Asp Gly Phe Phe Lys Lys Thr Lys Arg Lys Val Val 85 90 95
Pro Pro Ser Pro Met Thr Asp Pro Thr Met Leu Thr Asp Met Met Lys 100 105 110
Gly Asn Val Thr Asn Val Leu Pro Met He Leu He Gly Gly Trp He 115 120 125 Asn Met Thr Phe Ser Gly Phe Val Thr Thr Lys Val Pro Phe Pro Leu 130 135 140 Thr Leu Arg Phe Lys Pro Met Leu Gln Gln Gly He Glu Leu Leu Thr 145 150 155 160
Leu Asp Ala Ser Trp Val Ser Ser Ala Ser Trp Tyr Phe Leu Asn Val 165 170 175
Phe Gly Leu Arg Ser He Tyr Ser Leu He Leu Gly Gln Asp Asn Ala 180 185 190
Ala Asp Gln Ser Arg Met Met Gln Glu Gln Met Thr Gly Ala Ala Met 195 200 205 Ala Met Pro Ala Asp Thr Asn Lys Ala Phe Lys Thr Glu Trp Glu Ala 210 215 220 Leu Glu Leu Thr Asp His Gln Trp Ala Leu Asp Asp Val Glu Glu Glu 225 230 235 240
Leu Met Ala Lys Asp Leu His Phe Glu Gly Met Phe Lys Lys Glu Leu 245 250 255
Gln Thr Ser He Phe 260 Información para: SEQ ID NO: 4 Longitud: 328 Tipo: PRT Organismo: Homo sapiens Secuencia: 4
Met Val Ser Lys Ala Leu Leu Arg Leu Val Ser Ala Val Asn Arg Arg 1 5 10 15
Arg Met Lys Leu Leu Leu Gly He Ala Leu Leu Ala Tyr Val Ala Ser 20 25 30
Val Trp Gly Asn Phe Val Asn Met Ser Phe Leu Leu Asn Arg Ser He 35 40 45 Gln Glu Asn Gly Glu Leu Lys He Glu Ser Lys He Glu Glu Met Val 50 55 60 Glu Pro Leu Arg Glu Lys He Arg Asp Leu Glu Lys Ser Phe Thr Gln 65 70 75 80
Lys Tyr Pro Pro Val Lys Phe Leu Ser Glu Lys Asp Arg Lys Arg He 85 90 95
Leu He Thr Gly Gly Ala Gly Phe Val Gly Ser His Leu Thr Asp Lys 100 105 110
Leu Met Met Asp Gly His Glu Val Thr Val Val Asp Asn Phe Phe Thr 115 120 125 Gly Arg Lys Arg Asn Val Glu His Trp He Gly His Glu Asn Phe Glu 130 135 140 Leu He Asn His Asp Val Val Glu Pro Leu Tyr He Glu Gly Val Glu 145 150 155 160
Val Arg Val Ala Arg He Phe Asn Thr Phe Gly Pro Arg Met His Met 165 170 175
Asn Asp Gly Arg Val Val Ser Asn Phe He Leu Gln Ala Leu Gln Gly 180 185 190
Glu Pro Leu Thr Val Tyr Gly Ser Gly Ser Gln Thr Arg Ala Phe Gln 195 200 205 Tyr Val Ser Asp Leu Val Asn Gly Leu Val Ala Leu Met Asn Ser Asn 210 215 220 Val Ser Ser Pro Val Asn Leu Gly Asn Pro Glu Glu His Thr He Leu 225 230 235 240
Glu Phe Ala Gln Leu He Lys Asn Leu Val Gly Ser Gly Ser Glu He 245 250 255
Gln Phe Leu Ser Glu Ala Gln Asp Asp Pro Gln Lys Arg Lys Pro Asp 260 265 270
He Lys Lys Ala Lys Leu Met Leu Gly Trp Glu Pro Val Val Pro Leu 275 280 285 Glu Glu Gly Leu Asn Lys Ala He His Tyr Phe Arg Lys Glu Leu Glu 290 295 300 Tyr Gln Ala Asn Asn Gln Tyr He Pro Lys Pro Lys Pro Ala Arg He 305 310 315 320
Lys Lys Gly Arg Thr Arg His Ser 325 Información para: SEQ ID NO: 5 Longitud: 300 Tipo: PRT Organismo: Homo sapiens Secuencia: 5 Met Lys Phe Leu Leu Asp He Leu Leu Leu Leu Pro Leu Leu He Val 1 5 10 15
Cys Ser Leu Glu Ser Phe Val Lys Leu Phe He Pro Lys Arg Arg Lys 20 25 30
Ser Val Thr Gly Glu He Val Leu He Thr Gly Ala Gly His Gly He 35 40 45 Gly Arg Leu Thr Ala Tyr Glu Phe Ala Lys Leu Lys Ser Lys Leu Val 50 55 60 Leu Trp Asp He Asn Lys His Gly Leu Glu Glu Thr Ala Ala Lys Cys 65 70 75 80
Lys Gly Leu Gly Ala Lys Val His Thr Phe Val Val Asp Cys Ser Asn 85 90 95
Arg Glu Asp He Tyr Ser Ser Ala Lys Lys Val Lys Ala Glu He Gly 100 105 110
Asp Val Ser He Leu Val Asn Asn Ala Gly Val Val Tyr Thr Ser Asp 115 120 125 Leu Phe Ala Thr Gln Asp Pro Gln He Glu Lys Thr Phe Glu Val Asn 130 135 140 Val Leu Ala His Phe Trp Thr Thr Lys Ala Phe Leu Pro Ala Met Thr 145 150 155 160
Lys Asn Asn His Gly His He Val Thr Val Ala Ser Ala Ala Gly His 165 170 175
Val Ser Val Pro Phe Leu Leu Ala Tyr Cys Ser Ser Lys Phe Ala Ala 180 185 190
Val Gly Phe His Lys Thr Leu Thr Asp Glu Leu Ala Ala Leu Gln He 195 200 205 Thr Gly Val Lys Thr Thr Cys Leu Cys Pro Asn Phe Val Asn Thr Gly 210 215 220 Phe He Lys Asn Pro Ser Thr Ser Leu Gly Pro Thr Leu Glu Pro Glu 225 230 235 240
Glu Val Val Asn Arg Leu Met His Gly He Leu Thr Glu Gln Lys Met 245 250 255
He Phe He Pro Ser Ser He Ala Phe Leu Thr Thr Leu Glu Arg He 260 265 270 Leu Pro Glu Arg Phe Leu Ala Val Leu Lys Arg Lys He Ser Val Lys 275 280 285 Phe Asp Ala Val He Gly Tyr Lys Met Lys Ala Gln 290 295 300 Información para SEQ ID NO 6 Longitud 182 Tipo PRT Organismo Homo sapiens Secuencia 6 Met Lys Gly Trp Gly Trp Leu Ala Leu Leu Leu Gly Ala Leu Leu Gly 1 5 10 15
Thr Ala Trp Ala Arg Arg Ser Gln Asp Leu His Cys Gly Ala Cys Arg 20 25 30
Ala Leu Val Asp Glu Leu Glu Trp Glu He Ala Gln Val Asp Pro Lys 35 40 45 Lys Thr He Gln Met Gly Ser Phe Arg He Asn Pro Asp Gly Ser Gln 50 55 60 Ser Val Val Glu Val Pro Tyr Ala Arg Ser Glu Ala His Leu Thr Glu 65 70 75 80
Leu Leu Glu Glu He Cys Asp Arg Met Lys Glu Tyr Gly Glu Gln He 85 90 95
Asp Pro Ser Thr Hxs Arg Lys Asn Tyr Val Arg Val Val Gly Arg Asn 100 105 110
Gly Glu Ser Ser Glu Leu Asp Leu Gln Gly He Arg He Asp Ser Asp 115 120 125 He Ser Gly Thr Leu Lys Phe Ala Cys Glu Ser He Val Glu Glu Tyr 130 135 140 Glu Asp Glu Leu He Glu Phe Phe Ser Arg Glu Ala Asp Asn Val Lys 145 150 155 160
Asp Lys Leu Cys Ser Lys Arg Thr Asp Leu Cys Asp His Ala Leu His 165 170 175
He Ser Hxs Asp Glu Leu 180 Información para. SEQ ID NO: 7 Longitud: 66 Tipo: PRT Organismo: Homo sapiens Secuencia: 7 Met Glu Val Asp Ala Pro Gly Val Asp Gly Arg Asp Gly Leu Arg Glu 1 5 10 15
Arg Arg Gly Phe Ser Glu Gly Gly Arg Gln Asn Phe Asp Val Arg Pro 20 25 30
Gln Ser Gly Ala Asn Gly Leu Pro Lys Hxs Ser Tyr Trp Leu Asp Leu 35 40 45 Trp Leu Phe He Leu Phe Asp Val Val Val Phe Leu Phe Val Tyr Phe 50 55 60 Leu Pro 65 Información para: SEQ ID NO: 8 Longitud: 183 Tipo: PRT Organismo: Homo sapiens
Secuencia: 8 Met Ala Ser Arg Ala Gly Pro Arg Ala Ala Gly Thr Asp Gly Ser Asp 1 5 10 15
Phe Gln Hxs Arg Glu Arg Val Ala Met Hxs Tyr Gln Met Ser Val Thr 20 25 30
Leu Lys Tyr Glu He Lys Lys Leu He Tyr Val His Leu Val He Trp 35 40 45 Leu Leu Leu Val Ala Lys Met Ser Val Gly His Leu Arg Leu Leu Ser 50 55 60 Hxs Asp Gln Val Ala Met Pro Tyr Gln Trp Glu Tyr Pro Tyr Leu Leu 65 70 75 80
Ser He Leu Pro Ser Leu Leu Gly Leu Leu Ser Phe Pro Arg Asn Asn 85 90 95
He Ser Tyr Leu Val Leu Ser Met He Ser Met Gly Leu Phe Ser He 100 105 110
Ala Pro Leu He Tyr Gly Ser Met Glu Met Phe Pro Ala Ala Gln Gln 115 120 125 Leu Tyr Arg Hxs Gly Lys Ala Tyr Arg Phe Leu Phe Gly Phe Ser Ala 130 135 140 Val Ser He Met Tyr Leu Val Leu Val Leu Ala Val Gln Val Hxs Ala 145 150 155 160
Trp Gln Leu Tyr Tyr Ser Lys Lys Leu Leu Asp Ser Trp Phe Thr Ser 165 170 175
Thr Gln Glu Lys Lys His Lys 180 Información para: SEQ ID NO: 9 Longitud: 324 Tipo. PRT Organismo: Homo sapiens Secuencia: 9 Met Gly Pro Trp Gly Glu Pro Glu Leu Leu Val Trp Arg Pro Glu Ala 1 5 10 15
Val Ala Ser Glu Pro Pro Val Pro Val Gly Leu Glu Val Lys Leu Gly 20 25 30
Ala Leu Val Leu Leu Leu Val Leu Thr Leu Leu Cys Ser Leu Val Pro 35 40 45 He Cys Val Leu Arg Arg Pro Gly Ala Asn His Glu Gly Ser Ala Ser 50 55 60 Arg Gln Lys Ala Leu Ser Leu Val Ser Cys Phe Ala Gly Gly Val Phe 65 70 75 80
Leu Ala Thr Cys Leu Leu Asp Leu Leu Pro Asp Tyr Leu Ala Ala He 85 90 95
Asp Glu Ala Leu Ala Ala Leu Hxs Val Thr Leu Gln Phe Pro Leu Gln 100 105 110
Glu Phe He Leu Ala Met Gly Phe Phe Leu Val Leu Val Met Glu Gln 115 120 125 He Thr Leu Ala Tyr Lys Glu Gln Ser Gly Pro Ser Pro Leu Glu Glu 130 135 140 Thr Arg Ala Leu Leu Gly Thr Val Asn Gly Gly Pro Gln Hxs Trp Hxs 145 150 155 160
Asp Gly Pro Gly Val Pro Gln Ala Ser Gly Ala Pro Ala Thr Pro Ser 165 170 175
Ala Leu Arg Ala Cys Val Leu Val Phe Ser Leu Ala Leu Hxs Ser Val 180 185 190
Phe Glu Gly Leu Ala Val Gly Leu Gln Arg Asp Arg Ala Arg Ala Met 195 200 205 Glu Leu Cys Leu Ala Leu Leu Leu His Lys Gly He Leu Ala Val Ser 210 215 220 Leu Ser Leu Arg Leu Leu Gln Ser His Leu Arg Ala Gln Val Val Ala 225 230 235 240
Gly Cys Gly He Leu Phe Ser Cys Met Thr Pro Leu Gly He Gly Leu 245 250 255
Gly Ala Ala Leu Ala Glu Ser Ala Gly Pro Leu Hxs Gln Leu Ala Gln 260 265 270
Ser Val Leu Glu Gly Met Ala Ala Gly Thr Phe Leu Tyr He Thr Phe 275 280 285
Leu Glu He Leu Pro Gln Glu Leu Ala Ser Ser Glu Gln Arg He Leu 290 295 300 Lys Val He Leu Leu Leu Ala Gly Phe Ala Leu Leu Thr Gly Leu Leu 305 310 315 320
Phe He Gln He Información para: SEQ ID NO: 10 Longitud: 804 Tipo: ADN Organismo: Homo sapiens Secuencia: 10 ATGGCCTTTG AGGAGCTCTT GAGTCAAGTT GGAGGCCTTG GGAGATTTCA GATGCTTCAT 60
CTGGTTTTTA TTCTTCCCTC TCTCATGTTA TTAATCCCTC ATATACTGCT AGAGAACTTT 120
GCTGCAGCCA TTCCTGGTCA TCGTTGCTGG GTCCACATGC TGGACAATAA TACTGGATCT 180
GGTAATGAAA CTGGAATCCT CAGTGAAGAT GCCCTCTTGA GAATCTCTAT CCCACTAGAC 240
TCAAATCTGA GGCCAGAGAA GTGTCGTCGC TTTGTCCATC CCCAGTGGCA GCTTCTTCAC 300
CTGAATGGGA CTATCCACAG CACAAGTGAG GCAGACACAG AACCCTGTGT GGATGGCTGG 360
GTATATGATC AAAGCTACTT CCCTTCGACC ATTGTGACTA AGTGGGACCT GGTATGTGAT 420
TATCAGTCAC TGAAATCAGT GGTTCAATTC CTACTTCTGA CTGGAATGCT GGTGGGAGGC 480
ATCATAGGTG GCCATGTCTC AGACAGGTGG CTGGTGGAAT CTGCTCGGTG GTTGATAATC 540
ACCAATAAAC TAGATGAGGG CTTAAAGGCA CTTAGAAAAG TTGCACGCAC AAATGGAATA 600
AAGAATGCTG AAGAAACCCT GAACATAGAG GTTGTAAGAT CCACCATGCA GGAGGAGCTG 660
GATGCAGCAC AGACCAAAAC TACTGTGTGT GACTTGTTCC GCAACCCCAG TATGCGTAAA 720
AGGATCTGTA TCCTGGTATT TTTGAGAAAA AAAATCTCAA GGAAAAGGCA TAAAAATGAT 780
TGCTACACAA AAGTGACCAA ATTT 804
Información para: SEQ ID NO. 11 Longitud: 708 Tipo: ADN Organismo: Homo sapiens Secuencia: 11
ATGGCGGAGC CGTCGGCGGC CACTCAGTCC CATTCCATCT CCTCGTCGTC CTTCGGAGCC 60
GAGCCGTCCG CGCCCGGCGG CGGCGGGAGC CCAGGAGCCT GCCCCGCCCT GGGGACGAAG 120
AGCTGCAGCT CCTCCTGTGC GGTGCACGAT CTGATTTTCT GGAGAGATGT GAAGAAGACT 180
GGGTTTGTCT TTGGCACCAC GCTGATCATG CTGCTTTCCC TGGCAGCTTT CAGTGTCATC 240
AGTGTGGTTT CTTACCTCAT CCTGGCTCTT CTCTCTGTCA CCATCAGCTT CAGGATCTAC 300
AAGTCCGTCA TCCAAGCTGT ACAGAAGTCA GAAGAAGGCC ATCCATTCAA AGCCTACCTG 360
GACGTAGACA TTACTCTGTC CTCAGAAGCT TTCCATAATT ACATGAATGC TGCCATGGTG 420
CACATCAACA GGGCCCTGAA ACTCATTATT CGTCTCTTTC TGGTAGAAGA TCTGGTTGAC 480
TCCTTGAAGC TGGCTGTCTT CATGTGGCTG ATGACCTATG TTGGTGCTGT TTTTAACGGA 540
ATCACCCTTC TAATTCTTGC TGAACTGCTC ATTTTCAGTG TCCCGATTGT CTATGAGAAG 600
TACAAGACCC AGATTGATCA CTATGTTGGC ATCGCCCGAG ATCAGACCAA GTCAATTGTT 660
GAAAAGATCC AAGCAAAACT CCCTGGAATC GCCAAAAAAA AGGCAGAA 708
Información para: SEQ ID NO: 12 Longitud: 783 Tipo: ADN Organismo: Homo sapiens Secuencia: 12 ATGGCAGGGC CAGAACTGTT GCTCGACTCC AACATCCGCC TCTGGGTGGT CCTACCCATC 60
GTTATCATCA CTTTCTTCGT AGGCATGATC CGCCACTACG TGTCCATCCT GCTGCAGAGC 120
GACAAGAAGC TCACCCAGGA ACAAGTATCT GACAGTCAAG TCCTAATTCG AAGCAGAGTC 180
CTCAGGGAAA ATGGAAAATA CATTCCCAAA CAGTCTTTCT TGACACGAAA ATATTATTTC 240
AACAACCCAG AGGATGGATT TTTCAAAAAA ACTAAACGGA AGGTAGTGCC ACCTTCTCCT 300
ATGACTGATC CTACTATGTT GACAGACATG ATGAAAGGGA ATGTAACAAA TGTCCTCCCT 360
ATGATTCTTA TTGGTGGATG GATCAACATG ACATTCTCAG GCTTTGTCAC AACCAAGGTC 420
CCATTTCCAC TGACCCTCCG TTTTAAGCCT ATGTTACAGC AAGGAATCGA GCTACTCACA 480
TTAGATGCAT CCTGGGTGAG TTCTGCATCC TGGTACTTCC TCAATGTATT TGGGCTTCGG 540
AGCATTTACT CTCTGATTCT GGGCCAAGAT AATGCCGCTG ACCAATCACG AATGATGCAG 600
GAGCAGATGA CGGGAGCAGC CATGGCCATG CCCGCAGACA CAAACAAAGC TTTCAAGACA 660
GAGTGGGAAG CTTTGGAGCT GACGGATCAC CAGTGGGCAC TAGATGATGT CGAAGAAGAG 720
CTCATGGCCA AAGACCTCCA CTTCGAAGGC ATGTTCAAAA AGGAATTACA GACCTCTATT 780
TTT 783
Información para: SEQ ID NO: 13 Longitud: 984 Tipo: ADN Organismo: Homo sapiens Secuencia: 13 ATGGTGAGCA AGGCGCTGCT GCGCCTCGTG TCTGCCGTCA ACCGCAGGAG GATGAAGCTG 60
CTGCTGGGCA TCGCCTTGCT GGCCTACGTC GCCTCTGTTT GGGGCAACTT CGTTAATATG 120
AGCTTTCTAC TCAACAGGTC TATCCAGGAA AATGGTGAAC TAAAAATTGA AAGCAAGATT 180
GAAGAGATGG TTGAACCACT AAGAGAGAAA ATCAGAGATT TAGAAAAAAG CTTTACCCAG 240
AAATACCCAC CAGTAAAGTT TTTATCAGAA AAGGATCGGA AAAGAATTTT GATAACAGGA 300
GGCGCAGGGT TCGTGGGCTC CCATCTAACT GACAAACTCA TGATGGACGG CCACGAGGTG 360
ACCGTGGTGG ACAATTTCTT CACGGGCAGG AAGAGAAACG TGGAGCACTG GATCGGACAT 420
GAGAACTTCG AGTTGATTAA CCACGACGTG GTGGAGCCCC TCTACATCGA GGGCGTGGAA 480
GTGCGAGTGG CCAGAATCTT CAACACCTTT GGGCCACGCA TGCACATGAA CGATGGGCGA 540
GTAGTCAGCA ACTTCATCCT GCAGGCGCTC CAGGGGGAGC CACTCACGGT ATACGGATCC 600
GGGTCTCAGA CAAGGGCGTT CCAGTACGTC AGCGATCTAG TGAATGGCCT CGTGGCTCTC 660
ATGAACAGCA ACGTCAGCAG CCCGGTCAAC CTGGGGAACC CAGAAGAACA CACAATCCTA 720
GAATTTGCTC AGTTAATTAA AAACCTTGTT GGTAGCGGAA GTGAAATTCA GTTTCTCTCC 780
GAAGCCCAGG ATGACCCACA GAAAAGAAAA CCAGACATCA AAAAAGCAAA GCTGATGCTG 840
GGGTGGGAGC CCGTGGTCCC GCTGGAGGAA GGTTTAAACA AAGCAATTCA CTACTTCCGT 900
AAAGAACTCG AGTACCAGGC AAATAATCAG TACATCCCCA AACCAAAGCC TGCCAGAATA 960
AAGAAAGGAC GGACTCGCCA CAGC 984
Información para: SEQ ID NO: 14 Longitud: 900 Tipo: ADN Organismo: Homo sapiens
Secuencia- 14 ATGAAATTTC TTCTGGACAT CCTCCTGCTT CTCCCGTTAC TGATCGTCTG CTCCCTAGAG 60
TCCTTCGTGA AGCTTTTTAT TCCTAAGAGG AGAAAATCAG TCACCGGCGA AATCGTGCTG 120
ATTACAGGAG CTGGGCATGG AATTGGGAGA CTGACTGCCT ATGAATTTGC TAAACTTAAA 180
AGCAAGCTGG TTCTCTGGGA TATAAATAAG CATGGACTGG AGGAAACAGC TGCCAAATGC 240
AAGGGACTGG GTGCCAAGGT TCATACCTTT GTGGTAGACT GCAGCAACCG AGAAGATATT 300
TACAGCTCTG CAAAGAAGGT GAAGGCAGAA ATTGGAGATG TTAGTATTTT AGTAAATAAT 360
GCTGGTGTAG TCTATACATC AGATTTGTTT GCTACACAAG ATCCTCAGAT TGAAAAGACT 420
TTTGAAGTTA ATGTACTTGC ACATTTCTGG ACTACAAAGG CATTTCTTCC TGCAATGACG 480
AAGAATAACC ATGGCCATAT TGTCACTGTG GCTTCGGCAG CTGGACATGT CTCGGTCCCC 540
TTCTTACTGG CTTACTGTTC AAGCAAGTTT GCTGCTGTTG GATTTCATAA AACTTTGACA 600
GATGAACTGG CTGCCTTACA AATAACTGGA GTCAAAACAA CATGTCTGTG TCCTAATTTC 660
GTAAACACTG GCTTCATCAA AAATCCAAGT ACAAGTTTGG GACCCACTCT GGAACCTGAG 720
GAAGTGGTAA ACAGGCTGAT GCATGGGATT CTGACTGAGC AGAAGATGAT TTTTATTCCA 780
TCTTCTATAG CTTTTTTAAC AACATTGGAA AGGATCCTTC CTGAGCGTTT CCTGGCAGTT 840
TTAAAACGAA AAATCAGTGT TAAGTTTGAT GCAGTTATTG GATATAAAAT GAAAGCGCAA 900
Información para: SEQ ID NO: 15 Longitud: 546 Tipo: ADN Organismo: Homo sapiens Secuencia: 15 ATGAAAGGCT GGGGTTGGCT GGCCCTGCTT CTGGGGGCCC TGCTGGGAAC CGCCTGGGCT 60
CGGAGGAGCC AGGATCTCCA CTGTGGAGCA TGCAGGGCTC TGGTGGATGA ACTAGAATGG 120
GAAATTGCCC AGGTGGACCC CAAGAAGACC ATTCAGATGG GATCTTTCCG GATCAATCCA 180
GATGGCAGCC AGTCAGTGGT GGAGGTGCCT TATGCCCGCT CAGAGGCCCA CCTCACAGAG 240
CTGCTGGAGG AGATATGTGA CCGGATGAAG GAGTATGGGG AACAGATTGA TCCTTCCACC 300
CATCGCAAGA ACTACGTACG TGTAGTGGGC CGGAATGGAG AATCCAGTGA ACTGGACCTA 360
CAAGGCATCC GAATCGACTC AGATATTAGC GGCACCCTCA AGTTTGCGTG TGAGAGCATT 420
GTGGAGGAAT ACGAGGATGA ACTCATTGAA TTCTTTTCCC GAGAGGCTGA CAATGTTAAA 480
GACAAACTTT GCAGTAAGCG AACAGATCTT TGTGACCATG CCCTGCACAT ATCGCATGAT 540 GAGCTA Información para: SEQ ID NO 16 Longitud- 198 Tipo: ADN Organismo. Homo sapiens Secuencia: 16 ATGGAGGTGG ACGCACCGGG TGTTGATGGT CGAGATGGTC TCCGGGAGCG GCGAGGCTTT 60
AGCGAGGGAG GGAGGCAGAA CTTCGATGTG AGGCCTCAGT CTGGGGCAAA TGGGCTTCCC 120
AAACACTCCT ACTGGTTGGA CCTCTGGCTT TTCATCCTTT TCGATGTGGT GGTGTTTCTC 180
TTTGTGTATT TTTTGCCA 198
Información para. SEQ ID NO- 17 Longitud: 549 Tipo: ADN Organismo Homo sapiens Secuencia: 17 ATGGCGTCTC GAGCAGGCCC GCGAGCGGCC GGCACCGACG GCAGCGACTT TCAGCACCGG 60
GAGCGCGTCG CCATGCACTA CCAGATGAGT GTGACCCTCA AGTATGAAAT CAAGAAGCTG 120
ATCTACGTAC ATCTGGTCAT ATGGCTGCTG CTGGTTGCTA AGATGAGCGT GGGACACCTG 180
AGGCTCTTGT CACATGATCA GGTGGCCATG CCCTATCAGT GGGAATACCC GTATTTGCTG 240
AGCATTTTGC CCTCTCTCTT GGGCCTTCTC TCCTTTCCCC GCAACAACAT TAGCTACCTG 300
GTGCTCTCCA TGATCAGCAT GGGACTCTTT TCCATCGCTC CACTCATTTA TGGCAGCATG 360
GAGATGTTCC CTGCTGCACA GCAGCTCTAC CGCCATGGCA AGGCCTACCG TTTCCTCTTT 420
GGTTTTTCTG CCGTTTCCAT CATGTACCTG GTGTTGGTGT TGGCAGTGCA AGTGCATGCC 480
TGGCAGTTGT ACTACAGCAA GAAGCTCCTA GACTCTTGGT TCACCAGCAC ACAGGAGAAG 540
AAGCATAAA 549
Información para: SEQ ID NO: 1 í Longitud: 972 Tipo: ADN Organismo: Homo sapiens Secuencia: 18 ATGGGGCCCT GGGGAGAGCC AGAGCTCCTG GTGTGGCGCC CCGAGGCGGT AGCTTCAGAG 60
CCTCCAGTGC CTGTGGGGCT GGAGGTGAAG TTGGGGGCCC TGGTGCTGCT GCTGGTGCTC 120
ACCCTCCTCT GCAGCCTGGT GCCCATCTGT GTGCTGCGCC GGCCAGGAGC TAACCATGAA 180
GGCTCAGCTT CCCGCCAGAA AGCCCTGAGC CTAGTAAGCT GTTTCGCGGG GGGCGTCTTT 240
TTGGCCACTT GTCTCCTGGA CCTGCTGCCT GACTACCTGG CTGCCATAGA TGAGGCCCTG 300
GCAGCCTTGC ACGTGACGCT CCAGTTCCCA CTGCAAGAGT TCATCCTGGC CATGGGCTTC 360
TTCCTGGTCC TGGTGATGGA GCAGATCACA CTGGCTTACA AGGAGCAGTC AGGGCCGTCA 420
CCTCTGGAGG AAACAAGGGC TCTGCTGGGA ACAGTGAATG GTGGGCCGCA GCATTGGCAT 480
GATGGGCCAG GGGTCCCACA GGCGAGTGGA GCCCCAGCAA CCCCCTCAGC CTTGCGTGCC 540
TGTGTACTGG TGTTCTCCCT GGCCCTCCAC TCCGTGTTCG AGGGGCTGGC GGTAGGGCTG 600
CAGCGAGACC GGGCTCGGGC CATGGAGCTG TGCCTGGCTT TGCTGCTCCA CAAGGGCATC 660
CTGGCTGTCA GCCTGTCCCT GCGGCTGTTG CAGAGCCACC TTAGGGCACA GGTGGTGGCT 720
GGCTGTGGGA TCCTCTTCTC ATGCATGACA CCTCTAGGCA TCGGGCTGGG TGCAGCTCTG 780
GCAGAGTCGG CAGGACCTCT GCACCAGCTG GCCCAGTCTG TGCTAGAGGG CATGGCAGCT 840
GGCACCTTTC TCTATATCAC CTTTCTGGAA ATCCTGCCCC AGGAGCTGGC CAGTTCTGAG 900
CAAAGGATCC TCAAGGTCAT TCTGCTCCTA GCAGGCTTTG CCCTGCTCAC TGGCCTGCTC 960
TTCATCCAAA TC 972
Información para: SEQ ID NO: 19 Longitud: 1705 Tipo: ADN Organismo: Homo sapiens Secuencia: 19 AAGAACTGAG GAAGCTCTTT CCACTACGGC TGTATTGCAC TGGTGAGTCC GGGCCCATGG 60
ATGAGAAATT GATGCGAGGA TCAATACAAG CTTAATTTGA ATTAATAAAA GGAAATATTT 120
TCTCCCTTTG AACTTATCTC CGTAAAGCCA TTGTGCCTCC TCTTGGGGGT CACGTGTTCA 180
CAATCA ATG GCC TTT GAG GAG CTC TTG AGT CAÁ GTT GGA GGC CTT GGG 228 Met Ala Phe Glu Glu Leu Leu Ser Gln Val Gly Gly Leu Gly 1 5 10 AGA TTT CAG ATG CTT CAT CTG GTT TTT ATT CTT CCC TCT CTC ATG TTA 276 Arg Phe Gln Met Leu Hxs Leu Val Phe He Leu Pro Ser Leu Met Leu 15 20 25 30
TTA ATC CCT CAT ATA CTG CTA GAG AAC TTT GCT GCA GCC ATT CCT GGT 324 Leu He Pro Hxs He Leu Leu Glu Asn Phe Ala Ala Ala He Pro Gly 35 40 45 CAT CGT TGC TGG GTC CAC ATG CTG GAC AAT AAT ACT GGA TCT GGT AAT 372 Hxs Arg Cys Trp Val Hxs Met Leu Asp Asn Asn Thr Gly Ser Gly Asn 50 55 60 GAA ACT GGA ATC CTC AGT GAA GAT GCC CTC TTG AGA ATC TCT ATC CCA 420 Glu Thr Gly He Leu Ser Glu Asp Ala Leu Leu Arg He Ser He Pro 65 70 75 CTA GAC TCA AAT CTG AGG CCA GAG AAG TGT CGT CGC TTT GTC CAT CCC 468 Leu Asp Ser Asn Leu Arg Pro Glu Lys Cys Arg Arg Phe Val Hxs Pro 80 85 90 CAG TGG CAG CTT CTT CAC CTG AAT GGG ACT ATC CAC AGC ACA AGT GAG 516 Gln Trp Gln Leu Leu Hxs Leu Asn Gly Thr He Hxs Ser Thr Ser Glu 95 100 105 110
GCA GAC ACA GAA CCC TGT GTG GAT GGC TGG GTA TAT GAT CAÁ AGC TAC 564 Ala Asp Thr Glu Pro Cys Val Asp Gly Trp Val Tyr Asp Gln Ser Tyr 115 120 125 TTC CCT TCG ACC ATT GTG ACT AAG TGG GAC CTG GTA TGT GAT TAT CAG 612 Phe Pro Ser Thr He Val Thr Lys Trp Asp Leu Val Cys Asp Tyr Gln 130 135 140 TCA CTG AAA TCA GTG GTT CAÁ TTC CTA CTT CTG ACT GGA ATG CTG GTG 660 Ser Leu Lys Ser Val Val Gln Phe Leu Leu Leu Thr Gly Met Leu Val 145 150 155 GGA GGC ATC ATA GGT GGC CAT GTC TCA GAC AGG TGG CTG GTG GAA TCT 708 Gly Gly He He Gly Gly Hxs Val Ser Asp Arg Trp Leu Val Glu Ser 160 165 170 GCT CGG TGG TTG ATA ATC ACC AAT AAA CTA'GAT GAG GGC TTA AAG GCA 756 Ala Arg Trp Leu He He Thr Asn Lys Leu Asp Glu Gly Leu Lys Ala 175 180 185 190
CTT AGA AAA GTT GCA CGC ACA AAT GGA ATA AAG AAT GCT GAA GAA ACC 804 Leu Arg Lys Val Ala Arg Thr Asn Gly He Lys Asn Ala Glu Glu Thr 195 200 205 CTG AAC ATA GAG GTT GTA AGA TCC ACC ATG CAG GAG GAG CTG GAT GCA 852
Leu Asn He Glu Val Val Arg Ser Thr Met Gln Glu Glu Leu Asp Ala 210 215 220 GCA CAG ACC AAA ACT ACT GTG TGT GAC TTG TTC CGC AAC CCC AGT ATG 900 Ala Gln Thr Lys Thr Thr Val Cys Asp Leu Phe Arg Asn Pro Ser Met 225 230 235 CGT AAA AGG ATC TGT ATC CTG GTA TTT TTG AGA AAA AAA ATC TCA AGG 948 Arg Lys Arg He Cys He Leu Val Phe Leu Arg Lys Lys He Ser Arg 240 245 250 AAA AGG CAT AAA AAT GAT TGC TAC ACA AAA GTG ACC AAA TTT TAAGAAGCCT 1000 Lys Arg Hxs Lys Asn Asp Cys Tyr Thr Lys Val Thr Lys Phe 255 260 265 TCATGAGCTG ATTGGTGGGG AAATTCAGAA AAAAAAATAC AGGAAAAGAA CACACCAGAA 1060
GGGTTTTTTT CCCTACAACC AGCAAGAACA TATATTAGAT ACATGAATCT CAATTATAAT 1120
TATGGCATTA ATTTGCATTT TATTTCAAAA TTAACTTGTG GGGACATGTA ATCTCTTGAG 1180
CAATCTGATA TTTTTGGGAA GTCCTTTAAA AAGTTACAAA TTTATCAATA AATTACTAGT 1240
AGATAAGATG ATTCAGAAAC AAAAGAAAAT CACAGAATTA GGATGTGGCT GGCTGGTGTA 1300
TGAAGCACCA TGTGATGAAT TCATAAAGTT GCAAAAGTCA AAACAATACT GTACATGCAA 1360
CCAGAAATCA AAATAAATCC AGAAATAGAG ACCTATATAA ATGCATTTAA TACATGATAC 1420
TTTTGACATA ATAAGCCATT GGAAAACGGA AAGATTAGAT ACTAAATAAC ATTGACTATC 1480
TCTTTGTAAA TACAGTCACT AAATGATGTT AGTTACTTTT CCATGGTGGA ATTTTAATTA 1540
CTTTTTCTTT GTAATTTTTC TCTCTGTATA TTTTAAACAA ATAGCTGGTA TAGTTTACAA 1600
TATTATAAAG ATATTGTTCA AATTGAAGGG CAAAGGCCAG GTTCAGCAAT TTTCAAACTG 1660
TATGTACATT TAATAAAATA ACTATAAATT AAAAAATTAT ATTTC 1705
Información para. SEQ ID NO: 20 Longitud: 268 Tipo: PRT Organismo- Homo sapiens Secuencia 20 Met Ala Phe Glu Glu Leu Leu Ser Gln Val Gly Gly Leu Gly 1 5 10 Arg Phe Gln Met Leu Hxs Leu Val Phe He Leu Pro Ser Leu Met Leu 15 20 25 30
Leu He Pro His He Leu Leu Glu Asn Phe Ala Ala Ala He Pro Gly 35 40 45
His Arg Cys Trp Val His Met Leu Asp Asn Asn Thr Gly Ser Gly Asn 50 55 60
Glu Thr Gly He Leu Ser Glu Asp Ala Leu Leu Arg He Ser He Pro 65 70 75 Leu Asp Ser Asn Leu Arg Pro Glu Lys Cys Arg Arg Phe Val His Pro 80 85 90 Gln Trp Gln Leu Leu His Leu Asn Gly Thr He His Ser Thr Ser Glu 95 100 105 110
Ala Asp Thr Glu Pro Cys Val Asp Gly Trp Val Tyr Asp Gln Ser Tyr 115 120 125
Phe Pro Ser Thr He Val Thr Lys Trp Asp Leu Val Cys Asp Tyr Gln 130 135 140
Ser Leu Lys Ser Val Val Gln Phe Leu Leu Leu Thr Gly Met Leu Val 145 150 155 Gly Gly He He Gly Gly His Val Ser Asp Arg Trp Leu Val Glu Ser 160 165 170 Ala Arg Trp Leu He He Thr Asn Lys Leu Asp Glu Gly Leu Lys Ala 175 180 185 190
Leu Arg Lys Val Ala Arg Thr Asn Gly He Lys Asn Ala Glu Glu Thr 195 200 205
Leu Asn He Glu Val Val Arg Ser Thr Met Gln Glu Glu Leu Asp Ala 210 215 220
Ala Gln Thr Lys Thr Thr Val Cys Asp Leu Phe Arg Asn Pro Ser Met 225 230 235 Arg Lys Arg He Cys He Leu Val Phe Leu Arg Lys Lys He Ser Arg 240 245 250 Lys Arg His Lys Asn Asp Cys Tyr Thr Lys Val Thr Lys Phe 255 260 265 Información para: SEQ ID NO: 21 Longitud: 1759 Tipo: ADN Organismo: Homo sapiens
Secuencia 21 AGTCAGTCTG TCGGAGTCTG TCCTCGGAGC AGGCGGAGTA AAGGGACTTG AGCGAGCCAG 60
TTGCCGGATT ATTCTATTTC CCCTCCCTCT CTCCCGCCCC GTATCTCTTT TCACCCTTCT 120
CCCACCCTCG CTCGCGTAGC C ATG GCG GAG CCG TCG GCG GCC ACT CAG TCC 171 Met Ala Glu Pro Ser Ala Ala Thr Gln Ser 1 5 10
CAT TCC ATC TCC TCG TCG TCC TTC GGA GCC GAG CCG TCC GCG CCC GGC 219 Hxs Ser He Ser Ser Ser Ser Phe Gly Ala Glu Pro Ser Ala Pro Gly 15 20 25 GGC GGC GGG AGC CCA GGA GCC TGC CCC GCC CTG GGG ACG AAG AGC TGC 267 Gly Gly Gly Ser Pro Gly Ala Cys Pro Ala Leu Gly Thr Lys Ser Cys 30 35 40 AGC TCC TCC TGT GCG GTG CAC GAT CTG ATT TTC TGG AGA GAT GTG AAG 315 Ser Ser Ser Cys Ala Val Hxs Asp Leu He Phe Trp Arg Asp Val Lys 45 50 55 AAG ACT GGG TTT GTC TTT GGC ACC ACG CTG ATC ATG CTG CTT TCC CTG 363 Lys Thr Gly Phe Val Phe Gly Thr Thr Leu He Met Leu Leu Ser Leu 60 65 70 GCA GCT TTC AGT GTC ATC AGT GTG GTT TCT TAC CTC ATC CTG GCT CTT 411 Ala Ala Phe Ser Val He Ser Val Val Ser Tyr Leu He Leu Ala Leu 75 80 85 90
CTC TCT GTC ACC ATC AGC TTC AGG ATC TAC AAG TCC GTC ATC CAÁ GCT 459 Leu Ser Val Thr He Ser Phe Arg He Tyr Lys Ser Val He Gln Ala 95 100 105 GTA CAG AAG TCA GAA GAA GGC CAT CCA TTC AAA GCC TAC CTG GAC GTA 507 Val Gln Lys Ser Glu Glu Gly His Pro Phe Lys Ala Tyr Leu Asp Val 110 115 120 GAC ATT ACT CTG TCC TCA GAA GCT TTC CAT AAT TAC ATG AAT GCT GCC 555 Asp He Thr Leu Ser Ser Glu Ala Phe Hxs Asn Tyr Met Asn Ala Ala 125 130 135 ATG GTG CAC ATC AAC AGG GCC CTG AAA CTC ATT ATT CGT CTC TTT CTG 603 Met Val Hxs He Asn Arg Ala Leu Lys Leu He He Arg Leu Phe Leu 140 145 150 GTA GAA GAT CTG GTT GAC TCC TTG AAG CTG GCT GTC TTC ATG TGG CTG 651 Val Glu Asp Leu Val Asp Ser Leu Lys Leu Ala Val Phe Met Trp Leu 155 160 165 170
ATG ACC TAT GTT GGT GCT GTT TTT AAC GGA ATC ACC CTT CTA ATT CTT 699 Met Thr Tyr Val Gly Ala Val Phe Asn Gly He Thr Leu Leu He Leu 175 180 185 GCT GAA CTG CTC ATT TTC AGT GTC CCG ATT GTC TAT GAG AAG TAC AAG 747
Ala Glu Leu Leu He Phe Ser Val Pro He Val Tyr Glu Lys Tyr Lys 190 195 200 ACC CAG ATT GAT CAC TAT GTT GGC ATC GCC CGA GAT CAG ACC AAG TCA 795 Thr Gln He Asp Hxs Tyr Val Gly He Ala Arg Asp Gln Thr Lys Ser 205 210 215 ATT GTT GAA AAG ATC CAÁ GCA AAA CTC CCT GGA ATC GCC AAA AAA AAG 843 He Val Glu Lys He Gln Ala Lys Leu Pro Gly He Ala Lys Lys Lys 220 225 230 GCA GAA TAAGTACATG GAAACCAGAA ATGCAACAGT TACTAAAACA CCATTTAATA G 900
Ala Glu 235 TTATAACGTC GTTACTTGTA CTATGAAGGA AAATACTCAG TGTCAGCTTG AGCCTGCATT 960
CCAAGCTTTT TTTTTAATTT GGTGTTTTCT CCCATCCTTT CCCTTTAACC CTCAGTATCA 1020
AGCACAAAAA TTGATGGACT GATAAAAGAA CTATCTTAGA ACTCAGAAGA AGAAAGAATC 1080
AAATTCATAG GATAAGTCAA TACCTTAATG GTGGTAGAGC CTTTACCTGT AGCTTGAAAG 1140
GGGAAAGATT GGAGGTAAGA GAGAAAATGA AAGAACACCT CTGGGTCCTT CTGTCCAGTT 1200
TTCAGCACTA GTCTTACTCA GCTATCCATT ATAGTTTTGC CCTTAAGAAG TCATGATTAA 1260
CTTATGAAAA AATTATTTGG GGACAGGAGT GTGATACCTT CCTTGGTTTT TTTTTGCAGC 1320
CCTCAAATCC TATCTTCCTG CCCCACAATG TGAGCAGCTA CCCCTGATAC TCCTTTTCTT 1380
TAATGATTTA ACTATCAACT TGATAAATAA CTTATAGGTG ATAGTGATAA TTCCTGATTC 1440
CAAGAATGCC ATCTGATAAA AAAGAATAGA AATGGAAAGT GGGACTGAGA GGGAGTCAGC 1500
AGGCATGCTG CGGTGGCGGT CACTCCCTCT GCCACTATCC CCAGGGAAGG AAAGGCTCCG 1560
CCATTTGGGA AAGTGGTTTC TACGTCACTG GACACCGGTT CTGAGCATTA GTTTGAGAAC 1620
TCGTTCCCGA ATGTGCTTTC CTCCCTCTCC CCTGCCCACC TCAAGTTTAA TAAATAAGGT 1680
TGTACTTTTC TTACTATAAA ATAAATGTCT GTAACTGCTG TGCACTGCTG TAAACTTGTT 1740
AGAGAAAAAA ATAACCTGC 1759
Información para: SEQ ID NO: 22 Longitud: 236 Tipo: PRT Organismo: Homo sapiens Secuencia: 22
Met Ala Glu Pro Ser Ala Ala Thr Gln Ser 1 5 10
Hxs Ser He Ser Ser Ser Ser Phe Gly Ala Glu Pro Ser Ala Pro Gly 15 20 25
Gly Gly Gly Ser Pro Gly Ala Cys Pro Ala Leu Gly Thr Lys Ser Cys 30 35 40
Ser Ser Ser Cys Ala Val Hxs Asp Leu He Phe Trp Arg Asp Val Lys 45 50 55 Lys Thr Gly Phe Val Phe Gly Thr Thr Leu He Met Leu Leu Ser Leu 60 65 70 Ala Ala Phe Ser Val He Ser Val Val Ser Tyr Leu He Leu Ala Leu 75 80 85 90
Leu Ser Val Thr He Ser Phe Arg He Tyr Lys Ser Val He Gln Ala 95 100 105
Val Gln Lys Ser Glu Glu Gly Hxs Pro Phe Lys Ala Tyr Leu Asp Val 110 115 120
Asp He Thr Leu Ser Ser Glu Ala Phe Hxs Asn Tyr Met Asn Ala Ala 125 130 135 Met Val Hxs He Asn Arg Ala Leu Lys Leu He He Arg Leu Phe Leu 140 145 150 Val Glu Asp Leu Val Asp Ser Leu Lys Leu Ala Val Phe Met Trp Leu 155 160 165 170
Met Thr Tyr Val Gly Ala Val Phe Asn Gly He Thr Leu Leu He Leu 175 180 185
Ala Glu Leu Leu He Phe Ser Val Pro He Val Tyr Glu Lys Tyr Lys 190 195 200
Thr Gln He Asp Hxs Tyr Val Gly He Ala Arg Asp Gln Thr Lys Ser 205 210 215 He Val Glu Lys He Gln Ala Lys Leu Pro Gly He Ala Lys Lys Lys 220 225 230 Ala Glu 235 Información para: SEQ ID NO: 23
Longitud: 1069 Tipo: ADN Organismo: Homo sapiens Secuencia- 23 AGTGGAAGAC CAGGCAGCCC AGCTGAAGGC AGTAAGCTCG GCTCACAGTC GCAGGAGAGT 60
TCTGGGGTAC ACGGGCAAAG GGGCTTGAGA AGGCCCGGAG GCGAAGCCGA AGAGAAGCAA 120
CTGTGCCCCG GAGAAGAGAA GCTCGCCCAT TCCAGACTGG GAACCAGCTT TCAGTGAAG 179
ATG GCA GGG CCA GAA CTG TTG CTC GAC TCC AAC ATC CGC CTC TGG GTG 227 Met Ala Gly Pro Glu Leu Leu Leu Asp Ser Asn He Arg Leu Trp Val 1 5 10 15 GTC CTA CCC ATC GTT ATC ATC ACT TTC TTC GTA GGC ATG ATC CGC CAC 275 Val Leu Pro He Val He He Thr Phe Phe Val Gly Met He Arg Hxs 20 25 30 TAC GTG TCC ATC CTG CTG CAG AGC GAC AAG AAG CTC ACC CAG GAA CAÁ 323 Tyr Val Ser He Leu Leu Gln Ser Asp Lys Lys Leu Thr Gln Glu Gln 35 40 45 GTA TCT GAC AGT CAÁ GTC CTA ATT CGA AGC AGA GTC CTC AGG GAA AAT 371 Val Ser Asp Ser Gln Val Leu He Arg Ser Arg Val Leu Arg Glu Asn 50 55 60 GGA AAA TAC ATT CCC AAA CAG TCT TTC TTG ACA CGA AAA TAT TAT TTC 419 Gly Lys Tyr He Pro Lys Gln Ser Phe Leu Thr Arg Lys Tyr Tyr Phe 65 70 75 80
AAC AAC CCA GAG GAT GGA TTT TTC AAA AAA ACT AAA CGG AAG GTA GTG 467 Asn Asn Pro Glu Asp Gly Phe Phe Lys Lys Thr Lys Arg Lys Val Val 85 90 95 CCA CCT TCT CCT ATG ACT GAT CCT ACT ATG TTG ACA GAC ATG ATG AAA 515 Pro Pro Ser Pro Met Thr Asp Pro Thr Met Leu Thr Asp Met Met Lys 100 105 110 GGG AAT GTA ACA AAT GTC CTC CCT ATG ATT CTT ATT GGT GGA TGG ATC 563 Gly Asn Val Thr Asn Val Leu Pro Met He Leu He Gly Gly Trp He 115 120 125 AAC ATG ACA TTC TCA GGC TTT GTC ACA ACC AAG GTC CCA TTT CCA CTG 611 Asn Met Thr Phe Ser Gly Phe Val Thr Thr Lys Val Pro Phe Pro Leu 130 135 140 ACC CTC CGT TTT AAG CCT ATG TTA CAG CAÁ GGA ATC GAG CTA CTC ACA 659 Thr Leu Arg Phe Lys Pro Met Leu Gln Gln Gly He Glu Leu Leu Thr 145 150 155 160
TTA GAT GCA TCC TGG GTG AGT TCT GCA TCC TGG TAC TTC CTC AAT GTA 707
Leu Asp Ala Ser Trp Val Ser Ser Ala Ser Trp Tyr Phe Leu Asn Val 165 170 175 TTT GGG CTT CGG AGC ATT TAC TCT CTG ATT CTG GGC CAÁ GAT AAT GCC 755 Phe Gly Leu Arg Ser He Tyr Ser Leu He Leu Gly Gln Asp Asn Ala 180 185 190 GCT GAC CAÁ TCA CGA ATG ATG CAG GAG CAG ATG ACG GGA GCA GCC ATG 803 Ala Asp Gln Ser Arg Met Met Gln Glu Gln Met Thr Gly Ala Ala Met 195 200 205 GCC ATG CCC GCA GAC ACA AAC AAA GCT TTC AAG ACA GAG TGG GAA GCT 851 Ala Met Pro Ala Asp Thr Asn Lys Ala Phe Lys Thr Glu Trp Glu Ala 210 215 220 TTG GAG CTG ACG GAT CAC CAG TGG GCA CTA GAT GAT GTC GAA GAA GAG 899 Leu Glu Leu Thr Asp Hxs Gln Trp Ala Leu Asp Asp Val Glu Glu Glu 225 230 235 240
CTC ATG GCC AAA GAC CTC CAC TTC GAA GGC ATG TTC AAA AAG GAA TTA 947 Leu Met Ala Lys Asp Leu Hxs Phe Glu Gly Met Phe Lys Lys Glu Leu 245 250 255 CAG ACC TCT ATT TTT TGAAGACCGA GCAGGGATTA GCTGTGTCAG GAACTTGG 1000 Gln Thr Ser He Phe 260 AGTTGCACTT AACCTTGTAA CTTTGTTTGG AGCTGGCACC TCTTGAAATA AAAAGGAGGA 1060
TGCACGAGC 1069
Información para. SEQ ID NO. 24 Longitud: 261 Tipo PRT Organismo. Homo sapiens Secuencia- 24 Met Ala Gly Pro Glu Leu Leu Leu Asp Ser Asn He Arg Leu Trp Val 1 5 10 15
Val Leu Pro He Val He He Thr Phe Phe Val Gly Met He Arg Hxs 20 25 30 Tyr Val Ser He Leu Leu Gln Ser Asp Lys Lys Leu Thr Gln Glu Gln 35 40 45 Val Ser Asp Ser Gln Val Leu He Arg Ser Arg Val Leu Arg Glu Asn 50 55 60
Gly Lys Tyr He Pro Lys Gln Ser Phe Leu Thr Arg Lys Tyr Tyr Phe 65 70 75 80
Asn Asn Pro Glu Asp Gly Phe Phe Lys Lys Thr Lys Arg Lys Val Val 85 90 95
Pro Pro Ser Pro Met Thr Asp Pro Thr Met Leu Thr Asp Met Met Lys 100 105 110
Gly Asn Val Thr Asn Val Leu Pro Met He Leu He Gly Gly Trp He 115 120 125 Asn Met Thr Phe Ser Gly Phe Val Thr Thr Lys Val Pro Phe Pro Leu 130 135 140 Thr Leu Arg Phe Lys Pro Met Leu Gln Gln Gly He Glu Leu Leu Thr 145 150 155 160
Leu Asp Ala Ser Trp Val Ser Ser Ala Ser Trp Tyr Phe Leu Asn Val 165 170 175
Phe Gly Leu Arg Ser He Tyr Ser Leu He Leu Gly Gln Asp Asn Ala 180 185 190
Ala Asp Gln Ser Arg Met Met Gln Glu Gln Met Thr Gly Ala Ala Met 195 200 205 Ala Met Pro Ala Asp Thr Asn Lys Ala Phe Lys Thr Glu Trp Glu Ala 210 215 220 Leu Glu Leu Thr Asp Hxs Gln Trp Ala Leu Asp Asp Val Glu Glu Glu 225 230 235 240
Leu Met Ala Lys Asp Leu Hxs Phe Glu Gly Met Phe Lys Lys Glu Leu 245 250 255
Gln Thr Ser He Phe 260 Información para: SEQ ID NO: 25 Longitud: 1759 Tipo: ADN Organismo: Homo sapiens Secuencia: 25 ATTGTGCAGC AGGCGGGCCC CCGCGCGGCA GGGCCCTGGA CCCGCGCGGC TCCCGGGG
ATG GTG AGC AAG GCG CTG CTG CGC CTC GTG TCT GCC GTC AAC CGC AGG
Met Val Ser Lys Ala Leu Leu Arg Leu Val Ser Ala Val Asn Arg Arg
1 5 10 15 AGG ATG AAG CTG CTG CTG GGC ATC GCC TTG CTG GCC TAC GTC GCC TCT Arg Met Lys Leu Leu Leu Gly He Ala Leu Leu Ala Tyr Val Ala Ser 20 25 30 GTT TGG GGC AAC TTC GTT AAT ATG AGC TTT CTA CTC AAC AGG TCT ATC Val Trp Gly Asn Phe Val Asn Met Ser Phe Leu Leu Asn Arg Ser He 35 40 45 CAG GAA AAT GGT GAA CTA AAA ATT GAA AGC AAG ATT GAA GAG ATG GTT Gln Glu Asn Gly Glu Leu Lys He Glu Ser Lys He Glu Glu Met Val 50 55 60 GAA CCA CTA AGA GAG AAA ATC AGA GAT TTA GAA AAA AGC TTT ACC CAG 298
Glu Pro Leu Arg Glu Lys He Arg Asp Leu Glu Lys Ser Phe Thr Gln
65 70 75 80
AAA TAC CCA CCA GTA AAG TTT TTA TCA GAA AAG GAT CGG AAA AGA ATT 346
Lys Tyr Pro Pro Val Lys Phe Leu Ser Glu Lys Asp Arg Lys Arg He 85 90 95 TTG ATA ACA GGA GGC GCA GGG TTC GTG GGC TCC CAT CTA ACT GAC AAA 394
Leu He Thr Gly Gly Ala Gly Phe Val Gly Ser Hxs Leu Thr Asp Lys 100 105 110 CTC ATG ATG GAC GGC CAC GAG GTG ACC GTG GTG GAC AAT TTC TTC ACG Leu Met Met Asp Gly Hxs Glu Val Thr Val Val Asp Asn Phe Phe Thr 115 120 125 GGC AGG AAG AGA AAC GTG GAG CAC TGG ATC GGA CAT GAG AAC TTC GAG 490
Gly Arg Lys Arg Asn Val Glu Hxs Trp He Gly Hxs Glu Asn Phe Glu 130 135 140 TTG ATT AAC CAC GAC GTG GTG GAG CCC CTC TAC ATC GAG GGC GTG GAA Leu He Asn His Asp Val Val Glu Pro Leu Tyr He Glu Gly Val Glu
145 150 155 160
GTG CGA GTG GCC AGA ATC TTC AAC ACC TTT GGG CCA CGC ATG CAC ATG 586
Val Arg Val Ala Arg He Phe Asn Thr Phe Gly Pro Arg Met Hxs Met 165 170 175 AAC GAT GGG CGA GTA GTC AGC AAC TTC ATC CTG CAG GCG CTC CAG GGG Asn Asp Gly Arg Val Val Ser Asn Phe He Leu Gln Ala Leu Gln Gly 180 185 190 GAG CCA CTC ACG GTA TAC GGA TCC GGG TCT CAG ACA AGG GCG TC CAG 682
Glu Pro Leu Thr Val Tyr Gly Ser Gly Ser Gln Thr Arg Ala Phe Gln 195 200 205 TAC GTC AGC GAT CTA GTG AAT GGC CTC GTG GCT CTC ATG AAC AGC AAC Tyr Val Ser Asp Leu Val Asn Gly Leu Val Ala Leu Met Asn Ser Asn 210 215 220
GTC AGC AGC CCG GTC AAC CTG GGG AAC CCA GAA GAA CAC ACA ATC CTA 778 Val Ser Ser Pro Val Asn Leu Gly Asn Pro Glu Glu Hxs Thr He Leu 225 230 235 240
GAA TTT GCT CAG TTA ATT AAA AAC CTT GTT GGT AGC GGA AGT GAA ATT 826 Glu Phe Ala Gln Leu He Lys Asn Leu Val Gly Ser Gly Ser Glu He 245 250 255 CAG TTT CTC TCC GAA GCC CAG GAT GAC CCA CAG AAA AGA AAA CCA GAC 874 Gln Phe Leu Ser Glu Ala Gln Asp Asp Pro Gln Lys Arg Lys Pro Asp 260 265 270 ATC AAA AAA GCA AAG CTG ATG CTG GGG TGG GAG CCC GTG GTC CCG CTG 922 He Lys Lys Ala Lys Leu Met Leu Gly Trp Glu Pro Val Val Pro Leu 275 280 285 GAG GAA GGT TTA AAC AAA GCA ATT CAC TAC TTC CGT AAA GAA CTC GAG 970 Glu Glu Gly Leu Asn Lys Ala He Hxs Tyr Phe Arg Lys Glu Leu Glu 290 295 300 TAC CAG GCA AAT AAT CAG TAC ATC CCC AAA CCA AAG CCT GCC AGA ATA 1018 Tyr Gln Ala Asn Asn Gln Tyr He Pro Lys Pro Lys Pro Ala Arg He 305 310 315 320
AAG AAA GGA CGG ACT CGC CAC AGC TGAACTCCTC ACTTTTAGGA CACAAGAC 1070 Lys Lys Gly Arg Thr Arg Hxs Ser 325 TACCATTGTA CACTTGATGG GATGTATTTT TGGCTTTTTT TTGTTGTCGT TTAAAGAAAG 1130
ACTTTAACAG GTGTCATGAA GAACAAACTG GAATTTCATT CTGAAGCTTG CTTTAATGAA 1190
ATGGATGTGC CTAAAAGCTC CCCTCAAAAA ACTGCAGATT TTGCCTTGCA CTTTTTGAAT 1250
CTCTCTTTTT ATGTAAAATA GCGTAGATGC ATCTCTGCGT ATTTTCAAGT TTTTTTATCT 1310
TGCTGTGAGA GCATATGTTG TGACTGTCGT TGACAGTTTT ATTTACTGGT TTCTTTGTGA 1370
AGCTGAAAAG GAACATTAAG CGGGACAAAA AATGCCGATT TTATTTATAA AAGTGGGTAC 1430
TTAATAAATG AGTCGTTATA CTATGCATAA AGAAAAATCC TAGCAGTATT GTCAGGTGGT 1490
GGTGCGCCGG CATTGATTTT AGGGCAGATA AAAGAATTCT GTGTGAGAGC TTTATGTTTC 1550
TCTTTTAATT CAGAGTTTTT CCAAGGTCTA CTTTTGAGTT GCAAACTTGA CTTTGAAATA 1610
TTCCTGTTGG TCATGATCAA GGATATTTGA AATCACTACT GTGTTTTGCT GCGTATCTGG 1670
GGCGGGGGCA GGTTGGGGGG CACAAAGTTA ACATATTCTT GGTTAACCAT GGTTAAATAT 1730
GCTATTTTAA TAAAATATTG AAACTCACC 1759
Información para SEQ ID NO 26
Longitud: 328 Tipo: PRT Organismo: Homo sapiens Secuencia: 26 Met Val Ser Lys Ala Leu Leu Arg Leu Val Ser Ala Val Asn Arg Arg 1 5 10 15
Arg Met Lys Leu Leu Leu Gly He Ala Leu Leu Ala Tyr Val Ala Ser 20 25 30
Val Trp Gly Asn Phe Val Asn Met Ser Phe Leu Leu Asn Arg Ser He 35 40 45 Gln Glu Asn Gly Glu Leu Lys He Glu Ser Lys He Glu Glu Met Val 50 55 60 Glu Pro Leu Arg Glu Lys He Arg Asp Leu Glu Lys Ser Phe Thr Gln 65 70 75 80
Lys Tyr Pro Pro Val Lys Phe Leu Ser Glu Lys Asp Arg Lys Arg He 85 90 95
Leu He Thr Gly Gly Ala Gly Phe Val Gly Ser His Leu Thr Asp Lys 100 105 110
Leu Met Met Asp Gly Hxs Glu Val Thr Val Val Asp Asn Phe Phe Thr 115 120 125 Gly Arg Lys Arg Asn Val Glu His Trp He Gly Hxs Glu Asn Phe Glu 130 135 140 Leu He Asn Hxs Asp Val Val Glu Pro Leu Tyr He Glu Gly Val Glu 145 150 155 160
Val Arg Val Ala Arg He Phe Asn Thr Phe Gly Pro Arg Met Hxs Met 165 170 175
Asn Asp Gly Arg Val Val Ser Asn Phe He Leu Gln Ala Leu Gln Gly 180 185 190
Glu Pro Leu Thr Val Tyr Gly Ser Gly Ser Gln Thr Arg Ala Phe Gln 195 200 205 Tyr Val Ser Asp Leu Val Asn Gly Leu Val Ala Leu Met Asn Ser Asn 210 215 220
Val Ser Ser Pro Val Asn Leu Gly Asn Pro Glu Glu Hxs Thr He Leu 225 230 235 240
Glu Phe Ala Gln Leu He Lys Asn Leu Val Gly Ser Gly Ser Glu He 245 250 255
Gln Phe Leu Ser Glu Ala Gln Asp Asp Pro Gln Lys Arg Lys Pro Asp 260 265 270 He Lys Lys Ala Lys Leu Met Leu Gly Trp Glu Pro Val Val Pro Leu 275 280 285 Glu Glu Gly Leu Asn Lys Ala He Hxs Tyr Phe Arg Lys Glu Leu Glu 290 295 300 Tyr Gln Ala Asn Asn Gln Tyr He Pro Lys Pro Lys Pro Ala Arg He 305 310 315 320
Lys Lys Gly Arg Thr Arg Hxs Ser 325 Información para: SEQ ID NO: 27 Longitud: 1697 Tipo: ADN Organismo: Homo sapiens Secuencia: 27 AAAAGGATAC GGGAGTTCCT CCTTGCTCTC GCCCCTACTC TTTCTGGTGT TAGATCGAGC 60
TACCCTCTAA AAGCAGTTTA GAGTGGTAAA AAAAAAAAAA AACACACCAA ACGCTCGCAG 120
CCACAAAAGG G ATG AAA TTT CTT CTG GAC ATC CTC CTG CTT CTC CCG TTA 170 Met Lys Phe Leu Leu Asp He Leu Leu Leu Leu Pro Leu 1 5 10 CTG ATC GTC TGC TCC CTA GAG TCC TTC GTG AAG CTT TTT ATT CCT AAG 218 Leu He Val Cys Ser Leu Glu Ser Phe Val Lys Leu Phe He Pro Lys 15 20 25 AGG AGA AAA TCA GTC ACC GGC GAA ATC GTG CTG ATT ACA GGA GCT GGG 266 Arg Arg Lys Ser Val Thr Gly Glu He Val Leu He Thr Gly Ala Gly 30 35 40 45
CAT GGA ATT GGG AGA CTG ACT GCC TAT GAA TTT GCT AAA CTT AAA AGC 314 Hxs Gly He Gly Arg Leu Thr Ala Tyr Glu Phe Ala Lys Leu Lys Ser 50 55 60 AAG CTG GTT CTC TGG GAT ATA AAT AAG CAT GGA CTG GAG GAA ACA GCT 362 Lys Leu Val Leu Trp Asp He Asn Lys Hxs Gly Leu Glu Glu Thr Ala 65 70 75
GCC AAA TGC AAG GGA CTG GGT GCC AAG GTT CAT ACC TTT GTG GTA GAC 410
Ala Lys Cys Lys Gly Leu Gly Ala Lys Val Hxs Thr Phe Val Val Asp 80 85 90 TGC AGC AAC CGA GAA GAT ATT TAC AGC TCT GCA AAG AAG GTG AAG GCA 458
Cys Ser Asn Arg Glu Asp He Tyr Ser Ser Ala Lys Lys Val Lys Ala 95 100 105 GAA ATT GGA GAT GTT AGT ATT TTA GTA AAT AAT GCT GGT GTA GTC TAT 506
Glu He Gly Asp Val Ser He Leu Val Asn Asn Ala Gly Val Val Tyr
110 115 120 125
ACA TCA GAT TTG TTT GCT ACA CAÁ GAT CCT CAG ATT GAA AAG ACT TTT 554
Thr Ser Asp Leu Phe Ala Thr Gln Asp Pro Gln He Glu Lys Thr Phe 130 135 140 GAA GTT AAT GTA CTT GCA CAT TTC TGG ACT ACA AAG GCA TTT CTT CCT 602
Glu Val Asn Val Leu Ala Hxs Phe Trp Thr Thr Lys Ala Phe Leu Pro 145 150 155 GCA ATG ACG AAG AAT AAC CAT GGC CAT ATT GTC ACT GTG GCT TCG GCA 650
Ala Met Thr Lys Asn Asn Hxs Gly Hxs He Val Thr Val Ala Ser Ala 160 165 170 GCT GGA CAT GTC TCG GTC CCC TTC TTA CTG GCT TAC TGT TCA AGC AAG 698
Ala Gly Hxs Val Ser Val Pro Phe Leu Leu Ala Tyr Cys Ser Ser Lys 175 180 185 TTT GCT GCT GTT GGA TTT CAT AAA ACT TTG ACA GAT GAA CTG GCT GCC 746
Phe Ala Ala Val Gly Phe Hxs Lys Thr Leu Thr Asp Glu Leu Ala Ala
190 195 200 205
TTA CAÁ ATA ACT GGA GTC AAA ACA ACA TGT CTG TGT CCT AAT TTC GTA 794
Leu Gln He Thr Gly Val Lys Thr Thr Cys Leu Cys Pro Asn Phe Val 210 215 220 AAC ACT GGC TTC ATC AAA AAT CCA AGT ACA AGT TTG GGA CCC ACT CTG 842
Asn Thr Gly Phe He Lys Asn Pro Ser Thr Ser Leu Gly Pro Thr Leu 225 230 235 GAA CCT GAG GAA GTG GTA AAC AGG CTG ATG CAT GGG ATT CTG ACT GAG 890
Glu Pro Glu Glu Val Val Asn Arg Leu Met Hxs Gly He Leu Thr Glu 240 245 250 CAG AAG ATG ATT TTT ATT CCA TCT TCT ATA GCT TTT TTA ACA ACA TTG 938
Gln Lys Met He Phe He Pro Ser Ser He Ala Phe Leu Thr Thr Leu 255 260 265 GAA AGG ATC CTT CCT GAG CGT TTC CTG GCA GTT TTA AAA CGA AAA ATC 986
Glu Arg He Leu Pro Glu Arg Phe Leu Ala Val Leu Lys Arg Lys He
270 275 280 285
AGT GTT AAG TTT GAT GCA GTT ATT GGA TAT AAA ATG AAA GCG CAÁ 1031
Ser Val Lys Phe Asp Ala Val He Gly Tyr Lys Met Lys Ala Gln 290 295 300
TAAGCACCT AGTTTTCTGA AAACTGATTT ACCAGGTTTA GGTTGATGTC ATCTAATAGT 1090
GCCAGAATTT TAATGTTTGA ACTTCTGTTT TTTCTAATTA TCCCCATTTC TTCAATATCA 1150
TTTTTGAGGC TTTGGCAGTC TTCATTTACT ACCACTTGTT CTTTAGCCAA AAGCTGATTA 1210
CATATGATAT AAACAGAGAA ATACCTTTAG AGGTGACTTT AAGGAAAATG AAGAAAAAGA 1270
ACCAAAATGA CTTTATTAAA ATAATTTCCA AGATTATTTG TGGCTCACCT GAAGGCTTTG 1330
CAAAATTTGT ACCATAACCG TTTATTTAAC ATATATTTTT ATTTTTGATT GCACTTAAAT 1390
TTTGTATAAT TTGTGTTTCT TTTTCTGTTC TACATAAAAT CAGAAACTTC AAGCTCTCTA 1450
AATAAAATGA AGGACTATAT CTAGTGGTAT TTCACAATGA ATATCATGAA CTCTCAATGG 1510
GTAGGTTTCA TCCTACCCAT TGCCACTCTG TTTCCTGAGA GATACCTCAC ATTCCAATGC 1570
CAAACATTTC TGCACAGGGA AGCTAGAGGT GGATACACGT GTTGCAAGTA TAAAAGCATC 1630
ACTGGGATTT AAGGAGAATT GAGAGAATGT ACCCACAAAT GGCAGCAATA ATAAATGGAT 1690
CACACTT 1697
Información para: SEQ ID NO: 28 Longitud: 300 Tipo: PRT Organismo: Homo sapiens Secuencia: 28 Met Lys Phe Leu Leu Asp He Leu Leu Leu Leu Pro Leu 1 5 10 Leu He Val Cys Ser Leu Glu Ser Phe Val Lys Leu Phe He Pro Lys 15 20 25 Arg Arg Lys Ser Val Thr Gly Glu He Val Leu He Thr Gly Ala Gly 30 35 40 45
His Gly He Gly Arg Leu Thr Ala Tyr Glu Phe Ala Lys Leu Lys Ser 50 55 60
Lys Leu Val Leu Trp Asp He Asn Lys Hxs Gly Leu Glu Glu Thr Ala 65 70 75 Ala Lys Cys Lys Gly Leu Gly Ala Lys Val Hxs Thr Phe Val Val Asp 80 85 90 Cys Ser Asn Arg Glu Asp He Tyr Ser Ser Ala Lys Lys Val Lys Ala 95 100 105
Glu He Gly Asp Val Ser He Leu Val Asn Asn Ala Gly Val Val Tyr 110 115 120 125
Thr Ser Asp Leu Phe Ala Thr Gln Asp Pro Gln He Glu Lys Thr Phe 130 135 140
Glu Val Asn Val Leu Ala His Phe Trp Thr Thr Lys Ala Phe Leu Pro 145 150 155 Ala Met Thr Lys Asn Asn His Gly His He Val Thr Val Ala Ser Ala 160 165 170 Ala Gly His Val Ser Val Pro Phe Leu Leu Ala Tyr Cys Ser Ser Lys 175 180 185 Phe Ala Ala Val Gly Phe Hxs Lys Thr Leu Thr Asp Glu Leu Ala Ala 190 195 200 205
Leu Gln He Thr Gly Val Lys Thr Thr Cys Leu Cys Pro Asn Phe Val 210 215 220
Asn Thr Gly Phe He Lys Asn Pro Ser Thr Ser Leu Gly Pro Thr Leu 225 230 235 Glu Pro Glu Glu Val Val Asn Arg Leu Met His Gly He Leu Thr Glu 240 245 250 Gln Lys Met He Phe He Pro Ser Ser He Ala Phe Leu Thr Thr Leu 255 260 265 Glu Arg He Leu Pro Glu Arg Phe Leu Ala Val Leu Lys Arg Lys He 270 275 280 285
Ser Val Lys Phe Asp Ala Val He Gly Tyr Lys Met Lys Ala Gln 290 295 300
Información para: SEQ ID NO: 29 Longitud: 814 Tipo: ADN Organismo: Homo sapiens Secuencia: 29 AGAATCCCGG ACAGCCCTGC TCCCTGCAGC CAGGTGTAGT TTCGGGAGCC ACTGGGGCCA 60
AAGTGAGAGT CCAGCGGTCT TCCAGCGCTT GGGCCACGGC GGCGGCCCTG GGAGCAGAGG 120
TGGAGCGACC CCATTACGCT AAAG ATG AAA GGC TGG GGT TGG CTG GCC CTG 171 Met Lys Gly Trp Gly Trp Leu Ala Leu 1 5
CTT CTG GGG GCC CTG CTG GGA ACC GCC TGG GCT CGG AGG AGC CAG GAT 219 Leu Leu Gly Ala Leu Leu Gly Thr Ala Trp Ala Arg Arg Ser Gln Asp 10 15 20 25
CTC CAC TGT GGA GCA TGC AGG GCT CTG GTG GAT GAA CTA GAA TGG GAA 267 Leu Hxs Cys Gly Ala Cys Arg Ala Leu Val Asp Glu Leu Glu Trp Glu 30 35 40 ATT GCC CAG GTG GAC CCC AAG AAG ACC ATT CAG ATG GGA TCT TTC CGG 315 He Ala Gln Val Asp Pro Lys Lys Thr He Gln Met Gly Ser Phe Arg 45 50 55 ATC AAT CCA GAT GGC AGC CAG TCA GTG GTG GAG GTG CCT TAT GCC CGC 363 He Asn Pro Asp Gly Ser Gln Ser Val Val Glu Val Pro Tyr Ala Arg 60 65 70 TCA GAG GCC CAC CTC ACA GAG CTG CTG GAG GAG ATA TGT GAC CGG ATG 411 Ser Glu Ala His Leu Thr Glu Leu Leu Glu Glu He Cys Asp Arg Met 75 80 85 AAG GAG TAT GGG GAA CAG ATT GAT CCT TCC ACC CAT CGC AAG AAC TAC 459 Lys Glu Tyr Gly Glu Gln He Asp Pro Ser Thr His Arg Lys Asn Tyr 90 95 100 105
GTA CGT GTA GTG GGC CGG AAT GGA GAA TCC AGT GAA CTG GAC CTA CAÁ 507 Val Arg Val Val Gly Arg Asn Gly Glu Ser Ser Glu Leu Asp Leu Gln 110 115 120 GGC ATC CGA ATC GAC TCA GAT ATT AGC GGC ACC CTC AAG TTT GCG TGT 555 Gly He Arg He Asp Ser Asp He Ser Gly Thr Leu Lys Phe Ala Cys 125 130 135 GAG AGC ATT GTG GAG GAA TAC GAG GAT GAA CTC ATT GAA TTC TTT TCC 603 Glu Ser He Val Glu Glu Tyr Glu Asp Glu Leu He Glu Phe Phe Ser 140 145 150 CGA GAG GCT GAC AAT GTT AAA GAC AAA CTT TGC AGT AAG CGA ACA GAT 651 Arg Glu Ala Asp Asn Val Lys Asp Lys Leu Cys Ser Lys Arg Thr Asp 155 160 165 CTT TGT GAC CAT GCC CTG CAC ATA TCG CAT GAT GAG CTA TGAACCACTG 700 Leu Cys Asp His Ala Leu His He Ser Hxs Asp Glu Leu 170 175 180 GAGCAGCCCA CACTGGCTTG ATGGATCACC CCCAGGAGGG GAAAATGGTG GCAATGCCTT 760
TTATATATTA TGTTTTTACT GAAATTAACT GAAAAAATAT GAAACCAAAA GTAC 814
Información para: SEQ ID NO: 30 Longitud: 182 Tipo: PRT Organismo: Homo sapiens
Secuencia: 30 Met Lys Gly Trp Gly Trp Leu Ala Leu 1 5 Leu Leu Gly Ala Leu Leu Gly Thr Ala Trp Ala Arg Arg Ser Gln Asp 10 15 20 25
Leu Hxs Cys Gly Ala Cys Arg Ala Leu Val Asp Glu Leu Glu Trp Glu 30 35 40
He Ala Gln Val Asp Pro Lys Lys Thr He Gln Met Gly Ser Phe Arg 45 50 55
He Asn Pro Asp Gly Ser Gln Ser Val Val Glu Val Pro Tyr Ala Arg 60 65 70 Ser Glu Ala Hxs Leu Thr Glu Leu Leu Glu Glu He Cys Asp Arg Met 75 80 85 Lys Glu Tyr Gly Glu Gln He Asp Pro Ser Thr Hxs Arg Lys Asn Tyr 90 95 100 105
Val Arg Val Val Gly Arg Asn Gly Glu Ser Ser Glu Leu Asp Leu Gln 110 115 120
Gly He Arg He Asp Ser Asp He Ser Gly Thr Leu Lys Phe Ala Cys 125 130 135
Glu Ser He Val Glu Glu Tyr Glu Asp Glu Leu He Glu Phe Phe Ser 140 145 150 Arg Glu Ala Asp Asn Val Lys Asp Lys Leu Cys Ser Lys Arg Thr Asp 155 160 165 Leu Cys Asp Hxs Ala Leu Hxs He Ser Hxs Asp Glu Leu 170 175 180 Información para. SEQ ID NO: 31 Longitud' 511 Tipo: ADN Organismo: Homo sapiens Secuencia: 31 GTTACGAAGC TGCAGGAGCG AG ATG GAG GTG GAC GCA CCG GGT GTT GAT GGT Met Glu Val Asp Ala Pro Gly Val Asp Gly 1 5 10
CGA GAT GGT CTC CGG GAG CGG CGA GGC TTT AGC GAG GGA GGG AGG CAG 100 Arg Asp Gly Leu Arg Glu Arg Arg Gly Phe Ser Glu Gly Gly Arg Gln 15 20 25 AAC TTC GAT GTG AGG CCT CAG TCT GGG GCA AAT GGG CTT CCC AAA CAC 148 Asn Phe Asp Val Arg Pro Gln Ser Gly Ala Asn Gly Leu Pro Lys Hxs 30 35 40 TCC TAC TGG TTG GAC CTC TGG CTT TTC ATC CTT TTC GAT GTG GTG GTG 196 Ser Tyr Trp Leu Asp Leu Trp Leu Phe He Leu Phe Asp Val Val Val 45 50 55 TTT CTC TTT GTG TAT TTT TTG CCA TGACTTGTTC GCTGATATCT AAATTAAGAA 250 Phe Leu Phe Val Tyr Phe Leu Pro 60 65 GTTGGTTCTT GAGTGAATTC TGAAAATGGC TACAAACTTC TTGAATAAAG AAGACAGGAC 310
TCTCAATAGA AGAATTTCAC ATCTCCAAGG GACCCTTCCT TTCATTTTAC ACTTTGTTAC 370
TAATTTGCAG AACTCTATTA ATTGGGTAGG ATTTCACCCA TTCCTAGCTA AGTTCTTAAA 430
ATTAAACCCT TTGGTTCGTG TTTAAAAACT TTCAAACATC TGATGGCTTT ACAGGGGCTG 490
AATATAAAAG CATTTGTACT T 511
Información para: SEQ ID NO: 32 Longitud: 66 Tipo: PRT Organismo: Homo sapiens Secuencia: 32 Met Glu Val Asp Ala Pro Gly Val Asp Gly 1 5 10
Arg Asp Gly Leu Arg Glu Arg Arg Gly Phe Ser Glu Gly Gly Arg Gln 15 20 25 Asn Phe Asp Val Arg Pro Gln Ser Gly Ala Asn Gly Leu Pro Lys Hxs 30 35 40 Ser Tyr Trp Leu Asp Leu Trp Leu Phe He Leu Phe Asp Val Val Val 45 50 55 Phe Leu Phe Val Tyr Phe Leu Pro 60 65 Información para: SEQ ID NO: 33
Longitud: 1126 Tipo: ADN Organismo: Homo sapiens Secuencia: 33 CTCTTCACGG AGCCGCGCGG CTGCGGGGGC GCAAATAGGG TCACTGGGCC GCTTGGCGGT 60
GTCGTTGCGG TACCAGGTCC GCGTGAGGGG TTCGGGGGTT CTGGGCAGGC ACA ATG 116 Met 1
GCG TCT CGA GCA GGC CCG CGA GCG GCC GGC ACC GAC GGC AGC GAC TTT 164 Ala Ser Arg Ala Gly Pro Arg Ala Ala Gly Thr Asp Gly Ser Asp Phe 5 10 15 CAG CAC CGG GAG CGC GTC GCC ATG CAC TAC CAG ATG AGT GTG ACC CTC 212 Gln Hxs Arg Glu Arg Val Ala Met Hxs Tyr Gln Met Ser Val Thr Leu 20 25 30 AAG TAT GAA ATC AAG AAG CTG ATC TAC GTA CAT CTG GTC ATA TGG CTG 260 Lys Tyr Glu He Lys Lys Leu He Tyr Val Hxs Leu Val He Trp Leu 35 40 45 CTG CTG GTT GCT AAG ATG AGC GTG GGA CAC CTG AGG CTC TTG TCA CAT 308 Leu Leu Val Ala Lys Met Ser Val Gly Hxs Leu Arg Leu Leu Ser Hxs 50 55 60 65
GAT CAG GTG GCC ATG CCC TAT CAG TGG GAA TAC CCG TAT TTG CTG AGC 356 Asp Gln Val Ala Met Pro Tyr Gln Trp Glu Tyr Pro Tyr Leu Leu Ser 70 75 80 ATT TTG CCC TCT CTC TTG GGC CTT CTC TCC TTT CCC CGC AAC AAC ATT 404 He Leu Pro Ser Leu Leu Gly Leu Leu Ser Phe Pro Arg Asn Asn He 85 90 95 AGC TAC CTG GTG CTC TCC ATG ATC AGC ATG GGA CTC TTT TCC ATC GCT 452 Ser Tyr Leu Val Leu Ser Met He Ser Met Gly Leu Phe Ser He Ala 100 105 110 CCA CTC ATT TAT GGC AGC ATG GAG ATG TTC CCT GCT GCA CAG CAG CTC 500 Pro Leu He Tyr Gly Ser Met Glu Met Phe Pro Ala Ala Gln Gln Leu 115 120 125 TAC CGC CAT GGC AAG GCC TAC CGT TTC CTC TTT GGT TTT TCT GCC GTT 548 Tyr Arg Hxs Gly Lys Ala Tyr Arg Phe Leu Phe Gly Phe Ser Ala Val 130 135 140 145
TCC ATC ATG TAC CTG GTG TTG GTG TTG GCA GTG CAÁ GTG CAT GCC TGG 596 Ser He Met Tyr Leu Val Leu Val Leu Ala Val Gln Val Hxs Ala Trp 150 155 160 CAG TTG TAC TAC AGC AAG AAG CTC CTA GAC TCT TGG TTC ACC AGC ACA 644
Gln Leu Tyr Tyr Ser Lys Lys Leu Leu Asp Ser Trp Phe Thr Ser Thr 165 170 175 CAG GAG AAG AAG CAT AAA TGAAGCCTCT TTGGGGTGAA GCCTGGACAT CCCATCGA 700 Gln Glu Lys Lys Hxs Lys 180 ATGAAAGGAC ACTAGTACAG CGGTTCCAAA ATCCCTTCTG GTGATTTTAG CAGCTGTGAT 760
GTTGGTACCT GGTGCAGACC AGGCCAAAGT TCTGGAAAGC TCCTTTTGCC ATCTGCTGAG 820
GTGGCAAAAC TATAATTTAT TCCTGGTTGG CTAGAACTGG GTGACCGACA GCTATGAAAC 880
AAATTTCAGC TGTTTGAAGT TGAACTTTGA GGTTTTTCTT TAAGAATGAG CTTCGTCCTT 940
GCCTCTACTC GGTCATTCTC CCCATTTCCA TCCATTACCC CTTAGCCATT GAGACTAAAG 1000
GAAATAGGGA ATAAATCAAA TTACTTCATC TCTAGGTCAC GGGTCAGGAA ACATTTGGGC 1060
AGCTGCTCCC TTGGCAGCTG TGGTCTCCTC TGCAAAGCAT TTTAATTAAA AACCTCAATA 1120
AAGATG 1126
Información para: SEQ ID NO: 34 Longitud: 183 Tipo: PRT Organismo: Homo sapiens Secuencia: 34 Met 1
Ala Ser Arg Ala Gly Pro Arg Ala Ala Gly Thr Asp Gly Ser Asp Phe
10 15 Gln His Arg Glu Arg Val Ala Met His Tyr Gln Met Ser Val Thr Leu
25 30 Lys Tyr Glu He Lys Lys Leu He Tyr Val His Leu Val He Trp Leu
40 45 Leu Leu Val Ala Lys Met Ser Val Gly His Leu Arg Leu Leu Ser His
50 55 60 65
Asp Gln Val Ala Met Pro Tyr Gln Trp Glu Tyr Pro Tyr Leu Leu Ser
70 75 80
He Leu Pro Ser Leu Leu Gly Leu Leu Ser Phe Pro Arg Asn Asn He
85 90 95
•-**'*^"-
Ser Tyr Leu Val Leu Ser Met He Ser Met Gly Leu Phe Ser He Ala 100 105 110 Pro Leu He Tyr Gly Ser Met Glu Met Phe Pro Ala Ala Gln Gln Leu 115 120 125 Tyr Arg Hxs Gly Lys Ala Tyr Arg Phe Leu Phe Gly Phe Ser Ala Val 130 135 140 145
Ser He Met Tyr Leu Val Leu Val Leu Ala Val Gln Val Hxs Ala Trp 150 155 160
Gln Leu Tyr Tyr Ser Lys Lys Leu Leu Asp Ser Trp Phe Thr Ser Thr 165 170 175 Gln Glu Lys Lys Hxs Lys 180 Información para: SEQ ID NO: 35 Longitud: 2015 Tipo: ADN Organismo: Homo sapiens Secuencia: 35 ATGTAGTGAG ACCCTCGCGA GGTCTGAGAG TCACTGGAGC TACCAGAAGC ATC ATG 56 Met 1
GGG CCC TGG GGA GAG CCA GAG CTC CTG GTG TGG CGC CCC GAG GCG GTA 104 Gly Pro Trp Gly Glu Pro Glu Leu Leu Val Trp Arg Pro Glu Ala Val 5 10 15 GCT TCA GAG CCT CCA GTG CCT GTG GGG CTG GAG GTG AAG TTG GGG GCC 152 Ala Ser Glu Pro Pro Val Pro Val Gly Leu Glu Val Lys Leu Gly Ala 20 25 30 CTG GTG CTG CTG CTG GTG CTC ACC CTC CTC TGC AGC CTG GTG CCC ATC 200 Leu Val Leu Leu Leu Val Leu Thr Leu Leu Cys Ser Leu Val Pro He 35 40 45 TGT GTG CTG CGC CGG CCA GGA GCT AAC CAT GAA GGC TCA GCT TCC CGC 248 Cys Val Leu Arg Arg Pro Gly Ala Asn Hxs Glu Gly Ser Ala Ser Arg 50 55 60 65
CAG AAA GCC CTG AGC CTA GTA AGC TGT TTC GCG GGG GGC GTC TTT TTG 296 Gln Lys Ala Leu Ser Leu Val Ser Cys Phe Ala Gly Gly Val Phe Leu 70 75 80 GCC ACT TGT CTC CTG GAC CTG CTG CCT GAC TAC CTG GCT GCC ATA GAT 344
Ala Thr Cys Leu Leu Asp Leu Leu Pro Asp Tyr Leu Ala Ala He Asp 85 90 95 GAG GCC CTG GCA GCC TTG CAC GTG ACG CTC CAG TTC CCA CTG CAÁ GAG 392
Glu Ala Leu Ala Ala Leu Hxs Val Thr Leu Gln Phe Pro Leu Gln Glu 100 105 110 TTC ATC CTG GCC ATG GGC TTC TTC CTG GTC CTG GTG ATG GAG CAG ATC 440
Phe He Leu Ala Met Gly Phe Phe Leu Val Leu Val Met Glu Gln He 115 120 125 ACA CTG GCT TAC AAG GAG CAG TCA GGG CCG TCA CCT CTG GAG GAA ACA 488
Thr Leu Ala Tyr Lys Glu Gln Ser Gly Pro Ser Pro Leu Glu Glu Thr
130 135 140 145
AGG GCT CTG CTG GGA ACA GTG AAT GGT GGG CCG CAG CAT TGG CAT GAT 536
Arg Ala Leu Leu Gly Thr Val Asn Gly Gly Pro Gln Hxs Trp Hxs Asp 150 155 160 GGG CCA GGG GTC CCA CAG GCG AGT GGA GCC CCA GCA ACC CCC TCA GCC 584
Gly Pro Gly Val Pro Gln Ala Ser Gly Ala Pro Ala Thr Pro Ser Ala 165 170 175 TTG CGT GCC TGT GTA CTG GTG TTC TCC CTG GCC CTC CAC TCC GTG TTC 632
Leu Arg Ala Cys Val Leu Val Phe Ser Leu Ala Leu Hxs Ser Val Phe 180 185 190 GAG GGG CTG GCG GTA GGG CTG CAG CGA GAC CGG GCT CGG GCC ATG GAG 680
Glu Gly Leu Ala Val Gly Leu Gln Arg Asp Arg Ala Arg Ala Met Glu 195 200 205 CTG TGC CTG GCT TTG CTG CTC CAC AAG GGC ATC CTG GCT GTC AGC CTG 728
Leu Cys Leu Ala Leu Leu Leu Hxs Lys Gly He Leu Ala Val Ser Leu
210 215 220 225
TCC CTG CGG CTG TTG CAG AGC CAC CTT AGG GCA CAG GTG GTG GCT GGC 776
Ser Leu Arg Leu Leu Gln Ser Hxs Leu Arg Ala Gln Val Val Ala Gly 230 235 240 TGT GGG ATC CTC TTC TCA TGC ATG ACA CCT CTA GGC ATC GGG CTG GGT 824
Cys Gly He Leu Phe Ser Cys Met Thr Pro Leu Gly He Gly Leu Gly 245 250 255 GCA GCT CTG GCA GAG TCG GCA GGA CCT CTG CAC CAG CTG GCC CAG TCT 872
Ala Ala Leu Ala Glu Ser Ala Gly Pro Leu Hxs Gln Leu Ala Gln Ser 260 265 270 GTG CTA GAG GGC ATG GCA GCT GGC ACC TTT CTC TAT ATC ACC TTT CTG 920
Val Leu Glu Gly Met Ala Ala Gly Thr Phe Leu Tyr He Thr Phe Leu 275 280 285 GAA ATC CTG CCC CAG GAG CTG GCC AGT TCT GAG CAÁ AGG ATC CTC AAG 968
Glu He Leu Pro Gln Glu Leu Ala Ser Ser Glu Gln Arg He Leu Lys
290 295 300 305
GTC ATT CTG CTC CTA GCA GGC TTT GCC CTG CTC ACT GGC CTG CTC TTC 1016 Val He Leu Leu Leu Ala Gly Phe Ala Leu Leu Thr Gly Leu Leu Phe 310 315 320 ATC CAÁ ATC TAGGGGGCTT CAAGAGAGGG GCAGGGGAGA TTGATGATCA GGTGC 1070 He Gln He CCCTGTTCTC CCTTCCCTCC CCCAGTTGTG GGGAATAGGA AGGAAAGGGG AAGGGAAATA 1130
CTGAGGACCA AAAAGTTCTC TGGGAGCTAA AGATAGAGCC TTTGGGGCTA TCTGACTAAT 1190
GAGAGGGAAG TGGGCAGACA AGAGGCTGGC CCCAGTCCCA AGGAACAAGA GATGGTCAAG 1250
TCGCTAGAGA CATATCAGGG GACATTAGGA TTGGGGAAGA CACTTGACTG CTAGAATCAG 1310
AGGTTGGACA CTATACATAA GGACAGGCTC ACATGGGAGG CTGGAGGTGG GTACCCAGCT 1370
GCTGTGGAAC GGGTATGGAC AGGTCATAAA CCTAGAGTCA GTGTCCTGTT GGTCCTAGCC 1430
CATTTCAGCA CCCTGCCACT TGGAGTGGAC CCCTCCTACT CTTCTTAGCG CCTACCCTCA 1490
TACCTATCTC CCTCCTCCCA TCTCCTAGGG GACTGGCGCC AAATGGTCTC TCCCTGCCAA 1550
TTTTGGTATC TTCTCTGGCC TCTCCAGTCC TGCTTACTCC TCTATTTTTA AAGTGCCAAA 1610
CAAATCCCCT TCCTCTTTCT CAAAGCACAG TAATGTGGCA CTGAGCCCTA CCCAGCACCT 1670
CAGTGAAGGG GGCCTGCTTG CTCTTTATTT TGGTCCCGGA TCCTGGGGTG GGGCAGAAAT 1730
ATTTTCTGGG CTGGGGTAGG AGGAAGGTTG TTGCAGCCAT CTACTGCTGC TGTACCCTAG 1790
GAATATGGGG ACATGGACAT GGTGTCCCAT GCCCAGATGA TAAACACTGA GCTGCCAAAA 1850
CATTTTTTTA AATACACCCG AGGAGCCCAA GGGGGAAGGG CAATGCCTAC CCCCAGCGTT 1910
ATTTTTGGGG AGGGAGGGCT GTGCATAGGG ACATATTCTT TAGAATCTAT TTTATTAACT 1970
GACCTGTTTT GGGACCTGTT ACCCAAATAA AAGATGTTTC TAGAC 2015
Información para: SEQ ID NO- 36 Longitud: 324 Tipo. PRT Organismo Homo sapiens Secuencia: 36 Met 1
Gly Pro Trp Gly Glu Pro Glu Leu Leu Val Trp Arg Pro Glu Ala Val 5 10 15
Ala Ser Glu Pro Pro Val Pro Val Gly Leu Glu Val Lys Leu Gly Ala 20 25 30 Leu Val Leu Leu Leu Val Leu Thr Leu Leu Cys Ser Leu Val Pro He 35 40 45 Cys Val Leu Arg Arg Pro Gly Ala Asn Hxs Glu Gly Ser Ala Ser Arg 50 55 60 65
Gln Lys Ala Leu Ser Leu Val Ser Cys Phe Ala Gly Gly Val Phe Leu 70 75 80
Ala Thr Cys Leu Leu Asp Leu Leu Pro Asp Tyr Leu Ala Ala He Asp 85 90 95
Glu Ala Leu Ala Ala Leu Hxs Val Thr Leu Gln Phe Pro Leu Gln Glu 100 105 110 Phe He Leu Ala Met Gly Phe Phe Leu Val Leu Val Met Glu Gln He 115 120 125 Thr Leu Ala Tyr Lys Glu Gln Ser Gly Pro Ser Pro Leu Glu Glu Thr 130 135 140 145
Arg Ala Leu Leu Gly Thr Val Asn Gly Gly Pro Gln Hxs Trp Hxs Asp 150 155 160
Gly Pro Gly Val Pro Gln Ala Ser Gly Ala Pro Ala Thr Pro Ser Ala 165 170 175
Leu Arg Ala Cys Val Leu Val Phe Ser Leu Ala Leu Hxs Ser Val Phe 180 185 190 Glu Gly Leu Ala Val Gly Leu Gln Arg Asp Arg Ala Arg Ala Met Glu 195 200 205 Leu Cys Leu Ala Leu Leu Leu His Lys Gly He Leu Ala Val Ser Leu 210 215 220 225
Ser Leu Arg Leu Leu Gln Ser Hxs Leu Arg Ala Gln Val Val Ala Gly 230 235 240
Cys Gly He Leu Phe Ser Cys Met Thr Pro Leu Gly He Gly Leu Gly 245 250 255
Ala Ala Leu Ala Glu Ser Ala Gly Pro Leu Hxs Gln Leu Ala Gln Ser 260 265 270 Val Leu Glu Gly Met Ala Ala Gly Thr Phe Leu Tyr He Thr Phe Leu 275 280 285
Glu He Leu Pro Gln Glu Leu Ala Ser Ser Glu Gln Arg He Leu Lys 290 295 300 305
Val He Leu Leu Leu Ala Gly Phe Ala Leu Leu Thr Gly Leu Leu Phe 310 315 320
He Gln He
Claims (6)
- Novedad de la Invención 1. Una proteína que comprende cualquiera de las secuencias de aminoácidos representadas por las Secuencias Nos. 1 a 9.
- 2. Un ADN que codifica para cualquiera de las proteínas de la reivindicación 1.
- 3. Un ADNc que comprende cualquiera de las secuencias de bases representadas por las Secuencias No. 10 a 18.
- 4 El ADNc de la reivindicación 3, comprendiendo cualquiera de las secuencias de bases representadas por las Secuencias Nos. 19, 21, 23, 25, 27, 29, 31, 33 y 35.
- 5. Un vector de expresión capaz de expresar el ADN de conformidad con cualquiera de las reivindicaciones 2 a 4, mediante traducción in vitro o en células eucarioticas.
- 6. Una célula eucariotica de transformación, capaz de expresar el ADN de acuerdo con cualquiera de las reivindicaciones 2 a 4, y que produce una proteína de conformidad con la reivindicación 1.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10/119395 | 1998-04-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA00010275A true MXPA00010275A (es) | 2001-07-31 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1254221A2 (en) | HUMAN PROTEINS HAVING HYDROPHOBIC DOMAINS AND DNAs ENCODING THESE PROTEINS | |
WO2000029448A2 (en) | Human proteins having hydrophobic domains and dnas encoding these proteins | |
AU2549399A (en) | Human proteins having transmembrane domains and dnas encoding these proteins | |
WO2000000506A2 (en) | Human proteins having hydrophobic domains and dnas encoding these proteins | |
EP1200582A2 (en) | Human proteins having hydrophobic domains and dnas encoding these proteins | |
WO1999018204A2 (en) | HUMAN PROTEINS HAVING SECRETORY SIGNAL SEQUENCES AND cDNAS ENCODING THESE PROTEINS | |
MXPA00010275A (es) | Proteinas humanas que tienen dominios de transmembrana y adns que codifican para estas | |
EP1021530A1 (en) | PROTEINS ALIKE TO HUMAN COMPLEMENT FACTOR H AND cDNAs ENCODING THESE PROTEINS | |
AU9283298A (en) | Human proteins having transmembrane domains and cdnas encoding these proteins | |
EP1032664A2 (en) | HUMAN PROTEINS HAVING TRANSMEMBRANE DOMAINS AND DNAs ENCODING THESE PROTEINS | |
US6500939B1 (en) | cDNAs coding for human proteins having transmembrane domains | |
CA2308120A1 (en) | Human proteins having transmembrane domains and cdnas encoding these proteins | |
US20040048339A1 (en) | Human proteins having transmembrane domains and cDNAs encoding these proteins | |
MXPA00005074A (es) | Proteinas humanas que tienen dominios de transmembrana y adns que codifican para estas proteinas | |
JP2001519154A (ja) | 膜貫通ドメインを有するヒトタンパク質及びそれをコードするdna | |
CA2327381A1 (en) | Human proteins having transmembrane domains and dnas encoding these proteins | |
MXPA00008085A (es) | Proteinas humanas que tienen dominios de transmembrana y adns que codifican para estas proteinas | |
EP1194543A2 (en) | HUMAN PROTEINS HAVING HYDROPHOBIC DOMAINS AND DNAs ENCODING THESE PROTEINS | |
MXPA00003435A (es) | Proteinas humanas que poseen dominios de transmembrana y adncs que codifican para estas proteinas | |
JP2001519155A (ja) | 分泌シグナル配列を持つヒト蛋白質およびそれをコードするcDNA | |
MXPA00003437A (es) | Adncs que codifican para proteinas humanas que tienen dominios de transmembrana | |
JP2002512797A (ja) | 膜貫通ドメインを有するヒト蛋白質及びそれをコードするdna | |
MXPA98007393A (es) | Proteina de la superfamilia tm4 del antigeno de membrana humana, y adn que codifica para dicha proteina |