MXPA02004297A - Clonacion, expresion y caracterizacion de un gen que se expresa en celulas tumorales y que esta relacionado con la regulacion de la respuesta inmunitaria. - Google Patents
Clonacion, expresion y caracterizacion de un gen que se expresa en celulas tumorales y que esta relacionado con la regulacion de la respuesta inmunitaria.Info
- Publication number
- MXPA02004297A MXPA02004297A MXPA02004297A MXPA02004297A MXPA02004297A MX PA02004297 A MXPA02004297 A MX PA02004297A MX PA02004297 A MXPA02004297 A MX PA02004297A MX PA02004297 A MXPA02004297 A MX PA02004297A MX PA02004297 A MXPA02004297 A MX PA02004297A
- Authority
- MX
- Mexico
- Prior art keywords
- thr
- ser
- gly
- sequence
- seq
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 103
- 238000010367 cloning Methods 0.000 title claims abstract description 12
- 238000012512 characterization method Methods 0.000 title claims abstract description 10
- 210000004881 tumor cell Anatomy 0.000 title claims abstract description 10
- 230000033228 biological regulation Effects 0.000 title claims abstract description 9
- 230000028993 immune response Effects 0.000 title claims abstract description 8
- 230000014509 gene expression Effects 0.000 title claims description 73
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 202
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 194
- 229920001184 polypeptide Polymers 0.000 claims abstract description 192
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 120
- 210000004027 cell Anatomy 0.000 claims abstract description 71
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 64
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 64
- 239000002299 complementary DNA Substances 0.000 claims abstract description 55
- 150000001875 compounds Chemical class 0.000 claims abstract description 52
- 239000013598 vector Substances 0.000 claims abstract description 29
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 19
- 239000000126 substance Substances 0.000 claims abstract description 16
- 201000011510 cancer Diseases 0.000 claims abstract description 9
- 208000023275 Autoimmune disease Diseases 0.000 claims abstract description 5
- 238000002405 diagnostic procedure Methods 0.000 claims abstract description 4
- 230000007170 pathology Effects 0.000 claims abstract 2
- 238000000034 method Methods 0.000 claims description 106
- 239000012634 fragment Substances 0.000 claims description 55
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 48
- 241000282414 Homo sapiens Species 0.000 claims description 44
- 108020004414 DNA Proteins 0.000 claims description 39
- 239000000523 sample Substances 0.000 claims description 33
- 230000000694 effects Effects 0.000 claims description 29
- 102000004169 proteins and genes Human genes 0.000 claims description 27
- 239000002773 nucleotide Substances 0.000 claims description 26
- 125000003729 nucleotide group Chemical group 0.000 claims description 26
- 230000035772 mutation Effects 0.000 claims description 25
- 210000001519 tissue Anatomy 0.000 claims description 25
- 230000003321 amplification Effects 0.000 claims description 21
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 21
- 241000282326 Felis catus Species 0.000 claims description 20
- 230000000295 complement effect Effects 0.000 claims description 17
- 150000001413 amino acids Chemical group 0.000 claims description 16
- 239000000047 product Substances 0.000 claims description 16
- 108010057821 leucylproline Proteins 0.000 claims description 15
- 239000012472 biological sample Substances 0.000 claims description 14
- 108010078144 glutaminyl-glycine Proteins 0.000 claims description 14
- 108010050848 glycylleucine Proteins 0.000 claims description 14
- 238000012986 modification Methods 0.000 claims description 13
- 230000004048 modification Effects 0.000 claims description 13
- 230000001575 pathological effect Effects 0.000 claims description 12
- 108010038633 aspartylglutamate Proteins 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 11
- 108010089804 glycyl-threonine Proteins 0.000 claims description 11
- 239000003999 initiator Substances 0.000 claims description 11
- 230000009897 systematic effect Effects 0.000 claims description 11
- 241000124008 Mammalia Species 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 10
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 claims description 9
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 claims description 9
- 108010081551 glycylphenylalanine Proteins 0.000 claims description 9
- 230000003993 interaction Effects 0.000 claims description 8
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 claims description 7
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 claims description 7
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 claims description 7
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 claims description 7
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 claims description 7
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 claims description 7
- 230000027455 binding Effects 0.000 claims description 7
- 238000000338 in vitro Methods 0.000 claims description 7
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 claims description 6
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 claims description 6
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 claims description 6
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 claims description 6
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 210000004072 lung Anatomy 0.000 claims description 6
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 claims description 5
- 108091034117 Oligonucleotide Proteins 0.000 claims description 5
- 108010068380 arginylarginine Proteins 0.000 claims description 5
- 230000001580 bacterial effect Effects 0.000 claims description 5
- 210000001072 colon Anatomy 0.000 claims description 5
- 229940127121 immunoconjugate Drugs 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 229940126601 medicinal product Drugs 0.000 claims description 5
- 210000000056 organ Anatomy 0.000 claims description 5
- 230000003612 virological effect Effects 0.000 claims description 5
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 claims description 4
- 230000005856 abnormality Effects 0.000 claims description 4
- 108010018006 histidylserine Proteins 0.000 claims description 4
- 230000001900 immune effect Effects 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- QUBKBPZGMZWOKQ-SZMVWBNQSA-N Arg-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QUBKBPZGMZWOKQ-SZMVWBNQSA-N 0.000 claims description 3
- 208000011231 Crohn disease Diseases 0.000 claims description 3
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 claims description 3
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 claims description 3
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 claims description 3
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 claims description 3
- 230000000692 anti-sense effect Effects 0.000 claims description 3
- 208000002458 carcinoid tumor Diseases 0.000 claims description 3
- 238000001727 in vivo Methods 0.000 claims description 3
- 108091060211 Expressed sequence tag Proteins 0.000 claims description 2
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 claims description 2
- 239000000074 antisense oligonucleotide Substances 0.000 claims description 2
- 238000012230 antisense oligonucleotides Methods 0.000 claims description 2
- 239000012620 biological material Substances 0.000 claims description 2
- 239000000463 material Substances 0.000 claims description 2
- 230000036961 partial effect Effects 0.000 claims description 2
- FMYKJLXRRQTBOR-BZSNNMDCSA-N acetylleucyl-leucyl-norleucinal Chemical compound CCCC[C@@H](C=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-BZSNNMDCSA-N 0.000 claims 4
- 238000009826 distribution Methods 0.000 claims 4
- 241001582367 Polia Species 0.000 claims 3
- 208000000474 Poliomyelitis Diseases 0.000 claims 3
- 210000003484 anatomy Anatomy 0.000 claims 3
- 238000001712 DNA sequencing Methods 0.000 claims 2
- 210000004877 mucosa Anatomy 0.000 claims 2
- 238000010606 normalization Methods 0.000 claims 2
- 230000008520 organization Effects 0.000 claims 2
- 238000002360 preparation method Methods 0.000 claims 2
- 210000002307 prostate Anatomy 0.000 claims 2
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 claims 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 claims 1
- GISFCCXBVJKGEO-QEJZJMRPSA-N Asp-Glu-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GISFCCXBVJKGEO-QEJZJMRPSA-N 0.000 claims 1
- AYKQJQVWUYEZNU-IMJSIDKUSA-N Cys-Asn Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O AYKQJQVWUYEZNU-IMJSIDKUSA-N 0.000 claims 1
- WXOFKRKAHJQKLT-BQBZGAKWSA-N Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CS WXOFKRKAHJQKLT-BQBZGAKWSA-N 0.000 claims 1
- 206010016717 Fistula Diseases 0.000 claims 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 claims 1
- MRVYVEQPNDSWLH-XPUUQOCRSA-N Gln-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O MRVYVEQPNDSWLH-XPUUQOCRSA-N 0.000 claims 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 claims 1
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 claims 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 claims 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 claims 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 claims 1
- 208000000821 Parathyroid Neoplasms Diseases 0.000 claims 1
- 206010033963 Parathyroid tumour Diseases 0.000 claims 1
- XMQSOOJRRVEHRO-ULQDDVLXSA-N Phe-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMQSOOJRRVEHRO-ULQDDVLXSA-N 0.000 claims 1
- HXNYBZQLBWIADP-WDSKDSINSA-N Pro-Cys Chemical compound OC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 HXNYBZQLBWIADP-WDSKDSINSA-N 0.000 claims 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 claims 1
- VOHWDZNIESHTFW-XKBZYTNZSA-N Thr-Glu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O VOHWDZNIESHTFW-XKBZYTNZSA-N 0.000 claims 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 claims 1
- CKHWEVXPLJBEOZ-VQVTYTSYSA-N Thr-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O CKHWEVXPLJBEOZ-VQVTYTSYSA-N 0.000 claims 1
- HWCBFXAWVTXXHZ-NYVOZVTQSA-N Trp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N HWCBFXAWVTXXHZ-NYVOZVTQSA-N 0.000 claims 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 claims 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 claims 1
- 229960000723 ampicillin Drugs 0.000 claims 1
- 230000001079 digestive effect Effects 0.000 claims 1
- 208000010643 digestive system disease Diseases 0.000 claims 1
- 239000004744 fabric Substances 0.000 claims 1
- 230000003890 fistula Effects 0.000 claims 1
- 230000002538 fungal effect Effects 0.000 claims 1
- 208000015181 infectious disease Diseases 0.000 claims 1
- 208000019423 liver disease Diseases 0.000 claims 1
- 230000000955 neuroendocrine Effects 0.000 claims 1
- 230000003071 parasitic effect Effects 0.000 claims 1
- 210000002990 parathyroid gland Anatomy 0.000 claims 1
- 108010073101 phenylalanylleucine Proteins 0.000 claims 1
- 230000005748 tumor development Effects 0.000 claims 1
- 208000017997 tumor of parathyroid gland Diseases 0.000 claims 1
- 238000010187 selection method Methods 0.000 abstract 1
- 241001122767 Theaceae Species 0.000 description 60
- 108020004999 messenger RNA Proteins 0.000 description 25
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 21
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 20
- 108010060199 cysteinylproline Proteins 0.000 description 20
- 239000012528 membrane Substances 0.000 description 20
- 238000003752 polymerase chain reaction Methods 0.000 description 20
- 108010029020 prolylglycine Proteins 0.000 description 18
- ZLFRUAFDAIFNHN-LKXGYXEUSA-N Cys-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)O ZLFRUAFDAIFNHN-LKXGYXEUSA-N 0.000 description 17
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 17
- 108010092114 histidylphenylalanine Proteins 0.000 description 17
- 238000009396 hybridization Methods 0.000 description 17
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 16
- 241000880493 Leptailurus serval Species 0.000 description 16
- 108010064235 lysylglycine Proteins 0.000 description 16
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 15
- 125000003275 alpha amino acid group Chemical group 0.000 description 15
- MFEVVAXTBZELLL-GGVZMXCHSA-N Tyr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-GGVZMXCHSA-N 0.000 description 14
- 108010092854 aspartyllysine Proteins 0.000 description 14
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 13
- 210000005087 mononuclear cell Anatomy 0.000 description 13
- 108010053725 prolylvaline Proteins 0.000 description 13
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 12
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 12
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 12
- DZQKLNLLWFQONU-LKXGYXEUSA-N Asp-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O DZQKLNLLWFQONU-LKXGYXEUSA-N 0.000 description 12
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 12
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 12
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 12
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 12
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 12
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 11
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 11
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 11
- 108010065920 Insulin Lispro Proteins 0.000 description 11
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 11
- 108010065395 Neuropep-1 Proteins 0.000 description 11
- 230000001105 regulatory effect Effects 0.000 description 11
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 11
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 10
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 10
- TULNGKSILXCZQT-IMJSIDKUSA-N Cys-Asp Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O TULNGKSILXCZQT-IMJSIDKUSA-N 0.000 description 10
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 10
- 241001465754 Metazoa Species 0.000 description 10
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 10
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 10
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 10
- VTCKHZJKWQENKX-KBPBESRZSA-N Tyr-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O VTCKHZJKWQENKX-KBPBESRZSA-N 0.000 description 10
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 10
- 108010047857 aspartylglycine Proteins 0.000 description 10
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 10
- 108091033319 polynucleotide Proteins 0.000 description 10
- 102000040430 polynucleotide Human genes 0.000 description 10
- 239000002157 polynucleotide Substances 0.000 description 10
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 9
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 9
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 9
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 9
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 9
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 9
- 108010066427 N-valyltryptophan Proteins 0.000 description 9
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 9
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 9
- RCOUFINCYASMDN-GUBZILKMSA-N Ser-Val-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O RCOUFINCYASMDN-GUBZILKMSA-N 0.000 description 9
- 210000001744 T-lymphocyte Anatomy 0.000 description 9
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 9
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 9
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 9
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 8
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 8
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 8
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 8
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 8
- PORWNQWEEIOIRH-XHNCKOQMSA-N Cys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)C(=O)O PORWNQWEEIOIRH-XHNCKOQMSA-N 0.000 description 8
- LKHMGNHQULEPFY-ACZMJKKPSA-N Cys-Ser-Glu Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O LKHMGNHQULEPFY-ACZMJKKPSA-N 0.000 description 8
- IWVNIQXKTIQXCT-SRVKXCTJSA-N Cys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O IWVNIQXKTIQXCT-SRVKXCTJSA-N 0.000 description 8
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 8
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 8
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 8
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 8
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 8
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 8
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 8
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 8
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 8
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 8
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 8
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 8
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 8
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 8
- 108010068265 aspartyltyrosine Proteins 0.000 description 8
- 108010091871 leucylmethionine Proteins 0.000 description 8
- 210000001616 monocyte Anatomy 0.000 description 8
- 230000002285 radioactive effect Effects 0.000 description 8
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 7
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 7
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 7
- JSQIXEHORHLQEE-MEYUZBJRSA-N His-Phe-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JSQIXEHORHLQEE-MEYUZBJRSA-N 0.000 description 7
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 7
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 7
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 7
- OKQQWSNUSQURLI-JYJNAYRXSA-N Phe-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N OKQQWSNUSQURLI-JYJNAYRXSA-N 0.000 description 7
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 7
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 7
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 7
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 7
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 7
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 7
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 7
- BQASAMYRHNCKQE-IHRRRGAJSA-N Tyr-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BQASAMYRHNCKQE-IHRRRGAJSA-N 0.000 description 7
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 7
- DCOOGDCRFXXQNW-ZKWXMUAHSA-N Val-Asn-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DCOOGDCRFXXQNW-ZKWXMUAHSA-N 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- YWENWUYXQUWRHQ-LPEHRKFASA-N Arg-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O YWENWUYXQUWRHQ-LPEHRKFASA-N 0.000 description 6
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 6
- ZPWMEWYQBWSGAO-ZJDVBMNYSA-N Arg-Thr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZPWMEWYQBWSGAO-ZJDVBMNYSA-N 0.000 description 6
- BXLDDWZOTGGNOJ-SZMVWBNQSA-N Arg-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N BXLDDWZOTGGNOJ-SZMVWBNQSA-N 0.000 description 6
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 6
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 6
- KOWYNSKRPUWSFG-IHPCNDPISA-N Asp-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)O)N KOWYNSKRPUWSFG-IHPCNDPISA-N 0.000 description 6
- BNCKELUXXUYRNY-GUBZILKMSA-N Cys-Lys-Glu Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BNCKELUXXUYRNY-GUBZILKMSA-N 0.000 description 6
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 6
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 6
- FJAYYNIXQNERSO-ACZMJKKPSA-N Gln-Cys-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FJAYYNIXQNERSO-ACZMJKKPSA-N 0.000 description 6
- MFHVAWMMKZBSRQ-ACZMJKKPSA-N Gln-Ser-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N MFHVAWMMKZBSRQ-ACZMJKKPSA-N 0.000 description 6
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 6
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 6
- VJVAQZYGLMJPTK-QEJZJMRPSA-N Glu-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VJVAQZYGLMJPTK-QEJZJMRPSA-N 0.000 description 6
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 6
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 6
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 6
- NELVFWFDOKRTOR-SDDRHHMPSA-N His-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O NELVFWFDOKRTOR-SDDRHHMPSA-N 0.000 description 6
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 6
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 6
- SEOXPEFQEOYURL-PMVMPFDFSA-N Leu-Tyr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SEOXPEFQEOYURL-PMVMPFDFSA-N 0.000 description 6
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 6
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 6
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 6
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 6
- 241000699670 Mus sp. Species 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 6
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 6
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 6
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 6
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 6
- ZHYMUFQVKGJNRM-ZLUOBGJFSA-N Ser-Cys-Asn Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(N)=O ZHYMUFQVKGJNRM-ZLUOBGJFSA-N 0.000 description 6
- COLJZWUVZIXSSS-CIUDSAMLSA-N Ser-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N COLJZWUVZIXSSS-CIUDSAMLSA-N 0.000 description 6
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 6
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 6
- DVWAIHZOPSYMSJ-ZVZYQTTQSA-N Trp-Glu-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 DVWAIHZOPSYMSJ-ZVZYQTTQSA-N 0.000 description 6
- DYIXEGROAOVQPK-VFAJRCTISA-N Trp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DYIXEGROAOVQPK-VFAJRCTISA-N 0.000 description 6
- ZSXJENBJGRHKIG-UWVGGRQHSA-N Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UWVGGRQHSA-N 0.000 description 6
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 6
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 6
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 6
- 108010093581 aspartyl-proline Proteins 0.000 description 6
- 230000001086 cytosolic effect Effects 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000003446 ligand Substances 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 108010079317 prolyl-tyrosine Proteins 0.000 description 6
- 229940083575 sodium dodecyl sulfate Drugs 0.000 description 6
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 230000009261 transgenic effect Effects 0.000 description 6
- 108010080629 tryptophan-leucine Proteins 0.000 description 6
- 108010051110 tyrosyl-lysine Proteins 0.000 description 6
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 5
- FOQFHANLUJDQEE-GUBZILKMSA-N Arg-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CS)C(=O)O FOQFHANLUJDQEE-GUBZILKMSA-N 0.000 description 5
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 5
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 5
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 5
- BIVYLQMZPHDUIH-WHFBIAKZSA-N Asp-Gly-Cys Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)C(=O)O BIVYLQMZPHDUIH-WHFBIAKZSA-N 0.000 description 5
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 5
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 5
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 5
- SBMGKDLRJLYZCU-BIIVOSGPSA-N Cys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N)C(=O)O SBMGKDLRJLYZCU-BIIVOSGPSA-N 0.000 description 5
- WAJDEKCJRKGRPG-CIUDSAMLSA-N Cys-His-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N WAJDEKCJRKGRPG-CIUDSAMLSA-N 0.000 description 5
- MXZYQNJCBVJHSR-KATARQTJSA-N Cys-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O MXZYQNJCBVJHSR-KATARQTJSA-N 0.000 description 5
- JUNZLDGUJZIUCO-IHRRRGAJSA-N Cys-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O JUNZLDGUJZIUCO-IHRRRGAJSA-N 0.000 description 5
- ABLQPNMKLMFDQU-BIIVOSGPSA-N Cys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CS)N)C(=O)O ABLQPNMKLMFDQU-BIIVOSGPSA-N 0.000 description 5
- KVBPDJIFRQUQFY-ACZMJKKPSA-N Glu-Cys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O KVBPDJIFRQUQFY-ACZMJKKPSA-N 0.000 description 5
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 5
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 5
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 5
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 5
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 5
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 5
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 5
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 5
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 5
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 5
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 5
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 5
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 5
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 5
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 5
- ANCPZNHGZUCSSC-ULQDDVLXSA-N Met-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 ANCPZNHGZUCSSC-ULQDDVLXSA-N 0.000 description 5
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 5
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 5
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 5
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 5
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 5
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 5
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 5
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 5
- PZHJLTWGMYERRJ-SRVKXCTJSA-N Ser-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O PZHJLTWGMYERRJ-SRVKXCTJSA-N 0.000 description 5
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 5
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 5
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 5
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 5
- OKAMOYTUQMIFJO-JBACZVJFSA-N Trp-Glu-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 OKAMOYTUQMIFJO-JBACZVJFSA-N 0.000 description 5
- WXEQUSQNDDJEDZ-NYVOZVTQSA-N Trp-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WXEQUSQNDDJEDZ-NYVOZVTQSA-N 0.000 description 5
- ZMKDQRJLMRZHRI-ACRUOGEOSA-N Tyr-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N ZMKDQRJLMRZHRI-ACRUOGEOSA-N 0.000 description 5
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 5
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 5
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 5
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 5
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 5
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 239000003112 inhibitor Substances 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 210000000952 spleen Anatomy 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 4
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 4
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 4
- CUQUEHYSSFETRD-ACZMJKKPSA-N Asn-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N CUQUEHYSSFETRD-ACZMJKKPSA-N 0.000 description 4
- RATOMFTUDRYMKX-ACZMJKKPSA-N Asp-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RATOMFTUDRYMKX-ACZMJKKPSA-N 0.000 description 4
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 4
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 4
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 4
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 4
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 4
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 4
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 4
- FOEHRHOBWFQSNW-KATARQTJSA-N Leu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N)O FOEHRHOBWFQSNW-KATARQTJSA-N 0.000 description 4
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 4
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 4
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 4
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 4
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 4
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 4
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 4
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 4
- OLTFZQIYCNOBLI-DCAQKATOSA-N Pro-Cys-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O OLTFZQIYCNOBLI-DCAQKATOSA-N 0.000 description 4
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 4
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 4
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 4
- KMWFXJCGRXBQAC-CIUDSAMLSA-N Ser-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N KMWFXJCGRXBQAC-CIUDSAMLSA-N 0.000 description 4
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 4
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 4
- LPSKHZWBQONOQJ-XIRDDKMYSA-N Ser-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N LPSKHZWBQONOQJ-XIRDDKMYSA-N 0.000 description 4
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 4
- APIQKJYZDWVOCE-VEVYYDQMSA-N Thr-Asp-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O APIQKJYZDWVOCE-VEVYYDQMSA-N 0.000 description 4
- UTCFSBBXPWKLTG-XKBZYTNZSA-N Thr-Cys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O UTCFSBBXPWKLTG-XKBZYTNZSA-N 0.000 description 4
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 4
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 4
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 4
- NBIIPOKZPUGATB-BWBBJGPYSA-N Thr-Ser-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O NBIIPOKZPUGATB-BWBBJGPYSA-N 0.000 description 4
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 4
- WCRFXRIWBFRZBR-GGVZMXCHSA-N Thr-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WCRFXRIWBFRZBR-GGVZMXCHSA-N 0.000 description 4
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 4
- VUVVMFSDLYKHPA-PMVMPFDFSA-N Tyr-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC3=CC=C(C=C3)O)N VUVVMFSDLYKHPA-PMVMPFDFSA-N 0.000 description 4
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 4
- QFXVAFIHVWXXBJ-AVGNSLFASA-N Tyr-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O QFXVAFIHVWXXBJ-AVGNSLFASA-N 0.000 description 4
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 4
- VSYROIRKNBCULO-BWAGICSOSA-N Tyr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O VSYROIRKNBCULO-BWAGICSOSA-N 0.000 description 4
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 4
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 4
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 4
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 4
- 210000003719 b-lymphocyte Anatomy 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 210000004443 dendritic cell Anatomy 0.000 description 4
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 4
- 239000006174 pH buffer Substances 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 210000000813 small intestine Anatomy 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 108010003137 tyrosyltyrosine Proteins 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 241000844498 Agatea Species 0.000 description 3
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 3
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 3
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 3
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 3
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 3
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 3
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 3
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 3
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 3
- SMZCLQGDQMGESY-ACZMJKKPSA-N Asp-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N SMZCLQGDQMGESY-ACZMJKKPSA-N 0.000 description 3
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 3
- LKVKODXGSAFOFY-VEVYYDQMSA-N Asp-Met-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LKVKODXGSAFOFY-VEVYYDQMSA-N 0.000 description 3
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 3
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 3
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 3
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 3
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 3
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- NDUSUIGBMZCOIL-ZKWXMUAHSA-N Cys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N NDUSUIGBMZCOIL-ZKWXMUAHSA-N 0.000 description 3
- BIVLWXQGXJLGKG-BIIVOSGPSA-N Cys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)C(=O)O BIVLWXQGXJLGKG-BIIVOSGPSA-N 0.000 description 3
- KABHAOSDMIYXTR-GUBZILKMSA-N Cys-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N KABHAOSDMIYXTR-GUBZILKMSA-N 0.000 description 3
- VTJLJQGUMBWHBP-GUBZILKMSA-N Cys-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N VTJLJQGUMBWHBP-GUBZILKMSA-N 0.000 description 3
- YXQDRIRSAHTJKM-IMJSIDKUSA-N Cys-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YXQDRIRSAHTJKM-IMJSIDKUSA-N 0.000 description 3
- RJPKQCFHEPPTGL-ZLUOBGJFSA-N Cys-Ser-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RJPKQCFHEPPTGL-ZLUOBGJFSA-N 0.000 description 3
- YWEHYKGJWHPGPY-XGEHTFHBSA-N Cys-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N)O YWEHYKGJWHPGPY-XGEHTFHBSA-N 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 3
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 3
- PIUPHASDUFSHTF-CIUDSAMLSA-N Gln-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O PIUPHASDUFSHTF-CIUDSAMLSA-N 0.000 description 3
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 3
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 3
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 3
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 3
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 3
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 3
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 3
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 3
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 3
- DJTXYXZNNDDEOU-WHFBIAKZSA-N Gly-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)C(=O)N DJTXYXZNNDDEOU-WHFBIAKZSA-N 0.000 description 3
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 3
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 3
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 3
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 3
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 3
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 3
- NIOPEYHPOBWLQO-KBPBESRZSA-N Gly-Trp-Glu Chemical compound NCC(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOPEYHPOBWLQO-KBPBESRZSA-N 0.000 description 3
- NGBGZCUWFVVJKC-IRXDYDNUSA-N Gly-Tyr-Tyr Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NGBGZCUWFVVJKC-IRXDYDNUSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 3
- JGFWUKYIQAEYAH-DCAQKATOSA-N His-Ser-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JGFWUKYIQAEYAH-DCAQKATOSA-N 0.000 description 3
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 3
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 3
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 3
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 3
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 3
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 3
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- WGAZVKFCPHXZLO-SZMVWBNQSA-N Leu-Trp-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N WGAZVKFCPHXZLO-SZMVWBNQSA-N 0.000 description 3
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 3
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 3
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 3
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 3
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 3
- RVKIPWVMZANZLI-ZFWWWQNUSA-N Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-ZFWWWQNUSA-N 0.000 description 3
- ZFNYWKHYUMEZDZ-WDSOQIARSA-N Lys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCCN)N ZFNYWKHYUMEZDZ-WDSOQIARSA-N 0.000 description 3
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 3
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 3
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 3
- FKKHDBFNOLCYQM-FXQIFTODSA-N Pro-Cys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O FKKHDBFNOLCYQM-FXQIFTODSA-N 0.000 description 3
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 3
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 3
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 3
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 3
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 3
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 3
- CTRHXXXHUJTTRZ-ZLUOBGJFSA-N Ser-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O CTRHXXXHUJTTRZ-ZLUOBGJFSA-N 0.000 description 3
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 3
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 3
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 3
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 3
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 3
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 3
- HYNAKPYFEYJMAS-XIRDDKMYSA-N Trp-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HYNAKPYFEYJMAS-XIRDDKMYSA-N 0.000 description 3
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 3
- WPRVVBVWIUWLOH-UFYCRDLUSA-N Tyr-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPRVVBVWIUWLOH-UFYCRDLUSA-N 0.000 description 3
- JAQGKXUEKGKTKX-HOTGVXAUSA-N Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 3
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 3
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 3
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 3
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 3
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 3
- HVRRJRMULCPNRO-BZSNNMDCSA-N Val-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 HVRRJRMULCPNRO-BZSNNMDCSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 239000000556 agonist Substances 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 239000005557 antagonist Substances 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 210000002257 embryonic structure Anatomy 0.000 description 3
- 210000003743 erythrocyte Anatomy 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 210000000822 natural killer cell Anatomy 0.000 description 3
- 238000010647 peptide synthesis reaction Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 239000013049 sediment Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 210000001541 thymus gland Anatomy 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 2
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- 101001035365 Arabidopsis thaliana Histone H2B.9 Proteins 0.000 description 2
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 2
- LUVODTFFSXVOAG-ACZMJKKPSA-N Asn-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N LUVODTFFSXVOAG-ACZMJKKPSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 2
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 2
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 2
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 2
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 2
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 2
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 2
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 2
- HSPSXROIMXIJQW-BQBZGAKWSA-N Asp-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 HSPSXROIMXIJQW-BQBZGAKWSA-N 0.000 description 2
- NTQDELBZOMWXRS-IWGUZYHVSA-N Asp-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O NTQDELBZOMWXRS-IWGUZYHVSA-N 0.000 description 2
- 108010052382 CD83 antigen Proteins 0.000 description 2
- 102100035793 CD83 antigen Human genes 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- BSFFNUBDVYTDMV-WHFBIAKZSA-N Cys-Gly-Asn Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BSFFNUBDVYTDMV-WHFBIAKZSA-N 0.000 description 2
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 2
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 2
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 2
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 2
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 2
- KHNJVFYHIKLUPD-SRVKXCTJSA-N Gln-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHNJVFYHIKLUPD-SRVKXCTJSA-N 0.000 description 2
- HNAUFGBKJLTWQE-IFFSRLJSSA-N Gln-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N)O HNAUFGBKJLTWQE-IFFSRLJSSA-N 0.000 description 2
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 2
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 2
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 2
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 2
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 2
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 2
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 2
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 2
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- WYWBYSPRCFADBM-GARJFASQSA-N His-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O WYWBYSPRCFADBM-GARJFASQSA-N 0.000 description 2
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 2
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 2
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 2
- 101000581981 Homo sapiens Neural cell adhesion molecule 1 Proteins 0.000 description 2
- 101001074035 Homo sapiens Zinc finger protein GLI2 Proteins 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 2
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 2
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 2
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 2
- JCVOHUKUYSYBAD-DCAQKATOSA-N Lys-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCCN)N)C(=O)N[C@@H](CS)C(=O)O JCVOHUKUYSYBAD-DCAQKATOSA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- OPJRECCCQSDDCZ-TUSQITKMSA-N Lys-Trp-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OPJRECCCQSDDCZ-TUSQITKMSA-N 0.000 description 2
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 2
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 102100027347 Neural cell adhesion molecule 1 Human genes 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 2
- MYQCCQSMKNCNKY-KKUMJFAQSA-N Phe-His-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O)N MYQCCQSMKNCNKY-KKUMJFAQSA-N 0.000 description 2
- HQPWNHXERZCIHP-PMVMPFDFSA-N Phe-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 HQPWNHXERZCIHP-PMVMPFDFSA-N 0.000 description 2
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 2
- YVXPUUOTMVBKDO-IHRRRGAJSA-N Phe-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CS)C(=O)O YVXPUUOTMVBKDO-IHRRRGAJSA-N 0.000 description 2
- VFDRDMOMHBJGKD-UFYCRDLUSA-N Phe-Tyr-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N VFDRDMOMHBJGKD-UFYCRDLUSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- QVIZLAUEAMQKGS-GUBZILKMSA-N Pro-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 QVIZLAUEAMQKGS-GUBZILKMSA-N 0.000 description 2
- LUGOKRWYNMDGTD-FXQIFTODSA-N Pro-Cys-Asn Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O LUGOKRWYNMDGTD-FXQIFTODSA-N 0.000 description 2
- SZZBUDVXWZZPDH-BQBZGAKWSA-N Pro-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 SZZBUDVXWZZPDH-BQBZGAKWSA-N 0.000 description 2
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 2
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 2
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 2
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 2
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 2
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 2
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 2
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 2
- SGZVZUCRAVSPKQ-FXQIFTODSA-N Ser-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N SGZVZUCRAVSPKQ-FXQIFTODSA-N 0.000 description 2
- LSHUNRICNSEEAN-BPUTZDHNSA-N Ser-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N LSHUNRICNSEEAN-BPUTZDHNSA-N 0.000 description 2
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 2
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 2
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 2
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 2
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 2
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 2
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 2
- HEJJDUDEHLPDAW-CUJWVEQBSA-N Thr-His-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N)O HEJJDUDEHLPDAW-CUJWVEQBSA-N 0.000 description 2
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 2
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 2
- BXKWZPXTTSCOMX-AQZXSJQPSA-N Trp-Asn-Thr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXKWZPXTTSCOMX-AQZXSJQPSA-N 0.000 description 2
- YTYHAYZPOARHAP-HOCLYGCPSA-N Trp-Lys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N YTYHAYZPOARHAP-HOCLYGCPSA-N 0.000 description 2
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 2
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- AKRHKDCELJLTMD-BVSLBCMMSA-N Tyr-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N AKRHKDCELJLTMD-BVSLBCMMSA-N 0.000 description 2
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 2
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 2
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 2
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 2
- 102100035558 Zinc finger protein GLI2 Human genes 0.000 description 2
- FKNHDDTXBWMZIR-GEMLJDPKSA-N acetic acid;(2s)-1-[(2r)-2-amino-3-sulfanylpropanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(O)=O.SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O FKNHDDTXBWMZIR-GEMLJDPKSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 108010054813 diprotin B Proteins 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 210000000688 human artificial chromosome Anatomy 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000003563 lymphoid tissue Anatomy 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000002741 palatine tonsil Anatomy 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 235000020183 skimmed milk Nutrition 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 238000010396 two-hybrid screening Methods 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- BHNQPLPANNDEGL-UHFFFAOYSA-N 2-(4-octylphenoxy)ethanol Chemical compound CCCCCCCCC1=CC=C(OCCO)C=C1 BHNQPLPANNDEGL-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 1
- 208000003200 Adenoma Diseases 0.000 description 1
- 206010001233 Adenoma benign Diseases 0.000 description 1
- JYEBJTDTPNKQJG-FXQIFTODSA-N Ala-Asn-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N JYEBJTDTPNKQJG-FXQIFTODSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- MJKBOVWWADWLHV-ZLUOBGJFSA-N Asp-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)O MJKBOVWWADWLHV-ZLUOBGJFSA-N 0.000 description 1
- FIAKNCXQFFKSSI-ZLUOBGJFSA-N Asp-Ser-Cys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O FIAKNCXQFFKSSI-ZLUOBGJFSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 208000011691 Burkitt lymphomas Diseases 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- HAYVTMHUNMMXCV-IMJSIDKUSA-N Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CS HAYVTMHUNMMXCV-IMJSIDKUSA-N 0.000 description 1
- SFUUYRSAJPWTGO-SRVKXCTJSA-N Cys-Asn-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SFUUYRSAJPWTGO-SRVKXCTJSA-N 0.000 description 1
- VNLYIYOYUNGURO-ZLUOBGJFSA-N Cys-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N VNLYIYOYUNGURO-ZLUOBGJFSA-N 0.000 description 1
- VZKXOWRNJDEGLZ-WHFBIAKZSA-N Cys-Asp-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O VZKXOWRNJDEGLZ-WHFBIAKZSA-N 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- XMVZMBGFIOQONW-GARJFASQSA-N Cys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)C(=O)O XMVZMBGFIOQONW-GARJFASQSA-N 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- HPZAJRPYUIHDIN-BZSNNMDCSA-N Cys-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N HPZAJRPYUIHDIN-BZSNNMDCSA-N 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- OPINTGHFESTVAX-BQBZGAKWSA-N Gln-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N OPINTGHFESTVAX-BQBZGAKWSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- NJMYZEJORPYOTO-BQBZGAKWSA-N Gln-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O NJMYZEJORPYOTO-BQBZGAKWSA-N 0.000 description 1
- WBYHRQBKJGEBQJ-CIUDSAMLSA-N Gln-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CS)C(=O)O WBYHRQBKJGEBQJ-CIUDSAMLSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- UENPHLAAKDPZQY-XKBZYTNZSA-N Glu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O UENPHLAAKDPZQY-XKBZYTNZSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- RXESHTOTINOODU-JYJNAYRXSA-N Glu-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RXESHTOTINOODU-JYJNAYRXSA-N 0.000 description 1
- QVXWAFZDWRLXTI-NWLDYVSISA-N Glu-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QVXWAFZDWRLXTI-NWLDYVSISA-N 0.000 description 1
- XOEKMEAOMXMURD-JYJNAYRXSA-N Glu-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O XOEKMEAOMXMURD-JYJNAYRXSA-N 0.000 description 1
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 1
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- FOKISINOENBSDM-WLTAIBSBSA-N Gly-Thr-Tyr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FOKISINOENBSDM-WLTAIBSBSA-N 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- NJZGEXYLSFGPHG-GUBZILKMSA-N His-Gln-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N NJZGEXYLSFGPHG-GUBZILKMSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WKEABZIITNXXQZ-CIUDSAMLSA-N His-Ser-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N WKEABZIITNXXQZ-CIUDSAMLSA-N 0.000 description 1
- DGLAHESNTJWGDO-SRVKXCTJSA-N His-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DGLAHESNTJWGDO-SRVKXCTJSA-N 0.000 description 1
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 1
- 101000946856 Homo sapiens CD83 antigen Proteins 0.000 description 1
- 101000746373 Homo sapiens Granulocyte-macrophage colony-stimulating factor Proteins 0.000 description 1
- 101001010591 Homo sapiens Interleukin-20 Proteins 0.000 description 1
- 101001002709 Homo sapiens Interleukin-4 Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101000980827 Homo sapiens T-cell surface glycoprotein CD1a Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- 241001484259 Lacuna Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 1
- BQVUABVGYYSDCJ-ZFWWWQNUSA-N Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-ZFWWWQNUSA-N 0.000 description 1
- 206010024305 Leukaemia monocytic Diseases 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 1
- NAOVYENZCWFBDG-BZSNNMDCSA-N Phe-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 NAOVYENZCWFBDG-BZSNNMDCSA-N 0.000 description 1
- PYOHODCEOHCZBM-RYUDHWBXSA-N Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 PYOHODCEOHCZBM-RYUDHWBXSA-N 0.000 description 1
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- ABEFOXGAIIJDCL-SFJXLCSZSA-N Phe-Thr-Trp Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 ABEFOXGAIIJDCL-SFJXLCSZSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108010004729 Phycoerythrin Proteins 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- ALJGSKMBIUEJOB-FXQIFTODSA-N Pro-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 ALJGSKMBIUEJOB-FXQIFTODSA-N 0.000 description 1
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 1
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 1
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 108010066717 Q beta Replicase Proteins 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 1
- SWIQQMYVHIXPEK-FXQIFTODSA-N Ser-Cys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O SWIQQMYVHIXPEK-FXQIFTODSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- HJAXVYLCKDPPDF-SRVKXCTJSA-N Ser-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N HJAXVYLCKDPPDF-SRVKXCTJSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 1
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 102100024219 T-cell surface glycoprotein CD1a Human genes 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- YRNBANYVJJBGDI-VZFHVOOUSA-N Thr-Ala-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O)N)O YRNBANYVJJBGDI-VZFHVOOUSA-N 0.000 description 1
- DGDCHPCRMWEOJR-FQPOAREZSA-N Thr-Ala-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DGDCHPCRMWEOJR-FQPOAREZSA-N 0.000 description 1
- JMQUAZXYFAEOIH-XGEHTFHBSA-N Thr-Arg-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O JMQUAZXYFAEOIH-XGEHTFHBSA-N 0.000 description 1
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 1
- UZJDBCHMIQXLOQ-HEIBUPTGSA-N Thr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O UZJDBCHMIQXLOQ-HEIBUPTGSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- ODXKUIGEPAGKKV-KATARQTJSA-N Thr-Leu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O ODXKUIGEPAGKKV-KATARQTJSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- GYUUYCIXELGTJS-MEYUZBJRSA-N Thr-Phe-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O GYUUYCIXELGTJS-MEYUZBJRSA-N 0.000 description 1
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 1
- PALLCTDPFINNMM-JQHSSLGASA-N Trp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N PALLCTDPFINNMM-JQHSSLGASA-N 0.000 description 1
- DXYWRYQRKPIGGU-BPNCWPANSA-N Tyr-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DXYWRYQRKPIGGU-BPNCWPANSA-N 0.000 description 1
- KLGFILUOTCBNLJ-IHRRRGAJSA-N Tyr-Cys-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O KLGFILUOTCBNLJ-IHRRRGAJSA-N 0.000 description 1
- NJLQMKZSXYQRTO-FHWLQOOXSA-N Tyr-Glu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NJLQMKZSXYQRTO-FHWLQOOXSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 1
- PLXQRTXVLZUNMU-RNXOBYDBSA-N Tyr-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC4=CC=C(C=C4)O)N PLXQRTXVLZUNMU-RNXOBYDBSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- VXCAZHCVDBQMTP-NRPADANISA-N Val-Cys-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VXCAZHCVDBQMTP-NRPADANISA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 239000003125 aqueous solvent Substances 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 238000000376 autoradiography Methods 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000005082 bioluminescent agent Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 201000001531 bladder carcinoma Diseases 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 201000008275 breast carcinoma Diseases 0.000 description 1
- RDHPKYGYEGBMSE-UHFFFAOYSA-N bromoethane Chemical compound CCBr RDHPKYGYEGBMSE-UHFFFAOYSA-N 0.000 description 1
- 238000001386 capillary affinity electrophoresis Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000005081 chemiluminescent agent Substances 0.000 description 1
- 230000009137 competitive binding Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000004163 cytometry Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229940041984 dextran 1 Drugs 0.000 description 1
- 229960000633 dextran sulfate Drugs 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 208000023965 endometrium neoplasm Diseases 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- -1 haptens Substances 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 102000046699 human CD14 Human genes 0.000 description 1
- 102000046157 human CSF2 Human genes 0.000 description 1
- 102000055229 human IL4 Human genes 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 201000005264 laryngeal carcinoma Diseases 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 239000000891 luminescent agent Substances 0.000 description 1
- 201000005249 lung adenocarcinoma Diseases 0.000 description 1
- 201000005296 lung carcinoma Diseases 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000001690 micro-dialysis Methods 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 201000006894 monocytic leukemia Diseases 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000010397 one-hybrid screening Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000000849 parathyroid Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 210000004976 peripheral blood cell Anatomy 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 102000013415 peroxidase activity proteins Human genes 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 239000005080 phosphorescent agent Substances 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 208000023958 prostate neoplasm Diseases 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000003751 purification from natural source Methods 0.000 description 1
- 239000005086 radioluminescent agent Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 208000010570 urinary bladder carcinoma Diseases 0.000 description 1
- YSGSDAIMSCVPHG-UHFFFAOYSA-N valyl-methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)C(C)C YSGSDAIMSCVPHG-UHFFFAOYSA-N 0.000 description 1
- 230000006490 viral transcription Effects 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/10—Antimycotics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P33/00—Antiparasitic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Communicable Diseases (AREA)
- Immunology (AREA)
- Oncology (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Virology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Zoology (AREA)
- Toxicology (AREA)
- Cell Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Tropical Medicine & Parasitology (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
La invencion se relaciona con la identificacion y caracterizacion de un gen novedoso que se expresa en celulas tumorales y que esta relacionado con la regulacion de la respuesta inmunitaria,. la clonacion y la caracterizacion de su ADNc y los polipeptidos correspondientes. La invencion tambien se relaciona con vectores que contienen un acido nucleico que codifica para tal gen,. celulas transformadas por los vectores y metodos de diagnostico y metodos de seleccion de un compuesto quimico o biologico capaz de interactuar, directa o in' directamente, con un acido nucleico o un polipeptido de la invencion. La invencion se relaciona ademas con compuestos para tratar patologias inmunitarias, en particular enfermedades autoinmunes y cancer.
Description
CLONACIÓN. EXPRESIÓN Y CARACTERIZACIÓN DE UN GEN QUE SE
EXPRESA EN CÉLULAS TUMORALES Y QUE ESTA RELACIONADO CON
LA REGULACIÓN DE LA RESPUESTA INMUNITARIA
DESCRIPCIÓN DE LA INVENCIÓN
La invención se relaciona con la identificación y caracterización de un gen novedoso que se expresa en células tumorales y que está relacionado con la regulación de la respuesta inmunitaria,. la clonación y la caracterización de su ADNc y los polipéptidos correspondientes. La invención también se relaciona con vectores que contienen un ácido nucleico que codifica para tal gen, células transformadas con los vectores y métodos de diagnóstico y métodos de selección de un compuesto químico o bioquímico capaz de interactuar, directa o indirectamente, con un ácido nucleico o un polipéptido de acuerdo con la ¡nvención. La invención también se relaciona con compuestos para tratar condiciones patológicos inmunitarias, en particular enfermedades autoinmunes y cáncer. Muchos mecanismos celulares, normales y patológicos, involucran expresión diferencial de genes, y algunos genes se expresan en tejidos específicos en momentos determinados o con resistencia particular. Entre estos genes, aquellos que codifican proteínas que se encuentran en compartimientos subcelulares o que se secretan fuera de la célula durante o después del procedimiento de traducción, son de gran valor.
Se puede hacer mención, en particular, de los genes que codifican para proteínas denominadas factores, tales como citocinas o genes que codifican para receptores unidos a membrana los cuales constituyen objetivos terapéuticos de elección. La mayor parte de estas proteínas, tales como las proteínas unidas a membrana tienen un dominio N terminal que corresponde a un péptido señal, un dominio extracelular y un dominio transmembranal. Por lo tanto, actualmente permanece una gran necesidad por identificar y caracterizar tales genes, cuya expresión es específica para ciertos tejidos o células, en particular para células involucradas en la regulación de la respuesta inmunitaria o células tumorales. Este es precisamente el objetivo de la presente invención. Un objetivo de la ¡nvención por lo tanto es la identificación y caracterización de un gen novedoso que se expresa preferencialmente en humanos en los tejidos linfoides, en particular en linfocitos T periféricos no estimulados y en células tumorales, el producto de traducción de cuyo gene es el tipo unido a membrana. En un primer aspecto, el objetivo de la presente ¡nvención es un ácido nucleico purificado o aislado, caracterizado porque comprende una secuencia de ácido nucleico que se elige del grupo de las siguientes secuencias: a) la secuencia SEC ID NO. 1 ; b) la secuencia de un fragmento de por lo menos 18 nucleótidos consecutivos, preferiblemente 20, 25, 30, 50, 100 ó 200 nucleótidos consecutivos, de la secuencia SEC ID NO.: 1 suprimida de su fragmento poliA terminal, preferiblemente del fragmento de la secuencia SEC ID No. 3, SEC ID
NO.: 5, SEC ID NO.: 7 o SEC ID NO.: 9; c) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, de manera preferible 90%, 95% o 99%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); d) la secuencia complementaria, o la secuencia del ARN que corresponde a una secuencia como se define en los incisos a), b) o c). Preferiblemente, la presente invención se relaciona con un ácido nucleico purificado o aislado, caracterizado porque comprende una secuencia de ácido nucleico que se elige del grupo de las siguientes secuencias: a) la secuencia SEC ID NO.: 1 ; b) la secuencia de un fragmento de por lo menos 18 nucleótidos consecutivos, de la secuencia SEC ID NO.: 1 suprimida de su fragmento poliA terminal; c) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); d) la secuencia complementaria a, o la secuencia del ARN que corresponde a una secuencia como se define en los incisos a), b) o c). con la excepción de que la secuencia SEC ID NO. 11 del documento WO 99/54461 o la secuencia SEC ID NO. 51 del documento WO
99/06548 , y de las tres secuencias descritas en los documentos del banco de datos EMBL bajo los números de identificación Al 672868, AA 890726 y Al 301140. El documento WO 99/54461 es un documento de patente el cual se relaciona con secuencias de ácido nucleico expresadas por tejido de tumor de endometrio. Este documento describe en particular entre 635 secuencias, una secuencia de ácido nucleico SEC ID NO. 11 y su secuencia peptídica correspondiente SEC ID NO. 173, que tiene una identidad cercana a 100% con, respectivamente, un fragmento de la secuencia SEC ID NO. 1 (nt 1597-3313) y de la secuencia SEC ID NO. 2 (aa 519-1013) de la presente ¡nvención. Ese documento indica, en la página 153, que la secuencia del péptido SEC ID NO. 173 no corresponde a ninguna secuencia para la cual se conozca función. El documento WO 99/06548 es un documento que se relaciona con secuencias EST que codifican para proteínas secretadas que no son específicas de tejido. Ese documento describe en particular, entre las 545 secuencias descritas en la lista de secuencias dei mismo, la secuencia de ácido nucleico y la secuencia peptídica SEC ID No. 51 y la secuencia de aa37-113 (150 aminoácidos) de la cual muestra una homología muy fuerte con el fragmento de aa1-150 de la secuencia SEC ID No. 2, de acuerdo con la invención (aproximadamente 85% de identidad para el fragmento de 150 aminoácidos; ~ 94% para los primeros 135 aminoácidos). Ese documento también indica que el ADN que corresponde a esta secuencia EST 5' SEC ID No. 51 se origina de un tejido de tumor de próstata humano (véase página 40 de la lista de secuencias "fuente original"). El documento de "EMBL" Al 672868 describe una secuencia de ARNm la cual se origina de una biblioteca de tejidos de colon humanos afectados por la enfermedad de Crohn, y tiene un grado de identidad considerable con ia secuencia complementaria al fragmento de ADNc nt 441- 971 de la secuencia SEC ID No. 1 , de acuerdo con la invención. El documento de "EMBL" AA 890726 describe una secuencia de ARNm la cual se origina de una biblioteca de tejidos paratiroideos humanos con adenoma esporádico y tiene un grado de identidad considerable con la secuencia complementaria al fragmento de ADNc nt 2779-3309 de la secuencia SEC ID No. 1 , de acuerdo con la presente invención. Finalmente, el documento de "EMBL" Al 301140 describe una secuencia de ARNm la cual se origina de una biblioteca carcinoide pulmonar humana de tipo neuroendórino descrita, y tiene un grado considerable de identidad con la secuencia complementaria al fragmento de ADNc en la posición nt 2736-3299 de la secuencia SEC ID No. 1 , de acuerdo con la invención. Los términos "ácido nucleico", "secuencia de ácido nucleico",
"polinucleótido", "oligonucleótido", "secuencia polinucleotídica" y "secuencia nucieotídica", términos los cuales se utilizarán de intercambiablemente en la presente invención se pretende que indiquen una cadena precisa de nucleótidos, la cual puede o no estar modificada, lo que posibilita definir un fragmento o una región de un ácido nucleico, que puede o no incluir nucleótidos no naturales y los cuales pueden corresponder a un ADN de cadena doble o a un ADN de cadena sencilla y a productos para la transcripción de tales ADN. Debe entenderse que la presente ¡nvención no se relaciona con secuencias nucleotídicas en su ambiente cromosómico natural, es decir, en su estado natural. Son secuencias las cuales se han aislado y/o purificado, es decir, se han eliminado directa o indirectamente, por ejemplo por copiado, y su ambiente ha sido modificado por lo menos parcialmente. Preferiblemente, la longitud de la secuencia de ácido nucleico de acuerdo con la presente ¡nvención será menor de 150 kb, incluso de manera más preferible menor de 100 kb, 50 kb, 25 kb, 10 kb o 5 kb. Para los propósitos de la presente ¡nvención, el término "porcentaje de identidad" entre dos secuencias de ácido nucleico o de aminoácidos se pretende que indique un porcentaje de nucleótidos o de residuos aminoácidos los cuales son idénticos entre las dos secuencias que se van a comparar, que se obtienen después de la mejor alineación, este porcentaje es solo estadístico y las diferencias entre las dos secuencias se distribuyen aleatoriamente y sobre toda la longitud. El término "mejor alineación" o "alineación óptima" se pretende que indique la alineación para la cual el porcentaje de identidad determinado como se indica en lo siguiente, sea el más alto. Las comparaciones de secuencia entre dos secuencias de ácido nucleico o de aminoácidos se llevan a cabo convencionalmente al comparar estas secuencias después de haberlas alineado de manera óptima, la comparación se lleva a cabo por segmento o por "intervalo de comparación" para identificar y comparar regiones locales de similitud de secuencia. La alineación óptima de las secuencias para comparación se puede llevar a cabo, además de manualmente, por medio de un algoritmo de homología local de Smith y Waterman (1981 ) [Ad. App. Math., 2:482], por medio del algoritmo de homología local de Neddleman y Wunsch (1970) [J. Mol. Biol., 48:443], por medio del método de búsqueda de similitud de Pearson y Lipman (1988) [Proc. Nati. Acad. Sci., USA, 85:2444], por medio de programa de computadora los cuales utilizan estos algoritmos (GAP, BESTFIT, BLAST P, BLAST N. FASTA and TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wl). El porcentaje de identidad entre dos secuencias de ácido nucleico o de aminoácidos se determina al comparar éstas dos secuencias alineadas de manera óptima, en las cuales el ácido nucleico o la secuencia de aminoácidos que se van a comparar pueden comprender adiciones o supresiones en comparación con la secuencia de referencia para alineación óptima entre estas dos secuencias. Se calcula el porcentaje de identidad al determinar la cantidad de posiciones idénticas para las cuales el nucleótido o el residuo aminoácido es idéntico entre las dos secuencias, y al dividir este número de posiciones idénticas entre el número total de posiciones comparadas, y multiplicar el resultado que se obtenga por 100, de manera que se obtenga el porcentaje de identidad entre éstas dos secuencias. La expresión "secuencias de ácido nucleico que tienen un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99%, después de alineación óptima, con una secuencia de referencia" se considerará que indica que las secuencias de ácido nucleico las cuales tienen, en comparación con la secuencia de ácido nucleico de referencia, ciertas modificaciones, por ejemplo en particular una supresión, una parte truncada, extensión, fusión quimérica y/o sustitución, en particular una sustitución puntual y la secuencia de ácido nucleico de la cual tiene por lo menos 80%, preferiblemente 90%, 95% o 99% de identidad, después de alineación óptima, con la secuencia de ácido nucleico de referencia. Preferiblemente son secuencias, las secuencias complementarias a las cuales son capaces de hibridizar específicamente con la secuencia de la SEC ID No. 1 de la invención. Preferiblemente, las condiciones específicas de hibridación de alta rigurosidad serán tales que aseguren que por lo menos 80%, preferiblemente 90%, 95% o 99%, después de alineación óptima, entre una de las dos secuencias y la secuencia complementaria a la otra. Una hibridación bajo condiciones de alta rigurosidad significa que las condiciones de temperatura y fuerza iónica se eligen de manera que se mantenga la hibridación entre dos fragmentos complementarios de ADN. A modo de ilustración, las condiciones de alta rigurosidad para la etapa de hibridación con el propósito de definir los fragmentos polinucleotídicos descritos en lo anterior son, ventajosamente, como sigue:
La hibridación ADÑ-ADN o ADN-ARN se lleva a cabo en dos etapas: (1) prehibridación a 42°C durante 3 horas en regulador de pH de fosfato (20 mM, pH 7.5) que contiene 5 X SSC (1 x SSC corresponde a NaCl 0.15 M + solución de citrato de sodio 0.015 M), 50% de formamida, 7% de dodecilsulfato de sodio (SDS), 10 x Denhardt, 5% de sulfato de dextrano y 1 % de ADN de esperma de salmón; (2) hibridación en si misma, durante 20 horas a una temperatura que depende del tamaño de la sonda (es decir 42° C para una sonda con un tamaño de > 100 nucleótidos), seguido por dos lavados de 20 minutos a 2Ó°C en 2 x SSC + 2% de SDS y un lavado de 20 minutos a 20°C en 0.1 x SSC + 0.1% de SDS. El lavado final se lleva a cabo en 0.1 x SSC + 0.1% de SDS durante 30 minutos a 60°C para una sonda con un tamaño de > 100 nucleótidos. Las condiciones de hibridación de alta rigurosidad descritas antes para un polinucleótido de tamaño definido se ajustarán por aquellos expertos en la técnica para oligonucleótidos los cuales tengan un tamaño más grande o más pequeño, de acuerdo con las enseñanzas de Sambrook et al. (Molecular cloning: a laboratory manual, Sec. Ed., Cold Spring Harbor Lab., Cold Spring Harbor, New York, 1989). Entre las secuencias de ácido nucleico que tienen un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99% después de alineación óptima, con la secuencia de acuerdo con la invención, también se proporciona preferencia a las secuencias de ácido nucleico las cuales son variantes de la secuencia de ácido nucleico SEC ID No. 1 o un fragmento de la misma, es decir, la totalidad de las secuencias de ácido nucleico que corresponden a las variantes aléíicas, es decir, variaciones individuales de la secuencia de ácido nucleico SEC ID No. 1. Estas secuencias mutadas naturales corresponden a polimorfismo presente en mamíferos, en particular humanos y especialmente a polimorfismo que llevan a la presentación de un trastorno patológico. La presente invención preferiblemente se relaciona con las secuencias de ácido nucleico variantes en las cuales las mutaciones llevan a una modificación de la secuencia de aminoácidos del polipéptido, o de fragmentos del mismo, codificados por la secuencia normal de la secuencia SEC ID No. 1. También se entenderá que la expresión "secuencias variantes de ácido nucleico" indicarán cualquier ARN o ADNc que resulte de una mutación de un sitio de empalme de la secuencia genómica de ácido nucleico,, cuyo ADNc tenga la secuencia de la SEC ID No. 1. La ¡nvención preferiblemente se relaciona con un ácido nucleico purificado o aislado, de acuerdo con la presente ¡nvención, caracterizado porque consiste de la secuencia SEC ID No. 1 , de la secuencia complementaria a, o de la secuencia del ARN que corresponde a la secuencia SEC ID No. 1 , preferiblemente el fragmento de la misma que codifica para el péptido de la secuencia SEC ID No. 2 o de la secuencia SEC ID No. 2 suprimida del péptido señal aa 1 -41. La invención preferiblemente se relaciona con un ácido nucleico purificado o aislado, de acuerdo con la invención, caracterizado porque comprende las secuencias que se eligen de las siguientes secuencias: a) las secuencias SEC ID No. 5, SEC ID No. 7, SEC ID No. 15, SEC ID No. 17 y SEC ID No. 19; b) la secuencia de un fragmento de por lo menos 18 nucleótidos de la secuencia SEC ID No. 19; c una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); y d) la secuencia complementaria a, o la secuencia de ARN que corresponde a una secuencia como se define en los incisos a), b) o c). La invención preferiblemente se relaciona con un ácido nucleico purificado o aislado, de acuerdo con la invención, caracterizado porque la secuencia del mismo se elige de las siguientes secuencias: a) SEC ID No. 1 , SEC ID No. 3, SEC ID No. 5, SEC ID No. 7, SEC
ID No. 9, SEC ID No. 15, SEC ID No. 17, SEC ID No. 19 y SEC ID No. 21 ; b) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%>, después de alineación óptima, con una secuencia como se define en el inciso a); y c) la secuencia complementaria a, o la secuencia de ARN que corresponde a una secuencia como se define en los incisos a) o b). Los iniciadores o sondas, caracterizados porque comprenden una secuencia de un ácido nucleico de acuerdo con la ¡nvención, también son parte de la invención. La presente ¡nvención preferiblemente por lo tanto se relaciona a los iniciadores o a las sondas de acuerdo con la invención los cuales en particular posibilitan revelar o diferenciar entre las secuencias variantes de ácido nucleico, o identificar la secuencia genómica del gen, el ADNc del cual está representado por la secuencia SEC ID No. 1 , utilizando en particular un método de amplificación tal como el método de PCR, o un método relacionado. La invención también se relaciona con el uso de una secuencia de ácido nucleico de acuerdo con la invención como una sonda o iniciador, para detectar, identificar, titular o amplificar secuencias de ácido nucleico. De acuerdo con la invención, los polinucleótidos los cuales se pueden utilizar como una sonda o como un iniciador en los métodos para detección, identificación, titulación o amplificación, la secuencia de ácido nucleico será de un mínimo de 15 bases, preferiblemente de 20 bases, o aún mejor de 25 a 30 bases en cuanto a tamaño. La totalidad de las sondas e iniciadores de acuerdo con la invención se pueden marcar directa o indirectamente con un compuesto radioactivo o no radioactivo, utilizando métodos bien conocidos por los expertos en la técnica para obtener una señal detectable y/o cuantificable. Las secuencias polinucleotídicas no marcadas, de acuerdo con la invención, se pueden utilizar directamente como una sonda o iniciador. Las secuencias generalmente se marcan con el fin de obtener secuencias las cuales se pueden utilizar para muchas aplicaciones. Los iniciadores o las sondas de acuerdo con la invención se marcan con elementos radiactivos o con moléculas no radiactivas. Entre los núclidos radiactivos utilizados, se puede hacer mención de ^P, 33P> 2BS, 3H o 125l. Las entidades no radiactivas se seleccionan de ligandos, tales como biotina, avidina, estreptavidina o digoxigenina, haptenos, colorantes y agentes luminiscentes, tales como agente radioluminiscentes, quimioluminiscentes, bioluminiscentes, fluorescentes o fosforescentes. Los polinucleótidos de acuerdo con la invención de esta manera se pueden utilizar como un iniciador y/o una sonda en métodos los cuales utilizan en particular la técnica de PCR (reacción en cadena de polimerasa) (H.A. Eriich, New York: Stockton Press, 1989; M.A. Innis et al., Academic Press, 1990; and A. Rolfs et al., Berlin: Springer-Verlag, 1991). Esta técnica requiere elegir pares de iniciadores oiigonucleotídicos los cuales finalizan el fragmento el cual debe ser amplificado. Se puede hacer referencia, por ejemplo, a la técnica descrita en ta patente de E.U.A. número 4,683,202. Los fragmentos amplificados se pueden identificar, por ejemplo después de electroforesis en gel de agarosa o de poliacrilamida, o después de una técnica cromatográfica tal como filtración en gel o cromatografía de intercambio iónico, y posteriormente se pueden secuenciar. Se puede controlar la especificidad de la amplificación mediante la utilización, como un iniciador, de secuencias nucleotídicas de polinucleótidos de la invención y, como una matriz, plásmidos que contengan estas secuendas o los productos de amplificación derivados. Los fragmentos nucleotídicos amplificados se pueden utilizar como reactivos en reacciones de hibridación para demostrar la presencia, en una muestra biológica, del ácido nucleico objetivo o de una secuencia complementaria a la de los fragmentos nucleotídicos amplificados. La invención también se relaciona con ácidos nucleicos los cuales se pueden obtener por amplificación utilizando iniciadores de acuerdo con la ¡nvención. Ventajosamente se pueden utilizar otras técnicas para amplificar el ácido nucleico objetivo, como una alternativa a PCR (similares a PCR) utilizando pares de iniciadores de secuencias nucleotídicas de acuerdo con la invención. El término "similar a PCR" se indicará que indica que la totalidad de los métodos los cuales utilizan reproducción directa o indirecta de secuencias de ácido nucleico, o en los cuales se han amplificado sistemas de etiquetado; por supuesto estas técnicas son conocidas; en general, requieren de amplificación del ADN por una polimerasa; cuando la muestra de origen es un ARN, se debe llevar a cabo de antemano transcripción inversa. Actualmente hay una gran cantidad de métodos para esta amplificación tales como, por ejemplo, la técnica SDA (amplificación por desplazamiento de cadena) (G.T. Walker et al., Nucleic Acids Res., 20:1691-1696, 1992), la técnica TAS (sistema de amplificación basado en transcripción) descrita por D.Y. Kwoh et al. en 1989 (Proc. Nati. Acad. Sci., USA, 86:1173-1177), la técnica 3SR (replicación de secuencias autosostenidas) por J.C. Guatelli et al., en 1990 (Proc. Nati. Acad. Sci., USA, 87:1874-1878, and Cell, 85:281-290, 1996), la técnica NASBA (amplificación basada en secuencia de ácido nucleico) descrita por T. Kievitis et al. en 1991 (J. Viral., Methods, 35:273-286), la técnica TMA (amplificación mediada por transcripción), la técnica LCR (reacción en cadena de ligasa) descrita por U. Landegren et al. en 1988 (Science, 241:1077-1080) y mejorada por F. Barany en 1991 (Proc. Nati. Acad. Sci. USA, 88:189-193), la cual utiliza una ligasa termoestable, la técnica de RCR (reacción en cadena con reparación) descrita por D. Segev en 1992 (Kessler C. Springer Verlag, Berlin, New York, 197-205), la técnica CPR (reacción de sonda ciclada) descrita por P. Duck et al. en 1990 (Biotechniques, 9:142-147), y la técnica de amplificación de Q-beta-replicasa descrita por E.A. Miele et al. en 1983 (J. Mol. Biol., 171 :281-295) y mejorada en particular por B.C.F. Chu et al. en 1986 (Nucleic Acids Res., 14:5591 -5603) y P.M. Lizardi et al. en 1988 (Biotechnology, 6:1197-1202), y después por J.L. Burg et al. (Mol. and Cell. Probes, 10:257-271) y también por B.B. Stone et al. (Mol. and Cel!. Probes, 10:359-370) en 1996. Cuando el polinucleótido objetivo que se va a detectar es un
ARNm, se utilizará ventajosamente una enzima del tipo de transcriptasa inversa, antes de llevar a cabo una reacción de amplificación utilizando los iniciadores de acuerdo con la invención, o para llevar a cabo un método de detección utilizando las sondas de la invención, con el fin de obtener un ADNc a partir del ARNm contenido en la muestra biológica. El ADNc que se obtiene después se utilizará como el objetivo para los iniciadores o las sondas utilizadas en el método de amplificación o detección, de acuerdo con la invención.
La técnica de hibridación por sonda se puede llevar a cabo de diversas maneras (J.A. Matthews et al., Anal. Biochem., 169:1-25, 1988). El método más general consiste en inmovilizar el ácido nucleico extraído de las células de diversos tejidos, o de células en cultivo, sobre un soporte (tal como nitrocelulosa, nylon o poliestireno) y en la incubación dei ácido nucleico objetivo inmovilizado con la sonda, bajo condiciones bien definidas. Después de la hibridación, se elimina el exceso de sonda y se detectan las moléculas híbridas formadas utilizando un método apropiado (medición de radioactividad, fluorescencia o actividad enzimática relacionada con la sonda). De acuerdo con otra modalidad de las sondas de ácido nucleico de acuerdo con la invención, estas últimas se pueden utilizar como una sonda de retención. En este caso, una sonda, denominada "sonda de retención" se inmoviliza sobre un soporte y se utiliza para retener, por hibridación específica, el ácido nucleico objetivo que se obtiene de la muestra biológica que se va a probar, y el ácido nucleico objetivo después se detecta utilizando una segunda sonda, denominada "sonda de detección" marcada con un elemento detectable fácilmente. Entre los fragmentos ventajosos de ácido nucleico, se debe hacer mención, en particular de oligonucleótidos antisentido, es decir, oligonucleótidos cuya estructura proporciona, por hibridación con la secuencia objetivo, ¡nhibición de la expresión del producto correspondiente. También se puede hacer mención de los oügonucleótidos directos (con sentido) los cuales, por interacción con las proteínas involucradas en la regulación de la expresión del producto correspondiente, inducirán inhibición o activación de esta expresión. En otro aspecto, la invención comprende un método para la detección sistemática de genotecas de ADN o de ADNc, o para clonación de material genómico aislado o ADNc, caracterizado porque utiliza una secuencia de ácido nucleico de acuerdo con la invención. Entre estos métodos, se puede hacer mención en particular de: detección sistemática de genotecas de ADNc y ADNc aislados clonados (Sambrook, J., et al., 1989; Suggs, S.V., et al., PNAS 78:6613-6617, 1981; Woo, S.L.C., Methods Enzymol., 68:389, 1979), utilizando las secuencias de ácido nucleico de acuerdo con la invención; detección sistemática de genotecas, por ejemplo BACs (Chumakov, I.M., et al., 1992; Chumakov, I.M., et al., Nature, 377:175-183, 1995) y, opcionalmente, análisis genético por FISH (Cherif, D., et al., Proc. Nati. Acad. Sci., USA, 87:6639-6643, 1990) utilizando secuencias de acuerdo con la invención, lo que permite el aislamiento y ubicación cromosómica, y después el secuenciado completo del gen para el cual la secuencia del ADNc es la secuencia de SEC ID No. 1. En particular, estos métodos de acuerdo con la invención se pueden utilizar aquí para identificar y por lo tanto obtener ADNc de variantes de áddo nudeico. Estos métodos de detección sistemática y/o clonación comprenderán en particular una etapa para hibridizar el ácido nucleico de acuerdo con la invención con un ácido nucleico contenido en una biblioteca genómica o de ADNc. La invención también comprende un método para identificar las secuencias de ácido nucleico las cuales promueven y/o regulan la expresión del gen, cuyo ADN tiene la secuencia SEC ID No. 1 , caracterizada porque utiliza un ácido nucleico de acuerdo con la invención. Las herramientas de computadora disponibles para aquellos expertos en la técnica les permiten identificar con facilidad, a partir de las secuencias genómicas de ácido nucleico de acuerdo con la invención, las secuencias reguladoras promotoras necesarias y suficientes para controlar la expresión del gen, en particular las secuencias TATA, CCAAT y GC, y también las secuencias reguladoras estimuladoras ("mejoradoras") o las secuencias reguladoras inhibidoras ("inhibidoras") las cuales controlan, en CIS, la expresión de los genes de acuerdo con la invención; entre estas secuencias reguladoras se pueden mencionar IRÉ, MRE y CRE. La ¡nvención también se relaciona con métodos para identificar mutaciones presentadas por el gen que codifica para el polipéptido de la secuencia SEC ID No. 2, en particular mutaciones responsables [lacuna], caracterizadas porque utilizan una secuencia de ácido nucleico de acuerdo con la ¡nvención. La invención se relaciona particularmente con un método para identificar un ácido nucleico de por lo menos 18 nucleótidos consecutivos de la secuencia del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, el ácido nucleico comprende por lo menos una mutación, preferiblemente responsable de la expresión anormal del gen, caracterizada porque utiliza una secuencia de ácido nucleico de acuerdo con la ¡nvención. Estos métodos para identificar estas mutaciones comprenderán, en particular, las siguientes etapas: (i) aislamiento del ADN de la muestra biológica que se va a analizar, o producción de ADNc a partir del ARNm de la muestra biológica; (ii) amplificación específica del ADN objetivo que es probable que tenga una mutación, utilizando iniciadores de acuerdo con la invención; (i¡¡) análisis de los productos de amplificación, en particular el tamaño y/o la secuencia de los productos de amplificación, en relación a una secuencia de referencia. Las secuencias promotora y/o reguladora para el gen de acuerdo con la invención las cuales tengan mutaciones capaces de modificar la expresión de la proteína correspondiente también son parte de la ¡nvención. Los ácidos nucleicos caracterizados porque se pueden obtener utilizando uno de los métodos anteriores de acuerdo con la invención, o los ácidos nucleicos capaces de hibridación, bajo condiciones de alta rigurosidad (porcentaje de identidad de por lo menos 80% entre una de las dos secuencias y la secuencia complementaria a la otra), con las secuencias de ácido nucleico, son parte de la invención, en particular los ácidos nucleicos de variantes alélicas del gen, cuyo ADNc tiene la secuencia SEC ID No. 1 , y también las secuencias genómicas de los genes homólogos de otros mamíferos, tales como ratones.
El uso de una secuencia de ácido nucleico de acuerdo con la invención, como una sonda o iniciador para una detección sistemática de una biblioteca genómica o de ADNc, por supuesto, es parte del objetivo de la presente invención. En otro aspecto, la invención comprende un polipéptido purificado o aislado codificado por un ácido nucleico de acuerdo con la ¡nvención. En la presente descripción, el término "polipéptido" se utilizará para indicar por igual una proteína o un péptido. Preferiblemente, la presente ¡nvención se relaciona con un polipéptido purificado o aislado, caracterizado porque comprende una secuencia de aminoácidos que se elige del siguiente grupo: a) la secuencia SEC ID No. 2; b) la secuencia o un fragmento de por lo menos 6, 10, 15, 30 ó 50 aminoácidos consecutivos de la secuencia SEC ID No. 2, preferiblemente de tal fragmento de la secuencia SEC ID No. 4, SEC ID No. 6, SEC ID No. 8 o SEC ID No. 10; c) una secuencia de aminoácidos que tiene un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99%, después de alineación óptima, con una secuencia como se define en los incisos a) o b). También de manera preferible, el objetivo de la ¡nvención es un polipéptido o secuencia de aminoácidos SEC ID No. 2, la secuencia SEC ID
No. 2 suprimida del fragmento aa 1-41 , o una secuencia de aminoácidos que tiene un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95%o o 99%, después de alineación óptima, con la secuencia SEC ID No. 2. El análisis de la secuencia de proteínas predice que el polipéptido de la secuencia SEC ID No. 2 tiene un péptido señal, cuya secuencia está entre las posiciones aa 1-41 , un dominio extracelular, cuya secuencia está entre las posiciones aa 42-911 , un dominio transmembranal cuya secuencia está entre las posiciones aa912-930 y un dominio intraceluiar cuya secuencia está entre las posiciones aa931-1013, en la secuencia SEC ID No. 2. Entre los polipéptidos de acuerdo con la invención, también se proporciona preferencia al polipéptido cuya secuencia está entre las posiciones aa 42-911 de la secuencia SEC ID No. 2, que corresponde al dominio extramembranal, o cualquier fragmento de por lo menos 6, 10, 15, 30 ó 50 aminoácidos consecutivos de la secuencia aa 42-911 , preferiblemente los aminoácidos consecutivos de la secuencia SEC ID No. 4, SEC ID No. 6, SEC ID No. 8 o SEC ID No. 10. La ¡nvención preferiblemente se relaciona con un péptido purificado o aislado, caracterizado porque comprende una secuencia de aminoácidos que se elige del siguiente grupo: a) la secuencia SEC ID No. 2; b) la secuencia de un fragmento de por lo menos 6 aminoácidos de la secuencia SEC ID No. 22, preferiblemente de la secuencia SEC ID No. 20; y c) una secuencia de aminoácidos que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b). La invención preferiblemente se relaciona con un poüpéptido de acuerdo con la ¡nvención, caracterizado porque la secuencia del mismo se elige de las secuencias SEC ID No. 2, SEC ID No. 4, SEC ID No. 6, SEC ID No. 8, SEC ID No. 10, SEC ID No. 16, SEC ID No. 18, SEC ID No. 20 y SEC ID No. 22, o una secuencia que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con estas secuencias. Se debe entender que la invención no se relaciona con polipéptidos en la forma natural, es decir, no se toman en su ambiente. Específicamente, la invención se relaciona con los péptidos que se obtienen por purificación de fuentes naturales, o que se obtienen por recombinación genética o por síntesis química y que posiblemente comprenden después aminoácidos no naturales. La producción de un polipéptido recombinante, la cual puede ser llevada a cabo utilizando una de las secuencias nucleotídicas de acuerdo con la invención, es particularmente provechosa dado que posibilita obtener un nivel aumentado de pureza del polipéptido deseado. La expresión "polipéptido cuya secuencia de aminoácidos tiene un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99%o, después de alineación óptima, con una secuencia de referencia" se pretende que indique que los polipéptidos tienen ciertas modificaciones en relación al polipéptido de referencia, por ejemplo en particular una o más supresiones, cortes, una extensión, una fusión quimérica y/o uno o más sustituciones. Entre los polipéptidos, la secuencia de aminoácidos la cual tiene un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99%> después de la alineación opcional con la secuencia SEC ID No. 2, o con un fragmento de la misma de acuerdo con la invención, se da preferencia a las variantes polipeptídicas codificadas por las secuencias de áddo nucleico variantes como se definen en lo anterior, en particular los polipéptidos cuya secuencia de aminoácidos tiene por lo menos una mutación que corresponde en particular a un corte, supresión, sustitución y/o adhesión de por lo menos un residuo aminoácido en relación a la secuenda SEC ID No. 2 o con un fragmento de la misma, de manera más preferible los polipéptidos variantes tienen una mutación unida a una condición patológica. La invención también comprende la clonación y/o vectores de expresión que contienen una secuencia de ácido nucleico de acuerdo con la invención. Los vectores de acuerdo con la invención, caracterizados porque comprenden los elementos que permiten la expresión y/o secreción de las secuencias en una célula huésped, o una secuencia para direccionamiento celular, también son parte de la invención. Los vectores caraderizados porque comprenden una secuencia promotora y/o reguladora de acuerdo con la invención, también son parte de la invención.
Tales vectores preferiblemente comprenden un promotor, un inicio de traducción y señales de terminación, y regiones adecuadas para regular la transcripción. Es posible que se mantengan establemente en la célula y de manera óptima pueden tener señales particulares las cuales especifican secreción de la proteína traducida. Estas señales diversas de control se eligen como una función del huésped celular utilizado. Para este fin, las secuencias de ácido nucleico de acuerdo con la invención se pueden insertar en vectores los cuales se replican de manera autónoma en el huésped elegido, o vectores los cuales se integran en el huésped elegido. Entre los sistemas los cuales se replican de manera autónoma se hará uso preferiblemente, dependiendo de la célula huésped, de los sistemas del plásmido o tipo viral, ios vectores virales posiblemente sean, en particular, adenovirus (Perricaudet, M., et al., La Recherche [Research], 23:471-473, 1992), retrovirus, lentivirus, poxvirus o virus de herpes (Epstein, A., Médecine/Sciences, 8:902-911 , 1992). Los expertos en la técnica la cual se puede utilizar para cada uno de estos sistemas. Cuando se desea la integración de la secuencia en los cromosoma de la célula huésped, se puede hacer uso, por ejemplo, de los sistemas del tipo plasmídico o viral; tales virus, por ejemplo, serán retrovirus (Temin, H.M., Retrovirus vectors for gene transfer, ¡n Kucherlapati R., ed. Gene Transfer, New York, Plenum Press, 149-187, 1986) o AAVs (Cárter, B.J., Curr. Op. Biotechnology, 3:533-539, 1993).
Entre los vectores no virales, se proporciona preferencia a los polinucleótidos desnudos, tales como ADN desnudo o ARN desnudo, de acuerdo con la técnica desarrollada por la compañía VICAL, cromosomas artificiales de levadura (YAC) para expresión en levadura, cromosomas artificiales de ratón (MAC) para expresión en células murinas y, preferiblemente, cromosomas artificiales humanos (HAC) para expresión en células humanas. Tales vectores se preparan de acuerdo con los métodos utilizados habitualmente por los expertos en la técnica y los clones resultantes de los mismos se pueden introducir en un huésped adecuado utilizando métodos convencionales tales, por ejemplo, lipofección, electroporación o choque térmico. La invención también comprende las células huéspedes, en particular células eucarióticas y procarióticas transformadas con los vectores de acuerdo con la ¡nvención y también los animales transgénicos, excepto humanos, que comprenden una de las células transformadas, de acuerdo con la invención. Entre las células que se pueden utilizar para estos propósitos, se pueden mencionar, por supuesto, células bacterianas (Olins, P.O., et al., Curr. Op. Biotechnology, 4:520-525, 1993), pero también células de levadura (Buckholz, R.G., Curr. Op., Biotechnology, 4:538-542, 1993), así como células animales, en particular cultivos de células de mamífero (Edwards, C.P., et al., Curr. Op. Biotechnology, 4:558-563, 1993), y en particular células de ovario de hámster chino (CHO), pero también células de insectos en las cuales es posible utilizar métodos que utilicen baculovirus, por ejemplo (Luckow, V.A., Curr. Op. Biotechnology, 4:564-572, 1993). Las células COS constituyen un huésped celular preferido para expresar proteínas de la ¡nvención. Entre los mamíferos de acuerdo con la ¡nvención, los animales tales como ratones, ratas o conejos, que expresan un polipéptido de acuerdo con la invención serán los preferidos. Entre los mamíferos de acuerdo con la invención, también se proporcionará preferencia a los animales tales como ratones, ratas o conejos, caracterizados porque el gen que codifica para la secuencia de la proteína SEC ID No. 2 o la secuencia de la cual es codificada por el gen homólogo de estos animales, no es funcional, ha sido suprimida del cromosoma o tiene por lo menos una mutación. Estos animales transgénicos se obtienen, por ejemplo, por recombinación homologa de embriocitos, transferencia de estos embriocltos a embriones, selección de las quimeras alteradas en las líneas de reproducción y crecimiento de las quimeras. Estos animales transgénicos (preferiblemente ratones) pueden sobreexpresar el gen que codifica para la proteína de acuerdo con la ¡nvención, o su gen homólogo, o expresar el gen en el cual se puede introducir una mutación. Estos animales transgénicos, en particular ratones se obtienen, por ejemplo por transfección de una copia de este gen bajo el control de un promotor fuerte el cual es naturaleza ubicua, o un promotor selectivo para un tipo de tejido o después de transcripción viral. Estos animales transgénicos (preferiblemente ratones) se pueden volver deficientes para el gen que codifica para el polipéptido de la secuencia SEC ID No. 2 o su gen homólogo, por inactivación utilizando el sistema de recombinasa LOXP/CRE (Rohlmann, A., et al., Nature Biotech., 14:1562-1565, 1996) o cualquier otro sistema para inactivar la expresión de este gen. Las células y mamíferos de acuerdo con la invención se pueden utilizar en un método para producir un polipéptido de acuerdo con la invención, como se describe en lo anterior, y también se pueden utilizar como un modelo analítico. Las células transformadas o los mamíferos como se describen en lo anterior de esta manera se pueden utilizar como modelos para estudiar las interacciones entre los polipéptidos de acuerdo con la invención y los compuestos químicos o de proteínas involucrados directa o indirectamente en las actividades de los polipéptidos de acuerdo con la invención, esto se realiza con el fin de estudiar los diversos mecanismos e interacciones involucradas. Se pueden utilizar especialmente para seleccionar productos que ¡nteractúan con los polipéptidos de acuerdo con la ¡nvención, en particular la proteína de la secuencia SEC ID No. 2 o variantes de la misma, de acuerdo con la ¡nvención, como un cofactor o como un inhibidor, en particular, un inhibidor competitivo, del cual se tiene una actividad la cual es agonista o antagonista para la actividad de los polipéptidos de acuerdo con la ¡nvención.
Preferiblemente, las células transformadas o los animales transgénicos se utilizarán como un modelo, en particular para seleccionar productos para conbatir condiciones patológicas relacionadas con expresión anormal de este gen, La ¡nvención también se relaciona con el uso de una célula, un mamífero o un polipéptido de acuerdo con la ¡nvención, para detección sistemática de un compuesto químico o bioquímico el cual puede ¡nteractuar directa o indirectamente con los polipéptidos de acuerdo con la invención y/o capaz de modular la expresión o actividad de estos polipéptidos. La ¡nvención también se relaciona con el uso de una secuencia de ácido nucleico de acuerdo con ia invención para sintetizar polipéptidos recombinantes. El método para elaborar un polipéptido de la invención en forma recombinante está incluido, en si mismo, en la presente invención y se caracteriza porque las células transformadas, en particular las células o mamíferos de la presente ¡nvención, se hacen crecer bajo condiciones las cuales permiten la expresión de un polipéptido recombinante codificado por una secuencia de ácido nucleico de acuerdo con la invención y en donde se recupera el polipéptido recombinante. Los polipéptidos recombinantes, caracterizados porque se pueden obtener utilizando tal método de producción, también son parte de la invención. Los polipéptidos recombinantes que se obtienen como se indica en lo anterior pueden estar en forma glicosilada y no glicosilada, y pueden o no tener una estructura terciaria natural. También se pueden modificar las secuencias de los poiipéptidos recombinantes para mejorar su solubilidad, en particular en solventes acuosos. Tales modificaciones se conocen por aquellos expertos en la técnica tales como, por ejemplo, la supresión de dominios hidrofóbicos o la sustitución de aminoácidos hidrofóbicos por aminoácidos hidrofílicos. Estos polipéptidos se pueden elaborar a partir de secuencias de ácido nucleico definidas antes, de acuerdo con las técnicas para elaborar polipéptidos recombinantes conocidos por los expertos en la técnica. En este caso, la secuencia de ácido nucleico utilizada se coloca bajo el control de señales las cuales permiten su expresión en un huésped celular. Un sistema eficaz para producir un polipéptldo recombinante requiere tener un vector y una célula huésped de acuerdo con la invención. Estas células se pueden obtener al introducir, en las células huéspedes una secuencia nucleotídica insertada en un vector como se define en lo anterior, y después cultivar las células bajo condiciones que permiten la repllcación y/o expresión de la secuencia nucleotídica transfectada. Los métodos para purificar un polipéptido recombinante los cuales se utilizan se reconocen por los expertos en la técnica. El polipéptido recombinante se puede purificar de los usados celulares y extractos, y del sobrenadante de medio de cultivo, utilizando métodos utilizados individualmente o en combinación, tales como fraccionamiento, métodos cromatográficos, técnicas de ¡nmunoafinidad utilizando anticuerpos monoclonales o policlonales específicos, etc. Los polipéptidos de acuerdo con la presente invención se pueden obtener por síntesis química utilizando una de las muchas síntesis peptídicas conocidas, por ejemplo las técnicas que utilizan fases sólidas o técnicas que utilizan fases sólidas, parciales, por condensación de fragmentos o por síntesis convencional en solución. La técnica de síntesis en fase sólida es bien conocida por los expertos en la técnica; véase, en particular J.M. Stewart, et al., (Solid phase peptide synthesis, Pierce Chem., Chem., Company, Rockford, 111 , 2nd ed., 1984) y M. Bodanski (Principies of peptide synthesis, 1984). Los polipéptidos correspondientes que se obtienen por síntesis química y que posiblemente comprenden aminoácidos no naturales también se incluyen en la invención. Los anticuerpos monoclonales o policlonales o fragmentos de los mismos, anticuerpos quiméricos o inmunoconjugados, caracterizados porque son capaces de reconocer específicamente un poiipéptido de acuerdo con la invención, también son parte de la invención pues son tales anticuerpos o fragmentos de los mismos capaces de reconocer las secuencias de polipéptidos de la secuencia SEC ID No. 173 del documento WO 99/54461 o de la secuencia SEC ID No. 51 del documento WO 99/06548. Se pueden obtener anticuerpos policlonales específicos a partir del suero de un animal inmunizado contra el polipéptido de acuerdo con la invención, en particular elaborado por recombinación genética o por síntesis peptídica, de acuerdo con los procedimientos habituales. La ventaja de los anticuerpos los cuales reconocen específicamente ciertas variantes polipeptídlcas, o fragmentos inmunogénicos de los mismos, de acuerdo con la ¡nvención, se notarán en particular. Los anticuerpos monoclonales o policlonales, o fragmentos de los mismos, anticuerpos quiméricos o inmunoconjugados, caracterizados porque son capaces de reconocer específicamente el dominio extramembranal del polipéptido de la secuencia SEC ID No. 2, se prefieren particularmente. Los anticuerpos monoclonales específicos se pueden obtener de acuerdo con el método convencional de cultivo de hibridomas, descrito por Kóhler y Milstein (Nature, 256:495-497, 1975). Los anticuerpos de acuerdo con la invención son, por ejemplo, anticuerpos quiméricos, anticuerpos humanos o fragmentos Fab o F(ab')2. También pueden estar en forma de inmunoconjugados o de anticuerpos los cuales se marcan con el fin de obtener una señal detectable y/o cuantificable. La invención también se relaciona con métodos para detectar y/o purificar un polipéptido de acuerdo con la invención, caracterizado porque se utiliza un anticuerpo de acuerdo con la ¡nvención. La invención también comprende polipéptidos purificados, caracterizados porque se obtienen utilizando un método de acuerdo con la invención. Además, de manera adicional a su uso para purificar los polipéptidos, los anticuerpos de la invención, en particular los anticuerpos monoclonales, también se pueden utilizar para detectar estos polipéptidos en una muestra biológica. Por lo tanto, ellos constituyen un medio para analizar inmunocitoquímicamente o inmunohistoquímicamente la expresión de los polipéptidos de acuerdo con la invención, en particular el polipéptido de la secuencia SEC ID No. 2, o una variante de la misma, sobre cortes de tejido específico, por ejemplo por inmunofluorescencia o marcado con oro, o con inmunoconjugados enzimáticos. Ellos pueden, en particular, hacer posible demostrar la expresión anormal de estos polipéptidos en muestras de tejido o biológicas. De manera más general, los anticuerpos de la ¡nvención se pueden utilizar ventajosamente en cualquier situación en la cual se pueda observar una expresión de un polipéptido normal o mutado, de acuerdo con la invención. Los métodos para determinar variabilidad alélica, una mutación, una supresión, pérdida de la condición heterocigota o cualquier anomalía genética del gen de acuerdo con la invención, caracterizado porque se utiliza una secuencia de ácido nucleico o un anticuerpo de acuerdo con la invención, también son parte de la invención. Preferiblemente la invención se relaciona con un método para diagnosticar una enfermedad asociada con la presencia de por lo menos una mutación sobre una secuencia del gen de acuerdo con la invención, utilizando una muestra biológica de un paciente, caracterizado porque comprende las siguientes etapas: a) cuando sea apropiado, aislar el ADN genómico de la muestra biológica que se va a analizar, u obtener ADNc a partir de ARN de la muestra biológica; b) amplificar específicamente la secuencia de ADN del gen que probablemente contenga una mutación, utilizando iniciadores de acuerdo con la invención; c) analizar los productos de amplificación que se obtienen al comparar su secuencia con la secuencia normal. La ¡nvención también comprende un método para diagnosticar una enfermedad relacionada con la expresión anormal de un polipéptido de acuerdo con la invención, en particular el polipéptido de la secuencia SEC ID No. 2 o una variante del mismo, caracterizado porque uno o más anticuerpos de acuerdo con la invención se ponen en contacto con el material biológico que se va a probar bajo condiciones que permiten la posible formación de complejos inmunológicos específicos entre el polipéptido y el o los anticuerpos y en donde los complejos inmunológicos que se forman posiblemente se pueden detectar y/o cuantificar. Estos métodos de diagnóstico se dirigen, por ejemplo, a métodos para el diagnóstico de enfermedades relacionadas con la expresión anormal del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, tales como la sobreexpresión o supresión, al determinar, utilizando una muestra biológica del paciente, la presencia de una secuencia de acuerdo con la invención en una cantidad anormal. Las secuencias de ácido nucleico analizadas pueden ser por igual ADN genómico, ADNc o ARNm. Por supuesto, existen una gran cantidad de métodos para demostrar una mutación en un gen en relación al gen de tipo silvestre. Se pueden dividir esencialmente en dos categorías principales. El primer tipo o método es aquel en el cual se detecta la presencia de una mutación al comparar la secuencia mutada con la secuencia correspondiente de tipo silvestre, y el segundo tipo es aquel en el cual se detecta la presencia de la mutación indirectamente, por ejemplo mediante la evidencia de malos pareamientos debidos a la presencia de la mutación. Estos métodos pueden utilizar las sondas y iniciadores de la presente ¡nvención. Generalmente son secuencias de hibridación de ácido nucleico purificadas, que comprenden por lo menos 15 nucleótidos, preferiblemente 20, 25 ó 30 a 200 nucleótidos, caracterizados porque pueden hibridizar específicamente con una secuencia de ácido nucleico de acuerdo con la invención. Las condiciones de hibridación específicas preferiblemente son las definidas en lo anterior o en los ejemplos. Entre los métodos para determinar una variabilidad alélica, una mutación, una supresión o una anomalía genética, se da preferencia a los métodos que comprenden por lo menos una etapa de amplificación "PCR" (reacción en cadena de polimerasa) o "similar a PCR" para amplificar la secuencia objetivo de acuerdo con la invención que probablemente tenga una anomalía, utilizando un par de iniciadores de secuencias nucleotídlcas de acuerdo con la invención. Los productos amplificados se pueden tratar con una enzima de restricción adecuada antes de proceder con la detección o con la titulación del producto objetivo. Las mutaciones del gen de acuerdo con la ¡nvención pueden ser responsables de las diversas modificaciones de sus productos de traducción, y estas son modificaciones las cuales se pueden utilizar para un enfoque de diagnóstico. Específicamente, modificaciones de antigenicidad relacionadas con estas mutaciones pueden permitir el desarrollo de anticuerpos específicos. Es posible diferenciar el producto del gen mutado por estos métodos. Todas estas modificaciones se pueden utilizar en un enfoque de diagnóstico utilizando varios métodos bien conocidos basados en el uso de anticuerpos monoclonales o policlonales los cuales reconocen al polipéptido normal o las variantes mutadas tales como, por ejemplo, por RÍA o por ELISA. En otro aspecto, la invención comprende un método para seleccionar compuestos químicos o bioquímicos capaces de ¡nteractuar directa o indirectamente con los polipéptidos de acuerdo con la ¡nvención, en particular el polipéptido de la secuencia SEC ID No. 2 o con los ácidos nucleicos de acuerdo con la invención, o posibilitar modular la expresión o actividad de los polipéptidos de acuerdo con la invención.
Por lo tanto, la ¡nvención comprende un método para seleccionar compuestos químicos o bioquímicos capaces de interactuar, in vitro o ¡n vivo con una secuencia de ácido nucleico de acuerdo con la ¡nvención, caracterizado porque comprende colocar una célula que expresa, normal o 5 anormalmente, el gen que codifica para el polipéptido de la secuencia SEC ID No. 2, en contacto con un compuesto candidato, y detectar directa o indirectamente una modificación de la expresión o de la actividad del polipéptido de la secuencia SEC ID No. 2. s La detección sistemática se puede utilizar para probar
10 compuestos capaces de modificar el nivel y/o la especificidad de expresión de los polipéptidos de acuerdo con la ¡nvención, en particular el polipéptido de la secuencia SEC ID No. 2, ya sea por unión competitiva a los sitios de unión de factor de transcripción que se localizan en el promotor del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, o al unirlo directamente a
15 factores de transcripción. Se puede analizar el nivel de expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 y su posición, por hibridación en solución con sondas grandes, como se indica en la patente PCT WO 97/05277. 20 Un análisis cuantitativo de la expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 también se puede realizar utilizando matrices de ADN, que posiblemente incluyan la totalidad o parte de la secuencia del ADNc de la secuencia SEC ID No. 1 de la presente invención y que tengan una longitud suficiente para permitir la detección específica de la expresión de los ARNm capaces de hibridizar con el mismo. Los fragmentos preferiblemente comprenden por lo menos 15, 25, 50, 100 ó 500 nucleótidos consecutivos de secuencias de ácido nucleico de las cuales se derivan, como se describe en Schena et al. (Science, 270:467-470, 1995). También se puede llevar a cabo un análisis cuantitativo de la expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la ¡nvención, con los ADN de acuerdo con la invención sobre matrices de ADN de acuerdo con la descripción por Pletu et al. (1996). Los ADN de acuerdo con la invención o fragmentos de los mismos se amplifican por PCR y se unen sobre membranas. Los ARNm que se originan de diversos tejidos o células se etiquetan con nucleótidos radioactivos. Después de hibridación y lavado bajo condiciones controladas, se detectan los ARNm hlbrldizados con equipo Phosphor Imager o por autorradiografía. Los experimentos se llevan a cabo por duplicado y se puede realizar un análisis cuantitativo de ARNm que se expresan diferencialmente. Las técnicas mencionadas antes permiten el análisis de los niveles de expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención, en la misma célula o el mismo tejido, en base en las diferentes condiciones, por ejemplo de inducción o de no inducción, y también el análisis de la especificidad de tejido de esta expresión, bajo condiciones las cuales también pueden variar. Otro aspecto de la presente invención se relaciona con métodos para identificar moléculas capaces de unirse con los polipéptidos de acuerdo con la invención, en particular el polipéptido de la secuencia SEC ID No. 2. Tales moléculas se pueden utilizar para modular la actividad biológica de estos polipéptidos. Por ejemplo, tales moléculas se pueden utilizar para estimular o disminuir la actividad de estos polipéptidos. Por lo tanto, la invención comprende un método para seleccionar compuestos químicos o bioquímicos capaces de modular la actividad del polipéptido de la secuencia SEC ID No. 2, caracterizados porque comprenden poner al polipéptido de acuerdo con la invención o una célula de acuerdo con la ¡nvención en contacto con un compuesto candidato, y detectar una modificación de la actividad del polipéptido de la secuencia SEC ID No. 2 Un objetivo de la invención también es un método para seleccionar compuestos químicos o bioquímicos, ¡n vivo o in vitro, capaces de unirse con el polipéptldo de la secuencia SEC ID No. 2 caracterizados porque comprenden colocar al polipéptido de acuerdo con lá invención o una célula de acuerdo con la invención en contacto con un compuesto candidato y detectar la formación de un complejo entre el compuesto candidato y el polipéptido. Existen muchos métodos para identificar ligandos para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención. Por ejemplo, sin que se limite a estos, se puede hacer mención de un método para" identificar moléculas capaces de ¡nteractuar con el polipéptido de la secuencia SEC ID No. 2 utilizando un sistema de dos híbridos bacterianos o de levadura tales como el Matchmaker Two Hybrid System 2, de acuerdo con las instrucciones del manual que acompaña a Matchmaker Two Hybrid System 2 (catálogo No. K1604-1 , Clontech). Para estudiar la interacción del polipéptido de la secuencia SEC ID No. 2 con moléculas pequeñas, tales como las generadas por química combinacional, es posible utilizar microdiáiisis acoplada a CLAP como se describe en Wang et al. (Chromatographia, 44:205-208, 1997), o electroforesis de capilaridad de afinidad como se describe en Busch et al. (J. Chromatogr., 777:311-328, 1997). En otros métodos, los péptidos o moléculas pequeñas de interactuar con el polipéptido o la secuencia SEC ID No. 2 de acuerdo con la invención se pueden unir a marcas detectables, tales como marcas radioactivas, fluorescentes o enzimáticas. Estas moléculas marcadas se ponen en contacto con el polipéptido inmovilizado de acuerdo con la invención, bajo condiciones las cuales permiten interacción específica. Después de la eliminación de las moléculas que no están unidas específicamente, se detectan por medios adecuados a las moléculas unidas. También se puede utilizar la tecnología BIACORE para llevar a cabo una detección sistemática de los compuestos capaz de ¡nteractuar con el polipéptido de la secuencia SEC ID No. 2. Esta tecnología, descrita en A. Szabo et al. (Curr. Opin. Struct. Biol., 5:699-705, 1995), posibilita detectar interacciones entre moléculas en tiempo real, sin utilizar marcado. Se basa en el fenómeno de SPR (resonancia de plasmón de superficie). Una de las ventajas principales de este método es que posibilita determinar las constantes de asociación para el polipéptido de la secuencia SEC ID No. 2 y las moléculas que interactúan. Por lo tanto, es posible seleccionar específicamente las moléculas que ¡nteractúan con constantes de asociación altas o bajas. Las proteínas u otras moléculas las cuales ¡nteractúan con el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la ¡nvención se pueden identificar utilizando columnas de afinidad las cuales contienen al polipéptido, o un fragmento del mismo, de acuerdo con la invención. El polipéptido de la secuencia SEC ID No. 2 o un fragmento del mismo se puede unir a la columna utilizando técnicas convencionales las cuales incluyen acoplamiento químico a una matriz de columna adecuada tal como agarosa, Affi Ge! u otras matrices conocidas por los expertos en la técnica. En otro aspecto de la invención, la columna de afinidad puede contener proteínas quiméricas en las cuales se puede fusionar el polipéptido de la secuencia SEC ID No. 2 o un fragmento de la misma, por ejemplo con glutation S-transferasa. Las moléculas que se van a probar descritas en lo anterior después se cargan en la columna. Las moléculas que ¡nteractúan con el polipéptido de la secuencia SEC ID No. 2 se retienen por la columna y se pueden aislar por elusión. La invención también se relaciona con un método para la detección sistemática y/o la selección de compuestos que interactúan con las secuencias promotoras y/o reguladoras de los genes que codifican para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención. Los ácidos nucleicos que codifican para proteínas que interactúan con las secuencias promotoras y/o reguladoras del gen que codifica para el polipéptldo de la secuencia SEC ID No. 2 de acuerdo con la ¡nvención, se pueden someter a detección sistemática y/o se pueden seleccionar utilizando un sistema de un híbrido, tal como el descrito en el manual que acompaña al equipo Matchmaker One-Hybrid System de Clontech (catálogo No. K1603). Los compuestos capaces de modificar la expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención, al unirlo a sus secuencias reguladoras y/o promotoras también se pueden seleccionar utilizando genes "indicadores", tales como fosfatasa alcalina, -galactosldasa o GFP (proteína fluorescente verde). De esta manera se puede evaluar el efecto de los compuestos candidatos sobre la expresión derivada de las secuencia reguladora y/o promotora del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención. En otro aspecto, la ¡nvención comprende el uso de un ácido nucleico o polipéptido de acuerdo con la invención, de una célula de acuerdo con la invención o de un mamífero de acuerdo con la ¡nvención, para estudiar la expresión o actividad del polipéptido de la secuencia SEC ID No. 2 de acuerdo con la ¡nvención, y/o las interacciones directas o indirectas entre el polipéptido de la secuencia SEC ID No. 2 y los compuestos químicos o bioquímicos los cuales puedan estar involucrados en su actividad. Los compuestos químicos o bioquímicos caracterizados porque se seleccionan utilizando los métodos definidos en lo anterior también son parte de la ¡nvención. Entre estos compuestos, los compuestos químicos o bioquímicos los que posibilitan modular la expresión o actividad del polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención son los que se prefieren. Se pretende que la expresión "compuestos los cuales posibilitan modular la expresión o actividad del polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención" indica los compuestos los cuales, en particular, posibilitan disminuir, estabilizar o aumentar la cantidad o la especificidad del polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención, o promover o inhibir la actividad total o la actividad de uno de los dominios específicos del polipéptldo, o reestablecer la expresión normal del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención cuando, por ejemplo, se observa una anomalía genética. Estos compuestos pueden interaduar, por ejemplo, como ligandos específicos para el polipéptido de la secuencia SEC ID No. 2, de acuerdo con la ¡nvención, o para un dominio del mismo, como un cofactor o como un inhibidor, en particular un inhibidor competitivo, o que tengan una actividad la cual es agonista o antagonista para la actividad dei polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención. Estos compuestos también pueden interactuar ya sea al neutralizar los ligandos específicos naturales para el polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención y por io tanto inhiben la actividad del polipéptido, inducido por estos ligandos o al neutralizar el sitio de unión de estos ligandos naturales. La invención comprende los compuestos de acuerdo con la invención, caracterizados porque son agonistas o antagonistas de la actividad del polipéptido de la secuencia SEC ID No. 2, de acuerdo con la ¡nvención. La ¡nvención también comprende compuestos de acuerdo con la invención, caracterizados porque son capaces de unirse a un polipéptido de la secuencia SEC ID No. 2, de acuerdo con la ¡nvención. En particular, entre estos compuestos de acuerdo con la invención, se da preferencia a los compuestos caracterizados porque se eligen de: un anticuerpo de acuerdo con la invención, un polipéptido de acuerdo con la invención, que incluye los polipéptidos de las secuencias SEC ID No. 173 y SEC ID No. 51 , respectivamente, descritos en los documentos WO 99/54461 y WO 99/06458, un polipéptido de acuerdo con la invención, caracterizado porque corresponde a un fragmento o a la fracción soluble del polipéptido de la secuencia SEC ID No. 2, de acuerdo con la ¡nvención, - un ácido nucleido de acuerdo con la ¡nvención, que incluye el ácido nucleico de la secuencia SEC ID No. 11 del documento WO 99/54461 , de la secuencia SEC ID No. 51 del documento WO 99/06548 y de la secuencia Al 672868, AA 890726 o Al 30140 de los documentos EMBL de los números de identificación correspondientes, los cuales pueden ser directos o antisentido, y un vector de acuerdo con la ¡nvención. _ En otro aspecto, la ¡nvención comprende compuestos de acuerdo con la invención, como un producto medicinal para evitar y/o tratar trastornos patológicos relacionados con una anomalía de la expresión y/o de la actividad del polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención. En particular, la invención comprende compuestos de acuerdo con la ¡nvención, como un producto medicinal para evitar y/o tratar condiciones patológicas inmunes, en particular para evitar y/o tratar enfermedades autoinmunes o cánceres. Finalmente, la invención comprende compuestos de acuerdo con la invención, como un producto medicinal para evitar y/o tratar infecciones de tipo viral, micótlco, bacterial o parasitario. Los compuestos de la invención, como principios activos de un producto medicinal, preferiblemente estarán en forma soluble, combinados con un vehículo farmacéuticamente aceptable. Preferiblemente, estos compuestos se administrarán de manera sistémica, en particular por vía intravenosa, intramuscular, intradérmica u oral. Sus formas farmacéuticas, dosis y métodos de administración óptimos se pueden determinar de acuerdo con los criterios que se consideran en general al establecer un tratamiento adecuado para un paciente, tal como por ejemplo la edad o peso corporal del paciente, lo grave de su estado general, la tolerancia al tratamiento y los efectos colaterales que se observan, etc. Otras características y ventajas de la invención aparecen en el resto de la descripción con los ejemplos y figuras, cuyas leyendas se representan a continuación.
LEYENDAS DE LAS FIGURAS
Figuras 1A y 1B: La expresión del ARN que codifica para el péptido de la secuencia SEC ID No. 2 se analiza por transferenda Northern utilizando membranas disponibles comercialmente (Múltiple Tissue Northern; Clontech, Palo Alto, CA). Se presentan los resultados representativos que se obtienen con dos membranas diferentes. 1. hígado fetal, 2. médula ósea, 3. células mononucleares, 4. timo, 5. nodulos linfáticos periféricos, 6. bazo, 7. células mononucleares, 8. pulmón, 9. placenta, 10. intestino delgado, 11. hígado, 12. riñon, 13. bazo, 14. timo, 15. colon, 16. músculo esquelético, 17. corazón, 18. cerebro. El ARNm que codifica para el polipéptido en la secuencia SEC ID No. 2 se expresa en células mononucleares, bazo, pulmón e intestino delgado. Figura 2: Se evalúa por PCR la expresión del ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 en las diversas subpoblaciones de células mononucleares no estimuladas, linfocitos T (carril 1), linfocitos B (carril 2), células NK (carril 3) y monocitos (carril 4), y también en células dendríticas generadas in vitro (carril 5). Se evalúan la integridad del ARN y también la calidad del ADNc sintetizado por amplificación del ADNc que codifica para la molécula GAPDH. El ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa en células mononucleares, bazo, pulmón e intestino delgado. Figura 3: Se analiza por PCR el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 en líneas tumorales humanas. Las líneas de células analizadas son carril 1: A549, carril 2: THP1, carril 3: HTB10, carril 4: T24, carril 5: Daudi, carril 6: A427, carril 7: U373, carril 8: HEP2, carril
9: HT29, carril 10: BT20. El ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa constitutivamente en diversas líneas de tumores humanos. Figura 4: Se transfectan células COS con ei vector pCDNA3.1 que contiene el ADNc completo que codifica para el polipéptido de la secuencia SEC ID No. 2. Se obtienen las fracciones citoplásmica y no citoplásmica de las células después de tres días de transfección mediante congelado/descongelado. Los extractos proteínicos se separan por electroforesis en SDS-PAGE; se evalúa la expresión de la proteína recombinante por análisis de transferencia de Westemblot utilizando un anticuerpo contra c-myc. Carril 1: fracción no citoplásmica, carril 2: fracción citoplásmica. El polipéptido de la secuencia SEC ID No. 2 se expresa en la fracdón no citoplásmica de las células transfectadas.
EJEMPL0 1 Clonación del ADNc que codifica para el polipéptido de la secuencia SEC D No. 2
Con el objetivo de identificar moléculas novedosas expresadas selectivamente en la superficie de células humanas, se lleva a cabo una búsqueda de secuencias que posiblemente contengan un motivo transmembranal en bancos de datos EST (etiqueta de secuencia expresada) en humanos. Metodología Se identifican las secuencias EST humanas que codifican para motivos transmembranales potenciales utilizando el programa TopPred 2 (programa para predecir proteínas unidas a membrana) el cual está disponible en la red (http://www.biokemi.su.se/TopPred2). Entre las muchas secuencias obtenidas, se seleccionan EST #AI301140 en base en el hecho de que el producto de traducción tiene un motivo transmembranal (posición 14-34 con una calificación de predicción de 1,868) y en que la secuencia nucleotídica no es homologa a alguna otra secuencia conocida. La secuencia nucleotídica disponible (http://www.ncbi.nih.nlm.gov) tiene un marco de lectura abierta de 116 aminoácidos con un codón de detención. Cuando se realiza una investigación para determinar homólogos de la secuencia #AI301140 en el banco de datos EST humano. De esta manera se seleccionan 18 de secuencia nucleotídicas novedosas en base en la homología con la secuencia #AI301 40. Los clones se obtienen de Research Genetics (New York, NY). Los clones bacterianos se seleccionan utilizando el antibiótico apropiado. Se purifica el ADN plasmídico utilizando un equipo disponible comercialmente (equipo de extracción de ADN Midiprep, Qiagen, Alemania), y se secuencia utilizando el equipo ABI Prism BigDye Termitator DNA (Perkin Elmer Applied Biosystems, Warrington, Reino Unido), de acuerdo con las instrucciones del proveedor. Se analiza la secuencia con un secuenciador automático ABI Prism 377 (Perkin Elmer Applied Biosystems). Se analizan las secuencias utilizando el programa de análisis de secuencia Sequencher (Genecodes, Ann Arbor, MI). Después de alineación de las diversas secuencias, se define un fragmento de ADN de 1100 pares de bases que tiene un marco de lectura abierta que contiene el codón de detención y la cola poli-A. Este fragmento se amplifica por PCR utilizando iniciadores específicos que corresponden a los extremos 5' y 3' de la secuencia alineada. Se obtiene la secuencia completa de ADNc por una serie de ciclos de aplicación por PCR del extremo 5' (5'RACE) (Frohman, M.A., et al., Proc. Nati. Acad. Sci. EUA, 85:8998-9002, 1988) utilizando equipos disponibles comercialmente. El ADN de matrices se prepara por ADN a partir de cerebro humano y médula ósea (Marathon-Ready cDNA; Clontech). Se define la predicción de un péptido señal utilizando un programa disponible en la red (http://www.cbs.dtu.dk/services/SignalP). La molécula tiene un peso molecular predicho de 113 kDa, un pl de 6.5 y 3 posibles sitios de glicosilación (residuos de treonina y serina). Resultados Se selecciona una clona de ADNc (#AI301140) que codifica para una molécula que tiene un motivo transmembranal, por análisis de los bancos de datos EST humanos disponibles. La secuencia de ADNc SEC ID No. 1 obtenida tiene una longitud de 3331 pares de bases y no muestra homología con moléculas que se encuentren en bases de datos. Tiene un marco de lectura abierta 3042 pares de bases que codifica para una proteína putativa de 1013 aminoácidos. Ei codón de inicio se localiza en la posición nt 45-47 y el codón de detención se localiza en la posición nt 3084-3086 de la secuencia SEC ID No. 1. El análisis de la secuencia de proteínas predice que esta proteína de secuencia SEC ID No. 2 tiene un péptido señal de secuencia aa 1-41 , un dominio extracelular de secuencia aa 42-911 , un dominio transmembranal de secuencia aa 912-930 y un dominio intracelular de secuencia aa 931-1013. Las secuencias SEC ID No. 3, SEC ID No. 5, SEC ID No. 7, y SEC ID No. 9 corresponden a fragmentos de secuencia SEC ID No. 1 los cuales no son homólogos a las secuencias EST seleccionadas en el ejemplo 1.
EJEMPLO 2 Expresión en tejido del ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2
Metodología La expresión de tejido del polipéptido de la secuencia SEC ID No. 2 se analiza por transferencia Northern utilizando membranas disponibles comercialmente las cuales posibilitan evaluar la expresión de un ARNm en diversos tejidos (Múltiple Tissue Northern or MTN, Clontech). Se genera por PCR un fragmento de ADNc que corresponde al fragmento nt 385-nt 1137, utilizando iniciadores específicos, cuya secuencia se deduce de la secuencia SEC ID No. 1. Después de purificación, se marcan radioactivamente 25 µg de este fragmento utilizando un equipo disponible comercialmente (equipo de etiquetado de ADN Multiprime, Amersham, Amersham, Reino Unido) y el nucleótido radioactivo (a-32P]-dATP. La sonda marcada se purifica por cromatografía. Las membranas se preincuban en una solución 2 X SSC (citrato de sodio 300 mM, pH 7 - NaCI 3 M - dodecilsulfato de sodio 0.1 %) durante 2 horas a 50°C, con agitación. Posteriormente, la membrana se incuba durante la noche a 50°C, con agitación, con la sonda radiomarcada la cual ha sido desnaturalizada por calor 10 minutos a 95°C). Después de tres lavados (15 minutos a 55°C con agitación) en solución 2 x SSC-SDS 0.1 %, las membranas se exponen a una película autorradiográfica (Kodak, Rochester, NY) durante 24 horas.
Resultados Las membranas de transferencia de análisis de Northernblot, que se presentan en las figuras 1A y 1B, muestran una fuerte señal de hibridación en las células mononucleares sanguíneas periféricas y en intestino delgado, el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 también se expresa en el timo, bazo, cerebro y pulmón. Por lo tanto, el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa de manera preferencial en tejidos linfoides humanos.
EJEMPLO 3 Expresión de ARNm que codifica para el polipéptido de la secuencia SEC
ID No. 2 en las diversas poblaciones de sangre circulante
Metodología Aislamiento de las diversas subpoblaciones celulares de sangre periférica Se extrae sangre de un individuo voluntario sano por leucoféresis (en presencia de un anticoagulante tal como, por ejemplo, heparinato de litio). Se aislan tas células mononucleares (MNC) (que contiene linfocitos T, linfocitos B y monocitos) por centrifugación en un gradiente Ficoll-Hypaque (densidad = 1.077) (Pharmacia, Uppsala, Suecia). Brevemente, las células sanguíneas se centrifugan a 1500 rpm durante 30 minutos a temperatura ambiente. Los MNC que se localizan en la interfase de Ficoll-plasma se recuperan y se lavan dos veces en presencia de medio RMPI 1640 (Life technologies). Los linfocitos T se purifican por la técnica de formación de "roseta". Brevemente, los MNC se resuspenden a una concentración de 200 x 106 células/ml y se mezclan con 1 ml de una solución que contiene 50% de eritrocitos de borrego (BioMérieux, Marcy PEtoile Francia). La suspensión celular se incuba a 4°C durante la noche. Después de resuspensión suave, se aislan los linfocitos T por centrifugación en un gradiente Ficoll-Hypaque (1500 rpm durante 30 minutos a temperatura ambiente). Se recolectan los complejos de eritrocitos de borrego-linfocito T en el fondo del tubo. Los eritrocitos se lisan por dos choques hipotónicos sucesivos. Se evalúa la pureza de los linfocitos T aislados de esta manera por marcado con anticuerpo contra CD3 FITC, la cual es de >95%. Brevemente, las células se lavan en regulador de pH FACS (regulador de pH de fosfato 10 mM, pH 7.4, que contiene albúmina sérica bovina 1% y azida de sodio 0.01%), antes de distribuirse en pozos de una placa de cultivo con fondo de cono de 96 pozos (Nunc, Roskitde, Dinamarca) a 2 x 105 células, en un volumen de 50 µl de regulador de pH FACS. A cada pozo se agrega anticuerpo marcado con FITC contra CD3 humano (Bedon Dickinson) o anticuerpo isotípico control marcado con FITC (Bedon Dickinson). Después de incubación durante 20 minutos a 4°C, las células se lavan dos veces con 200 µl de regulador de pH FACS y después se resuspenden en 200 µl de este mismo regulador de pH. La expresión de CD3 en la superficie de los linfocitos T se analiza por FACS.
Se purifican los monocitos por una técnica de selección positiva utilizando esferas magnéticas recubiertas con anticuerpo contra CD14 humano (sistema MACSMR; Miltenyi Biotex, Bergish Gladbach, Alemania). Brevemente, se incuban células mononucleares (300 x 106/ml) con 60 ml de una suspensión de esferas (Miltenyi) a 4°C durante 15 minutos en regulador de pH PBS/EDTA 2 mM/albúmina sérica bovina 0.5% (PBS/EDTA/BSA). Después del lavado, las células se cargan en una columna la cual se somete a un campo magnético. Después de tres lavados con la solución PBS/EDTA BSA, se separa la colonia del campo magnético y los monocitos se recolectan por gravedad. La pureza de los monocitos, evaluada por citometría en base en parámetros de tamaño/granulocidad, es mayor de 95%. Se generan in vitro células dendríticas humanas inmaduras a partir de monocitos purificados como se describe antes. Se cultivan los monocitos a una concentración de 106 células/ml en el siguiente medio (denominado subsecuentemente como medio de cultivo completo): medio RPMl 1640 suplementado con suero bovino fetal 10% (calentado a 56°C durante 30 minutos), 2 mM de L-glutamina, 50 U/ml de penicilina y 50 Dm/ml de estreptomicina (Life technologies) en placas de cultivo de 6 pozos (Nunc, Roskilde, Dinamarca) a 5 ml de medio por pozo. Las células se activan con 20 ng/ml de IL-4 humana recombinante y 20 ng/ml de GM-CSF humana recombinante (R&D Systems, Abingdon, Reino Unido). Después de cultivar durante 6 días (37°C, CO2 5% en una atmósfera húmeda), se define el fenotipo de las células por dtometría de flujo, mediante análisis de la expresión de moléculas CD a y CD83 utilizando un anticuerpo marcado con fluoresceína contra CD1a humano, o un anticuerpo contra CD83 humano (Becton Dickinson) el cual se detecta con un anticuerpo marcado con fluoresceína contra inmunoglobulina de ratón (Silenus, Hauworth, Australia). Las células dendríticas inmaduras se caracterizan por expresión de la molécula CD1a (intensidad de fluorescencia media (MFI)>100) y ausencia de expresión de la molécula CD83. Se aislan células NK (CD56+/CD3-) a partir de los MNC por citometría de flujo (selección positiva) después de marcado con anticuerpo, marcado con fluoresceína contra CD56 (Becton Dickinson) y un anticuerpo, marcado con ficoeritrina, contra CD3. Las células se marcan con el anticuerpo como se describe en lo anterior. Las células se clasifican en un equipo FACS Vantage (Becton Dickinson); la pureza es >98%. Se aislan linfodtos B de amígdalas recolectadas después de exéresis quirúrgica. Brevemente, se muelen mecánicamente las amígdalas y después se hacen pasar sobre un tamiz con una porosidad de 50 Dm. Se aislan por centrifugación células mononucleares, sobre un gradiente Ficoll-Hypaque como se describe antes. Se separan los linfocitos T de la suspensión de MNC utilizando la técnica de formación de rosetas, como se describe en lo anterior. Se evalúa la pureza de la población de linfocitos B por citometría de flujo utilizando un anticuerpo marcado con FITC contra CD20; la pureza es de >95%.
Técnica de PCR Se analiza por PCR la expresión del ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 en varias subpoblaciones de MNC. Brevemente, las células se lavan dos veces en PBS y después se lisan en un medio de extracción de ácido nucleico Trizol (Life technologies). Se separan las proteínas por dos extracciones sucesivas con fenol/cloroformo/ácido isoamílico (25 : 24 : 1) (Life technologies). Se agrega un volumen equivalente de alcohol isopropílico a la fase acuosa o para precipitar los ácidos nucleicos (durante la noche a -20°C). Los ácidos nucleicos se recolectan por centrifugación (12,000 rpm, 30 minutos a 4°C). El sedimento se lava una vez con una solución de etanol a 70°C. El sedimento se resuspende en agua y los ARNs se cuantifican por espedrometría (? = 260 nm). Después de la desnaturalización (65°C, 10 min), se someten a transcripción inversa 2 Og de ARN total utilizando un iniciador oligo-dT, con la ayuda de un equipo disponible comercialmente (Promega, Madison, Ml), de acuerdo con las recomendaciones del fabricante. El ADNc que codifica para el polipéptido de la secuencia SEC ID No. 2 se amplifica por PCR utilizando los siguientes iniciadores: 5'-TGACTCGGAATCACCTCCCAGCT-3' (SEC ID No. 11) y 5'-CAAGACGGTGAGCAGGATGGCAGTACAG-3' (SEC ID No.
12). Se utiliza la integridad del ARN para preparar los ADNc que se analizan al evaluar la expresión de ADNc que codifica para la molécula GAPDH utilizando los siguientes iniciadores. 5'-TCCACCACCCCTGTTGCTGTA-3' (SEC ID No. 13) y 5'-ACCACAGTCCATGCCATCAC-3' (SEC ID No. 14). La mezcla de reacción es como sigue: 1 DI de ADNc (que corresponde a 25 ng de ARN total), 25 pmol de iniciador, dNTP 200 DM, MgCI2 1.5 mM, Tris-HCl 10 mM, pH = 8.3, KCl 50 mM y 0.4 unidades de polimerasa Taq (Perkin Elmer). Las condiciones de PCR son: 5 min a 95°C, 30 ciclos: 1 min a 94°C, 1 min a 55°C y 1 min a 72°C, y una extensión final de 5 min a 72°C. Las muestras se captan en el regulador de pH de muestra (azul de bromofenol 0.25%, sacarosa 40%). Las muestras se analizan por electroforesis en un gel de agarosa 1% el cual contiene bromuro de etilo. Después de la migración, las muestras se visualizan por iluminación UV del gel.
Resultados El ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se detecta por PCR únicamente en los linfocitos T periféricos no estimulados. No se encuentra en otras poblaciones de células mononucleares probadas (células NK, linfocitos B, monocitos). El ARNm también se detecta en células dendríticas humanas generadas in vitro. Los resultados se proporcionan en la figura 2. De esta manera, el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa selectivamente por los linfodtos T de sangre circulante.
EJEMPLO 4 El ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa en diversas líneas de células tumorales
Metodología Evaluamos la expresión del ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 en varias líneas de células tumorales. Estas líneas de células se obtienen de ATCC y se cultivan de acuerdo con las instrucciones que se proporcionan. La extracción de ARN total y la síntesis de ADNc se lleva a cabo como se describe antes. La expresión de ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 y la molécula GAPDH se analiza por PCR como se describe antes.
Resultados Los experimentos de PCR (figura 3) muestran que las siguientes líneas de células humanas expresan constitutivamente el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2: adenocarcinoma de pulmón (línea A549), leucemia monocítica (línea THP1), neuroblastoma (línea HTB10), carcinoma de vejiga (T24), linforma de Burkitt (línea Daudi), carcinoma de pulmón (línea A427), glioblastoma (línea U373), carcinoma de la laringe (línea HEP2), carcinoma del colon (línea HT29) y carcinoma de mama (línea BT20). Por lo tanto, el ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa por cierta cantidad de líneas tumorales.
EJEMPLO 5 El polipéptido recombinante de la secuencia SEC ID No. 2 se expresa principalmente en la fracción de membrana de células COS transfectadas
Metodología Se transfectan células COS con el vector pCDNA3.1 (Invitrogen) que contiene un fragmento de inserción que codifica para el polipéptido de la secuencia SEC ID No. 2. Este sistema posibilita agregar un epítope c-myc a la molécula recombinante. La transfección se lleva a cabo por la técnica de lipofección (Fugene; Boehringer Mannheim, Alemania). Tres días después de la transfección las células se recolectan y se lavan tres veces con PBS. Posteriormente las células se someten a tres series de ciclos rápidos de congelamiento/recalentamiento y se centrifugan posteriormente a 12,000 rpm durante .10 min a 4°C. El sobrenadante corresponde a la fracción citoplásmica y el sedimento corresponde al componente de membrana más el núcleo más los organelos. El sedimento se resuspende en un regulador de pH de fosfato 10 mM, pH 7.4 que contiene 0.5% de Nonidet P40 y una mezcla de inhibidores de proteasa (Boehringer Mannheim, Alemania) durante 20 minutos a 4°C. Los usados celulares después se centrifugan a 12,000 rpm durante 10 minutos a 4°C para eliminar los núcleos. Los sobrenadantes que corresponden a las fracciones de membrana y citoplasma se captan en un volumen equivalente de regulador de pH de fosfato 10 mM que contiene 0.1 % de azul de bromofenol, 5% de glicerol y 0.1% de ß-mercaptoetanol. Las proteínas después se separan de acuerdo con su peso molecular por electroforesis en gel de poliacrilamida (gel de apilamiento 5%-gel de separación 10%>). Se carga en cada carril una cantidad de proteína que corresponde a 5 x 106células. Después de la migración, las proteínas se transfieren mediante Westernblot a una membrana de nitrocelulosa. Después de saturación en una solución de fosfato que contiene 10% de leche desnatada, las membranas se incuban durante la noche a 4°C, con agitación, con un anticuerpo contra c-myc (clona 9E10; ATCC, Manassas, VA) a la concentración de 10 µg/ml. Después del lavado con un regulador de pH de fosfato que contiene 10% de leche desnatada, las membranas se incuban con anticuerpo contra inmunoglobulina de ratón, marcada con peroxidasa (Amersham) durante 2 horas a temperatura ambiente, con agitación. Las membranas se lavan con regulador de pH de fosfato. Se detedan los anticuerpos unidos por quimioluminiscencia utilizando el sistema ELC de Amersham. Resultados La transferencia Western que se muestra en la figura 4 indica que la proteína recombinante se expresa principalmente en la fracción insoluble de los extractos celulares (membrana citoplásmica más órganelos intracitoplásmicos). Este resultado, y también la predicción de un dominio transmebranal potencial, sugieren que el polipéptido recombinante se expresa en la superficie de las células transfectadas. De esta manera, el polipéptido recombinante de la secuencia
SEC ID No. 2 se expresa en la fracción de membrana (no citoplásmlca) de las células COS transfectadas.
EJEMPLO 6 El gen que codifica para el polipéptido de la SEC ID No. 2 se localiza en el cromosoma 11q33-11 q34
Metodología Se determina la posición cromosómica del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 mediante una detección sistemática del banco de datos Unigene utilizando la secuencia EST #AI3011410.
Resultados Se encontró una secuencia de ADN genómico que muestra 98%> de homología con EST #AI301140, en un fragmento de cromosoma 11q en el grupo 33-34. Muchos genes de susceptibilidad a tumor se han localizado en la región genómica 11q23-40 (Koreth, J., et al. J. Pathol., 187:28-38, 1999). El gen que codifica para el polipéptido de la secuencia SEC ID No. 2 se localiza en el cromosoma 11 , región q133-q34. Este resultado permite confirmar que el polipéptido de la secuencia SEC ID No. 2 puede estar relacionado en la regulación de la respuesta ¡nmunitaria y que una modificación de su expresión se puede relacionar con trastornos ¡nmunológicos que probablemente induzca a las células a mostrar expresión anormal del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 para que se vuelvan de naturaleza tumoral.
LISTADO DE SECUENCIAS
<110> PIERRE FABRE MÉDICAM?NT
<120> CLONACIÓN, EXPRESIÓN Y CARACTERIZACIÓN DE UN GEN QUE SE EXPRESA EN CÉLULAS TUMORALES Y QUE ESTÁ RELACIONADO CON LA REGULACIÓN DE LA RESPUESTA INMUNITARIA
<130> D18391
<150> PCT/FROO/03032 <151> 2000-10-30
<150> FR 99 13629 <151> 1999-10-29
<160> 22 <170> Patentln Ver. 2.1
<210> 1 <211> 3331 <212> ADN <213> Homo sapiens
<220> <221> CDS <222> (45) .. (3083) <400> 1 gtgattactc actatagggc tcgagcggcc gcccgggcag gtct atg gct gag ect 56 Met Ala Glu Pro 1
ggg cae age cae cat ctc tcc gcc aga gtc agg gga aga act gag agg 104 Gly His Ser His His Leu Ser Ala Arg Val Arg Gly Arg Thr Glu Arg 5 10 15 20
cgc ata ecc cgg ctg tgg cgg ctg ctg ctc tgg gct ggg acc gcc ttc 152 Arg lie Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala Gly Thr Ala Phe 25 30 35
cag gtg acc cag gga acg gga ceg gag ctt cat gcc tgc aaa gag tet 200 Gln Val Thr Gln Gly Thr Gly Pro Glu Leu His Ala Cys Lys Glu Ser 40 45 50
gag tac cae tat gag tac acg gcg tgt gac age acg ggt tcc agg tgg 248 Glu Tyr His Tyr Glu Tyr Thr Ala Cys Asp Ser Thr Gly Ser Arg Trp 55 60 65
agg gtc gcc gtg ceg cat acc ceg ggc ctg tgc acc age ctg ect gac 296 Arg Val Ala Val Pro His Thr Pro Gly Leu Cys Thr Ser Leu Pro Asp 70 75 80
ecc gtc aag ggc acc gag tgc tcc ttc tcc tgc aac gcc ggg gag ttt 344 Pro Val Lys Gly Thr Glu Cys Ser Phe Ser Cys Asn Ala Gly Glu Phe 85 90 95 100 ctg gat atg aag gac cag tea tgt aag cea tgc gct gag ggc cgc tac 392
Leu Asp Met Lys Asp Gln Ser Cys Lys Pro Cys Ala Glu Gly Arg Tyr 105 110 115
tcc ctc ggc acá ggc att cgg ttt gat gag tgg gat gag ctg ecc cat 440
Ser Leu Gly Thr Gly lie Arg Phe Asp Glu Trp Asp Glu Leu Pro His 120 125 130
ggc ttt gcc age ctc tea gcc aac atg gag ctg gat gac agt gct gct 488
Gly Phe Ala Ser Leu Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala 135 140 145
gag tcc acc ggg aac tgt act teg tcc aag tgg gtt ecc cgg ggc gac 536
Glu Ser Thr Gly Asn Cys Thr Ser Ser Lys Trp Val Pro Arg Gly Asp 150 155 160
tac ate gcc tcc aac acg gac gaa tgc acá gcc acá ctg atg tac gcc 584 Tyr lie Ala Ser Asn Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala 165 170 175 180
gtc aac ctg aag caá tet ggc acc gtt aac ttc gaa tac tac tat cea 632 Val Asn Leu Lys Gln Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro 185 190 195
gac tcc age ate ate ttt gag ttt ttc gtt cag aat gac cag tgc cag 680 Asp Ser Ser lie lie Phe Glu Phe Phe Val Gln Asn Asp Gln Cys Gln 200 205 210 ecc aat gca gat gac tcc agg tgg atg aag acc acá gag aaa gga tgg 728 Pro Asn Ala Asp Asp Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp 215 220 225
gaa ttc cae agt gtg gag cta aat cga ggc aat aat gtc ctc tat tgg 776 Glu Phe His Ser Val Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp 230 235 240
aga acc acá gcc ttc tea gta tgg acc aaa gta ecc aag ect gtg ctg 824 Arg Thr Thr Ala Phe Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu 245 250 255 260
gtg aga aac att gcc ata acá ggg gtg gcc tac act tea gaa tgc ttc 872 Val Arg Asn lie Ala lie Thr Gly Val Ala Tyr Thr Ser Glu Cys Phe 265 270 275
ecc tgc aaa ect ggc acg tat gca gac aag cag ggc tcc tet ttc tgc 920 ro Cys Lys Pro Gly Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys 280 285 290
aaa ctt tgc cea gcc aac tet tat tea aat aaa gga gaa act tet tgc 968 Lys Leu Cys Pro Ala Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys 295 300 305
cae cag tgt gac ect gac aaa tac tea gag aaa gga tet tet tcc tgt 1016 His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys 310 315 320 aac gtg cgc cea gct tgc acá gac aaa gat tat ttc tac acá cae acg 1064 Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr 325 330 335 340
gcc tgc gat gcc aac gga gag acá caá ctc atg tac aaa tgg gcc aag 1112 Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys 345 350 355
ceg aaa ate tgt age gag gac ctt gag ggg gca gtg aag ctg ect gcc 1160 Pro Lys lie Cys Ser Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala 360 365 370
tet ggt gtg aag acc cae tgc cea ecc tgc aac cea ggc ttc ttc aaa 1208 Ser Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys 375 380 385
acc aac aac age acc tgc cag ecc tgc cea tat ggt ecc tac tcc aat 1256 hr Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn 390 395 400
ggc tea gac tgt acc cgc tgc ect gca ggg act gaa ect gct gtg gga 1304 Gly Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly 405 410 415 420
ttt gaa tac aaa tgg tgg aac acg ctg ecc acá aac atg gaa acg acc 1352 Phe Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr 425 430 435 gtt ctc agt ggg ate aac ttc gag tac aag ggc atg acá ggc tgg gag 1400
Val Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu 440 445 450
gtg gct ggt gat cae att tac acá gct gct gga gcc tea gac aat gac 1448
Val Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp 455 460 465
ttc atg att ctc act ctg gtt gtg cea gga ttt aga ect ceg cag teg 1496
Phe Met He Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser 470 475 480
gtg atg gca gac acá gag aat aaa gag gtg gcc aga ate acá ttt gtc 1544
Val Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val 485 490 495 500
ttt gag acc ctc tgt tet gtg aac tgt gag ctc tac ttc atg gtg ggt 1592 phe Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly 505 510 515
gtg aat tet agg acc aac act ect gtg gag acg tgg aaa ggt tcc aaa 1640 Val Asn Ser Arg Thr Asn Thr Pro Val Glu Thr Trp Lys Gly Ser Lys 520 525 530
ggc aaa cag tcc tat acc tac ate att gag gag aac act acc acg age 1688 Gly Lys Gln Ser Tyr Thr Tyr He He Glu Glu Asn Thr Thr Thr Ser 535 540 545 ttc acc tgg gcc ttc cag agg acc act ttt cat gag gca age agg aag 1736 Phe Thr Trp Ala Phe Gln Arg Thr Thr Phe His Glu Ala Ser Arg Lys 550 555 560
tac acc aat gac gtt gcc aag ate tac tcc ate aat gtc acc aat gtt 1784 Tyr Thr Asn Asp Val Ala Lys He Tyr Ser He Asn Val Thr Asn Val 565 570 575 580
atg aat ggc gtg gcc tcc tac tgc cgt ecc tgt gcc cta gaa gcc tet 1832 Met Asn Gly Val Ala Ser Tyr Cys Arg Pro Cys Ala Leu Glu Ala Ser 585 590 595
gat gtg ggc tcc tcc tgc acc tet tgt ect gct ggt tac tat att gac 1880 Asp Val Gly Ser Ser Cys Thr Ser Cys Pro Ala Gly Tyr Tyr He Asp 600 605 610
cga gat tea gga acc tgc cae tcc tgc ecc ect aac acá att ctg aaa 1928 Arg Asp Ser Gly Thr Cys His Ser Cys Pro Pro Asn Thr He Leu Lys 615 620 625
gcc cae cag ect tat ggt gtc cag gcc tgt gtg ecc tgt ggt cea ggg 1976
Ala His Gln Pro Tyr Gly Val Gln Ala Cys Val Pro Cys Gly Pro Gly 630 635 640
acc aag aac aac aag ate cae tet ctg tgc tac aat gat tgc acc ttc 2024
Thr Lys Asn Asn Lys He His Ser Leu Cys Tyr Asn Asp Cys Thr Phe
645 650 655 660 tea cgc aac act cea acc agg act ttc aac tac aac ttc tcc gct ttg 2072 Ser Arg Asn Thr Pro Thr Arg Thr Phe Asn Tyr Asn Phe Ser Ala Leu 665 670 675
gca aac acc gtc act ctt gct gga ggg cea age ttc act tcc aaa ggg 2120 Ala Asn Thr Val Thr Leu Ala Gly Gly Pro Ser Phe Thr Ser Lys Gly 680 685 690
ttg aaa tac ttc cat cae ttt acc ctc agt ctc tgt gga aac cag ggt 2168 Leu Lys Tyr Phe His His Phe Thr Leu Ser Leu Cys Gly Asn Gln Gly 695 700 . 705
agg aaa atg tet gtg tgc acc gac aat gtc act gac ctc cgg att ect 2216 Arg Lys Met Ser Val Cys Thr Asp Asn Val Thr Asp Leu Arg He Pro 710 715 720
gag ggt gag tea ggg ttc tcc aaa tet ate acá gcc tac gtc tgc cag 2264 , Glu Gly Glu Ser Gly Phe Ser Lys Ser He Thr Ala Tyr Val Cys Gln 725 730 735 740
gca gtc ate ate ecc cea gag gtg acá ggc tac aag gcc ggg gtt tcc 2312 Ala Val He He Pro Pro Glu Val Thr Gly Tyr Lys Ala Gly Val Ser 745 750 755
tea cag ect gtc age ctt gct gat cga ctt att ggg gtg acá acá gat 2360 Ser Gln Pro Val Ser Leu Ala Asp Arg Leu He Gly Val Thr Thr Asp 760 765 770 atg act ctg gat gga ate acc tcc cea gct gaa ctt ttc cae ctg gag 2408 Met Thr Leu Asp Gly He Thr Ser Pro Ala Glu Leu Phe His Leu Glu 775 780 785
tcc ttg gga ata ceg gac gtg ate ttc ttt tat agg tcc aat gat gtg 2456 Ser Leu Gly He Pro Asp Val He Phe Phe Tyr Arg Ser Asn Asp Val 790 795 800
acc cag tcc tgc agt tet ggg aga tea acc acc ate cgc gtc agg tgc 2504 Thr Gln Ser Cys Ser Ser Gly Arg Ser Thr Thr He Arg Val Arg Cys 805 810 815 820
agt cea cag aaa act gtc ect gga agt ttg ctg ctg cea gga acg tgc 2552 Ser Pro Gln Lys Thr Val Pro Gly Ser Leu Leu Leu Pro Gly Thr Cys 825 830 835
tea gat ggg acc tgt gat ggc tgc aac ttc cae ttc ctg tgg gag age 2600 ser Asp Gly Thr Cys Asp Gly Cys Asn Phe His Phe Leu Trp Glu Ser 840 845 850
gcg gct gct tgc ceg ctc tgc tea gtg gct gac tac cgt gct ate gtc 2648 Ala Ala Ala Cys Pro Leu Cys Ser Val Ala Asp Tyr Arg Ala He Val 855 860 865
age age tgt gtg gct ggg ate cag aag act act tac gtg tgg cga gaa 2696 Ser Ser Cys Val Ala Gly He Gln Lys Thr Thr Tyr Val Trp Arg Glu 870 875 880 ecc aag cta tgc tet ggt ggc att tet ctg ect gag cag aga gtc acc 2744 Pro Lys Leu Cys Ser Gly Gly He Ser Leu Pro Glu Gln Arg Val Thr 885 890 895 900
ate tgc aaa acc ata gat ttc tgg ctg aaa gtg ggc ate tet gca ggc 2792 He Cys Lyß Thr He Asp Phe Trp Leu Lys Val Gly He Ser Ala Gly 905 910 915
acc tgt act gcc ate ctg ctc acc gtc ttg acc tgc tac ttt tgg aaa 2840 Thr Cys Thr Ala He Leu Leu Thr Val Leu Thr Cys Tyr Phe Trp Lys 920 925 930
aag aat caá aaa cta gag tac aag tac tcc aag ctg gtg atg aat gct 2888 Lys Asn Gln Lys Leu Glu Tyr Lys Tyr Ser Lys Leu Val Met Asn Ala 935 940 945
act ctc aag gac tgt gac ctg cea gca gct gac age tgc gcc ate atg 2936 th.r Leu Lys Asp Cys Asp Leu Pro Ala Ala Asp Ser Cys Ala He Met 950 955 960
gaa ggc gag gat gta gag gac gac ctc ate ttt acc age aag aag tea 2984 Glu Gly Glu Asp Val Glu Asp Asp Leu He Phe Thr Ser Lys Lys Ser 965 970 975 980
ctc ttt ggg aag ate aaa tea ttt acc tcc aag agg act ect gat gga 3032 Leu Phe Gly Lys He Lys Ser Phe Thr Ser Lys Arg Thr Pro Asp Gly 985 990 995 ttt gac tea gtg ceg ctg aag acá tcc tea gga ggc ecc gac atg gac 3080 Phe Asp Ser Val Pro Leu Lys Thr Ser Ser Gly Gly Pro Asp Met Asp 1000 1005 1010
ctg tgagaggcac tgcctgcctc acctgcctcc tcaccttgca tageacettt 3133
Leu gcaagcctgc ggcgatttgg gtgccagcat cctgcaacac ccactgctgg aaatetette 3193 attgtggect tatcagatgt ttgaatttca gatctttttt tatagagtac ccaaaccctc 3253 ctttctgctt gcctcaaacc tgccaaatat acccacactt tgtttgtaaa aaaaaaaaaa 3313 aaaaaaaaaa aaaaaaaa 3331
<210> 2 <211> 1013 <212> PRT <213> Homo sapiens
<400> 2 Met Ala Glu Pro Gly His Ser His His Leu Ser Ala Arg Val Arg Gly 1 5 10 15
Arg Thr Glu Arg Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala 20 25 30
Gly Thr Ala Phe Gln Val Thr Gln Gly Thr Gly Pro Glu Leu His Ala 35 40 45
Cys Lys Glu Ser Glu Tyr His Tyr Glu Tyr Thr Ala Cys Asp Ser Thr 50 55 60
Gly Ser Arg Trp Arg Val Ala Val Pro His Thr Pro Gly Leu Cys Thr 65 70 75 80
Ser Leu Pro Asp Pro Val Lys Gly Thr Glu Cys Ser Phe Ser Cys Asn 85 90 95
Ala Gly Glu Phe Leu Asp Met Lys Asp Gln Ser Cys Lys Pro Cys Ala 100 105 110
Glu Gly Arg Tyr Ser Leu Gly Thr Gly He Arg Phe Asp Glu Trp Asp 115 120 125
Glu Leu Pro His Gly Phe Ala Ser Leu Ser Ala Asn Met Glu Leu Asp
130 135 140
Asp Ser Ala Ala Glu Ser Thr Gly Asn Cys Thr Ser Ser Lys Trp Val
145 150 155 160 Pro Arg Gly Asp Tyr He Ala Ser Asn Thr Asp Glu Cys Thr Ala Thr 165 170 175
Leu Met Tyr Ala Val Asn Leu Lys Gln Ser Gly Thr Val Asn Phe Glu 180 185 190
Tyr Tyr Tyr Pro Asp Ser Ser He He Phe Glu Phe Phe Val Gln Asn 195 200 205
Asp Gln Cys Gln Pro Asn Ala Asp Asp Ser Arg Trp Met Lys Thr Thr 210 215 220
Glu Lys Gly Trp Glu Phe His Ser Val Glu Leu Asn Arg Gly Asn Asn 225 230 235 240
Val Leu Tyr Trp Arg Thr Thr Ala Phe Ser Val Trp Thr Lys Val Pro 245 250 255
Lys Pro Val Leu Val Arg Asn He Ala He Thr Gly Val Ala Tyr Thr 260 265 270
Ser Glu Cys Phe Pro Cys Lys Pro Gly Thr Tyr Ala Asp Lys Gln Gly
275 280 285
Ser Ser Phe Cys Lys Leu Cys Pro Ala Asn Ser Tyr Ser Asn Lys Gly
290 295 300 Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly 305 310 315 320
Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe 325 330 335
Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr 340 345 350
Lys Trp Ala Lys Pro Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val 355 360 365
Lys Leu Pro Ala Ser Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro 370 375 380
Gly Phe Phe Lys Thr Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly 385 390 395 400
Pro Tyr Ser Asn Gly Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu 405 410 415
Pro Ala Val Gly Phe Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn 420 425 430
Met Glu Thr Thr Val Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met 435 440 445 Thr Gly Trp Glu Val Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala 450 455 460
Ser Asp Asn Asp Phe Met He Leu Thr Leu Val Val Pro Gly Phe Arg 465 470 475 480
Pro Pro Gln Ser Val Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg 485 490 495
He Thr Phe Val Phe Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr 500 505 510
Phe Met Val Gly Val Asn Ser Arg Thr Asn Thr Pro Val Glu Thr Trp 515 520 525
Lys Gly Ser Lys Gly Lys Gln Ser Tyr Thr Tyr He He Glu Glu Asn 530 535 540
Thr Thr Thr Ser Phe Thr Trp Ala Phe Gln Arg Thr Thr Phe His Glu 545 550 555 560
Ala Ser Arg Lys Tyr Thr Asn Asp Val Ala Lys He Tyr Ser He Asn 565 570 575
Val Thr Asn Val Met Asn Gly Val Ala Ser Tyr Cys Arg Pro Cys Ala 580 585 590 Leu Glu Ala Ser Asp Val Gly Ser Ser Cys Thr Ser Cys Pro Ala Gly 595 600 605
Tyr Tyr He Asp Arg Asp Ser Gly Thr Cys His Ser Cys Pro Pro Asn 610 615 620
T r He Leu Lys Ala His Gln Pro Tyr Gly Val Gln Ala Cys Val Pro 625 630 635 640
Cys Gly Pro Gly Thr Lys Asn Asn Lys He His Ser Leu Cys Tyr Asn 645 650 655
Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe Asn Tyr Asn 660 665 670
Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly Pro Ser Phe 675 680 685
Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu Ser Leu Cys 690 695 700
Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn Val Thr Asp 705 710 715 720
Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser He Thr Ala 725 730 735 Tyr Val Cys Gln Ala Val He He Pro Pro Glu Val Thr Gly Tyr Lys 740 745 750
Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg Leu He Gly 755 760 765
Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro Ala Glu Leu 770 775 780
Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe Phe Tyr Arg 785 790 795 800
Ser Asn Asp Val Thr Gln Ser Cys Ser Ser Gly Arg Ser Thr Thr He 805 810 815
Arg Val Arg Cys Ser Pro Gln Lys Thr Val Pro Gly Ser Leu Leu Leu 820 825 830
Pro Gly Thr Cys Ser Asp Gly Thr Cys Asp Gly Cys Asn Phe His Phe 835 840 845
Leu Trp Glu Ser Ala Ala Ala Cys Pro Leu Cys Ser Val Ala Asp Tyr 850 855 860
Arg Ala He Val Ser Ser Cys Val Ala Gly He Gln Lys Thr Thr Tyr 865 870 875 880 Val Trp Arg Glu Pro Lys Leu Cys Ser Gly Gly He Ser Leu Pro Glu 885 890 895
Gln Arg Val Thr He Cys Lys Thr He Asp Phe Trp Leu Lye Val Gly 900 905 910
He Ser Ala Gly Thr Cys Thr Ala He Leu Leu Thr Val Leu Thr Cys 915 920 925
Tyr Phe Trp Lys Lys Asn Gln Lys Leu Glu Tyr Lys Tyr Ser Lys Leu 930 935 940
Val Met Asn Ala Thr Leu Lys Asp Cys Asp Leu Pro Ala Ala Asp Ser 945 950 955 960
Cys Ala He Met Glu Gly Glu Asp Val Glu Asp Asp Leu He Phe Thr 965 970 975
Ser Lys Lys Ser Leu Phe Gly Lys He Lys Ser Phe Thr Ser Lys Arg 980 985 990
Thr Pro Asp Gly Phe Asp Ser Val Pro Leu Lys Thr Ser Ser Gly Gly 995 1000 1005
Pro Asp Met Asp Leu 1010 <210> 3 <211> 181
<213> Homo sapiens
<220> <221> CDS <222> (45) .. (179)
<400> 3 gtgattactc actatagggc tcgagcggcc gcccgggcag gtct atg gct gag ect 56 Met Ala Glu Pro 1
ggg cae age cae cat ctc tcc gcc aga gtc agg gga aga act gag agg 104 Gly His Ser His His Leu Ser Ala Arg Val Arg Gly Arg Thr Glu Arg 5 10 15 20 cgc ata ecc cgg ctg tgg cgg ctg ctg ctc tgg gct ggg acc gcc ttc 152 Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala Gly Thr Ala Phe 25 30 35
cag gtg acc cag gga acg gga ceg gag ct 181 Gln Val Thr Gln Gly Thr Gly Pro Glu 40 45 <210> 4 <211> 45 <212> PRT <213 > Homo sapiens
<400> 4 Met Ala Glu Pro Gly His Ser His His Leu Ser Ala Arg Val Arg Gly 1 5 10 15
Arg Thr Glu Arg Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala 20 25 30
Gly Thr Ala Phe Gln Val Thr Gln Gly Thr Gly Pro Glu 35 40 45
<210> 5 <211> 171 <212> ADN <213> Homo sapiens
<220> <221> CDS <222> (2) .. (169)
<400> 5 a gga gaa act tet tgc cae cag tgt gac ect gac aaa tac tea gag aaa 49 Gly Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys 1 5 10 15 gga tet tet tcc tgt aac gtg cgc cea gct tgc acá gac aaa gat tat 97 Gly Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr 20 25 30
ttc tac acá cae acg gcc tgc gat gcc aac gga gag acá caá ctc atg 145 Phe Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met 35 40 45
tac aaa tgg gcc aag ceg aaa ate tg 171 Tyr Lys Trp Ala Lys Pro Lys He 50 55
<210> 6 <211> 56 <212> PRT <213> Ho o sapiens
<400> 6 Gly Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys 10 15
Gly Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr 20 25 30
Phe Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met 35 40 45 Tyr Lys Trp Ala Lys Pro Lys He 50 55
<210> 7 <211> 158 <212> ADN <213> Homo sapiens
<220> <221> CDS <222> (3) .. (158)
<400> 7 tt ctc act ctg gtt gtg cea gga ttt aga ect ceg cag teg gtg atg 47
Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met 1 5 10 15
gca gac acá gag aat aaa gag gtg gcc aga ate acá ttt gtc ttt gag 95 Ala Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu 20 25 30 acc ctc tgt tet gtg aac tgt gag ctc tac ttc atg gtg ggt gtg aat 143 Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn 35 40 45
tet agg acc aac act 158
Ser Arg Thr Asn Thr 50 <210> 8 <211> 52 <212> PRT <213> Homo sapiens
<400> 8 Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala 1 5 10 15
Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu Thr 20 25 30
Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn Ser 35 40 45
Arg Thr Asn Thr 50
<210> 9 <211> 443 <212> ADN <213> Homo sapiens
<220> <221> CDS <222> (1) .. (441) <400> 9 tgc tac aat gat tgc acc ttc tea cgc aac act cea acc agg act ttc 48 Cys Tyr Asn Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe 1 5 10 15
aac tac aac ttc tcc gct ttg gca aac acc gtc act ctt gct gga ggg 96 Asn Tyr Asn Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly 20 25 30
cea age ttc act tcc aaa ggg ttg aaa tac ttc cat cae ttt acc ctc 144 Pro Ser Phe Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu 35 40 45
agt ctc tgt gga aac cag ggt agg aaa atg tet gtg tgc acc gac aat 192 Ser Leu Cys Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn 50 55 60
gtc act gac ctc cgg att ect gag ggt gag tea ggg ttc tcc aaa tet 240 Val Thr Asp Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser
65 70 75 80
ate acá gcc tac gtc tgc cag gca gtc ate ate ecc cea gag gtg acá 288 He Thr Ala Tyr Val Cys Gln Ala Val He He Pro Pro Glu Val Thr 85 90 95
ggc tac aag gcc ggg gtt tcc tea cag ect gtc age ctt gct gat cga 336 Gly Tyr Lys Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg 100 105 110 ctt att ggg gtg acá acá gat atg act ctg gat gga ate acc tcc cea 384
Leu He Gly Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro 115 120 125
gct gaa ctt ttc cae ctg gag tcc ttg gga ata ceg gac gtg ate ttc 432
Ala Glu Leu Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe
130 135 140
ttt tat agg te 443 Phe Tyr Arg 145
<210> 10 <211> 147 <212> PRT <213> Ho o sapiens
<400> 10 Cys Tyr Asn Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe
1 5 10 15 Asn Tyr Asn Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly 20 25 30
Pro Ser Phe Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu 35 40 45
Ser Leu Cys Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn 50 55 60 Val Thr Asp Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser 65 70 75 80
He Thr Ala Tyr Val Cys Gln Ala Val He He Pro Pro Glu Val Thr 85 90 95
Gly Tyr Lys Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg 100 105 110
Leu He Gly Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro 115 120 125
Ala Glu Leu Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe 130 135 140
Phe Tyr Arg 145
<210> 11 <211> 23 <212> ADN <213> Secuencia artificial
<220> <223> Iniciador derivado de la S?C ID No. 1 de origen de Homo sapiens
<400> 11 tgactcggaa tcacctccca gct 23 <210> 12 <211> 28 <212> ADN <213> Secuencia artificial
<220> <223> Iniciador derivado de la SEC ID No. 1 de origen de Homo sapiens
<400> 12 caagacggtg agcaggatgg cagtacag 28
<210> 13 <211> 20 <212> ADN <213> Secuencia artificial
<220> <223> Iniciador derivado de la secuencia de GAPDH, de origen de Homo sapiens
<400> 13 tccaccaccc tgttgctgta 20
<210> 14 <211> 20 <212> ADN <213> Secuencia artificial <220> <223> Iniciador derivado de la secuencia de GAPDH, de origen de Homo sapiens
<400> 14 accacagtcc atgccatcac 20
<210> 15 <211> 2733 <212> ADN <213> Homo sapiens
<220> <221> CDS <222> (1) .. (2733)
<400> 15 atg gct gag ect ggg cae age cae cat ctc tcc gcc aga gtc agg gga 48 Met Ala Glu Pro Gly His Ser His His Leu Ser Ala Arg Val Arg Gly 1 5 10 15
aga act gag agg cgc ata ecc cgg ctg tgg cgg ctg ctg ctc tgg gct 96 Arg Thr Glu Arg Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala 20 25 30
ggg acc gcc ttc cag gtg acc cag gga acg gga ceg gag ctt cat gcc 144 Gly Thr Ala Phe Gln Val Thr Gln Gly Thr Gly Pro Glu Leu His Ala 35 40 45 tgc aaa gag tet gag tac cae tat gag tac acg gcg tgt gac age acg 192 Cys Lys Glu Ser Glu Tyr His Tyr Glu Tyr Thr Ala Cys Asp Ser Thr 50 55 60
ggt tcc agg tgg agg gtc gcc gtg ceg cat acc ceg ggc ctg tgc acc 240 Gly Ser Arg Trp Arg Val Ala Val Pro His Thr Pro Gly Leu Cys Thr 65 70 75 80
age ctg ect gac ecc gtc aag ggc acc gag tgc tcc ttc tcc tgc aac 288 Ser Leu Pro Asp Pro Val Lys Gly Thr Glu Cys Ser Phe Ser Cys Asn 85 90 95
gcc ggg gag ttt ctg gat atg aag gac cag tea tgt aag cea tgc gct 336 Ala Gly Glu Phe Leu Asp Met Lys Asp Gln Ser Cys Lys Pro Cys Ala 100 105 110
gag ggc cgc tac tcc ctc ggc acá ggc att cgg ttt gat gag tgg gat 384
Glu Gly Arg Tyr Ser Leu Gly Thr Gly He Arg Phe Asp Glu Trp Asp 115 120 125
gag ctg ecc cat ggc ttt gcc age ctc tea gcc aac atg gag ctg gat 432
Glu Leu Pro His Gly Phe Ala Ser Leu Ser Ala Asn Met Glu Leu Asp 130 135 140
gac agt gct gct gag tcc acc ggg aac tgt act teg tcc aag tgg gtt 480 Asp Ser Ala Ala Glu Ser Thr Gly Asn Cys Thr Ser Ser Lys Trp Val 145 150 155 160 ecc cgg ggc gac tac ate gcc tcc aac acg gac gaa tgc acá gcc acá 528 Pro Arg Gly Asp Tyr ?le Ala Ser Asn Thr Asp Glu Cys Thr Ala Thr 165 170 175
ctg atg tac gcc gtc aac ctg aag caá tet ggc acc gtt aac ttc gaa 576 Leu Met Tyr Ala Val Asn Leu Lys Gln Ser Gly Thr Val Asn Phe Glu 180 185 190
tac tac tat cea gac tcc age ate ate ttt gag ttt ttc gtt cag aat 624 Tyr Tyr Tyr Pro Asp Ser Ser He He Phe Glu Phe Phe Val Gln Asn 195 200 205
gac cag tgc cag ecc aat gca gat gac tcc agg tgg atg aag acc acá 672 Asp Gln Cys Gln Pro Asn Ala Asp Asp Ser Arg Trp Met Lys Thr Thr 210 215 220
gag aaa gga tgg gaa ttc cae agt gtg gag cta aat cga ggc aat aat 720 Glu Lys Gly Trp Glu Phe His Ser Val Glu Leu Asn Arg Gly Asn Asn 225 230 235 240
gtc ctc tat tgg aga acc acá gcc ttc tea gta tgg acc aaa gta ecc 768 Val Leu Tyr Trp Arg Thr Thr Ala Phe Ser Val Trp Thr Lys Val Pro 245 250 255
aag ect gtg ctg gtg aga aac att gcc ata acá ggg gtg gcc tac act 816 Lys Pro Val Leu Val Arg Asn He Ala He Thr Gly Val Ala Tyr Thr 260 265 270 tea gaa tgc ttc ecc tgc aaa ect ggc acg tat gca gac aag cag ggc 864 Ser Glu Cys Phe Pro Cys Lys Pro Gly Thr Tyr Ala Asp Lys Gln Gly 275 280 285
5 tcc tet ttc tgc aaa ctt tgc cea gcc aac tet tat tea aat aaa gga 912 Ser Ser Phe Cys Lys Leu Cys Pro Ala Asn Ser Tyr Ser Asn Lys Gly 290 295 300
gaa act tet tgc cae cag tgt gac ect gac aaa tac tea gag aaa gga 960 * 10 Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly 305 310 315 320 e
tet tet tcc tgt aac gtg cgc cea gct tgc acá gac aaa gat tat ttc
1008 15 Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe 325 330 335 tac acá cae acg gcc tgc gat gcc aac gga gag acá caá ctc atg tac
1056 Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr 20 340 345 350
aaa tgg gcc aag ceg aaa ate tgt age gag gac ctt gag ggg gca gtg 1104
Lys Trp Ala Lys Pro Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val 25 355 360 365
aag ctg ect gcc tet ggt gtg aag acc cae tgc cea ecc tgc aac cea 1152 Lys Leu Pro Ala Ser Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro 370 375 380
ggc ttc ttc aaa acc aac aac age acc tgc cag ecc tgc cea tat ggt 1200 Gly Phe Phe Lys Thr Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly 385 390 395 400
ecc tac tcc aat ggc tea gac tgt acc cgc tgc ect gca ggg act gaa 1248 Pro Tyr Ser Asn Gly Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu 405 410 415
ect gct gtg gga ttt gaa tac aaa tgg tgg aac acg ctg ecc acá aac 1296 Pro Ala Val Gly Phe Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn 420 425 430
atg gaa acg acc gtt ctc agt ggg ate aac ttc gag tac aag ggc atg 1344
Met Glu Thr Thr Val Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met 435 440 445
acá ggc tgg gag gtg gct ggt gat cae att tac acá gct gct gga gcc 1392 Thr Gly Trp Glu Val Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala 450 455 460
tea gac aat gac ttc atg att ctc act ctg gtt gtg cea gga ttt aga 1440
Ser Asp Asn Asp Phe Met He Leu Thr Leu Val Val Pro Gly Phe Arg 465 470 475 480
ect ceg cag teg gtg atg gca gac acá gag aat aaa gag gtg gcc aga 1488 Pro Pro Gln Ser Val Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg 485 490 495
ate acá ttt gtc ttt gag acc ctc tgt tet gtg aac tgt gag ctc tac 1536
He Thr Phe Val Phe Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr 500 505 510
ttc atg gtg ggt gtg aat tet agg acc aac act ect gtg gag acg tgg 1584
Phe Met Val Gly Val Asn Ser Arg Thr Asn Thr Pro Val Glu Thr Trp 515 520 525
aaa ggt tcc aaa ggc aaa cag tcc tat acc tac ate att gag gag aac 1632
Lys Gly Ser Lys Gly Lys Gln Ser Tyr Thr Tyr He He Glu Glu Asn
530 535 540
act acc acg age ttc acc tgg gcc ttc cag agg acc act ttt cat gag 1680
Thr Thr Thr Ser Phe Thr Trp Ala Phe Gln Arg Thr Thr Phe His Glu 545 550 555 560
gca age agg aag tac acc aat gac gtt gcc aag ate tac tcc ate aat 1728 Ala Ser Arg Lys Tyr Thr Asn Asp Val Ala Lys He Tyr Ser He Asn 565 570 575
gtc acc aat gtt atg aat ggc gtg gcc tcc tac tgc cgt ecc tgt gcc 1776
Val Thr Asn Val Met Asn Gly Val Ala Ser Tyr Cys Arg Pro Cys Ala 580 585 590
cta gaa gcc tet gat gtg ggc tcc tcc tgc acc tet tgt ect gct ggt 1824 Leu Glu Ala Ser Asp Val Gly Ser Ser Cys Thr Ser Cys Pro Ala Gly 595 600 605
tac tat att gac cga gat tea gga acc tgc cae tcc tgc ecc ect aac 1872
Tyr Tyr He Asp Arg Asp Ser Gly Thr Cys His Ser Cys Pro Pro Asn 610 615 620
acá att ctg aaa gcc cae cag ect tat ggt gtc cag gcc tgt gtg ecc 1920
Thr He Leu Lys Ala His Gln Pro Tyr Gly Val Gln Ala Cys Val Pro
625 630 635 640
tgt ggt cea ggg acc aag aac aac aag ate cae tet ctg tgc tac aat 1968
Cys Gly Pro Gly Thr Lys Asn Asn Lys He His Ser Leu Cys Tyr Asn 645 650 655
gat tgc acc ttc tea cgc aac act cea acc agg act ttc aac tac aac 2016
Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe Asn Tyr Asn 660 665 670
ttc tcc gct ttg gca aac acc gtc act ctt gct gga ggg cea age ttc 2064 Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly Pro Ser Phe 675 680 685
act tcc aaa ggg ttg aaa tac ttc cat cae ttt acc ctc agt ctc tgt 2112
Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu Ser Leu Cys 690 695 700
gga aac cag ggt agg aaa atg tet gtg tgc acc gac aat gtc act gac 2160 Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn Val Thr Asp 705 710 715 720
ctc cgg att ect gag ggt gag tea ggg ttc tcc aaa tet ate acá gcc 2208 Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser He Thr Ala 725 730 735
tac gtc tgc cag gca gtc ate ate ecc cea gag gtg acá ggc tac aag 2256
Tyr Val Cys Gln Ala Val He He Pro Pro Glu Val Thr Gly Tyr Lys 740 745 750
gcc ggg gtt tcc tea cag ect gtc age ctt gct gat cga ctt att ggg 2304 Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg Leu He Gly 755 760 765
gtg acá acá gat atg act ctg gat gga ate acc tcc cea gct gaa ctt 2352
Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro Ala Glu Leu
770 775 780
ttc cae ctg gag tcc ttg gga ata ceg gac gtg ate ttc ttt tat agg 2400 Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe Phe Tyr Arg 785 790 795 800
tcc aat gat gtg acc cag tcc tgc agt tet ggg aga tea acc acc ate 2448
Ser Asn Asp Val Thr Gln Ser Cys Ser Ser Gly Arg Ser Thr Thr He 805 810 815
cgc gtc agg tgc agt cea cag aaa act gtc ect gga agt ttg ctg ctg 2496 Arg Val Arg Cys Ser Pro Gln Lys Thr Val Pro Gly Ser Leu Leu Leu 820 825 830
cea gga acg tgc tea gat ggg acc tgt gat ggc tgc aac ttc cae ttc 2544 Pro Gly Thr Cys Ser Asp Gly Thr Cys Asp Gly Cys Asn Phe His Phe 835 840 845
ctg tgg gag age gcg gct gct tgc ceg ctc tgc tea gtg gct gac tac 2592 Leu Trp Glu Ser Ala Ala Ala Cys Pro Leu Cys Ser Val Ala Asp Tyr 850 855 860
cgt gct ate gtc age age tgt gtg gct ggg ate cag aag act act tac 2640 Arg Ala He Val Ser Ser Cys Val Ala Gly He Gln Lys Thr Thr Tyr 865 870 875 880
gtg tgg cga gaa ecc aag cta tgc tet ggt ggc att tet ctg ect gag 2688 Val Trp Arg Glu Pro Lys Leu Cys Ser Gly Gly He Ser Leu Pro Glu 885 890 895
cag aga gtc acc ate tgc aaa acc ata gat ttc tgg ctg aaa gtg 2733 Gln Arg Val Thr He Cys Lys Thr He Asp Phe Trp Leu Lys Val 900 905 910
<210> 16 <211> 911 <212> PRT <213> Homo sapiens <400> 16 Met Ala Glu Pro Gly His Ser His His Leu Ser Ala Arg Val Arg Gly 1 5 10 15
Arg Thr Glu Arg Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala 20 25 30
Qly Thr Ala Phe Gln Val Thr Glp Gly Thr Gly Pro Glu Leu His Ala 35 40 45
Cys Lys Glu Ser Glu Tyr His Tyr Glu Tyr Thr Ala Cys Asp Ser Thr 50 55 60
Gly Ser Arg Trp Arg Val Ala Val Pro His Thr Pro 31y Leu Cys Thr 65 70 75 80
Ser Leu Pro Asp Pro Val Lys Gly Thr Glu Cys Ser Phe Ser Cys Asn 85 90 95
Ala Gly Glu Phe Leu Asp Met Lys Asp Gln Ser Cys Lys Pro Cys Ala 100 105 lio
Glu Gly Arg Tyr Ser Leu Gly Thr Gly He Arg Phe Asp Glu Trp Asp 115 120 125
Glu Leu Pro His Gly Phe Ala Ser Leu Ser Ala Asn Met Glu Leu Asp 130 135 140 Asp Ser Ala Ala Glu Ser Thr Gly Asn Cys Thr Ser Ser Lys Trp Val 145 150 155 160
Pro Arg Gly Asp Tyr He Ala Ser Asn Thr Asp Glu Cys Thr Ala Thr 165 170 175
Leu Met Tyr Ala Val Asn Leu Lys Gln Ser Gly Thr Val Asn Phe Glu 180 185 190
Tyr Tyr Tyr Pro Asp Ser Ser He He Phe Glu Phe Phe Val Gln Asn 195 200 205
Asp Gln Cys Gln Pro Asn Ala Asp Asp Ser Arg Trp Met Lys Thr Thr 210 215 220
Glu Lys Gly Trp Glu Phe His Ser Val Glu Leu Asn Arg Gly Asn Asn 225 230 235 240
Val Leu Tyr Trp Arg Thr Thr Ala Phe Ser Val Trp Thr Lys Val Pro 245 250 255
Lys Pro Val Leu Val Arg Asn He Ala He Thr Gly Val Ala Tyr Thr 260 265 270
Ser Glu Cys Phe Pro Cys Lys Pro Gly Thr Tyr Ala Asp Lys Gln Gly 275 280 285 Ser Ser Phe Cys Lys Leu Cys Pro Ala Asn Ser Tyr Ser Asn Lys Gly 290 295 300
Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly 305 310 315 320
Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe 325 330 335
Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr 340 345 350
Lys Trp Ala Lys Pro Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val 355 360 365
Lys Leu Pro Ala Ser Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro
370 375 380
Gly Phe Phe Lys Thr Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly 385 390 395 400
Pro Tyr Ser Asn Gly Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu 405 410 415
Pro Ala Val Gly Phe Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn 420 425 430 Met Glu Thr Thr Val Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met 435 440 445
T r Gly Trp Glu Val Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala 450 455 460
Ser Asp Asn Asp Phe Met He Leu Thr Leu Val Val Pro Gly Phe Arg 465 470 475 480
Pro Pro Gln Ser Val Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg 485 490 495
He Thr Phe Val Phe Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr 500 505 510
Phe Met Val Gly Val Asn Ser Arg Thr Asn Thr Pro Val Glu Thr Trp 515 520 525
Lys Gly Ser Lys Gly Lys Gln Ser Tyr Thr Tyr He lie Glu Glu Asn 530 535 540
Thr Thr Thr Ser Phe Thr Trp Ala Phe Gln Arg Thr Thr Phe His Glu 545 550 555 560
Ala Ser Arg Lys Tyr Thr Asn Asp Val Ala Lys He Tyr Ser He Asn 565 570 575
Val Thr Asn Val Met Asn Gly Val Ala Ser Tyr Cys Arg Pro Cys Ala 580 585 590 Leu Glu Ala Ser Asp Val GÍy Ser Ser Cys Thr Ser Cys Pro Ala Gly 595 600 605
Tyr Tyr He Asp Arg Asp Ser Gly Thr Cys His Ser Cys Pro Pro Asn 610 615 620
Thr He Leu Lys Ala His Gln Pro Tyr Gly Val Gln Ala Cys Val Pro 625 630 635 640
Cys Gly Pro Gly Thr Lys Asn Asn Lys He His Ser Leu Cys Tyr Asn 645 650 655
Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe Asn Tyr Asn 660 665 670
Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly Pro Ser Phe 675 680 685
Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu Ser Leu Cys 690 695 700
Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn Val Thr Asp 705 710 715 720
Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser He Thr Ala 725 730 735 Tyr Val Cys Gln Ala Val íle lie Pro Pro Glu Val Thr Gly Tyr Lys 740 745 750
Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg Leu He Gly 755 760 765
Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro Ala Glu Leu 770 775 780
Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe Phe Tyr Arg
785 790 795 800
Ser Asn Asp Val Thr Gln Ser Cys Ser Ser Gly Arg Ser Thr Thr He 805 810 815
Arg Val Arg Cys Ser Pro Gln Lys Thr Val Pro Gly Ser Leu Leu Leu 820 825 830
Pro Gly Thr Cys Ser Asp Gly Thr Cys Asp Gly Cys Asn Phe His Phe 835 840 845
Leu Trp Glu Ser Ala Ala Ala Cys Pro Leu Cys Ser Val Ala Asp Tyr
850 855 860 Arg Ala He Val Ser Ser Cys Val Ala Gly He Gln Lys Thr Thr Tyr 865 870 875 880
Val Trp Arg Glu Pro Lys Leu Cys Ser Gly Gly He Ser Leu Pro Glu 885 890 895 Gln Arg Val Thr He Cys Lys Thr He Asp Phe Trp Leu Lys Val 900 905 910
<210> 17 <211> 2610 <212> ADN <213> Homo sapiens
<220> <221> CDS <222> (1) .. (2610)
<400> 17 acg gga ceg gag ctt cat gcc tgc aaa gag tet gag tac cae tat gag 48 Thr Gly Pro Glu Leu His Ala Cys Lys Glu Ser Glu Tyr His Tyr Glu 1 5 10 15
tac acg gcg tgt gac age acg ggt tcc agg tgg agg gtc gcc gtg ceg 96 Tyr Thr Ala Cys Asp Ser Thr Gly Ser Arg Trp Arg Val Ala Val Pro 20 25 30
cat acc ceg ggc ctg tgc acc age ctg ect gac ecc gtc aag ggc acc 144
His Thr Pro Gly Leu Cys Thr Ser Leu Pro Asp Pro Val Lys Gly Thr 35 40 45
gag tgc tcc ttc tcc tgc aac gcc ggg gag ttt ctg gat atg aag gac 192
Glu Cys Ser Phe Ser Cys Asn Ala Gly Glu Phe Leu Asp Met Lys Asp 50 55 60 cag tea tgt aag cea tgc gct gág ggc cgc tac tcc ctc ggc ac ggc 240 Gln Ser Cys Lys Pro Cys Ala Glu Gly Arg Tyr Ser Leu Gly Thr Gly 65 70 75 80
att cgg ttt gat gag tgg gat gag ctg ecc cat ggc ttt gcc age ctc 288 He Arg Phe Asp Glu Trp Asp Glu Leu Pro His Gly Phe Ala Ser Leu 85 90 95
tea gcc aac atg gag ctg gat gac agt gct gct gag tcc acc ggg aac 336 Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala Glu Ser Thr Gly Asn 100 105 110
tgt act teg tcc aag tgg gtt ecc cgg ggc gac tac ate gcc tcc aac 384 Cys Thr Ser Ser Lys Trp Val Pro Arg Gly Asp Tyr He Ala Ser Asn 115 120 125
acg gac gaa tgc acá gcc acá ctg atg tac gcc gtc aac ctg aag caá 432 Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala Val Asn Leu Lys Gln 130 135 140
tet ggc acc gtt aac ttc gaa tac tac tat cea gac tcc age ate ate 480 Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro Asp Ser Ser He He 145 150 155 160
ttt gag ttt ttc gtt cag aat gac cag tgc cag ecc aat gca gat gac 528 Phe Glu Phe Phe Val Gln Asn Asp Gln Cys Gln Pro Asn Ala Asp Asp 165 170 175 tcc agg tgg atg aag acc acá gag aaa gga tgg gaa ttc cae agt gtg 576 Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp Glu Phe His Ser Val 180 185 190
gag cta aat cga ggc aat aat gtc ctc tat tgg aga acc acá gcc ttc 624
Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp Arg Thr Thr Ala Phe 195 200 205
tea gta tgg acc aaa gta ecc aag ect gtg ctg gtg aga aac att gcc 672 Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu Val Arg Asn He Ala 210 215 220
ata acá ggg gtg gcc tac act tea gaa tgc ttc ecc tgc aaa ect ggc 720 He Thr Gly Val Ala Tyr Thr Ser Glu Cys Phe Pro Cye Lys Pro Gly 225 230 235 240
acg tat gca gac aag cag ggc tcc tet ttc tgc aaa ctt tgc cea gcc 768 Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys Lys Leu Cys Pro Ala 245 250 255
aac tet tat tea aat aaa gga gaa act tet tgc cae cag tgt gac ect 816 Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys His Gln Cys Asp Pro 260 265 270
gac aaa tac tea gag aaa gga tet tet tcc tgt aac gtg cgc cea gct 864 Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn Val Arg Pro Ala 275 280 285 tgc acá gac aaa gat tat ttc tac acá cae acg gcc tgc gat gcc aac 912 Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala Cys Asp Ala Asn 290 295 300
gga gag acá caá ctc atg tac aaa tgg gcc aag ceg aaa ate tgt age 960 Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro Lys He Cys Ser
305 310 315 320
gag gac ctt gag ggg gca gtg aag ctg ect gcc tet ggt gtg aag acc 1008 Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala Ser Gly Val Lys Thr 325 330 335
cae tgc cea ecc tgc aac cea ggc ttc ttc aaa acc aac aac age acc 1056 His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr Asn Asn Ser Thr 340 345 350
tgc cag ecc tgc cea tat ggt ecc tac tcc aat ggc tea gac tgt acc 1104 Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly Ser Asp Cys Thr 355 360 365
cgc tgc ect gca ggg act gaa ect gct gtg gga ttt gaa tac aaa tgg 1152 Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe Glu Tyr Lys Trp 370 375 380
tgg aac acg ctg ecc acá aac atg gaa acg acc gtt ctc agt ggg ate 1200 Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val Leu Ser Gly He 385 390 395 400 aac ttc gag tac aag ggc atg acá ggc tgg gag gtg gct ggt gat cae 1248 Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val Ala Gly Asp His 405 410 415
att tac acá gct gct gga gcc tea gac aat gac ttc atg att ctc act 1296 He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe Met He Leu Thr 420 425 430
ctg gtt gtg cea gga ttt aga ect ceg cag teg gtg atg gca gac acá 1344 Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala Asp Thr 435 440 445
gag aat aaa gag gtg gcc aga ate acá ttt gtc ttt gag acc ctc tgt 1392 Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu Thr Leu Cys 450 455 460
tet gtg aac tgt gag ctc tac ttc atg gtg ggt gtg aat tet agg acc 1440 Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn Ser Arg Thr 465 470 475 480
aac act ect gtg gag acg tgg aaa ggt tcc aaa ggc aaa cag tcc tat 1488 Asn Thr Pro Val Glu Thr Trp Lys Gly Ser Lys Gly Lys Gln Ser Tyr 485 490 495
acc tac ate att gag gag aac act acc acg age ttc acc tgg gcc ttc 1536 Thr Tyr He He Glu Glu Asn Thr Thr Thr Ser Phe Thr Trp Ala Phe 500 505 510 cag agg acc act ttt cat gag gca age agg aag tac acc aat gac gtt 1584 Gln Arg Thr Thr Phe His Glu Ala Ser Arg Lys Tyr Thr Asn Asp Val 515 520 525
gcc aag ate tac tcc ate aat gtc acc aat gtt atg aat ggc gtg gcc 1632 Ala Lys He Tyr Ser He Asn Val Thr Asn Val Met Asn Gly Val Ala 530 535 540
tcc tac tgc cgt ecc tgt gcc cta gaa gcc tet gat gtg ggc tcc tcc 1680 Ser Tyr Cys Arg Pro Cys Ala Leu Glu Ala Ser Asp Val Gly Ser Ser 545 550 555 560
tgc acc tet tgt ect gct ggt tac tat att 'gac cga gat tea gga acc 1728 Cys Thr Ser Cys Pro Ala Gly Tyr Tyr He Asp Arg Asp Ser Gly Thr 565 570 575
tgc cae tcc tgc ecc ect aac acá att ctg aaa gcc cae cag ect tat 1776 Cys His Ser Cys Pro Pro Asn Thr He Leu Lys Ala His Gln Pro Tyr 580 585 590
ggt gtc cag gcc tgt gtg ecc tgt ggt cea ggg acc aag aac aac aag 1824 Gly Val Gln Ala Cys Val Pro Cys Gly Pro Gly Thr Lys Asn Asn Lys 595 600 605
ate cae tet ctg tgc tac aat gat tgc acc ttc tea cgc aac act cea 1872 He His Ser Leu Cys Tyr Asn Asp Cys Thr Phe Ser Arg Asn Thr Pro 610 615 620 acc agg act ttc aac tac aac ttc tcc gct ttg gca aac acc gtc act 1920 Thr Arg Thr Phe Asn Tyr Asn Phe Ser Ala Leu Ala Asn Thr Val Thr 625 630 635 640
5 ctt gct gga ggg cea age ttc act tcc aaa ggg ttg aaa tac ttc cat 1968 Leu Ala Gly Gly Pro Ser Phe Thr Ser Lys Gly Leu Lys Tyr Phe His 645 650 655
cae ttt ace etc agt etc tgt gga aac cag ggt agg aaa atg tet gtg 2016
* 10 His Phe Thr Leu Ser Leu Cys Gly Asn Gln Gly Arg Lys Met Ser Val 660 665 670
tgc acc gac aat gtc act gac ctc cgg att ect gag ggt gag tea ggg 2064 Cys Thr Asp Asn Val Thr Asp Leu Arg He Pro Glu Gly Glu Ser Gly 15 675 680 685
ttc tcc aaa tet ate acá gcc tac gtc tgc cag gca gtc ate ate ecc 2112 Phe Ser Lys Ser He Thr Ala Tyr Val Cys Gln Ala Val He He Pro 690 695 700 20 cea gag gtg acá ggc tac aag gcc ggg gtt tcc tea cag ect gtc age 2160 Pro Glu Val Thr Gly Tyr Lys Ala Gly Val Ser Ser Gln Pro Val Ser 705 710 715 720
25 ctt gct gat cga ctt att ggg gtg acá acá gat atg act ctg gat gga 2208 Leu Ala Asp Arg Leu He Gly Val Thr Thr Asp Met Thr Leu Asp Gly 725 730 735 ate acc tcc cea gct gaa ctt ttc cae ctg gag tcc ttg gga ata ceg 2256 He Thr Ser Pro Ala Glu Leu Phe His Leu Glu Ser Leu Gly He Pro 740 745 750
gac gtg ate ttc ttt tat agg tcc aat gat gtg acc cag tcc tgc agt 2304 Asp Val He Phe Phe Tyr Arg Ser Asn Asp Val Thr Gln Ser Cys Ser 755 760 765
tet ggg aga tea acc acc ate cgc gtc agg tgc agt cea cag aaa act 2352 Ser Gly Arg Ser Thr Thr He Arg Val Arg Cys Ser Pro Gln Lys Thr 770 775 780
gtc ect gga agt ttg ctg ctg cea gga acg tgc tea gat ggg acc tgt 2400, Val Pro Gly Ser Leu Leu Leu Pro Gly Thr Cys Ser Asp Gly Thr Cys 785 790 795 800
gat ggc tgc aac ttc cae ttc ctg tgg gag age gcg gct gct tgc ceg 2448 Asp Gly Cys Asn Phe His Phe Leu Trp Glu Ser Ala Ala Ala Cys Pro 805 810 815
ctc tgc tea gtg gct gac tac cgt gct ate gtc age age tgt gtg gct 2496 Leu Cys Ser Val Ala Asp Tyr Arg Ala He Val Ser Ser Cys Val Ala 820 825 830
ggg ate cag aag act act tac gtg tgg cga gaa ecc aag cta tgc tet 2544 Gly He Gln Lys Thr Thr Tyr Val Trp Arg Glu Pro Lys Leu Cys Ser 835 840 845 ggt ggc att tet ctg ect gag cag aga gtc acc ate tgc aaa acc ata 592 Gly Gly He Ser Leu Pro Glu Gln Arg Val Thr He Cys Lys Thr He 850 855 860
gat ttc tgg ctg aaa gtg 2610
Asp Phe Trp Leu Lys Val 865 870
<210> 18 <211> 870 <212> PRT <213> Homo sapiens
<400> 18 Thr Gly Pro Glu Leu His Ala Cys Lys Glu Ser Glu Tyr His Tyr Glu 1 5 10 15
Tyr Thr Ala Cys Asp Ser Thr Gly Ser Arg Trp Arg Val Ala Val Pro 20 25 30 His Thr Pro Gly Leu Cys Thr Ser Leu Pro Asp Pro Val Lys Gly Thr 35 40 45
Glu Cys Ser Phe Ser Cys Asn Ala Gly Glu Phe Leu Asp Met Lys Asp 50 55 60
Gln Ser Cys Lys Pro Cys Ala Glu Gly Arg Tyr Ser Leu Gly Thr Gly 65 70 75 80 He Arg Phe Asp Glu Trp Asp Glu Leu Pro His Gly Phe Ala Ser Leu 85 90 95
Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala Glu Ser Thr Gly Asn 100 105 110
Cys Thr Ser Ser Lys Trp Val Pro Arg Gly Asp Tyr He Ala Ser Asn 115 120 125
Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala Val Asn Leu Lys Gln 130 135 140
Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro Asp Ser Ser He He 145 150 155 160
Phe Glu Phe Phe Val Gln Asn Asp Gln Cys Gln Pro Asn Ala Asp Asp 165 170 175
Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp Glu Phe His Ser Val 180 185 190
Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp Arg Thr Thr Ala Phe 195 200 205
Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu Val Arg Asn He Ala 210 215 220 He Thr Gly Val Ala Tyr Thr Ser Glu Cys Phe Pro Cys Lys Pro Gly 225 230 235 240
Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys Lys Leu Cys Pro Ala 245 250 255
Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys His Gln Cys Asp Pro 260 265 270
Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn Val Arg Pro Ala 275 280 285
Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala Cys Asp Ala Asn 290 295 300
Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro Lys He Cys Ser 305 310 315 320
Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala Ser Gly Val Lys Thr 325 330 335
His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr Asn Asn Ser Thr 340 345 350
Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly Ser Asp Cys Thr 355 360 365 Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe Glu Tyr Lys Trp 370 375 380
Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val Leu Ser Gly He 385 390 395 400
Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val Ala Gly Asp His 405 410 415
He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe Met He Leu Thr
420 425 430
Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala Asp Thr 435 440 445
Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu Thr Leu Cys 450 455 460
Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn Ser Arg Thr 465 470 475 480
Asn Thr Pro Val Glu Thr Trp Lys Gly Ser Lys Gly Lys Gln Ser Tyr 485 490 495
Thr Tyr He lie Glu Glu Asn Thr Thr Thr Ser Phe Thr Trp Ala Phe 500 505 510 Gln Arg Thr Thr Phe His Glu Ala Ser Arg Lys Tyr Thr Asn Asp Val 515 520 525
Ala Lys He Tyr Ser He Asn Val Thr Asn Val Met Asn Gly Val Ala 530 535 540
Ser Tyr Cys Arg Pro Cys Ala Leu Glu Ala Ser Asp Val Gly Ser Ser 545 550 555 560
Cys Thr Ser Cys Pro Ala Gly Tyr Tyr He Asp Arg Asp Ser Gly Thr 565 570 575
Cys His Ser Cys Pro Pro Asn Thr He Leu Lys Ala His GLn Pro Tyr 580 585 590
Gly Val Gln Ala Cys Val Pro Cys Gly Pro Gly Thr Lys Asn Asn Lys 595 600 605
He His Ser Leu Cys Tyr Asn Asp Cys Thr Phe Ser Arg Asn Thr Pro 610 615 620
Thr Arg Thr Phe Asn Tyr Asn Phe Ser Ala Leu Ala Asn Thr Val Thr 625 630 635 640
Leu Ala Gly Gly Pro Ser Phe Thr Ser Lys Gly Leu Lys Tyr Phe His 645 650 655 His Phe Thr Leu Ser Leu Cys Gly Asn Gln Gly Arg Lys Met Ser Val 660 665 670
Cys Thr Asp Asn Val Thr Asp Leu Arg He Pro Glu Gly Glu Ser Gly 675 680 685
Phe Ser Lys Ser He Thr Ala Tyr Val Cys Gln Ala Val He He Pro 690 695 700
Pro Glu Val Thr Gly Tyr Lys Ala Gly Val Ser Ser Gln Pro Val Ser 705 710 715 720
Leu Ala Asp Arg Leu He Gly Val Thr Thr Asp Met Thr Leu Asp Gly 725 730 735
He Thr Ser Pro Ala Glu Leu Phe His Leu Glu Ser Leu Gly He Pro 740 745 750
Asp Val He Phe Phe Tyr Arg Ser Asn Asp Val Thr Gln Ser Cys Ser 755 760 765
Ser Gly Arg Ser Thr Thr He Arg Val Arg Cys Ser Pro Gln Lys Thr 770 775 780
Val Pro Gly Ser Leu Leu Leu Pro Gly Thr Cys Ser Asp Gly Thr Cys 785 790 795 800 Asp Gly Cys Asn Phe His Phe Leu Trp Glu Ser Ala Ala Ala Cys Pro 805 810 815 Leu Cys Ser Val Ala Asp Tyr Arg Ala He Val Ser Ser Cys Val Ala 820 825 830
Gly He Gln Lys Thr Thr Tyr Val Trp Arg Glu Pro Lys Leu Cys Ser 835 840 845
Gly Gly He Ser Leu Pro Glu Gln Arg Val Thr He Cys Lys Thr He 850 855 860
Asp Phe Trp Leu Lys Val 865 870
<210> 19 <211> 627 <212> ADN <213> Homo sapiens
<220> <221> CDS <222> (1) .. (627)
<400> 19 cag tgt gac ect gac aaa tac tea gag aaa gga tet tet tcc tgt aac 48
Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn 1 5 10 15 gtg cgc cea gct tgc acá gac aáá gat tát ttc tac acá cae acg gcc 96 Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala 20 25 30
tgc gat gcc aac gga gag acá caá ctc atg tac aaa tgg gcc aag ceg 144 Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro 35 40 45
aaa ate tgt age gag gac ctt gag ggg gca gtg aag ctg ect gcc tet 192 Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala Ser 50 55 60
ggt gtg aag acc cae tgc cea ecc tgc aac cea ggc ttc ttc aaa acc 240 Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr 65 70 75 80
aac aac age acc tgc cag ecc tgc cea tat ggt ecc tac tcc aat ggc 288 Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly 85 90 95 tea gac tgt acc cgc tgc ect gca ggg act gaa ect gct gtg gga ttt 336 Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe 100 105 110
gaa tac aaa tgg tgg aac acg ctg ecc acá aac atg gaa acg acc gtt 384 Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val 115 120 125 ctc agt ggg ate aac ttc gag tac aag ggc atg acá ggc tgg gag gtg 432 Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val 130 135 140
gct ggt gat cae att tac acá gct gct gga gcc tea gac aat gac ttc 480 Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe 145 150 155 160
atg att ctc act ctg gtt gtg cea gga ttt aga ect ceg cag teg gtg 528 Met He Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val 165 170 175
atg gca gac acá gag aat aaa gag gtg gcc aga ate acá ttt gtc ttt 576 Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe 180 185 190
gag acc ctc tgt tet gtg aac tgt gag ctc tac ttc atg gtg ggt gtg 624 Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val 195 200 205
aat 627
Asn
<210> 20 <211> 209 <212> PRT <213> Homo sapiens <400> 20 Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn 1 5 10 15
Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala 20 25 30
Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro 35 40 45
Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala Ser 50 55 60
Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr 65 70 75 80
Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly 85 90 95
Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe 100 105 110
Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val 115 120 125
Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val 130 135 140 Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe 145 150 155 160
Met He Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val 165 170 175
Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe 180 185 190
Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val 195 200 205 Asn
<210> 21 <211> 1149 <212> ADN <213> Homo sapiens
<220> <221> CDS <222> (1) .. (1149)
<400> 21 age ctc tea gcc aac atg gag ctg gat gac agt gct gct gag tcc acc 48
Ser Leu Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala Glu Ser Thr 1 5 10 15 ggg aac tgt act teg tcc aag tgg gtt ecc cgg ggc gac tac ate gcc 96 Gly Asn Cys Thr Ser Ser Lys Trp Val Pro Arg Gly Asp Tyr He Ala 20 25 30
tcc aac acg gac gaa tgc acá gcc acá ctg atg tac gcc gtc aac ctg 144 Ser Asn Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala Val Asn Leu 35 40 45
aag caá tet ggc acc gtt aac ttc gaa tac tac tat cea gac tcc age 192 Lys Gln Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro Asp Ser Ser 50 55 60
ate ate ttt gag ttt ttc gtt cag aat gac cag tgc cag ecc aat gca 240
He He Phe Glu Phe Phe Val Gln Asn Asp Gln Cys Gln Pro Asn Ala
65 70 75 80
gat gac tcc agg tgg atg aag acc acá gag aaa gga tgg gaa ttc cae 288 Asp Asp Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp Glu Phe His 85 90 95 agt gtg gag cta aat cga ggc aat aat gtc ctc tat tgg aga acc acá 336 Ser Val Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp Arg Thr Thr 100 105 110
gcc ttc tea gta tgg acc aaa gta ecc aag ect gtg ctg gtg aga aac 384 Ala Phe Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu Val Arg Asn 115 120 125 att gcc ata acá ggg gtg gcc tac act tea gaa tgc ttc ecc tgc aaa 432
He Ala He Thr Gly Val Ala Tyr Thr S r Glu Cys Phe Pro Cys Lys 130 135 140
5 ect ggc acg tat gca gac aag cag ggc tcc tet ttc tgc aaa ctt tgc 480
Pro Gly Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys Lys Leu Cye 145 150 155 160
cea gcc aac tet tat tea aat aaa gga gaa act tet tgc cae cag tgt 528
* 10 Pro Ala Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys His Gln Cys 165 170 175
gac ect gac aaa tac tea gag aaa gga tet tet tcc tgt aac gtg cgc 576 Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn Val Arg
15 180 185 190
cea gct tgc acá gac aaa gat tat ttc tac acá cae acg gcc tgc gat 624
Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala Cys Asp 195 200 205 20 gcc aac gga gag acá caá ctc atg tac aaa tgg gcc aag ceg aaa ate 672
Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro Lys He 210 215 220
25 tgt age gag gac ctt gag ggg gca gtg aag ctg ect gcc tet ggt gtg 720 Cys Ser Glu Asp Leu Glu Gly Ala Val Lye Leu Pro Ala Ser Gly Val 225 230 235 240 aag acc cae tgc cea ecc tgc aac cea ggc ttc ttc aaa acc aac aac 768 Lys Thr His Cys Pro Pro Cys ASii Pro Gly Phe Phe Lys Thr Asn Aen 245 250 255
age acc tgc cag ecc tgc cea tat ggt ecc tac tcc aat ggc tea gac 816 Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly Ser Asp 260 265 270
tgt acc cgc tgc ect gca ggg act gaa ect gct gtg gga ttt gaa tac 864 Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe Glu Tyr 275 280 285
aaa tgg tgg aac acg ctg ecc acá aac atg gaa acg acc gtt ctc agt 912 Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val Leu Ser 290 295 300
ggg ate aac ttc gag tac aag ggc atg acá ggc tgg gag gtg gct ggt 960
Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val Ala Gly
305 310 315 320
gat cae att tac acá gct gct gga gcc tea gac aat gac ttc atg att 1008
Asp His He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe Met He 325 330 335
ctc act ctg gtt gtg cea gga ttt aga ect ceg cag teg gtg atg gca 1056 Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala 340 345 350 gac acá gag aat aaa gag gtg gcc aga ate acá ttt gtc ttt gag acc 1104 Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu Thr 355 360 365
ctc tgt tet gtg aac tgt gag ctc tac ttc atg gtg ggt gtg aat 1149 Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn 370 375 380
<210> 22 <211> 383 < 12> PRT <213> Homo sapiens
<400> 22 Ser Leu Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala Glu Ser Thr 1 5 10 15
Gly Aen Cye Thr Ser Ser Lye Trp Val Pro Arg Gly Asp Tyr He Ala 20 25 30
Ser Asn Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala Val Asn Leu 35 40 45
Lye Gln Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro Asp Ser Ser 50 55 60
He He Phe Glu Phe Phe Val Gln Asn Asp Gln Cye Gln Pro Aen Ala 65 70 75 80 Asp Asp Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp Glu Phe His 85 90 95
Ser Val Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp Arg Thr Thr 5 100 105 110
Ala Phe Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu Val Arg Asn 115 120 125
* 10 He Ala He Thr Gly Val Ala Tyr Thr Ser Glu Cys Phe Pro Cys Lys 130 135 140
Pro Gly Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys Lys Leu Cys 145 150 155 160
• 15 * Pro Ala Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys His Gln Cys 165 170 175
Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn Val Arg 20 180 185 190
Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala Cys Asp
• 195 200 205
25 Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro Lys He 210 215 220 Cys Ser Glu Asp Leu Glu Gly Alá Val Lys Leu Pro Ala Ser Gly Val 225 230 235 240
Lys Thr His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr Asn Asn 5 245 250 255
Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly Ser Asp 260 265 270
s" 10 Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe Glu Tyr 275 280 285
Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val Leu Ser 290 295 300 15 " Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val Ala Gly 305 310 315 320
Asp His He Tyr Thr Ala Ala Gly Ala Ser Aep Asn Asp Phe Met He 20 325 330 335
Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala 340 345 350
25 Asp Thr Glu Asn Lye Glu Val Ala Arg He Thr Phe Val Phe Glu Thr 355 360 365 Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn 370 375 380
Claims (34)
1.- Un ácido nucleico purificado o aislado, caracterizado porque comprende una secuencia de ácido nucleico que se elige del grupo de las siguientes secuencias: a) ia secuencia SEC ID NO.: 1 ; b) la secuencia de un fragmento de por lo menos 18 nucleótidos consecutivos, de la secuencia SEC ID NO.: 1 suprimida de su fragmento poliA terminal; c) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); d) la secuencia complementaria a, o la secuencia del ARN que corresponde a una secuencia como se define en los incisos a), b) o c), con la excepción de que la secuencia SEC ID NO. 11 del documento WO 99/54461 de la secuencia SEC ID NO. 51 del documento WO 99/06548 de la secuencia SEC ID No. 254 del documentro WO 99/06550 y de las tres secuencias descritas en los documentos del banco de datos EMBL bajo los números de identificación Al 672868, AA 890726 y Al 301140.
2.- El ácido nucleico purificado o aislado, de conformidad con la reivindicación 1 , caracterizado además porque comprende las secuencias que se eligen de las siguientes secuencias: a) las secuencias SEC ID No. 5, SEC ID No. 7, SEC ID No. 15, SEC ID No. 17 y SEC ID No. 19; b) la secuencia de un fragmento de por lo menos 18 nucleótidos de la secuencia SEC ID No. 19; c) una secuenda de ácido nucleico que fiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); y d) la secuencia complementaria a, o la secuencia de ARN que corresponde a una secuencia como se define en los incisos a), b) o c).
3.- El ácido nucleico purificado o aislado de conformidad con la i reivindicación 1 ó 2, caracterizado además porque las secuencias del mismo se eligen de las siguientes secuencias: a) SEC ID No. 1, SEC ID No. 3, SEC ID No. 5, SEC ID No. 7, SEC ID No. 9, SEC ID No. 15, SEC ID No. 17, SEC ID No. 19 y SEC ID No. 21 ; b) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en el inciso a); y c) la secuencia complementaria a, o la secuencia de ARN que corresponde a una secuencia como se define en los incisos a) o b).
4.- Un método para detección sistemática de genotecas de ADNc o ADN o para clonación de material genómico aislado o ADNc, caracterizado porque utiliza una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3.
5.- Un método para identificar un ácido nucleico de por lo menos 18 nucleótidos consecutivos de la secuencia del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, el ácido nucleico comprende por lo menos una mutación responsable de la expresión anormal del gen, caracterizado porque utiliza una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3.
6.- Un método para identificar la secuencia genómica del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, preferiblemente las secuencias de ácido nucleico que promueven y/o regulan la expresión, el método está caracterizado porque utiliza una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3.
7.- Un ácido nucleico caracterizado porque se identifica utilizando un método como se reclama en cualquiera de las reivindicaciones 5 y 6.
8.- Un polipéptido aislado o purificado, caracterizado porque está codificado por un ácido nucleico como se reclama en una de las reivindicaciones 1 a 3, y 7.
9.- Un polipéptido purificado o aislado, caracterizado porque comprende una secuencia de aminoácidos que se elige del siguiente grupo: a) la secuencia SEC ID No. 2; b) la secuencia de un fragmento de por lo menos 6 aminoácidos de la secuencia SEC ID No. 22, preferiblemente de la secuencia SEC ID No. 20; y c) la secuencia de aminoácidos que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en el inciso a) o b).
10.- El polipéptido de conformidad con la reivindicación 8, caracterizado además porque la secuencia del mismo se elige de la secuencia SEC ID No. 2, SEC ID No. 4, SEC ID No. 6, SEC ID No. 8, SEC ID No. 10, SEC ID No. 16, SEC ID No. 18, SEC ID No. 20 o SEC ID No. 22, o una secuencia que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima con estas secuencias.
11.- Un vector de clonación y/o de expresión caracterizado porque contiene una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7.
12.- El vector de conformidad con la reivindicación 11, caracterizado además porque comprende los elementos necesarios para su expresión en una célula huésped.
13.- Una célula huésped caracterizada porque se transforma con un vector como se reclama en la reivindicación 11 6 12.
14.- Un mamífero, excepto un humano, caracterizado porque comprende una célula, de conformidad con la reivindicación 13.
15.- El uso de una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7, como una sonda o iniciador para detectar y/o amplificar secuencias de ácido nucleico.
16.- El uso de un ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7, como un oligonucleótido directo o antisentido.
17.- El uso de una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7, para elaborar un polipéptido recombinante.
18.- Un método para producir un polipéptido recombinante, caracterizado porque una célula transformada, como se reclama en la reivindicación 13, se cultiva bajo condiciones que permiten la expresión del polipéptido recombinante, y en doríde se recupera el polipéptido recombinante.
19.- Un polipéptido, caracterizado porque se obtiene utilizando un método como se reclama en la reivindicación 18.
20.- Un anticuerpo monoclonal o policlonal, o un fragmento del mismo, anticuerpo quimérico o inmunoconjugado, caracterizado porque es capaz de reconocer específicamente un polipéptido como se reclama en una de las reivindicaciones 8 a 10 y 19, o el polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461, SEC ID No. 254 del documento WO 99/06550 o la SEC ID No. 51 del documento WO 99/06548.
21.- Un método para detectar y/o purificar un polipéptido, caracterizado porque utiliza un anticuerpo como se reclama en la reivindicación 20.
22.- Un método para diagnosticar una condición patológica asociada con la expresión anormal del gen que codifica para el polipéptido de la SEC ID No. 2, caracterizado porque se utiliza una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7.
23.- Un método para diagnosticar una condición patológica relacionada con la presencia de por lo menos una mutación del gen que codifica para el polipéptido de la SEC ID No. 2 utilizando una muestra biológica de un paciente, caracterizado porque comprende las siguientes etapas: a) cuando sea apropiado, aislar el ADN genómico de la muestra biológica que se va a analizar, u obtener ADNc a partir de ARN de la muestra biológica; b) amplificar específicamente la secuencia de ADN del gen que probablemente contenga una mutación, utilizando iniciadores elegidos de los ácidos nucleicos como se reivindican en una de las reivindicaciones 1 a 3 y 7; c) analizar los productos de amplificación que se obtienen al comparar su secuencia con la secuencia normal correspondiente del gen.
24.- Un método para diagnosticar una condición patológica asociada con la expresión anormal del polipéptido de la secuencia SEC ID No. 2, caracterizado porque uno o más anticuerpos como se reclaman en la reivindicación 20 se ponen en contacto con el material biológico que se va a probar, bajo condiciones que permiten la posible formación de complejos inmunológicos específicos entre el polipéptido y el anticuerpo o los anticuerpos, y en donde los complejos inmunológicos que posiblemente se formen se detectan y/o cuantifican.
25.- Un método para seleccionar compuestos químicos o bioquímicos capaces de modular la actividad del polipéptido de la secuencia SEC ID No. 2, in vitro o in vivo, caracterizado porque comprende poner en contacto un polipéptido como se reclama en una de las reivindicaciones 8 a 10 y 19, el polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461, la SEC ID No. 254 del documento WO 99/06550 o la SEC ID No. 51 del documento WO 99/06548 o una célula como se reclama en la reivindicación 13 en contacto con un compuesto candidato, y detectar una modificación de la actividad del poiipéptido de la secuencia SEC ID No. 2.
26.- Un método para seleccionar compuestos químicos o bioquímicos capaces de unirse al polipéptido de la secuencia SEC ID No. 2, caracterizado porque comprende poner en contacto un polipéptido de conformidad con una de las reivindicaciones 8 a 10 y 19, el polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461 , SEC ID No. 254 del documento WO 99/06550 o SEC ID No. 51 del documento WO 99/06538 o una célula como se reclama en la reivindicación 13 en contacto con un compuesto candidato, y detectar la formación de un complejo entre el compuesto candidato y el polipéptido.
27.- Un método para seleccionar compuestos químicos o bioquímicos capaces de interactuar, in vitro o in vivo, con una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7, caracterizado porque comprende poner en contacto una célula que expresa, normal o anormalmente, el gen que codifica para el polipéptido de la secuencia SEC ID No. 2, en contacto con un compuesto candidato, y detectar, directa o indirectamente, una modificación de la expresión de la actividad del polipéptido de la secuencia SEC ID No. 2.
28.- El uso de un polipéptido, como se reclama en una de las reivindicaciones 8 a 10 y 19, el polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461 , la SEC ID No. 254 del documento WO 99/06550 o la SEC ID No. 51 del documento WO 99/06548 o una célula como se reclama en la reivindicación 13 para estudiar la expresión o actividad del polipéptido de la secuencia SEC ID No. 2, y/o las interacciones directas o indirectas entre el polipéptido de la secuencia SEC ID No. 2 y los compuestos químicos o bioquímicos posiblemente involucrados en la actividad del polipéptido de la secuencia SÉC ID No. 2.
29.- Un compuesto caracterizado porque se selecciona utilizando un método como se reclama en una de las reivindicaciones 25 a 27.
30.- Un compuesto caracterizado porque se elige de: un anticuerpo, como se reclama en la reivindicación 20, un polipéptido, como se reclama en una de las reivindicaciones 8 a 10 y 19, un polipéptido, como se reclama en una de las reivindicaciones 8 a 10 y 19, caracterizado porque corresponde a un fragmento soluble del polipéptido de la secuencia SEC ID No. 2, un vector, como se reclama en la reivindicación 11 ó 12, un ácido nucleico, como se reclama en una de las reivindicaciones 1 a 3 y 7, el cual puede ser directo o antisentido.
31.- El compuesto de conformidad con cualquiera de las reivindicaciones 29 y 30, un polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461, la SEC ID No. 254 del documento WO 99/06550 o SEC ID No. 51 del documento WO 99/06548, o un ácido nucleico de la SEC ID No. 11 del documento WO 99/54461 , de la secuencia SEC ID No. 51 del documento WO 99/06548, de la secuencia SEC ID No. 254 del documento WO 99/06550 y de las tres secuencias descritas en los documentos del banco de datos EMBL bajo los números de identificación Al 672868, AA 890726 y Al 301140, los cuales pueden ser directos o antisentidos, como un producto medicinal.
32.- El compuesto de conformidad con la reivindicación 31 , para evitar y/o tratar condiciones patológicas relacionadas con una anormalidad de la expresión y/o actividad del polipéptido de la SEC ID No. 2.
33.- El compuesto de conformidad con cualquiera de las reivindicaciones 31 y 32, para evitar y/o tratar condiciones patológicas inmunitarias, en particular para evitar y/o tratar enfermedades autoinmunitarias o cánceres.
34.- El compuesto de conformidad con cualquiera de las reivindicaciones 31 y 32, para evitar y/o tratar infecciones de tipo viral, : micótico, bacteriano o parasitario. • RESUMEN DE LA INVENCIÓN La invención se relaciona con la identificación y caracterización de un gen novedoso que se expresa en células tumorales y que está relacionado con la regulación de la respuesta inmunitaria,. la clonación y la caracterización de su ADNc y los polipéptidos correspondientes. La ¡nvención también se relaciona con vectores que contienen un ácido nucleico que codifica para tal gen, células transformadas por los vectores y métodos de diagnóstico y métodos de selección de un compuesto químico o biológico capaz de interactuar, directa o indirectamente, con un ácido nucleico o un polipéptido de la invención. La invención se relaciona además con compuestos para tratar patologías inmunitarias, en particular enfermedades autoinmunes y cáncer. °2/ 2 ANEXÓ 1 (2) INFORMACIÓN SOBRE LA SEQ ID NO: 11 : (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1717 pares de base (B) TIPO: Acido nucleico (C) CADENA: individual (D) TOPOLOGÍA: Lineal (ii) TIPO DE MOLÉCULA: ADNc parcial producido a partir de EST individuales por ensamble y edición (iii) HIPOTÉTICO: NO (¡ii) ANTISENTIDO: NO (vi) ORIGEN: (A) ORGANISMO: SER HUMANO (C) ÓRGANO: (vii) OTRO ORIGEN: (A) GENOTECA: Genoteca de ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 11 «ttctaggac caacac cct tggagacgt ggaaaggttc caaaggcaaa cagtcotata 60 cctacateat tgaggagaac actaceacga gcttcacctg ggccttccßg aggaccactt 120 t cat?tag?íC aagcaggaag taaaccaatg acgttgcoaa gststastsd atcaatgtca 180 ccaatgtfcat gaatggcugtg gcctcctact gccgtccctg tgccctagaa gcctctgatg 240 tgggatcstc ctgcacctcfc tgtcctgctg gttastatat tgaocgagat tcaggaacct 3O0 yccaetcct coce ot ac acaattctga aagcccacca gcettatggt gtccaggcct 360 gtg gcccfcg tggtccaggg aecAagaaea aeaá atcca cfcctctgtgc tacaatf&tt 420 g?acettctc aogcaacact ccaaccagga ctttcaacta caaottctcc gct tggcaa 480 acaccgtcac tcttgctgga gggcaaagct teaettooaa agggttgaaa tacttscatc 540 fcatttaccct eagtctctgt ggaaaccagg gtaggaaaat gtctftgtgc acogacaatg 600 tcactgacct ccgg&ttcct gagggtgagt cagggttcts caaattítat? ac<*g-ect*c 660 tctgccaggc agt-catcatc cccocagagg tgacaggcta caaggccggg gttfccctcac 720 agcctgfccag QCttgctgat cyacttattg gggtgacaac agatatgact ctggatggaa 780 tScßcctccsé agetgaaett ttccacctgg agtccttggg aataccggac gtg&tcttct 840 trt'fcmts gtc caatgatgtg acccagtcct gcagttctg gagat?aacc accátccgc? 900 taag tgcag tccacagaaa act técctg gaagtttg?t getgscagga acgtgctsag 960 atgggacctg tgatggctgc aacttccact tcctgtggga gagcgcggct gcttgcccgcl,020 tctgctcßgt ggctgác ac cat ctatcg tcagcagct tgtggctggg atscagaßgalOSO cfcacfctasgt gtggcgagaa cccaagctat gctctggtg catttctctg cctgagcagall40 g>'accát cfcgc&aaa.cc atagatttct ggetgáaagt gggcatctct goaggcacct!200 gfeactgccat cctgctcacc gtcttgacct gctacttttg gaaaaagaat caaaaactagl260 if caa?fia ctocaa.gc.tg gtgatgaatg ctactctcaa ggactgtgac ctgccageagl320 e 5a.eagd g cgccatcatg gaaggcgagg atgtagagga cgacctcatc tttaccagcaI380 a aágfccác€ ctfetgggaa atcaaatcat ttaaetccaa gaggactcct gatggatttgl 0 ac cagtgcc gctgáa$aca tcctcaggag gcccagacat ggacctgtga gaggcactgciSOO ctíjcctcacc tgcstcctca ccttgpatag cacctttgca agcctgsgge gatttgggtglS€O ccáge'tftect gcaacaccca ctgctgg&aa tctcttcatt gtggccttat cagatgtttgl620 aatttcagat cttttt'ttat agagtaccca aaccctcct.t tctgcttgcc tcaaacctgc!680 casatatácc cftcactttgt ttgtasatta aaaaaaa 1717 (2) INFORMACIÓN SOBRE LA SEQ ID NO: 173: (A) LONGITUD: 495 aminoácidos 0 (B) TIPO: Proteína (C) CADENA: Individual (D) TOPOLOGÍA: Lineal (¡i) TIPO DE MOLÉCULA: ORF (¡ii) HIPOTÉTICO: Sí 15 (vi) ORIGEN: (A) ORGANISMO: SER HUMANO (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 173 20 SRTNTBVE?W KGSKGKQSYT YIIEEísm'TS FTW&FQRTTF HE?SRKYTND VftKIYSINVT 60 Nyfß3i3v?¡,s¥£ GSéCTSCÍAG r??fíROSÍGÍC A8QE?GV fi.C?20 VPCGPGTKÑN KIHSLCVNDC FNYNF5R A VTLAGGPSF TSKG KIFÜH180 Ri?áSVCTDNV. TPtR?g&GES GFSKSÍISÍ? COWÍ?PPEV TG?KAGVSSQ2 0 eVSt&DjRLXG VT?Dj .DGZ TSPñEL Sí?e SÍ.GIP0YIFF XjRSNDVTQSC SSGRST?XRV300 SC^QKT?PG SÍ& PGTCSD GTCDGCNFHF LWÉS ACFX, CSWU3?HAIV sscvÁ ÍQí íáeo ?Y WREP?OiC! SGG?SL?'fidR. rcfór?DFW LKVGISAG C YFWKKNQKI,B 2Q XKYS?O VWNA f KócoLPm DSCÁ?'HSGÜD VEDDLXFTSK KS FG I SF TSKR?PÜGFD480 ÓVPtKfSSGS 495 1 ANEXO 2 (2) INFORMACIÓN SOBRE SEQ ID NO: 51 (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 466 pares de base (B) TIPO: ACIDO NUCLEICO (C) CADENA: DOBLE (D) TOPOLOGÍA: LINEAL (ii) TIPO DE MOLÉCULA: ADNc (vi) FUENTE ORIGINAL: (A) ORGANISMO: Homo Sapiens (F) TIPO DE TEJIDO: Próstata cancerosa (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: sig_péptido (B) UBICACIÓN: 17..127 (C) MÉTODO DE IDENTIFICACIÓN: Matriz de Von Heijne (D) OTRA INFORMACIÓN: puntuación 7.4 seq LWRLLLWAGTAFQ? X (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 51 : ftACTCAGGAC AACGCT ATG GCT GAG CCT GGG CAC AGC CAC QAT CTC TCC GCC 52 tíet Ala Glu Pro Gly His Ser HAS Kis Leu Ser Ala -3$ -30 AGA GTC ÁGG GGA AGA ACT GAG AGG CGC ATA CCC CGG CTG TGG CGG CTG 100 Arg Val ftrg Gly ATg Thr Glu Arg Arg lie' Pro Arg Leu Trp Arg Leu -25 -20 -15 -10 CTG CTC TGd GCT GGG ACC GCC TTC CAG GTG RMC CAG GGA MSG GRA CCG 148 leu Leu Trp Ala Gly Thr Ala Phß Gln Val Xaa Gln G?y Xaa Xaa Pro • -S 1 5 GAG CT? CAS GCC TGC ?RA GAG TCT GAG TAC CAC TAT GAG TAC ACG GCG 196 Glu I?U Xaa Ala Cys Lys Giu Ser Glu Tyr His Tyr Glu Tyr Thr Ala 10 15 20 TGT GAC AGC ACG GGT TCC AGG TGG AGG GTC GCC GTG CCG CAT ACH YCG 244 Cys Asp Ser Thr Gly Ser Arg Trp Arg Val Ala Val Pro His Thr Xaa 25 30 35 GGC CTG TGC. ACC AGC CTG CCT GAC CCC GTC AAG GGC ACC GAG TGC TSN 292 Gly Leu Cys Thr Ser Leu Pro Asp Pro Val Lys Gly Thr Glu Cys Xaa 40 45 50 55 NTC TCC TGC AAC GCC GGG GAG TTT CTG GAT ATG AAG GAC CAG TCA TGT 340 Xaa Sar Cys Asn Ala Gly Glu Phe Leu Asp Mst Lys Asp Gln Ser Cys 60 S5 70 NNG CCA TGC GCT GAG GGC CGC TAC TCC CTC GGC ACÁ GGC ATT CGG TTT 388 Xaa Pro Cys Ala Glu Gly Arg Tyr Ser Leu Gly Thr Gly He Arg Phe 75 80 85 GAT GAG TGG GAT GAG CTG CCC CAT GGC TTT GCA GCC TCT CAG CCA ACÁ 436 Asp Glu Trp Asp Glu t,eu Pro fiis Gly Ph-s Ala Ala Ser Gln Pro Thr 90 95 100 TGG AGC TGG ATG ACÁ GTG CTG CTG AGT CAC 4S6 Trp Ser Trp Mßt Thr Val Lau Leu Ser His 105 110 ANEXO 3 (2) INFORMACIÓN SOBRE SEQ ID NO: 254: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 477 pares de base (B) TIPO: ACIDO NUCLEICO (C) CADENA: DOBLE (D) TOPOLOGÍA: LINEAL (ii) TIPO DE MOLÉCULA: ADNc (vi) FUENTE ORIGINAL: (A) ORGANISMO: Homo Sapiens (F) TIPO DE TEJIDO: Próstata normal (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: Otro (B) UBICACIÓN: Complemento (43..130) (C) MÉTODO DE IDENTIFICACIÓN: blastn (D) OTRA INFORMACIÓN: identidad 97 región 176..263 id C01485 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: Otro (B) UBICACIÓN: Complemento (137..219) (C) MÉTODO DE IDENTIFICACIÓN: blastn (D) OTRA INFORMACIÓN: identidad 100 región 88..170 id C01485 est (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: sig_péptido (B) UBICACIÓN: 421..459 (C) MÉTODO DE IDENTIFICACIÓN: Matriz de Von Heijne (D) OTRA INFORMACIÓN: puntuación 5.6 seq MSLTSGFLRVSQG/SP (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 254: CACCAATGTT ATGAATGGCG TGGCCTCCTA CTGCCGTCCC TGTGCCCTAG AAGCCTCTGA 60 TGTGGGCTCC TCCTGCACCT CTTGTCCTGC TGGTTACTAT ATTOACCGAG ATTCAGGAAC 120 CTGCCAMTCC BTGCCCCCCT AACACAATTC TGAAAGCCCA CCAGCCTTAT GGTGTCCAGG 180 CCTGTGTGCC CTGTGGTCCA GGGACCAAGA ACAACAAGAT CCACTCTCTG TGCTACAATG 240 ATTGCACCTT CTCACGCAAC ACTCCA^CCA GGACTTTCAA CTACAACTTC TCCGCTTTGG 300 CAAACACCGT CACTCTTGCT GGAGGGCCAA GCTTCACTTC CAAAGGGTTG AAATACTTCC 360 ATCACTTTAC CCTCAGTCTC TGTGGAAACC AGGGTAGGAA AATGTCTGTG TGCACCGACA 420 ATG TCA CTG ACC TCC GGA TTC CTG AGG GTG AGT CAG GGT TCT CCA AAT 468 Met Ser Leu Thr Ser Gly Phe Leu Arg Val Ser Gln Gly Ser Pro Asn -10 -5 1 CTA TCA CAG 477 Leu Ser Gln 5 ANEXO 4 1: AA890726 IDENTIFICADORES dbEST Id: 1618753 Nombre EST: ak13d08.s1 Número de cuenta: AA890726 GenBank gi: 3017605 * 10 INFORMACIÓN DE LOS CLONES ld de los clones: IMAGE: 1405839 (3') Fuente: IMAGE Consortium, LLNL Longitud de inserto: 1325 15 Tipo de ADN: ADNc INICIADORES Secuenciación: -40m13 fwd. ET de Amersham Cola de PoliA: Desconocido SECUENCIA tfT^TTTTTTJUSAAACAAAGTGTGGGT^^ GTWGSGTAC?HOTATAW?AA^ AGA ?TCC& ASTGGGTG?TGCM TGCTA?GCAA G^GAG AG CAGGTGAGGC^^ CAGGT yy^ ACG TGAG AGGATGGC C^G TGCCTG yiGAGATG Calidad: La secuencia de alta calidad se detiene en la base: 497 Entrada creada 2 de abril de 1998 Ultima actualización 4 de enero de 1999 COMENTARIOS Preparación de la genoteca de ADNc: M. Bento Soares, Ph. D., M. Fatima Bonaldo, Ph. D. Genoteca del ADNc arreglada por: Greg Lennon, Ph. D. Secuenciación del ADN por: Washington University Genome Sequencing Center Distribución de los clones: La información sobre la distribución del clon NCI-CGAP puede hallarse a través de I.M.A.G.E. Consortium/LLNL en: www-bio.llnl.gov/bbrp/image/image.html GENOTECA Nombre de genoteca: Soares_parathyroid_tumor_NbHPA Organismo: Homo sapiens Órgano: glándula paratiroides Tipo de tejido: tumor en paratiroides Etapa de desarrollo: Adulto Cepa hospedera: DH10B (resistente a ampicilina) Vector: pT7T3D (Pharmacia) con un polienlazador modificado Sitio R. 1 : Not l Sitio R. 2: Eco Rl Descripción: La primera cadena de ADNc se inició con un iniciador oligo (dT) - Not I [5'- TGTTACCAATCTGAAGTGGGAGCGGCCGCACCAAI I I I I I I I I I M I I I I I i i i i i i i ? -3'], el ADNc de doble cadena se seleccionó por el tamaño, se ligó a adaptadores Eco Rl (Pharmacia), fue digerida con Not I y fue clonada en los sitios Not I y Eco Rl de un vector pT7T3 modificado (Pharmacia). La genoteca pasó por un ciclo de normalización a un Cot = 5. Genoteca construida por Bento Soares y M. Fatima Bonaldo. El Dr. Stephen Marx del Instituto de Diabetes y Enfermedades Digestivas y Hepáticas, NIH por sus siglas en inglés, tuvo la gentileza de proveer el ARN de adenomas de paratiroides esporádicos. DEPOSITANTE Nombre: Robert Strausberg, Ph. D. Correo-e: cgapbs-r@mail.nih.gov CITAS Título: Instituto Nacional Contra ei Cáncer, Proyecto de Anatomía del Genoma del Cáncer (CGAP), índice Génico en Tumores Autores: NCI-CGAP http://www.ncbi.nlm.nih.gov/ncicgap Año: 1997 Condición: Sin publicar 1: AI672868 IDENTIFICADORES dbEST Id: 2553046 Nombre EST: we72g04.xl Número de cuenta: AI672868 GenBank gi: 4852599 INFORMACIÓN DE LOS CLONES Id de los clones: IMAGE: 2346678(3') Fuente: NCI Longitud de inserto: 706 Tipo de ADN: ADNc INICIADORES Secuenciación: -40UP de Gibco Cola de PoliA: Desconocido SECUENCIA GAGCCCTGCTTGTCTGCATACGTGCi^GGTTTGI^GGGGA^ ÁCCCCTGTTAT GCAAT TTCTC-ACC^ ^ GGC2G!?GGTTCTC( TAGAGGAC&TO TTG8^ FCCCATCCT?TCFCTGTGGTCTTCATCCACCTG^GT ^TCTGAACGAA?AACTCAAAGA GATGCTGGAGTCTGGATAGTAGTATTCGAAffiFTA ACGGTGCCA^SWTGCTTC?8TTGACGGCGTAC^TC^GTGTGGCTGTGCATICGTCCGTG TTGGAGGCGATGTAGTCGCCCCGGGGAACCCAC GGACGAAGTACAGTTCCCGGTGGA.C iC^GCAGCACTGTCATC ^CTCCATGTTGGCTGAGAGGCTGGCTJíAGCC Calidad: La secuencia de alta calidad se detiene en la base: 473 Entrada creada 18 de mayo de 1999 Última actualización 18 de diciembre de 1999 COMENTARIOS Este clon está disponible sin cargos por derecho a través de LLNL; comunicarse con IMAGE Consortium (inof@image.llnl.gov) para mayor información. GENOTECA Nombre de genoteca: Soares_Dieckgraefe_colon_NHCD Organismo: Homo sapiens Órgano: colon Tipo de tejido: mucosa de colon de 3 pacientes con enfermedad de Crohn Cepa hospedera: DH10B (resistente a fagos) Vector: pT7T3D-Pac (Pharmacia) con un polienlazador modificado Sitio R. 1 : Not l Sitio R. 2: Eco Rl Descripción: La primera cadena de ADNc se inició con un iniciador oligo (dT) - Not I [5'-TGTTACCAATCTGAAGTGGGAGCGGCCGCCGTC I I I I I I I I I I I I I I I I I I -3'], el ADNc de doble cadena se ligó a adaptadores Eco Rl (Pharmacia), fue digerida con Not I y fue clonada en los sitios Not I y Eco Rl del vector pT7T3 modificado. La genoteca pasó por una vuelta de normalización. Muestras de tejido proporcionadas por el Dr.Brian Dieckgraefe (Washington Universtity, dieck(5>im.wustl.edu): la mucosa del colon representa una escala de implicación de enfermedad de Crohn de moderada a grave; las muestras incluyen muestras de perforación (fístulas) y de no perforación. Genoteca construida por Bento Soares y M. Fatima Bonaldo. DEPOSITANTE Nombre: Robert Strausberg, Ph. D. Correo-e: cgapbs-r@mail.nih.gov CITAS Título: Instituto Nacional Contra el Cáncer, Proyecto de Anatomía del Genoma del Cáncer (CGAP), índice Génico en Tumores Autores: NCI-CGAP http://www.ncbi.nlm.nih.gov/ncicgap Año: 1997 Condición: Sin publicar 1: AI301140 IDENTIFICADORES dbEST Id: 2074937 Nombre EST: qo16g05.x1 Número de cuenta: AI301140 GenBank gi: 3960486 INFORMACIÓN DE LOS CLONES Id de los clones: IMAGE: 1908728(3') Fuente: NCI Longitud de inserto: 1305 Tipo de ADN: ADNc INICIADORES Secuenciación: -40UP de Gibco Cola de PoliA: Desconocido SECUENCIA CAA?G?AAGTGTGGGTATATTTG?C&GGTTT^ TC!^ ?AiWAAAaTCTG^ C?GTGGGTGTTGCa^GA?GCTßGC&CCCAAA C A TG G CA G G G CA C GT CCTCTC^^ TGTCTOC G^e&CT GTO'iAATC^ GA CTTCCCAAASí^rG?CTrCTTGC GGTAAAGATGAGGTC^TCCTCTACATCCTCGCC FTCC TGAT GCGC^CT C&GCT CTG C^^ GACG T<-& CA O^AC GTGCCT C GA^^ TA?GtíFT'WGCAGATGG?'GACTCT Calidad: La secuencia de alta calidad se detiene en la base: 10 460 Entrada creada 3 de diciembre de 1998 Última actualización 1 de febrero de 1999 15 COMENTARIOS Tejido proporcionado por: Christopher Moskaluk, M.D., Ph. D, Michael R. Emmert-Buck, M.D., Ph. D. Preparación de la genoteca de ADNc: M. Bento Soares, Ph. D. 20 Genoteca del ADNc arreglada por: Greg Lennon, Ph. D. Secuenciación del ADN por: Washington University Genome Sequencing Center Distribución de los clones: La información sobre ia distribución del clon NCI-CGAP puede hallarse a través de I.M.A.G.E. Consortium/LLNL en: www-bio.llnl.gov/bbrp/image/image.html GENOTECA Nombre de genoteca: NCI_CGAP_Lu5 Organismo: Homo sapiens Órgano: pulmón Tipo de tejido: carcinoide Cepa hospedera: DH 10B Vector: pT7T3D (Pharmacia) con un polienlazador modificado Descripción: La primera cadena de ADNc se preparó a partir de carcinoide de pulmón neuroendócrino, y entonces se inició con un iniciador oligo (dT) - Not I. El ADNc de doble cadena se ligó a adaptadores Eco Rl (Pharmacia), fue digerida con Not I y fue clonada en los sitios Not l y Eco Rl de un vector pT7T3 modificado. La genoteca se normalizó. La genoteca fue construida por Bento Soares y M. Fatima Bonaldo. DEPOSITANTE Nombre: Robert Strausberg, Ph. D. Cofreo-e: cgapbs-r@mail.nih.gov CITAS Título: Instituto Nacional Contra el Cáncer, Proyecto de Anatomía del Genoma del Cáncer (CGAP), índice Génico en Tumores Autores: NCI-CGAP http://www.ncbi.nlm.nih.gov/ncicgap Año: 1997 Condición: Sin publicar P02/666F
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9913629A FR2800388A1 (fr) | 1999-10-29 | 1999-10-29 | Clonage, expression et caracterisation d'un gene exprime dans des cellules tumorales et implique dans la regulation de la reponse immune |
PCT/FR2000/003032 WO2001031003A1 (fr) | 1999-10-29 | 2000-10-30 | Clonage, expression et caracterisation d'un gene exprime dans des cellules tumorales et implique dans la regulation de la reponse immune |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA02004297A true MXPA02004297A (es) | 2002-10-31 |
Family
ID=9551565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MXPA02004297A MXPA02004297A (es) | 1999-10-29 | 2000-10-30 | Clonacion, expresion y caracterizacion de un gen que se expresa en celulas tumorales y que esta relacionado con la regulacion de la respuesta inmunitaria. |
Country Status (10)
Country | Link |
---|---|
EP (1) | EP1226248A1 (es) |
JP (1) | JP2003516126A (es) |
CN (1) | CN1391608A (es) |
AU (1) | AU1284801A (es) |
BR (1) | BR0015161A (es) |
CA (1) | CA2389522A1 (es) |
FR (1) | FR2800388A1 (es) |
MX (1) | MXPA02004297A (es) |
WO (1) | WO2001031003A1 (es) |
ZA (1) | ZA200203340B (es) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6951738B2 (en) | 1999-07-16 | 2005-10-04 | Human Genome Sciences, Inc. | Human tumor necrosis factor receptors TR13 and TR14 |
JP2003252801A (ja) * | 2002-02-27 | 2003-09-10 | Japan Science & Technology Corp | 下垂体特異的遺伝子の使用法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU8555198A (en) * | 1997-08-01 | 1999-02-22 | Genset | 5' ests for secreted proteins expressed in prostate |
EP1000146B1 (en) * | 1997-08-01 | 2006-08-30 | Serono Genetics Institute S.A. | 5'ESTs FOR NON TISSUE SPECIFIC SECRETED PROTEINS |
DE19817948A1 (de) * | 1998-04-17 | 1999-10-21 | Metagen Gesellschaft Fuer Genomforschung Mbh | Menschliche Nukleinsäuresequenzen aus Endometrium-Tumor |
JP2002539826A (ja) * | 1999-03-26 | 2002-11-26 | スミスクライン ビーチャム バイオロジカルズ ソシエテ アノニム | 新規化合物 |
WO2001002568A2 (en) * | 1999-07-02 | 2001-01-11 | Chiron Corporation | Human genes and gene expression products |
-
1999
- 1999-10-29 FR FR9913629A patent/FR2800388A1/fr active Pending
-
2000
- 2000-10-30 BR BR0015161-0A patent/BR0015161A/pt not_active Application Discontinuation
- 2000-10-30 CA CA002389522A patent/CA2389522A1/fr not_active Abandoned
- 2000-10-30 WO PCT/FR2000/003032 patent/WO2001031003A1/fr not_active Application Discontinuation
- 2000-10-30 AU AU12848/01A patent/AU1284801A/en not_active Abandoned
- 2000-10-30 EP EP00974612A patent/EP1226248A1/fr not_active Withdrawn
- 2000-10-30 CN CN00816059A patent/CN1391608A/zh active Pending
- 2000-10-30 MX MXPA02004297A patent/MXPA02004297A/es unknown
- 2000-10-30 JP JP2001533984A patent/JP2003516126A/ja active Pending
-
2002
- 2002-04-26 ZA ZA200203340A patent/ZA200203340B/en unknown
Also Published As
Publication number | Publication date |
---|---|
ZA200203340B (en) | 2002-12-11 |
WO2001031003A1 (fr) | 2001-05-03 |
AU1284801A (en) | 2001-05-08 |
WO2001031003B1 (fr) | 2001-10-11 |
CN1391608A (zh) | 2003-01-15 |
FR2800388A1 (fr) | 2001-05-04 |
EP1226248A1 (fr) | 2002-07-31 |
JP2003516126A (ja) | 2003-05-13 |
CA2389522A1 (fr) | 2001-05-03 |
BR0015161A (pt) | 2002-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002502589A (ja) | 45個のヒト分泌タンパク質 | |
NZ503404A (en) | The presence of unique DNA and RNA molecules in prostate tumour cells and their use in diagnostic detection methods | |
JP2002525067A (ja) | レプチン誘導遺伝子 | |
JP2003508030A (ja) | 新規ポリペプチドおよびそれをコードする核酸 | |
CA2365243A1 (en) | Human transmembrane proteins | |
Pask et al. | The Candidate Sex-ReversingDAX1Gene Is Autosomal in Marsupials: Implications for the Evolution of Sex Determination in Mammals | |
JP2000510690A (ja) | 哺乳類混合リンパ球受容体、ケモカイン受容体(mmlr―ccr) | |
MXPA02004297A (es) | Clonacion, expresion y caracterizacion de un gen que se expresa en celulas tumorales y que esta relacionado con la regulacion de la respuesta inmunitaria. | |
JP2005504830A (ja) | Hkid−1関連タンパク質ファミリーの新規な分子およびその使用 | |
US7105315B2 (en) | Transmembrane protein differentially expressed in cancer | |
CA2401076A1 (en) | Molecules for disease detection and treatment | |
US20040058365A1 (en) | Molecules for disease detection and treatment | |
US6475752B1 (en) | Mammalian imidazoline receptor | |
US20040214990A1 (en) | Transmembrane protein differentially expressed in cancer | |
EP1263958B1 (en) | Nusap, a gene encoding a tissue-specific nuclear protein, useful as a diagnostic tool and therapeutic agent | |
US6670150B1 (en) | Isolated human receptor proteins, nucleic acid molecules encoding human receptor proteins, and uses thereof | |
US20020064855A1 (en) | Genes that regulate hematopoietic blood forming stem cells and uses thereof | |
CA2374822A1 (en) | Molecules for disease detection and treatment | |
US20030054385A1 (en) | Human ubiquitin-conjugating enzymes | |
US20040242468A1 (en) | Gene involved in mineral deposition and uses thereof | |
CA2433802A1 (en) | Secretory molecules | |
CA2380549A1 (en) | Secretory molecules | |
US20020164709A1 (en) | Nucleic acid endocing growth factor protein | |
US20030068787A1 (en) | Antibody specifically binding cyclophilin-type peptidyl-prolyl cis/trans isomerase | |
US20030113317A1 (en) | Molecules associated with apoptosis |