JPH0477498A - ヒトプロテアソーム - Google Patents
ヒトプロテアソームInfo
- Publication number
- JPH0477498A JPH0477498A JP19331390A JP19331390A JPH0477498A JP H0477498 A JPH0477498 A JP H0477498A JP 19331390 A JP19331390 A JP 19331390A JP 19331390 A JP19331390 A JP 19331390A JP H0477498 A JPH0477498 A JP H0477498A
- Authority
- JP
- Japan
- Prior art keywords
- leu
- ala
- glu
- gly
- gaa
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 title claims abstract description 63
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 title claims abstract description 63
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 22
- 108090000623 proteins and genes Proteins 0.000 claims description 71
- 210000004027 cell Anatomy 0.000 abstract description 33
- 239000000872 buffer Substances 0.000 abstract description 9
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 abstract description 7
- 238000004440 column chromatography Methods 0.000 abstract description 4
- 206010073071 hepatocellular carcinoma Diseases 0.000 abstract description 4
- 229910052588 hydroxylapatite Inorganic materials 0.000 abstract description 3
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 abstract description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 abstract description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 abstract description 2
- 238000002360 preparation method Methods 0.000 abstract description 2
- 239000006228 supernatant Substances 0.000 abstract description 2
- 239000007853 buffer solution Substances 0.000 abstract 1
- 210000000172 cytosol Anatomy 0.000 abstract 1
- 239000000032 diagnostic agent Substances 0.000 abstract 1
- 229940039227 diagnostic agent Drugs 0.000 abstract 1
- 239000003814 drug Substances 0.000 abstract 1
- 239000012894 fetal calf serum Substances 0.000 abstract 1
- 239000000463 material Substances 0.000 abstract 1
- 239000002994 raw material Substances 0.000 abstract 1
- 208000011580 syndromic disease Diseases 0.000 abstract 1
- 229940124597 therapeutic agent Drugs 0.000 abstract 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 36
- 238000000034 method Methods 0.000 description 35
- 108020004414 DNA Proteins 0.000 description 22
- 101001082432 Homo sapiens Heparin cofactor 2 Proteins 0.000 description 18
- 101000736929 Homo sapiens Proteasome subunit alpha type-1 Proteins 0.000 description 18
- 239000013598 vector Substances 0.000 description 18
- 102100036042 Proteasome subunit alpha type-1 Human genes 0.000 description 17
- 101000706678 Homo sapiens Proteasome subunit beta type-1 Proteins 0.000 description 16
- 102000004169 proteins and genes Human genes 0.000 description 16
- 239000000243 solution Substances 0.000 description 16
- 102100031566 Proteasome subunit beta type-1 Human genes 0.000 description 15
- 239000002299 complementary DNA Substances 0.000 description 15
- 101000577424 Homo sapiens Proteasome subunit alpha type-4 Proteins 0.000 description 14
- 239000003795 chemical substances by application Substances 0.000 description 14
- 101001136888 Homo sapiens Proteasome subunit alpha type-3 Proteins 0.000 description 13
- 102100028813 Proteasome subunit alpha type-4 Human genes 0.000 description 13
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- 102100035908 Proteasome subunit alpha type-3 Human genes 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 239000000203 mixture Substances 0.000 description 10
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 241000700159 Rattus Species 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 108091034057 RNA (poly(A)) Proteins 0.000 description 7
- 230000005856 abnormality Effects 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 6
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 6
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 6
- 108091036066 Three prime untranslated region Proteins 0.000 description 6
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 6
- 210000004185 liver Anatomy 0.000 description 6
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 238000010353 genetic engineering Methods 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 102000004594 DNA Polymerase I Human genes 0.000 description 4
- 108010017826 DNA Polymerase I Proteins 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- 239000004677 Nylon Substances 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 4
- 238000004587 chromatography analysis Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 229920001778 nylon Polymers 0.000 description 4
- 230000017854 proteolysis Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- 208000024827 Alzheimer disease Diseases 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 3
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 102000035195 Peptidases Human genes 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- 229920002684 Sepharose Polymers 0.000 description 3
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- CDRYEAWHKJSGAF-BPNCWPANSA-N Tyr-Ala-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O CDRYEAWHKJSGAF-BPNCWPANSA-N 0.000 description 3
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 3
- ZSXJENBJGRHKIG-UWVGGRQHSA-N Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UWVGGRQHSA-N 0.000 description 3
- 108091023045 Untranslated Region Proteins 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 3
- 239000012148 binding buffer Substances 0.000 description 3
- 230000003915 cell function Effects 0.000 description 3
- 239000001913 cellulose Substances 0.000 description 3
- 229920002678 cellulose Polymers 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010081551 glycylphenylalanine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 3
- 210000003494 hepatocyte Anatomy 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 2
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 2
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- BGNLUHXLSAQYRQ-FXQIFTODSA-N Ala-Glu-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BGNLUHXLSAQYRQ-FXQIFTODSA-N 0.000 description 2
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 2
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 2
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 2
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 2
- ATYWBXGNXZYZGI-ACZMJKKPSA-N Asp-Asn-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ATYWBXGNXZYZGI-ACZMJKKPSA-N 0.000 description 2
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 2
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 2
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 2
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 2
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 2
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 102100040004 Gamma-glutamylcyclotransferase Human genes 0.000 description 2
- VOLVNCMGXWDDQY-LPEHRKFASA-N Gln-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O VOLVNCMGXWDDQY-LPEHRKFASA-N 0.000 description 2
- ARPVSMCNIDAQBO-YUMQZZPRSA-N Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ARPVSMCNIDAQBO-YUMQZZPRSA-N 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 2
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 2
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 2
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 2
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 2
- JYGYNWYVKXENNE-OALUTQOASA-N Gly-Tyr-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JYGYNWYVKXENNE-OALUTQOASA-N 0.000 description 2
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000886680 Homo sapiens Gamma-glutamylcyclotransferase Proteins 0.000 description 2
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 2
- 101001090725 Leuconostoc gelidum Bacteriocin leucocin-A Proteins 0.000 description 2
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 2
- OAPNERBWQWUPTI-YUMQZZPRSA-N Lys-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O OAPNERBWQWUPTI-YUMQZZPRSA-N 0.000 description 2
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 2
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 2
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 2
- DBXMFHGGHMXYHY-DCAQKATOSA-N Met-Leu-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O DBXMFHGGHMXYHY-DCAQKATOSA-N 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 108010039918 Polylysine Proteins 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 2
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 2
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 2
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 2
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfisoxazole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- XQMGDVVKFRLQKH-BBRMVZONSA-N Trp-Val-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O)=CNC2=C1 XQMGDVVKFRLQKH-BBRMVZONSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000003698 anagen phase Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 238000000376 autoradiography Methods 0.000 description 2
- 238000010805 cDNA synthesis kit Methods 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 238000012869 ethanol precipitation Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000002523 gelfiltration Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 238000000265 homogenisation Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108010090114 methionyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- -1 phosphite triester Chemical class 0.000 description 2
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 2
- 229920000656 polylysine Polymers 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000001488 sodium phosphate Substances 0.000 description 2
- 229910000162 sodium phosphate Inorganic materials 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- WDVIDPRACNGFPP-QWRGUYRKSA-N (2s)-2-[[(2s)-6-amino-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCC(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WDVIDPRACNGFPP-QWRGUYRKSA-N 0.000 description 1
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- JEOQACOXAOEPLX-WCCKRBBISA-N (2s)-2-amino-5-(diaminomethylideneamino)pentanoic acid;1,3-thiazolidine-4-carboxylic acid Chemical compound OC(=O)C1CSCN1.OC(=O)[C@@H](N)CCCN=C(N)N JEOQACOXAOEPLX-WCCKRBBISA-N 0.000 description 1
- JFOWDKWFHZIMTR-RUCXOUQFSA-N (2s)-2-aminopentanedioic acid;(2s)-2,5-diamino-5-oxopentanoic acid Chemical compound OC(=O)[C@@H](N)CCC(N)=O.OC(=O)[C@@H](N)CCC(O)=O JFOWDKWFHZIMTR-RUCXOUQFSA-N 0.000 description 1
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- 102100039164 Acetyl-CoA carboxylase 1 Human genes 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 1
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 1
- GKAZXNDATBWNBI-DCAQKATOSA-N Ala-Met-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N GKAZXNDATBWNBI-DCAQKATOSA-N 0.000 description 1
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 1
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 1
- FVNAUOZKIPAYNA-BPNCWPANSA-N Ala-Met-Tyr Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FVNAUOZKIPAYNA-BPNCWPANSA-N 0.000 description 1
- OMNVYXHOSHNURL-WPRPVWTQSA-N Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMNVYXHOSHNURL-WPRPVWTQSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- OOBVTWHLKYJFJH-FXQIFTODSA-N Arg-Ala-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O OOBVTWHLKYJFJH-FXQIFTODSA-N 0.000 description 1
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 1
- VYSRNGOMGHOJCK-GUBZILKMSA-N Arg-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N VYSRNGOMGHOJCK-GUBZILKMSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- XNSKSTRGQIPTSE-ACZMJKKPSA-N Arg-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XNSKSTRGQIPTSE-ACZMJKKPSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 1
- FXGMURPOWCKNAZ-JYJNAYRXSA-N Arg-Val-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FXGMURPOWCKNAZ-JYJNAYRXSA-N 0.000 description 1
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- LTZIRYMWOJHRCH-GUDRVLHUSA-N Asn-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N LTZIRYMWOJHRCH-GUDRVLHUSA-N 0.000 description 1
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 1
- AYOAHKWVQLNPDM-HJGDQZAQSA-N Asn-Lys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AYOAHKWVQLNPDM-HJGDQZAQSA-N 0.000 description 1
- IQTUDDBANZYMAR-WDSKDSINSA-N Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O IQTUDDBANZYMAR-WDSKDSINSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 1
- WKGJGVGTEZGFSW-FXQIFTODSA-N Asp-Asn-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O WKGJGVGTEZGFSW-FXQIFTODSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 1
- FMWHSNJMHUNLAG-FXQIFTODSA-N Asp-Cys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FMWHSNJMHUNLAG-FXQIFTODSA-N 0.000 description 1
- LXKLDWVHXNZQGB-SRVKXCTJSA-N Asp-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O LXKLDWVHXNZQGB-SRVKXCTJSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 1
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 1
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 1
- JGLWFWXGOINXEA-YDHLFZDLSA-N Asp-Val-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JGLWFWXGOINXEA-YDHLFZDLSA-N 0.000 description 1
- 102100039339 Atrial natriuretic peptide receptor 1 Human genes 0.000 description 1
- 101710102163 Atrial natriuretic peptide receptor 1 Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 101150117204 C9 gene Proteins 0.000 description 1
- XHCUETHYSHFAKY-UHFFFAOYSA-N CCCCCCCCCCCCN(C)CC([Na])=O Chemical compound CCCCCCCCCCCCN(C)CC([Na])=O XHCUETHYSHFAKY-UHFFFAOYSA-N 0.000 description 1
- 101100392772 Caenorhabditis elegans gln-2 gene Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- NJMYZEJORPYOTO-BQBZGAKWSA-N Gln-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O NJMYZEJORPYOTO-BQBZGAKWSA-N 0.000 description 1
- XIYWAJQIWLXXAF-XKBZYTNZSA-N Gln-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XIYWAJQIWLXXAF-XKBZYTNZSA-N 0.000 description 1
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 1
- JZDHUJAFXGNDSB-WHFBIAKZSA-N Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O JZDHUJAFXGNDSB-WHFBIAKZSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- KLJMRPIBBLTDGE-ACZMJKKPSA-N Glu-Cys-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O KLJMRPIBBLTDGE-ACZMJKKPSA-N 0.000 description 1
- RQNYYRHRKSVKAB-GUBZILKMSA-N Glu-Cys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O RQNYYRHRKSVKAB-GUBZILKMSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- HKTRDWYCAUTRRL-YUMQZZPRSA-N Glu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 HKTRDWYCAUTRRL-YUMQZZPRSA-N 0.000 description 1
- SNFUTDLOCQQRQD-ZKWXMUAHSA-N Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SNFUTDLOCQQRQD-ZKWXMUAHSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 1
- CHDWDBPJOZVZSE-KKUMJFAQSA-N Glu-Phe-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CHDWDBPJOZVZSE-KKUMJFAQSA-N 0.000 description 1
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 1
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 1
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 1
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 1
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- SJLKKOZFHSJJAW-YUMQZZPRSA-N Gly-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN SJLKKOZFHSJJAW-YUMQZZPRSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 1
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- AJHCSUXXECOXOY-NSHDSACASA-N Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-NSHDSACASA-N 0.000 description 1
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 1
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- NNBWMLHQXBTIIT-HVTMNAMFSA-N His-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N NNBWMLHQXBTIIT-HVTMNAMFSA-N 0.000 description 1
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 1
- PZUZIHRPOVVHOT-KBPBESRZSA-N His-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CN=CN1 PZUZIHRPOVVHOT-KBPBESRZSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- 101000963424 Homo sapiens Acetyl-CoA carboxylase 1 Proteins 0.000 description 1
- DXUJSRIVSWEOAG-NAKRPEOUSA-N Ile-Arg-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N DXUJSRIVSWEOAG-NAKRPEOUSA-N 0.000 description 1
- WTOAPTKSZJJWKK-HTFCKZLJSA-N Ile-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WTOAPTKSZJJWKK-HTFCKZLJSA-N 0.000 description 1
- OEQKGSPBDVKYOC-ZKWXMUAHSA-N Ile-Gly-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N OEQKGSPBDVKYOC-ZKWXMUAHSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 1
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- DKEZVKFLETVJFY-CIUDSAMLSA-N Leu-Cys-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DKEZVKFLETVJFY-CIUDSAMLSA-N 0.000 description 1
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 1
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 1
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 1
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- DKTNGXVSCZULPO-YUMQZZPRSA-N Lys-Gly-Cys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O DKTNGXVSCZULPO-YUMQZZPRSA-N 0.000 description 1
- IGRMTQMIDNDFAA-UWVGGRQHSA-N Lys-His Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UWVGGRQHSA-N 0.000 description 1
- FMIIKPHLJKUXGE-GUBZILKMSA-N Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN FMIIKPHLJKUXGE-GUBZILKMSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- QRHWTCJBCLGYRB-FXQIFTODSA-N Met-Ala-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O QRHWTCJBCLGYRB-FXQIFTODSA-N 0.000 description 1
- PQPMMGQTRQFSDA-SRVKXCTJSA-N Met-Glu-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O PQPMMGQTRQFSDA-SRVKXCTJSA-N 0.000 description 1
- MVBZBRKNZVJEKK-DTWKUNHWSA-N Met-Gly-Pro Chemical compound CSCC[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N MVBZBRKNZVJEKK-DTWKUNHWSA-N 0.000 description 1
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 1
- ZIIMORLEZLVRIP-SRVKXCTJSA-N Met-Leu-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZIIMORLEZLVRIP-SRVKXCTJSA-N 0.000 description 1
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 1
- LNXGEYIEEUZGGH-JYJNAYRXSA-N Met-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=CC=C1 LNXGEYIEEUZGGH-JYJNAYRXSA-N 0.000 description 1
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- WSPQHZOMTFFWGH-XGEHTFHBSA-N Met-Thr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(O)=O WSPQHZOMTFFWGH-XGEHTFHBSA-N 0.000 description 1
- ANCPZNHGZUCSSC-ULQDDVLXSA-N Met-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 ANCPZNHGZUCSSC-ULQDDVLXSA-N 0.000 description 1
- IBAQFPQHRJAVAV-ULAWRXDQSA-N Miglitol Chemical compound OCCN1C[C@H](O)[C@@H](O)[C@H](O)[C@H]1CO IBAQFPQHRJAVAV-ULAWRXDQSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 108010068519 N-benzyloxycarbonyl-alanyl-arginyl-arginine 4-methoxy-2-naphthylamide Proteins 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- JEGFCFLCRSJCMA-IHRRRGAJSA-N Phe-Arg-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N JEGFCFLCRSJCMA-IHRRRGAJSA-N 0.000 description 1
- JIYJYFIXQTYDNF-YDHLFZDLSA-N Phe-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N JIYJYFIXQTYDNF-YDHLFZDLSA-N 0.000 description 1
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 1
- UEXCHCYDPAIVDE-SRVKXCTJSA-N Phe-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEXCHCYDPAIVDE-SRVKXCTJSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- MMYUOSCXBJFUNV-QWRGUYRKSA-N Phe-Gly-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N MMYUOSCXBJFUNV-QWRGUYRKSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- PYOHODCEOHCZBM-RYUDHWBXSA-N Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 PYOHODCEOHCZBM-RYUDHWBXSA-N 0.000 description 1
- RTUWVJVJSMOGPL-KKUMJFAQSA-N Phe-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RTUWVJVJSMOGPL-KKUMJFAQSA-N 0.000 description 1
- ODGNUUUDJONJSC-UFYCRDLUSA-N Phe-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O ODGNUUUDJONJSC-UFYCRDLUSA-N 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- HXNYBZQLBWIADP-WDSKDSINSA-N Pro-Cys Chemical compound OC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 HXNYBZQLBWIADP-WDSKDSINSA-N 0.000 description 1
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 1
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 1
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 1
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 239000012614 Q-Sepharose Substances 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 101150023114 RNA1 gene Proteins 0.000 description 1
- 108010025216 RVF peptide Proteins 0.000 description 1
- 101100191561 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PRP3 gene Proteins 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- JFWDJFULOLKQFY-QWRGUYRKSA-N Ser-Gly-Phe Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JFWDJFULOLKQFY-QWRGUYRKSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 1
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 1
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 1
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- BTAJAOWZCWOHBU-HSHDSVGOSA-N Thr-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)C(C)C)C(O)=O)=CNC2=C1 BTAJAOWZCWOHBU-HSHDSVGOSA-N 0.000 description 1
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- UBAQSAUDKMIEQZ-QWRGUYRKSA-N Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBAQSAUDKMIEQZ-QWRGUYRKSA-N 0.000 description 1
- WVRUKYLYMFGKAN-IHRRRGAJSA-N Tyr-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WVRUKYLYMFGKAN-IHRRRGAJSA-N 0.000 description 1
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 1
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- VYQQQIRHIFALGE-UWJYBYFXSA-N Tyr-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VYQQQIRHIFALGE-UWJYBYFXSA-N 0.000 description 1
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- DJSYPCWZPNHQQE-FHWLQOOXSA-N Tyr-Tyr-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=C(O)C=C1 DJSYPCWZPNHQQE-FHWLQOOXSA-N 0.000 description 1
- NVJCMGGZHOJNBU-UFYCRDLUSA-N Tyr-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N NVJCMGGZHOJNBU-UFYCRDLUSA-N 0.000 description 1
- YKBUNNNRNZZUID-UFYCRDLUSA-N Tyr-Val-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YKBUNNNRNZZUID-UFYCRDLUSA-N 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- XCTHZFGSVQBHBW-IUCAKERBSA-N Val-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C XCTHZFGSVQBHBW-IUCAKERBSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 1
- BCBFMJYTNKDALA-UFYCRDLUSA-N Val-Phe-Phe Chemical compound N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O BCBFMJYTNKDALA-UFYCRDLUSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 1
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- LZDNBBYBDGBADK-KBPBESRZSA-N Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-KBPBESRZSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- 230000000963 caseinolytic effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- SPTYHKZRPFATHJ-HYZXJONISA-N dT6 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 SPTYHKZRPFATHJ-HYZXJONISA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 108010068404 exorphin B4 Proteins 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005861 gene abnormality Effects 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 229940084937 glyset Drugs 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 239000011539 homogenization buffer Substances 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- MNWBNISUBARLIT-UHFFFAOYSA-N sodium cyanide Chemical compound [Na+].N#[C-] MNWBNISUBARLIT-UHFFFAOYSA-N 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- UVFAEQZFLBGVRM-MSMWPWNWSA-N succinyl-Leu-Leu-Val-Tyr-7-amino-4-methylcoumarin Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)CCC(O)=O)CC(C)C)C(=O)NC=1C=C2OC(=O)C=C(C)C2=CC=1)C1=CC=C(O)C=C1 UVFAEQZFLBGVRM-MSMWPWNWSA-N 0.000 description 1
- 108010090544 succinyl-leucyl-leucyl-valyl-tyrosyl-methylcoumarinamide Proteins 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000003760 tallow Substances 0.000 description 1
- 239000012085 test solution Substances 0.000 description 1
- WROMPOXWARCANT-UHFFFAOYSA-N tfa trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.OC(=O)C(F)(F)F WROMPOXWARCANT-UHFFFAOYSA-N 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- SOBHUZYZLFQYFK-UHFFFAOYSA-K trisodium;hydroxy-[[phosphonatomethyl(phosphonomethyl)amino]methyl]phosphinate Chemical compound [Na+].[Na+].[Na+].OP(O)(=O)CN(CP(O)([O-])=O)CP([O-])([O-])=O SOBHUZYZLFQYFK-UHFFFAOYSA-K 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 108010036320 valylleucine Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 210000004885 white matter Anatomy 0.000 description 1
Landscapes
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明はヒトのプロテアソームのコンポーネント、より
詳しくは細胞内の多機能プロテイナーゼ複合体であるプ
ロテアソームのコンポーネントに関する。
詳しくは細胞内の多機能プロテイナーゼ複合体であるプ
ロテアソームのコンポーネントに関する。
従来の技術
細胞内には、蛋白質合成異常や転写後玉白質の障害等に
よる不必要な蛋白質を識別し、急速に分解するエネルギ
ー依存性の機構が、細胞質両分に存在する。この機構は
非すソソーム系蛋白質分解経路と総称されている。プロ
テアソームは細胞質両分に局在する分子量の極めて大き
な(Mr=約750000前後;2O8)多機能プロテ
アーゼ複合体であり、この非すソソーム系の中核を成す
と考えられており、酵母からヒトに至るまで真核生物に
広く分布する(Tanaka K、et al、、J、
Biol。
よる不必要な蛋白質を識別し、急速に分解するエネルギ
ー依存性の機構が、細胞質両分に存在する。この機構は
非すソソーム系蛋白質分解経路と総称されている。プロ
テアソームは細胞質両分に局在する分子量の極めて大き
な(Mr=約750000前後;2O8)多機能プロテ
アーゼ複合体であり、この非すソソーム系の中核を成す
と考えられており、酵母からヒトに至るまで真核生物に
広く分布する(Tanaka K、et al、、J、
Biol。
Chem、263.16209(1988))。
該酵素は蛋白質の塩基性アミノ酸、中性アミノ酸、酸性
アミノ酸残基のC末端側を分解する活性を同一分子内に
持っておりその広い基質特異性を特徴とし、細胞内では
不活性型で存在し、ポリリジンとの相互作用等種々の処
理により活性化される。
アミノ酸残基のC末端側を分解する活性を同一分子内に
持っておりその広い基質特異性を特徴とし、細胞内では
不活性型で存在し、ポリリジンとの相互作用等種々の処
理により活性化される。
最近、このプロテアソームが細胞質のみでなく核にも多
量に存在することが見出された。さらに、mRNA翻訳
抑制やtRNAプロセッシング、rRNA分解等との関
連から見出された2OSプロ・ソームとこのプロテアソ
ームとの間で、電子顕微鏡像や電気泳動パターンから類
似性や一致性が指摘されており、プロテアソームはこの
ような核関連の細胞機能にも関わる可能性もある。
量に存在することが見出された。さらに、mRNA翻訳
抑制やtRNAプロセッシング、rRNA分解等との関
連から見出された2OSプロ・ソームとこのプロテアソ
ームとの間で、電子顕微鏡像や電気泳動パターンから類
似性や一致性が指摘されており、プロテアソームはこの
ような核関連の細胞機能にも関わる可能性もある。
該酵素は複数のコンポーネントからなる巨大な複合体で
あり、7M尿素や0.05%トリフルオロ酢酸(T F
A)等の蛋白変性剤存在下で複数の構成成分が解離す
る。これらコンポーネントは該酵素を0.05%トリフ
ルオロ酢酸(T F A)に透析し各構成成分を解離さ
せた後、0.05%TFAで平衡化したT S K −
Gel phenyl 5 P WRPの逆層HPLC
により30〜50%アセトニトリルの濃度勾配で分離す
ることができる( Tanakak、et al、、J
、Biol、chem、、263.16209−162
17(1988))。該酵素は、電子顕微鏡観察におい
て複数の粒子からなる環状構造を有し、又その各種基質
は種々の阻害剤に対する反応性の違いから互いに異なっ
た複数の触媒活性部位によって分解されていると推定さ
れている。
あり、7M尿素や0.05%トリフルオロ酢酸(T F
A)等の蛋白変性剤存在下で複数の構成成分が解離す
る。これらコンポーネントは該酵素を0.05%トリフ
ルオロ酢酸(T F A)に透析し各構成成分を解離さ
せた後、0.05%TFAで平衡化したT S K −
Gel phenyl 5 P WRPの逆層HPLC
により30〜50%アセトニトリルの濃度勾配で分離す
ることができる( Tanakak、et al、、J
、Biol、chem、、263.16209−162
17(1988))。該酵素は、電子顕微鏡観察におい
て複数の粒子からなる環状構造を有し、又その各種基質
は種々の阻害剤に対する反応性の違いから互いに異なっ
た複数の触媒活性部位によって分解されていると推定さ
れている。
プロテアソームは上記の非すソソーム系蛋白分解経路、
核関連の細胞機能の他種々の重要な細胞機能及び各種病
態に関連すると考えられており、その各コンポーネント
の解明が望まれている。
核関連の細胞機能の他種々の重要な細胞機能及び各種病
態に関連すると考えられており、その各コンポーネント
の解明が望まれている。
発明が解決しようとする課題
本発明はヒト プロテアソームの各コンポーネント及び
これらの遺伝子を提供することを目的とする。
これらの遺伝子を提供することを目的とする。
本発明者らは、これまでにラット及び酵母についてコン
ポーネントの遺伝子を一部単離し、アミノ酸配列を決定
した。しかし、ヒトのコンポーネントについての詳細は
未だ明らかになっていない。
ポーネントの遺伝子を一部単離し、アミノ酸配列を決定
した。しかし、ヒトのコンポーネントについての詳細は
未だ明らかになっていない。
ヒトのコンポーネント及びその遺伝子を提供することに
より、ヒトのプロテアソーム異常に関連する病態が解明
され、その診断及び/又は治療法の開発されることが期
待される。
より、ヒトのプロテアソーム異常に関連する病態が解明
され、その診断及び/又は治療法の開発されることが期
待される。
課題を解決するための手段
本発明者らはさらに研究を重ね、今回ヒト プロテアソ
ームのコンポーネントの内HC2、HC5、HC8、H
C9の遺伝子を単離し、その塩基配列及び相当するアミ
ノ酸配列を明らかにすることに成功した。
ームのコンポーネントの内HC2、HC5、HC8、H
C9の遺伝子を単離し、その塩基配列及び相当するアミ
ノ酸配列を明らかにすることに成功した。
本発明によれば、下記式(1)〜(4)に示したアミノ
酸配列を有するヒトプロテアソームのコンポーネントH
C2、HC5、HC8、HC9及びこれらをコードする
遺伝子が提供される。
酸配列を有するヒトプロテアソームのコンポーネントH
C2、HC5、HC8、HC9及びこれらをコードする
遺伝子が提供される。
式(1):HC2のアミノ酸配列
Met Phe Arg Asn Gin Tyr A
sp Asn Asp Val 10Thr Val
Trp Scr Pro Gln Gly Arg
Ile l1is 20Gln lie Glu T
yr Ala Met Glu Ala Val Ly
s 30Gln Gly Ser Ala Thr
Val Gly Leu Lys Ser 40Ly
s Thr 1lis Ala Val Leu Va
l Ala Leu Lys 50Arg Ala
Gln Ser Glu Leu Ala Ala l
1is Gln 60Lys Lys Ilc Le
u t(is Val Asp Asn His li
e 70Gly llc Scr Ile Ala
Gly Lcu Thr Ala Asp 80Al
a Arg Leu Leu Cys Asn Phe
Met Arg Gln 90Glu Cys L
eu ASpSer Arg Phe Vat Phe
Asp 1100Ar Pro Leu Pro
Val Ser Arg Leu Val Ser
110Leu lie Gly Ser Lys Th
r Gln lie Pro Thr 120Gin
Arg Tyr Gly Arg Arg Pro
Tyr Gly Val 130Gly Leu L
eu Ile Ala Gly ’Tyr Asp A
sp MetGly Pro l1ls Ile P
he Gln Thr Cys Pro 5erAla
Asn Tyr Phe Asp Cys Arg
Ala Met 5erlie Gly Ala Ar
g Ser Gln Ser Ala Arg Thr
Tyr Leu Glu Arg 1lls Met
Ser Glu Phe MetGlu Cys As
n Leu Asn Glu Leu Val Lys
HisGay Leu Arg Ala Leu A
rg Glu Thr Leu Pr。
sp Asn Asp Val 10Thr Val
Trp Scr Pro Gln Gly Arg
Ile l1is 20Gln lie Glu T
yr Ala Met Glu Ala Val Ly
s 30Gln Gly Ser Ala Thr
Val Gly Leu Lys Ser 40Ly
s Thr 1lis Ala Val Leu Va
l Ala Leu Lys 50Arg Ala
Gln Ser Glu Leu Ala Ala l
1is Gln 60Lys Lys Ilc Le
u t(is Val Asp Asn His li
e 70Gly llc Scr Ile Ala
Gly Lcu Thr Ala Asp 80Al
a Arg Leu Leu Cys Asn Phe
Met Arg Gln 90Glu Cys L
eu ASpSer Arg Phe Vat Phe
Asp 1100Ar Pro Leu Pro
Val Ser Arg Leu Val Ser
110Leu lie Gly Ser Lys Th
r Gln lie Pro Thr 120Gin
Arg Tyr Gly Arg Arg Pro
Tyr Gly Val 130Gly Leu L
eu Ile Ala Gly ’Tyr Asp A
sp MetGly Pro l1ls Ile P
he Gln Thr Cys Pro 5erAla
Asn Tyr Phe Asp Cys Arg
Ala Met 5erlie Gly Ala Ar
g Ser Gln Ser Ala Arg Thr
Tyr Leu Glu Arg 1lls Met
Ser Glu Phe MetGlu Cys As
n Leu Asn Glu Leu Val Lys
HisGay Leu Arg Ala Leu A
rg Glu Thr Leu Pr。
Ala Glu Gln Asp Leu Thr T
hr Lys Asn ValSer lle Gl
y lie Val Gly Lys Asp Leu
GluPhe Thr lle Tyr Asp A
sp Asp Asp Vat 5erPro Phe
Leu Glu Gly Leu Glu Glu
Arg Pr。
hr Lys Asn ValSer lle Gl
y lie Val Gly Lys Asp Leu
GluPhe Thr lle Tyr Asp A
sp Asp Asp Vat 5erPro Phe
Leu Glu Gly Leu Glu Glu
Arg Pr。
Gin Arg Lys Ala Gin Pro A
la Gin Pro AlaAsp Glu Pro
Ala Glu Lys Ala Asp Glu
Pr。
la Gin Pro AlaAsp Glu Pro
Ala Glu Lys Ala Asp Glu
Pr。
Met Glu His
式(2):HC5のアミノ酸配列
Met Leu Ser Ser Thr Ala M
et Tyr Ser AlaPro Gly Arg
Asp Leu Gly Met Glu Pro
HisArg Ala Ala Gly Pro Le
u Gln Leu Arg PheSer Pro
Tyr Val Phe Asn GlyLcu A
ha lle Ala Gly Glu AspVa
l Ala Ser Asp Thr Arg Le
uPhe Ser lie His Thr Arg
AspCys Tyr Lys Lcu Thr A
sp LysGly Cys Ser Gly Phe
l1ls cly1’hr Leu Thr Lys
Ile lie GluLys Met Tyr
Lys l1is Ser AsnMet Thr T
hr Gly Ala Ile AlaSer Th
r Ilc Leu Tyr Ser ArgPro
Tyr Tyr Val Tyr Asn Ice
Leu Asp Glu Glu Gly Lys G
lySar Phe Asp Pro Vat Gl
y 5erAsp Ser Phe Lys Ala
Gly GlyAla Met Leu Gln
Pro Leu LeuVal Gly Phe L
ys Asn Met G1n11is Val P
ro Leu Ser Leu AspArg Leu
Val Lys AspVal PheGly
Thr 1ie Phe Ala l1e Ser Glu Gly Ser Pro Lys Thr Vat l1e Asp Cys Leu Aha Arg Leu Asn Lys Ala Ala Met Leu Arg Pbe Phe 11e Gly Gly Ala Vat Tyr Tyr Gln Arg Ser Ala 5er Asp Asn Gln Asn Vat Glu Arg Ala Met 11e Ser Aha Ala Glu Arg Asp Val Tyr T
hr Gly Asp AlaLeu Arg Ile
Cys Ile Val Thr Lys Glu
Glylle Arg Glu Glu Thr Va
t Ser Leu Arg LysAsp 式(3):HC8のアミノ酸配列 Met Ser Ser Ile Gly Thr G
ly Tyr Asp LeuSer Ala Ser
Thr Phe Ser Pro Asp Gay
ArgVal Phe Gln Val Glu Ty
r Ala Met Lys AlaVal Glu
Asn Scr Ser Thr Ala Ile G
ly IleArg Cys Lys Asp Gly
Va! Val Phe Gly ValGlu L
ys Leu Val Leu Ser Lys Le
u Tyr GluGlu Gly Ser Asn
Lys Arg Leu Phe Asn ValAs
p Arg His Val Gly Met Ala
Val Ala GlyLeu Leu Ala A
sp Ala Arg Ser Leu Ala As
plle Ala Arg Glu Glu Ala
Ser Asn Phe ArgSer Asn Ph
e Gly Tyr Asn Ile Pro Leu
LysIlls Leu Ala Asp Arg
Vat Ala Met Tyr ValHls Al
a Tyr Thr Leu TYr Ser Ala
Vat Arg工00 Pro Phe Gly Cys Ser Phe M
et Leu Gly 5erTyr Scr Vat
Asn Asp Gly Ala Gln Leu
TyrMet lie Asp Pro Ser Gl
y Vat Ser Tyr GlyTyr Trp
Gly Cys Ala lie Gly Lys A
la ArgGin Ala Ala Lys Thr
Glu lie Glu Lys LeuGln M
et Lys Glu Met Thr Cys Ar
g Asp 1ieVal Lys Clu Val
Ala Lys Ile lle Tyr 1leVa
l Jlis Asp Glu Vat Lys As
p Lys Ala PheGlu Leu Glu
Leu Ser Trp Val Gly Glu L
euThr Asn Gly Arg 1lis Gl
u lle Vat Pro LysAsp lie
Arg Glu Glu Ala Glu Lys T
yr AlaLys C1u Ser Leu Lys
Glu Glu Asp Glu 5erAsp A
sp Asp Asn Met式(4):HC9のアミ
ノ酸配列 Met Ser Arg Arg Tyr Asp S
er Arg Thr Thrlle Phe Ser
Pro Glu Gly Arg Leu Tyr
GlnVat GJu Tyr Ala Met Gl
u Ala Ile Gly HisAla Gly
Thr Cys Leu Gly Ile Leu A
la AsnAsp cly val Leu Le
u Ala Ala Glu Arg ArgAsn
lle His Lys Leu Leu Asp
Glu Val PhePhe Ser Glu L
ys lie Tyr Lys Leu Asn G
luASp Met Ala Cys Ser Val
Ala Gly Ile ThrScr Asp
Ala Asn Val Leu Thr Asn
Glu LeuArg Leu Ile Ala
Gln Arg Tyr Leu Leu GlnTy
r Gln Glu Pro lle Pro Cy
s Glu Gln LeuVal Thr Ala
Leu Cys Asp lie Lys Gln
AlaTyr Thr Gln Phe Gly G
ly Lys Arg Pro PheGly Val
Ser Leu Leu Tyr lle Gly
Trp AspLys 1lis Tyr Gly
Phe Gln Leu Tyr Gln 5erAs
p Pro Ser Gly Asn Tyr Gly
Gly Trp LysAla Thr Cys
Ile Gly Asn Asn Ser Ala A
laAla Val Ser Met Leu Ly
s Gin Asp Tyr LysGlu Gly
Glu Met Thr Leu Lys Ser A
la LeuAla Leu Ala Ile Ly
s Vat Leu Asn Lys ThrMet
Asp Val Ser Lys Leu Ser
Ala Glu LysVal Glu lie
Ala Thr Leu Thr Arg Glu
AsnGly Lys Thr Val lie A
rg Val Leu Lys Gln 230L
ys Glu Val Glu Gin Leu
Ile Lys Lys l1is 240Glu
Glu Glu Glu Ala Lys Ala G
lu Arg Glu 250Lys Lys Gl
u Lys Glu Gln Lys Glu Lys
Asp 260Lys
261本発明によれば、
ヒトプロテアソームのコンポーネントHC2、HC5、
HC8、HC9をコードする遺伝子が提供される。これ
らの具体例は夫々下記式(5)〜(8)のDNA配列で
示されるが、本発明遺伝子は上記コンポーネントをコー
ドするものであればよく、下記式に限定されない。
et Tyr Ser AlaPro Gly Arg
Asp Leu Gly Met Glu Pro
HisArg Ala Ala Gly Pro Le
u Gln Leu Arg PheSer Pro
Tyr Val Phe Asn GlyLcu A
ha lle Ala Gly Glu AspVa
l Ala Ser Asp Thr Arg Le
uPhe Ser lie His Thr Arg
AspCys Tyr Lys Lcu Thr A
sp LysGly Cys Ser Gly Phe
l1ls cly1’hr Leu Thr Lys
Ile lie GluLys Met Tyr
Lys l1is Ser AsnMet Thr T
hr Gly Ala Ile AlaSer Th
r Ilc Leu Tyr Ser ArgPro
Tyr Tyr Val Tyr Asn Ice
Leu Asp Glu Glu Gly Lys G
lySar Phe Asp Pro Vat Gl
y 5erAsp Ser Phe Lys Ala
Gly GlyAla Met Leu Gln
Pro Leu LeuVal Gly Phe L
ys Asn Met G1n11is Val P
ro Leu Ser Leu AspArg Leu
Val Lys AspVal PheGly
Thr 1ie Phe Ala l1e Ser Glu Gly Ser Pro Lys Thr Vat l1e Asp Cys Leu Aha Arg Leu Asn Lys Ala Ala Met Leu Arg Pbe Phe 11e Gly Gly Ala Vat Tyr Tyr Gln Arg Ser Ala 5er Asp Asn Gln Asn Vat Glu Arg Ala Met 11e Ser Aha Ala Glu Arg Asp Val Tyr T
hr Gly Asp AlaLeu Arg Ile
Cys Ile Val Thr Lys Glu
Glylle Arg Glu Glu Thr Va
t Ser Leu Arg LysAsp 式(3):HC8のアミノ酸配列 Met Ser Ser Ile Gly Thr G
ly Tyr Asp LeuSer Ala Ser
Thr Phe Ser Pro Asp Gay
ArgVal Phe Gln Val Glu Ty
r Ala Met Lys AlaVal Glu
Asn Scr Ser Thr Ala Ile G
ly IleArg Cys Lys Asp Gly
Va! Val Phe Gly ValGlu L
ys Leu Val Leu Ser Lys Le
u Tyr GluGlu Gly Ser Asn
Lys Arg Leu Phe Asn ValAs
p Arg His Val Gly Met Ala
Val Ala GlyLeu Leu Ala A
sp Ala Arg Ser Leu Ala As
plle Ala Arg Glu Glu Ala
Ser Asn Phe ArgSer Asn Ph
e Gly Tyr Asn Ile Pro Leu
LysIlls Leu Ala Asp Arg
Vat Ala Met Tyr ValHls Al
a Tyr Thr Leu TYr Ser Ala
Vat Arg工00 Pro Phe Gly Cys Ser Phe M
et Leu Gly 5erTyr Scr Vat
Asn Asp Gly Ala Gln Leu
TyrMet lie Asp Pro Ser Gl
y Vat Ser Tyr GlyTyr Trp
Gly Cys Ala lie Gly Lys A
la ArgGin Ala Ala Lys Thr
Glu lie Glu Lys LeuGln M
et Lys Glu Met Thr Cys Ar
g Asp 1ieVal Lys Clu Val
Ala Lys Ile lle Tyr 1leVa
l Jlis Asp Glu Vat Lys As
p Lys Ala PheGlu Leu Glu
Leu Ser Trp Val Gly Glu L
euThr Asn Gly Arg 1lis Gl
u lle Vat Pro LysAsp lie
Arg Glu Glu Ala Glu Lys T
yr AlaLys C1u Ser Leu Lys
Glu Glu Asp Glu 5erAsp A
sp Asp Asn Met式(4):HC9のアミ
ノ酸配列 Met Ser Arg Arg Tyr Asp S
er Arg Thr Thrlle Phe Ser
Pro Glu Gly Arg Leu Tyr
GlnVat GJu Tyr Ala Met Gl
u Ala Ile Gly HisAla Gly
Thr Cys Leu Gly Ile Leu A
la AsnAsp cly val Leu Le
u Ala Ala Glu Arg ArgAsn
lle His Lys Leu Leu Asp
Glu Val PhePhe Ser Glu L
ys lie Tyr Lys Leu Asn G
luASp Met Ala Cys Ser Val
Ala Gly Ile ThrScr Asp
Ala Asn Val Leu Thr Asn
Glu LeuArg Leu Ile Ala
Gln Arg Tyr Leu Leu GlnTy
r Gln Glu Pro lle Pro Cy
s Glu Gln LeuVal Thr Ala
Leu Cys Asp lie Lys Gln
AlaTyr Thr Gln Phe Gly G
ly Lys Arg Pro PheGly Val
Ser Leu Leu Tyr lle Gly
Trp AspLys 1lis Tyr Gly
Phe Gln Leu Tyr Gln 5erAs
p Pro Ser Gly Asn Tyr Gly
Gly Trp LysAla Thr Cys
Ile Gly Asn Asn Ser Ala A
laAla Val Ser Met Leu Ly
s Gin Asp Tyr LysGlu Gly
Glu Met Thr Leu Lys Ser A
la LeuAla Leu Ala Ile Ly
s Vat Leu Asn Lys ThrMet
Asp Val Ser Lys Leu Ser
Ala Glu LysVal Glu lie
Ala Thr Leu Thr Arg Glu
AsnGly Lys Thr Val lie A
rg Val Leu Lys Gln 230L
ys Glu Val Glu Gin Leu
Ile Lys Lys l1is 240Glu
Glu Glu Glu Ala Lys Ala G
lu Arg Glu 250Lys Lys Gl
u Lys Glu Gln Lys Glu Lys
Asp 260Lys
261本発明によれば、
ヒトプロテアソームのコンポーネントHC2、HC5、
HC8、HC9をコードする遺伝子が提供される。これ
らの具体例は夫々下記式(5)〜(8)のDNA配列で
示されるが、本発明遺伝子は上記コンポーネントをコー
ドするものであればよく、下記式に限定されない。
式(5):HC2の遺伝子
ATG TTT CGA AAT CAG TAT G
ACAAT GAT GTC30ACT GTT TG
G AGCCCCCAG にGCAGG ATT CA
T 60CAA ATT GAA TAT GCA
ATG GAA GCT GTT AAA 90CA
A GGT TCA GCCACA GTT GGT
CTG AAA TCA 120AAA ACT C
AT GCA GTT TTG GTT GCA TT
G AAA 150AGG GCG CAA TCA
GAG CTT GCA GCT CAT CAG
180AAA AAA ATT CTCCAT GT
T GACAACCAT ATTGGT ATCTCA
ATT GCG GGG CTT ACT GCT
CATGCT AGA CTG TTA TGT AA
T TTT ATG CGT CAGGAG TGT
TTG GAT TCCAGA TTT GTA TT
CGATAGA CCA CTG CCT GTG T
CT CGT CTT GTA TCTCTA ATT
GGA AGCAAG ACCCAG ATA CC
A ACACAA CGA TAT GGCCGG A
GA CCA TAT GOT GTTGGT CTC
CTT ATT GCT GGT TAT GAT G
AT ATGGGCCCT CACATT TTCCA
A ACCTGT CCA TCTGCT AACTA
T TTT GACTGCAGA GCCATG TC
CATT GGA GCCCGT TCCCAA TC
A GCT CGT ACTTACTTG GAG A
GA CAT ATG TCT GAA TTT AT
GGAG TGT AAT TTA AAT GAA
CTA GTT AAA CATGGT CTG CG
T GCCTTA AGA GAG ACG CTT
CCTGCA GAA CAG GACCTG ACT
ACA AAG AAT GTTTCCATT にG
A ATT GTT GGT AAA GACTTG
GAGTTT ACA ATCTAT GAT GAT
GAT GAT GTG TCTCCA TTCCT
G GAA GGT CTT GAA GAA AGA
CCACAG AGA AAG GCA CAG C
CT GCT CAA CCT GCT 750GA
T GAA CCT GCA GAA AAG GCT
GAT GAA CCA 780ATG GAA
CAT
789式(6):HC5の遺伝子 ATG TTG TCCTCT ACA GCCATG
TAT TCG GCT 30CCT GGCA
GA GACTTG GGG ATG GAA CCG
CAC60AGA GCCGCG GGCCCT T
TG CAG C1”G CGA TTT 90T
CG CCCTACGTT TTCAACGGA GG
T ACT ATA 120CTG GCA ATT
GCT GGA GAA GAT TTT GCA
ATT 150GTT GCT TCT GAT A
CT CGA TTG AGT GAA GGG 1
80TTT TCA ATT CAT ACG CGG
GAT AGCCCCAAA 210TGT TA
CAAA TTA ACA GACAAA ACA G
TCATT 240GGA TGCAGCGGT T
TT CAT GGA GACTGT CTT 27
0ACG CTG ACA AAG ATT ATT
GAA GCA AGA CTA 300AAG A
TG TAT AAG CAT TCCAAT AAT
AAG GCC330ATG ACT ACG GG
G GCA ATT GCT GCA ATG CTG
360TCT ACA ATCCTG TAT T
CA AGG CGCTTCTTT 390CCA
TACTAT GTT TACAACATCATCGG
T GGA 42.0CTT GAT GAA GA
A GGA AAG GGG GCT GTA TAC
AGCTTT GAT CCA GTA GGG TC
T TACCAG AGAGACTCCTTCAAG
GCT GGA GGCTCA GCA AGTGCC
ATG CTA CAG CCCCTG CTT にA
CAACCAGGTT GGT TTT AAG AA
CATG CAG AAT GTG GAGCAT G
TT CCG CTG TCCTTG GACAGA
GCCATGCGG CTG GTG AAA GAT
GTCTTCATT TCT GCGGCT GAG
AGA GAT GTG TACACT GGG G
ACGCACTCCOG ATCTGCATA GTG
ACCAAA GAG GGCATCAGG GAG
GAA ACT GTT TCCTTA AGG A
AGAC 式(7):HC8の遺伝子 ATG AGCTCA ATCGGCACT GGG
TAT GACCTGTCA GCCTCT ACA
TTCTCT CCT にACGGA AGAGTT
TTT CAA GTT GAA TAT GCT A
TG AAG GCTGTG GAA AAT AGT
AGT ACA にCT ATT GGA ATCA
GA TGCAAA GAT GGT GTT GTC
TTT GGG GTAGAA AAA TTA GT
CCTT TCT AAA CTT TAT GAAG
AA GGT TCCAACAAA AGA CTT
TTT AAT GTTGAT CGG CAT GT
T にGA ATG GCA GTA GCA GGT
TTG TTG GCA GAT GCT CGT ’
I’CT TTA GCA GACATA GCA A
GA GAA GAA GCT TCCAACTTCA
GATCT AACTTT GGCTACAACATT
CCA CTA AAACAT CTT GCA G
ACAGA GTG GCCATG TAT GTGC
AT GCA TAT ACA CTCTACAGT
GOT GTT AGACCT T’l’T GGCT
GCAGT TTCATCTTA GGG TCTTA
CAGT GTG AAT GACC;GT にCG
CAA CTCTAC^TG ATT GACCCA
TCA GGT GTT TCA TACGGTTAT
TGG GGCTGT GCCATCGGCAAA
GCCAGGCAA GCT GCA AAG ACに
GAA ATA GAG AAG CTTCAG A
TG AAA GAA ATG ACCTGCCGT
GAT ATCGTT AAA GAA GTT GC
A AAA ATA ATT TACATAGTA C
AT GACGAA GTT AAG GAT AAA
GCT TTTGAA CTA GAA CTCAG
CTGG GTT GGT GAA TTAACT A
AT GGA AGA CAT GAA ATT GT
T CCA AAAGAT ATA AGA GAA
GAA GCA GAG AAA TAT GCTAA
G GAA TCT CTG AAG C;AA GA
A GAT GAA TCA 750GAT GAT
GAT AAT ATC765式(8):HC9の遺
伝子 ATG TCT CGA AGA TAT GACTC
CAGG ACCACT 30ATA TTT TC
T CCA GAA GGT CGCTTA TACC
AA 60GTT GAA TAT GCCATG
GAA GCT ATT GGA CAT 90GC
A GGCACCTGT TTG GGA ATT T
TA GCA AAT 120GAT GGT GT
T TTG CTT GCA GCA GAG AGA
CGC150AACATCCACAAG CTT C
TT GAT GAA GTCTTT 180TTT
TCT GAA AAA ATT TAT AAA
CTCAAT GAG 210GACATG GCT
TGCAGT GTG GCA GGCATA AC
T 240TCT GAT GCT AAT GTT
CTG ACT AAT GAA CTA 270
AGG CTCATT GCT CAA AGG TA
T TTA TTA CAG 800TAT CAG
GAG CCA ATA CCT TGT GAG
CAG TTG 330GTT ACA GCA C
TG TGT GAT ATCAAA CAA GCT
380TAT ACA CAA TTT GGA
GGA AAA CGT CCCTTT 390GG
T GTT TCA TTG CTG TACATT
GGCTGG にAT 420AAG CACTAT
GGCTTT CAG CTCTAT CAG AG
T 450GACCCT ACT GGA AAT
TACGGG GGA TGG AAG 480GC
CACA TCCATT CGA AAT AAT A
GCGCT GCA 510GCT GTG TCA
ATG TTG AAA CAA GACTAT A
AA 540GAA GGA GAA ATG AC
CTTG AAG TCA GCA CTT 570
CCT TTA GCT ATCAAA GTA CT
A AAT AAG ACC600ATG GAT G
TT ACT AAA、 CTCTCT GCT GA
A AAA 630GTG GAA ATT GCA
ACA CTA ACA AGA GAG AAT
660GGA AAG ACA GTA ATCAG
A GTT CTCAAA CAA 690AAA
GAA GTG GAG CAG TTG ATCAA
A AAA CAT 720GAG GAA GAA
GAA GCCAAA GCT GAG CGT G
AG 750AAG AAA GAA AAA GA
A CAG AAA GAA AAG GAT 78
0AAA
783本発明によれば、上記式(5)〜(8)
で表されるDNA配列、該塩基配列に相補的な塩基配列
又はその両者を含有するDNAが提供される。
ACAAT GAT GTC30ACT GTT TG
G AGCCCCCAG にGCAGG ATT CA
T 60CAA ATT GAA TAT GCA
ATG GAA GCT GTT AAA 90CA
A GGT TCA GCCACA GTT GGT
CTG AAA TCA 120AAA ACT C
AT GCA GTT TTG GTT GCA TT
G AAA 150AGG GCG CAA TCA
GAG CTT GCA GCT CAT CAG
180AAA AAA ATT CTCCAT GT
T GACAACCAT ATTGGT ATCTCA
ATT GCG GGG CTT ACT GCT
CATGCT AGA CTG TTA TGT AA
T TTT ATG CGT CAGGAG TGT
TTG GAT TCCAGA TTT GTA TT
CGATAGA CCA CTG CCT GTG T
CT CGT CTT GTA TCTCTA ATT
GGA AGCAAG ACCCAG ATA CC
A ACACAA CGA TAT GGCCGG A
GA CCA TAT GOT GTTGGT CTC
CTT ATT GCT GGT TAT GAT G
AT ATGGGCCCT CACATT TTCCA
A ACCTGT CCA TCTGCT AACTA
T TTT GACTGCAGA GCCATG TC
CATT GGA GCCCGT TCCCAA TC
A GCT CGT ACTTACTTG GAG A
GA CAT ATG TCT GAA TTT AT
GGAG TGT AAT TTA AAT GAA
CTA GTT AAA CATGGT CTG CG
T GCCTTA AGA GAG ACG CTT
CCTGCA GAA CAG GACCTG ACT
ACA AAG AAT GTTTCCATT にG
A ATT GTT GGT AAA GACTTG
GAGTTT ACA ATCTAT GAT GAT
GAT GAT GTG TCTCCA TTCCT
G GAA GGT CTT GAA GAA AGA
CCACAG AGA AAG GCA CAG C
CT GCT CAA CCT GCT 750GA
T GAA CCT GCA GAA AAG GCT
GAT GAA CCA 780ATG GAA
CAT
789式(6):HC5の遺伝子 ATG TTG TCCTCT ACA GCCATG
TAT TCG GCT 30CCT GGCA
GA GACTTG GGG ATG GAA CCG
CAC60AGA GCCGCG GGCCCT T
TG CAG C1”G CGA TTT 90T
CG CCCTACGTT TTCAACGGA GG
T ACT ATA 120CTG GCA ATT
GCT GGA GAA GAT TTT GCA
ATT 150GTT GCT TCT GAT A
CT CGA TTG AGT GAA GGG 1
80TTT TCA ATT CAT ACG CGG
GAT AGCCCCAAA 210TGT TA
CAAA TTA ACA GACAAA ACA G
TCATT 240GGA TGCAGCGGT T
TT CAT GGA GACTGT CTT 27
0ACG CTG ACA AAG ATT ATT
GAA GCA AGA CTA 300AAG A
TG TAT AAG CAT TCCAAT AAT
AAG GCC330ATG ACT ACG GG
G GCA ATT GCT GCA ATG CTG
360TCT ACA ATCCTG TAT T
CA AGG CGCTTCTTT 390CCA
TACTAT GTT TACAACATCATCGG
T GGA 42.0CTT GAT GAA GA
A GGA AAG GGG GCT GTA TAC
AGCTTT GAT CCA GTA GGG TC
T TACCAG AGAGACTCCTTCAAG
GCT GGA GGCTCA GCA AGTGCC
ATG CTA CAG CCCCTG CTT にA
CAACCAGGTT GGT TTT AAG AA
CATG CAG AAT GTG GAGCAT G
TT CCG CTG TCCTTG GACAGA
GCCATGCGG CTG GTG AAA GAT
GTCTTCATT TCT GCGGCT GAG
AGA GAT GTG TACACT GGG G
ACGCACTCCOG ATCTGCATA GTG
ACCAAA GAG GGCATCAGG GAG
GAA ACT GTT TCCTTA AGG A
AGAC 式(7):HC8の遺伝子 ATG AGCTCA ATCGGCACT GGG
TAT GACCTGTCA GCCTCT ACA
TTCTCT CCT にACGGA AGAGTT
TTT CAA GTT GAA TAT GCT A
TG AAG GCTGTG GAA AAT AGT
AGT ACA にCT ATT GGA ATCA
GA TGCAAA GAT GGT GTT GTC
TTT GGG GTAGAA AAA TTA GT
CCTT TCT AAA CTT TAT GAAG
AA GGT TCCAACAAA AGA CTT
TTT AAT GTTGAT CGG CAT GT
T にGA ATG GCA GTA GCA GGT
TTG TTG GCA GAT GCT CGT ’
I’CT TTA GCA GACATA GCA A
GA GAA GAA GCT TCCAACTTCA
GATCT AACTTT GGCTACAACATT
CCA CTA AAACAT CTT GCA G
ACAGA GTG GCCATG TAT GTGC
AT GCA TAT ACA CTCTACAGT
GOT GTT AGACCT T’l’T GGCT
GCAGT TTCATCTTA GGG TCTTA
CAGT GTG AAT GACC;GT にCG
CAA CTCTAC^TG ATT GACCCA
TCA GGT GTT TCA TACGGTTAT
TGG GGCTGT GCCATCGGCAAA
GCCAGGCAA GCT GCA AAG ACに
GAA ATA GAG AAG CTTCAG A
TG AAA GAA ATG ACCTGCCGT
GAT ATCGTT AAA GAA GTT GC
A AAA ATA ATT TACATAGTA C
AT GACGAA GTT AAG GAT AAA
GCT TTTGAA CTA GAA CTCAG
CTGG GTT GGT GAA TTAACT A
AT GGA AGA CAT GAA ATT GT
T CCA AAAGAT ATA AGA GAA
GAA GCA GAG AAA TAT GCTAA
G GAA TCT CTG AAG C;AA GA
A GAT GAA TCA 750GAT GAT
GAT AAT ATC765式(8):HC9の遺
伝子 ATG TCT CGA AGA TAT GACTC
CAGG ACCACT 30ATA TTT TC
T CCA GAA GGT CGCTTA TACC
AA 60GTT GAA TAT GCCATG
GAA GCT ATT GGA CAT 90GC
A GGCACCTGT TTG GGA ATT T
TA GCA AAT 120GAT GGT GT
T TTG CTT GCA GCA GAG AGA
CGC150AACATCCACAAG CTT C
TT GAT GAA GTCTTT 180TTT
TCT GAA AAA ATT TAT AAA
CTCAAT GAG 210GACATG GCT
TGCAGT GTG GCA GGCATA AC
T 240TCT GAT GCT AAT GTT
CTG ACT AAT GAA CTA 270
AGG CTCATT GCT CAA AGG TA
T TTA TTA CAG 800TAT CAG
GAG CCA ATA CCT TGT GAG
CAG TTG 330GTT ACA GCA C
TG TGT GAT ATCAAA CAA GCT
380TAT ACA CAA TTT GGA
GGA AAA CGT CCCTTT 390GG
T GTT TCA TTG CTG TACATT
GGCTGG にAT 420AAG CACTAT
GGCTTT CAG CTCTAT CAG AG
T 450GACCCT ACT GGA AAT
TACGGG GGA TGG AAG 480GC
CACA TCCATT CGA AAT AAT A
GCGCT GCA 510GCT GTG TCA
ATG TTG AAA CAA GACTAT A
AA 540GAA GGA GAA ATG AC
CTTG AAG TCA GCA CTT 570
CCT TTA GCT ATCAAA GTA CT
A AAT AAG ACC600ATG GAT G
TT ACT AAA、 CTCTCT GCT GA
A AAA 630GTG GAA ATT GCA
ACA CTA ACA AGA GAG AAT
660GGA AAG ACA GTA ATCAG
A GTT CTCAAA CAA 690AAA
GAA GTG GAG CAG TTG ATCAA
A AAA CAT 720GAG GAA GAA
GAA GCCAAA GCT GAG CGT G
AG 750AAG AAA GAA AAA GA
A CAG AAA GAA AAG GAT 78
0AAA
783本発明によれば、上記式(5)〜(8)
で表されるDNA配列、該塩基配列に相補的な塩基配列
又はその両者を含有するDNAが提供される。
尚、本明細書中のアミノ酸配列及び塩基配列に使用され
る略号はIUPAC−IUBの規定或いは当該分野にお
ける通称または慣用に従うものである。
る略号はIUPAC−IUBの規定或いは当該分野にお
ける通称または慣用に従うものである。
本発明のヒトプロテアソームのコンポーネントHC2、
HC5、HC8及びHC9は、式(1)〜(4)のアミ
ノ酸配列のN末端のメチオニンが欠損したもの、N末端
にシグナルペプチド又はその一部の結合した中間体、ア
ミノ酸配列の一部が欠損したものも包含する。かかる変
異は天然に例えば翻訳後の修飾により得られ、或いは遺
伝子工学的手法により得られる。遺伝子工学的手法にお
いては、天然から得た遺伝子を、例えばサイトスペシフ
ィック ミュータゲネシス等の方法により改変したり、
ホスファイトトリエステル法等の化学合成法により変異
したDNAを合成したり、或いは両者を組合わせて、遺
伝子を作成できる。
HC5、HC8及びHC9は、式(1)〜(4)のアミ
ノ酸配列のN末端のメチオニンが欠損したもの、N末端
にシグナルペプチド又はその一部の結合した中間体、ア
ミノ酸配列の一部が欠損したものも包含する。かかる変
異は天然に例えば翻訳後の修飾により得られ、或いは遺
伝子工学的手法により得られる。遺伝子工学的手法にお
いては、天然から得た遺伝子を、例えばサイトスペシフ
ィック ミュータゲネシス等の方法により改変したり、
ホスファイトトリエステル法等の化学合成法により変異
したDNAを合成したり、或いは両者を組合わせて、遺
伝子を作成できる。
これらの遺伝子を利用し、これを微生物のベクターに組
込み、形質転換された微生物から産生させることにより
、変異を有するコンポーネントを得ることができる。又
、これらの蛋白質は、その機能を保ったまま、天然の或
いは人工の変異により、その一部のアミノ酸の置換や配
列の改変を行うことができる。
込み、形質転換された微生物から産生させることにより
、変異を有するコンポーネントを得ることができる。又
、これらの蛋白質は、その機能を保ったまま、天然の或
いは人工の変異により、その一部のアミノ酸の置換や配
列の改変を行うことができる。
本発明のヒトプロテアソーム コンポーネントをコード
する遺伝子には、上記の各種変異を有する蛋白質をコー
ドする遺伝子も包含される。遺伝暗号の末端にはTAG
STAA等の終止コドンを付加することができる。
する遺伝子には、上記の各種変異を有する蛋白質をコー
ドする遺伝子も包含される。遺伝暗号の末端にはTAG
STAA等の終止コドンを付加することができる。
遺伝暗号は、式(5)〜(8)に例示されたコドンに限
られず、アミノ酸配列を変えることなく各アミノ酸に対
し任意のコドンを選択でき、例えば遺伝子組換に利用す
る宿主のコドン使用頻度等を考慮した常法に従えばよい
。
られず、アミノ酸配列を変えることなく各アミノ酸に対
し任意のコドンを選択でき、例えば遺伝子組換に利用す
る宿主のコドン使用頻度等を考慮した常法に従えばよい
。
本発明の遺伝子を用いれば、ヒト プロテアソーム、そ
のコンポーネント、或いはこれらに改変を加えたものを
遺伝子工学的手法により容易に大口に産生ずることがで
きる。
のコンポーネント、或いはこれらに改変を加えたものを
遺伝子工学的手法により容易に大口に産生ずることがで
きる。
また、本発明のヒト プロテアソームの各コンポーネン
トを用い、コンポーネント特異的な抗体を作成すること
ができる。該抗体の作成には、抗原として各コンポーネ
ントの他、アミノ酸配列の全体又は部分の情報をもとに
合成したペプチドを用いることができる。抗原として用
いる各コンポーネントは遺伝子工学的手法で大量に産生
されたものを用いることもできる。抗体は通常のポリク
ローナル抗体、モノクローナル抗体の製造法に従い製造
されるが、ヒト プロテアソーム複合体に対するポリク
ローナル抗体からWet nbcrgerらの方法(5
ience、 228 、740−742 (1985
))に従いエピトープ特異的抗体を得ることも可能であ
る。抗体はヒト プロテアソームの精製、測定、識別等
に用いられる。
トを用い、コンポーネント特異的な抗体を作成すること
ができる。該抗体の作成には、抗原として各コンポーネ
ントの他、アミノ酸配列の全体又は部分の情報をもとに
合成したペプチドを用いることができる。抗原として用
いる各コンポーネントは遺伝子工学的手法で大量に産生
されたものを用いることもできる。抗体は通常のポリク
ローナル抗体、モノクローナル抗体の製造法に従い製造
されるが、ヒト プロテアソーム複合体に対するポリク
ローナル抗体からWet nbcrgerらの方法(5
ience、 228 、740−742 (1985
))に従いエピトープ特異的抗体を得ることも可能であ
る。抗体はヒト プロテアソームの精製、測定、識別等
に用いられる。
本発明者らの研究によれば、乳癌細胞や白血病細胞等の
腫瘍細胞の核にプロテアソームが異常蓄積、これらの腫
瘍細胞でのプロテアソーム遺伝子発現の異常昂進が観察
されている。さらに肝臓症等の癌患者の体液中にはプロ
テアソームが大量に存在し、その量は非癌患者に比し診
断可能な程有意に多いことが見出されている。
腫瘍細胞の核にプロテアソームが異常蓄積、これらの腫
瘍細胞でのプロテアソーム遺伝子発現の異常昂進が観察
されている。さらに肝臓症等の癌患者の体液中にはプロ
テアソームが大量に存在し、その量は非癌患者に比し診
断可能な程有意に多いことが見出されている。
最近、アルツハイマー病患者の脳内にはユビキチンが異
常蓄積し、少なくともこの疾患の原因の一つに細胞内に
おける蛋白質分解系の異常があることの可能性が示唆さ
れた。また、この疾患の発現にかかわる遺伝子の機能ド
メインにはプロテアーゼ阻害剤がコードされていること
も判明し、非すソソーム系に関与すると考えられるプロ
テアソームがアルツハイマー病に本質的に関係している
ことが考えられる。
常蓄積し、少なくともこの疾患の原因の一つに細胞内に
おける蛋白質分解系の異常があることの可能性が示唆さ
れた。また、この疾患の発現にかかわる遺伝子の機能ド
メインにはプロテアーゼ阻害剤がコードされていること
も判明し、非すソソーム系に関与すると考えられるプロ
テアソームがアルツハイマー病に本質的に関係している
ことが考えられる。
本発明によって提供されるヒト プロテアソーム及び/
又はその遺伝子あるいはこれらに改変を加えたものは、
上記層、アルツハイマー病等のプロテアソーム異常を伴
う疾患について、病態のヒトにおける解明、診断/治療
法の開発に利用できる。 プロテアソームの測定技術の
提供は、プロテアソーム異常を伴う疾患の診断に極めて
有用である。かかる測定には本発明のコンポーネントに
対する抗体を用いた種々の知られた測定系を使用できる
。或いは本発明遺伝子及びその部分をプローブとしてプ
ロテアソームの発現異常(ノザンプロット解析)、遺伝
子の異常(サザンプロット解析)についての解析、コン
ポーネント特異的抗体を用いてコンポーネント構成の異
常(ウェスタンプロット解析)の解析を行うことができ
る。
又はその遺伝子あるいはこれらに改変を加えたものは、
上記層、アルツハイマー病等のプロテアソーム異常を伴
う疾患について、病態のヒトにおける解明、診断/治療
法の開発に利用できる。 プロテアソームの測定技術の
提供は、プロテアソーム異常を伴う疾患の診断に極めて
有用である。かかる測定には本発明のコンポーネントに
対する抗体を用いた種々の知られた測定系を使用できる
。或いは本発明遺伝子及びその部分をプローブとしてプ
ロテアソームの発現異常(ノザンプロット解析)、遺伝
子の異常(サザンプロット解析)についての解析、コン
ポーネント特異的抗体を用いてコンポーネント構成の異
常(ウェスタンプロット解析)の解析を行うことができ
る。
本発明によって提供されるヒト プロテアソームあるい
はこれに改変を加えたものや、本発明遺伝子から作成さ
れるアンチセンスRNAを用いることによりプロテアソ
ーム異常を伴う疾患の治療上価値ある医薬が提供される
。
はこれに改変を加えたものや、本発明遺伝子から作成さ
れるアンチセンスRNAを用いることによりプロテアソ
ーム異常を伴う疾患の治療上価値ある医薬が提供される
。
さらに、本発明によって提供されるヒト プロテアソー
ムは独特の蛋白質分解活性、即ち、蛋白質の塩基性、中
性、疎水性、酸性アミノ酸残基のカルボキシル部のペプ
チド結合を分解する活性を有するため、この活性を蛋白
質の合成及び分解に利用できる。利用に当っては、酵素
を固定化したバイオリアクターとすることが可能である
。
ムは独特の蛋白質分解活性、即ち、蛋白質の塩基性、中
性、疎水性、酸性アミノ酸残基のカルボキシル部のペプ
チド結合を分解する活性を有するため、この活性を蛋白
質の合成及び分解に利用できる。利用に当っては、酵素
を固定化したバイオリアクターとすることが可能である
。
本発明のヒト プロテアソームのコンポーネントHC2
、HC5、HC8及びHC9は、以下のようにして得る
ことができる。
、HC5、HC8及びHC9は、以下のようにして得る
ことができる。
ヒト プロテアソームの単離精製
ヒト プロテアソームは培養樹立肝細胞癌HepG2細
胞の可溶性画分から、田中らの方法(Tanaka e
t al、、J、Biol、Chem、、261.15
197−15203(1986);Tanaka et
al、、J、Biol、Chem、、263.162
09−16217 (1988))に従い各種クロマト
グラフィー法を用いて単離精製できる。HepG2細胞
はヒト肝細胞癌より得られた樹立症細胞株で、アメリカ
ン タイプ カルチャー コレクション(ATCC)に
寄託番号ATCCHB8065で登録されており、細胞
の性質はAdemらが報告している(Adcm、D、、
et al、、Nature、282.615−616
(1979) )。
胞の可溶性画分から、田中らの方法(Tanaka e
t al、、J、Biol、Chem、、261.15
197−15203(1986);Tanaka et
al、、J、Biol、Chem、、263.162
09−16217 (1988))に従い各種クロマト
グラフィー法を用いて単離精製できる。HepG2細胞
はヒト肝細胞癌より得られた樹立症細胞株で、アメリカ
ン タイプ カルチャー コレクション(ATCC)に
寄託番号ATCCHB8065で登録されており、細胞
の性質はAdemらが報告している(Adcm、D、、
et al、、Nature、282.615−616
(1979) )。
細胞はホモジナイズした後、通常の細胞分画法により、
例えば未破壊細胞を除いた後、核、ミトコンドリア、リ
ソソーム画分を遠心沈殿させて除いた上清として可溶性
画分を得る。ホモジナイズ用緩衝液には、グリセロール
及びジチオスレイトールを含むものを使用し、例えば1
mMジチオスレイトール、20%グリセロールを含む5
0mMトリス−H(J)緩衝液(pH7,5)を好まし
く用いることができる。グリセロールとSH安定化剤の
ジチオスレイトールは本酵素を不活性化状態で精製する
ための安定化剤として添加する。本酵素は細胞の可溶性
画分に局在するが、他の部分にも存在が確認されており
、特に核には豊富に存在する。従って、本酵素は細胞の
核両分からも得ることができる。
例えば未破壊細胞を除いた後、核、ミトコンドリア、リ
ソソーム画分を遠心沈殿させて除いた上清として可溶性
画分を得る。ホモジナイズ用緩衝液には、グリセロール
及びジチオスレイトールを含むものを使用し、例えば1
mMジチオスレイトール、20%グリセロールを含む5
0mMトリス−H(J)緩衝液(pH7,5)を好まし
く用いることができる。グリセロールとSH安定化剤の
ジチオスレイトールは本酵素を不活性化状態で精製する
ための安定化剤として添加する。本酵素は細胞の可溶性
画分に局在するが、他の部分にも存在が確認されており
、特に核には豊富に存在する。従って、本酵素は細胞の
核両分からも得ることができる。
可溶性画分からのプロテアソームの精製は、プロテアソ
ームの物理化学的、免疫化学的性質を利用した種々の処
理操作を利用して実施できる。特にプロテアソームは他
の細胞質性プロテアーゼとは分子量の点で顕著に相違し
、さらに等電点、疎水性等が異なり、ゲル濾過法やイオ
ン交換法がプロテアソームの分離精製に効果的である。
ームの物理化学的、免疫化学的性質を利用した種々の処
理操作を利用して実施できる。特にプロテアソームは他
の細胞質性プロテアーゼとは分子量の点で顕著に相違し
、さらに等電点、疎水性等が異なり、ゲル濾過法やイオ
ン交換法がプロテアソームの分離精製に効果的である。
例えば、ファスト フローQ−セファロース、バイオゲ
ルA−1,5m、等によるゲル濾過、ヒドロキシアパタ
イト、ヘパリン−セファ0−スCL−6B等の吸着クロ
マトグラフィー、FPLCモノ−Qカラム等によるクロ
マトグラフィーを順次使用する。
ルA−1,5m、等によるゲル濾過、ヒドロキシアパタ
イト、ヘパリン−セファ0−スCL−6B等の吸着クロ
マトグラフィー、FPLCモノ−Qカラム等によるクロ
マトグラフィーを順次使用する。
かくして電気泳動的に単一なヒト プロテアソームを得
る。
る。
かくして得られるヒト プロテアソームは、以下の各種
生物学的、物理的、化学的性質を有する。
生物学的、物理的、化学的性質を有する。
i)ヒト プロテアソームは以下の合成基質をいずれも
分解し、至適pHは各基質に対し次の通りである。
分解し、至適pHは各基質に対し次の通りである。
Sue−Leu−Leu−Val−Tyr−MCA −
pH8,4〜8. 7Cbz−Ala−Arg−Arg
−MNA ・・・・・・T) H9、6〜10 、 0
Cz−Leu−Leu−Glu−NA ・=−−pH8
,4〜8. 8ii)ヒト プロテアソームはカゼイン
分解活性を有し、その活性はポリーL−リジン添加によ
り顕著に増大する。
pH8,4〜8. 7Cbz−Ala−Arg−Arg
−MNA ・・・・・・T) H9、6〜10 、 0
Cz−Leu−Leu−Glu−NA ・=−−pH8
,4〜8. 8ii)ヒト プロテアソームはカゼイン
分解活性を有し、その活性はポリーL−リジン添加によ
り顕著に増大する。
1ii)電気泳動により求めた分子量は約750000
である。
である。
之等の詳細は、後記実施例に示す通りである。
また、本発明のヒト プロテアソームのコンポーネント
は、遺伝子工学的手法によって、即ち本発明の提供する
遺伝子を利用し、これを微生物のベクターに組込んで該
微生物細胞内で複製、転写、翻訳させることによって、
製造することができる。
は、遺伝子工学的手法によって、即ち本発明の提供する
遺伝子を利用し、これを微生物のベクターに組込んで該
微生物細胞内で複製、転写、翻訳させることによって、
製造することができる。
この方法は、特に人足生産が可能である点から有利であ
る。
る。
以下、本発明のヒト プロテアソームのコンポーネント
の遺伝子の製造方法を説明する。
の遺伝子の製造方法を説明する。
cDNAライブラリーの構築
本発明遺伝子は、例えば以下に示すように天然の起源の
m RN Aから製造できる他、一般に知られている種
々の方法で製造でき、例えば本発明遺伝子の遺伝情報に
基づいて、ホスファイト トリエステル法[Natur
e、310.105 (1984)]等の常法に従って
核酸の化学合成を行う方法、或いは上記各種方法を併用
する方法等を例示できる。
m RN Aから製造できる他、一般に知られている種
々の方法で製造でき、例えば本発明遺伝子の遺伝情報に
基づいて、ホスファイト トリエステル法[Natur
e、310.105 (1984)]等の常法に従って
核酸の化学合成を行う方法、或いは上記各種方法を併用
する方法等を例示できる。
以下に、本発明遺伝子の製造法のうち、上記mRNAか
ら製造する方法につき、より詳細に説明する。
ら製造する方法につき、より詳細に説明する。
本遺伝子は、培養樹立肝細胞癌HepG2細胞から得る
ことができる。プロテアソームの含量は代謝活性の高い
臓器、殊に肝臓に多く、又癌化により遺伝子の発現が亢
進する。本遺伝子は肝細胞のみでなく、肝臓、胃、肝、
小腸、腎臓、心臓等の各種組繊細胞から得ることもでき
る。該細胞にグアニジンチオシアネート(GTC)溶液
を加えてホモジナイズし、次いで塩化セシウム密度勾配
遠心法により全RNAを得た。
ことができる。プロテアソームの含量は代謝活性の高い
臓器、殊に肝臓に多く、又癌化により遺伝子の発現が亢
進する。本遺伝子は肝細胞のみでなく、肝臓、胃、肝、
小腸、腎臓、心臓等の各種組繊細胞から得ることもでき
る。該細胞にグアニジンチオシアネート(GTC)溶液
を加えてホモジナイズし、次いで塩化セシウム密度勾配
遠心法により全RNAを得た。
上記抽出操作に従い得られるRNAからのmRNAの分
離は、オリゴ(dT)カラムクロマトグラフィーを用い
た常法により行う。
離は、オリゴ(dT)カラムクロマトグラフィーを用い
た常法により行う。
mRNAから逆転写酵素を用いてcDNAを合成し、次
にDNAポリメラーゼIで二本鎖DNAとし、ベクター
へ組込む。これは使用するベクターに応じ公知の種々の
方法、例えばゴブラーとホフマンの方法、岡山バーブ法
等を使用して行われる。市販のcDNA合成キットを用
いれば容易に行うことができる。使用するベクターとし
ては、特に制限されないが、λgt系等のファージベク
ターやEK系、Bluescript K S+等の
プラスミドベクターを宿主に応じて適当に選択し、ある
いは組合わせて使用できる。プライマーには、オリゴ(
dT)単独、あるいはリンカ−や組込むプラスミドの一
部を有するオリゴ(dT)を使用する。
にDNAポリメラーゼIで二本鎖DNAとし、ベクター
へ組込む。これは使用するベクターに応じ公知の種々の
方法、例えばゴブラーとホフマンの方法、岡山バーブ法
等を使用して行われる。市販のcDNA合成キットを用
いれば容易に行うことができる。使用するベクターとし
ては、特に制限されないが、λgt系等のファージベク
ターやEK系、Bluescript K S+等の
プラスミドベクターを宿主に応じて適当に選択し、ある
いは組合わせて使用できる。プライマーには、オリゴ(
dT)単独、あるいはリンカ−や組込むプラスミドの一
部を有するオリゴ(dT)を使用する。
合成された二本鎖DNAを、適当な方法でベクターに組
込む。宿主細胞としては、E、coliが代表的である
が、これに限定されず、真核生物及び原核生物のいずれ
をも用いることができる。例えば合成した2本鎖DNA
をクレノー断片で平滑化し、EcoRIアダプターを結
合させ、発現ベクターBluescript K S
+のマルチクローニング部位のEcoRI部位に挿入し
、これでE、C01i HBIOIコンピテント細胞
を形質転換する。
込む。宿主細胞としては、E、coliが代表的である
が、これに限定されず、真核生物及び原核生物のいずれ
をも用いることができる。例えば合成した2本鎖DNA
をクレノー断片で平滑化し、EcoRIアダプターを結
合させ、発現ベクターBluescript K S
+のマルチクローニング部位のEcoRI部位に挿入し
、これでE、C01i HBIOIコンピテント細胞
を形質転換する。
DNAの宿主微生物への導入及びこれによる形質転換の
方法としては、一般に用いられている方法を使用できる
。例えばベクターとしてファージを用いる場合は単に宿
主細胞に感染させれば効率よく宿主にDNAがくみこま
れる。またプラスミドを用いる場合は、対数増殖期にあ
る細胞を集め、CaC,Q2処理して自然にDNAを取
り込み易い状態にしてプラスミドを取込ませる方法等を
採用できる。
方法としては、一般に用いられている方法を使用できる
。例えばベクターとしてファージを用いる場合は単に宿
主細胞に感染させれば効率よく宿主にDNAがくみこま
れる。またプラスミドを用いる場合は、対数増殖期にあ
る細胞を集め、CaC,Q2処理して自然にDNAを取
り込み易い状態にしてプラスミドを取込ませる方法等を
採用できる。
例えば合成した2本鎖DNAをクレノー断片で平滑化し
、EcoRIアダプターを結合させ、発現ベクターBl
uescript K S+のマルチクローニング部
位のEcoR1部位に挿入し、これでE。
、EcoRIアダプターを結合させ、発現ベクターBl
uescript K S+のマルチクローニング部
位のEcoR1部位に挿入し、これでE。
co2i HBIOIコンピテント細胞を形質転換す
る。これらの方法の詳細についてはBiochemis
tory、28.7332(1989)に記載されてい
る。
る。これらの方法の詳細についてはBiochemis
tory、28.7332(1989)に記載されてい
る。
クローンの単離と塩基配列の決定
かくして得られるヒト cDNAライブラリーからの、
遺伝子のスクリーニングは、従来より知られている各種
操作を組合わせることにより実施できる。例えばCDN
Aクローンの産生ずる蛋白質に対しヒト プロテアソー
ム特異的抗体を使用し、ウェスタンブロッティングによ
り対応するCDNAクローンを選択する方法、目的のD
NA配列に選択的に結合するプローブを用いたサザンブ
ロッティング法、或いはノザンブロッティング法により
スクリーニングが可能である。これらを組合わせること
も可能である。
遺伝子のスクリーニングは、従来より知られている各種
操作を組合わせることにより実施できる。例えばCDN
Aクローンの産生ずる蛋白質に対しヒト プロテアソー
ム特異的抗体を使用し、ウェスタンブロッティングによ
り対応するCDNAクローンを選択する方法、目的のD
NA配列に選択的に結合するプローブを用いたサザンブ
ロッティング法、或いはノザンブロッティング法により
スクリーニングが可能である。これらを組合わせること
も可能である。
ユニでプローブとしては、目的のDNA又はRNA配列
に選択的に結合するものであればよく、目的のDNA配
列又はそれにコードされるアミノ酸配列に関する情報を
もとに、化学合成したDNA配列を用いるのが一般的で
あるが、天然から調製されたDNAやRNAも使用でき
る。特にヒトプロテアソームのコンポーネントの遺伝子
はラットのそれと相同性が高いため、ラットの対応する
コンポーネントのcDNA又はその一部を(5、J化し
て使用可能である。
に選択的に結合するものであればよく、目的のDNA配
列又はそれにコードされるアミノ酸配列に関する情報を
もとに、化学合成したDNA配列を用いるのが一般的で
あるが、天然から調製されたDNAやRNAも使用でき
る。特にヒトプロテアソームのコンポーネントの遺伝子
はラットのそれと相同性が高いため、ラットの対応する
コンポーネントのcDNA又はその一部を(5、J化し
て使用可能である。
上記において得られた本発明遺伝子は、常法に従って各
種プラスミドにクローニングすることができる。例えば
EcoRIにて切断して精製した本発明遺伝子を含む断
片を、同様にEcoRIにて切断したp B R327
[X、5oberon。
種プラスミドにクローニングすることができる。例えば
EcoRIにて切断して精製した本発明遺伝子を含む断
片を、同様にEcoRIにて切断したp B R327
[X、5oberon。
L、Covarrubias and F、Bollv
ar、Gene、9,287(1980)]の切断部位
へ挿入すれば良い。これにより所望の組換えベクターを
得ることができる。また、得られる組換えベクターの宿
主への導入及びこれによる組換えベクターの増幅と個別
化は、般に用いられている各種の方法、例えば主として
対数増殖期にある細胞を集め、CaC1□処理により自
然にDNAを取り込みやすい状態とし、これにベクター
を取り込ませる方法等により行い得る。
ar、Gene、9,287(1980)]の切断部位
へ挿入すれば良い。これにより所望の組換えベクターを
得ることができる。また、得られる組換えベクターの宿
主への導入及びこれによる組換えベクターの増幅と個別
化は、般に用いられている各種の方法、例えば主として
対数増殖期にある細胞を集め、CaC1□処理により自
然にDNAを取り込みやすい状態とし、これにベクター
を取り込ませる方法等により行い得る。
なお、上記において採用される各種の操作、例えば一部
DNAの化学合成、DNA鎖の切断、削除、付加ないし
結合を目的とする酵素処理、DNAの単離、精製、複製
、選択等はいずれも常法に従うことができる。より具体
的には、上記DNAの単離精製は、アガロースゲル電気
泳動等に従うことができる。
DNAの化学合成、DNA鎖の切断、削除、付加ないし
結合を目的とする酵素処理、DNAの単離、精製、複製
、選択等はいずれも常法に従うことができる。より具体
的には、上記DNAの単離精製は、アガロースゲル電気
泳動等に従うことができる。
また、上記で得られる本発明遺伝子のDNA配列の決定
は、適当な制限酵素でDNAを消化した後、ジデオキシ
法[Sanger、et al、、Proc、Natl
、Acad、sci、UsA、74.5463(197
7)]や]マキサムーギルバート法[A、M、Maxa
m and W、G11bert、Methods
in EnzymoIogy、 85.499−5[3
0(1980)]等により行い得る。
は、適当な制限酵素でDNAを消化した後、ジデオキシ
法[Sanger、et al、、Proc、Natl
、Acad、sci、UsA、74.5463(197
7)]や]マキサムーギルバート法[A、M、Maxa
m and W、G11bert、Methods
in EnzymoIogy、 85.499−5[3
0(1980)]等により行い得る。
さらに上記DNA配列の決定は、市販のシークエンスキ
ット等を用いることによっても容易に行い得る。
ット等を用いることによっても容易に行い得る。
かくして得られた本発明のヒト プロテアソームコンポ
ーネントHC2、HC5、HC8及びHC9の遺伝子の
塩基配列及び対応するアミノ酸配列を、夫々第1〜4表
に示す。そのうち翻訳領域と対応するアミノ酸配列は、
前記式(5)〜(8)及び式(1)〜(4)に示した通
りである。塩基の番号は、開始コドンATGを1とし、
5−→3一方向につけられている。アミノ酸残基の番号
はN末端からつけられている。
ーネントHC2、HC5、HC8及びHC9の遺伝子の
塩基配列及び対応するアミノ酸配列を、夫々第1〜4表
に示す。そのうち翻訳領域と対応するアミノ酸配列は、
前記式(5)〜(8)及び式(1)〜(4)に示した通
りである。塩基の番号は、開始コドンATGを1とし、
5−→3一方向につけられている。アミノ酸残基の番号
はN末端からつけられている。
HC2の配列は、翻訳領域及び5′側と3′側の非翻訳
領域を含めて全体で1105個の塩基からなる。翻訳領
域は789塩基の長さで、263個のアミノ酸の蛋白質
に相当する。この推定配列から、分子量は29554と
計算される。
領域を含めて全体で1105個の塩基からなる。翻訳領
域は789塩基の長さで、263個のアミノ酸の蛋白質
に相当する。この推定配列から、分子量は29554と
計算される。
HC5の配列は翻訳領域及び5′側と3′側の非翻訳領
域を含めて全体で823個の塩基から成る。翻訳領域は
723塩基の長さで、241個のアミノ酸の蛋白質に相
当する。この推定配列から、分子口は26488と計算
される。
域を含めて全体で823個の塩基から成る。翻訳領域は
723塩基の長さで、241個のアミノ酸の蛋白質に相
当する。この推定配列から、分子口は26488と計算
される。
HC8の配列は翻訳領域及び5′側と3′側の非翻訳領
域を含め全体で838個の塩基から成る。
域を含め全体で838個の塩基から成る。
翻訳領域は765塩基の長さで、255個のアミノ酸の
蛋白質に相当する。この推定配列から、分子量は284
32と計算される。
蛋白質に相当する。この推定配列から、分子量は284
32と計算される。
HC9の配列は翻訳領域及び5′側と3′側の非翻訳領
域を含めて全体で1078個の塩基から成る。翻訳領域
は783塩基の長さで、261個のアミノ酸の蛋白質に
相当する。この推定配列から、分子量は29482と計
算される。
域を含めて全体で1078個の塩基から成る。翻訳領域
は783塩基の長さで、261個のアミノ酸の蛋白質に
相当する。この推定配列から、分子量は29482と計
算される。
実施例
以下本発明を具体的に説明するため実施例を挙げるが本
発明はこれに限定されない。
発明はこれに限定されない。
実施例1
(1)ヒト プロテアソームの精製
ヒト プロテアソームは既報の方法に従い(Tanak
a et al、、J、Biol、chem、263.
16209−16217゜(1988)) 、樹立株化
ヒト肝細胞層HepG2細胞の可溶性画分からクロマト
グラフィーにより精製した。 簡単に述べれば、樹立株
化ヒト肝細胞層HepG2細胞を4X107個/ml、
lO%牛脂児血清(Fe2) 、25mg/Ωセフアメ
シン、30mg/Nカナマイシンを含むダルベツコ改変
イーグル培地(DME)にて10m1シヤーレ40枚を
5%CO2中37℃中日7培養し、1001000rp
分間の遠心分離を数回繰り返して精製し1.9gのHe
pG細胞を得た。これを緩衝液[1mMジチオスレイト
ール、20%グリセロールを含む50mMトリス−HC
(l緩衝液(pH7,5)]中でホモジナイズした後、
遠心してサイドシル画分を得た。次にファスト フロー
ローセファロース、バイオ−ゲルA−1,5m、ヒドロ
キシアパタイト、ヘパリン−セファロースCL−6B及
びFPLCモノ−Qカラムで順次クロマトグラフして精
製した。この精製したプロテアソームはSDS非存非存
在米変性条件下ポリアクリルアミド ゲル電気泳動で分
析した結果、はぼ単一であった。SDS存在下では分子
量2.2万〜3.2万の位置に8〜10本の染色バンド
が観察された。得られたヒト プロテアソームは以下の
活性を有していた(特開平1−309686)。
a et al、、J、Biol、chem、263.
16209−16217゜(1988)) 、樹立株化
ヒト肝細胞層HepG2細胞の可溶性画分からクロマト
グラフィーにより精製した。 簡単に述べれば、樹立株
化ヒト肝細胞層HepG2細胞を4X107個/ml、
lO%牛脂児血清(Fe2) 、25mg/Ωセフアメ
シン、30mg/Nカナマイシンを含むダルベツコ改変
イーグル培地(DME)にて10m1シヤーレ40枚を
5%CO2中37℃中日7培養し、1001000rp
分間の遠心分離を数回繰り返して精製し1.9gのHe
pG細胞を得た。これを緩衝液[1mMジチオスレイト
ール、20%グリセロールを含む50mMトリス−HC
(l緩衝液(pH7,5)]中でホモジナイズした後、
遠心してサイドシル画分を得た。次にファスト フロー
ローセファロース、バイオ−ゲルA−1,5m、ヒドロ
キシアパタイト、ヘパリン−セファロースCL−6B及
びFPLCモノ−Qカラムで順次クロマトグラフして精
製した。この精製したプロテアソームはSDS非存非存
在米変性条件下ポリアクリルアミド ゲル電気泳動で分
析した結果、はぼ単一であった。SDS存在下では分子
量2.2万〜3.2万の位置に8〜10本の染色バンド
が観察された。得られたヒト プロテアソームは以下の
活性を有していた(特開平1−309686)。
i)ヒト プロテアソーム50μg、1mMジチオスレ
イトール、50mM)リスーHCII緩衝液(pH8,
0) 、10μg [3H] −カゼインから成る試験
液200μgを調製し、これにポリーL−リジン(分子
ff134000、シグマ社製)を終濃度が0.5mg
/mlとなるように加えて、37℃で1時間反応させ、
次いで2mg/mRのBSAを含む10%トリクロロ酢
酸0.8mNを加えて反応を停止させた後、酸可溶性分
画の放射能を測定した。プロテアソームのカゼイン分解
活性はポリリジン添加により顕著に増大した。
イトール、50mM)リスーHCII緩衝液(pH8,
0) 、10μg [3H] −カゼインから成る試験
液200μgを調製し、これにポリーL−リジン(分子
ff134000、シグマ社製)を終濃度が0.5mg
/mlとなるように加えて、37℃で1時間反応させ、
次いで2mg/mRのBSAを含む10%トリクロロ酢
酸0.8mNを加えて反応を停止させた後、酸可溶性分
画の放射能を測定した。プロテアソームのカゼイン分解
活性はポリリジン添加により顕著に増大した。
ji)ヒト プロテアソーム50μg、1mMジチオス
レイトール、50mMトリス−HCj7緩衝液(pH8
,0)から成る試験液200μgを調製し、合成基質と
してSuc−Leu−Leu−Val−Tyr−MCA
、 Cbz−Ala−Arg−Arg−MNA又はC
z−Leu−Leu−Glu−NAを0.2mM用い、
37℃で10分間反応させた。反応停止は10%SDS
を100μg添加し、更に0.1Mトリス−HC,Q(
p H9,0)を加えてから、遊離してきたMCA、M
NA又はNAの蛍光を夫々測定した。
レイトール、50mMトリス−HCj7緩衝液(pH8
,0)から成る試験液200μgを調製し、合成基質と
してSuc−Leu−Leu−Val−Tyr−MCA
、 Cbz−Ala−Arg−Arg−MNA又はC
z−Leu−Leu−Glu−NAを0.2mM用い、
37℃で10分間反応させた。反応停止は10%SDS
を100μg添加し、更に0.1Mトリス−HC,Q(
p H9,0)を加えてから、遊離してきたMCA、M
NA又はNAの蛍光を夫々測定した。
プロテアソームは上記合成基質をいずれも分解し、至適
pHは各基質に対し以下の通りであった。
pHは各基質に対し以下の通りであった。
Sue−Leu−Leu−Val−Tyr−MCA −
pH8,4〜8. 6Cbz−Ala−Arg−Arg
−MNA −−−−−−p H9,8〜10. IC
z−Leu−Leu−Glu−NA −−・−pH8,
4〜8. 6(3)プローブの調製 ヒトとラットのプロテアソームはそのサブユニットの構
成及び物理的性質のパターンが類似していることから、
遺伝子配列に於いてもかなりの相同性が期待できる。実
際に、ラットC2クローンをプローブとしてノザンプロ
ット解析をした結果、ヒトの肝にもラットのものと同様
に明確なバンドが認められた(Biochemistr
y 28.7332(1989))。
pH8,4〜8. 6Cbz−Ala−Arg−Arg
−MNA −−−−−−p H9,8〜10. IC
z−Leu−Leu−Glu−NA −−・−pH8,
4〜8. 6(3)プローブの調製 ヒトとラットのプロテアソームはそのサブユニットの構
成及び物理的性質のパターンが類似していることから、
遺伝子配列に於いてもかなりの相同性が期待できる。実
際に、ラットC2クローンをプローブとしてノザンプロ
ット解析をした結果、ヒトの肝にもラットのものと同様
に明確なバンドが認められた(Biochemistr
y 28.7332(1989))。
このことはヒトの肝にもラットC2クローンと類似した
mRNA分子種が存在することを強く示唆している。ま
た、RC5,RC8,RC9についてもヒト肝において
それぞれ同様のm RN A分子種の存在がノザンプロ
ット解析で確認されている。
mRNA分子種が存在することを強く示唆している。ま
た、RC5,RC8,RC9についてもヒト肝において
それぞれ同様のm RN A分子種の存在がノザンプロ
ット解析で確認されている。
このため、ヒト プロテアソームの検索にはラットのプ
ロテアソームのサブユニットRC2、RC5、RC8、
RC9のcDNAクローン(特願平2−103833)
を標識化して行った。
ロテアソームのサブユニットRC2、RC5、RC8、
RC9のcDNAクローン(特願平2−103833)
を標識化して行った。
各プローブを第1図に示す。HC2のスクリーニングに
用いたプローブはRC2のHindm−Pvun断片(
約1050bp)であり、同様に、HC5にはRC5の
Xhol−8au3AI断片(約700bp) 、HC
8にはRC8のXhol−Ncol断片(約850bp
) 、HC9にはRC9の5tyl−5tyl断片(約
810bp)を用い、マルチプライムDNA ラベル
化法(Peinberg、A、P、、et al、An
al、Biochem、137.266−267(19
84)により32pで標識化しプローブとした。
用いたプローブはRC2のHindm−Pvun断片(
約1050bp)であり、同様に、HC5にはRC5の
Xhol−8au3AI断片(約700bp) 、HC
8にはRC8のXhol−Ncol断片(約850bp
) 、HC9にはRC9の5tyl−5tyl断片(約
810bp)を用い、マルチプライムDNA ラベル
化法(Peinberg、A、P、、et al、An
al、Biochem、137.266−267(19
84)により32pで標識化しプローブとした。
(1)と同様にして得られたHepG2細胞1.9gに
5倍量のGTC緩衝液(5,3Mグアニジウムチオシア
ネー)、0.02M N−ラウリルザルコシルナトリ
ウム、0.03M クエン酸三ナトリウム、0.8%
β−メルカプトエタノール、0.7%アンチフオームD
B−11ONエマルジョン)を加え、ボッター式ホモジ
ナイザーで10往復させてホモジナイズした後、ビーカ
ーに移し、22Gの注射針をいきおい良く3回通しシア
リングした。0.1M EDTAを含む 5゜7M塩
化セシウム溶液を遠心チューブに約 12貌入れ、その
上にホモシネイト約241112を重層した後、28.
00Orpmで20時間遠心分離を行って全RNA3.
29mgを回収した。
5倍量のGTC緩衝液(5,3Mグアニジウムチオシア
ネー)、0.02M N−ラウリルザルコシルナトリ
ウム、0.03M クエン酸三ナトリウム、0.8%
β−メルカプトエタノール、0.7%アンチフオームD
B−11ONエマルジョン)を加え、ボッター式ホモジ
ナイザーで10往復させてホモジナイズした後、ビーカ
ーに移し、22Gの注射針をいきおい良く3回通しシア
リングした。0.1M EDTAを含む 5゜7M塩
化セシウム溶液を遠心チューブに約 12貌入れ、その
上にホモシネイト約241112を重層した後、28.
00Orpmで20時間遠心分離を行って全RNA3.
29mgを回収した。
次に上記で得たRNAからポリ(A)” RNAを取得
するために、以下のようにしてオリゴ(dT)−セルロ
ースカラムクロマトグラフィーを行った。全RNA1.
6mgを5 mg / ItQ以下の濃度に希釈し、6
5℃、7分間インキュベート後、水冷中で2分間急冷し
た。等全の2倍オリゴ(dT)結合緩衝液[1,0M
NaC,Q、20mMTr i 5−HCl25pH
7,5コ、及び1/100容量の 20%SDSを添加
してよく混合した。ついでオリゴ(dT)結合緩衝液[
0,5M NaC,Q、10mM Tris−H(
J)、 pH7,5,0,1%5DSIで平衡化したオ
リゴ(dT)セルロースカラム(バイオ・ラド社製)に
付加した。未吸着区分は再度65℃で7分間反応させ、
水冷中で2分間急冷して再度カラムに付加した。カラム
は10倍容量のオリゴ(dT)結合緩衝液で洗浄し、さ
らに10倍容量のオリゴ(dT)洗浄液[0,1M
NaCN、10mM Tris−HCI pH7,
5,0,1% SDS]を用いて洗浄した。オリコ(d
T)セルロースに結合したポリ(A)” RNAはオリ
ゴ(dT)溶出液[10mM Tris−HCI)
pH7,5、0,05%SDSコ により溶出した
。溶出液に1/25容量の5MNaC9及び2.5容量
のエタノールを加え、よく混合して一20℃で一昼夜放
置した後、12000rpmで15分間遠心分離を行い
ポリ(A)” RNAを沈殿させた。これを70%エタ
ノールに再度懸濁して同様に遠心分離し、沈殿を乾燥後
、適当量の水に溶かした。得られたポリ(A)” RN
A全は53μgであった。
するために、以下のようにしてオリゴ(dT)−セルロ
ースカラムクロマトグラフィーを行った。全RNA1.
6mgを5 mg / ItQ以下の濃度に希釈し、6
5℃、7分間インキュベート後、水冷中で2分間急冷し
た。等全の2倍オリゴ(dT)結合緩衝液[1,0M
NaC,Q、20mMTr i 5−HCl25pH
7,5コ、及び1/100容量の 20%SDSを添加
してよく混合した。ついでオリゴ(dT)結合緩衝液[
0,5M NaC,Q、10mM Tris−H(
J)、 pH7,5,0,1%5DSIで平衡化したオ
リゴ(dT)セルロースカラム(バイオ・ラド社製)に
付加した。未吸着区分は再度65℃で7分間反応させ、
水冷中で2分間急冷して再度カラムに付加した。カラム
は10倍容量のオリゴ(dT)結合緩衝液で洗浄し、さ
らに10倍容量のオリゴ(dT)洗浄液[0,1M
NaCN、10mM Tris−HCI pH7,
5,0,1% SDS]を用いて洗浄した。オリコ(d
T)セルロースに結合したポリ(A)” RNAはオリ
ゴ(dT)溶出液[10mM Tris−HCI)
pH7,5、0,05%SDSコ により溶出した
。溶出液に1/25容量の5MNaC9及び2.5容量
のエタノールを加え、よく混合して一20℃で一昼夜放
置した後、12000rpmで15分間遠心分離を行い
ポリ(A)” RNAを沈殿させた。これを70%エタ
ノールに再度懸濁して同様に遠心分離し、沈殿を乾燥後
、適当量の水に溶かした。得られたポリ(A)” RN
A全は53μgであった。
(4−2)cDNAの合成
上記の方法で得られたポリ(A) +RNAからファル
マシア社製のcDNA合成キットを用いてcDNAを合
成した。
マシア社製のcDNA合成キットを用いてcDNAを合
成した。
シリコン化した1、5鋪チユーブ(エッペンドルフ社製
)に5μg/7μgのポリ(A)” RNAを入れ、1
3μgのRNase−フリー水を加えて総容量20μg
とする。この溶液を65℃で10分間加温して、水中で
急冷する。次に、第1鎖合成反応液[F P L Cp
ureoMCloned Murin Reverse
Transcriptase (モロニー・マウス白
血病ウィルス(MMLV)の逆転写酵素)、FPLCp
ureTMRNAguard SRN a s e/D
N a s e フリーBSA、オリゴd (T) 1
2−18プライマー dATP、dGTP、dCTP、
dTTPを含むバッファー]に1μρのDTT溶液を加
えて混合し、RNaseフリー水で希釈した1μg (
5μci)のa−32PdCTP (3000Ci/m
mo1.10mCi /mD ;ファルマシア社製)
を加えた。
)に5μg/7μgのポリ(A)” RNAを入れ、1
3μgのRNase−フリー水を加えて総容量20μg
とする。この溶液を65℃で10分間加温して、水中で
急冷する。次に、第1鎖合成反応液[F P L Cp
ureoMCloned Murin Reverse
Transcriptase (モロニー・マウス白
血病ウィルス(MMLV)の逆転写酵素)、FPLCp
ureTMRNAguard SRN a s e/D
N a s e フリーBSA、オリゴd (T) 1
2−18プライマー dATP、dGTP、dCTP、
dTTPを含むバッファー]に1μρのDTT溶液を加
えて混合し、RNaseフリー水で希釈した1μg (
5μci)のa−32PdCTP (3000Ci/m
mo1.10mCi /mD ;ファルマシア社製)
を加えた。
熱変性させた上記ポリ(A)” RNA溶液を加え混合
後、37℃1時間反応させて一本鎖cDNAを合成した
。この反応条件は7kb或いはそれ以上の長さのRNA
の全長を転写できるように至適化されている。
後、37℃1時間反応させて一本鎖cDNAを合成した
。この反応条件は7kb或いはそれ以上の長さのRNA
の全長を転写できるように至適化されている。
上記の反応液33μgを更に、予め5μ、Q (25
μCi)の[α−32P] dCTPを加えた第2鎖合
成反応液[E、coli RNaseH,DNAポリ
メラーゼI、dNTPsを含むバッファー]67μgに
移し、総容量100μgとし混合する。次に12℃1時
間、続いて22℃1時間反応させた。
μCi)の[α−32P] dCTPを加えた第2鎖合
成反応液[E、coli RNaseH,DNAポリ
メラーゼI、dNTPsを含むバッファー]67μgに
移し、総容量100μgとし混合する。次に12℃1時
間、続いて22℃1時間反応させた。
cDNAを平滑末端にするため、さらに1μgのクレノ
ー溶液を加え、37℃ 30分間反応させた後フェノー
ル抽出した。水層をスパンカラムで精製するかわりにエ
タノール沈殿を行った。
ー溶液を加え、37℃ 30分間反応させた後フェノー
ル抽出した。水層をスパンカラムで精製するかわりにエ
タノール沈殿を行った。
沈殿に100μNのTE[10mM Tris−HC
II pH7,5,1mM EDTA)を加え溶解
後、EcoRIアダプター5μm、ATP溶液1μN
、T4DNAリガーゼ3μgを加え混合後12℃−昼夜
反応させた。次に、64℃で10分間加熱しりガーゼを
変性させた後氷で冷やした。10μgのATP溶液と1
μgのT4ポリヌクレオチドキナーゼを添加して穏やか
に混合後37℃で30分間反応させた後、フェノール/
クロロホルム(24: 1)抽出し、水層を0.3MN
aCl、10mM Tris−HCll、1mM
EDTAで平衡化したセファロースCL−4B (0,
7X15cm)にて未反応のアダプターを除去した。c
DNA画分をエタノール沈殿し、400ngの2末鎖c
DNAを得た。
II pH7,5,1mM EDTA)を加え溶解
後、EcoRIアダプター5μm、ATP溶液1μN
、T4DNAリガーゼ3μgを加え混合後12℃−昼夜
反応させた。次に、64℃で10分間加熱しりガーゼを
変性させた後氷で冷やした。10μgのATP溶液と1
μgのT4ポリヌクレオチドキナーゼを添加して穏やか
に混合後37℃で30分間反応させた後、フェノール/
クロロホルム(24: 1)抽出し、水層を0.3MN
aCl、10mM Tris−HCll、1mM
EDTAで平衡化したセファロースCL−4B (0,
7X15cm)にて未反応のアダプターを除去した。c
DNA画分をエタノール沈殿し、400ngの2末鎖c
DNAを得た。
(4−3)ベクターBlueseript K S
+への挿入Bluescript K S ” (
ストラタジーン社製)のマルチクローニング部位のEc
oRI部位に挿入した。すなわち、KSプラスミド3μ
N (3,3μg)に3uflの反応用緩衝液(10
0mM Tr i 5−HCl2 pH7,5,7
0mM MgCl2.600mM NaC(1,7
0mM β−メルカプトエタノール)、2μpのEc
oRI (24units)、22μgの蒸留水を加
え、混合後、37℃で2時間反応させた。さらに、ベク
ターのみの結合(セルフライゲーション)を妨げるため
にベクターの脱リン酸化を行なった。すなわち、反応液
に3ttlのIM Tris−HCj!pH8,0と
1μgのバクチリアルアルカリホスファターゼ(BAP
)0.5un i tを加え、混合後、60℃1時間反
応させた、反応後、1.58gの200mM EDT
Aを加え、フェノール/クロロホルム抽出を3回行い、
完全にBAPを除去しエタノール沈澱にてDNAを回収
した。10ng/1tl)の濃度になるようにTE (
10mMTr i 5−HCp pH7,5,1mM
EDTA)加えた。
+への挿入Bluescript K S ” (
ストラタジーン社製)のマルチクローニング部位のEc
oRI部位に挿入した。すなわち、KSプラスミド3μ
N (3,3μg)に3uflの反応用緩衝液(10
0mM Tr i 5−HCl2 pH7,5,7
0mM MgCl2.600mM NaC(1,7
0mM β−メルカプトエタノール)、2μpのEc
oRI (24units)、22μgの蒸留水を加
え、混合後、37℃で2時間反応させた。さらに、ベク
ターのみの結合(セルフライゲーション)を妨げるため
にベクターの脱リン酸化を行なった。すなわち、反応液
に3ttlのIM Tris−HCj!pH8,0と
1μgのバクチリアルアルカリホスファターゼ(BAP
)0.5un i tを加え、混合後、60℃1時間反
応させた、反応後、1.58gの200mM EDT
Aを加え、フェノール/クロロホルム抽出を3回行い、
完全にBAPを除去しエタノール沈澱にてDNAを回収
した。10ng/1tl)の濃度になるようにTE (
10mMTr i 5−HCp pH7,5,1mM
EDTA)加えた。
上記で処理したベクター2μg (20ng)に2μg
(20ng)cDNA、反応用緩衝液[660mM
Tr i 5−HC,Q pH7,5,50mM
Mg(、Q 2.50mM DTT、10mMATP
) 、T4DNAリガーゼ1 uD (350uni
ts)(ベーリンガー製)、水13μgを混合して16
℃で一昼夜反応させた。
(20ng)cDNA、反応用緩衝液[660mM
Tr i 5−HC,Q pH7,5,50mM
Mg(、Q 2.50mM DTT、10mMATP
) 、T4DNAリガーゼ1 uD (350uni
ts)(ベーリンガー製)、水13μgを混合して16
℃で一昼夜反応させた。
(5)クローンの単離
(5−1)形質転換
(4)で得られたベクターを用いて
E、coli HBIOIコンピテントセル(宝酒造
製)を形質転換した。
製)を形質転換した。
(5−2)スクリーニング
9cmナイロンファルタ−(デュポンのコロニ/プラー
クスクリーン)上に2000のトランスフォーマントを
生育させ、計20枚、40000のトランスフォーマン
トをスクリーニングした。
クスクリーン)上に2000のトランスフォーマントを
生育させ、計20枚、40000のトランスフォーマン
トをスクリーニングした。
各フィルターを0,5N NaOHで処理し、IM
Tris−HCp (pH7,5)で洗浄後、濾紙上
で乾燥させた。次いでこれを十分量の2×5SPE
(0,3M NaCρ、20mMリン酸ナトリウム、
2rnM EDTA、pH7,4)中でよく洗浄した
。これを濾紙上で風乾した。
Tris−HCp (pH7,5)で洗浄後、濾紙上
で乾燥させた。次いでこれを十分量の2×5SPE
(0,3M NaCρ、20mMリン酸ナトリウム、
2rnM EDTA、pH7,4)中でよく洗浄した
。これを濾紙上で風乾した。
全フィルターをナイロンバックに入れ、20脱のプレハ
イブリダイゼーション溶液(5XSSPE15×デンハ
ルト、0.5%SDS、100μg / fIIQの熱
変性DNA)を加え、泡を抜いて37℃で2時間反応さ
せた。尚上記に於て5xSSPE及び5×デンハルトの
組成は以下の通りである。
イブリダイゼーション溶液(5XSSPE15×デンハ
ルト、0.5%SDS、100μg / fIIQの熱
変性DNA)を加え、泡を抜いて37℃で2時間反応さ
せた。尚上記に於て5xSSPE及び5×デンハルトの
組成は以下の通りである。
5XSSPE:(0,75MNaC1)、50mMリン
酸ナトリウム、5 m M E D T A )5×
デンハルト:(0,1% Ficoll。
酸ナトリウム、5 m M E D T A )5×
デンハルト:(0,1% Ficoll。
0.1%ポリビニルピロリドン、0.1%牛血清アルブ
ミン) 全フィルターを新しいナイロンバックに移し、サケ精子
DNA (10mg/m12)を100μgと(3)で
得られたプローブ100μgを100℃で5分間熱処理
を行った後、水中で2分急冷した。
ミン) 全フィルターを新しいナイロンバックに移し、サケ精子
DNA (10mg/m12)を100μgと(3)で
得られたプローブ100μgを100℃で5分間熱処理
を行った後、水中で2分急冷した。
この変性DNAと20−のプレハイブリダイゼーション
溶液を混合し、ナイロンバッグに加え、泡を抜いて37
℃で一昼夜反応させた。
溶液を混合し、ナイロンバッグに加え、泡を抜いて37
℃で一昼夜反応させた。
次いでフィルターを1% SDSを含む2xSSPEを
用いて室温で5分、65℃で 30分洗浄してオートラ
ジオグラフィーを行った。
用いて室温で5分、65℃で 30分洗浄してオートラ
ジオグラフィーを行った。
オートラジオグラフィーの結果、約40000個のコロ
ニーから、HC2、HC5、)IC8及びHC9に対し
夫々3個、5個、1個、5個の陽性コロニーが得られた
。最も長いcDNAインサートを有するクローンについ
て全−次構造を決定した。
ニーから、HC2、HC5、)IC8及びHC9に対し
夫々3個、5個、1個、5個の陽性コロニーが得られた
。最も長いcDNAインサートを有するクローンについ
て全−次構造を決定した。
(5−3)制限酵素地図
HC2、HC5、HC8及びHC9の制限酵素地図を第
2図、第3図、第4図及び第5図に示す。
2図、第3図、第4図及び第5図に示す。
図中黒いカラムは翻訳領域を示し、白いカラムは5′端
及び3′端の非翻訳領域を示す。実線はベクター(Bl
ucscript K S +)部分を示す。カラム
の下の数字は開始コドンATGの1番目及び終止コドン
の一つ前のヌクレオチドの位置を示しており、配列を決
定した部分は破線又は実線の矢印で示した。破線部分の
配列は、Bluescript KS+のプロモータ
ーT3又はT7をプライマーとして用い配列決定した。
及び3′端の非翻訳領域を示す。実線はベクター(Bl
ucscript K S +)部分を示す。カラム
の下の数字は開始コドンATGの1番目及び終止コドン
の一つ前のヌクレオチドの位置を示しており、配列を決
定した部分は破線又は実線の矢印で示した。破線部分の
配列は、Bluescript KS+のプロモータ
ーT3又はT7をプライマーとして用い配列決定した。
実線部分は制限酵素で消化しサブクローン後、T3、T
7プライマーを用いて配列決定を行った。
7プライマーを用いて配列決定を行った。
DNA配列決定は、7−DEAZAシークエンシング
キット(宝酒造社製)を用いて、サンガーらの方法(S
anger et al、、Proc、Natl、Ac
ad、Sci。
キット(宝酒造社製)を用いて、サンガーらの方法(S
anger et al、、Proc、Natl、Ac
ad、Sci。
LISA(1977))に基いてジデオキシ チェーン
−ターミネーション法で行った。
−ターミネーション法で行った。
得られたcDNAの核酸配列と、核酸配列から推論され
るHC2、HC5、HC8及びHC9の蛋白質の一次構
造を、夫々第1〜4表に示す。塩基の番号は、開始コド
ンATGを1とし、5′−3′方向につけられている。
るHC2、HC5、HC8及びHC9の蛋白質の一次構
造を、夫々第1〜4表に示す。塩基の番号は、開始コド
ンATGを1とし、5′−3′方向につけられている。
アミノ酸残基の番号はN末端からつけられている。
HC2の配列は、翻訳領域及び5′側と3′側の非翻訳
領域を含めて全体で1105個の塩基からなる。翻訳領
域は789塩基の長さで、263個のアミノ酸の蛋白質
に相当する。この推定配列から、分子量は29554と
計算される。
領域を含めて全体で1105個の塩基からなる。翻訳領
域は789塩基の長さで、263個のアミノ酸の蛋白質
に相当する。この推定配列から、分子量は29554と
計算される。
HC5の配列は翻訳領域及び5−側と3′側の非翻訳領
域を含めて全体で823個の塩基から成る。翻訳領域は
723塩基の長さで、241個のアミノ酸の蛋白質に相
当する。この推定配列から、分子量は26488と計算
される。
域を含めて全体で823個の塩基から成る。翻訳領域は
723塩基の長さで、241個のアミノ酸の蛋白質に相
当する。この推定配列から、分子量は26488と計算
される。
HC8の配列は翻訳領域及び5′側と3−側の非翻訳領
域を含め全体で838個の塩基から成る。
域を含め全体で838個の塩基から成る。
翻訳領域は765塩基の長さで、255個のアミノ酸の
蛋白質に相当する。この推定配列から、分子量は284
32と計算される。
蛋白質に相当する。この推定配列から、分子量は284
32と計算される。
HC9の配列は翻訳領域及び5′側と3′側の非翻訳領
域を含めて全体で1078個の塩基から成る。翻訳領域
は783塩基の長さで、261個のアミノ酸の蛋白質に
相当する。この推定配列から、分子量は29482と計
算される。
域を含めて全体で1078個の塩基から成る。翻訳領域
は783塩基の長さで、261個のアミノ酸の蛋白質に
相当する。この推定配列から、分子量は29482と計
算される。
オープンリーディングフレームが最も長くなるため、番
号1〜3のATGが開始コドンであると結論した。
号1〜3のATGが開始コドンであると結論した。
第1表HC2
TCAGT TTT GCT GGA GGCCGCA
ACCAG GCCMet Phe Arg Asn
Gln TyrCGCGCCGCCACCATG TT
T CGA AAT CAG TATAsp Asn
Asp Val Thr Val Trp Ser P
ro GlnGACAAT’ GAT GTCACT
GTT TGG AGCCCCCAGGly Arg
lle His Gln Ile GluTyr Al
a Mel 26GGCAGG ATT CAT
CAA ATT GAA TAT GCA ATG
119Glu Ala Vat Lys Gln
Gly Ser Ala Thr Val 36
GAA GCT GTT AAA CAA GGT T
CA GCCACA GTT 149Gly Le
u Lys Ser Lys Thr His Ala
Val Leu 46GGT CTG AAA
TCA AAA ACT CAT GCA GTT T
TG 179Val Ala Leu Lys A
rg Ala Gln Ser GILI LeuGT
T GCA TTG AAA AGG GCG CAA
TCA GAG CTTAla^la His Gl
n Lys Lys lie Leu His Val
GCA GCT CAT CAG AAA AAA A
TT CTCCAT CTT第 1 表 HC2(続き
) Asp Asn His lle Gly lie S
er Ile Ala GlyGACAACCAT A
TT GGT ATCTCA ATT GCG GGG
Leu Thr Ala Asp Ala Arg L
eu Leu Cys Asn 86CTT A
CT GCT GAT GCT AGA CTG TT
A TGT AAT 299Phe Met Ar
g Gin Glu Cys Leu Asp Ser
Arg 96TTT ATG CGT
CAG GAG 70丁 TTG GAT T
CCAGA 329Phe Val Phe
Asp Arg Pro Leu Pro Val S
er 106TTT GTA TTCGAT AG
A CCA CTG CCT GTG TCT 3
59Arg Leu Val Ser Leu lie
Gly Set Lys ThrCGT CTT G
TA TCT CTA ATT GGA AGCAAG
ACCGln Ile Pro Thr Gin A
rg Tyr Gly Arg ArgCAG ATA
CCA ACA CAA CGA TAT GGCC
GG AGAPro Tyr Gly Vat Gly
LeuCCA TAT GGT GTT GGT C
TCLeu lie^la Gly CTT ATT GCT GGT Tyt Asp Asp Met Gly Pro H
is lle Phe GinTAT GAT GAT
ATG GGCCCT CACATT TTCCAA
HC2 (続き) 床 表 C2 (続き) Thr Cys Pro Ser Ala Asn T
yr Phe Asp Cys 156ACCTG
T CCA TCT GCT AACTAT TTT
GACTGC509Arg Ala Met Ser
lle Gly Ala Arg Ser GlnAG
A GCCATG TCCATT GGA GCCCG
T TCCCAASer Ala Arg Thr T
yr Leu Glu Arg His MetTCA
GCT CGT ACT TACTTG GAG A
GA CAT ATGSer Glu Phe Met
Glu Cys Asn Leu Asn Glu
186TCT GAA TTT ATG GAG
TGT AAT TTA AAT GAA 599
Leu Val Lys His Gay Leu A
rg Ala Leu ArgCTA GTT AAA
CAT GGT CTG CGT GCCTTA A
GAGlu Thr Leu Pro Ala Glu
Gln Asp Leu Thr 206GAG
ACG CTT CCT GCA GAA CAG
GACCTG ACT 659Thr L7s A
sn Vat Ser lie Gly lie Va
l Gly 216ACA AAG AAT GT
T TCCATT GGA ATT GTT GGT
689Lys Asp Leu Glu Phe
Tbr Ile T7r Asp Asp 226
AAA GACTTG GAG TTT ACA AT
CTAT GAT GAT 719Asp Asp
Val Ser Pro Phe Leu Glu
Gly LeuGAT GAT GTG TCT CC
A TTCCTG GAA GGT CTTGlu G
lu Arg Pro Gln Arg Lys Al
a Gln Pro 24もGAA GAA AG
A CCA CAG AGA AAG GCA CAG
CCT 779Ala Gin Pro Ala
Asp Glu Pro Ala Glu LysG
CT CAA CCT GCT GAT GAA CC
T GCA GAA AAGAGCCAG TCT A
TA TAA GAA TACAGG ATA ATCTAT ACT AGT GGT GGA ATG TCCAGA TGT GAG ACT GAA ACCTAT Glu His GAA CAT TAA TAT GTA TTA TCA CACCACATA CTG TTG AACCAA AAG CTA TGT TTT AGG TTT TTT CCA AGC ATA ATG GAA TAC Ala Asp Glu Pro MetGCT GA
T GAA CCA ATGGTG ATA AAT ATG ATG ACA TTG CAG AAT CAG AACCTC ATT TTT 第 1 表 HC2(続き) CTT TGA AAG GGT CTG TAT A
AT CAT TTT CTAGAA AGT ATG
GGT ATCTAT ACT AAT GTT T
TTATA TGA AGA ACA TAG GTG
TCT TTG TG第 表 C5 Met Leu Ser Ser Thr Ala
CGCAGCCGT GCG ATG TTG TCC
TCT ACA GCCMet Tyr Ser Al
a Pro Gly Arg Asp Leu Gly
ATG TAT TCG GCT CCT GGCAG
A GACTTG GGGMet Glu Pro H
is Arg ALa Ala Gly Pro Le
uATG GAA CCG CACAGA GCCGC
G GGCCCT TTGGln Leu Arg P
he Ser Pro Tyr Val Phe As
nCAG CTG CGA TTT TCG CCCT
ACGTT TTCAACGly Gly Thr l
le Leu Ala lie Ala Gly Gl
u 46GGA GGT ACT ATA CT
G GCA ATT GCT GGA GAA 1
50Asp Phe Ala lle Vat Ala
Ser Asp Thr Arg 56GAT
TTT GCA ATT GTT GCT TCT G
AT ACT CGA 180Leu Ser G
lu Gly Phe Ssr lie旧s Thr
Arg 66TTG AGT GAA GGG T
TT TCA ATT CAT ACG CGG
210Asp Ser Pro L7s C7s Ty
t L7s Leu Thr AspGAT AGCC
CCAAA TGT TACAAA TTA ACA
GAC部 表 C5 (続き) 第 表 C5 (続き) Lys Thr Val Ile Gly Cys S
et Gly Phe HisAAA ACA GTC
ATT GGA TGCAにCGGT TTT CAT
Ser Tyr Gin Arg Asp Ser P
he Lys Ala Gly 166TC丁 T
ACCAG AGA GACTCCTTCAAG
GCT GGA 510Gly Asp
Cys Leu Thr Leu Thr Lys I
le lle 96GGA GACTGT CTT
ACG CTG ACA AAG ATT ATT
3(10Gly Ser Ala Ser Ala
Met Leu Gin Pro LeuGGc T
CA GCA AGT GCCATG CTA CAG
CCCCTGGlu Ala Arg Leu Ly
s Met Tyr Lys His 5erGAA
GCA AGA CTA AAG ATG TAT A
AG CAT TCCLeu Asp Asn Gln
Val Gly Phe Lys Asn MetC
T丁 GACAACCAG GTT GGT T
TT AAG AACATGAsn Asn Ly
s Ala Met Thr Thr Gly Aia
!Ie 116AAT AAT AAG GCC
ATG ACT ACG GGG GCA ATT
360Gln Asn Val Glu His V
al Pro Ler Ser Leu 196C
AG AAT GTG GAG CAT GTT CC
G CTG TCCTTG 600Ala Ala
Mej Leu Ser Thr Ile Leu
T7r Ser 126GCT GCA ATG
CTG TCT ACA ATCCTG TAT TC
A 390Asp Arg Ala Met Ar
g Leu Val Lys Asp Vat 2
06GACAGA GCCATCCGG CTG GT
G AAA GAT GTC630Arg Arg P
he Phe Pro Tyr Tyr Vat Ty
r AsnAGG CGCTTCTTT CCA TA
CTAT GTT TACAACPhe lle Se
r Ala Ala Glu Arg Asp Val
Tyr 216TTCATT TCT GCG
GCT GAG AGA GAT GTG TAC66
011e Ile Gly Gly Leu Asp
Glu Glu Gly LysATCATCGGT
GGA CTT GAT GAA GAA GGA A
AGThr Gly Asp Ala Leu Arg
Ile Cys Ile VatACT GGG
GACGCA CTCCGG ATCTGCATA G
TGGly Ala Vat Tyr Ser Phe
Asp Pro Val Gly 156GGG
GCT GTA TACAGCTTT GA
T CCA GTA GGG 480T
hr Lys Glu Gly Ile Arg Gl
u Glu Thr ValACCAAA GAG G
GCATCAGG GAG GAA ACT CTT第 表 C5 (続き) 第 表 C8 5er Leu Arg Lys AspTCCTTA
AGG AAG GACTGA TCT GTG T
GCTCTMet Ser Ser Ile Gly
Thr Gly T7t 8GCACG ATG
AGCTCA ATCGGCACT GGG TAT
29TAT CAC CAA TCA GTT CAG ACCTG
G TTG AT丁Asp LelISer Al
a Ser Thr Phe Ser Pro Asp
18GACCTG TCA GCCTCT A
CA TTCTCT CCT GAC59TTG TA
CTTT GGA ACT GTA CCT TGG
ATG GTTTTG TTT ATT AAA A Gly Arg Val Phe Gln Vat G
lu Tyr Ala Met 28GGA A
GA GTT TTT CAA GTT GAA TA
T GCT ATG 89Lys Ala Va
l Glu Asn Ser Ser Thr Ala
1leAAG GCT GTG GAA AAT
AGT AGT ACA GCT ATTGly Il
e Arg C7s Lys Asp Gly Val
Val Phe 48GGA ATCAGA
TGCAAA GAT GGT GTT GTCTTT
149Gly Val Glu Lys Leu
Val Leu Ser Lys LcuGGG G
TA GAA AAA TTA GTCCTT TCT
AAA CTTTyr Glu Glu Gly S
er Asn Lys Arg Leu PheTAT
GAA GAA GGT TCCAACAAA AG
A CTT TTTAsn Val Asp Arg
His Val Gly Met Ala V!IAA
T GTT GAT CGG CAT GTT GGA
ATG GCA GTA茅 表 C8 (続き) 郊 表 C8 (続き) A11 GIF Leu Leu Ala Asp A
la Arg Ser LeuGCA GGT TTG
TTG GCA GAT GCT CGT TCT
TTATyr Gly Tyr Trp Gly Cy
s Ala lie Gly Lys 168TA
CGGT TAT TGG GGCTGT GCCAT
CGGCAAA 509Ala Asp lle
Ala Arg Glu Glu Ala Ser
Asn 98GCA GACATA GCA A
GA GAA GAA GCT TCCAAC299A
la Aug Gin Ala Ala Lys Th
「Glu Ile GluGCCAGG CAA GC
T GCA AAG ACG GAA ATA GAG
Phe Arg Ser Asn Phe Gly T
yr Asn Ile Pro 108TTCAG
A TCT AACTTT GGCTACAACATT
CCA 329Lys Leu Gin Met
Lys Glu Met Thr Cys ArgA
AG CTT CAG ATG AAA GAA AT
G ACCTGCCGTLeu Lys His Le
u Ala Asp Arg Vat Ala Met
llgCTA AAA CAT CTT GCA
GACAGA GTG GCCATG 359A
sp lle Vat Lys Glu Vat Al
a Lys Ile lie 198GAT AT
CGTT AAA GAA GTT GCA AAA
ATA ATT 599Tyr Val His
Ala Tyr Thr Lea Tyr Ser A
la 128TAT GTG CAT GCA T
AT ACA CTCTACAGT GCT 38
9Tyr lle Val 1(is Asp Glu
TACATA GTA CAT GACGAAVal
Lys Asp Lys GTT AAG GAT AAA Val Arg Pro Phe Gly Cys S
er Phe Met LeuGTT AGA CCT
TTT GGCTGCAGT TTCATG TTA
Ala Phe Giu Leu Glu Leu S
er Trp Val Gly 218GCT T
TT GAA CTA GAA CTCAGCTGG
GTT GGT 659Gly Ser Tyr
Ser Val Asn Asp G17 Ala G
lnGGG TCT TACAGT GTG AAT
GACGGT GCG CAAGlu Leu Thr
Asn Gly Arg His Glu lie
ValGAA TTA ACT AAT GGA AG
A CAT GAA ATT GTTLsu T7r
Met Ile Asp Pro Ser Gly
Val 5erCTCTACATG ATT GACC
CA TCA GGT GTT TCAPro Lys
Asp Ile Arg Glu Glu^la G
lu Lys 238CCA AAA GAT A
TA AGA GAA GAA GCA GAG AA
A 719第 表 C8 (続き) 床 表 C9 Tyr Ala Lys Glu Ser Leu L
ys Glu Glu Asp 248TAT G
CT AAG GAA TCT CTG AAG GA
A GAA GAT 749CCGTG GACA
TCTCA GGT CTT CAG GGT CTT
CCA TCT GGA ACT ATA TAA A
GT TCAGA^^AC Glu Ser Asp Asp Asp Asn M
etGAA TCA GAT GAT GAT AAT
ATG TAA CAT TTAMet Ser A
rg Arg Tyr Asp Ser Arg Th
r Thr 10ATG TCT CGA AG
A TAT GACTCCAGG ACCACT
89CTCCAG CAT CTA TTG TAT TTT AAA T
TT CTACTC CAG TCCAAT GTA ACT ATT TA
G CCCTG11e Phe Ser Pro Gl
u Gly Arg Leu Tyr Gln 2
0ATA TTT TCT CCA GAA GGT
CGCTTA TACCAA 119Val Gl
u Tyr Ala Met Glu Ala lle
Gly HisGTT GAA TAT GCCAT
G GAA GCT ATT GGA CATAla
Gly Thr Cys Leu Gly lle L
eu Ala AsnGCA GGCACCTGT T
TG GGA ATT TTA GCA AATAsp
Gly Val Leu Leu Ala Ala
Glu Arg^「gGAT GGT GTT TTG
CTT GCA GCA GAG AGA CGCA
sn lie His Lys Leu Leu As
p Glu Val PheAACATCCACAAG
CTT CTT GAT GAA GTCTTTPh
e Ser Glu L7s IIeT7r Lys
Leu Asn Glu 70TTT TCT
GAA AAA ATT TAT AAA CTCAA
T GAG 269部 表 C9 (続き) 部 表 C9 (続き) Asp Met Ala Cys Ser Val A
la Gly Ile ThrGACATG GCT
TGCAGT GTG GCA GGCATA ACT
Asp Pro Set Gly Asn Tyr G
ly Gly Trp Lys 160GACCC
T AGT GGA AAT TACGGG GGA
TGG AAG 539Ser Asp Ala
Asn Val Leu Thr Asn Glu L
euTCT GAT GCT AAT GTT CTG
ACT AAT GAA CTAAla Thr C
ys lie Gly Asn Asn Set A
la AlaGCCACA TGCATT GGA A
AT AAT AGCGCT GCAAtg Leu
lie Ala Gin Arg Tyr Leu L
eu GlnAGG CTCATT GCT CAA
AGG TAT TTA TTA CAGAla Va
l Ser Met Leu Lys Gln Asp
Tyr LysGCT GTG TCA ATG T
TG AAA CAA GACTAT AAATyr
Gln Glu Pro lie Pro Cys G
lu Gln Leu 110TAT CAG G
AG CCA ATA CCT TGT GAG CA
G TTG 389Glu Gly Glu Me
t Thr Leu Lys Ser Ala Leu
GAA GGA GAA ATG ACCTTG AA
G TCA GCA CTTVal Thr Ala
Leu Cys Asp lie Lys Gln A
laGTT ACA GCA CTG TGT GAT
ATCAAA CAA GCTAla Leu Al
a lle Lys Val Leu Asn Lys
Thr 200GCT TTA GCT ATC
AAA GTA CTA AAT AAG ACC65
9Tyr Thr Gln Phe Gly Gly
Lys Arg Pro PheTAT ACA CA
A TTT GGA GGA AAA CGT CCC
TTTMet Asp Val Ser Lys Le
u Ser Ala Glu LysATG GAT
GTT AGT AAA CTCTCT GCT GA
A AAAGly Val Ser Leu Leu
Tyr Ile Gly Trp AspGGT GT
T TCA TTG CTG TACATT GGCT
GG GATVal Glu Ile Ala Thr
Leu Thr Arg Glu AsnGTG G
AA ATT GCA ACA CTA ACA AG
A GAG AATLys His Tyr Gly
Phe GinAAG CACTAT GGCTTT
CAGLeu Tyr Gln 5er CTCTAT CAG AGT Gly Lys Thr Vat lle Arg
Vat Leu Lys GinGGA AAG AC
A GTA ATCAGA GTT CTCAAA C
AA第 表 C9 (続き) ンし 表 C9 (続き) Lys Glu Val Glu AAA GAA GTG GAG Gln Leu lle Lys Lys旧5CAG
TTG ATCAAA AAA CATCACACA CAT CCCCTT TTT TTG GAA TA
A AAGlu Glu Glu Glu Ala L
ys Ala Glu Arg Glu 250G
AG GAA GAA GAA GCCAAA GCT
GAG CGT GAG 809Lys Lys
Glu Lys Glu Gln Lys Glu
Lys Asp 260AAG AAA GAA
AAA GAA CAG AAA GAA AAG G
AT 839ys AAA TAG AAT CAG AGA TTT T
AT TACTCA TTTGGG GCA CCA
TTT CAG TGT AAA AGCAGT CC
TACT CTT CCA CACTAGGAA GG
CTTT ACT TTTTTT AACTGG TG
CAGT GGG AAA ATA GGA CATT
ACATA CTG AAT TGG GTCCTT
GTCATT TCTGTCCAA TTG AAT
ACT TTA TTG TAA CGA TGATG
G TTA CCCTTCATG GACGTCTTA
ATCTTC
ACCAG GCCMet Phe Arg Asn
Gln TyrCGCGCCGCCACCATG TT
T CGA AAT CAG TATAsp Asn
Asp Val Thr Val Trp Ser P
ro GlnGACAAT’ GAT GTCACT
GTT TGG AGCCCCCAGGly Arg
lle His Gln Ile GluTyr Al
a Mel 26GGCAGG ATT CAT
CAA ATT GAA TAT GCA ATG
119Glu Ala Vat Lys Gln
Gly Ser Ala Thr Val 36
GAA GCT GTT AAA CAA GGT T
CA GCCACA GTT 149Gly Le
u Lys Ser Lys Thr His Ala
Val Leu 46GGT CTG AAA
TCA AAA ACT CAT GCA GTT T
TG 179Val Ala Leu Lys A
rg Ala Gln Ser GILI LeuGT
T GCA TTG AAA AGG GCG CAA
TCA GAG CTTAla^la His Gl
n Lys Lys lie Leu His Val
GCA GCT CAT CAG AAA AAA A
TT CTCCAT CTT第 1 表 HC2(続き
) Asp Asn His lle Gly lie S
er Ile Ala GlyGACAACCAT A
TT GGT ATCTCA ATT GCG GGG
Leu Thr Ala Asp Ala Arg L
eu Leu Cys Asn 86CTT A
CT GCT GAT GCT AGA CTG TT
A TGT AAT 299Phe Met Ar
g Gin Glu Cys Leu Asp Ser
Arg 96TTT ATG CGT
CAG GAG 70丁 TTG GAT T
CCAGA 329Phe Val Phe
Asp Arg Pro Leu Pro Val S
er 106TTT GTA TTCGAT AG
A CCA CTG CCT GTG TCT 3
59Arg Leu Val Ser Leu lie
Gly Set Lys ThrCGT CTT G
TA TCT CTA ATT GGA AGCAAG
ACCGln Ile Pro Thr Gin A
rg Tyr Gly Arg ArgCAG ATA
CCA ACA CAA CGA TAT GGCC
GG AGAPro Tyr Gly Vat Gly
LeuCCA TAT GGT GTT GGT C
TCLeu lie^la Gly CTT ATT GCT GGT Tyt Asp Asp Met Gly Pro H
is lle Phe GinTAT GAT GAT
ATG GGCCCT CACATT TTCCAA
HC2 (続き) 床 表 C2 (続き) Thr Cys Pro Ser Ala Asn T
yr Phe Asp Cys 156ACCTG
T CCA TCT GCT AACTAT TTT
GACTGC509Arg Ala Met Ser
lle Gly Ala Arg Ser GlnAG
A GCCATG TCCATT GGA GCCCG
T TCCCAASer Ala Arg Thr T
yr Leu Glu Arg His MetTCA
GCT CGT ACT TACTTG GAG A
GA CAT ATGSer Glu Phe Met
Glu Cys Asn Leu Asn Glu
186TCT GAA TTT ATG GAG
TGT AAT TTA AAT GAA 599
Leu Val Lys His Gay Leu A
rg Ala Leu ArgCTA GTT AAA
CAT GGT CTG CGT GCCTTA A
GAGlu Thr Leu Pro Ala Glu
Gln Asp Leu Thr 206GAG
ACG CTT CCT GCA GAA CAG
GACCTG ACT 659Thr L7s A
sn Vat Ser lie Gly lie Va
l Gly 216ACA AAG AAT GT
T TCCATT GGA ATT GTT GGT
689Lys Asp Leu Glu Phe
Tbr Ile T7r Asp Asp 226
AAA GACTTG GAG TTT ACA AT
CTAT GAT GAT 719Asp Asp
Val Ser Pro Phe Leu Glu
Gly LeuGAT GAT GTG TCT CC
A TTCCTG GAA GGT CTTGlu G
lu Arg Pro Gln Arg Lys Al
a Gln Pro 24もGAA GAA AG
A CCA CAG AGA AAG GCA CAG
CCT 779Ala Gin Pro Ala
Asp Glu Pro Ala Glu LysG
CT CAA CCT GCT GAT GAA CC
T GCA GAA AAGAGCCAG TCT A
TA TAA GAA TACAGG ATA ATCTAT ACT AGT GGT GGA ATG TCCAGA TGT GAG ACT GAA ACCTAT Glu His GAA CAT TAA TAT GTA TTA TCA CACCACATA CTG TTG AACCAA AAG CTA TGT TTT AGG TTT TTT CCA AGC ATA ATG GAA TAC Ala Asp Glu Pro MetGCT GA
T GAA CCA ATGGTG ATA AAT ATG ATG ACA TTG CAG AAT CAG AACCTC ATT TTT 第 1 表 HC2(続き) CTT TGA AAG GGT CTG TAT A
AT CAT TTT CTAGAA AGT ATG
GGT ATCTAT ACT AAT GTT T
TTATA TGA AGA ACA TAG GTG
TCT TTG TG第 表 C5 Met Leu Ser Ser Thr Ala
CGCAGCCGT GCG ATG TTG TCC
TCT ACA GCCMet Tyr Ser Al
a Pro Gly Arg Asp Leu Gly
ATG TAT TCG GCT CCT GGCAG
A GACTTG GGGMet Glu Pro H
is Arg ALa Ala Gly Pro Le
uATG GAA CCG CACAGA GCCGC
G GGCCCT TTGGln Leu Arg P
he Ser Pro Tyr Val Phe As
nCAG CTG CGA TTT TCG CCCT
ACGTT TTCAACGly Gly Thr l
le Leu Ala lie Ala Gly Gl
u 46GGA GGT ACT ATA CT
G GCA ATT GCT GGA GAA 1
50Asp Phe Ala lle Vat Ala
Ser Asp Thr Arg 56GAT
TTT GCA ATT GTT GCT TCT G
AT ACT CGA 180Leu Ser G
lu Gly Phe Ssr lie旧s Thr
Arg 66TTG AGT GAA GGG T
TT TCA ATT CAT ACG CGG
210Asp Ser Pro L7s C7s Ty
t L7s Leu Thr AspGAT AGCC
CCAAA TGT TACAAA TTA ACA
GAC部 表 C5 (続き) 第 表 C5 (続き) Lys Thr Val Ile Gly Cys S
et Gly Phe HisAAA ACA GTC
ATT GGA TGCAにCGGT TTT CAT
Ser Tyr Gin Arg Asp Ser P
he Lys Ala Gly 166TC丁 T
ACCAG AGA GACTCCTTCAAG
GCT GGA 510Gly Asp
Cys Leu Thr Leu Thr Lys I
le lle 96GGA GACTGT CTT
ACG CTG ACA AAG ATT ATT
3(10Gly Ser Ala Ser Ala
Met Leu Gin Pro LeuGGc T
CA GCA AGT GCCATG CTA CAG
CCCCTGGlu Ala Arg Leu Ly
s Met Tyr Lys His 5erGAA
GCA AGA CTA AAG ATG TAT A
AG CAT TCCLeu Asp Asn Gln
Val Gly Phe Lys Asn MetC
T丁 GACAACCAG GTT GGT T
TT AAG AACATGAsn Asn Ly
s Ala Met Thr Thr Gly Aia
!Ie 116AAT AAT AAG GCC
ATG ACT ACG GGG GCA ATT
360Gln Asn Val Glu His V
al Pro Ler Ser Leu 196C
AG AAT GTG GAG CAT GTT CC
G CTG TCCTTG 600Ala Ala
Mej Leu Ser Thr Ile Leu
T7r Ser 126GCT GCA ATG
CTG TCT ACA ATCCTG TAT TC
A 390Asp Arg Ala Met Ar
g Leu Val Lys Asp Vat 2
06GACAGA GCCATCCGG CTG GT
G AAA GAT GTC630Arg Arg P
he Phe Pro Tyr Tyr Vat Ty
r AsnAGG CGCTTCTTT CCA TA
CTAT GTT TACAACPhe lle Se
r Ala Ala Glu Arg Asp Val
Tyr 216TTCATT TCT GCG
GCT GAG AGA GAT GTG TAC66
011e Ile Gly Gly Leu Asp
Glu Glu Gly LysATCATCGGT
GGA CTT GAT GAA GAA GGA A
AGThr Gly Asp Ala Leu Arg
Ile Cys Ile VatACT GGG
GACGCA CTCCGG ATCTGCATA G
TGGly Ala Vat Tyr Ser Phe
Asp Pro Val Gly 156GGG
GCT GTA TACAGCTTT GA
T CCA GTA GGG 480T
hr Lys Glu Gly Ile Arg Gl
u Glu Thr ValACCAAA GAG G
GCATCAGG GAG GAA ACT CTT第 表 C5 (続き) 第 表 C8 5er Leu Arg Lys AspTCCTTA
AGG AAG GACTGA TCT GTG T
GCTCTMet Ser Ser Ile Gly
Thr Gly T7t 8GCACG ATG
AGCTCA ATCGGCACT GGG TAT
29TAT CAC CAA TCA GTT CAG ACCTG
G TTG AT丁Asp LelISer Al
a Ser Thr Phe Ser Pro Asp
18GACCTG TCA GCCTCT A
CA TTCTCT CCT GAC59TTG TA
CTTT GGA ACT GTA CCT TGG
ATG GTTTTG TTT ATT AAA A Gly Arg Val Phe Gln Vat G
lu Tyr Ala Met 28GGA A
GA GTT TTT CAA GTT GAA TA
T GCT ATG 89Lys Ala Va
l Glu Asn Ser Ser Thr Ala
1leAAG GCT GTG GAA AAT
AGT AGT ACA GCT ATTGly Il
e Arg C7s Lys Asp Gly Val
Val Phe 48GGA ATCAGA
TGCAAA GAT GGT GTT GTCTTT
149Gly Val Glu Lys Leu
Val Leu Ser Lys LcuGGG G
TA GAA AAA TTA GTCCTT TCT
AAA CTTTyr Glu Glu Gly S
er Asn Lys Arg Leu PheTAT
GAA GAA GGT TCCAACAAA AG
A CTT TTTAsn Val Asp Arg
His Val Gly Met Ala V!IAA
T GTT GAT CGG CAT GTT GGA
ATG GCA GTA茅 表 C8 (続き) 郊 表 C8 (続き) A11 GIF Leu Leu Ala Asp A
la Arg Ser LeuGCA GGT TTG
TTG GCA GAT GCT CGT TCT
TTATyr Gly Tyr Trp Gly Cy
s Ala lie Gly Lys 168TA
CGGT TAT TGG GGCTGT GCCAT
CGGCAAA 509Ala Asp lle
Ala Arg Glu Glu Ala Ser
Asn 98GCA GACATA GCA A
GA GAA GAA GCT TCCAAC299A
la Aug Gin Ala Ala Lys Th
「Glu Ile GluGCCAGG CAA GC
T GCA AAG ACG GAA ATA GAG
Phe Arg Ser Asn Phe Gly T
yr Asn Ile Pro 108TTCAG
A TCT AACTTT GGCTACAACATT
CCA 329Lys Leu Gin Met
Lys Glu Met Thr Cys ArgA
AG CTT CAG ATG AAA GAA AT
G ACCTGCCGTLeu Lys His Le
u Ala Asp Arg Vat Ala Met
llgCTA AAA CAT CTT GCA
GACAGA GTG GCCATG 359A
sp lle Vat Lys Glu Vat Al
a Lys Ile lie 198GAT AT
CGTT AAA GAA GTT GCA AAA
ATA ATT 599Tyr Val His
Ala Tyr Thr Lea Tyr Ser A
la 128TAT GTG CAT GCA T
AT ACA CTCTACAGT GCT 38
9Tyr lle Val 1(is Asp Glu
TACATA GTA CAT GACGAAVal
Lys Asp Lys GTT AAG GAT AAA Val Arg Pro Phe Gly Cys S
er Phe Met LeuGTT AGA CCT
TTT GGCTGCAGT TTCATG TTA
Ala Phe Giu Leu Glu Leu S
er Trp Val Gly 218GCT T
TT GAA CTA GAA CTCAGCTGG
GTT GGT 659Gly Ser Tyr
Ser Val Asn Asp G17 Ala G
lnGGG TCT TACAGT GTG AAT
GACGGT GCG CAAGlu Leu Thr
Asn Gly Arg His Glu lie
ValGAA TTA ACT AAT GGA AG
A CAT GAA ATT GTTLsu T7r
Met Ile Asp Pro Ser Gly
Val 5erCTCTACATG ATT GACC
CA TCA GGT GTT TCAPro Lys
Asp Ile Arg Glu Glu^la G
lu Lys 238CCA AAA GAT A
TA AGA GAA GAA GCA GAG AA
A 719第 表 C8 (続き) 床 表 C9 Tyr Ala Lys Glu Ser Leu L
ys Glu Glu Asp 248TAT G
CT AAG GAA TCT CTG AAG GA
A GAA GAT 749CCGTG GACA
TCTCA GGT CTT CAG GGT CTT
CCA TCT GGA ACT ATA TAA A
GT TCAGA^^AC Glu Ser Asp Asp Asp Asn M
etGAA TCA GAT GAT GAT AAT
ATG TAA CAT TTAMet Ser A
rg Arg Tyr Asp Ser Arg Th
r Thr 10ATG TCT CGA AG
A TAT GACTCCAGG ACCACT
89CTCCAG CAT CTA TTG TAT TTT AAA T
TT CTACTC CAG TCCAAT GTA ACT ATT TA
G CCCTG11e Phe Ser Pro Gl
u Gly Arg Leu Tyr Gln 2
0ATA TTT TCT CCA GAA GGT
CGCTTA TACCAA 119Val Gl
u Tyr Ala Met Glu Ala lle
Gly HisGTT GAA TAT GCCAT
G GAA GCT ATT GGA CATAla
Gly Thr Cys Leu Gly lle L
eu Ala AsnGCA GGCACCTGT T
TG GGA ATT TTA GCA AATAsp
Gly Val Leu Leu Ala Ala
Glu Arg^「gGAT GGT GTT TTG
CTT GCA GCA GAG AGA CGCA
sn lie His Lys Leu Leu As
p Glu Val PheAACATCCACAAG
CTT CTT GAT GAA GTCTTTPh
e Ser Glu L7s IIeT7r Lys
Leu Asn Glu 70TTT TCT
GAA AAA ATT TAT AAA CTCAA
T GAG 269部 表 C9 (続き) 部 表 C9 (続き) Asp Met Ala Cys Ser Val A
la Gly Ile ThrGACATG GCT
TGCAGT GTG GCA GGCATA ACT
Asp Pro Set Gly Asn Tyr G
ly Gly Trp Lys 160GACCC
T AGT GGA AAT TACGGG GGA
TGG AAG 539Ser Asp Ala
Asn Val Leu Thr Asn Glu L
euTCT GAT GCT AAT GTT CTG
ACT AAT GAA CTAAla Thr C
ys lie Gly Asn Asn Set A
la AlaGCCACA TGCATT GGA A
AT AAT AGCGCT GCAAtg Leu
lie Ala Gin Arg Tyr Leu L
eu GlnAGG CTCATT GCT CAA
AGG TAT TTA TTA CAGAla Va
l Ser Met Leu Lys Gln Asp
Tyr LysGCT GTG TCA ATG T
TG AAA CAA GACTAT AAATyr
Gln Glu Pro lie Pro Cys G
lu Gln Leu 110TAT CAG G
AG CCA ATA CCT TGT GAG CA
G TTG 389Glu Gly Glu Me
t Thr Leu Lys Ser Ala Leu
GAA GGA GAA ATG ACCTTG AA
G TCA GCA CTTVal Thr Ala
Leu Cys Asp lie Lys Gln A
laGTT ACA GCA CTG TGT GAT
ATCAAA CAA GCTAla Leu Al
a lle Lys Val Leu Asn Lys
Thr 200GCT TTA GCT ATC
AAA GTA CTA AAT AAG ACC65
9Tyr Thr Gln Phe Gly Gly
Lys Arg Pro PheTAT ACA CA
A TTT GGA GGA AAA CGT CCC
TTTMet Asp Val Ser Lys Le
u Ser Ala Glu LysATG GAT
GTT AGT AAA CTCTCT GCT GA
A AAAGly Val Ser Leu Leu
Tyr Ile Gly Trp AspGGT GT
T TCA TTG CTG TACATT GGCT
GG GATVal Glu Ile Ala Thr
Leu Thr Arg Glu AsnGTG G
AA ATT GCA ACA CTA ACA AG
A GAG AATLys His Tyr Gly
Phe GinAAG CACTAT GGCTTT
CAGLeu Tyr Gln 5er CTCTAT CAG AGT Gly Lys Thr Vat lle Arg
Vat Leu Lys GinGGA AAG AC
A GTA ATCAGA GTT CTCAAA C
AA第 表 C9 (続き) ンし 表 C9 (続き) Lys Glu Val Glu AAA GAA GTG GAG Gln Leu lle Lys Lys旧5CAG
TTG ATCAAA AAA CATCACACA CAT CCCCTT TTT TTG GAA TA
A AAGlu Glu Glu Glu Ala L
ys Ala Glu Arg Glu 250G
AG GAA GAA GAA GCCAAA GCT
GAG CGT GAG 809Lys Lys
Glu Lys Glu Gln Lys Glu
Lys Asp 260AAG AAA GAA
AAA GAA CAG AAA GAA AAG G
AT 839ys AAA TAG AAT CAG AGA TTT T
AT TACTCA TTTGGG GCA CCA
TTT CAG TGT AAA AGCAGT CC
TACT CTT CCA CACTAGGAA GG
CTTT ACT TTTTTT AACTGG TG
CAGT GGG AAA ATA GGA CATT
ACATA CTG AAT TGG GTCCTT
GTCATT TCTGTCCAA TTG AAT
ACT TTA TTG TAA CGA TGATG
G TTA CCCTTCATG GACGTCTTA
ATCTTC
第1図はヒト プロテアソーム コンポーネントの遺伝
子の単離に使用したプローブを示す。 第2図はHC2のcDNAインサートの制限酵素地図を
示す。 第3図はHC5のcDNAインサートの制限酵素地図を
示す。 第4図はHC8のcDNAインサートの制限酵素地図を
示す。 第5図はHC9のcDNAインサートの制限酵素地図を
示す。 (以 上)
子の単離に使用したプローブを示す。 第2図はHC2のcDNAインサートの制限酵素地図を
示す。 第3図はHC5のcDNAインサートの制限酵素地図を
示す。 第4図はHC8のcDNAインサートの制限酵素地図を
示す。 第5図はHC9のcDNAインサートの制限酵素地図を
示す。 (以 上)
Claims (8)
- (1)下記のアミノ酸配列を有することを特徴とするヒ
トプロテアソームのコンポーネントHC2。 【遺伝子配列です】 【遺伝子配列です】 - (2)下記の塩基配列を有することを特徴とするヒトプ
ロテアソームのコンポーネントHC2の遺伝子。 【遺伝子配列です】 【遺伝子配列です】 - (3)下記のアミノ酸配列を有することを特徴とするヒ
トプロテアソームのコンポーネントHC5。 【遺伝子配列です】 【遺伝子配列です】 【遺伝子配列です】 - (4)下記の塩基配列を有することを特徴とするヒトプ
ロテアソームのコンポーネントHC5の遺伝子。 【遺伝子配列です】 【遺伝子配列です】 - (5)下記のアミノ酸配列を有することを特徴とするヒ
トプロテアソームのコンポーネントHC8。 【遺伝子配列です】 【遺伝子配列です】 【遺伝子配列です】 - (6)下記の塩基配列を有することを特徴とするヒトプ
ロテアソームのコンポーネントHC8の遺伝子。 【遺伝子配列です】 【遺伝子配列です】 - (7)下記のアミノ酸配列を有することを特徴とするヒ
トプロテアソームのコンポーネントHC9。 【遺伝子配列です】 【遺伝子配列です】 - (8)下記の塩基配列を有することを特徴とするヒトプ
ロテアソームのコンポーネントHC9の遺伝子。 【遺伝子配列です】 【遺伝子配列です】 【遺伝子配列です】
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19331390A JPH0477498A (ja) | 1990-07-20 | 1990-07-20 | ヒトプロテアソーム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19331390A JPH0477498A (ja) | 1990-07-20 | 1990-07-20 | ヒトプロテアソーム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0477498A true JPH0477498A (ja) | 1992-03-11 |
Family
ID=16305829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19331390A Pending JPH0477498A (ja) | 1990-07-20 | 1990-07-20 | ヒトプロテアソーム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0477498A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004087921A1 (ja) * | 2003-03-31 | 2004-10-14 | Japan Science And Technology Agency | ヒト固形癌抗原ペプチドとこれをコードするポリヌクレオチド、並びにそれらの利用 |
-
1990
- 1990-07-20 JP JP19331390A patent/JPH0477498A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004087921A1 (ja) * | 2003-03-31 | 2004-10-14 | Japan Science And Technology Agency | ヒト固形癌抗原ペプチドとこれをコードするポリヌクレオチド、並びにそれらの利用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW302369B (ja) | ||
KR100219970B1 (ko) | 재조합 비만 단백질 | |
JPH03503641A (ja) | 発現のための突然変異体ヒトアンギオゲニン(卓越したアンギオゲニン活性を有する血管形成誘導因子)遺伝子及び発現方法 | |
JPS60115528A (ja) | ヒトインタ―ロイキン―2蛋白質を含有する抗腫瘍用または免疫機能低下疾患治療用組成物 | |
WO1994011401A1 (en) | Human homolog of the e-cadherin gene and methods based thereon | |
JPS63501052A (ja) | ヒトアンギオゲニン(脈管形成因子)のためのcdna及び遺伝子及び発現方法 | |
JPH04506342A (ja) | 非グリコシル化ヒトインターロイキン―3類似蛋白質 | |
JPH06502633A (ja) | 気管抗菌ペプチドの生産と用途 | |
JPH06503949A (ja) | 新規インシュリン様成長因子結合タンパク質igfbp―5 | |
AU604003B2 (en) | Dna sequences coding for proteins having the biological activity of husi-type i inhibitors, biotechnological methods for the preparation of said proteins and pharmaceutical compositions containing said proteins | |
JPH0866194A (ja) | ヒト腫瘍壊死因子ミューテインをコードする遺伝子 | |
JP2008502323A5 (ja) | ||
JPS6270398A (ja) | ウシインタ−ロイキン−2遺伝子のクロ−ニングおよび同定 | |
JPH08504580A (ja) | 組換え型イヌ胃リパーゼ及び医薬組成物 | |
JPH0477498A (ja) | ヒトプロテアソーム | |
JPS60207583A (ja) | ブタ・膵臓エラスタ−ゼ | |
JPH07509698A (ja) | 後生動物寄生虫に対するワクチン | |
CA2358380A1 (en) | Testis-specific gene | |
JPH06225763A (ja) | ヒトベイシジンi遺伝子 | |
US5045471A (en) | Cloned DNA for P450scc and expression thereof | |
JPS61291598A (ja) | 魚類カルシトニン誘導体及びその製造方法 | |
US6280968B1 (en) | Human PEC-60-like protein and DNA encoding the same | |
JPH04117283A (ja) | ヒトプロテアソームのコンポーネントhc3 | |
WO2003012044A9 (en) | Hagfish cathelin-associated antimicrobial peptides and genes | |
JPH08107797A (ja) | ヒトdnaミスマッチ修復関連蛋白質をコードするdna |