JPH11221075A - 新規遺伝子とそれにコードされる蛋白質 - Google Patents
新規遺伝子とそれにコードされる蛋白質Info
- Publication number
- JPH11221075A JPH11221075A JP10021987A JP2198798A JPH11221075A JP H11221075 A JPH11221075 A JP H11221075A JP 10021987 A JP10021987 A JP 10021987A JP 2198798 A JP2198798 A JP 2198798A JP H11221075 A JPH11221075 A JP H11221075A
- Authority
- JP
- Japan
- Prior art keywords
- glu
- leu
- lys
- ser
- val
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 90
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 43
- 150000001413 amino acids Chemical class 0.000 claims abstract description 14
- 238000013518 transcription Methods 0.000 claims abstract description 11
- 230000035897 transcription Effects 0.000 claims abstract description 11
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 7
- 230000001105 regulatory effect Effects 0.000 claims description 9
- 239000002773 nucleotide Substances 0.000 claims description 8
- 125000003729 nucleotide group Chemical group 0.000 claims description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 7
- 239000002299 complementary DNA Substances 0.000 abstract description 36
- 239000012634 fragment Substances 0.000 abstract description 25
- 102100036682 PiggyBac transposable element-derived protein 1 Human genes 0.000 abstract description 21
- 101100029458 Homo sapiens PGBD1 gene Proteins 0.000 abstract description 20
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 abstract description 17
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 abstract description 17
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 abstract description 17
- 238000009396 hybridization Methods 0.000 abstract description 15
- 210000003710 cerebral cortex Anatomy 0.000 abstract description 13
- 239000000523 sample Substances 0.000 abstract description 9
- 239000013598 vector Substances 0.000 abstract description 9
- 208000018737 Parkinson disease Diseases 0.000 abstract description 3
- 239000003814 drug Substances 0.000 abstract description 3
- 230000000302 ischemic effect Effects 0.000 abstract description 3
- 208000015122 neurodegenerative disease Diseases 0.000 abstract description 3
- 230000001131 transforming effect Effects 0.000 abstract description 3
- 238000011282 treatment Methods 0.000 abstract description 3
- 208000024827 Alzheimer disease Diseases 0.000 abstract description 2
- 238000012258 culturing Methods 0.000 abstract description 2
- 208000018152 Cerebral disease Diseases 0.000 abstract 2
- 230000009711 regulatory function Effects 0.000 abstract 2
- 201000010099 disease Diseases 0.000 abstract 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract 1
- 238000012216 screening Methods 0.000 abstract 1
- 230000001225 therapeutic effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 36
- 210000004027 cell Anatomy 0.000 description 31
- 235000018102 proteins Nutrition 0.000 description 31
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 29
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 18
- 101001072718 Homo sapiens PiggyBac transposable element-derived protein 1 Proteins 0.000 description 14
- 239000012528 membrane Substances 0.000 description 14
- 230000000694 effects Effects 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 8
- 210000000056 organ Anatomy 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 7
- 238000005406 washing Methods 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 108010049041 glutamylalanine Proteins 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 5
- 235000001014 amino acid Nutrition 0.000 description 5
- 229940024606 amino acid Drugs 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 108010003700 lysyl aspartic acid Proteins 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- LHJDLVVQRJIURS-SRVKXCTJSA-N Cys-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LHJDLVVQRJIURS-SRVKXCTJSA-N 0.000 description 4
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 4
- 101710096438 DNA-binding protein Proteins 0.000 description 4
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 4
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 4
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 4
- 101500006448 Mycobacterium bovis (strain ATCC BAA-935 / AF2122/97) Endonuclease PI-MboI Proteins 0.000 description 4
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 4
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 4
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 210000004556 brain Anatomy 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 3
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 3
- GWNUMRVBKPDDFV-UHFFFAOYSA-N CCCCCCCCCCCC(=O)N(C)CC([Na])=O Chemical compound CCCCCCCCCCCC(=O)N(C)CC([Na])=O GWNUMRVBKPDDFV-UHFFFAOYSA-N 0.000 description 3
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 102100036263 Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Human genes 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 101001001786 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Proteins 0.000 description 3
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 3
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- 102000008300 Mutant Proteins Human genes 0.000 description 3
- 108010021466 Mutant Proteins Proteins 0.000 description 3
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 3
- 102000003923 Protein Kinase C Human genes 0.000 description 3
- 108090000315 Protein Kinase C Proteins 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 238000000246 agarose gel electrophoresis Methods 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 230000000975 bioactive effect Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 210000005013 brain tissue Anatomy 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 3
- 229940097277 hygromycin b Drugs 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 108010036211 5-HT-moduline Proteins 0.000 description 2
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 2
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 2
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 2
- KMGOBAQSCKTBGD-DLOVCJGASA-N Ala-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CN=CN1 KMGOBAQSCKTBGD-DLOVCJGASA-N 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 2
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 2
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 2
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 2
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 2
- GITAWLWBTMJPKH-AVGNSLFASA-N Arg-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GITAWLWBTMJPKH-AVGNSLFASA-N 0.000 description 2
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 2
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- VJIQPOJMISSUPO-BVSLBCMMSA-N Arg-Trp-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VJIQPOJMISSUPO-BVSLBCMMSA-N 0.000 description 2
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 2
- NTXNUXPCNRDMAF-WFBYXXMGSA-N Asn-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC(N)=O)C)C(O)=O)=CNC2=C1 NTXNUXPCNRDMAF-WFBYXXMGSA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 2
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 2
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 2
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 2
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 2
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 2
- JWQWPRCDYWNVNM-ACZMJKKPSA-N Asn-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N JWQWPRCDYWNVNM-ACZMJKKPSA-N 0.000 description 2
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- MRQQMVZUHXUPEV-IHRRRGAJSA-N Asp-Arg-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MRQQMVZUHXUPEV-IHRRRGAJSA-N 0.000 description 2
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 2
- OEUQMKNNOWJREN-AVGNSLFASA-N Asp-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N OEUQMKNNOWJREN-AVGNSLFASA-N 0.000 description 2
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 2
- RATOMFTUDRYMKX-ACZMJKKPSA-N Asp-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RATOMFTUDRYMKX-ACZMJKKPSA-N 0.000 description 2
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 2
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 2
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 2
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 2
- BCSYBBMFGLHCOA-ACZMJKKPSA-N Cys-Glu-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O BCSYBBMFGLHCOA-ACZMJKKPSA-N 0.000 description 2
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 2
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 2
- YQEHNIKPAOPBNH-DCAQKATOSA-N Cys-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N YQEHNIKPAOPBNH-DCAQKATOSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241001646716 Escherichia coli K-12 Species 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 2
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 2
- FYAULIGIFPPOAA-ZPFDUUQYSA-N Gln-Ile-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O FYAULIGIFPPOAA-ZPFDUUQYSA-N 0.000 description 2
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 2
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 2
- OAOOXBSVCJEIFY-QAETUUGQSA-N Gln-Leu-Leu-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O OAOOXBSVCJEIFY-QAETUUGQSA-N 0.000 description 2
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 2
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 2
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 2
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- JTWZNMUVQWWGOX-SOUVJXGZSA-N Gln-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JTWZNMUVQWWGOX-SOUVJXGZSA-N 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 2
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 2
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 2
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 2
- DRLVXRQFROIYTD-GUBZILKMSA-N Glu-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DRLVXRQFROIYTD-GUBZILKMSA-N 0.000 description 2
- YDJOULGWHQRPEV-SRVKXCTJSA-N Glu-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N YDJOULGWHQRPEV-SRVKXCTJSA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 2
- BHXSLRDWXIFKTP-SRVKXCTJSA-N Glu-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BHXSLRDWXIFKTP-SRVKXCTJSA-N 0.000 description 2
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 2
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 2
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 2
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 2
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 2
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 2
- UROVZOUMHNXPLZ-AVGNSLFASA-N His-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 UROVZOUMHNXPLZ-AVGNSLFASA-N 0.000 description 2
- WPUAVVXYEJAWIV-KKUMJFAQSA-N His-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WPUAVVXYEJAWIV-KKUMJFAQSA-N 0.000 description 2
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 2
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 2
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 2
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 2
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 2
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 2
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 2
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 2
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 2
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 2
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 2
- UIJVKVHLCQSPOJ-XIRDDKMYSA-N Lys-Ser-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O UIJVKVHLCQSPOJ-XIRDDKMYSA-N 0.000 description 2
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 2
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- QDMUMFDBUVOZOY-GUBZILKMSA-N Met-Arg-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N QDMUMFDBUVOZOY-GUBZILKMSA-N 0.000 description 2
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 2
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 2
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 2
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 2
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 2
- XTSBLBXAUIBMLW-KKUMJFAQSA-N Met-Tyr-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N XTSBLBXAUIBMLW-KKUMJFAQSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108010057466 NF-kappa B Proteins 0.000 description 2
- 102000003945 NF-kappa B Human genes 0.000 description 2
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 2
- WGXOKDLDIWSOCV-MELADBBJSA-N Phe-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O WGXOKDLDIWSOCV-MELADBBJSA-N 0.000 description 2
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 2
- OJUMUUXGSXUZJZ-SRVKXCTJSA-N Phe-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OJUMUUXGSXUZJZ-SRVKXCTJSA-N 0.000 description 2
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 2
- DNAXXTQSTKOHFO-QEJZJMRPSA-N Phe-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DNAXXTQSTKOHFO-QEJZJMRPSA-N 0.000 description 2
- IEOHQGFKHXUALJ-JYJNAYRXSA-N Phe-Met-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IEOHQGFKHXUALJ-JYJNAYRXSA-N 0.000 description 2
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 2
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 2
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 2
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 2
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 2
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 2
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 2
- XQPHBAKJJJZOBX-SRVKXCTJSA-N Pro-Lys-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O XQPHBAKJJJZOBX-SRVKXCTJSA-N 0.000 description 2
- QGLFRQCECIWXFA-RCWTZXSCSA-N Pro-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1)O QGLFRQCECIWXFA-RCWTZXSCSA-N 0.000 description 2
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 2
- XSXABUHLKPUVLX-JYJNAYRXSA-N Pro-Ser-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O XSXABUHLKPUVLX-JYJNAYRXSA-N 0.000 description 2
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 2
- XVAUJOAYHWWNQF-ZLUOBGJFSA-N Ser-Asn-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O XVAUJOAYHWWNQF-ZLUOBGJFSA-N 0.000 description 2
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 2
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 2
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 2
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 102000006467 TATA-Box Binding Protein Human genes 0.000 description 2
- 108010044281 TATA-Box Binding Protein Proteins 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 2
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 2
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 2
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- XGUAUKUYQHBUNY-SWRJLBSHSA-N Thr-Trp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O XGUAUKUYQHBUNY-SWRJLBSHSA-N 0.000 description 2
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- WQYPAGQDXAJNED-AAEUAGOBSA-N Trp-Cys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N WQYPAGQDXAJNED-AAEUAGOBSA-N 0.000 description 2
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 2
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 2
- AXWBYOVVDRBOGU-SIUGBPQLSA-N Tyr-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AXWBYOVVDRBOGU-SIUGBPQLSA-N 0.000 description 2
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 2
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 2
- XTOCLOATLKOZAU-JBACZVJFSA-N Tyr-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N XTOCLOATLKOZAU-JBACZVJFSA-N 0.000 description 2
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 2
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 2
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 2
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 2
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 2
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 2
- JQTYTBPCSOAZHI-FXQIFTODSA-N Val-Ser-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N JQTYTBPCSOAZHI-FXQIFTODSA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 230000003925 brain function Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 108010069495 cysteinyltyrosine Proteins 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 2
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 230000005937 nuclear translocation Effects 0.000 description 2
- 150000007523 nucleic acids Chemical group 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 102220219006 rs1060501597 Human genes 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 101150028074 2 gene Proteins 0.000 description 1
- OTEWWRBKGONZBW-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]-4-methylpentanoyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NC(CC(C)C)C(=O)NCC(=O)NCC(O)=O OTEWWRBKGONZBW-UHFFFAOYSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- 101100433754 Arabidopsis thaliana ABCG30 gene Proteins 0.000 description 1
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 1
- LIVXPXUVXFRWNY-CIUDSAMLSA-N Asp-Lys-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O LIVXPXUVXFRWNY-CIUDSAMLSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 208000014644 Brain disease Diseases 0.000 description 1
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 1
- 240000003966 Chrysopogon subtilis Species 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 1
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 1
- SBMGKDLRJLYZCU-BIIVOSGPSA-N Cys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N)C(=O)O SBMGKDLRJLYZCU-BIIVOSGPSA-N 0.000 description 1
- GGIHYKLJUIZYGH-ZLUOBGJFSA-N Cys-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)O GGIHYKLJUIZYGH-ZLUOBGJFSA-N 0.000 description 1
- SMYXEYRYCLIPIL-ZLUOBGJFSA-N Cys-Cys-Cys Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O SMYXEYRYCLIPIL-ZLUOBGJFSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 108010031746 Dam methyltransferase Proteins 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 108010088742 GATA Transcription Factors Proteins 0.000 description 1
- 102000009041 GATA Transcription Factors Human genes 0.000 description 1
- 241001123946 Gaga Species 0.000 description 1
- 241001200922 Gagata Species 0.000 description 1
- SOIAHPSKKUYREP-CIUDSAMLSA-N Gln-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N SOIAHPSKKUYREP-CIUDSAMLSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- IIMZHVKZBGSEKZ-SZMVWBNQSA-N Gln-Trp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O IIMZHVKZBGSEKZ-SZMVWBNQSA-N 0.000 description 1
- KHHDJQRWIFHXHS-NRPADANISA-N Gln-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHHDJQRWIFHXHS-NRPADANISA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 1
- QBLCUWAGTGRXAY-UHFFFAOYSA-N Glu-Glu-Tyr-Tyr Chemical compound C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(NC(=O)C(CCC(O)=O)NC(=O)C(CCC(O)=O)N)CC1=CC=C(O)C=C1 QBLCUWAGTGRXAY-UHFFFAOYSA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 1
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 1
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- JMQFHZWESBGPFC-WDSKDSINSA-N Gly-Gln-Asp Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JMQFHZWESBGPFC-WDSKDSINSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- IMPKSPYRPUXYAP-SZMVWBNQSA-N His-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC3=CN=CN3)N IMPKSPYRPUXYAP-SZMVWBNQSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 1
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- LJKJVTCIRDCITR-SRVKXCTJSA-N Leu-Cys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LJKJVTCIRDCITR-SRVKXCTJSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 1
- NROQVSYLPRLJIP-PMVMPFDFSA-N Lys-Trp-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NROQVSYLPRLJIP-PMVMPFDFSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 1
- ULLIQRYQNMAAHC-RWMBFGLXSA-N Met-His-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N ULLIQRYQNMAAHC-RWMBFGLXSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 101100054291 Oryza sativa subsp. japonica ABCG35 gene Proteins 0.000 description 1
- 101100107595 Oryza sativa subsp. japonica ABCG41 gene Proteins 0.000 description 1
- 101150024488 PDR2 gene Proteins 0.000 description 1
- 101150012394 PHO5 gene Proteins 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Chemical class OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108700025701 Retinoblastoma Genes Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101100321174 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YRR1 gene Proteins 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000973887 Takayama Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- VDCGPCSLAJAKBB-XIRDDKMYSA-N Trp-Ser-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N VDCGPCSLAJAKBB-XIRDDKMYSA-N 0.000 description 1
- ZJPSMXCFEKMZFE-IHPCNDPISA-N Trp-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O ZJPSMXCFEKMZFE-IHPCNDPISA-N 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 230000003281 allosteric effect Effects 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000003181 biological factor Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 210000004720 cerebrum Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000012894 fetal calf serum Substances 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 238000010841 mRNA extraction Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 230000009822 protein phosphorylation Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
Landscapes
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
(57)【要約】
【課題】 ヒト大脳皮質由来の転写調節活性を有する新
規蛋白質HUCEP−4と、それをコードする遺伝子h
ucep−4を提供する。 【解決手段】 ヒト大脳皮質由来のcDNAライブラリ
ーからのクローニングによって転写調節活性を有する新
規蛋白質HUCEP−4をコードする遺伝子hucep
−4が得られ、該遺伝子を有する発現ベクターによる形
質転換体の培養により、新規蛋白質HUCEP−4が得
られる。該蛋白質は転写調節因子として、医薬又は医薬
の開発に用いることができる。
規蛋白質HUCEP−4と、それをコードする遺伝子h
ucep−4を提供する。 【解決手段】 ヒト大脳皮質由来のcDNAライブラリ
ーからのクローニングによって転写調節活性を有する新
規蛋白質HUCEP−4をコードする遺伝子hucep
−4が得られ、該遺伝子を有する発現ベクターによる形
質転換体の培養により、新規蛋白質HUCEP−4が得
られる。該蛋白質は転写調節因子として、医薬又は医薬
の開発に用いることができる。
Description
【0001】
【発明の属する技術】本発明は、遺伝子の転写調節機能
を有する、新規蛋白質HUCEP(Human Cer
ebral Protein)−4、該蛋白質をコード
する遺伝子hucep−4に関するものである。
を有する、新規蛋白質HUCEP(Human Cer
ebral Protein)−4、該蛋白質をコード
する遺伝子hucep−4に関するものである。
【0002】
【従来の技術】生物を取り巻く外界には、重金属やアミ
ノ酸の化学物質、熱や浸透圧等の物理的要因、ビタミン
やホルモン等の生理活性物質、ウイルスや細菌等の生物
学的要因などの、多種の環境因子が存在する。生物を構
成する細胞は、この環境因子を特定のシグナルとして感
知する機能を有し、このシグナルに応じた特定の遺伝子
の転写を調節することで、外界変化に対応する。この遺
伝子の転写制御メカニズムに関わる蛋白質(転写制御蛋
白質)は、機能的に大きく二種類に分けられる。
ノ酸の化学物質、熱や浸透圧等の物理的要因、ビタミン
やホルモン等の生理活性物質、ウイルスや細菌等の生物
学的要因などの、多種の環境因子が存在する。生物を構
成する細胞は、この環境因子を特定のシグナルとして感
知する機能を有し、このシグナルに応じた特定の遺伝子
の転写を調節することで、外界変化に対応する。この遺
伝子の転写制御メカニズムに関わる蛋白質(転写制御蛋
白質)は、機能的に大きく二種類に分けられる。
【0003】第一に、例えばプロモーター配列等の転写
制御領域の塩基配列に特異的に親和性を示すDNA結合
蛋白質が挙げられる。これらDNA結合蛋白質は、転写
制御領域に存在する特定の塩基配列を認識してこれに結
合することで、遺伝子の転写を促進または抑制する機能
を有する。これまで明らかにされたDNA結合蛋白質
は、蛋白化学上特徴的な構造を有するものが多い。例え
ば、λリプレッサ−等に見られるヘリックス・ターン・
ヘリックス構造、GCN−4に見られるロイシンジッパ
ー構造、GATA因子に見られるZnフィンガー構造等
が代表例であり、この他にもTBP(TATA binding pro
tein)、NF−κB、POUドメイン転写因子等が挙げ
られる。
制御領域の塩基配列に特異的に親和性を示すDNA結合
蛋白質が挙げられる。これらDNA結合蛋白質は、転写
制御領域に存在する特定の塩基配列を認識してこれに結
合することで、遺伝子の転写を促進または抑制する機能
を有する。これまで明らかにされたDNA結合蛋白質
は、蛋白化学上特徴的な構造を有するものが多い。例え
ば、λリプレッサ−等に見られるヘリックス・ターン・
ヘリックス構造、GCN−4に見られるロイシンジッパ
ー構造、GATA因子に見られるZnフィンガー構造等
が代表例であり、この他にもTBP(TATA binding pro
tein)、NF−κB、POUドメイン転写因子等が挙げ
られる。
【0004】第二に、直接DNAと結合してその転写を
制御するのではなく、DNA結合蛋白質と結合すること
でDNA結合蛋白質の転写能を調節する因子(転写調節
因子)が挙げられる。これらは一方で細胞内外からの各
種シグナル、例えば蛋白質リン酸化、アロステリック因
子等のエフェクター等の複雑なシグナル伝達を受ける機
能を有することが多く、シグナルに対応してDNA結合
蛋白質の活性を促進、抑制して、目的遺伝子を必要量だ
け転写させるように働く。
制御するのではなく、DNA結合蛋白質と結合すること
でDNA結合蛋白質の転写能を調節する因子(転写調節
因子)が挙げられる。これらは一方で細胞内外からの各
種シグナル、例えば蛋白質リン酸化、アロステリック因
子等のエフェクター等の複雑なシグナル伝達を受ける機
能を有することが多く、シグナルに対応してDNA結合
蛋白質の活性を促進、抑制して、目的遺伝子を必要量だ
け転写させるように働く。
【0005】例えば、E2Fと結合してその活性を調節
するRB(retinoblastoma gene;Weinberg, Science
(1991) 254, 1138)、CREB、NF−κBなどと結合
しその活性を調節するHTLV−1由来のTax(tran
scriptional trans-activator coded in X-region;Yos
hida et al., Proc Natl Acad Sci USA (1982) 79, 203
1)等が挙げられる。
するRB(retinoblastoma gene;Weinberg, Science
(1991) 254, 1138)、CREB、NF−κBなどと結合
しその活性を調節するHTLV−1由来のTax(tran
scriptional trans-activator coded in X-region;Yos
hida et al., Proc Natl Acad Sci USA (1982) 79, 203
1)等が挙げられる。
【0006】
【発明が解決しようとする課題】上述のように、細胞機
能の発現は、種々の遺伝子の発現制御、即ち遺伝子発現
の促進または抑制に依存し、これらを通じて細胞は生
存、増殖または死滅するものと考えられている。従っ
て、臓器特異的な分化細胞でのみ発現しているDNA結
合蛋白質や転写調節因子は、その分化細胞に固有の機
能、生存または死滅に深く関与していると考えられる。
この様なDNA結合蛋白質または転写調節因子を単離同
定することは、臓器特異的な分化細胞生理に起因する病
態の解明、治療法の開発や薬物の探索等に、極めて重要
な意義を有するものと考えられる。
能の発現は、種々の遺伝子の発現制御、即ち遺伝子発現
の促進または抑制に依存し、これらを通じて細胞は生
存、増殖または死滅するものと考えられている。従っ
て、臓器特異的な分化細胞でのみ発現しているDNA結
合蛋白質や転写調節因子は、その分化細胞に固有の機
能、生存または死滅に深く関与していると考えられる。
この様なDNA結合蛋白質または転写調節因子を単離同
定することは、臓器特異的な分化細胞生理に起因する病
態の解明、治療法の開発や薬物の探索等に、極めて重要
な意義を有するものと考えられる。
【0007】
【課題を解決するための手段】本発明者らは、神経細胞
内での各種遺伝子の転写制御蛋白質の同定を目的とし、
ヒト脳組織で特異的に発現している遺伝子の中から、所
望の蛋白質を把握するべく鋭意研究の結果、新規蛋白質
HUCEP−4の存在とそれをコードする遺伝子huc
ep−4の単離に成功し、本発明を完成するに至った。
内での各種遺伝子の転写制御蛋白質の同定を目的とし、
ヒト脳組織で特異的に発現している遺伝子の中から、所
望の蛋白質を把握するべく鋭意研究の結果、新規蛋白質
HUCEP−4の存在とそれをコードする遺伝子huc
ep−4の単離に成功し、本発明を完成するに至った。
【0008】即ち、本発明は、(a)配列番号:1に記
載のアミノ酸配列からなる蛋白質、または(b)配列番
号:1のアミノ酸配列において1もしくは数個のアミノ
酸が欠失、置換もしくは付加されたアミノ酸配列からな
り、かつ活性を有する蛋白質に関するものである。さら
に本発明は、(c)配列番号:2に記載のDNAからな
る遺伝子、または、(d)配列番号:2のDNAとスト
リンジェントな条件でハイブリダイズし、かつ活性を有
する蛋白質をコードするDNAからなる遺伝子に関する
ものである。
載のアミノ酸配列からなる蛋白質、または(b)配列番
号:1のアミノ酸配列において1もしくは数個のアミノ
酸が欠失、置換もしくは付加されたアミノ酸配列からな
り、かつ活性を有する蛋白質に関するものである。さら
に本発明は、(c)配列番号:2に記載のDNAからな
る遺伝子、または、(d)配列番号:2のDNAとスト
リンジェントな条件でハイブリダイズし、かつ活性を有
する蛋白質をコードするDNAからなる遺伝子に関する
ものである。
【0009】本発明であるHUCEP−4は、全809
アミノ酸残基からなる分子量92514ダルトン(D
a)の蛋白質である。そのアミノ酸配列上の特徴とし
て、57番目から122番目に転写調節領域(SCAN BO
X;Williams et.al., J.Biol.Chem., Vol.270(38), 2213
4-22152(1995))を、340番目から349番目に核内
移行シグナル(Arg-Lys-Gly-Arg-Lys-Lys-Asp-Lys-Ala-
Arg)を、またPKC(Protein Kinase C)により特異的
にリン酸化される部位を12個、それぞれ有しているこ
とが認められる。以上から、HUCEP−4は、PKC
の作用によるリン酸化を受けつつ遺伝子の転写制御を行
う、核内移行蛋白質であると推察される。
アミノ酸残基からなる分子量92514ダルトン(D
a)の蛋白質である。そのアミノ酸配列上の特徴とし
て、57番目から122番目に転写調節領域(SCAN BO
X;Williams et.al., J.Biol.Chem., Vol.270(38), 2213
4-22152(1995))を、340番目から349番目に核内
移行シグナル(Arg-Lys-Gly-Arg-Lys-Lys-Asp-Lys-Ala-
Arg)を、またPKC(Protein Kinase C)により特異的
にリン酸化される部位を12個、それぞれ有しているこ
とが認められる。以上から、HUCEP−4は、PKC
の作用によるリン酸化を受けつつ遺伝子の転写制御を行
う、核内移行蛋白質であると推察される。
【0010】
【発明の実施の形態】遺伝子hucep−4は、ヒト大
脳皮質由来のcDNAライブラリーから、該遺伝子を含
んだcDNA断片として単離することができる。本発明
者らが使用したcDNAライブラリーは、クローンテッ
ク社から市販されているヒト大脳皮質のmRNAをもと
に調製したものであるが、ストラタジーン社から市販さ
れているヒト大脳皮質のmRNAをもとにしても、同様
にcDNAを調製することができる。
脳皮質由来のcDNAライブラリーから、該遺伝子を含
んだcDNA断片として単離することができる。本発明
者らが使用したcDNAライブラリーは、クローンテッ
ク社から市販されているヒト大脳皮質のmRNAをもと
に調製したものであるが、ストラタジーン社から市販さ
れているヒト大脳皮質のmRNAをもとにしても、同様
にcDNAを調製することができる。
【0011】上述のcDNAライブラリーにおいて、ヒ
ト脳組織で特異的に発現している遺伝子を有すると思わ
れるcDNAを識別する方法として、大久保らの方法
(Okubo et al.,Nature Gene
t.,2,173(1992))による、遺伝子発現の
出現頻度を解析する方法を用いることができる。具体的
には、ヒト大脳皮質のmRNAを鋳型とし、適当な制限
酵素で開環させたベクタープラスミドの一端にオリゴd
Tを結合させたものをプライマーとしてcDNA合成を
行った後、制限酵素MboIと制限酵素BamHIで切
断する。当該ベクターはdamメチラーゼ陽性の大腸菌
を宿主として調製されたため、MboIの認識配列であ
る「GATC」のA残基がメチル化されている。従って
MboIは新たに合成されたcDNA部分のみを切断す
る。当該ベクターはオリゴdTを結合させた末端とは反
対側の末端近傍にBamHI切断部位を1ヶ所だけ有し
ているので本酵素は当該ベクターを1ヶ所切断し、さら
に新たに合成されたcDNA部分にもしBamHI認識
配列が存在すれば、その部位も切断する。BamHIと
MboIは「GATC」なる配列からなる、同一の付着
端を生ぜしめるため、両酵素で切断した後、DNAリガ
ーゼを作用させれば、プラスミドを閉環することができ
る。
ト脳組織で特異的に発現している遺伝子を有すると思わ
れるcDNAを識別する方法として、大久保らの方法
(Okubo et al.,Nature Gene
t.,2,173(1992))による、遺伝子発現の
出現頻度を解析する方法を用いることができる。具体的
には、ヒト大脳皮質のmRNAを鋳型とし、適当な制限
酵素で開環させたベクタープラスミドの一端にオリゴd
Tを結合させたものをプライマーとしてcDNA合成を
行った後、制限酵素MboIと制限酵素BamHIで切
断する。当該ベクターはdamメチラーゼ陽性の大腸菌
を宿主として調製されたため、MboIの認識配列であ
る「GATC」のA残基がメチル化されている。従って
MboIは新たに合成されたcDNA部分のみを切断す
る。当該ベクターはオリゴdTを結合させた末端とは反
対側の末端近傍にBamHI切断部位を1ヶ所だけ有し
ているので本酵素は当該ベクターを1ヶ所切断し、さら
に新たに合成されたcDNA部分にもしBamHI認識
配列が存在すれば、その部位も切断する。BamHIと
MboIは「GATC」なる配列からなる、同一の付着
端を生ぜしめるため、両酵素で切断した後、DNAリガ
ーゼを作用させれば、プラスミドを閉環することができ
る。
【0012】本方法においてはこのようにして調製した
プラスミドを用いて大腸菌を形質転換することによって
cDNAライブラリーを構築した。従って当該ライブラ
リーは各mRNAの3’端のポリA部位から、その5’
側部分のうち最初にGATCなる塩基配列が出現する部
位までの領域を含んでいる。当該cDNAライブラリー
から無作為に適当個数の組換え体を選択し、各組換え体
中のcDNAを抽出してその全塩基配列を決定する。本
法は、このようにして決定された特定配列を有するcD
NA断片が、無作為に選択された組み換え体の中から幾
つ確認されるかをもって、臓器特異的遺伝子及び高発現
遺伝子を識別する方法である。本法において、組み換え
体cDNAの抽出並びにcDNAの塩基配列の決定は、
いずれも当業者にとって自体公知の各種操作方法(Mo
lecular Cloning、2nd. ed.,
Cold Spring Harbor Lab.Pr
ess、1989、その他当業者にとって標準的な方法
を紹介した技術解説書等に記載の方法、以下常法とす
る)により行うことができる。
プラスミドを用いて大腸菌を形質転換することによって
cDNAライブラリーを構築した。従って当該ライブラ
リーは各mRNAの3’端のポリA部位から、その5’
側部分のうち最初にGATCなる塩基配列が出現する部
位までの領域を含んでいる。当該cDNAライブラリー
から無作為に適当個数の組換え体を選択し、各組換え体
中のcDNAを抽出してその全塩基配列を決定する。本
法は、このようにして決定された特定配列を有するcD
NA断片が、無作為に選択された組み換え体の中から幾
つ確認されるかをもって、臓器特異的遺伝子及び高発現
遺伝子を識別する方法である。本法において、組み換え
体cDNAの抽出並びにcDNAの塩基配列の決定は、
いずれも当業者にとって自体公知の各種操作方法(Mo
lecular Cloning、2nd. ed.,
Cold Spring Harbor Lab.Pr
ess、1989、その他当業者にとって標準的な方法
を紹介した技術解説書等に記載の方法、以下常法とす
る)により行うことができる。
【0013】尚、高発現遺伝子を識別する方法では、無
作為に選択する組み換え体の総数は数百から千程度が適
当であるが、必要ならばそれ以上の個数の組み換え体を
処理すればよい。本発明者らは上記方法を実施し、77
0個の組み換え体中のcDNA断片の塩基配列を全て決
定し、その中から、同一の配列を有するcDNAとして
の出現頻度が2/770であったcDNA断片を、ヒト
脳で特異的に発現している遺伝子を有するDNA断片の
候補として選別した。
作為に選択する組み換え体の総数は数百から千程度が適
当であるが、必要ならばそれ以上の個数の組み換え体を
処理すればよい。本発明者らは上記方法を実施し、77
0個の組み換え体中のcDNA断片の塩基配列を全て決
定し、その中から、同一の配列を有するcDNAとして
の出現頻度が2/770であったcDNA断片を、ヒト
脳で特異的に発現している遺伝子を有するDNA断片の
候補として選別した。
【0014】上記cDNA断片は前述したとおり、mR
NAの3’端の一部の領域しか含んでいない。そこで本
発明者らは当該領域(以下3’断片)の塩基配列情報を
元にして、全鎖長cDNAを取得した。これは上記3’
断片をプローブとして、λDR2をクローニングベクタ
ーとするヒト大脳皮質cDNAライブラリー(クローン
テック社製)をプラークハイブリダイゼーションで、常
法に従ってスクリーニングすることによって行った。そ
の結果、約4.1kbのDNA断片を増幅することがで
きた。
NAの3’端の一部の領域しか含んでいない。そこで本
発明者らは当該領域(以下3’断片)の塩基配列情報を
元にして、全鎖長cDNAを取得した。これは上記3’
断片をプローブとして、λDR2をクローニングベクタ
ーとするヒト大脳皮質cDNAライブラリー(クローン
テック社製)をプラークハイブリダイゼーションで、常
法に従ってスクリーニングすることによって行った。そ
の結果、約4.1kbのDNA断片を増幅することがで
きた。
【0015】上記方法によって取得したクローンをCr
eリコンビナーゼを有する大腸菌にトランスフェクトす
ることにより、該クローンから当該cDNAを含む断片
を環状プラスミドとして切り出して全塩基配列を決定し
た。
eリコンビナーゼを有する大腸菌にトランスフェクトす
ることにより、該クローンから当該cDNAを含む断片
を環状プラスミドとして切り出して全塩基配列を決定し
た。
【0016】上記方法によって選別したcDNA断片中
に存在すると思われる遺伝子が、脳組織で特異的に発現
していることの確認は、該cDNA配列の臓器特異的な
発現頻度をノーザンハイブリダイゼーションで確認する
ことで行うことができる。具体的には、クローンテック
社またはストラタジーン社から市販されている、ヒトの
各臓器から抽出したmRNAをアガロースゲル電気泳動
で分画し、メンブレンフィルターに転写した後、上記方
法によって選別したcDNA断片をプローブとして、常
法に従ってハイブリダイゼーションを行った。本発明者
らはこの方法を用い、該cDNA配列の発現についての
臓器特異性を調べた。その結果、脳以外の他の臓器、器
官、細胞等でも該cDNA配列の多少の発現が認められ
たものの、それに比べ大脳皮質で特異的に発現していた
ことを確認した。このことは、該cDNA配列中に、ヒ
ト脳で特異的に発現し正常な脳機能の維持に必須である
所望の遺伝子が存在することを、強く示唆するものであ
る。
に存在すると思われる遺伝子が、脳組織で特異的に発現
していることの確認は、該cDNA配列の臓器特異的な
発現頻度をノーザンハイブリダイゼーションで確認する
ことで行うことができる。具体的には、クローンテック
社またはストラタジーン社から市販されている、ヒトの
各臓器から抽出したmRNAをアガロースゲル電気泳動
で分画し、メンブレンフィルターに転写した後、上記方
法によって選別したcDNA断片をプローブとして、常
法に従ってハイブリダイゼーションを行った。本発明者
らはこの方法を用い、該cDNA配列の発現についての
臓器特異性を調べた。その結果、脳以外の他の臓器、器
官、細胞等でも該cDNA配列の多少の発現が認められ
たものの、それに比べ大脳皮質で特異的に発現していた
ことを確認した。このことは、該cDNA配列中に、ヒ
ト脳で特異的に発現し正常な脳機能の維持に必須である
所望の遺伝子が存在することを、強く示唆するものであ
る。
【0017】塩基配列中の蛋白質をコードする領域(O
RF、open reading frame)の存在は、塩基配列をコン
ピュータープログラムを用いて解析する汎用の方法によ
り確認することができる。該cDNA配列の中に目的と
する遺伝子の存在を確信した本発明者らは、コンピュー
ターを利用して該配列中に一つのORFを見いだし、こ
の遺伝子を遺伝子hucep−4、該遺伝子にコードさ
れる蛋白質をHUCEP−4と命名した。
RF、open reading frame)の存在は、塩基配列をコン
ピュータープログラムを用いて解析する汎用の方法によ
り確認することができる。該cDNA配列の中に目的と
する遺伝子の存在を確信した本発明者らは、コンピュー
ターを利用して該配列中に一つのORFを見いだし、こ
の遺伝子を遺伝子hucep−4、該遺伝子にコードさ
れる蛋白質をHUCEP−4と命名した。
【0018】遺伝子hucep−4は、配列番号:2に
示される2427塩基対(bp)からなる遺伝子であ
る。この遺伝子hucep−4を用い、適当な宿主ベク
ター系による一般的な遺伝子組み換え技術によって、組
み換え遺伝子を調製することができる。適当なベクター
としては、大腸菌由来のプラスミド(例、pBR32
2、pUC118その他)、枯草菌由来のプラスミド
(例、pUB110、pC194その他)、酵母由来の
プラスミド(例、pSH19その他)、さらにバクテリ
オファージやレトロウィルスやワクシニアウィルス等の
動物ウィルス等が利用できる。組み換えに際しては、適
当な合成DNAアダプターを用いて翻訳開始コドンや翻
訳終止コドンを付加することも可能である。さらに該遺
伝子を発現させるために、遺伝子の上流に適当な発現プ
ロモーターを接続する。使用するプロモーターは、宿主
に応じて適宜選択すればよい。例えば、宿主が大腸菌で
ある場合には、T7プロモーター、lacプロモータ
ー、trpプロモーター、λPLプロモーターなどが、
宿主がバチルス属菌である場合にはSPO系プロモータ
ー等が、宿主が酵母である場合にはPHO5プロモータ
ー、GAPプロモーター、ADHプロモーター等が、宿
主が動物細胞である場合にはSV40由来プロモータ
ー、レトロウィルスプロモーター等が、それぞれ使用で
きる。
示される2427塩基対(bp)からなる遺伝子であ
る。この遺伝子hucep−4を用い、適当な宿主ベク
ター系による一般的な遺伝子組み換え技術によって、組
み換え遺伝子を調製することができる。適当なベクター
としては、大腸菌由来のプラスミド(例、pBR32
2、pUC118その他)、枯草菌由来のプラスミド
(例、pUB110、pC194その他)、酵母由来の
プラスミド(例、pSH19その他)、さらにバクテリ
オファージやレトロウィルスやワクシニアウィルス等の
動物ウィルス等が利用できる。組み換えに際しては、適
当な合成DNAアダプターを用いて翻訳開始コドンや翻
訳終止コドンを付加することも可能である。さらに該遺
伝子を発現させるために、遺伝子の上流に適当な発現プ
ロモーターを接続する。使用するプロモーターは、宿主
に応じて適宜選択すればよい。例えば、宿主が大腸菌で
ある場合には、T7プロモーター、lacプロモータ
ー、trpプロモーター、λPLプロモーターなどが、
宿主がバチルス属菌である場合にはSPO系プロモータ
ー等が、宿主が酵母である場合にはPHO5プロモータ
ー、GAPプロモーター、ADHプロモーター等が、宿
主が動物細胞である場合にはSV40由来プロモータ
ー、レトロウィルスプロモーター等が、それぞれ使用で
きる。
【0019】また該遺伝子を他の蛋白質(例、グルタチ
オンSトランスフェラーゼ、プロテインAその他)との
融合蛋白質として発現させることも可能である。このよ
うにして発現させた融合型HUCEP−4は、適当なプ
ロテアーゼ(例、トロンビンその他)を用いて切り出す
ことが可能である。
オンSトランスフェラーゼ、プロテインAその他)との
融合蛋白質として発現させることも可能である。このよ
うにして発現させた融合型HUCEP−4は、適当なプ
ロテアーゼ(例、トロンビンその他)を用いて切り出す
ことが可能である。
【0020】HUCEP−4の発現の際に利用できる宿
主としては、エシェリヒア属菌であるEscheric
hia coliの各種菌株、バチルス属菌であるBa
cillus subtilisの各種菌株、酵母とし
てはSaccharomyce s cerevisia
eの各種菌株、動物細胞としてはCOS−7細胞、CH
O細胞、PC12細胞等が利用できる。
主としては、エシェリヒア属菌であるEscheric
hia coliの各種菌株、バチルス属菌であるBa
cillus subtilisの各種菌株、酵母とし
てはSaccharomyce s cerevisia
eの各種菌株、動物細胞としてはCOS−7細胞、CH
O細胞、PC12細胞等が利用できる。
【0021】上記組み換えベクターを用いて宿主細胞を
形質転換する方法としては、常法または各宿主細胞に対
して一般に用いられる形質転換方法が適用できる。
形質転換する方法としては、常法または各宿主細胞に対
して一般に用いられる形質転換方法が適用できる。
【0022】前述した方法によって、取得したラムダフ
ァージクローンからhucep−4を含む断片を切り出
して得られた環状プラスミド、pDRhucep−4を
用い、常法に従って形質転換したEscherichi
a coliDH5/pDRhucep−4は、平成9
年3月14日に工業技術院生命工学技術研究所に寄託番
号FARM P−16134として寄託されている。
ァージクローンからhucep−4を含む断片を切り出
して得られた環状プラスミド、pDRhucep−4を
用い、常法に従って形質転換したEscherichi
a coliDH5/pDRhucep−4は、平成9
年3月14日に工業技術院生命工学技術研究所に寄託番
号FARM P−16134として寄託されている。
【0023】新規蛋白質HUCEP−4は、配列番号:
1に示されるごとく、総数809個のアミノ酸残基から
なる、分子量92514Daの蛋白質である。
1に示されるごとく、総数809個のアミノ酸残基から
なる、分子量92514Daの蛋白質である。
【0024】尚、本発明においては、配列番号:2に示
したDNA配列の他に、該DNAとハイブリダイズしか
つ活性を有する生理活性蛋白質をコードするDNAも、
本発明の範囲内である。
したDNA配列の他に、該DNAとハイブリダイズしか
つ活性を有する生理活性蛋白質をコードするDNAも、
本発明の範囲内である。
【0025】すなわち、遺伝子hucep−4の全長配
列において、種々の人為的処理、例えば部位特異的変異
導入、変異剤処理によるランダム変異、制限酵素切断に
よるDNA断片の変異・欠失・連結等により、部分的に
DNA配列が変化したものであっても、これらDNA変
異体が遺伝子hucep−4とストリンジェントな条件
下でハイブリダイズし、かつ活性を有する生理活性蛋白
質をコードするDNAであれば、配列表2に示したDN
A配列との相違に関わらず、本発明の範囲内のものであ
る。
列において、種々の人為的処理、例えば部位特異的変異
導入、変異剤処理によるランダム変異、制限酵素切断に
よるDNA断片の変異・欠失・連結等により、部分的に
DNA配列が変化したものであっても、これらDNA変
異体が遺伝子hucep−4とストリンジェントな条件
下でハイブリダイズし、かつ活性を有する生理活性蛋白
質をコードするDNAであれば、配列表2に示したDN
A配列との相違に関わらず、本発明の範囲内のものであ
る。
【0026】また、配列番号:2に示したDNA配列と
僅かに異なる配列からなる遺伝子が、ヒト染色体上に遺
伝子hucep−4とは別個に存在する可能性もあり得
るが、この場合においても、そこにコードされる蛋白質
が活性を有する生理活性蛋白質であれば、上記人為的変
異体と同様に本発明の範囲内のものである。
僅かに異なる配列からなる遺伝子が、ヒト染色体上に遺
伝子hucep−4とは別個に存在する可能性もあり得
るが、この場合においても、そこにコードされる蛋白質
が活性を有する生理活性蛋白質であれば、上記人為的変
異体と同様に本発明の範囲内のものである。
【0027】上記のDNA変異の程度は、遺伝子huc
ep−4のDNA配列と90%以上の相同性を有するも
のであれば許容範囲内である。また、遺伝子hucep
−4とハイブリダイズする程度としては、通常の条件下
(例えば DIG DNALabeling kit
(ベーリンガー・マンハイム社製 Cat No.11
75033)でプローブをラベルした場合に、32℃の
DIG Easy Hyb溶液(ベーリンガー・マンハ
イム社製 Cat No.1603558)中でハイブ
リダイズさせ、50℃の0.5×SSC溶液(0.1%
[w/v]SDSを含む)中でメンブレンを洗浄する条
件(1×SSCは0.15M NaCl、0.015M
クエン酸ナトリウムである)でのサザンハイブリダイ
ゼーションで、遺伝子hucep−4にハイブリダイズ
する程度であればよい。
ep−4のDNA配列と90%以上の相同性を有するも
のであれば許容範囲内である。また、遺伝子hucep
−4とハイブリダイズする程度としては、通常の条件下
(例えば DIG DNALabeling kit
(ベーリンガー・マンハイム社製 Cat No.11
75033)でプローブをラベルした場合に、32℃の
DIG Easy Hyb溶液(ベーリンガー・マンハ
イム社製 Cat No.1603558)中でハイブ
リダイズさせ、50℃の0.5×SSC溶液(0.1%
[w/v]SDSを含む)中でメンブレンを洗浄する条
件(1×SSCは0.15M NaCl、0.015M
クエン酸ナトリウムである)でのサザンハイブリダイ
ゼーションで、遺伝子hucep−4にハイブリダイズ
する程度であればよい。
【0028】また、上記のごとく遺伝子hucep−4
と相同性の高い変異体遺伝子にコードされる蛋白質であ
って、活性を有する生理活性蛋白質もまた、本発明の範
囲内のものである。
と相同性の高い変異体遺伝子にコードされる蛋白質であ
って、活性を有する生理活性蛋白質もまた、本発明の範
囲内のものである。
【0029】すなわち、新規蛋白質HUCEP−4のア
ミノ酸配列の1もしくは複数個のアミノ酸が欠失、置換
もしくは付加された変異体であっても、該変異体が活性
を有する蛋白質であれば、該変異体は本発明の範囲内の
ものである。
ミノ酸配列の1もしくは複数個のアミノ酸が欠失、置換
もしくは付加された変異体であっても、該変異体が活性
を有する蛋白質であれば、該変異体は本発明の範囲内の
ものである。
【0030】蛋白質の構成要素となるアミノ酸の側鎖
は、疎水性、電荷、大きさなどにおいてそれぞれ異なる
ものであるが、実質的に蛋白質全体の3次元構造(立体
構造とも言う)に影響を与えないという意味で保存性の
高い幾つかの関係が、経験的にまた物理化学的な実測に
より知られている。例えば、アミノ酸残基の置換につい
ては、グリシン(Gly)とプロリン(Pro)、Gl
yとアラニン(Ala)またはバリン(Val)、ロイ
シン(Leu)とイソロイシン(Ile)、グルタミン
酸(Glu)とグルタミン(Gln)、アスパラギン酸
(Asp)とアスパラギン(Asn)、システイン(C
ys)とスレオニン(Thr)、Thrとセリン(Se
r)またはAla、リジン(Lys)とアルギニン(A
rg)、等が挙げられる。
は、疎水性、電荷、大きさなどにおいてそれぞれ異なる
ものであるが、実質的に蛋白質全体の3次元構造(立体
構造とも言う)に影響を与えないという意味で保存性の
高い幾つかの関係が、経験的にまた物理化学的な実測に
より知られている。例えば、アミノ酸残基の置換につい
ては、グリシン(Gly)とプロリン(Pro)、Gl
yとアラニン(Ala)またはバリン(Val)、ロイ
シン(Leu)とイソロイシン(Ile)、グルタミン
酸(Glu)とグルタミン(Gln)、アスパラギン酸
(Asp)とアスパラギン(Asn)、システイン(C
ys)とスレオニン(Thr)、Thrとセリン(Se
r)またはAla、リジン(Lys)とアルギニン(A
rg)、等が挙げられる。
【0031】従って、配列番号:1に示した新規蛋白質
HUCEP−4のアミノ酸配列上の置換、挿入、欠失等
による変異蛋白質であっても、その変異がHUCEP−
4蛋白質の3次元構造において保存性が高い変異であっ
て、その変異蛋白質がHUCEP−4と同様に活性を有
する生理活性蛋白質であれば、これらは本発明の範囲内
にあるものと言うことができる。変異の程度としては、
配列番号:1に示したアミノ酸配列との相同性が、90
%以上のものが許容し得る範囲である。
HUCEP−4のアミノ酸配列上の置換、挿入、欠失等
による変異蛋白質であっても、その変異がHUCEP−
4蛋白質の3次元構造において保存性が高い変異であっ
て、その変異蛋白質がHUCEP−4と同様に活性を有
する生理活性蛋白質であれば、これらは本発明の範囲内
にあるものと言うことができる。変異の程度としては、
配列番号:1に示したアミノ酸配列との相同性が、90
%以上のものが許容し得る範囲である。
【0032】
【発明の効果】HUCEP−4が転写調節活性を有して
いることから、遺伝子hucep−4の発現異常、ある
いはHUCEP−4の機能不全は、脳の高次機能を維持
する上で重大な障害となると推測される。
いることから、遺伝子hucep−4の発現異常、ある
いはHUCEP−4の機能不全は、脳の高次機能を維持
する上で重大な障害となると推測される。
【0033】したがってHUCEP−4それ自体は虚血
性脳疾患やアルツハイマー病、パーキンソン病などの神
経変性疾患の治療薬として有用と考えられる。また、当
該蛋白質の機能と同様の機能を有する物質、当該機能を
促進する物質、あるいはまた当該遺伝子の発現を促進す
る物質等の創出に利用することができる。
性脳疾患やアルツハイマー病、パーキンソン病などの神
経変性疾患の治療薬として有用と考えられる。また、当
該蛋白質の機能と同様の機能を有する物質、当該機能を
促進する物質、あるいはまた当該遺伝子の発現を促進す
る物質等の創出に利用することができる。
【0034】
【実施例】以下実施例を挙げて詳述するが、本発明はこ
の実施例に限定されないことは言うまでもない。
の実施例に限定されないことは言うまでもない。
【0035】<実施例1> 遺伝子hucep−4のク
ローニング 1)大脳の正常機能の維持に必須な遺伝子の部分配列の
決定 ヒト大脳皮質のmRNA(クローンテック社)を鋳型と
して、大久保らの方法(Okubo et al.Na
ture Genet.,1992、2、p173)に
より、大脳皮質のcDNAライブラリーを作成した。
ローニング 1)大脳の正常機能の維持に必須な遺伝子の部分配列の
決定 ヒト大脳皮質のmRNA(クローンテック社)を鋳型と
して、大久保らの方法(Okubo et al.Na
ture Genet.,1992、2、p173)に
より、大脳皮質のcDNAライブラリーを作成した。
【0036】次いで、当該ライブラリーから無作為に7
70個の組換え体を選択し、常法(Molecular
Cloning、2nd. ed.,Cold Sp
ring Harbor Lab.Press、198
9、以下同じ)に従って、組換えDNAを抽出し、cD
NA部分の3’側の塩基配列を決定した。配列決定には
PEアプライドバイオシステムズ社製のDNAシークエ
ンサー(ABI PRISM377)と同社製反応キッ
トを用いた。770個の組み換え体中の各DNA断片の
発現頻度を解析した結果、図1に示す配列(配列−1)
を有する遺伝子の発現頻度が2/770であった。
70個の組換え体を選択し、常法(Molecular
Cloning、2nd. ed.,Cold Sp
ring Harbor Lab.Press、198
9、以下同じ)に従って、組換えDNAを抽出し、cD
NA部分の3’側の塩基配列を決定した。配列決定には
PEアプライドバイオシステムズ社製のDNAシークエ
ンサー(ABI PRISM377)と同社製反応キッ
トを用いた。770個の組み換え体中の各DNA断片の
発現頻度を解析した結果、図1に示す配列(配列−1)
を有する遺伝子の発現頻度が2/770であった。
【0037】2)配列−1を含むcDNA断片のクロー
ニング 配列−1を含むcDNA断片のクローニングを以下の方
法により行った。
ニング 配列−1を含むcDNA断片のクローニングを以下の方
法により行った。
【0038】まず、配列−1の一部分よりなるオリゴヌ
クレオチド(図1;配列−2)を、PEアプライドバイ
オシステムズ社製のDNA合成機(ABI 380B)
で合成した。λDR2をクローニングベクターとする、
Human Brain cerebral cort
ex 5’−STRETCH cDNA librar
y(クロンテックラボラトリーズ社製)を、大腸菌K1
2株、K802を宿主として常法に従ってプラークを形
成せしめた。プラークをメンブレンフィルター(アマシ
ャム社製Hybond−N+)に転写し、DIG(ジゴ
キシゲニン)で標識した配列−2のオリゴヌクレオチド
をプローブとして、プラークハイブリダイゼーション法
によって配列−2を有するファージを取得した。標識に
はDIGオリゴヌクレオチド・テイリングキット(ベー
リンガーマンハイム社製)を使用し、方法は本キットの
手順に従った。ハイブリダイゼーションは以下の組成の
溶液中で(濃度は全て終濃度)、51℃で5時間行っ
た。
クレオチド(図1;配列−2)を、PEアプライドバイ
オシステムズ社製のDNA合成機(ABI 380B)
で合成した。λDR2をクローニングベクターとする、
Human Brain cerebral cort
ex 5’−STRETCH cDNA librar
y(クロンテックラボラトリーズ社製)を、大腸菌K1
2株、K802を宿主として常法に従ってプラークを形
成せしめた。プラークをメンブレンフィルター(アマシ
ャム社製Hybond−N+)に転写し、DIG(ジゴ
キシゲニン)で標識した配列−2のオリゴヌクレオチド
をプローブとして、プラークハイブリダイゼーション法
によって配列−2を有するファージを取得した。標識に
はDIGオリゴヌクレオチド・テイリングキット(ベー
リンガーマンハイム社製)を使用し、方法は本キットの
手順に従った。ハイブリダイゼーションは以下の組成の
溶液中で(濃度は全て終濃度)、51℃で5時間行っ
た。
【0039】5×SSC 1% Blocking Buffer 0.1% N−ラウロイルサルコシルナトリウム 0.02% SDS 50μg/ml polyA 1pmol/ml DIG 標識合成DNA ハイブリダイゼーション終了後、メンブレンを2×SS
C、0.1%SDS、次いで0.5×SSC、0.1%
SDSを用い、51℃で洗浄した。メンブレン洗浄後、
DIG発光検出キット(ベーリンガーマンハイム社製)
を使用し、当該キットの手順に従ってメンブレンを処理
した。シグナルの検出には、HyperfilmTM−E
CL(アマシャム社製)フイルムを使用した。
C、0.1%SDS、次いで0.5×SSC、0.1%
SDSを用い、51℃で洗浄した。メンブレン洗浄後、
DIG発光検出キット(ベーリンガーマンハイム社製)
を使用し、当該キットの手順に従ってメンブレンを処理
した。シグナルの検出には、HyperfilmTM−E
CL(アマシャム社製)フイルムを使用した。
【0040】プローブとハイブリダイズしたプラークを
常法に従って純化し、単一クローンを取得した。
常法に従って純化し、単一クローンを取得した。
【0041】当該単一クローンを大腸菌K12株、K8
02を宿主として増殖せしめた後、大腸菌K12株、A
M1にトランスフェクトして、当該菌体を培養した。こ
れらの操作は「λDR2&pDR2 Cloning
and Expression System Lib
rary Protocol Handbook」(ク
ローンテック社製)に従って行った。遠心分離によって
菌体を集めた後、QIAprep Spin Plas
mid Miniprep Kit(キアゲン社製)で
組換えDNAを精製した。このような方法によって、取
得したラムダファージクローンからhucep−4を含
む断片を切り出して得られた環状プラスミドをpDRh
ucep−4と命名した。このプラスミドpDRhuc
ep4の構造を図2に示す。
02を宿主として増殖せしめた後、大腸菌K12株、A
M1にトランスフェクトして、当該菌体を培養した。こ
れらの操作は「λDR2&pDR2 Cloning
and Expression System Lib
rary Protocol Handbook」(ク
ローンテック社製)に従って行った。遠心分離によって
菌体を集めた後、QIAprep Spin Plas
mid Miniprep Kit(キアゲン社製)で
組換えDNAを精製した。このような方法によって、取
得したラムダファージクローンからhucep−4を含
む断片を切り出して得られた環状プラスミドをpDRh
ucep−4と命名した。このプラスミドpDRhuc
ep4の構造を図2に示す。
【0042】pDRhucep−4を用い、常法に従っ
て形質転換したEs cherichia coliDH
5/pDRhucep−4は、平成9年3月12日に工
業技術院生命工学技術研究所に寄託番号FARM P−
16134として寄託されている。
て形質転換したEs cherichia coliDH
5/pDRhucep−4は、平成9年3月12日に工
業技術院生命工学技術研究所に寄託番号FARM P−
16134として寄託されている。
【0043】3)DNA断片の塩基配列の決定 塩基配列決定にはPEアプライドバイオシステムズ社製
のDNAシークエンサーを用い、ダイターミネーター法
を用いた。決定された塩基配列を元にしてオリゴヌクレ
オチドを合成し、プライマーウオーキング法で両鎖の全
塩基配列を決定した(図3)。当該クローンのcDNA
の全塩基配列を配列番号3に示す。当該塩基配列が配列
−2を含んでいたことから、目的とする遺伝子huce
p−4がクローニングされたことを確認した。
のDNAシークエンサーを用い、ダイターミネーター法
を用いた。決定された塩基配列を元にしてオリゴヌクレ
オチドを合成し、プライマーウオーキング法で両鎖の全
塩基配列を決定した(図3)。当該クローンのcDNA
の全塩基配列を配列番号3に示す。当該塩基配列が配列
−2を含んでいたことから、目的とする遺伝子huce
p−4がクローニングされたことを確認した。
【0044】当該cDNAは809残基より成る蛋白質
(HUCEP−4)をコードする翻訳領域(open
reading frame、ORF)を含んでいた。
(HUCEP−4)をコードする翻訳領域(open
reading frame、ORF)を含んでいた。
【0045】<実施例2>ヒト組織中での遺伝子huc
ep−4の発現の確認 ノ−ザンハイブリダイゼ−ションを実施して、ヒト組織
中での遺伝子hucep−4の発現を確認した。
ep−4の発現の確認 ノ−ザンハイブリダイゼ−ションを実施して、ヒト組織
中での遺伝子hucep−4の発現を確認した。
【0046】ヒト大脳皮質からmRNA抽出キット(フ
ァルマシア バイオテク社製)を用いてmRNAを精製
した。2μgのmRNAを定法に従ってアガロースゲル
電気泳動で分画してメンブレン(アマシャム社製Hyb
ond−N+)に転写し、ハイブリダイゼーションを行
った。プローブとしてはDIG(ジゴキシゲニン)で標
識したhucep−4のcDNA断片を用いた。標識に
はDIGオリゴヌクレオチド・テイリングキット(ベー
リンガーマンハイム社製)を使用し、方法は本キットの
手順に従った。ハイブリダイゼーションは以下の組成の
溶液中で(濃度は全て終濃度)、51℃で5時間行っ
た。
ァルマシア バイオテク社製)を用いてmRNAを精製
した。2μgのmRNAを定法に従ってアガロースゲル
電気泳動で分画してメンブレン(アマシャム社製Hyb
ond−N+)に転写し、ハイブリダイゼーションを行
った。プローブとしてはDIG(ジゴキシゲニン)で標
識したhucep−4のcDNA断片を用いた。標識に
はDIGオリゴヌクレオチド・テイリングキット(ベー
リンガーマンハイム社製)を使用し、方法は本キットの
手順に従った。ハイブリダイゼーションは以下の組成の
溶液中で(濃度は全て終濃度)、51℃で5時間行っ
た。
【0047】5×SSC 1% Blocking Buffer 0.1% N−ラウロイルサルコシルナトリウム 0.02% SDS 50μg/ml polyA 1pmol/ml DIG 標識合成DNA ハイブリダイゼーション終了後、メンブレンを2×SS
C、0.1%SDS、次いで0.5×SSC、0.1%
SDSを用い、51℃で洗浄した。
C、0.1%SDS、次いで0.5×SSC、0.1%
SDSを用い、51℃で洗浄した。
【0048】メンブレン洗浄後、DIG発光検出キット
(ベーリンガーマンハイム社製)を使用し、当該キット
の手順に従ってメンブレンを処理した。シグナルの検出
には、HyperfilmTM−ECL(アマシャム社
製)フイルムを使用した。
(ベーリンガーマンハイム社製)を使用し、当該キット
の手順に従ってメンブレンを処理した。シグナルの検出
には、HyperfilmTM−ECL(アマシャム社
製)フイルムを使用した。
【0049】プロ−ブとハイブリダイズするmRNA
は、大脳皮質に豊富であった。
は、大脳皮質に豊富であった。
【0050】<実施例3> PC12細胞中でのhuc
ep−4遺伝子の発現 1)PC12細胞への導入と安定な形質転換体の取得 実施例−1で取得したpDRhucep−4はhuce
p−4断片の上流にRSV−LTRプロモーターを有し
ており、当該組換えDNAを動物細胞中に導入すれば、
hucep−4を発現させることが可能である。
ep−4遺伝子の発現 1)PC12細胞への導入と安定な形質転換体の取得 実施例−1で取得したpDRhucep−4はhuce
p−4断片の上流にRSV−LTRプロモーターを有し
ており、当該組換えDNAを動物細胞中に導入すれば、
hucep−4を発現させることが可能である。
【0051】PC12細胞を直径60mmのプラスチッ
クシャーレで培養した。シャーレはコラーゲンコートし
たものを用い、培地としては5%牛胎児血清、5%ウマ
血清、50ユニット/mlペニシリン、50μg/ml
ストレプトマイシンを含むDMEM(ギブコ社製、以下
増殖培地とする)を使用し、37℃、5%CO2存在下
で培養した。
クシャーレで培養した。シャーレはコラーゲンコートし
たものを用い、培地としては5%牛胎児血清、5%ウマ
血清、50ユニット/mlペニシリン、50μg/ml
ストレプトマイシンを含むDMEM(ギブコ社製、以下
増殖培地とする)を使用し、37℃、5%CO2存在下
で培養した。
【0052】細胞密度が50%になった時点で、1)で
構築したpDRhucep−4を含むLIPOFECT
AMINE試薬(ギブコ社製)を、細胞上に重層して5
時間培養した後、増殖培地に置換して24時間培養し
た。ピペッティングで細胞を分散した後、細胞懸濁液を
2等分して直径100mmのプラスチックシャーレ2枚
に分注してさらに24時間培養した。
構築したpDRhucep−4を含むLIPOFECT
AMINE試薬(ギブコ社製)を、細胞上に重層して5
時間培養した後、増殖培地に置換して24時間培養し
た。ピペッティングで細胞を分散した後、細胞懸濁液を
2等分して直径100mmのプラスチックシャーレ2枚
に分注してさらに24時間培養した。
【0053】培地を除いた後、ハイグロマイシンB(カ
ルビオケム社製;終濃度400μg/ml)を含有する
増殖培地に置換した。ハイグロマイシンB添加培地を3
日毎に交換してして2週間培養した。細胞のコロニーが
肉眼で確認できるようになった時点で、ステンレスカッ
プを用いてコロニーを5個単離した。対照として用いる
ためにPC12細胞にpDR2(クローンテック社製)
のみを上記と同様にして導入し、安定な形質転換体を5
個単離した。
ルビオケム社製;終濃度400μg/ml)を含有する
増殖培地に置換した。ハイグロマイシンB添加培地を3
日毎に交換してして2週間培養した。細胞のコロニーが
肉眼で確認できるようになった時点で、ステンレスカッ
プを用いてコロニーを5個単離した。対照として用いる
ためにPC12細胞にpDR2(クローンテック社製)
のみを上記と同様にして導入し、安定な形質転換体を5
個単離した。
【0054】2)形質転換体中の遺伝子発現の確認 単離した各形質転換体を、24穴のプレートでハイグロ
マイシンB添加培地(終濃度400μg/ml)で培養
し、細胞密度が80%コンフルエントになった時点でピ
ペッティングで細胞を分散して、直径100mmのプラ
スチックシャーレに接種した。細胞密度が再度80%コ
ンフルエントになった時点で培地を除去し、PBSを添
加してセルスクレイパーを用いて細胞を回収した。遠心
によって細胞を沈殿させた後に上清を除去し、mRNA
抽出キット(ファルマシア バイオテク社製)を用いて
細胞からmRNAを精製した。2μgのmRNAを定法
に従ってアガロースゲル電気泳動で分画してメンブレン
(アマシャム社製Hybond−N+)に転写し、ノー
ザンハイブリダイゼーションを行った。プローブとして
はDIG(ジゴキシゲニン)で標識したhucep−4
のcDNA断片を用いた。標識にはDIGオリゴヌクレ
オチド・テイリングキット(ベーリンガーマンハイム社
製)を使用し、方法は本キットの手順に従った。ハイブ
リダイゼーションは以下の組成の溶液中で(濃度は全て
終濃度)、51℃で5時間行った。
マイシンB添加培地(終濃度400μg/ml)で培養
し、細胞密度が80%コンフルエントになった時点でピ
ペッティングで細胞を分散して、直径100mmのプラ
スチックシャーレに接種した。細胞密度が再度80%コ
ンフルエントになった時点で培地を除去し、PBSを添
加してセルスクレイパーを用いて細胞を回収した。遠心
によって細胞を沈殿させた後に上清を除去し、mRNA
抽出キット(ファルマシア バイオテク社製)を用いて
細胞からmRNAを精製した。2μgのmRNAを定法
に従ってアガロースゲル電気泳動で分画してメンブレン
(アマシャム社製Hybond−N+)に転写し、ノー
ザンハイブリダイゼーションを行った。プローブとして
はDIG(ジゴキシゲニン)で標識したhucep−4
のcDNA断片を用いた。標識にはDIGオリゴヌクレ
オチド・テイリングキット(ベーリンガーマンハイム社
製)を使用し、方法は本キットの手順に従った。ハイブ
リダイゼーションは以下の組成の溶液中で(濃度は全て
終濃度)、51℃で5時間行った。
【0055】5×SSC 1% Blocking Buffer 0.1% N−ラウロイルサルコシルナトリウム 0.02% SDS 50μg/ml polyA 1pmol/ml DIG 標識合成DNA ハイブリダイゼーション終了後、メンブレンを2×SS
C、0.1%SDS、次いで0.5×SSC、0.1%
SDSを用い、51℃で洗浄した。
C、0.1%SDS、次いで0.5×SSC、0.1%
SDSを用い、51℃で洗浄した。
【0056】メンブレン洗浄後、DIG発光検出キット
(ベーリンガーマンハイム社製)を使用し、当該キット
の手順に従ってメンブレンを処理した。シグナルの検出
には、HyperfilmTM−ECL(アマシャム社
製)フイルムを使用した。
(ベーリンガーマンハイム社製)を使用し、当該キット
の手順に従ってメンブレンを処理した。シグナルの検出
には、HyperfilmTM−ECL(アマシャム社
製)フイルムを使用した。
【0057】その結果、pDRhucep−4を導入し
たPC12細胞のほうがpDR2(クローンテック社
製)を導入したPC12細胞よりも、遺伝子hucep
−4の発現量が多かった。
たPC12細胞のほうがpDR2(クローンテック社
製)を導入したPC12細胞よりも、遺伝子hucep
−4の発現量が多かった。
【0058】
出願人氏名:大正製薬株式会社 発明の名称:新規遺伝子とそれにコードされる蛋白質 整理番号:00HI−P2615 配列の数:1 配列番号(SEQ ID NO):1 配列の長さ:809残基 配列の型 :アミノ酸 トポロジ−:直鎖状 配列の種類:蛋白質 配列: Met Tyr Glu Ala Leu Pro Gly Pro Ala Pro Glu Asn Glu Asp Gly 5 10 15 Leu Val Lys Val Lys Glu Glu Asp Pro Thr Trp Glu Gln Val Cys 20 25 30 Asn Ser Gln Glu Gly Ser Ser His Thr Gln Glu Ile Cys Arg Leu 35 40 45 Arg Phe Arg His Phe Cys Tyr Gln Glu Ala His Gly Pro Gln Glu 50 55 60 Ala Leu Ala Gln Leu Arg Glu Leu Cys His Gln Trp Leu Arg Pro 65 70 75 Glu Met His Thr Lys Glu Gln Ile Met Glu Leu Leu Val Leu Glu 80 85 90 Gln Phe Leu Thr Ile Leu Pro Lys Glu Leu Gln Pro Cys Val Lys 95 100 105 Thr Tyr Pro Leu Glu Ser Gly Glu Glu Ala Val Thr Val Leu Glu 110 115 120 Asn Leu Glu Thr Gly Ser Gly Asp Thr Gly Gln Gln Ala Ser Val 125 130 135 Tyr Ile Gln Gly Gln Asp Met His Pro Met Val Ala Glu Tyr Gln 140 145 150 Gly Val Ser Leu Glu Cys Gln Ser Leu Gln Leu Leu Pro Gly Ile 155 160 165 Thr Thr Leu Lys Cys Glu Pro Pro Gln Arg Pro Gln Gly Asn Pro 170 175 180 Gln Glu Val Ser Gly Pro Val Pro His Gly Ser Ala His Leu Gln 185 190 195 Glu Lys Asn Pro Arg Asp Lys Ala Val Val Pro Val Phe Asn Pro 200 205 210 Val Arg Ser Gln Thr Leu Val Lys Thr Glu Glu Glu Thr Ala Gln 215 220 225 Ala Val Ala Ala Glu Lys Trp Ser His Leu Ser Leu Thr Arg Arg 230 235 240 Asn Leu Cys Gly Asn Ser Ala Gln Glu Thr Val Met Ser Leu Ser 245 250 255 Pro Met Thr Glu Glu Ile Val Thr Lys Asp Arg Leu Phe Lys Ala 260 265 270 Lys Gln Glu Thr Ser Glu Glu Met Glu Gln Ser Gly Glu Ala Ser 275 280 285 Gly Lys Pro Asn Arg Glu Cys Ala Pro Gln Ile Pro Cys Ser Thr 290 295 300 Pro Ile Ala Thr Glu Arg Thr Val Ala His Leu Asn Thr Leu Lys 305 310 315 Asp Arg His Pro Gly Asp Leu Trp Ala Arg Met His Ile Ser Ser 320 325 330 Leu Glu Tyr Ala Ala Gly Asp Ile Thr Arg Lys Gly Arg Lys Lys 335 340 345 Asp Lys Ala Arg Val Ser Glu Leu Leu Gln Gly Leu Ser Phe Ser 350 355 360 Gly Asp Ser Asp Val Glu Lys Asp Asn Glu Pro Glu Ile Gln Pro 365 370 375 Ala Gln Lys Lys Leu Lys Val Ser Cys Phe Pro Glu Lys Ser Trp 380 385 390 Thr Lys Arg Asp Ile Lys Pro Asn Phe Pro Ser Trp Ser Ala Leu 395 400 405 Asp Ser Gly Leu Leu Asn Leu Lys Ser Glu Lys Leu Asn Pro Val 410 415 420 Glu Leu Phe Glu Leu Phe Phe Asp Asp Glu Thr Phe Asn Leu Ile 425 430 435 Val Asn Glu Thr Asn Asn Tyr Ala Ser Gln Lys Asn Val Ser Leu 440 445 450 Glu Val Thr Val Gln Glu Met Arg Cys Val Phe Gly Val Leu Leu 455 460 465 Leu Ser Gly Phe Met Arg His Pro Arg Arg Glu Met Tyr Trp Glu 470 475 480 Val Ser Asp Thr Asp Gln Asn Leu Val Arg Asp Ala Ile Arg Arg 485 490 495 Asp Arg Phe Glu Leu Ile Phe Ser Asn Leu His Phe Ala Asp Asn 500 505 510 Gly His Leu Asp Gln Lys Asp Lys Phe Thr Lys Leu Arg Pro Leu 515 520 525 Ile Lys Gln Met Asn Lys Asn Phe Leu Leu Tyr Ala Pro Leu Glu 530 535 540 Glu Tyr Tyr Cys Phe Asp Lys Ser Met Cys Glu Cys Phe Asp Ser 545 550 555 Asp Gln Phe Leu Asn Gly Lys Pro Ile Arg Ile Gly Tyr Lys Ile 560 565 570 Trp Cys Gly Thr Thr Thr Gln Gly Tyr Leu Val Trp Phe Glu Pro 575 580 585 Tyr Gln Glu Glu Ser Thr Met Lys Val Asp Glu Asp Pro Asp Leu 590 595 600 Gly Leu Gly Gly Asn Leu Val Met Asn Phe Ala Asp Val Leu Leu 605 610 615 Glu Arg Gly Gln Tyr Pro Tyr His Leu Cys Phe Asp Ser Phe Phe 620 625 630 Thr Ser Val Lys Leu Leu Ser Ala Leu Lys Lys Lys Gly Val Arg 635 640 645 Ala Thr Gly Thr Ile Arg Glu Asn Arg Thr Glu Lys Cys Pro Leu 650 655 660 Met Asn Val Glu His Met Lys Lys Met Lys Arg Gly Tyr Phe Asp 665 670 675 Phe Arg Ile Glu Glu Asn Asn Glu Ile Ile Leu Cys Arg Trp Tyr 680 685 690 Gly Asp Gly Ile Ile Ser Leu Cys Ser Asn Ala Val Gly Ile Glu 695 700 705 Pro Val Asn Glu Val Ser Cys Cys Asp Ala Asp Asn Glu Glu Ile 710 715 720 Pro Gln Ile Ser Gln Pro Ser Ile Val Lys Val Tyr Asp Glu Cys 725 730 735 Lys Glu Gly Val Ala Lys Met Asp Gln Ile Ile Ser Lys Tyr Arg 740 745 750 Val Arg Ile Arg Ser Lys Lys Trp Tyr Ser Ile Leu Val Ser Tyr 755 760 765 Met Ile Asp Val Ala Met Asn Asn Ala Trp Gln Leu His Arg Ala 770 775 780 Cys Asn Pro Gly Ala Ser Leu Asp Pro Leu Asp Phe Arg Arg Phe 785 790 795 Val Ala His Phe Tyr Leu Glu His Asn Ala His Leu Ser Asp 800 805 809 出願人氏名:大正製薬株式会社 発明の名称:新規遺伝子とそれにコードされる蛋白質 整理番号:00HI−P2615 配列の数:1 配列番号(SEQ ID NO):2 配列の長さ:2427塩基 配列の型 :二本鎖 トポロジ−:直鎖状 配列の種類:核酸 配列 10 20 30 40 50 ATGTATGAAG CTTTGCCAGG CCCTGCTCCT GAAAATGAAG ATGGCCTTGT 50 GAAAGTGAAG GAGGAAGATC CCACCTGGGA GCAGGTGTGC AACTCACAGG 100 AGGGCAGCTC CCACACTCAG GAGATTTGCC GCCTGCGCTT TCGGCACTTC 150 TGCTACCAGG AGGCTCACGG ACCCCAGGAA GCTCTGGCCC AACTCCGAGA 200 ACTTTGTCAT CAATGGCTGA GACCGGAGAT GCACACCAAG GAACAGATAA 250 TGGAACTGCT GGTGCTGGAG CAGTTCCTGA CCATCCTGCC CAAGGAGCTC 300 CAGCCCTGTG TGAAGACATA TCCTCTGGAG AGTGGAGAGG AGGCAGTGAC 350 AGTGCTGGAG AATCTAGAGA CAGGAAGTGG AGACACAGGA CAACAGGCCT 400 CTGTCTATAT TCAGGGACAG GACATGCACC CAATGGTGGC AGAATATCAA 450 GGAGTCTCTT TGGAGTGTCA GAGCCTCCAG CTCCTGCCTG GGATAACCAC 500 CCTGAAGTGT GAACCTCCAC AGCGTCCTCA AGGGAACCCC CAAGAAGTGA 550 GTGGGCCTGT TCCCCACGGA TCAGCTCATC TCCAGGAAAA AAACCCCAGA 600 GACAAGGCTG TAGTGCCTGT GTTTAACCCA GTCAGGTCCC AGACATTGGT 650 GAAGACTGAG GAAGAAACAG CCCAGGCCGT TGCTGCAGAG AAGTGGTCAC 700 ATCTGAGTCT GACTCGGAGG AACCTCTGTG GGAACTCAGC TCAGGAGACA 750 GTTATGAGCC TCAGTCCGAT GACTGAAGAA ATTGTAACTA AAGATAGATT 800 GTTTAAAGCA AAGCAAGAAA CTTCTGAAGA AATGGAACAA AGTGGAGAAG 850 CCTCAGGAAA GCCCAACAGA GAGTGTGCAC CCCAGATTCC TTGTAGTACT 900 CCTATTGCTA CTGAAAGGAC AGTTGCACAT TTGAACACTC TGAAGGACCG 950 TCACCCAGGT GATTTGTGGG CCCGCATGCA CATTTCATCC CTGGAATATG 1000 CTGCAGGAGA CATTACCCGA AAAGGGAGAA AAAAAGACAA AGCTCGAGTG 1050 AGTGAACTGC TCCAAGGCCT CTCATTCTCT GGTGACTCAG ATGTGGAAAA 1100 AGATAATGAG CCTGAGATCC AGCCTGCTCA AAAGAAGTTA AAGGTATCAT 1150 GTTTCCCAGA AAAGAGTTGG ACCAAAAGAG ACATTAAACC CAATTTTCCA 1200 AGCTGGTCAG CACTGGATTC TGGACTTTTG AATCTCAAGA GCGAAAAGTT 1250 GAACCCAGTA GAGCTTTTTG AATTATTTTT TGATGATGAA ACATTCAACT 1300 TAATTGTCAA TGAAACCAAT AATTATGCTT CTCAGAAAAA TGTCAGCTTG 1350 GAAGTCACAG TTCAGGAAAT GAGGTGTGTG TTTGGTGTCT TACTTTTGAG 1400 TGGATTTATG AGGCATCCTA GAAGGGAAAT GTATTGGGAA GTCTCTGACA 1450 CCGATCAGAA CCTGGTTAGA GATGCAATCA GAAGGGACAG ATTTGAATTG 1500 ATTTTCTCAA ACCTGCACTT TGCAGATAAT GGCCACCTAG ATCAAAAAGA 1550 TAAGTTTACA AAGTTGAGAC CTCTCATAAA ACAAATGAAT AAAAATTTCC 1600 TCTTGTATGC TCCCCTGGAA GAATACTATT GCTTTGATAA GTCAATGTGT 1650 GAATGCTTTG ATAGTGACCA ATTCCTGAAT GGAAAGCCTA TTAGAATTGG 1700 CTATAAAATT TGGTGTGGTA CAACCACACA GGGTTATCTG GTTTGGTTTG 1750 AACCCTATCA AGAAGAATCA ACTATGAAGG TAGATGAGGA TCCTGATCTT 1800 GGGTTAGGTG GAAATCTAGT GATGAACTTC GCTGATGTTC TTTTAGAGAG 1850 AGGTCAGTAT CCCTATCACC TGTGTTTTGA TAGCTTCTTT ACAAGTGTCA 1900 AATTGTTGTC AGCCTTGAAA AAGAAGGGGG TGAGGGCAAC AGGAACAATT 1950 CGTGAGAACA GGACCGAAAA ATGTCCCCTT ATGAATGTAG AACATATGAA 2000 AAAAATGAAG AGAGGGTATT TTGATTTCCG AATAGAAGAA AACAATGAGA 2050 TAATTTTGTG TCGTTGGTAT GGGGATGGCA TTATCAGTCT GTGCTCCAAT 2100 GCTGTGGGCA TAGAACCAGT CAATGAGGTA AGCTGTTGTG ATGCTGATAA 2150 CGAAGAAATC CCTCAGATAA GTCAACCATC CATAGTAAAA GTGTATGATG 2200 AATGCAAGGA AGGTGTAGCT AAAATGGATC AAATTATTTC GAAATACAGG 2250 GTGAGGATAA GAAGCAAGAA ATGGTACTCA ATTTTGGTGA GCTACATGAT 2300 TGATGTAGCC ATGAACAATG CATGGCAACT ACACAGAGCC TGTAACCCAG 2350 GTGCTTCTCT AGACCCCTTG GATTTTCGGA GATTTGTTGC ACATTTCTAC 2400 TTGGAACACA ATGCTCATCT GTCAGAT 2427 出願人氏名:大正製薬株式会社 発明の名称:新規遺伝子とそれにコードされる蛋白質 整理番号:00HI−P2615 配列の数:1 配列番号(SEQ ID NO):3 配列の長さ:4089塩基 配列の型 :二本鎖 トポロジ−:直鎖状 配列の種類:核酸 配列 GCGCGGTGCT AGATGCTGGG TGTAATCTCA GAAAAATACA TTCAGGGGCG CGCCTGAGGG 60 TGCTGGCTGC TGGCATCTCA GGTGCTTTAC GTGCATTCGT GAAGAAGCCC ATCAGTATTT 120 CTTGAATACC AGACCCCAAG CTAAGTGAAG CTTTAGCCTC TAAGCTCAAC ATG TAT GAA 179 Met Tyr Glu 1 GCT TTG CCA GGC CCT GCT CCT GAA AAT GAA GAT GGC CTT GTG AAA 224 Ala Leu Pro Gly Pro Ala Pro Glu Asn Glu Asp Gly Leu Val Lys 5 10 15 GTG AAG GAG GAA GAT CCC ACC TGG GAG CAG GTG TGC AAC TCA CAG 269 Val Lys Glu Glu Asp Pro Thr Trp Glu Gln Val Cys Asn Ser Gln 20 25 30 GAG GGC AGC TCC CAC ACT CAG GAG ATT TGC CGC CTG CGC TTT CGG 314 Glu Gly Ser Ser His Thr Gln Glu Ile Cys Arg Leu Arg Phe Arg 35 40 45 CAC TTC TGC TAC CAG GAG GCT CAC GGA CCC CAG GAA GCT CTG GCC 359 His Phe Cys Tyr Gln Glu Ala His Gly Pro Gln Glu Ala Leu Ala 50 55 60 CAA CTC CGA GAA CTT TGT CAT CAA TGG CTG AGA CCG GAG ATG CAC 404 Gln Leu Arg Glu Leu Cys His Gln Trp Leu Arg Pro Glu Met His 65 70 75 ACC AAG GAA CAG ATA ATG GAA CTG CTG GTG CTG GAG CAG TTC CTG 449 Thr Lys Glu Gln Ile Met Glu Leu Leu Val Leu Glu Gln Phe Leu 80 85 90 ACC ATC CTG CCC AAG GAG CTC CAG CCC TGT GTG AAG ACA TAT CCT 494 Thr Ile Leu Pro Lys Glu Leu Gln Pro Cys Val Lys Thr Tyr Pro 95 100 105 CTG GAG AGT GGA GAG GAG GCA GTG ACA GTG CTG GAG AAT CTA GAG 539 Leu Glu Ser Gly Glu Glu Ala Val Thr Val Leu Glu Asn Leu Glu 110 115 120 ACA GGA AGT GGA GAC ACA GGA CAA CAG GCC TCT GTC TAT ATT CAG 584 Thr Gly Ser Gly Asp Thr Gly Gln Gln Ala Ser Val Tyr Ile Gln 125 130 135 GGA CAG GAC ATG CAC CCA ATG GTG GCA GAA TAT CAA GGA GTC TCT 629 Gly Gln Asp Met His Pro Met Val Ala Glu Tyr Gln Gly Val Ser 140 145 150 TTG GAG TGT CAG AGC CTC CAG CTC CTG CCT GGG ATA ACC ACC CTG 674 Leu Glu Cys Gln Ser Leu Gln Leu Leu Pro Gly Ile Thr Thr Leu 155 160 165 AAG TGT GAA CCT CCA CAG CGT CCT CAA GGG AAC CCC CAA GAA GTG 719 Lys Cys Glu Pro Pro Gln Arg Pro Gln Gly Asn Pro Gln Glu Val 170 175 180 AGT GGG CCT GTT CCC CAC GGA TCA GCT CAT CTC CAG GAA AAA AAC 764 Ser Gly Pro Val Pro His Gly Ser Ala His Leu Gln Glu Lys Asn 185 190 195 CCC AGA GAC AAG GCT GTA GTG CCT GTG TTT AAC CCA GTC AGG TCC 809 Pro Arg Asp Lys Ala Val Val Pro Val Phe Asn Pro Val Arg Ser 200 205 210 CAG ACA TTG GTG AAG ACT GAG GAA GAA ACA GCC CAG GCC GTT GCT 854 Gln Thr Leu Val Lys Thr Glu Glu Glu Thr Ala Gln Ala Val Ala 215 220 225 GCA GAG AAG TGG TCA CAT CTG AGT CTG ACT CGG AGG AAC CTC TGT 899 Ala Glu Lys Trp Ser His Leu Ser Leu Thr Arg Arg Asn Leu Cys 230 235 240 GGG AAC TCA GCT CAG GAG ACA GTT ATG AGC CTC AGT CCG ATG ACT 944 Gly Asn Ser Ala Gln Glu Thr Val Met Ser Leu Ser Pro Met Thr 245 250 255 GAA GAA ATT GTA ACT AAA GAT AGA TTG TTT AAA GCA AAG CAA GAA 989 Glu Glu Ile Val Thr Lys Asp Arg Leu Phe Lys Ala Lys Gln Glu 260 265 270 ACT TCT GAA GAA ATG GAA CAA AGT GGA GAA GCC TCA GGA AAG CCC 1034 Thr Ser Glu Glu Met Glu Gln Ser Gly Glu Ala Ser Gly Lys Pro 275 280 285 AAC AGA GAG TGT GCA CCC CAG ATT CCT TGT AGT ACT CCT ATT GCT 1079 Asn Arg Glu Cys Ala Pro Gln Ile Pro Cys Ser Thr Pro Ile Ala 290 295 300 ACT GAA AGG ACA GTT GCA CAT TTG AAC ACT CTG AAG GAC CGT CAC 1124 Thr Glu Arg Thr Val Ala His Leu Asn Thr Leu Lys Asp Arg His 305 310 315 CCA GGT GAT TTG TGG GCC CGC ATG CAC ATT TCA TCC CTG GAA TAT 1169 Pro Gly Asp Leu Trp Ala Arg Met His Ile Ser Ser Leu Glu Tyr 320 325 330 GCT GCA GGA GAC ATT ACC CGA AAA GGG AGA AAA AAA GAC AAA GCT 1214 Ala Ala Gly Asp Ile Thr Arg Lys Gly Arg Lys Lys Asp Lys Ala 335 340 345 CGA GTG AGT GAA CTG CTC CAA GGC CTC TCA TTC TCT GGT GAC TCA 1259 Arg Val Ser Glu Leu Leu Gln Gly Leu Ser Phe Ser Gly Asp Ser 350 355 360 GAT GTG GAA AAA GAT AAT GAG CCT GAG ATC CAG CCT GCT CAA AAG 1304 Asp Val Glu Lys Asp Asn Glu Pro Glu Ile Gln Pro Ala Gln Lys 365 370 375 AAG TTA AAG GTA TCA TGT TTC CCA GAA AAG AGT TGG ACC AAA AGA 1349 Lys Leu Lys Val Ser Cys Phe Pro Glu Lys Ser Trp Thr Lys Arg 380 385 390 GAC ATT AAA CCC AAT TTT CCA AGC TGG TCA GCA CTG GAT TCT GGA 1394 Asp Ile Lys Pro Asn Phe Pro Ser Trp Ser Ala Leu Asp Ser Gly 395 400 405 CTT TTG AAT CTC AAG AGC GAA AAG TTG AAC CCA GTA GAG CTT TTT 1439 Leu Leu Asn Leu Lys Ser Glu Lys Leu Asn Pro Val Glu Leu Phe 410 415 420 GAA TTA TTT TTT GAT GAT GAA ACA TTC AAC TTA ATT GTC AAT GAA 1484 Glu Leu Phe Phe Asp Asp Glu Thr Phe Asn Leu Ile Val Asn Glu 425 430 435 ACC AAT AAT TAT GCT TCT CAG AAA AAT GTC AGC TTG GAA GTC ACA 1529 Thr Asn Asn Tyr Ala Ser Gln Lys Asn Val Ser Leu Glu Val Thr 440 445 450 GTT CAG GAA ATG AGG TGT GTG TTT GGT GTC TTA CTT TTG AGT GGA 1574 Val Gln Glu Met Arg Cys Val Phe Gly Val Leu Leu Leu Ser Gly 455 460 465 TTT ATG AGG CAT CCT AGA AGG GAA ATG TAT TGG GAA GTC TCT GAC 1619 Phe Met Arg His Pro Arg Arg Glu Met Tyr Trp Glu Val Ser Asp 470 475 480 ACC GAT CAG AAC CTG GTT AGA GAT GCA ATC AGA AGG GAC AGA TTT 1664 Thr Asp Gln Asn Leu Val Arg Asp Ala Ile Arg Arg Asp Arg Phe 485 490 495 GAA TTG ATT TTC TCA AAC CTG CAC TTT GCA GAT AAT GGC CAC CTA 1709 Glu Leu Ile Phe Ser Asn Leu His Phe Ala Asp Asn Gly His Leu 500 505 510 GAT CAA AAA GAT AAG TTT ACA AAG TTG AGA CCT CTC ATA AAA CAA 1754 Asp Gln Lys Asp Lys Phe Thr Lys Leu Arg Pro Leu Ile Lys Gln 515 520 525 ATG AAT AAA AAT TTC CTC TTG TAT GCT CCC CTG GAA GAA TAC TAT 1799 Met Asn Lys Asn Phe Leu Leu Tyr Ala Pro Leu Glu Glu Tyr Tyr 530 535 540 TGC TTT GAT AAG TCA ATG TGT GAA TGC TTT GAT AGT GAC CAA TTC 1844 Cys Phe Asp Lys Ser Met Cys Glu Cys Phe Asp Ser Asp Gln Phe 545 550 555 CTG AAT GGA AAG CCT ATT AGA ATT GGC TAT AAA ATT TGG TGT GGT 1889 Leu Asn Gly Lys Pro Ile Arg Ile Gly Tyr Lys Ile Trp Cys Gly 560 565 570 ACA ACC ACA CAG GGT TAT CTG GTT TGG TTT GAA CCC TAT CAA GAA 1934 Thr Thr Thr Gln Gly Tyr Leu Val Trp Phe Glu Pro Tyr Gln Glu 575 580 585 GAA TCA ACT ATG AAG GTA GAT GAG GAT CCT GAT CTT GGG TTA GGT 1979 Glu Ser Thr Met Lys Val Asp Glu Asp Pro Asp Leu Gly Leu Gly 590 595 600 GGA AAT CTA GTG ATG AAC TTC GCT GAT GTT CTT TTA GAG AGA GGT 2024 Gly Asn Leu Val Met Asn Phe Ala Asp Val Leu Leu Glu Arg Gly 605 610 615 CAG TAT CCC TAT CAC CTG TGT TTT GAT AGC TTC TTT ACA AGT GTC 2069 Gln Tyr Pro Tyr His Leu Cys Phe Asp Ser Phe Phe Thr Ser Val 620 625 630 AAA TTG TTG TCA GCC TTG AAA AAG AAG GGG GTG AGG GCA ACA GGA 2114 Lys Leu Leu Ser Ala Leu Lys Lys Lys Gly Val Arg Ala Thr Gly 635 640 645 ACA ATT CGT GAG AAC AGG ACC GAA AAA TGT CCC CTT ATG AAT GTA 2159 Thr Ile Arg Glu Asn Arg Thr Glu Lys Cys Pro Leu Met Asn Val 650 655 660 GAA CAT ATG AAA AAA ATG AAG AGA GGG TAT TTT GAT TTC CGA ATA 2204 Glu His Met Lys Lys Met Lys Arg Gly Tyr Phe Asp Phe Arg Ile 665 670 675 GAA GAA AAC AAT GAG ATA ATT TTG TGT CGT TGG TAT GGG GAT GGC 2249 Glu Glu Asn Asn Glu Ile Ile Leu Cys Arg Trp Tyr Gly Asp Gly 680 685 690 ATT ATC AGT CTG TGC TCC AAT GCT GTG GGC ATA GAA CCA GTC AAT 2294 Ile Ile Ser Leu Cys Ser Asn Ala Val Gly Ile Glu Pro Val Asn 695 700 705 GAG GTA AGC TGT TGT GAT GCT GAT AAC GAA GAA ATC CCT CAG ATA 2339 Glu Val Ser Cys Cys Asp Ala Asp Asn Glu Glu Ile Pro Gln Ile 710 715 720 AGT CAA CCA TCC ATA GTA AAA GTG TAT GAT GAA TGC AAG GAA GGT 2384 Ser Gln Pro Ser Ile Val Lys Val Tyr Asp Glu Cys Lys Glu Gly 725 730 735 GTA GCT AAA ATG GAT CAA ATT ATT TCG AAA TAC AGG GTG AGG ATA 2429 Val Ala Lys Met Asp Gln Ile Ile Ser Lys Tyr Arg Val Arg Ile 740 745 750 AGA AGC AAG AAA TGG TAC TCA ATT TTG GTG AGC TAC ATG ATT GAT 2474 Arg Ser Lys Lys Trp Tyr Ser Ile Leu Val Ser Tyr Met Ile Asp 755 760 765 GTA GCC ATG AAC AAT GCA TGG CAA CTA CAC AGA GCC TGT AAC CCA 2519 Val Ala Met Asn Asn Ala Trp Gln Leu His Arg Ala Cys Asn Pro 770 775 780 GGT GCT TCT CTA GAC CCC TTG GAT TTT CGG AGA TTT GTT GCA CAT 2565 Gly Ala Ser Leu Asp Pro Leu Asp Phe Arg Arg Phe Val Ala His 785 790 795 TTC TAC TTG GAA CAC AAT GCT CAT CTG TCA GAT TAG GGTACATAAA 2610 Phe Tyr Leu Glu His Asn Ala His Leu Ser Asp 800 805 809 ATGGACATAG TGCAGACATT AATAAGACAT AGAAAAATAA TAATTATACA TGCTGTTGTA 2670 CCCTCCCAAA GTAAATCTGA TATATGTAAT GAAGTTATTA AATAATACTT TTAAAAATCA 2730 GACATTTATA TAGAGTTTCA AAGACTATTG TAACAAGTAA TGTTAAAAAT TGTCTGTGAG 2790 AATGTTGAAC TGTAGTACCT TTTTCTATGT CAAGTTTTGT GTCAGACATG GGAAATCATG 2850 TATTTGTTCA ATTGACTACT TTGTGCACTT ATTTATTTAT TTTTTGAGAC ACAGTCTCGC 2910 TCTGCGGCCA AGCTGGAGTG CAGTGGCACG ATCTTGGCTC ACTGCAACCT CTGACACCCT 2970 AGTTCAAGCG ATTCTCCTGC CTCAGCCTCC CAAGTAGCTG GGATTACAGG CACGTGCTGC 3030 CATGCCTAGC TAATTTTTGT ATTTTTAGTA GAGACAGGGT TTCACCATGT TGGCCAGGAT 3090 GGTCTCGATC TGACCTCGTG ATCTGCCTGC CTTGGCCTCC CAAAGTGCTG GGATTACAGG 3150 CGTGAGCCAC CATGCCCAGC TATTTTGTGC ATTTAAAGAA GGAAATCCTA CCTCTTAAAA 3210 AAAATTATCT GGAGAATGCC ATTTTTAAGA TGCAAGCAAT GTTACAGAAA CCATAGAATG 3270 GTGCTGACTC AATAGTTCAA ACTAGTGACA CAGCCTATGA AGTAAGAATG ATCTAAACAA 3330 AACATAGGTG GTAAGAGACT AAAAACCTTA GCATTGGTGT AAAACTGGAT CGGATTGTGT 3390 GTAAGTGAGA AGGGTCAGGC ATGGATATTG AAGGAGAGTG CTATAAAGGA AAAACCAGAG 3450 GTGAAGCAGT GCCTTTGAAT ATTGAAATGA TAGGTGTATC CTATGGTGAC TGTGTGAGTT 3510 GGCAGCAGAA GTCAGAAGAG TAAAGAAAAC CAAGGAAACA GGCAAATCAG GGTAACAAGT 3570 AACCAGGAGA GTGAAGGAAA AGATAGGCAT AAAGTCAACA TAAAGGCCAA GTTGAAATCA 3630 CCTGAGGAGA TGTCTAGGCT TAAGGCCATC AGTGATAGGT AACTGAAGGA GAAACACTTG 3690
GAAAAGTGAA TGATACGGAC TGTGACTCCT TAGTGTTGAA GTCTAGCATT GGTGGATTAG 3750 TCTGGAGGGT AGAGAAGACA GGCTCCACCT CATTTCTGTG AGTTGTAGCC ACAACAGCTC 3810 TTTGCCTTTC TTTCATATCC TAATATTTAC AGTCCCTTTC CTGGCTGGAA GGCAGGTGGT 3870 CAGGTTTGAA TTCTTTCAAC AGGTATGTTT CTTATGTGGA TGACTGGTGA AAGTGTAAGC 3930 TGCGTGTAAT GTAGTCACAG ATTCACCTAT TCCATGCAAG ATGTTCAAAG AAAATATAAG 3990 TTCATTATTT CCTGTAATTG ATCTGATATT CTTTGTGAAA TACATCACCA GCGTGGGTTG 4050 GTTTCACTTT TAAATGAAAA AAAAAAAAAA AAAATCTAG 4089
GAAAAGTGAA TGATACGGAC TGTGACTCCT TAGTGTTGAA GTCTAGCATT GGTGGATTAG 3750 TCTGGAGGGT AGAGAAGACA GGCTCCACCT CATTTCTGTG AGTTGTAGCC ACAACAGCTC 3810 TTTGCCTTTC TTTCATATCC TAATATTTAC AGTCCCTTTC CTGGCTGGAA GGCAGGTGGT 3870 CAGGTTTGAA TTCTTTCAAC AGGTATGTTT CTTATGTGGA TGACTGGTGA AAGTGTAAGC 3930 TGCGTGTAAT GTAGTCACAG ATTCACCTAT TCCATGCAAG ATGTTCAAAG AAAATATAAG 3990 TTCATTATTT CCTGTAATTG ATCTGATATT CTTTGTGAAA TACATCACCA GCGTGGGTTG 4050 GTTTCACTTT TAAATGAAAA AAAAAAAAAA AAAATCTAG 4089
【図1】図1の配列−1は、大脳皮質のcDNAライブ
ラリーより得られる組み換え体中で高い発現頻度を示す
DNA断片を表わし、配列−2は、配列−1を含むDN
A断片のクローニングに用いたオリゴヌクレオチドを示
す。
ラリーより得られる組み換え体中で高い発現頻度を示す
DNA断片を表わし、配列−2は、配列−1を含むDN
A断片のクローニングに用いたオリゴヌクレオチドを示
す。
【図2】図2は、組み換えベクターpDRhucep4
の構造を示す。
の構造を示す。
【図3】図3は、遺伝子hucep−4の塩基配列決定
の方法を示す。
の方法を示す。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI C12R 1:91) (C12P 21/02 C12R 1:91) (72)発明者 高山 喜好 東京都豊島区高田3丁目24番1号 大正製 薬株式会社内
Claims (2)
- 【請求項1】 以下の(a)または(b)の蛋白質; (a)配列番号:1に記載のアミノ酸配列からなる蛋白
質; (b)配列番号:1のアミノ酸配列において1もしくは
数個のアミノ酸が欠失、置換もしくは付加されたアミノ
酸配列からなり、かつ遺伝子の転写調節機能を有する蛋
白質。 - 【請求項2】 以下の(a)または(b)のDNA (a)配列番号:2に記載の塩基配列からなるDNA (b)配列番号:2のDNAとストリンジェントな条件
でハイブリダイズし、 かつ遺伝子の転写調節機能を有する蛋白質をコードする
DNA。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10021987A JPH11221075A (ja) | 1998-02-03 | 1998-02-03 | 新規遺伝子とそれにコードされる蛋白質 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10021987A JPH11221075A (ja) | 1998-02-03 | 1998-02-03 | 新規遺伝子とそれにコードされる蛋白質 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11221075A true JPH11221075A (ja) | 1999-08-17 |
Family
ID=12070388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10021987A Pending JPH11221075A (ja) | 1998-02-03 | 1998-02-03 | 新規遺伝子とそれにコードされる蛋白質 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11221075A (ja) |
-
1998
- 1998-02-03 JP JP10021987A patent/JPH11221075A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1143372A (zh) | 血细胞生成成熟因子 | |
Hwang et al. | Isolation of a cDNA encoding a UV-damaged DNA binding factor defective in xeroderma pigmentosum group E cells | |
CA2169355C (en) | Tumor suppressor protein prb2, related gene products, and dna encoding therefor | |
JP2002540782A (ja) | ヒト間葉DNAsと発現産物 | |
US6337388B1 (en) | Aspergillus fumigatus auxotrophs, auxotrophic markers and polynucleotides encoding same | |
JPH11221075A (ja) | 新規遺伝子とそれにコードされる蛋白質 | |
US20030099660A1 (en) | Genes displaying enhanced expression during cellular senescence and terminal cell differentiation and uses thereof | |
AU685179B2 (en) | (Plasmodium falciparum) ribonucleotide reductase, encoding DNA, and inhibitors | |
CA2315943A1 (en) | Multiple drug resistance gene atrc of aspergillus nidulans | |
CA2147110A1 (en) | Multiple drug resistance gene of aureobasidium pullulans | |
JPH1132769A (ja) | 新規遺伝子とそれにコードされる蛋白質 | |
JPH1014582A (ja) | リボヌクレオチドリダクターゼ | |
JP3243531B2 (ja) | 機能性タンパク質のスクリーニング方法 | |
JP2984143B2 (ja) | 新規なウリカーゼ遺伝子、新規な組み換え体dna及びウリカーゼの製造法 | |
JPH06181778A (ja) | ヒトカルシニューリンAαアイソフォーム蛋白質をコードするDNAおよびその用途 | |
CN116003542A (zh) | 生产柠檬酸的微生物及其构建方法和应用 | |
WO2002026991A2 (en) | Gene 4 | |
WO2000005365A1 (en) | Human lcb kinase 1 | |
JPH10257891A (ja) | 神経細胞機能賦活化活性を有する新規蛋白質hucep−1 | |
CA2157531A1 (en) | Htfiiia gene | |
CA2211682A1 (en) | Multiple drug resistance gene of aspergillus fumigatus | |
JPH0656895A (ja) | 新規なポリペプチド、その製造方法、そのポリペプチドをコードするdna、そのdnaからなるベクター、およびそのベクターで形質転換された宿主細胞 | |
CA2256455A1 (en) | Identification of genes altered in multiple myeloma | |
US20020155560A1 (en) | Reductase | |
JP2001352991A (ja) | βアミロイド蛋白質により発現誘導される新規遺伝子 |