KR101776863B1 - PAS1 변이 단백질을 포함하는 TodS 변이 단백질 및 이의 용도 - Google Patents
PAS1 변이 단백질을 포함하는 TodS 변이 단백질 및 이의 용도 Download PDFInfo
- Publication number
- KR101776863B1 KR101776863B1 KR1020150155951A KR20150155951A KR101776863B1 KR 101776863 B1 KR101776863 B1 KR 101776863B1 KR 1020150155951 A KR1020150155951 A KR 1020150155951A KR 20150155951 A KR20150155951 A KR 20150155951A KR 101776863 B1 KR101776863 B1 KR 101776863B1
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- pas1
- leu
- ala
- tods
- Prior art date
Links
- 101100060179 Drosophila melanogaster Clk gene Proteins 0.000 title claims abstract description 333
- 101150038023 PEX1 gene Proteins 0.000 title claims abstract description 333
- 101150014555 pas-1 gene Proteins 0.000 title claims abstract description 333
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 claims abstract description 540
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 308
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 294
- 108010021466 Mutant Proteins Proteins 0.000 claims abstract description 118
- 102000008300 Mutant Proteins Human genes 0.000 claims abstract description 118
- GWHJZXXIDMPWGX-UHFFFAOYSA-N pseudo-cymene Natural products CC1=CC=C(C)C(C)=C1 GWHJZXXIDMPWGX-UHFFFAOYSA-N 0.000 claims abstract description 113
- 150000004945 aromatic hydrocarbons Chemical class 0.000 claims abstract description 92
- 244000005700 microbiome Species 0.000 claims abstract description 51
- 230000000813 microbial effect Effects 0.000 claims abstract description 11
- 230000000593 degrading effect Effects 0.000 claims abstract description 5
- 235000018102 proteins Nutrition 0.000 claims description 288
- 235000004279 alanine Nutrition 0.000 claims description 106
- 230000027455 binding Effects 0.000 claims description 100
- 239000003446 ligand Substances 0.000 claims description 88
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 85
- 238000000034 method Methods 0.000 claims description 80
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 61
- 235000005772 leucine Nutrition 0.000 claims description 61
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 58
- 239000004474 valine Substances 0.000 claims description 58
- 235000014393 valine Nutrition 0.000 claims description 58
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 56
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 53
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 53
- 235000008729 phenylalanine Nutrition 0.000 claims description 53
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 49
- 235000004400 serine Nutrition 0.000 claims description 49
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 45
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 44
- 230000014509 gene expression Effects 0.000 claims description 43
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 claims description 41
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 39
- 229940024606 amino acid Drugs 0.000 claims description 36
- 235000001014 amino acid Nutrition 0.000 claims description 36
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 36
- 235000002374 tyrosine Nutrition 0.000 claims description 36
- 235000013922 glutamic acid Nutrition 0.000 claims description 35
- 239000004220 glutamic acid Substances 0.000 claims description 35
- 239000000126 substance Substances 0.000 claims description 35
- 150000001413 amino acids Chemical class 0.000 claims description 33
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 31
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 26
- 241000589776 Pseudomonas putida Species 0.000 claims description 25
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 24
- 235000003704 aspartic acid Nutrition 0.000 claims description 24
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 24
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 23
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 23
- 235000014304 histidine Nutrition 0.000 claims description 23
- 230000035772 mutation Effects 0.000 claims description 23
- 102000040430 polynucleotide Human genes 0.000 claims description 23
- 108091033319 polynucleotide Proteins 0.000 claims description 23
- 239000002157 polynucleotide Substances 0.000 claims description 23
- 239000004475 Arginine Substances 0.000 claims description 22
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 claims description 22
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 22
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 22
- 235000009697 arginine Nutrition 0.000 claims description 22
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 claims description 21
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 21
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims description 20
- 229930182817 methionine Natural products 0.000 claims description 19
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 18
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 18
- 229960000310 isoleucine Drugs 0.000 claims description 18
- IVSZLXZYQVIEFR-UHFFFAOYSA-N m-xylene Chemical group CC1=CC=CC(C)=C1 IVSZLXZYQVIEFR-UHFFFAOYSA-N 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 17
- 241000589516 Pseudomonas Species 0.000 claims description 15
- 239000003550 marker Substances 0.000 claims description 15
- 238000012216 screening Methods 0.000 claims description 14
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 14
- 108091023040 Transcription factor Proteins 0.000 claims description 13
- 102000040945 Transcription factor Human genes 0.000 claims description 13
- 239000013604 expression vector Substances 0.000 claims description 13
- 239000000203 mixture Substances 0.000 claims description 13
- 108091000080 Phosphotransferase Proteins 0.000 claims description 12
- 125000003118 aryl group Chemical group 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 12
- 102000020233 phosphotransferase Human genes 0.000 claims description 12
- 230000001105 regulatory effect Effects 0.000 claims description 11
- YCIMNLLNPGFGHC-UHFFFAOYSA-N catechol Chemical compound OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 claims description 10
- MVPPADPHJFYWMZ-UHFFFAOYSA-N chlorobenzene Chemical compound ClC1=CC=CC=C1 MVPPADPHJFYWMZ-UHFFFAOYSA-N 0.000 claims description 10
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 10
- 230000035578 autophosphorylation Effects 0.000 claims description 9
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 claims description 9
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 claims description 7
- 230000002103 transcriptional effect Effects 0.000 claims description 7
- FYGHSUNMUKGBRK-UHFFFAOYSA-N 1,2,3-trimethylbenzene Chemical compound CC1=CC=CC(C)=C1C FYGHSUNMUKGBRK-UHFFFAOYSA-N 0.000 claims description 6
- AUHZEENZYGFFBQ-UHFFFAOYSA-N 1,3,5-trimethylbenzene Chemical compound CC1=CC(C)=CC(C)=C1 AUHZEENZYGFFBQ-UHFFFAOYSA-N 0.000 claims description 6
- KJCVRFUGPWSIIH-UHFFFAOYSA-N 1-naphthol Chemical compound C1=CC=C2C(O)=CC=CC2=C1 KJCVRFUGPWSIIH-UHFFFAOYSA-N 0.000 claims description 6
- YNQLUTRBYVCPMQ-UHFFFAOYSA-N Ethylbenzene Chemical compound CCC1=CC=CC=C1 YNQLUTRBYVCPMQ-UHFFFAOYSA-N 0.000 claims description 6
- OCKPCBLVNKHBMX-UHFFFAOYSA-N butylbenzene Chemical compound CCCCC1=CC=CC=C1 OCKPCBLVNKHBMX-UHFFFAOYSA-N 0.000 claims description 6
- LQNUZADURLCDLV-UHFFFAOYSA-N nitrobenzene Chemical compound [O-][N+](=O)C1=CC=CC=C1 LQNUZADURLCDLV-UHFFFAOYSA-N 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 6
- ODLMAHJVESYWTB-UHFFFAOYSA-N propylbenzene Chemical compound CCCC1=CC=CC=C1 ODLMAHJVESYWTB-UHFFFAOYSA-N 0.000 claims description 6
- SPSVMMKHVNWAFN-UHFFFAOYSA-N 1,3-xylene Chemical compound CC1=CC=CC(C)=C1.CC1=CC=CC(C)=C1 SPSVMMKHVNWAFN-UHFFFAOYSA-N 0.000 claims description 4
- WYLIRYQDDKDHLT-UHFFFAOYSA-N CC1=CC=CC=C1C.CC1=CC=CC=C1C Chemical compound CC1=CC=CC=C1C.CC1=CC=CC=C1C WYLIRYQDDKDHLT-UHFFFAOYSA-N 0.000 claims description 4
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 claims description 4
- AUUMBODMGBOYTI-UHFFFAOYSA-N 1-chloro-2-methylbenzene Chemical compound ClC1=C(C=CC=C1)C.ClC1=C(C=CC=C1)C AUUMBODMGBOYTI-UHFFFAOYSA-N 0.000 claims description 3
- YTIPZPHEHDFDQG-UHFFFAOYSA-N 1-chloro-3-methylbenzene Chemical compound ClC=1C=C(C=CC1)C.ClC=1C=C(C=CC1)C YTIPZPHEHDFDQG-UHFFFAOYSA-N 0.000 claims description 3
- QLFOXKLAFVNJFZ-UHFFFAOYSA-N 1-chloro-4-methylbenzene Chemical compound CC1=CC=C(Cl)C=C1.CC1=CC=C(Cl)C=C1 QLFOXKLAFVNJFZ-UHFFFAOYSA-N 0.000 claims description 3
- WHNQFLAEAOWDTD-UHFFFAOYSA-N 2-methylaniline Chemical compound CC1=CC=CC=C1N.CC1=CC=CC=C1N WHNQFLAEAOWDTD-UHFFFAOYSA-N 0.000 claims description 3
- KNNWNSVVTDKXHS-UHFFFAOYSA-N 4-methylaniline Chemical compound CC1=CC=C(N)C=C1.CC1=CC=C(N)C=C1 KNNWNSVVTDKXHS-UHFFFAOYSA-N 0.000 claims description 3
- JRNGUTKWMSBIBF-UHFFFAOYSA-N naphthalene-2,3-diol Chemical compound C1=CC=C2C=C(O)C(O)=CC2=C1 JRNGUTKWMSBIBF-UHFFFAOYSA-N 0.000 claims description 3
- FIMVMYXUGWSJKE-UHFFFAOYSA-N 1,4-xylene Chemical compound CC1=CC=C(C)C=C1.CC1=CC=C(C)C=C1 FIMVMYXUGWSJKE-UHFFFAOYSA-N 0.000 claims description 2
- DGQQLJUOIVFNLX-UHFFFAOYSA-N 3-methylaniline Chemical compound CC1=CC=CC(N)=C1.CC1=CC=CC(N)=C1 DGQQLJUOIVFNLX-UHFFFAOYSA-N 0.000 claims description 2
- 238000009472 formulation Methods 0.000 claims 2
- SBRYFUVVWOMLLP-UHFFFAOYSA-N 2-azaniumyl-4-methoxy-4-oxobutanoate Chemical group COC(=O)CC(N)C(O)=O SBRYFUVVWOMLLP-UHFFFAOYSA-N 0.000 claims 1
- PYLWMHQQBFSUBP-UHFFFAOYSA-N monofluorobenzene Chemical compound FC1=CC=CC=C1 PYLWMHQQBFSUBP-UHFFFAOYSA-N 0.000 claims 1
- 239000013078 crystal Substances 0.000 abstract description 67
- 239000003795 chemical substances by application Substances 0.000 abstract description 9
- 238000004519 manufacturing process Methods 0.000 abstract description 5
- 108020004414 DNA Proteins 0.000 description 126
- 125000003275 alpha amino acid group Chemical group 0.000 description 58
- 239000000539 dimer Substances 0.000 description 31
- 108010005774 beta-Galactosidase Proteins 0.000 description 27
- 238000001727 in vivo Methods 0.000 description 27
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 26
- 238000004458 analytical method Methods 0.000 description 26
- 102000005936 beta-Galactosidase Human genes 0.000 description 26
- 101100016388 Arabidopsis thaliana PAS2 gene Proteins 0.000 description 25
- 101100297150 Komagataella pastoris PEX3 gene Proteins 0.000 description 25
- 101100315760 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PEX4 gene Proteins 0.000 description 25
- 210000004027 cell Anatomy 0.000 description 25
- 238000006467 substitution reaction Methods 0.000 description 23
- 239000000243 solution Substances 0.000 description 22
- 229960004799 tryptophan Drugs 0.000 description 22
- 230000011664 signaling Effects 0.000 description 20
- RJFAYQIBOAGBLC-BYPYZUCNSA-N Selenium-L-methionine Chemical group C[Se]CC[C@H](N)C(O)=O RJFAYQIBOAGBLC-BYPYZUCNSA-N 0.000 description 19
- RJFAYQIBOAGBLC-UHFFFAOYSA-N Selenomethionine Natural products C[Se]CCC(N)C(O)=O RJFAYQIBOAGBLC-UHFFFAOYSA-N 0.000 description 19
- 230000000694 effects Effects 0.000 description 19
- 229960002718 selenomethionine Drugs 0.000 description 19
- 238000002425 crystallisation Methods 0.000 description 17
- 230000035945 sensitivity Effects 0.000 description 17
- 125000000539 amino acid group Chemical group 0.000 description 16
- 239000005557 antagonist Substances 0.000 description 16
- 239000002245 particle Substances 0.000 description 16
- 210000004899 c-terminal region Anatomy 0.000 description 15
- 238000006471 dimerization reaction Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- CTQNGGLPUBDAKN-UHFFFAOYSA-N O-Xylene Chemical group CC1=CC=CC=C1C CTQNGGLPUBDAKN-UHFFFAOYSA-N 0.000 description 14
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical group OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 14
- 230000008025 crystallization Effects 0.000 description 14
- 230000002209 hydrophobic effect Effects 0.000 description 14
- 239000004471 Glycine Substances 0.000 description 13
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 13
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 13
- 239000000872 buffer Substances 0.000 description 13
- 238000000354 decomposition reaction Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 13
- 108010050848 glycylleucine Proteins 0.000 description 13
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- 108050009469 PAS domains Proteins 0.000 description 12
- 102000002131 PAS domains Human genes 0.000 description 12
- 230000001419 dependent effect Effects 0.000 description 12
- 238000009792 diffusion process Methods 0.000 description 12
- 238000000746 purification Methods 0.000 description 12
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical group C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 11
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Chemical group CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 11
- 239000004473 Threonine Chemical group 0.000 description 11
- 230000008859 change Effects 0.000 description 11
- 235000008521 threonine Nutrition 0.000 description 11
- 241000588724 Escherichia coli Species 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 102200006525 rs121913240 Human genes 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 10
- 238000001542 size-exclusion chromatography Methods 0.000 description 10
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 10
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- 101100007970 Mus musculus Ctdspl gene Proteins 0.000 description 9
- 241001041887 Pseudomonas putida F1 Species 0.000 description 9
- 108010047857 aspartylglycine Proteins 0.000 description 9
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 9
- 108010049041 glutamylalanine Proteins 0.000 description 9
- 229910052739 hydrogen Inorganic materials 0.000 description 9
- 239000001257 hydrogen Substances 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 8
- 239000000556 agonist Substances 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 238000003556 assay Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 108010057821 leucylproline Proteins 0.000 description 8
- 239000000178 monomer Substances 0.000 description 8
- 239000002773 nucleotide Substances 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- 238000006366 phosphorylation reaction Methods 0.000 description 8
- 239000012460 protein solution Substances 0.000 description 8
- -1 85-tryptophan Chemical compound 0.000 description 7
- 108010072039 Histidine kinase Proteins 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 7
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 7
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 7
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 108010005942 methionylglycine Proteins 0.000 description 7
- 230000026731 phosphorylation Effects 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 6
- BJNUAWGXPSHQMJ-DCAQKATOSA-N Arg-Gln-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O BJNUAWGXPSHQMJ-DCAQKATOSA-N 0.000 description 6
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 6
- SWLOHUMCUDRTCL-ZLUOBGJFSA-N Asn-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N SWLOHUMCUDRTCL-ZLUOBGJFSA-N 0.000 description 6
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 6
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 6
- 101710088194 Dehydrogenase Proteins 0.000 description 6
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 6
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 6
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 6
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 6
- 238000001042 affinity chromatography Methods 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 108010077245 asparaginyl-proline Proteins 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- 239000003344 environmental pollutant Substances 0.000 description 6
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 6
- 230000004660 morphological change Effects 0.000 description 6
- 239000012071 phase Substances 0.000 description 6
- 230000008054 signal transmission Effects 0.000 description 6
- 239000002689 soil Substances 0.000 description 6
- 108010073969 valyllysine Proteins 0.000 description 6
- NNMUHYLAYUSTTN-FXQIFTODSA-N Asn-Gln-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O NNMUHYLAYUSTTN-FXQIFTODSA-N 0.000 description 5
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 5
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 5
- 241000589151 Azotobacter Species 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 5
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 5
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 5
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 5
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 5
- 102000035195 Peptidases Human genes 0.000 description 5
- 108091005804 Peptidases Proteins 0.000 description 5
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 5
- JOQSQZFKFYJKKJ-GUBZILKMSA-N Val-Arg-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N JOQSQZFKFYJKKJ-GUBZILKMSA-N 0.000 description 5
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 5
- 108010060035 arginylproline Proteins 0.000 description 5
- 125000004429 atom Chemical group 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 5
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 231100000719 pollutant Toxicity 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000019491 signal transduction Effects 0.000 description 5
- 229960005322 streptomycin Drugs 0.000 description 5
- 238000012916 structural analysis Methods 0.000 description 5
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 4
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 4
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 4
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 4
- XKHLBBQNPSOGPI-GUBZILKMSA-N Ala-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N XKHLBBQNPSOGPI-GUBZILKMSA-N 0.000 description 4
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 4
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 4
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 4
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 4
- 108010043325 Aryl-alcohol dehydrogenase Proteins 0.000 description 4
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 4
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 4
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 4
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 4
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 4
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 4
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 4
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 4
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 4
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 4
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 4
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 4
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 4
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 4
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 4
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 4
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 4
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 4
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 4
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 4
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 4
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 4
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 4
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 4
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 4
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 4
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 4
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 4
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 4
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 4
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 4
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 4
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 4
- TYMBHHITTMGGPI-NAKRPEOUSA-N Pro-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 TYMBHHITTMGGPI-NAKRPEOUSA-N 0.000 description 4
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 4
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 4
- 241000320117 Pseudomonas putida KT2440 Species 0.000 description 4
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 4
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 4
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 4
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 4
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 4
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 4
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 4
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 4
- WVAKXMOGMWLWHK-VJBMBRPKSA-N Trp-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N WVAKXMOGMWLWHK-VJBMBRPKSA-N 0.000 description 4
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 4
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 229910000388 diammonium phosphate Inorganic materials 0.000 description 4
- 235000019838 diammonium phosphate Nutrition 0.000 description 4
- 108010054812 diprotin A Proteins 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 4
- 238000001493 electron microscopy Methods 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 239000007789 gas Substances 0.000 description 4
- 229930195712 glutamate Natural products 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 239000003208 petroleum Substances 0.000 description 4
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 4
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 108010090894 prolylleucine Proteins 0.000 description 4
- 229910052711 selenium Inorganic materials 0.000 description 4
- 239000011669 selenium Substances 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 150000004684 trihydrates Chemical class 0.000 description 4
- 108010034569 2-hydroxy-6-oxo-2,4-heptadienoate hydrolase Proteins 0.000 description 3
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- SKHCUBQVZJHOFM-NAKRPEOUSA-N Ala-Arg-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SKHCUBQVZJHOFM-NAKRPEOUSA-N 0.000 description 3
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 3
- 108010040956 Ala-Asp-Glu-Leu Proteins 0.000 description 3
- IYCZBJXFSZSHPN-DLOVCJGASA-N Ala-Cys-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IYCZBJXFSZSHPN-DLOVCJGASA-N 0.000 description 3
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 3
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 3
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 3
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 3
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 3
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 3
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 3
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 3
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 3
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 3
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 3
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 3
- GFEDXKNBZMPEDM-KZVJFYERSA-N Ala-Met-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFEDXKNBZMPEDM-KZVJFYERSA-N 0.000 description 3
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 3
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 3
- ISCYZXFOCXWUJU-KZVJFYERSA-N Ala-Thr-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O ISCYZXFOCXWUJU-KZVJFYERSA-N 0.000 description 3
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 3
- 239000004254 Ammonium phosphate Substances 0.000 description 3
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 3
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 3
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 3
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 3
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 3
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 3
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 3
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 3
- YNSUUAOAFCVINY-OSUNSFLBSA-N Arg-Thr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YNSUUAOAFCVINY-OSUNSFLBSA-N 0.000 description 3
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 3
- JWCCFNZJIRZUCL-AVGNSLFASA-N Arg-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JWCCFNZJIRZUCL-AVGNSLFASA-N 0.000 description 3
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 3
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 3
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 3
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 3
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 3
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 3
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 3
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 3
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 3
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 3
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 3
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 3
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 3
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 3
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 3
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 3
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 3
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 3
- YTXCCDCOHIYQFC-GUBZILKMSA-N Asp-Met-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTXCCDCOHIYQFC-GUBZILKMSA-N 0.000 description 3
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 3
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 3
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 3
- IWLZBRTUIVXZJD-OLHMAJIHSA-N Asp-Thr-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O IWLZBRTUIVXZJD-OLHMAJIHSA-N 0.000 description 3
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 3
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 101150111062 C gene Proteins 0.000 description 3
- BDWIZLQVVWQMTB-XKBZYTNZSA-N Cys-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N)O BDWIZLQVVWQMTB-XKBZYTNZSA-N 0.000 description 3
- UVZFZTWNHOQWNK-NAKRPEOUSA-N Cys-Ile-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UVZFZTWNHOQWNK-NAKRPEOUSA-N 0.000 description 3
- SRIRHERUAMYIOQ-CIUDSAMLSA-N Cys-Leu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SRIRHERUAMYIOQ-CIUDSAMLSA-N 0.000 description 3
- 108010028143 Dioxygenases Proteins 0.000 description 3
- 102000016680 Dioxygenases Human genes 0.000 description 3
- REJJNXODKSHOKA-ACZMJKKPSA-N Gln-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N REJJNXODKSHOKA-ACZMJKKPSA-N 0.000 description 3
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 3
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 3
- DLOHWQXXGMEZDW-CIUDSAMLSA-N Gln-Arg-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DLOHWQXXGMEZDW-CIUDSAMLSA-N 0.000 description 3
- NSNUZSPSADIMJQ-WDSKDSINSA-N Gln-Gly-Asp Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NSNUZSPSADIMJQ-WDSKDSINSA-N 0.000 description 3
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 3
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 3
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 3
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 3
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 3
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 3
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 3
- OWVURWCRZZMAOZ-XHNCKOQMSA-N Glu-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OWVURWCRZZMAOZ-XHNCKOQMSA-N 0.000 description 3
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 3
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 3
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 3
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 3
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 3
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 3
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 3
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 3
- PMSMKNYRZCKVMC-DRZSPHRISA-N Glu-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCC(=O)O)N PMSMKNYRZCKVMC-DRZSPHRISA-N 0.000 description 3
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 3
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 3
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 3
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 3
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 3
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 3
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 3
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 3
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 3
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 3
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 3
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 3
- IIVZNQCUUMBBKF-GVXVVHGQSA-N His-Gln-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 IIVZNQCUUMBBKF-GVXVVHGQSA-N 0.000 description 3
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 3
- 101710116831 Histidine kinase 1 Proteins 0.000 description 3
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 3
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 3
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 3
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 3
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 3
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 3
- BKPPWVSPSIUXHZ-OSUNSFLBSA-N Ile-Met-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N BKPPWVSPSIUXHZ-OSUNSFLBSA-N 0.000 description 3
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 3
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 3
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 3
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 3
- WKSHBPRUIRGWRZ-KCTSRDHCSA-N Ile-Trp-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N WKSHBPRUIRGWRZ-KCTSRDHCSA-N 0.000 description 3
- MGUTVMBNOMJLKC-VKOGCVSHSA-N Ile-Trp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C(C)C)C(=O)O)N MGUTVMBNOMJLKC-VKOGCVSHSA-N 0.000 description 3
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 3
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 3
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 3
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 3
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 3
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 3
- NHHKSOGJYNQENP-SRVKXCTJSA-N Leu-Cys-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N NHHKSOGJYNQENP-SRVKXCTJSA-N 0.000 description 3
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 3
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 3
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 3
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 3
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 3
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 3
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 3
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 3
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 3
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 3
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 3
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 3
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 3
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 3
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 3
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 3
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 3
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 3
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 3
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 3
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 3
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 3
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 3
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 3
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 3
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 3
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 3
- 108050001666 PAS fold Proteins 0.000 description 3
- 102000011356 PAS fold Human genes 0.000 description 3
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 3
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 3
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 3
- PPHFTNABKQRAJV-JYJNAYRXSA-N Phe-His-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PPHFTNABKQRAJV-JYJNAYRXSA-N 0.000 description 3
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 3
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 3
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 3
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 3
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 3
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 3
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 3
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 3
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 3
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 3
- CFVRJNZJQHDQPP-CYDGBPFRSA-N Pro-Ile-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 CFVRJNZJQHDQPP-CYDGBPFRSA-N 0.000 description 3
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 3
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 3
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 3
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 3
- 101100260942 Pseudomonas putida (strain ATCC 700007 / DSM 6899 / BCRC 17059 / F1) todF gene Proteins 0.000 description 3
- VQBLHWSPVYYZTB-DCAQKATOSA-N Ser-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N VQBLHWSPVYYZTB-DCAQKATOSA-N 0.000 description 3
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 3
- COAHUSQNSVFYBW-FXQIFTODSA-N Ser-Asn-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O COAHUSQNSVFYBW-FXQIFTODSA-N 0.000 description 3
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 3
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 3
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 3
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 3
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 3
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 3
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 3
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 3
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 3
- XGQKSRGHEZNWIS-IHRRRGAJSA-N Ser-Pro-Tyr Chemical compound N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O XGQKSRGHEZNWIS-IHRRRGAJSA-N 0.000 description 3
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 3
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 3
- 239000012505 Superdex™ Substances 0.000 description 3
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 3
- XUGYQLFEJYZOKQ-NGTWOADLSA-N Thr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XUGYQLFEJYZOKQ-NGTWOADLSA-N 0.000 description 3
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 3
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 3
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 3
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 3
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 3
- UPNRACRNHISCAF-SZMVWBNQSA-N Trp-Lys-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UPNRACRNHISCAF-SZMVWBNQSA-N 0.000 description 3
- WTXQBCCKXIKKHB-JYJNAYRXSA-N Tyr-Arg-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WTXQBCCKXIKKHB-JYJNAYRXSA-N 0.000 description 3
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 3
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 3
- GZWPQZDVTBZVEP-BZSNNMDCSA-N Tyr-Tyr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O GZWPQZDVTBZVEP-BZSNNMDCSA-N 0.000 description 3
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 3
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 3
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 3
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 3
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 3
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 3
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 3
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 3
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 3
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 3
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 3
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 3
- 235000019289 ammonium phosphates Nutrition 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 239000000356 contaminant Substances 0.000 description 3
- 238000002447 crystallographic data Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000003912 environmental pollution Methods 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- 229910001385 heavy metal Inorganic materials 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 125000001165 hydrophobic group Chemical group 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 3
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- 108010000761 leucylarginine Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 3
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 3
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 3
- 235000019419 proteases Nutrition 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 108010005652 splenotritin Proteins 0.000 description 3
- 125000003944 tolyl group Chemical group 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 108700004896 tripeptide FEG Proteins 0.000 description 3
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 3
- 108010009962 valyltyrosine Proteins 0.000 description 3
- 108030000292 1,2-dihydroxy-6-methylcyclohexa-3,5-dienecarboxylate dehydrogenases Proteins 0.000 description 2
- AXRMZRLNCOVFJZ-UHFFFAOYSA-N 1,6-dihydroxy-5-methylcyclohexa-2,4-dienecarboxylic acid Chemical compound CC1=CC=CC(O)(C(O)=O)C1O AXRMZRLNCOVFJZ-UHFFFAOYSA-N 0.000 description 2
- JJYPMNFTHPTTDI-UHFFFAOYSA-N 3-methylaniline Chemical compound CC1=CC=CC(N)=C1 JJYPMNFTHPTTDI-UHFFFAOYSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- PSGQCCSGKGJLRL-UHFFFAOYSA-N 4-methyl-2h-chromen-2-one Chemical group C1=CC=CC2=C1OC(=O)C=C2C PSGQCCSGKGJLRL-UHFFFAOYSA-N 0.000 description 2
- HSHNITRMYYLLCV-UHFFFAOYSA-N 4-methylumbelliferone Chemical compound C1=C(O)C=CC2=C1OC(=O)C=C2C HSHNITRMYYLLCV-UHFFFAOYSA-N 0.000 description 2
- CONKBQPVFMXDOV-QHCPKHFHSA-N 6-[(5S)-5-[[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]methyl]-2-oxo-1,3-oxazolidin-3-yl]-3H-1,3-benzoxazol-2-one Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)C[C@H]1CN(C(O1)=O)C1=CC2=C(NC(O2)=O)C=C1 CONKBQPVFMXDOV-QHCPKHFHSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- IEAUDUOCWNPZBR-LKTVYLICSA-N Ala-Trp-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IEAUDUOCWNPZBR-LKTVYLICSA-N 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 102000000546 Apoferritins Human genes 0.000 description 2
- 108010002084 Apoferritins Proteins 0.000 description 2
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 2
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 2
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- 108010080972 Catechol 2,3-dioxygenase Proteins 0.000 description 2
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000672609 Escherichia coli BL21 Species 0.000 description 2
- ZPOZINZKCFWAAJ-UHFFFAOYSA-N FCC1=CC=CC=C1.FC1=CC=CC=C1.C1=CC=CC=C1 Chemical compound FCC1=CC=CC=C1.FC1=CC=CC=C1.C1=CC=CC=C1 ZPOZINZKCFWAAJ-UHFFFAOYSA-N 0.000 description 2
- 108090000331 Firefly luciferases Proteins 0.000 description 2
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 2
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 2
- 108010024636 Glutathione Proteins 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- IDNNYVGVSZMQTK-IHRRRGAJSA-N His-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N IDNNYVGVSZMQTK-IHRRRGAJSA-N 0.000 description 2
- 102000004867 Hydro-Lyases Human genes 0.000 description 2
- 108090001042 Hydro-Lyases Proteins 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- 102220472556 Melanoregulin_Q61A_mutation Human genes 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- MPGJIHFJCXTVEX-KKUMJFAQSA-N Phe-Arg-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O MPGJIHFJCXTVEX-KKUMJFAQSA-N 0.000 description 2
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 2
- 102000004005 Prostaglandin-endoperoxide synthases Human genes 0.000 description 2
- 108090000459 Prostaglandin-endoperoxide synthases Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 108010075474 Toluene dioxygenase Proteins 0.000 description 2
- SUEGAFMNTXXNLR-WFBYXXMGSA-N Trp-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O SUEGAFMNTXXNLR-WFBYXXMGSA-N 0.000 description 2
- 239000006035 Tryptophane Substances 0.000 description 2
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 2
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 2
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 2
- 241000607598 Vibrio Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 125000002947 alkylene group Chemical group 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 108010015059 autophosphorylation-dependent multifunctional protein kinase Proteins 0.000 description 2
- SCNFXMOTXXIBIU-UHFFFAOYSA-N benzaldehyde Chemical compound O=CC1=CC=CC=C1.O=CC1=CC=CC=C1.O=CC1=CC=CC=C1 SCNFXMOTXXIBIU-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- FVTCRASFADXXNN-SCRDCRAPSA-N flavin mononucleotide Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-SCRDCRAPSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- MSNOMDLPLDYDME-UHFFFAOYSA-N gold nickel Chemical compound [Ni].[Au] MSNOMDLPLDYDME-UHFFFAOYSA-N 0.000 description 2
- 229960001867 guaiacol Drugs 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 101150066555 lacZ gene Proteins 0.000 description 2
- 150000002614 leucines Chemical class 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 210000004897 n-terminal region Anatomy 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- DTUQWGWMVIHBKE-UHFFFAOYSA-N phenylacetaldehyde Chemical compound O=CCC1=CC=CC=C1 DTUQWGWMVIHBKE-UHFFFAOYSA-N 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 108091008695 photoreceptors Proteins 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 101150036956 todS gene Proteins 0.000 description 2
- 150000003613 toluenes Chemical class 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 150000003668 tyrosines Chemical class 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 239000008096 xylene Substances 0.000 description 2
- 108010034306 xylene monooxygenase Proteins 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- RZOCOFJOFNECKO-RVZXSAGBSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopentanedioic acid Chemical compound CC(C)C[C@H](N)C(O)=O.OC(=O)[C@@H](N)CCC(O)=O RZOCOFJOFNECKO-RVZXSAGBSA-N 0.000 description 1
- KZEVSDGEBAJOTK-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[5-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CC=1OC(=NN=1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O KZEVSDGEBAJOTK-UHFFFAOYSA-N 0.000 description 1
- JQMFQLVAJGZSQS-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-N-(2-oxo-3H-1,3-benzoxazol-6-yl)acetamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)NC1=CC2=C(NC(O2)=O)C=C1 JQMFQLVAJGZSQS-UHFFFAOYSA-N 0.000 description 1
- YJLUBHOZZTYQIP-UHFFFAOYSA-N 2-[5-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1=NN=C(O1)CC(=O)N1CC2=C(CC1)NN=N2 YJLUBHOZZTYQIP-UHFFFAOYSA-N 0.000 description 1
- HVZGWILTESYJSP-UHFFFAOYSA-N 2-hydroxy-6-oxo-2,4-heptadienoic acid Chemical compound CC(=O)C=CC=C(O)C(O)=O HVZGWILTESYJSP-UHFFFAOYSA-N 0.000 description 1
- VKQJFKLRXDLRNP-UHFFFAOYSA-N 4,5-dimethylbenzene-1,2-diol Chemical compound CC1=CC(O)=C(O)C=C1C VKQJFKLRXDLRNP-UHFFFAOYSA-N 0.000 description 1
- QEVHRUUCFGRFIF-UHFFFAOYSA-N 6,18-dimethoxy-17-[oxo-(3,4,5-trimethoxyphenyl)methoxy]-1,3,11,12,14,15,16,17,18,19,20,21-dodecahydroyohimban-19-carboxylic acid methyl ester Chemical compound C1C2CN3CCC(C4=CC=C(OC)C=C4N4)=C4C3CC2C(C(=O)OC)C(OC)C1OC(=O)C1=CC(OC)=C(OC)C(OC)=C1 QEVHRUUCFGRFIF-UHFFFAOYSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- DCUCOIYYUBILPS-GUBZILKMSA-N Ala-Leu-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DCUCOIYYUBILPS-GUBZILKMSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- OQWQTGBOFPJOIF-DLOVCJGASA-N Ala-Lys-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N OQWQTGBOFPJOIF-DLOVCJGASA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 1
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- GMGWOTQMUKYZIE-UBHSHLNASA-N Ala-Pro-Phe Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 GMGWOTQMUKYZIE-UBHSHLNASA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000239290 Araneae Species 0.000 description 1
- NUBPTCMEOCKWDO-DCAQKATOSA-N Arg-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N NUBPTCMEOCKWDO-DCAQKATOSA-N 0.000 description 1
- DXQIQUIQYAGRCC-CIUDSAMLSA-N Arg-Asp-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)CN=C(N)N DXQIQUIQYAGRCC-CIUDSAMLSA-N 0.000 description 1
- JTWOBPNAVBESFW-FXQIFTODSA-N Arg-Cys-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N JTWOBPNAVBESFW-FXQIFTODSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- GFMWTFHOZGLTLC-AVGNSLFASA-N Arg-His-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O GFMWTFHOZGLTLC-AVGNSLFASA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 1
- UGJLILSJKSBVIR-ZFWWWQNUSA-N Arg-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)NCC(O)=O)=CNC2=C1 UGJLILSJKSBVIR-ZFWWWQNUSA-N 0.000 description 1
- JBQORRNSZGTLCV-WDSOQIARSA-N Arg-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 JBQORRNSZGTLCV-WDSOQIARSA-N 0.000 description 1
- WAEWODAAWLGLMK-OYDLWJJNSA-N Arg-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WAEWODAAWLGLMK-OYDLWJJNSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- XLHLPYFMXGOASD-CIUDSAMLSA-N Asn-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLHLPYFMXGOASD-CIUDSAMLSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 1
- TZQWZQSMHDVLQL-QEJZJMRPSA-N Asn-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N TZQWZQSMHDVLQL-QEJZJMRPSA-N 0.000 description 1
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 1
- NSTBNYOKCZKOMI-AVGNSLFASA-N Asn-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O NSTBNYOKCZKOMI-AVGNSLFASA-N 0.000 description 1
- DXHINQUXBZNUCF-MELADBBJSA-N Asn-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O DXHINQUXBZNUCF-MELADBBJSA-N 0.000 description 1
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 1
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- RNAQPBOOJRDICC-BPUTZDHNSA-N Asp-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N RNAQPBOOJRDICC-BPUTZDHNSA-N 0.000 description 1
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 1
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 1
- KRQFMDNIUOVRIF-KKUMJFAQSA-N Asp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N KRQFMDNIUOVRIF-KKUMJFAQSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 1
- GFYOIYJJMSHLSN-QXEWZRGKSA-N Asp-Val-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GFYOIYJJMSHLSN-QXEWZRGKSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101100245267 Caenorhabditis elegans pas-1 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 102000003846 Carbonic anhydrases Human genes 0.000 description 1
- 108090000209 Carbonic anhydrases Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 1
- URDUGPGPLNXXES-WHFBIAKZSA-N Cys-Gly-Cys Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O URDUGPGPLNXXES-WHFBIAKZSA-N 0.000 description 1
- OTXLNICGSXPGQF-KBIXCLLPSA-N Cys-Ile-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTXLNICGSXPGQF-KBIXCLLPSA-N 0.000 description 1
- KCPOQGRVVXYLAC-KKUMJFAQSA-N Cys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N KCPOQGRVVXYLAC-KKUMJFAQSA-N 0.000 description 1
- CHRCKSPMGYDLIA-SRVKXCTJSA-N Cys-Phe-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O CHRCKSPMGYDLIA-SRVKXCTJSA-N 0.000 description 1
- NRVQLLDIJJEIIZ-VZFHVOOUSA-N Cys-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CS)N)O NRVQLLDIJJEIIZ-VZFHVOOUSA-N 0.000 description 1
- 102100025698 Cytosolic carboxypeptidase 4 Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100533283 Dictyostelium discoideum serp gene Proteins 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 102000002464 Galactosidases Human genes 0.000 description 1
- 108010093031 Galactosidases Proteins 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 1
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 1
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- KHNJVFYHIKLUPD-SRVKXCTJSA-N Gln-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHNJVFYHIKLUPD-SRVKXCTJSA-N 0.000 description 1
- YPMDZWPZFOZYFG-GUBZILKMSA-N Gln-Leu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YPMDZWPZFOZYFG-GUBZILKMSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- NSEKYCAADBNQFE-XIRDDKMYSA-N Gln-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 NSEKYCAADBNQFE-XIRDDKMYSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- TZXOPHFCAATANZ-QEJZJMRPSA-N Glu-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N TZXOPHFCAATANZ-QEJZJMRPSA-N 0.000 description 1
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- JDAYMLXPUJRSDJ-XIRDDKMYSA-N Glu-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 JDAYMLXPUJRSDJ-XIRDDKMYSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 1
- GYAUWXXORNTCHU-QWRGUYRKSA-N Gly-Cys-Tyr Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 GYAUWXXORNTCHU-QWRGUYRKSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- ZZJVYSAQQMDIRD-UWVGGRQHSA-N Gly-Pro-His Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ZZJVYSAQQMDIRD-UWVGGRQHSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- AWHJQEYGWRKPHE-LSJOCFKGSA-N His-Ala-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AWHJQEYGWRKPHE-LSJOCFKGSA-N 0.000 description 1
- MBSSHYPAEHPSGY-LSJOCFKGSA-N His-Ala-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O MBSSHYPAEHPSGY-LSJOCFKGSA-N 0.000 description 1
- HVCRQRQPIIRNLY-IUCAKERBSA-N His-Gln-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N HVCRQRQPIIRNLY-IUCAKERBSA-N 0.000 description 1
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 1
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 101000932590 Homo sapiens Cytosolic carboxypeptidase 4 Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- GLLAUPMJCGKPFY-BLMTYFJBSA-N Ile-Ile-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 GLLAUPMJCGKPFY-BLMTYFJBSA-N 0.000 description 1
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 1
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 1
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 1
- NGKPIPCGMLWHBX-WZLNRYEVSA-N Ile-Tyr-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NGKPIPCGMLWHBX-WZLNRYEVSA-N 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 1
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- BAJIJEGGUYXZGC-CIUDSAMLSA-N Leu-Asn-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N BAJIJEGGUYXZGC-CIUDSAMLSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- LKXANTUNFMVCNF-IHPCNDPISA-N Leu-His-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LKXANTUNFMVCNF-IHPCNDPISA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- BEGQVWUZFXLNHZ-IHPCNDPISA-N Lys-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 BEGQVWUZFXLNHZ-IHPCNDPISA-N 0.000 description 1
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 1
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- XOMXAVJBLRROMC-IHRRRGAJSA-N Met-Asp-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOMXAVJBLRROMC-IHRRRGAJSA-N 0.000 description 1
- AVTWKENDGGUWDC-BQBZGAKWSA-N Met-Cys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O AVTWKENDGGUWDC-BQBZGAKWSA-N 0.000 description 1
- WXJXYMFUTRXRGO-UWVGGRQHSA-N Met-His-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 WXJXYMFUTRXRGO-UWVGGRQHSA-N 0.000 description 1
- KYJHWKAMFISDJE-RCWTZXSCSA-N Met-Thr-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCSC KYJHWKAMFISDJE-RCWTZXSCSA-N 0.000 description 1
- FAKYXUOUQCRGMO-FDARSICLSA-N Met-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCSC)N FAKYXUOUQCRGMO-FDARSICLSA-N 0.000 description 1
- HOTNHEUETJELDL-BPNCWPANSA-N Met-Tyr-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N HOTNHEUETJELDL-BPNCWPANSA-N 0.000 description 1
- 241000108056 Monas Species 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 101001033003 Mus musculus Granzyme F Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 108010066427 N-valyltryptophan Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- URLKBWYHVLBVBO-UHFFFAOYSA-N Para-Xylene Chemical group CC1=CC=C(C)C=C1 URLKBWYHVLBVBO-UHFFFAOYSA-N 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 1
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 1
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- HQVPQHLNOVTLDD-IHRRRGAJSA-N Phe-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N HQVPQHLNOVTLDD-IHRRRGAJSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 1
- CWFGECHCRMGPPT-MXAVVETBSA-N Phe-Ile-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O CWFGECHCRMGPPT-MXAVVETBSA-N 0.000 description 1
- XMQSOOJRRVEHRO-ULQDDVLXSA-N Phe-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMQSOOJRRVEHRO-ULQDDVLXSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- 241000607568 Photobacterium Species 0.000 description 1
- 241001148062 Photorhabdus Species 0.000 description 1
- 101710112190 Phototropin-2 Proteins 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- SBYVDRLQAGENMY-DCAQKATOSA-N Pro-Asn-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O SBYVDRLQAGENMY-DCAQKATOSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- PTLOFJZJADCNCD-DCAQKATOSA-N Pro-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 PTLOFJZJADCNCD-DCAQKATOSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- BLJMJZOMZRCESA-GUBZILKMSA-N Pro-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BLJMJZOMZRCESA-GUBZILKMSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- YYARMJSFDLIDFS-FKBYEOEOSA-N Pro-Phe-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YYARMJSFDLIDFS-FKBYEOEOSA-N 0.000 description 1
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 1
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- 102220573186 Protein adenylyltransferase SelO, mitochondrial_F79Y_mutation Human genes 0.000 description 1
- 102220586248 Protein yippee-like 4_L49D_mutation Human genes 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 101100043747 Pseudomonas fluorescens styC gene Proteins 0.000 description 1
- 101100043748 Pseudomonas fluorescens styD gene Proteins 0.000 description 1
- 101100260940 Pseudomonas putida (strain ATCC 700007 / DSM 6899 / BCRC 17059 / F1) todD gene Proteins 0.000 description 1
- 101100260941 Pseudomonas putida (strain ATCC 700007 / DSM 6899 / BCRC 17059 / F1) todE gene Proteins 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical class [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- WMZVVNLPHFSUPA-BPUTZDHNSA-N Ser-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 WMZVVNLPHFSUPA-BPUTZDHNSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- 108010016298 Styrene monooxygenase Proteins 0.000 description 1
- 108010059629 Styrene-oxide isomerase Proteins 0.000 description 1
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 1
- XVNZSJIKGJLQLH-RCWTZXSCSA-N Thr-Arg-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N)O XVNZSJIKGJLQLH-RCWTZXSCSA-N 0.000 description 1
- VXMHQKHDKCATDV-VEVYYDQMSA-N Thr-Asp-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VXMHQKHDKCATDV-VEVYYDQMSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- ODXKUIGEPAGKKV-KATARQTJSA-N Thr-Leu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O ODXKUIGEPAGKKV-KATARQTJSA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- GUHLYMZJVXUIPO-RCWTZXSCSA-N Thr-Met-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GUHLYMZJVXUIPO-RCWTZXSCSA-N 0.000 description 1
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 1
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- BKIOKSLLAAZYTC-KKHAAJSZSA-N Thr-Val-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O BKIOKSLLAAZYTC-KKHAAJSZSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 1
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 1
- HDQJVXVRGJUDML-UBHSHLNASA-N Trp-Cys-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HDQJVXVRGJUDML-UBHSHLNASA-N 0.000 description 1
- OFSLQLHHDQOWDB-QEJZJMRPSA-N Trp-Cys-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 OFSLQLHHDQOWDB-QEJZJMRPSA-N 0.000 description 1
- CZSMNLQMRWPGQF-XEGUGMAKSA-N Trp-Gln-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CZSMNLQMRWPGQF-XEGUGMAKSA-N 0.000 description 1
- OENGVSDBQHHGBU-QEJZJMRPSA-N Trp-Glu-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OENGVSDBQHHGBU-QEJZJMRPSA-N 0.000 description 1
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 1
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- UMIACFRBELJMGT-GQGQLFGLSA-N Trp-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UMIACFRBELJMGT-GQGQLFGLSA-N 0.000 description 1
- RKISDJMICOREEL-QRTARXTBSA-N Trp-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RKISDJMICOREEL-QRTARXTBSA-N 0.000 description 1
- LNGFWVPNKLWATF-ZVZYQTTQSA-N Trp-Val-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LNGFWVPNKLWATF-ZVZYQTTQSA-N 0.000 description 1
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 1
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- OSXNCKRGMSHWSQ-ACRUOGEOSA-N Tyr-His-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSXNCKRGMSHWSQ-ACRUOGEOSA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- VYTUETMEZZLJFU-IHRRRGAJSA-N Tyr-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)N[C@@H](CS)C(=O)O VYTUETMEZZLJFU-IHRRRGAJSA-N 0.000 description 1
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 1
- COQLPRJCUIATTQ-UHFFFAOYSA-N Uranyl acetate Chemical compound O.O.O=[U]=O.CC(O)=O.CC(O)=O COQLPRJCUIATTQ-UHFFFAOYSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- UDLYXGYWTVOIKU-QXEWZRGKSA-N Val-Asn-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UDLYXGYWTVOIKU-QXEWZRGKSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- 241000607757 Xenorhabdus Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010057412 arginyl-glycyl-aspartyl-phenylalanine Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 150000001491 aromatic compounds Chemical class 0.000 description 1
- 150000001555 benzenes Chemical class 0.000 description 1
- 108010019077 beta-Amylase Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 101150103188 bnzA gene Proteins 0.000 description 1
- 101150042475 bnzB gene Proteins 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000007816 calorimetric assay Methods 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 108010016012 cis-toluene dihydrodiol dehydrogenase Proteins 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000007872 degassing Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- DPXDJGUFSPAFJZ-UHFFFAOYSA-L disodium;4-[3-methyl-n-(4-sulfonatobutyl)anilino]butane-1-sulfonate Chemical compound [Na+].[Na+].CC1=CC=CC(N(CCCCS([O-])(=O)=O)CCCCS([O-])(=O)=O)=C1 DPXDJGUFSPAFJZ-UHFFFAOYSA-L 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000000635 electron micrograph Methods 0.000 description 1
- 238000010218 electron microscopic analysis Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 150000003278 haem Chemical class 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 150000002519 isoleucine derivatives Chemical class 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 238000000111 isothermal titration calorimetry Methods 0.000 description 1
- 238000000447 isothermal titration calorimetry curve Methods 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 101150055499 lov-1 gene Proteins 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 239000012452 mother liquor Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 229940078552 o-xylene Drugs 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 101150061739 pas-2 gene Proteins 0.000 description 1
- 229940100595 phenylacetaldehyde Drugs 0.000 description 1
- 108010089113 phenylacetate - CoA ligase Proteins 0.000 description 1
- 229960005190 phenylalanine Drugs 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- QQONPFPTGQHPMA-UHFFFAOYSA-N propylene Natural products CC=C QQONPFPTGQHPMA-UHFFFAOYSA-N 0.000 description 1
- 125000004805 propylene group Chemical group [H]C([H])([H])C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 239000013636 protein dimer Substances 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000000197 pyrolysis Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 102220094337 rs876658446 Human genes 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 125000003748 selenium group Chemical group *[Se]* 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 230000007781 signaling event Effects 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 101150077543 st gene Proteins 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 150000003440 styrenes Chemical class 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000005469 synchrotron radiation Effects 0.000 description 1
- 102220482186 tRNA pseudouridine synthase A_F46A_mutation Human genes 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical group C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 238000001757 thermogravimetry curve Methods 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 101150099309 todA gene Proteins 0.000 description 1
- 101150038736 todB gene Proteins 0.000 description 1
- 101150092067 todT gene Proteins 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 238000004627 transmission electron microscopy Methods 0.000 description 1
- 125000000430 tryptophan group Chemical class [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 1
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/30—Extraction; Separation; Purification by precipitation
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B09—DISPOSAL OF SOLID WASTE; RECLAMATION OF CONTAMINATED SOIL
- B09C—RECLAMATION OF CONTAMINATED SOIL
- B09C1/00—Reclamation of contaminated soil
- B09C1/10—Reclamation of contaminated soil microbiologically, biologically or by using enzymes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/21—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/78—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/26—Oils; Viscous liquids; Paints; Inks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Genetics & Genomics (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Pathology (AREA)
- Food Science & Technology (AREA)
- General Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Soil Sciences (AREA)
- Environmental & Geological Engineering (AREA)
Abstract
본 발명은 PAS1 변이 단백질, 상기 PAS1 변이 단백질을 포함하는 TodS 변이 단백질, 상기 변이 단백질을 생산하는 미생물, 상기 변이 단백질을 이용하는 방향족 탄화수소 감지용 바이오센서 및 방향족 탄화수소 분해용 미생물 제제에 관한 것이다.
또한, 본 발명은 PAS1 단백질 결정체, SeMet-PAS1 단백질과 톨루엔 복합체의 결정체, PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 결정체 및 상기 결정체의 제조 방법, 및 이의 적용에 관한 것이다.
또한, 본 발명은 PAS1 단백질 결정체, SeMet-PAS1 단백질과 톨루엔 복합체의 결정체, PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 결정체 및 상기 결정체의 제조 방법, 및 이의 적용에 관한 것이다.
Description
본 발명은 PAS1 변이 단백질, 상기 PAS1 변이 단백질을 포함하는 TodS 변이 단백질, 상기 변이 단백질을 생산하는 미생물, 상기 변이 단백질을 이용하는 방향족 탄화수소 감지용 바이오센서 및 방향족 탄화수소 분해용 미생물 제제에 관한 것이다.
또한, 본 발명은 PAS1 단백질 결정체, SeMet-PAS1 단백질과 톨루엔 복합체의 결정체, PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 결정체 및 상기 결정체의 제조 방법, 및 이의 적용에 관한 것이다.
토양 내 축적된 다양한 벤젠계 방향성 휘발성 화학물질들은 토양 미생물인 슈도모나스 푸티타(Pseudomoans putida) 균에 의해 탄소원으로 사용된다. 이 균은 tod 오페론 내에 다양한 톨루엔(toluene) 분해효소를 코딩하고 있고, tod 오페론의 활성은 TodS/TodT 2개 인자 신호조절 시스템에 의해 이루어진다. TodS/TodT 2개 인자 신호조절을 구성하는 TodS는 2개의 PAS 도메인과 2개의 히스티딘 키나아제(Histidine kinase, HK) 도메인, 1개의 반응 조절자(response regulator, RRR)로 구성되어 있다. 톨루엔은 TodS의 N-말단 부위의 PAS1 도메인에 결합하여 TodS 내의 2개의 히스티딘 키나아제의 자기인산화(autophosphorylation)를 유도하고, 인산화된 신호가 전사조절인자 TodT의 인산화를 촉진하여 tod 오페론의 전사조절부위 todX box에 결합함으로써 tod 오페론의 유전자 발현을 가져온다(Proc. Natl. Acad. Sci., 2006, 103, 8191-8196). 슈도모나스 푸티다 F1균의 tod 오페론은 todF, todC1, todC2, todB, todA, todD, todE로 이루어져있고, 톨루엔 2산소화효소(toluene dioxygenase, todABC1C2), cis-톨루엔 디하이드로다이올 디하이드로게나아제(cis-toluene dihydrodiol dehydrogenase, todD), 30-메틸카테콜 2,3,-디옥시게나아제(30-methylcatechol 2,3,-dioxygense, todE), 2-하이드록시-6-옥소-2,4-헥타다이에노에이트 하이드롤라아제(2-hydroxy-6-oxo-2,4-heptadienoate hydrolase, todF) 등의 톨루엔 분해 효소를 코딩하고 있다(Appl. Environ. Microbiol., 1988, 54, 1498-1503). 따라서 TodS의 PAS1 도메인과 톨루엔의 결합은 토양 내 미생물들이 톨루엔을 대체 탄소 자원으로 활용하여 생존을 유지하는데 중요하며, 이러한 톨루엔 분해효소를 발현하는 슈도모나스 균주들은 최근 석유 오염지역 등에서 생물정화 역할을 수행하는 미생물로 활용되고 있다.
한편, 석유환경 오염지역에는 다양한 벤젠계의 방향성 휘발성 화학물질들이 혼합하여 존재하고 있고, TodS의 PAS1 도메인은 톨루엔뿐만 아니라, 스티렌(styrene), m-자일렌(m-xylene), o-자일렌(o-xylene), 1,2,4-TMB 등과 같은 다양한 종류의 방향성 탄화수소가 결합이 될 수 있다. 하지만, 톨루엔 이외의 리간드들이 톨루엔보다 더 높은 결합속도로 PAS1에 결합하게 되면 tod 오페론의 활성이 원활하게 이루어지지 않으며. 결과적으로 미생물에 의한 톨루엔 이화작용이 저해되는 한계를 가지고 있다. 즉, 톨루엔 결합이 가장 강하게 생체 내 신호전달을 가능하게 하는바, 이의 매커니즘 연구 및 이를 이용한 센서 개발이 요구되고 있으나, 정확한 매커니즘 및 PAS1을 포함하는 TodS의 정확한 구조를 규명할 수 없어 어려움이 있어왔다.
최근 단백질 효소공학 연구는 표적 단백질의 입체 구조와 기능을 규명하여, 명확하고 효율적인 과학적 단백질 엔지니어링을 통한 효율적 단백질을 설계하고 개발하는 방향으로 이루어지고 있으며, 이러한 연구는 리간드 특이성과 효능을 증진시킬 수 있는 감지센서 개발 접근 방식으로 활용될 수 있다. 선택적이고 특이적인 리간드의 결합부위을 설계하여 민감도를 증대하고, 리간드 특이성을 확대한 감지센서를 개발하기 위해서는 안정한 상태의 고순도 단백질을 대량으로 확보하고 결정화를 통해 단백질의 입체구조를 규명하는 것이 필수적이다. 그러나, TodS 또는 PAS1 단백질은 안정한 상태로 순수 정제하여 결정화하기에 매우 어려운 까닭에, 그 중요성에도 불구하고 그 동안 입체구조가 밝혀지지 않았다.
이러한 배경 하에 본 발명자들은 PAS1 단백질의 입체구조를 규명하기 위하여 예의 노력한 결과, Apo-PAS1 단백질 결정체, SeMet-PAS1 단백질과 톨루엔과의 복합체 결정체, 및 PAS1 단백질과 1,2,4-TMB와의 복합체 결정체를 제조하여 이로부터 수득한 3차 구조를 토대로 PAS1 단백질과 리간드의 결합부위를 고해상도 원자 수준에서 규명하였다. 또한, 규명한 리간드 결합부위를 이용하여 톨루엔 이외의 다른 방향족 화학 물질과 결합하여 신호를 전달할 수 있는 새로운 기능의 감지센서를 제조할 수 있음을 확인하여, 본 발명을 완성하였다.
본 발명의 하나의 목적은 서열번호 1의 TodS 단백질에서, 하기 (a) 내지 (w)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 TodS 변이 단백질을 제공하는 것이다;
(a) 46번 페닐알라닌을 알라닌 또는 세린으로 치환
(b) 47번 발린을 알라닌 또는 류신으로 치환,
(c) 49번 류신을 아스파틱산 또는 알라닌으로 치환,
(d) 58번 글루탐산을 알라닌 또는 세린으로 치환,
(e) 59번 발린을 알라닌, 아스파틱산 또는 페닐알라닌으로 치환,
(f) 61번 글루타민을 류신, 알지닌 또는 알라닌으로 치환,
(g) 63번 알라닌을 발린 또는 세린으로 치환,
(h) 79번 페닐알라닌을 타이로신, 글루탐산 또는 류신으로 치환,
(i) 84번 트립토판을 발린, 히스티딘 또는 알지닌으로 치환,
(j) 85번 트립토판을 히스티딘, 알지닌, 또는 류신으로 치환,
(k) 114번 아이소류신이 발린, 페닐알라닌, 쓰레오닌 또는 세린으로 치환,
(l) 126번 발린을 알라닌, 세린, 쓰레오닌, 또는 류신으로 치환,
(m) 128번 페닐알라닌을 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로 치환,
(n) 131번 류신을 아스파틱산으로 치환,
(o) 145번 알라닌을 세린 또는 발린으로 치환,
(p) 146번 글루탐산을 알라닌 또는 류신으로 치환,
(q) 148번 알지닌을 알라닌 또는 메티오닌으로 치환,
(r) 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환,
(s) 666번 글루탐산을 알라닌으로 치환
(t) 674번 루신을 알라닌으로 치환,
(u) 691번 타이로신을 아이소류신으로 치환,
(v) 703번 알라닌을 세린으로 치환, 및
(w) 617번 내지 623번 아미노산의 결손.
본 발명의 다른 목적은 서열번호 1의 TodS 단백질 중 43번 내지 168번째 또는 23번 내지 168번째 아미노산 서열을 가지는 PAS1 단백질에서, 서열번호 1의 아미노산 서열을 기준으로, 상기 (a) 내지 (q)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 PAS1 변이 단백질을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 단백질을 코딩하는 폴리뉴클레오티드; 상기 폴리뉴클레오티드를 포함하는 발현 벡터; 및 상기 발현 벡터가 도입된 미생물을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 변이 단백질을 생산하는 미생물을 제공하는 것이다.
본 발명의 또 다른 목적은 (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 방향족 탄화수소 감지용 바이오센서를 제공하는 것이다:
(a) 방향족 탄화수소와 특이적으로 결합하는 상기 PAS1 변이 단백질을 포함하는 제1모듈;
(b) 제1모듈에 방향족 탄화수소가 결합시 신호를 발생 및 전달하는 제2모듈;
(c) 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d) 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.
본 발명의 또 다른 목적은 (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; 또는 (iii) 상기 발현 카세트를 포함하는 벡터를 포함하는 미생물을 함유하는, 방향족 탄화수소 분해용 미생물 제제을 제공하는 것이다:
(a) 방향족 탄화수소와 특이적으로 결합하는 상기 PAS1 변이 단백질을 포함하는 제1모듈;
(b) 제1모듈에 방향족 탄화수소가 결합시 신호를 발생 및 전달하는 제2모듈;
(c) 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d) 상기 인산화되는 제3모듈에 의해 방향족 탄화수소 분해 단백질을 발현시키는 제4모듈.
본 발명의 또 다른 목적은 상기 바이오센서를 포함하는, 방향족 탄화수소 감지용 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 미생물 제제를 포함하는, 방향족 탄화수소 분해용 조성물을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 바이오센서를 시료에 노출시키는 단계를 포함하는, 방향족 탄화수소 감지방법을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 미생물 제제를 이용하여 방향족 탄화수소를 분해하는 단계를 포함하는, 방향족 탄화수소 분해방법을 제공하는 것이다.
본 발명의 또 다른 목적은 (a) 표 3에 나타낸 PAS1 단백질의 원자좌표, 표 4에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표, 또는 표 5에 나타낸 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 원자좌표를 이용하여, PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계;
(b) 상기 설계된 3차 구를 이용하여 PAS1 변이 단백질을 생성하는 단계; 및
(c) 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합 활성을 측정하는 단계를 포함하는,
야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질을 스크리닝하는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질을 결정화시키는 단계를 포함하는, PAS1 단백질을 결정화시키는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 서열번호 1의 TodS 단백질 중 43번 내지 168번째 아미노산 서열을 가지는 PAS1 단백질과 톨루엔 또는 1,2,4-TMB(1,2,4-Trimethylbenzene)의 혼합물을 결정화시키는 단계를 포함하는, PAS1 단백질과 톨루엔 또는 1,2,4-TMB의 복합체를 결정화시키는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 공간군(space group)이 P21이고, 단위 셀 디멘션(unit-cell dimension)은 a=41.114Å, b=49.314Å, c=56.222Å, α=90°, β=109.22°, γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질 결정체를 제공하는 것이다.
본 발명의 또 다른 목적은 공간군이 P212121이고, 단위 셀 디멘션은 a=41.342Å, b=47.744Å, c=126.522Å, α=β=γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질 중 메티오닌이 셀레노메티오닌인 SeMet-PAS1 단백질과 톨루엔 복합체의 결정체를 제공하는 것이다.
본 발명의 또 다른 목적은 공간군이 P212121이고, 단위 셀 디멘션은 a=45.387Å, b=51.016Å, c=100.728Å, α=β=γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 결정체를 제공하는 것이다.
본 발명의 또 다른 목적은 (a) 표 3에 나타낸 PAS1 단백질의 원자좌표, 표 4에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표 또는 표 5에 나타낸 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 원자좌표를 이용하여 PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계; (b) 상기 설계된 3차 구조를 이용하여 PAS1에 결합하는 후보 물질을 생성하는 단계; 및 (c) 상기 후보 물질이 PAS1 단백질 또는 PAS1을 포함하는 TodS 단백질과 리간드 간의 결합을 조절하는지 여부를 확인하는 단계를 포함하는, PAS1 단백질 또는 TodS 단백질과 리간드 간의 결합을 조절하는 물질을 스크리닝하는 방법을 제공하는 것이다.
본 발명의 하나의 양태는 TodS 변이 단백질을 제공한다.
본 발명의 TodS 변이 단백질은 다양한 방향족 탄화수소에 대한 민감도가 야생형 TodS 단백질보다 높거나 또는 낮게 변화되어, 방향족 탄화수소의 감지 및/또는 분해에 유용하게 이용될 수 있다.
구체적으로, 서열번호 1의 TodS 단백질에서, 하기 (a) 내지 (w)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 TodS 변이 단백질을 제공한다;
(a) 46번 페닐알라닌을 알라닌 또는 세린으로 치환
(b) 47번 발린을 알라닌 또는 류신으로 치환,
(c) 49번 류신을 아스파틱산 또는 알라닌으로 치환,
(d) 58번 글루탐산을 알라닌 또는 세린으로 치환,
(e) 59번 발린을 알라닌, 아스파틱산 또는 페닐알라닌으로 치환,
(f) 61번 글루타민을 류신, 알지닌 또는 알라닌으로 치환,
(g) 63번 알라닌을 발린 또는 세린으로 치환,
(h) 79번 페닐알라닌을 타이로신, 글루탐산 또는 류신으로 치환,
(i) 84번 트립토판을 발린, 히스티딘 또는 알지닌으로 치환,
(j) 85번 트립토판을 히스티딘, 알지닌, 또는 류신으로 치환,
(k) 114번 아이소류신이 발린, 페닐알라닌, 쓰레오닌 또는 세린으로 치환,
(l) 126번 발린을 알라닌, 세린, 쓰레오닌, 또는 류신으로 치환,
(m) 128번 페닐알라닌을 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로 치환,
(n) 131번 류신을 아스파틱산으로 치환,
(o) 145번 알라닌을 세린 또는 발린으로 치환,
(p) 146번 글루탐산을 알라닌 또는 류신으로 치환,
(q) 148번 알지닌을 알라닌 또는 메티오닌으로 치환,
(r) 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환,
(s) 666번 글루탐산을 알라닌으로 치환
(t) 674번 루신을 알라닌으로 치환,
(u) 691번 타이로신을 아이소류신으로 치환,
(v) 703번 알라닌을 세린으로 치환, 및
(w) 617번 내지 623번 아미노산의 결손.
본 발명에서 용어, "TodS 단백질"은 방향족 탄화수소를 감지하여 인산 신호를 발생 및 전달하는 단백질을 의미하며, 2개의 PAS 도메인과 2개의 히스티딘 키나아제(Histidine kinase, HK) 도메인, 1개의 반응 조절자(response regulator, RRR)를 포함한다. 상기 TodS 단백질은 슈도모나스 (Pseudomoans) 속 미생물 유래, 구체적으로 슈도모나스 푸티타(Pseudomoans putida) 유래일 수 있으나, 이에 제한되지 않는다. 또한, 상기 TodS 단백질은 특별히 이에 제한되지 않으나, NCBI 유전자 은행과 같은 공지의 데이터베이스를 통하여 이의 서열을 용이하게 수득할 수 있으며, 그 예로 GenBank ID: A5W4E3.1인 단백질일 수 있으며, 서열번호 1로 표시되는 아미노산 서열 또는 서열번호 2로 표시되는 염기서열을 가질 수 있다.
본 발명에서 용어, "TodS 변이 단백질"은 야생형 TodS 유전자 내의 PAS1 단백질에 하나 이상의 아미노산을 치환, 삽입, 제거 또는 변형한 단백질을 의미하며, 본 발명의 목적상 상기 TodS 변이 단백질은 톨루엔에 대한 민감도를 높이거나 낮추기 위해 변이시키거나, 톨루엔 외의 리간드에 대한 민감도를 변화시키기 위해 변이시킨 단백질을 의미할 수 있으나, 이에 제한되지 않는다.
상기 TodS 변이 단백질은 구체적으로는 TodS 단백질인 서열번호 1의 아미노산 서열에서 46번 페닐알라닌, 47번 발린, 48번 글라이신, 49번 류신, 58번 글루탐산, 59번 발린, 61번 글루타민, 63번 알라닌, 79번 페닐알라닌, 84번 트립토판, 85번 트립토판, 114번 아이소류신, 126번 발린, 128번 페닐알라닌, 131번 류신, 145번 알라닌, 146번 글루탐산, 147번 글라이신, 148번 알지닌, 619번 타이로신, 620번 글루탐산, 666번 글루탐산, 674번 루신, 691번 타이로신 및 703번 알라닌으로 이루어진 군 중에서 하나 이상이 변이된 단백질, 예컨대 다른 아미노산으로 치환된 형태의 단백질일 수 있다. 또한, 상기 군 중, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 또는 23개 변이를 포함하는 변이 단백질일 수 있다.
또한, 상기 TodS 변이 단백질은 서열번호 1의 아미노산 서열에서 617번 내지 623번 아미노산이 결손된 단백질 또는 상기 치환된 형태의 TodS 변이 단백질에 추가적으로 617번 내지 623번 아미노산이 결손된 단백질이 수 있다.
더욱 구체적으로는, 상기 TodS 변이 단백질은 TodS 단백질인 서열번호 1의 아미노산 서열에서, (a) 46번 페닐알라닌이 알라닌 또는 세린으로 치환, (b) 47번 발린이 알라닌 또는 류신으로 치환, (c) 49번 류신이 아스파틱산 또는 알라닌으로 치환, (d) 58번 글루탐산이 알라닌 또는 세린으로 치환, (e) 59번 발린이 알라닌, 아스파틱산 또는 페닐알라닌으로 치환, (f) 61번 글루타민이 류신, 알지닌 또는 알라닌으로 치환, (g) 63번 알라닌이 발린 또는 세린으로 치환, (h) 79번 페닐알라닌이 타이로신, 글루탐산 또는 류신으로 치환, (i) 84번 트립토판이 발린, 히스티딘 또는 알지닌으로 치환, (j) 85번 트립토판이 히스티딘, 알지닌, 또는 류신으로 치환, (k) 114번 아이소류신이 발린, 페닐알라닌, 쓰레오닌 또는 세린으로 치환, (l) 126번 발린이 알라닌, 세린, 쓰레오닌, 또는 류신으로 치환, (m) 128번 페닐알라닌이 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로 치환, (n) 131번 류신이 아스파틱산으로 치환, (o) 145번 알라닌이 세린 또는 발린으로 치환, (p) 146번 글루탐산이 알라닌 또는 류신으로 치환, (q) 148번 알지닌이 알라닌 또는 메티오닌(methionine)으로 치환, (r) 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환, (s) 666번 글루탐산이 알라닌으로 치환, (t) 674번 루신이 알라닌으로 치환, (u) 691번 타이로신이 아이소류신으로 치환, (v) 703번 알라닌이 세린으로 치환, 및 (w) 617번 내지 623번 아미노산의 결손으로 이루어진 군에서 선택되는 하나 이상의 변이를 가질 수 있으나, 이에 제한되지 않는다.
상기 TodS 변이 단백질은 상기 변이 단백질뿐 아니라, 야생형 TodS 단백질에 비하여 방향족 탄화수소와 결합하는 능력이 조절된 이상, 상기 변이 위치를 포함하면서, 서열번호 1의 TodS 아미노산 서열과 70% 이상, 구체적으로는 80% 이상, 더욱 구체적으로는 95% 이상, 가장 구체적으로는 97%, 98% 또는 99% 이상의 유사성을 나타내는 아미노산 서열을 포함하는 단백질도 본 발명의 범위 내에 포함됨은 자명하다.
본 발명에서 방향족 탄화수소는 본 발명의 변이 단백질과 결합할 수 있는 방향족 탄화수소는 제한없이 포함될 수 있으며, 벤젠(benzene), 에틸벤젠(ethylbenzene), 프로필벤젠(propylbenzene), 부틸벤젠(butylbenzene), 니트로벤젠(nitrobenzene), 클로로벤젠(chlorobenzene), 플루오로벤젠(fluorobenzene), 톨루엔(toluene), 스티렌(styrene), o-자일렌(o-xylene), m-자일렌(m-xylene), p-자일렌(p-xylene), o-클로로톨루엔(o-chlorotoluene), m-클로로톨루엔(m-chlorotoluene), p-클로로톨루엔(p-chlorotoluene), o-톨루이딘(o-toluidine), m-톨루이딘(m-toluidine), p-톨루이딘(p-toluidine), 카테콜(catechol), 1,2,4-TMB(1,2,4-Trimethylbenzene), 1,2,3-TMB(1,2,3-Trimethylbenzene), 1,3,5-TMB(1,3,5-Trimethylbenzene), 1-나프톨(1-naphthol) 및 2,3-디히드록시나프탈렌(2,3-dihydroxynaphthalene)으로 이루어진 군으로부터 선택된 하나 이상의 화합물일 수 있다.
본 발명에서 서열번호 1의 43 - 978번째 또는 23 - 978번째 아미노산 서열을 가진 TodS 단백질은 각각 TodS (43 - 978) 또는 TodS (23 - 978)와 혼용된다.
본 발명의 다른 하나의 양태는 서열번호 1의 TodS 단백질 중, 23번 내지 168번 아미노산 서열, 또는 43번 내지 168번째 아미노산 서열을 가지는 PAS1 단백질에서, 서열번호 1의 아미노산 서열을 기준으로, 상기 (a) 내지 (q)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 PAS1 변이 단백질을 제공한다.
본 발명의 PAS1 변이 단백질은 다양한 방향족 탄화수소에 대한 민감도가 야생형 PAS1 단백질보다 높거나 또는 낮게 변화되어, 방향족 탄화수소의 감지 및/또는 분해에 유용하게 이용될 수 있다.
본 발명에서 용어, "PAS1 단백질"은 톨루엔을 리간드로 감지하여 결합하여 톨루엔에 대한 센서 기능을 나타낼 수 있는, TodS 단백질의 N-말단에 위치한 단백질 부위를 말한다. 구체적으로, PAS1 단백질은 톨루엔과 결합할 수 있으며, 상기 결합에 의하여 PAS1 단백질의 구조변화에 의해 TodS 단백질의 형태 변화(conformational change)가 TodS 단백질의 자가인산화과정을 활성화하고 TodS에 의해 인산화된 TodT가 tod 오페론의 전사조절부위 DNA와 결합하여 tod 유전자들을 활성화 시킬 수 있다.
상기 PAS1 단백질 구조를 형성하는 아미노산 서열 및 염기서열과 같은 정보는 NCBI GenBank와 같은 데이터베이스로부터 얻을 수 있으며, 그 예로 서열번호 1로 표시된 TodS 단백질의 43번 아미노산 내지 168번 아미노산 서열(서열번호 3), 또는 23번 아미노산 내지 168번 아미노산 서열(서열번호 5)일 수 있다. 또한, 상기 PAS1 단백질은 상기 서열번호 3 또는 서열번호 5의 아미노산 서열을 가지는 단백질뿐만 아니라, 이와 80% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 보다 더욱 구체적으로는 97%, 98% 또는 99% 이상의 상동성을 갖는 아미노산 서열을 포함할 수 있다. 이러한 상동성을 갖는 서열로서 실질적으로 서열번호 또는 서열번호 4의 단백질과 동일하거나 상응하는 생물학적 활성을 갖는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 경우도 본 발명의 범주에 포함됨은 자명하다.
본 발명에서 용어, "PAS1 변이 단백질"은 야생형 PAS1 단백질에 하나 이상의 아미노산을 치환, 삽입, 제거 또는 변형한 단백질을 의미하며, 본 발명의 목적상 상기 PAS1 변이 단백질은 톨루엔 리간드에 대한 민감도를 높이거나 낮추기 위해 변형시키거나, 톨루엔 외의 리간드에 대한 민감도를 변화시키기 위해 변경시킨 단백질을 의미할 수 있으나, 이에 제한되지 않는다.
또한, 상기 PAS1 변이 단백질은 야생형 PAS1 단백질에 비하여 방향족 탄화수소와 결합하는 능력이 조절된 이상, 상기 (a) 내지 (q)로 이루어진 군에서 선택되는 하나 이상의 변이를 포함하면서, 서열번호 1의 43번 내지 168번째 아미노산 서열, 또는 23번 내지 168번째 아미노산 서열과 70% 이상, 구체적으로는 80% 이상, 더욱 구체적으로는 95% 이상, 가장 구체적으로는 97%, 98% 또는 99% 이상의 유사성을 나타내는 아미노산 서열을 포함하는 단백질도 본 발명의 범위 내에 포함됨은 자명하다.
본 발명에서 서열번호 1의 43 - 168번째 또는 23 - 168번째 아미노산 서열을 가진 PAS1 단백질은 각각 PAS1 (43 - 168) 또는 PAS1 (23 - 168)와 혼용된다.
본 발명의 일 실시예에서는 서열번호 1의 아미노산 서열을 가진 TodS 단백질에서 46번 페닐알라닌이 알라닌 또는 세린으로, 59번 발린이 알라닌, 아스파틱산 또는 페닐알라닌으로, 63번 알라닌이 발린 또는 세린으로, 79번 페닐알라닌이 타이로신, 글루탐산 또는 류신으로, 84번 트립토판이 발린, 히스티딘 또는 알지닌으로, 85번 트립토판이, 히스티딘, 말지닌, 또는 류신으로, 114번 아이소퓨신이 발린, 페닐알라닌, 쓰레오닌(threonine) 또는 세린으로, 126번 발린이 알라닌, 세린, 쓰레오닌, 또는 류신으로, 128번 페닐알라닌이 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로, 145번 알라닌이 세린 또는 발린으로, 47번 발린이 알라닌 또는 류신으로, 49번 류신이 아스파틱산 또는 알라닌으로, 58번 글루탐산이 알리닌 또는 세린으로 131번 류신 아스파틱산으로, 61번 글루타민이 류신, 알지닌, 알라닌으로, 146번 글루탐산이 알라닌 또는 류신으로, 또는 148번 알지닌이 알라닌 또는 메티오닌으로 치환시킨 PAS1 변이 단백질을 포함하는 TodS 변이 단백질을 제조하여, 리간드에 따른 감지 능력을 확인하였다.
또한, 본 발명의 일 실시예에서는 서열번호 1의 아미노산 서열을 가진 TodS 단백질에서 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환, 666번 글루탐산을 알라닌으로 치환, 674번 루신을 알라닌으로 치환, 691번 타이로신을 아이소류신으로 치환, 703번 알라닌을 세린으로 치환, 또는 617번 내지 623번 아미노산이 결손된, TodS 변이 단백질을 제조하여, 리간드에 따른 감지 능력을 확인하였다.
본 발명에서 상기 서열번호 1의 TodS 단백질에서 114번 아이소류신이 발린으로 치환된 TodS 변이 단백질(I114V TodS, 서열번호 7); 또는 상기 TodS 변이 단백질의 아미노산 서열에서 43 내지 168번째, 또는 23번째 내지 168번째 아미노산 서열을 가지는 PAS1 변이 단백질은 톨루엔 및 m-자일렌으로 이루어진 군에서 선택되는 하나 이상의 방향족 탄화수소 감지 센서로서 사용될 수 있다.
본 발명의 일 실시예에 따르면, 상기 I114V TodS의 경우, 도 10에 기술된 방법을 사용하여 활성을 확인하였을 때, 야생형 TodS와 비교하여, 톨루엔에 의한 TodS/TodT 신호전달을 여전히 나타냈을 뿐만 아니라, 야생형 TodS에 비해 2 내지 5배 이상 민감도가 증가되는 결과를 나타내었다(실험예 10).
따라서 상기 I114V TodS는 톨루엔 또는/및 m-자일렌 감지 센서로서 사용될 수 있다. 예컨대, I114V TodS를 코딩하는 폴리뉴클레오티드, TodT를 코딩하는 폴리뉴클레오티드, 및 tod 오페론의 프로모터에 작동가능하게 연결된 리포터 유전자의 3가지 구성 요소를 포함하는 시스템을 미생물에 도입하는 방법 등으로 톨루엔 또는/및 m-자일렌 감지 센서로서 사용할 수 있다.
또한, 본 발명에서 서열번호 1의 TodS 단백질에서 61번 아미노산인 글루타민이 알지닌으로 치환된 TodS 변이 단백질(Q61R TodS, 서열번호 8) 또는 상기 TodS 변이 단백질의 아미노산 서열에서 43 내지 168번째, 또는 23번째 내지 168번째 아미노산 서열을 가지는 PAS1 변이 단백질은 톨루엔, 스티렌, m-자일렌, o-자일렌 및 1,2,4-TMB(1,2,4-Trimethylbenzene)으로 이루어진 군에서 선택되는 하나 이상의 방향족 탄화수소 감지 센서로서 사용될 수 있다.
본 발명의 일 실시예에 따르면, 상기 Q61R TodS의 경우, 도 8에 기술된 방법을 사용하여 활성을 확인하였을 때, 야생형 TodS와 비교하여, 톨루엔에 의한 TodS/TodT 신호전달을 2 내지 4배 가량 민감하게 인지하였을 뿐만 아니라, 스티렌, m-자일렌 및 o-자일렌에 대해서도 야생형 TodS에 비해 높은 민감도를 나타내었다(실험예 10).
따라서 상기 Q61R TodS는 톨루엔, 스티렌, m-자일렌, 또는/및 o-자일렌 감지 센서로서 사용될 수 있다. 예컨대, Q61R TodS를 코딩하는 폴리뉴클레오티드, TodT를 코딩하는 폴리뉴클레오티드, 및 tod 오페론의 프로모터에 작동가능하게 연결된 리포터 유전자의 3가지 구성 요소를 포함하는 시스템을 미생물에 도입하는 방법 등으로 톨루엔, 스티렌, m-자일렌, 또는/및 o-자일렌 감지 센서로서 사용할 수 있다.
본 발명에서 PAS1 단백질은 TodS 단백질의 특정 도메인에 해당하므로, PAS1 변이 단백질은 TodS 변이 단백질에 포함된다.
본 발명의 또 다른 하나의 양태는 TodS 변이 단백질 또는 PAS1 변이 단백질을 코딩하는 폴리뉴클레오티드; 상기 폴리뉴클레오티드를 포함하는, 발현 벡터; 및 상기 발현 벡터가 도입된 형질전환체를 제공한다.
상기 변이 단백질에 대해서는 앞서 설명한 바와 같다.
본 발명에서 제공하는 상기 TodS 변이 단백질 또는 PAS1 변이 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터는 특별히 이에 제한되지 않으나, 포유류 세포(예를 들어, 사람, 원숭이, 토끼, 래트, 햄스터, 마우스 세포 등), 식물 세포, 효모 세포, 곤충 세포 또는 박테리아 세포(예를 들어, 대장균 등)를 포함하는 진핵 또는 원핵세포에서 상기 폴리뉴클레오티드를 복제 및/또는 발현할 수 있는 벡터가 될 수 있고, 바람직하게는 숙주세포에서 상기 폴리뉴클레오티드가 발현될 수 있도록 적절한 프로모터에 작동 가능하도록 연결되며, 적어도 하나의 선별 마커를 포함하는 벡터가 될 수 있다,
본 발명에서 용어, "형질전환체"는 상기 벡터로 형질 전환된 숙주세포로 본 발명의 수용성, 또는 수용성 및 결정성을 갖는 TodS 변이 단백질 또는 PAS1 변이 단백질을 다량으로 생산할 수 있는 형질전환체를 의미하며, 또한 상기 TodS 변이 단백질 또는 PAS1 변이 단백질이 도입되어 NMR 등을 통한 신기능의 감지센서 개발 후보물질을 스크리닝할 수 있는 형질전환체를 포함하나, 이에 제한되지 않는다. 또한, 상기 형질전환체는 방향족 탄화수소와 같은 오염물질을 분해하는 미생물 균주로서도 제작될 수 있다.
본 발명에서 제공하는 상기 발현벡터가 도입된 형질전환체는 특별히 이에 제한되지 않으나, 상기 발현벡터가 도입되어 형질전환 된 대장균, 슈도모나스 등의 박테리아 세포(예, 슈도모나스 푸티다); 효모 세포; 피치아 파스토리스 등의 균류 세포; 또는 식물 세포가 될 수 있다.
본 발명에서 용어, "도입"은 상기 PAS1 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 발현벡터를 숙주세포에 전달하는 방법을 의미한다. 이와 같은 도입은 칼슘 포스페이트-DNA 공침전법, DEAE-덱스트란-매개 트랜스펙션법, 폴리브렌-매개 형질감염법, 전기충격법, 미세주사법, 리포좀 융합법, 리포펙타민 및 원형질체 융합법 등의 당 분야에 공지된 여러 방법에 의해 수행될 수 있다. 또한, 형질도입은 감염(infection)을 수단으로 하여 바이러스 입자를 사용하여 목적물을 세포 내로 전달시키는 것을 의미한다. 아울러, 유전자 밤바드먼트 등에 의해 벡터를 숙주세포 내로 도입할 수 있다. 본 발명에서 도입은 형질전환과 혼용되어 사용될 수 있다.
본 발명의 또 다른 하나의 양태는 상기 TodS 변이 단백질 또는 PAS1 변이 단백질을 생산하는 미생물을 제공한다.
상기 변이 단백질에 대해서는 앞서 설명한 바와 같다.
상기 TodS 변이 단백질 또는 PAS1 변이 단백질을 생산하는 미생물은 돌연변이 없이 상기 변이 단백질을 야생형 단백질로 생산하는 미생물뿐만 아니라, 인위적인 및/또는 자연적인 돌연변이에 의해 상기 변이 단백질을 생산하게 된 미생물을 포함한다. 구체적으로, 상기 TodS 변이 단백질 또는 PAS1 변이 단백질을 생산하는 미생물은 슈도모나스(Pseudomonas) 속 미생물, 더욱 구체적으로 슈도모나스 푸티다(Pseudomonas putida)일 수 있으나, 이에 제한되지 않는다.
본 발명의 또 다른 하나의 양태는 (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 방향족 탄화수소 감지용 바이오센서를 제공한다:
(a) 방향족 탄화수소와 특이적으로 결합하는 상기 PAS1 변이 단백질을 포함하는 제1모듈;
(b) 제1모듈에 방향족 탄화수소가 결합시 신호를 발생 및 전달하는 제2모듈;
(c) 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d) 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.
본 발명의 PAS1 변이 단백질이 방향족 탄화수소와 특이적으로 결합하여 키나아제 단백질의 자기인산화를 유도하여 인산 신호를 발생 및 전달시키면, 상기 전달된 신호에 의해 전사조절인자가 활성화되어 표지 단백질의 프로모터에 결합하여 표지 단백질을 발현시킨다. 즉, 제1모듈 내지 제4모듈을 포함하는 센서용 모듈 조합에 의해 방향족 탄화수소의 종류에 따라 표지 단백질이 발현되므로, 상기 모듈 조합을 포함하는 바이오센서는 방향족 탄화수소 감지 용도로 사용될 수 있다.
상기 변이 단백질, 벡터 및 방향족 탄화수소에 대해서는 앞서 설명한 바와 같다.
상기 제2모듈의 신호는 PAS1 변이 단백질이 특정 방향족 탄화수소와 특이적으로 결합함에 따라 발생하는 신호를 의미한다. 구체적으로 제2모듈의 신호는 PAS1 변이 단백질과 특정 방향족 탄화수소의 결합에 의해 키나아제 단백질이 자기인산화되어 발생 및/또는 전달될 수 있으며, 더욱 구체적으로 1차 키나아제 단백질(HK 1)의 자기인산화에 의해 발생된 인산 신호가 반응 조절자(response regulator, RRR), PAS2 단백질, 및 2차 키나아제 단백질(HK 2)로 이루어진 군에서 선택되는 하나 이상의 단백질을 통해 전달될 수 있다. 또한, 상기 키나아제 단백질, 반응 조절자 및 PAS2 단백질은 인산 신호를 발생 및/또는 전달할 수 있는 한 특별히 제한되지 않으나, 구체적으로 슈노모나스 속 미생물, 더욱 구체적으로 슈도모나스 푸티다 유래일 수 있다.
또한, 상기 제2모듈은 본 발명의 TodS 변이 단백질 중에서 PAS1 변이 단백질을 제외한 단백질을 포함할 수 있다. 그 예로는 자기인산화에 의해 인산 신호를 발생 및/또는 전달할 수 있는 한, 본 발명의 TodS 변이 단백질 중에서 PAS1 변이 단백질을 제외한 단백질의 아미노산 서열과 70% 이상, 구체적으로는 80% 이상, 더욱 구체적으로는 95% 이상, 가장 구체적으로는 97%, 98% 또는 99% 이상의 유사성을 나타내는 아미노산 서열을 가지는 단백질도 포함할 수 있다.
본 발명에서 제3모듈은 제2모듈로부터 전달된 인산 신호에 의해 인산화되어 활성화되는 전사조절인자를 포함한다. 상기 활성화되는 전사조절인자는 표지 단백질을 발현시킬 수 있는 한 제한되지 않으나, 구체적으로 TodT 단백질일 수 있으며, 더욱 구체적으로 슈노모나스 속 미생물 유래, 더더욱 구체적으로 슈도모나스 푸티다 유래일 수 있다. 또한, 상기 TodT 단백질의 아미노산 서열 및 염기서열과 같은 정보는 NCBI GenBank와 같은 데이터베이스로부터 얻을 수 있으며, 그 예로 서열번호 9로 표시된 아미노산 서열 또는 서열번호 10으로 표시되는 염기서열일 수 있다. 또한, 상기 TodT 단백질은 상기 서열번호 9의 아미노산 서열 또는 서열번호 10의 염기서열을 가지는 단백질뿐만 아니라, 이와 80% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 보다 더욱 구체적으로는 97%, 98% 또는 99% 이상의 상동성을 갖는 아미노산 서열 또는 염기서열을 포함할 수 있다. 이러한 상동성을 갖는 서열로서 실질적으로 서열번호 9 또는 서열번호 10의 단백질과 동일하거나 상응하는 생물학적 활성을 갖는 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 서열을 갖는 경우도 본 발명의 범주에 포함됨은 자명하다.
본 발명에서 제4모듈은 제3모듈에 의해 표지 단백질을 발현시키는 모듈을 의미한다. 구체적으로, 상기 단백질의 발현은 제3모듈의 인산화되어 활성화된 전사조절인자가 표지 단백질을 발현시키는 프로모터에 결합하여 이루어질 수 있다.
구체적으로, 본 발명에서 제4모듈은 제3모듈의 인산화된 전사조절인자가 결합하는 프로모터 및 상기 프로모터와 작동 가능하게 연결된 표지 단백질을 코딩하는 유전자를 포함할 수 있으나, 이에 제한되지 않는다.
상기 프로모터는 인산화된 전사조절인자가 결합하여 표지 단백질을 발현시킬 수 있는 한 제한되지 않으나, 구체적으로 todX 프로모터일 수 있으며, 더욱 구체적으로 슈노모나스 속 미생물 유래, 더더욱 구체적으로 슈도모나스 푸티다 유래일 수 있다. 또한, 상기 todX 프로모터의 염기서열과 같은 정보는 NCBI GenBank와 같은 데이터베이스로부터 얻을 수 있으며, 그 예로 서열번호 7으로 표시된 염기서열일 수 있다. 또한, 상기 todX 프로모터는 상기 서열번호 7의 염기서열을 가지는 프로모터뿐만 아니라, 이와 80% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 보다 더욱 구체적으로는 97%, 98% 또는 99% 이상의 상동성을 갖는 염기서열을 포함할 수 있다. 이러한 상동성을 갖는 서열로서 실질적으로 서열번호 7의 프로모터와 동일하거나 상응하는 생물학적 활성을 갖는 염기서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 염기서열을 갖는 경우도 본 발명의 범주에 포함됨은 자명하다.
또한, 상기 표지 단백질은 구체적으로 형광단백질 및 변종(GFP, YFP, RFP, CFP 등), 알칼라인 포스파타제(alkaline phosphatase), 반딧불 루시퍼라제(firefly luciferase), 생물 발광의 미생물(비브리오(Vibrio), 제노르하브두스(Xenorhabdus), 포토르하브두스(Photorhabdus), 및 포토박테리움(Photobacterium) 등) 및 베타-갈락토시다아제(β-galactosidase)로 구성된 군으로부터 선택되는 하나 이상일 수 있으며, 더욱 구체적으로는 베타-갈락토시다아제일 수 있으나, 이에 제한되지 않는다.
본 발명에서 방향족 탄화수소 감지용 바이오센서로 사용될 수 있는 미생물은 제1모듈 내지 제4모듈의 모듈 조합을 포함하여 방향족 탄화수소에 따라 특이적으로 표지 단백질을 발현시킬 수 있는한 제한되지 않으나, 구체적으로 슈노모나스 속 미생물, 더더욱 구체적으로 슈도모나스 푸티다일 수 있다.
본 발명에서 바이오센서는 추가로 표지 단백질의 발현을 측정할 수 있는 물질을 포함할 수 있으나, 이에 제한되지 않는다.
본 발명의 일 실시예에서는 슈도모나스 퓨티다 KT2440 염색체의 mexC 유전자에 TodT 결합 프로모터 P tod X, β-갈락토시다아제의 유전자 lacZ, 및 스트렙토마이신 저항 유전자 Sm R로 구성된 카세트(P todX -lacZ-Sm R)가 삽입되어 있는, 슈도모나스 퓨티다 KT24400-PXZ 리포터 균주를 제작하였고, 상기 리포터 균주에 PAS1 내 톨루엔 결합부위에 위치-지정 돌연변이를 일으킨 TodS/TodT 플라스미드를 형질전환시켜 슈도모나스 형질전환체들을 제작하였다. 상기 슈도모나스 형질전환체들을 96-웰 딥 플레이트(96-well deep plate)에 배양하고, 효능제인 톨루엔, 스티렌, m-자일렌 또는 길항제인 o-자일렌, 1,2,4-TMB 리간드를 각각 가스형태로 공급하여 생체 내 β-갈락토시다아제 단백질 생성을 유도한 후, 4-MUG(4-methylumbelliferyl β-galactopyranoside) 기질을 이용하여 β-갈락토시다아제 단백질의 활성을 측정하였다(실시예 6). 그 결과, 서열번호 1의 아미노산 서열에서I114V 또는 Q61R로 변형된 PAS1 또는 TodS 변이 단백질을 포함하는 슈도모나스 형질전환체들은 각각 m-자일렌과 o-자일렌 등에 대한 β-갈락토시다아제 활성이 매우 증가하여 상기 방향족 탄화수소 감지용 바이오센서로 사용될 수 있음을 알 수 있었다(실험예 10).
본 발명의 또 다른 하나의 양태는 (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; 또는 (iii) 상기 발현 카세트를 포함하는 벡터를 포함하는 미생물을 함유하는, 방향족 탄화수소 분해용 미생물 제제를 제공한다:
(a) 방향족 탄화수소와 특이적으로 결합하는 본 발명의 PAS1 변이 단백질을 포함하는 제1모듈;
(b) 제1모듈에 방향족 탄화수소가 결합시 신호를 발생 및 전달하는 제2모듈;
(c) 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d) 상기 인산화되는 제3모듈에 의해 방향족 탄화수소 분해 단백질을 발현시키는 제4모듈.
본 발명의 방향족 탄화수소 분해용 미생물 제제의 모듈 조합은 상기 바이오센서의 모듈 조합에서 제4모듈의 표지 단백질이 방향족 탄화수소 분해 단백질로 교체되어 있는 형태이다. 즉, 제1모듈 내지 제4모듈을 포함하는 모듈 조합에 의해 방향족 탄화수소의 종류에 따라 방향족 탄화수소 분해 단백질이 발현되므로, 상기 모듈 조합을 포함하는 미생물 제제는 방향족 탄화수소를 분해하는 데에 사용될 수 있다.
상기 변이 단백질, 벡터, 방향족 탄화수소, 제1모듈, 제2모듈 및 제3모듈에 대해서는 앞서 설명한 바와 같다.
상기 제4모듈의 방향족 탄화수소 분해 단백질은 방향족 탄화수소를 분해하는 것으로 알려진 다양한 단백질 중에서 선택할 수 있으며, 1 종의 방향족 탄화수소를 분해하기 위해 필요한 2 이상의 단백질이거나, 또는 2 이상의 방향족 탄화수소를 분해할 수 있는 하나 이상의 단백질 일 수 있으나, 이에 제한되지 않는다.
구체적으로, 제4모듈의 방향족 탄화수소 분해 단백질은 톨루엔을 분해하는 데에 필요한 톨루엔 디옥시게나아제(toluene dioxygenase, todABC1C2), cis-톨루엔 디하이드로다이올 디하이드로게나아제(cis-toluene dihydrodiol dehydrogenase, todD), 30-메틸카테콜 2,3,-디옥시게나아제(30-methylcatechol 2,3,-dioxygense, todE) 및 2-하이드록시-6-옥소-2,4-헥타다이에노에이트 하이드롤라아제(2-hydroxy-6-oxo-2,4-heptadienoate hydrolase, todF)로 이루어진 군에서 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.
또한, 구체적으로, 제4모듈의 방향족 탄화수소 분해 단백질은 스티렌을 분해하는 데에 필요한 스티렌 모노옥시게나아제(styrene monooxygenase, styAB), 스티렌 옥시드 이소머라아제(styrene oxide isomerase, styC), 페닐아세트알데히드 디하이드로게나아제(penylacetaldehyde dehydrogenase, styD), 및 페닐아세틸 코에이 리가아제(phenylacetyl coA ligase, paaF2)로 이루어진 군에서 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.
또한, 구체적으로, 제4모듈의 방향족 탄화수소 분해 단백질은 m-자일렌을 분해하는 데에 필요한 자일렌 모노옥시게나아제(xylene monooxygenase), 벤질 알콜 디하이드로게나아제(benzyl alcohol dehydrogenase), 벤즈알데하이드 디하이드로게나아제(benzaldehyde dehydrogenase), 톨루에이트 디옥시게나아제(toluate dioxygenase), 및 1,2-디하이드록시-3-메틸시클로헥사-3,5-디엔카르복실레이트 디하이드로게나아제(1,2-dihydroxy-3-methylcyclohexa-3,5-dienecarboxylate dehydrogenase)로 이루어진 군에서 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.
또한, 구체적으로, 제4모듈의 방향족 탄화수소 분해 단백질은 o-자일렌을 분해하는 데에 필요한 자일렌 모노옥시게나아제(xylene monooxygenase), 벤질 알콜 디하이드로게나아제(benzyl alcohol dehydrogenase), 벤즈알데하이드 디하이드로게나아제(benzaldehyde dehydrogenase), 톨루에이트 디옥시게나아제(toluate dioxygenase), 1,2-디하이드록시-6-메틸시클로헥사-3,5-디엔카르복실레이트 디하이드로게나아제(1,2-dihydroxy-6-methylcyclohexa-3,5-dienecarboxylate dehydrogenase), o-자일렌 3,4-디옥시게나아제(o-xylene 3,4-dioxygenase), 카테콜 2,3-디옥시게나아제(catechol 2,3-dioxygenase), o-자일렌 4,5-디옥시게나아제(o-xylene 4,5-dioxygenase), 및 4,5-디메틸카테콜 2,3-디옥시게나아제(4,5-dimethylcatechol 2,3-dioxygenase)로 이루어진 군에서 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.
본 발명에서 방향족 탄화수소 분해용 미생물 제제로 사용될 수 있는 미생물은 상기 제1모듈 내지 제4모듈의 모듈 조합을 포함하여 방향족 탄화수소에 따라 특이적으로 분해 단백질을 발현시킬 수 있는 한 제한되지 않으나, 구체적으로 슈노모나스 속 미생물, 더더욱 구체적으로 슈도모나스 푸티다일 수 있다.
또한, 슈도모나스 속 미생물은 톨루엔 이외에도 스티렌의 이화작용을 위하여 styABCD 오페론을 필요로 하고, styABCD 오페론은styS/styR 2개 인자 신호전달 체계에 의해 조절 받는다. 스티렌에 의해 styS는 styR을 인산화시켜 sty 오페론의 발현을 상향조절 하지만, styS는 또한 스티렌보다 선호하는 글루코스에 존재 하에서는 sty 오페론의 발현을 저해하기도 한다. StyS 역시 TodS와 같이 센서 키나아제로 기능하며, 스티렌 결합은 PAS 도메인에서 이루어질 것으로 추정된다. 따라서, 톨루엔과 결합하는 PAS1 단백질의 입체구조 정보를 기반하여 재설계하여 제작된 PAS1 변이 단백질은, 스트렌 결합에 의해 특이적으로 반응하는 StyS로 도입되어 토양 내 스티렌 오염물질을 분해하는 미생물 균주의 제작을 가능하게 할 수 있다.
본 발명의 또 다른 하나의 양태는 상기 바이오센서를 포함하는, 방향족 탄화수소 감지용 조성물을 제공한다.
본 발명의 또 다른 하나의 양태는 상기 미생물 제제를 포함하는, 방향족 탄화수소 분해용 조성물을 제공한다.
본 발명의 또 다른 하나의 양태는 상기 바이오센서를 시료에 노출시키는 단계를 포함하는, 방향족 탄화수소 감지방법을 제공한다.
본 발명의 바이오센서는 시료에 함유된 방향족 탄화수소의 종류에 따라 표지 단백질이 발현되므로, 발현된 표지 단백질을 측정하여 특정 방향족 탄화수소를 감지할 수 있다.
본 발명의 방향족 탄화수소 감지방법은 추가적으로 바이오센서의 표지 단백의 발현 수준을 측정하여 대조군과 비교하는 단계를 포함할 수 있다.
또한, 본 발명의 방향족 탄화수소 감지방법은 추가적으로 표지 단백의 발현 수준이 대조군에 비하여 증가하는 경우, 시료에 방향족 탄화수소가 존재하는 것으로 판단하는 단계를 포함할 수 있다.
본 발명의 또 다른 하나의 양태는 상기 미생물 제제를 이용하여 방향족 탄화수소를 분해하는 단계를 포함하는, 방향족 탄화수소 분해방법을 제공한다.
본 발명의 미생물 제제는 방향족 탄화수소의 종류에 따라 방향족 탄화수소 분해 단백질이 발현되므로, 특정 방향족 탄화수소를 분해할 수 있다.
본 발명의 또 다른 하나의 양태는 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질을 결정화시키는 단계를 포함하는, PAS1 단백질을 결정화시키는 방법과, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질과 톨루엔 또는 1,2,4-TMB(1,2,4-Trimethylbenzene)의 혼합물을 결정화시키는 단계를 포함하는, PAS1 단백질과 톨루엔 또는 1,2,4-TMB의 복합체를 결정화시키는 방법을 제공한다.
상기 PAS1 단백질 단독의 결정체('Apo-PAS1'으로 명명), 나아가 상기 TodS의 PAS1 단백질 부위에 결합하는 리간드인 톨루엔 및 1,2,4-TMB(1,2,4-Trimethylbenzene) 각각과 PAS1 단백질의 복합체의 결정체의 제조 방법에 대한 본 발명의 구체적인 내용은 하기와 같다.
본 발명에서 용어, " Apo-PAS1"은 PAS1 단백질 단독으로 형성된 결정체를 의미한다. 본 발명의 일 구현예에 따르면 PAS1 단백질은 리간드가 없는 상태에서도 두 분자의 이량체로 존재하나, 아미노산 150번에서 168번 사이의 구조는 유연성이 높다.
본 발명에서 용어, "SeMet-PAS1 단백질"은 PAS1의 메티오닌이 셀레노메티오닌(selenomethionine, SeMet)으로 치환된 단백질을 의미한다. 상기 셀레노메티오닌이란, 메티오닌을 구성하는 황(32S)을 동족원소인 셀레늄(75Se)으로 치환한 아미노산을 말한다. 셀레노메티오닌은 원래의 메티오닌과 유사한 동태 및 화학적 성질을 보이며, X-선 결정학에서 현재까지 밝혀진 유사한 형태의 입체구조가 없을 경우 3차원적 결정 구조를 얻기 위한 위상문제 해결을 위해 사용된다. 이러한 단백질의 구조를 분석하기 위해 메티오닌을 셀레노메티오닌으로 치환하여 결정화하는 방법을 셀레노메티오닌법이라고 지칭하기도 한다. 본 발명의 일 실시예에서는 톨루엔과의 복합체 제조에 있어서 결정화된 단백질의 위상문제를 해결하기 위해, 단백질을 구성하는 메티오닌이 셀레노메티오닌으로 치환된 SeMet-PAS1을 제조하여 톨루엔과 혼합하여 결정화하였다. 상기 셀레노메티오닌(selenomethionine, SeMet)-치환 PAS1 단백질을 얻기 위해서, 메티오닌 영양 요구체 E. coli B834(DE3) 균주(Novagen)를 50mg/ml의 SeMet을 첨가한 최소 배지에서 배양하였다. 상기 배양한 배양물에서 SeMet-치환 PAS1 단백질은 5mM 메티오닌을 모든 버퍼에 첨가하여 정제-수득하였다.
본 발명에서 용어, "톨루엔(toluene)"은, 방향족탄화수소로서 벤젠의 수소 하나가 메틸기로 치환된 무색의 휘발성, 가연성 액체, 메틸벤젠을 말한다. 상기 톨루엔, 대부분 석유로부터 촉매 개량방법에 의해 생산되나, 일부는 에틸렌과 프로필렌 제조 과정에서 가솔린 열분해 과정을 통해 분리 생산된다. 상기 톨루엔은 C6H5CH3의 화학식을 가질 수 있다.
본 발명에서 용어, "SeMet-PAS1 단백질과 톨루엔의 복합체"는 SeMet-PAS1 단백질과 톨루엔 간의 상호작용에 의해 형성된 복합체를 의미한다. 구체적으로는 PAS1 단백질의 소수성 리간드 결합 부위의 46번 페닐알라닌(phenylalanine), 48번 글라이신(glycine), 59번 발린(valine), 63번 알라닌(alanine), 79번 페닐알라닌, 84번 트립토판(tryptophan), 85번 트립토판, 114번 아이소류신(isoleucine), 126번 발린, 128번 페닐알라닌, 145번 알라닌, 147번 글라이신과 톨루엔이 수소 결합(Hydrogen bond) 또는 물 분자-매개 수소 결합에 의하여 형성된 복합체를 의미할 수 있으나, 이에 제한되지 않는다.
본 발명의 구체적인 일 실시예에서는 SeMet-PAS1 단백질과 톨루엔 간의 결합 구조를 본 발명에서 제작한 결정체 구조를 분석하여 확인하였다. 구체적으로, 톨루엔이 PAS1 소수성 리간드 결합 부위에 결합하는 것을 확인하였다. 두 SeMet-PAS1 단량체들 간에 밀접한 결합은 각 SeMet-PAS1 단량체 47번 발린, 49번 류신 및 131번 류신을 통해 일어났다. 또한, PAS1 단백질에 리간드 결합이 일어날 때 나타난 46번 페닐알라닌, 146번 글루탐산과 148번 알지닌의 구조 변화는 TodS 단백질 이량체의 형태 변화와 tod 오페론 유전자들로의 신호 전달에 매우 중요하였다. 더욱이, 톨루엔 리간드의 벤젠 링은 46번 페닐알라닌, 79번 페닐알라닌, 84번 트립토판, 85번 트립토판, 128번 페닐알라닌에 의해 형성된 공간에 위치하며, 63번 알라닌, 114번 아이소류신, 126번 발린, 147번 글라이신도 톨루엔과의 결합에 중요한 역할을 하였다. 또한 톨루엔의 메틸 그룹은 48번 글라이신, 59번 발린, 145번 알라닌 아미노산 잔기들에 둘러싸여 있음을 확인하였다.
본 발명에서 용어, "1,2,4-TMB(1,2,4-trimethylbenzene)"는, 가연성 방향족 탄화수소로서 세 개의 메틸기로 포함하는 무색의 휘발성 액체 형태일 수 있다. 상기 1,2,4-TMB는 대부분 석유나 석탄으로부터 생산된다. 상기 1,2,4-TMB는 C9H12의 화학식을 가질 수 있다. 본 발명에서 1,2,4-TMB는 PAS1 단백질과 결합할 수 있으며, 상기 결합에 의하여 PAS1 단백질의 구조변화에 의해 나타나는 TodS 단백질의 형태 변화(conformational change)가 TodS 단백질의 자가 인산화과정을 불활성화 시키는 것일 수 있으나, 이에 제한되지 않는다.
본 발명에서 용어, "PAS1 단백질과 1,2,4-TMB의 복합체"는 PAS1 단백질과 1,2,4-TMB 간의 상호작용에 의해 형성된 복합체를 의미한다. 1,2,4-TMB 리간드도 톨루엔과 같이 PAS1 단백질의 소수성 리간드 결합 부위의 46번 페닐알라닌, 48번 글라이신, 59번 발린, 63번 알라닌, 79번 페닐알라닌, 84번 트립토판, 85번 트립토판, 114번 아이소류신, 126번 발린, 128번 페닐알라닌, 145번 알라닌, 또는/및 147번 글라이신과 수소 결합(Hydrogen bond) 또는 물 분자-매개 수소 결합을 하여, 상기 복합체를 형성할 수 있으나, 이에 제한되지 않는다.
본 발명에서 용어, "결정화"를 이룰 수 있게 한다는 것 또는 "결정성"을 갖는다는 것은 단백질을 X-선 단백질 3차 구조 분석을 위한 적합한 상태로 만들어주기 위해 단백질 분자에 변이를 도입하는 등으로 균일한 액상으로부터 일정한 모양과 크기를 갖는 고체입자를 형성하게 하거나 단백질의 결정 상태를 더욱 안정하게 하는 것을 말한다. 단백질의 3차원 구조는 단백질의 생체 내 작용을 이해하고, 분자기전을 규명하는데 매우 중요하다. 즉, 고분자인 단백질을 구성하는 원자의 배열과 3차원 구조를 안다면, PAS1 단백질과 톨루엔 복합체의 3차 구조 분석이 가능하며 PAS1 단백질과 톨루엔 간의 특이적 결합 부위 조절을 통해 리간드 특이성의 확대 및 민감도 증대를 가능하게 하는 신기능의 감지센서 제작의 기반을 마련할 수 있다. 그러나, 단백질, 또는 단백질과 리간드 복합체의 3차 구조의 구조 규명은 일반적으로 매우 어려웠다. 이는, PAS1 단백질 단독 또는 이의 복합체의 3차 구조 분석을 위해서는 먼저 해당 단백질을 결정체로 만들어야 하며, 이를 분석해야 하기 때문이다. 또한, 안정적인 결정체를 수득할 수 있는지 여부는 단백질의 종류에 따라 달라지며, 특히 결정화 조건은 단백질에 따라 전혀 다를 수 있기 때문이다.
상기 단계에서 결정화시키는 방법은 공지의 다양한 결정화 방법을 이용할 수 있으며, 구체적으로 증기 확산법(vapor diffusion method)에 의해 수행될 수 있다. 상기 증기 확산법은 시팅 드롭 증기 확산법(sitting drop vapo-diffusion method) 또는 방울 혼합 증기 확산법(Hanging-drop vapor diffusion method)을 포함하며, 더욱 구체적으로 시팅 드롭 증기 확산법에 의해 수행될 수 있으나, 이에 제한되지 않는다.
본 발명에서 용어, "시팅 드롭 증기 확산법"이란 밀폐된 공간에 모액의 작은 방울과 훨씬 큰 규모의 저수조(reservoir) 용액이 분리된 채 공존할 때, 이들 사이에 물 또는 다른 휘발성 물질의 이동이 일어나게 되고, 단백질의 용액조건에서 슈퍼포화상태가 되며, 그러한 열역학적 준안정 상태에서 침전제의 변화에 따라 단백질이 침전되는 것을 이용한 결정화 방법이다. 단백질이 침전될 때, 그 속도가 느리게 진행되면서 안정된 결정화 상태가 되고, 침전제로 알려져 있는 것은 농축상태의 단백질 용액의 용해도를 줄여 주는 역할을 하게 되며, 단백질 분자 주위의 상대적인 흡착층을 감소시키기 위하여 단백질들은 서로 모여들며 이것이 결정을 형성하게 된다. 저수조 용액은 이와 같은 침전제, 완충액, 염, 계면활성제(detergent) 등이 여러 농도로 섞여 있게 되는데, 단백질 용액과 이런 다양한 조건의 저수조 용액이 보통의 경우 1:1의 비율로 섞어 방울을 형성하게 되고, 이렇게 얻어진 방울을 마이크로브릿지(microbrige) 위에 놓은 후 밀봉한다. 이때, 초기에는 방울 중 단백질의 농도가 저수조 용액의 농도와 차이가 있어서 단백질이 결정 상태로 존재하지 않는다. 이렇게 밀봉된 상태로 놓아두면 서서히 평형이 이루어지고, 상기에 설명한 원리에 의해 특정상태의 조건에서 결정이 형성될 수 있는 것이다. 이와 같은 시팅 드롭 증기 평형법에서 저수조 용액 중의 침전제뿐만 아니라 염, 완충액 및 계면활성제의 종류와 적정 농도, 용액의 pH 및 실험온도는 단백질의 종류에 따라 달리 선택되고 경우에 따라서는 단백질의 결정형성에 있어서 아주 중요한 요소가 된다.
본 발명에서 용어, "방울 혼합 증기 확산법(Hanging-drop vapor diffusion method)"은 단백질의 결정화 방법 중 하나로서, 단백질 구조를 분석하기에 충분한 크기의 결정을 제공하는 방법이다. 방울 혼합 증기 확산법은 샘플이 포함된 시약과 액체 상태의 순수한 시약을 증기 평형 상태에 있는 용기 상단에 부착한다. 용기에 비해 시약의 함량이 적은 샘플이 평형에 도달하기 위해서, 샘플에 포함된 물이 용기로 떨어지게 하므로 액체 상태의 시약과 농도가 같아질 때까지 샘플에 함유된 물이 제거되고, 결과적으로 평형 상태에 도달한 단백질 결정을 얻을 수 있다.
본 발명의 일 실시예에서는 시팅 드롭 증기 확산법을 이용하여 PAS1 단백질의 결정체(Apo-PAS1), SeMet-PAS1 단백질과 톨루엔의 복합체, 및 PAS1 단백질과 1,2,4-TMB 복합체의 결정체를 수득하였다.
본 발명은 PAS1 단백질 단독 또는 이의 톨루엔 또는 1,2,4-TMB 복합체의 결정체를 제조할 수 있는 최적화된 방법을 제공한다. 상기 방법은 시팅 드롭 증기 확산법을 통해 수행될 수 있다.
구체적으로, 상기 PAS1 단백질과 톨루엔 또는 1,2,4-TMB를 1:2 내지 1:20(PAS1 단백질: 톨루엔 또는 1,2,4-TMB), 보다 구체적으로는 1:2의 몰비율로 혼합한 것일 수 있다.
본 발명의 방법에 사용되는 상기 PAS1 단백질은 별도로 발현시키거나 천연에 존재하는 단백질을 정제하는 과정을 통해 수득된 단백질일 수 있으며, 상기 정제는 당업계에 잘 알려진 정제 방법일 수 있다. 따라서, 상기 방법에서 결정화시키는 단계를 수행하기에 앞서, PAS1 단백질을 정제하는 단계를 포함할 수 있으며, 상기 단백질의 정제는 친화성 크로마토그래피 등 공지의 정제 방법에 의하여 수행될 수 있다. 예컨대, 면역친화성 크로마토그래피, 수용체 친화성 크로마토그래피, 소수성 작용 크로마토그래피, 렉틴 친화성 크로마토그래피, 크기배제 크로마토그래피, 양이온 또는 음이온 교환 크로마토그래피, 고성능 액체 크로마토그래피(HPLC) 및 역상 HPLC 등을 포함하는 종래의 크로마토그래피 방법에 의해 숙주 세포가 자라는 배지에서 분리될 수 있다. 또한, PAS1 단백질에 특이적 태그, 라벨 또는 킬레이트 모이어티를 융합하여 융합 단백질을 수득하여 특이적 결합 파트너 또는 제제에 의해 인식하여 정제하는 방법이 있다. 정제된 단백질은 원하는 단백질 부분으로 절단되거나 그 자체로 남아있을 수 있다. 융합 단백질의 절단으로 절단 과정에서 부가적인 아미노산을 가지는 원하는 단백질 형태가 만들어질 수 있다
또한 구체적으로, 상기 결정화는 암모늄 포스페이트 및 트리스 하이드로클로라이드를 포함하는 저수조 용액 조건 하에서 이루어지는 것일 수 있다.
보다 구체적으로, 상기 결정화는 2.8 내지 3.0M 암모늄 포스페이트(예, ammonium phosphate dibasic, trihydrate) 및 0.01 내지 0.1M, 구체적으로는 0.1M 트리스 하이드로클로라이드(Tris-Hydrochloride, pH 8.0 내지 8.5)를 포함하는 용액 조건에서 이루어지는 것일 수 있다.
상기와 같은 조성을 가진 저수조 용액에, PAS1 단백질 또는 이의 리간드를 추가로 포함하는 단백질 용액을 첨가하여 이를 혼합하고, 평형화하여 결정체를 제조할 수 있다.
상기 PAS1 단백질을 포함하는 단백질 용액은 PAS1 단백질을 5 내지 10 mg/ml의 농도로 포함할 수 있으나, 이에 제한되지 않는다. 또한, 상기 단백질 용액은 10 mg/ml의 농도로 PAS1 단백질을 포함하는 용액일 수 있다.
상기 저수조 용액에 단백질 용액을 혼합하는 경우에는, 저수조 용액과 단백질 용액이 바람직하게는 1:1의 비율이 되도록 혼합하나, 이에 제한되지 않는다.
이와 같이 혼합한 용액을 저수조 위쪽을 밀폐한 커버슬립 아래, 또는 용기 상단에 부착하여 결정체가 커지도록 할 수 있다.
여기서, 상기 결정화시키는 단계는 얼음 위에서 1 내지 24시간, 그 예로 1 내지 2시간 동안 정치시키는 것을 통해 이루어지는 것일 수 있다. 본 발명의 일 실시예에서는, 21℃에서 시팅 드랍 증기 확산법을 이용한 정제된 PAS1과 톨루엔을 1:2 몰비율로 혼합하여 1시간 동안 얼음상에 정치시켜 복합체를 얻을 수 있었다. 상기 단백질의 결정화는 3.0M 암모늄 포스페이트(ammonium phosphate dibasic, trihydrate), pH 8.0의 0.1M 트리스 하드로클로라이드(Tris-Hydrochloride) 조건하에서 최적 형성되었다.
본 발명의 또 다른 하나의 양태는 PAS1 단백질 결정체, SeMet-PAS1 단백질과 톨루엔 복합체의 결정체 및 PAS1 단백질과 1,2,4-TMB 복합체의 결정체를 제공한다.
상기 PAS1, SeMet-PAS1, 톨루엔, 1,2,4-TMB, 복합체 및 결정체에 대해서는 앞서 설명한 바와 같다.
구체적으로, 상기 PAS1 단백질 결정체는 공간군(space group)이 P21이고, 단위 셀 디멘션(unit-cell dimension)은 a=41.114Å, b=49.314Å, c=56.222Å, α=90°, β=109.22°, γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질 결정체일 수 있다.
또한, 구체적으로 상기 SeMet-PAS1 단백질과 톨루엔 복합체의 결정체는 공간군이 P212121이고, 단위 셀 디멘션은 a=41.342Å, b=47.744Å, c=126.522Å, α=β=γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질 중 메티오닌이 셀레노메티오닌인 SeMet-PAS1 단백질과 톨루엔 복합체의 결정체일 수 있다.
또한, 구체적으로 상기 PAS1 단백질과 1,2,4-TMB 복합체의 결정체는 공간군이 P212121이고, 단위 셀 디멘션은 a=45.387Å, b=51.016Å, c=100.728Å, α=β=γ=90°인, 서열번호 1의 TodS 단백질로부터 43번째 내지 168번째 아미노산 서열을 가지는 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 결정체일 수 있다.
본 발명에서 용어, "공간군(space group)"이란 결정의 단위 세포(unit cell)의 대칭(symmetry)을 의미하며, 대칭요소들을 조합하면 군(group)을 형성한다. 상기 공간은 공간 그룹과 혼용된다.
본 발명에서 용어, "단위 셀 디멘션(unit-cell dimension)"은 격자계수로도 불리며, 단위 셀은 공간군을 구성하는 가장 해석이 용이한 최소 반복 단위(repeating unit)으로, 세 crystallographic axes로 정의되며, 이 세 벡터(vector)에 대한 길이(a, b, c)와 이들이 서로 이루는 각(α, β, γ)을 의미한다. 상기 a, b, c는 각각 A, B 및 C로 표시될 수 있다.
상기 위상정보는 중금속 치환법(Multiple Isomorphous Replacement), 다중파장분석법(Multiwavelength Anomalous Dispersion) 및 구조 치환법(Molecular Replacement) 등을 통해 얻을 수 있다. 첫째, 중금속치환법은 여러 결정을 중금속으로 치환하여 데이터를 모은 후 그 정보를 분석, 위상정보를 얻는 것이다. 둘째, 다중파장분석법은 중금속 대신에 결정 내의 특이적인 금속 또는 원자를 이용하여 여러 파장에서의 그 원자의 변칙(anomalous)을 이용하여 데이터를 모은 후 위상 정보를 얻는 것으로 널리 이용되고 있는 기술 중 하나이다. 즉 여러 결정에서 데이터를 수집하는 번거로움 없이 하나의 결정으로부터 분자생물학적 방법을 이용하여 아미노산 메티오닌이 셀레노메티오닌(Se-Met)으로 치환되어 이 셀레늄 원자를 이용하여 쉽게 데이터를 얻을 수 있으나 이 방법은 꼭 방사광에서만 얻어야 하는 단점이 있다. 셋째, 구조 치환법은 이미 알려진 유사한 구조로부터 위상문제를 해결하는 방법으로, 이는 알려진 구조가 증가함에 따라 널리 이용되는 방법으로서, 각각의 구조를 데이터로부터 얻은 후, 이 데이터와 우리의 모델이 최대한 잘 맞게 해주는 정밀화단계 과정이 진행된다. 이러한 과정은 공지의 여러가지 프로그램(CCP4, Coot, Quanta, CNS 등)을 이용하여 수행되며, 각각의 각도 및 결합길이 등의 표준화 과정이 필요한데, 이 과정에서는 컴퓨터의 성능과 눈으로 보고 직접 모델을 얻어진 전자밀도 지도에 맞추는 과정이 반복 수행된다. 구조 정밀화 작업 후 분석단계에서는 그 구조로부터 여러 가지 정보를 유추 해석해 내며, 이러한 분석단계에서 구조에 바탕을 둔 작용 기작에 대한 연구를 할 수 있으며, 이러한 정확한 작용기작에 대한 연구는 신약개발에 필요한 여러 가지 정보를 얻어내는 기반이 된다. 또한, 그 단백질에 대한 조절화합물과의 복합체의 구조를 통해서는 직접적인 관련 잔기들을 알 수 있으므로, 그 다음 단계의 조절화합물 연구에 중요한 정보를 제공하게 된다.
본 발명의 일 실시예에서는 본 발명의 결정체를 위한 분산 데이터를 Apo-PAS1 단백질은 1.5Å 해상도로 측정하였고. SeMet-PAS1/톨루엔 복합체의 결정체 크리스탈에 대한 단일파장 비정상 회절 데이터는 1.65Å 해상도로, PAS1/1,2,4-TMB 복합결정체 수집하였다. 모든 데이터는 HKL2000 소프트웨어 패키지로 분석하였다. SeMet-PAS1/톨루엔 복합체의 구조는 Se 원자로부터 나오는 비정상 신호를 SOLVE 프로그램으로 분석하여 알아내었다. 밀도 조절 및 순차적 자동화 모델 빌딩 과정은 RESOLVE 프로그램으로 수행하였다. 복합체 결정 구조는 SeMet 결정의 부분 개선 모델을 이용하는 MOLREP 프로그램를 이용하여 분자 치환을 통해 1.65Å 해상도로 밝혔다. 복합체 결정 구조는 COOT 프로그램으로 교정되고 REFMAC5를 이용하여 개선하였다. 이러한 방법으로 얻은 PAS1 단독 단백질(Apo-PAS1), SeMet-PAS1 단백질과 toluene 복합체, PAS1과 1,2,4-TMB 복합체에 대한 원자 좌표 및 구조 인자 진폭(Structure factor amplitudes)는 PDB(Protein Data Bank)에 기탁하였으며, 이에 대한 각각의 접근 코드(Accession code)는 PAS1 단독 단백질 (Apo-PAS1)이 3X18, SeMet-PAS1/toluene 볼합체는 3X19, 또한 PAS1/1,2,4-TMB는 접근 코드가 3X1A이다. 이에 대한 결정체 정보는 표 3에, 원자좌표는 표 4 내지 6에 각각 나타내었다.
본 발명의 또 다른 하나의 양태는 (a) 표 4에 나타낸 PAS1 단백질의 원자좌표, 표 5에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표 또는 표 6에 나타낸 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 원자좌표를 이용하여 PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계; (b) 상기 설계된 3차 구조를 이용하여 PAS1에 결합하는 후보 물질을 생성하는 단계; 및 (c) 상기 후보 물질이 PAS1 단백질 또는 PAS1을 포함하는 TodS 단백질과 리간드 간의 결합을 조절하는지 여부를 확인하는 단계를 포함하는, PAS1 단백질 또는 TodS 단백질과 리간드 간의 결합을 조절하는 물질을 스크리닝하는 방법을 제공한다.
상기 PAS1 단백질, 복합체, 톨루엔, 1,2,4-TMB 등에 대해서는 앞서 설명한 바와 같다.
상기 PAS1 단백질 또는 이의 복합체에 대한 원자좌표는 컴퓨터와 같은 계산 장치로의 연속적인 사용을 위한 매체에 저장될 수 있다. 전형적으로 상기 좌표는 자기 또는 광학매체와 같은 다량의 데이터를 저장하는 데 유용한 매체(즉, 플로피 디스크, 하드 디스크, 컴팩트 디스크, 마그네토-광학 매체 또는 전자 매체 등)에 저장될 수 있다. 이와 관련한 컴퓨터, 저장매체, 네트워킹 및 다른 장치 또는 기술의 선택은 구조/계산 화학 분야의 당업자에게 익숙할 것이다.
상기 스크리닝 방법의 (a) 단계는 상기 복합체에 대한 3차 구조에 대한 원자 좌표 등에 대한 데이터를 적절한 소프트웨어 프로그램과 함께 컴퓨터 상에 입력하는 단계; 및 시각화 및 추가적인 컴퓨터 조작이 가능한 3차원적 단백질 구조로 나타내는 단계를 포함할 수 있으나, 이에 제한되지 않는다.
상기 스크리닝 방법의 (b) 단계는 상기 설계된 3차 구조를 이용하여 PAS1에 결합하는 후보 물질을 생성하는 단계이다.
본 발명에서 규명한 PAS1 단백질 또는 이의 복합체의 3차원 구조를 바탕으로 원자좌표 및/또는 3차원 구조 표시에 대한 데이터를 포함하는 컴퓨터-판독 매체를 이용하여 상호작용 부위를 포함하는 다양한 단백질 부위에 대한 정보를 제공받을 수 있다. 이러한 과정을 통하여 수많은 신약 후보물질들에 대한 실질적인 실험을 수행하지 않고도 그 반응 양상을 예측할 수 있고, 그 결과에 따라 선별된 물질에 한하여 실험을 수행함으로써 신약 개발의 경제성을 증대시킬 수 있다.
본 발명에서 용어, "후보 물질"은 PAS1과 결합할 수 있는 물질인 이상, 방향족 화합물들을 제한 없이 포함한다. 즉, 상기 분석된 PAS1 단백질 또는 이의 복합체의 3차 구조를 기반으로 해당 PAS1 부위에 결합할 수 있는 구조를 가진다고 예측되거나, 결합할 수 있는 구조를 가지도록 합성, 제조 또는 변형된 물질을 제한 없이 포함할 수 있다. 그 예로, PAS1에 결합하는 방향족 탄화수소일 수 있으며, 보다 구체적인 예로 하기 기술하는 방향족 탄화수소일 수 있으나, 이에 제한되지 않는다.
본 발명의 방법에서 상기 (c) 단계는 상기 후보 물질이 PAS1 단백질 또는 PAS1을 포함하는 TodS 단백질과 리간드 간의 결합을 조절하는지 여부를 확인하는 단계이다.
구체적으로, 상기 후보 물질이 단백질과 리간드 간의 결합을 조절하는지 여부는 PAS1 단백질 또는 PAS1 단백질을 포함하는 TodS 단백질을 함유하는, 바이오센서를 이용하여, 후보 물질에 의해 발현되는 표지 단백질의 수준을 측정함으로써 확인할 수 있다.
보다 구체적으로, 상기 (c) 단계는 (i) 하기 (a') 내지 (d')의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 바이오센서를 이용하여, 후보 물질에 의해 발현되는 표지 단백질의 수준을 측정함으로써 수행될 수 있다:
(a') PAS1 단백질을 포함하는 제1모듈;
(b') 제1모듈에 후보 물질이 결합시 신호를 발생 및 전달하는 제2모듈;
(c') 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d') 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.
상기 PAS1 단백질이 후보 물질과 특이적으로 결합하여 키나아제 단백질의 자가인산화를 유도하여 인산 신호를 발생 및 전달시키면, 상기 전달된 신호에 의해 전사조절인자가 활성화되어 표지 단백질의 프로모터에 결합하여 표지 단백질을 발현시킨다. 즉, 제1모듈 내지 제4모듈을 포함하는 센서용 모듈 조합에 의해 후보 물질에 따라 표지 단백질이 발현되므로, 표지 단백질의 발현 수준을 측정하여 PAS1 단백질 또는 TodS 단백질과 리간드 간의 결합을 조절하는 물질을 스크리닝할 수 있다. 본 발명의 일 실시예에서는 표지 단백질로서 베타-갈락토시다아제(β-galactosidase) 단백질을 사용하였다.
이에 따라서, (d) 상기 후보 물질이 대조군에 비하여 표지 단백질의 발현을 증가시키면 TodS의 효능제로, 대조군에 비하여 표지 단백질의 발현을 감소시키면 TodS의 길항제로 판단하는 단계를 추가로 포함할 수 있다.
본 발명의 또 다른 하나의 양태는 (a) 표 4에 나타낸 PAS1 단백질의 원자좌표, 표 5에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표 또는 표 6에 나타낸 PAS1 단백질과 1,2,4-TMB 복합체의 원자좌표를 이용하여 PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계; (b) 상기 설계된 3차 구조를 이용하여 PAS1 변이 단백질을 생성하는 단계; 및 (c) 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합 활성을 측정하는 단계를 포함하는, 야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질을 스크리닝하는 방법을 제공한다.
상기 PAS1 단백질, 복합체, 톨루엔, 1,2,4-TMB, (a) 단계 등에 대해서는 앞서 설명한 바와 같다.
상기 (b) 단계는 설계된 3차 구조를 이용하여 PAS1 변이 단백질을 생성하는 단계이고, 상기 (c) 단계는 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합 활성을 측정하는 단계이다.
구체적으로, 상기 변이 단백질과 주어진 리간드 간의 결합 활성 측정은 바이오센서를 이용하여, 생성된 PAS1 변이 단백질과 리간드의 결합에 의해 발현되는 표지 단백질의 수준을 측정함으로써 수행될 수 있다.
보다 구체적으로, 상기 (c) 단계는 (i) 하기 (a') 내지 (d')의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 바이오센서를 이용하여 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합에 의해 발현되는 표지 단백질의 수준을 측정함으로써 수행될 수 있다.
(a') 리간드와 특이적으로 결합하는 상기 생성된 PAS1 변이 단백질을 포함하는 제1모듈;
(b') 제1모듈에 리간드가 결합시 신호를 발생 및 전달하는 제2모듈;
(c') 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d') 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.
상기 생성된 PAS1 변이 단백질이 리간드와 특이적으로 결합하여 키나아제 단백질의 자가인산화를 유도하여 인산 신호를 발생 및 전달시키면, 상기 전달된 신호에 의해 전사조절인자가 활성화되어 표지 단백질의 프로모터에 결합하여 표지 단백질을 발현시킨다. 즉, 제1모듈 내지 제4모듈을 포함하는 센서용 모듈 조합에 의해 생성된 PAS1 변이 단백질에 따라 표지 단백질이 발현되므로, 표지 단백질의 발현 수준을 측정하여 야생형 PAS1 단백질에 대하여 방향족 탄화수소 결합 활성이 변이된, PAS1 변이 단백질을 스크리닝할 수 있다.
본 발명의 일 실시예에서는 표지 단백질로서 베타-갈락토시다아제(β-galactosidase) 단백질을 사용하였다.
상기 Apo-PAS1 및 SeMet-PAS1 단백질/톨루엔, PAS1/1,2,4-TMB 복합체의 3차 구조의 전부 또는 일부를 이용하는 경우, PAS1 단백질과 톨루엔의 결합에 중요한 PAS1 단백질의 결합부위를 재설계하여 다양한 리간드에 대한 새로운 감지센서를 디자인하여 제작할 수 있다. 본 발명자들이 확인한 바에 따르면, SeMet-PAS1 단백질과 톨루엔의 결합에 의하여 TodS 단백질의 형태변화가 일어나서 TodT의 인산화가 변화되고, TodT의 tod 오페론의 전사조절부위 DNA 간의 결합이 조절된다. 따라서, PAS1 단백질과 톨루엔의 결합을 조절하는 결합부위를 재설계하고, tod 오페론의 활성을 베타 갈락토시다아제 리포터 단백질을 이용해 스크리닝하는 방법으로, 궁극적으로 PAS1 단백질과 tod 오페론의 전사조절을 가능하게 하는 새로운 기질에 대한 PAS1 단백질 내 리간드 결합 부위를 규명하는 스크리닝을 할 수 있다.
또한, 본 발명의 방법은 (d) 야생형 PAS1 단백질의 값에 비해 측정된 리간드 결합 활성이 변화된 경우, 야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질로 판정하는 단계를 추가로 포함할 수 있다.
또한, 톨루엔과 비교하여 PAS1 단백질과 결합하는 친화도가 유사하거나 높은 물질로서, 야생형 PAS1 단백질 대조군에 비하여 결합부위가 재설계된 PAS1 단백질, 즉 PAS1 변이 단백질과 상기 후보 물질의 결합이 높아져, tod 오페론 전사 활성 신호로 기능하는지를 베타 갈락토시다아제 발현에 의해 분해되는 형광물질로 재설계된 결합부위의 민감도를 정량화하여 비교할 수 있다. 이러한 스크리닝을 통해 결합부위의 재설계가 야생형 PAS1의 기능을 유지 또는 증진 시키는 정도와 비교하여 신기능의 방향족 화학물질의 감지센서로 판단할 수 있다. 특히, 상기 톨루엔은 PAS1에 결합하여 tod 오페론의 전사를 활성화 할 수 있다고 알려져 있으므로, 상기 SeMet-PAS1의 구조적 정보를 이용하여 PAS1에 결합하는 다양한 결합친화도를 가진 휘발성 방향성 화학물질들이 PAS1과 결합하지 못하도록 또는 PAS1과 결합하여 톨루엔과 같이 신호를 전달하도록 PAS1의 리간드 결합부위를 재설계할 수 있다. 이에 PAS1의 리간드 결합부위 재설계는 특정 화학물질 대한 결합 친화도를 높이고, 신호전달이 가능한 구조로의 변화를 유도하는 신기능의 감지센서 디자인을 하고 미생물에 도입하여 토양 내 석유오염물질을 지속적으로 모니터링 하거나, 특정 오염물질을 감지하여 분해하는 미생물 리포터 균주를 제작 할 수 있다. 즉, 생물 정화에 사용될 수 있다.
본 발명에서 용어, "생물 정화"는 미생물을 이용해 환경(토양, 대기, 강, 바다)에 축적된 다양한 난분해성 오염물질을 감지하고, 무해화하는 과정으로 미생물을 이용한 환경오염 물질을 정화하는 방법을 지칭한다. 바이오리메디에이션은 경제적이고 환경친화적인 방법으로 환경오염정화 및 복구 방법으로 활용되는 유망 기술의 하나이다. 따라서, 본 발명의 입체구조 정보를 기반으로 설계하여 제작된 PAS1 감지센서들은 벤젠계 방향족 휘발성 환경오염물질을 영양원으로 활용하는 유전자를 포함한 미생물 균주에 도입되어 오염물질 감지 민감도를 증대하고, 분해를 촉진하는 효과를 기대할 수 있다.
본 발명에서 톨루엔의 분해효과는 todS/todT 유전자를 도입한 세균, 특히 슈도모나스 푸티다 KT2440 균 유래의 베타 갈락토시다아제 리포터 발현 균주에서 밝혔으나, PAS1 단백질의 구조변화에 의해 tod 오페론의 발현이 증대됨은, 이 균주에 제한되지 않는다.
이러한 본 발명의 방법에 적용될 수 있는 기질 혹은 리간드는 방향족 탄화수소일 수 있으며, 그 예로 벤젠(benzene), 에틸벤젠(ethylbenzene), 프로필벤젠(propylbenzene), 부틸벤젠(butylbenzene), 니트로벤젠(nitrobenzene), 클로로벤젠(chlorobenzene), 플루오로벤젠(fluorobenzene), 톨루엔(toluene), 스티렌(styrene), o-자일렌(o-xylene), m-자일렌(m-xylene), p-자일렌(p-xylene), o-클로로톨루엔(o-chlorotoluene), m-클로로톨루엔(m-chlorotoluene), p-클로로톨루엔(p-chlorotoluene), o-톨루이딘(o-toluidine), m-톨루이딘(m-toluidine), p-톨루이딘(p-toluidine), 카테콜(catechol), 1,2,4-TMB(1,2,4-Trimethylbenzene), 1,2,3-TMB(1,2,3-Trimethylbenzene), 1,3,5-TMB(1,3,5-Trimethylbenzene), 1-나프톨(1-naphthol) 및 2,3-디히드록시나프탈렌(2,3-dihydroxynaphthalene)으로 이루어진 군으로부터 선택되는 것일 수 있으나, 이에 제한되는 것은 아니다.
본 발명에서 제공하는 PAS1 단백질과 PAS1/1,2,4-TMB 복합체 단백질 결정체 및 SeMet-PAS1/톨루엔 단백질 복합체의 결정체, 결정화시키는 방법 및 이의 3차원적 구조정보는, tod 유전자를 포함하는 다양한 세균의 환경오염정화 관련된 오염물질 분해 유전자들의 발현 증대를 목적하는 신기능의 감지센서 개발에 유용하게 이용될 수 있다. 또한, 본 발명에서 제공하는 PAS1 변이 단백질 또는 이를 포함하는 TodS 변이 단백질은 방향족 탄화수소 감지 및 분해에 유용하게 이용될 수 있다.
도 1a는 PAS1 단백질의 발현을 위해 사용한 아미노산 서열을 나타낸 도이다.
도 1b는 PAS1 단백질이 크기배제 크로마토그래피에서도 이량체 형태로 존재함을 확인한 도이다.
도 1c는 SeMet-PAS1/톨루엔 복합체, PAS1/1,2,4-TMB 복합체의 결정체 유도 및 TodS 변이단백질의 생체 내 신호전달 스크리닝에 사용한 벤젠계 방향족 화학물질을 표시한 도이다.
도 2a는 PAS1 (43 - 168) 단백질(Apo-PAS1)의 이량체 내 대칭 짝을 분석한 도이다.
도 2b는 Apo-PAS1 (43 - 168)의 구조를 리본으로 나타낸 도이다. 비대칭 유닛에는 두개의 PAS1 분자(분자 A 및 분자 B)가 있다.
도 2c는 SeMet-PAS1 (43 - 168)/톨루엔 복합체의 이량체 내 대칭 짝을 분석한 도이다.
도 2d는 PAS1 (43 - 168)/1,2,4-TMB 복합체의 이량체 내 대칭 짝을 분석한 도이다.
도 3은 SeMet-PAS1 (43 - 168) 단백질과 톨루엔 간의 결합을 구조적으로 분석한 도이다. PAS1의 결합에 필수적인 잔기들을 리간드와 함께 나타내었다.
도 4는 SeMet-PAS1 (43 - 168)/톨루엔 복합체 이량체를 구성하는 각 단량체 SeMet-PAS1-A와 SeMet-PAS1-B를 이차원적으로 겹쳐놓았을 때 보이는 구조적 차이를 표시한 도이다.
도 5a는 아고니스트 톨루엔과 복합체를 형성한 TodS PAS1 구조를 나타낸 도이다. 비대칭 단위에 두개의 톨루엔과 결합한 PAS1 분자가 있다. Apo-PAS1의 분자 B에서 정렬되지 않은 부위에 대응되는, 분자 B의 정렬되지 않은 C-말단 알파 헬릭스를 붉은색으로 표시하였다.
도 5b는 톨루엔 결합 포켓을 나타낸 도이다. 포켓은 정전기적 표면 표현(electrostatic surface representation)에서 검은색으로 표시되어 있다. PAS1에 의한 톨루엔 감지의 구체적인 환경을 분자 A 및 분자 B에서 확대하였다. 톨루엔 (붉은색)은 소수성의 PAS1 잔기(녹색)에 의해 둘러싸여 있다.
도 5c는 안타고니스트 1,2,4-TMB와 복합체를 형성한 PAS1의 구조를 나타낸 도이다. 비대칭 단위에 두개의 안타고니스트와 결합된 PAS1 분자가 있다. 1,2,4-TMB 분자는 붉은 색의 탄소 원자로 표시되어 있다. Apo-PAS1의 분자 B에서 정렬되지 않은 부위에 대응되는, 분자 B의 정렬되지 않은 C-말단 부위는 붉은색으로 표시되어 있다.
도 5d는 1,2,4-TMB 결합 포켓을 나타낸 도이다. 포켓은 정전기적 표면 표현에서 검은색으로 표시되어 있다. PAS1에 의한 1,2,4-TMB 결합의 구체적인 환경을 분자 A 및 분자 B에서 확대하였다. 특히, 1,2,4-TMB(붉은색)은 톨루엔 결합 포켓에서와 동일한 소수성 잔기(녹색)에 의해서 둘러싸여 있다. Apo-PAS1에서 소수성 포켓을 형성하기 위해 필요한 대응되는 잔기(노란색)는 톨루엔과 1,2,4-TMB 결합 잔기와 각각 겹쳐져 있다.
도 5e는 톨루엔과 결합하는 PAS1 (23-168)과 그 돌연변이들의 열역학적 파라미터를 나타낸 도이다. ORIGIN 소프트웨어 패키지 (MicroCal Inc., 미국)의 두개의 연속된 결합 모델을 사용하여 얻어졌다. 각 단백질 변이체와 톨루엔의 반응으로부터 생성된 열 데이터에서, 반응 버퍼에 톨루엔을 첨가하여 생성된 열 데이터를 뺐다. 야생형 PAS1(23-168)와 톨루엔 분자의 결합에 대한 대표적인 ITC 프로파일을 왼쪽에 나타내었다.
도 6은 PAS1 (43 - 168) 단백질(Apo-PAS1), PAS1 (43 - 168)/1,2,4-TMB 복합체 및 SeMet-PAS1 (43 - 168)/톨루엔 복합체의 SeMet-PAS1-B 단량체 구조를 겹쳐 놓고, PAS1-B 단백질의 각 리간드 결합 특이적 구조 변화를 원으로 표시한 도이다. SeMet-PAS1/톨루엔 복합체의 경우 톨루엔 결합 시 SeMet-PAS1-B의 E146과 R148의 결합으로 고정된 형태의 α5 헬릭스가 형성된다.
도 7a는 크기배제 크로마토그래피에서 TodS 단백질이 사량체의 크기를 갖는 길고 유연한 형태를 갖는 이량체로 존재함을 확인한 도이다.
도 7b는 C-말단에 His6 태그를 가진 TodS (서열번호 1의 43 - 978번째 아미노산 서열) 단백질을 순수 분리하여, 니켈-골드 분자를 히스티딘 마커와 결합시킨 후 음성 염색하여 전자현미경으로 관찰한 결과를 나타낸 도이다. 도 6b를 통하여 두 개의 골드 분자가 나란히 위치함을 확인하고, TodS 단백질이 이량체로 존재함을 확인하였다(화살표와 원으로 표시).
도 8a는 TodS(43-978) 단백질 단독(Apo-TodS)으로도 이량체로 존재함을 확인한 도이다.
도 8b는 TodS(43-978)/톨루엔 복합체 단백질도 이량체로 존재하나, TodS 단백질 단독으로 존재할 때에 비해, 길이가 길어진 양태를 보이는 것을 확인한 도이다.
도 8c는 TodS(43-978)/1,2,4-TMB 복합체 단백질도 이량체로 존재하나, 대다수의 단백질이 뭉침 현상을 보이는 것을 확인한 도이다.
도 9a는 정제된 TodS (서열번호 1 23 - 978번째 아미노산 서열, TodS(23-978)) 단백질의 사이즈 배제 크로마토그래피 분석 결과를 나타낸 도이다. TodS(23-978)를 표준 분자량 마커인 β-amylase (200kDa), apoferritin (443kDa)과 비교하였다.
도 9b는 TodS(23-978) 단백질(Apo-TodS) 및 이의 복합체(Toluene-TodS, 1,2,4-TMB-TodS)의 분자 외형을 보여주는 전자현미경 사진이다. 스케일 바: 20 nm.
도 10은 리간드 결합 부위를 변이시킨 PAS1 도메인을 포함하는 TodS 변이 단백질들의 리간드 결합 특이적 생체 내 TodS/TodT 2개 인자 신호전달 능력을 검증하기 위한, 96-딥-웰 플레이트 기반 스크리닝 시스템(in vivo β-galactosidase assay system)의 원리를 나타낸 모식도이다.
도 11a는 Azotobacter vinelandii NifL LOV 도메인(PDB ID: 2GJ3)의 구조하에서 모델화된 PAS1의 이량체 구조를 나타낸 도이다. 이량체화에 관여되는 것으로 예측된 소수성 잔기들을 녹색과 회색으로 각각 분자 A와 분자 B에 표시하였다.
도 11b는 이량체화에 관여하는 잔기들을 톨루엔 환경에서 생체내 β-갈락토시다아제 분석 시스템을 사용하여 평가하였다. 모든 결과들을 3번의 독립적인 실험을 통해 얻었다.
도 12a는 정제된 PAS2의 사이즈 배제 크로마토그래피 분석결과를 나타낸 도이다. 정제된 PAS2를 표준 분자량 마커인 카보닉 언하이드라제(carbonic anhydrase, 29 kDa)와 비교한 결과, 용액에서 이량체로서 분석되었다.
도 12b는 Azotobacter vinelandii NifL LOV 도메인 (PDB ID: 2GJ3)의 이량체 구조(녹색, 청록색)에 기초하여 모델화된 PAS2 구조(자홍색)를 나타낸 도이다. 각 NifL PAS 도메인에 결합한 FAD를 나타내었다. 이량체화에 관여하는 것으로 예측된 PAS2의 N-말단의 알파 헬릭스 (Ser611 내지 Ser622)를 표시하였다.
도 12c는 NifL FAD 결합 잔기인 Thr78과 Leu86에 대응하는 PAS2의 Glu666과 Leu674를 나타낸 도이다.
도 12d는 생체내 β-갈락토시다아제 분석 시스템을 사용하여 다양한 리간드 결합에 관여할 것으로 예측된 PAS2 잔기들을 평가한 도이다.
도 12e는 톨루엔이 결합된 PAS1 구조와 모델화된 PAS2 구조를 겹친 도이다.
도 13은 TodS/TodT의 신호 전달 과정에 대하여 분자 수준의 매커니즘 모델을 나타낸 도이다. PAS1 이량체에서 분자 A와 분자 B를 각각 어두운 녹색과 밝은 녹색으로 표시하였다. TodT 이량체를 밝은 노란색과 어두운 노란색으로 표시하였다. 톨루엔 분자는 붉은색으로 표시하였다.
도 14는 효능제(agonist)인 톨루엔 또는 길항제(antagonist)인 1,2,4-TMB 리간드를 100 μM의 농도로 가스 형태로 공급하였을 때, TodS 변이 단백질들을 발현하는 슈도모나스 푸티다(Pseudomonas putida) KT2440-PXZ 형질전환체들의 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다. PAS1/톨루엔 복합체의 입체구조 기반으로 규명된 10개의 아미노산 잔기를 위치-지정 변형시킨 PAS1 도메인을 포함한 TodS 변이 단백질들이 각각 야생형 TodS와 비교하여 100μM의 효능제인 톨루엔 또는 길항제인 1,2,4-TMB 리간드에 대해 보이는 반응을 상기 스크리닝 시스템으로 검증한 결과, 10개의 아미노산 잔기 모두 TodS/TodT 2개 인자 신호전달에 중요한 것으로 검증되었다.
도 15a는 10μM의 농도에서 각 리간드를 처리하여, 야생형 PAS1을 포함하는 TodS(WT)와 톨루엔 결합부위의 아미노산 잔기들을 위치-지정 돌연변이 유도 방법으로 치환시킨 10개의 TodS 변이 단백질간의 신호전달 능력을 비교한 결과를 나타낸 도이다.
도 15b는 리간드 농도 의존적으로, 야생형 TodS와 10종의 TodS 변이 단백질의 생체 내 베타 갈락토시다아제 활성 결과를 비교한 도이다.
도 16은 PAS1의 이량체화에 관여하는 아미노산들을 변형시킨 TodS 변이 단백질을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 리간드 농도 의존적 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 17은 톨루엔과 결합 특이적으로 구조변화가 일어나는 PAS1-B의 α5 헬릭스 형성부위의 아미노산들을 변이시킨 TodS 변이 단백질을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 리간드 농도 의존적 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 18a는 PAS1 단백질 61번 글루탐산 아미노산 잔기의 생화학적 특성을 변화시킨 TodS 변형단백질을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 리간드 농도(10μM, 50μM, 100μM) 의존적 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 18b는 10μM의 리간드를 가스 형태로 공급하였을 때, Q61R TodS와 Q61A TodS 변이 단백질들을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 19는 저농도의 톨루엔(0 내지 10μM)을 가스 형태로 공급하였을 때, Q61R TodS와 Q61A TodS 변이 단백질들을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 1b는 PAS1 단백질이 크기배제 크로마토그래피에서도 이량체 형태로 존재함을 확인한 도이다.
도 1c는 SeMet-PAS1/톨루엔 복합체, PAS1/1,2,4-TMB 복합체의 결정체 유도 및 TodS 변이단백질의 생체 내 신호전달 스크리닝에 사용한 벤젠계 방향족 화학물질을 표시한 도이다.
도 2a는 PAS1 (43 - 168) 단백질(Apo-PAS1)의 이량체 내 대칭 짝을 분석한 도이다.
도 2b는 Apo-PAS1 (43 - 168)의 구조를 리본으로 나타낸 도이다. 비대칭 유닛에는 두개의 PAS1 분자(분자 A 및 분자 B)가 있다.
도 2c는 SeMet-PAS1 (43 - 168)/톨루엔 복합체의 이량체 내 대칭 짝을 분석한 도이다.
도 2d는 PAS1 (43 - 168)/1,2,4-TMB 복합체의 이량체 내 대칭 짝을 분석한 도이다.
도 3은 SeMet-PAS1 (43 - 168) 단백질과 톨루엔 간의 결합을 구조적으로 분석한 도이다. PAS1의 결합에 필수적인 잔기들을 리간드와 함께 나타내었다.
도 4는 SeMet-PAS1 (43 - 168)/톨루엔 복합체 이량체를 구성하는 각 단량체 SeMet-PAS1-A와 SeMet-PAS1-B를 이차원적으로 겹쳐놓았을 때 보이는 구조적 차이를 표시한 도이다.
도 5a는 아고니스트 톨루엔과 복합체를 형성한 TodS PAS1 구조를 나타낸 도이다. 비대칭 단위에 두개의 톨루엔과 결합한 PAS1 분자가 있다. Apo-PAS1의 분자 B에서 정렬되지 않은 부위에 대응되는, 분자 B의 정렬되지 않은 C-말단 알파 헬릭스를 붉은색으로 표시하였다.
도 5b는 톨루엔 결합 포켓을 나타낸 도이다. 포켓은 정전기적 표면 표현(electrostatic surface representation)에서 검은색으로 표시되어 있다. PAS1에 의한 톨루엔 감지의 구체적인 환경을 분자 A 및 분자 B에서 확대하였다. 톨루엔 (붉은색)은 소수성의 PAS1 잔기(녹색)에 의해 둘러싸여 있다.
도 5c는 안타고니스트 1,2,4-TMB와 복합체를 형성한 PAS1의 구조를 나타낸 도이다. 비대칭 단위에 두개의 안타고니스트와 결합된 PAS1 분자가 있다. 1,2,4-TMB 분자는 붉은 색의 탄소 원자로 표시되어 있다. Apo-PAS1의 분자 B에서 정렬되지 않은 부위에 대응되는, 분자 B의 정렬되지 않은 C-말단 부위는 붉은색으로 표시되어 있다.
도 5d는 1,2,4-TMB 결합 포켓을 나타낸 도이다. 포켓은 정전기적 표면 표현에서 검은색으로 표시되어 있다. PAS1에 의한 1,2,4-TMB 결합의 구체적인 환경을 분자 A 및 분자 B에서 확대하였다. 특히, 1,2,4-TMB(붉은색)은 톨루엔 결합 포켓에서와 동일한 소수성 잔기(녹색)에 의해서 둘러싸여 있다. Apo-PAS1에서 소수성 포켓을 형성하기 위해 필요한 대응되는 잔기(노란색)는 톨루엔과 1,2,4-TMB 결합 잔기와 각각 겹쳐져 있다.
도 5e는 톨루엔과 결합하는 PAS1 (23-168)과 그 돌연변이들의 열역학적 파라미터를 나타낸 도이다. ORIGIN 소프트웨어 패키지 (MicroCal Inc., 미국)의 두개의 연속된 결합 모델을 사용하여 얻어졌다. 각 단백질 변이체와 톨루엔의 반응으로부터 생성된 열 데이터에서, 반응 버퍼에 톨루엔을 첨가하여 생성된 열 데이터를 뺐다. 야생형 PAS1(23-168)와 톨루엔 분자의 결합에 대한 대표적인 ITC 프로파일을 왼쪽에 나타내었다.
도 6은 PAS1 (43 - 168) 단백질(Apo-PAS1), PAS1 (43 - 168)/1,2,4-TMB 복합체 및 SeMet-PAS1 (43 - 168)/톨루엔 복합체의 SeMet-PAS1-B 단량체 구조를 겹쳐 놓고, PAS1-B 단백질의 각 리간드 결합 특이적 구조 변화를 원으로 표시한 도이다. SeMet-PAS1/톨루엔 복합체의 경우 톨루엔 결합 시 SeMet-PAS1-B의 E146과 R148의 결합으로 고정된 형태의 α5 헬릭스가 형성된다.
도 7a는 크기배제 크로마토그래피에서 TodS 단백질이 사량체의 크기를 갖는 길고 유연한 형태를 갖는 이량체로 존재함을 확인한 도이다.
도 7b는 C-말단에 His6 태그를 가진 TodS (서열번호 1의 43 - 978번째 아미노산 서열) 단백질을 순수 분리하여, 니켈-골드 분자를 히스티딘 마커와 결합시킨 후 음성 염색하여 전자현미경으로 관찰한 결과를 나타낸 도이다. 도 6b를 통하여 두 개의 골드 분자가 나란히 위치함을 확인하고, TodS 단백질이 이량체로 존재함을 확인하였다(화살표와 원으로 표시).
도 8a는 TodS(43-978) 단백질 단독(Apo-TodS)으로도 이량체로 존재함을 확인한 도이다.
도 8b는 TodS(43-978)/톨루엔 복합체 단백질도 이량체로 존재하나, TodS 단백질 단독으로 존재할 때에 비해, 길이가 길어진 양태를 보이는 것을 확인한 도이다.
도 8c는 TodS(43-978)/1,2,4-TMB 복합체 단백질도 이량체로 존재하나, 대다수의 단백질이 뭉침 현상을 보이는 것을 확인한 도이다.
도 9a는 정제된 TodS (서열번호 1 23 - 978번째 아미노산 서열, TodS(23-978)) 단백질의 사이즈 배제 크로마토그래피 분석 결과를 나타낸 도이다. TodS(23-978)를 표준 분자량 마커인 β-amylase (200kDa), apoferritin (443kDa)과 비교하였다.
도 9b는 TodS(23-978) 단백질(Apo-TodS) 및 이의 복합체(Toluene-TodS, 1,2,4-TMB-TodS)의 분자 외형을 보여주는 전자현미경 사진이다. 스케일 바: 20 nm.
도 10은 리간드 결합 부위를 변이시킨 PAS1 도메인을 포함하는 TodS 변이 단백질들의 리간드 결합 특이적 생체 내 TodS/TodT 2개 인자 신호전달 능력을 검증하기 위한, 96-딥-웰 플레이트 기반 스크리닝 시스템(in vivo β-galactosidase assay system)의 원리를 나타낸 모식도이다.
도 11a는 Azotobacter vinelandii NifL LOV 도메인(PDB ID: 2GJ3)의 구조하에서 모델화된 PAS1의 이량체 구조를 나타낸 도이다. 이량체화에 관여되는 것으로 예측된 소수성 잔기들을 녹색과 회색으로 각각 분자 A와 분자 B에 표시하였다.
도 11b는 이량체화에 관여하는 잔기들을 톨루엔 환경에서 생체내 β-갈락토시다아제 분석 시스템을 사용하여 평가하였다. 모든 결과들을 3번의 독립적인 실험을 통해 얻었다.
도 12a는 정제된 PAS2의 사이즈 배제 크로마토그래피 분석결과를 나타낸 도이다. 정제된 PAS2를 표준 분자량 마커인 카보닉 언하이드라제(carbonic anhydrase, 29 kDa)와 비교한 결과, 용액에서 이량체로서 분석되었다.
도 12b는 Azotobacter vinelandii NifL LOV 도메인 (PDB ID: 2GJ3)의 이량체 구조(녹색, 청록색)에 기초하여 모델화된 PAS2 구조(자홍색)를 나타낸 도이다. 각 NifL PAS 도메인에 결합한 FAD를 나타내었다. 이량체화에 관여하는 것으로 예측된 PAS2의 N-말단의 알파 헬릭스 (Ser611 내지 Ser622)를 표시하였다.
도 12c는 NifL FAD 결합 잔기인 Thr78과 Leu86에 대응하는 PAS2의 Glu666과 Leu674를 나타낸 도이다.
도 12d는 생체내 β-갈락토시다아제 분석 시스템을 사용하여 다양한 리간드 결합에 관여할 것으로 예측된 PAS2 잔기들을 평가한 도이다.
도 12e는 톨루엔이 결합된 PAS1 구조와 모델화된 PAS2 구조를 겹친 도이다.
도 13은 TodS/TodT의 신호 전달 과정에 대하여 분자 수준의 매커니즘 모델을 나타낸 도이다. PAS1 이량체에서 분자 A와 분자 B를 각각 어두운 녹색과 밝은 녹색으로 표시하였다. TodT 이량체를 밝은 노란색과 어두운 노란색으로 표시하였다. 톨루엔 분자는 붉은색으로 표시하였다.
도 14는 효능제(agonist)인 톨루엔 또는 길항제(antagonist)인 1,2,4-TMB 리간드를 100 μM의 농도로 가스 형태로 공급하였을 때, TodS 변이 단백질들을 발현하는 슈도모나스 푸티다(Pseudomonas putida) KT2440-PXZ 형질전환체들의 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다. PAS1/톨루엔 복합체의 입체구조 기반으로 규명된 10개의 아미노산 잔기를 위치-지정 변형시킨 PAS1 도메인을 포함한 TodS 변이 단백질들이 각각 야생형 TodS와 비교하여 100μM의 효능제인 톨루엔 또는 길항제인 1,2,4-TMB 리간드에 대해 보이는 반응을 상기 스크리닝 시스템으로 검증한 결과, 10개의 아미노산 잔기 모두 TodS/TodT 2개 인자 신호전달에 중요한 것으로 검증되었다.
도 15a는 10μM의 농도에서 각 리간드를 처리하여, 야생형 PAS1을 포함하는 TodS(WT)와 톨루엔 결합부위의 아미노산 잔기들을 위치-지정 돌연변이 유도 방법으로 치환시킨 10개의 TodS 변이 단백질간의 신호전달 능력을 비교한 결과를 나타낸 도이다.
도 15b는 리간드 농도 의존적으로, 야생형 TodS와 10종의 TodS 변이 단백질의 생체 내 베타 갈락토시다아제 활성 결과를 비교한 도이다.
도 16은 PAS1의 이량체화에 관여하는 아미노산들을 변형시킨 TodS 변이 단백질을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 리간드 농도 의존적 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 17은 톨루엔과 결합 특이적으로 구조변화가 일어나는 PAS1-B의 α5 헬릭스 형성부위의 아미노산들을 변이시킨 TodS 변이 단백질을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 리간드 농도 의존적 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 18a는 PAS1 단백질 61번 글루탐산 아미노산 잔기의 생화학적 특성을 변화시킨 TodS 변형단백질을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 리간드 농도(10μM, 50μM, 100μM) 의존적 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 18b는 10μM의 리간드를 가스 형태로 공급하였을 때, Q61R TodS와 Q61A TodS 변이 단백질들을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
도 19는 저농도의 톨루엔(0 내지 10μM)을 가스 형태로 공급하였을 때, Q61R TodS와 Q61A TodS 변이 단백질들을 발현하는 슈도모나스 푸티다 KT2440-PXZ 형질전환체들의 생체 내 베타 갈락토시다아제 활성 결과를 보여주는 도이다.
이하, 본 발명을 하기 실시예에서 보다 구체적으로 설명한다. 그러나 이들 실시예는 본 발명의 이해를 돕기 위한 것일 뿐, 이들에 의해 본 발명이 한정되는 것은 아니다.
실시예 1: 박테리아 균주, 플라스미드, 및 성장조건
본 발명에서 사용되는 박테리아 균주와 제조된 플라스미드를 하기 표 1에 정리하였다. 서열번호 1의 아미노산 서열 중 43 - 978번째 아미노산 서열 또는 23 - 978번째 아미노산 서열을 가지는 TodS (TodS (43 - 978), TodS (23 - 978))단백질을 코딩하는, todS 유전자를 슈도모나스 퓨티다(Pseudomonas Putida) F1 genomic DNA를 주형으로 하여 PCR을 통해 증폭하였다. 그 후 C-말단에 6개의 히스티딘 태그가 결합되는 단백질의 발현 벡터 pET28b(+) (Novagene, 미국)의 NcoI과 XhoI 부위를 통해 상기 증폭된 TodS 단백질(서열번호 1의 43 - 978번째 아미노산 서열)의 유전자를 삽입하였다. 또한, N-말단에 GST가 결합된 단백질 발현 벡터 pGST-Parallell(Sheffield et al., 1999)의 BamHI과 XhoI 부위를 통해 상기 TodS 단백질(서열번호 1의 23 - 978번째 아미노산 서열)의 유전자를 삽입하였다.
또한, 서열번호 1의 아미노산 서열 중 43 - 168번째 아미노산 서열을 가지는 PAS1 (서열번호 3, PAS1 (43 - 168), 도 1a) 단백질 또는 23 - 168번째 아미노산 서열을 가지는 PAS1 (서열번호 5, PAS1 (23 - 168)) 단백질을 코딩하는, pas1 유전자(각각 서열번호 4 및 서열번호 6)와 서열번호 1의 아미노산 서열 중 611 - 729번째 아미노산 서열을 가지는 PAS2 단백질을 코딩하는, pas2 유전자를 TodS 발현 벡터를 이용하여 PCR을 통해 증폭한 후, N-말단에 6개의 히스티딘 태그 및 rTEV 프로테아제 절단 부위(rTEV protease cleavage site)를 가지는 pHis-Parallell 벡터(Sheffield et al., 1999)의 NcoI과 XhoI 부위에 삽입하였다. 슈도모나스 퓨티다 F1의 todST 프로모터와 todST 유전자를 각각 TodSTpp-u 및 TodSTpp-m 프라이머와 TodST-F 및 TodST-R 프라이머를 사용하여 PCR을 통해 증폭하였다. 상기 todST 프로모터를 pBBRBB-eGFP 벡터(Vick et al., 2011)의 NsiI과 XbaI 부위에 삽입하여 pBBR-PtodST를 만들었다. 그 후, 야생형 todST 프로모터 하에 todST를 발현시키기 위하여 pBBR-PtodST의 SacI과 HindIII 부위에 todST를 삽입하여 pBBR-PtodST-TodST를 만들었다. 상기 발현 플라스미드는 녹색 형광 단백질 유전자를 포함하고 있지 않았다.
또한, 돌연변이체를 QuicKChange Site-Directed Mutagenesis kit(Stratagene, USA)를 사용하여 위치-지정 돌연변이를 통해 만들었다. 결정 구조를 알아내기 위한 셀레노메티오닌(selenomethionine, SeMet)으로의 치환을 위해, PAS1 (43 - 168)에 L71M 돌연변이를 유도하였다. 모든 돌연변이체들을 DNA 서열분석을 통해 확인하였다(Macrogene, 한국). 플라스미드들과 다양한 돌연변이체를 만들기 위해 사용된 프라이머를 하기 표 2에 나타내었다.
별다른 기재가 없는 한, 대장균(E. coli) 및 슈도모나스 퓨티다 균주는 각각 37℃ LB(Luria-Bertani) 배지, 30℃ LB 배지에 항생제를 하기 농도로 첨가한 배지에서 배양하였다.
대장균 - 100㎍/ml 암피실린(ampicillin), 50㎍/ml 카나마이신(kanamycin), 및 100㎍/ml 스트렙토마이신(streptomycin).
톨루엔은 시그마 (SigmaAldrich, USA)에서 구입하였다.
a: AmpR은 암피실린 내성(ampicilin resistant); KmR은 카나마이신 내성(Kanamycin resistant); SmR은 스트렙토마이신 내성 (streptomycin resistant); TcR은 테트라사이클린 내성(tetracyclin resistant)이다.
b: 변이체 표현에서 첫번째 문자는 원래 아미노산, 숫자는 변이된 위치, 마지막 문자는 변이로 인해 치환된 아미노산을 의미한다.
실시예 2: PAS1 단백질과 TodS 단백질의 발현 및 정제
E. coli BL21 Star (DE3) system (Invitrogen, 미국)을 0.5mM IPTG(isopropyl β-D-thiogalactopyranoside)와 함께 18°C에서 밤새 배양하여, N-말단에 His6 태그를 가진 PAS1 (43 - 168)과 PAS2 단백질을 발현시켰다. 모든 정제 단계는 버퍼 A(50 mM Tris-HCl pH 8.0 및 300 mM NaCl을 포함)를 사용하여 수행되었다. 배양된 세포들을 수확하여, 버퍼 A로 재현탁 시킨 후, 초음파로 분쇄하였다. 상기 분쇄액을 4°C에서 1시간 동안 16,000 x g로 원심분리하였다. 그 후 세포의 용해물을 Ni-NTA (Qiagen, 미국) 친화성 컬럼에 로딩하여, 6개의 히스티딘이 결합된 단백질을 200mM 이미다졸(imidazole)로 용출시켰다. 용출된 단백질을 rTEV 프로테아제 처리; Superdex G75 컬럼(GE Healthcare, 미국)을 사용한 사이즈 배제 크로마토그래피(size-exclusion chromatography); 및 His6 태그와 잘려지지 않은 His6 태그를 가진 단백질을 제거하기 위한 추가적인 Ni-NTA 친화 크로마토그래피를 사용하여 추가적으로 정제하였다(도 1b). 버퍼 A에 존재하는 정제된 단백질을 이후의 사용을 위해 15mg/ml의 농도로 농축하여, - 80°C에 보관하였다.
또한, N-말단에 His6 태그를 가진 PAS1 (23 - 168)과 이의 돌연변이 단백질을 전술한 방법과 같이 E. coli C41(DE3) system (Lucigen, 미국)을 사용하여 발현시킨 후, ITC(isothermal titration calorimetry) 분석에 사용하기 위해, 5% 글리세롤 및 2mM DTT를 포함하는 버퍼 A를 사용하여 Ni-NTA 친화 크로마토그래피로 정제하였다.
또한, SeMet이 치환된 PAS1(L71M)을 메티오닌 영양요구주인 E. coli B834 (DE3) (Novagen)를 사용하여, 50mg/ml의 SeMet가 함유된 최소 배지에서 발현시켰다. SeMet-PAS1(L71M)의 정제 절차는 버퍼에 5mM 메티오닌을 첨가하는 것을 제외하고는 야생형 단백질의 정제 절차와 동일하였다.
또한, C-말단에 His6 태그를 가진 TodS (43 - 978) 단백질을 E. coli BL21 Star (DE3) system (Invitrogen, 미국)에서 발현시켰고, Ni-NTA 친화 크로마토그래피 및 Superdex G200 컬럼(GE Healthcare, 미국)을 이용한 사이즈 배제 크로마토그래피를 사용하여 전술한 방법으로 정제하였다.
또한, N-말단에 GST가 융합된 TodS (23 - 978) 단백질을 전술한 방법과 같이 E. coli BL21-CodonPlus (DE3)-RIPL system (Agilent, 미국)에 서 발현시켰다. 배양된 세포를 수확한 후, PBS (pH 7.3, LPS solution, 대한민국), 5% 글리세롤, 2mM DTT, 및 프로테아제 억제제 칵테일(GenDEPOT, USA)을 포함하는 버퍼에 재현탁 시켜, 초음파로 분쇄하였다. 상기 분쇄액을 4°C에서 1시간 동안 16,000 x g로 원심분리하였다. 그 후 세포 용해물을 Glutathione Sepharose 4 Fast Flow (GE Healthcare, 스웨덴) 친화 컬럼에 로딩한 후, 50 mM Tris-HCl pH 8.0, 300 mM NaCl, 5% 글리세롤, 2mM DTT, 및 프로테아제 억제제 칵테일을 함유하는 버퍼를 사용하여 컬럼을 세척하였다. GST 융합 단백질을 10mM 감소된 글루타치온(glutathione)으로 용출시켰다. rTEV 프로테아제 처리; Superdex G200 컬럼을 이용한 사이즈 배제 크로마토그래피; 및 GST와 잘려지지 않은 GST 융합 단백질을 제거하기 위한, GST 친화 크로마토그래피를 사용하여 상기 용출된 단백질을 추가적으로 정제하였다. 정제된 TodS (23 - 978) 단백질을 TEM(transmission electron microscopy) 분석에 사용하였다.
실시예 3: PAS1 단백질의 결정화, 분산 및 구조 분석
21℃에서 시팅 드랍 증기 확산법을 이용한 정제된 PAS1 (43 - 168) 단백질을 단독으로 또는 SeMet-PAS1과 톨루엔(도 1c)을 1:2 몰비율로 혼합하여 1시간 동안 얼음상에 정치시켜 복합체를 얻을 수 있었다. PAS1과 1,2,4-TMB(도 1c)를 또한 1:2 몰비율로 혼합하여 1시간 동안 얼음상에 정치시켜 복합체를 얻을 수 있었다.
상기 PAS1 단독 단백질(Apo-PAS1) 및 복합체의 결정화는 다음과 같은 조건하에서 형성되었다:
Apo-PAS1과 PAS1/1,2,4-TMB 복합체는 2.8 내지 3.0M 암모늄 포스페이트(ammonium phosphate dibasic, trihydrate), pH 8.0 내지 8.5의 0.1M 트리스 하드로클로라이드(Tris-Hydrochloride)를 포함하는 용액 조건에서, SeMet-PAS/톨루엔 복합체 는 3.0 M 암모늄 포스페이트, pH 8.0, 0.1M 트리스 하드로클로라이드를 포함하는 용액 조건에서 복합체의 결정을 얻었다.
성장된 결정체는 3.0M 암모늄 포스페이트(ammonium phosphate dibasic, trihydrate), pH 8.0의 0.1M 트리스 하드로클로라이드를 포함하는 용액 조건에서 복합체의 결정체가 최적 형성되었다.
Apo-PAS1 단백질 결정체를 위한 분산 데이터는 1.5Å 해상도로 측정하였다 (도 2a). SeMet-치환 PAS1/톨루엔 복합체 단백질 결정체는 상기 개시된 바와 동일한 방법으로 결정화하였다. SeMet-치환 크리스탈에 대한 단일파장 비정상 회절 데이터는 1.65 Å 해상도로 수집하였다(도 2b). PAS1/1,2,4-TMB 복합체 단백질 결정체는 상기 개시된 바와 동일한 방법으로 결정화하였고 단일파장 비정상 회절 데이터는 2.0 Å 해상도로 수집하였다(도 2c). 모든 데이터는 HKL2000 소프트웨어 패키지로 분석하였다.
PAS1/톨루엔 복합체의 구조는 Se 원자로부터 나오는 비정상 신호를 SOLVE 프로그램으로 분석하여 알아내었다. 밀도 조절 및 순차적 자동화 모델 빌딩 과정은 RESOLVE 프로그램으로 수행하였다. 복합체 결정 구조는 SeMet 결정의 부분 개선 모델을 이용하는 MOLREP 프로그램를 이용하여 분자 치환을 통해 1.65Å 해상도로 밝혔다. 복합체 결정 구조는 COOT 프로그램으로 교정되고 REFMAC5를 이용하여 개선하였다. 해당 개선은 TLS(translation-liberation-screw) 과정을 포함했다. 최종 개선된 모델은 Rfree과 Rcryst값이 각각 0.23 과 0.18를 나타내었다.
PAS1 단백질 결정체의 경우 PAS1-A와 PAS1-B의 Asn164에서 Glu168 영역은 아무런 전자밀도를 보이지 않았다. 하지만 SeMet-치환 PAS1/톨루엔 복합체 단백질 결정체는 SeMet-PAS1-A의 Glu166에서 Glu168 영역 및 SeMet-PAS1-B의 Glu168만 아무런 전자밀도를 보이지 않았다(도 3 내지 5).
한편, PAS1/1,2,4-TMB 복합체 단백질 결정체는 PAS1-A의 Glu166에서 Glu168 영역에서만 전자밀도가 보이지 않았으나, PAS1-B의 경우는 Ala155에서부터 Glu168까지 아무런 전자밀도를 보이지 않았기에, 유연성이 높은 부분임을 추측할 수 있었다. 따라서 상기 전자밀도를 보이지 않는 잔기들은 모델에 포함되지 않았다.
Apo-PAS1, SeMet-PAS1 단백질과 toluene 복합체, PAS1과 1,2,4-TMB 복합체에 대한 결정화 데이터 통계는 하기 표 3에, 원자좌표는 표 4 내지 6에 각각 나타내었다.
실시예 3: PAS1 단백질의 ITC 분석
PAS1 (23 - 168) 단백질과 리간드 사이의 상호작용을 ITC를 통해 분석하였다. 정제된 N-말단 His6 태그를 가진 PAS1 (23 - 168) 단백질과 이의 돌연변이 단백질을 50mM Tris-HCl pH7.5, 200mM KCl, 2mM MgCl2, 1mM DTT, 및 0.1mM EDTA가 포함된 버퍼로 투석하였다. 그 후 진공 흡입기를 15분 동안 사용하여 샘플에서 가스를 제거하고, 로딩전 샘플에 에탄올(최종 농도 0.2%)을 첨가하였다. 0.2% 에탄올을 함유하는 리간드들을 상기 가스 제거에 사용한 버퍼로 희석하였다. 25°C에서 적정을 수행하였다. VP-ITC (MicroCal Inc., 미국)를 사용하여 열량측정법 (calorimetric assay)을 수행하였다. 스터링(stirring) 속도는 분당 300 회전이고, thermal power를 10초마다 기록하였다. 0.2% 에탄올에 녹아있는 2 - 6mM의 톨루엔은 반응 셀 (reaction cell, ~1.6mL)에 있는 50μM 단백질 (이량체로 계산되었음)에 대하여 적정되었다. 실험기구와 함께 제공된 Origin package (version 7)를 사용하여 적정의 열분석 (Thermogram analysis)을 수행하였다.
실시예 5: TodS 단백질의 전자현미경 및 단일 입자 분석
실시예 5-1: TodS (43 - 978) 단백질
C-말단에 His6 태그를 가진 TodS (43 - 978) 단백질(표 1)을 대장균에서 과발현시켜, 상기 방법으로 대량 분리 정제한 후 전자현미경 및 단일입자 분석을 실시하였다(도 7a 내지 도 8c).
정제된 Apo-TodS 단백질, TodS/톨루엔 복합체 및 TodS/1,2,4-TMB 복합체 단백질들을 각각 500 mM NaCl, 20 mM Tris-HCl (pH 8.0), 0.1 mM EDTA 용액에 최종 농도 100 내지 200 nM로 희석하여, 각 시료 용액 5μL를 3분간 공기 중에서 글로 방전(glow-discharged)시킨 탄소-코팅 망에 처리했다. 상기 망은 1% 우라닐 아세테이트(uranyl acetate)를 이용하여 즉시 음성 염색하였다. 망을 Technai G2 Spirit Twin 투과전자현미경(FEI, Hillsboro, OR, USA)에서 확인하였으며, 이미지를 0.36 nm/pixel 배율로 4K X 4K Ultrascan 895 CCD (Gatan, Pleasanton, CA, USA)로 저장하였다.
단일 분자 분석에서는, 단일 분자 이미지 분석을 위해, 각각의 분자 이미지가 선택되었으며 SPIDER 프로그램(Health Research, Rensselaer, NY, USA)을 이용하였다. 총 921개의 TodS 입자, 582개의 TodS/톨루엔 입자, 및 1631개의 TodS/1,2,4-TMB 입자들을 분석에 사용하였고, 클래스 평균은 기존에 알려진 임의의 방법으로 구하였다. 세 개의 시료의 유사한 view를 비교하여, 데이터들을 융합하고, 동시-정렬하여 분별하였다. 유사하게 관찰된 TodS 영역의 평균을 추후 분석을 위해 선택하였다. UCSF 키메라 프로그램을 시각화, 원자 모델 및 평균에 해당 비교 분석을 위해 사용하였다.
실시예 5-2: TodS (23 - 978) 단백질
N-말단에 GST가 융합된 TodS (23 - 978) 단백질을 대장균에서 과발현시켜, 상기 방법으로 대량 분리 정제한 후 전자현미경 및 단일입자 분석을 실시하였다 (도 9a 내지 도 9b).
정제된 Apo-TodS 단백질, TodS/톨루엔 복합체 및 TodS/1,2,4-TMB 복합체단백질들을 각각 PBS (pH 7.3), 5% 글리세롤, 2mM DTT, 및 프로테아제 억제제 칵테일을 포함하는 버퍼를 사용하여 최종농도 ~100 - 200nM로 희석하였다. 각각의 최종 용액 5μl를 사용하여 실시예 5-1과 동일한 방법으로 전자현미경 및 단일입자 분석을 수행하였다. 총 482개의 apo-TodS 입자, 411개의 TodS/톨루엔 입자 411 입자, 및 459개의 odS/1,2,4-TMB 입자들을 분석에 사용하였다.
실시예
6:
생체내
β-갈락토시다아제 분석 시스템(
in
vivo
β-
galactosidase
assay system)
실시예 6-1: 슈도모나스 퓨티다 리포터 균주의 제작
in vivo β-갈락토시다아제 분석을 수행하기 위해, 슈도모나스 퓨티다 KT24400-PXZ 리포터 균주를 제작하였다. 상기 균주는 슈도모나스 퓨티다 KT2440 염색체의 mexC 유전자에 TodT 결합 프로모터 P tod X(서열번호 11), β-갈락토시다아제 단백질(서열번호 12)의 유전자 lacZ(서열번호 13), 및 스트렙토마이신 저항 유전자 Sm R로 구성된 카세트(P todX -lacZ-Sm R)가 삽입되어 있는 형태이다. 리포터 균주 제작을 위해 다수의 유전자 복제 단계를 수행하였다. 첫째, 슈도모나스 퓨티다 KT2440 mexC 유전자의 539 bp, 509 bp의 절편 및 pEXT21 플라스미드 Sm R 유전자를 각각 mexCn-u와 mexCn-d, mexCc-u와 mexCc-d, 및 Sm-N과 Sm-C의 프라이머를 사용하여 PCR로 증폭하였다. 상기 3 종류의 PCR 생산물을 각각 EcoRI과 BamHI, BamHI과 SphI, 및 BamHI을 사용하여 절단하였다. 그 후 절단된 결과물을 pBR322 (New England Biolabs, Inc., 미국)의 EcoRI와 SphI 부위에 삽입하여 pSYK123를 얻었다. 그 후, P tod X-lacZ-Sm R 카세트가 mexC 염기서열에 삽입된, pSYK124를 만들기 위해, pSYK123의 HindIII 부위에 pEXT20-todST-P tod X의 P todX -lacZ 발현 융합 카세트가 삽입되었다. 결국, 5528 bp의 mexC-P tod X-lacZ-Sm R -mexC 카세트를 mexCn-u와 mexCc-d 프라이머를 사용하여 PCR을 통해 증폭하였고, SmaI에 의해 절단된 pK18mobsacB(Schafer et al., 1994)에 삽입하여 pSYK135를 만들었다. 그 후, 슈도모나스 퓨티다 KT2440를 전기천공법을 통해 pSYK135로 형질전환시켰다. Km R 과 수크로즈에 민감한 슈도모나스 퓨티다 형질전환체들을 50㎍/ml의 카나마이신과 10% 수크로즈가 첨가된 LB 배지에서 이중으로 선별하였다. 선별된 형질전환체에서 single-crossover event를 PCR을 통해 추가적으로 확인하였다. 두번의 교차(second crossover)에 의해서 형성된, 염색체에 삽입된 P tod X-lacZ-Sm R 카세트를 가진 리포터 균주, 슈도모나스 퓨티다 KT2440-PXZ를 100㎍/ml의 스트렙토마이신이 첨가된 LB 플레이트에서 선별하였다.
실시예 6-2: 생체내 β-갈락토시다아제 리포터 발현 측정
PAS1 내 톨루엔 결합부위에 위치-지정 돌연변이를 일으킨 TodS 단백질들의 생체 내 인산화 신호전달 능력의 변화를 각각 야생형 TodS와 비교하여 측정하기 위해 PAS1-의존-TodS/TodT 플라스미드를 포함한 슈도모나스에 형질전환체들을 카나마이신 항생제를 포함한 LB 배지 200㎕가 들어 있는 96-웰 딥 플레이트(96-well deep plate)에 배양하고, 효능제인 톨루엔, 스티렌, m-자일렌 또는 길항제인 o-자일렌, 1,2,4-TMB 리간드를 각각 가스형태로 2.5 내지 400μM 농도로 공급하여 30℃, 500 rpm에서 4-5시간 배양하여 생체 내 β-갈락토시다아제 단백질 생성을 유도하였다.
20㎕의 슈도모나스 형질전환체들과 80㎕의 Z-완충액을 혼합하여, 세포 밀도를 595nm에서 측정한 후, 25㎕의 4-MUG(4-methylumbelliferyl β-galactopyranoside) 기질을 1 mg/ml의 농도로 넣고, 25℃ 내지 37℃에서 1시간 반응한 후, 30㎕의 1M 소디움카보네이트 용액을 넣어 효소반응을 중지시켰다. 그 다음, 365nm/465nm에서 분해된 7-하이드록시-4-메틸쿠마린(7-hydroxy-4-methylcoumarin)의 형광을 측정하여, 각 균주의 MUG 값을 [(F365nm/465nm)/60 (min) x cell density at Abs585]로 계산하였다 (도 10). 데이터는 최소 3번 실험을 반복한 값의 평균 ± 표준 편차(SD)를 나타낸다.
상기 스크리닝 방법은, 공기중의 가스 상태로 특정 리간드를 공급하면 슈도모나스 형질전환체에서 발현된 PAS1-의존 TodS 단백질이 특정 리간드와 결합하여 PAS1-B 단량체 구조가 변화되면, TodS의 활성화를 위한 형태 변화가 유도되고, TodS에 의해 인산화된 TodT가 P todX 에 결합하여 tod 오페론 대신 연결된 β-갈락토시다아제 효소의 전사활성을 상향 조절하게 되어, 생체 내 β-갈락토시다아제 효소에 의해 분해된 형광물질의 양을 365nm/465nm에서 정량적으로 측정하는 원리다. 96-딥웰 플레이트를 이용한 스크리닝 방법은, 동시에 다수의 PAS1-의존 TodS 변이 단백질을 발현하는 슈도모나스 형질전환체를 야생형과 함께, 가스형태로 공급되는 특정 리간드에 대한 반응을 3 반복으로 검증할 수 있도록 구축하였다.
실험예 1 : PAS1 단백질의 구조
정제된 PAS1 (43 - 168) 단백질을 상기 결정화 방법으로 단독으로 결정화하여 Apo-PAS1의 입체구조를 확보하였고(도 2a), 비대칭적 유닛의 두 분자(PAS1-A 와 PAS1-B)를 포함한 입체구조는 리간드 존재 유무와 관계없이 두 분자의 이량체 구조를 이루고 있음을 크기배제 크로마토 그래피를 통해서도 확인할 수 있었다(도 1b). PAS1 단백질 입체구조에서 분석된 두 분자는 각각 C-말단 부위의 아미노산 150-163 부위에서 비대칭성을 보여주었는데, PAS1-A에서 헬릭스로 구조를 형성하는 아미노산 150-163 부위가 PAS1-B에서는 루프의 형태로 존재하며, Asn164에서 Glu168 영역은 아무런 전자밀도를 보이지 않은 것으로 보아, 이 부위의 유연성을 추측할 수 있었다.
각 PAS1 도메인의 구조는 45 - 149번째 아미노산 서열에 해당하는, 5개의 가닥이 역평행을 이루는 베타 시트와 3개의 알파 헬릭스로 구성된 다른 PAS 도메인의 구조와 매우 유사하였다(도 2b). 추가적인 알파 헬릭스(α4, 아미노산 잔기 150 - 163)는 분자 A에서 기본적인 PAS 폴드(fold)의 바로 밖에 위치하고 있었다. 특이적으로, α4와 대응되는 부위인 분자 B의 C-말단 부위는 완전히 정렬이 엉망이었다. PAS1의 중추는 녹조류(Chlamydomonas reinhardtii)의 광수용체(photoreceptor)의 LOV 도메인 (PDB ID: 1N9L, 11% 서열 상동성, RMSD (82 알파 탄소 쌍에 대한 1.52Å)) 및 아라비돕시스(Arabidopsis)의 청색광 수용체인 phototropin-2의 LOV1 도메인 (PDB ID: 2Z6D, 11% 서열 상동성, RMSD (58 알파 탄소 쌍에 대한 1.30Å))의 중추와 가장 유사하였다. 상기 LOV 도메인 및 LOV1 도메인은 모두 FMN과 결합한다.
많은 PAS 도메인들의 이량체화(dimerization)는 주로 핵심적인 PAS 폴드의 바로 윗 부위에 위치하는 양친매성의 알파 헬릭스를 통해 일어난다. 본 발명에서 제작된 TodS PAS1 도메인은 상응하는 헬릭스 부위를 포함하고 있지 않았다. 따라서, TodS PAS1 구조에서 관찰되는, 역평행의 마주보는 이량체화는 결정 팩킹(packing)의 대칭(symmetry)으로 인한 인위적인 결과 때문일 수 있다. TodS의 기본적인 PAS 폴드의 바로 윗 부분에 PAS1의 이량체화와 관련된 알파 헬릭스 부위 (아미노산 잔기 32 - 43)가 존재함을 이차구조(secondary structure)로부터 예측하 수 있다.
실험예 2 : SeMet-PAS1/톨루엔 복합체 단백질의 구조
상기 방법으로 SeMet-PAS1 (43 - 168)/톨루엔 복합체의 입체구조를 분석한 결과, 1.6 Å의 고해상도로 Apo-PAS1 (43 - 168) 결정체와 같이 비대칭적 유닛으로 두 분자(SeMet-PAS1-A 와 SeMet-PAS1-B)를 포함하고 있음을 확인하였다(도 2c). 톨루엔은 각 PAS1 단량체 내 소수성 결합 공간에 각각 한 분자씩 결합하는 것을 확인하였다(도 3). PAS1 단독 단백질 결정체의 경우 PAS1-A와 PAS1-B의 Asn164에서 Glu168 영역의 전자밀도를 볼 수 없었으나, SeMet-치환 PAS1/톨루엔 복합체 단백질 결정체의 경우는, SeMet-PAS1-A의 Glu166에서 Glu168 영역 및 SeMet-PAS1-B의 Glu168에서만 아무런 전자밀도를 보이지 않았다. 따라서 상기 전자밀도를 보이지 않는 잔기들은 모델에 포함되지 않았다. TodS의 46번 아미노산에서 149번 아미노산은 다섯 개의 베타 가닥과 세 개의 알파 헬릭스 구조로 이루어져 있는 전형적인 PAS 도메인의 구조를 형성하며, 기존에 보고된 Azotobacter vinelandi의 NifL, Chlamydomonas reinhardtii의 빛 수용체 LOV/PAS도메인과 유사한 구조를 보였다.
하지만, PAS1 (43 - 168)/톨루엔 복합체의 입체구조에서 분석된 PAS1은 FMN, Heme 등과 결합하는 기존의 PAS 도메인들과 달리 좁은 리간드 결합부위를 가지고 있으며, 상기 분석된 PAS1/톨루엔 복합체의 입체구조는 TodS의 히스티딘 키나제 1 도메인과 연결되는 알파 헬릭스 구조(아미노산 150부터 163까지)를 포함하고 있다. 따라서, PAS1-B의 알파 헬릭스 구조변화가 TodS의 히스티딘 키나제 1 도메인과의 연결에 영향을 주어, TodS의 형태 변화를 유도할 것으로 분석되었다. SeMet-PAS1-A와 SeMet-PAS1-B는 동일한 구조를 가지나, SeMet-PAS1-A와 SeMet-PAS1-B룰 겹쳐놓으면, 톨루엔 결합 특이적으로 형성된 알파 헬릭스가 약 25° 기울기 차이가 있었다(도 4).
실험예 3 : PAS1/1,2,4-TMB 복합체 단백질의 구조
상기 방법으로 PAS1 (43 - 168)/1,2,4-TMB 복합체의 입체구조를 분석한 결과, 전자 밀도 차이 지도에서 1,2,4-TMB가 각 PAS1 단량체의 소수성 결합 공간에 한 분자씩 결합하고 있는 것을 확인하였다(도 2d). 하지만, PAS1/1,2,4-TMB 복합체의 PAS1-B 단량체는 C-말단에 위치한 아미노산 Ala155에서부터 Glu168까지 아무런 전자밀도를 보이지 않았고, 이것은 PAS1 단백질 단독으로 얻은 결정체의 입체구조 분석결과와 비교해 보아, 이 부위가 기능적으로 매우 유연한 구조를 형성하고 있음을 예측할 수 있었다 (도 2d). 또한 155번 라이신의 경우도 1,2,4-TMB 결합시 전자밀도가 보이지 않았다. 상기 분석된 SeMet-PAS1/톨루엔 복합체의 입체구조와 비교하여, PAS1/1,2,4-TMB 복합체의 PAS1-B의 유연한 알파 헬릭스 구조는 TodS의 히스티딘 키나제 1 도메인과의 연결에 영향을 주어, PAS1-B의 1,2,4-TMB 결합은 TodS의 형태 변화를 비활성적으로 유도할 것으로 분석되었다.
실험예 4: PAS1의 톨루엔/1,2,4-TMB 결합부위에 대한 분석
상기 SeMet-PAS1/톨루엔 복합체 결정체의 전자 밀도 차이 지도 분석 결과, 톨루엔은 각 SeMet-PAS1-A와 SeMet-PAS1-B 두 분자의 소수성 결합 공간 (hydrophobic binding pocket)에 한 분자씩 결합하는 것을 확인하였다(도 2a, 도3). 구체적으로는, TodS 아미노산 서열 1번에서 PAS1 단백질의 톨루엔 결합 부위는 46번 페닐알라닌(phenylalanine), 48번 글라이신(glycine), 59번 발린(valine), 63번 알라닌(alanine), 79번 페닐알라닌, 84번 트립토판 (tryptophane), 85번 트립토판, 114번 아이소류신(isoleucine), 126번 발린, 128번 페닐알라닌, 145번 알라닌, 147번 글라이신과 톨루엔이 수소 결합(Hydrogen bond) 또는 물 분자-매개 수소 결합을 이루는 것을 확인하였다. 톨루엔의 벤젠 링이 상기 아미노산으로 둘러싸인 소수성 공간에 위치하며, 메틸기는 48번 글라이신, 59번 발린, 그리고 145번 알라닌에 둘러싸여 있었다. 흥미롭게도, 1,2,4-TMB 역시 톨루엔과 같은 부위에 위치하며 상동 아미노산 잔기들과 결합하고 있었으나, 각각 길항제로 작용하는 1,2,4-TMB의 PAS1 결합시 46번 페닐알라닌은 톨루엔 결합시보다 약 70°가량 기울어져 있음을 확인하였다. 이러한 차이는 톨루엔보다 2개의 메틸기를 더 가진 1,2,4-TMB가 PAS1-B 분자의 C-말단 헬릭스를 비정형화 상태로 만들어, 인산화 신호전달이 원활하지 못한 형태의 TodS 단백질로 기능하도록 하는 것으로 분석할 수 있다.
실험예 5: PAS1 단백질의 신호 감지
톨루엔은 TodS/TodT 신호 전달 시스템을 활성화 시키는데 필요한 핵심적인 신호 효능제(signal effector)이다. 톨루엔과 복합체를 형성하는 PAS1의 구조는 일반적으로 apo-PAS1 구조와 일치하였다(도 5a). 각각의 PAS1 분자에서 소수성 잔기인 Phe46, Gly48, Val59, Ala63, Phe79, Trp84, Trp85, Ile114, Val126, Phe128, Ala145, 및 Gly147에 의해 형성된 소수성 포켓에 아고니스트가 위치하였다(도 5b). 포켓의 파묻힌 표면부위는 PISA 소프트웨어에 의해 계산된 바에 의하면 247.27Å2 이었다. 구체적으로, 주로 방향족 아미노산인 Phe46, Phe79, Trp84, Trp85, 및 Phe128에 의해 형성된 부위에 톨루엔의 벤젠 고리가 위치하고, Ala63, Ile114, Val126, 및 Gly147는 상호작용에 관여하였다. 톨루엔의 메틸 그룹은 Gly48, Val59, Ala63, 및 Ala145 잔기에 의해서 둘러쌓여 있었다.
또한, 안타고니스트 1,2,4-TMB와 복합체를 형성하는 PAS1의 구조를 결정하였다(도 5c). 소수성 포켓에 존재하는 동일한 아미노산 잔기들은 안타고니스트와 상호작용에 관여하였다(도 5d). PAS1과 아고니스트와의 상호작용 및 PAS1과 안타고니스트와의 상호작용의 유일한 차이점이 Phe46 위치에서 발견되었다. 안타고니스트와 의 복합체에서 아미노산 잔기의 방향족 고리는, 분자 A와 분자 B 모두에서 톨루엔과의 복합체 Phe46의 방향족 고리에 대하여 상대적으로 ~80°기울어져 있었다(도 5b 및 5d)
리간드와 결합하는데 가장 핵심적인 잔기를 정제된 PAS1 (23-168) 단백질을 사용한 ITC 분석을 통해 분석하였다. PAS1 이량체의 각 분자에 대한 2.6μM 및 38.3μM의 톨루엔 결합 친화도(K d, 해리상수)를 가진 연속적인 결합 모델을 통해 PAS1 이량체와 톨루엔을 위한 ITC 커브의 최적화를 수행하였다. PAS1에 F46A, F79Y, 및 W85H의 돌연변이를 도입함으로써, 톨루엔의 결합 친화도가 상당히 감소되었다. 특히, 돌연변이에 대한 톨루엔의 첫 번째 결합은 야생형(WT)에 비해 대략 5 - 50배의 약한 상호작용을 나타내었다. ITC에 의해 측정된 단백질에 결합하는 톨루엔의 열역학적 파라미터를 도 5e에 나타내었다.
C-말단의 키나아제 도메인과 직접적으로 연결되어 있는 C-말단(아미노산 잔기 150-163)의 구조적 형태는 어떤 리간드가 존재하는지에 따라서 다르다. 전술한 바와 같이, apo-PAS1 구조에서 헬릭스는 분자 B에서 완전히 흩어져 있다. 톨루엔과 결합한 PAS1 구조에서, 대응되는 부위는 알파 헬릭스가 재건되었다(도 5a). 안타고니스트 1,2,4-TMB의 경우, 대응되는 부위는 완전히 흩어져 있었고, 심지어 전자 밀도 지도에서는 분자 B에서 Lys155 이후에는 존재하지 않았다(도 5c). 모든 구조들에서 분자 A는 C-말단 부위(아미노산 잔기 150 - 163)에서 동일한 알파 헬릭스(α4) 형태를 보여주었다. 이러한 결과는 효능제 의존적인 PAS1 감지에 의해, TodS의 C-말단 키나아제 도메인에 대한 분자적 신호 전달을 시사하는 것이다. PAS1 C-말단 부위(아미노산 잔기 150 - 163)를 신호 전달 부위(STR, signal transfer region)라고 명명하였다.
실험예 6: PAS1 의존적 Tod S의 형태 분석
본 발명에서 분석한 Apo-PAS1, SeMet-PAS1/톨루엔 및 PAS1/1,2,4-TMB 복합체 입체구조 결과에 따르면, PAS1 단백질 내 같은 결합부위에 경쟁적으로 결합하는 톨루엔과 1,2,4-TMB과 같은 방향족 탄화수소들은, PAS1-B 분자 46번 페닐알라닌의 방향족 고리의 각도를 변화시켜 히스티딘 키나아제와 PAS1 도메인을 연결하는 아미노산 150-163 부위를 각각 정형화 혹은 비정형화된 C-말단 구조로 변형-유지함으로써, TodS의 다단계 인산화 신호전달이 리간드 특이적으로 조절되는 것으로 분석되었다(도 5a 내지 6).
또한, PAS1 단백질 내 소수성 결합공간의 리간드 결합부위를 위치-지정 돌연변이 생성 방법으로 변형시킨 PAS1 변이 단백질들이 대부분 단백질 정제과정에서 뭉침현상이 일어나는 등 단백질 구조에 심각한 영향을 받는 것은 PAS1-B분자의 소수성 결합공간과 C-말단의 헬릭스 구조 부위가 TodS의 리간드 특이적 신호전달에 필수적이라는 것을 시사한다. Apo-TodS 단백질과 1,2,4-TMB가 결합된 TodS 단백질의 전자현미경적 관찰 결과에서 보이는 TodS 이량체의 짧은 길이 및 뭉침현상도 PAS1-B 단량체의 비정형화된 C-말단 구조가 TodS 형태를 변화시켰음을 확인하게 한다(도 7a 내지 도 8c).
실험예 7: PAS1 단백질의 이량체화
중요한 PAS 도메인의 바로 윗 부위에 존재하는 이량체화 헬릭스 (아미노산 잔기 32-43)를 결정화를 위해 PAS1 도메인에서 제거하고, 인위적으로 역평행의 마주보는 이량체를 만들었다. 따라서, Azotobacter vinelandii NifL LOV 도메인의 구조(PDB ID: 2GJ3)에 기초하여 PAS1 이량체의 구조를 모델화하였다. 분자 A의 베타 시트 바깥에 존재하는 Val47, Leu49, 및 Leu131과 같은 소수성 잔기들은 각각 분자 B의 Ile39과 Leu43, His35과 Ile38, 및 Gly42와 상호작용 할 것으로 보이고, 이량체화 및 구조적 안정성의 유지에 관여할 것으로 보였다(도 11a).
따라서, 야생형 TodST 또는 이의 돌연변이체를 발현하는 플라스미드를 가진 슈도모나스 퓨티다 KT24400-PXZ 리포터 균주를 이용한 생체내 β-갈락토시다아제 분석 시스템(도 10)을 사용하여, 각 돌연변이체의 리간드 결합 및 다단계 신호 전달 능력을 평가하였다. 그 결과, V47L, L49D, 및 L131D 돌연변이체들은 톨루엔 환경에서 β-갈락토시다아제의 활성이 완전히 파괴되었다(도 11b). 이는 상기 잔기들이 PAS1의 이량화에 필수적 역할을 함을 시사하는 것이다. 이에 반하여, 베타 시트 밖에 위치하는, 전하를 띈 잔기인 Glu58의 돌연변이는 PAS1 이량화에 영향을 주지 않았다(도 11b).
실험예 8: TodS/TodT 시스템에서 PAS2의 역할
TodS는 PAS-형태 센서 도메인과 오토키나아제(autokinase) 도메인을 각각 함유하는 2개의 모듈을 포함한다. TodS는 두개의 센서 키나아제(double sensor kinase) 패밀리 멤버로 분류된다. TodS의 두 번째 모듈에 있는 PAS 도메인인 PAS2는 방향족 신호 분자를 감지하지 않는다. 따라서, 현재 PAS2의 역할은 명확히 알려져 있지 않다. 그러나, TodS의 동족체(homologue)인 StyS의 C-말단의 PAS 도메인은 세포의 산화환원 전위에 반응할 것으로 보인다. PAS2의 결정화를 위해 PAS2를 발현시켜 정제한 결과, 용액 내에서 이량체로 존재함을 알 수 있었다(도 12a). 그러나 PAS2의 결정화는 실패하였다.
서열 분석을 통해 PAS2가 Azotobacter vinelandii NifL LOV 도메인의 구조와 유사한 구조를 가질 것으로 예측되었다(PDB ID: 2GJ3). 따라서, NifL LOV 도메인의 구조를 주형으로 하여 PAS2 (아미노산 잔기 611 - 729)의 구조를 모델화하였다(도 12b). NifL의 FAD 결합 잔기 (Thr78 및 Leu86)에 대응되는 잔기들 중에서, PAS2의 Glu666 및 Leu674(도 12c)를 알라닌으로 변이시켜, 생체내 β-갈락토시다아제 분석 시스템을 사용하여 야생형 TodS에 대한 변이체들의 활성을 비교하였다. 그 결과, 야생형과 돌연변이 사이의 효소 활성에는 차이가 없음을 알 수 있었다(도 12d). 톨루엔과 복합체를 형성한 PAS1의 구조를 상기 모델화된 구조에 겹쳐(도 12e), PAS1과 톨루엔의 결합에 핵심적 역할을 하는, Ile114 및 Val126 잔기와 상응하는, PAS2의 Tyr691 및 Ala703 잔기를 선택하였다. Tyr691 및 Ala703 위치의 TodS 돌연변이체들은 야생형 TodS와 비교하여 톨루엔 신호 전달 능력에 큰 차이가 없었다(도 12d).
이러한 결과들을 통해, 알려진 바와 같이 PAS2 도메인이 톨루엔 또는 FAD 센서로서 기능하지 않는다는 것을 알 수 있었다. TodS가 이량체로서 기능하기 때문에, 인산의 전달(phospho-relay)을 정교하게 조절하는 과정에서 PAS2의 이량화가 중요하다는 가정을 하였다. 모델화된 PAS2 구조를 통해, Ser611 내지 Ser622까지를 둘러싸는 첫 번째 알파 헬릭스가 PAS2의 이량체화에 관여할 것으로 예측되었다. 흥미롭게도, TodS (아미노산 잔기 617 - 623)의 이량체화 부위를 결손시키면 m-자일렌 및 스티렌과 같은 약한 아고니스트에 대한 β-갈락토시다아제 활성의 기초적인 수준이 증가되었다(도 12d). 또한, 이중 돌연변이 (Y619A 및 E620A)가 일어난 TodS에서도 동일한 결과를 얻었다(도 12d). 이러한 결과들은 PAS2가 TodS의 정확한 이량체의 유지를 통해, C-말단의 HK2 및 TodT에 대해 phospho-relay를 정교하게 조절하는 기능을 함을 의미한다.
실험예 9: 전자 현미경을 이용한 TodS 단백질의 구조 분석
실험예 9-1: TodS (43 - 978) 단백질의 구조 분석
C-말단에 His6 태그를 가진 TodS (43 - 978) 단백질을 순수분리 정제한 후 음성 염색하여 단일 입자 분석법으로 전자 현미경 분석을 한 결과(도 7a 및 7b), 대략 2 nm 해상도의 분자 수준에서 Apo-TodS과 TodS/톨루엔 복합체, TodS/1,2,4-TMB 복합체의 형태를 분석할 수 있었다.
니켈-골드 입자로 C-말단의 His6 태그를 가진 TodS 단백질을 표지 한 후, 음성 염색으로 전자현미경 분석한 Apo-TodS 단백질은 두 개의 골드 입자를 나란히 가지고 있는 것으로 분석되어(도 7b), 동방향의 이량체 형태로 존재하는 것으로 판단되었다. 또한 Apo-TodS과 TodS/톨루엔 복합체는 N-말단 부위가 약간 벌어져 있는 이량체 형태로 유사한 구조적 특징을 공유하고 있었으나, PAS1/톨루엔 복합체의 길이가 Apo-TodS에 비해 상대적으로 긴 양상을 보였다(도 8a 및 8b). 또한, TodS/1,2,4-TMB 복합체는 TodS의 뭉침 현상(aggregation) 이 나타나는 빈도가 높은 것을 확인하였다(도 8c).
상기에서, SeMet-PAS1/톨루엔 복합체의 입체구조에서 보이는 C-말단의 α5 헬릭스 구조가 Apo-PAS1 단백질에서는 유연성을 보이는 루프의 형태로 보여진 바, Apo-TodS에서 보여지는 N-말단부위의 벌어짐은 이러한 유연성 때문일 것으로 판단되었다. 한편, TodS-톨루엔 복합체의 이량체의 길이가 상대적으로 긴 것은, PAS1 도메인의 α5 헬릭스가 톨루엔의 결합에 의해 형성되고, 효율적 인산화 기능을 수행하도록 전체 TodS의 형태에 영향을 준 것으로 판단되었다. 또한 TodS/1,2,4-TMB 복합체의 형태는, TodS 단백질 단독으로 있을 때 보이는 이량체 형태와 뭉침현상이 보이는 형태가 혼재하여 존재함을 확인하였고, 이는 리간드 특이적 PAS1 단백질의 구조변화가 TodS의 형태변화를 유도한다는 결과와 일치하였다.
실험예 9-2: TodS (23-978) 단백질의 구조 분석
완전한 길이의 TodS 단백질은 상당히 유동적(flexible)이고 쉽게 뭉쳐지므로, in vitro에서 단백질을 정제하고 생화학적인 실험을 수행하는 것은 어렵다. 그러나, C-말단에 His6 태그를 가진 TodS (43-978) 단백질과 N-말단의 GST가 결합된 TodS (23-978) 단백질은 상대적으로 수용성이 있고 정제과정이 용이하였다. 사이즈 배제 크로마토그래피 분석 결과, 정제된 TodS (23-978) 단백질은 크기 마커 단백질인 apoferritin (443 kDa)과 동일한 부분에서 분리되어 나왔고, 이를 통해 단백질이 유동적인 특성을 가짐을 알 수 있었다(도 9a). 또한, 전자 현미경 분석을 통해 이량체적인 배열을 가짐을 알 수 있었고, Apo-TodS 분자는 14.2nm의 길이 및 7.0nm의 너비를 가지고 있음을 알 수 있었다(도 9b).
PAS1의 톨루엔 감지에 따라 구조적 변화를 야기하여(특히, 아미노산 잔기 150 - 163) TodS/TodT 신호 전달에 영향을 주므로, TodS의 특성은 톨루엔의 존재하에 영향을 받을 것이라 예측하였다. 톨루엔을 감지한 TodS (23-978) 단백질은 분자적 수준에서 볼 때, Apo-TodS와 유사한 형태를 가지고 있었다. 그러나, TodS/톨루엔 복합체 단백질은 16.2nm의 길이 및 9.4nm의 너비를 가지고 있었고, 이는 더욱 곧은 형태가 되도록 구조적 변화가 있었음을 시사하는 것이다(도 9b). 또한, 안타고니스트 1,2,4-TMB와 TodS 복합체의 다량체화를 통해, 리간드 의존적인 TodS의 형태적 변화를 확인하였다(도 9b).
이러한 결과들은 TodS가 신호 전달의 활성화를 위해 리간드 의존적인 구조 변화를 겪음을 시사하는 것이다.
상기 결과를 종합하여, 리간드에 따라 TodS가 정렬되거나 또는 정렬되지 않은 구조로 변화함을 알 수 있었고, 이를 통해 TodS/TodT 신호 전달 과정에 대하여 분자 수준의 매커니즘을 모델을 만들었다(도 13). TodS는 신축성을 가지며, 오토키나아제(autokinase) 활성을 가지는 이량체로 존재한다. 이러한 상태에서 PAS1 감지 도메인은 STR의 신축성을 통해 C-말단의 HK1으로 신호를 효과적으로 전달하지 못한다. 따라서, 이러한 형태는 HK1의 자기인산화(autophosphorylation)가 가능한, 기능적인 이량체 형태를 유도하지 못한다. 톨루엔을 감지했을 때, PAS1 STR들은 신호를 전달하도록 재배열되고, TodS에 형태적 변화를 유도하여 HK1-RRR-PAS2-HK2 도메인이 다단계의 인산 신호 전달을 위해 배열되도록 만든다. TodS의 이량체 구조뿐만아니라, PAS1 센서 및 HK1 사이의 구조적 유동성은 특정 환경 조건 하에서 효율적인 신호 전달에 필수적이다.
실험예
10:
PAS1
의존적
TodS의
돌연변이체의
생체내
베타 갈락토시다아제
발현 스크리닝 및 신기능 감지센서 선발
상기 SeMet-PAS1/톨루엔 복합체 입체구조 분석에 의거, 46번 페닐알라닌(phenylalanine), 48번 글라이신(glycine), 59번 발린(valine), 63번 알라닌(alanine), 79번 페닐알라닌, 84번 트립토판 (tryptophane), 85번 트립토판, 114번 아이소류신(isoleucine), 126번 발린, 128번 페닐알라닌, 145번 알라닌, 147번 글라이신이 톨루엔과 수소 결합(Hydrogen bond) 또는 물 분자-매개 수소 결합을 이루고, 특히 46번 페닐알라닌, 146번 알지닌, 148번 글루탐산이 SeMet-PAS1-B 분자의 C-말단 헬릭스 구조변화에 필수적임을 확인하였다(도 3 내지 6).
이에 본 발명자들은 pBBR-PtodS-TodST 클론에 위치-지정 돌연변이를 유도하여 서열번호 1의 아미노산 서열을 가진 TodS 단백질에서 46번 페닐알라닌을 알라닌 또는 세린으로, 59번 발린을 알라닌, 아스파틱산 또는 페닐알라닌으로, 63번 알라닌을 발린 또는 세린으로, 79번 페닐알라닌을 타이로신(tyrosine), 글루탐산 또는 류신으로, 84번 트립토판을 발린, 히스티딘(histidine) 또는 알지닌으로, 85번 트립토판을 히스티딘, 알지닌 또는 류신으로, 114번 아이소류신을 발린, 페닐알라닌, 쓰레오닌(threonine) 또는 세린으로, 126번 발린을 알라닌, 세린, 쓰레오닌 또는 류신으로, 128번 페닐알라닌을 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로, 145번 알라닌을 세린 또는 발린으로, 47번 발린을 알라닌 또는 류신으로, 49번 류신을 아스파틱산 또는 알라닌으로, 58번 글루탐산을 알라닌 또는 세린으로, 131번 류신을 아스파틱산으로, 61번 글루타민을 류신, 알지닌, 알라닌으로, 146번 글루탐산을 알라닌 또는 류신으로, 148번 알지닌을 알라닌 또는 메티오닌(methionine)으로 치환시킨 후, 슈도모나스 퓨티다 KT2440-PXZ 리포터 균주로 도입하였다 (표 1). 상기 TodS 변이 단백질을 발현하는 슈도모나스 퓨티다 KT2440-PXZ 리포터 균주는 특정 리간드 공급에 의해 생체 내에서 TodS 변이 단백질과 TodT의 단백질의 인산화을 순차적으로 유도하였다. 본 발명에서 구축된 96-딥 웰 스크리닝 방법은 가스 상태로 공급되는 2.5 내지 400μM 농도의 특정 리간드에 노출된 PAS1-의존 TodS 변이 단백질과 야생형 TodS 단백질을 3반복으로 검증하여, 최종 리간드 결합과 TodS/TodT 2개 인자 신호전달에 중요한 PAS1 단백질의 아미노산들을 각각 선발하였다(도 14 내지 19).
상기 스크리닝 결과, 46번 페닐알라닌을 알라닌 또는 세린으로, 59번 발린을 알라닌, 아스파틱산 또는 페닐알라닌으로, 63번 알라닌을 발린 또는 세린으로, 79번 페닐알라닌을 타이로신, 글루탐산 또는 류신으로, 84번 트립토판을 발린, 히스티딘 또는 알지닌으로, 85번 트립토판을 히스티딘, 알지닌, 또는 류신으로, 114번 아이소류신을 페닐알라닌, 쓰레오닌(threonine) 또는 세린으로, 126번 발린을 세린, 쓰레오닌, 또는 류신으로, 128번 페닐알라닌을 글루탐산, 히스티딘, 아스파틱산, 세린 또는 류신으로, 145번 알라닌을 세린 또는 발린으로 치환한 경우, 모두 10 μM 내지 100 μM 톨루엔에 의한 TodS/TodT 2개 인자 신호전달이 저해되었다(도 14 내지 15b).
그러나, 126번 발린을 알라닌으로 치환한 경우는 10μM 톨루엔에 대한 민감도가 낮아지기는 했으나, 100μM 톨루엔에 의해서는 여전히 신호전달이 이루어졌다(도 15b).
또한, 114번 아이소류신을 페닐알라닌 또는 세린으로 치환한 경우에는 100 μM의 톨루엔이 공급되어도 다른 잔기와 마찬가지로 톨루엔 결합이 저해되었으나(도 14), 114번 아이소류신을 발린으로 치환한 경우(I114V TodS)는 50-100μM m-자일렌에도 높은 신호전달 활성을 나타내었고, 이것은 야생형 TodS와 비교하여 약 2-4배 이상 높은 민감도를 보이는 것으로 확인되었다(도 15b).
또한, 47번 발린을 알라닌, 또는 류신으로, 49번 류신을 알라닌, 또는 아스파틱산으로, 58번 글루탐산을 알리닌 또는 세린으로, 131번 류신을 아스파틱산으로, 146번 글루탐산을 알라닌 또는 류신으로, 148번 알지닌을 알라닌 또는 메티오닌으로 치환시킨 경우, 역시 모두 10μM 톨루엔에 의한 TodS/TodT 2개 인자 신호전달이 저해되었다(도 16 및 17).
또한, 61번 글루타민이 알지닌으로 치환된, Q61R TodS의 경우에는 톨루엔에 비해 4배, 스티렌, m-자일렌에 비해 2 내지 5배 이상 민감도가 증대되었고, 야생형의 TodS의 길항제인 o-자일렌에도 TodS/TodT 2개 인자 신호전달이 매우 높게 이루어졌다(도 18a 내지 도 19). 이에, 톨루엔 결합부위를 디자인한 각 I114V와 Q61R로 변형된 PAS1과 TodS 단백질을 각각 m-자일렌과 o-자일렌 등에 민감하게 반응하는 신기능의 감지센서 모듈(ePAS1)로 선발하였다.
상기 결과를 종합하면, PAS1 단백질은 톨루엔과의 결합을 통하여, tod 오페론의 발현을 상향 조절함으로써, 톨루엔 분해를 촉진하게 되는 중요한 감지센서 단백질로 기능한다. 따라서, 본 발명의 Apo-PAS1, SeMet-PAS1/톨루엔, PAS1/1,2,4-TMB 복합체의 3차원적 입체구조를 이용하여, TodS가 톨루엔이외의 다양한 리간드 특이적 결합에 의해 tod 유전자의 발현을 조절하도록 리간드 결합부위를 재디자인하여 신기능의 감지센서 모듈을 개발할 수 있다. 또한, 96 딥 웰에서 가스 상인 리간드에 반응하여 생체 내 베타 갈락토시다아제 발현을 유도하는 PAS1 변이 단백질들을 동시에 대량 스크리닝하는 방범을 구축하여 민감도 높은 신기능의 감지센서를 선발할 수 있다.
또한, 본 발명의 PAS1 변이 단백질 또는 TodS 변이 단백질과 공지된 탄화수소 분해 단백질을 이용하여, 상기 변이 단백질과 방향족 탄화수소의 결합에 따라 탄화수소 분해 단백질이 발현되는, 방향족 탄화수소 분해용 미생물을 제작할 수 있다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그 리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> Korea Research Institute of Bioscience and Biotechnology
<120> TodS mutein comprising PAS1 mutein and use thereof
<130> KPA141137-KR-P1
<150> 10-2014-0153892
<151> 2014-11-06
<160> 130
<170> KopatentIn 2.0
<210> 1
<211> 978
<212> PRT
<213> Pseudomonas putida F1
<400> 1
Met Ser Ser Leu Asp Arg Lys Lys Pro Gln Asn Arg Ser Lys Asn Asn
1 5 10 15
Tyr Tyr Asn Ile Cys Leu Lys Glu Lys Gly Ser Glu Glu Leu Thr Cys
20 25 30
Glu Glu His Ala Arg Ile Ile Phe Asp Gly Leu Tyr Glu Phe Val Gly
35 40 45
Leu Leu Asp Ala His Gly Asn Val Leu Glu Val Asn Gln Val Ala Leu
50 55 60
Glu Gly Gly Gly Ile Thr Leu Glu Glu Ile Arg Gly Lys Pro Phe Trp
65 70 75 80
Lys Ala Arg Trp Trp Gln Ile Ser Lys Lys Thr Glu Ala Thr Gln Lys
85 90 95
Arg Leu Val Glu Thr Ala Ser Ser Gly Glu Phe Val Arg Cys Asp Val
100 105 110
Glu Ile Leu Gly Lys Ser Gly Gly Arg Glu Val Ile Ala Val Asp Phe
115 120 125
Ser Leu Leu Pro Ile Cys Asn Glu Glu Gly Ser Ile Val Tyr Leu Leu
130 135 140
Ala Glu Gly Arg Asn Ile Thr Asp Lys Lys Lys Ala Glu Ala Met Leu
145 150 155 160
Ala Leu Lys Asn Gln Glu Leu Glu Gln Ser Val Glu Cys Ile Arg Lys
165 170 175
Leu Asp Asn Ala Lys Ser Asp Phe Phe Ala Lys Val Ser His Glu Leu
180 185 190
Arg Thr Pro Leu Ser Leu Ile Leu Gly Pro Leu Glu Ala Val Met Ala
195 200 205
Ala Glu Ala Gly Arg Glu Ser Pro Tyr Trp Lys Gln Phe Glu Val Ile
210 215 220
Gln Arg Asn Ala Met Thr Leu Leu Lys Gln Val Asn Thr Leu Leu Asp
225 230 235 240
Leu Ala Lys Met Asp Ala Arg Gln Met Gly Leu Ser Tyr Arg Arg Ala
245 250 255
Asn Leu Ser Gln Leu Thr Arg Thr Ile Ser Ser Asn Phe Glu Gly Ile
260 265 270
Ala Gln Gln Lys Ser Ile Thr Phe Asp Thr Lys Leu Pro Val Gln Met
275 280 285
Val Ala Glu Val Asp Cys Glu Lys Tyr Glu Arg Ile Ile Leu Asn Leu
290 295 300
Leu Ser Asn Ala Phe Lys Phe Thr Pro Asp Gly Gly Leu Ile Arg Cys
305 310 315 320
Cys Leu Ser Leu Ser Arg Pro Asn Tyr Ala Leu Val Thr Val Ser Asp
325 330 335
Ser Gly Pro Gly Ile Pro Pro Ala Leu Arg Lys Glu Ile Phe Glu Arg
340 345 350
Phe His Gln Leu Ser Gln Glu Gly Gln Gln Ala Thr Arg Gly Thr Gly
355 360 365
Leu Gly Leu Ser Ile Val Lys Glu Phe Val Glu Leu His Arg Gly Thr
370 375 380
Ile Ser Val Ser Asp Ala Pro Gly Gly Gly Ala Leu Phe Gln Val Lys
385 390 395 400
Leu Pro Leu Asn Ala Pro Glu Gly Ala Tyr Val Ala Ser Asn Thr Ala
405 410 415
Pro Arg Arg Asp Asn Pro Gln Val Val Asp Thr Asp Glu Tyr Leu Leu
420 425 430
Leu Ala Pro Asn Ala Glu Asn Glu Ala Glu Val Leu Pro Phe Gln Ser
435 440 445
Asp Gln Pro Arg Val Leu Ile Val Glu Asp Asn Pro Asp Met Arg Gly
450 455 460
Phe Ile Lys Asp Cys Leu Ser Ser Asp Tyr Gln Val Tyr Val Ala Pro
465 470 475 480
Asp Gly Ala Lys Ala Leu Glu Leu Met Ser Asn Met Pro Pro Asp Leu
485 490 495
Leu Ile Thr Asp Leu Ile Met Pro Val Met Ser Gly Asp Met Leu Val
500 505 510
His Gln Val Arg Lys Lys Asn Glu Leu Ser His Ile Pro Ile Met Val
515 520 525
Leu Ser Ala Lys Ser Asp Ala Glu Leu Arg Val Lys Leu Leu Ser Glu
530 535 540
Ser Val Gln Asp Phe Leu Leu Lys Pro Phe Ser Ala His Glu Leu Arg
545 550 555 560
Ala Arg Val Ser Asn Leu Val Ser Met Lys Val Ala Gly Asp Ala Leu
565 570 575
Arg Lys Glu Leu Ser Asp Gln Gly Asp Asp Ile Ala Ile Leu Thr His
580 585 590
Arg Leu Ile Lys Ser Arg His Arg Leu Gln Gln Ser Asn Ile Ala Leu
595 600 605
Ser Ala Ser Glu Ala Arg Trp Lys Ala Val Tyr Glu Asn Ser Ala Ala
610 615 620
Gly Ile Val Leu Thr Asp Pro Glu Asn Arg Ile Leu Asn Ala Asn Pro
625 630 635 640
Ala Phe Gln Arg Ile Thr Gly Tyr Gly Glu Lys Asp Leu Glu Gly Leu
645 650 655
Ser Met Glu Gln Leu Thr Pro Ser Asp Glu Ser Pro Gln Ile Lys Gln
660 665 670
Arg Leu Ala Asn Leu Leu Gln Gly Gly Gly Ala Glu Tyr Ser Val Glu
675 680 685
Arg Ser Tyr Leu Cys Lys Asn Gly Ser Thr Ile Trp Ala Asn Ala Ser
690 695 700
Val Ser Leu Met Pro Gln Arg Val Gly Glu Ser Pro Val Ile Leu Gln
705 710 715 720
Ile Ile Asp Asp Ile Thr Glu Lys Lys Gln Ala Gln Glu Asn Leu Asn
725 730 735
Gln Leu Gln Gln Gln Leu Val Tyr Val Ser Arg Ser Ala Thr Met Gly
740 745 750
Glu Phe Ala Ala Tyr Ile Ala His Glu Ile Asn Gln Pro Leu Ser Ala
755 760 765
Ile Met Thr Asn Ala Asn Ala Gly Thr Arg Trp Leu Gly Asn Glu Pro
770 775 780
Ser Asn Ile Pro Glu Ala Lys Glu Ala Leu Ala Arg Ile Ile Arg Asp
785 790 795 800
Ser Asp Arg Ala Ala Glu Ile Ile Arg Met Val Arg Ser Phe Leu Lys
805 810 815
Arg Gln Glu Thr Val Leu Lys Pro Ile Asp Leu Lys Ala Leu Val Thr
820 825 830
Asp Thr Ser Leu Ile Leu Lys Ala Pro Ser Gln Asn Asn Ser Val Asn
835 840 845
Leu Asp Val Val Ala Asp Asp Glu Leu Pro Glu Ile Trp Gly Asp Gly
850 855 860
Val Gln Ile Gln Gln Leu Ile Ile Asn Leu Ala Met Asn Ala Ile Glu
865 870 875 880
Ala Ile Ser Gln Ala Asp Cys Glu Thr Arg Gln Leu Thr Leu Ser Phe
885 890 895
Ser Gly Asn Asp Thr Gly Asp Ala Leu Val Ile Ser Val Lys Asp Thr
900 905 910
Gly Pro Gly Ile Ser Glu Arg Gln Met Ala Gln Leu Phe Asn Ala Phe
915 920 925
Tyr Thr Thr Lys Lys Glu Gly Leu Gly Met Gly Leu Ala Ile Cys Leu
930 935 940
Thr Ile Thr Glu Val His Asn Gly Lys Ile Trp Val Glu Cys Pro Pro
945 950 955 960
Ala Gly Gly Ala Cys Phe Leu Val Ser Ile Pro Ala Arg Gln Gly Ser
965 970 975
Gly Thr
<210> 2
<211> 2937
<212> DNA
<213> Pseudomonas putida F1
<400> 2
atgagctcct tggatagaaa aaagcctcaa aatagatcga aaaataatta ttataatatc 60
tgcctcaagg agaaaggatc tgaagagctg acgtgtgaag aacatgcacg catcatattt 120
gatgggctct acgagtttgt gggccttctt gatgctcatg gaaatgtgct tgaagtgaac 180
caggtcgcat tggagggggg cgggattact ctggaagaaa tacgagggaa gccattctgg 240
aaggcgcgtt ggtggcaaat ttcaaaaaaa accgaggcga cccaaaagcg acttgttgaa 300
actgcatcat ccggtgaatt tgttcgctgt gatgttgaga ttcttggaaa atcaggtgga 360
agagaggtaa tagccgtcga tttttcattg ctgccaattt gcaatgaaga agggagcatt 420
gtttaccttc ttgcggaagg gcgcaatatt accgataaga agaaagccga ggccatgctg 480
gcgttgaaga accaggaatt ggagcagtcg gttgagtgta tccgaaaact cgataatgcg 540
aagagtgatt tctttgccaa ggtgagccat gagttgcgca ctccgctgtc tttgattcta 600
gggccactgg aagccgttat ggcggcagag gctgggcgtg aatcgccgta ttggaagcag 660
tttgaggtca ttcagcgtaa tgcaatgacc ctgttgaaac aggttaacac gctgcttgac 720
ttggcgaaaa tggacgcccg gcagatgggg ctttcctatc ggcgagccaa tcttagtcag 780
ctcacccgta ctattagctc gaattttgaa ggaatagccc agcaaaaatc aataacgttc 840
gatacaaaac tgcctgtaca gatggtcgct gaggtggatt gtgagaaata cgaacgcatt 900
atccttaact tgctttccaa tgcgtttaaa ttcacccctg acggggggct tatccgttgc 960
tgtcttagtt tgagtcgacc aaattatgcc ttggttactg tatctgatag cgggccgggt 1020
attcctcctg cactgcgtaa agaaatattt gaacgtttcc accagctaag ccaggaaggt 1080
caacaagcta cgcggggtac aggcttgggg ctttccattg tgaaagaatt cgttgaattg 1140
caccgtggaa caatttctgt aagtgatgcc ccgggcgggg gggcgctttt tcaggtaaag 1200
ctgccgctga atgctcctga aggtgcttat gttgcgagta acaccgcgcc gcgaagagat 1260
aatcctcagg tcgtggatac ggatgagtac cttttgctgg cgcccaatgc ggaaaatgaa 1320
gccgaggtgc ttccatttca atccgaccag cctcgggtgc taatcgttga agataaccct 1380
gatatgcgtg gttttataaa ggactgtctc agtagcgact atcaagttta tgttgcaccc 1440
gacggtgcaa aggcattgga gttgatgtca aacatgccgc cagacctgtt gattacagac 1500
ctgataatgc ctgttatgag cggcgatatg ctggttcacc aagtgcgtaa gaaaaatgaa 1560
ctttcacata tcccgatcat ggtgctgtcg gccaagtcag acgcagaact gcgtgtgaaa 1620
ttgctctccg agtcggtgca ggactttctt cttaagccat tttctgctca tgagctacga 1680
gcgcgtgtaa gcaatctggt atccatgaag gtggcaggcg atgcgttgcg taaggagctt 1740
tccgatcagg gggatgatat tgcgatactt actcaccgtc tgatcaaaag tcgccatcgt 1800
cttcagcaga gtaacatcgc attatccgcc tcggaagcgc gttggaaagc agtgtatgaa 1860
aactctgcgg ccggtattgt actgaccgac ccggaaaacc gaatactcaa cgccaatcct 1920
gcatttcaac gcattaccgg atatggggaa aaggatttgg agggactttc catggagcaa 1980
ttgactccat ctgacgaaag cccacagata aagcagcgtc tggccaattt gcttcagggt 2040
gggggagcgg aatacagtgt ggagcgctcc tatctatgca aaaatggttc tacgatttgg 2100
gccaatgcga gtgtctcgct gatgcctcaa cgtgtcggtg aatctccagt tatactgcag 2160
atcatcgatg acatcactga gaagaaacaa gcacaggaaa atcttaacca attgcagcaa 2220
caacttgtgt acgtttcccg atcagctacg atgggtgaat ttgcagccta tattgcacac 2280
gagataaacc aaccgctctc ggcgatcatg accaatgcca atgctggcac acgttggtta 2340
ggtaatgagc catctaacat cccagaggct aaagaggcac tggctcgcat tatccgagat 2400
tccgaccgcg ctgcagaaat tatccgtatg gtacgctcct tcctgaagcg tcaagaaacg 2460
gtgctgaaac cgattgatct aaaagcactg gtaactgata caagcctgat acttaaggcc 2520
cctagtcaga ataacagtgt caatttggat gttgttgcgg atgatgaact ccctgagata 2580
tggggggatg gtgtacagat ccagcagttg ataataaatc tggctatgaa cgctattgaa 2640
gcgatcagcc aagccgactg tgaaaccagg cagctaaccc tgtcattctc aggcaatgat 2700
acaggtgatg cgcttgttat ctcagtgaaa gatacaggtc caggtatttc agagaggcag 2760
atggcgcagt tgttcaacgc attctacacc acaaaaaaag aagggcttgg tatgggattg 2820
gcaatctgtc ttacaatcac ggaagtgcat aacggtaaaa tatgggttga gtgcccgccc 2880
gctgggggtg cttgtttcct ggtaagtatc cctgccagac agggctccgg cacatga 2937
<210> 3
<211> 126
<212> PRT
<213> Pseudomonas putida F1
<400> 3
Leu Tyr Glu Phe Val Gly Leu Leu Asp Ala His Gly Asn Val Leu Glu
1 5 10 15
Val Asn Gln Val Ala Leu Glu Gly Gly Gly Ile Thr Leu Glu Glu Ile
20 25 30
Arg Gly Lys Pro Phe Trp Lys Ala Arg Trp Trp Gln Ile Ser Lys Lys
35 40 45
Thr Glu Ala Thr Gln Lys Arg Leu Val Glu Thr Ala Ser Ser Gly Glu
50 55 60
Phe Val Arg Cys Asp Val Glu Ile Leu Gly Lys Ser Gly Gly Arg Glu
65 70 75 80
Val Ile Ala Val Asp Phe Ser Leu Leu Pro Ile Cys Asn Glu Glu Gly
85 90 95
Ser Ile Val Tyr Leu Leu Ala Glu Gly Arg Asn Ile Thr Asp Lys Lys
100 105 110
Lys Ala Glu Ala Met Leu Ala Leu Lys Asn Gln Glu Leu Glu
115 120 125
<210> 4
<211> 378
<212> DNA
<213> Pseudomonas putida F1
<400> 4
ctctacgagt ttgtgggcct tcttgatgct catggaaatg tgcttgaagt gaaccaggtc 60
gcattggagg ggggcgggat tactctggaa gaaatacgag ggaagccatt ctggaaggcg 120
cgttggtggc aaatttcaaa aaaaaccgag gcgacccaaa agcgacttgt tgaaactgca 180
tcatccggtg aatttgttcg ctgtgatgtt gagattcttg gaaaatcagg tggaagagag 240
gtaatagccg tcgatttttc attgctgcca atttgcaatg aagaagggag cattgtttac 300
cttcttgcgg aagggcgcaa tattaccgat aagaagaaag ccgaggccat gctggcgttg 360
aagaaccagg aattggag 378
<210> 5
<211> 146
<212> PRT
<213> Pseudomonas putida F1
<400> 5
Lys Glu Lys Gly Ser Glu Glu Leu Thr Cys Glu Glu His Ala Arg Ile
1 5 10 15
Ile Phe Asp Gly Leu Tyr Glu Phe Val Gly Leu Leu Asp Ala His Gly
20 25 30
Asn Val Leu Glu Val Asn Gln Val Ala Leu Glu Gly Gly Gly Ile Thr
35 40 45
Leu Glu Glu Ile Arg Gly Lys Pro Phe Trp Lys Ala Arg Trp Trp Gln
50 55 60
Ile Ser Lys Lys Thr Glu Ala Thr Gln Lys Arg Leu Val Glu Thr Ala
65 70 75 80
Ser Ser Gly Glu Phe Val Arg Cys Asp Val Glu Ile Leu Gly Lys Ser
85 90 95
Gly Gly Arg Glu Val Ile Ala Val Asp Phe Ser Leu Leu Pro Ile Cys
100 105 110
Asn Glu Glu Gly Ser Ile Val Tyr Leu Leu Ala Glu Gly Arg Asn Ile
115 120 125
Thr Asp Lys Lys Lys Ala Glu Ala Met Leu Ala Leu Lys Asn Gln Glu
130 135 140
Leu Glu
145
<210> 6
<211> 438
<212> DNA
<213> Pseudomonas putida F1
<400> 6
aaggagaaag gatctgaaga gctgacgtgt gaagaacatg cacgcatcat atttgatggg 60
ctctacgagt ttgtgggcct tcttgatgct catggaaatg tgcttgaagt gaaccaggtc 120
gcattggagg ggggcgggat tactctggaa gaaatacgag ggaagccatt ctggaaggcg 180
cgttggtggc aaatttcaaa aaaaaccgag gcgacccaaa agcgacttgt tgaaactgca 240
tcatccggtg aatttgttcg ctgtgatgtt gagattcttg gaaaatcagg tggaagagag 300
gtaatagccg tcgatttttc attgctgcca atttgcaatg aagaagggag cattgtttac 360
cttcttgcgg aagggcgcaa tattaccgat aagaagaaag ccgaggccat gctggcgttg 420
aagaaccagg aattggag 438
<210> 7
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> I114V TodS
<400> 7
Met Ser Ser Leu Asp Arg Lys Lys Pro Gln Asn Arg Ser Lys Asn Asn
1 5 10 15
Tyr Tyr Asn Ile Cys Leu Lys Glu Lys Gly Ser Glu Glu Leu Thr Cys
20 25 30
Glu Glu His Ala Arg Ile Ile Phe Asp Gly Leu Tyr Glu Phe Val Gly
35 40 45
Leu Leu Asp Ala His Gly Asn Val Leu Glu Val Asn Gln Val Ala Leu
50 55 60
Glu Gly Gly Gly Ile Thr Leu Glu Glu Ile Arg Gly Lys Pro Phe Trp
65 70 75 80
Lys Ala Arg Trp Trp Gln Ile Ser Lys Lys Thr Glu Ala Thr Gln Lys
85 90 95
Arg Leu Val Glu Thr Ala Ser Ser Gly Glu Phe Val Arg Cys Asp Val
100 105 110
Glu Val Leu Gly Lys Ser Gly Gly Arg Glu Val Ile Ala Val Asp Phe
115 120 125
Ser Leu Leu Pro Ile Cys Asn Glu Glu Gly Ser Ile Val Tyr Leu Leu
130 135 140
Ala Glu Gly Arg Asn Ile Thr Asp Lys Lys Lys Ala Glu Ala Met Leu
145 150 155 160
Ala Leu Lys Asn Gln Glu Leu Glu Gln Ser Val Glu Cys Ile Arg Lys
165 170 175
Leu Asp Asn Ala Lys Ser Asp Phe Phe Ala Lys Val Ser His Glu Leu
180 185 190
Arg Thr Pro Leu Ser Leu Ile Leu Gly Pro Leu Glu Ala Val Met Ala
195 200 205
Ala Glu Ala Gly Arg Glu Ser Pro Tyr Trp Lys Gln Phe Glu Val Ile
210 215 220
Gln Arg Asn Ala Met Thr Leu Leu Lys Gln Val Asn Thr Leu Leu Asp
225 230 235 240
Leu Ala Lys Met Asp Ala Arg Gln Met Gly Leu Ser Tyr Arg Arg Ala
245 250 255
Asn Leu Ser Gln Leu Thr Arg Thr Ile Ser Ser Asn Phe Glu Gly Ile
260 265 270
Ala Gln Gln Lys Ser Ile Thr Phe Asp Thr Lys Leu Pro Val Gln Met
275 280 285
Val Ala Glu Val Asp Cys Glu Lys Tyr Glu Arg Ile Ile Leu Asn Leu
290 295 300
Leu Ser Asn Ala Phe Lys Phe Thr Pro Asp Gly Gly Leu Ile Arg Cys
305 310 315 320
Cys Leu Ser Leu Ser Arg Pro Asn Tyr Ala Leu Val Thr Val Ser Asp
325 330 335
Ser Gly Pro Gly Ile Pro Pro Ala Leu Arg Lys Glu Ile Phe Glu Arg
340 345 350
Phe His Gln Leu Ser Gln Glu Gly Gln Gln Ala Thr Arg Gly Thr Gly
355 360 365
Leu Gly Leu Ser Ile Val Lys Glu Phe Val Glu Leu His Arg Gly Thr
370 375 380
Ile Ser Val Ser Asp Ala Pro Gly Gly Gly Ala Leu Phe Gln Val Lys
385 390 395 400
Leu Pro Leu Asn Ala Pro Glu Gly Ala Tyr Val Ala Ser Asn Thr Ala
405 410 415
Pro Arg Arg Asp Asn Pro Gln Val Val Asp Thr Asp Glu Tyr Leu Leu
420 425 430
Leu Ala Pro Asn Ala Glu Asn Glu Ala Glu Val Leu Pro Phe Gln Ser
435 440 445
Asp Gln Pro Arg Val Leu Ile Val Glu Asp Asn Pro Asp Met Arg Gly
450 455 460
Phe Ile Lys Asp Cys Leu Ser Ser Asp Tyr Gln Val Tyr Val Ala Pro
465 470 475 480
Asp Gly Ala Lys Ala Leu Glu Leu Met Ser Asn Met Pro Pro Asp Leu
485 490 495
Leu Ile Thr Asp Leu Ile Met Pro Val Met Ser Gly Asp Met Leu Val
500 505 510
His Gln Val Arg Lys Lys Asn Glu Leu Ser His Ile Pro Ile Met Val
515 520 525
Leu Ser Ala Lys Ser Asp Ala Glu Leu Arg Val Lys Leu Leu Ser Glu
530 535 540
Ser Val Gln Asp Phe Leu Leu Lys Pro Phe Ser Ala His Glu Leu Arg
545 550 555 560
Ala Arg Val Ser Asn Leu Val Ser Met Lys Val Ala Gly Asp Ala Leu
565 570 575
Arg Lys Glu Leu Ser Asp Gln Gly Asp Asp Ile Ala Ile Leu Thr His
580 585 590
Arg Leu Ile Lys Ser Arg His Arg Leu Gln Gln Ser Asn Ile Ala Leu
595 600 605
Ser Ala Ser Glu Ala Arg Trp Lys Ala Val Tyr Glu Asn Ser Ala Ala
610 615 620
Gly Ile Val Leu Thr Asp Pro Glu Asn Arg Ile Leu Asn Ala Asn Pro
625 630 635 640
Ala Phe Gln Arg Ile Thr Gly Tyr Gly Glu Lys Asp Leu Glu Gly Leu
645 650 655
Ser Met Glu Gln Leu Thr Pro Ser Asp Glu Ser Pro Gln Ile Lys Gln
660 665 670
Arg Leu Ala Asn Leu Leu Gln Gly Gly Gly Ala Glu Tyr Ser Val Glu
675 680 685
Arg Ser Tyr Leu Cys Lys Asn Gly Ser Thr Ile Trp Ala Asn Ala Ser
690 695 700
Val Ser Leu Met Pro Gln Arg Val Gly Glu Ser Pro Val Ile Leu Gln
705 710 715 720
Ile Ile Asp Asp Ile Thr Glu Lys Lys Gln Ala Gln Glu Asn Leu Asn
725 730 735
Gln Leu Gln Gln Gln Leu Val Tyr Val Ser Arg Ser Ala Thr Met Gly
740 745 750
Glu Phe Ala Ala Tyr Ile Ala His Glu Ile Asn Gln Pro Leu Ser Ala
755 760 765
Ile Met Thr Asn Ala Asn Ala Gly Thr Arg Trp Leu Gly Asn Glu Pro
770 775 780
Ser Asn Ile Pro Glu Ala Lys Glu Ala Leu Ala Arg Ile Ile Arg Asp
785 790 795 800
Ser Asp Arg Ala Ala Glu Ile Ile Arg Met Val Arg Ser Phe Leu Lys
805 810 815
Arg Gln Glu Thr Val Leu Lys Pro Ile Asp Leu Lys Ala Leu Val Thr
820 825 830
Asp Thr Ser Leu Ile Leu Lys Ala Pro Ser Gln Asn Asn Ser Val Asn
835 840 845
Leu Asp Val Val Ala Asp Asp Glu Leu Pro Glu Ile Trp Gly Asp Gly
850 855 860
Val Gln Ile Gln Gln Leu Ile Ile Asn Leu Ala Met Asn Ala Ile Glu
865 870 875 880
Ala Ile Ser Gln Ala Asp Cys Glu Thr Arg Gln Leu Thr Leu Ser Phe
885 890 895
Ser Gly Asn Asp Thr Gly Asp Ala Leu Val Ile Ser Val Lys Asp Thr
900 905 910
Gly Pro Gly Ile Ser Glu Arg Gln Met Ala Gln Leu Phe Asn Ala Phe
915 920 925
Tyr Thr Thr Lys Lys Glu Gly Leu Gly Met Gly Leu Ala Ile Cys Leu
930 935 940
Thr Ile Thr Glu Val His Asn Gly Lys Ile Trp Val Glu Cys Pro Pro
945 950 955 960
Ala Gly Gly Ala Cys Phe Leu Val Ser Ile Pro Ala Arg Gln Gly Ser
965 970 975
Gly Thr
<210> 8
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> Q61R TodS
<400> 8
Met Ser Ser Leu Asp Arg Lys Lys Pro Gln Asn Arg Ser Lys Asn Asn
1 5 10 15
Tyr Tyr Asn Ile Cys Leu Lys Glu Lys Gly Ser Glu Glu Leu Thr Cys
20 25 30
Glu Glu His Ala Arg Ile Ile Phe Asp Gly Leu Tyr Glu Phe Val Gly
35 40 45
Leu Leu Asp Ala His Gly Asn Val Leu Glu Val Asn Arg Val Ala Leu
50 55 60
Glu Gly Gly Gly Ile Thr Leu Glu Glu Ile Arg Gly Lys Pro Phe Trp
65 70 75 80
Lys Ala Arg Trp Trp Gln Ile Ser Lys Lys Thr Glu Ala Thr Gln Lys
85 90 95
Arg Leu Val Glu Thr Ala Ser Ser Gly Glu Phe Val Arg Cys Asp Val
100 105 110
Glu Ile Leu Gly Lys Ser Gly Gly Arg Glu Val Ile Ala Val Asp Phe
115 120 125
Ser Leu Leu Pro Ile Cys Asn Glu Glu Gly Ser Ile Val Tyr Leu Leu
130 135 140
Ala Glu Gly Arg Asn Ile Thr Asp Lys Lys Lys Ala Glu Ala Met Leu
145 150 155 160
Ala Leu Lys Asn Gln Glu Leu Glu Gln Ser Val Glu Cys Ile Arg Lys
165 170 175
Leu Asp Asn Ala Lys Ser Asp Phe Phe Ala Lys Val Ser His Glu Leu
180 185 190
Arg Thr Pro Leu Ser Leu Ile Leu Gly Pro Leu Glu Ala Val Met Ala
195 200 205
Ala Glu Ala Gly Arg Glu Ser Pro Tyr Trp Lys Gln Phe Glu Val Ile
210 215 220
Gln Arg Asn Ala Met Thr Leu Leu Lys Gln Val Asn Thr Leu Leu Asp
225 230 235 240
Leu Ala Lys Met Asp Ala Arg Gln Met Gly Leu Ser Tyr Arg Arg Ala
245 250 255
Asn Leu Ser Gln Leu Thr Arg Thr Ile Ser Ser Asn Phe Glu Gly Ile
260 265 270
Ala Gln Gln Lys Ser Ile Thr Phe Asp Thr Lys Leu Pro Val Gln Met
275 280 285
Val Ala Glu Val Asp Cys Glu Lys Tyr Glu Arg Ile Ile Leu Asn Leu
290 295 300
Leu Ser Asn Ala Phe Lys Phe Thr Pro Asp Gly Gly Leu Ile Arg Cys
305 310 315 320
Cys Leu Ser Leu Ser Arg Pro Asn Tyr Ala Leu Val Thr Val Ser Asp
325 330 335
Ser Gly Pro Gly Ile Pro Pro Ala Leu Arg Lys Glu Ile Phe Glu Arg
340 345 350
Phe His Gln Leu Ser Gln Glu Gly Gln Gln Ala Thr Arg Gly Thr Gly
355 360 365
Leu Gly Leu Ser Ile Val Lys Glu Phe Val Glu Leu His Arg Gly Thr
370 375 380
Ile Ser Val Ser Asp Ala Pro Gly Gly Gly Ala Leu Phe Gln Val Lys
385 390 395 400
Leu Pro Leu Asn Ala Pro Glu Gly Ala Tyr Val Ala Ser Asn Thr Ala
405 410 415
Pro Arg Arg Asp Asn Pro Gln Val Val Asp Thr Asp Glu Tyr Leu Leu
420 425 430
Leu Ala Pro Asn Ala Glu Asn Glu Ala Glu Val Leu Pro Phe Gln Ser
435 440 445
Asp Gln Pro Arg Val Leu Ile Val Glu Asp Asn Pro Asp Met Arg Gly
450 455 460
Phe Ile Lys Asp Cys Leu Ser Ser Asp Tyr Gln Val Tyr Val Ala Pro
465 470 475 480
Asp Gly Ala Lys Ala Leu Glu Leu Met Ser Asn Met Pro Pro Asp Leu
485 490 495
Leu Ile Thr Asp Leu Ile Met Pro Val Met Ser Gly Asp Met Leu Val
500 505 510
His Gln Val Arg Lys Lys Asn Glu Leu Ser His Ile Pro Ile Met Val
515 520 525
Leu Ser Ala Lys Ser Asp Ala Glu Leu Arg Val Lys Leu Leu Ser Glu
530 535 540
Ser Val Gln Asp Phe Leu Leu Lys Pro Phe Ser Ala His Glu Leu Arg
545 550 555 560
Ala Arg Val Ser Asn Leu Val Ser Met Lys Val Ala Gly Asp Ala Leu
565 570 575
Arg Lys Glu Leu Ser Asp Gln Gly Asp Asp Ile Ala Ile Leu Thr His
580 585 590
Arg Leu Ile Lys Ser Arg His Arg Leu Gln Gln Ser Asn Ile Ala Leu
595 600 605
Ser Ala Ser Glu Ala Arg Trp Lys Ala Val Tyr Glu Asn Ser Ala Ala
610 615 620
Gly Ile Val Leu Thr Asp Pro Glu Asn Arg Ile Leu Asn Ala Asn Pro
625 630 635 640
Ala Phe Gln Arg Ile Thr Gly Tyr Gly Glu Lys Asp Leu Glu Gly Leu
645 650 655
Ser Met Glu Gln Leu Thr Pro Ser Asp Glu Ser Pro Gln Ile Lys Gln
660 665 670
Arg Leu Ala Asn Leu Leu Gln Gly Gly Gly Ala Glu Tyr Ser Val Glu
675 680 685
Arg Ser Tyr Leu Cys Lys Asn Gly Ser Thr Ile Trp Ala Asn Ala Ser
690 695 700
Val Ser Leu Met Pro Gln Arg Val Gly Glu Ser Pro Val Ile Leu Gln
705 710 715 720
Ile Ile Asp Asp Ile Thr Glu Lys Lys Gln Ala Gln Glu Asn Leu Asn
725 730 735
Gln Leu Gln Gln Gln Leu Val Tyr Val Ser Arg Ser Ala Thr Met Gly
740 745 750
Glu Phe Ala Ala Tyr Ile Ala His Glu Ile Asn Gln Pro Leu Ser Ala
755 760 765
Ile Met Thr Asn Ala Asn Ala Gly Thr Arg Trp Leu Gly Asn Glu Pro
770 775 780
Ser Asn Ile Pro Glu Ala Lys Glu Ala Leu Ala Arg Ile Ile Arg Asp
785 790 795 800
Ser Asp Arg Ala Ala Glu Ile Ile Arg Met Val Arg Ser Phe Leu Lys
805 810 815
Arg Gln Glu Thr Val Leu Lys Pro Ile Asp Leu Lys Ala Leu Val Thr
820 825 830
Asp Thr Ser Leu Ile Leu Lys Ala Pro Ser Gln Asn Asn Ser Val Asn
835 840 845
Leu Asp Val Val Ala Asp Asp Glu Leu Pro Glu Ile Trp Gly Asp Gly
850 855 860
Val Gln Ile Gln Gln Leu Ile Ile Asn Leu Ala Met Asn Ala Ile Glu
865 870 875 880
Ala Ile Ser Gln Ala Asp Cys Glu Thr Arg Gln Leu Thr Leu Ser Phe
885 890 895
Ser Gly Asn Asp Thr Gly Asp Ala Leu Val Ile Ser Val Lys Asp Thr
900 905 910
Gly Pro Gly Ile Ser Glu Arg Gln Met Ala Gln Leu Phe Asn Ala Phe
915 920 925
Tyr Thr Thr Lys Lys Glu Gly Leu Gly Met Gly Leu Ala Ile Cys Leu
930 935 940
Thr Ile Thr Glu Val His Asn Gly Lys Ile Trp Val Glu Cys Pro Pro
945 950 955 960
Ala Gly Gly Ala Cys Phe Leu Val Ser Ile Pro Ala Arg Gln Gly Ser
965 970 975
Gly Thr
<210> 9
<211> 227
<212> PRT
<213> Pseudomonas putida F1
<400> 9
Val Pro Ala Arg Trp Gly Cys Leu Phe Pro Gly Lys Tyr Pro Cys Gln
1 5 10 15
Thr Gly Leu Arg His Met Ser Asp Arg Ala Ser Val Ile Tyr Ile Leu
20 25 30
Asp Asp Asp Asn Ala Val Leu Glu Ala Leu Ser Ser Leu Val Arg Ser
35 40 45
Ile Gly Leu Ser Val Glu Cys Phe Ser Ser Ala Ser Val Phe Leu Asn
50 55 60
Asp Val Asn Arg Ser Ala Cys Gly Cys Leu Ile Leu Asp Val Arg Met
65 70 75 80
Pro Glu Met Ser Gly Leu Asp Val Gln Arg Gln Leu Lys Glu Leu Gly
85 90 95
Glu Gln Ile Pro Ile Ile Phe Ile Ser Gly His Gly Asp Ile Pro Met
100 105 110
Ala Val Lys Ala Ile Lys Ala Gly Ala Val Asp Phe Phe Thr Lys Pro
115 120 125
Phe Arg Glu Glu Glu Leu Leu Gly Ala Ile Arg Ala Ala Leu Lys Leu
130 135 140
Ala Pro Gln Gln Arg Ser Asn Ala Pro Arg Val Ser Glu Leu Lys Glu
145 150 155 160
Asn Tyr Glu Ser Leu Ser Lys Arg Glu Gln Gln Val Leu Lys Phe Val
165 170 175
Leu Arg Gly Tyr Leu Asn Lys Gln Thr Ala Leu Glu Leu Asp Ile Ser
180 185 190
Glu Ala Thr Val Lys Val His Arg His Asn Ile Met Arg Lys Met Lys
195 200 205
Val Ser Ser Ile Gln Asp Leu Val Arg Val Thr Glu Arg Leu Lys Asp
210 215 220
Ser Leu Glu
225
<210> 10
<211> 684
<212> DNA
<213> Pseudomonas putida F1
<400> 10
gtgcccgccc gctgggggtg cttgtttcct ggtaagtatc cctgccagac agggctccgg 60
cacatgagtg atcgggcatc tgttatctat atcctcgatg acgacaatgc agtactggaa 120
gcactgagca gcttggtgcg ttcaatcggc ctgagtgtcg agtgtttttc atccgctagc 180
gtattcctga acgatgtcaa tcgctctgcc tgtggctgtc taattttgga tgtccgtatg 240
cccgagatga gcgggttgga tgtgcaacga caactgaaag agcttggcga gcaaatcccc 300
attattttta tcagcggcca cggtgatatt ccgatggcag tcaaagcgat caaggcgggt 360
gcggtagact tcttcactaa accttttcga gaagaggagc tgcttggcgc tattcgcgcc 420
gcgctgaagt tggcgcccca gcagagatca aacgctcccc gagtcagcga gcttaaagag 480
aattacgaaa gcctcagcaa acgcgagcaa caggtgctta agttcgtctt gcgaggatat 540
ctaaacaagc agacggctct agagcttgat atatcggaag caacagtgaa agtgcaccgc 600
cataatatca tgaggaaaat gaaagtatct tcaatccagg atctggttcg agtaactgag 660
cggctcaagg atagcctgga atag 684
<210> 11
<211> 366
<212> DNA
<213> Pseudomonas putida F1
<400> 11
ccgggatcaa cgcattgagc gccaccagca tgttcaggtc tgaggttttc atcgacatca 60
ggttatcaac ctgctcgtgg acctgaggga aactgccgtg gcggcgacgg ggcttgcgcg 120
taagcccccg ctatacgacc agcctgttcg aaagccgcaa agtgcttagg tttgggtgca 180
tatccatcag aagcggcata aaccatcgtt tatcacagtt aaactttggt tttctaagtt 240
gcgatagcca tataaaccca taagccaaaa aacaatattt cccagggcgt gattgtaata 300
ctgtgcgtgc tctaaggcgg tgtttgccta cttcacttta taaaaaaaat aagatgtgga 360
aggaga 366
<210> 12
<211> 1024
<212> PRT
<213> Artificial Sequence
<220>
<223> beta galactosidase
<400> 12
Met Thr Met Ile Thr Asp Ser Leu Ala Val Val Leu Gln Arg Arg Asp
1 5 10 15
Trp Glu Asn Pro Gly Val Thr Gln Leu Asn Arg Leu Ala Ala His Pro
20 25 30
Pro Phe Ala Ser Trp Arg Asn Ser Glu Glu Ala Arg Thr Asp Arg Pro
35 40 45
Ser Gln Gln Leu Arg Ser Leu Asn Gly Glu Trp Arg Phe Ala Trp Phe
50 55 60
Pro Ala Pro Glu Ala Val Pro Glu Ser Trp Leu Glu Cys Asp Leu Pro
65 70 75 80
Glu Ala Asp Thr Val Val Val Pro Ser Asn Trp Gln Met His Gly Tyr
85 90 95
Asp Ala Pro Ile Tyr Thr Asn Val Thr Tyr Pro Ile Thr Val Asn Pro
100 105 110
Pro Phe Val Pro Thr Glu Asn Pro Thr Gly Cys Tyr Ser Leu Thr Phe
115 120 125
Asn Val Asp Glu Ser Trp Leu Gln Glu Gly Gln Thr Arg Ile Ile Phe
130 135 140
Asp Gly Val Asn Ser Ala Phe His Leu Trp Cys Asn Gly Arg Trp Val
145 150 155 160
Gly Tyr Gly Gln Asp Ser Arg Leu Pro Ser Glu Phe Asp Leu Ser Ala
165 170 175
Phe Leu Arg Ala Gly Glu Asn Arg Leu Ala Val Met Val Leu Arg Trp
180 185 190
Ser Asp Gly Ser Tyr Leu Glu Asp Gln Asp Met Trp Arg Met Ser Gly
195 200 205
Ile Phe Arg Asp Val Ser Leu Leu His Lys Pro Thr Thr Gln Ile Ser
210 215 220
Asp Phe His Val Ala Thr Arg Phe Asn Asp Asp Phe Ser Arg Ala Val
225 230 235 240
Leu Glu Ala Glu Val Gln Met Cys Gly Glu Leu Arg Asp Tyr Leu Arg
245 250 255
Val Thr Val Ser Leu Trp Gln Gly Glu Thr Gln Val Ala Ser Gly Thr
260 265 270
Ala Pro Phe Gly Gly Glu Ile Ile Asp Glu Arg Gly Gly Tyr Ala Asp
275 280 285
Arg Val Thr Leu Arg Leu Asn Val Glu Asn Pro Lys Leu Trp Ser Ala
290 295 300
Glu Ile Pro Asn Leu Tyr Arg Ala Val Val Glu Leu His Thr Ala Asp
305 310 315 320
Gly Thr Leu Ile Glu Ala Glu Ala Cys Asp Val Gly Phe Arg Glu Val
325 330 335
Arg Ile Glu Asn Gly Leu Leu Leu Leu Asn Gly Lys Pro Leu Leu Ile
340 345 350
Arg Gly Val Asn Arg His Glu His His Pro Leu His Gly Gln Val Met
355 360 365
Asp Glu Gln Thr Met Val Gln Asp Ile Leu Leu Met Lys Gln Asn Asn
370 375 380
Phe Asn Ala Val Arg Cys Ser His Tyr Pro Asn His Pro Leu Trp Tyr
385 390 395 400
Thr Leu Cys Asp Arg Tyr Gly Leu Tyr Val Val Asp Glu Ala Asn Ile
405 410 415
Glu Thr His Gly Met Val Pro Met Asn Arg Leu Thr Asp Asp Pro Arg
420 425 430
Trp Leu Pro Ala Met Ser Glu Arg Val Thr Arg Met Val Gln Arg Asp
435 440 445
Arg Asn His Pro Ser Val Ile Ile Trp Ser Leu Gly Asn Glu Ser Gly
450 455 460
His Gly Ala Asn His Asp Ala Leu Tyr Arg Trp Ile Lys Ser Val Asp
465 470 475 480
Pro Ser Arg Pro Val Gln Tyr Glu Gly Gly Gly Ala Asp Thr Thr Ala
485 490 495
Thr Asp Ile Ile Cys Pro Met Tyr Ala Arg Val Asp Glu Asp Gln Pro
500 505 510
Phe Pro Ala Val Pro Lys Trp Ser Ile Lys Lys Trp Leu Ser Leu Pro
515 520 525
Gly Glu Thr Arg Pro Leu Ile Leu Cys Glu Tyr Ala His Ala Met Gly
530 535 540
Asn Ser Leu Gly Gly Phe Ala Lys Tyr Trp Gln Ala Phe Arg Gln Tyr
545 550 555 560
Pro Arg Leu Gln Gly Gly Phe Val Trp Asp Trp Val Asp Gln Ser Leu
565 570 575
Ile Lys Tyr Asp Glu Asn Gly Asn Pro Trp Ser Ala Tyr Gly Gly Asp
580 585 590
Phe Gly Asp Thr Pro Asn Asp Arg Gln Phe Cys Met Asn Gly Leu Val
595 600 605
Phe Ala Asp Arg Thr Pro His Pro Ala Leu Thr Glu Ala Lys His Gln
610 615 620
Gln Gln Phe Phe Gln Phe Arg Leu Ser Gly Gln Thr Ile Glu Val Thr
625 630 635 640
Ser Glu Tyr Leu Phe Arg His Ser Asp Asn Glu Leu Leu His Trp Met
645 650 655
Val Ala Leu Asp Gly Lys Pro Leu Ala Ser Gly Glu Val Pro Leu Asp
660 665 670
Val Ala Pro Gln Gly Lys Gln Leu Ile Glu Leu Pro Glu Leu Pro Gln
675 680 685
Pro Glu Ser Ala Gly Gln Leu Trp Leu Thr Val Arg Val Val Gln Pro
690 695 700
Asn Ala Thr Ala Trp Ser Glu Ala Gly His Ile Ser Ala Trp Gln Gln
705 710 715 720
Trp Arg Leu Ala Glu Asn Leu Ser Val Thr Leu Pro Ala Ala Ser His
725 730 735
Ala Ile Pro His Leu Thr Thr Ser Glu Met Asp Phe Cys Ile Glu Leu
740 745 750
Gly Asn Lys Arg Trp Gln Phe Asn Arg Gln Ser Gly Phe Leu Ser Gln
755 760 765
Met Trp Ile Gly Asp Lys Lys Gln Leu Leu Thr Pro Leu Arg Asp Gln
770 775 780
Phe Thr Arg Ala Pro Leu Asp Asn Asp Ile Gly Val Ser Glu Ala Thr
785 790 795 800
Arg Ile Asp Pro Asn Ala Trp Val Glu Arg Trp Lys Ala Ala Gly His
805 810 815
Tyr Gln Ala Glu Ala Ala Leu Leu Gln Cys Thr Ala Asp Thr Leu Ala
820 825 830
Asp Ala Val Leu Ile Thr Thr Ala His Ala Trp Gln His Gln Gly Lys
835 840 845
Thr Leu Phe Ile Ser Arg Lys Thr Tyr Arg Ile Asp Gly Ser Gly Gln
850 855 860
Met Ala Ile Thr Val Asp Val Glu Val Ala Ser Asp Thr Pro His Pro
865 870 875 880
Ala Arg Ile Gly Leu Asn Cys Gln Leu Ala Gln Val Ala Glu Arg Val
885 890 895
Asn Trp Leu Gly Leu Gly Pro Gln Glu Asn Tyr Pro Asp Arg Leu Thr
900 905 910
Ala Ala Cys Phe Asp Arg Trp Asp Leu Pro Leu Ser Asp Met Tyr Thr
915 920 925
Pro Tyr Val Phe Pro Ser Glu Asn Gly Leu Arg Cys Gly Thr Arg Glu
930 935 940
Leu Asn Tyr Gly Pro His Gln Trp Arg Gly Asp Phe Gln Phe Asn Ile
945 950 955 960
Ser Arg Tyr Ser Gln Gln Gln Leu Met Glu Thr Ser His Arg His Leu
965 970 975
Leu His Ala Glu Glu Gly Thr Trp Leu Asn Ile Asp Gly Phe His Met
980 985 990
Gly Ile Gly Gly Asp Asp Ser Trp Ser Pro Ser Val Ser Ala Glu Phe
995 1000 1005
Gln Leu Ser Ala Gly Arg Tyr His Tyr Gln Leu Val Trp Cys Gln Lys
1010 1015 1020
<210> 13
<211> 3075
<212> DNA
<213> Artificial Sequence
<220>
<223> beta galactosidase
<400> 13
atgaccatga ttacggattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 60
ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc 120
gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc 180
tttgcctggt ttccggcacc agaagcggtg ccggaaagct ggctggagtg cgatcttcct 240
gaggccgata ctgtcgtcgt cccctcaaac tggcagatgc acggttacga tgcgcccatc 300
tacaccaacg tgacctatcc cattacggtc aatccgccgt ttgttcccac ggagaatccg 360
acgggttgtt actcgctcac atttaatgtt gatgaaagct ggctacagga aggccagacg 420
cgaattattt ttgatggcgt taactcggcg tttcatctgt ggtgcaacgg gcgctgggtc 480
ggttacggcc aggacagtcg tttgccgtct gaatttgacc tgagcgcatt tttacgcgcc 540
ggagaaaacc gcctcgcggt gatggtgctg cgctggagtg acggcagtta tctggaagat 600
caggatatgt ggcggatgag cggcattttc cgtgacgtct cgttgctgca taaaccgact 660
acacaaatca gcgatttcca tgttgccact cgctttaatg atgatttcag ccgcgctgta 720
ctggaggctg aagttcagat gtgcggcgag ttgcgtgact acctacgggt aacagtttct 780
ttatggcagg gtgaaacgca ggtcgccagc ggcaccgcgc ctttcggcgg tgaaattatc 840
gatgagcgtg gtggttatgc cgatcgcgtc acactacgtc tgaacgtcga aaacccgaaa 900
ctgtggagcg ccgaaatccc gaatctctat cgtgcggtgg ttgaactgca caccgccgac 960
ggcacgctga ttgaagcaga agcctgcgat gtcggtttcc gcgaggtgcg gattgaaaat 1020
ggtctgctgc tgctgaacgg caagccgttg ctgattcgag gcgttaaccg tcacgagcat 1080
catcctctgc atggtcaggt catggatgag cagacgatgg tgcaggatat cctgctgatg 1140
aagcagaaca actttaacgc cgtgcgctgt tcgcattatc cgaaccatcc gctgtggtac 1200
acgctgtgcg accgctacgg cctgtatgtg gtggatgaag ccaatattga aacccacggc 1260
atggtgccaa tgaatcgtct gaccgatgat ccgcgctggc taccggcgat gagcgaacgc 1320
gtaacgcgaa tggtgcagcg cgatcgtaat cacccgagtg tgatcatctg gtcgctgggg 1380
aatgaatcag gccacggcgc taatcacgac gcgctgtatc gctggatcaa atctgtcgat 1440
ccttcccgcc cggtgcagta tgaaggcggc ggagccgaca ccacggccac cgatattatt 1500
tgcccgatgt acgcgcgcgt ggatgaagac cagcccttcc cggctgtgcc gaaatggtcc 1560
atcaaaaaat ggctttcgct acctggagag acgcgcccgc tgatcctttg cgaatacgcc 1620
cacgcgatgg gtaacagtct tggcggtttc gctaaatact ggcaggcgtt tcgtcagtat 1680
ccccgtttac agggcggctt cgtctgggac tgggtggatc agtcgctgat taaatatgat 1740
gaaaacggca acccgtggtc ggcttacggc ggtgattttg gcgatacgcc gaacgatcgc 1800
cagttctgta tgaacggtct ggtctttgcc gaccgcacgc cgcatccagc gctgacggaa 1860
gcaaaacacc agcagcagtt tttccagttc cgtttatccg ggcaaaccat cgaagtgacc 1920
agcgaatacc tgttccgtca tagcgataac gagctcctgc actggatggt ggcgctggat 1980
ggtaagccgc tggcaagcgg tgaagtgcct ctggatgtcg ctccacaagg taaacagttg 2040
attgaactgc ctgaactacc gcagccggag agcgccgggc aactctggct cacagtacgc 2100
gtagtgcaac cgaacgcgac cgcatggtca gaagccgggc acatcagcgc ctggcagcag 2160
tggcgtctgg cggaaaacct cagtgtgacg ctccccgccg cgtcccacgc catcccgcat 2220
ctgaccacca gcgaaatgga tttttgcatc gagctgggta ataagcgttg gcaatttaac 2280
cgccagtcag gctttctttc acagatgtgg attggcgata aaaaacaact gctgacgccg 2340
ctgcgcgatc agttcacccg tgcaccgctg gataacgaca ttggcgtaag tgaagcgacc 2400
cgcattgacc ctaacgcctg ggtcgaacgc tggaaggcgg cgggccatta ccaggccgaa 2460
gcagcgttgt tgcagtgcac ggcagataca cttgctgatg cggtgctgat tacgaccgct 2520
cacgcgtggc agcatcaggg gaaaacctta tttatcagcc ggaaaaccta ccggattgat 2580
ggtagtggtc aaatggcgat taccgttgat gttgaagtgg cgagcgatac accgcatccg 2640
gcgcggattg gcctgaactg ccagctggcg caggtagcag agcgggtaaa ctggctcgga 2700
ttagggccgc aagaaaacta tcccgaccgc cttactgccg cctgttttga ccgctgggat 2760
ctgccattgt cagacatgta taccccgtac gtcttcccga gcgaaaacgg tctgcgctgc 2820
gggacgcgcg aattgaatta tggcccacac cagtggcgcg gcgacttcca gttcaacatc 2880
agccgctaca gtcaacagca actgatggaa accagccatc gccatctgct gcacgcggaa 2940
gaaggcacat ggctgaatat cgacggtttc catatgggga ttggtggcga cgactcctgg 3000
agcccgtcag tatcggcgga attccagctg agcgccggtc gctaccatta ccagttggtc 3060
tggtgtcaaa aataa 3075
<210> 14
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> TodST-F
<400> 14
aaaggatcca ggagacatat gagctccttg gata 34
<210> 15
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> TodST-R
<400> 15
tataagcttc tattccaggc tatcctt 27
<210> 16
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> TodSTpp-u
<400> 16
tatatgcatc tcgagaaacg agcccagtac 30
<210> 17
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> TodSTpp-m
<400> 17
ccctctagaa gcttgctatt acctctcttc cacc 34
<210> 18
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> mexCn-u
<400> 18
aaagaattcg caagacaggt tcgataaggg tg 32
<210> 19
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> mexCn-d
<400> 19
aaaggatcca atgcgcccgg agatcgg 27
<210> 20
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> mexCc-u
<400> 20
aaaggatccg atatccagca actcgacccg 30
<210> 21
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> mexCc-d
<400> 21
tttgcatgcg tttctgcgca ggcgcaacg 29
<210> 22
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Sm-N
<400> 22
aaaggatcca agcttgaacc ttgaccgaac gca 33
<210> 23
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Sm-C
<400> 23
ataggatcct tatttgccga ctaccttggt gatc 34
<210> 24
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> PAS1(23) NcoI-F
<400> 24
caaccatggg aaaggagaaa ggatctgaag 30
<210> 25
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> PAS1(43) NcoI-F
<400> 25
caaccatggc gctctacgag tttgtg 26
<210> 26
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> PAS1(168) XhoI-R
<400> 26
caactcgagt cactccaatt cctggttctt c 31
<210> 27
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> TodS(23) BamHI-F
<400> 27
caaggatccg atgaaggaga aaggatctg 29
<210> 28
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> TodS(978) XhoI-R
<400> 28
ccgctcgagt gtgccggagc cctgtctgg 29
<210> 29
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> L71M-F
<400> 29
tggagggggg cgggattact atggaagaaa tacgagggaa g 41
<210> 30
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> L71M-R
<400> 30
cttccctcgt atttcttcca tagtaatccc gcccccctcc a 41
<210> 31
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> F46A-F2
<400> 31
gatgggctct acgaggccgt gggccttctt gatg 34
<210> 32
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> F46A-R2
<400> 32
catcaagaag gcccacggcc tcgtagagcc catc 34
<210> 33
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> F46A_F
<400> 33
gcgccatggc gctctacgag gctgtgggcc ttcttgatgc tc 42
<210> 34
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> F46A_R
<400> 34
gagcatcaag aaggcccaca gcctcgtaga gcgccatggc gc 42
<210> 35
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> F46S_F
<400> 35
cgccatggcg ctctacgagt ctgtgggcct tcttgatgct c 41
<210> 36
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> F46S_R
<400> 36
gagcatcaag aaggcccaca gactcgtaga gcgccatggc g 41
<210> 37
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> V47A-F
<400> 37
gatgggctct acgagtttgc gggccttctt gatgctcatg 40
<210> 38
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> V47A-R
<400> 38
catgagcatc aagaaggccc gcaaactcgt agagcccatc 40
<210> 39
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> V47L-F
<400> 39
gatgggctct acgagtttct gggccttctt gatgctc 37
<210> 40
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> V47L-R
<400> 40
gagcatcaag aaggcccaga aactcgtaga gcccatc 37
<210> 41
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> L49A-F
<400> 41
ggctctacga gtttgtgggc gctcttgatg ctcatggaaa tg 42
<210> 42
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> L49A-R
<400> 42
catttccatg agcatcaaga gcgcccacaa actcgtagag cc 42
<210> 43
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> L49D-F
<400> 43
ggctctacga gtttgtgggc gatcttgatg ctcatggaaa tg 42
<210> 44
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> L49D-R
<400> 44
catttccatg agcatcaaga tcgcccacaa actcgtagag cc 42
<210> 45
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> E58A-F
<400> 45
gctcatggaa atgtgcttgc agtgaaccag gtcgcattg 39
<210> 46
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> E58A-R
<400> 46
caatgcgacc tggttcactg caagcacatt tccatgagc 39
<210> 47
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> E58S-F
<400> 47
gctcatggaa atgtgctttc agtgaaccag gtcgcattg 39
<210> 48
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> E58S-R
<400> 48
caatgcgacc tggttcactg aaagcacatt tccatgagc 39
<210> 49
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> V59F_F
<400> 49
ctcatggaaa tgtgcttgaa tttaaccagg tcgcattgga ggg 43
<210> 50
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> V59F_R
<400> 50
ccctccaatg cgacctggtt aaattcaagc acatttccat gag 43
<210> 51
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> V59D_F
<400> 51
ctcatggaaa tgtgcttgaa gataaccagg tcgcattgga gggg 44
<210> 52
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> V59D_R
<400> 52
cccctccaat gcgacctggt tatcttcaag cacatttcca tgag 44
<210> 53
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> V59A_F
<400> 53
ctcatggaaa tgtgcttgaa gcgaaccagg tcgcattgga ggg 43
<210> 54
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> V59A_R
<400> 54
ccctccaatg cgacctggtt cgcttcaagc acatttccat gag 43
<210> 55
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Q61L-F
<400> 55
gtgcttgaag tgaacctggt cgcattggag gg 32
<210> 56
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Q61L-R
<400> 56
ccctccaatg cgaccaggtt cacttcaagc ac 32
<210> 57
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Q61R-F
<400> 57
gtgcttgaag tgaaccgagt cgcattggag gggg 34
<210> 58
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Q61R-R
<400> 58
ccccctccaa tgcgactcgg ttcacttcaa gcac 34
<210> 59
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Q61A-F
<400> 59
gtgcttgaag tgaacgcagt cgcattggag gggg 34
<210> 60
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Q61A-R
<400> 60
ccccctccaa tgcgactgcg ttcacttcaa gcac 34
<210> 61
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> A63V_F
<400> 61
gcttgaagtg aaccaggtcg tattggaggg gggcgggatt a 41
<210> 62
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> A63V_R
<400> 62
taatcccgcc cccctccaat acgacctggt tcacttcaag c 41
<210> 63
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> A63S_F
<400> 63
gtgcttgaag tgaaccaggt ctcattggag gggggcggga tta 43
<210> 64
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> A63S_R
<400> 64
taatcccgcc cccctccaat gagacctggt tcacttcaag cac 43
<210> 65
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> F79Y_F
<400> 65
gaaatacgag ggaagccata ctggaaggcg cgttggtgg 39
<210> 66
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> F79Y_R
<400> 66
ccaccaacgc gccttccagt atggcttccc tcgtatttc 39
<210> 67
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> F79E_F
<400> 67
gaaatacgag ggaagccaga gtggaaggcg cgttggtgg 39
<210> 68
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> F79E_R
<400> 68
ccaccaacgc gccttccact ctggcttccc tcgtatttc 39
<210> 69
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> F79L_F
<400> 69
gaagaaatac gagggaagcc actctggaag gcgcgttggt ggc 43
<210> 70
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> F79L_R
<400> 70
gccaccaacg cgccttccag agtggcttcc ctcgtatttc ttc 43
<210> 71
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> W84V_F
<400> 71
gaagccattc tggaaggcgc gtgtgtggca aatttcaaaa aaaacc 46
<210> 72
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> W84V_R
<400> 72
ggtttttttt gaaatttgcc acacacgcgc cttccagaat ggcttc 46
<210> 73
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> W84R_F
<400> 73
gaagccattc tggaaggcgc gtcgttggca aatttcaaaa aaaaccg 47
<210> 74
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> W84R_R
<400> 74
cggttttttt tgaaatttgc caacgacgcg ccttccagaa tggcttc 47
<210> 75
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> W84H_F
<400> 75
gaagccattc tggaaggcgc gtcattggca aatttcaaaa aaaaccg 47
<210> 76
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> W84H_R
<400> 76
cggttttttt tgaaatttgc caatgacgcg ccttccagaa tggcttc 47
<210> 77
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> W85H_F
<400> 77
ccattctgga aggcgcgttg gcatcaaatt tcaaaaaaaa ccgag 45
<210> 78
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> W85H_R
<400> 78
ctcggttttt tttgaaattt gatgccaacg cgccttccag aatgg 45
<210> 79
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> W85R_F
<400> 79
ccattctgga aggcgcgttg gcgtcaaatt tcaaaaaaaa ccgag 45
<210> 80
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> W85R_R
<400> 80
ctcggttttt tttgaaattt gacgccaacg cgccttccag aatgg 45
<210> 81
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> W85L_F
<400> 81
gccattctgg aaggcgcgtt ggctgcaaat ttcaaaaaaa accgag 46
<210> 82
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> W85L_R
<400> 82
ctcggttttt tttgaaattt gcagccaacg cgccttccag aatggc 46
<210> 83
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> I114V_F
<400> 83
gaatttgttc gctgtgatgt tgaggttctt ggaaaatcag gtggaagag 49
<210> 84
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> I114V_R
<400> 84
ctcttccacc tgattttcca agaacctcaa catcacagcg aacaaattc 49
<210> 85
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> I114F_F
<400> 85
gaatttgttc gctgtgatgt tgagtttctt ggaaaatcag gtggaagag 49
<210> 86
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> I114F_R
<400> 86
ctcttccacc tgattttcca agaaactcaa catcacagcg aacaaattc 49
<210> 87
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> I114S_F
<400> 87
gaatttgttc gctgtgatgt tgagagcctt ggaaaatcag gtggaagaga gg 52
<210> 88
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> I114S_R
<400> 88
cctctcttcc acctgatttt ccaaggctct caacatcaca gcgaacaaat tc 52
<210> 89
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> V126A_F
<400> 89
caggtggaag agaggtaata gccgccgatt tttcattgct gccaatttg 49
<210> 90
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> V126A_R
<400> 90
caaattggca gcaatgaaaa atcggcggct attacctctc ttccacctg 49
<210> 91
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> V126S_F
<400> 91
ggtggaagag aggtaatagc cagcgatttt tcattgctgc caat 44
<210> 92
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> V126S_R
<400> 92
attggcagca atgaaaaatc gctggctatt acctctcttc cacc 44
<210> 93
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> V126L_F
<400> 93
ggtggaagag aggtaatagc cctcgatttt tcattgctgc caa 43
<210> 94
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> V126L_R
<400> 94
ttggcagcaa tgaaaaatcg agggctatta cctctcttcc acc 43
<210> 95
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> F128E_F
<400> 95
gaggtaatag ccgtcgatga atcattgctg ccaatttgc 39
<210> 96
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> F128E_R
<400> 96
gcaaattggc agcaatgatt catcgacggc tattacctc 39
<210> 97
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> F128H_F
<400> 97
gaagagaggt aatagccgtc gatcattcat tgctgccaat ttgcaatg 48
<210> 98
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> F128H_R
<400> 98
cattgcaaat tggcagcaat gaatgatcga cggctattac ctctcttc 48
<210> 99
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> F128L_F
<400> 99
gagaggtaat agccgtcgat ctttcattgc tgccaatttg c 41
<210> 100
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> F128L_R
<400> 100
gcaaattggc agcaatgaaa gatcgacggc tattacctct c 41
<210> 101
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> F128D-F
<400> 101
gagaggtaat agccgtcgat gactcattgc tgccaatttg caa 43
<210> 102
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> F128D-R
<400> 102
ttgcaaattg gcagcaatga gtcatcgacg gctattacct ctc 43
<210> 103
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> F128S-F
<400> 103
gagaggtaat agccgtcgat tcgtcattgc tgccaatttg caa 43
<210> 104
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> F128S-R
<400> 104
ttgcaaattg gcagcaatga cgaatcgacg gctattacct ctc 43
<210> 105
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> A145S_F
<400> 105
ggagcattgt ttaccttctt tcggaagggc gcaatattac c 41
<210> 106
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> A145S_R
<400> 106
ggtaatattg cgcccttccg aaagaaggta aacaatgctc c 41
<210> 107
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> A145V_F
<400> 107
gagcattgtt taccttcttg tggaagggcg caatattacc g 41
<210> 108
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> A145V_R
<400> 108
cggtaatatt gcgcccttcc acaagaaggt aaacaatgct c 41
<210> 109
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> L131D_F
<400> 109
atagccgtcg atttttcatt ggatccaatt tgcaatgaag aaggg 45
<210> 110
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> L131D_R
<400> 110
cccttcttca ttgcaaattg gatccaatga aaaatcgacg gctat 45
<210> 111
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> E146A-F
<400> 111
cattgtttac cttcttgcgg cagggcgcaa tattaccgat aa 42
<210> 112
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> E146A-R
<400> 112
ttatcggtaa tattgcgccc tgccgcaaga aggtaaacaa tg 42
<210> 113
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> E146L-F
<400> 113
cattgtttac cttcttgcgc tggggcgcaa tattaccgat aa 42
<210> 114
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> E146L-R
<400> 114
ttatcggtaa tattgcgccc cagcgcaaga aggtaaacaa tg 42
<210> 115
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> R148A-F
<400> 115
ccttcttgcg gaaggggcaa atattaccga taagaag 37
<210> 116
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> R148A-R
<400> 116
cttcttatcg gtaatatttg ccccttccgc aagaagg 37
<210> 117
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> R148M-F
<400> 117
ccttcttgcg gaagggatga atattaccga taagaag 37
<210> 118
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> R148M-R
<400> 118
cttcttatcg gtaatattca tcccttccgc aagaagg 37
<210> 119
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> YE619620AA-F
<400> 119
gcgcgttgga aagcagtggc cgccaactct gcggccggta ttg 43
<210> 120
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> YE619620AA-R
<400> 120
caataccggc cgcagagttg gcggccactg ctttccaacg cgc 43
<210> 121
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 617-623D-F
<400> 121
ccgcctcgga agcgcgttgg aaagccggta ttgtactgac cgacc 45
<210> 122
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> 617-623D-R
<400> 122
ggtcggtcag tacaataccg gctttccaac gcgcttccga ggcgg 45
<210> 123
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> E666A-F
<400> 123
ctgactccat ctgacgcaag cccacagata aagc 34
<210> 124
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> E666A-R
<400> 124
gctttatctg tgggcttgcg tcagatggag tcag 34
<210> 125
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> L674A-F
<400> 125
cagataaagc agcgtgcagc caatttgctt cag 33
<210> 126
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> L674A-R
<400> 126
ctgaagcaaa ttggctgcac gctgctttat ctg 33
<210> 127
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Y691I-F
<400> 127
cagtgtggag cgctccattc tatgcaaaaa tggttc 36
<210> 128
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Y691I-R
<400> 128
gaaccatttt tgcatagaat ggagcgctcc acactg 36
<210> 129
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> A703S-F
<400> 129
ctacgatttg ggccaattcg agtgtctcgc tgatg 35
<210> 130
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> A703S-R
<400> 130
catcagcgag acactcgaat tggcccaaat cgtag 35
Claims (24)
- 서열번호 1의 TodS 단백질에서, 하기 (a) 내지 (w)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 TodS 변이 단백질;
(a) 46번 페닐알라닌을 알라닌 또는 세린으로 치환
(b) 47번 발린을 알라닌 또는 류신으로 치환,
(c) 49번 류신을 아스파틱산 또는 알라닌으로 치환,
(d) 58번 글루탐산을 알라닌 또는 세린으로 치환,
(e) 61번 글루타민을 류신, 알지닌 또는 알라닌으로 치환,
(f) 63번 알라닌을 발린 또는 세린으로 치환,
(g) 79번 페닐알라닌을 타이로신, 글루탐산 또는 류신으로 치환,
(h) 84번 트립토판을 발린, 히스티딘 또는 알지닌으로 치환,
(i) 85번 트립토판을 히스티딘, 알지닌, 또는 류신으로 치환,
(j) 114번 아이소류신이 발린으로 치환,
(k) 131번 류신을 아스파틱산으로 치환,
(l) 146번 글루탐산을 알라닌 또는 류신으로 치환,
(m) 148번 알지닌을 알라닌 또는 메티오닌으로 치환,
(n) 619번 타이로신 및 620번 글루탐산을 알라닌으로 치환,
(o) 617번 내지 623번 아미노산의 결손.
- 제1항에 있어서, 서열번호 1의 TodS 단백질에서 114번 아이소류신이 발린으로 치환된 TodS 변이 단백질은 톨루엔 및 m-자일렌으로 이루어진 군에서 선택되는 하나 이상의 방향족 탄화수소 감지 센서용인 것인, TodS 변이 단백질.
- 제1항에 있어서, 서열번호 1의 TodS 단백질에서 61번 글루타민이 알지닌으로 치환된 TodS 변이 단백질은 톨루엔, 스티렌, m-자일렌, o-자일렌 및 1,2,4-TMB(1,2,4-Trimethylbenzene)으로 이루어진 군에서 선택되는 하나 이상의 방향족 탄화수소 감지 센서용인 것인, TodS 변이 단백질.
- 서열번호 1의 TodS 단백질 중 43번 내지 168번째 또는 23번 내지 168번째 아미노산 서열을 가지는 PAS1 단백질에서, 서열번호 1의 아미노산 서열을 기준으로, 제1항의 (a) 내지 (m)로 이루어진 군에서 선택되는 하나 이상의 변이를 가지는 PAS1 변이 단백질.
- 제1항 내지 제4항 중 어느 한 항의 단백질을 코딩하는 폴리뉴클레오티드.
- 제5항의 폴리뉴클레오티드를 포함하는, 발현 벡터.
- 제6항의 발현 벡터가 도입된, 미생물.
- 제1항 내지 제4항 중 어느 한 항의 단백질을 생산하는 미생물.
- 제8항에 있어서, 상기 미생물은 슈도모나스(Pseudomonas) 속인 것인, 미생물.
- 제9항에 있어서, 상기 미생물은 슈도모나스 푸티다(Pseudomonas putida)인 것인, 미생물.
- (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 방향족 탄화수소 감지용 바이오센서:
(a) 방향족 탄화수소와 특이적으로 결합하는 제4항의 PAS1 변이 단백질을 포함하는 제1모듈;
(b) 제1모듈에 방향족 탄화수소가 결합시 신호를 발생 및 전달하는 제2모듈;
(c) 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d) 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.
- 제11항에 있어서, 상기 신호는 키나아제 단백질의 자기인산화 (autophosphorylation)에 의해 발생 또는 전달되는 것인, 바이오센서.
- 제11항에 있어서, 상기 전사조절인자은 슈노모나스 속 미생물 유래 TodT 단백질인 것인, 바이오센서.
- 제11항에 있어서, 상기 제4모듈의 발현은 슈노모나스 속 미생물 유래 todX 프로모터에 의한 것인, 바이오센서.
- 제11항에 있어서, 추가로 표지 단백질의 발현을 측정할 수 있는 물질을 포함하는 것인, 바이오센서.
- (i) 하기 (a) 내지 (d)의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; 또는 (iii) 상기 발현 카세트를 포함하는 벡터를 포함하는 미생물을 함유하는, 방향족 탄화수소 분해용 미생물 제제:
(a) 방향족 탄화수소와 특이적으로 결합하는 제4항의 PAS1 변이 단백질을 포함하는 제1모듈;
(b) 제1모듈에 방향족 탄화수소가 결합시 신호를 발생 및 전달하는 제2모듈;
(c) 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d) 상기 인산화되는 제3모듈에 의해 방향족 탄화수소 분해 단백질을 발현시키는 제4모듈.
- 제11항의 바이오센서를 포함하는, 방향족 탄화수소 감지용 조성물.
- 제16항의 미생물 제제를 포함하는, 방향족 탄화수소 분해용 조성물.
- 제11항의 바이오센서를 시료에 노출시키는 단계를 포함하는, 방향족 탄화수소 감지방법.
- 제16항의 미생물 제제를 이용하여 방향족 탄화수소를 분해하는 단계를 포함하는, 방향족 탄화수소 분해방법.
- (a) 표 3에 나타낸 PAS1 단백질의 원자좌표, 표 4에 나타낸 SeMet-PAS1 단백질과 톨루엔 복합체의 원자좌표, 또는 표 5에 나타낸 PAS1 단백질과 1,2,4-TMB(1,2,4-Trimethylbenzene) 복합체의 원자좌표를 이용하여, PAS1 단백질 또는 이의 복합체의 3차 구조를 설계하는 단계;
(b) 상기 설계된 3차 구조를 이용하여 PAS1 변이 단백질을 생성하는 단계; 및
(c) 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합 활성을 측정하는 단계를 포함하는,
야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질을 스크리닝하는 방법.
- 제21항에 있어서, 상기 (c) 단계는 (i) 하기 (a') 내지 (d')의 모듈을 포함하는 센서용 모듈 조합; (ii) 상기 모듈 조합을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트; (iii) 상기 발현 카세트를 포함하는 벡터; 또는 (i) 내지 (iii) 중 어느 하나를 포함하는 미생물을 함유하는, 바이오센서를 이용하여 상기 생성된 PAS1 변이 단백질과 주어진 리간드 간의 결합에 의해 발현되는 표지 단백질의 수준을 측정함으로써 수행되는 것인, 방법.
(a') 주어진 리간드와 특이적으로 결합하는 상기 생성된 PAS1 변이 단백질을 포함하는 제1모듈;
(b') 제1모듈에 리간드가 결합시 신호를 발생 및 전달하는 제2모듈;
(c') 상기 전달된 신호에 의해 인산화되는 전사조절인자를 포함하는 제3모듈; 및
(d') 상기 인산화되는 제3모듈에 의해 표지 단백질을 발현시키는 제4모듈.
- 제21항에 있어서, (d) 야생형 PAS1 단백질의 값에 비해 측정된 리간드 결합 활성이 변화된 경우, 야생형 PAS1 단백질에 대하여 리간드 결합 활성이 변이된, PAS1 변이 단백질로 판정하는 단계를 추가로 포함하는 것인, 방법.
- 제21항에 있어서, 상기 리간드는 벤젠(benzene), 에틸벤젠(ethylbenzene), 프로필벤젠(propylbenzene), 부틸벤젠(butylbenzene), 니트로벤젠(nitrobenzene), 클로로벤젠(chlorobenzene), 플루오로벤젠(fluorobenzene), 톨루엔(toluene), 스티렌(styrene), o-자일렌(o-xylene), m-자일렌(m-xylene), p-자일렌(p-xylene), o-클로로톨루엔(o-chlorotoluene), m-클로로톨루엔(m-chlorotoluene), p-클로로톨루엔(p-chlorotoluene), o-톨루이딘(o-toluidine), m-톨루이딘(m-toluidine), p-톨루이딘(p-toluidine), 카테콜(catechol), 1,2,4-TMB(1,2,4-Trimethylbenzene), 1,2,3-TMB(1,2,3-Trimethylbenzene), 1,3,5-TMB(1,3,5-Trimethylbenzene), 1-나프톨(1-naphthol) 및 2,3-디히드록시나프탈렌(2,3-dihydroxynaphthalene)으로 이루어진 군으로부터 선택된 것인, 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140153892 | 2014-11-06 | ||
KR20140153892 | 2014-11-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160054426A KR20160054426A (ko) | 2016-05-16 |
KR101776863B1 true KR101776863B1 (ko) | 2017-09-11 |
Family
ID=55909435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150155951A KR101776863B1 (ko) | 2014-11-06 | 2015-11-06 | PAS1 변이 단백질을 포함하는 TodS 변이 단백질 및 이의 용도 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101776863B1 (ko) |
WO (1) | WO2016072798A1 (ko) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9732126B2 (en) * | 2012-07-12 | 2017-08-15 | Korea Research Institute Of Bioscience And Biotechnology | Method for crystallization of TRX-TXNIP complex mutein and 3D structure thereof |
-
2015
- 2015-11-06 WO PCT/KR2015/011947 patent/WO2016072798A1/ko active Application Filing
- 2015-11-06 KR KR1020150155951A patent/KR101776863B1/ko active IP Right Grant
Non-Patent Citations (2)
Title |
---|
NCBI, GenBank accession no. ZP_00898200.1 (2005.11.29.)* |
한국생명공학연구원, ‘(PJ00817005) 농생명 합성 생물학 기반 Phyto-Sensor 기술개발’, 완결과제 최종보고서, 농촌진흥청, 2013.02.23* |
Also Published As
Publication number | Publication date |
---|---|
WO2016072798A1 (ko) | 2016-05-12 |
KR20160054426A (ko) | 2016-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Melcher et al. | A gate–latch–lock mechanism for hormone signalling by abscisic acid receptors | |
Tsujishita et al. | Specificity determinants in phosphoinositide dephosphorylation: crystal structure of an archetypal inositol polyphosphate 5-phosphatase | |
Van Den Ent et al. | Dimeric structure of the cell shape protein MreC and its functional implications | |
Singer et al. | Structure of the Shigella T3SS effector IpaH defines a new class of E3 ubiquitin ligases | |
Kneuper et al. | Molecular dissection of TatC defines critical regions essential for protein transport and a TatB–TatC contact site | |
Wu et al. | Insight into the sporulation phosphorelay: crystal structure of the sensor domain of Bacillus subtilis histidine kinase, KinD | |
Kefala et al. | Crystal structure and kinetic study of dihydrodipicolinate synthase from Mycobacterium tuberculosis | |
Ashenberg et al. | Determinants of homodimerization specificity in histidine kinases | |
Friedman et al. | Acireductone dioxygenase 1 (ARD1) is an effector of the heterotrimeric G protein β subunit in Arabidopsis | |
Stec et al. | Structural basis of the sulphate starvation response in E. coli: crystal structure and mutational analysis of the cofactor-binding domain of the Cbl transcriptional regulator | |
Heaslet et al. | Characterization of the active site of S. aureus monofunctional glycosyltransferase (Mtg) by site-directed mutation and structural analysis of the protein complexed with moenomycin | |
Labella et al. | Expanding the cyanobacterial nitrogen regulatory network: the GntR-like regulator PlmA interacts with the PII-PipX complex | |
Koh et al. | Molecular insights into toluene sensing in the TodS/TodT signal transduction system | |
Lam et al. | Crystal structure of activated CheY1 from Helicobacter pylori | |
Dupré et al. | Characterization of the PAS domain in the sensor-kinase BvgS: mechanical role in signal transmission | |
Nowak et al. | Structural and functional aspects of the sensor histidine kinase PrrB from Mycobacterium tuberculosis | |
Fraser et al. | An atypical receiver domain controls the dynamic polar localization of the Myxococcus xanthus social motility protein FrzS | |
Couñago et al. | Biochemical and structural characterization of alanine racemase from Bacillus anthracis (Ames) | |
KR101776863B1 (ko) | PAS1 변이 단백질을 포함하는 TodS 변이 단백질 및 이의 용도 | |
Hsieh et al. | Stepwise activity of ClpY (HslU) mutants in the processive degradation of Escherichia coli ClpYQ (HslUV) protease substrates | |
JP2007039398A (ja) | トキシン−アンチトキシン複合体の形成を指標とする抗生物質のスクリーニング方法 | |
Nariya et al. | Modulating factors for the Pkn4 kinase cascade in regulating 6‐phosphofructokinase in Myxococcus xanthus | |
Ranganathan et al. | Novel structural features drive DNA binding properties of Cmr, a CRP family protein in TB complex mycobacteria | |
US8999894B2 (en) | Nucleic acid-like proteins | |
WO2007089899A2 (en) | Water-soluble (g protein)-coupled receptor protein |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |