KR20150076159A - 돌연변이된 시스타티오닌 감마 신타제를 이용한 o-포스포-l-호모세린 및 메탄티올로부터 l-메티오닌의 제조 방법 - Google Patents
돌연변이된 시스타티오닌 감마 신타제를 이용한 o-포스포-l-호모세린 및 메탄티올로부터 l-메티오닌의 제조 방법 Download PDFInfo
- Publication number
- KR20150076159A KR20150076159A KR1020157009704A KR20157009704A KR20150076159A KR 20150076159 A KR20150076159 A KR 20150076159A KR 1020157009704 A KR1020157009704 A KR 1020157009704A KR 20157009704 A KR20157009704 A KR 20157009704A KR 20150076159 A KR20150076159 A KR 20150076159A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- val
- ser
- gly
- Prior art date
Links
- LSDPWZHWYPCBBB-UHFFFAOYSA-N Methanethiol Chemical compound SC LSDPWZHWYPCBBB-UHFFFAOYSA-N 0.000 title claims abstract description 178
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 title claims abstract description 149
- FXDNYOANAXWZHG-VKHMYHEASA-N O-phospho-L-homoserine Chemical compound OC(=O)[C@@H](N)CCOP(O)(O)=O FXDNYOANAXWZHG-VKHMYHEASA-N 0.000 title claims abstract description 123
- FXDNYOANAXWZHG-UHFFFAOYSA-N O-phospho-L-homoserine Natural products OC(=O)C(N)CCOP(O)(O)=O FXDNYOANAXWZHG-UHFFFAOYSA-N 0.000 title claims abstract description 122
- 238000000034 method Methods 0.000 title claims abstract description 85
- 108010061618 O-succinylhomoserine (thiol)-lyase Proteins 0.000 title claims description 54
- 230000008569 process Effects 0.000 title claims description 15
- 229960004452 methionine Drugs 0.000 claims abstract description 144
- FFEARJCKVFRZRR-UHFFFAOYSA-N L-Methionine Natural products CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 claims abstract description 96
- 229930195722 L-methionine Natural products 0.000 claims abstract description 96
- 102000004190 Enzymes Human genes 0.000 claims abstract description 66
- 108090000790 Enzymes Proteins 0.000 claims abstract description 66
- 238000006243 chemical reaction Methods 0.000 claims abstract description 44
- 238000004519 manufacturing process Methods 0.000 claims abstract description 34
- 230000001419 dependent effect Effects 0.000 claims abstract description 33
- 108010075604 5-Methyltetrahydrofolate-Homocysteine S-Methyltransferase Proteins 0.000 claims abstract description 32
- 102000011848 5-Methyltetrahydrofolate-Homocysteine S-Methyltransferase Human genes 0.000 claims abstract description 32
- 244000005700 microbiome Species 0.000 claims abstract description 6
- 125000000539 amino acid group Chemical group 0.000 claims description 101
- 150000001413 amino acids Chemical group 0.000 claims description 100
- 108090000623 proteins and genes Proteins 0.000 claims description 100
- 235000018102 proteins Nutrition 0.000 claims description 87
- 102000004169 proteins and genes Human genes 0.000 claims description 87
- 229930182817 methionine Natural products 0.000 claims description 48
- 108020004707 nucleic acids Proteins 0.000 claims description 48
- 102000039446 nucleic acids Human genes 0.000 claims description 48
- 150000007523 nucleic acids Chemical class 0.000 claims description 48
- 230000000694 effects Effects 0.000 claims description 36
- 238000012217 deletion Methods 0.000 claims description 32
- 230000037430 deletion Effects 0.000 claims description 32
- 238000006467 substitution reaction Methods 0.000 claims description 32
- 230000035772 mutation Effects 0.000 claims description 28
- FFFHZYDWPBMWHY-VKHMYHEASA-N L-homocysteine Chemical compound OC(=O)[C@@H](N)CCS FFFHZYDWPBMWHY-VKHMYHEASA-N 0.000 claims description 24
- 108030001879 Cystathionine gamma-synthases Proteins 0.000 claims description 21
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 claims description 21
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 claims description 20
- 229960001570 ademetionine Drugs 0.000 claims description 20
- 229960002433 cysteine Drugs 0.000 claims description 20
- 239000004473 Threonine Substances 0.000 claims description 17
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 17
- 235000018417 cysteine Nutrition 0.000 claims description 17
- 229960002898 threonine Drugs 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 17
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 16
- 229940024606 amino acid Drugs 0.000 claims description 16
- 235000001014 amino acid Nutrition 0.000 claims description 16
- 230000002255 enzymatic effect Effects 0.000 claims description 14
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 14
- 229960000310 isoleucine Drugs 0.000 claims description 14
- 229960001153 serine Drugs 0.000 claims description 14
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 claims description 13
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 13
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 13
- 235000004279 alanine Nutrition 0.000 claims description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 11
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 11
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 11
- 229960003180 glutathione Drugs 0.000 claims description 11
- 108010024636 Glutathione Proteins 0.000 claims description 10
- FFFHZYDWPBMWHY-UHFFFAOYSA-N L-Homocysteine Natural products OC(=O)C(N)CCS FFFHZYDWPBMWHY-UHFFFAOYSA-N 0.000 claims description 10
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 10
- 238000000338 in vitro Methods 0.000 claims description 10
- 229960003136 leucine Drugs 0.000 claims description 10
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 9
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 9
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 9
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 claims description 9
- 231100000350 mutagenesis Toxicity 0.000 claims description 9
- 229960002429 proline Drugs 0.000 claims description 9
- SXFSQZDSUWACKX-UHFFFAOYSA-N 4-methylthio-2-oxobutanoic acid Chemical compound CSCCC(=O)C(O)=O SXFSQZDSUWACKX-UHFFFAOYSA-N 0.000 claims description 8
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims description 8
- 238000002703 mutagenesis Methods 0.000 claims description 8
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 8
- 229960005190 phenylalanine Drugs 0.000 claims description 8
- 229940009098 aspartate Drugs 0.000 claims description 7
- 239000004474 valine Substances 0.000 claims description 7
- 229960004295 valine Drugs 0.000 claims description 7
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 6
- 230000026731 phosphorylation Effects 0.000 claims description 6
- 238000006366 phosphorylation reaction Methods 0.000 claims description 6
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims description 5
- 239000004471 Glycine Substances 0.000 claims description 5
- 229960001230 asparagine Drugs 0.000 claims description 5
- 235000009582 asparagine Nutrition 0.000 claims description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 5
- 229960002885 histidine Drugs 0.000 claims description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 4
- 108091034117 Oligonucleotide Proteins 0.000 claims description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 4
- 229960004441 tyrosine Drugs 0.000 claims description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 3
- 229930195712 glutamate Natural products 0.000 claims description 3
- YYTDBCBJZXAWIC-UHFFFAOYSA-N 2-oxopentanethioic s-acid Chemical compound CCCC(=O)C(S)=O YYTDBCBJZXAWIC-UHFFFAOYSA-N 0.000 claims 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 claims 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 claims 1
- 238000012216 screening Methods 0.000 abstract description 11
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 58
- 210000004027 cell Anatomy 0.000 description 52
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 46
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 45
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 45
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 40
- 241000219195 Arabidopsis thaliana Species 0.000 description 38
- 108010012581 phenylalanylglutamate Proteins 0.000 description 36
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 35
- 108010047857 aspartylglycine Proteins 0.000 description 34
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 34
- 108010034529 leucyl-lysine Proteins 0.000 description 33
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 32
- 108010017391 lysylvaline Proteins 0.000 description 32
- 108010005233 alanylglutamic acid Proteins 0.000 description 30
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 29
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 29
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 29
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 29
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 29
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 29
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 29
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 28
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 27
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 27
- 108010050848 glycylleucine Proteins 0.000 description 27
- 239000002609 medium Substances 0.000 description 27
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 26
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 25
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 24
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 23
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 23
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 23
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 23
- 108010047495 alanylglycine Proteins 0.000 description 23
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 22
- 108010051242 phenylalanylserine Proteins 0.000 description 22
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 21
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 21
- RFXXUWGNVRJTNQ-QXEWZRGKSA-N Arg-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N RFXXUWGNVRJTNQ-QXEWZRGKSA-N 0.000 description 21
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 21
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 21
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 21
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 21
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 21
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 21
- IAYPZSHNZQHQNO-KKUMJFAQSA-N His-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N IAYPZSHNZQHQNO-KKUMJFAQSA-N 0.000 description 21
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 21
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 21
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 21
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 21
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 21
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 21
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 21
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 21
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 21
- BIWBTRRBHIEVAH-IHPCNDPISA-N Ser-Tyr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BIWBTRRBHIEVAH-IHPCNDPISA-N 0.000 description 21
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 21
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 21
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 21
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 21
- 108010041407 alanylaspartic acid Proteins 0.000 description 21
- 108010079317 prolyl-tyrosine Proteins 0.000 description 21
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 20
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 20
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 20
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 20
- 241000880493 Leptailurus serval Species 0.000 description 20
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 20
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 20
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 20
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 20
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 20
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 20
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 19
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 19
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 19
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 19
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 19
- 108010070783 alanyltyrosine Proteins 0.000 description 19
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 19
- 108010090894 prolylleucine Proteins 0.000 description 19
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 18
- 241000196324 Embryophyta Species 0.000 description 18
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 18
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 17
- XGHYKIDVGYYHDC-JBDRJPRFSA-N Cys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N XGHYKIDVGYYHDC-JBDRJPRFSA-N 0.000 description 17
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 17
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 17
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 17
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 17
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 17
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 17
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 17
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 17
- 108010087924 alanylproline Proteins 0.000 description 17
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 16
- ITZOBNKQDZEOCE-NHCYSSNCSA-N Gly-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN ITZOBNKQDZEOCE-NHCYSSNCSA-N 0.000 description 16
- ONPJGOIVICHWBW-BZSNNMDCSA-N Leu-Lys-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ONPJGOIVICHWBW-BZSNNMDCSA-N 0.000 description 16
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 16
- 108010040030 histidinoalanine Proteins 0.000 description 16
- 229910052717 sulfur Inorganic materials 0.000 description 16
- 239000011593 sulfur Substances 0.000 description 16
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 15
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 15
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 15
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 15
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 15
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 15
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 15
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 15
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 15
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 15
- 102100021277 Beta-secretase 2 Human genes 0.000 description 15
- 101710150190 Beta-secretase 2 Proteins 0.000 description 15
- DVIHGGUODLILFN-GHCJXIJMSA-N Cys-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DVIHGGUODLILFN-GHCJXIJMSA-N 0.000 description 15
- RMOCFPBLHAOTDU-ACZMJKKPSA-N Gln-Asn-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RMOCFPBLHAOTDU-ACZMJKKPSA-N 0.000 description 15
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 15
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 15
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 15
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 15
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 15
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 15
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 15
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 15
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 15
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 15
- HHSOPSCKAZKQHQ-PEXQALLHSA-N Gly-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN HHSOPSCKAZKQHQ-PEXQALLHSA-N 0.000 description 15
- QLQDIJBYJZKQPR-BQBZGAKWSA-N Gly-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN QLQDIJBYJZKQPR-BQBZGAKWSA-N 0.000 description 15
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 15
- OMNVOTCFQQLEQU-CIUDSAMLSA-N His-Asn-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMNVOTCFQQLEQU-CIUDSAMLSA-N 0.000 description 15
- ORZGPQXISSXQGW-IHRRRGAJSA-N His-His-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O ORZGPQXISSXQGW-IHRRRGAJSA-N 0.000 description 15
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 15
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 15
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 15
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 15
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 15
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 15
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Chemical group NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 15
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 15
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 15
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 15
- VPFGPKIWSDVTOY-SRVKXCTJSA-N Pro-Glu-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O VPFGPKIWSDVTOY-SRVKXCTJSA-N 0.000 description 15
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 15
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 15
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 15
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 15
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 15
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 15
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 15
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 15
- HURRXSNHCCSJHA-AUTRQRHGSA-N Val-Gln-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HURRXSNHCCSJHA-AUTRQRHGSA-N 0.000 description 15
- HQYVQDRYODWONX-DCAQKATOSA-N Val-His-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N HQYVQDRYODWONX-DCAQKATOSA-N 0.000 description 15
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 15
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 15
- 101150070760 cgs1 gene Proteins 0.000 description 15
- 108010069495 cysteinyltyrosine Proteins 0.000 description 15
- 108010003700 lysyl aspartic acid Proteins 0.000 description 15
- 108010018625 phenylalanylarginine Proteins 0.000 description 15
- 108010048818 seryl-histidine Proteins 0.000 description 15
- 108010073969 valyllysine Proteins 0.000 description 15
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 14
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 14
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 14
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 14
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 14
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 14
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 14
- DMAPKBANYNZHNR-ULQDDVLXSA-N His-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DMAPKBANYNZHNR-ULQDDVLXSA-N 0.000 description 14
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 14
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 14
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 14
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 14
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 14
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 14
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 14
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 14
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 14
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 14
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 14
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 14
- 108010077245 asparaginyl-proline Proteins 0.000 description 14
- 108010009297 diglycyl-histidine Proteins 0.000 description 14
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 14
- 101150043924 metXA gene Proteins 0.000 description 14
- 108010053725 prolylvaline Proteins 0.000 description 14
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 13
- XDPLZVNMYQOFQZ-BJDJZHNGSA-N Lys-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N XDPLZVNMYQOFQZ-BJDJZHNGSA-N 0.000 description 13
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 13
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 12
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 12
- LLQIAIUAKGNOSE-NHCYSSNCSA-N Arg-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N LLQIAIUAKGNOSE-NHCYSSNCSA-N 0.000 description 12
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 12
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 12
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 12
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 12
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 12
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 12
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 12
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 12
- OHAJHDJOCKKJLV-LKXGYXEUSA-N Thr-Asp-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O OHAJHDJOCKKJLV-LKXGYXEUSA-N 0.000 description 12
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 12
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 12
- 108010038633 aspartylglutamate Proteins 0.000 description 12
- 230000035755 proliferation Effects 0.000 description 12
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 11
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 11
- -1 L-homoserine ester Chemical class 0.000 description 11
- 101150014095 MET2 gene Proteins 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 108010057821 leucylproline Proteins 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 10
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 10
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 10
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 10
- 101150009006 HIS3 gene Proteins 0.000 description 10
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 10
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 10
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 10
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 10
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 10
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 10
- 108010018006 histidylserine Proteins 0.000 description 10
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 10
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 9
- ILRYLPWNYFXEMH-UHFFFAOYSA-N D-cystathionine Natural products OC(=O)C(N)CCSCC(N)C(O)=O ILRYLPWNYFXEMH-UHFFFAOYSA-N 0.000 description 9
- ILRYLPWNYFXEMH-WHFBIAKZSA-N L-cystathionine Chemical compound [O-]C(=O)[C@@H]([NH3+])CCSC[C@H]([NH3+])C([O-])=O ILRYLPWNYFXEMH-WHFBIAKZSA-N 0.000 description 9
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 9
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 9
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 108010049041 glutamylalanine Proteins 0.000 description 9
- 235000003969 glutathione Nutrition 0.000 description 9
- 108010028295 histidylhistidine Proteins 0.000 description 9
- KPDTZVSUQCBOAE-HTFCKZLJSA-N (2s)-2-[[(2s)-1-[(2s)-2-[[(2s)-2-[[(2s)-2-aminopropanoyl]amino]propanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]propanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O KPDTZVSUQCBOAE-HTFCKZLJSA-N 0.000 description 8
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 8
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 8
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 8
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 8
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 8
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 8
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 8
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 8
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 8
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 8
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 8
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 8
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 8
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 8
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 8
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 8
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 8
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 8
- PGXZHYYGOPKYKM-IHRRRGAJSA-N His-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CCCCN)C(=O)O PGXZHYYGOPKYKM-IHRRRGAJSA-N 0.000 description 8
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 8
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 8
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 8
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 8
- RPEPZINUYHUBKG-FXQIFTODSA-N Met-Cys-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O RPEPZINUYHUBKG-FXQIFTODSA-N 0.000 description 8
- SKGLAZSLOGYCCA-PEFXOJROSA-N Neuromedin N (1-4) Chemical compound CC[C@@H](C)[C@@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)N[C@H]([C@H](C)CC)C(O)=O)CC1=CC=C(O)C=C1 SKGLAZSLOGYCCA-PEFXOJROSA-N 0.000 description 8
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 8
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 8
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 8
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 8
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 8
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 8
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 8
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 8
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 8
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 8
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 8
- 108010085325 histidylproline Proteins 0.000 description 8
- 101150002012 met6 gene Proteins 0.000 description 8
- 102220052186 rs200545412 Human genes 0.000 description 8
- 101100170933 Arabidopsis thaliana DMT1 gene Proteins 0.000 description 7
- 101100170942 Arabidopsis thaliana MET4 gene Proteins 0.000 description 7
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 7
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 7
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 7
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 7
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 7
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 7
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 7
- 101100261242 Mus musculus Trdmt1 gene Proteins 0.000 description 7
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 7
- FCXZBWSIAGGPCB-YFKPBYRVSA-N O-acetyl-L-homoserine Chemical compound CC(=O)OCC[C@H]([NH3+])C([O-])=O FCXZBWSIAGGPCB-YFKPBYRVSA-N 0.000 description 7
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 7
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 7
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 7
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 7
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 7
- WVVOFCVMHAXGLE-LFSVMHDDSA-N Thr-Phe-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O WVVOFCVMHAXGLE-LFSVMHDDSA-N 0.000 description 7
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 7
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 7
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 108010054155 lysyllysine Proteins 0.000 description 7
- 108010038320 lysylphenylalanine Proteins 0.000 description 7
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 6
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 6
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 6
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 6
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 6
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 6
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 6
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 6
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 6
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 6
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 6
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 6
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 6
- ABMMIOIRQJNRHG-XKNYDFJKSA-N Asn-Asn-Pro-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ABMMIOIRQJNRHG-XKNYDFJKSA-N 0.000 description 6
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 6
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 6
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 6
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 6
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 6
- 108700010070 Codon Usage Proteins 0.000 description 6
- PRXCTTWKGJAPMT-ZLUOBGJFSA-N Cys-Ala-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O PRXCTTWKGJAPMT-ZLUOBGJFSA-N 0.000 description 6
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 6
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 6
- MJOYUXLETJMQGG-IHRRRGAJSA-N Cys-Tyr-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MJOYUXLETJMQGG-IHRRRGAJSA-N 0.000 description 6
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 6
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 6
- ROHVCXBMIAAASL-HJGDQZAQSA-N Gln-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)N)N)O ROHVCXBMIAAASL-HJGDQZAQSA-N 0.000 description 6
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 6
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 6
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 6
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 6
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 6
- ZWRDOVYMQAAISL-UWVGGRQHSA-N Gly-Met-Lys Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCCN ZWRDOVYMQAAISL-UWVGGRQHSA-N 0.000 description 6
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 6
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 6
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 6
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 6
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 6
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 6
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 6
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 6
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 6
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 6
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 6
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 6
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 6
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 6
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 6
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 6
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 6
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 6
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 6
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 6
- GVKINWYYLOLEFQ-XIRDDKMYSA-N Lys-Trp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O GVKINWYYLOLEFQ-XIRDDKMYSA-N 0.000 description 6
- SOAYQFDWEIWPPR-IHRRRGAJSA-N Met-Ser-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SOAYQFDWEIWPPR-IHRRRGAJSA-N 0.000 description 6
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 6
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 6
- 101100281510 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) met-6 gene Proteins 0.000 description 6
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 6
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 6
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 6
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 6
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 6
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 6
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 6
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 6
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 6
- ZJUKTBDSGOFHSH-WFMPWKQPSA-N S-Adenosylhomocysteine Chemical compound O[C@@H]1[C@H](O)[C@@H](CSCC[C@H](N)C(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZJUKTBDSGOFHSH-WFMPWKQPSA-N 0.000 description 6
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 6
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 6
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 6
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 6
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 6
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 6
- LXWZOMSOUAMOIA-JIOCBJNQSA-N Thr-Asn-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O LXWZOMSOUAMOIA-JIOCBJNQSA-N 0.000 description 6
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 6
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 6
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 6
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 6
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 6
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 6
- FBVUOEYVGNMRMD-NAKRPEOUSA-N Val-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N FBVUOEYVGNMRMD-NAKRPEOUSA-N 0.000 description 6
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 6
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 6
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 6
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 6
- DLRZGNXCXUGIDG-KKHAAJSZSA-N Val-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O DLRZGNXCXUGIDG-KKHAAJSZSA-N 0.000 description 6
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 6
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 6
- 108010008355 arginyl-glutamine Proteins 0.000 description 6
- 108010062796 arginyllysine Proteins 0.000 description 6
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 108010037850 glycylvaline Proteins 0.000 description 6
- 108010025306 histidylleucine Proteins 0.000 description 6
- 239000006166 lysate Substances 0.000 description 6
- 108010070643 prolylglutamic acid Proteins 0.000 description 6
- 108010029020 prolylglycine Proteins 0.000 description 6
- 108010026333 seryl-proline Proteins 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- 210000005253 yeast cell Anatomy 0.000 description 6
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 5
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- HAYVLBZZBDCKRA-SRVKXCTJSA-N Cys-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N HAYVLBZZBDCKRA-SRVKXCTJSA-N 0.000 description 5
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 5
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 5
- RENBRDSDKPSRIH-HJWJTTGWSA-N Ile-Phe-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O RENBRDSDKPSRIH-HJWJTTGWSA-N 0.000 description 5
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 5
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 5
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 5
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 5
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 5
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 5
- RTUWVJVJSMOGPL-KKUMJFAQSA-N Phe-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RTUWVJVJSMOGPL-KKUMJFAQSA-N 0.000 description 5
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 5
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 5
- 241000235070 Saccharomyces Species 0.000 description 5
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 5
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 5
- AHOLTQCAVBSUDP-PPCPHDFISA-N Thr-Ile-Lys Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)[C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O AHOLTQCAVBSUDP-PPCPHDFISA-N 0.000 description 5
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 5
- 108010022394 Threonine synthase Proteins 0.000 description 5
- 102000006843 Threonine synthase Human genes 0.000 description 5
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 5
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 108010027338 isoleucylcysteine Proteins 0.000 description 5
- 108010078274 isoleucylvaline Proteins 0.000 description 5
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 5
- 108010056582 methionylglutamic acid Proteins 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 5
- TZBGSHAFWLGWBO-ABLWVSNPSA-N (2s)-2-[[4-[(2-amino-4-oxo-5,6,7,8-tetrahydro-1h-pteridin-6-yl)methylamino]benzoyl]amino]-5-methoxy-5-oxopentanoic acid Chemical compound C1=CC(C(=O)N[C@@H](CCC(=O)OC)C(O)=O)=CC=C1NCC1NC(C(=O)NC(N)=N2)=C2NC1 TZBGSHAFWLGWBO-ABLWVSNPSA-N 0.000 description 4
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 101710083973 Homocysteine synthase Proteins 0.000 description 4
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 4
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 210000003763 chloroplast Anatomy 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000002538 fungal effect Effects 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 108010077112 prolyl-proline Proteins 0.000 description 4
- 102220314418 rs150317197 Human genes 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 3
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- YPWSLBHSMIKTPR-UHFFFAOYSA-N Cystathionine Natural products OC(=O)C(N)CCSSCC(N)C(O)=O YPWSLBHSMIKTPR-UHFFFAOYSA-N 0.000 description 3
- 239000004201 L-cysteine Substances 0.000 description 3
- 235000013878 L-cysteine Nutrition 0.000 description 3
- RITKHVBHSGLULN-WHFBIAKZSA-N L-gamma-glutamyl-L-cysteine Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(O)=O RITKHVBHSGLULN-WHFBIAKZSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical group C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 3
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 3
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 3
- 101150049692 THR4 gene Proteins 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Chemical group C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 3
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009697 arginine Nutrition 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 3
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 3
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 3
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 3
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 239000003797 essential amino acid Substances 0.000 description 3
- 235000020776 essential amino acid Nutrition 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 108010034653 homoserine O-acetyltransferase Proteins 0.000 description 3
- 238000000099 in vitro assay Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000037353 metabolic pathway Effects 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000002062 proliferating effect Effects 0.000 description 3
- 229960001327 pyridoxal phosphate Drugs 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 229960004799 tryptophan Drugs 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 2
- WUUGFSXJNOTRMR-IOSLPCCCSA-N 5'-S-methyl-5'-thioadenosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CSC)O[C@H]1N1C2=NC=NC(N)=C2N=C1 WUUGFSXJNOTRMR-IOSLPCCCSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 102100032534 Adenosine kinase Human genes 0.000 description 2
- 108010076278 Adenosine kinase Proteins 0.000 description 2
- 102000005234 Adenosylhomocysteinase Human genes 0.000 description 2
- 108020002202 Adenosylhomocysteinase Proteins 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- RWWPBOUMKFBHAL-FXQIFTODSA-N Arg-Asn-Cys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O RWWPBOUMKFBHAL-FXQIFTODSA-N 0.000 description 2
- RWDVGVPHEWOZMO-GUBZILKMSA-N Arg-Cys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCNC(N)=N)C(O)=O RWDVGVPHEWOZMO-GUBZILKMSA-N 0.000 description 2
- BJNUAWGXPSHQMJ-DCAQKATOSA-N Arg-Gln-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O BJNUAWGXPSHQMJ-DCAQKATOSA-N 0.000 description 2
- SYAUZLVLXCDRSH-IUCAKERBSA-N Arg-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N SYAUZLVLXCDRSH-IUCAKERBSA-N 0.000 description 2
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 2
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 2
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 2
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 2
- LXKLDWVHXNZQGB-SRVKXCTJSA-N Asp-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O LXKLDWVHXNZQGB-SRVKXCTJSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 2
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 238000009010 Bradford assay Methods 0.000 description 2
- 241000222128 Candida maltosa Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241000186226 Corynebacterium glutamicum Species 0.000 description 2
- 102100034976 Cystathionine beta-synthase Human genes 0.000 description 2
- 108010073644 Cystathionine beta-synthase Proteins 0.000 description 2
- 102000020018 Cystathionine gamma-Lyase Human genes 0.000 description 2
- 108010045283 Cystathionine gamma-lyase Proteins 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 2
- 241001465328 Eremothecium gossypii Species 0.000 description 2
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 2
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 2
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- PABVKUJVLNMOJP-WHFBIAKZSA-N Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(O)=O PABVKUJVLNMOJP-WHFBIAKZSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- 102000004263 Glutamate-Cysteine Ligase Human genes 0.000 description 2
- 108010081687 Glutamate-cysteine ligase Proteins 0.000 description 2
- 108010036164 Glutathione synthase Proteins 0.000 description 2
- 102100034294 Glutathione synthetase Human genes 0.000 description 2
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 2
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 2
- 108010020869 Homocysteine S-Methyltransferase Proteins 0.000 description 2
- LLHYWBGDMBGNHA-VGDYDELISA-N Ile-Cys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LLHYWBGDMBGNHA-VGDYDELISA-N 0.000 description 2
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 2
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 2
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 2
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 2
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 2
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical group NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 2
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 2
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 2
- JPYPRVHMKRFTAT-KKUMJFAQSA-N Lys-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N JPYPRVHMKRFTAT-KKUMJFAQSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- 241000489861 Maximus Species 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 2
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 2
- 108030001122 Methionine transaminases Proteins 0.000 description 2
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- ZFVWWUILVLLVFA-AVGNSLFASA-N Phe-Gln-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N ZFVWWUILVLLVFA-AVGNSLFASA-N 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 2
- GFHOSBYCLACKEK-GUBZILKMSA-N Pro-Pro-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O GFHOSBYCLACKEK-GUBZILKMSA-N 0.000 description 2
- RNEFESSBTOQSAC-DCAQKATOSA-N Pro-Ser-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O RNEFESSBTOQSAC-DCAQKATOSA-N 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 2
- 101100364827 Prochlorococcus marinus (strain SARG / CCMP1375 / SS120) ahcY gene Proteins 0.000 description 2
- 108010011939 Pyruvate Decarboxylase Proteins 0.000 description 2
- 102100026115 S-adenosylmethionine synthase isoform type-1 Human genes 0.000 description 2
- 101150081953 SAM1 gene Proteins 0.000 description 2
- 101150021948 SAM2 gene Proteins 0.000 description 2
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 2
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 2
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 2
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 2
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 2
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- PXQUBKWZENPDGE-CIQUZCHMSA-N Thr-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)O)N PXQUBKWZENPDGE-CIQUZCHMSA-N 0.000 description 2
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 2
- NIEWSKWFURSECR-FOHZUACHSA-N Thr-Gly-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O NIEWSKWFURSECR-FOHZUACHSA-N 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 2
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 2
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 2
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 2
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 2
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 2
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 2
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- KBKTUNYBNJWFRL-UBHSHLNASA-N Trp-Ser-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 KBKTUNYBNJWFRL-UBHSHLNASA-N 0.000 description 2
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 2
- NAHUCETZGZZSEX-IHPCNDPISA-N Tyr-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N NAHUCETZGZZSEX-IHPCNDPISA-N 0.000 description 2
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 2
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 2
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 2
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 2
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004737 colorimetric analysis Methods 0.000 description 2
- 238000009833 condensation Methods 0.000 description 2
- 230000005494 condensation Effects 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- VLTRZXGMWDSKGL-UHFFFAOYSA-N perchloric acid Chemical compound OCl(=O)(=O)=O VLTRZXGMWDSKGL-UHFFFAOYSA-N 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 235000007682 pyridoxal 5'-phosphate Nutrition 0.000 description 2
- 239000011589 pyridoxal 5'-phosphate Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 102200123495 rs7637099 Human genes 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- PPXFBTCTQWEUIK-DQZFIDPSSA-N (2s)-2-amino-4-[(2r)-2-amino-2-carboxyethyl]sulfanylbutanoic acid;(2r)-2-amino-3-sulfanylpropanoic acid Chemical compound SC[C@H](N)C(O)=O.OC(=O)[C@@H](N)CCSC[C@H](N)C(O)=O PPXFBTCTQWEUIK-DQZFIDPSSA-N 0.000 description 1
- MOKLFAZOVPBPSX-REOHCLBHSA-N (3s)-3-amino-4-oxo-4-phosphonooxybutanoic acid Chemical compound OC(=O)C[C@H](N)C(=O)OP(O)(O)=O MOKLFAZOVPBPSX-REOHCLBHSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- CLUWOWRTHNNBBU-UHFFFAOYSA-N 3-methylthiopropanal Chemical compound CSCCC=O CLUWOWRTHNNBBU-UHFFFAOYSA-N 0.000 description 1
- OOXNYFKPOPJIOT-UHFFFAOYSA-N 5-(3-bromophenyl)-7-(6-morpholin-4-ylpyridin-3-yl)pyrido[2,3-d]pyrimidin-4-amine;dihydrochloride Chemical compound Cl.Cl.C=12C(N)=NC=NC2=NC(C=2C=NC(=CC=2)N2CCOCC2)=CC=1C1=CC=CC(Br)=C1 OOXNYFKPOPJIOT-UHFFFAOYSA-N 0.000 description 1
- 101150037691 ARO10 gene Proteins 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 1
- XZWXFWBHYRFLEF-FSPLSTOPSA-N Ala-His Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XZWXFWBHYRFLEF-FSPLSTOPSA-N 0.000 description 1
- QJABSQFUHKHTNP-SYWGBEHUSA-N Ala-Ile-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QJABSQFUHKHTNP-SYWGBEHUSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 241000588813 Alcaligenes faecalis Species 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241000193741 Aneurinibacillus aneurinilyticus Species 0.000 description 1
- 101100383400 Arabidopsis thaliana CGS1 gene Proteins 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- FUHFYEKSGWOWGZ-XHNCKOQMSA-N Asn-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O FUHFYEKSGWOWGZ-XHNCKOQMSA-N 0.000 description 1
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- 241001061273 Astragalus bisulcatus Species 0.000 description 1
- 241000634093 Astragalus racemosus Species 0.000 description 1
- 241000213948 Astragalus sinicus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 101100351264 Candida albicans (strain SC5314 / ATCC MYA-2876) PDC11 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000035484 Cellulite Diseases 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000235646 Cyberlindnera jadinii Species 0.000 description 1
- 101710095827 Cyclopropane mycolic acid synthase 1 Proteins 0.000 description 1
- 101710095826 Cyclopropane mycolic acid synthase 2 Proteins 0.000 description 1
- 101710095828 Cyclopropane mycolic acid synthase 3 Proteins 0.000 description 1
- 101710110342 Cyclopropane mycolic acid synthase MmaA2 Proteins 0.000 description 1
- NLCZGISONIGRQP-DCAQKATOSA-N Cys-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N NLCZGISONIGRQP-DCAQKATOSA-N 0.000 description 1
- 108010076010 Cystathionine beta-lyase Proteins 0.000 description 1
- DCXYFEDJOCDNAF-UWTATZPHSA-N D-Asparagine Chemical compound OC(=O)[C@H](N)CC(N)=O DCXYFEDJOCDNAF-UWTATZPHSA-N 0.000 description 1
- 229930182846 D-asparagine Natural products 0.000 description 1
- 101150082634 DUG2 gene Proteins 0.000 description 1
- 241000235036 Debaryomyces hansenii Species 0.000 description 1
- 208000010228 Erectile Dysfunction Diseases 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- 101100329534 Haloarcula marismortui (strain ATCC 43049 / DSM 3752 / JCM 8966 / VKM B-1809) csg1 gene Proteins 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 101001068302 Homo sapiens GS homeobox 2 Proteins 0.000 description 1
- 101001068634 Homo sapiens Protein PRRC2A Proteins 0.000 description 1
- 101000908580 Homo sapiens Spliceosome RNA helicase DDX39B Proteins 0.000 description 1
- 101710177638 Hydroxymycolate synthase MmaA4 Proteins 0.000 description 1
- WKXVAXOSIPTXEC-HAFWLYHUSA-N Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O WKXVAXOSIPTXEC-HAFWLYHUSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 1
- HOSWPDPVFBCLSY-VKHMYHEASA-N L-aspartic 4-semialdehyde Chemical compound [O-]C(=O)[C@@H]([NH3+])CC=O HOSWPDPVFBCLSY-VKHMYHEASA-N 0.000 description 1
- 229930195714 L-glutamate Natural products 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 244000242291 Lemna paucicostata Species 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- 239000004472 Lysine Chemical group 0.000 description 1
- 241000193386 Lysinibacillus sphaericus Species 0.000 description 1
- AFVOKRHYSSFPHC-STECZYCISA-N Met-Ile-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFVOKRHYSSFPHC-STECZYCISA-N 0.000 description 1
- 101710174850 Methoxy mycolic acid synthase MmaA3 Proteins 0.000 description 1
- 101710204417 Mycolic acid methyltransferase MmaA1 Proteins 0.000 description 1
- 241000990237 Neptunia Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- GNISQJGXJIDKDJ-YFKPBYRVSA-N O-succinyl-L-homoserine Chemical compound OC(=O)[C@@H](N)CCOC(=O)CCC(O)=O GNISQJGXJIDKDJ-YFKPBYRVSA-N 0.000 description 1
- 101150050255 PDC1 gene Proteins 0.000 description 1
- 102220593541 PMS1 protein homolog 1_N11D_mutation Human genes 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 206010049752 Peau d'orange Diseases 0.000 description 1
- 241000588701 Pectobacterium carotovorum Species 0.000 description 1
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 1
- 108010036076 Phenylpyruvate decarboxylase Proteins 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 1
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 102100033954 Protein PRRC2A Human genes 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- 108050008511 S-adenosylmethionine synthases Proteins 0.000 description 1
- 101150063173 SAH1 gene Proteins 0.000 description 1
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 1
- 101100163488 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ARO8 gene Proteins 0.000 description 1
- 101100386054 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CYS3 gene Proteins 0.000 description 1
- 101100438644 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CYS4 gene Proteins 0.000 description 1
- 101100386089 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MET17 gene Proteins 0.000 description 1
- 101100082596 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PDC5 gene Proteins 0.000 description 1
- 101100519200 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PDC6 gene Proteins 0.000 description 1
- 101100422777 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SUR1 gene Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000235060 Scheffersomyces stipitis Species 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 102100024690 Spliceosome RNA helicase DDX39B Human genes 0.000 description 1
- 241000187411 Streptomyces phaeochromogenes Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 101150001810 TEAD1 gene Proteins 0.000 description 1
- 101150074253 TEF1 gene Proteins 0.000 description 1
- 101150116985 THR1 gene Proteins 0.000 description 1
- 102220568068 Tetratricopeptide repeat protein 4_S47T_mutation Human genes 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 1
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- QARCDOCCDOLJSF-HJPIBITLSA-N Tyr-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QARCDOCCDOLJSF-HJPIBITLSA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- OPPPRBRETLLZFC-DKWTVANSSA-N [S].SC[C@H](N)C(O)=O Chemical compound [S].SC[C@H](N)C(O)=O OPPPRBRETLLZFC-DKWTVANSSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 101150034884 ado1 gene Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 229940005347 alcaligenes faecalis Drugs 0.000 description 1
- 150000004716 alpha keto acids Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000036232 cellulite Effects 0.000 description 1
- NCEXYHBECQHGNR-UHFFFAOYSA-N chembl421 Chemical compound C1=C(O)C(C(=O)O)=CC(N=NC=2C=CC(=CC=2)S(=O)(=O)NC=2N=CC=CC=2)=C1 NCEXYHBECQHGNR-UHFFFAOYSA-N 0.000 description 1
- RCTYPNKXASFOBE-UHFFFAOYSA-M chloromercury Chemical compound [Hg]Cl RCTYPNKXASFOBE-UHFFFAOYSA-M 0.000 description 1
- 238000013377 clone selection method Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical group N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 229960002743 glutamine Drugs 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 108010071598 homoserine kinase Proteins 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 229960003646 lysine Drugs 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052976 metal sulfide Inorganic materials 0.000 description 1
- 150000002741 methionine derivatives Chemical class 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- OTIJNTWWDCIUNM-UHFFFAOYSA-N pentanethioic s-acid Chemical compound CCCCC(S)=O OTIJNTWWDCIUNM-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 102220258485 rs1553637356 Human genes 0.000 description 1
- 102220321782 rs1554820662 Human genes 0.000 description 1
- 102220325921 rs1555376589 Human genes 0.000 description 1
- 102200082940 rs33936254 Human genes 0.000 description 1
- 102200024234 rs33968748 Human genes 0.000 description 1
- 102220062918 rs535644999 Human genes 0.000 description 1
- 102200022472 rs587776967 Human genes 0.000 description 1
- 102200049623 rs6529 Human genes 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 101150035983 str1 gene Proteins 0.000 description 1
- 101150117395 str4 gene Proteins 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 125000002730 succinyl group Chemical group C(CCC(=O)*)(=O)* 0.000 description 1
- FDDDEECHVMSUSB-UHFFFAOYSA-N sulfanilamide Chemical compound NC1=CC=C(S(N)(=O)=O)C=C1 FDDDEECHVMSUSB-UHFFFAOYSA-N 0.000 description 1
- 229940124530 sulfonamide Drugs 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/12—Methionine; Cysteine; Cystine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P11/00—Preparation of sulfur-containing organic compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/02—Amides, e.g. chloramphenicol or polyamides; Imides or polyimides; Urethanes, i.e. compounds comprising N-C=O structural element or polyurethanes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/38—Nucleosides
- C12P19/40—Nucleosides having a condensed ring system containing a six-membered ring having two nitrogen atoms in the same ring, e.g. purine nucleosides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
- C12Y201/01013—Methionine synthase (2.1.1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01048—Cystathionine gamma-synthase (2.5.1.48)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
Abstract
본 발명은, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 효소적으로 변환시키는 L-메티오닌의 제조 방법을 제공한다. 상기 변환은 O-포스포-L-호모세린 (OPHS) 의존적인 메티오닌 신타제라고 하는 효소에 의해 달성된다. 또한, O-포스포-L-호모세린 (OPHS) 의존적인 메티오닌 신타제, 즉, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 효소적으로 변환할 수 있는 단백질과, O-포스포-L-호모세린과 메탄티올로부터 L-메티오닌을 생산할 수 있도록 유전자 변형된 미생물을 개시한다. 또한, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 과정을 촉매하는 효소의 스크리닝 방법도 기술한다.
Description
본 발명은 O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌과 H3PO4로 변환하는, L-메티오닌의 제조 방법에 관한 것이다. 이러한 변환은 O-포스포-L-호모세린 (OPHS) 의존적인 메티오닌 신타제라고 하는 효소에 의해 달성된다. 또한, 본 발명은 O-포스포-L-호모세린 의존적인 메티오닌 신타제, 즉, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 효소적으로 변환할 수 있는 단백질을 제공한다. 또한, 본 발명은 O-포스포-L-호모세린과 메탄티올로부터 L-메티오닌을 생산할 수 있도록 유전자 변형된 미생물에 관한 것이다.
본 발명의 효소 및 방법은 또한 S-아데노실 메티오닌, 글루타티온, 시스테인, S-아데노실 호모시스테인 및 메틸-티오-아데노신 등의 메티오닌 유사체를 합성하는데에 유용하게 사용될 수 있다. 또한, 본 발명은 O-포스포-L-호모세린과 메탄티올의 L-메티오닌과 H3PO4로의 변환을 촉매하는 효소를 스크리닝하는 방법을 제공한다.
L-메티오닌은, L-아스파르틸 포스페이트의 활성화와 이후의 L-아스파르테이트 세미알데하이드 및 L-호모세린으로의 환원을 통해, L-아스파르테이트의 대사에 의해 합성되는, 필수 아미노산이다. 박테리아와 진균의 경우, L-호모세린은 O-아세틸화되어 숙시닐 또는 아세틸 에스테르를 형성하게 되며, 이는 설파이드 (SH2)와 직접 황 축합됨으로써 L-호모시스테인을 형성하거나 또는 L-시스테인과 간접적으로 황 축합됨으로써 호모시스테인으로 변환되기에 앞서 L-시스타티오닌을 형성하게 된다. 호모시스테인은 메틸테트라하이드로폴레이트를 이용한 연속적인 메틸화에 의해 L-메티오닌으로 형성된다.
식물의 경우, 시스타티오닌의 전구체로서 사용되는 L-호모세린 에스테르는 O-포스포-L-호모세린이다. 시스타티오닌은 시스타티오닌 β 리아제 (lyase)의 작용에 의해, 호모시스테인으로 변환된다. 그런 다음, 호모시스테인이 메틸화되어, 메티오닌이 된다. 또한, O-포스포-L-호모세린은, 박테리아, 식물, 진균 및 포유류 세포의 대사에서는, 포스포-피리독살 효소인 트레오닌 신타제 (EC 4.2.3.1)의 작용에 의해 L-트레오닌의 직접적인 전구체로서 형성된다. 식물의 경우, O-포스포-L-호모세린 분기점에서 메티오닌과 트레오닌으로의 탄소 유입을 제어하기 위해 엄격한 조절이 존재하고 있다 (Amir et al., TRENDS Plant Science 7 (2002), 153). 문헌에 보고된 바에 따르면 (예컨대, Kreft et al., Plant Physiol. 104 (1994), 1215; Ravanel et al., Arch. Biochem. Biophys. 316 (1995), 572), L-시스테인과 설파이드 (SH2) 모두 식물의 시스타티오닌 감마 신타제에 의해 O-포스포-L-호모세린과 축합되어 L-시스타티오닌 및 L-호모시스테인이 되고, 동시에 포스페이트가 방출된다. 또한, 티올 기질 범위가 매우 한정적이어서, L-시스테인 이외에는 허용되는 기질의 수가 몇 종되지 않는 것으로 보고되어 있다.
메티오닌은 필수 아미노산이지만, 동물에서 드노보 (de novo) 합성되지 않기 때문에, 동물은 메티오닌 또는 메티오닌-함유 단백질이나 관련 황 함유 화합물을 섭취하여야 한다. 특히, 메티오닌은 가금류와 가축 사료에 필수적이지만, 이들이 섭취하는 식물성 물질에는 그 양이 충분하지 않다. 따라서, 효과적인 사육을 위해서는 외부 메티오닌이 공급되어야 한다. 지금까지 모두가 그런 것은 아닐지라도 동물 사료에 사용되는 대부분의 메티오닌은 석유화학에서 기원한 것이다. 메티오닌 생산에 있어 한가지 제약은 황의 환원에 소요되는 에너지 비용이다. 이에, 이 아미노산을, 바람직하게는 공업적인 규모의 메티오닌 합성에 적합한 미생물을 이용할 수 있는 재생가능한 자원을 이용함으로써, 아미노산을 생산하는 대안적인 방법을 제공할 필요성이 존재한다.
본 발명은, O-포스포-L-호모세린과 메탄티올을 효소에 의해 메티오닌과 H3PO4로 변환하는, L-메티오닌의 제조 방법을 제공함으로써, 이러한 과제를 해결한다. 상기한 방법에서, 황 소스는 메탄티올이다. 이 화합물에서, 황은 이미 환원된 설파이드로서 제공된다. 아울러, 전구체로서 O-포스포-L-호모세린을 사용하면, 아세틸화되거나 또는 숙시닐화된 호모세린 유도체의 사용에 의존하는 표준 대사 경로와 비교해, 합성되는 메티오닌 1 분자 당 탄소 원자가 2개 이상이 절약된다. 요컨대, 이 경로에 의하면 메티오닌 및 이의 유도체의 합성 수율이 훨씬 높아진다.
이에, 본 발명은 L-메티오닌이 하기 반응식에 따라 효소적으로 생산되는, L-메티오닌 제조 방법에 관한 것이다:
O-포스포-L-호모세린 + CH3-SH < = > L-메티오닌 + H3PO4
지금까지 O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환하는 능력을 가진 단백질이 자연에 존재한다는 것은 보고된 바 없다. 본 발명자들은 비용 효율적인 방식으로 O-포스포-L-호모세린과 메탄티올로부터 L-메티오닌을 생산하는 방법을 생각하게 되었고, 이를 위해 자연에 존재하지 않는 O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환할 수 있는 능력을 가지고 있는 단백질을 만들게 되었다. 첨부된 실시예들에서 확인되는 바와 같이, 본 발명자들은 O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 능력을 가진 효소를 구축할 수 있는 시스템을 개발하였다. 또한, 본 발명자들은 이 시스템을 활용함으로써, 기존 효소로부터, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 능력을 가진 새로운 효소 변이체를 구축하는데 성공하게 되었다. 이를 위해, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 능력이 없는 기존 효소를 출발 물질로하여, 이러한 기존 효소로부터 돌연변이를 제작하고, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 능력을 보이는 효소를 선별하게 되었다. 즉, 본 발명자들은 지금까지 개시된 바 없는 새로운 효소 활성을 확립하여, 해당 효소를 제조하는 신뢰성있고 재현가능한 방법을 제공할 수 있게 되었다. 이 효소는 본 발명의 내용에서는 O-포스포-L-호모세린 의존적인 메티오닌 신타제로 언급된다.
이에, 본 발명은, 특히, 아래 반응식에 따라 O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 효소적으로 변환하는, L-메티오닌 제조 방법에 관한 것으로서:
O-포스포-L-호모세린 + CH3-SH < = > L-메티오닌 + H3PO4
상기한 효소 변환은 O-포스포-L-호모세린 의존적인 메티오닌 신타제를 사용함으로써 달성된다.
기본적으로, 모든 O-포스포-L-호모세린 의존적인 메티오닌 신타제, 즉, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 능력을 가진 모든 단백질이 본 발명에 따른 방법에 채택될 수 있다. 본 발명은 최초로 이러한 활성을 발휘하는 단백질을 개시하며, 이러한 활성을 발휘하는 추가적인 단백질을 제조하는 방법을 제공한다. 특히, 본 발명은, O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환하는 능력을 본래 가지고 있지 않은 식물의 시스타티오닌 감마 신타제 (EC 2.5.1.48)에서 출발하여, 돌연변이 유발 및 선별을 통해 이러한 능력을 가진 변이체를 구축할 수 있다는 것을 개시한다.
O-포스포-L-호모세린 의존적인 메티오닌 신타제는 아래 본 발명에 따른 단백질 내용에서 추가로 설명될 것이며, 기술된 임의의 O-포스포-L-호모세린 의존적인 메티오닌 신타제가 본 발명에 따른 방법에 채택될 수 있다.
첨부된 실시예에서 명확하게 확인되는 바와 같이, 본 발명자들은 O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 능력을 나타내는 수종의 여러가지 단백질을 구축하는데 성공하였다. 이들 단백질의 서열들은 서열번호 6 - 29로 기재된다. 이들 단백질은, O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환시키는 능력이 본래 없는 식물성 시스타티오닌 감마 신타제 (EC 2.5.1.48)로부터, 실시예에 기술된 스크리닝 시스템으로 돌연변이 유발 및 선별함으로써, 구축한다.
아울러, 서열번호 6 - 29로 기재된 서열에서 시작하여, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 활성을 보유한 추가의 단백질을 제공하는 것도 가능하다. 예를 들어, 기질 O-포스포-L-호모세린 및/또는 기질 메탄티올에 대한 단백질의 친화성을 더욱 높이거나, 또는 추가로 후술하는 바와 같이 단백질의 다른 특성을 개선하는 것도 가능한 일이다. 따라서, 본 발명에 따른 방법에 대한 바람직한 구현예에서, O-포스포-L-호모세린과 메탄티올의 L-메티오닌과 H3PO4로의 효소적 변환은 아래 열거된 단백질로 이루어진 군으로부터 선택되는 단백질을 이용함으로써 달성된다:
(a)
서열번호 6-29 중 어느 하나로 표시되는 아미노산 서열을 포함하는 단백질; 및
(b)
서열번호 6-29 중 어느 하나와 60% 이상의 서열 동일성을 가지며, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성을 가진, 단백질.
O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성은, 예를 들어, 첨부된 실시예에 기술된 분석에 의해 평가할 수 있다. 이를 위해, 예를 들어, 메티오닌에 대한 영양요구 표현형을 가지고 있는 사카로마이세스 세레비지애 (S. cerevisiae)를 이용할 수 있다. 이러한 균주의 예는, 호모세린 트랜스-아세틸라제 및 호모시스테인 신타제 효소들이 제거되거나 또는 기능부전화된 균주이다. 바람직하게는, 이들 2가지 효소가 제거되거나 기능부전화 된다. 도 1에 도시된 바와 같이, 사카로마이세스 세레비지애는 O-아세틸-호모세린만을 이용해 호모시스테인을 합성한 다음 이를 메티오닌으로 변환한다. O-아세틸-호모세린의 합성을 담당하는 효소 호모세린 트랜스아세틸라제는 MET2 유전자에 의해 코딩되어 있다. MET2가 불활성화되면, 호모세린은 더이상 O-아세틸 호모세린으로 변환되지 못하고, 호모세린 플럭스 전체는 포스포호모세린 쪽으로 방향을 돌리게 된다. MET2 촉매화된 반응은 효모의 경우 O-아세틸 호모세린의 유일한 소스이기 때문에, MET2 유전자의 불활성화시 효모 균주는 엄격한 메티오닌 영양요구성 표현형을 띄게 된다. 그러나, 호모시스테인 (마지막 메티오닌 전구체)은 시스테인 (황전달 (transsulfuration) 경로를 통해) 또는 S-아데노실메티오닌의 재순환으로부터도 유래될 수 있다. 메티오닌이 전혀 합성될 수 없다는 것을 보장하기 위해서는, 호모시스테인과 메틸-테트라하이드로폴레이트로부터 메티오닌을 합성하는 역할을 하는 호모시스테인 메틸-트랜스퍼라제의 코딩 유전자, 즉 MET6도 또한 제거한다.
이에, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 단백질의 능력을 검정하기 위한 분석에서는, MET2 유전자 및/또는 MET6 유전자, 바람직하게는 둘다가 결손 또는 파괴된 사카로마이세스 세레비지애를 이용할 수 있다. 2중 met2Δ met6Δ 파괴 균주는 메티오닌이 없는 조건에서는 생장할 수 없으며, 특히 황 소스로서 메탄티올이 존재하는 조건에서도 생장할 수 없다. 이러한 균주는 더이상 O-아세틸 호모세린을 합성 못하지만 O-포스포-호모세린은 생산할 수 있다. 이 효모 균주에, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 능력에 대해 테스트할 단백질을 코딩하는 핵산을 형질전환시킬 수 있다. 이 균주는 유일한 황 소스로서 메탄티올을 함유한 배지에서/배지 상에서 배양하며, 상기 배지에서의 증식력은 발현되는 단백질이 O-포스포-L-호모세린 (OPHS)과 메탄티올을 L-메티오닌과 H3PO4로 변환시킬 수 있음을 의미한다. 더 바람직하게는, 트레오닌 신타제를 코딩하는 유전자가, 예를들어, 결손 또는 파괴에 의해 불활성화된 균주를 사용하는 것이다. met2Δ met6Δ 균주의 경우, THR1 유전자에 의해 코딩된 호모세린 키나제에 의해 촉매되는 반응을 통해 OPHS이 합성되지만, THR4 유전자에 의해 코딩된 트레오닌 신타제에 의해 트레오닌으로 활발히 변환되기 때문에 효과적으로 축적되지 못할 수 있다. 따라서, 이러한 3중 met2Δ met6Δ thr4Δ 돌연변이 균주는 매우 활성이 낮은 OPHS 의존적인 메티오닌 신타제를 검출할 수 있어, OPHS 의존적인 메티오닌 신타제 활성을 부여받은 새로운 단백질을 분리하는 1차 탐색 세포로서 사용된다.
또한, 이러한 효소 활성은, 검출할 단백질을 발현하는 효모 균주의 무세포성 추출물 또는 검출할 (부분) 정제된 단백질이 첨가된 적정 조건 하에 O-포스포-L-호모세린과 메탄티올을 인큐베이션하고, 내부 대조군으로서 C13 메티오닌을 이용한 액체크로마토그래피/질량 분광측정/질량 분광측정 (LC/MS/MS)을 통해 메티오닌의 생성을 검출하는, 시험관내 분석으로 더욱 검증할 수 있다 (Ravanel et al. Archives of Biochemistry and Biophysics 316 (1995), 572-584).
상기한 시험관내 분석에 기질로서 사용되는 O-포스포-L-호모세린은 예를 들어 도 2에 도시된 공정에 따라 제공될 수 있다 (Barclay et al., J. Chem. Soc, Chem. Com (1994) 815-816).
전술한 바와 같이, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성을 발휘하는 단백질의 예는, 서열번호 6-29 중 어느 하나로 기술된 아미노산 서열을 가지는 단백질이다. 즉, 바람직한 일 구현예에서, 본 발명에 따른 방법은 서열번호 6-29 중 어느 하나에 나타낸 바와 같은 아미노산 서열을 포함하는 단백질을 이용한다. 그러나, 이들 단백질의 변이체, 즉, 서열번호 6-29 중 어느 하나에 나타낸 서열과 서열 동일성이 높은 아미노산 서열을 포함하면서 O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성을 나타내는 단백질도, 물론 가능하다. 서열번호 6-29 중 어느 하나에 따른 서열에 대한 서열 동일성은 60% 이상, 바람직하게는 70% 이상, 더 바람직하게는 80% 이상, 85% 이상, 90% 이상 또는 95% 이상이며, 가장 바람직하게는 96% 이상, 97% 이상, 98% 이상 또는 99% 이상이다.
바람직하게는, 동일성 수준은 서열번호 6-29 중 임의의 하나로 기술된 아미노산 서열과 해당 서열을 비교함으로써 측정한다. 비교되는 서열들이 동일 길이를 가지지 않는 경우에는, 동일성 수준은 바람직하게는 긴 서열의 아미노산 잔기에 대한 짧은 서열에서의 동일한 아미노산 잔기의 퍼센트를, 또는 짧은 서열의 아미노산 잔기에 대한 긴 서열에서의 동일한 아미노산 잔기의 퍼센트를 나타낸다. 서열 동일성 수준은 바람직하게는 CLUSTAL 등의 적절한 컴퓨터 알고리즘을 이용하여 당해 기술 분야에 잘 알려진 방법에 따라 결정할 수 있다.
특정 서열이 기준 서열에 대해 예를 들어 동일성이 80%인지를 확인하기 위해 Clustal 분석 방법을 이용하는 경우, 디폴트 세팅을 사용하거나, 또는 세팅은 바람직하게는 다음과 같다: 아미노산 서열 비교시, 매트릭스: blosum 30; 오픈 갭 패널티 (Open gap penalty): 10.0; 연장 갭 패널티 (Extend gap penalty): 0.05; 딜레이 다이버젼트 (Delay divergent): 40; 갭 간격 (Gap separation distance): 8. 뉴클레오티드 서열 비교시, 연장 갭 패널티가 바람직하게는 5.0으로 설정된다.
바람직하게는, 동일성 수준은 서열 전체 길이에 대해 계산한다. 아울러, "상동성"이라는 용어가 본 발명의 내용에 사용된다면, 이 용어는 바람직하게는 "서열 동일성"을 의미하는 것이다.
또한, 본 발명에 따른 방법은 L-메티오닌으로부터 유래되는 기타 황 함유 화합물을 생산할 수 있다. 상기한 화합물의 예는 S-아데노실 메티오닌, 글루타티온, 시스테인, S-아데노실 호모시스테인, 메틸-티오-아데노신 및 2-옥소-4-메틸티오부타노에이트이다.
이에, 본 발명은, 또한, 전술한 본 발명에 따른 L-메티오닌의 제조 방법을 포함하며, L-메티오닌이 하기 반응에 따라 S-아데노실 메티오닌으로 더욱 변환되는, S-아데노실 메티오닌의 제조 방법에 관한 것이다:
메티오닌 + ATP => S-아데노실메티오닌 + PPi +Pi
이 효소 반응은 당해 기술 분야에 공지되어 있으며, 반응을 촉매하는 효소 역시 당해 기술 분야에 공지되어 있다. 이 효소를 S-아데노실메티오닌 신타제 (EC 2.5.1.6)라고 한다. 효모에서 이 효소에 해당되는 예가 SAM1과 SAM2이다. 따라서, 상기 방법을 유기체에서 수행하는 경우, 이 유기체는 바람직하게는 L-메티오닌을 S-아데노실 메티오닌을 변환시키는/변환시킬 수 있는 대응되는 효소(들)를 과다 발현한다.
또한, S-아데노실 메티오닌이 다른 대사 경로로 흘러가지 않도록 하기 위해 상기한 유기체를 더 변형시키는 것이 유익할 수 있다. 효모의 경우, 예를 들어, S-아데노실 메티오닌이 S-아데노실 호모시스테인으로 진행되는 유입율을 낮추기 위해 아데노신 키나제 활성 (효모의 경우 ADO1 유전자에 코딩된 EC 2.7.1.20)을 불활화하는 것이 유용할 수 있다.
아울러, 본 발명은 전술한 본 발명에 따른 L-메티오닌 제조 방법을 포함하며, L-메티오닌을 시스테인으로 추가로 변환시키는, 시스테인 제조 방법에 관한 것이다. L-메티오닌의 시스테인으로의 변환은 종래 기술 분야에 공지되어 있으며, 당업자에게 공지된 수단 및 방법을 통해 달성할 수 있다. 예를 들어, L-메티오닌을 일차로 S-아데노실 메티오닌으로 변환시킨 후, 하기 반응에 따라 S-아데노실 모호시스테인으로 변환한다:
S-아데노실메티오닌 + 메틸-어셉터 (acceptor) =>
S-아데노실호모시스테인 + 메틸화된 어셉터
상기 반응은 S-아데노실메티오닌-의존적인 메틸트랜스퍼라제에 의해 촉매된다.
그런 후, S-아데노실 호모시스테인을 하기 반응에 따라 L-호모시스테인으로 추가적으로 변환시킬 수 있다:
S-아데노실호모시스테인 <=> L-호모시스테인 + 아데노신
상기 반응은 S-아데노실호모시스테인 하이드롤라제, EC 3.3.1.1에 의해 촉매된다.
이후, L-호모시스테인은 하기 반응에 따라 L-시스타티오닌으로 변환시킬 수 있다:
L-호모시스테인 + L-세린 < = > L-시스타티오닌 +H20
상기 반응은 시스타티오닌 beta-신타제 (EC 4.2.1.22)에 의해 촉매된다.
마지막으로, L-시스타티오닌은 하기 반응에 따라 시스테인으로 변환된다:
L-시스타티오닌 + H20 < = > L-시스테인 + NH3 + 옥소부타노에이트
상기 반응은 시스타티오닌 감마 리아제 (EC 4.4.1.1)에 의해 촉매된다.
이 방법이 효모에서 수행된다면, 다음과 같은 유전자들이 과다발현되는 것이 좋다: SAM1, SAM2, SAH1, STR4 및 STR1. 아울러, 효모의 시스타티오닌 감마 신타제를 코딩하는 유전자 STR2는, 시스테인에서 호모시스테인으로의 역 합성을 줄이기 위해, 제거되어야 한다. 이와 같이, 효모는 유리하게는 메틸테트라하이드로폴레이트-의존적인 메티오닌 신타제를 무력하게 만드는 MET6 돌연변이 뿐만 아니라 주요 글루타티온 분해 경로에 참여하는 DUG2 유전자의 결손을 포함한다.
아울러, 본 발명은, 전술한 본 발명에 따른 L-메티오닌 제조 방법을 포함하며, L-메티오닌을 글루타티온으로 추가적으로 변환하는, 글루타티온 제조 방법에 관한 것이다. L-메티오닌의 글루타티온으로의 변환은 종래 기술 분야에 공지되어 있으며, 당업자에게 공지된 수단 및 방법으로 달성할 수 있다. 예를 들어, L-메티오닌을 먼저 S-아데노실 메티오닌으로 변환한 다음, 이를 전술한 바와 같이 시스테인으로 변환하고, 수득한 시스테인을 다시 하기 반응에 따라 Glu-Cys (감마-L-글루타밀-L-시스테인)으로 변환한다:
ATP + L-글루타메이트 + L-시스테인 < = > gamma-L-글루타밀-L-시스테인 + ADP + Pi
상기 반응은 글루타메이트 시스테인 리가제 (EC 6.3.2.2)에 의해 촉매된다.
제조된 Glu-Cys는 하기 반응에 따라 글루타티온으로 변환된다:
ATP + gamma-L-글루타밀-L-시스테인 + 글리신 = 글루타티온 + ADP + Pi
상기 반응은 글루타티온 신타제 (EC 6.3.2.3)에 의해 촉매된다.
이 방법이 효모에서 수행된다면, 효모는 시스테인 제조 방법과 관련한 전술한 바와 같이 조작하는 것이 바람직하며, 또한 효모는 시스테인을 글루타티온으로 변환하는데 참여하는 GSH1과 GSH2 유전자를 과다발현하여야 한다. 특히 바람직한 구현예에서, GSH1 유전자는 피드-백 내성 효소를 발현한다.
또한, 본 발명은, 전술한 본 발명에 따른 L-메티오닌 제조 방법을 포함하며, L-메티오닌이 하기 반응에 따라 2-옥소-4-메틸티오부타노에이트로 추가로 변환되는, 2-옥소-4-메틸티오부타노에이트 제조 방법에 관한 것이다:
메티오닌 + 2-옥소산 => 2-옥소-4-메틸티오부타노에이트 + L-아미노산
상기 효소 반응은 당해 기술 분야에 공지되어 있으며, 이 반응을 촉매하는 효소는 당해 기술 분야에 공지되어 있다. 이들 효소를 메티오닌 트랜스아미나제 (EC 2.6.1.88)라 한다. 효모에서 이에 해당되는 효소의 예는 ARO8, BAT1, BAT2이다. 따라서, 이 방법을 유기체에서 수행하는 경우, 이 유기체는 바람직하게는 L-메티오닌을 2-옥소-4-메틸티오부타노에이트로 변환하는/변환할 수 있는 해당 효소(들)을 과다발현한다.
2-옥소-4-메틸티오부타노에이트가 다른 대사 경로로 유입되는 것을 방지하기 위해, 유기체를 추가로 변형시키는 것이 유익할 수 있다. 효모의 경우, 예를 들어, 2-옥소-4-메틸티오부타노에이트가 3-(메틸티오)프로피온알데하이드으로 변환되는 공정에 유입되는 것을 낮추기 위해, 페닐피루베이트 데카르복실라제 활성 (EC 4.1.1.43, 효모의 경우 ARO10 유전자에 의해 코딩됨) 또는 피루베이트 데카르복실라제 활성 (EC 4.1.1.1, 효모의 경우 PDC1, PDC5 및 PDC6 유전자에 의해 코딩됨)을 불활화하는 것이 유용할 수 있다.
본 발명에 따른 방법은 시험관내 또는 생체내에서 수행할 수 있다. 시험관내 반응은 세포가 사용되지 않는 반응, 즉 무세포성 반응으로 이해된다. 이에, 시험관내는 바람직하게는 세포-결핍 시스템을 의미한다. 용어 "시험관내"는 일 구현예에서 분리된 효소가 존재하는 것을 의미한다. 일 구현예에서, 본 방법에 사용되는 효소는 정제된 형태로 사용된다.
시험관내 공정을 수행하기 위해서는, 효소가 작용하고 효소적 변환이 이루어질 수 있는 조건 (완충제, 온도 등) 하에 반응 기질 및 효소를 인큐베이션한다. 반응은 L-메티오닌 생산에 충분한 기간 동안 진행될 수 있다. L-메티오닌의 생산은 당해 기술 분야에 공지된 방법에 의해 측정할 수 있다.
효소는 효소적 반응이 이루어질 수 있는 임의의 적절한 형태를 취할 수 있다. 효소는, 정제되거나 또는 부분 정제될 수 있거나, 또는 세포 조추출물 또는 부분 정제된 추출물 형태일 수 있다. 또한, 효소는 적정 담체에 고정된 형태일 수도 있다.
다른 구현예에서, 본 발명에 따른 방법은 O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 능력을 가진 단백질을 생산하는 유기체, 바람직하게는 미생물의 존재 하에 배양 중에 수행된다. 이러한 단백질은 본원에 기술된 단백질이다.
이러한 방법에 사용되는 유기체는 바람직하게는 본원에 기술된 본 발명에 따른 숙주 세포이다.
또한, 본 발명은 O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환하는 능력을 가진 단백질에 관한 것이다. 본 발명에서는, 이런 효소를 OPHS 의존적인 메티오닌 신타제로 언급한다. 전술한 바와 같이, 지금까지 O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환하는 능력을 가진 단백질이 자연에 존재한다는 보고는 없었으며, 본 발명에서 최초로 전술한 본 발명의 방법에 따라 L-메티오닌을 생산할 수 있는 단백질을 제공하는 것이다.
바람직한 구현예에서, O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환하는 능력을 가진 본 발명에 따른 단백질은 돌연변이 유발에 의해 시스타티오닌 감마 신타제 (EC 2.5.1.48)로부터 유래된 것이다. 상기한 돌연변이 유발은, 시스타티오닌 감마 신타제 (EC 2.5.1.48)의 아미노산 서열에서의, 하나 이상의 아미노산 잔기의 치환 및/또는 하나 이상의 아미노산 잔기의 결손, 및/또는 하나 이상의 아미노산 잔기의 부가일 수 있다.
다양한 유기체들에서 시스타티오닌 감마 신타제가 알려져 있으며, 개시되어 있다. 예를 들어, 식물의 경우, 특히, 아라비돕스 탈리아나 (A. thaliana), 니코티나 타바쿰 (Nicotiana tabacum), 트리티쿰 아에스티붐 (Triticum aestivum), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 렘나 파우시코스타타 (Lemna paucicostata), 솔라눔 투베로섬 (Solanum tuberosum), 스피나시아 올레라시아 (Spinacia oleracea), 아스트라갈러스 라세모수스 (Astragalus racemosus), 아스트라갈루스 비설카투스 (Astragalus bisulcatus), 아스트라갈루스 시니쿠스 (Astragalus sinicus) 및 넵투니아 암플렉시카울리스 (Neptunia amplexicaulis)에서 350건 이상의 시스타티오닌 감마 신타제 서열들이 공지되어 있다.
시스타티오닌 감마 신타제는 또한 박테리아와 진균에서도 공지되어 있다. 박테리아의 경우 22,000개 이상의 서열이 개시되어 있으며, 박테리아 또는 진균 서열의 예는, 사카로마이세스 세레비지애 (Saccharomyces cerevisiae), 뉴로스포라 크라사 (Neurospora crassa), 살모넬라 에르테리카 (Salmonella erterica), 에스케리키아 콜라이 (Escherichia coli), 아그로박테리움 투메팍시엔스 (Agrobacterium tumefaciens), 알칼리게네스 패칼리스 (Alcaligenes faecalis), 아누리니바실러스 아누리닐라이티쿠스 (Aneurinibacillus aneurinilyticus), 바실러스 푸미우스 (Bacillus pumius), 바실러스 섭틸리스 (Bacillus subtilis), 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 헬리코박터 필로리 (Helicobacter pylori), 라이시니바실러스 스페리쿠스 (Lysinibacillus sphaericus), 미코박테리움 투베르쿨로시스 (Mycobacterium tuberculosis), 펙토박테리움 카로토보룸 (Pectobacterium carotovorum), 슈도모나스 다쿤헤 (Pseudomonas dacunhae), 슈도모나스 푸티다 (Pseudomonas putida), 스트렙토마이세스 패오크로모게네스 (Streptomyces phaeochromogenes) 유래의 서열이다.
포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 활성을 발휘하는 단백질을 제공하는 방법은 첨부된 실시예에서 설명되며, 이는 아래에서 더욱 상세히 기술될 것이다. 기본적으로, 임의의 시스타티오닌 감마 신타제 (EC 2.5.1.48)를 포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 활성을 발휘하는 단백질을 제공하기 위한 출발 물질로서 사용할 수 있다. 시스타티오닌 감마 신타제 (EC 2.5.1.48)로부터 유래된, 포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 활성을 발휘하는 단백질은, 천연 시스타티오닌 감마 신타제의 아미노산 서열과 70% 이상, 바람직하게는 80% 이상, 더 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 서열 동일성을 가진다.
바람직한 일 구현예에서, OPHS 의존적인 메티오닌 신타제의 기원이 되는 시스타티오닌 감마 신타제 (EC 2.5.1.48)는 식물의 시스타티오닌 감마 신타제 (EC 2.5.1.48), 바람직하게는 아라비돕시스 탈리아나의 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1, 가장 바람직하게는 서열번호 1의 아미노산 서열을 가진 시스타티오닌 감마 신타제 (EC 2.5.1.48)이다. 더 바람직한 구현예에서, 본 발명에 따른 방법에 사용되는 OPHS 의존적인 메티오닌 신타제는 서열번호 2에 기재된 서열로부터 유래된다. 이 서열은 서열번호 1에 대응되지만, 84번 위치의 글리신 잔기가 세린 잔기로 치환된 것이다. 이런 치환, 즉 mto 돌연변이는 S-아데노실메티오닌에 의해 CGS1에 발휘되는 번역 후 억제를 완화한다 (Onoue et al. Journal of Biological Chemistry 286 (2011), 14903-14911). 특히 바람직한 구현예에서, 본 발명에 따른 방법에 사용되는 OPHS 의존적인 메티오닌 신타제는 서열번호 3에 기재된 서열로부터 유래된다. 이 서열은, 아미노 말단에 위치한 엽록체 타겟팅 서열 (1-57의 아미노산 잔기들)이 제거되고, 메티오닌 잔기가 N-말단에 부가된 것을 제외하고는, 서열번호 2와 동일하다.
본 발명에 따른 방법에 사용가능한 OPHS 의존적인 메티오닌 신타제의 예는 다음과 같다:
(i) 서열번호 3에서 하기 잔기로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 잔기가 치환 또는 결손됨으로써, 서열번호 3으로 나타낸 아미노산 서열을 가진 시스타티오닌 감마 신타제로부터 유래된, OPHS 의존적인 메티오닌 신타제:
(a)
프롤린 10;
(b)
아스파라긴 11;
(c)
글루타민 15;
(d)
이소루신 27;
(e)
알라닌 30;
(f)
루신 45;
(g)
세린 47;
(h)
발린 60;
(i)
알라닌 68;
(j)
페닐알라닌 150;
(k)
트레오닌 178;
(l)
아스파르테이트 183;
(m)
이소루신 185;
(n)
트레오닌 220;
(o)
메티오닌 232;
(p)
발린 245;
(q)
알라닌 257;
(r)
아스파라긴 259;
(s)
페닐알라닌 261;
(t)
페닐알라닌 275;
(u)
이소루신 287;
(v)
히스티딘 289;
(w)
티로신 324;
(x)
글리신 326;
(y)
프롤린 356;
(z)
트레오닌 371;
(aa)
발린 396;
(bb)
프롤린 405;
(cc)
아스파르테이트 431;
(dd)
이소루신 436;
(ee)
이소루신 457;
(ff)
아스파르테이트 459;
(gg)
프롤린 470;
(hh)
글루타메이트 472;
(ii)
알라닌 506;
(jj)
이소루신 507.
또는
(ii) 서열번호 3에서 상기 열거된 (a) - (jj) 중 임의의 하나에 해당되는 하나 이상의 아미노산 잔기가 치환 또는 결손됨으로써, 서열번호 3으로 나타낸 아미노산 서열과의 서열 동일성이 60% 이상인 아미노산 서열을 가지는, 시스타티오닌 감마 신타제로부터 유래된 OPHS 의존적인 메티오닌 신타제. 바람직하게는, 서열 동일성은 70% 이상, 바람직하게는 80% 이상, 가장 바람직하게는 90% 이상이다.
용어 "치환"은 지정된 위치에 존재하는 아미노산이 다른 아미노산 잔기로 치환되는 것을 의미한다. 본 발명에서, "다른 아미노산 잔기들로 치환된다"는 것은, 지정된 위치에 존재하는 각 아미노산 잔기들이 임의의 다른 가능한 아미노산 잔기들로, 바람직하게는, 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 이소루신, 루신, 라이신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신 및 발린으로 이루어진 군으로부터 선택되는 아미노산 잔기로 치환될 수 있다는 것을 의미한다. 특정 위치에 대한 바람직한 치환은 아래에 언급된다.
서열번호 3에 기재된 아미노산 서열에서 전술한 (a) - (jj) 위치들로 이루어진 군으로부터 선택되는 위치에 해당되는 위치에 존재하는 아미노산 잔기들은, 당해 기술 분야에 공지된 방법에 의해 당업자들이 파악할 수 있다. 예를 들어, 이러한 아미노산 잔기들은 서열번호 3에 나타낸 서열과 대상 서열을 정렬하고, 서열번호 3의 지정된 위치에 해당되는 위치를 찾음으로써, 파악할 수 있다. 정렬은, 예를 들어, Lipman-Pearson 방법 (Science 227 (1985), 1435) 또는 CLUSTAL 알고리즘 등의 공지된 컴퓨터 알고리즘을 이용함으로써, 당업자에게 공지된 수단 및 방법으로 행할 수 있다. 이러한 정렬시, 아미노산 서열에 존재하는 보존된 아미노산 서열에 최대 상동성이 할당되도록 하는 것이 바람직하다.
아미노산 서열에서 발생하는 삽입 또는 결손과 무관하게 아미노산 서열을 이런 방법을 이용하여 정렬하는 경우, 대응되는 아미노산 잔기의 위치는 주어진 서열에서 정해질 수 있다.
일 구현예에서, 본 발명의 OPHS 의존적인 메티오닌 신타제는, 하기로 특정되는 아미노산 서열을 가진다:
(i) 서열번호 3에 기재된 아미노산 서열에서 10번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 루신으로 치환됨; 및/또는
(ii) 서열번호 3에 기재된 아미노산 서열에서 11번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 아스파르테이트로 치환됨; 및/또는
(iii) 서열번호 3에 기재된 아미노산 서열에서 15번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 아르기닌으로 치환됨; 및/또는
(iv) 서열번호 3에 기재된 아미노산 서열에서 27번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 세린으로 치환됨; 및/또는
(v) 서열번호 3에 기재된 아미노산 서열에서 30번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 트레오닌으로 치환됨; 및/또는
(vi) 서열번호 3에 기재된 아미노산 서열에서 45번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 세린으로 치환됨; 및/또는
(vii) 서열번호 3에 기재된 아미노산 서열에서 47번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 트레오닌으로 치환됨; 및/또는
(viii) 서열번호 3에 기재된 아미노산 서열에서 60번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 아스파르테이트로 치환됨; 및/또는
(ix) 서열번호 3에 기재된 아미노산 서열에서 68번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 트레오닌으로 치환됨; 및/또는
(x) 서열번호 3에 기재된 아미노산 서열에서 150번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 루신으로 치환됨; 및/또는
(xi) 서열번호 3에 기재된 아미노산 서열에서 178번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 이소루신으로 치환됨; 및/또는
(xii) 서열번호 3에 기재된 아미노산 서열에서 183번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 글루타메이트로 치환됨; 및/또는
(xiii) 서열번호 3에 기재된 아미노산 서열에서 185번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 발린으로 치환됨; 및/또는
(xiv) 서열번호 3에 기재된 아미노산 서열에서 220번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 세린으로 치환됨; 및/또는
(xv) 서열번호 3에 기재된 아미노산 서열에서 232번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 루신으로 치환됨; 및/또는
(xvi) 서열번호 3에 기재된 아미노산 서열에서 245번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 알라닌으로 치환됨; 및/또는
(xvii) 서열번호 3에 기재된 아미노산 서열에서 257번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 트레오닌으로 치환됨; 및/또는
(xviiii) 서열번호 3에 기재된 아미노산 서열에서 259번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 아스파르테이트 또는 세린으로 치환됨; 및/또는
(xiv) 서열번호 3에 기재된 아미노산 서열에서 261번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 세린으로 치환됨; 및/또는
(xx) 서열번호 3에 기재된 아미노산 서열에서 275번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 루신으로 치환됨; 및/또는
(xxi) 서열번호 3에 기재된 아미노산 서열에서 287번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 발린 또는 페닐알라닌으로 치환됨; 및/또는
(xxii) 서열번호 3에 기재된 아미노산 서열에서 289번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 티로신 또는 아르기닌으로 치환됨; 및/또는
(xxiii) 서열번호 3에 기재된 아미노산 서열에서 324번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 페닐알라닌으로 치환됨; 및/또는
(xxiv) 서열번호 3에 기재된 아미노산 서열에서 326번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 세린으로 치환됨; 및/또는
(xxv) 서열번호 3에 기재된 아미노산 서열에서 356번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 트레오닌으로 치환됨; 및/또는
(xxvi) 서열번호 3에 기재된 아미노산 서열에서 371번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 알라닌으로 치환됨; 및/또는
(xxvii) 서열번호 3에 기재된 아미노산 서열에서 396번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 알라닌으로 치환됨; 및/또는
(xxviii) 서열번호 3에 기재된 아미노산 서열에서 405번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 세린으로 치환됨; 및/또는
(xxix) 서열번호 3에 기재된 아미노산 서열에서 431번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 글리신으로 치환됨; 및/또는
(xxx) 서열번호 3에 기재된 아미노산 서열에서 436번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 트레오닌으로 치환됨; 및/또는
(xxxi) 서열번호 3에 기재된 아미노산 서열에서 457번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 루신으로 치환됨; 및/또는
(xxxii) 서열번호 3에 기재된 아미노산 서열에서 459번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 아스파라긴으로 치환됨; 및/또는
(xxxiii) 서열번호 3에 기재된 아미노산 서열에서 470번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 세린으로 치환됨; 및/또는
(xxxiv) 서열번호 3에 기재된 아미노산 서열에서 472번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 글리신으로 치환됨; 및/또는
(xxxv) 서열번호 3에 기재된 아미노산 서열에서 506번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 글리신으로 치환됨; 및/또는
(xxxvi) 서열번호 3에 기재된 아미노산 서열에서 507번 위치의 아미노산 잔기 또는 이 위치에 대응되는 위치의 아미노산 잔기가 발린으로 치환됨.
또한, 본 발명은, 전술한 (i) - (xxxvi)로 정의되는 변이체에 관한 것으로서, 서열번호 3의 위치에 존재하는 아미노산 잔기를 치환하는 것으로서 표시된 아미노산 잔기는, 특별한 아미노산 잔기가 아니라 언급된 치환 아미노산과 보존적인 아미노산 잔기이다.
아미노산이 다른 아미노산과 보존적인지는 당해 기술 분야에 공지된 방법과 수단으로 판단할 수 있다. 한가지 방법은 PAM 250 매트릭스이며; 다른 예로, Blosum Family Matrices를 이용할 수 있다.
일 구현예에서, 본 발명은, 서열번호 3에 기재된 아미노산 서열, 또는 서열번호 3에 기재된 아미노산 서열에서 356번 위치 또는 이 위치에 대응되는 위치의 아미노산 잔기가 다른 아미노산 잔기로 치환된, 서열번호 3과 60% 이상의 서열 동일성을 가지는 아미노산 서열을 가진, OPHS 의존적인 메티오닌 신타제에 관한 것이다. 바람직한 구현예에서, 본 발명은, 10, 11, 15, 27, 28, 30, 32, 45, 47, 60, 68, 104, 150, 178, 183, 185, 220, 232, 245, 257, 259, 261, 275, 287, 289, 324, 326, 371, 396, 405, 431, 436, 457, 459, 470, 472, 506 및 507번 위치들로 이루어진 군으로부터 선택되는, 바람직하게는 10, 11, 15, 30, 32, 45, 47, 68, 104, 150, 178, 183, 185, 220, 232, 245, 257, 259, 261, 275, 287, 289, 326, 371, 396, 405, 431, 436, 459, 470, 472, 506 및 507번 위치들로 이루어진 군으로부터 선택되는, 보다 더 바람직하게는 275 및 396번 잔기들로 이루어진 군으로부터 선택되는 위치에서, 하나 이상의 다른 아미노산이 치환된, 단백질에 관한 것이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 다음과 같다:
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 10, 27, 60, 324 및 457번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 32, 287, 289 및 356번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 10, 232, 245, 259, 356, 431 및 436번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 11, 15, 30, 45, 47, 68, 178, 356, 371 및 459번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 32 및 356번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 32, 60, 324 및 457번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 32, 287, 289 및 356번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 32, 232, 245, 259, 356, 431 및 436번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 32, 45, 47, 68, 178, 356, 371 및 459번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 232, 245, 259, 356, 431 및 436번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 178, 356, 371 및 459번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 150, 257, 259, 261, 275, 289, 356 및 506번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 185, 356 및 405번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 275, 356, 396 및 472번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 275, 326, 356 및 396번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 220, 275, 356 및 396번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 183, 275, 356, 396 및 507번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 275, 287, 356, 396 및 507번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 275, 356, 396 및 470번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 275, 356 및 507번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 275, 356 및 396번 위치이다.
일 구현예에서, 치환 및/또는 결손이 발생되는 위치는 275, 287 및 356번 위치이다.
이들 위치들에서의 바람직한 치환은 전술한 바와 같다.
본 발명에 따른 방법에 사용될 수 있는 OPHS 의존적인 메티오닌 신타제는 또한 서열번호 3에 기재된 아미노산 서열에서 1-103번 아미노산들에 해당되는 하나 이상의 N-말단 아미노산을 결손시킴으로써, 전술한 임의의 OPHS 의존적인 메티오닌 신타제로부터 유래될 수 있는 효소이다. 실시예들에 기술된 바와 같이, 또한 전술한 OPHS 의존적인 메티오닌 신타제의 절단된 형태 (truncated form), 예컨대 서열번호 3과 비교해 아미노산 잔기 31 또는 아미노산 103이 N-말단에서 결손된 절단된 형태 역시 효과적인 OPHS 의존적인 메티오닌 신타제 활성을 발휘한다.
바람직한 일 구현예에서, 본 발명에 따른 OPHS 의존적인 메티오닌 신타제는 또한 O-포스포-L-호모세린과 설파이드를 L-호모시스테인 + H3PO4로 변환하는 효소 활성을 나타낸다. 바람직하게는, 상기 설파이드는 Na2S 등의 금속 설파이드이다. 이 경우, 변환은 하기 반응식에 따라 이루어진다:
O-포스포-L-호모세린 + Na2S < = > L-호모시스테인 + H3PO4
O-포스포-L-호모세린 (OPHS)과 금속 설파이드를 L-호모시스테인 및 H3PO4로 변환하는 활성은, O-포스포-L-호모세린 (OPHS)과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 활성을 검출하는 것과 관련하여 전술된 바와 기본적으로 동일한 분석으로 검출할 수 있다. 이 경우, 이중 met2Δ met25Δ 효모 균주가 사용되며, 단독 설페이트 소스로서 Na2S가 첨가된 배지에서 배양한다. 실제 MET25는 효모에서 공지된 유일한 공지된 호모시스테인 신타제 활성을 코딩하며, O-아세틸-L-호모세린과 설파이드를 축합하는 과정을 촉매한다. 분석의 민감도는, 이중 met2 met25 돌연변이 외에도, O-포스포-L-호모세린 축적을 유도하는 thr4 돌연변이를 포함하도록 조작된 사카로마이세스 세레비지애 균주를 이용함으로써, 쉽게 개선시킬 수 있다.
이러한 효소 활성은, 또한, O-포스포-L-호모세린과 Na2S를 검사할 단백질을 발현하는 효모 균주로부터 유래된 무세포성 추출물 또는 검사할 (일부) 정제된 단백질이 첨가된 적정 조건 하에 인큐베이션하고, 호모시스테인의 생산은 비색계 방법으로 검출하는, 시험관내 분석으로 추가로 검증할 수 있다 (Becker et al., Journal of Biochemical Chemistry 244(1969), 2418).
또한, 본 발명은 본 발명에 따른 단백질을 코딩하는 핵산 분자에 관한 것이다. 핵산 분자는 DNA 또는 RNA일 수 있으며, 바람직하게는 DNA이다.
아울러, 본 발명은 본 발명에 따른 핵산 분자를 포함하는 벡터에 관한 것이다. 바람직한 구현예에서, 벡터는 본 발명에 따른 단백질의 생산을 허용하기 위해 본 발명에 따른 핵산의 발현을 허용하는 벡터이다. 즉, 바람직한 구현예에서, 본 발명에 따른 핵산은 바람직한 숙주 세포 또는 숙주 세포 시스템에서 발현을 허용하는 조절 서열의 발현과 작동가능하게 연결된다. 본 명세서 전체에서 사용되는 "작용가능하게 연결된다" 또는 "작동가능하게 연결된다"라는 용어는 발현 조절 서열에 적합한 조건 하에 발현이 달성되는 방식으로 발현되게 하는 핵산 분자에서 하나 이상의 발현 조절 서열과 코딩 영역 간의 연결을 지칭한다.
발현은 이종의 DNA 서열을, 바람직하게는 번역가능한 mRNA로의 전사를 포함한다. 식물 세포, 동물 세포 및 진균 뿐만 아니라 박테리아에서 발현을 보장하는 조절 인자들이 당해 기술 분야의 당업자들에게 잘 알려져 있다. 이러한 것으로는 프로모터, 인핸서, 종결신호, 타겟팅 신호 등을 포괄한다. 그 예는 벡터에 대한 상세한 설명과 연계하여 아래에서 추가로 제공된다.
핵산 분자와 연결하여 사용하기 위한 프로모터는 이의 오리진 및/또는 발현시킬 유전자에 대해 동종 또는 이종일 수 있다. 적합한 프로모터로는, 예를 들어, 그 자신을 구성적인 발현 (constitutive expression)이 되게 하는 프로모터이다. 그러나, 외부 영향에 의해 측정하는 지점에만 활성화되는 프로모터를 사용할 수도 있다. 인공 및/또는 화학적 유도성 프로모터도 이러한 상황에 사용할 수 있다.
본 발명에 따른 벡터는 O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환시킬 수 있는 단백질을 발현 및 생산하도록 (마이크로)유기체에 도입시킬 수 있다.
여러가지 발현 시스템에 대한 개괄은 예를 들어 Methods in Enzymology 153 (1987), 385-516, in Bitter et al. (Methods in Enzymology 153 (1987), 516-544) and in Sawers et al. (Applied Microbiology and Biotechnology 46 (1996), 1-9), Billman-Jacobe (Current Opinion in Biotechnology 7 (1996), 500-4), Hockney (Trends in Biotechnology 12 (1994), 456-463), Griffiths et al., (Methods in Molecular Biology 75 (1997), 427-440)에 기술되어 있다. 효모 발현 시스템에 대한 개괄은 예를 들어 Hensing et al. (Antonie van Leuwenhoek 67 (1995), 261-279), Bussineau et al. (Developments in Biological Standardization 83 (1994), 13-19), Gellissen et al. (Antonie van Leuwenhoek 62 (1992), 79-93, Fleer (Current Opinion in Biotechnology 3 (1992), 486-496), Vedvick (Current Opinion in Biotechnology 2 (1991), 742-745) 및 Buckholz (Bio/Technology 9 (1991), 1067-1072)에 기술되어 있다.
발현 벡터는 문헌에 널리 기술되어 있다. 일반적으로, 발현 벡터는 선택 마커 유전자와 선택한 숙주에서의 복제를 보장하는 복제-오리진 뿐만 아니라 박테리아 또는 바이러스 프로모터를 포함하며, 대부분의 경우에는 전사 종결 신호도 포함한다. 프로모터와 종결 신호 사이에, 일반적으로 코딩 DNA 서열을 삽입하기 위한 하나 이상의 제한 부위 또는 폴리링커가 존재한다. 선택한 숙주 유기체에서 활성인 경우에는, 해당 유전자의 전사를 본래 조절하는 DNA 서열을 프로모터 서열로서 사용할 수 있다. 그러나, 이 서열은 다른 프로모터 서열로 치환될 수도 있다. 유전자의 구성적인 발현을 보장하는 프로모터와 유전자의 발현을 의도적으로 조절할 수 있는 유도성 프로모터를 이용하는 것도 가능하다. 이러한 특성을 가진 박테리아 프로모터 서열 및 바이러스 프로모터 서열들은 문헌에 상세히 기술되어 있다. 미생물 (예, E. coli, S. cerevisiae)에서의 발현 조절 서열 발현도 문헌에 자세히 기술되어 있다. 하류 서열의 특히 높은 수준의 발현을 허용하는 프로모터로는, 예컨대 T7 프로모터 (Studier et al., Methods in Enzymology 185 (1990), 60-89), lacUV5, trp, trp-lacUV5 (DeBoer et al., in Rodriguez and Chamberlin (Eds), Promoter, Structure and Function; Praeger, New York, (1982), 462-481; DeBoer et al., Proc. Natl. Acad. Sci. USA (1983), 21-25), lp1, rac (Boros et al., Gene 42 (1986), 97-100)를 포함한다. 유도성 프로모터는, 바람직하게는, 폴리펩타이드의 합성에 사용된다. 이들 프로모터는 대개 구성적인 프로모터 보다 폴리펩타이드의 수율을 더 높인다. 폴리펩타이드를 최적량으로 수득하기 위해, 2단계 공정이 보통 사용된다. 먼저, 숙주 세포를 최적 조건 하에 비교적 고 세포 밀도로 배양한다. 두번째 단계에서는, 사용되는 프로모터의 타입에 따라 전사를 유도한다. 이와 관련하여, tac 프로모터는 특히 락토스 또는 IPTG (=이소프로필-β-D-티오갈락토피라노사이드)에 의해 유도될 수 있어 특히 적합하다 (deBoer et al., Proc. Natl. Acad. Sci. USA 80 (1983), 21-25). 전사 종결 신호 역시 문헌에 기술되어 있다.
숙주 세포를 본 발명에 따른 폴리뉴클레오티드 또는 벡터로 형질전환하는 것은, 예를 들어 Sambrook 및 Russell (2001), Molecular Cloning: A Laboratory Manual, CSH Press, Cold Spring Harbor, NY, USA; Methods in Yeast Genetics, A Laboratory Course Manual, Cold Spring Harbor Laboratory Press, 1990에 기술된 바와 같이, 표준 방법으로 수행할 수 있다. 숙주 세포는 사용되는 구체적인 숙주 세포의 요건, 특히 pH 값, 온도, 염 농도, 호기, 항생제, 비타민, 미량 원소 등을 충족시키는 영양분 배지에서 배양한다.
또한, 본 발명은 본 발명에 따른 핵산 분자 또는 벡터를 포함하거나/형질전환된 숙주 세포에 관한 것이다. 바람직한 구현예에서, 이러한 숙주 세포는 본 발명에 따른 단백질을 발현하며, O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환할 수 있다. 기본적으로, 숙주 세포는 임의의 인지가능한 숙주 세포, 예컨대, 동물 세포, 식물 세포, 진균 세포 또는 박테리아 세포일 수 있다. 바람직한 구현예에서, 숙주 세포는 박테리아 세포 또는 진균 세포이다. 특히 바람직한 구현예에서, 숙주 세포는, 박테리아 세포, 예를 들어, 에스케리키아, 코리네박테리움, 클로스트리듐, 바실러스 또는 액시네토박터 속의 박테리아 세포이며, 더 바람직하게는 에스케리키아 콜라이 (E. coli), 코리네박테리움 글루타미컴 (Corynebacterium glutamicum), 바실러스 섭틸리스 (Bacillus subtilis) 또는 액시테노박터 빌란디 (Acinetobacter villandi) 종이다.
다른 바람직한 구현예에서, 숙주 세포는 진균 세포, 예컨대, 사카로마이세스, 칸디다, 아시비야, 클루베로마이세스, 피키아, 야로이와, 지고사카로마이세스, 아스퍼질러스, 데바리오마이세스 또는 토룰롭시스 속의 진균 세포, 더 바람직하게는 사카로마이세스 세레비지애 (S. cerevisiae), 사카로마이세스 막시무스 (Saccharomyces maximus), 칸디다 말토사 (Candida maltosa), 아시비야 고십피 (Ashbya gossypii), 클루베로마이세스 락티스 (Kluveromyces lactis), 피키아 패스토리스 (Pichia pastoris), 피키아 스티비티스 (Pichia stipitis), 야로이와 리폴리티카 (Yarrowia lipolitica), 아스퍼질러스 나이거 (Aspergillus niger), 아스퍼질러스 니둘란스 (Aspergillus nidullans), 데바리오마이세스 한센이 (Debaryomyces hansenii) 또는 톨룰롭시스 유틸리스 (Torulopsis utilis) 종이다. 특히 바람직한 구현예에서, 숙주 세포는 효모 세포이다.
전술한 바와 같이, 본 발명은, O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환할 수 있는 단백질을 코딩하는 핵산 분자의 제조 방법에 관한 것이다. 이러한 방법은 하기 단계를 포함한다:
(i)
돌연변이된 시스타티오닌 감마 신타제를 생산하기 위해, 시스타티오닌 감마 신타제 (EC 2.5.1.48)를 코딩하는 핵산 분자에 돌연변이를 유발하는 단계;
(ii)
(i) 단계에서 수득한 돌연변이된 핵산 분자를 숙주 세포에서 O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환할 수 있는 단백질을 코딩하는 핵산 분자를 선별할 수 있는 배양 조건 하에 발현하는 단계;
(iii)
O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환할 수 있는 단백질을 발현하는 숙주 세포를 동정하는 단계; 및
(iv)
단계 (iii)에서 동정한 숙주 세포로부터 O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환할 수 있는 돌연변이된 시스타티오닌 감마 신타제를 코딩하는 핵산 분자를 수득하는 단계.
또한, 본 발명은, 본 발명에 따른 전술한 방법에 따라 수득되는 핵산 분자를 발현하는 단계 및 코딩된 단백질을 회수하는 단계를 포함하는, O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환할 수 있는 단백질의 제조 방법에 관한 것이다.
용어 "시스타티오닌 감마 신타제 (EC 2.5.1.48)"는 시스타티오닌 감마 신타제의 효소 활성을 가진 임의의 효소를 지칭한다. 시스타티오닌 감마 신타제는 하기 반응을 촉매하는 효소이다:
이 활성은 당해 기술 분야에 공지된 방법에 의해 측정할 수 있다 (Ravanel, Biochem. J. 331 (1998), 639-648).
본 발명에 따른 전술한 방법에서 단계 (i)에서, 돌연변이된 시스타티오닌 감마 신타제를 생산하기 위해 시스타티오닌 감마 신타제를 코딩하는 핵산 분자의 돌연변이된 버전을 제조한다. 핵산 분자의 돌연변이 유발 방법은 당해 기술 분야의 당업자에 널리 공지되어 있다. 즉, 분자 생물에서 공통적으로 사용되는 방법에 의해 여러가지 타입의 돌연변이를 핵산 분자에 삽입하여 (예, Sambrook and Russell (2001), Molecular Cloning: A Laboratory Manual, CSH Press, Cold Spring Harbor, NY, USA), 출발 서열과 비교해 변형된 아미노산 서열을 가진 시스타티오닌 감마 신타제의 합성을 유도한다. 기본적으로, 핵산 분자 수준에서의 임의 타입의 돌연변이는 결손, 부가 및/또는 치환과 같이 인지가능하다. 바람직한 구현예에서, 핵산에 실시되는 돌연변이는 아미노산 서열 수준에서의 아미노산의 치환을 유도한다.
핵산 분자 당 오직 1개의 돌연변이를 수행할 수 있지만, 물론 핵산 분자에 하나 이상의 돌연변이를 수행하여, 아미노산 수준에서 하나 이상의 돌연변이를 만들 수 있다. 원칙적으로 돌연변이의 수에는 상한이 없다. 그러나, 돌연변이된 핵산 분자는 전술한 방법의 단계 (i)에서 사용된 시스타티오닌 감마 신타제를 코딩하는 출발 신호와 60% 이상, 바람직하게는 70% 이상, 더 바람직하게는 80%, 특히 바람직하게는 90%, 가장 바람직하게는 95% 이상의 서열 동일성을 가지는 것이 바람직하다.
바람직한 구현예에서, 상기 방법의 단계 (i)에서 수득되는 돌연변이된 핵산 분자는, 출발 핵산 분자에 의해 코딩되는 시스타티오닌 감마 신타제와 비교하여, 아미노산 잔기들에서 20개 보다 많지 않은, 바람직하게는 15개 보다 많지 않은, 더 바람직하게는 10개 보다 많지 않은, 특히 바람직하게는 5개 보다 많지 않은 수의 변화를 나타내는, 시스타티오닌 감마 신타제의 돌연변이된 버전을 코딩한다.
본 발명에 따른 방법의 단계 (i)에서, 용어 "시스타티오닌 감마 신타제 (EC 2.5.1.48)를 코딩하는 핵산 분자"는 전술한 바와 같은 시스타티오닌 감마 신타제의 효소 활성을 가진 단백질을 코딩하는 핵산 분자를 지칭한다. 기본적으로, 이러한 효소를 코딩하는 임의의 핵산 분자는 출발 물질로서 본 발명에 따른 방법에 사용될 수 있다. 시스타티오닌 감마 신타제와 이의 천연 발생은 상기에 상세히 기술되어 있다. 이들 시스타티오닌 감마 신타제 중 임의의 것을 코딩하는 임의 핵산은, 본 발명에 따른 방법의 단계 (i)에서 사용할 수 있다. 바람직한 구현예에서, 단계 (i)에서 사용되는 핵산 분자는 식물의 시스타티오닌 감마 신타제를 코딩하는 핵산 분자이다. 보다 더 바람직하게는, 시스타티오닌 감마 신타제는 아라비돕시스 탈리아나 (A. thaliana) 유래의 것이며, 바람직하게는 서열번호 1에 나타낸 바와 같이 아라비돕시스 탈리아나의 시스타티오닌 감마 신타제를 코딩하는 뉴클레오티드 서열이다.
단계 (i)에 사용되는 핵산 분자의 뉴클레오티드 서열은 단계 (ii)에서 사용되는 숙주 세포에 사용하도록 개조될 수 있다. 예를 들어, 사용된 숙주 세포의 번역 장치 (translation machinery)의 코돈 용법에 더 가까워지도록 코돈 용법에 변화를 가할 수 있다. 즉, 핵산 분자는 단계 (ii)에서 사용된 숙주 세포와 관련하여 최적화된 코돈 용법을 나타내도록 변형시킬 수 있다.
아울러, 본 발명에 따른 방법을 위해 식물의 시스타티오닌 감마 신타제를 코딩하는 핵산 분자 등의 특정 핵산 분자를 개조하기 위해, 다른 변형이 필수적이거나 또는 바람직할 수 있다. 예를 들어, 식물의 시스타티오닌 감마 신타제는 일반적으로 아미노 말단에 단백질을 엽록체로 가게 하는 엽록체 타겟팅 서열을 포함한다. 단계 (ii)에 사용되는 숙주 세포에 따라, 이 타겟 서열을 제거하는 것이 필요하거나 바람직할 수 있다. 예를 들어, 단계 (i)에 효소 세포가 사용된다면, 엽록체 타겟 서열을 제거하는 것이 바람직하다. 아울러, 식물의 시스타티오닌 감마 신타제는, 식물의 세포내 S-아데노실메티오닌 (SAM) 풀의 증가에 의해 매개되는 번역 조절을 허용하는, 조절 영역 (mto 영역이라고도 함)을 포함할 수 있다. SAM은 번역되는 동안에 이 mto 영역과 일부 리보존에 의해 형성되는 포켓 안에서 시스타티오닌 감마 신타제의 초기 펩타이드에 결합함으로써, 번역을 정지시킨다. 본 발명에 따른 방법을 실시하는 경우에는 이런 조절은 피하는 것이 바람직할 수 있다. 따라서, 바람직한 구현예에서, 단계 (i)에서는, SAM에 의한 이러한 조절을 방지하기 위해 변형된 식물의 시스타티오닌 감마 신타제 코딩 서열을 사용한다. 이러한 변형은 종래 기술 분야에, 예를 들어 Onoue al. (Journal of Biological Chemistry 286 (2011), 14903-14911)에 기술되어 있다. 아울러, 시스타티오닌 감마 신타제의 보다 안정적인 버전을 만드는 서열을 출발 핵산 분자로 사용할 수도 있다. 2번째 N 말단 서열의 아이덴터티가 전체 단백질 안정성을 결정하는 것으로 알려져 있다 (Varshavsky, Annual Review of Biochemistry 81 (2012), 167-176). 따라서, 불안정한 잔기 (특히 Tyr, Gln, Leu, Phe, Asp, Lys, Arg)는 피하고, Val 또는 Ser 등의 안정성 잔기를 선호하는 것이 좋다 (Varshavsky, Annual review of Biochemistry 81 (2012), 167-176).
본 발명의 단계 (ii)에 따른 돌연변이된 핵산 분자의 발현은 당해 기술 분야의 당업자에 공지된 방법으로 달성할 수 있다. 또한, 발현 시스템은 본 발명에 따른 벡터 및 숙주 세포와 관련하여 이미 앞에서 언급하였다.
본 발명에 따른 방법의 단계 (ii)에서, 숙주 세포는 돌연변이된 시스타티오닌 감마 신타제를 발현시키기 위해 사용되며, O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환할 수 있는 단백질을 코딩하는 핵산 분자를 선별할 수 있다. 이런 맥락에서, 예를 들어, 숙주 세포가 O-포스포-L-호모세린과 메탄티올을 L-메티오닌을 변환시킬 수 있다면, 단독 황 소스로서 메탄티올을 포함하는 배지에서 배양하였을 때 생존할 수 있는 숙주 세포를 사용할 수 있다. 이런 숙주 세포에 대한 일예가, met2의 기능이 적어도 결여되도록 유전자 변형된 사카로마이세스 세레비지애 세포이다. MET2 유전자는 호모세린과 아세틸-CoA를 O-아세틸 호모세린과 CoA로 변환하는 과정을 촉매하는 호모세린 트랜스-아세틸라제를 코딩한다. Met2 유전자의 불활성화로 효모 균주는 메티오닌 영양 요구성 표현형을 나타내게 된다. 바람직하게는, 또한 met6 유전자는 MET2 기능이 결여된 효소 균주에 기능부전을 부가하여야 한다. MET6 유전자는 호모시스테인과 메틸테트라하이드로폴레이트를 메티오닌으로 변환하는 호모시스테인 메틸-트랜스퍼라제를 코딩한다. 사카로마이세스 세레비지애는 필수 아미노산인 메티오닌을 호모시스테인으로부터 합성하는 방식 이외의 다른 임의의 방식은 가지고 있지 않기 때문에, MET2 기능 (및 선택적으로 MET6 기능도)이 결여된 사카로마이세스 세레비지애 균주는 다른 수단에 의해 메티오닌을 생산할 수 있는 경우에만 생존할 수 있다.
단계 (ii)에서 배양 조건 역시 숙주 세포가 O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환할 수 있는 경우에만 생존할 수 있는 방식으로 개조된다. 이는 배양 배지에 단독 황 소스로서 메탄티올을 사용함으로써 달성할 수 있다.
더 바람직하게는, MET2 및 MET6 유전자 외에도, THR4 유전자도 불활성화된다. 이러한 불활성화는 OPHS의 세포내 풀을 증대하기 위한 것이다. 이 경우, 형질전환된 숙주 세포를 메티오닌 대신 트레오닌과 메탄티올이 첨가된 배지에서 배양한다. 이 숙주 세포를 사용하게 된다면, OPHS 의존적인 메티오닌 신타제의 활성을 매우 약하게만 나타내는 돌연변이를 분리할 수 있다.
상기 방법의 단계 (iii)에서 동정된 숙주 세포는 이후 이를 사용하여, O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환할 수 있는 돌연변이된 시스타티오닌 감마 신타제를 코딩하는 핵산 분자를 수득한다. 이는 당해 기술 분야의 당업자에 공지된 방법으로 행할 수 있다.
분리된 핵산 분자는 이후 해당 효소를 발현하는데 사용하거나, 또는 다른 숙주 세포에 도입할 수 있다.
바람직한 구현예에서, O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환할 수 있는 단백질을 코딩하는 핵산 분자의 제조 방법은, 수회의 스크리닝, 즉, 돌연변이화 및 원하는 활성을 나타내는 해당 돌연변이의 분리를 포함한다.
이런 맥락에서, 1차 스크리닝에서는, MET2, MET6 및 THR4 유전자가 불활성화된 숙주 세포를 사용하는 것이 바람직하다. 전술한 바와 같이, 이런 숙주 세포를 사용함으로써, OPHS 의존적인 메티오닌 신타제의 활성을 매우 약하게 나타내는 돌연변이를 분리할 수 있다. 그런 후, 분리된 돌연변이를 다음 회차의 돌연변이화를 수행한 다음, MET2와 MET6 유전자만 불활성화되고 thr4 유전자는 활성형인 숙주 세포에서 OPHS 의존적인 메티오닌 신타제의 활성을 선별한다. OPHS의 일부가 트레오닌 신타제에 의해 이용되기 때문에 이 스크리닝은 매우 엄격하다. 이 경우, 원하는 효소 특성을 가진 클론 선별에 사용되는 숙주 세포는 황 소스로서 메탄티올이 첨가된 배지에서 배양한다.
2차 스크리닝은 반복적으로 수행할 수 있으며, 배지에 첨가하는 메탄티올의 양을 줄이고 가장 빠른 증식율을 나타내는 형질전환된 균주를 선별함으로써 선별압을 높일 수 있다.
도 1은 사카로마이세스 세레비지애의 메티오닌 생합성 경로를 간단히 도시한 것이다 (출처: Thomas D. and Y. Surdin-Kerjan; Microbiological and Molecular Reviews 61 (1997); Metabolism of Sulfur Amino-acids in Saccharomyces cerevisiae., page 503-532).
도 2는 O-포스포-L-호모세린의 화학적인 합성 경로를 도시한 것이다.
도 3은 효소의 돌연변이 버전을 구축하기 위해 출발 물질로서 사용된 CGS1의 절단된 형태를 도식적으로 나타낸 것이다.
도 4는 AD242 또는 the AD328 CGS1 변이체를 발현하거나, 또는 대조군 벡터 pAL06를 보유한, YA246-4A 균주의 메티오닌 0.05mM 첨가 배지에서의 증식을 나타낸 것이다.
도 5는 각각 CGS1-4 (A), CGS1-5 (B) 및 CGS1-1 (C) 돌연변이 패밀리를 발현하는 YA246-4A계 균주의 메티오닌 0.1mM 첨가 배지에서의 증식을 나타낸 것이다. CGS1-4 (G84S)와 pAL06 빈 벡터를 가진 음성 대조군을 모든 그래프에 도시한다.
도 6은 메탄티올 1mM (A) 또는 0.1mM (B) 첨가된 배지에서, CGS1-4 돌연변이 패밀리 AD242, AD328, MUT24 및 MUT27을 발현하는 YA247-5A계 균주의 증식을 나타낸 것이다. CGS1-4 (G84S)와 pAL06 빈 벡터를 가진 음성 대조군을 모든 그래프에 도시한다.
도 7은 CGS1의 동정된 돌연변이들을 정렬한 것이다.
서열에 대한 설명:
서열번호 1은 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)이다.
서열번호 2는 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)에서, 84번 글리신이 세린으로 치환된 것이다. 이 서열은 CGS1 G84S 또는 CGS1-0으로도 언급된다.
서열번호 3은 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)에서, 84번 글리신이 세린으로 치환되고, N-말단의 57개의 아미노산이 제거되고, 메티오닌 잔기가 N-말단에 부가된 것이다. 이 서열은 CGS1 1-4 G84S로도 언급된다.
서열번호 4는 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)의 절단된 형태로서, N-말단의 88개의 아미노산이 제거되고, 메티오닌 잔기가 N-말단에 부가된 것이다. 이 서열은 CGS1 1-5 G84S로도 언급된다.
서열번호 5는 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)의 절단된 형태로서, N-말단의 160개의 아미노산이 제거되고, 메티오닌 잔기가 N-말단에 부가된 것이다. 이 서열은 CGS1 1-1 G84S로도 언급된다.
서열번호 6은 돌연변이 MUT02의 서열이다.
서열번호 7은 돌연변이 MUT04의 서열이다.
서열번호 8은 돌연변이 MUT13의 서열이다.
서열번호 9는 돌연변이 MUT18의 서열이다.
서열번호 10은 돌연변이 MUT19의 서열이다.
서열번호 11은 돌연변이 AD309의 서열이다.
서열번호 12는 돌연변이 AD310의 서열이다.
서열번호 13은 돌연변이 AD311의 서열이다.
서열번호 14는 돌연변이 AD312의 서열이다.
서열번호 15는 돌연변이 AD313의 서열이다.
서열번호 16은 돌연변이 AD242의 서열이다.
서열번호 17은 돌연변이 AD328의 서열이다.
서열번호 18은 돌연변이 AD329의 서열이다.
서열번호 19는 돌연변이 MUT24의 서열이다.
서열번호 20은 돌연변이 MUT27의 서열이다.
서열번호 21은 돌연변이 MUT67의 서열이다.
서열번호 22는 돌연변이 MUT68의 서열이다.
서열번호 23은 돌연변이 MUT70의 서열이다.
서열번호 24는 돌연변이 MUT71의 서열이다.
서열번호 25는 돌연변이 MUT72의 서열이다.
서열번호 26은 돌연변이 MUT74의 서열이다.
서열번호 27은 돌연변이 MUT75의 서열이다.
서열번호 28은 돌연변이 MUT78의 서열이다.
서열번호 29는 돌연변이 MUT79의 서열이다.
본원에 인용된 문헌의 내용은 그 전체가 원용에 의해 본 명세서에 포함된다.
본 발명의 그외 측면들과 이점은 아래 실시예들에서 기술될 것이며, 실시예들은 예를 들기 위한 것일 뿐 한정하고자 하는 것은 아니다.
도 2는 O-포스포-L-호모세린의 화학적인 합성 경로를 도시한 것이다.
도 3은 효소의 돌연변이 버전을 구축하기 위해 출발 물질로서 사용된 CGS1의 절단된 형태를 도식적으로 나타낸 것이다.
도 4는 AD242 또는 the AD328 CGS1 변이체를 발현하거나, 또는 대조군 벡터 pAL06를 보유한, YA246-4A 균주의 메티오닌 0.05mM 첨가 배지에서의 증식을 나타낸 것이다.
도 5는 각각 CGS1-4 (A), CGS1-5 (B) 및 CGS1-1 (C) 돌연변이 패밀리를 발현하는 YA246-4A계 균주의 메티오닌 0.1mM 첨가 배지에서의 증식을 나타낸 것이다. CGS1-4 (G84S)와 pAL06 빈 벡터를 가진 음성 대조군을 모든 그래프에 도시한다.
도 6은 메탄티올 1mM (A) 또는 0.1mM (B) 첨가된 배지에서, CGS1-4 돌연변이 패밀리 AD242, AD328, MUT24 및 MUT27을 발현하는 YA247-5A계 균주의 증식을 나타낸 것이다. CGS1-4 (G84S)와 pAL06 빈 벡터를 가진 음성 대조군을 모든 그래프에 도시한다.
도 7은 CGS1의 동정된 돌연변이들을 정렬한 것이다.
서열에 대한 설명:
서열번호 1은 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)이다.
서열번호 2는 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)에서, 84번 글리신이 세린으로 치환된 것이다. 이 서열은 CGS1 G84S 또는 CGS1-0으로도 언급된다.
서열번호 3은 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)에서, 84번 글리신이 세린으로 치환되고, N-말단의 57개의 아미노산이 제거되고, 메티오닌 잔기가 N-말단에 부가된 것이다. 이 서열은 CGS1 1-4 G84S로도 언급된다.
서열번호 4는 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)의 절단된 형태로서, N-말단의 88개의 아미노산이 제거되고, 메티오닌 잔기가 N-말단에 부가된 것이다. 이 서열은 CGS1 1-5 G84S로도 언급된다.
서열번호 5는 아라비돕시스 탈리아나 유래 시스타티오닌 감마 신타제 (EC 2.5.1.48) CGS1의 아미노산 서열 (AAC25687.1)의 절단된 형태로서, N-말단의 160개의 아미노산이 제거되고, 메티오닌 잔기가 N-말단에 부가된 것이다. 이 서열은 CGS1 1-1 G84S로도 언급된다.
서열번호 6은 돌연변이 MUT02의 서열이다.
서열번호 7은 돌연변이 MUT04의 서열이다.
서열번호 8은 돌연변이 MUT13의 서열이다.
서열번호 9는 돌연변이 MUT18의 서열이다.
서열번호 10은 돌연변이 MUT19의 서열이다.
서열번호 11은 돌연변이 AD309의 서열이다.
서열번호 12는 돌연변이 AD310의 서열이다.
서열번호 13은 돌연변이 AD311의 서열이다.
서열번호 14는 돌연변이 AD312의 서열이다.
서열번호 15는 돌연변이 AD313의 서열이다.
서열번호 16은 돌연변이 AD242의 서열이다.
서열번호 17은 돌연변이 AD328의 서열이다.
서열번호 18은 돌연변이 AD329의 서열이다.
서열번호 19는 돌연변이 MUT24의 서열이다.
서열번호 20은 돌연변이 MUT27의 서열이다.
서열번호 21은 돌연변이 MUT67의 서열이다.
서열번호 22는 돌연변이 MUT68의 서열이다.
서열번호 23은 돌연변이 MUT70의 서열이다.
서열번호 24는 돌연변이 MUT71의 서열이다.
서열번호 25는 돌연변이 MUT72의 서열이다.
서열번호 26은 돌연변이 MUT74의 서열이다.
서열번호 27은 돌연변이 MUT75의 서열이다.
서열번호 28은 돌연변이 MUT78의 서열이다.
서열번호 29는 돌연변이 MUT79의 서열이다.
본원에 인용된 문헌의 내용은 그 전체가 원용에 의해 본 명세서에 포함된다.
본 발명의 그외 측면들과 이점은 아래 실시예들에서 기술될 것이며, 실시예들은 예를 들기 위한 것일 뿐 한정하고자 하는 것은 아니다.
실시예
실시예 1: 돌연변이 제조를 위해 출발 물질로서 사용되는 CGS1의 절단된 형태 제조
CGS1-4 유전자는 합성 유전자이다. 합성은 사카로마이세스 세레비지애에서의 이의 발현을 개선시키고자 코돈 용법을 최적화하기 위해 GENEius 알고리즘을 이용하여 Eurofins MWG Operon (Ebersberg)에서 수행하였다. 사용되는 사카로마이세스 세레비지애의 코돈 용법 표는 Kazusa Codon Usage Database (http://www.kazusa.or.jp/codon)에서 입수하였다. 절단형 CGS1-5와 CGS1-1은 매트릭스로서 CGS1-4를 이용하고 CGS1-5의 경우 정방향 올리고뉴클레오티드 GTACCGCTCGAGATGGTTGCTGGTAAGTGGTCTAACAATC와 CGS1-1의 경우 GTACCGCTCGAGATGTCTGTTCAATTGACCGATTCTAAG을 이용하여 PCR함으로써 제조된 것이다. CGS1-5 및 CGS1-1 포맷에는 동일한 역방향 올리고뉴클레오티드 AGTACGGGATCCTCAAATGGCTTCCA를 사용하였다.
CGS1에 대한 기술된 절단 변이형은 도 3에 개략적으로 도시된다.
실시예 2: CGS1의 절단된 돌연변이 형태의 제조
CGS1 유전자의 절단된 형태를, pRS316 벡터로부터 유래된 효모 복제가능한 벡터인 pAL06 플라스미드에 클로닝하였다 (Sikorski RS & Hieter P., Genetics. 1989, 122:19-27). pAL06 플라스미드는 강력한 효모 프로모터 TEF1의 통제 하에 클로닝된 유전자를 발현시킨다. Vartanian JP et al., (Nucleic Acids Res. 1996 24:2627-2631)에 기술된 프로토콜로 편향된 데옥시뉴클레오티드 트리포스페이트 (dNTP) 농축물을 사용하여 과잉돌연변이 유발성 PCR에 의해, CGS1 라이브러리를 제작하였다. 돌연변이 유발성 PCR 중에 [dTTP] > [dCTP] 및 [dGTP] > [dATP] 편향을 사용하였다. [dTTP]/[dCTP] = [dGTP]/[dATP] = 1000 μM / 200 μM 또는 [dTTP]/[dCTP] = [dGTP]/[dATP] = 1000 μM / 150 μM을 0.5 mM MnCl2 존재 하에 사용하였다.
실시예 3: O-포스포-L-호모세린과 메탄티올로부터 L-메티오닌을 생산할 수 있는 돌연변이의 스크리닝
CGS1 라이브러리를 효모 균주 YA247-5A (MAT-α, ade2, his3, leu2, met2::loxP, met6::HIS3, trp1, ura3) 또는 YA246-4A (MAT-a, ade2, his3, leu2, met2::loxP, met6::HIS3, thr4::loxP, trp1, ura3)에 메티오닌이 보충되고 플라스미드 마커를 선별하기 위해 우라실은 결여된 최소 배지에서 형질전환하였다. 48시간 배양 후, 세포를 수집하여 세척한 다음, 황 소스로서 메틸머캅탄이 첨가된 최소 액체 배지에 재-현탁하였다. 7일 후, 배양물의 취하여, 동일 액체 배지에 OD600nm 약 0.2로 희석하였다. 3번의 연속적인 희석 사이클을 수행하였다.
수득한 배양 효모 세포에 존재하는 플라스미드를 이후 추출하여, E. coli에서 증폭시킨 다음, 수득한 DNA를 사용하여 균주 YA247-5A (MAT-α, ade2, his3, leu2, met2::loxP, met6::HIS3, trp1, ura3) 또는 YA246-4A (MAT-a, ade2, his3, leu2, met2::loxP, met6::HIS3, thr4::loxP, trp1, ura3)에 재-형질전환하였다. 형질전환된 효모는 메티오닌이 첨가되나 우라실은 결핍된 최소 고체 배지에서 선별하였다. 그런 후, 각 개별 콜로니가 황 소스로서 메틸머캅탄을 이용하여 증식하는 증식력을, 황 원소로서 메탄티올이 함유된 액체 배지에서 개개 클론을 배양함으로써, 평가하였다. 각 증폭 사이클에서, 메탄티올 존재 하에 최상의 증식율을 보이는 효모 클로니에 존재하는 플라스미드를 추출하여, 서열분석하였다. 선별된 돌연변이는 시험관내 분석을 위해 YA247-5A 균주에 형질전환하였고, 새로운 과잉 돌연변이 유발성 PCR의 출발 물질로서 사용하였다.
전술한 스크리닝 공정을 이용하여, 단독 황 소스로서 메탄티올에서 증식하며 O-포스포-L-호모세린과 메탄티올을 L-메티오닌로 변환할 수 있는 것으로 추측되는 상당수의 CSG1 돌연변이를 동정하였다. 이들 돌연변이들에서 서열을 결정하였으며, 돌연변이를 하기 표 1A에 요약개시하며, 표에서 돌연변이의 위치는 서열번호 3 (CGS 1-4)으로 제시된 서열을 기준으로 표시된다. 또한, 돌연변이를 정렬하여 도 7에 요약 개시한다.
표 1A
아미노산 | 위치 | 돌연변이(들) |
P | 10 | L |
N | 11 | D |
Q | 15 | R |
I | 27 | S |
A | 30 | T |
L | 45 | S |
S | 47 | T |
V | 60 | D |
A | 68 | T |
F | 150 | L |
T | 178 | I |
D | 183 | E |
I | 185 | V |
T | 220 | S |
M | 232 | L |
V | 245 | A |
A | 257 | T |
N | 259 | D,S |
F | 261 | S |
F | 275 | L |
I | 287 | V, F |
H | 289 | Y,R |
Y | 324 | F |
G | 326 | S |
P | 356 | T |
T | 371 | A |
V | 396 | A |
P | 405 | S |
D | 431 | G |
I | 436 | T |
I | 457 | L |
D | 459 | N |
P | 470 | S |
E | 472 | G |
A | 506 | G |
I | 507 | V |
아래 표 1B는 분석한 변이주들을 모두 열거한 것으로서, 서열번호 1의 전장 서열 (CGS1)에서 확인된 돌연변이 위치를 나타낸다. 대응되는 출발 서열에서의 위치는 괄호 안에 나타낸다.
표 1B
변이주 | 돌연변이들 | 출발 서열 |
MUT02 | P412(356)T | 1-4 |
MUT04 | P66(10)L, I83(27)S, V116(60)D, Y380(324)F, I513(457)L | 1-4 |
MUT13 | M57(1)K, I88(32)M, I343(287)V, H345(289)R, P412(356)T, stop564(508)W | 1-4 |
MUT18 | P66(10)L, M288(232)L, V301(245)A, N315(259)D, P412(356)T, D487(431)G, I492(436)T | 1-4 |
MUT19 | N67(11)D, Q71(15)R, A86(30)T, L101(45)S, S103(47)T, A124(68)T, T234(178)I, P412(356)T, T427(371)A, D515(459)N | 1-4 |
AD309 | I88(1)M, P412(325)T | 1-5 |
AD310 | I88(1)M, V116(29)D, Y380(293)F, I513(426)L | 1-5 |
AD311 | I88(1)M, I343(256)V, H345(258)R, P412(325)T | 1-5 |
AD312 | I88(1)M, M288(201)L, V301(214)A, N315(228)D, P412(325)T, D487(400)G, I492(405)T | 1-5 |
AD313 | I88(1)M, L101(14)S, S103(16)T, A124(37)T, T234(147)I, P412(325)T, T427(340)A, D515(428)N | 1-5 |
AD242 | G160(1)M, P412(325)T | 1-1 |
AD328 | G160(1)M, M288(129)L, V301(142)A, N315(156)D, P412(253)T, D487(328)G, I492(333)T | 1-1 |
AD329 | G160(1)M, T234(75)I, P412(253)T, T427(268)A, D515(356)N | 1-1 |
MUT24 | G160(1)M, F206(47)L, A313(154)T, N315(156)S, F317(158)S, F331(172)L, H345(186)Y, P412(253)T, A562(403)G | 1-1 |
MUT27 | G160(1)M,I241(82)V, P412(253)T, P461(302)S | 1-1 |
MUT67 | G160(1)M, F331(172)L, P412(253)T, V452(293)A, E528(369)G | 1-1 |
MUT68 | G160(1)M, F331(172)L, G382(223)S, P412(253)T, V452(293)A | 1-1 |
MUT70 | G160(1)M, T276(117)S, F331(172)L, P412(253)T, V452(293)A | 1-1 |
MUT71 | G160(1)M, D239(80)E, F331(172)L, P412(253)T, V452(293)A, I563(404)V | 1-1 |
MUT72 | G160(1)M, F331(172)L, I343(184)F, P412(253)T, V452(293)A, I563(404)V | 1-1 |
MUT74 | G160(1)M, F331(172)L, P412(253)T, V452(293)A, P526(367)S | 1-1 |
MUT75 | G160(1)M, F331(172)L, P412(253)T, I563(404)V | 1-1 |
MUT78 | G160(1)M, F331(172)L, P412(253)T, V452(293)A | 1-1 |
MUT79 | G160(1)M, F331(172)L, I343(184)F, P412(253)T | 1-1 |
출발 서열 1-4는 서열번호 3에 해당된다.
출발 서열 1-5는 서열번호 4에 해당된다.
출발 서열 1-1은 서열번호 5에 해당된다.
아래 표 1C는 분석한 모든 변이주들을 열거하고 있으며, 서열번호 3 (CGS1-4)의 서열에서 확인된 돌연변이 위치가 표시된다. 대응되는 출발 서열에서의 위치는 괄호 안에 나타낸다.
표 1C
변이주 | 돌연변이 | 출발 서열 |
MUT02 | P356T | 1-4 |
MUT04 | P10L, I27S, V60D, Y324F, I457L | 1-4 |
MUT13 | M1K, I32M, I287V, H289R, P356T, stop508W | 1-4 |
MUT18 | P10L, M232L, V245A, N259D, P356T, D431G, I436T | 1-4 |
MUT19 | N11D, Q15R, A30T, L45S, S47T, A68T, T178I, P356T, T371A, D459N | 1-4 |
AD309 | I32(1)M, P356(325)T | 1-5 |
AD310 | I32(1)M, V60(29)D, Y324(293)F, I457(426)L | 1-5 |
AD311 | I32(1)M, I287(256)V, H289(258)R, P356(325)T | 1-5 |
AD312 | I32(1)M, M232(201)L, V245(214)A, N259(228)D, P356(325)T, D431(400)G, I436(405)T | 1-5 |
AD313 | I32(1)M, L45(14)S, S47(16)T, A68(37)T, T178(147)I, P356(325)T, T371(340)A, D459(428)N | 1-5 |
AD242 | G104(1)M, P356(253)T | 1-1 |
AD328 | G104(1)M, M232(129)L, V245(142)A, N259(156)D, P356(253)T, D431(328)G, I436(333)T | 1-1 |
AD329 | G104(1)M, T178(75)I, P356(253)T, T371(268)A, D459(356)N | 1-1 |
MUT24 | G104(1)M, F150(47)L, A257(154)T, N259(156)D, F261(158)S, F275(172)L, H289(186)Y, P356(253)T, A506(403)G | 1-1 |
MUT27 | G104(1)M,I185(82)V, P356(253)T, P405(302)S | 1-1 |
MUT67 | G104(1)M, F275(172)L, P356(253)T, V396(293)A, E472(369)G | 1-1 |
MUT68 | G104(1)M, F275(172)L, G326(223)S, P356(253)T, V396(293)A | 1-1 |
MUT70 | G104(1)M, T220(117)S, F275(172)L, P356(253)T, V396(293)A | 1-1 |
MUT71 | G104(1)M, D183(80)E, F275(172)L, P356(253)T, V396(293)A, I507(404)V | 1-1 |
MUT72 | G104(1)M, F275(172)L, I287(184)F, P356(253)T, V396(293)A, I507(404)V | 1-1 |
MUT74 | G104(1)M, F275(172)L, P356(253)T, V396(293)A, P470(367)S | 1-1 |
MUT75 | G104(1)M, F275(172)L, P356(253)T, I507(404)V | 1-1 |
MUT78 | G104(1)M, F275(172)L, P356(253)T, V396(293)A | 1-1 |
MUT79 | G104(1)M, F275(172)L, I287(184)F, P356(253)T | 1-1 |
실시예 4: 효모 사카로마이세스 세레비지애에서의 효소의 활성 검정
사카로마이세스 세레비지애 균주 YA247-5A (MAT-α, ade2, his3, leu2, met2::loxP, met6::HIS3, trp1, ura3) 및 YA246-4A (MAT-α, ade2, his3, leu2, met2::loxP, met6::HIS3, thr4::loxP, trp1, ura3)에서 전술한 변이주들 중 임의의 변이주의 발현은 이의 메티오닌 영양 요구성을 완화한다.
즉, 전술한 임의의 변이주의 발현시, 메티오닌 합성에 결함이 있는 효모 균주 YA247-5A와 YA246-4A는 아데닌, 히스티딘, 루신, 트립토판 및 우라실이 첨가된 최소 배지에서 배양하였다.
검정의 실험 설계:
돌연변이 뉴클레오티드 서열을 복제가능한 플라스미드 pAL06 (pRS316의 유도체)에 전사 프로모터 (pTEF1)의 하류에 그리고 전사 종결인자 (tADH1)의 상류에 각각 클로닝하였다.
이렇게 수득한 12종의 플라스미드를 각각 효모 균주 YA247-5A 및 YA246-4A에 형질전환하였다. 형질전환체를 메티오닌 0.2 mM이 첨가된 배지 A (DifcoTM 효모 질소 베이스 6.7%, 글루코스 2%, 아데닌 0.3 mM, 루신 0.75 mM, 히스티딘 1.3 mM, 트립토판 0.1 mM)에서 배양하였다.
각 형질전환주를 0.05 mM 메티오닌이 첨가된 배지 A 또는 메탄티올 0.1 또는 1 mM이 첨가된 배지 A에 접종 (OD590 = 0.015)하였다.
증식은 590 nm에서 광학 밀도(OD590)를 추적함으로써 모니터링하였다. 2종의 배지에서의 각 클론의 각 증식을 빈 벡터 pAL06로 형질전횐된 음성 대조군 YA246-4A 또는 YA247-5A의 증식과 비교하였다.
메티오닌이 첨가된 배지 A의 경우, 모든 검사 균주들은 재생 시간이 약 4시간이었다. 예를 들어, 돌연변이 CGS 1-4 (G84S), AD242 및 AD328을 발현하는 균주 YA246-4A와 대조군 pAL06 균주의 증식을 도 4에 나타낸다.
포스포호모세린의 축적 측면에서의 증식:
포스포호모세린을 축적하며 0.1mM 메탄티올이 첨가된 배지 A에서 CGS1 단백질 변이체를 발현하는, YA246-4A계 균주들의 증식을 도 5에 나타낸다.
모든 경우들에서, 대조군 CGS1-4 (G84S) 및 pAL06 플라스미드 균주에서 증식이 관찰되지 않았다.
CGS1-4 패밀리 (도 5A)의 경우, 재생 시간은 MUT19의 경우 13시간에서 MUT02의 경우 42시간이다. CGS1-5 패밀리 (도 5B)의 경우, 재생 시간은 AD312 및 AD313의 9.5시간에서 AD310의 12.5시간이다. CGS1-1 패밀리 (도5C)의 경우, 재생 시간은 AD242, AD328 및 AD329의 경우 약 9.5시간이다.
포스포호모세린이 축적되지 않는다는 측면에서의 증식:
포스포호모세린을 축적하지 않으며 1mM 메탄티올 또는 0.1mM 메탄티올이 첨가된 배지 A에서 CGS1 단백질 변이체를 발현하는, YA247-5A계 균주들의 증식을 각각 도 6A 및 6B에 나타낸다.
메탄티올 1 mM 첨가시, CGS1-1과 pAL06 빈 벡터로 형질전환된 음성 대조군에서는 증식이 관찰되지 않는다. 재생 시간은, AD242 또는 AD328의 경우 약 21시간, MUT27의 경우 10.5시간, MUT24의 경우 8시간이다. 메탄티올 0.1 mM 첨가시, MUT24 및 MUT27 균주들에서만 증식이 관찰된다. 재생 시간은 각각 19시간 및 40시간이다.
실시예 5: OPHS 의존적인 메티오닌 신타제의 시험관내 활성
효모에서 발현된 효소의 시험관내 활성을 효모의 라이세이트 (lysate) 조산물에서 검정하였다.
O-포스포-L-호모세린 (OPHS) 및 메탄티올 (CH3SNa)의 존재 하에 라이세이트에서 메티오닌의 합성을 모니터링함으로써, 활성을 추적하였다. 효모 세포 YA246-5A, 빈 플라스미드 pAL06을 보유한 YA246-5A, CGS1-4를 발현하는 YA246-5A 및 돌연변이 AD246, AD239, MUT24, MUT27, MUT67 또는 MUT79를 발현하는 YA246-5A의 라이세이트들을 비교하였다.
실험 공정:
라이세이트 제조
효모 세포를 일차로 완전 배지에서 배양하였다. 1차 배양물을 사용하여 배지 A 100 ml에 접종하여 (OD590nm= 0.3), 16시간 동안 교반하면서 28℃에서 배양하였다.
단백질의 총량을 브래드포드 분석을 이용하여 측정하였다.
반응을 개시하기 위해, 총 단백질 0.03 - 0.06 mg을 100 mM Tris pH8, 0.2 mM 피리독살 포스페이트, 5 mM CH3SNa 및 25mM OPHS로 구성된 총 100 ㎕에서 37℃에서 15분간 인큐베이션하였다. 반응 혼합물의 분액 10 ㎕를 15분과 60분에 취하고, 과염소산 90 ㎕를 첨가하여 반응을 정지시켰다. 이들 분액내 메티오닌의 양은, 내부 표준 물질로서 13CMet를 이용하여 LCMS로 측정하였다. 형성된 메티오닌의 양을 분석에 사용된 단백질의 양에 대해 표준화하였다.
그 결과를 아래 표 2에 나타낸다:
표 2
활성 (nmole.min-1.mg-1) | 표준 편차 | |
CGS1-4 (G84S) | 미검출 | - |
pAD242 | 142 | ±13 |
pAD329 | 143 | ±11 |
pMUT24 | 354 | ±14 |
pMUT27 | 343 | ±38 |
pMUT67 | 864 | ±91 |
pMUT79 | 462 | ±35 |
실시예 6: 호모시스테인 신타제 활성을 측정하기 위한 시험관내 분석
효모에서 발현되는 효소의 호모시스테인 신타제 활성을 효모의 라이세이트 조산물을 이용하여 시험관내 분석으로 검정하였다.
활성은, O-포스포-L-호모세린 (OPHS) 및 메탄티올 (CH3SNa)의 존재 하에 라이세이트에서 메티오닌의 합성을 모니터링함으로써, 활성을 추적하였다. 효모 세포 YA246-5A, 빈 플라스미드 pAL06을 보유한 YA246-5A, CGS1-4를 발현하는 YA246-5A 및 돌연변이 AD246, AD239, MUT24, MUT27, MUT67 또는 MUT79를 발현하는 YA246-5A의 라이세이트들을 비교하였다.
실험 공정:
라이세이트 제조
효모 세포를 일차로 완전 배지에서 배양하였다. 1차 배양물을 사용하여 배지 A 100 ml에 접종하여 (OD590nm= 0.3), 16시간 동안 교반하면서 28℃에서 배양하였다. 단백질의 총량을 브래드포드 분석을 이용하여 측정하였다. 형성된 호모시스테인의 양을 비색 분석으로 측정하였다.
반응을 개시하기 위해, 총 단백질 0.03 - 0.06 mg을 0.1 M Tris pH8, 0.2 mM 피리독살 포스페이트, 10 mM Na2S 및 12.5 mM OPHS로 구성된 총 100 ㎕에서 30℃에서 15분간 인큐베이션하였다.
- 1% NaNO2 (H2SO4에 0.4N로 용해됨) 500 ㎕을 첨가하여 5분간 인큐베이션
- NH4SO3NH2 100 ㎕을 첨가하여 2분간 인큐베이션
- 1 부피 de HgCl2 750 ㎕ 첨가
- 설파닐아미드 4 부피 첨가
- N-(1-나프틸)에틸렌다이아민 다이하이드로클로라이드 2 부피 첨가
15분간 인큐베이션
OD 450 nm 측정 (호모시스테인의 양과 비례하여 증가함 - 양은 기지 범위의 호모시스테인에서 관찰된 결과와 비교함으로써 결정함).
그 결과는 표 3에 나타낸다.
표 3:
활성 (nmole.min-1.mg-1) | 표준편차 | |
CGS1-4 (G84S) | 미검출 | - |
pAD242 | 18 | ±4 |
pAD328 | 21 | ±2 |
pMUT24 | 59 | ±9 |
pMUT27 | 47 | ±2 |
pMUT67 | 239 | ±32 |
pMUT79 | 215 | ±29 |
SEQUENCE LISTING
<110> ADISSEO France S.A.S.
<120> Means and methods for the enzymatic production of L-methionine from O-phospho-L-homoserine and metanethiol
<130> U1661 PCT S3
<150> EP12 19 0150.8
<151> 2012-10-26
<160> 29
<170> BiSSAP 1.2
<210> 1
<211> 563
<212> PRT
<213> Arabidopsis thaliana
<400> 1
Met Ala Val Ser Ser Phe Gln Ser Pro Thr Ile Phe Ser Ser Ser Ser
1 5 10 15
Ile Ser Gly Phe Gln Cys Arg Ser Asp Pro Asp Leu Val Gly Ser Pro
20 25 30
Val Gly Gly Ser Ser Arg Arg Arg Val His Ala Ser Ala Gly Ile Ser
35 40 45
Ser Ser Phe Thr Gly Asp Gly Gly Leu Ser Ser Arg Ile Leu Arg Phe
50 55 60
Pro Pro Asn Phe Val Arg Gln Leu Ser Ile Lys Ala Arg Arg Asn Cys
65 70 75 80
Ser Asn Ile Gly Val Ala Gln Ile Val Ala Gly Lys Trp Ser Asn Asn
85 90 95
Pro Ser Ser Ala Leu Pro Ser Ala Ala Ala Ala Ala Ala Thr Ser Ser
100 105 110
Ala Ser Ala Val Ser Ser Ala Ala Ser Ala Ala Ala Ala Ser Ser Ala
115 120 125
Ala Ala Ala Pro Val Ala Ala Ala Pro Pro Val Val Leu Lys Ser Val
130 135 140
Asp Glu Glu Val Val Val Ala Glu Glu Gly Ile Arg Glu Lys Ile Gly
145 150 155 160
Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp Gly
165 170 175
Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val Thr
180 185 190
Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe Lys
195 200 205
Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser Phe
210 215 220
Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp Lys
225 230 235 240
Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser Gly
245 250 255
Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly Gly
260 265 270
His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe Met
275 280 285
Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp Pro
290 295 300
Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val Ser
305 310 315 320
Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Phe Leu Arg Cys Val Asp
325 330 335
Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val Cys
340 345 350
Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala Leu
355 360 365
Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly His
370 375 380
Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val Ser
385 390 395 400
Glu Ile Arg Asn Leu His His Val Leu Gly Gly Pro Leu Asn Pro Asn
405 410 415
Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg Val
420 425 430
Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu Ala
435 440 445
His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His Pro
450 455 460
Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val Val
465 470 475 480
Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val Asp
485 490 495
Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu Ser
500 505 510
Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln Glu
515 520 525
Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser Phe
530 535 540
Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala Leu
545 550 555 560
Glu Ala Ile
<210> 2
<211> 563
<212> PRT
<213> Arabidopsis thaliana
<400> 2
Met Ala Val Ser Ser Phe Gln Ser Pro Thr Ile Phe Ser Ser Ser Ser
1 5 10 15
Ile Ser Gly Phe Gln Cys Arg Ser Asp Pro Asp Leu Val Gly Ser Pro
20 25 30
Val Gly Gly Ser Ser Arg Arg Arg Val His Ala Ser Ala Gly Ile Ser
35 40 45
Ser Ser Phe Thr Gly Asp Gly Gly Leu Ser Ser Arg Ile Leu Arg Phe
50 55 60
Pro Pro Asn Phe Val Arg Gln Leu Ser Ile Lys Ala Arg Arg Asn Cys
65 70 75 80
Ser Asn Ile Ser Val Ala Gln Ile Val Ala Gly Lys Trp Ser Asn Asn
85 90 95
Pro Ser Ser Ala Leu Pro Ser Ala Ala Ala Ala Ala Ala Thr Ser Ser
100 105 110
Ala Ser Ala Val Ser Ser Ala Ala Ser Ala Ala Ala Ala Ser Ser Ala
115 120 125
Ala Ala Ala Pro Val Ala Ala Ala Pro Pro Val Val Leu Lys Ser Val
130 135 140
Asp Glu Glu Val Val Val Ala Glu Glu Gly Ile Arg Glu Lys Ile Gly
145 150 155 160
Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp Gly
165 170 175
Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val Thr
180 185 190
Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe Lys
195 200 205
Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser Phe
210 215 220
Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp Lys
225 230 235 240
Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser Gly
245 250 255
Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly Gly
260 265 270
His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe Met
275 280 285
Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp Pro
290 295 300
Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val Ser
305 310 315 320
Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Phe Leu Arg Cys Val Asp
325 330 335
Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val Cys
340 345 350
Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala Leu
355 360 365
Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly His
370 375 380
Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val Ser
385 390 395 400
Glu Ile Arg Asn Leu His His Val Leu Gly Gly Pro Leu Asn Pro Asn
405 410 415
Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg Val
420 425 430
Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu Ala
435 440 445
His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His Pro
450 455 460
Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val Val
465 470 475 480
Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val Asp
485 490 495
Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu Ser
500 505 510
Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln Glu
515 520 525
Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser Phe
530 535 540
Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala Leu
545 550 555 560
Glu Ala Ile
<210> 3
<211> 507
<212> PRT
<213> Arabidopsis thaliana
<400> 3
Met Ser Ser Arg Ile Leu Arg Phe Pro Pro Asn Phe Val Arg Gln Leu
1 5 10 15
Ser Ile Lys Ala Arg Arg Asn Cys Ser Asn Ile Ser Val Ala Gln Ile
20 25 30
Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser Ala
35 40 45
Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala Ala
50 55 60
Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala Ala
65 70 75 80
Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala Glu
85 90 95
Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser Lys
100 105 110
His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly Glu
115 120 125
Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val Val
130 135 140
Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp Phe
145 150 155 160
Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn Pro
165 170 175
Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala Glu
180 185 190
Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met Leu
195 200 205
Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp Cys
210 215 220
Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu Gly
225 230 235 240
Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu Ala
245 250 255
Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro Thr
260 265 270
Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile Cys
275 280 285
His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr Pro
290 295 300
Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His Ser
305 310 315 320
Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys Ile
325 330 335
Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His Val
340 345 350
Leu Gly Gly Pro Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg Gly
355 360 365
Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala Phe
370 375 380
Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val Tyr
385 390 395 400
Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg Gln
405 410 415
Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp Ile
420 425 430
Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile Ala
435 440 445
Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asp Gln Pro Ala Ile Met
450 455 460
Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile Lys
465 470 475 480
Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp Val
485 490 495
Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
500 505
<210> 4
<211> 476
<212> PRT
<213> Arabidopsis thaliana
<400> 4
Met Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser
1 5 10 15
Ala Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala
20 25 30
Ala Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala
35 40 45
Ala Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala
50 55 60
Glu Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser
65 70 75 80
Lys His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly
85 90 95
Glu Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val
100 105 110
Val Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp
115 120 125
Phe Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn
130 135 140
Pro Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala
145 150 155 160
Glu Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met
165 170 175
Leu Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp
180 185 190
Cys Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu
195 200 205
Gly Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu
210 215 220
Ala Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro
225 230 235 240
Thr Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile
245 250 255
Cys His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr
260 265 270
Pro Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His
275 280 285
Ser Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys
290 295 300
Ile Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His
305 310 315 320
Val Leu Gly Gly Pro Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg
325 330 335
Gly Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala
340 345 350
Phe Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val
355 360 365
Tyr Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg
370 375 380
Gln Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp
385 390 395 400
Ile Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile
405 410 415
Ala Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asp Gln Pro Ala Ile
420 425 430
Met Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile
435 440 445
Lys Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp
450 455 460
Val Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
465 470 475
<210> 5
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 5
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Phe Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Pro Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 6
<211> 507
<212> PRT
<213> Arabidopsis thaliana
<400> 6
Met Ser Ser Arg Ile Leu Arg Phe Pro Pro Asn Phe Val Arg Gln Leu
1 5 10 15
Ser Ile Lys Ala Arg Arg Asn Cys Ser Asn Ile Ser Val Ala Gln Ile
20 25 30
Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser Ala
35 40 45
Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala Ala
50 55 60
Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala Ala
65 70 75 80
Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala Glu
85 90 95
Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser Lys
100 105 110
His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly Glu
115 120 125
Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val Val
130 135 140
Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp Phe
145 150 155 160
Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn Pro
165 170 175
Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala Glu
180 185 190
Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met Leu
195 200 205
Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp Cys
210 215 220
Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu Gly
225 230 235 240
Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu Ala
245 250 255
Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro Thr
260 265 270
Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile Cys
275 280 285
His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr Pro
290 295 300
Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His Ser
305 310 315 320
Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys Ile
325 330 335
Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His Val
340 345 350
Leu Gly Gly Thr Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg Gly
355 360 365
Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala Phe
370 375 380
Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val Tyr
385 390 395 400
Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg Gln
405 410 415
Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp Ile
420 425 430
Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile Ala
435 440 445
Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asp Gln Pro Ala Ile Met
450 455 460
Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile Lys
465 470 475 480
Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp Val
485 490 495
Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
500 505
<210> 7
<211> 507
<212> PRT
<213> Arabidopsis thaliana
<400> 7
Met Ser Ser Arg Ile Leu Arg Phe Pro Leu Asn Phe Val Arg Gln Leu
1 5 10 15
Ser Ile Lys Ala Arg Arg Asn Cys Ser Asn Ser Ser Val Ala Gln Ile
20 25 30
Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser Ala
35 40 45
Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Asp Ser Ser Ala Ala
50 55 60
Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala Ala
65 70 75 80
Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala Glu
85 90 95
Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser Lys
100 105 110
His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly Glu
115 120 125
Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val Val
130 135 140
Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp Phe
145 150 155 160
Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn Pro
165 170 175
Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala Glu
180 185 190
Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met Leu
195 200 205
Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp Cys
210 215 220
Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu Gly
225 230 235 240
Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu Ala
245 250 255
Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro Thr
260 265 270
Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile Cys
275 280 285
His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr Pro
290 295 300
Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His Ser
305 310 315 320
Ala Thr Lys Phe Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys Ile
325 330 335
Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His Val
340 345 350
Leu Gly Gly Pro Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg Gly
355 360 365
Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala Phe
370 375 380
Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val Tyr
385 390 395 400
Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg Gln
405 410 415
Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp Ile
420 425 430
Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile Ala
435 440 445
Pro Ser Phe Gly Gly Cys Glu Ser Leu Val Asp Gln Pro Ala Ile Met
450 455 460
Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile Lys
465 470 475 480
Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp Val
485 490 495
Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
500 505
<210> 8
<211> 531
<212> PRT
<213> Arabidopsis thaliana
<400> 8
Lys Ser Ser Arg Ile Leu Arg Phe Pro Pro Asn Phe Val Arg Gln Leu
1 5 10 15
Ser Ile Lys Ala Arg Arg Asn Cys Ser Asn Ile Ser Val Ala Gln Met
20 25 30
Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser Ala
35 40 45
Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala Ala
50 55 60
Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala Ala
65 70 75 80
Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala Glu
85 90 95
Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser Lys
100 105 110
His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly Glu
115 120 125
Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val Val
130 135 140
Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp Phe
145 150 155 160
Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn Pro
165 170 175
Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala Glu
180 185 190
Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met Leu
195 200 205
Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp Cys
210 215 220
Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu Gly
225 230 235 240
Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu Ala
245 250 255
Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro Thr
260 265 270
Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Val Cys
275 280 285
Arg Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr Pro
290 295 300
Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His Ser
305 310 315 320
Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys Ile
325 330 335
Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His Val
340 345 350
Leu Gly Gly Thr Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg Gly
355 360 365
Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala Phe
370 375 380
Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val Tyr
385 390 395 400
Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg Gln
405 410 415
Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp Ile
420 425 430
Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile Ala
435 440 445
Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asp Gln Pro Ala Ile Met
450 455 460
Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile Lys
465 470 475 480
Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp Val
485 490 495
Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile Trp Gly Ser Thr Ser
500 505 510
Ser Arg Ala Ala Ala Ala Ala Val Gly Glu Phe Leu Met Ile Tyr Asp
515 520 525
Phe Tyr Tyr
530
<210> 9
<211> 507
<212> PRT
<213> Arabidopsis thaliana
<400> 9
Met Ser Ser Arg Ile Leu Arg Phe Pro Leu Asn Phe Val Arg Gln Leu
1 5 10 15
Ser Ile Lys Ala Arg Arg Asn Cys Ser Asn Ile Ser Val Ala Gln Ile
20 25 30
Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser Ala
35 40 45
Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala Ala
50 55 60
Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala Ala
65 70 75 80
Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala Glu
85 90 95
Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser Lys
100 105 110
His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly Glu
115 120 125
Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val Val
130 135 140
Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp Phe
145 150 155 160
Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn Pro
165 170 175
Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala Glu
180 185 190
Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met Leu
195 200 205
Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp Cys
210 215 220
Tyr Arg Lys Thr Arg Ile Phe Leu Glu Asn Phe Leu Pro Lys Leu Gly
225 230 235 240
Ile Thr Val Thr Ala Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu Ala
245 250 255
Ala Val Asp Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro Thr
260 265 270
Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile Cys
275 280 285
His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr Pro
290 295 300
Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His Ser
305 310 315 320
Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys Ile
325 330 335
Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His Val
340 345 350
Leu Gly Gly Thr Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg Gly
355 360 365
Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala Phe
370 375 380
Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val Tyr
385 390 395 400
Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg Gln
405 410 415
Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Gly Ile
420 425 430
Glu Thr Thr Thr Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile Ala
435 440 445
Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asp Gln Pro Ala Ile Met
450 455 460
Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile Lys
465 470 475 480
Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp Val
485 490 495
Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
500 505
<210> 10
<211> 507
<212> PRT
<213> Arabidopsis thaliana
<400> 10
Met Ser Ser Arg Ile Leu Arg Phe Pro Pro Asp Phe Val Arg Arg Leu
1 5 10 15
Ser Ile Lys Ala Arg Arg Asn Cys Ser Asn Ile Ser Val Thr Gln Ile
20 25 30
Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Ser Pro Thr Ala
35 40 45
Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala Ala
50 55 60
Ser Ala Ala Thr Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala Ala
65 70 75 80
Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala Glu
85 90 95
Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser Lys
100 105 110
His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly Glu
115 120 125
Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val Val
130 135 140
Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp Phe
145 150 155 160
Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn Pro
165 170 175
Thr Ile Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala Glu
180 185 190
Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met Leu
195 200 205
Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp Cys
210 215 220
Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu Gly
225 230 235 240
Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu Ala
245 250 255
Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro Thr
260 265 270
Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile Cys
275 280 285
His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr Pro
290 295 300
Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His Ser
305 310 315 320
Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys Ile
325 330 335
Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His Val
340 345 350
Leu Gly Gly Thr Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg Gly
355 360 365
Met Lys Ala Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala Phe
370 375 380
Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val Tyr
385 390 395 400
Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg Gln
405 410 415
Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp Ile
420 425 430
Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile Ala
435 440 445
Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asn Gln Pro Ala Ile Met
450 455 460
Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile Lys
465 470 475 480
Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp Val
485 490 495
Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
500 505
<210> 11
<211> 476
<212> PRT
<213> Arabidopsis thaliana
<400> 11
Met Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser
1 5 10 15
Ala Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala
20 25 30
Ala Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala
35 40 45
Ala Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala
50 55 60
Glu Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser
65 70 75 80
Lys His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly
85 90 95
Glu Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val
100 105 110
Val Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp
115 120 125
Phe Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn
130 135 140
Pro Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala
145 150 155 160
Glu Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met
165 170 175
Leu Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp
180 185 190
Cys Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu
195 200 205
Gly Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu
210 215 220
Ala Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro
225 230 235 240
Thr Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile
245 250 255
Cys His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr
260 265 270
Pro Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His
275 280 285
Ser Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys
290 295 300
Ile Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His
305 310 315 320
Val Leu Gly Gly Thr Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg
325 330 335
Gly Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala
340 345 350
Phe Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val
355 360 365
Tyr Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg
370 375 380
Gln Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp
385 390 395 400
Ile Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile
405 410 415
Ala Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asp Gln Pro Ala Ile
420 425 430
Met Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile
435 440 445
Lys Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp
450 455 460
Val Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
465 470 475
<210> 12
<211> 476
<212> PRT
<213> Arabidopsis thaliana
<400> 12
Met Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser
1 5 10 15
Ala Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Asp Ser Ser Ala
20 25 30
Ala Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala
35 40 45
Ala Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala
50 55 60
Glu Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser
65 70 75 80
Lys His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly
85 90 95
Glu Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val
100 105 110
Val Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp
115 120 125
Phe Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn
130 135 140
Pro Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala
145 150 155 160
Glu Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met
165 170 175
Leu Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp
180 185 190
Cys Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu
195 200 205
Gly Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu
210 215 220
Ala Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro
225 230 235 240
Thr Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile
245 250 255
Cys His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr
260 265 270
Pro Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His
275 280 285
Ser Ala Thr Lys Phe Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys
290 295 300
Ile Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His
305 310 315 320
Val Leu Gly Gly Pro Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg
325 330 335
Gly Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala
340 345 350
Phe Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val
355 360 365
Tyr Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg
370 375 380
Gln Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp
385 390 395 400
Ile Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile
405 410 415
Ala Pro Ser Phe Gly Gly Cys Glu Ser Leu Val Asp Gln Pro Ala Ile
420 425 430
Met Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile
435 440 445
Lys Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp
450 455 460
Val Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
465 470 475
<210> 13
<211> 476
<212> PRT
<213> Arabidopsis thaliana
<400> 13
Met Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser
1 5 10 15
Ala Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala
20 25 30
Ala Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala
35 40 45
Ala Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala
50 55 60
Glu Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser
65 70 75 80
Lys His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly
85 90 95
Glu Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val
100 105 110
Val Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp
115 120 125
Phe Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn
130 135 140
Pro Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala
145 150 155 160
Glu Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met
165 170 175
Leu Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp
180 185 190
Cys Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu
195 200 205
Gly Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu
210 215 220
Ala Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro
225 230 235 240
Thr Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Val
245 250 255
Cys Arg Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr
260 265 270
Pro Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His
275 280 285
Ser Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys
290 295 300
Ile Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His
305 310 315 320
Val Leu Gly Gly Thr Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg
325 330 335
Gly Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala
340 345 350
Phe Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val
355 360 365
Tyr Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg
370 375 380
Gln Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp
385 390 395 400
Ile Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile
405 410 415
Ala Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asp Gln Pro Ala Ile
420 425 430
Met Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile
435 440 445
Lys Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp
450 455 460
Val Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
465 470 475
<210> 14
<211> 476
<212> PRT
<213> Arabidopsis thaliana
<400> 14
Met Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Leu Pro Ser
1 5 10 15
Ala Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala
20 25 30
Ala Ser Ala Ala Ala Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala
35 40 45
Ala Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala
50 55 60
Glu Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser
65 70 75 80
Lys His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly
85 90 95
Glu Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val
100 105 110
Val Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp
115 120 125
Phe Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn
130 135 140
Pro Thr Thr Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala
145 150 155 160
Glu Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met
165 170 175
Leu Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp
180 185 190
Cys Tyr Arg Lys Thr Arg Ile Phe Leu Glu Asn Phe Leu Pro Lys Leu
195 200 205
Gly Ile Thr Val Thr Ala Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu
210 215 220
Ala Ala Val Asp Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro
225 230 235 240
Thr Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile
245 250 255
Cys His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr
260 265 270
Pro Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His
275 280 285
Ser Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys
290 295 300
Ile Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His
305 310 315 320
Val Leu Gly Gly Thr Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg
325 330 335
Gly Met Lys Thr Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala
340 345 350
Phe Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val
355 360 365
Tyr Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg
370 375 380
Gln Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Gly
385 390 395 400
Ile Glu Thr Thr Thr Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile
405 410 415
Ala Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asp Gln Pro Ala Ile
420 425 430
Met Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile
435 440 445
Lys Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp
450 455 460
Val Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
465 470 475
<210> 15
<211> 476
<212> PRT
<213> Arabidopsis thaliana
<400> 15
Met Val Ala Gly Lys Trp Ser Asn Asn Pro Ser Ser Ala Ser Pro Thr
1 5 10 15
Ala Ala Ala Ala Ala Ala Thr Ser Ser Ala Ser Ala Val Ser Ser Ala
20 25 30
Ala Ser Ala Ala Thr Ala Ser Ser Ala Ala Ala Ala Pro Val Ala Ala
35 40 45
Ala Pro Pro Val Val Leu Lys Ser Val Asp Glu Glu Val Val Val Ala
50 55 60
Glu Glu Gly Ile Arg Glu Lys Ile Gly Ser Val Gln Leu Thr Asp Ser
65 70 75 80
Lys His Ser Phe Leu Ser Ser Asp Gly Ser Leu Thr Val His Ala Gly
85 90 95
Glu Arg Leu Gly Arg Gly Ile Val Thr Asp Ala Ile Thr Thr Pro Val
100 105 110
Val Asn Thr Ser Ala Tyr Phe Phe Lys Lys Thr Ala Glu Leu Ile Asp
115 120 125
Phe Lys Glu Lys Arg Ser Val Ser Phe Glu Tyr Gly Arg Tyr Gly Asn
130 135 140
Pro Thr Ile Val Val Leu Glu Asp Lys Ile Ser Ala Leu Glu Gly Ala
145 150 155 160
Glu Ser Thr Leu Val Met Ala Ser Gly Met Cys Ala Ser Thr Val Met
165 170 175
Leu Leu Ala Leu Val Pro Ala Gly Gly His Ile Val Thr Thr Thr Asp
180 185 190
Cys Tyr Arg Lys Thr Arg Ile Phe Met Glu Asn Phe Leu Pro Lys Leu
195 200 205
Gly Ile Thr Val Thr Val Ile Asp Pro Ala Asp Ile Ala Gly Leu Glu
210 215 220
Ala Ala Val Asn Glu Phe Lys Val Ser Leu Phe Phe Thr Glu Ser Pro
225 230 235 240
Thr Asn Pro Phe Leu Arg Cys Val Asp Ile Glu Leu Val Ser Lys Ile
245 250 255
Cys His Lys Arg Gly Thr Leu Val Cys Ile Asp Gly Thr Phe Ala Thr
260 265 270
Pro Leu Asn Gln Lys Ala Leu Ala Leu Gly Ala Asp Leu Val Val His
275 280 285
Ser Ala Thr Lys Tyr Ile Gly Gly His Asn Asp Val Leu Ala Gly Cys
290 295 300
Ile Cys Gly Ser Leu Lys Leu Val Ser Glu Ile Arg Asn Leu His His
305 310 315 320
Val Leu Gly Gly Thr Leu Asn Pro Asn Ala Ala Tyr Leu Ile Ile Arg
325 330 335
Gly Met Lys Ala Leu His Leu Arg Val Gln Gln Gln Asn Ser Thr Ala
340 345 350
Phe Arg Met Ala Glu Ile Leu Glu Ala His Pro Lys Val Ser His Val
355 360 365
Tyr Tyr Pro Gly Leu Pro Ser His Pro Glu His Glu Leu Ala Lys Arg
370 375 380
Gln Met Thr Gly Phe Gly Gly Val Val Ser Phe Glu Ile Asp Gly Asp
385 390 395 400
Ile Glu Thr Thr Ile Lys Phe Val Asp Ser Leu Lys Ile Pro Tyr Ile
405 410 415
Ala Pro Ser Phe Gly Gly Cys Glu Ser Ile Val Asn Gln Pro Ala Ile
420 425 430
Met Ser Tyr Trp Asp Leu Pro Gln Glu Glu Arg Leu Lys Tyr Gly Ile
435 440 445
Lys Asp Asn Leu Val Arg Phe Ser Phe Gly Val Glu Asp Phe Glu Asp
450 455 460
Val Lys Ala Asp Ile Leu Gln Ala Leu Glu Ala Ile
465 470 475
<210> 16
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 16
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Phe Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 17
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 17
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Leu Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Ala Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asp Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Phe Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Gly Ile Glu Thr Thr Thr Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 18
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 18
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Ile Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Phe Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Ala Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asn Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 19
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 19
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Leu Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Thr Val Ser Glu Ser Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys Tyr Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Gly Ile
<210> 20
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 20
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Val Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Phe Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Ser Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 21
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 21
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Ala Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Gly Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 22
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 22
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Ser Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Ala Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 23
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 23
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Ser Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Ala Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 24
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 24
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Glu
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Ala Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Val
<210> 25
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 25
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Phe Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Ala Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Val
<210> 26
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 26
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Ala Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Ser Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 27
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 27
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Val
<210> 28
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 28
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Ile Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Ala Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
<210> 29
<211> 404
<212> PRT
<213> Arabidopsis thaliana
<400> 29
Met Ser Val Gln Leu Thr Asp Ser Lys His Ser Phe Leu Ser Ser Asp
1 5 10 15
Gly Ser Leu Thr Val His Ala Gly Glu Arg Leu Gly Arg Gly Ile Val
20 25 30
Thr Asp Ala Ile Thr Thr Pro Val Val Asn Thr Ser Ala Tyr Phe Phe
35 40 45
Lys Lys Thr Ala Glu Leu Ile Asp Phe Lys Glu Lys Arg Ser Val Ser
50 55 60
Phe Glu Tyr Gly Arg Tyr Gly Asn Pro Thr Thr Val Val Leu Glu Asp
65 70 75 80
Lys Ile Ser Ala Leu Glu Gly Ala Glu Ser Thr Leu Val Met Ala Ser
85 90 95
Gly Met Cys Ala Ser Thr Val Met Leu Leu Ala Leu Val Pro Ala Gly
100 105 110
Gly His Ile Val Thr Thr Thr Asp Cys Tyr Arg Lys Thr Arg Ile Phe
115 120 125
Met Glu Asn Phe Leu Pro Lys Leu Gly Ile Thr Val Thr Val Ile Asp
130 135 140
Pro Ala Asp Ile Ala Gly Leu Glu Ala Ala Val Asn Glu Phe Lys Val
145 150 155 160
Ser Leu Phe Phe Thr Glu Ser Pro Thr Asn Pro Leu Leu Arg Cys Val
165 170 175
Asp Ile Glu Leu Val Ser Lys Phe Cys His Lys Arg Gly Thr Leu Val
180 185 190
Cys Ile Asp Gly Thr Phe Ala Thr Pro Leu Asn Gln Lys Ala Leu Ala
195 200 205
Leu Gly Ala Asp Leu Val Val His Ser Ala Thr Lys Tyr Ile Gly Gly
210 215 220
His Asn Asp Val Leu Ala Gly Cys Ile Cys Gly Ser Leu Lys Leu Val
225 230 235 240
Ser Glu Ile Arg Asn Leu His His Val Leu Gly Gly Thr Leu Asn Pro
245 250 255
Asn Ala Ala Tyr Leu Ile Ile Arg Gly Met Lys Thr Leu His Leu Arg
260 265 270
Val Gln Gln Gln Asn Ser Thr Ala Phe Arg Met Ala Glu Ile Leu Glu
275 280 285
Ala His Pro Lys Val Ser His Val Tyr Tyr Pro Gly Leu Pro Ser His
290 295 300
Pro Glu His Glu Leu Ala Lys Arg Gln Met Thr Gly Phe Gly Gly Val
305 310 315 320
Val Ser Phe Glu Ile Asp Gly Asp Ile Glu Thr Thr Ile Lys Phe Val
325 330 335
Asp Ser Leu Lys Ile Pro Tyr Ile Ala Pro Ser Phe Gly Gly Cys Glu
340 345 350
Ser Ile Val Asp Gln Pro Ala Ile Met Ser Tyr Trp Asp Leu Pro Gln
355 360 365
Glu Glu Arg Leu Lys Tyr Gly Ile Lys Asp Asn Leu Val Arg Phe Ser
370 375 380
Phe Gly Val Glu Asp Phe Glu Asp Val Lys Ala Asp Ile Leu Gln Ala
385 390 395 400
Leu Glu Ala Ile
Claims (24)
- 하기 반응식에 따라 O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌과 H3PO4로 변환하는, L-메티오닌의 제조 방법:
O-포스포-L-호모세린 + CH3-SH < = > L-메티오닌 + H3PO4. - 제1항에 있어서, 상기 효소적 변환은 OPHS 의존적인 메티오닌 신타제를 사용하여 달성되는 것을 특징으로 하는 방법.
- 제1항 또는 제2항에 있어서, OPHS 의존적인 메티오닌 신타제는 돌연변이 유발에 의해 시스타티오닌 감마 신타제 (EC 2.5.1.48)로부터 유래되는 단백질인 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 변환에 이용되는 효소가 하기 아미노산 서열과 70% 이상의 서열 동일성을 나타내는 아미노산 서열을 가지는 것을 특징으로 하는 효소:
(i) 천연 시스타티오닌 감마 신타제의 아미노산 서열;
(ii) 서열번호 1 또는 2에 기재된 아미노산 서열;
(iii) 서열번호 3에 기재된 아미노산 서열;
(iv) 서열번호 4에 기재된 아미노산 서열; 또는
(v) 서열번호 5에 기재된 아미노산 서열 - 제1항 내지 제4항 중 어느 한항에 있어서, 상기 OPHS 의존적인 메티오닌 신타제가 하기 단백질로 이루어진 군으로부터 선택되는 단백질인 것을 특징으로 하는 방법:
(a) 서열번호 6-29 중 어느 하나에 기재된 아미노산 서열을 포함하는 단백질;
(b) 서열번호 6-29 중 어느 하나의 서열과 60% 이상의 서열 동일성을 가지며, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성을 가진, 단백질. - 제1항 내지 제5항 중 어느 한항에 있어서, 시험관내에서 수행되는 것을 특징으로 하는 방법.
- 제1항 내지 제6항 중 어느 한항에 있어서, 상기 방법은 제2항 내지 제5항 중 어느 한항에 따른 단백질을 생산하는 미생물을 사용함으로써 수행되는 것을 특징으로 하는 방법.
- O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성을 가진 단백질.
- 제8항에 있어서, 돌연변이 유발에 의해 시스타티오닌 감마 신타제 (EC 2.5.1.48)로부터 유래되는 것을 특징으로 하는 단백질.
- 제8항 또는 제9항에 있어서, 하기 아미노산 서열과 70% 이상의 서열 동일성을 나타내는 아미노산 서열을 가지는 것을 특징으로 하는 단백질:
(i) 천연 시스타티오닌 감마 신타제의 아미노산 서열;
(ii) 서열번호 1 또는 2에 기재된 아미노산 서열;
(iii) 서열번호 3에 기재된 아미노산 서열;
(iv) 서열번호 4에 기재된 아미노산 서열; 또는
(v) 서열번호 5에 기재된 아미노산 서열 - 제8항 또는 제9항에 있어서,
O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성을 가지고 있으며,
상기 단백질이 하기 단백질로 이루어진 군으로부터 선택되는 단백질인 것을 특징으로 하는 단백질:
(a) 서열번호 6-29 중 어느 하나에 기재된 아미노산 서열을 포함하는 단백질;
(b) 서열번호 6-29 중 어느 하나의 서열과 60% 이상의 서열 동일성을 가지며, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성을 가진, 단백질. - 제11항에 있어서, 서열번호 6-29 중 어느 하나의 서열과 80% 이상의 서열 동일성을 가지며, O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성을 가지는 단백질인 것을 특징으로 하는 단백질.
- 제9항에 있어서,
(i) 서열번호 3에서 하기 (a) 내지 (jj)로 이루어진 군으로부터 선택되는 하나 이상의 아미노산 잔기의 치환 또는 결손에 의해, 서열번호 3에 기재된 아미노산 서열을 가진 시스타티오닌 감마 신타제로부터 유래되거나;
(a) 10번 프롤린;
(b) 11번 아스파라긴;
(c) 15번 글루타민;
(d) 27번 이소루신;
(e) 30번 알라닌;
(f) 45번 루신;
(g) 47번 세린;
(h) 60번 발린;
(i) 68번 알라닌;
(j) 150번 페닐알라닌;
(k) 178번 트레오닌;
(l) 183번 아스파르테이트;
(m) 185번 이소루신;
(n) 220번 트레오닌;
(o) 232번 메티오닌;
(p) 245번 발린;
(q) 257번 알라닌;
(r) 259번 아스파라긴;
(s) 261번 페닐알라닌;
(t) 275번 페닐알라닌;
(u) 287번 이소루신;
(v) 289번 히스티딘;
(w) 324번 티로신;
(x) 326번 글리신;
(y) 356번 프롤린;
(z) 371번 트레오닌;
(aa) 396번 발린;
(bb) 405번 프롤린;
(cc) 431번 아스파르테이트;
(dd) 436번 이소루신;
(ee) 457번 이소루신;
(ff) 459번 아스파르테이트;
(gg) 470번 프롤린;
(hh) 472번 글루타메이트;
(ii) 506번 알라닌;
(jj) 507번 이소루신,
또는
(ii) 서열번호 3에서 상기 열거된 (a) - (jj) 중 어느 하나에 해당되는 하나 이상의 아미노산 잔기의 치환 또는 결손에 의해, 시스타티오닌 감마 신타제로부터 유래되며, 서열번호 3에 기재된 아미노산 서열과의 서열 동일성이 60% 이상인 아미노산 서열을 가지는 단백질,
또는
(iii) 서열번호 3에 기재된 아미노산 서열내 1-103번의 아미노산들에 해당되는 N-말단 아미노산들 중 하나 이상이 결손됨으로써 상기 (i) 또는 (ii)의 단백질로부터 유래되는 것을 특징으로 하는 단백질. - 제9항 내지 제13항 중 어느 한항에 있어서, O-포스포-L-호모세린과 설파이드를 L-호모시스테인 + H3PO4로 변환하는 효소 활성을 나타내는 것을 특징으로 하는 단백질.
- 제8항 내지 제14항 중 어느 한항에 따른 단백질을 코딩하는 핵산 분자로서,
상기 단백질은 O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환하는 효소 활성을 가진 것을 특징으로 하는 핵산 분자. - 제15항에 따른 핵산 분자를 포함하는 벡터.
- 제15항에 따른 핵산 분자 또는 제16항에 따른 벡터를 포함하는 숙주 세포.
- 제17항에 있어서, 제8항 내지 제14항 중 어느 한항에 따른 단백질을 발현하는 것을 특징으로 하는 숙주 세포.
- O-포스포-L-호모세린과 메탄티올을 L-메티오닌과 H3PO4로 변환시키는데 있어, 제8항 내지 제14항 중 어느 한항에 따른 단백질, 또는 제18항에 따른 숙주 세포의, 용도.
- O-포스포-L-호모세린과 메탄티올을 L-메티오닌으로 변환할 수 있는 단백질을 코딩하는 핵산 분자의 제조 방법으로서,
(i) 시스타티오닌 감마 신타제 (EC 2.5.1.48)를 코딩하는 핵산 분자에 돌연변이를 유발하여, 돌연변이된 시스타티오닌 감마 신타제를 제조하는 단계;
(ii) (i) 단계에서 수득한 돌연변이된 핵산 분자를 숙주 세포에서 O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환할 수 있는 단백질을 코딩하는 핵산 분자를 선별할 수 있는 배양 조건 하에 발현시키는 단계;
(iii) O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환할 수 있는 단백질을 발현하는 숙주 세포를 동정하는 단계; 및
(iv) 단계 (iii)에서 동정된 숙주 세포로부터 O-포스포-L-호모세린과 메탄티올을 효소에 의해 L-메티오닌으로 변환할 수 있는 돌연변이된 시스타티오닌 감마 신타제를 코딩하는 핵산 분자를 수득하는 단계를 포함하는 것을 특징으로 하는 방법. - S-아데노실 메티오닌의 제조 방법으로서,
L-메티오닌을 생산하기 위해 제1항 내지 제7항 중 어느 한항에 따른 방법을 포함하며, L-메티오닌을 S-아데노실 메티오닌으로 변환하는 단계를 더 포함하는, S-아데노실 메티오닌의 제조 방법. - 시스테인의 제조 방법으로서,
L-메티오닌을 생산하기 위해 제1항 내지 제7항 중 어느 한항에 따른 방법을 포함하며, L-메티오닌을 시스테인으로 변환하는 단계를 더 포함하는, 시스테인의 제조 방법. - 글루타티온의 제조 방법으로서, L-메티오닌을 생산하기 위해 제1항 내지 제7항 중 어느 한항에 따른 방법을 포함하며, L-메티오닌을 글루타티온으로 변환하는 단계를 더 포함하는, 글루타티온의 제조 방법.
- 2-옥소-4-메틸티오부타노에이트의 제조 방법으로서,
L-메티오닌을 생산하기 위해 제1항 내지 제7항 중 어느 한항에 따른 방법을 포함하며, L-메티오닌을 2-옥소-4-메틸티오부타노에이트로 변환하는 단계를 더 포함하는, 2-옥소-4-메틸티오부타노에이트의 제조 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12190150.8 | 2012-10-26 | ||
EP12190150 | 2012-10-26 | ||
PCT/EP2013/072380 WO2014064244A2 (en) | 2012-10-26 | 2013-10-25 | Means and methods for the enzymatic production of l-methionine from o-phospho-l-homoserine and methanethiol |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150076159A true KR20150076159A (ko) | 2015-07-06 |
KR102126318B1 KR102126318B1 (ko) | 2020-06-25 |
Family
ID=47071182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157009704A KR102126318B1 (ko) | 2012-10-26 | 2013-10-25 | 돌연변이된 시스타티오닌 감마 신타제를 이용한 o-포스포-l-호모세린 및 메탄티올로부터 l-메티오닌의 제조 방법 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9803225B2 (ko) |
EP (1) | EP2912185A2 (ko) |
JP (1) | JP6438402B2 (ko) |
KR (1) | KR102126318B1 (ko) |
CN (1) | CN104755625B (ko) |
BR (1) | BR112015007212B1 (ko) |
IN (1) | IN2015DN02439A (ko) |
MY (1) | MY176164A (ko) |
RU (1) | RU2650859C2 (ko) |
WO (1) | WO2014064244A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170052665A1 (en) * | 2015-08-20 | 2017-02-23 | Samsung Electronics Co., Ltd. | Method of text input for wearable devices |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3330380A1 (en) * | 2016-12-05 | 2018-06-06 | Evonik Degussa GmbH | Process for producing l-methionine from methional |
RU2020105358A (ru) | 2017-07-11 | 2021-08-11 | Адиссео Франс С.А.С. | Дрожжи, продуцирующие метионин |
KR102025867B1 (ko) | 2017-07-13 | 2019-09-27 | 씨제이제일제당 주식회사 | 인산을 발효액 또는 발효 폐액으로부터 회수 및 재사용하는 방법 |
JP6894650B2 (ja) * | 2018-10-30 | 2021-06-30 | GreenEarthInstitute株式会社 | 有機化合物の製造方法およびコリネ型細菌 |
US20220315965A1 (en) * | 2019-06-25 | 2022-10-06 | Zymergen Inc. | Engineered biosynthetic pathways for production of cystathionine by fermentation |
KR20230138803A (ko) | 2022-03-24 | 2023-10-05 | 씨제이제일제당 (주) | 인산을 발효액 또는 발효 폐액으로부터 회수 및 재사용하는 방법 |
WO2024179538A1 (zh) * | 2023-03-01 | 2024-09-06 | 湖南利尔生物科技有限公司 | 一种从l-高丝氨酸直接制备l-甲硫氨酸的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011031285A1 (en) * | 2009-09-08 | 2011-03-17 | Shai Ufaz | Improving essential amino acid content in algae and cyanobacteria for animal feed |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1993017112A1 (en) | 1992-02-20 | 1993-09-02 | Genencor International, Inc. | Biosynthesis of methionine using a reduced source of sulfur |
EP1846547A2 (en) * | 2005-02-07 | 2007-10-24 | Metabolic Explorer | Microorganisms comprising enzymes expressed with low gamma-elimination activity |
RU2447146C2 (ru) * | 2005-07-18 | 2012-04-10 | Эвоник Дегусса Гмбх | Рекомбинантные микроорганизмы, продуцирующие метионин |
-
2013
- 2013-10-25 WO PCT/EP2013/072380 patent/WO2014064244A2/en active Application Filing
- 2013-10-25 EP EP13792606.9A patent/EP2912185A2/en active Pending
- 2013-10-25 CN CN201380055160.XA patent/CN104755625B/zh active Active
- 2013-10-25 IN IN2439DEN2015 patent/IN2015DN02439A/en unknown
- 2013-10-25 MY MYPI2015000684A patent/MY176164A/en unknown
- 2013-10-25 JP JP2015538462A patent/JP6438402B2/ja active Active
- 2013-10-25 US US14/438,847 patent/US9803225B2/en active Active
- 2013-10-25 RU RU2015119400A patent/RU2650859C2/ru active
- 2013-10-25 KR KR1020157009704A patent/KR102126318B1/ko active IP Right Grant
- 2013-10-25 BR BR112015007212-7A patent/BR112015007212B1/pt active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011031285A1 (en) * | 2009-09-08 | 2011-03-17 | Shai Ufaz | Improving essential amino acid content in algae and cyanobacteria for animal feed |
Non-Patent Citations (3)
Title |
---|
Journal of Biological Chemistry, Vol. 277, pp. 36380-36386 (2002.) * |
Nucleic Acid Research, Vol. 24, pp. 2627-2631 (1996.) * |
Plant Physiology, Vol. 128, pp. 454-462 (2002.) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170052665A1 (en) * | 2015-08-20 | 2017-02-23 | Samsung Electronics Co., Ltd. | Method of text input for wearable devices |
US10382927B2 (en) * | 2015-08-20 | 2019-08-13 | Samsung Electronics Co., Ltd. | Method of text input for wearable devices |
Also Published As
Publication number | Publication date |
---|---|
BR112015007212B1 (pt) | 2022-07-05 |
JP2015533280A (ja) | 2015-11-24 |
US20150275247A1 (en) | 2015-10-01 |
US9803225B2 (en) | 2017-10-31 |
CN104755625B (zh) | 2020-02-07 |
MY176164A (en) | 2020-07-24 |
IN2015DN02439A (ko) | 2015-09-04 |
WO2014064244A3 (en) | 2014-08-14 |
CN104755625A (zh) | 2015-07-01 |
RU2015119400A (ru) | 2016-12-20 |
EP2912185A2 (en) | 2015-09-02 |
KR102126318B1 (ko) | 2020-06-25 |
JP6438402B2 (ja) | 2018-12-12 |
BR112015007212A2 (pt) | 2018-01-30 |
RU2650859C2 (ru) | 2018-04-17 |
WO2014064244A2 (en) | 2014-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102126318B1 (ko) | 돌연변이된 시스타티오닌 감마 신타제를 이용한 o-포스포-l-호모세린 및 메탄티올로부터 l-메티오닌의 제조 방법 | |
EP3517607B1 (en) | Novel aspartokinase mutant and method for production of l-amino acid using same | |
US9150893B2 (en) | Compositions and methods of producing methionine | |
KR101586098B1 (ko) | 메티오닌 수득량의 증가법 | |
EP1969130B1 (en) | Process for the preparation of methionine and its precursors homoserine or succinylhomoserine employing a microorganism | |
KR101944150B1 (ko) | 메티오닌의 발효적 생산을 위한 재조합 미생물 | |
KR100275287B1 (ko) | O-아세틸세린,l-시스테인및l-시스테인 유도생성물의 제조방법 | |
JP2008529485A (ja) | 低いγ脱離活性を有する発現酵素を含む微生物 | |
KR20070036139A (ko) | 황 함유 화합물을 생산하는 미생물 | |
US20050255568A1 (en) | Methods and compositions for amino acid production | |
EP3490969B1 (en) | N-acetyl homoserine | |
CN110869384A (zh) | 具有改善的铁硫簇递送的细胞工厂 | |
BRPI0720967A2 (pt) | Metionina sintases com inibição reduzida de produto. | |
JP2019149972A (ja) | エルゴチオネイン合成微生物、及びエルゴチオネインの製造方法 | |
JP2007525951A (ja) | アミノ酸生産用の方法および組成物 | |
US20140342399A1 (en) | Microorganism and method for overproduction of gamma-glutamylcysteine and derivatives of this dipeptide by fermentation | |
US9234223B2 (en) | Method for producing L-cysteine | |
WO2017005910A1 (en) | Methionine hydroxy analog (mha) pathways for production by fermentation | |
US10301657B2 (en) | Amino acid-producing microorganisms and methods of making and using | |
US11162122B2 (en) | Methionine-producing yeast | |
Yeom et al. | Regulation of enzymes involved in methionine biosynthesis in Corynebacterium glutamicum |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |