TW202315944A - 新穎YhhS變異體及使用其生產O-磷絲胺酸、半胱胺酸及半胱胺酸之衍生物的方法 - Google Patents
新穎YhhS變異體及使用其生產O-磷絲胺酸、半胱胺酸及半胱胺酸之衍生物的方法 Download PDFInfo
- Publication number
- TW202315944A TW202315944A TW111120779A TW111120779A TW202315944A TW 202315944 A TW202315944 A TW 202315944A TW 111120779 A TW111120779 A TW 111120779A TW 111120779 A TW111120779 A TW 111120779A TW 202315944 A TW202315944 A TW 202315944A
- Authority
- TW
- Taiwan
- Prior art keywords
- leu
- ala
- gly
- val
- variant
- Prior art date
Links
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 title claims abstract description 31
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 title claims abstract description 25
- 235000018417 cysteine Nutrition 0.000 title claims abstract description 25
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 21
- 150000001945 cysteines Chemical class 0.000 title abstract 2
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 claims abstract description 110
- 108091033319 polynucleotide Proteins 0.000 claims description 121
- 102000040430 polynucleotide Human genes 0.000 claims description 121
- 239000002157 polynucleotide Substances 0.000 claims description 121
- 244000005700 microbiome Species 0.000 claims description 105
- 230000000694 effects Effects 0.000 claims description 90
- 235000001014 amino acid Nutrition 0.000 claims description 89
- 229940024606 amino acid Drugs 0.000 claims description 88
- 150000001413 amino acids Chemical class 0.000 claims description 79
- 239000013598 vector Substances 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 31
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 28
- 229960000310 isoleucine Drugs 0.000 claims description 19
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 19
- 108030001910 O-phosphoserine sulfhydrylases Proteins 0.000 claims description 18
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 18
- 235000004400 serine Nutrition 0.000 claims description 18
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 17
- 239000004471 Glycine Substances 0.000 claims description 15
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 14
- 239000004474 valine Substances 0.000 claims description 14
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 13
- 235000013922 glutamic acid Nutrition 0.000 claims description 13
- 239000004220 glutamic acid Substances 0.000 claims description 13
- 238000012258 culturing Methods 0.000 claims description 10
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical group CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 9
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 claims description 9
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 9
- 239000004473 Threonine Substances 0.000 claims description 9
- 235000008521 threonine Nutrition 0.000 claims description 9
- 235000004279 alanine Nutrition 0.000 claims description 8
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 7
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 6
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 6
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 6
- 235000003704 aspartic acid Nutrition 0.000 claims description 6
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 5
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 5
- 102100021762 Phosphoserine phosphatase Human genes 0.000 claims description 4
- 108010076573 phosphoserine phosphatase Proteins 0.000 claims description 4
- 241000588722 Escherichia Species 0.000 claims description 3
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 claims description 3
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 claims description 2
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 claims 2
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 claims 1
- 229950006137 dexfosfoserine Drugs 0.000 claims 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 121
- 229920001184 polypeptide Polymers 0.000 description 120
- 102000004196 processed proteins & peptides Human genes 0.000 description 120
- 125000003275 alpha amino acid group Chemical group 0.000 description 89
- 108090000623 proteins and genes Proteins 0.000 description 48
- 108010050848 glycylleucine Proteins 0.000 description 41
- 108020004414 DNA Proteins 0.000 description 38
- 239000002609 medium Substances 0.000 description 37
- 230000014509 gene expression Effects 0.000 description 36
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 32
- 239000012634 fragment Substances 0.000 description 30
- 210000004027 cell Anatomy 0.000 description 29
- 239000002773 nucleotide Substances 0.000 description 25
- 125000003729 nucleotide group Chemical group 0.000 description 25
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 23
- 210000000349 chromosome Anatomy 0.000 description 23
- 230000004048 modification Effects 0.000 description 22
- 238000012986 modification Methods 0.000 description 22
- 230000035772 mutation Effects 0.000 description 20
- 229960001153 serine Drugs 0.000 description 20
- 238000006467 substitution reaction Methods 0.000 description 20
- 108020004705 Codon Proteins 0.000 description 19
- 230000001747 exhibiting effect Effects 0.000 description 18
- 101150083023 mgsA gene Proteins 0.000 description 17
- 210000002706 plastid Anatomy 0.000 description 17
- 235000018102 proteins Nutrition 0.000 description 17
- 102000004169 proteins and genes Human genes 0.000 description 17
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 16
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 16
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 16
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 16
- 125000000539 amino acid group Chemical group 0.000 description 16
- 108010037850 glycylvaline Proteins 0.000 description 16
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 15
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 15
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 15
- 150000001944 cysteine derivatives Chemical class 0.000 description 14
- 108010090894 prolylleucine Proteins 0.000 description 14
- 101100139916 Escherichia coli (strain K12) rarA gene Proteins 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 108700026244 Open Reading Frames Proteins 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 230000010076 replication Effects 0.000 description 10
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 9
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 9
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 9
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 9
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 9
- 108091081024 Start codon Proteins 0.000 description 9
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 9
- 108010005233 alanylglutamic acid Proteins 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 239000001963 growth medium Substances 0.000 description 9
- 108010057821 leucylproline Proteins 0.000 description 9
- 108010051242 phenylalanylserine Proteins 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 8
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 8
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 8
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 8
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 8
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 8
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 8
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 8
- SGFBVLBKDSXGAP-GKCIPKSASA-N Ala-Phe-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N SGFBVLBKDSXGAP-GKCIPKSASA-N 0.000 description 8
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 8
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 8
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 8
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 8
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 8
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 8
- CDGHMJJJHYKMPA-DLOVCJGASA-N Asn-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)N)N CDGHMJJJHYKMPA-DLOVCJGASA-N 0.000 description 8
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 8
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 8
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 8
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 8
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 8
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 8
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 8
- DUAWRXXTOQOECJ-JSGCOSHPSA-N Gly-Tyr-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O DUAWRXXTOQOECJ-JSGCOSHPSA-N 0.000 description 8
- JFFAPRNXXLRINI-NHCYSSNCSA-N His-Asp-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JFFAPRNXXLRINI-NHCYSSNCSA-N 0.000 description 8
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 8
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 8
- DJQUZZAFLFQVFL-UHFFFAOYSA-N Ile-Gly-Leu-Pro Chemical compound CCC(C)C(N)C(=O)NCC(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O DJQUZZAFLFQVFL-UHFFFAOYSA-N 0.000 description 8
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 8
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 8
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 8
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 8
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 8
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 8
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 8
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 8
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 8
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 8
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 8
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 8
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 8
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 8
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 8
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 8
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 8
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 8
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 8
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 8
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 8
- BQHLZUMZOXUWNU-DCAQKATOSA-N Met-Pro-Glu Chemical compound CSCC[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BQHLZUMZOXUWNU-DCAQKATOSA-N 0.000 description 8
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 8
- NHHZWPNMYQUNEH-ACRUOGEOSA-N Phe-Tyr-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N NHHZWPNMYQUNEH-ACRUOGEOSA-N 0.000 description 8
- PEYNRYREGPAOAK-LSJOCFKGSA-N Pro-His-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 PEYNRYREGPAOAK-LSJOCFKGSA-N 0.000 description 8
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 8
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 8
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 8
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 8
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 8
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 8
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 8
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 8
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 8
- LHHDBONOFZDWMW-AAEUAGOBSA-N Trp-Asp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LHHDBONOFZDWMW-AAEUAGOBSA-N 0.000 description 8
- WSGPBCAGEGHKQJ-BBRMVZONSA-N Trp-Gly-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WSGPBCAGEGHKQJ-BBRMVZONSA-N 0.000 description 8
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 8
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 8
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 8
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 8
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 8
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 8
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 8
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 8
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 8
- 229960003767 alanine Drugs 0.000 description 8
- 108010047495 alanylglycine Proteins 0.000 description 8
- 108010060035 arginylproline Proteins 0.000 description 8
- 108010036533 arginylvaline Proteins 0.000 description 8
- 238000004925 denaturation Methods 0.000 description 8
- 230000036425 denaturation Effects 0.000 description 8
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 8
- 108010010147 glycylglutamine Proteins 0.000 description 8
- 108010087823 glycyltyrosine Proteins 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 108010034529 leucyl-lysine Proteins 0.000 description 8
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 8
- 108010054155 lysyllysine Proteins 0.000 description 8
- 229930182817 methionine Natural products 0.000 description 8
- 235000006109 methionine Nutrition 0.000 description 8
- 238000006116 polymerization reaction Methods 0.000 description 8
- 108010070643 prolylglutamic acid Proteins 0.000 description 8
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 7
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 7
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 7
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 7
- UTSMXMABBPFVJP-SZMVWBNQSA-N Arg-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UTSMXMABBPFVJP-SZMVWBNQSA-N 0.000 description 7
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 7
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 7
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 7
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 7
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 7
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 7
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 7
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 7
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 7
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 7
- OAOLATANIHTNCZ-IHRRRGAJSA-N Phe-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N OAOLATANIHTNCZ-IHRRRGAJSA-N 0.000 description 7
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 7
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 7
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 7
- CXUFDWZBHKUGKK-CABZTGNLSA-N Trp-Ala-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O)=CNC2=C1 CXUFDWZBHKUGKK-CABZTGNLSA-N 0.000 description 7
- OFTGYORHQMSPAI-PJODQICGSA-N Trp-Met-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O OFTGYORHQMSPAI-PJODQICGSA-N 0.000 description 7
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 7
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 7
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 7
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 238000001802 infusion Methods 0.000 description 7
- 229910052757 nitrogen Inorganic materials 0.000 description 7
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 239000002243 precursor Substances 0.000 description 7
- 108010004914 prolylarginine Proteins 0.000 description 7
- 238000011144 upstream manufacturing Methods 0.000 description 7
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 6
- ZEVPMOHYCQFWSE-NAKRPEOUSA-N Met-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N ZEVPMOHYCQFWSE-NAKRPEOUSA-N 0.000 description 6
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 6
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 6
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 6
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 6
- 239000002253 acid Substances 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 101150033014 rhtB gene Proteins 0.000 description 6
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 5
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 5
- PWKSKIMOESPYIA-BYPYZUCNSA-N L-N-acetyl-Cysteine Chemical compound CC(=O)N[C@@H](CS)C(O)=O PWKSKIMOESPYIA-BYPYZUCNSA-N 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 5
- GBFLZEXEOZUWRN-VKHMYHEASA-N S-carboxymethyl-L-cysteine Chemical compound OC(=O)[C@@H](N)CSCC(O)=O GBFLZEXEOZUWRN-VKHMYHEASA-N 0.000 description 5
- 229930006000 Sucrose Natural products 0.000 description 5
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 5
- 229960004308 acetylcysteine Drugs 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 125000004429 atom Chemical group 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- -1 glycine amino acid Chemical class 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 229960004793 sucrose Drugs 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 235000002374 tyrosine Nutrition 0.000 description 5
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 5
- 108020003589 5' Untranslated Regions Proteins 0.000 description 4
- 241001646716 Escherichia coli K-12 Species 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 4
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 4
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 4
- 125000003277 amino group Chemical group 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004440 column chromatography Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 4
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 235000013379 molasses Nutrition 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 229910052717 sulfur Inorganic materials 0.000 description 4
- 125000003396 thiol group Chemical group [H]S* 0.000 description 4
- 108020005544 Antisense RNA Proteins 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 3
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 3
- 239000004201 L-cysteine Substances 0.000 description 3
- 235000013878 L-cysteine Nutrition 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- 102000015841 Major facilitator superfamily Human genes 0.000 description 3
- 108050004064 Major facilitator superfamily Proteins 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000003184 complementary RNA Substances 0.000 description 3
- 239000000306 component Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 230000003827 upregulation Effects 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 230000003313 weakening effect Effects 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- VHPXSBIFWDAFMB-UHFFFAOYSA-N 2-amino-Delta(2)-thiazoline-4-carboxylic acid Chemical compound NC1=[NH+]C(C([O-])=O)CS1 VHPXSBIFWDAFMB-UHFFFAOYSA-N 0.000 description 2
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000186146 Brevibacterium Species 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- 108010024636 Glutathione Proteins 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- ILRYLPWNYFXEMH-WHFBIAKZSA-N L-cystathionine Chemical compound [O-]C(=O)[C@@H]([NH3+])CCSC[C@H]([NH3+])C([O-])=O ILRYLPWNYFXEMH-WHFBIAKZSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 2
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 108010009736 Protein Hydrolysates Proteins 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- KEANSLVUGJADPN-LKTVYLICSA-N Tyr-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N KEANSLVUGJADPN-LKTVYLICSA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 235000011114 ammonium hydroxide Nutrition 0.000 description 2
- 239000000074 antisense oligonucleotide Substances 0.000 description 2
- 238000012230 antisense oligonucleotides Methods 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 229960003180 glutathione Drugs 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 150000002484 inorganic compounds Chemical class 0.000 description 2
- 229910010272 inorganic material Inorganic materials 0.000 description 2
- 239000007951 isotonicity adjuster Substances 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 2
- 235000019341 magnesium sulphate Nutrition 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 101150103854 yhhS gene Proteins 0.000 description 2
- WFDQTEFRLDDJAM-LURJTMIESA-N (2r)-2-[(2-methylpropan-2-yl)oxycarbonylamino]-3-methylsulfanylpropanoic acid Chemical compound CSC[C@@H](C(O)=O)NC(=O)OC(C)(C)C WFDQTEFRLDDJAM-LURJTMIESA-N 0.000 description 1
- ULBLKXPBISVARU-BYPYZUCNSA-N (2r)-2-amino-3-(1,3-thiazol-2-ylsulfanyl)propanoic acid Chemical compound OC(=O)[C@@H](N)CSC1=NC=CS1 ULBLKXPBISVARU-BYPYZUCNSA-N 0.000 description 1
- XRPOWEFAFQZLRI-YFKPBYRVSA-N (2r)-2-amino-3-thiophen-2-ylsulfanylpropanoic acid Chemical compound OC(=O)[C@@H](N)CSC1=CC=CS1 XRPOWEFAFQZLRI-YFKPBYRVSA-N 0.000 description 1
- YVOOPGWEIRIUOX-BXRBKJIMSA-N (2r)-2-azanyl-3-sulfanyl-propanoic acid Chemical compound SC[C@H](N)C(O)=O.SC[C@H](N)C(O)=O YVOOPGWEIRIUOX-BXRBKJIMSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- YPFNIPKMNMDDDB-UHFFFAOYSA-K 2-[2-[bis(carboxylatomethyl)amino]ethyl-(2-hydroxyethyl)amino]acetate;iron(3+) Chemical compound [Fe+3].OCCN(CC([O-])=O)CCN(CC([O-])=O)CC([O-])=O YPFNIPKMNMDDDB-UHFFFAOYSA-K 0.000 description 1
- PWKSKIMOESPYIA-UHFFFAOYSA-N 2-acetamido-3-sulfanylpropanoic acid Chemical compound CC(=O)NC(CS)C(O)=O PWKSKIMOESPYIA-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000567139 Aeropyrum pernix Species 0.000 description 1
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 1
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IDLBLNBDLCTPGC-HERUPUMHSA-N Ala-Trp-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CS)C(=O)O)N IDLBLNBDLCTPGC-HERUPUMHSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 101100533902 Arabidopsis thaliana SPL13A gene Proteins 0.000 description 1
- 101100533904 Arabidopsis thaliana SPL13B gene Proteins 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 1
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 1
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- 101100455080 Bacillus subtilis (strain 168) lmrB gene Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- GGLZPLKKBSSKCX-RXMQYKEDSA-N D-ethionine Chemical compound CCSCC[C@@H](N)C(O)=O GGLZPLKKBSSKCX-RXMQYKEDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- UFNSPPFJOHNXRE-AUTRQRHGSA-N Gln-Gln-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UFNSPPFJOHNXRE-AUTRQRHGSA-N 0.000 description 1
- CLSDNFWKGFJIBZ-YUMQZZPRSA-N Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O CLSDNFWKGFJIBZ-YUMQZZPRSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- XKPOCESCRTVRPL-KBIXCLLPSA-N Glu-Cys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XKPOCESCRTVRPL-KBIXCLLPSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- GMAGZGCAYLQBKF-NHCYSSNCSA-N Glu-Met-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GMAGZGCAYLQBKF-NHCYSSNCSA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 1
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- SYVMEYAPXRRXAN-MXAVVETBSA-N Ile-Cys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SYVMEYAPXRRXAN-MXAVVETBSA-N 0.000 description 1
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 1
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- KWHFUMYCSPJCFQ-NGTWOADLSA-N Ile-Thr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N KWHFUMYCSPJCFQ-NGTWOADLSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- 229910021578 Iron(III) chloride Inorganic materials 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- VHPXSBIFWDAFMB-REOHCLBHSA-N L-2-amino-Delta(2)-thiazoline-4-carboxylic acid Chemical compound NC1=[NH+][C@H](C([O-])=O)CS1 VHPXSBIFWDAFMB-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- LSPYFSHXDAYVDI-SRVKXCTJSA-N Leu-Ala-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C LSPYFSHXDAYVDI-SRVKXCTJSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- FLNPJLDPGMLWAU-UWVGGRQHSA-N Leu-Met-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(C)C FLNPJLDPGMLWAU-UWVGGRQHSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- 101001090725 Leuconostoc gelidum Bacteriocin leucocin-A Proteins 0.000 description 1
- 108010036940 Levansucrase Proteins 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- UWKNTTJNVSYXPC-CIUDSAMLSA-N Lys-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN UWKNTTJNVSYXPC-CIUDSAMLSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- UDXSLGLHFUBRRM-OEAJRASXSA-N Lys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCCCN)N)O UDXSLGLHFUBRRM-OEAJRASXSA-N 0.000 description 1
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 1
- MPCKIRSXNKACRF-GUBZILKMSA-N Met-Pro-Asn Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O MPCKIRSXNKACRF-GUBZILKMSA-N 0.000 description 1
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 1
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 241000187480 Mycobacterium smegmatis Species 0.000 description 1
- 241000187479 Mycobacterium tuberculosis Species 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 101710161951 O-phosphoserine sulfhydrylase Proteins 0.000 description 1
- 206010068319 Oropharyngeal pain Diseases 0.000 description 1
- 101100070556 Oryza sativa subsp. japonica HSFA4D gene Proteins 0.000 description 1
- 101100043227 Oryza sativa subsp. japonica SPL13 gene Proteins 0.000 description 1
- 101710190786 PI protein Proteins 0.000 description 1
- 101150038013 PIR gene Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 201000007100 Pharyngitis Diseases 0.000 description 1
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 1
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- 241000588768 Providencia Species 0.000 description 1
- 101150099282 SPL7 gene Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- 241000224527 Trichomonas vaginalis Species 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 1
- SMKXLHVZIFKQRB-GUBZILKMSA-N Val-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N SMKXLHVZIFKQRB-GUBZILKMSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- YQMILNREHKTFBS-IHRRRGAJSA-N Val-Phe-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YQMILNREHKTFBS-IHRRRGAJSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000012345 acetylating agent Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 235000012501 ammonium carbonate Nutrition 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- UYJXRRSPUVSSMN-UHFFFAOYSA-P ammonium sulfide Chemical compound [NH4+].[NH4+].[S-2] UYJXRRSPUVSSMN-UHFFFAOYSA-P 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000003434 antitussive agent Substances 0.000 description 1
- 229940124584 antitussives Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- 238000012365 batch cultivation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- UUQMNUMQCIQDMZ-UHFFFAOYSA-N betahistine Chemical compound CNCCC1=CC=CC=N1 UUQMNUMQCIQDMZ-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005516 coenzyme A Substances 0.000 description 1
- 229940093530 coenzyme a Drugs 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- AIUDWMLXCFRVDR-UHFFFAOYSA-N dimethyl 2-(3-ethyl-3-methylpentyl)propanedioate Chemical class CCC(C)(CC)CCC(C(=O)OC)C(=O)OC AIUDWMLXCFRVDR-UHFFFAOYSA-N 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 1
- 229910000397 disodium phosphate Inorganic materials 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 230000009036 growth inhibition Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000030603 inherited susceptibility to asthma Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 229910000358 iron sulfate Inorganic materials 0.000 description 1
- RBTARNINKXHZNM-UHFFFAOYSA-K iron trichloride Chemical compound Cl[Fe](Cl)Cl RBTARNINKXHZNM-UHFFFAOYSA-K 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- RUTXIHLAWFEWGM-UHFFFAOYSA-H iron(3+) sulfate Chemical compound [Fe+3].[Fe+3].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O RUTXIHLAWFEWGM-UHFFFAOYSA-H 0.000 description 1
- 229910000360 iron(III) sulfate Inorganic materials 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229940099596 manganese sulfate Drugs 0.000 description 1
- 239000011702 manganese sulphate Substances 0.000 description 1
- 235000007079 manganese sulphate Nutrition 0.000 description 1
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012533 medium component Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 125000001037 p-tolyl group Chemical group [H]C1=C([H])C(=C([H])C([H])=C1*)C([H])([H])[H] 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 229940066779 peptones Drugs 0.000 description 1
- 235000011007 phosphoric acid Nutrition 0.000 description 1
- 150000003014 phosphoric acid esters Chemical class 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920001522 polyglycol ester Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 235000011118 potassium hydroxide Nutrition 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000007398 protein translocation Effects 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 230000000246 remedial effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 101150062776 yccA gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/06—Alanine; Leucine; Isoleucine; Serine; Homoserine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/12—Methionine; Cysteine; Cystine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01065—O-Phosphoserine sulfhydrylase (2.5.1.65)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/03—Phosphoric monoester hydrolases (3.1.3)
- C12Y301/03003—Phosphoserine phosphatase (3.1.3.3)
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本發明是有關新穎YhhS變異體及使用其生產O-磷絲胺酸、半胱胺酸及半胱胺酸之衍生物的方法
Description
本發明是有關YhhS變異體及使用其生產O-磷絲胺酸、半胱胺酸及半胱胺酸之衍生物的方法。
左旋半胱胺酸(L-cysteine)為所有生物體中之硫代謝重要的胺基酸,且不僅被用於體內蛋白諸如頭髮角蛋白、麩胱甘肽(glutathione)、生物素、甲硫胺酸及其他含硫代謝物的合成,亦作為輔酶A生物合成的前驅物。
作為用於使用一微生物生產左旋半胱胺酸的方法,1) 其中右旋、左旋ATC(D,L-2-胺基噻唑啉-4-羧酸,D,L-2-aminothiazoline-4-carboxylic acid)使用一微生物進行生物轉化(biologically converted)的方法、2) 其中使用
E. coli而生產左旋半胱胺酸的直接發酵法(EP 0885962 B; Wada M and Takagi H,
Appl. Microbiol. Biochem., 73:48-54, 2006),及3) 其中O-磷絲胺酸(O-phosphoserine,OPS)藉由使用一微生物之發酵作用並接著藉由O-磷絲胺酸硫氫化酶(O-phosphoserine sulfhydrylase,OPSS)之催化而與一硫化物反應以被轉化成左旋半胱胺酸而生產的方法(美國發明專利第8557549 B2號)為已知的。
此時,為了在高產率下藉由方法3)生產半胱胺酸,需要生產過量的OPS作為前驅物。
[
技術問題
]
本發明的一個目的是提供一種YhhS變異體,其中對應於SEQ ID NO: 1之該胺基酸序列中第129位置的一胺基酸是以另一胺基酸所取代。
本發明的另一目的是提供一種YhhS變異體,其中異白胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第241位置的一胺基酸,是以麩醯胺酸所取代。
本發明的再另一目的是提供編碼本發明之該變異體的一多核苷酸。
本發明的再另一目的是提供大腸桿菌屬(genus
Escherichia)的一微生物,其包含本發明之該變異體或編碼該變異體的一多核苷酸。
本發明的再另一目的是提供用於生產O-磷絲胺酸的方法,其包含於一培養基中培養包含本發明之該變異體或編碼該變異體之一多核苷酸的一微生物。
本發明的再另一目的是提供用以生產半胱胺酸或半胱胺酸之衍生物的方法,其包含a)於一培養基中培養包含本發明之該變異體或編碼該變異體之一多核苷酸的一生產O-磷絲胺酸之微生物以生產O-磷絲胺酸或一含O-磷絲胺酸之培養基;及b)使O-磷絲胺酸硫氫化酶(OPSS)或表現O-磷絲胺酸硫氫化酶(OPSS)之一微生物、步驟a)中所生產之O-磷絲胺酸或含O-磷絲胺酸之培養基,以及一硫化物與彼此接觸。
[
解決問題的技術方案
]
此後將進行詳細說明。同時,本發明中所揭露之各說明及實施例可被應用於其他說明及實施例。意即,本發明中所揭露之各種元件的所有組合落於本發明的範圍內。此外,本發明的範圍並未受以下詳細說明限制。
此外,在本說明書中,參考了數篇論文及專利文件且他們的引用被標出。所引用之論文及專利文件的揭露內容的整體被作為參考而併入此處以更清楚地敘述本發明所屬技術領域的程度,以及本發明的內容。
本發明的一個態樣提供一種YhhS變異體,其中對應於SEQ ID NO: 1之胺基酸序列的第129位置之一胺基酸是以另一胺基酸所取代。
如此處所使用的,該用語「YhhS」是指展現O-磷絲胺酸(OPS)輸出活性的多肽,具體而言,展現能夠由一細胞輸出OPS之活性的一膜蛋白。在本發明中,YhhS可為一YhhS MFS(主要協助轉運蛋白超家族,major facilitator superfamily)轉運蛋白,其為展現能夠自一細胞輸出OPS之活性的膜蛋白。該YhhS已被辨識為展現自大腸桿菌(
E. coli)輸出OPS活性的蛋白,其中於過量的OPS存在的條件下釋放生長抑制。
如此處所使用的,該用語「O
-磷絲胺酸(OPS)」是指絲胺酸的一磷酸酯(phosphoric acid ester),且為許多蛋白的組分。OPS為左旋半胱胺酸的前驅物,且可藉由與一硫化物藉由OPS巰基化酶(
O-phosphoserine sulfhydrylase,OPSS)的催化進行反應而轉化成半胱胺酸,但不限於此(美國發明專利第8557549 B2號)。
具體而言,本發明之YhhS可與YhhS MFS轉運蛋白互換使用。在本發明中,YhhS之胺基酸序列可自NCBI之GenBank,一已知資料庫獲得。該胺基酸序列可特別為展現YhhS活性、由該
yhhS基因,更具體而言,SEQ ID NO: 1編碼的多肽,但不限於此。
對應於SEQ ID NO: 1之胺基酸序列中第129位置之該胺基酸可為一極性胺基酸。該極性胺基酸可為,例如,絲胺酸、蘇胺酸、半胱胺酸、酪胺酸、天門冬醯胺酸或麩醯胺酸,且特別是絲胺酸。
在本發明的變異體中,對應於基於SEQ ID NO: 1之胺基酸序列的第129位置之極性胺基酸可以一非極性胺基酸取代。該非極性胺基酸可為,例如,甘胺酸、丙胺酸、纈胺酸、白胺酸、異白胺酸、甲硫胺酸、苯丙胺酸、色胺酸或脯胺酸,且特別是甘胺酸或丙胺酸。該變異體可包括具有與對應於基於SEQ ID NO: 1之胺基酸序列的第129位置之胺基酸為甘胺酸或丙胺酸的一胺基酸序列,至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.7%或99.9%或更高之同源性或相等性的胺基酸序列。顯見的是,只要該胺基酸序列具有這樣的同源性或相等性並展現對應於本發明之變異體之效力的效力,具有其中序列一部分被刪除、修飾、取代、保留取代,或添加之胺基酸序列的變異體亦被包括於本發明的範圍中。
舉例而言,在該胺基酸序列之N端、C端中及/或內部,不改變本發明之變異體的功能之序列添加或刪除、自然發生之突變、沉默突變或保留取代可被包括。
如此處所使用的,該用語「保留取代」表示以展現相似結構及/或化學特性的另一胺基酸取代一胺基酸。該變異體可具有,例如,一或多個保留取代,同時仍保有一或多個生物活性。這些胺基酸取代可通常基於殘基的極性、電荷、溶解度、疏水性、親水性及/或其他兩親媒性本質的相似性而發生。舉例而言,在帶電的胺基酸中,帶正電(鹼性)之胺基酸,包括精胺酸、酪胺酸及組胺酸,及帶負電(酸性)之胺基酸,包括麩胺酸及天門冬胺酸;在不帶電胺基酸中,非極性胺基酸包括甘胺酸、丙胺酸、纈胺酸、白胺酸、異白胺酸、甲硫胺酸、苯丙胺酸、色胺酸,及脯胺酸,以及極性或親水胺基酸包括絲胺酸、蘇胺酸、半胱胺酸、酪胺酸、天門冬醯胺,及麩醯胺酸;以及胺基酸中,芳族胺基酸包括苯丙胺酸、色胺酸及酪胺酸。
如此處所使用的,該用語「變異體」是指其中一或多個胺基酸被保留取代及/或修飾,使得該胺基酸序列與該變異體突變前不同但其功能或特性被維持的多肽。此變異體通常可由修飾該多肽之該胺基酸序列中之一或多個胺基酸,並評估該經修飾之多肽的特性而辨認。換句話說,與突變前之該多肽相較,該變異體之能力可被增強、不改變或降低。一些變異體可包括自其中一或多個部分,諸如一N端前導序列或一跨膜域(transmembrane domain)被移除的變異體。其他變異體可包括其中一部分從該成熟蛋白的N-及/或C-端移除的變異體。該用語「變異體」可與諸如修飾、經修飾之多肽、經修飾之蛋白、突變體、突變蛋白(mutein)及趨異體(divergent)之用語互換使用,且只要其為用於一突變的意義,並不受限於此。對於本發明的目的,該變異體可為包括敘述於SEQ ID NO: 1中之胺基酸序列的多肽,其中絲胺酸,對應於SEQ ID NO: 1之胺基酸序列中第129位置的胺基酸,是以甘胺酸或丙胺酸所取代。
此外,該變異體可包含對於該多肽之二級結構及特性具有最小效果的胺基酸之刪除或添加。舉例而言,無論是在共轉譯時或轉譯後,涉及蛋白轉位作用(translocation)的一訊號(或前導)序列可被共軛於該變異體的N端。該變異體可被共軛至其他序列或連結子,用於辨識、純化或合成。
如此處所使用的,該等用語「同源性(homology)」或「相等性(identity)」是指在兩個給定的胺基酸序列或核苷酸序列(nucleotide sequence)之間的相關度(degree of relatedness),且可被以百分比表示。該用語「同源性」及「相等性」通常可被彼此互換使用。
保留 多核苷酸(conserved polynucleotide)或多肽之序列同源性或相等性可藉由標準對位演算法(standard alignment algorithms)而決定,且可與藉由程式所確立的預設空位罰分(default gap penalty)一起使用。實質上,同源或相等的序列一般可與該整個序列或部分,在中等或高度嚴密條件下雜交。顯見的是該雜交亦包括以包含一常用密碼子於一多核苷酸中或考量密碼子簡併性之密碼子之多核苷酸進行雜交。
任意兩個多核苷酸或多肽序列是否具有同源性、相似性或相等性可藉由,例如,藉由已知的電腦演算法,諸如「FASTA」程式使用預設參數而決定,如Pearson
et al. (1988) [
Proc. Natl. Acad. Sci. USA85]: 2444中所述。或者是,任意兩個多核苷酸或多肽序列是否具有同源性、相似性或相等性可藉由使用如於EMBOSS組合之Needleman程式(EMBOSS: The European Molecular Biology Open Software Suite, Rice
et al., 2000,
Trends Genet. 16: 276-277)(5.0.0或其後的版本)(包括GCG程式組合(Devereux, J.,
et al.,
Nucleic Acids Research12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [
et al.,
J Molec Biol215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego, 1994, and [CARILLO
et al.] (1988) SIAM
J Applied Math48: 1073)中所進行的Needleman-Wunsch演算法(Needleman and Wunsch, 1970,
J. Mol. Biol. 48: 443-453)而決定。舉例而言,同源性、相似性或相等性可使用國家生物技術資訊中心(National Center for Biotechnology Information,NCBI)的BLAST或ClustalW來決定。
多核苷酸或多肽的同源性、相似性或相等性可藉由使用例如GAP電腦程式比對序列資訊而決定,該GAP電腦程式舉例而言,諸如Needleman
et al. (1970),
J Mol Biol.48:443,其已知於,例如, Smith and Waterman,
Adv. Appl. Math(1981) 2:482。 總而言之,GAP程式可界定為兩個序列之較短者中的符號之總數除以相似的經對齊之符號(亦即核苷酸或胺基酸)之數量所獲得之值。該GAP程式的預設參數可包括:(1) 二進位比較矩陣(包含表示相同的數值1及表示不同的數值0)以及揭露於 Schwartz and Dayhoff, eds.,
Atlas of Protein Sequence and Structure, National Biomedical Research Foundation, pp. 353-358 (1979) 中的 Gribskov
et al.(1986)
Nucl . Acids Res.14: 6745之加權比較矩陣(或EDNAFULL (NCBI NUC4.4之EMBOSS版本)取代矩陣);(2) 對各空位(gap)之3.0的罰分(penalty)以及各空位中每個符號額外0.10的罰分(或是一個空位開啟10罰分,且一空位延伸0.5罰分);以及(3) 對於終端空位無罰分。
如此處使用的,該用語「對應至」是指於一多肽中列出的位置處的一胺基酸殘基,或與一多肽中列出的一殘基相似、相同或同源的胺基酸殘基。辨識位於對應位置之胺基酸可為決定意指一具體序列之序列的具體胺基酸。如此處所使用的,該用語「對應區域」一般是指在相關或參考蛋白中相似或對應的位置。
舉例而言,一任意胺基酸序列是與SEQ ID NO: 1對準,且基於此,該胺基酸序列之各胺基酸殘基可參考對應於SEQ ID NO: 1中胺基酸殘基的胺基酸殘基的數値位置而編號。舉例而言,本發明中所述的序列對準演算法可與一查詢序列(query sequence,亦稱為「參考序列」)相較以決定一胺基酸的位置,或修飾,諸如取代、插入或刪除發生的位置。
對於此對準,例如,該Needleman-Wunsch演算法(Needleman and Wunsch, 1970,
J. Mol. Biol. 48: 443-453);EMBOSS組合之Needleman程式(EMBOSS: The European Molecular Biology Open Software Suite, Rice
et al., 2000, and
Trends Genet. 16: 276-277)可被使用,但該程式不限於此,且一序列對準程式、一成對序列比較演算法,及本技術領域中已知者可被適當地使用。
本發明的另一態樣為提供一種YhhS變異體,其中異白胺酸,對應於SEQ ID NO: 1之胺基酸序列中第241位置的一胺基酸,是以麩醯胺酸或蘇胺酸所取代。
該「SEQ ID NO: 1之胺基酸序列」、「YhhS」及「變異體」是如以上其他態樣中所述者。
具體而言,在本發明的變異體中,異白胺酸,對應於基於SEQ ID NO: 1之胺基酸序列的第241位置的胺基酸,是以麩醯胺酸或蘇胺酸所取代。該變異體可包括具有與其中對應於基於SEQ ID NO: 1之胺基酸序列的第241位置的胺基酸為麩醯胺酸或蘇胺酸的胺基酸序列至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.7%,或99.9%或更高的同源性或相等性,且此是如以上其他態樣中所述者。
在本發明的變異體中,對應於SEQ ID NO: 1之胺基酸序列中第129位置的胺基酸可以另一胺基酸所取代,且進一步地異白胺酸,對應於第241位置之胺基酸,可以麩醯胺酸或蘇胺酸所取代。
除了對應於SEQ ID NO: 1之胺基酸序列中第129位置或第241位置之胺基酸的取代,本發明之變異體可包含天門冬胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第246位置之胺基酸,以纈胺酸所取代,及/或纈胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第330位置之胺基酸,以異白胺酸取代的進一步取代。
此外,本發明的變異體中對應於SEQ ID NO: 1之該胺基酸序列中第88位置之胺基酸可為苯丙胺酸且對應於SEQ ID NO: 1之該胺基酸序列中第207位置之胺基酸可為酪胺酸。
具體而言,本發明之變異體可包括SEQ ID NO: 2之胺基酸序列,其中絲胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第129位置之胺基酸,是以甘胺酸所取代;SEQ ID NO: 3之胺基酸序列,其中絲胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第129位置之胺基酸是以丙胺酸所取代;SEQ ID NO: 4之胺基酸序列,其中異白胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第241位置之胺基酸是以麩醯胺酸所取代;SEQ ID NO: 5之胺基酸序列,其中異白胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第241位置之胺基酸是以甲硫胺酸所取代;SEQ ID NO: 12之胺基酸序列,其中異白胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第241位置之胺基酸是以甲硫胺酸所取代,天門冬胺酸,對應於第246位置的胺基酸,是以纈胺酸所取代,以及纈胺酸,對應於第330位置之胺基酸,是以異白胺酸所取代;SEQ ID NO: 34之胺基酸序列,其中絲胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第129位置之胺基酸是以甘胺酸所取代;異白胺酸,對應於第241位置的胺基酸,是以甲硫胺酸所取代,天門冬胺酸,對應於第246位置的胺基酸,是以纈胺酸所取代,以及纈胺酸,對應於第330位置之胺基酸,是以異白胺酸所取代;或SEQ ID NO: 36之胺基酸序列,其中絲胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第129位置之胺基酸是以甘胺酸所取代,及異白胺酸,對應於第241位置之胺基酸,是以麩醯胺酸所取代。
本發明之變異體可由SEQ ID NO: 2或SEQ ID NO: 3或SEQ ID NO: 4或SEQ ID NO: 5或SEQ ID NO: 12或SEQ ID NO: 34或SEQ ID NO: 36之胺基酸序列所組成,或為包括該胺基酸序列的多肽。
此外,本發明之變異體可具有與SEQ ID NO: 2或SEQ ID NO: 3或SEQ ID NO: 4或SEQ ID NO: 5或SEQ ID NO: 12或SEQ ID NO: 34或SEQ ID NO: 36之胺基酸序列99%或更高的序列相等性(同源性或相等性),但可具有與SEQ ID NO: 2或SEQ ID NO: 3或SEQ ID NO: 4或SEQ ID NO: 5或SEQ ID NO: 12或SEQ ID NO: 34或SEQ ID NO: 36之胺基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3 %、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或更多,或少於100%之序列相等性。顯見的是,具有其中一些序列被刪除、修飾、取代、保留取代或添加的胺基酸序列的變異體亦包括於本發明的範圍內,只要該胺基酸序列具有此些同源性或相等性且展現對應於本發明之變異體者的效力。
作為本發明的一個實例,本發明之變異體可展現YhhS活性。本發明之該變異體可展現與野生種多肽相比,增加之OPS輸出的活性。
YhhS是如以上其他態樣中所述。
本發明的再另一態樣為提供編碼本發明之變異體的多核苷酸。
該「變異體」是如上所述。
如此處所使用的,該用語「多核苷酸」是指作為核苷酸之聚合物之特定長度或更長之DNA或RNA股,其中核苷酸單體通過共價鍵以長鏈連接,且更具體而言,是指編碼該變異體之多核苷酸片段。
編碼本發明之變異體的多核苷酸可包括編碼敘述於SEQ ID NO: 2或SEQ ID NO: 3或SEQ ID NO: 4或SEQ ID NO: 5或SEQ ID NO: 12或SEQ ID NO: 34或SEQ ID NO: 36中之胺基酸序列的核苷酸序列。作為本發明的一個實例,本發明之多核苷酸可具有或包括SEQ ID NO: 6或SEQ ID NO: 7或SEQ ID NO: 8或SEQ ID NO: 9或SEQ ID NO: 17或SEQ ID NO: 35或SEQ ID NO: 37之序列。本發明之該多核苷酸可由SEQ ID NO: 6或SEQ ID NO: 7或SEQ ID NO: 8或SEQ ID NO: 9或SEQ ID NO: 17或SEQ ID NO: 35或SEQ ID NO: 37之序列所組成或實質上由SEQ ID NO: 6或SEQ ID NO: 7或SEQ ID NO: 8或SEQ ID NO: 9或SEQ ID NO: 17或SEQ ID NO: 35或SEQ ID NO: 37之序列所組成。
於本發明之多核苷酸中,各種修飾可於編碼區域中,在本發明之變異體的胺基酸序列在考量密碼子簡併性或生物體中表現本發明之變異體的較佳密碼子之下未被改變的範圍內進行。具體而言,本發明之多核苷酸可具有或包括具有與SEQ ID NO: 6或SEQ ID NO: 7或SEQ ID NO: 8或SEQ ID NO: 9或SEQ ID NO: 17或SEQ ID NO: 35或SEQ ID NO: 37之序列70%或更高、 75%或更高、 80%或更高、 85%或更高、 90%或更高、 95%或更高、 96%或更高、 97%或更高,或98%或更高且少於100%的同源性或相等性,或可由具有與SEQ ID NO: 6或SEQ ID NO: 7或SEQ ID NO: 8或SEQ ID NO: 9或SEQ ID NO: 17或SEQ ID NO: 35或SEQ ID NO: 37之序列70%或更高、 75%或更高、 80%或更高、 85%或更高、 90%或更高、 95%或更高、 96%或更高、 97%或更高,或98%或更高且少於100%之同源性或相等性的核苷酸序列所組成或實質上可由具有與SEQ ID NO: 6或SEQ ID NO: 7或SEQ ID NO: 8或SEQ ID NO: 9或SEQ ID NO: 17或SEQ ID NO: 35或SEQ ID NO: 37之序列70%或更高、 75%或更高、 80%或更高、 85%或更高、 90%或更高、 95%或更高、 96%或更高、 97%或更高,或98%或更高且少於100%之同源性或相等性的核苷酸序列所組成,但不限於此。在此情形中,在具有同源性或相等性的序列中,編碼對應於SEQ ID NO: 1中第129位置之胺基酸的密碼子可為編碼甘胺酸或丙胺酸之密碼子之一,編碼對應於第241位置之胺基酸的密碼子可為編碼麩醯胺酸或蘇胺酸之密碼子之一,編碼對應於第246位置之胺基酸的密碼子可為編碼纈胺酸之密碼子之一,且編碼對應於第330位置之胺基酸的密碼子可為編碼異白胺酸之密碼子之一。
本發明之該多核苷酸可包括,但不限於,可以自已知基因序列,舉例而言,與本發明之多核苷酸序列的全部或部分互補的序列在嚴密條件下雜交的序列,所建構的探子(probe)。該「嚴密條件」是指使得多核苷酸之間的特定雜交可發生的條件。此條件特別敘述於文獻中(請參J. Sambrook
et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; and F.M. Ausubel
et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8)。舉例而言,其中具有高同源性或相等性的多核苷酸,即具有70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、96%或更高、97%或更高、98%或更高,或99%或更高之同源性或相等性的多核苷酸與彼此雜交,且具有低於此之同源性或相等性的多核苷酸不與彼此雜交的條件;或其中用於一般的南方雜交法中的清洗條件,於等於60°C,1×SSC、及0.1% SDS的鹽類濃度及溫度下進行清洗一次,特別是進行清洗兩次至三次,特別是在60°C,0.1×SSC, 0.1% SDS,更特別是在68°C,0.1×SSC,0.1% SDS的條件可被例示。
雜交需要兩個核苷酸具有互補序列,雖然鹼基之間的錯位依照雜交的嚴密度是可能的。該用語「互補」是用於敘述能夠與彼此雜交之核苷酸鹼基之間的關係。舉例而言,對於DNA,腺苷酸(adenosine)是與胸腺嘧啶(thymine)互補而胞嘧啶(cytosine)是與鳥糞嘌呤(guanine)互補。因此,本發明的多核苷酸亦可包括實質上相似的核苷酸序列,以及對該整個序列為互補之分離的(isolated)核苷酸片段。
具體而言,具有與本發明之多核苷酸之同源性或相似性的多核苷酸可使用包括於55°C之Tm值下之雜交步驟的上述雜交條件偵測。該Tm值可為60°C、63°C,或65°C,但不限於此且可由所屬技術領域具有通常知識者依據目的而適當調整。
對於多核苷酸之雜交的適當之嚴密程度依據該等多核苷酸的長度與互補程度而定,且該等參數是所屬技術領域中所熟知的(例如,J. Sambrook
et al.,
supra)。
本發明的再另一態樣為提供一種包含本發明之該多核苷酸的載體。
該載體可為用於一宿主細胞中表現該多核苷酸之表現載體,但不限於此。
本發明之該載體可包括,包含編碼可操作地連結至合適的表現控制區域(或表現控制序列)之目標多肽之多核苷酸的核苷酸序列,使得目標多肽能夠於適當宿主中表現該目標多肽之DNA建構。該表現控制區域可包含能夠起始轉錄之啟動子、用以調節此轉錄的任何操作子序列、用以編碼合適mRNA核醣體結合位置的序列,以及用以控制轉錄及轉譯之終止的序列。一旦轉化至合適的宿主細胞,該載體可進行複製或獨立於宿主基因組發揮功能,或可被整合至該基因組中。
用於本發明中之載體不被特別限制,且本技術領域中已知的任意載體可被使用。常使用之載體包括天然或重組狀態的質體、黏接質體(cosmids)、病毒,以及噬菌體(bacteriophages)。舉例而言,pWE15、M13、MBL3、MBL4、IXII、ASHII、APII、t10、t11、Charon4A及Charon21A可被使用作為噬菌體載體或黏接質體載體;且基於pDZ(pDZ -based)、pBR、pUC、pBluescriptII、pGEM、pTZ、pCL、pSK-、pSKH-,及pET之載體等可被使用作為質體載體。具體而言,pDZ、pDC、pDCM2、pACYC177、pACYC184、pCL、pSK、pSKH130、pECCG117、pUC19、pBR322、pMW118、pCC1BAC載體等可被使用。
作為一實例,編碼一目標多肽之一多核苷酸可通過用於插入至胞內染色體的載體而被插入至一染色體中。多核苷酸插入至染色體可藉由本技術領域中已知的任何方法進行,舉例而言,同源重組,但不限於此。該載體可進一步包括用於確認染色體中的插入的一選擇標記(selection marker)。選擇標記係用以選擇以該載體轉化之細胞,即,用以確認該目標核酸分子是否已被插入,且提供可選擇之表型(例如,抗藥性、營養缺陷性(auxotrophy)、對細胞毒劑的抗性、或表面修飾蛋白之表現等)的標記可被使用。在經選擇性試劑處理的環境下,只有表現該選擇標記的細胞存活或表現其他表型特徵,藉此經轉化的細胞得以被選擇。
如此處所使用的,該用語「轉化作用(transformation)」表示導入包括編碼目標多肽之多核苷酸的載體至宿主細胞或微生物中,藉此使由該多核苷酸所編碼的多肽可被表現於該宿主細胞中。只要經轉化的多核苷酸可於該宿主細胞中表現,且無論該多核苷酸是否被插入且位於該宿主細胞的染色體中或位於該染色體外,該經轉化的多核苷酸可包括所有的多核苷酸。該多核苷酸包括編碼該目標多肽之DNA及/或RNA。只要可被導入至宿主細胞中並在其中被表現,該多核苷酸可以任何形式導入。舉例而言,該多核苷酸可以表現匣(expression cassette)的形式被導入至宿主細胞中,其是包括對於其自我表現(self-expression)為必須的所有元素的基因建構(gene construct)。該表現匣一般可包括可操作地連結至該多核苷酸的啟動子、轉錄終止訊號、核醣體結合位置,及轉譯終止訊號。該表現匣可呈得以自我複製之表現載體的形式。另外,該多核苷酸可以其當下的形式被導入至宿主細胞並可操作地連結至對於其在宿主細胞中之表現所需的序列,但不限於此。
如此處所使用的,該用語「可操作地連結(operably linked)」表示起始及調解(mediates)編碼本發明之目標變異體的多核苷酸的一啟動子序列與該多核苷酸序列是彼此功能性連結。
本發明的另一態樣為提供一種大腸桿菌(
Escherichia)屬之微生物,其包含本發明之該變異體或編碼該變異體的多核苷酸。
本發明之微生物可包含本發明之突變體多肽(mutant polypeptide)、編碼該多肽之多核苷酸,或包括本發明之多核苷酸的載體。
如此處所使用的,該用語「菌株(或微生物)」,其包括野生種微生物及其中自然或人工地發生基因修飾的微生物兩種類型,是指其中由於諸如外源基因之插入或一內源基因之活性被增強或去活化之原因所導致之特定機制被弱化或增強的微生物,且可為包含用於生產所欲之多肽、蛋白或產物之基因修飾的微生物。
本發明之該微生物可為包含本發明之變異體的任一者或多者,本發明之多核苷酸及包括本發明之多核苷酸的載體的微生物;被修飾以表現本發明之變異體或本發明之多核苷酸的微生物;表現本發明之變異體或本發明之多核苷酸的微生物(舉例而言,一重組微生物);或具有本發明之變異體之活性的微生物(舉例而言,一重組微生物),但不限於此。
本發明之該微生物可為具有O-磷絲胺酸生產力的微生物。
本發明之該微生物可為天然地具有YhhS或O-磷絲胺酸生產力的微生物,或其中本發明之變異體或編碼該變異體之多核苷酸(或包括該多核苷酸之載體)被導入,及/或對於不具有該YhhS或O-磷絲胺酸生產力之母株付與該O-磷絲胺酸生產力的微生物,但不限於此。
作為一實例,本發明之菌株為以包括本發明之多核苷酸或編碼本發明之變異體之一多核苷酸的載體所轉化且表現本發明之變異體的細胞或微生物。為了本發明之目的,本發明之菌株可包括能夠藉由包含本發明之變異體而生產O-磷絲胺酸的微生物。舉例而言,本發明之菌株可為一重組菌株,其藉由導入編碼本發明之變異體的多核苷酸而表現該YhhS變異體至一天然野生種微生物或生產O-磷絲胺酸且具有經增加之O-磷絲胺酸生產力的微生物。具有經增加之O-磷絲胺酸的重組菌株可為具有與天然野生種微生物、未經YhhS修飾之微生物(即,表現野生種YhhS(SEQ ID NO: 1)之微生物),或不表現一突變YhhS之微生物(SEQ ID NO: 2 or SEQ ID NO: 3 or SEQ ID NO: 4 or SEQ ID NO: 5 or SEQ ID NO: 12 or SEQ ID NO: 34 or SEQ ID NO: 36)相比經增加之O-磷絲胺酸生產力的微生物,但不限於此。舉例而言,該導入YhhS之野生種之微生物,其為用於比較O-磷絲胺酸生產力的目標菌株,可為CA07-0012(KCCM 11121P,韓國發明專利第10-1381048號及美國發明專利申請公開第10-2012-0190081號),其為其中與固有活性(intrinsic activity)相比,SerB活性被弱化的微生物,但不限於此。
作為一實例,具有經增加之生產力的該重組菌株可具有,與突變前之母株或未經修飾之微生物之O-磷絲胺酸生產力相比,增加約1%或更高,具體而言,約1%或更高、約10%或更高、約20%或更高、約29%或更高、約30%或更高、約40%或更高、約50%或更高、約60%或更高、約70%或更高、約80%或更高、約90%或更高、約100%或更高、約110%或更高、約120%或更高、約130%或更高、約140%或更高、約144%或更高、約150%或更高、約160%或更高、約170%或更高、約180%或更高、約190%或更高、約200%或更高、約210%或更高、約220%或更高、約230%或更高、約233%或更高、約240%或更高、約250%或更高、約252%或更高、約260%或更高、約267%或更高、約270%或更高、約280%或更高、約290%或更高、約300%或更高、約310%或更高、約320%或更高、約330%或更高,或約338%或更高(上限不特別限制,且可為,舉例而言,約300%或更低、約200%或更低、約100%或更低、約50%或更低、約40%或更低、約30%或更低、約20%或更低、或約15%或更低)的O-磷絲胺酸生產力,但只要其具有與突變前之母株或未經修飾之微生物相比,具有+值之增加量,本發明不限於此。於另一實例中,該具有增加之生產力的重組菌株可具有與突變前之母株或未經修飾之微生物相比,增加約1.01倍或更高、約1.1倍或更高、約1.2倍或更高、約1.29倍或更高、約1.3倍或更高、約1.4倍或更高、約1.5倍或更高、約1.6倍或更高、約1.7倍或更高、約1.8倍或更高、約1.9倍或更高、約2.0倍或更高、約2.1倍或更高、約2.2倍或更高、約2.3倍或更高、約2.4倍或更高、約2.44倍或更高、約2.5倍或更高、約2.6倍或更高、約2.7倍或更高、約2.8倍或更高、約2.9倍或更高、約3.0倍或更高、約3.1倍或更高、約3.2倍或更高、約3.3倍或更高、約3.33倍或更高、約3.4倍或更高、約3.5倍或更高、約3.52或更高、約3.6倍或更高、約3.67倍或更高、約3.7倍或更高、約3.8倍或更高、約3.9倍或更高、約4.0倍或更高、約4.1倍或更高、約4.2倍或更高、約4.3倍或更高,或約4.38倍或更高(該上限不特別限制,且可為,例如,約10倍或更低、約5倍或更低、約3倍或更低,或約2倍或更低)的OPS生產力,但不限於此。
如此處所使用的,該用語「未經修飾之微生物」並不排除包含可自然發生於微生物中之突變的菌株,且可指一野生種菌株或原生菌株(native strain)本身,或在由藉由自然或人工因素而導致之基因突變而改變表徵(trait)之前的菌株。舉例而言,該未經修飾之微生物可指其中此處所述之YhhS變異體未被導入或還沒被導入的菌株。該「未經修飾之微生物」可與「修飾前之菌株」、「修飾前之微生物」、「未突變之菌株」、「未修飾之菌株」、「未突變之微生物」或「參考微生物」互換使用。
作為本發明之另一實例,本發明之該微生物可為能夠生產O-磷絲胺酸的微生物,且微生物的種類不特別限制。本發明之該微生物可能為原核細胞或真核細胞,但具體而言可為一原核細胞。該原核細胞可包括,舉例而言,屬於大腸桿菌屬、伊文氏桿菌(
Erwinia)屬、鋸桿菌(
Serratia)屬、普羅威登斯(
Providencia)屬、棒狀桿菌(
Corynebacterium)屬及短桿菌(
Brevibacterium)屬的微生物菌株,且具體而言屬於大腸桿菌屬的微生物,更具體而言大腸桿菌,但不限於此。特別是,本發明之大腸桿菌屬的微生物可經由SerA、SerC及SerB,其等為左旋絲胺酸之生物合成途徑中的酵素,而生產OPS及左旋絲胺酸(Ahmed Zahoor,
Computational and Structural Biotechnology Journal, vol 3, 2012 October; Wendisch V F
et al.,
Curr Opin Microbiol. 2006 Jun; 9(3):268-74; and Peters-Wendisch P
et al.,
Appl Environ Microbiol. 2005 Nov; 7 1( l l):7 139-44)。
本發明之該生產O-磷絲胺酸之微生物可額外具有與固有活性相比之弱化的磷絲胺酸磷酸酶(SerB)活性。
本發明之SerB展現將O-磷絲胺酸轉化為左旋絲胺酸的活性,且因此被突變以使得SerB活性被弱化的微生物具有累積O-磷絲胺酸的特徵,且可被有用地用於O-磷絲胺酸的生產。本發明之SerB可為具有或包括敘述於SEQ ID NO: 10中之胺基酸序列的蛋白,或由敘述於SEQ ID NO: 10中之胺基酸序列所組成或實質上由敘述於SEQ ID NO: 10中之胺基酸序列所組成的蛋白,但不限於此。本發明之SerB可具有或包括與敘述於SEQ ID NO: 10中之胺基酸序列至少70%、80%、90%、95%,或99%或更高之同源性或相等性的胺基酸序列,只要其展現SerB活性。本發明之SerB可由具有與敘述於SEQ ID NO: 10中之胺基酸序列至少70%、80%、90%、95%或99%或更高之同源性或相等性之胺基酸序列所組成,或實質上由具有與敘述於SEQ ID NO: 10中之胺基酸序列至少70%、80%、90%、95%或99%或更高之同源性或相等性之胺基酸序列所組成,但不限於此。編碼該SerB之多核苷酸可具有或包括編碼敘述於SEQ ID NO: 10中之胺基酸序列的核苷酸序列。另外,編碼該SerB之多核苷酸可由編碼敘述於SEQ ID NO: 10中之胺基酸序列的核苷酸序列所組成,或實質上由編碼敘述於SEQ ID NO: 10中之胺基酸序列的核苷酸序列所組成。在本發明之編碼SerB之多核苷酸中,各種修飾可在其中該SerB蛋白之胺基酸序列未由於密碼子簡併性或考量到用以表現該SerB蛋白之生物體中偏好的密碼子而改變的範圍內,對編碼區進行。編碼本發明之SerB的多核苷酸可具有或包括具有與SEQ ID NO: 11之核苷酸序列至少70%、80%、90%、95%,或99%或更高且低於100%之同源性或相等性的核苷酸序列。編碼本發明之SerB的多核苷酸可由與SEQ ID NO: 11之核苷酸序列至少70%、80%、90%、95%,或99%或更高且低於100%之同源性或相等性的核苷酸序列所組成,或實質上由與SEQ ID NO: 11之核苷酸序列至少70%、80%、90%、95%,或99%或更高且低於100%之同源性或相等性的核苷酸序列所組成,但不限於此。
如此處所使用的,該用語,一多肽之「弱化」為包括與該固有活性相比降低之活性的情形以及不展現活性之情形兩者的概念。該弱化可與諸如去活化(inactivation)、缺乏(deficiency)、下調(down-regulation)、降低(decrease)、減少(reduction)及衰減(attenuation)互換使用。
該弱化亦可包括與一微生物原始所具有之多肽活性相比,其中該多肽本身的活性由於編碼該多肽之多核苷酸的突變而導致減少或消除等的情形;其中細胞中之多肽的整體活性程度及/或濃度(表現等級)由於編碼該多肽之多核苷酸之基因表現的抑制或轉化成多肽的轉譯被抑制等,較原生菌株低的情形;其中多核苷酸完全未被表現的情形,及/或其中即使該多核苷酸被表現,該多肽不表現活性的情形。該「固有活性」是指當由自然或人工因素所導致之基因突變導致表徵改變時,由轉化前之母株或野生種或未經修飾之微生物原始具有之特定多肽的活性。該固有活性可與「修飾前活性」互換使用。與固有活性相比,多肽活性的「去活化、缺乏、降低、向下調節、減少、衰減」表示與由轉化前母株或未經修飾之微生物所原始具有的具體多肽之活性相比,多肽的活性被降低。
多肽活性的減弱可藉由本技術領域中已知之任意方法進行,但不限於此,且可藉由應用本技術領域中熟知的各種方法而達成(舉例而言,Nakashima N
et al., Bacterial cellular engineering by genome editing and gene silencing.
Int J Mol Sci. 2014; 15(2):2773-2793, Sambrook
et al. Molecular Cloning 2012等)。
具體而言,本發明之多肽的弱化可為:
1) 刪除編碼一多肽之基因的全部或部分;
2) 修飾一表現控制區域(或表現控制序列)以降低編碼一多肽之基因的表現;
3) 修飾建構一多肽之胺基酸序列使該多肽的活性被消除或弱化(舉例而言,刪除/取代/添加一或多個胺基酸於該胺基酸序列中);
4) 修飾編碼一多肽之基因序列使得該多肽的活性被消除或弱化(舉例而言,一或多個核苷酸在一多肽基因之核苷酸序列中的刪除/取代/添加,用以編碼被修飾以消除或弱化該多肽之活性的多肽);
5) 修飾編碼一起始密碼子之核苷酸序列或編碼一多肽之基因轉錄的5’-UTR區域;
6) 導入互補結合至編碼一多肽之基因的轉錄之反股寡核苷酸(舉例而言,反股RNA);
7) 添加與夏因-達爾加諾序列(Shine–Dalgarno sequence)互補之序列於編碼多肽之基因的該夏因-達爾加諾序列之前,以形成使核醣體無法附接的二級結構;
8) 在編碼多肽之基因序列的開讀框(open reading frame,ORF)之3’端添加相反方向轉錄啟動子(反轉錄工程,RTE);或
9) 選自第1)至8)項之二或多者之組合,但不特別限於此。
舉例而言,
1)編碼多肽之基因的部分或整體刪除可為編碼該染色體中之內生目標多肽的整個多核苷酸的消除、以其中一些核苷酸被刪除之多核苷酸取代,或以標記基因取代。
2) 對表現控制區域(或表現控制序列)的修飾可為在表現控制區域(或表現控制序列)中藉由刪除、插入、非保留取代或保留取代或其等之組合而發生的突變,或以展現極弱活性之序列進行取代。該表現控制區域包含,但不限於,啟動子、操作子序列、用於編碼核醣體結合位置的序列,及用以控制轉錄及轉譯之終止的序列。
3)或4)之胺基酸序列或多核苷酸序列的修飾可為該多肽或編碼該多肽之多核苷酸序列藉由刪除、插入、非保留或保留取代,或其等之組合,使得該多肽活性被弱化的突變的發生,或以被修飾以表現極低活性之胺基酸序列或多核苷酸序列,或被修飾以不展現活性之胺基酸序列或多核苷酸序列的取代,但不限於此。舉例而言,基因的表現可藉由導入突變至多核苷酸序列中並因此形成一終止密碼子而抑制或弱化,但不限於此。
5) 編碼起始密碼子之核苷酸序列或編碼多肽之基因轉錄的5’-UTR區域的修飾可為,例如,但不限於,以編碼另一具有與內生起始密碼子相比較低多肽表現率的起始密碼子進行取代。
6)導入互補地結合至編碼多肽之基因轉錄的反股寡核苷酸(例如,反股RNA)可參考,例如,以下文獻[Weintraub, H.
et al., Antisense-RNA as a molecular tool for genetic analysis, Reviews -
Trends in Genetics, Vol. 1(1) 1986]。
7) 與夏因-達爾加諾序列互補之序列在編碼多肽之基因的該夏因-達爾加諾序列前方的添加,以形成使核醣體之附接無法達成的二級結構可為用以使mRNA轉譯無法進行或減低mRNA轉譯速率。
8) 此外,對在編碼該多肽之基因序列的開讀框(ORF)之3’端之相反方向轉錄之啟動子的添加(反轉錄工程,RTE)可為形成對編碼多肽之基因的轉錄互補之一反股核苷酸,並藉此弱化該活性。
如此處所使用的,該用語多肽活性之「增強」表示該多肽的活性與該固有活性相比被增強。該增強可與諸如活化、上調(up-regulation)、過度表現(overexpression)、增加(increase)之用語互換使用。在此,活化、增強、上調、過度表現及增加可包括展現未被原先擁有的活性以及展現與固有活性或修飾前之活性相比經改善之活性兩者。該「固有活性」是指特定多肽之母株在轉化前所原先擁有的活性,或當由於自然或人工因素而導致之基因突變而特徵改變的未經修飾之微生物。該「固有活性」可與「修飾前活性」互換使用。與多肽之固有活性相比,多肽之活性之該「增強」、「上調」、「過度表現」,或「增加」表示與特定多肽之由母株在轉化前原先所擁有,或未經修飾之微生物原先所擁有的該活性及/或濃度(表現等級)相比,多肽的活性的改善。
該增強可藉由導入外源多肽或增強該內源多肽之活性及/或其濃度(表現等級)而達成。該多肽之活性的增強可自多肽的活性程度、表現等級之增加,或自由該多肽所生產之產物的量而確認。
該多肽活性的增強並未受限,只要該目標多肽之活性與修飾前之微生物相比可被增強,且本發明所屬技術領域中所熟知的各種方法可被應用。具體而言,該增強可藉由本發明所屬技術領域中具有通常知識者熟知的基因工程及/或蛋白工程而達成,其等為分子生物學的例行方法,但不限於此(舉例而言,Sitnicka
et al. Functional Analysis of Genes.
Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook
et al. Molecular Cloning 2012等)。
具體而言,本發明之多肽的強化可為
1) 編碼多肽之多核苷酸的細胞內複製數(intracellular copy number)的增加;
2) 編碼一多肽之染色體中之基因表現控制區域的修飾(舉例而言,在表現控制區中的突變之發生、以展現極強活性的序列取代,或展現極強活性之序列的插入);
3) 編碼一起始密碼子之核苷酸序列或編碼一多肽之基因轉錄之5’-UTR區域的修飾;
4) 多肽之胺基酸序列的修飾以增強多肽活性;
5) 編碼一多肽之多核苷酸序列的修飾以增強該多肽活性(舉例而言,多肽基因之多核苷酸序列的修飾以編碼被修飾以增強該多肽活性之多肽);
6) 展現多肽之活性的外源多肽或編碼該多肽之外源多核苷酸之導入;
7) 編碼一多肽之多核苷酸的密碼子最佳化;
8) 多肽之三級結構的分析以選擇一暴露位置及修飾或化學修飾該暴露位置;或
9) 選自第1)至8)項之二或多者之組合,但不特別限於此。
更具體而言,
1) 編碼多肽之多核苷酸的細胞內複製數的增加可藉由將可獨立於宿主複製及運作的一載體導入至宿主細胞而達成,其中編碼該對應之多肽的多核苷酸被可操作地連結至該載體。或者是,該增加可藉由導入編碼多肽的多核苷酸的一份複製或二或更多份複製至宿主細胞中的染色體中而達成。染色體中的導入可藉由將能夠把該多核苷酸插入至宿主細胞中之該染色體中的載體導入宿主細胞中而進行,但不限於此。該載體是如上所述。
2) 以具有強活性的序列取代編碼多肽之染色體中之基因表現控制區域(或表現控制序列)可為,舉例而言,以序列取代基因表現控制區域,該序列中藉由刪除、插入、非保留或保留取代,或其等之組合而發生突變,或是以具有較強活性之序列取代,以進一步增強該表現控制區域的活性。該表現控制區域可包含,但不特別限於,一啟動子、一操作子序列、編碼一核醣體結合位置的序列,以及控制轉錄及轉譯之終止的序列。作為一實例,該取代可為以較強啟動子取代原始啟動子,但不限於此。
強啟動子之已知實例包括但不限於,CJ1至CJ7啟動子(美國發明專利第7662943 B2號)、乳糖啟動子(lac promoter)、色胺酸啟動子(trp promoter)、trc啟動子、tac啟動子、λ噬菌體PR啟動子(lambda phage PR promoter)、PL啟動子、tet啟動子、gapA啟動子、SPL7啟動子、SPL13(sm3)啟動子(美國發明專利第10584338 B2號)、O2啟動子(美國發明專利第10273491 B2號)、tkt啟動子,及yccA啟動子。
3) 編碼起始密碼子之核苷酸序列或編碼多肽之基因轉錄的5’-UTR區域的修飾可為,舉例而言,但不限於,以編碼另一具有多肽之較高表現率的起始密碼子而非內生起始密碼子之核苷酸序列進行取代。
4)或5)之胺基酸序列或多核苷酸序列之修飾可為通過刪除、插入、非保留或保留取代,或其等之組合而發生在該多肽之胺基酸序列或編碼該多肽之該多核苷酸序列中之突變,使得該多肽之活性被增強,或以被修飾以展現極強活性之胺基酸序列或多核苷酸序列,或被修飾以展現經增加之活性的胺基酸序列或多核苷酸序列進行取代,但不限於此。具體而言,該取代可藉由通過同源重組將多核苷酸插入至染色體而進行,但不限於此。此處所使用之載體可進一步包括一選擇標記用於確認染色體中的插入。該選擇標記是如上所述。
6) 表現該多肽之活性的外源多核苷酸之導入可為將編碼表現與該多肽相等/相似活性之多肽的外源多核苷酸導入宿主細胞。該外源多核苷酸並不限於其起源或序列,只要該外源多核苷酸表現與該多肽相等/相似之活性。該導入可藉由由所屬技術領域中具有通常知識者適當選擇的已知轉化方法而進行。如該經導入之多核苷酸表現在宿主細胞中,該多肽可被生產,且其活性可被增加。
7) 編碼多肽之該多核苷酸的密碼子最佳化可為一內源多核苷酸(endogenous polynucleotide)的密碼子最佳化,用以增加其在一宿主細胞中的轉錄或轉譯,或一外源多核苷酸(foreign polynucleotide)的密碼子最佳化,用以在一宿主細胞中進行最佳化的轉錄及轉譯。
8) 由多肽之三級結構分析而選擇之暴露位置及修飾或化學修飾該暴露位置可為,舉例而言,將欲加以分析之多肽的序列資訊與已儲存已知蛋白之序列資訊的資料庫比對以根據序列相似性之等級而決定模板蛋白候選者,基於此確認該結構、選擇將被修飾或化學修飾之暴露位置,以及限定(qualify)該暴露位置。
此多肽活性的增強可為,基於表現於野生種微生物菌株或修飾前之微生物菌株中之多肽的活性或濃度,對應之多肽的活性、或濃度表現等級之增加,或自該多肽生產之產物量的增加,但不限於此。
在本發明之微生物中多核苷酸之部分或全部的修飾可藉由下列誘發:(a) 使用用於將染色體插入微生物中之載體的同源重組,或採用工程化基因酶(engineered nuclease,例如CRISPR-Cas9)的基因編輯,及/或(b)以光,諸如紫外光及輻射,及/或化學品處理,但不限於此。用於修飾該基因之部分或整體的方法可包括藉由DNA重組技術而進行之方法。舉例而言,將核苷酸序列或包含對目標基因同源之核苷酸序列的載體注入微生物中以實現同源重組,該基因之部分或整體的刪除可被達成。被注入之該核苷酸序列或載體可包括一優勢選擇標記(dominant selection marker),但不限於此。
該微生物可為具有進一步減少之OPS的能力以進入及降解細胞之微生物。
針對上述生產OPS之微生物的內容,除了上述內容,揭露於美國發明專利第8557549 B2號或美國發明專利申請公開第2012-0190081號的內容等可被用作本發明之參考材料,但內容並不限於此。
在本發明之微生物中,「變異體」、「多核苷酸」、「O-磷絲胺酸」等為如以上其他態樣中所述者。
本發明的再另一態樣為提供用以生產O-磷絲胺酸的方法,其包含於一培養基中培養包含本發明之變異體或編碼該變異體之一多核苷酸的一微生物。
本發明之用以生產O-磷絲胺酸的方法可包括於一培養基中培養包含本發明之變異體或編碼該變異體之多核苷酸的微生物之步驟。
如此處所使用的,該用語「培養」表示本發明之微生物在適當控制之環境條件下生長。本發明之培養程序可於本發明所屬技術領域中已知的合適培養基中,在本發明所屬技術領域中已知的合適培養條件下進行。此培養程序可由所屬技術領域中具有通常知識者依據所選擇之菌株輕易調整及使用。具體而言,該培養可為批次型式、連續型式,及/或進料-批次型式(fed-batch)之培養,但不限於此。
如此處所使用之用語「培養基」是指其中用於本發明之該微生物之培養為必須的營養物質做為主要成分進行混合,並供應對於存活及生長為必要的營養物質、生長因子等,包括水之材料。具體而言,做為用於培養本發明之微生物的培養基及其它培養條件,任何用於培養常見的微生物之培養基可被使用而不特別限制,但本發明之該微生物可在包含適當碳源、氮源、磷源、無機化合物、胺基酸,及/或維生素等的一般培養基中,在好氧條件下,於經調整之溫度、pH值等下被培養。
本發明中的碳源包括碳水化合物,諸如葡萄糖、蔗糖(saccharose)、乳糖、果糖、蔗糖(sucrose)及麥芽糖;糖醇諸如甘露醇及山梨醇;有機酸諸如丙酮酸、乳酸及檸檬酸;胺基酸諸如麩胺酸、甲硫胺酸及離胺酸等。天然有機營養物質諸如澱粉水解物、糖蜜(molasses)、黑糖蜜(blackstrap molasses)、米糠(rice bran)、木薯(cassava)、蔗渣(sugarcane bagasse),及玉米浸液(corn steep liquor)可被使用。具體而言,諸如葡萄糖及滅菌預處理糖蜜(即被轉化成還原糖的糖蜜)的碳水化合物可被使用,且適當量的其他碳源可被廣泛地使用而不受限制。這些碳源可被單獨使用或二或多者組合使用,但碳源不限於此。
作為氮源,無機氮源諸如氨、硫化氨、氯化銨、醋酸氨、磷酸氨、碳酸氨及硝酸銨;以及有機氮源諸如胺基酸,如麩胺酸、甲硫胺酸及麩醯胺酸、蛋白腖(peptone)、NZ-胺、肉類萃取、酵母萃取、麥芽精(malt extract)、玉米浸液、酪蛋白水解產物、魚或其分解產物,及去脂大豆餅或其分解產物可被使用。這些氮源可被單獨使用或以其二或多者之組合使用,但氮源不限於此。
磷源可包括磷酸二氫鉀( potassium phosphate monobasic)及磷酸氫二鉀(potassium phosphate dibasic)或磷酸二氫鈉(sodium phosphate monobasic)及磷酸氫二鈉(sodium phosphate dibasic)。做為無機化合物,氯化鈉、氯化鈣、氯化鐵、硫酸鎂、硫酸鐵、硫酸錳、碳酸鈣等可被使用。除了這些之外,胺基酸、維生素及/或適當的前驅物可被包含於培養基中。這些組分或前驅物可被批次地或連續地添加至培養基。然而,該培養基不限於此。
該培養基可包含金屬鹽,諸如硫酸鎂或硫酸鐵,且此外,包含胺基酸、維生素及適當的前驅物。這些媒介或前驅物可被批次地或連續地添加至培養基,但不限於此。
做為一實例,其中與固有活性相比SerB活性被弱化的重組微生物的培養中,由於微生物的絲胺酸需求被誘發,甘胺酸或絲胺酸可被額外包含於培養基中。甘胺酸可以純化甘胺酸、包含甘胺酸的酵母及胰蛋白腖的形式被提供, 而包含於培養基中的甘胺酸之濃度通常可為0.1 g/L至10 g/L,具體而言0.5 g/L至3 g/L。絲胺酸可以純化絲胺酸、包含絲胺酸之酵母萃取及胰蛋白腖的形式被提供, 而包含於培養基中的絲胺酸之濃度通常可為0.1 g/L至5 g/L,具體而言0.1 g/L至1 g/L。
在本發明之微生物的培養期間,諸如氫氧化銨、氫氧化鉀、氨水、磷酸及硫酸的化合物可被以適當的方式添加至培養基中以調整培養基的pH值。培養期間,諸如脂肪酸聚乙二醇酯(fatty acid polyglycol ester)的消泡劑(antifoaming agent)可被使用以抑制泡沫形成。氧氣或含氧氣體可被注入該培養基以維持該培養基的好氧狀態(aerobic state),或為了維持厭氧(anaerobic)或微好氣性(microaerobic)狀態,可不注入氣體,或注入氮氣、氫氣或二氧化碳,但培養條件不限於此。
在本發明的培養中,培養溫度可被維持於20°C至45°C,具體而言25°C至40°C,且該培養可進行約10至160小時,但培養條件不限於此。
由本發明之培養所生產的O-磷絲胺酸可被分泌(secreted)至培養基中或留存於細胞中。
用於生產本發明之O-磷絲胺酸之方法可進一步包括製備本發明之微生物的步驟、製備用於培養該微生物之培養基的步驟,或其等之組合(以任何順序),舉例而言,在培養步驟之前。
本發明之用於生產O-磷絲胺酸的方法可進一步包含在培養後自該培養基(經歷培養之培養基)或微生物回收O-磷絲胺酸的步驟。該回收步驟可在培養步驟後被進一步包括。
該回收可為根據本發明之用以培養微生物的方法,使用本發明所屬技術領域中已知的合適方法,例如,批次式、連續式,或進料-批次培養方法等收集所欲的O-磷絲胺酸。舉例而言,離心、過濾、以結晶化蛋白沉澱劑(鹽析方法,salting-out method)處理、萃取、音波震盪、超過濾(ultrafiltration)、透析、各種管柱層析,諸如分子篩管柱層析(膠體過濾)、吸附管柱層析、離子交換管柱層析及親和力層析術、HPLC,或此等方法的組合可被使用。所欲的O-磷絲胺酸可自該培養基或微生物使用本領域中已知的合適方法回收。
本發明之用以生產O-磷絲胺酸的方法可進一步包括一純化步驟。該純化可藉由本發明所屬技術領域中已知的合適方法進行。於一實例中,當本發明之用以生產O-磷絲胺酸的方法包括回收步驟及純化步驟兩者,該回收步驟及純化步驟可以任何順序連續或非連續進行,或可同步進行或做為一個整合的步驟,但不限於此。
在本發明的方法中,「變異體」、「多核苷酸」、「載體」、「微生物」等如以上其他態樣中所述。
本發明的再另一態樣為提供用於生產半胱胺酸或半胱胺酸之衍生物的方法,其包含:a) 於一培養基中培養包含本發明之變異體或編碼該變異體之多核苷酸的生產O-磷絲胺酸之微生物以生產O-磷絲胺酸或含O-磷絲胺酸之培養基;及b) 使O-磷絲胺酸硫氫化酶(OPSS)或表現O-磷絲胺酸硫氫化酶(OPSS)之微生物、步驟a)中所生產之O-磷絲胺酸或含O-磷絲胺酸之培養基,以及硫化物與彼此接觸。
具體而言,該方法可為用以生產半胱胺酸或半胱胺酸衍生物的方法,其包括於一培養基中培養包含選自於包括SEQ ID NO: 2或SEQ ID NO: 3或SEQ ID NO: 4或SEQ ID NO: 5或SEQ ID NO: 12或SEQ ID NO: 34或SEQ ID NO: 36之胺基酸序列,同時展現O-磷絲胺酸輸出活性之多肽;包括具有與此多肽至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.7%,或99.9%或更高之同源性或相等性之胺基酸序列的多肽;具有其中一些序列被刪除、修飾、取代,或添加而對應於SEQ ID NO: 1之胺基酸序列中i) 第129位置;ii) 第241位置;iii) 第129位置及241位置;iv) 第241位置、第246位置及第330位置;及v) 第129位置、第241位置、第246位置,及第330位置的氨基酸之突變被固定的胺基酸序列之突變多肽;編碼本發明之變異體之多核苷酸;或包括編碼本發明之變異體的多核苷酸之載體的一或多者之生產O-磷絲胺酸的微生物,用以生產O-磷絲胺酸或包含O-磷絲胺酸之培養基的步驟;以及將O-磷絲胺酸硫氫化酶或展現O-磷絲胺酸硫氫化酶之微生物與該步驟中所生產之O-磷絲胺酸或包含O-磷絲胺酸之培養基與一硫化物反應的步驟。
如此處所使用的,該用語「衍生物」是由化學修飾特定化合物之一部分而獲得的相似化合物,且通常是指其中化合物中之氫原子或特定原子團被以另一原子或原子團所取代的化合物。
如此處所使用的,該用語「半胱胺酸之衍生物」是指其中半胱胺酸之氫原子或特定原子團被以另一原子或原子團取代的化合物。舉例而言,半胱胺酸衍生物可呈其中另一原子或原子團連接於半胱胺酸中之胺基(-NH
2)中的氮原子或硫醇基(thiol group,-SH)之硫原子的形式,且其實例包括NAC(
N-乙醯基半胱胺酸,
N-acetylcysteine)、SCMC(
S-羧甲基半胱氨酸,
S-carboxymethylcysteine)、Boc-Cys(Me)-OH、(
R)-
S-(2-胺基-2-羧乙基)-L-同半胱胺酸((
R)-
S-(2-amino-2-carboxyethyl)-L-homocysteine)、(
R)-2-胺基-3-磺基丙酸、D-2-胺基-4-(乙硫基)丁酸、3-亞硫基-L-丙胺酸、Fmoc-Cys(Boc-甲基)-OH、硒基-L-半胱胺酸、
S-(2-噻唑基)-L-半胱胺酸、
S-(2-噻吩基)-L-半胱胺酸及
S-(4-甲苯基)-L-半胱胺酸,但不限於此。
只要半胱胺酸根據本發明之方法生產,將半胱胺酸轉化成各種半胱胺酸衍生物可依據本發明所屬術領域中熟知的方法輕易完成。
具體而言,用於生產半胱胺酸衍生物的方法可進一步包括將步驟b)中生產的半胱胺酸轉化成半胱胺酸衍生物的步驟。舉例而言,NAC(
N-乙醯基半胱胺酸)可藉由使半胱胺酸與一乙醯化劑反應而合成,或
S-羧甲基半胱氨酸(SCMC)可藉由使半胱胺酸與鹵代乙酸在鹼性條件下反應而合成,但將半胱胺酸轉化為半胱胺酸衍生物不限制於此。
該半胱胺酸衍生物可主要做為藥學原料而用於鎮咳劑(antitussive agent)、止咳藥(cough reliever),及用於支氣管炎、支氣管哮喘及咽喉痛之治療劑(remedial agents),但不限於此。
如此處所使用的,該用語「O-磷絲胺酸巰基化酶(OPSS)」是指催化提供硫醇基(SH基)給O-磷絲胺酸而將O-磷絲胺酸轉化成半胱胺酸之反應的酵素。該酵素可為已首先於
Aeropyrum pernix , Mycobacterium tuberculosis, Mycobacterium smegmatis,及
Trichomonas vaginalis(Mino K and Ishikawa K, FEBS letters, 551: 133-138, 2003; and Bums K E
et al. J. Am. Chem. Soc.,127: 11602-11603, 2005)中發現者。該O-磷絲胺酸巰基化酶不僅包括野生種O-磷絲胺酸巰基化酶,亦包括具有其中編碼該O-磷絲胺酸巰基化酶之多核苷酸的序列中的一部分被刪除、取代,或添加,並展現與野生種O-磷絲胺酸巰基化酶之活性相等或更高之活性的序列之變異體。該O-磷絲胺酸巰基化酶亦可包括揭露於美國發明專利第8557549 B2號及第9127324 B2號中之O-磷絲胺酸巰基化酶及其等之變異體。
作為硫化物,由於pH、壓力及溶解度的差異以液體或氣體形式提供以及以本發明技術領域中常用之固體提供,且可被轉化成呈硫化物(S
2-)或硫代硫化物(S
2O
3 2-)等之形式的巰基(SH)基團的任何硫化物可被不受限地使用。具體而言,將巰基基團提供至O-磷絲胺酸之Na
2S、NaSH、H
2S、(NH
4)
2S及Na
2S
2O
3可被使用,但該硫化物不限於此。該反應為用於藉由提供一個巰基基團至一個O-磷絲胺酸反應基團而生產一個半胱胺酸或半胱胺酸衍生物的反應,且被添加用於反應之硫化物的量可為O-磷絲胺酸之莫耳濃度的0.1至3倍,具體而言1至2倍,但不限於此。
本發明中,該方法可進一步包括回收經由該反應步驟生產之半胱胺酸的步驟。在此案例中,該所欲半胱胺酸可藉由本發明技術領域中熟知的合適反應,由反應混合物分離及純化,並加以收集。
本發明的再另一態樣為提供用於O-磷絲胺酸生產的組成物,其包含本發明之變異體、編碼該變異體的多核苷酸、包括該多核苷酸的載體、包含本發明之變異體的微生物或編碼該變異體的多核苷酸,或其等之二或多者的組合。
本發明之組成物可進一步包含常用於O-磷絲胺酸生產之組成物中任何適當的賦形劑,且此賦形劑可為,舉例而言,防腐劑、濕潤劑、分散劑、懸浮劑、緩衝劑、 穩定劑,或等滲劑(isotonic agent),但不限於此。
本發明的組成物中,「變異體」、「多核苷酸」、「載體」、「微生物」、「培養基」、「O-磷絲胺酸」等是如以上其他態樣中所述。
本發明的再另一態樣是提供本發明之變異體、編碼該變異體之多核苷酸、包括該多核苷酸之載體,或包含本發明之變異體或編碼該變異體之多核苷酸之微生物用於生產O-磷絲胺酸、半胱胺酸或半胱胺酸之衍生物的用途。
本發明的再另一態樣為提供本發明之變異體用於自一微生物輸出O-磷絲胺酸的用途。
[ 有益的功效 ]
當具有該OPS生產力的微生物使用本發明之展現O-磷絲胺酸(OPS)輸出活性的新穎突變多肽培養時,與使用現有未經修飾或突變蛋白之案例相比,可在較高產率下生產OPS。
[ 本發明的詳細說明 ]
此後,本發明將參考實例更詳細敘述。然而,下列實例僅為用於說明本發明的較佳實施例,且因此並非意欲限制本發明的權利範圍。同時,此處未述及之技術內容可由本發明所屬技術領域或相似技術領域中具有通常知識者充分了解且輕易實施。
實例 1 : YhhS 變異體的選擇
為了選擇展現經增加之OPS輸出活性的YhhS變異體,一
YhhS基因變異體質體庫被建構。具體程序如下所述。
隨機突變誘發PCR使用大腸桿菌(
Escherichia coli)K12 W3110的基因組DNA做為模板以及呈現於以下表1中的SEQ ID Nos:13及14之核苷酸序列的引子對進行。多樣性PCR隨機突變誘發套組(Diversity PCR Random Mutagenesis Kit,Takara)被使用。對於PCR,在於94°C進行變性作用5分鐘後,進行在94°C下30秒之變性作用、55°C下30秒之退火,及72°C下1分鐘之聚合作用被重複20次,接著進行72°C下5分鐘之聚合作用。
為了將經由此程序建構的突變基因片段置入具有rhtB啟動子的pCL1920載體中,pCL_PrhtB被首先建構。
為了確保該rhtB啟動子碎片,PCR使用
E. coliK12 W3110之基因組DNA做為模板,及SEQ ID NOs: 15及16進行。對於PCR,在於94°C進行變性作用5分鐘後,進行在94°C下30秒之變性作用、55°C下30秒之退火,及72°C下1分鐘之聚合作用被重複30次,隨後進行72°C下5分鐘之聚合作用。該rhtB啟動子碎片使用一浸劑複製套組(infusion cloning kit)被複製至以
EcoRI及
SalI消化之該pCL1920載體(GeneBank No. AB236930)中,且pCL_PrhtB被獲得(secured)。在獲得之pCL_PrhtB載體以
ScaI消化後,經由PCR獲得之突變基因片段使用浸劑複製套組複製。複製藉由在50°C進行反應60分鐘,一pCL_PrhtB-yhhS基因突變質體庫因此被建構。此後,所獲得之質體藉由電穿孔法(electroporation)被轉化成CA07-0012(KCCM 11121P,韓國發明專利第10-1381048號及美國發明專利申請公開第10-2012-0190081號)。
其中,包含變異體的三個菌株被選擇,自這些菌株獲得質體,且該等核苷酸序列經由定序技術被分析。做為定序的結果,確認的是經選擇的變異體為其中在野生種YhhS之胺基酸序列中第129胺基酸殘基之絲胺酸是以甘胺酸所取代的變異體,其中第241胺基酸殘基之異白胺酸是以麩胺酸所取代的變異體,且其中第241胺基酸殘基之異白胺酸是以蘇胺酸所取代,第246胺基酸殘基之天門冬胺酸是以纈胺酸取代,及第330胺基酸殘基之纈胺酸是以纈胺酸所取代的變異體。三個菌株被分別命名為CA07-0012/pCL_PrhtB-yhhS (S129G)、CA07-0012/pCL_PrhtB-yhhS (I241Q)及CA07-0012/pCL_PrhtB-yhhS (I241T/D246V/V330I)。該CA07-0012/pCL_PrhtB-yhhS (I241T/D246V/V330I)菌株亦常稱為大腸桿菌CA07-0352,且依據布達佩斯條約於2020年5月14日寄存於韓國微生物保藏中心(Korean Culture Center of Microorganisms,KCCM),具有存取碼KCCM 12720P。
[表1]
實例 2 :額外 YhhS 變異體之表現之載體建構 2-1. YhhS ( S129A )變異體表現載體及表現菌株的建構
SEQ ID NO: | 序列 (5'→3') |
13 | GGAGTTCATCagtATGCCCGAACCCGTAGCC |
14 | CTGCAGGTCGAagtTTAAGATGATGAGGCGGC |
15 | CGACGGCCAGTGAATTCGATGGTCGATGATTAAGACATC |
16 | ATGCCTGCAGGTCGAAGTACTGATGAACTCCCGGTGTGTCT |
為了獲得該YhhS(S129A)片段,YhhS(S129A)之上游片段通過PCR,使用E.
coliK12 W3110基因組DNA做為模板及SEQ ID NOs: 13及18獲得,該YhhS(S129A)的下游片段經由PCR,以相同方式使用
E. coliK12 W3110基因組DNA做為模板及呈現於下表2之SEQ ID NOs: 19及14獲得。對於PCR,在94°C下進行變性作用5分鐘後,進行在94°C下30秒之變性作用、55°C下30秒之退火,及72°C下1分鐘之聚合作用被重複30次,隨後進行72°C下5分鐘之聚合作用。
在pCL_PrhtB載體以
ScaI消化後,所獲得之YhhS(S129A)上游片段及YhhS(S129A)下游片段使用浸劑複製套組(Clontech Laboratories, Inc.)複製。複製藉由在50°C下進行反應60分鐘而進行,且因此pCL_PrhtB-yhhS(S129A)被獲得。獲得之質體藉由電穿孔法被轉化成CA07-0012以獲得菌株CA07-0012/pCL_PrhtB-yhhS(S129A)。
[表2]
2-2. YhhS(I241Q) 變異體表現載體、 YhhS (I241T) 變異體表現載體及變異體表現菌株的建構
SEQ ID NO: | 序列 (5'→3') |
18 | TCCCGTTCCGGCAAAcgcTTGCCCAATCCCAAGGA |
19 | CTTGGGATTGGGCAAgcgTTTGCCGGAACGGGATC |
為了確認當通過資料庫獲得的YhhS之第241胺基酸殘基之異白胺酸被以麩醯胺酸外之蘇胺酸取代時之OPS生產力,建構一菌株且進行評估。
為了將YhhS之第241胺基酸突變插入至CA07-0012染色體中,trc被用作啟動子且
mgsA基因位置被用作插入位置。
具體而言,pSKH130載體(美國發明專利申請公開第2020-0048619號,SEQ ID NO: 38)被用作染色體之插入。該載體包括R6K複製子、
SacB(Levansucrase)基因,且康黴素抗性基因是依據PI蛋白(pir基因)而定,所欲之菌株使用R6K及康黴素使用該載體在第一次染色體互換下獲得,且接著該抗生素以蔗糖自培養基移除,藉此建構一菌株。
為了將其中YhhS之第241胺基酸殘基被以其他胺基酸取代的形式導入菌株CA07-0012之mgsA基因位置,試圖獲得pSKH130ΔmgsA質體。pSKH130ΔmgsA為用於刪除該mgsA ORF(開讀框)的載體,且為在mgsA之ORF的兩側都包含5’及3’核苷酸序列的質體。
使用呈現於以下表3中之引子對,5’片段及3’片段分別被獲得。該pSKH130載體以
BamHI消化,且接著質體使用浸劑複製套組獲得。
[表3]
SEQ ID NO: | 序列(5'→3') | |
mgsA之上游片段的引子對 | 20 | CCTGCCATCGGATCCGGTATCCGTTTTTGCCACCA |
21 | ACCTGTGCAATAAGTACTAATGTACATCCGTAGTT | |
mgsA之下游片段的引子對 | 22 | CGGATGTACATTAGTACTTATTGCACAGGTGGCAA |
23 | TGATATCGAATTCCTTCGCTGTTGGTGATGACTGG |
為了獲得該trc啟動子片段,使用呈現於以下表4的SEQ ID NOs: 24及25進行PCR。為了獲得兩種類型的變異體YhhS ORFs,兩種變異體之上游及下游片段使用呈現於表5中的引子對分別獲得。所獲得的兩種上游及下游片段、該trc啟動子片段,及其中pSKH130ΔmgsA被以
ScaI消化之載體,及浸劑複製套組被一同使用以獲得兩種類型的質體。
為了獲得其中野生種YhhS被導入至mgsA位置作為控制組的菌株,一pSKH130ΔmgsA::Ptrc-yhhS質體被建構。使用具有SEQ ID NOs: 26及27的寡核苷酸對進行PCR以獲得YhhS ORF,且浸劑複製套組與該trc啟動子片段及其中pSKH130ΔmgsA被以
ScaI消化之載體一同使用以獲得一質體。
[表4]
[表5]
SEQ ID NO: | 序列(5'→3') |
24 | CGGATGTACATTAGTCGCTTGCTGCAACTCTCTCA |
25 | GATAGCTCTCCTGTGTGAAATTGTTATCCGCTCAC |
SEQ ID NO: | 序列(5'→3') | |
I241Q之上游片段的引子對 | 26 | CACAGGAAAGATATCATGCCCGAACCCGTAGCCGA |
28 | GCCGGATTTGGCGTCATCGCCACCTTTcagACGCTGTTTTATGACGCT | |
I241Q之下游片段的引子對 | 29 | CCAACCTTTAGCGTCATAAAACAGCGTctgAAAGGTGGCGATGACGCC |
27 | ACCTGTGCAATAAGTTTAAGATGATGAGGCGGCCT | |
I241T之上游片段的引子對 | 26 | CACAGGAAAGATATCATGCCCGAACCCGTAGCCGA |
30 | TCATAAAACAGCGTGGTAAAGGTGGCGATGACGCC | |
I241T之下游片段的引子對 | 31 | TCATCGCCACCTTTACCACGCTGTTTTATGACGCT |
27 | ACCTGTGCAATAAGTTTAAGATGATGAGGCGGCCT |
該獲得的質體被藉由電穿孔法轉化至該菌株CA07-0012中。其中突變藉由重組(互換)被插入至染色體中的菌株自具有康黴素之LB固體培養基選擇,且接著在具有蔗糖之培養基中受到次級重組(替換),使得自染色體之質體位置的切除(excision)發生。該已進行次級重組的菌株使用SEQ ID NOs: 20及27受到PCR作用並定序以獲得兩種菌株(CA07-0012ΔmgsA::Ptrc-yhhS(I241T)及CA07-0012ΔmgsA::Ptrc-yhhS(I241Q)),其中該YhhS變異體被插入該染色體的mgsA位置。其中控制被導入的菌株(CA07-0012ΔmgsA::Ptrc-yhhS)亦以相同方法獲得。
2-3.YhhS ( S129G/I241Q )變異體表現載體及表現菌株的建構
基於該YhhS(I241Q)變異體,其中第129胺基酸殘基之絲胺酸被以甘胺酸所取代的菌株被建構。在此情形中,該rhtB啟動子被用作一啟動子。
具體而言,PCR使用pCL_PrhtB-yhhS(I241Q)作為模板以及呈現於以下表6中之SEQ ID NOs: 32及33(整個質體中的PCR_129G時間點)進行。所獲得之PCR片段使用浸劑複製套組複製。
所獲得之質體藉由電穿孔法被轉化至CA07-0012中以獲得菌株CA07-0012/pCL_PrhtB-yhhS (S129G/I241Q)。
[表6]
2-4. YhhS ( S129G/I241T/D246V/V330I )變異體表現載體及表現菌株之建構
SEQ ID NO: | 序列(5'→3') |
32 | ATTGGGCAAgGTTTTGCCGG |
33 | CCGGCAAAACcTTGCCCAAT |
該trc啟動子被使用,該
mgsA基因被刪除,且S129G/I241T/D246V/V330I突變被插入其中。
具體而言,為了導入I241T、D246V及V330I突變於菌株CA07-0012的
mgsA基因位置,於實例2-2中建構之pSKH130ΔmgsA質體被使用。
為了建構pSKH130ΔmgsA::Ptrc-yhhS (I241T/D246V/V330I),於實例2-2中獲得的trc啟動子片段被以相同方式使用。使用SEQ ID NOs: 26及27及pCL_Ptrc-yhhS (I241T/D246V/V330I)質體作為模板進行PCR以獲得該YhhS (I241T/D246V/V330I)的ORF片段。該trc啟動子片段、yhhS453片段、其中以Scal消化之pSKH130ΔmgsA之載體,以及浸劑複製套組被一同使用以獲得一質體pSKH130ΔmgsA::Ptrc-yhhS (I241T/D246V/V330I)。
此後,PCR使用pSKH130ΔmgsA::Ptrc-yhhS (I241T/D246V/V330I)作為模板及SEQ ID NOs: 32及33(整個質體中PCR_129G時間點)進行。對於PCR,在94°C下進行變性作用5分鐘後,進行在94°C下30秒之變性作用、55°C下30秒之退火,及72°C下7分鐘之聚合作用被重複30次,隨後進行72°C下5分鐘之聚合作用。所獲得之片段及浸劑複製套組被用於獲得質體pSKH130ΔmgsA::Ptrc-yhhS (129G/I241T/D246V/V330I)。
所獲得之質體藉由電穿孔法被轉化成菌株CA07-0012。對於經轉化之菌株,藉由重組(交換)而導入具有康黴素之LB固體培養基中染色體的菌株被選擇,且接著自染色體的質體位置的切除經由在具有蔗糖之培養基中的次級重組(替換)而發生。
已經過次級重組的菌株使用SEQ ID NOs: 20及27進行PCR並定序以獲得兩種菌株(CA07-0012/pSKH130ΔmgsA::Ptrc-yhhS(I241T/D246V/V330I)及CA07-0012/pSKH130ΔmgsA::Ptrc-yhhS(129G/I241T/D246V/V330I)),其中YhhS(I241T/D246V/V330I)或YhhS(129G/I241T/D246V/V330I)被插入至染色體的mgsA位置。
實例 3 :導入 YhhS 變異體之菌株的 OPS 生產力之評估
導入YhhS變異體之菌株的O-磷絲胺酸生產力使用下列培養基(表7)評估。
具體而言,在培養中,各菌株被設置於LB固體培養基上,且接著在培養器中於33°C下隔夜培養。在LB固體培養基中隔夜培養的菌株被接種至以下表7之25 mL效價培養基(titer medium)中,且接著在培養器中於33°C下、200 rpm下培養48小時,且結果呈現於表8至11中。
[表7]
3-1 :導入其中第129胺基酸被取代之 YhhS 變異體的菌株之 OPS 生產力的評估
培養基組分 | 所製備的量(Amount prepared) |
葡萄糖 | 40 g |
KH 2PO 4(KP1) | 6 g |
(NH 4) 2SO 4 | 17 g |
MgSO 4.7H 2O | 1 g |
MnSO 4.4H 2O | 5 mg |
FeSO 4.7H 2O | 10 mg |
左旋甘胺酸 | 2.5 g/L |
酵母萃取 | 3 g/L |
CaCO 3 | 30 g/L |
pH | 6.8 |
已確認的是在其中被導入YhhS(S129G)變異體的菌株,CA07-0012/pCL_PrhtB-yhhS(S129G)的情形中OPS生產力的增加率為約252%,而其中被導入YhhS(S129A)變異體的菌株,CA07-0012/pCL_PrhtB-yhhS(S129A)的情形中OPS生產力的增加率為約29%(表8)。
[表8]
3-2 :導入其中第241胺基酸殘基被取代之 YhhS 變異體的菌株之 OPS 生產力的評估
菌株名稱 | OPS濃度(g/L) |
CA07-0012/pCL_PrhtB-yhhS | 2.1 |
CA07-0012/pCL_PrhtB-yhhS(S129A) | 2.7 |
CA07-0012/pCL_PrhtB-yhhS(S129G) | 5.3 |
與其中野生種YhhS被導入之菌株,CA07-0012ΔmgsA::Ptrc-yhhS的OPS輸出能力相比,OPS輸出能力之增加率被檢驗,且結果,被確認的是在其中YhhS(I241Q)變異體被導入的菌株,CA07-0012ΔmgsA::Ptrc-yhhS(I241Q)的情形中,OPS輸出能力的增加率為約425%,在其中YhhS(I241T)變異體被導入的菌株,CA07-0012ΔmgsA::Ptrc-yhhS(I241T)的情形中,OPS輸出能力的增加率為約233%,而在其中YhhS(I241T/D246V/V330I)變異體被導入的菌株,CA07-0012ΔmgsA::Ptrc-yhhS(I241T/D246V/V330I)的情形中,OPS輸出能力的增加率為約267%(表9)。
[表9]
3-3 :導入其中第129胺基酸殘基被取代及第 241 胺基酸殘基被取代之 YhhS 變異體的菌株之 OPS 生產力的評估
菌株名稱 | OPS濃度(g/L) |
CA07-0012△mgsA::Ptrc-yhhS | 1.2 |
CA07-0012△mgsA::Ptrc-yhhS(I241T) | 2.8 |
CA07-0012△mgsA::Ptrc-yhhS(I241Q) | 5.1 |
CA07-0012△mgsA::Ptrc-yhhS(I241T/D246V/V330I) | 3.2 |
與CA07-0012/pCL_PrhtB-yhhS,其中野生種YhhS被導入之菌株相比,OPS輸出能力的增加率被檢驗,且結果經確認的是在其中YhhS(S129G/I241Q)變異體被導入的菌株,CA07-0012/pCL_PrhtB-yhhS (S129G/I241Q)的情形中,OPS輸出能力的增加率為約338%(表10)。
[表10]
菌株名稱 | OPS濃度(g/L) |
CA07-0012/pCL_PrhtB-yhhS | 2.1 |
CA07-0012/pCL_PrhtB-yhhS(S129G/I241Q) | 7.1 |
此外,與CA07-0012ΔmgsA::Ptrc-yhhS(I241T/D246V/V330I)相比之OPS輸出能力的增加率被檢驗,且結果被確認的是在其中導入YhhS(S129G/I241T/D246V/V330I)變異體的菌株,CA07-0012ΔmgsA::Ptrc-yhhS(S129G/I241T/D246V/V330I)的情形中,OPS輸出能力的增加率為約144%(表11)。
[表11]
菌株名稱 | OPS濃度(g/L) |
CA07-0012△mgsA::Ptrc-yhhS(I241T/D246V/V330I) | 3.2 |
CA07-0012△mgsA::Ptrc-yhhS(S129G/I241T/D246V/V330I) | 4.6 |
基於上述說明,本發明所屬技術領域中具有通常知識者將能夠理解本發明可在不改變本發明之技術精神或必要特徵下以其他具體形式實施。因此,應理解的是以上所述之實施例在所有方面為例示性而非限制性的。對於本發明的範圍,應被解釋為衍生自下述申請專利範圍的範圍及其等效範圍之定義及範圍的所有改變或修飾,而不是上述詳細說明,被包括於本發明的範圍內。
(無)
<![CDATA[<110> CJ第一製糖股份有限公司(CJ CheilJedang Corporation)]]> <![CDATA[<120> 新穎YhhS變異體及使用其生產O-磷絲胺酸、半胱胺酸及半胱胺酸之衍生物的方法]]> <![CDATA[<140> TW 111120779]]> <![CDATA[<141> 2022-06-03]]> <![CDATA[<150> KR 10-2021-0072313]]> <![CDATA[<151> 2021-06-03]]> <![CDATA[<160> 38]]> <![CDATA[<170> KoPatentIn 3.0]]> <![CDATA[<210> 1]]> <![CDATA[<211> 406]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 未知]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(WT)]]> <![CDATA[<400> 1]]> Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn 1 5 10 15 Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr 20 25 30 Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met 35 40 45 Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe 50 55 60 Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu 65 70 75 80 Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser 85 90 95 Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile 100 105 110 Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln 115 120 125 Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly 130 135 140 Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr 145 150 155 160 Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp 165 170 175 Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val 180 185 190 Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly 195 200 205 Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly 210 215 220 Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe 225 230 235 240 Ile Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala 245 250 255 Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro 260 265 270 Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe 275 280 285 Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro 290 295 300 Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu 305 310 315 320 Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln 325 330 335 Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser 340 345 350 Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly 355 360 365 Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu 370 375 380 Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu 385 390 395 400 Ala Ala Ser Ser Ser *** 405 <![CDATA[<210> 2]]> <![CDATA[<211> 406]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(S129G) AA]]> <![CDATA[<400> 2]]> Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn 1 5 10 15 Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr 20 25 30 Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met 35 40 45 Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe 50 55 60 Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu 65 70 75 80 Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser 85 90 95 Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile 100 105 110 Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln 115 120 125 Gly Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly 130 135 140 Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr 145 150 155 160 Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp 165 170 175 Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val 180 185 190 Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly 195 200 205 Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly 210 215 220 Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe 225 230 235 240 Ile Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala 245 250 255 Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro 260 265 270 Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe 275 280 285 Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro 290 295 300 Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu 305 310 315 320 Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln 325 330 335 Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser 340 345 350 Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly 355 360 365 Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu 370 375 380 Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu 385 390 395 400 Ala Ala Ser Ser Ser *** 405 <![CDATA[<210> 3]]> <![CDATA[<211> 406]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(S129A) AA]]> <![CDATA[<400> 3]]> Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn 1 5 10 15 Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr 20 25 30 Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met 35 40 45 Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe 50 55 60 Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu 65 70 75 80 Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser 85 90 95 Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile 100 105 110 Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln 115 120 125 Ala Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly 130 135 140 Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr 145 150 155 160 Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp 165 170 175 Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val 180 185 190 Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly 195 200 205 Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly 210 215 220 Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe 225 230 235 240 Ile Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala 245 250 255 Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro 260 265 270 Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe 275 280 285 Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro 290 295 300 Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu 305 310 315 320 Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln 325 330 335 Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser 340 345 350 Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly 355 360 365 Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu 370 375 380 Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu 385 390 395 400 Ala Ala Ser Ser Ser *** 405 <![CDATA[<210> 4]]> <![CDATA[<211> 406]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(I241Q) AA]]> <![CDATA[<400> 4]]> Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn 1 5 10 15 Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr 20 25 30 Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met 35 40 45 Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe 50 55 60 Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu 65 70 75 80 Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser 85 90 95 Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile 100 105 110 Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln 115 120 125 Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly 130 135 140 Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr 145 150 155 160 Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp 165 170 175 Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val 180 185 190 Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly 195 200 205 Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly 210 215 220 Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe 225 230 235 240 Gln Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala 245 250 255 Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro 260 265 270 Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe 275 280 285 Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro 290 295 300 Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu 305 310 315 320 Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln 325 330 335 Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser 340 345 350 Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly 355 360 365 Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu 370 375 380 Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu 385 390 395 400 Ala Ala Ser Ser Ser *** 405 <![CDATA[<210> 5]]> <![CDATA[<211> 406]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(I241T) AA]]> <![CDATA[<400> 5]]> Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn 1 5 10 15 Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr 20 25 30 Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met 35 40 45 Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe 50 55 60 Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu 65 70 75 80 Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser 85 90 95 Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile 100 105 110 Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln 115 120 125 Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly 130 135 140 Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr 145 150 155 160 Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp 165 170 175 Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val 180 185 190 Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly 195 200 205 Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly 210 215 220 Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe 225 230 235 240 Thr Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala 245 250 255 Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro 260 265 270 Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe 275 280 285 Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro 290 295 300 Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu 305 310 315 320 Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln 325 330 335 Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser 340 345 350 Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly 355 360 365 Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu 370 375 380 Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu 385 390 395 400 Ala Ala Ser Ser Ser *** 405 <![CDATA[<210> 6]]> <![CDATA[<211> 1218]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(S129G) NT]]> <![CDATA[<400> 6]]> atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60 tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120 ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180 ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240 ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300 ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360 cgcgtcatcc ttgggattgg gcaaggtttt gccggaacgg gatcgaccct atggggcgtt 420 ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480 ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540 gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600 ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660 tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720 atcacgctgt tttatgacgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780 agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840 ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900 gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960 gtgttcccgg cattgggtgt agtggcggta aaagcggttc cgcagcaaaa tcagggggcg 1020 gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080 gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140 gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200 gccgcctcat catcttaa 1218 <![CDATA[<210> 7]]> <![CDATA[<211> 1218]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(S129A) NT]]> <![CDATA[<400> 7]]> atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60 tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120 ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180 ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240 ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300 ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360 cgcgtcatcc ttgggattgg gcaagcgttt gccggaacgg gatcgaccct atggggcgtt 420 ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480 ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540 gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600 ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660 tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720 atcacgctgt tttatgacgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780 agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840 ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900 gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960 gtgttcccgg cattgggtgt agtggcggta aaagcggttc cgcagcaaaa tcagggggcg 1020 gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080 gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140 gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200 gccgcctcat catcttaa 1218 <![CDATA[<210> 8]]> <![CDATA[<211> 1218]]> <![CDATA[<212> ]]> DNA <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(I241Q) NT]]> <![CDATA[<400> 8]]> atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60 tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120 ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180 ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240 ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300 ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360 cgcgtcatcc ttgggattgg gcaaagtttt gccggaacgg gatcgaccct atggggcgtt 420 ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480 ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540 gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600 ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660 tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720 cagacgctgt tttatgacgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780 agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840 ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900 gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960 gtgttcccgg cattgggtgt agtggcggta aaagcggttc cgcagcaaaa tcagggggcg 1020 gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080 gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140 gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200 gccgcctcat catcttaa 1218 <![CDATA[<210> 9]]> <![CDATA[<211> 1218]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(I241T) NT]]> <![CDATA[<400> 9]]> atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60 tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120 ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180 ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240 ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300 ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360 cgcgtcatcc ttgggattgg gcaaagtttt gccggaacgg gatcgaccct atggggcgtt 420 ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480 ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540 gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600 ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660 tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720 accacgctgt tttatgacgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780 agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840 ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900 gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960 gtgttcccgg cattgggtgt agtggcggta aaagcggttc cgcagcaaaa tcagggggcg 1020 gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080 gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140 gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200 gccgcctcat catcttaa 1218 <![CDATA[<210> 10]]> <![CDATA[<211> 323]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 未知]]> <![CDATA[<220>]]> <![CDATA[<223> 磷絲胺酸磷酸酶]]> <![CDATA[<400> 10]]> Met Pro Asn Ile Thr Trp Cys Asp Leu Pro Glu Asp Val Ser Leu Trp 1 5 10 15 Pro Gly Leu Pro Leu Ser Leu Ser Gly Asp Glu Val Met Pro Leu Asp 20 25 30 Tyr His Ala Gly Arg Ser Gly Trp Leu Leu Tyr Gly Arg Gly Leu Asp 35 40 45 Lys Gln Arg Leu Thr Gln Tyr Gln Ser Lys Leu Gly Ala Ala Met Val 50 55 60 Ile Val Ala Ala Trp Cys Val Glu Asp Tyr Gln Val Ile Arg Leu Ala 65 70 75 80 Gly Ser Leu Thr Ala Arg Ala Thr Arg Leu Ala His Glu Ala Gln Leu 85 90 95 Asp Val Ala Pro Leu Gly Lys Ile Pro His Leu Arg Thr Pro Gly Leu 100 105 110 Leu Val Met Asp Met Asp Ser Thr Ala Ile Gln Ile Glu Cys Ile Asp 115 120 125 Glu Ile Ala Lys Leu Ala Gly Thr Gly Glu Met Val Ala Glu Val Thr 130 135 140 Glu Arg Ala Met Arg Gly Glu Leu Asp Phe Thr Ala Ser Leu Arg Ser 145 150 155 160 Arg Val Ala Thr Leu Lys Gly Ala Asp Ala Asn Ile Leu Gln Gln Val 165 170 175 Arg Glu Asn Leu Pro Leu Met Pro Gly Leu Thr Gln Leu Val Leu Lys 180 185 190 Leu Glu Thr Leu Gly Trp Lys Val Ala Ile Ala Ser Gly Gly Phe Thr 195 200 205 Phe Phe Ala Glu Tyr Leu Arg Asp Lys Leu Arg Leu Thr Ala Val Val 210 215 220 Ala Asn Glu Leu Glu Ile Met Asp Gly Lys Phe Thr Gly Asn Val Ile 225 230 235 240 Gly Asp Ile Val Asp Ala Gln Tyr Lys Ala Lys Thr Leu Thr Arg Leu 245 250 255 Ala Gln Glu Tyr Glu Ile Pro Leu Ala Gln Thr Val Ala Ile Gly Asp 260 265 270 Gly Ala Asn Asp Leu Pro Met Ile Lys Ala Ala Gly Leu Gly Ile Ala 275 280 285 Tyr His Ala Lys Pro Lys Val Asn Glu Lys Ala Glu Val Thr Ile Arg 290 295 300 His Ala Asp Leu Met Gly Val Phe Cys Ile Leu Ser Gly Ser Leu Asn 305 310 315 320 Gln Lys *** <![CDATA[<210> 11]]> <![CDATA[<211> 969]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知]]> <![CDATA[<220>]]> <![CDATA[<223> 磷絲胺酸磷酸酶]]> <![CDATA[<400> 11]]> atgcctaaca ttacctggtg cgacctgcct gaagatgtct ctttatggcc gggtctgcct 60 ctttcattaa gtggtgatga agtgatgcca ctggattacc acgcaggtcg tagcggctgg 120 ctgctgtatg gtcgtgggct ggataaacaa cgtctgaccc aataccagag caaactgggt 180 gcggcgatgg tgattgttgc cgcctggtgc gtggaagatt atcaggtgat tcgtctggca 240 ggttcactca ccgcacgggc tacacgcctg gcccacgaag cgcagctgga tgtcgccccg 300 ctggggaaaa tcccgcacct gcgcacgccg ggtttgctgg tgatggatat ggactccacc 360 gccatccaga ttgaatgtat tgatgaaatt gccaaactgg ccggaacggg cgagatggtg 420 gcggaagtaa ccgaacgggc gatgcgcggc gaactcgatt ttaccgccag cctgcgcagc 480 cgtgtggcga cgctgaaagg cgctgacgcc aatattctgc aacaggtgcg tgaaaatctg 540 ccgctgatgc caggcttaac gcaactggtg ctcaagctgg aaacgctggg ctggaaagtg 600 gcgattgcct ccggcggctt tactttcttt gctgaatacc tgcgcgacaa gctgcgcctg 660 accgccgtgg tagccaatga actggagatc atggacggta aatttaccgg caatgtgatc 720 ggcgacatcg tagacgcgca gtacaaagcg aaaactctga ctcgcctcgc gcaggagtat 780 gaaatcccgc tggcgcagac cgtggcgatt ggcgatggag ccaatgacct gccgatgatc 840 aaagcggcag ggctggggat tgcctaccat gccaagccaa aagtgaatga aaaggcggaa 900 gtcaccatcc gtcacgctga cctgatgggg gtattctgca tcctctcagg cagcctgaat 960 cagaagtaa 969 <![CDATA[<210> 12]]> <![CDATA[<211> 406]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(I241T/D246V/V330I) AA]]> <![CDATA[<400> 12]]> Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn 1 5 10 15 Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr 20 25 30 Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met 35 40 45 Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe 50 55 60 Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu 65 70 75 80 Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser 85 90 95 Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile 100 105 110 Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln 115 120 125 Ser Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly 130 135 140 Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr 145 150 155 160 Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp 165 170 175 Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val 180 185 190 Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly 195 200 205 Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly 210 215 220 Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe 225 230 235 240 Thr Thr Leu Phe Tyr Val Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala 245 250 255 Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro 260 265 270 Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe 275 280 285 Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro 290 295 300 Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu 305 310 315 320 Val Phe Pro Ala Leu Gly Val Val Ala Ile Lys Ala Val Pro Gln Gln 325 330 335 Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser 340 345 350 Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly 355 360 365 Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu 370 375 380 Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu 385 390 395 400 Ala Ala Ser Ser Ser *** 405 <![CDATA[<210> 13]]> <![CDATA[<211> 31]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> K12_F]]> <![CDATA[<400> 13]]> ggagttcatc agtatgcccg aacccgtagc c 31 <![CDATA[<210> 14]]> <![CDATA[<211> 32]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> K12_R]]> <![CDATA[<400> 14]]> ctgcaggtcg aagtttaaga tgatgaggcg gc 32 <![CDATA[<210> 15]]> <![CDATA[<211> 39]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> rhtB promoter_F]]> <![CDATA[<400> 15]]> cgacggccag tgaattcgat ggtcgatgat taagacatc 39 <![CDATA[<210> 16]]> <![CDATA[<211> 41]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> rhtB 啟動子_R]]> <![CDATA[<400> 16]]> atgcctgcag gtcgaagtac tgatgaactc ccggtgtgtc t 41 <![CDATA[<210> 17]]> <![CDATA[<211> 1218]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(I241T/D246V/V330I) NT]]> <![CDATA[<400> 17]]> atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60 tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120 ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180 ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240 ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300 ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360 cgcgtcatcc ttgggattgg gcaaagtttt gccggaacgg gatcgaccct atggggcgtt 420 ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480 ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540 gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600 ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660 tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720 accacgctgt tttatgtcgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780 agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840 ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900 gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960 gtgttcccgg cattgggtgt agtggcgata aaagcggttc cgcagcaaaa tcagggggcg 1020 gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080 gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140 gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200 gccgcctcat catcttaa 1218 <![CDATA[<210> 18]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(S129A) 上_R]]> <![CDATA[<400> 18]]> tcccgttccg gcaaacgctt gcccaatccc aagga 35 <![CDATA[<210> 19]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(S129A) 下_F]]> <![CDATA[<400> 19]]> cttgggattg ggcaagcgtt tgccggaacg ggatc 35 <![CDATA[<210> 20]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> mgsA 上_F]]> <![CDATA[<400> 20]]> cctgccatcg gatccggtat ccgtttttgc cacca 35 <![CDATA[<210> 21]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> mgsA 上_R]]> <![CDATA[<400> 21]]> acctgtgcaa taagtactaa tgtacatccg tagtt 35 <![CDATA[<210> 22]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> mgsA 下_F]]> <![CDATA[<400> 22]]> cggatgtaca ttagtactta ttgcacaggt ggcaa 35 <![CDATA[<210> 23]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> mgsA 下_R]]> <![CDATA[<400> 23]]> tgatatcgaa ttccttcgct gttggtgatg actgg 35 <![CDATA[<210> 24]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> trc 啟動子_F]]> <![CDATA[<400> 24]]> cggatgtaca ttagtcgctt gctgcaactc tctca 35 <![CDATA[<210> 25]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> trc 啟動子_R]]> <![CDATA[<400> 25]]> gatagctctc ctgtgtgaaa ttgttatccg ctcac 35 <![CDATA[<210> 26]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(I241T/D246V/V330I) ORF_F]]> <![CDATA[<400> 26]]> cacaggaaag atatcatgcc cgaacccgta gccga 35 <![CDATA[<210> 27]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(I241T/D246V/V330I) ORF_R]]> <![CDATA[<400> 27]]> acctgtgcaa taagtttaag atgatgaggc ggcct 35 <![CDATA[<210> 28]]> <![CDATA[<211> 48]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> I241Q 上_F]]> <![CDATA[<400> 28]]> gccggatttg gcgtcatcgc cacctttcag acgctgtttt atgacgct 48 <![CDATA[<210> 29]]> <![CDATA[<211> 48]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> I241Q 下_R]]> <![CDATA[<400> 29]]> ccaaccttta gcgtcataaa acagcgtctg aaaggtggcg atgacgcc 48 <![CDATA[<210> 30]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> I241T 上_R]]> <![CDATA[<400> 30]]> tcataaaaca gcgtggtaaa ggtggcgatg acgcc 35 <![CDATA[<210> 31]]> <![CDATA[<211> 35]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> I241T 上_F]]> <![CDATA[<400> 31]]> tcatcgccac ctttaccacg ctgttttatg acgct 35 <![CDATA[<210> 32]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> PCR_129G_F]]> <![CDATA[<400> 32]]> attgggcaag gttttgccgg 20 <![CDATA[<210> 33]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> PCR_129G_R]]> <![CDATA[<400> 33]]> ccggcaaaac cttgcccaat 20 <![CDATA[<210> 34]]> <![CDATA[<211> 406]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(S129G/I241T/D246V/V330I) AA]]> <![CDATA[<400> 34]]> Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn 1 5 10 15 Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr 20 25 30 Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met 35 40 45 Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe 50 55 60 Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu 65 70 75 80 Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser 85 90 95 Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile 100 105 110 Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln 115 120 125 Gly Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly 130 135 140 Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr 145 150 155 160 Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp 165 170 175 Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val 180 185 190 Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly 195 200 205 Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly 210 215 220 Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe 225 230 235 240 Thr Thr Leu Phe Tyr Val Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala 245 250 255 Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro 260 265 270 Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe 275 280 285 Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro 290 295 300 Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu 305 310 315 320 Val Phe Pro Ala Leu Gly Val Val Ala Ile Lys Ala Val Pro Gln Gln 325 330 335 Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser 340 345 350 Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly 355 360 365 Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu 370 375 380 Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu 385 390 395 400 Ala Ala Ser Ser Ser *** 405 <![CDATA[<210> 35]]> <![CDATA[<211> 1218]]> <![CDATA[<21]]>2> DNA]]> <br/><![CDATA[<213> 人工序列]]> <br/> <br/><![CDATA[<220>]]> <br/><![CDATA[<223> YhhS(S129G/I241T/D246V/V330I) NT]]> <br/> <br/> <br/><![CDATA[<400> 35]]> <br/><![CDATA[atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60 tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120 ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180 ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240 ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300 ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360 cgcgtcatcc ttgggattgg gcaaggtttt gccggaacgg gatcgaccct atggggcgtt 420 ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480 ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540 gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600 ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660 tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720 accacgctgt tttatgtcgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780 agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840 ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900 gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960 gtgttcccgg cattgggtgt agtggcgata aaagcggttc cgcagcaaaa tcagggggcg 1020 gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080 gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140 gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200 gccgcctcat catcttaa 1218 <![CDATA[<210> 36]]> <![CDATA[<211> 406]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(S129G/I241Q) AA]]> <![CDATA[<400> 36]]> Met Pro Glu Pro Val Ala Glu Pro Ala Leu Asn Gly Leu Arg Leu Asn 1 5 10 15 Leu Arg Ile Val Ser Ile Val Met Phe Asn Phe Ala Ser Tyr Leu Thr 20 25 30 Ile Gly Leu Pro Leu Ala Val Leu Pro Gly Tyr Val His Asp Val Met 35 40 45 Gly Phe Ser Ala Phe Trp Ala Gly Leu Val Ile Ser Leu Gln Tyr Phe 50 55 60 Ala Thr Leu Leu Ser Arg Pro His Ala Gly Arg Tyr Ala Asp Ser Leu 65 70 75 80 Gly Pro Lys Lys Ile Val Val Phe Gly Leu Cys Gly Cys Phe Leu Ser 85 90 95 Gly Leu Gly Tyr Leu Thr Ala Gly Leu Thr Ala Ser Leu Pro Val Ile 100 105 110 Ser Leu Leu Leu Leu Cys Leu Gly Arg Val Ile Leu Gly Ile Gly Gln 115 120 125 Gly Phe Ala Gly Thr Gly Ser Thr Leu Trp Gly Val Gly Val Val Gly 130 135 140 Ser Leu His Ile Gly Arg Val Ile Ser Trp Asn Gly Ile Val Thr Tyr 145 150 155 160 Gly Ala Met Ala Met Gly Ala Pro Leu Gly Val Val Phe Tyr His Trp 165 170 175 Gly Gly Leu Gln Ala Leu Ala Leu Ile Ile Met Gly Val Ala Leu Val 180 185 190 Ala Ile Leu Leu Ala Ile Pro Arg Pro Thr Val Lys Ala Ser Lys Gly 195 200 205 Lys Pro Leu Pro Phe Arg Ala Val Leu Gly Arg Val Trp Leu Tyr Gly 210 215 220 Met Ala Leu Ala Leu Ala Ser Ala Gly Phe Gly Val Ile Ala Thr Phe 225 230 235 240 Gln Thr Leu Phe Tyr Asp Ala Lys Gly Trp Asp Gly Ala Ala Phe Ala 245 250 255 Leu Thr Leu Phe Ser Cys Ala Phe Val Gly Thr Arg Leu Leu Phe Pro 260 265 270 Asn Gly Ile Asn Arg Ile Gly Gly Leu Asn Val Ala Met Ile Cys Phe 275 280 285 Ser Val Glu Ile Ile Gly Leu Leu Leu Val Gly Val Ala Thr Met Pro 290 295 300 Trp Met Ala Lys Ile Gly Val Leu Leu Ala Gly Ala Gly Phe Ser Leu 305 310 315 320 Val Phe Pro Ala Leu Gly Val Val Ala Val Lys Ala Val Pro Gln Gln 325 330 335 Asn Gln Gly Ala Ala Leu Ala Thr Tyr Thr Val Phe Met Asp Leu Ser 340 345 350 Leu Gly Val Thr Gly Pro Leu Ala Gly Leu Val Met Ser Trp Ala Gly 355 360 365 Val Pro Val Ile Tyr Leu Ala Ala Ala Gly Leu Val Ala Ile Ala Leu 370 375 380 Leu Leu Thr Trp Arg Leu Lys Lys Arg Pro Pro Glu His Val Pro Glu 385 390 395 400 Ala Ala Ser Ser Ser *** 405 <![CDATA[<210> 37]]> <![CDATA[<211> 1218]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> YhhS(S129G/I241Q) NT]]> <![CDATA[<400> 37]]> atgcccgaac ccgtagccga acccgcgcta aacggattgc gcctgaattt gcgcattgtc 60 tctatagtca tgtttaactt cgccagctac ctcaccatcg ggttgccgct cgctgtatta 120 ccgggctatg tccatgatgt gatgggcttt agcgccttct gggcaggatt ggttatcagc 180 ctgcaatatt tcgccacctt gctgagccgc cctcatgccg gacgttacgc cgattcgctg 240 ggacccaaaa agattgtcgt cttcggttta tgcggctgct ttttgagcgg tctggggtat 300 ctgacggcag gattaaccgc cagtctgcct gtcatcagcc tgttattact ttgcctgggg 360 cgcgtcatcc ttgggattgg gcaaggtttt gccggaacgg gatcgaccct atggggcgtt 420 ggcgtggttg gctcgctgca tatcgggcgg gtgatttcgt ggaacggcat tgtcacttac 480 ggggcgatgg cgatgggtgc gccgttaggc gtcgtgtttt atcactgggg cggcttgcag 540 gcgttagcgt taatcattat gggcgtggcg ctggtggcca ttttgttggc gatcccgcgt 600 ccgacggtaa aagccagtaa aggcaaaccg ctgccgtttc gcgcggtgct tgggcgcgtc 660 tggctgtacg gtatggcgct ggcactggct tccgccggat ttggcgtcat cgccaccttt 720 cagacgctgt tttatgacgc taaaggttgg gacggtgcgg ctttcgcgct gacgctgttt 780 agctgtgcgt ttgtcggtac gcgtttgtta ttccctaacg gcattaaccg tatcggtggc 840 ttaaacgtag cgatgatttg ctttagcgtt gagataatcg gcctgctact ggttggcgtg 900 gcgactatgc cgtggatggc gaaaatcggc gtcttactgg cgggggccgg gttttcgctg 960 gtgttcccgg cattgggtgt agtggcggta aaagcggttc cgcagcaaaa tcagggggcg 1020 gcgctggcaa cttacaccgt atttatggat ttatcgcttg gcgtgactgg accactggct 1080 gggctggtga tgagctgggc gggcgtaccg gtgatttatc tggcggcggc gggactggtc 1140 gcaatcgcgt tattactgac gtggcgatta aaaaaacggc ctccggaaca cgtccctgag 1200 gccgcctcat catcttaa 1218 <![CDATA[<210> 38]]> <![CDATA[<211> 4695]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> pSKH130]]> <![CDATA[<400> 38]]> tcgaggccgc gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc 60 gataatgtcg ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc cgatgcgcca 120 gagttgtttc tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc 180 agactaaact ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact 240 cctgatgatg catggttact caccactgcg atccccggga aaacagcatt ccaggtatta 300 gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg 360 ttgcattcga ttcctgtttg taattgtcct tttaacagcg atcgcgtatt tcgtctcgct 420 caggcgcaat cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt 480 aatggctggc ctgttgaaca agtctggaaa gaaatgcata agcttttgcc attctcaccg 540 gattcagtcg tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa 600 ttaataggtt gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc 660 atcctatgga actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa 720 tatggtattg ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt 780 ttctaatcag aattggttaa ttggttgtaa cactggcaga gcattacgct gacttgacgg 840 gacggcggct ttgttgaata aatcgaactt ttgctgagtt gaaggatcag atcacgcatc 900 ttcccgacaa cgcagaccgt tccgtggcaa agcaaaagtt caaaatcacc aactggtcca 960 cctacaacaa agctctcatc aaccgtggct ccctcacttt ctggctggat gatggggcga 1020 ttcaggcctg gtatgagtca gcaacacctt cttcacgagg cagacctcag cgctcaaaga 1080 tgcaggggta aaagctaacc gcatctttac cgacaaggca tccggcagtt caacagatcg 1140 ggaagggctg gatttgctga ggatgaaggt ggaggaaggt gatgtcattc tggtgaagaa 1200 gctcgaccgt cttggccgcg acaccgccga catgatccaa ctgataaaag agtttgatgc 1260 tcagggtgta gcggttcggt ttattgacga cgggatcagt accgacggtg atatggggca 1320 aatggtggtc accgcgcgta atacgactca ctatagggcg aattggagct ccaccgcggt 1380 ggcggccgct ctagacttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 1440 cgccttcttg acgagttctt ctgagcggga ctctggggtt cgctagagga tcgatccttt 1500 ttaacccatc acatatacct gccgttcact attatttagt gaaatgagat attatgatat 1560 tttctgaatt gtgattaaaa aggcaacttt atgcccatgc aacagaaact ataaaaaata 1620 cagagaatga aaagaaacag atagattttt tagttcttta ggcccgtagt ctgcaaatcc 1680 ttttatgatt ttctatcaaa caaaagagga aaatagacca gttgcaatcc aaacgagagt 1740 ctaatagaat gaggtcgaaa agtaaatcgc gcgggtttgt tactgataaa gcaggcaaga 1800 cctaaaatgt gtaaagggca aagtgtatac tttggcgtca ccccttacat attttaggtc 1860 tttttttatt gtgcgtaact aacttgccat cttcaaacag gagggctgga agaagcagac 1920 cgctaacaca gtacataaaa aaggagacat gaacgatgaa catcaaaaag tttgcaaaac 1980 aagcaacagt attaaccttt actaccgcac tgctggcagg aggcgcaact caagcgtttg 2040 cgaaagaaac gaaccaaaag ccatataagg aaacatacgg catttcccat attacacgcc 2100 atgatatgct gcaaatccct gaacagcaaa aaaatgaaaa atatcaagtt cctgaattcg 2160 attcgtccac aattaaaaat atctcttctg caaaaggcct ggacgtttgg gacagctggc 2220 cattacaaaa cgctgacggc actgtcgcaa actatcacgg ctaccacatc gtctttgcat 2280 tagccggaga tcctaaaaat gcggatgaca catcgattta catgttctat caaaaagtcg 2340 gcgaaacttc tattgacagc tggaaaaacg ctggccgcgt ctttaaagac agcgacaaat 2400 tcgatgcaaa tgattctatc ctaaaagacc aaacacaaga atggtcaggt tcagccacat 2460 ttacatctga cggaaaaatc cgtttattct acactgattt ctccggtaaa cattacggca 2520 aacaaacact gacaactgca caagttaacg tatcagcatc agacagctct ttgaacatca 2580 acggtgtaga ggattataaa tcaatctttg acggtgacgg aaaaacgtat caaaatgtac 2640 agcagttcat cgatgaaggc aactacagct caggcgacaa ccatacgctg agagatcctc 2700 actacgtaga agataaaggc cacaaatact tagtatttga agcaaacact ggaactgaag 2760 atggctacca aggcgaagaa tctttattta acaaagcata ctatggcaaa agcacatcat 2820 tcttccgtca agaaagtcaa aaacttctgc aaagcgataa aaaacgcacg gctgagttag 2880 caaacggcgc tctcggtatg attgagctaa acgatgatta cacactgaaa aaagtgatga 2940 aaccgctgat tgcatctaac acagtaacag atgaaattga acgcgcgaac gtctttaaaa 3000 tgaacggcaa atggtacctg ttcactgact cccgcggatc aaaaatgacg attgacggca 3060 ttacgtctaa cgatatttac atgcttggtt atgtttctaa ttctttaact ggcccataca 3120 agccgctgaa caaaactggc cttgtgttaa aaatggatct tgatcctaac gatgtaacct 3180 ttacttactc acacttcgct gtacctcaag cgaaaggaaa caatgtcgtg attacaagct 3240 atatgacaaa cagaggattc tacgcagaca aacaatcaac gtttgcgcca agcttcctgc 3300 tgaacatcaa aggcaagaaa acatctgttg tcaaagacag catccttgaa caaggacaat 3360 taacagttaa caaataaaaa cgcaaaagaa aatgccgatg ggtaccgagc gaaatgaccg 3420 accaagcgac gcccaacctg ccatcggatc ccccgggctg caggaattcg atatcacgct 3480 agtcgaccta gctagcatat ggggagatct actagtaaag catgccaatt ggtattctat 3540 agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg tagccgcgtt 3600 ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag cagaccctat 3660 catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc tgagtttctg 3720 gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc atcgctagcc 3780 catggctaat tcccatgtca gccgttaagt gttcctgtgt cactcaaaat tgctttgaga 3840 ggctctaagg gcttctcagt gcgttacatc cctggcttgt tgtccacaac cgttaaacct 3900 taaaagcttt aaaagcctta tatattcttt tttttcttat aaaacttaaa accttagagg 3960 ctatttaagt tgctgattta tattaatttt attgttcaaa catgagagct tagtacgtga 4020 aacatgagag cttagtacgt tagccatgag agcttagtac gttagccatg agggtttagt 4080 tcgttaaaca tgagagctta gtacgttaaa catgagagct tagtacgtga aacatgagag 4140 cttagtacgt actatcaaca ggttgaactg ctgatcttca gatcctctac gccggacgca 4200 tcgtggccgg atcttgcggc cgcaaaaatt aaaaatgaag ttttaaatca atctaaagta 4260 tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca ccaataactg 4320 ccttaaaaaa actagcgctg aggtctgcct cgtgaagaag gtgttgctga ctcataccag 4380 gcctgaatcg ccccatcatc cagccagaaa gtgagggagc cacggttgat gagagctttg 4440 ttgtaggtgg accagttggt gattttgaac ttttgctttg ccacggaacg gtctgcgttg 4500 tcgggaagat gcgtgatctg atccttcaac tcagcaaaag ttcgatttat tcaacaaagc 4560 cacgttgtgt ctcaaaatct ctgatgttac attgcacaag ataaaaatat atcatcatga 4620 acaataaaac tgtctgctta cataaacagt aatacaaggg gtgttatgag ccatattcaa 4680 cgggaaacgt cttgc 4695
(無)
Claims (17)
- 一種YhhS變異體,其中對應於SEQ ID NO: 1之一胺基酸序列中第129位置之一胺基酸是以另一胺基酸取代。
- 如請求項1所述之YhhS變異體,其中對應於SEQ ID NO: 1之該胺基酸序列中第129位置之該胺基酸為一極性胺基酸。
- 如請求項2所述之YhhS變異體,其中該極性胺基酸為絲胺酸。
- 如請求項1所述之YhhS變異體,其中該另一胺基酸為一非極性胺基酸。
- 如請求項4所述之YhhS變異體,其中該非極性胺基酸為甘胺酸或丙胺酸。
- 一種YhhS變異體,其中異白胺酸,對應於SEQ ID NO: 1之一胺基酸序列中第241位置之一胺基酸,是以麩醯胺酸取代。
- 如請求項1所述之YhhS變異體,其中異白胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第241位置之一胺基酸,是以麩醯胺酸或蘇胺酸所取代。
- 如請求項1或6所述之YhhS變異體,其中天門冬胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第246位置之一胺基酸,是進一步以纈胺酸所取代,且/或纈胺酸,對應於SEQ ID NO: 1之該胺基酸序列中第330位置之一胺基酸,是進一步以異白胺酸所取代。
- 如請求項1或6所述之YhhS變異體,其中該變異體具有與選自於SEQ ID NOs: 2至5、34及36之一胺基酸序列90%或更高的序列相等性。
- 一種多核苷酸,其編碼如請求項1或6所述之該變異體。
- 一種大腸桿菌( Escherichia)屬之微生物,其包含如請求項1或6所述之該變異體,或編碼該變異體的一多核苷酸。
- 如請求項11所述之微生物,其中該微生物進一步展現與固有活性相比弱化之磷酸絲胺酸磷酸酶(SerB)之活性。
- 一種用於生產O-磷絲胺酸的方法,該方法包含於一培養基中培養包含如請求項1或6所述之該變異體或編碼該變異體之一多核苷酸的一微生物。
- 一種用於生產半胱胺酸或半胱胺酸之衍生物的方法,該方法包含: a) 於一培養基中培養包含如請求項1或6所述之該變異體或編碼該變異體之一多核苷酸的一生產O-磷絲胺酸之微生物以生產O-磷絲胺酸或一含O-磷絲胺酸之培養基;及 b) 使O-磷絲胺酸硫氫化酶(OPSS)或表現O-磷絲胺酸硫氫化酶(OPSS)之一微生物、步驟a)中所生產之O-磷絲胺酸或含O-磷絲胺酸之培養基,以及一硫化物與彼此接觸。
- 一種用於生產O-磷絲胺酸的組成物,其包含如請求項1或6所述之該變異體;編碼該變異體的一多核苷酸;包含該變異體或編碼該變異體之一多核苷酸的一微生物;或其等之二或多者的組合。
- 一種使用如請求項1或6所述之該變異體;編碼該變異體的一多核苷酸;包含該多核苷酸之一載體;或包含該變異體或編碼該變異體之一多核苷酸的一微生物生產O-磷絲胺酸、半胱胺酸,或半胱胺酸之衍生物的用途。
- 一種使用如請求項1或6所述之變異體自一微生物輸出O-磷絲胺酸的用途。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210072313A KR20220163754A (ko) | 2021-06-03 | 2021-06-03 | 신규한 YhhS 변이체 및 이를 이용한 O-포스포세린, 시스테인 및 이의 유도체의 생산방법 |
KR10-2021-0072313 | 2021-06-03 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202315944A true TW202315944A (zh) | 2023-04-16 |
TWI832275B TWI832275B (zh) | 2024-02-11 |
Family
ID=84324443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111120779A TWI832275B (zh) | 2021-06-03 | 2022-06-03 | 新穎YhhS變異體及使用其生產O-磷絲胺酸、半胱胺酸及半胱胺酸之衍生物的方法 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP4368632A1 (zh) |
KR (1) | KR20220163754A (zh) |
AR (1) | AR126071A1 (zh) |
AU (1) | AU2022286220A1 (zh) |
CA (1) | CA3231648A1 (zh) |
TW (1) | TWI832275B (zh) |
WO (1) | WO2022255839A1 (zh) |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19726083A1 (de) | 1997-06-19 | 1998-12-24 | Consortium Elektrochem Ind | Mikroorganismen und Verfahren zur fermentativen Herstellung von L-Cystein, L-Cystin, N-Acetyl-Serin oder Thiazolidinderivaten |
JP3997631B2 (ja) * | 1998-01-12 | 2007-10-24 | 味の素株式会社 | 発酵法によるl−セリンの製造法 |
KR100620092B1 (ko) | 2004-12-16 | 2006-09-08 | 씨제이 주식회사 | 코리네박테리움 속 세포로부터 유래된 신규한 프로모터서열, 그를 포함하는 발현 카세트 및 벡터, 상기 벡터를포함하는 숙주 세포 및 그를 이용하여 유전자를 발현하는방법 |
KR101208267B1 (ko) | 2010-10-20 | 2012-12-04 | 씨제이제일제당 (주) | O-포스포세린 설피드릴라제 변이체 |
KR101381048B1 (ko) | 2010-10-20 | 2014-04-14 | 씨제이제일제당 (주) | O-포스포세린 생산 균주 및 이로부터 생산된 o-포스포세린으로부터 l-시스테인 또는 이의 유도체의 생산방법 |
KR101525663B1 (ko) * | 2013-05-10 | 2015-06-04 | 씨제이제일제당 (주) | 신규 o-포스포세린 배출 단백질 및 이를 이용한 o-포스포세린의 생산방법 |
KR101677328B1 (ko) * | 2014-08-12 | 2016-11-18 | 씨제이제일제당 (주) | O-포스포세린 생산 미생물 및 이를 이용한 o-포스포세린 또는 l-시스테인 생산 방법 |
KR101632642B1 (ko) | 2015-01-29 | 2016-06-22 | 씨제이제일제당 주식회사 | 신규한 프로모터 및 그의 용도 |
KR101694632B1 (ko) * | 2015-09-11 | 2017-01-10 | 씨제이제일제당 (주) | 신규 o-포스포세린 배출 단백질 변이체 및 이를 이용한 o-포스포세린, 시스테인 및 이의 유도체의 생산방법 |
ES2907694T3 (es) | 2016-08-31 | 2022-04-26 | Cj Cheiljedang Corp | Nuevo promotor y uso del mismo |
EP3824089A4 (en) | 2018-08-07 | 2021-12-15 | CJ Cheiljedang Corporation | NUCLEIC ACID MOLECULES WITH A VARIANT OF THE RPOC-ENCODING SEQUENCE |
-
2021
- 2021-06-03 KR KR1020210072313A patent/KR20220163754A/ko not_active Application Discontinuation
-
2022
- 2022-06-03 AU AU2022286220A patent/AU2022286220A1/en active Pending
- 2022-06-03 CA CA3231648A patent/CA3231648A1/en active Pending
- 2022-06-03 TW TW111120779A patent/TWI832275B/zh active
- 2022-06-03 WO PCT/KR2022/007930 patent/WO2022255839A1/ko active Application Filing
- 2022-06-03 AR ARP220101475A patent/AR126071A1/es unknown
- 2022-06-03 EP EP22816498.4A patent/EP4368632A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2022286220A1 (en) | 2024-05-23 |
TWI832275B (zh) | 2024-02-11 |
EP4368632A1 (en) | 2024-05-15 |
WO2022255839A1 (ko) | 2022-12-08 |
AR126071A1 (es) | 2023-09-06 |
CA3231648A1 (en) | 2022-12-08 |
KR20220163754A (ko) | 2022-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102277407B1 (ko) | 신규한 글루타메이트 합성 효소 서브 유니트 알파 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
KR102284730B1 (ko) | 신규한 수용성 피리딘 뉴클레오티드 트랜스수소효소 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR102273638B1 (ko) | 신규한 포스포글리세린산 디하이드로게나제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102273639B1 (ko) | 신규한 이중기능성 메틸렌테트라히드로폴레이트 탈수소효소/메테닐테트라하이드로폴레이트 사이클로하이드롤라아제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102273640B1 (ko) | 신규한 f0f1 atp 합성효소 서브유닛 감마 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102287112B1 (ko) | 신규한 쿠퍼익스포팅 P-type 에이티피에이즈 A 변이체 및 이를 이용한 L-트립토판 생산 방법 | |
KR102306010B1 (ko) | 신규한 분지쇄아미노산 투과효소 변이체 및 이를 이용한 l-발린 생산 방법 | |
KR102279696B1 (ko) | 신규한 l-세린 암모니아 분해 효소 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102287111B1 (ko) | 신규한 데옥시구아노신트리포스페이트 트리포스포하이드로레이즈 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
EP4063502A1 (en) | Novel cysteine sulfinate desulfinase variant and method for producing l-valine using same | |
TWI832275B (zh) | 新穎YhhS變異體及使用其生產O-磷絲胺酸、半胱胺酸及半胱胺酸之衍生物的方法 | |
TWI809494B (zh) | 新穎MdtH變異體及藉由使用其生產O-磷絲胺酸及半胱胺酸及半胱胺酸之衍生物的方法 | |
KR102287113B1 (ko) | 신규한 하이드로레이즈 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
RU2797499C1 (ru) | Новый вариант белка семейства транспортера цианата и способ получения L-триптофана с его применением | |
KR102306009B1 (ko) | 신규한 WhiB 계열 전사 조절자 WhcA 변이체 및 이를 이용한 L-발린 생산 방법 | |
RU2793185C1 (ru) | Новый вариант гидролазы и способ получения L-триптофана | |
RU2791193C1 (ru) | Новый вариант феррохелатазы и способ получения l-триптофана с его применением | |
KR102281371B1 (ko) | 신규한 글리세르알데히드-3-인산탈수소효소 변이체 및 이를 이용한 l-발린 생산 방법 | |
RU2793441C1 (ru) | Новый вариант белка сборки праймосомы и способ получения l-лизина с его применением | |
RU2790565C1 (ru) | Новый вариант экспортирующей медь АТФазы А Р-типа и способ получения L-триптофана с его применением | |
KR102284728B1 (ko) | 신규한 H(+)/Cl(-) 익스체인지 트랜스포터 변이체 및 이를 이용한 L-트립토판 생산 방법 | |
KR102281370B1 (ko) | 신규한 2-이소프로필말레이트합성효소 변이체 및 이를 이용한 l-발린 생산 방법 | |
KR102306008B1 (ko) | 신규한 전사 조절자 변이체 및 이를 이용한 l-발린 생산 방법 | |
KR102281369B1 (ko) | 신규한 디히드로리포일 아세틸기전이효소 변이체 및 이를 이용한 l-발린 생산 방법 | |
RU2791243C1 (ru) | Новый вариант растворимой пиридиннуклеотидтрансгидрогеназы и способ получения l-триптофана с его применением |