CN110291192B - 在可滴定氨基酸具有修饰的赖氨酸脱羧酶 - Google Patents
在可滴定氨基酸具有修饰的赖氨酸脱羧酶 Download PDFInfo
- Publication number
- CN110291192B CN110291192B CN201680091428.9A CN201680091428A CN110291192B CN 110291192 B CN110291192 B CN 110291192B CN 201680091428 A CN201680091428 A CN 201680091428A CN 110291192 B CN110291192 B CN 110291192B
- Authority
- CN
- China
- Prior art keywords
- host cell
- cada
- leu
- glu
- ile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108010048581 Lysine decarboxylase Proteins 0.000 title abstract description 11
- 150000001413 amino acids Chemical class 0.000 title description 89
- 230000004048 modification Effects 0.000 title description 4
- 238000012986 modification Methods 0.000 title description 4
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 198
- 229920001184 polypeptide Polymers 0.000 claims abstract description 196
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 196
- 238000000034 method Methods 0.000 claims abstract description 34
- 210000004027 cell Anatomy 0.000 claims description 160
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 94
- 238000006467 substitution reaction Methods 0.000 claims description 94
- VHRGRCVQAFMJIZ-UHFFFAOYSA-N cadaverine Chemical compound NCCCCCN VHRGRCVQAFMJIZ-UHFFFAOYSA-N 0.000 claims description 82
- 150000007523 nucleic acids Chemical group 0.000 claims description 63
- 108091033319 polynucleotide Proteins 0.000 claims description 59
- 102000040430 polynucleotide Human genes 0.000 claims description 59
- 239000002157 polynucleotide Substances 0.000 claims description 59
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 46
- 239000004472 Lysine Substances 0.000 claims description 36
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 34
- 241000588724 Escherichia coli Species 0.000 claims description 31
- 241000588729 Hafnia alvei Species 0.000 claims description 19
- 239000013604 expression vector Substances 0.000 claims description 18
- CJNBYAVZURUTKZ-UHFFFAOYSA-N hafnium(IV) oxide Inorganic materials O=[Hf]=O CJNBYAVZURUTKZ-UHFFFAOYSA-N 0.000 claims description 16
- 241000588722 Escherichia Species 0.000 claims description 14
- 241000588731 Hafnia Species 0.000 claims description 14
- 241000186216 Corynebacterium Species 0.000 claims description 12
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 12
- 241000894006 Bacteria Species 0.000 claims description 11
- 210000000349 chromosome Anatomy 0.000 claims description 4
- 238000012258 culturing Methods 0.000 claims description 4
- 230000001851 biosynthetic effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 31
- 244000005700 microbiome Species 0.000 abstract description 8
- 235000001014 amino acid Nutrition 0.000 description 156
- 108020004414 DNA Proteins 0.000 description 124
- 229940024606 amino acid Drugs 0.000 description 98
- 108090000623 proteins and genes Proteins 0.000 description 82
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 47
- 235000018102 proteins Nutrition 0.000 description 47
- 102000004169 proteins and genes Human genes 0.000 description 47
- 229960003646 lysine Drugs 0.000 description 41
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 39
- 230000035772 mutation Effects 0.000 description 38
- 235000018977 lysine Nutrition 0.000 description 34
- 102000039446 nucleic acids Human genes 0.000 description 31
- 108020004707 nucleic acids Proteins 0.000 description 31
- 238000004519 manufacturing process Methods 0.000 description 27
- 230000014509 gene expression Effects 0.000 description 24
- 101150008667 cadA gene Proteins 0.000 description 23
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 22
- 239000013612 plasmid Substances 0.000 description 22
- 235000003704 aspartic acid Nutrition 0.000 description 20
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 20
- 101100276041 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) ctpD gene Proteins 0.000 description 19
- 102000004190 Enzymes Human genes 0.000 description 18
- 108090000790 Enzymes Proteins 0.000 description 18
- 229940088598 enzyme Drugs 0.000 description 18
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 18
- 235000014304 histidine Nutrition 0.000 description 18
- 108090000489 Carboxy-Lyases Proteins 0.000 description 16
- 102000004031 Carboxy-Lyases Human genes 0.000 description 16
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 16
- 239000013598 vector Substances 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 14
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 14
- 235000007682 pyridoxal 5'-phosphate Nutrition 0.000 description 14
- 239000011589 pyridoxal 5'-phosphate Substances 0.000 description 14
- 239000002253 acid Substances 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 13
- 239000000523 sample Substances 0.000 description 13
- 241000894007 species Species 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 12
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 9
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 230000001580 bacterial effect Effects 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 8
- 241000588748 Klebsiella Species 0.000 description 8
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 8
- 241001138501 Salmonella enterica Species 0.000 description 8
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 8
- 230000002378 acidificating effect Effects 0.000 description 8
- 150000003862 amino acid derivatives Chemical class 0.000 description 8
- 239000000539 dimer Substances 0.000 description 8
- 238000012239 gene modification Methods 0.000 description 8
- 230000005017 genetic modification Effects 0.000 description 8
- 235000013617 genetically modified food Nutrition 0.000 description 8
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 8
- 108010009298 lysylglutamic acid Proteins 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 108010051242 phenylalanylserine Proteins 0.000 description 8
- 241000588921 Enterobacteriaceae Species 0.000 description 7
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 7
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 7
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 7
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 108010047857 aspartylglycine Proteins 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 108010077515 glycylproline Proteins 0.000 description 7
- 108010036413 histidylglycine Proteins 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000004475 Arginine Substances 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 6
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 6
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 6
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 6
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 6
- 235000009697 arginine Nutrition 0.000 description 6
- 229960003121 arginine Drugs 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 229920000768 polyamine Polymers 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 230000002103 transcriptional effect Effects 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 5
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 5
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 5
- 229960000723 ampicillin Drugs 0.000 description 5
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 5
- -1 cadaverine Chemical class 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 235000018417 cysteine Nutrition 0.000 description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 235000013922 glutamic acid Nutrition 0.000 description 5
- 239000004220 glutamic acid Substances 0.000 description 5
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 239000013600 plasmid vector Substances 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 235000002374 tyrosine Nutrition 0.000 description 5
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 5
- VBDMWOKJZDCFJM-FXQIFTODSA-N Ala-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N VBDMWOKJZDCFJM-FXQIFTODSA-N 0.000 description 4
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 4
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 4
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 4
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 4
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 4
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 4
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 4
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 4
- LTTLSZVJTDSACD-OWLDWWDNSA-N Ala-Thr-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O LTTLSZVJTDSACD-OWLDWWDNSA-N 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 4
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 4
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 4
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 4
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 4
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 4
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 4
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 4
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 4
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 4
- OGMDXNFGPOPZTK-GUBZILKMSA-N Asn-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N OGMDXNFGPOPZTK-GUBZILKMSA-N 0.000 description 4
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 4
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 4
- ICDDSTLEMLGSTB-GUBZILKMSA-N Asn-Met-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ICDDSTLEMLGSTB-GUBZILKMSA-N 0.000 description 4
- KSGAFDTYQPKUAP-GMOBBJLQSA-N Asn-Met-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KSGAFDTYQPKUAP-GMOBBJLQSA-N 0.000 description 4
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 4
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 4
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 4
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 4
- MFTVXYMXSAQZNL-DJFWLOJKSA-N Asp-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)O)N MFTVXYMXSAQZNL-DJFWLOJKSA-N 0.000 description 4
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 4
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 4
- DKQCWCQRAMAFLN-UBHSHLNASA-N Asp-Trp-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O DKQCWCQRAMAFLN-UBHSHLNASA-N 0.000 description 4
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 4
- GYNUXDMCDILYIQ-QRTARXTBSA-N Asp-Val-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N GYNUXDMCDILYIQ-QRTARXTBSA-N 0.000 description 4
- 241000193830 Bacillus <bacterium> Species 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- HAYVLBZZBDCKRA-SRVKXCTJSA-N Cys-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N HAYVLBZZBDCKRA-SRVKXCTJSA-N 0.000 description 4
- IQXSTXKVEMRMMB-XAVMHZPKSA-N Cys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N)O IQXSTXKVEMRMMB-XAVMHZPKSA-N 0.000 description 4
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 4
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 4
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 4
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 4
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 4
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 4
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 4
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 4
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 4
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 4
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 4
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 4
- QRWPTXLWHHTOCO-DZKIICNBSA-N Glu-Val-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QRWPTXLWHHTOCO-DZKIICNBSA-N 0.000 description 4
- QIZJOTQTCAGKPU-KWQFWETISA-N Gly-Ala-Tyr Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 QIZJOTQTCAGKPU-KWQFWETISA-N 0.000 description 4
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 4
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 4
- UUWOBINZFGTFMS-UWVGGRQHSA-N Gly-His-Met Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O UUWOBINZFGTFMS-UWVGGRQHSA-N 0.000 description 4
- MDKCBHZLQJZOCJ-STQMWFEESA-N Gly-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)CN MDKCBHZLQJZOCJ-STQMWFEESA-N 0.000 description 4
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 4
- AWASVTXPTOLPPP-MBLNEYKQSA-N His-Ala-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWASVTXPTOLPPP-MBLNEYKQSA-N 0.000 description 4
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 4
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 4
- CTJHHEQNUNIYNN-SRVKXCTJSA-N His-His-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O CTJHHEQNUNIYNN-SRVKXCTJSA-N 0.000 description 4
- VTZYMXGGXOFBMX-DJFWLOJKSA-N His-Ile-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O VTZYMXGGXOFBMX-DJFWLOJKSA-N 0.000 description 4
- MJUUWJJEUOBDGW-IHRRRGAJSA-N His-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MJUUWJJEUOBDGW-IHRRRGAJSA-N 0.000 description 4
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 4
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 4
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 4
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 4
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 4
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 4
- YBGTWSFIGHUWQE-MXAVVETBSA-N Ile-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CN=CN1 YBGTWSFIGHUWQE-MXAVVETBSA-N 0.000 description 4
- CCYGNFBYUNHFSC-MGHWNKPDSA-N Ile-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CCYGNFBYUNHFSC-MGHWNKPDSA-N 0.000 description 4
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 4
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 4
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 4
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 4
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 4
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 4
- DZMWFIRHFFVBHS-ZEWNOJEFSA-N Ile-Tyr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N DZMWFIRHFFVBHS-ZEWNOJEFSA-N 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 4
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 4
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 4
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 4
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 4
- KWURTLAFFDOTEQ-GUBZILKMSA-N Leu-Cys-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KWURTLAFFDOTEQ-GUBZILKMSA-N 0.000 description 4
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 4
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 4
- LAGPXKYZCCTSGQ-JYJNAYRXSA-N Leu-Glu-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LAGPXKYZCCTSGQ-JYJNAYRXSA-N 0.000 description 4
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 4
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 4
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 4
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 4
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 4
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 4
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 4
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 4
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 4
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 4
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 4
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 4
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 4
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 4
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 4
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 4
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 4
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 4
- YHBHDYYHOUAKLR-AVGNSLFASA-N Met-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YHBHDYYHOUAKLR-AVGNSLFASA-N 0.000 description 4
- XOFDBXYPKZUAAM-GUBZILKMSA-N Met-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N XOFDBXYPKZUAAM-GUBZILKMSA-N 0.000 description 4
- VSJAPSMRFYUOKS-IUCAKERBSA-N Met-Pro-Gly Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O VSJAPSMRFYUOKS-IUCAKERBSA-N 0.000 description 4
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 4
- FZDOBWIKRQORAC-ULQDDVLXSA-N Met-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N FZDOBWIKRQORAC-ULQDDVLXSA-N 0.000 description 4
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 4
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 4
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 4
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 4
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 4
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 4
- AGTHXWTYCLLYMC-FHWLQOOXSA-N Phe-Tyr-Glu Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 AGTHXWTYCLLYMC-FHWLQOOXSA-N 0.000 description 4
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 4
- BAKAHWWRCCUDAF-IHRRRGAJSA-N Pro-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CN=CN1 BAKAHWWRCCUDAF-IHRRRGAJSA-N 0.000 description 4
- XFFIGWGYMUFCCQ-ULQDDVLXSA-N Pro-His-Tyr Chemical compound C1=CC(O)=CC=C1C[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H]1[NH2+]CCC1)CC1=CN=CN1 XFFIGWGYMUFCCQ-ULQDDVLXSA-N 0.000 description 4
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 4
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 4
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 4
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 4
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 4
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 4
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 4
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 4
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 4
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 4
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 4
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 4
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 4
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 4
- KZURUCDWKDEAFZ-XVSYOHENSA-N Thr-Phe-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O KZURUCDWKDEAFZ-XVSYOHENSA-N 0.000 description 4
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 4
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 4
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 4
- 239000004473 Threonine Substances 0.000 description 4
- BOMYCJXTWRMKJA-RNXOBYDBSA-N Trp-Phe-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N BOMYCJXTWRMKJA-RNXOBYDBSA-N 0.000 description 4
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 4
- PALLCTDPFINNMM-JQHSSLGASA-N Trp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N PALLCTDPFINNMM-JQHSSLGASA-N 0.000 description 4
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 4
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 4
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 4
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 108010064997 VPY tripeptide Proteins 0.000 description 4
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 4
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 4
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 4
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 4
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 4
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 4
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 4
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 4
- 101150015189 aceE gene Proteins 0.000 description 4
- 235000004279 alanine Nutrition 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 125000001931 aliphatic group Chemical group 0.000 description 4
- SCJNCDSAIRBRIA-DOFZRALJSA-N arachidonyl-2'-chloroethylamide Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCCl SCJNCDSAIRBRIA-DOFZRALJSA-N 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010040030 histidinoalanine Proteins 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 108010053037 kyotorphin Proteins 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 108010000761 leucylarginine Proteins 0.000 description 4
- 150000002668 lysine derivatives Chemical class 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 108010085203 methionylmethionine Proteins 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 238000006384 oligomerization reaction Methods 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 108010015796 prolylisoleucine Proteins 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 235000004400 serine Nutrition 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- 108010005652 splenotritin Proteins 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 235000008521 threonine Nutrition 0.000 description 4
- 108010036387 trimethionine Proteins 0.000 description 4
- 108010029384 tryptophyl-histidine Proteins 0.000 description 4
- 108010084932 tryptophyl-proline Proteins 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 108010009962 valyltyrosine Proteins 0.000 description 4
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 3
- HIMXTOIXVXWHTB-DCAQKATOSA-N Arg-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HIMXTOIXVXWHTB-DCAQKATOSA-N 0.000 description 3
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 3
- JZDZLBJVYWIIQU-AVGNSLFASA-N Asn-Glu-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JZDZLBJVYWIIQU-AVGNSLFASA-N 0.000 description 3
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 3
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 3
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 3
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 3
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 3
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- 101100242035 Bacillus subtilis (strain 168) pdhA gene Proteins 0.000 description 3
- 101100350224 Bacillus subtilis (strain 168) pdhB gene Proteins 0.000 description 3
- 101100236536 Corynebacterium glutamicum (strain ATCC 13032 / DSM 20300 / BCRC 11384 / JCM 1318 / LMG 3730 / NCIMB 10025) glcB gene Proteins 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 3
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 3
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 3
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 3
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 3
- ZWRDOVYMQAAISL-UWVGGRQHSA-N Gly-Met-Lys Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCCN ZWRDOVYMQAAISL-UWVGGRQHSA-N 0.000 description 3
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 3
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 3
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 3
- 101100123255 Komagataeibacter xylinus aceC gene Proteins 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 3
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 3
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 3
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 3
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 3
- 241001214257 Mene Species 0.000 description 3
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 3
- YLDSJJOGQNEQJK-AVGNSLFASA-N Met-Pro-Leu Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YLDSJJOGQNEQJK-AVGNSLFASA-N 0.000 description 3
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 3
- 101100134871 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aceE gene Proteins 0.000 description 3
- 101100406344 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aceF gene Proteins 0.000 description 3
- 241000607142 Salmonella Species 0.000 description 3
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 3
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 3
- 241000607720 Serratia Species 0.000 description 3
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 3
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 3
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 3
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 3
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 3
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 3
- 101150094017 aceA gene Proteins 0.000 description 3
- 101150036393 aceB gene Proteins 0.000 description 3
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 101150070136 axeA gene Proteins 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 238000012933 kinetic analysis Methods 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 235000006109 methionine Nutrition 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 229910052700 potassium Inorganic materials 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 2
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000193752 Bacillus circulans Species 0.000 description 2
- 101000742087 Bacillus subtilis (strain 168) ATP-dependent threonine adenylase Proteins 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 241000186146 Brevibacterium Species 0.000 description 2
- 108010036824 Citrate (pro-3S)-lyase Proteins 0.000 description 2
- 241000588923 Citrobacter Species 0.000 description 2
- 102000007120 DEAD-box RNA Helicases Human genes 0.000 description 2
- 108010033333 DEAD-box RNA Helicases Proteins 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- 241000588698 Erwinia Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 2
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 2
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- GYAFMRQGWHXMII-IUKAMOBKSA-N Ile-Asp-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N GYAFMRQGWHXMII-IUKAMOBKSA-N 0.000 description 2
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 2
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 2
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 2
- 108010093096 Immobilized Enzymes Proteins 0.000 description 2
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 2
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 2
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 2
- LQUIENKUVKPNIC-ULQDDVLXSA-N Leu-Met-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LQUIENKUVKPNIC-ULQDDVLXSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241001467578 Microbacterium Species 0.000 description 2
- 241000588771 Morganella <proteobacterium> Species 0.000 description 2
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 2
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 2
- 101100462488 Phlebiopsis gigantea p2ox gene Proteins 0.000 description 2
- 101100145480 Prochlorococcus marinus (strain SARG / CCMP1375 / SS120) rpoC2 gene Proteins 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000863430 Shewanella Species 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 101000774739 Thermus thermophilus Aspartokinase Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 241000607734 Yersinia <bacteria> Species 0.000 description 2
- 230000006518 acidic stress Effects 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 101150025518 citE gene Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000006114 decarboxylation reaction Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- JBKVHLHDHHXQEQ-UHFFFAOYSA-N epsilon-caprolactam Chemical compound O=C1CCCCCN1 JBKVHLHDHHXQEQ-UHFFFAOYSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 101150063051 hom gene Proteins 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 235000014705 isoleucine Nutrition 0.000 description 2
- 235000005772 leucine Nutrition 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 101150087021 menE gene Proteins 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229960003104 ornithine Drugs 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 235000008729 phenylalanine Nutrition 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 101150060030 poxB gene Proteins 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 235000013930 proline Nutrition 0.000 description 2
- 230000005588 protonation Effects 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 101150109946 rpo1C gene Proteins 0.000 description 2
- 101150042391 rpoC gene Proteins 0.000 description 2
- 101150103066 rpoC1 gene Proteins 0.000 description 2
- 101150014006 thrA gene Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241001103870 Adia Species 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- 241000024188 Andala Species 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- XVAPVJNJGLWGCS-ACZMJKKPSA-N Asn-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVAPVJNJGLWGCS-ACZMJKKPSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- 241000193375 Bacillus alcalophilus Species 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 101000780609 Bacillus subtilis (strain 168) Aspartokinase 1 Proteins 0.000 description 1
- 101100351124 Bacillus subtilis (strain 168) pckA gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000989055 Cronobacter Species 0.000 description 1
- 108010090461 DFG peptide Proteins 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 101100378193 Dictyostelium discoideum aco2 gene Proteins 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 101100465553 Dictyostelium discoideum psmB6 gene Proteins 0.000 description 1
- 241001147784 Domibacillus aminovorans Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000607473 Edwardsiella <enterobacteria> Species 0.000 description 1
- 101000787195 Escherichia coli (strain K12) Aldose sugar dehydrogenase YliI Proteins 0.000 description 1
- 101100434436 Escherichia coli (strain K12) adiA gene Proteins 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 101100398755 Escherichia coli (strain K12) ldcC gene Proteins 0.000 description 1
- 101100400218 Escherichia coli (strain K12) lysO gene Proteins 0.000 description 1
- 101100410777 Escherichia coli (strain K12) puuA gene Proteins 0.000 description 1
- 101100246465 Escherichia coli (strain K12) puuP gene Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 101150099894 GDHA gene Proteins 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- STHSGOZLFLFGSS-SUSMZKCASA-N Gln-Thr-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STHSGOZLFLFGSS-SUSMZKCASA-N 0.000 description 1
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- QDMVXRNLOPTPIE-WDCWCFNPSA-N Glu-Lys-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QDMVXRNLOPTPIE-WDCWCFNPSA-N 0.000 description 1
- YRMZCZIRHYCNHX-RYUDHWBXSA-N Glu-Phe-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O YRMZCZIRHYCNHX-RYUDHWBXSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- 102000005731 Glucose-6-phosphate isomerase Human genes 0.000 description 1
- 108010070600 Glucose-6-phosphate isomerase Proteins 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- SJLKKOZFHSJJAW-YUMQZZPRSA-N Gly-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN SJLKKOZFHSJJAW-YUMQZZPRSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- 101100277701 Halobacterium salinarum gdhX gene Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- ZDNNDIJTUHQCAM-MXAVVETBSA-N Ile-Ser-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ZDNNDIJTUHQCAM-MXAVVETBSA-N 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108020003285 Isocitrate lyase Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- 235000019766 L-Lysine Nutrition 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 1
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- 108010036940 Levansucrase Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- MXMDJEJWERYPMO-XUXIUFHCSA-N Lys-Ile-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MXMDJEJWERYPMO-XUXIUFHCSA-N 0.000 description 1
- 108050008732 Malate synthase A Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 101100276922 Nostoc sp. (strain PCC 7120 / SAG 25.82 / UTEX 2576) dapF2 gene Proteins 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108090000472 Phosphoenolpyruvate carboxykinase (ATP) Proteins 0.000 description 1
- 101100392454 Picrophilus torridus (strain ATCC 700027 / DSM 9790 / JCM 10055 / NBRC 100828) gdh2 gene Proteins 0.000 description 1
- 101100217185 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) aruC gene Proteins 0.000 description 1
- 101000728677 Pseudomonas sp Bifunctional aspartate aminotransferase and L-aspartate beta-decarboxylase Proteins 0.000 description 1
- 101100169519 Pyrococcus abyssi (strain GE5 / Orsay) dapAL gene Proteins 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 108010042687 Pyruvate Oxidase Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 241000531124 Raoultella ornithinolytica Species 0.000 description 1
- 101100116769 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) gdhA-2 gene Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- OJFFAQFRCVPHNN-JYBASQMISA-N Ser-Thr-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OJFFAQFRCVPHNN-JYBASQMISA-N 0.000 description 1
- 241000607714 Serratia sp. Species 0.000 description 1
- 241001415395 Spea Species 0.000 description 1
- 101150084989 Speg gene Proteins 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- 101100116197 Streptomyces lavendulae dcsC gene Proteins 0.000 description 1
- 101100022072 Sulfolobus acidocaldarius (strain ATCC 33909 / DSM 639 / JCM 8929 / NBRC 15157 / NCIMB 11770) lysJ gene Proteins 0.000 description 1
- 101100492609 Talaromyces wortmannii astC gene Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 101100157012 Thermoanaerobacterium saccharolyticum (strain DSM 8691 / JW/SL-YS485) xynB gene Proteins 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- 241000588901 Zymomonas Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- BUFLLCUFNHESEH-UHFFFAOYSA-N [5-(2-amino-6-oxo-3h-purin-9-yl)-4-hydroxy-2-[[hydroxy(phosphonooxy)phosphoryl]oxymethyl]oxolan-3-yl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(OP(O)(=O)OP(O)(O)=O)C1O BUFLLCUFNHESEH-UHFFFAOYSA-N 0.000 description 1
- 241000193761 [Bacillus] caldolyticus Species 0.000 description 1
- 101150116772 aatA gene Proteins 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 101150053555 acnB gene Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 101150050866 argD gene Proteins 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 101150005925 aspC gene Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 241000186254 coryneform bacterium Species 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 101150011371 dapA gene Proteins 0.000 description 1
- 101150073654 dapB gene Proteins 0.000 description 1
- 101150064923 dapD gene Proteins 0.000 description 1
- 101150000582 dapE gene Proteins 0.000 description 1
- 101150062988 dapF gene Proteins 0.000 description 1
- 101150100742 dapL gene Proteins 0.000 description 1
- 101150057904 ddh gene Proteins 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 101150056556 gadA gene Proteins 0.000 description 1
- 101150032444 gadC gene Proteins 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 101150106096 gltA gene Proteins 0.000 description 1
- 101150042350 gltA2 gene Proteins 0.000 description 1
- 101150041871 gltB gene Proteins 0.000 description 1
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 101150109073 ldhD gene Proteins 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 101150033534 lysA gene Proteins 0.000 description 1
- 101150035025 lysC gene Proteins 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 101150043597 murE gene Proteins 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 101150111581 pflB gene Proteins 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 101150000475 pntAB gene Proteins 0.000 description 1
- 101150023641 ppc gene Proteins 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000001273 protein sequence alignment Methods 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 101150047761 sdhA gene Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 101150044368 speC gene Proteins 0.000 description 1
- 101150079682 speE gene Proteins 0.000 description 1
- 101150109161 speE1 gene Proteins 0.000 description 1
- 101150022778 speF gene Proteins 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid Chemical compound OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 239000002351 wastewater Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/001—Amines; Imines
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01018—Lysine decarboxylase (4.1.1.18)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了与野生型赖氨酸脱羧酶相比,具有在碱性pH下增加活性的突变的CadA多肽。本发明还提供产生这种突变多肽的方法,经遗传修饰以过表达所述突变多肽的微生物,以及产生这种微生物的方法。
Description
发明背景
大多数酶由于其是两性分子而在较窄的pH范围内最佳地起作用。周围环境的pH直接影响构成酶的氨基酸的酸性和碱性基团上的电荷。这些电荷的变化影响酶的净电荷、活性位点的pKa及酶表面的电荷分布。结果,pH的变化会影响酶的活性、溶解性和稳定性。
被称为酸脱羧酶的蛋白质类别是催化碱性氨基酸(例如赖氨酸,精氨酸,鸟氨酸)的脱羧酶反应以产生多胺作为在许多微生物中酸应激反应的一部分的一组酶。大肠杆菌(Escherichia coli)具有一些PLP依赖性酸脱羧酶:CadA,LdcC,AdiA,SpeA,SpeC,SpeF,GadA和GadB。所有这些酶在窄pH范围内起作用,且酶活性在该pH范围之外明显降低(Kanjeeet al.,Biochemistry 50,9388-9398,2011)。先前已经观察到这些PLP依赖性脱羧酶二聚化形成完整活性位点。在某些情况下,如CadA,二聚体形成十聚体,聚集成为最佳功能所需的较高分子量蛋白质复合物。抑制较高分子量的蛋白质复合物形成(例如在最佳pH之外的条件下)导致功能的明显降低(Kanjee et al.,The EMBO Journal 30,931-944,2011)。
蛋白质中各个氨基酸的pKa值对于确定其生物分子功能是重要的,因为蛋白质-水溶液中的主要反应之一是某些氨基酸与蛋白质环境的质子交换。pKa是在中性和荷电状态之间自由能差异的量度,及表示氨基酸提供或接受质子的倾向。某些氨基酸具有可滴定基团,使其更容易接受和提供质子。这些氨基酸包括天冬氨酸、谷氨酸、半胱氨酸、丝氨酸、酪氨酸、苏氨酸、组氨酸、赖氨酸和精氨酸。一些氨基酸的样品pKa值为:天冬氨酸为4.0,谷氨酸为4.4,半胱氨酸为8.7,酪氨酸为9.6,组氨酸为6.3,赖氨酸为10.4,精氨酸为13.0(Nielsen JE&Vriend G,Proteins 43,403-412,2001)。根据文献资源不同,这些pKa值可以变化0.5。
可滴定基团是否接受或提供质子取决于其环境,例如pH或其附近的其它氨基酸。例如,当pH小于可滴定基团的pKa时,该基团更可能接受质子。相反,当pH大于可滴定基团的pKa时,该基团更可能提供质子。当一组可滴定的氨基酸接受或提供质子时,取决于质子交换发生前的电荷,氨基酸可以带正电荷、负电荷或中性的。当两基团彼此接近时,带电基团可以与其它带电基团相互作用。相同电荷相互排斥,相反电荷相互吸引。质子化的中性电荷基团通过氢键相互作用仍可与其它基团相互作用。
了解蛋白质可滴定基团的pKa值不仅对于理解pH如何影响多肽折叠和酶活性是重要的,而且对蛋白质-蛋白质相互作用也很重要(Jensen JE,Curr Pharm Biotechnol 9,96-102,2008),特别是在酸脱羧酶的情况下,其四级结构由于环境pH的变化而发生显著变化。酸脱羧酶对碱性pH的耐受性是重要的,因为其作为产物产生的多胺提高反应环境的pH。因此,酸脱羧酶的活性通常随着产生更多的多胺而降低,当反应环境的pH超过野生型酸脱羧酶所耐受的pH范围时,这可导致脱羧反应过早地停止。很少有研究评估具有可滴定基团的各种氨基酸突变对酸脱羧酶功能的影响。
基于先前文献(Kanjee,et al.The EMBO Journal 30,931-944,2011),当环境pH改变时,CadA从由十聚体和高级寡聚物组成的状态转变为主要由二聚体组成的状态。十聚体的形成是形成高级寡聚物的先决条件。已经表明,CadA在pH5.0-5.5条件下最佳地起作用(Lemonnier M&Lane D,Microbiology 144,751-760,1998)。在这种酸性pH,Kanjee等使用EM表明CadA主要以高级寡聚物存在。当pH增加到6.0以上或当存在抑制剂ppGpp时,不形成高级寡聚物,且脱羧酶功能显著降低。然而,还没有关于描述CadA高级寡聚物如何形成以及在其形成中起作用的氨基酸残基的文献。
发明概述
本发明部分基于突变的发现,所述突变提供稳定四元结构形成所需的化学相互作用的能力,以及增加的稳定性以允许突变蛋白在更宽的pH范围起作用。在更宽的pH范围起作用的能力对于保持高反应速率而不需要添加额外的化学物以维持pH值是重要的。在宽pH范围维持高反应速率可以使赖氨酸更快地转变为尸胺及减少所需的设备量。蛋白质对碱性pH的耐受性不再需要添加额外的化学物以维持pH值的需要。用于维持pH的这些化学物通常形成盐,例如(SO42-或Cl-),其进入废水中或必须使用另外的纯化步骤从生产过程中除去。因此,在比野生型更宽的pH范围内起作用的突变酸脱羧酶通过减少在该过程中形成的盐的量而降低整个过程的成本和环境中留下的痕迹。氨基酸组氨酸的pKa为6.3,这是酸脱羧酶蛋白CadA在不同寡聚状态之间转换的pH。寡聚状态的改变也改变了蛋白质的活性。CadA蛋白中至少一个组氨酸残基看起来在检测环境pH中起重要作用。pH与CadA功能之间的联系与作为酸应激反应系统一部分的CadA蛋白的功能一致。当环境的pH足够高时,不再需要CadA蛋白继续合成将进一步提高环境pH的多胺。当环境的pH降至低于组氨酸残基的pKa时,组氨酸残基可以经历可滴定基团的质子化状态的变化,导致CadA蛋白从较高的寡聚状态转变为较低的寡聚状态,从而影响CadA蛋白的活性。
来自大肠杆菌的CadA蛋白(SEQ ID NO:2)中总共有24个组氨酸残基,其中2个位于N-末端翼结构域(wing domain)(H9和H23),1个位于接头区(H152)),11个位于PLP结合亚结构域(H193,H197,H245,H250,H282,H300,H328,H366,H379,H396,H402),4个位于亚结构域4(H458,H474,H483,H521)及6个位于C-末端结构域(H594,H599,H600,H629,H685,H694)。来自埃希氏菌属(Escherichia)的CadA蛋白序列与来自克雷伯氏菌属(Klebsiella),肠杆菌科(Enterobacteriaceae)和肠道沙门氏菌(Salmonella enterica)的序列比对,表明所有24个组氨酸残基除了一个残基(H521)之外都是保守的(图1)。来自肠道沙门氏菌的CadA等价蛋白在氨基酸位置521具有精氨酸残基。
一方面,本发明因此提供了CadA变体多肽,其在相应于参照SEQ ID NO:2确定的氨基酸455-483的区域中包含至少一个氨基酸取代,其中所述至少一个氨基酸取代选自位置457和/或458;及其中所述CadA变体多肽与SEQ ID NO:2-5任一个具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽在位置457和458包含取代。在一些实施方案中,所述氨基酸取代是H458A/C/E/F/G/M/P/T/V/W/Y或者D457A/C/E/F/H/I/K/L/M/N/S/W/Y。在一些实施方案中,所述氨基酸取代是H458A/C/F/M/V/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中,所述CadA变体多肽进一步在参照SEQ ID NO:2确定的位置460包含天冬氨酸取代。在一些实施方案中,所述天冬氨酸取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。在一些实施方案中,在这个段落中上述的CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或者至少95%的相同性。在一些实施方案中,CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或者至少95%的相同性。在一些实施方案中,所述CadA变体多肽包含SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的氨基酸序列,其中在位置457的天冬氨酸被取代,例如取代D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者取代D457A/C/H/K/L/M/N/S;在位置458的组氨酸被取代,例如取代H458A/C/E/F/G/M/P/T/V/W/Y或者H458A/C/F/M/V/W/Y;或者在位置460的天冬氨酸被取代,例如取代D460C/F/Q/I/S/V/W或D460F/V/W/Y。在一些实施方案中,所述CadA变体包含SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的氨基酸序列,其中在位置D457、H458和D460的氨基酸之一被取代;或者在位置D457、H458和D460的两个氨基酸被取代。在一些实施方案中,所述CadA变体包含SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的氨基酸序列,其中所有位置D457、H458和D460均被取代。
另一方面,本发明提供了遗传修饰的宿主细胞,其包含如本文例如在前一段所述的CadA变体多肽。在典型的实施方案中,所述遗传修饰的宿主细胞经遗传修饰以过表达一或多种赖氨酸生物合成多肽。在一些实施方案中,所述宿主细胞是细菌。在进一步的实施方案中,所述宿主细胞来自埃希氏菌属,例如大肠杆菌(Escherichia coli),或者哈夫尼菌属(Hafnia),例如蜂房哈夫尼菌(Hafnia alvei),或者棒杆菌属(Corynebacterium),例如谷氨酸棒杆菌(Corynebacterium glutamicum)。
在另一方面,本发明提供了多核苷酸,其包含编码在本文例如本节前段所述的CadA变体多肽的核酸序列。在一些实施方案中,如本节前段中所述的CadA变体多肽与SEQID NO:2具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。在一些实施方案中,CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。在进一步的方面,本发明另外提供了包含编码所述CadA变体的多核苷酸的表达载体和/或提供了包含所述表达载体的遗传修饰的宿主细胞。在一些实施方案中,所述宿主细胞是细菌,例如来自埃希氏菌属或哈夫尼菌属。在一些实施方案中,所述宿主细胞来自棒状杆菌属,例如谷氨酸棒杆菌。在一些实施方案中,所述遗传修饰的宿主细胞是大肠杆菌。在一些实施方案中,所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述遗传修饰的宿主细胞是谷氨酸棒杆菌。
另一方面,本发明提供了包含多核苷酸的遗传修饰的宿主细胞,所述多核苷酸包含编码在本文如本节前段所述的CadA变体多肽的核酸序列,其中编码所述CadA变体多肽的核酸序列整合到宿主细胞染色体中。在一些实施方案中,所述宿主细胞是细菌,例如来自埃希氏菌属、棒杆菌属或哈夫尼菌属。在一些实施方案中,所述遗传修饰的宿主细胞是大肠杆菌。在一些实施方案中,所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述遗传修饰的宿主细胞是谷氨酸棒杆菌。
另一方面,本发明提供了一种生产尸胺的方法,所述方法包括在表达CadA变体多肽的条件下培养本文如本节前段所述的遗传修饰的宿主细胞。
一方面,本发明因此提供了遗传修饰的宿主细胞,其包含在相应于参照SEQ IDNO:2确定的氨基酸455-483的区域中具有至少一个氨基酸取代的CadA变体多肽,其中所述至少一个氨基酸取代选自位置457、458和460位;其中所述CadA变体多肽与SEQ ID NO:2-5任一个具有至少70%的相同性;且其中所述宿主细胞来自哈夫尼菌属、埃希氏菌属或者棒杆菌属。在典型的实施方案中,所述遗传修饰的宿主细胞经遗传修饰以过表达一或多种赖氨酸生物合成多肽。在一些实施方案中,所述宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述宿主细胞是大肠杆菌。在一些实施方案中,所述宿主细胞是谷氨酸棒杆菌。在一些实施方案中,所述CadA变体多肽在位置457包含氨基酸取代。在一些实施方案中,所述氨基酸取代为D457A/C/E/F/H/I/K/L/M/N/S/W/Y。在一些实施方案中,所述氨基酸取代是D457A/C/H/K/L/M/N/S。在一些实施方案中,所述CadA变体多肽在位置458包含氨基酸取代。在一些实施方案中,所述氨基酸取代是H458A/C/E/F/G/M/P/T/V/W/Y。在一些实施方案中,所述氨基酸取代是H458A/C/F/M/V/W/Y。在一些实施方案中,所述CadA变体多肽在位置460包含氨基酸取代。在一些实施方案中,所述氨基酸取代是D460C/F/Q/I/S/V/W/Y。在一些实施方案中,所述氨基酸取代是D460C/F/Q/I/S/V/W。在一些实施方案中,所述氨基酸取代是D460F/V/W/Y。在一些实施方案中,所述CadA变体多肽具有选自位置457、458和460的至少两个氨基酸取代。在一些实施方案中,所述CadA变体多肽具有选自位置457/458和460的至少三个氨基酸取代。在一些实施方案中,所述CadA变体多肽具有氨基酸取代457和458。在一些实施方案中,所述CadA变体多肽具有氨基酸取代458和460。在一些实施方案中,所述CadA变体多肽具有氨基酸取代457和460。在一些实施方案中,如本段上述的CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。在一些实施方案中,CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。
另一方面,本发明提供了包含编码如本文例如本节前段所述的CadA变体多肽的核酸序列的多核苷酸。在一些实施方案中,如本节前段所述的CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。在一些实施方案中,CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。在进一步的方面,本发明另外提供了包含编码所述CadA变体的多核苷酸的表达载体和/或提供了包含所述表达载体的遗传修饰的宿主细胞。在一些实施方案中,所述宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述宿主细胞是大肠杆菌。在一些实施方案中,所述宿主细胞是谷氨酸棒杆菌。
另一方面,本发明提供了包含多核苷酸的遗传修饰的宿主细胞,所述多核苷酸包含编码CadA变体多肽的核酸序列,所述CadA变体多肽在相应于参照SEQ ID NO:2确定的氨基酸455-483的区域中具有至少一个氨基酸取代,其中至少一个氨基酸取代选自位置457、458和460;其中所述CadA变体多肽与SEQ ID NO:2-5任一个具有至少70%的相同性;其中所述宿主细胞来自哈夫尼菌属、埃希氏菌属或者棒杆菌属,及其中编码所述CadA变体多肽的核酸序列整合到宿主细胞染色体中。在一些实施方案中,所述宿主细胞来自哈夫尼菌属、埃希氏菌属或者棒杆菌属。在一些实施方案中,所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述宿主细胞是大肠杆菌。在一些实施方案中,所述宿主细胞是谷氨酸棒杆菌。
另一方面,本发明提供了一种生产尸胺的方法,所述方法包括在表达CadA变体多肽的条件下培养本文例如本节前段所述的遗传修饰的宿主细胞。
附图描述
图1示出大肠杆菌CadA多肽序列SEQ ID NO:2与来自肠道沙门氏菌(WP_001540636.1)、克雷伯氏菌多物种(WP_012968785)及肠杆菌科多物种(WP_002892486.1)的CadA同系物的序列比对。
发明详述
在描述本发明之前,应理解本发明不限于所描述的特定实施方案,因为所述实施方案当然可以改变。还应理解,本文使用的术语仅用于描述特定实施方案的目的,而不是限制性的。
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文描述的那些类似或等同的任何方法和材料可用于本发明的实践或测试,但现在描述优选的方法和材料。本文提及的所有出版物和登录号均通过引用并入本文作参考,以揭示和描述与所引用的出版物相关的方法和/或材料。
术语
如在本发明所用,“CadA多肽”是指具有SEQ ID NO:2所示氨基酸序列的大肠杆菌CadA多肽,或者其具有催化L-赖氨酸脱羧产生尸胺的活性的生物活性变体。生物活性变体包括大肠杆菌CadA多肽的等位基因、突变体、片段和种间同系物。CadA在结构和功能上都已经充分鉴定。CadA结构的蛋白质数据库ID是3N75。举例的其它物种的CadA多肽包括来自克雷伯氏菌属(例如SEQ ID NO:3)、肠杆菌科(例如SEQ ID NO:5)和肠道沙门氏菌(例如SEQID NO:6)的CadA。来自其它物种的其它CadA多肽包括沙雷氏菌属(Serratia sp.),WP033635725.1和解鸟氨酸拉乌尔菌(Raoultella ornithinolytica),YP 007874766.1。在一些实施方案中,“CadA多肽”与SEQ ID NO:2所示CadA多肽的至少大约200、300、400、500或更多个氨基酸的区域或者全长具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%、85%、90%的相同性;通常至少91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性。在一些实施方案中,“CadA多肽”包含与包含相应于SEQID NO:2的氨基酸455-483的氨基酸残基的区域具有至少80%、至少85%、至少90%、至少95%、或者至少91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性的区域,其中该区域中存在的天然组氨酸或天冬氨酸如本文所述用另一非天然存在的氨基酸取代。在一些实施方案中,“CadA多肽”优选与SEQ ID NO:3、SEQ ID NO:4或SEQ IDNO:5的CadA多肽的至少大约200、300、400、500或更多个氨基酸的区域或全长具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性。
如本文所用,“CadA多核苷酸”是指编码CadA多肽的多核苷酸。编码CadA的核酸或多核苷酸是指基因、前mRNA、mRNA等,包括编码本文所述特定氨基酸序列的变体、等位基因、片段、突变体和种间同系物的核酸。
如本文所用,术语“碱性pH”是指pH大于7.5的溶液或周围环境。在一个实施方案中,碱性pH是指溶液或周围环境具有至少8.0、至少8.5或更高的pH。
如本文所用,在产生氨基酸衍生物如尸胺的语境中,术语“增强的”或“改善的”是指表达本发明CadA变体多肽的宿主细胞与对照对应细胞相比,产生的氨基酸衍生物增加,所述对照对应细胞如野生型菌株的细胞或者表达野生型CadA蛋白的相同菌株的细胞。在一个实施方案中,与表达野生型CadA的对应细胞的CadA活性相比,所述CadA变体的活性改善至少10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更高,其中活性通过测量在相同条件下由所述宿主细胞和对照细胞产生的氨基酸衍生物(通常是尸胺)的生产而评估。例如,本发明的CadA变体多肽的活性可以通过评估等份的用编码所述变体CadA多肽的多核苷酸转化的宿主细胞培养物相比于相应等份的表达野生型CadA的相同菌株的对应宿主细胞培养物而确定。再进一步而言,本发明的CadA变体多肽与对应野生型CadA相比的活性可以通过评估用包含编码所述变体CadA多肽的核酸序列的载体转化的细胞(变体宿主细胞)或者包含编码野生型CadA多肽的核酸的载体转化的细胞(对照宿主细胞)产生的尸胺而确定。在表达CadA的条件下生长变体宿主细胞和对照宿主细胞并且将等份与终浓度分别为120g/L和0.1mM的赖氨酸-HCl和PLP在pH8.0温育一段时间,例如2小时。温育后测量尸胺的产生。在实施例部分中提供了示例的测定。
当在给定氨基酸或多核苷酸序列的编号的语境中使用的术语“参照编号”、或“相应于”或“参照”确定,是指当给定的氨基酸或多核苷酸序列与参考序列比较时指定参考序列的残基的编号。例如,当变体多肽以最大比对与SEQ ID NO:2比对时,变体CadA多肽序列的位置“相应于”SEQ ID NO:2中的位置。
如本文所用,与CadA多肽相关的术语“野生型”、“天然的”和“天然发生的”是指具有天然发生的序列的CadA蛋白。
在本发明的上下文中,关于突变多肽或突变多核苷酸所用术语“突变体”可与“变体”互换使用。“非天然”发生的CadA变体是指不是天然存在于细胞中及是通过遗传修饰例如对天然CadA多核苷酸或多肽使用基因工程技术或诱变技术产生的变体或突变体CadA多肽。本公开上下文中的“变体”CadA多肽包括任何包含至少一个氨基酸取代的CadA多肽,其中所述至少一个氨基酸取代是在参照SEQ ID NO:2确定的位置457、458和460的组氨酸或天冬氨酸残基的取代。本发明的变体CadA多肽相对于SEQ ID NO:2还可具有其它突变,包括进一步的取代、插入或缺失。
术语“多核苷酸”和“核酸”可互换使用,是指从5'至3'末端读取的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。用于本发明的核酸通常含有磷酸二酯键,但是在某些情况下可以使用可具有替代主链的核酸类似物,包括例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基亚磷酰胺键(参见Eckstein,Oligonucleotides and Analogues:APractical Approach,Oxford University Press)、正电荷主链、非离子主链和非核糖主链。核酸或多核苷酸还可包括允许聚合酶正确通读的修饰的核苷酸。“多核苷酸序列”或“核酸序列”包括核酸的有义链和反义链作为单个单链或双链体。如本领域技术人员所理解的,单链的描述也定义了互补链的序列;因此本文描述的序列也提供所述序列的互补序列。除非另有说明,否则特定核酸序列也隐含涵盖其变体(例如简并密码子取代)和互补序列,以及明确指出的序列。核酸可以是DNA-基因组DNA和cDNA、RNA或杂合体,其中核酸可以包含脱氧核糖核苷酸和核糖核苷酸的组合,以及碱基的组合,包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤次黄嘌呤、异胞嘧啶、异鸟嘌呤等。
在本发明公开的上下文中用于两个核酸或多肽的术语“基本上相同”是指与参考序列具有至少50%序列相同性的序列。相同性百分比可以是50%-100%的任何整数。一些实施方案包括:与参考序列相比具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性,使用本文所述程序、优选使用标准参数的BLAST进行,如下文描述。
如果两个序列中的核苷酸或氨基酸残基序列在如下所述进行最大对应性比对时是相同的,则称这两个核酸序列或多肽序列是“相同的”。在描述两或更多个核酸或多肽序列时,术语“相同”或“相同性”百分比是指当在对比窗进行最大对应性对比和比对时(如使用以下序列对比算法之一或通过手动比对和目测进行测量),所述两或更多个序列或子序列是相同的,或者具有指定百分比的相同的氨基酸残基或核苷酸。
对于序列对比,通常一个序列作为参考序列,将测试序列与其对比。当使用序列对比算法时,将测试序列和参考序列输入计算机,如果需要则指定子序列坐标,及指定序列算法程序参数。可以使用默认程序参数,也可以指定替代参数。然后,序列对比算法基于程序参数计算测试序列相对于参考序列的序列相同性百分比。
可用于确定变体CadA多肽与SEQ ID NO:2或另一多肽参考序列如SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5是否具有序列相同性的算法是BLAST算法,其在Altschul etal.,1990,J.Mol.Biol.215:403-410中描述。进行BLAST分析的软件可通过国家生物技术信息中心(在全球网站ncbi.nlm.nih.gov/上)可公开获得。用于进行蛋白质序列比对的示例性软件包括ClustalW2和BLASTP。对于氨基酸序列,BLASTP程序默认使用字长(W)为3,期望阈值(E)为10和BLOSUM62评分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915(1989))。在本公开中,多肽序列相同性通常使用默认参数的BLASTP AlignSequence确定。
如本文所用,“对比窗”包括选自20-600、通常大约50至大约200、更通常大约100至大约150个连续位置的任一序列节段,其中在两个序列最佳比对后,可以将序列与相同数目的连续位置的参考序列进行对比。用于对比的序列比对方法为本领域熟知。可以通过如下方法进行最佳序列比对以进行对比,例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法,Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法,Pearson&Lipman,Proc.Nat'l.Acad.Sci.USA 85:2444(1988)的搜索相似性方法,通过这些算法的计算机执行程序(Wisconsin Genetics Software Package,GeneticsComputer Group,575Science Dr.,Madison,WI中的GAP,BESTFIT,FASTA和TFASTA),或者通过手动比对及目测进行。最佳比对通常是使用默认参数BLASTP进行。
与参考序列基本相同的核酸或蛋白质序列包括“保守修饰的变体”。关于特定的核酸序列,保守修饰的变体是指编码相同或基本相同的氨基酸序列的那些核酸,或者在核酸不编码氨基酸序列的情况中是指基本相同的序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定的蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在丙氨酸由密码子指定的每个位置,密码子可以改变为任何相应密码子而不改变编码的多肽。这种核酸变异是“沉默变异”,其是保守修饰变异的一种。本文中编码多肽的每个核酸序列也描述了核酸的每种可能的沉默变异。技术人员将认识到,可以修饰核酸中的每个密码子(除了AUG,其通常是甲硫氨酸的唯一密码子)以产生功能相同的分子。因此,编码多肽的核酸的每个沉默变异隐含在每个所述序列中。
如本文所用,术语“多肽”包括含有天然发生的氨基酸和氨基酸主链以及非天然发生的氨基酸和氨基酸类似物的多肽。
关于氨基酸序列,技术人员将认识到在核酸、肽、多肽或蛋白质序列中改变编码序列中单个氨基酸或小百分比氨基酸的各个取代是“保守修饰的变体”,其中所述改变导致一个氨基酸由化学相似的氨基酸取代。提供功能相似的氨基酸的保守取代表为本领域熟知。以这种方式定义的氨基酸组的实例可包括:“带电荷/极性组”,包括Glu(谷氨酸或E),Asp(天冬氨酸或D),Asn(天冬酰胺或N),Gln(谷氨酰胺或Q),Lys(赖氨酸或K),Arg(精氨酸或R)和His(组氨酸或H);“芳香族或环形组”,包括Pro(脯氨酸或P),Phe(苯丙氨酸或F),Tyr(酪氨酸或Y)和Trp(色氨酸或W);及“脂肪族组”,包括Gly(甘氨酸或G),Ala(丙氨酸或A),Val(缬氨酸或V),Leu(亮氨酸或L),Ile(异亮氨酸或I),Met(甲硫氨酸或M),Ser(丝氨酸或S),Thr(苏氨酸或T)和Cys(半胱氨酸或C)。在每个组中,也可以再分亚组。例如,带电荷/极性氨基酸组可以细分为亚组,包括:“正电荷亚组”包括Lys、Arg和His,“负电荷亚组”包括Glu和Asp,及“极性亚组”包括Asn和Gln。在另一个实例中,芳香族或环形组可以细分为亚组,包括:“氮环亚组”包括Pro、His和Trp,“苯基亚组”包括Phe和Tyr。在另一个实例中,脂肪族组可以细分为亚组,包括:“大脂肪族非极性亚组”包括Val、Leu和Ile,“脂肪族小极性亚组”包括Met、Ser、Thr和Cys,和“小残基亚组”包括Gly和Ala。保守突变的实例包括上述亚组内氨基酸的氨基酸取代,例如但不限于:Arg取代Lys,反之亦然,由此可以保持正电荷;Asp取代Glu,反之亦然,由此可以保持负电荷;Thr取代Ser,反之亦然,由此可以保持游离--OH;及Asn取代Gln,反之亦然,由此可以保持游离--NH2。以下六组均含有进一步提供示例的彼此保守取代的氨基酸。1)Ala,Ser,Thr;2)Asp,Glu;3)Asn,Gln;4)Arg,Lys;5)Ile,Leu,Met,Val;6)Phe,Try和Trp(参见例如Creighton,Proteins(1984))。在一些实施方案中,保守取代用于产生在除组氨酸或天冬氨酸残基之外的位点具有取代的CadA变体。
如在本公开中所用,“可滴定基团”是指由于pH变化而能提供或接受质子的氨基酸侧链。在一个实施方案中,可滴定基团可以在沿着CadA蛋白的各个氨基酸发现。在一个实施方案中,具有可滴定基团的氨基酸包括天冬氨酸、谷氨酸、半胱氨酸、丝氨酸、酪氨酸、苏氨酸、组氨酸、赖氨酸和精氨酸。虽然不希望受以下限制,但相信可滴定基团允许氨基酸侧链的旋转或定向,由此相邻氨基酸pKa(即可滴定基团的4埃内的氨基酸)可能受到可滴定基团的影响。在一个实施方案中,一个氨基酸的可滴定基团与相邻氨基酸之间小于2埃的距离被认为是强相互作用。在另一个实施方案中,一个氨基酸的可滴定基团与相邻氨基酸之间大于4埃的距离被认为是弱相互作用。
为本发明的目的,“氨基酸三元体(triad)”是指出现具有可滴定基团的一个组氨酸和两个相邻酸性氨基酸,其中组氨酸的pKa值接近于CadA在不同寡聚状态之间转变的pH值,如使用基于线性化Poisson-Boltzmann方程的pKa计算方法预测CadA蛋白中组氨酸残基的pKa值确定。在一个实施方案中,氨基酸三元体包含在参照SEQ ID NO:2确定的位置457的天冬氨酸残基、位置458的组氨酸残基和位置460的天冬氨酸残基的至少一个取代。在另一个实施方案中,氨基酸三元体包含至少两个取代,其中所述至少两个取代选自参照SEQ IDNO:2确定的位置457的天冬氨酸残基、位置458的组氨酸残基和位置460的天冬氨酸残基。在另一个实施方案中,氨基酸三元体包含在参照SEQ ID NO:2确定的位置457的天冬氨酸残基、位置458的组氨酸残基和位置460的天冬氨酸残基三个残基中每一个的取代。
如本文所用,术语“启动子”是指能够驱动细胞中核酸序列转录的多核苷酸序列。因此,在本发明的多核苷酸构建体中使用的启动子包括顺式和反式作用转录控制元件和调节序列,其参与调节或调整基因转录的时机和/或速率。例如,启动子可以是顺式作用转录控制元件,包括增强子、阻抑物结合序列等。这些顺式作用序列通常与蛋白质或其它生物分子相互作用以进行(打开/关闭、调节、调整等)基因转录。大多数情况下,核心启动子序列位于翻译起始位点的1-2kb内,更通常在翻译起始位点的1kbp内及通常在500bp或200bp或更少以内。按照惯例,启动子序列通常提供为在其控制的基因的编码链上的序列。在本申请的上下文中,启动子通常根据其天然调节表达的基因的名称而提及。用于本发明表达构建体中的启动子用基因名称提及。根据名称提及的启动子包括野生型天然启动子以及保留诱导表达能力的启动子的变体。根据名称提及的启动子不限于特定物种,还涵盖来自其它物种中相应基因的启动子。
本发明上下文中的“组成型启动子”是指在大多数条件下在细胞中能起始转录的启动子,例如在不存在诱导分子的条件下。“诱导型启动子”在存在诱导剂分子的条件下起始转录。
如果多核苷酸源自外来物种,或者如果来自相同物种,是对原始形式加以修饰的,则该多核苷酸对于生物体或第二多核苷酸序列是“异源的”。例如,当编码多肽序列的多核苷酸被称为与异源启动子可操作地连接时,意味着所述编码多肽的多核苷酸编码序列来自一个物种,而所述启动子序列来自另一个不同物种;或者,如果二者来自相同物种,则所述编码序列与所述启动子不是天然相关的(例如是基因工程化的编码序列,例如来自相同物种的不同基因,或来自不同物种的等位基因)。相似地,如果天然野生型宿主细胞不产生多肽,则所述多肽对于所述宿主细胞是“异源的”。
术语“外源的”通常是指在野生型细胞或生物体中不是天然存在的多核苷酸序列或多肽,但通常通过分子生物学技术导入细胞中,即工程化以产生重组微生物。“外源”多核苷酸的实例包括编码所需蛋白质或酶的载体、质粒和/或人造核酸构建体。
术语“内源的”是指可以在给定的野生型细胞或生物体中发现的天然存在的多核苷酸序列或多肽。在这方面,还应注意即使生物体可包含给定多核苷酸序列或基因的内源拷贝,但是导入编码该序列的质粒或载体例如以过表达或以其它方式调节编码蛋白质的表达,也代表该基因或多核苷酸序列的“外源”拷贝。本文描述的任何途径、基因或酶可以利用或依赖可以以一或多个“外源”多核苷酸序列提供的“内源”序列,或二者。
如本文所用,“重组核酸”或“重组多核苷酸”是指核酸聚合物,其中如下至少一种情况是正确的:(a)核酸序列对于给定的宿主细胞是外源的(即不是天然存在的);(b)序列在给定的宿主细胞中可以是天然存在的,但是以非天然量(例如大于预期)存在;或者(c)核酸序列包含在自然界中彼此不存在相同关系的两或多个子序列。例如,关于情况(c),重组核酸序列可以具有来自无关基因的两或更多个序列,排列产生新的功能性核酸。
术语“可操作地连接”是指两或更多个多核苷酸(例如DNA)节段之间的功能关系。通常,其是指转录调节序列与转录序列的功能关系。例如,如果启动子或增强子序列在合适的宿主细胞或其它表达系统中刺激或调节DNA或RNA序列的转录,则其与所述DNA或RNA序列是可操作地连接的。通常,与转录序列可操作连接的启动子转录调节序列与转录序列是物理上连续的,即其是顺式作用的。然而,一些转录调节序列如增强子与其增强转录的编码序列不需要在物理上连续或位于非常接近的位置。
术语“表达盒”或“DNA构建体”或“表达构建体”是指这样的核酸构建体,当其被导入宿主细胞时,分别导致RNA或多肽的转录和/或翻译。在表达转基因的情况下,技术人员将认识到插入的多核苷酸序列不需要是相同的,但与其衍生的基因的序列基本相同。如本文所解释的,这些基本相同的变体通过提及特定核酸序列而特别涵盖。表达盒的一个实例是多核苷酸构建体,其包含与启动子例如其天然启动子可操作地连接的编码本发明多肽的多核苷酸序列,其中所述表达盒被导入异源微生物中。在一些实施方案中,表达盒包含编码本发明多肽的多核苷酸序列,其中所述多核苷酸靶向微生物基因组中的一个位置,由此该多核苷酸序列的表达由存在于所述微生物中的启动子驱动。
在本发明上下文中所用术语“宿主细胞”是指微生物,包括可以是或已经是本发明的任何重组载体或分离的多核苷酸的受体的单个细胞或细胞培养物。宿主细胞包括单个宿主细胞的后代,且由于天然的、偶然的或有意的突变和/或改变,所述后代与原始亲本细胞不一定完全相同(在形态学上或在总DNA补体中)。宿主细胞包括其中包括通过转化、转染等已经导入了本发明的重组载体或多核苷酸的细胞。在一些实施方案中,所述宿主细胞来自埃希氏菌属、棒杆菌属或哈夫尼菌属。
术语“分离的”是指一种材料基本上或实质上没有在其天然状态下通常伴随其的成分。例如,如本文所用,“分离的多核苷酸”可以指从在其天然存在或基因组状态时位于其侧翼的序列中分离的多核苷酸,例如如通过克隆进载体中已从通常与其相邻的序列中移出的DNA片段。例如,如果将多核苷酸克隆进不是天然环境一部分的载体中,或者如果其以不同于其天然存在的状态的方式人工导入细胞的基因组中,则认为该多核苷酸是分离的。或者,如本文所用,“分离的肽”或“分离的多肽”等是指不含细胞的其它成分的多肽分子,即其与体内细胞成分不相关。
本发明采用各种常规重组核酸技术。通常,下文描述的重组DNA技术中的命名法和实验室程序是本领域通常使用的。可以获得许多提供进行重组DNA操作指导的手册,例如Sambrook&Russell,Molecular Cloning,A Laboratory Manual(3rd Ed,2001)和CurrentProtocols in Molecular Biology(Ausubel,et al.,John Wiley and Sons,New York,2009-2016)。
本发明发明某些方面的概述
一方面,本发明提供了变体CadA多肽,其包含在相应于参照SEQ ID NO:2确定的氨基酸455-483的区域中组氨酸和/或天冬氨酸残基的突变。在一个实施方案中,所述突变包括位于CadA蛋白柔性环内的参照SEQ ID NO:2确定的位置458的组氨酸残基的取代。在另一个实施方案中,组氨酸和/或天冬氨酸残基的突变包含一或多个具有可滴定基团的氨基酸。在一个实施方案中,CadA变体多肽在相应于参照SEQ ID NO:2确定的氨基酸455-483的区域中包含氨基酸取代,其中所述氨基酸取代包括具有可滴定基团的氨基酸三元体。在一个实施方案中,所述氨基酸三元体包括参照SEQ ID NO:2在位置457、458和460的氨基酸残基的取代。在一个实施方案中,所述在相应于参照SEQ ID NO:2确定的氨基酸455和483的区域中组氨酸或天冬氨酸残基的突变包括适合质子化的氨基酸。
本发明的变体CadA耐受碱性pH的能力还允许在发酵反应中使用具有较高pH值的替代氮源,例如尿素和氨(1M溶液的pH为11.6),以产生所需产物如多胺。这些替代氮源产生较少的盐废物副产物。
CadA多肽变体
CadA是Fold Type I吡哆醛5'-磷酸(PLP)依赖性脱羧酶的亚类成员。这类蛋白质通常含有N末端翼结构域、核心结构域和C末端结构域。核心结构域由接头区、PLP结合亚结构域和亚结构域4组成。对于CadA,N-末端翼结构域(相应于参照SEQ ID NO:2确定的残基1-129)具有黄素氧还蛋白样折叠,由夹在两组两亲性α螺旋之间的五链平行β-折叠组成。核心结构域(参照SEQ ID NO:2确定的残基130-563)包括:接头区,SEQ ID NO:2的氨基酸残基130-183,其形成短螺旋束;PLP结合亚结构域,SEQ ID NO:2的氨基酸184-417,其形成由三组α-螺旋包围的七链β-折叠核心;及亚结构域4,氨基酸418-563,形成具有三个α-螺旋朝外的四链反平行β-折叠核心。C末端结构域相应于参照SEQ ID NO:2确定的氨基酸残基564-715,其形成具有α-螺旋外表面的两组β折叠(Kanjee et al.,The EMBO Journal 30,931-944 2011)。
CadA蛋白形成双重对称二聚体,完成每个单体的活性位点。五个二聚体结合形成十聚体,其由具有五重对称性的双环结构组成。十聚体与其它十聚体结合形成更高级的寡聚物。已经表明,在酸性条件下(pH5),CadA主要以寡聚状态存在,且随着环境变得更加碱性而发现存在较少的寡聚物和十聚体。据估计,在pH 6.5,25%的酶以二聚体存在,75%以十聚体存在,而在pH 8.0,95%的酶以二聚体存在(Kanjee et al.,The EMBO Journal 30,931-944 2011)。这种寡聚物形成的降低与随着酶环境的pH增加到5.0以上观察到的脱羧酶活性降低的结果一致。
示例的来自大肠杆菌、肠道沙门氏菌、克雷伯氏菌和肠杆菌科的Cad A多肽在SEQID NO:2-5中提供,其彼此共有超过90%的序列相同性。
本领域有关于计算蛋白质pKa值各种方法的研究(Yang,et al.,Proteins 15,252-265,1993;Van Vlijmen HW,et al.,Proteins 33,145-158,1998;Rabenstein B&Knapp EW,Biophysical Journal 80,1141-1150,2001;Kieseritzky G&Knapp EW,Proteins 71,1335-1348,2008;Kilambi KP&Gray JJ,Biophysical J 103,587-595,2012)。文献中测试的大多数氨基酸残基的计算和实验pKa值之间的差异为0.5-0.75。一种方法是基于线性化Poisson-Boltzmann方程的pKa计算方法,以预测CadA蛋白中24个组氨酸残基的pKa值。本文计算的pKa值的概述示于表1。发现在参照SEQ ID NO:2的位置458的一个组氨酸残基的pKa值接近CadA在不同寡聚状态之间转换的pH。根据文献(Kanjee U,etal.The EMBO Journal,30,931-944,2011),当环境的pH值改变时,CadA从由十聚体和高级寡聚物组成的状态转变为主要由二聚体组成的状态。因此,pH的变化可以影响其可滴定基团的pKa值与发生蛋白质寡聚化转变的pH相似的那些氨基酸。
H458位于CadA的跨越氨基酸Q455至H483的柔性环形区域。当环在三维空间中移动时,这个环的柔性允许蛋白质的相邻二级结构上的相邻氨基酸(即可滴定基团的四埃内的氨基酸)与柔性环上的氨基酸相互作用。因此,如果柔性环的运动带动H458的范围内的相邻氨基酸,则附近的其它酸性或碱性基团可能影响H458的pKa。
在一个实施方案中,本发明的CadA多肽在相应于参照SEQ ID NO:2确定的氨基酸455-483的区域中包含至少一个氨基酸取代,其中至少一个氨基酸取代选自位置457和/或458;其中CadA变体多肽与SEQ ID NO:2-5任一个具有至少70%的相同性。在一个实施方案中,所述CadA变体包含在位置458的组氨酸残基的取代。在一些实施方案中,所述氨基酸取代是H458A/C/E/F/G/M/P/T/V/W/Y或者H458A/C/F/M/V/W/Y。在另一个实施方案中,所述CadA变体包含在位置457的天冬氨酸残基的取代。在一个实施方案中,所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中,所述CadA变体多肽进一步包含在根据SEQ ID NO:2确定的位置460的天冬氨酸取代。在一些实施方案中,所述天冬氨酸取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。在一些实施方案中,如本段上述的CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或者至少95%的相同性。在一些实施方案中,CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或者至少95%的相同性。
在本公开中,取代所述组氨酸和/或天冬氨酸残基的氨基酸在天然CadA序列中在该位置不存在。因此,本发明的变体CadA多肽可包含在参照SEQ ID NO:2确定的位置D457和/或H458包含至少一个氨基酸取代。在一些实施方案中,所述CadA变体可以进一步包含在参照SEQ ID NO:2确定的位置460的氨基酸取代。
在另一个实施方案中,本发明的CadaA变体多肽在相应于参照SEQ ID NO:2确定的氨基酸455-483的区域中包含至少一个氨基酸取代,其中所述至少一个氨基酸取代选自位置457、458和460;其中所述CadA变体多肽与SEQ ID NO:2-5任一个具有至少70%的相同性;其中所述宿主细胞来自哈夫尼菌属。在一个实施方案中,所述CadA变体所包含在位置457的天冬氨酸残基的取代。在一个实施方案中,所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一个实施方案中,所述CadA变体包含在位置458的组氨酸残基的取代。在一些实施方案中,所述氨基酸取代是H458A/C/E/F/G/M/P/T/V/W/Y或者H458A/C/F/M/V/W/Y。在一个实施方案中,所述CadA变体包含在参照SEQ ID NO:2确定的位置460的天冬氨酸取代。在一些实施方案中,所述天冬氨酸取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。在一些实施方案中,所述变体CadA多肽包含在参照SEQ ID NO:2确定的位置D457、H458和D460的一个以上的氨基酸取代,例如2个、3个或更多个取代。在一个实施方案中,所述变体CadA多肽包含在参照SEQ ID NO:2确定的位置D457和H458的氨基酸取代。在一个实施方案中,所述变体CadA多肽包含在参照SEQ ID NO:2确定的位置D457和D460的氨基酸取代。在一个实施方案中,所述变体CadA多肽包含在参照SEQ ID NO:2确定的位置H458和D460的氨基酸取代。在一个实施方案中,所述变体CadA多肽包含在参照SEQ IDNO:2确定的位置D457、H458和D460的氨基酸取代。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或者至少95%的相同性。在一些实施方案中,CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。在一些实施方案中,所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或者至少95%的相同性。
在一个实施方案中,本发明的CadA多肽包含在CadA的亚结构域4(即没有确定的二级结构(α,α螺旋;β,β折叠);η,链)(见Kanjee et al.))中组氨酸和/或天冬氨酸残基的至少一个氨基酸取代;其中氨基酸侧链(α碳周围)的旋转使D457或D460的可滴定基团在H458的4埃以内,从而促进质子供体和质子受体之间的强相互作用。
在一些实施方案中,变体CadA多肽包含在参照SEQ ID NO:2确定的位置D457、H458和D460的一个以上的氨基酸取代,例如2、3或更多个取代。在一些实施方案中,取代组氨酸或天冬氨酸的氨基酸选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸或缬氨酸,其中突变体在与野生型序列(SEQ ID NO:2、3、4或5)相同位置不具有相同氨基酸。在一些实施方案中,取代组氨酸或天冬氨酸的氨基酸具有提供氢以形成氢键的能力。例如,通常而言,氨基酸C、Y、K和R的pKa值大于8,因此当pH从5提高至8时,其质子化状态不会改变。因此,在这些位置形成的任何氢键与当这个位置存在具有酸性pKa的天冬氨酸时相比更稳定。在一些实施方案中,取代组氨酸的氨基酸选自A、C、E、F、G、M、P、T、V、W和Y。在一些实施方案中,取代组氨酸的氨基酸选自A、C、F、M、V、W和Y。在一些实施方案中,所述变体CadA多肽是来自大肠杆菌的CadA的变体,其中位置H458的组氨酸由另一氨基酸取代。在一些实施方案中,取代天冬氨酸的氨基酸选自A、C、E、F、H、I、K、L、M、N、S、W和Y。在一些实施方案中,取代天冬氨酸的氨基酸选自A、C、H、K、L、M、N和S。在一些实施方案中,所述变体CadA多肽是来自大肠杆菌的CadA的变体,其中位置D457的天冬氨酸由另一氨基酸取代。
在一些实施方案中,本发明的变体CadA多肽与SEQ ID NO:2的CadA多肽的500或更多个氨基酸长度的区域或者全长具有至少60%的氨基酸序列相同性,通常具有至少65%、70%、75%、80%或85%的相同性;通常具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;且在参照SEQ ID NO:2确定的位置D457或D460的天冬氨酸残基具有取代。在一些实施方案中,所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中,在位置460的取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。
在一些实施方案中,本发明的变体CadA多肽与SEQ ID NO:3的CadA多肽的500或更多个氨基酸长度的区域或者全长具有至少60%的氨基酸序列相同性,通常具有至少65%、70%、75%、80%或85%的相同性;通常具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;且在参照SEQ ID NO:3确定的位置D457或D460的天冬氨酸残基具有取代。在一些实施方案中,所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中,在位置460的取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。
在一些实施方案中,本发明的变体CadA多肽与SEQ ID NO:4的CadA多肽的500或更多个氨基酸长度的区域或者全长具有至少60%的氨基酸序列相同性,通常具有至少65%、70%、75%、80%或85%的相同性;通常具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;且在参照SEQ ID NO:4确定的位置D457或D460的天冬氨酸残基具有取代。在一些实施方案中,所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中,在位置460的取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。
在一些实施方案中,本发明的变体CadA多肽与SEQ ID NO:5的CadA多肽的500或更多个氨基酸长度的区域或者全长具有至少60%的氨基酸序列相同性,通常具有至少65%、70%、75%、80%或85%的相同性;通常具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;且在参照SEQ ID NO:5确定的位置D457或D460的天冬氨酸残基具有取代。在一些实施方案中,所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或D457A/C/H/K/L/M/N/S。在一些实施方案中,在位置460的取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或D460F/V/W/Y。
编码CadA变体多肽的核酸
CadA多核苷酸序列的分离或产生可通过许多技术完成。在一些实施方案中,寡核苷酸探针和基于本文公开的序列可用于在cDNA或基因组DNA文库中鉴别来自所需细菌物种的希望的多核苷酸。可以使用合适的引物在CadA编码多核苷酸序列中导入希望的取代,如实施例章节所示,以在所述多核苷酸序列中掺入希望的改变。例如,PCR可用于直接从mRNA、cDNA、基因组文库或cDNA文库扩增基因序列及导入希望的取代。
用于鉴别细菌中的CadA多核苷酸的合适引物和探针可以通过对比本发明提供的序列而产生,或者基于来自另一细菌的CadA多核苷酸序列产生。关于PCR的一般概述见PCRProtocols:A Guide to Methods and Applications.(Innis,M,Gelfand,D.,Sninsky,J.and White,T.,eds.),Academic Press,San Diego(1990)。示例的引物序列在实施例章节的引物表中示出。
编码用于本发明的酸脱羧酶多肽的核酸序列包括通过使用示例的核酸序列(例如SEQ ID NO:1所示cadA多核苷酸序列)通过如杂交和/或序列分析的技术鉴别和鉴定的基因和基因产物。在一些实施方案中,宿主细胞通过导入核酸序列而被遗传修饰,所述核酸序列与酸脱羧酶多核苷酸如SEQ ID NO:1所示cadA多核苷酸具有至少60%的相同性,或至少70%、75%、80%、85%或90%的相同性,或95%或更高的相同性,其中所述核酸包含编码希望被取代的氨基酸的密码子。
赋予宿主细胞产生增多的氨基酸衍生物例如尸胺的编码本发明的CadA变体蛋白的核酸序列可以另外进行密码子优化以在希望的宿主细胞中表达。可以采用的方法和数据库为本领域已知。例如,可以根据在单个基因、一组共同功能或起源的基因、高度表达的基因中的密码子使用,整个生物体的总计蛋白质编码区中的密码子频率,相关生物体的总计蛋白质编码区中的密码子频率,或其组合而确定优选的密码子。见例如Henaut andDanchin in"Escherichia coli and Salmonella,"Neidhardt,et al.Eds.,ASM Pres,Washington D.C.(1996),pp.2047-2066;Nucleic Acids Res.20:2111-2118;Nakamura etal.,2000,Nucl.Acids Res.28:292)。
重组载体的制备
可以使用本领域熟知的方法制备用于表达变体CadA蛋白的重组载体。例如,编码CadA变体多肽的DNA序列可以与转录和其它调节序列组合,所述转录和其它调节序列在指定细胞中指导从基因序列转录,所述细胞例如是细菌细胞如蜂房哈夫尼菌、大肠杆菌或者谷氨酸棒杆菌。在一些实施方案中,包含表达盒的表达载体进一步包含与编码所述CadA变体多肽的核酸序列可操作连接的启动子,所述表达盒包含编码所述CadA变体多肽的基因。在其它实施方案中,指导编码变体Cada多肽的cadA多核苷酸转录的启动子和/或其它调节元件对于宿主细胞而言是内源的,通过例如同源重组导入包含所述cadA基因的表达盒,由此外源基因与内源启动子可操作地连接,且由内源启动子驱动表达。
如上所述,编码cadA变体多肽的多核苷酸的表达可以通过许多调节序列控制,包括启动子,其可以是组成型的或诱导型启动子;及如果需要任选地可以使用阻抑物序列。合适的启动子、特别是在细菌宿主细胞中的启动子实例是得自大肠杆菌lac操纵子的启动子及衍生自参与其它糖例如半乳糖和麦芽糖代谢的基因的其它启动子。其它实例包括启动子,例如trp启动子、bla启动子噬菌体λPL和T5。另外,可以使用合成启动子,例如tac启动子(美国专利号4,551,433)。启动子的其它实例包括天蓝色链霉菌(Streptomycescoelicolar)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因。合适的启动子也在如前文提及的Ausubel和Sambrook&Russell中描述。其它启动子包括Jensen&Hammer,Appl.Environ.Microbiol.64:82,1998、Shimada,et al.,J.Bacteriol.186:7112,2004和Miksch et al.,Appl.Microbiol.Biotechnol.69:312,2005描述的启动子。
在一些实施方案中,可以修饰影响编码本发明的CadA变体多肽的cadA基因表达的启动子以增加表达。例如,可以用提供与天然启动子相比增加的表达的启动子置换内源性CadA启动子。
表达载体也可以包含影响编码所述CadA变体多肽的多核苷酸表达的其它序列。这种序列包括增强子序列、核糖体结合位点或其它序列如转录终止序列等。
表达编码本发明的CadA变体多肽的多核苷酸的载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以包含确保自主复制的任何手段。或者,载体可以是这样的载体,当其被引入宿主时被整合进基因组中并与其整合进之中的染色体一起复制。因此,表达载体可另外含有允许载体整合进宿主基因组中的元件。
本发明的表达载体优选含有一或多个选择标记,其允许容易地选择转化的宿主。例如,表达载体可以包含赋予重组宿主生物体例如细菌细胞如大肠杆菌抗生素抗性(例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性)的基因。
虽然任何合适的表达载体均可用于掺入希望的序列,但容易获得的细菌表达载体包括但不限于:质粒如pSClO1,pBR322,pBBR1MCS-3,pUR,pET,pEX,pMR100,pCR4,pBAD24,p15a,pACYC,pUC如pUC18或pUC19,或者衍生自这些质粒的质粒;以及噬菌体如Ml3噬菌体和λ噬菌体。然而,本领域技术人员可以通过常规实验容易地确定任何特定表达载体是否适于任何给定的宿主细胞。例如,可以将表达载体导入宿主细胞中,然后监测所述载体中包含的序列的存活性和表达情况。
可以使用任何熟知的方法将本发明的表达载体导入宿主细胞中,所述方法包括基于氯化钙的方法、电穿孔或者本领域已知的任何其它方法。
宿主细胞
本发明提供了经遗传修饰的宿主细胞,其被工程化为表达本发明的CadA变体多肽。本发明的经遗传修饰的宿主菌株通常包含至少一种额外的遗传修饰,以相对于不具有这一种额外的遗传修饰的对照菌株增强氨基酸或氨基酸衍生物的产生,所述对照菌株例如是野生型菌株或者没有这一种额外的遗传修饰的相同菌株的细胞。“增强氨基酸或氨基酸衍生物的产生的额外的遗传修饰”可以是任何遗传修饰。在一些实施方案中,所述遗传修饰是导入表达参与所述氨基酸或氨基酸衍生物合成的酶的多核苷酸。在一些实施方案中,所述宿主细胞包含多种修饰以相对于野生型宿主细胞增加氨基酸或氨基酸衍生物的产生。
在一些方面,为表达CadA变体多肽对宿主细胞的遗传修饰与修饰宿主细胞以过表达一或多个赖氨酸生物合成多肽联合进行。
在一些实施方案中,宿主细胞可以被遗传修饰以表达影响赖氨酸生物合成的一或多种多肽。示例的赖氨酸生物合成多肽包括大肠杆菌基因SucA、Ppc、AspC、LysC、Asd、DapA、DapB、DapD、ArgD、DapE、DapF、LysA、Ddh、PntAB、CyoABE、GadAB、YbjE、GdhA、GltA、SucC、GadC、AcnB、PflB、ThrA、AceA、AceB、GltB、AceE、SdhA、MurE、SpeE、SpeG、PuuA、PuuP和YgjG,或者来自其它生物体的相应基因。这些基因为本领域已知(见例如Shah et al.,J.Med.Sci.2:152-157,2002;Anastassiadia,S.Recent Patents on Biotechnol.1:11-24,2007)。也见于Kind,et al.,Appl.Microbiol.Biotechnol.91:1287-1296,2011关于参与尸胺产生的基因的综述。示例的编码赖氨酸生物合成多肽的基因在下表中提供。
在一些实施方案中,可以对宿主细胞进行遗传修饰以减弱或降低影响赖氨酸生物合成的一或多种多肽的表达。这些多肽的实例包括大肠杆菌基因Pck、Pgi、DeaD、CitE、MenE、PoxB、AceA、AceB、AceE、RpoC和ThrA,或来自其它生物体的相应基因。这些基因为本领域已知(参见Shah et al.,J.Med.Sci.2:152-157,2002;Anastassiadia,S.RecentPatents on Biotechnol.1:11-24,2007)。也见于Kind,et al.,Appl.Microbiol.Biotechnol.91:1287-1296,2011关于弱化基因以增加尸胺产生的综述。示例的编码其弱化增加赖氨酸生物合成的多肽的基因在下文提供。
蛋白质 | 基因 | EC编号 | 基因库登录号 |
PEP羧激酶(Pck) | pck | 4.1.1.49 | NP_417862 |
葡萄糖-6-磷酸异构酶(Pgi) | pgi | 5.3.1.9 | NP_418449 |
DEAD-盒RNA解旋酶(DeaD) | deaD | NP_417631 | |
柠檬酸裂解酶(CitE) | citE | 4.1.3.6/4.1.3.34 | NP_415149 |
o-琥珀酰苯甲酸-CoA连接酶(MenE) | menE | 6.2.1.26 | NP_416763 |
丙酮酸氧化酶(PoxB) | poxB | 1.2.2.2 | NP_415392 |
异柠檬酸裂解酶(AceA) | aceA | 4.1.3.1 | NP_418439 |
苹果酸合酶A(AceB) | aceB | 2.3.3.9 | NP_418438 |
丙酮酸脱氢酶(aceE) | aceE | 1.2.4.1 | NP_414656 |
RNA聚合酶b’亚基(RpoC) | rpoC | 2.7.7.6 | NP_418415 |
天冬氨酸激酶I(ThrA) | thrA | 2.7.2.4/1.1.1.3 | NP_414543 |
编码赖氨酸生物合成多肽的核酸可与编码CadA变体多肽的多核苷酸一起导入宿主细胞中,例如在单个表达载体上编码,或同时以多个表达载体导入。或者,可以对宿主细胞进行遗传修饰,以在宿主细胞经遗传修饰以表达CadA变体多肽之前或之后过表达一或多种赖氨酸生物合成多肽。
经工程化以表达CadA变体多肽的宿主细胞通常是细菌宿主细胞。在典型的实施方案中,所述细菌宿主细胞是革兰氏阴性细菌宿主细胞。在本发明的一些实施方案中,所述细菌是肠细菌。在本发明的一些实施方案中,所述细菌是棒杆菌属,埃希氏菌属,假单胞菌属(Pseudomonas),单胞发酵菌属(Zymomonas),希瓦氏菌属(Shewanella),沙门氏菌属(Salmonella),志贺氏菌属(Shigella),肠杆菌属(Enterobacter),柠檬酸杆菌属(Citrobacter),Cronobacter,欧文氏菌属(Erwinia),沙雷氏菌属(Serratia),变形杆菌属(Proteus),哈夫尼菌属,耶尔森氏菌属(Yersinia),摩根菌属(Morganella),爱德华氏菌属(Edwardsiella)或克雷伯氏菌属分类学类别的物种。在一些实施方案中,所述宿主细胞是埃希氏菌属、哈夫尼菌属或者棒杆菌属的成员。在一些实施方案中,所述宿主细胞是大肠杆菌、蜂房哈夫尼菌或者谷氨酸棒杆菌宿主细胞。在一些实施方案中,所述宿主细胞是大肠杆菌。在一些实施方案中,所述宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述宿主细胞是谷氨酸棒杆菌。在一些实施方案中,来自大肠杆菌或棒杆菌属的经遗传修饰的宿主细胞包含CadA变体多肽,所述CadA变体多肽在相应于参照SEQ ID NO:2确定的氨基酸455-483的区域中具有氨基酸取代,其中所述氨基酸取代不包括参照SEQ ID NO:2在位置D460的取代。在一些实施方案中,所述遗传修饰的宿主细胞包含CadA变体多肽,其中所述CadA变体在相应于参照SEQ ID NO:2确定的氨基酸455-483的区域中在位置D457、H458或D460的至少一个位置包含氨基酸取代,其中所述宿主细胞是除了埃希氏菌属、棒杆菌属、短杆菌属(Brevibacterium)和小杆菌属(Microbacterium)之外的菌属的细胞。
在一些实施方案中,所述宿主细胞是革兰氏阳性细菌宿主细胞,如芽孢杆菌(Bacillus sp.),例如枯草芽孢杆菌或者地衣芽孢杆菌;或者另一芽孢杆菌如嗜碱芽孢杆菌(B.alcalophilus),嗜胺芽孢杆菌(B.aminovorans),解淀粉芽孢杆菌,热熔芽孢杆菌(B.caldolyticus),环状芽孢杆菌(B.circulans),嗜热脂肪芽孢杆菌,热葡糖苷酶芽孢杆菌(B.thermoglucosidasius),苏云金芽孢杆菌(B.thuringiensis)或者B.vulgatis.
如本文所述,可以针对增加的赖氨酸或赖氨酸衍生物如尸胺的产生筛选按照本发明修饰的宿主细胞。
在一些实施方案中,本发明的CadA变体多肽可以从表达所述变体多肽的宿主细胞回收。在一些实施方案中,可以将所述回收的变体蛋白固定在固体基质或惰性材料上以形成固定化酶。在一个实施方案中,所述固定化酶可以较可溶形式变体多肽具有改善的操作稳定性。
产生赖氨酸或者赖氨酸衍生物的方法
经遗传修饰以过表达本发明的CadA变体多肽的宿主细胞可用于产生赖氨酸或赖氨酸的衍生物。在一些实施方案中,所述宿主细胞产生尸胺。因此,例如,为了产生尸胺,可以在适于允许多肽表达和编码用于产生赖氨酸和/或尸胺的酶的基因表达的条件下培养经遗传修饰以表达如本文所述的CadA变体多肽的宿主细胞。根据本发明修饰的表达CadA变体多肽的宿主细胞相对于表达天然CadA的对应宿主细胞提供更高产量的尸胺。在一些实施方案中,与表达野生型CadA的对应宿主细胞达到的相对产量相比,尸胺的相对产量可以为至少125%。
宿主细胞可以使用熟知技术培养(见例如在实施例章节提供的示例条件)。
在一些实施方案中,宿主细胞使用不是盐(例如硫酸铵或者氯化铵)的氮源如氨或尿素培养。在细胞生长或者酶产生期间,宿主细胞可以在碱性pH培养。
赖氨酸或者赖氨酸衍生物可以使用已知技术分离和纯化。根据本发明产生的赖氨酸或者赖氨酸衍生物如尸胺随后可用于任何已知方法中,例如用于产生多胺。
在一些实施方案中,使用化学催化剂或者通过使用酶和化学催化剂可以将赖氨酸转变为己内酰胺。
本发明将通过具体实施例更详细地描述。提供以下实施例是为了说明目的,而不是以任何方式意图限制本发明。本领域技术人员将容易地认识到各种非关键参数,其可以改变或修改以产生基本相同的结果。
实施例
实施例1:计算CadA中组氨酸残基的pKa值
本领域有许多计算蛋白pKa值的方法(Yang,et al.,Proteins 15,252-265,1993;Van Vlijmen HW,et al.,Proteins 33,145-158,1998;Rabenstein B&Knapp EW,Biophysical Journal 80,1141-1150,2001;Kieseritzky G&Knapp EW,Proteins 71,1335-1348,2008;Kilambi KP&Gray JJ,Biophysical J 103,587-595,2012)。对于在文献中测试的大多数氨基酸残基在计算与实验pKa值之间差异为0.5-0.75。在此,我们使用基于线性化Poisson-Boltzmann方程的pKa计算方法预测CadA蛋白中24个组氨酸残基的pKa值。计算的pKa值的概述在表1中示出。
表1:在大肠杆菌的CadA蛋白中24个组氨酸残基的计算的pKa值
残基位置 | pKa | 残基位置 | pKa |
9 | 6.2 | 396 | 2.2 |
23 | 6.4 | 402 | -0.8 |
152 | 0.9 | 458 | 6.6 |
193 | >20.0 | 474 | -3.1 |
197 | -6.6 | 483 | -3.6 |
245 | 1.1 | 521 | 6.1 |
250 | 0.2 | 594 | 1.5 |
282 | 6.3 | 599 | 6.4 |
300 | -6.4 | 600 | 1.8 |
328 | >20.0 | 629 | 6.4 |
366 | 2.9 | 685 | 6.3 |
379 | -0.7 | 694 | 6.3 |
参照SEQ ID NO:2在位置458的一个组氨酸残基的pKa值与CadA在不同寡聚状态之间转换的pH值相近。根据文献((Kanjee U,et al.The EMBO Journal,30,931-944,2011),当环境pH值改变时,CadA从由十聚体和高级寡聚物组成的状态转变为主要由二聚体组成的状态。因此,pH的变化可能影响H458,其可滴定基团的pKa值与发生CadA寡聚化转变的pH值相似。
H458具有位于其附近的酸性氨基酸(D457)和位于距离两个氨基酸残基的第二个酸性氨基酸(D460)。D457和D460的酸基团是可滴定的,如果其与H458的侧链的距离小于则可以影响H458的pKa。CadA X射线晶体结构(PDB ID:3N75)分析表明D457的可滴定基团与H458侧链的距离是D460的可滴定基团与H458的侧链的距离是然而,围绕α-碳的D457、H458或D460侧链的旋转可使D457的可滴定基团与H458的距离为与D460的距离近如这两个距离均在通常在蛋白质二级结构元件中的质子供体和受体基团之间发现的范围内。质子供体和受体对之间的典型距离为2.2至其中被认为是强相互作用,而被认为是弱相互作用。感兴趣的是,D457的侧基与H458的侧基即使是相邻的氨基酸也是位于同一面。通常,两个相邻的氨基酸具有位于相反面上的侧基(即彼此面向相反方向)。D460的侧基也位于H458的同一面上,因为其被一个氨基酸隔开。侧基的方向提示D457和D460可影响H458的pKa。假设氨基酸位置457、458和460对于CadA多肽在不同pH的功能是重要的。以下实施例表明,可滴定基团的pKa值与CadA寡聚化转变的pH值相似的一或多个氨基酸的取代可以影响CadA的活性。具体地,实施例示出位置458的组氨酸残基的氨基酸取代或者在位置457和/或460的天冬氨酸残基的氨基酸取代可以增加经遗传修饰表达CadA变体多肽的宿主细胞的尸胺产生。
实施例2:编码CadA的质粒载体的构建
使用PCR引物cadA-F和cadA-R(表11)从大肠杆菌MG1655K12基因组DNA扩增含有编码赖氨酸脱羧酶CadA(SEQ ID NO:2)的野生型大肠杆菌cadA(SEQ ID NO:1)的质粒载体,使用限制酶SacI和XbaI消化,连接到pUC18中以产生质粒pCIB60。使用PCR引物cadA-F2和cadA-R2优化cadA基因上游5'序列以产生pCIB71。
实施例3:编码在D457具有突变的CadA的质粒载体的构建
设计引物对以使用Quickchange PCR修饰pCIB71中cadA基因的位置457的氨基酸。使用DNA测序验证突变,在氨基酸位置457携带每个突变的质粒标记为pCIB71-D457X,其中X是置换天冬氨酸残基的氨基酸。
实施例4:编码在H458具有突变的CadA的质粒载体的构建
设计引物对以使用Quickchange PCR修饰pCIB71中cadA基因的位置458的氨基酸。使用DNA测序验证突变,在氨基酸位置458携带每个突变的质粒标记为pCIB71-H458X,其中X是置换组氨酸残基的氨基酸。
实施例5:编码在D460具有突变的CadA的质粒载体的构建
设计引物对以使用Quickchange PCR修饰pCIB71中cadA基因的位置460的氨基酸。使用DNA测序验证突变,在氨基酸位置460携带每个突变的质粒标记为pCIB71-D460X,其中X是置换天冬氨酸残基的氨基酸。
实施例6:具有D457X突变的突变CadA多肽的赖氨酸脱羧酶活性
将蜂房哈夫尼菌用pCIB71-D457X转化。将来自每次转化的三个单菌落在37℃在含有氨苄青霉素(100μg/mL)的4mL的LB培养基中生长过夜。第二天,将0.7mL的每个过夜培养物加入到0.3mL的赖氨酸-HCl和PLP中,其终浓度分别为120g/L和0.1mM。用1M NaOH将最终混合物调节至pH 8.0。将每种混合物在37℃温育2小时。使用NMR定量每个样品的尸胺产生,将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量计算产量。表2中列出了2小时后每个样品的产量相对于用pCIB71转化的蜂房哈夫尼菌的产量。
表2:表达编码在氨基酸位置457具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产量
质粒 | 相对产量(%) | 质粒 | 相对产量(%) |
pCIB71 | 100 | pCIB71-D457M | 130 |
pCIB71-D457A | 138 | pCIB71-D457N | 130 |
pCIB71-D457C | 156 | pCIB71-D457P | 65 |
pCIB71-D457E | 112 | pCIB71-D457Q | 0 |
pCIB71-D457F | 116 | pCIB71-D457R | 0 |
pCIB71-D457G | 69 | pCIB71-D457S | 170 |
pCIB71-D457H | 152 | pCIB71-D457T | 73 |
pCIB71-D457I | 124 | pCIB71-D457V | 0 |
pCIB71-D457K | 126 | pCIB71-D457W | 117 |
pCIB71-D457L | 147 | pCIB71-D457Y | 120 |
如表2所示,在氨基酸位置457的一些不同突变相对于野生型CadA(pCIB71)提高了在pH8的赖氨酸脱羧酶产量。突变D457A、D457C、D457H、D457K、D475L、D457M、D457N和D457S的产量增加25%以上。与野生型CadA相比,突变D457E、D457F、D457I、D457W和D457Y也增加了产量。突变D457G、D457P和D457T降低了产量。突变D457Q、D457R和D457V消除了赖氨酸脱羧酶活性。
实施例7:具有H458X突变的突变CadA多肽的赖氨酸脱羧酶活性
将蜂房哈夫尼菌用pCIB71-H458X转化。将来自每次转化的三个单菌落在37℃在含有氨苄青霉素(100μg/mL)的4mL的LB培养基中生长过夜。第二天,将0.7mL每个过夜培养物加入0.3mL的赖氨酸-HCl和PLP中,其终浓度分别为120g/L和0.1mM。用1M NaOH将最终混合物调节至pH 8.0。将每个混合物在37℃温育2小时。使用NMR定量每个样品的尸胺产生,将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量计算产量。表3示出2小时后每个样品的产量相对于用pCIB71转化的蜂房哈夫尼菌的产量。表3:表达编码在氨基酸位置458具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH 8的相对尸胺产量
质粒 | 相对产量(%) | 质粒 | 相对产量(%) |
pCIB71 | 100 | pCIB71-H458M | 140 |
pCIB71-H458A | 157 | pCIB71-H458N | 100 |
pCIB71-H458C | 126 | pCIB71-H458P | 111 |
pCIB71-H458D | 91 | pCIB71-H458Q | 91 |
pCIB71-H458E | 103 | pCIB71-H458R | 88 |
pCIB71-H458F | 177 | pCIB71-H458S | 0 |
pCIB71-H458G | 120 | pCIB71-H458T | 105 |
pCIB71-H458I | 100 | pCIB71-H458V | 137 |
pCIB71-H458K | 89 | pCIB71-H458W | 165 |
pCIB71-H458L | 94 | pCIB71-H458Y | 151 |
如表3所示,在氨基酸位置458的一些不同突变相对于野生型CadA(pCIB71)在pH8提高了尸胺产量。突变H458A、H458C、H458F、H458M、H458V、H458W和H458Y使产量增加超过25%。与野生型CadA相比,突变H458G和H458P也增加了产量。突变H458D、H458E、H458K、H458L、H458N、H458Q、H458R和H458T对产量几乎没有影响。突变H458S消除了赖氨酸脱羧酶活性。
实施例8:具有D460X突变的突变CadA多肽的赖氨酸脱羧酶活性
将蜂房哈夫尼菌用pCIB71-D460X转化。将每次转化的三个单菌落在37℃在含有氨苄青霉素(100μg/mL)的4mL的LB培养基中生长过夜。第二天,将0.7mL的每个过夜培养物加入0.3mL的赖氨酸-HCl和PLP中,其终浓度分别为120g/L和0.1mM。用1M NaOH将最终混合物调节至pH 8.0。将每个混合物在37℃温育2小时。使用NMR定量每个样品的尸胺产生,将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量计算产量。表4示出2小时后每个样品的产量相对于用pCIB71转化的蜂房哈夫尼菌菌株的产量。
表4:表达编码在氨基酸位置460具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH 8的相对尸胺产量
质粒 | 相对产量(%) | 质粒 | 相对产量(%) |
pCIB71 | 100 | pCIB71-D460M | 97 |
pCIB71-D460A | 93 | pCIB71-D460N | 0 |
pCIB71-D460C | 168 | pCIB71-D460P | 66 |
pCIB71-D460E | 71 | pCIB71-D460Q | 155 |
pCIB71-D460F | 152 | pCIB71-D460R | 0 |
pCIB71-D460G | 86 | pCIB71-D460S | 159 |
pCIB71-D460H | 77 | pCIB71-D460T | 75 |
pCIB71-D460I | 169 | pCIB71-D460V | 175 |
pCIB71-D460K | 69 | pCIB71-D460W | 163 |
pCIB71-D460L | 50 | pCIB71-D460Y | 102 |
如表4所示,氨基酸位置460的一些突变提高了在pH8.0的CadA多肽的活性。突变D460C、D460F、D460I、D460Q、D460S、D460I、D460V和D460W使相对尸胺产量增加超过25%。突变D460A、D460G、D460M和D460Y对产量几乎没有影响。突变D460N和D460R消除了活性。剩余的突变D460E、D460H、D460K、D460L、D460P和D460T对尸胺产量具有负面影响。
实施例9:野生型和突变CadA多肽在碱性pH条件的体外动力学分析
根据文献报道,CadA的活性在pH 8由于从高寡聚物状态至二聚体状态的结构变化而显著低于其在pH 6的活性。比较野生型和突变CadA多肽在pH 6和pH 8的活性,以确定所述突变是否可以增加CadA多肽对碱性条件的耐受性。
用弗氏压碎器裂解用pCIB71、pCIB71-D457S、pCIB71-H458F或pCIB71-D460V转化的100mL蜂房哈夫尼菌样品。将裂解的样品离心,并将上清液与沉淀物分离以进行体外实验。每个反应均在具有120g/L赖氨酸-HCl和0.1mM PLP的Tris-HCl缓冲液(50mM Tris-HCl,pH6或8,25mM NaCl,2mM EDTA)中进行。使用NMR测量每个裂解样品的反应速率,通过在PLP存在下每1.6分钟取样转变为尸胺的赖氨酸的量,共20分钟,并获取产量曲线的线性部分的斜率进行。稀释样品以使裂解样品的反应速率每体积(mmol/min/mL,U)相同。稀释样品以使每个样品的U为0.5。使用相同的U在pH 6或pH8的初始pH测量每个裂解样品的赖氨酸的动力学常数Vmax。通过对U标准化,每个样品中活性酶的浓度是相同的。两个样品的动力学分析的结果如表5所示。
表5:在不同pH条件下表达编码野生型或突变CadA多肽的质粒的蜂房哈夫尼菌的裂解样品的标准化Vmax的动力学分析
pH | pCIB71 | pCIB71-D457S | pCIB71-H458F | pCIB71-D460V |
6 | 100% | 101% | 100% | 102% |
8 | 49% | 72% | 70% | 70% |
根据文献报道,野生型CadA(pCIB71)在pH8与在pH 6相比活性显著丧失。在pH 8的活性与在pH 6的活性相比降低51%。令人惊奇地,突变CadA多肽(D457S、H458F和D460V)均比野生型CadA在pH8示出更高的活性。
实施例10:突变CadA多肽的尸胺产生的时程
将蜂房哈夫尼菌用pCIB71或pCIB71-D460V转化。将每次转化的三个单菌落在37℃在含有氨苄青霉素(100μg/mL)的10mL的LB培养基中生长过夜。第二天,将每个过夜培养物等分进代表不同的时间点的8个单独的试管中,每个试管含有0.7mL过夜培养物、0.3mL赖氨酸-HCl(终浓度120g/L)和PLP(终浓度0.1mM)。用1M NaOH将每个试管中的最终混合物调节至pH 8.0。将每个混合物在37℃温育并以220rpm摇动。在每个时间点,取出每个菌落的样品进行分析。使用NMR定量每个样品产生的尸胺产生,将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量计算产量。每个时间点的产量列于表6中。
表6:在不同时间点在pH 8.0表达编码野生型和突变CadA多肽的质粒的蜂房哈夫尼菌的尸胺产量
时间点(分钟) | pCIB71 | pCIB71-D460V |
60 | 7.22 | 51.6 |
120 | 17.5 | 77.3 |
180 | 30.7 | 97.5 |
240 | 50.4 | 98.1 |
300 | 73.4 | 100 |
360 | 85.8 | 100 |
420 | 86.0 | 100 |
480 | 88.5 | 100 |
如表6所示,与野生型CadA(pCIB71)相比,过表达突变体CadA D460V的细胞在pH8.0更快速地将赖氨酸转化为尸胺。240分钟后,突变体CadA转化98.1%的赖氨酸,而野生型CadA仅将50%的赖氨酸转化为尸胺。300分钟后,突变体CadA完成赖氨酸至尸胺转化,而野生型CadA即使在480分钟后也未完成转化。
表7:实施例中使用的质粒和菌株表
表8:实施例中使用的引物序列表
示例序列:
SEQ ID NO:1大肠杆菌cadA核酸序列
ATGAACGTTATTGCAATATTGAATCACATGGGGGTTTATTTTAAAGAAGAACCCATCCGTGAACTTCATCGCGCGCTTGAACGTCTGAACTTCCAGATTGTTTACCCGAACGACCGTGACGACTTATTAAAACTGATCGAAAACAATGCGCGTCTGTGCGGCGTTATTTTTGACTGGGATAAATATAATCTCGAGCTGTGCGAAGAAATTAGCAAAATGAACGAGAACCTGCCGTTGTACGCGTTCGCTAATACGTATTCCACTCTCGATGTAAGCCTGAATGACCTGCGTTTACAGATTAGCTTCTTTGAATATGCGCTGGGTGCTGCTGAAGATATTGCTAATAAGATCAAGCAGACCACTGACGAATATATCAACACTATTCTGCCTCCGCTGACTAAAGCACTGTTTAAATATGTTCGTGAAGGTAAATATACTTTCTGTACTCCTGGTCACATGGGCGGTACTGCATTCCAGAAAAGCCCGGTAGGTAGCCTGTTCTATGATTTCTTTGGTCCGAATACCATGAAATCTGATATTTCCATTTCAGTATCTGAACTGGGTTCTCTGCTGGATCACAGTGGTCCACACAAAGAAGCAGAACAGTATATCGCTCGCGTCTTTAACGCAGACCGCAGCTACATGGTGACCAACGGTACTTCCACTGCGAACAAAATTGTTGGTATGTACTCTGCTCCAGCAGGCAGCACCATTCTGATTGACCGTAACTGCCACAAATCGCTGACCCACCTGATGATGATGAGCGATGTTACGCCAATCTATTTCCGCCCGACCCGTAACGCTTACGGTATTCTTGGTGGTATCCCACAGAGTGAATTCCAGCACGCTACCATTGCTAAGCGCGTGAAAGAAACACCAAACGCAACCTGGCCGGTACATGCTGTAATTACCAACTCTACCTATGATGGTCTGCTGTACAACACCGACTTCATCAAGAAAACACTGGATGTGAAATCCATCCACTTTGACTCCGCGTGGGTGCCTTACACCAACTTCTCACCGATTTACGAAGGTAAATGCGGTATGAGCGGTGGCCGTGTAGAAGGGAAAGTGATTTACGAAACCCAGTCCACTCACAAACTGCTGGCGGCGTTCTCTCAGGCTTCCATGATCCACGTTAAAGGTGACGTAAACGAAGAAACCTTTAACGAAGCCTACATGATGCACACCACCACTTCTCCGCACTACGGTATCGTGGCGTCCACTGAAACCGCTGCGGCGATGATGAAAGGCAATGCAGGTAAGCGTCTGATCAACGGTTCTATTGAACGTGCGATCAAATTCCGTAAAGAGATCAAACGTCTGAGAACGGAATCTGATGGCTGGTTCTTTGATGTATGGCAGCCGGATCATATCGATACGACTGAATGCTGGCCGCTGCGTTCTGACAGCACCTGGCACGGCTTCAAAAACATCGATAACGAGCACATGTATCTTGACCCGATCAAAGTCACCCTGCTGACTCCGGGGATGGAAAAAGACGGCACCATGAGCGACTTTGGTATTCCGGCCAGCATCGTGGCGAAATACCTCGACGAACATGGCATCGTTGTTGAGAAAACCGGTCCGTATAACCTGCTGTTCCTGTTCAGCATCGGTATCGATAAGACCAAAGCACTGAGCCTGCTGCGTGCTCTGACTGACTTTAAACGTGCGTTCGACCTGAACCTGCGTGTGAAAAACATGCTGCCGTCTCTGTATCGTGAAGATCCTGAATTCTATGAAAACATGCGTATTCAGGAACTGGCTCAGAATATCCACAAACTGATTGTTCACCACAATCTGCCGGATCTGATGTATCGCGCATTTGAAGTGCTGCCGACGATGGTAATGACTCCGTATGCTGCATTCCAGAAAGAGCTGCACGGTATGACCGAAGAAGTTTACCTCGACGAAATGGTAGGTCGTATTAACGCCAATATGATCCTTCCGTACCCGCCGGGAGTTCCTCTGGTAATGCCGGGTGAAATGATCACCGAAGAAAGCCGTCCGGTTCTGGAGTTCCTGCAGATGCTGTGTGAAATCGGCGCTCACTATCCGGGCTTTGAAACCGATATTCACGGTGCATACCGTCAGGCTGATGGCCGCTATACCGTTAAGGTATTGAAAGAAGAAAGCAAAAAATAA
SEQ ID NO:2CadA多肽序列
MNVIAILNHMGVYFKEEPIRELHRALERLNFQIVYPNDRDDLLKLIENNARLCGVIFDWDKYNLELCEEISKMNENLPLYAFANTYSTLDVSLNDLRLQISFFEYALGAAEDIANKIKQTTDEYINTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSLFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEQYIARVFNADRSYMVTNGTSTANKIVGMYSAPAGSTILIDRNCHKSLTHLMMMSDVTPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLINGSIERAIKFRKEIKRLRTESDGWFFDVWQPDHIDTTECWPLRSDSTWHGFKNIDNEHMYLDPIKVTLLTPGMEKDGTMSDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQELAQNIHKLIVHHNLPDLMYRAFEVLPTMVMTPYAAFQKELHGMTEEVYLDEMVGRINANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQA DGRYTVKVLKEESKK
SEQ ID NO:3与大肠杆菌CadA同源的克雷伯氏菌多肽
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDRDDLLKLIENNSRLCGVIFDWDKYNLELCEEISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGPECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQDLAQNIHKLIEHHNLPDLMFRAFEVLPSMVMTPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:4与大肠杆菌CadA同源的肠杆菌科多肽
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDRDDLLKLIENNSRLCGVIFDWDKYNLELCEEISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGPECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQDLAQNIHKLIEHHNLPDLMFRAFEVLPSMVMTPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:5与大肠杆菌CadA同源的肠道沙门氏菌多肽
MNVIAIMNHMGVYFKEEPIRELHRALEGLNFRIVYPNDREDLLKLIENNSRLCGVIFDWDKYNLELCEEISKLNEYMPLYAFANSYSTLDVSLNDLRMQVRFFEYALGAATDIAAKIRQNTDEYIDNILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYQGKCGMSGDRVEGKIIYETQSTHKLLAAFSQASMIHVKGDINEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLINGSIERAIKFRKEIKRLKSESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTILTPGMKKDGTMDEFGIPASLVAKYLDERGIIVEKTGPYNLLFLFSIGIDKTKALSLLRALTEFKRAFDLNLRVKNILPALYREAPEFYENMRIQELAQNIHKLVEHHNLPDLMYRAFEVLPKMVMTPYTAFQKELHGETEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKENTK
序列表
<110> 上海凯赛生物技术研发中心有限公司
CIBT美国公司
<120> 在可滴定氨基酸具有修饰的赖氨酸脱羧酶
<130> P2019TC3103CB
<160> 121
<170> PatentIn version 3.5
<210> 1
<211> 2148
<212> DNA
<213> Escherichia coli
<400> 1
atgaacgtta ttgcaatatt gaatcacatg ggggtttatt ttaaagaaga acccatccgt 60
gaacttcatc gcgcgcttga acgtctgaac ttccagattg tttacccgaa cgaccgtgac 120
gacttattaa aactgatcga aaacaatgcg cgtctgtgcg gcgttatttt tgactgggat 180
aaatataatc tcgagctgtg cgaagaaatt agcaaaatga acgagaacct gccgttgtac 240
gcgttcgcta atacgtattc cactctcgat gtaagcctga atgacctgcg tttacagatt 300
agcttctttg aatatgcgct gggtgctgct gaagatattg ctaataagat caagcagacc 360
actgacgaat atatcaacac tattctgcct ccgctgacta aagcactgtt taaatatgtt 420
cgtgaaggta aatatacttt ctgtactcct ggtcacatgg gcggtactgc attccagaaa 480
agcccggtag gtagcctgtt ctatgatttc tttggtccga ataccatgaa atctgatatt 540
tccatttcag tatctgaact gggttctctg ctggatcaca gtggtccaca caaagaagca 600
gaacagtata tcgctcgcgt ctttaacgca gaccgcagct acatggtgac caacggtact 660
tccactgcga acaaaattgt tggtatgtac tctgctccag caggcagcac cattctgatt 720
gaccgtaact gccacaaatc gctgacccac ctgatgatga tgagcgatgt tacgccaatc 780
tatttccgcc cgacccgtaa cgcttacggt attcttggtg gtatcccaca gagtgaattc 840
cagcacgcta ccattgctaa gcgcgtgaaa gaaacaccaa acgcaacctg gccggtacat 900
gctgtaatta ccaactctac ctatgatggt ctgctgtaca acaccgactt catcaagaaa 960
acactggatg tgaaatccat ccactttgac tccgcgtggg tgccttacac caacttctca 1020
ccgatttacg aaggtaaatg cggtatgagc ggtggccgtg tagaagggaa agtgatttac 1080
gaaacccagt ccactcacaa actgctggcg gcgttctctc aggcttccat gatccacgtt 1140
aaaggtgacg taaacgaaga aacctttaac gaagcctaca tgatgcacac caccacttct 1200
ccgcactacg gtatcgtggc gtccactgaa accgctgcgg cgatgatgaa aggcaatgca 1260
ggtaagcgtc tgatcaacgg ttctattgaa cgtgcgatca aattccgtaa agagatcaaa 1320
cgtctgagaa cggaatctga tggctggttc tttgatgtat ggcagccgga tcatatcgat 1380
acgactgaat gctggccgct gcgttctgac agcacctggc acggcttcaa aaacatcgat 1440
aacgagcaca tgtatcttga cccgatcaaa gtcaccctgc tgactccggg gatggaaaaa 1500
gacggcacca tgagcgactt tggtattccg gccagcatcg tggcgaaata cctcgacgaa 1560
catggcatcg ttgttgagaa aaccggtccg tataacctgc tgttcctgtt cagcatcggt 1620
atcgataaga ccaaagcact gagcctgctg cgtgctctga ctgactttaa acgtgcgttc 1680
gacctgaacc tgcgtgtgaa aaacatgctg ccgtctctgt atcgtgaaga tcctgaattc 1740
tatgaaaaca tgcgtattca ggaactggct cagaatatcc acaaactgat tgttcaccac 1800
aatctgccgg atctgatgta tcgcgcattt gaagtgctgc cgacgatggt aatgactccg 1860
tatgctgcat tccagaaaga gctgcacggt atgaccgaag aagtttacct cgacgaaatg 1920
gtaggtcgta ttaacgccaa tatgatcctt ccgtacccgc cgggagttcc tctggtaatg 1980
ccgggtgaaa tgatcaccga agaaagccgt ccggttctgg agttcctgca gatgctgtgt 2040
gaaatcggcg ctcactatcc gggctttgaa accgatattc acggtgcata ccgtcaggct 2100
gatggccgct ataccgttaa ggtattgaaa gaagaaagca aaaaataa 2148
<210> 2
<211> 715
<212> PRT
<213> Escherichia coli
<400> 2
Met Asn Val Ile Ala Ile Leu Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asn Phe Gln
20 25 30
Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Asn Leu Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Leu Gln Ile Ser Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Thr Thr Asp Glu Tyr Ile Asn Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Leu Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Gln Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Asp Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Ile Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Val Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Arg Thr Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Asp His Ile Asp Thr Thr Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Thr Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Glu Lys Asp Gly Thr Met Ser Asp Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Val His His Asn Leu Pro Asp Leu Met Tyr Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Val Met Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Met Thr Glu Glu Val Tyr Leu Asp Glu Met
625 630 635 640
Val Gly Arg Ile Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Ser Lys Lys
705 710 715
<210> 3
<211> 715
<212> PRT
<213> Klebsiella
<400> 3
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Pro Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Asp Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Asp Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Ser Met Val Met Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 4
<211> 715
<212> PRT
<213> Enterobacteriaceae
<400> 4
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Pro Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Asp Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Asp Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Ser Met Val Met Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 5
<211> 714
<212> PRT
<213> Salmonella enterica
<400> 5
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Gly Leu Asn Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Leu Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Ser Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Thr Asp
100 105 110
Ile Ala Ala Lys Ile Arg Gln Asn Thr Asp Glu Tyr Ile Asp Asn Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Gln Gly Lys Cys Gly Met Ser Gly Asp
340 345 350
Arg Val Glu Gly Lys Ile Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Ile
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Ser Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Ile Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Leu Val Ala Lys Tyr Leu Asp Glu Arg Gly Ile Ile Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Glu Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Ile Leu Pro Ala Leu Tyr Arg Glu
565 570 575
Ala Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Val Glu His His Asn Leu Pro Asp Leu Met Tyr Arg
595 600 605
Ala Phe Glu Val Leu Pro Lys Met Val Met Thr Pro Tyr Thr Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Glu Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Asn Thr Lys
705 710
<210> 6
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer cadA-F
<400> 6
ggcgagctca cacaggaaac agaccatgaa cgttattgca atattgaatc ac 52
<210> 7
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer cadA-R
<400> 7
ggctctagac cacttccctt gtacgagc 28
<210> 8
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer cadA-F2
<400> 8
atttcacaca ggaaacagct atgaacgtta ttgcaatatt gaat 44
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer cadA-R2
<400> 9
agctgtttcc tgtgtgaaat 20
<210> 10
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457C-F
<400> 10
tggcagccgt gtcatatcga tacgactgaa tg 32
<210> 11
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457C-R
<400> 11
atcgatatga cacggctgcc atacatcaaa g 31
<210> 12
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457A-F
<400> 12
tggcagccgg cgcatatcga tacgactgaa tg 32
<210> 13
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457A-R
<400> 13
atcgatatgc gccggctgcc atacatcaaa g 31
<210> 14
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457H-F
<400> 14
tggcagccgc atcatatcga tacgactgaa tg 32
<210> 15
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457H-R
<400> 15
atcgatatga tgcggctgcc atacatcaaa g 31
<210> 16
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457K-F
<400> 16
tggcagccga aacatatcga tacgactgaa tg 32
<210> 17
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457K-R
<400> 17
atcgatatgt ttcggctgcc atacatcaaa g 31
<210> 18
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457R-F
<400> 18
tggcagccgc gtcatatcga tacgactgaa tg 32
<210> 19
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457R-R
<400> 19
atcgatatga cgcggctgcc atacatcaaa g 31
<210> 20
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457L-F
<400> 20
tggcagccgc tgcatatcga tacgactgaa tg 32
<210> 21
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457L-R
<400> 21
atcgatatgc agcggctgcc atacatcaaa g 31
<210> 22
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457S-F
<400> 22
tggcagccga gccatatcga tacgactgaa tg 32
<210> 23
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457S-R
<400> 23
atcgatatgg ctcggctgcc atacatcaaa g 31
<210> 24
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457P-F
<400> 24
tggcagccgc cgcatatcga tacgactgaa tg 32
<210> 25
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457P-R
<400> 25
atcgatatgc ggcggctgcc atacatcaaa g 31
<210> 26
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457E-F
<400> 26
tggcagccgg aacatatcga tacgactgaa tg 32
<210> 27
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457E-R
<400> 27
atcgatatgt tccggctgcc atacatcaaa g 31
<210> 28
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457T-F
<400> 28
tggcagccga cccatatcga tacgactgaa tg 32
<210> 29
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457T-R
<400> 29
atcgatatgg gtcggctgcc atacatcaaa g 31
<210> 30
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457Y-F
<400> 30
tggcagccgt atcatatcga tacgactgaa tg 32
<210> 31
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457Y-R
<400> 31
atcgatatga tacggctgcc atacatcaaa g 31
<210> 32
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457G-F
<400> 32
tggcagccgg gccatatcga tacgactgaa tg 32
<210> 33
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457G-R
<400> 33
atcgatatgg cccggctgcc atacatcaaa g 31
<210> 34
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457V-F
<400> 34
tggcagccgg tgcatatcga tacgactgaa tg 32
<210> 35
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457V-R
<400> 35
atcgatatgc accggctgcc atacatcaaa g 31
<210> 36
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457F-F
<400> 36
tggcagccgt ttcatatcga tacgactgaa tg 32
<210> 37
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457F-R
<400> 37
atcgatatga aacggctgcc atacatcaaa g 31
<210> 38
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457N-F
<400> 38
tggcagccga accatatcga tacgactgaa tg 32
<210> 39
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457N-R
<400> 39
atcgatatgg ttcggctgcc atacatcaaa g 31
<210> 40
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457Q-F
<400> 40
tggcagccgc agcatatcga tacgactgaa tg 32
<210> 41
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457Q-R
<400> 41
atcgatatgc tgcggctgcc atacatcaaa g 31
<210> 42
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457I-F
<400> 42
tggcagccga tccatatcga tacgactgaa tg 32
<210> 43
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457I-R
<400> 43
atcgatatgg atcggctgcc atacatcaaa g 31
<210> 44
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457M-F
<400> 44
tggcagccga tgcatatcga tacgactgaa tg 32
<210> 45
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457M-R
<400> 45
atcgatatgc atcggctgcc atacatcaaa g 31
<210> 46
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457W-F
<400> 46
tggcagccgt ggcatatcga tacgactgaa tg 32
<210> 47
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D457W-R
<400> 47
atcgatatgc cacggctgcc atacatcaaa g 31
<210> 48
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460C-F
<400> 48
ggatcatatc tgcacgactg aatgctggcc gctgcgttc 39
<210> 49
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460C-R
<400> 49
attcagtcgt gcagatatga tccggctgcc atacatcaa 39
<210> 50
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460H-F
<400> 50
ggatcatatc catacgactg aatgctggcc gctgcgttc 39
<210> 51
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460H-R
<400> 51
attcagtcgt atggatatga tccggctgcc atacatcaa 39
<210> 52
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460K-F
<400> 52
ggatcatatc aaaacgactg aatgctggcc gctgcgttc 39
<210> 53
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460K-R
<400> 53
attcagtcgt tttgatatga tccggctgcc atacatcaa 39
<210> 54
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460R-F
<400> 54
ggatcatatc cgtacgactg aatgctggcc gctgcgttc 39
<210> 55
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460R-R
<400> 55
attcagtcgt acggatatga tccggctgcc atacatcaa 39
<210> 56
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460L-F
<400> 56
ggatcatatc ctgacgactg aatgctggcc gctgcgttc 39
<210> 57
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460L-R
<400> 57
attcagtcgt caggatatga tccggctgcc atacatcaa 39
<210> 58
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460S-F
<400> 58
ggatcatatc agcacgactg aatgctggcc gctgcgttc 39
<210> 59
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460S-R
<400> 59
attcagtcgt gctgatatga tccggctgcc atacatcaa 39
<210> 60
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460P-F
<400> 60
ggatcatatc ccgacgactg aatgctggcc gctgcgttc 39
<210> 61
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460P-R
<400> 61
attcagtcgt cgggatatga tccggctgcc atacatcaa 39
<210> 62
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460E-F
<400> 62
ggatcatatc gaaacgactg aatgctggcc gctgcgttc 39
<210> 63
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460E-R
<400> 63
attcagtcgt ttcgatatga tccggctgcc atacatcaa 39
<210> 64
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460T-F
<400> 64
ggatcatatc accacgactg aatgctggcc gctgcgttc 39
<210> 65
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460T-R
<400> 65
attcagtcgt ggtgatatga tccggctgcc atacatcaa 39
<210> 66
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460Y-F
<400> 66
ggatcatatc tatacgactg aatgctggcc gctgcgttc 39
<210> 67
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460Y-R
<400> 67
attcagtcgt atagatatga tccggctgcc atacatcaa 39
<210> 68
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460A-F
<400> 68
ggatcatatc gcgacgactg aatgctggcc gctgcgttc 39
<210> 69
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460A-R
<400> 69
attcagtcgt cgcgatatga tccggctgcc atacatcaa 39
<210> 70
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460G-F
<400> 70
ggatcatatc ggcacgactg aatgctggcc gctgcgttc 39
<210> 71
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460G-R
<400> 71
attcagtcgt gccgatatga tccggctgcc atacatcaa 39
<210> 72
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460V-F
<400> 72
ggatcatatc gtgacgactg aatgctggcc gctgcgttc 39
<210> 73
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460V-R
<400> 73
attcagtcgt cacgatatga tccggctgcc atacatcaa 39
<210> 74
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460F-F
<400> 74
ggatcatatc tttacgactg aatgctggcc gctgcgttc 39
<210> 75
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460F-R
<400> 75
attcagtcgt aaagatatga tccggctgcc atacatcaa 39
<210> 76
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460N-F
<400> 76
ggatcatatc aacacgactg aatgctggcc gctgcgttc 39
<210> 77
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460N-R
<400> 77
attcagtcgt gttgatatga tccggctgcc atacatcaa 39
<210> 78
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460Q-F
<400> 78
ggatcatatc cagacgactg aatgctggcc gctgcgttc 39
<210> 79
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460Q-R
<400> 79
attcagtcgt ctggatatga tccggctgcc atacatcaa 39
<210> 80
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460I-F
<400> 80
ggatcatatc atcacgactg aatgctggcc gctgcgttc 39
<210> 81
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460I-R
<400> 81
attcagtcgt gatgatatga tccggctgcc atacatcaa 39
<210> 82
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460M-F
<400> 82
ggatcatatc atgacgactg aatgctggcc gctgcgttc 39
<210> 83
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460M-R
<400> 83
attcagtcgt catgatatga tccggctgcc atacatcaa 39
<210> 84
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460W-F
<400> 84
ggatcatatc tggacgactg aatgctggcc gctgcgttc 39
<210> 85
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer D460W-R
<400> 85
attcagtcgt ccagatatga tccggctgcc atacatcaa 39
<210> 86
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458F-F
<400> 86
atggcagccg gatttcatcg atacgactga atgctg 36
<210> 87
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458F-R
<400> 87
agtcgtatcg atgaaatccg gctgccatac atcaaagaac 40
<210> 88
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458L-F
<400> 88
atggcagccg gatctaatcg atacgactga atgctg 36
<210> 89
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458L-R
<400> 89
agtcgtatcg attagatccg gctgccatac atcaaagaac 40
<210> 90
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458S-F
<400> 90
atggcagccg gattgaatcg atacgactga atgctg 36
<210> 91
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458S-R
<400> 91
agtcgtatcg attcaatccg gctgccatac atcaaagaac 40
<210> 92
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458Y-F
<400> 92
atggcagccg gattacatcg atacgactga atgctg 36
<210> 93
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458Y-R
<400> 93
agtcgtatcg atgtaatccg gctgccatac atcaaagaac 40
<210> 94
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458P-F
<400> 94
atggcagccg gatccaatcg atacgactga atgctg 36
<210> 95
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458P-R
<400> 95
agtcgtatcg attggatccg gctgccatac atcaaagaac 40
<210> 96
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458Q-F
<400> 96
atggcagccg gatcaaatcg atacgactga atgctg 36
<210> 97
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458Q-R
<400> 97
agtcgtatcg atttgatccg gctgccatac atcaaagaac 40
<210> 98
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458R-F
<400> 98
atggcagccg gatcgtatcg atacgactga atgctg 36
<210> 99
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458R-R
<400> 99
agtcgtatcg atacgatccg gctgccatac atcaaagaac 40
<210> 100
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458W-F
<400> 100
atggcagccg gattggatcg atacgactga atgctg 36
<210> 101
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458W-R
<400> 101
agtcgtatcg atccaatccg gctgccatac atcaaagaac 40
<210> 102
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458I-F
<400> 102
atggcagccg gatatcatcg atacgactga atgctg 36
<210> 103
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458I-R
<400> 103
agtcgtatcg atgatatccg gctgccatac atcaaagaac 40
<210> 104
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458T-F
<400> 104
atggcagccg gatactatcg atacgactga atgctg 36
<210> 105
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458T-R
<400> 105
agtcgtatcg atagtatccg gctgccatac atcaaagaac 40
<210> 106
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458D-F
<400> 106
atggcagccg gatgatatcg atacgactga atgctg 36
<210> 107
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458D-R
<400> 107
agtcgtatcg atatcatccg gctgccatac atcaaagaac 40
<210> 108
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458K-F
<400> 108
atggcagccg gataagatcg atacgactga atgctg 36
<210> 109
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458K-R
<400> 109
agtcgtatcg atcttatccg gctgccatac atcaaagaac 40
<210> 110
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458N-F
<400> 110
atggcagccg gataacatcg atacgactga atgctg 36
<210> 111
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458N-R
<400> 111
agtcgtatcg atgttatccg gctgccatac atcaaagaac 40
<210> 112
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458E-F
<400> 112
atggcagccg gatgaaatcg atacgactga atgctg 36
<210> 113
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458E-R
<400> 113
agtcgtatcg atttcatccg gctgccatac atcaaagaac 40
<210> 114
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458A-F
<400> 114
atggcagccg gatgctatcg atacgactga atgctg 36
<210> 115
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458A-R
<400> 115
agtcgtatcg atagcatccg gctgccatac atcaaagaac 40
<210> 116
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458G-F
<400> 116
atggcagccg gatggtatcg atacgactga atgctg 36
<210> 117
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458G-R
<400> 117
agtcgtatcg ataccatccg gctgccatac atcaaagaac 40
<210> 118
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458V-F
<400> 118
atggcagccg gatgtaatcg atacgactga atgctg 36
<210> 119
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458V-R
<400> 119
agtcgtatcg attacatccg gctgccatac atcaaagaac 40
<210> 120
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458M-F
<400> 120
atggcagccg gatatgatcg atacgactga atgctg 36
<210> 121
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer H458M-R
<400> 121
agtcgtatcg atcatatccg gctgccatac atcaaagaac 40
Claims (27)
1.CadA变体多肽,其在SEQ ID NO:2的D457、H458或D460进行氨基酸取代,所述氨基酸取代为:H458A/C/E/F/G/M/P/T/V/W/Y、D457A/C/E/F/H/I/K/L/M/N/S/W/Y或D460C/F/Q/I/S/V/W/Y。
2.权利要求1的CadA变体多肽,其中H458的氨基酸取代是H458A/C/F/M/V/W/Y。
3.权利要求1的CadA变体多肽,其中D457的氨基酸取代是D457A/C/H/K/L/M/N/S。
4.权利要求1的CadA变体多肽,其中D460的氨基酸取代是D460C/F/Q/I/S/V/W。
5.遗传修饰的宿主细胞,其包含权利要求1-4任一项的CadA变体多肽。
6.权利要求5的遗传修饰的宿主细胞,其中所述宿主细胞被遗传修饰以过表达一或多种赖氨酸生物合成多肽。
7.权利要求5的遗传修饰的宿主细胞,其中所述宿主细胞是细菌。
8.权利要求7的遗传修饰的宿主细胞,其中所述宿主细胞来自埃希氏菌属(Escherichia)、哈夫尼菌属(Hafnia)或者棒杆菌属(Corynebacterium)。
9. 权利要求7的遗传修饰的宿主细胞,其中所述宿主细胞是大肠杆菌(Escherichia coli)。
10. 权利要求7的遗传修饰的宿主细胞,其中所述宿主细胞是谷氨酸棒杆菌(Corynebacterium glutamicum)。
11.权利要求7的遗传修饰的宿主细胞,其中所述宿主细胞是蜂房哈夫尼菌(Hafnia alvei)。
12.一种产生尸胺的方法,所述方法包括将权利要求5-11任一项的遗传修饰的宿主细胞在表达所述CadA变体多肽的条件下进行培养。
13.一种多核苷酸,其包含编码权利要求1-4任一项的CadA变体多肽的核酸序列。
14.一种表达载体,其包含权利要求13的多核苷酸。
15.一种遗传修饰的宿主细胞,其包含权利要求14的表达载体。
16.权利要求15的遗传修饰的宿主细胞,其中所述宿主细胞是细菌。
17.权利要求15的遗传修饰的宿主细胞,其中所述宿主细胞来自埃希氏菌属、哈夫尼菌属或者棒杆菌属。
18.权利要求15的遗传修饰的宿主细胞,其中所述宿主细胞是大肠杆菌。
19.权利要求15的遗传修饰的宿主细胞,其中所述宿主细胞是谷氨酸棒杆菌。
20.权利要求15的遗传修饰的宿主细胞,其中所述宿主细胞是蜂房哈夫尼菌。
21.一种遗传修饰的宿主细胞,其包含权利要求13的多核苷酸,其中编码所述CadA变体多肽的核酸序列整合进所述宿主细胞染色体中。
22.权利要求21的遗传修饰的宿主细胞,其中所述宿主细胞是细菌。
23.权利要求22的遗传修饰的宿主细胞,其中所述宿主细胞来自埃希氏菌属、哈夫尼菌属或者棒杆菌属。
24.权利要求22的遗传修饰的宿主细胞,其中所述宿主细胞是大肠杆菌。
25.权利要求22的遗传修饰的宿主细胞,其中所述宿主细胞是谷氨酸棒杆菌。
26.权利要求22的遗传修饰的宿主细胞,其中所述宿主细胞是蜂房哈夫尼菌。
27.一种生产尸胺的方法,所述方法包括将权利要求15-26任一项的遗传修饰的宿主细胞在表达所述CadA变体多肽的条件下进行培养。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2016/113516 WO2018120025A1 (en) | 2016-12-30 | 2016-12-30 | Lysine decarboxylases having modifications at titratable amino acids |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110291192A CN110291192A (zh) | 2019-09-27 |
CN110291192B true CN110291192B (zh) | 2023-12-08 |
Family
ID=62706740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680091428.9A Active CN110291192B (zh) | 2016-12-30 | 2016-12-30 | 在可滴定氨基酸具有修饰的赖氨酸脱羧酶 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11078473B2 (zh) |
EP (1) | EP3562938A4 (zh) |
CN (1) | CN110291192B (zh) |
WO (1) | WO2018120025A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113881657B (zh) * | 2020-07-02 | 2024-02-02 | 中国科学院过程工程研究所 | 一种用于合成戊二胺的赖氨酸脱羧酶及其应用 |
CN118516339A (zh) * | 2023-02-18 | 2024-08-20 | 宁波酶赛生物工程有限公司 | 一种制备1,5-戊二胺的工程化赖氨酸脱羧酶 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1175280A (zh) * | 1994-12-09 | 1998-03-04 | 味之素株式会社 | 新的赖氨酸脱羧酶基因以及生产l-赖氨酸的方法 |
CN102753682A (zh) * | 2009-12-17 | 2012-10-24 | 巴斯夫欧洲公司 | 用于生产尸胺的方法和重组微生物 |
CN103789292A (zh) * | 2013-12-26 | 2014-05-14 | 南京工业大学 | 一种赖氨酸脱羧酶、制备方法及其应用 |
EP2806026A1 (en) * | 2012-01-18 | 2014-11-26 | Mitsui Chemicals, Inc. | Production method for 1,5-pentamethylenediamine, production method for mutant lysine decarboxylase and 1,5-pentamethylene diisocyanate, and production method for polyisocyanate composition |
CN104762336A (zh) * | 2014-01-06 | 2015-07-08 | 上海凯赛生物技术研发中心有限公司 | 1,5-戊二胺的制备方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6610836B1 (en) * | 1999-01-29 | 2003-08-26 | Genome Therapeutics Corporation | Nucleic acid amino acid sequences relating to Klebsiella pneumoniae for diagnostics and therapeutics |
DE602004000428T2 (de) | 2003-05-26 | 2006-10-19 | Ajinomoto Co., Inc. | Verfahren zur Herstellung von Cadaverindicarboxylat und dessen Verwendung zur Herstellung von Nylon |
DE102007005072A1 (de) * | 2007-02-01 | 2008-08-07 | Evonik Degussa Gmbh | Verfahren zur fermentativen Herstellung von Cadaverin |
CN102770542A (zh) * | 2007-05-22 | 2012-11-07 | 巴斯夫植物科学有限公司 | 对环境胁迫具有提高的耐性和/或抗性以及增加的生物量产生的植物 |
US10647976B2 (en) | 2014-06-26 | 2020-05-12 | Cathay Biotech Inc. | Expression of polypeptides involved in lysine decarboxylation, and methods and applications thereof |
CN104498519A (zh) * | 2014-12-19 | 2015-04-08 | 南京工业大学 | 一种表达重组载体及其应用 |
ES2871097T3 (es) | 2015-01-30 | 2021-10-28 | Cathay Biotech Inc | Expresión de polipéptidos de Klebsiella oxytoca implicados en la descarboxilación de lisina, y métodos y aplicaciones de los mismos |
KR20160097691A (ko) * | 2015-02-09 | 2016-08-18 | 씨제이제일제당 (주) | 신규 라이신 디카르복실라제 및 이를 이용하여 카다베린을 생산하는 방법 |
-
2016
- 2016-12-30 WO PCT/CN2016/113516 patent/WO2018120025A1/en unknown
- 2016-12-30 US US16/473,215 patent/US11078473B2/en active Active
- 2016-12-30 CN CN201680091428.9A patent/CN110291192B/zh active Active
- 2016-12-30 EP EP16925168.3A patent/EP3562938A4/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1175280A (zh) * | 1994-12-09 | 1998-03-04 | 味之素株式会社 | 新的赖氨酸脱羧酶基因以及生产l-赖氨酸的方法 |
CN102753682A (zh) * | 2009-12-17 | 2012-10-24 | 巴斯夫欧洲公司 | 用于生产尸胺的方法和重组微生物 |
EP2806026A1 (en) * | 2012-01-18 | 2014-11-26 | Mitsui Chemicals, Inc. | Production method for 1,5-pentamethylenediamine, production method for mutant lysine decarboxylase and 1,5-pentamethylene diisocyanate, and production method for polyisocyanate composition |
CN103789292A (zh) * | 2013-12-26 | 2014-05-14 | 南京工业大学 | 一种赖氨酸脱羧酶、制备方法及其应用 |
CN104762336A (zh) * | 2014-01-06 | 2015-07-08 | 上海凯赛生物技术研发中心有限公司 | 1,5-戊二胺的制备方法 |
Non-Patent Citations (2)
Title |
---|
Lysine Decarboxylase Mutants of Escherichia coli: Evidence for Two Enzyme Forms;SARA H. GOLDEMBERG;《JOURNAL OF BACTERIOLOGY》;第141卷(第3期);第1428-1431页 * |
生物法合成戊二胺研究进展;李东霞等;《生物工程学报》;第30卷(第2期);第161-174页 * |
Also Published As
Publication number | Publication date |
---|---|
US20190330614A1 (en) | 2019-10-31 |
CN110291192A (zh) | 2019-09-27 |
WO2018120025A1 (en) | 2018-07-05 |
EP3562938A4 (en) | 2020-11-11 |
US11078473B2 (en) | 2021-08-03 |
EP3562938A1 (en) | 2019-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110546255B (zh) | 对赖氨酸脱羧酶酶类的修饰 | |
CN110291101B (zh) | 修饰的赖氨酸脱羧酶 | |
US20230295602A1 (en) | Method of improving acid decarboxylase activity in vitro under alkaline ph | |
CN108368477B (zh) | 修饰的膜渗透性 | |
WO2023098453A1 (zh) | 腈水合酶突变体及其应用 | |
CN110997899B (zh) | 嗜热赖氨酸脱羧酶的异源表达及其用途 | |
CN111770993B (zh) | 调节csr系统以生产赖氨酸和赖氨酸衍生产物 | |
CN110291192B (zh) | 在可滴定氨基酸具有修饰的赖氨酸脱羧酶 | |
CN109790557B (zh) | 控制生物膜分散以产生氨基酸或氨基酸衍生产物 | |
CN111406104B (zh) | 减少为了生产氨基酸或氨基酸衍生产物的亚胺/烯胺的积累 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information |
Address after: No.5 Building, 1690 Cailun Road, Zhangjiang High-tech Park, Pudong New Area, Shanghai Applicant after: CATHAY R&D CENTER Co.,Ltd. Applicant after: CIBT USA Address before: 201203 Shanghai Zhangjiang High Tech Park of Pudong New Area Cailun Road No. 5 No. 1690 Applicant before: CATHAY R&D CENTER Co.,Ltd. Applicant before: CIBT USA |
|
CB02 | Change of applicant information | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |