CN117480250A - 新型伽马氨基丁酸通透酶变体及使用其生产异亮氨酸的方法 - Google Patents
新型伽马氨基丁酸通透酶变体及使用其生产异亮氨酸的方法 Download PDFInfo
- Publication number
- CN117480250A CN117480250A CN202180093144.4A CN202180093144A CN117480250A CN 117480250 A CN117480250 A CN 117480250A CN 202180093144 A CN202180093144 A CN 202180093144A CN 117480250 A CN117480250 A CN 117480250A
- Authority
- CN
- China
- Prior art keywords
- ala
- amino acid
- leu
- gly
- isoleucine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229960000310 isoleucine Drugs 0.000 title claims abstract description 143
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 title claims abstract description 142
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 title claims abstract description 118
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 title claims abstract description 57
- 229960003692 gamma aminobutyric acid Drugs 0.000 title claims abstract description 57
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 49
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 title description 17
- 244000005700 microbiome Species 0.000 claims abstract description 137
- 229930182844 L-isoleucine Natural products 0.000 claims abstract description 126
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 126
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 126
- 239000002157 polynucleotide Substances 0.000 claims abstract description 126
- 239000013598 vector Substances 0.000 claims abstract description 76
- 239000006227 byproduct Substances 0.000 claims abstract description 54
- 150000001413 amino acids Chemical class 0.000 claims description 112
- 229940024606 amino acid Drugs 0.000 claims description 110
- 238000000034 method Methods 0.000 claims description 89
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 52
- 239000004473 Threonine Substances 0.000 claims description 37
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 35
- 239000004474 valine Substances 0.000 claims description 35
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 34
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 34
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 33
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 claims description 29
- QWCKQJZIFLGMSD-UHFFFAOYSA-N 2-Aminobutanoic acid Natural products CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 claims description 28
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 25
- 241000186226 Corynebacterium glutamicum Species 0.000 claims description 18
- 241000186216 Corynebacterium Species 0.000 claims description 17
- 239000000203 mixture Substances 0.000 claims description 12
- 238000012258 culturing Methods 0.000 claims description 10
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 6
- 229940124277 aminobutyric acid Drugs 0.000 claims description 6
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 4
- QWCKQJZIFLGMSD-GSVOUGTGSA-N D-alpha-aminobutyric acid Chemical compound CC[C@@H](N)C(O)=O QWCKQJZIFLGMSD-GSVOUGTGSA-N 0.000 claims 2
- 108090000623 proteins and genes Proteins 0.000 description 184
- 102000004169 proteins and genes Human genes 0.000 description 132
- 235000018102 proteins Nutrition 0.000 description 112
- 230000000694 effects Effects 0.000 description 104
- 229920001184 polypeptide Polymers 0.000 description 100
- 108090000765 processed proteins & peptides Proteins 0.000 description 100
- 102000004196 processed proteins & peptides Human genes 0.000 description 100
- 235000001014 amino acid Nutrition 0.000 description 97
- 101150010999 aroP gene Proteins 0.000 description 90
- 230000000875 corresponding effect Effects 0.000 description 79
- 125000003275 alpha amino acid group Chemical group 0.000 description 68
- 102000003939 Membrane transport proteins Human genes 0.000 description 55
- 108090000301 Membrane transport proteins Proteins 0.000 description 55
- 108020004414 DNA Proteins 0.000 description 50
- 229960004295 valine Drugs 0.000 description 50
- 230000014509 gene expression Effects 0.000 description 38
- 230000035772 mutation Effects 0.000 description 36
- 229960002898 threonine Drugs 0.000 description 32
- 239000000047 product Substances 0.000 description 29
- 210000000349 chromosome Anatomy 0.000 description 28
- 229960005190 phenylalanine Drugs 0.000 description 28
- 235000008521 threonine Nutrition 0.000 description 28
- QWCKQJZIFLGMSD-VKHMYHEASA-N L-alpha-aminobutyric acid Chemical compound CC[C@H](N)C(O)=O QWCKQJZIFLGMSD-VKHMYHEASA-N 0.000 description 26
- 210000004027 cell Anatomy 0.000 description 25
- 239000012634 fragment Substances 0.000 description 24
- 150000007523 nucleic acids Chemical class 0.000 description 23
- 230000001965 increasing effect Effects 0.000 description 21
- 239000002609 medium Substances 0.000 description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 description 16
- 101150095957 ilvA gene Proteins 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 238000004925 denaturation Methods 0.000 description 14
- 230000036425 denaturation Effects 0.000 description 14
- 238000000137 annealing Methods 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 12
- 101150063051 hom gene Proteins 0.000 description 12
- 230000002829 reductive effect Effects 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 12
- 230000001747 exhibiting effect Effects 0.000 description 11
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 235000004279 alanine Nutrition 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- 239000013587 production medium Substances 0.000 description 9
- 238000000746 purification Methods 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 230000009466 transformation Effects 0.000 description 9
- SFOXOSKVTLDEDM-HOTGVXAUSA-N Gly-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CN)=CNC2=C1 SFOXOSKVTLDEDM-HOTGVXAUSA-N 0.000 description 8
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 8
- 108010089804 glycyl-threonine Proteins 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 108010026333 seryl-proline Proteins 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 7
- 108091081024 Start codon Proteins 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 6
- 229960003767 alanine Drugs 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 230000002708 enhancing effect Effects 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- 230000002779 inactivation Effects 0.000 description 6
- 238000001802 infusion Methods 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 5
- 241000186031 Corynebacteriaceae Species 0.000 description 5
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- 239000004471 Glycine Substances 0.000 description 5
- 108010064711 Homoserine dehydrogenase Proteins 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- 102100023162 L-serine dehydratase/L-threonine deaminase Human genes 0.000 description 5
- 101710193388 L-serine dehydratase/L-threonine deaminase Proteins 0.000 description 5
- 101710125839 L-threonine dehydratase Proteins 0.000 description 5
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 5
- 101710170075 Serine dehydratase-like Proteins 0.000 description 5
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 238000000855 fermentation Methods 0.000 description 5
- 230000004151 fermentation Effects 0.000 description 5
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 5
- 229960002449 glycine Drugs 0.000 description 5
- 229960002885 histidine Drugs 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 4
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 4
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 4
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 4
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 4
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 4
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 4
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 4
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 4
- 239000004475 Arginine Substances 0.000 description 4
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 4
- CTQIOCMSIJATNX-WHFBIAKZSA-N Asn-Gly-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O CTQIOCMSIJATNX-WHFBIAKZSA-N 0.000 description 4
- ILQCHXURSRRIRY-YUMQZZPRSA-N Asp-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N ILQCHXURSRRIRY-YUMQZZPRSA-N 0.000 description 4
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 4
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 4
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 4
- INGJLBQKTRJLFO-UKJIMTQDSA-N Glu-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O INGJLBQKTRJLFO-UKJIMTQDSA-N 0.000 description 4
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 4
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 4
- JPUNZXVHHRZMNL-XIRDDKMYSA-N Glu-Pro-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JPUNZXVHHRZMNL-XIRDDKMYSA-N 0.000 description 4
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 4
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 4
- IXKRSKPKSLXIHN-YUMQZZPRSA-N Gly-Cys-Leu Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IXKRSKPKSLXIHN-YUMQZZPRSA-N 0.000 description 4
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 4
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 4
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 4
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 4
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 4
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 4
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 4
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 4
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 4
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 4
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 4
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 4
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 4
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 4
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 4
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 4
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 4
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 4
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 4
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 4
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 4
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 4
- SBFPAAPFKZPDCZ-JYJNAYRXSA-N Met-Pro-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SBFPAAPFKZPDCZ-JYJNAYRXSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 108010066427 N-valyltryptophan Proteins 0.000 description 4
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 4
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 4
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 4
- XEXSSIBQYNKFBX-KBPBESRZSA-N Phe-Gly-His Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 XEXSSIBQYNKFBX-KBPBESRZSA-N 0.000 description 4
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 4
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 4
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 4
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 4
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 4
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 4
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 4
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 4
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 4
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 4
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 4
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 4
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 4
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 4
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 4
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 4
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 4
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 4
- CXUFDWZBHKUGKK-CABZTGNLSA-N Trp-Ala-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O)=CNC2=C1 CXUFDWZBHKUGKK-CABZTGNLSA-N 0.000 description 4
- FOAJSVIXYCLTSC-PJODQICGSA-N Trp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N FOAJSVIXYCLTSC-PJODQICGSA-N 0.000 description 4
- BGWSLEYVITZIQP-DCPHZVHLSA-N Trp-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O BGWSLEYVITZIQP-DCPHZVHLSA-N 0.000 description 4
- JDWUNEPOEZAZGD-BVSLBCMMSA-N Trp-Phe-Met Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=CC=C1 JDWUNEPOEZAZGD-BVSLBCMMSA-N 0.000 description 4
- YMZYSCDRTXEOKD-IHPCNDPISA-N Tyr-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N YMZYSCDRTXEOKD-IHPCNDPISA-N 0.000 description 4
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 4
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 4
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 4
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 4
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 4
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 4
- 108010011559 alanylphenylalanine Proteins 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 4
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 4
- 235000011130 ammonium sulphate Nutrition 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- -1 food Chemical compound 0.000 description 4
- 235000013922 glutamic acid Nutrition 0.000 description 4
- 239000004220 glutamic acid Substances 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 4
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 4
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 108010088381 isoleucyl-lysyl-valyl-alanyl-valine Proteins 0.000 description 4
- 229960003136 leucine Drugs 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 229960004452 methionine Drugs 0.000 description 4
- 235000006109 methionine Nutrition 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 108010085203 methionylmethionine Proteins 0.000 description 4
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 4
- 235000019796 monopotassium phosphate Nutrition 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 235000015097 nutrients Nutrition 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 238000006116 polymerization reaction Methods 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 108010089087 soymetide-4 Proteins 0.000 description 4
- 108010005652 splenotritin Proteins 0.000 description 4
- 229960004793 sucrose Drugs 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 3
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 3
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 3
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 239000001110 calcium chloride Substances 0.000 description 3
- 229910001628 calcium chloride Inorganic materials 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000002577 cryoprotective agent Substances 0.000 description 3
- 238000012136 culture method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 150000002484 inorganic compounds Chemical class 0.000 description 3
- 229910010272 inorganic material Inorganic materials 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- SURQXAFEQWPFPV-UHFFFAOYSA-L iron(2+) sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Fe+2].[O-]S([O-])(=O)=O SURQXAFEQWPFPV-UHFFFAOYSA-L 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- WRUGWIBCXHJTDG-UHFFFAOYSA-L magnesium sulfate heptahydrate Chemical compound O.O.O.O.O.O.O.[Mg+2].[O-]S([O-])(=O)=O WRUGWIBCXHJTDG-UHFFFAOYSA-L 0.000 description 3
- 229940061634 magnesium sulfate heptahydrate Drugs 0.000 description 3
- ISPYRSDWRDQNSW-UHFFFAOYSA-L manganese(II) sulfate monohydrate Chemical compound O.[Mn+2].[O-]S([O-])(=O)=O ISPYRSDWRDQNSW-UHFFFAOYSA-L 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 108091005573 modified proteins Proteins 0.000 description 3
- 102000035118 modified proteins Human genes 0.000 description 3
- 235000013379 molasses Nutrition 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 239000000546 pharmaceutical excipient Substances 0.000 description 3
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 3
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 3
- 230000037432 silent mutation Effects 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 229960004799 tryptophan Drugs 0.000 description 3
- 229960004441 tyrosine Drugs 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 241000186145 Corynebacterium ammoniagenes Species 0.000 description 2
- 241000158523 Corynebacterium striatum Species 0.000 description 2
- 238000012270 DNA recombination Methods 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- VZUNGTLZRAYYDE-UHFFFAOYSA-N N-methyl-N'-nitro-N-nitrosoguanidine Chemical compound O=NN(C)C(=N)N[N+]([O-])=O VZUNGTLZRAYYDE-UHFFFAOYSA-N 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 150000005693 branched-chain amino acids Chemical class 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 229960002433 cysteine Drugs 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 235000015872 dietary supplement Nutrition 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- 229960002743 glutamine Drugs 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 229960002429 proline Drugs 0.000 description 2
- 235000013930 proline Nutrition 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 229960001153 serine Drugs 0.000 description 2
- 235000004400 serine Nutrition 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 235000002374 tyrosine Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- QDGAVODICPCDMU-UHFFFAOYSA-N 2-amino-3-[3-[bis(2-chloroethyl)amino]phenyl]propanoic acid Chemical compound OC(=O)C(N)CC1=CC=CC(N(CCCl)CCCl)=C1 QDGAVODICPCDMU-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 102000034263 Amino acid transporters Human genes 0.000 description 1
- 108050005273 Amino acid transporters Proteins 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 101100533902 Arabidopsis thaliana SPL13A gene Proteins 0.000 description 1
- 101100533904 Arabidopsis thaliana SPL13B gene Proteins 0.000 description 1
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 1
- XEOXPCNONWHHSW-AVGNSLFASA-N Arg-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N XEOXPCNONWHHSW-AVGNSLFASA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- RAKKBBHMTJSXOY-XVYDVKMFSA-N Asn-His-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O RAKKBBHMTJSXOY-XVYDVKMFSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108010055400 Aspartate kinase Proteins 0.000 description 1
- 101100455080 Bacillus subtilis (strain 168) lmrB gene Proteins 0.000 description 1
- 241000212384 Bifora Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000186248 Corynebacterium callunae Species 0.000 description 1
- 241000424760 Corynebacterium crenatum Species 0.000 description 1
- 241001605246 Corynebacterium crudilactis Species 0.000 description 1
- 241000446654 Corynebacterium deserti Species 0.000 description 1
- 241001644925 Corynebacterium efficiens Species 0.000 description 1
- 241001134763 Corynebacterium flavescens Species 0.000 description 1
- 241000291063 Corynebacterium halotolerans Species 0.000 description 1
- 241000024402 Corynebacterium imitans Species 0.000 description 1
- 241000128247 Corynebacterium pollutisoli Species 0.000 description 1
- 241001313296 Corynebacterium simulans Species 0.000 description 1
- 241000334675 Corynebacterium singulare Species 0.000 description 1
- 241000186249 Corynebacterium sp. Species 0.000 description 1
- 241000186308 Corynebacterium stationis Species 0.000 description 1
- 241000960580 Corynebacterium testudinoris Species 0.000 description 1
- NIXHTNJAGGFBAW-CIUDSAMLSA-N Cys-Lys-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N NIXHTNJAGGFBAW-CIUDSAMLSA-N 0.000 description 1
- ZOKPRHVIFAUJPV-GUBZILKMSA-N Cys-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O ZOKPRHVIFAUJPV-GUBZILKMSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N DMSO Substances CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 1
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- SRZLHYPAOXBBSB-HJGDQZAQSA-N Glu-Arg-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SRZLHYPAOXBBSB-HJGDQZAQSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- MRVZCDSYLJXKKX-ACRUOGEOSA-N His-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N MRVZCDSYLJXKKX-ACRUOGEOSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- SNHYFFQZRFIRHO-CYDGBPFRSA-N Ile-Met-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N SNHYFFQZRFIRHO-CYDGBPFRSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- 239000004395 L-leucine Substances 0.000 description 1
- 235000019454 L-leucine Nutrition 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- KUEVMUXNILMJTK-JYJNAYRXSA-N Leu-Gln-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KUEVMUXNILMJTK-JYJNAYRXSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- XOFDBXYPKZUAAM-GUBZILKMSA-N Met-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N XOFDBXYPKZUAAM-GUBZILKMSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- VYDLZDRMOFYOGV-TUAOUCFPSA-N Met-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N VYDLZDRMOFYOGV-TUAOUCFPSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101100070556 Oryza sativa subsp. japonica HSFA4D gene Proteins 0.000 description 1
- 101100043227 Oryza sativa subsp. japonica SPL13 gene Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 1
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 1
- XYAFCOJKICBRDU-JYJNAYRXSA-N Pro-Phe-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O XYAFCOJKICBRDU-JYJNAYRXSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- 108010009736 Protein Hydrolysates Proteins 0.000 description 1
- 101150099282 SPL7 gene Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- ZGFRMNZZTOVBOU-CIUDSAMLSA-N Ser-Met-Gln Chemical compound N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)O ZGFRMNZZTOVBOU-CIUDSAMLSA-N 0.000 description 1
- VXYQOFXBIXKPCX-BQBZGAKWSA-N Ser-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N VXYQOFXBIXKPCX-BQBZGAKWSA-N 0.000 description 1
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 1
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- BIENEHRYNODTLP-HJGDQZAQSA-N Thr-Glu-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O BIENEHRYNODTLP-HJGDQZAQSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 1
- GYKDRHDMGQUZPU-MGHWNKPDSA-N Tyr-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N GYKDRHDMGQUZPU-MGHWNKPDSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- LABUITCFCAABSV-UHFFFAOYSA-N Val-Ala-Tyr Natural products CC(C)C(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LABUITCFCAABSV-UHFFFAOYSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 235000012501 ammonium carbonate Nutrition 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 108010079058 casein hydrolysate Proteins 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 241000186254 coryneform bacterium Species 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000003208 gene overexpression Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- FBAFATDZDUQKNH-UHFFFAOYSA-M iron chloride Chemical compound [Cl-].[Fe] FBAFATDZDUQKNH-UHFFFAOYSA-M 0.000 description 1
- 229910000358 iron sulfate Inorganic materials 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 101150035025 lysC gene Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 229940099596 manganese sulfate Drugs 0.000 description 1
- 239000011702 manganese sulphate Substances 0.000 description 1
- 235000007079 manganese sulphate Nutrition 0.000 description 1
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 1
- 229920001522 polyglycol ester Polymers 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000002525 ultrasonication Methods 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 101150062776 yccA gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/34—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/06—Alanine; Leucine; Isoleucine; Serine; Homoserine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/15—Corynebacterium
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Immunology (AREA)
- Toxicology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本申请涉及:新型γ‑氨基丁酸通透酶变体,其减少在生产L‑异亮氨酸的生产过程中生成的副产物的量;编码所述变体的多核苷酸和包含所述多核苷酸的载体;包含所述变体、多核苷酸或载体的微生物;以及使用所述微生物生产L‑异亮氨酸的方法。
Description
技术领域
本申请涉及减少在生产L-异亮氨酸过程中生成的副产物的量的新型伽马(γ)-氨基丁酸通透酶变体、编码所述变体的多核苷酸和包含所述多核苷酸的载体、包含所述变体、多核苷酸或载体的微生物以及使用所述微生物生产L-异亮氨酸的方法。
背景技术
L-异亮氨酸是20种氨基酸中的一种支链氨基酸,被分类成必需氨基酸,并广泛用于动物饲料、食品添加剂和医药领域。L-异亮氨酸经代谢后具有能量生成、血红蛋白产生、血糖水平控制、肌肉构建和修复等功能,并越来越多地用于动物饲料以及输液、营养补充剂和运动营养补充剂领域。
基于这种趋势,各种微生物及其变体被用于生产L-氨基酸(美国专利号10113190),而在这种情况下,也产生大量除L-异亮氨酸外的副产物,并且副产物是在纯化步骤中极大地影响L-异亮氨酸纯度的物质,因此,需要用于去除副产物的方法。在这方面,为提高L-异亮氨酸纯度而开发的L-异亮氨酸纯化方法的缺点在于需要单独的额外纯化过程(美国专利号6072083),并且需要开发一种提高L-异亮氨酸纯度的方法。
发明内容
【技术问题】
在使用微生物生产时,为提高L-异亮氨酸的纯度做出不懈的努力,结果鉴定出编码γ-氨基丁酸通透酶的aroP基因——其可减少副产物如α-氨基丁酸和L-缬氨酸的量并且有助于L-异亮氨酸的生产,并且获得能够进一步提高L-异亮氨酸纯度的变异体(variation)。
【技术方案】
本申请的目的是提供γ-氨基丁酸通透酶变体。
本申请的另一个目的是提供编码所述变体的多核苷酸。
本申请的另一个目的是提供包含所述多核苷酸的载体。
本申请的另一个目的是提供微生物,其包含下列中的任意一种或多种:所述变体;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
本申请的另一个目的是提供用于生产L-异亮氨酸的方法。
本申请的另一个目的是提供用于生产L-异亮氨酸的组合物。
本申请的另一个目的是提供所述变体、所述编码所述变体的多核苷酸、所述包含所述多核苷酸的载体或微生物用于生产L-异亮氨酸的用途。
【有利效果】
与不表达γ-氨基丁酸通透酶变体的菌株相比,表达本申请的γ-氨基丁酸通透酶变体的微生物可显著提高L-异亮氨酸的纯度,因此可通过使用所述微生物有效地生产L-异亮氨酸。因此,所述微生物有望广泛用于采用L-异亮氨酸的行业如食品、饲料和医药行业。
具体实施方式
在下文中,将如下详细描述本申请的内容。同时,本申请中公开的方面的描述和实施方式可适用于关于共同事项的其它方面的描述和实施方式。此外,本申请中公开的各种要素的所有组合都在本申请的范围内。此外,不能认为本申请的范围受到下述详细描述的限制。
本申请的一个方面提供γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代。
在所述变体中,SEQ ID NO:1的氨基酸序列中第212个氨基酸可被苏氨酸取代,第114个氨基酸可被苯丙氨酸取代,或第28个氨基酸可被缬氨酸取代,并且具体地,SEQ IDNO:1的氨基酸序列中相应于第212位的氨基酸(其为甘氨酸)可被苏氨酸取代,相应于第114位的氨基酸(其为异亮氨酸)可被苯丙氨酸取代,或相应于第28位的氨基酸(其为丙氨酸)可被缬氨酸取代,但是所述变体不限于此。
所述变体可由选自SEQ ID NO:3、SEQ ID NO:20和SEQ ID NO:21的任意一个或多个序列组成,但不限于此。
具体地,分别地,SEQ ID NO:1的氨基酸序列中第212个氨基酸(即甘氨酸)被苏氨酸取代的变体可由SEQ ID NO:3组成;SEQ ID NO:1的氨基酸序列中第114个氨基酸(即异亮氨酸)被苯丙氨酸取代的变体可由SEQ ID NO:20组成;以及SEQ ID NO:1的氨基酸序列中第28个氨基酸(即丙氨酸)被缬氨酸取代的变体可由SEQ ID NO:21组成,但是所述变体不限于此。
本申请的变体可以是这样一种变体,其中具有SEQ ID NO:1的氨基酸序列的γ-氨基丁酸通透酶中相应于第212位、第114位或第28位的氨基酸被不同的氨基酸取代,从而由于副产物摄取的增加而具有增强的γ-氨基丁酸通透酶的活性,但不限于此。
如本文所用,术语“L-异亮氨酸”是指化学式为HO2CCH(NH2)CH(CH3)CH2CH3的L-氨基酸,它是必需氨基酸之一,并且在结构上相应于支链氨基酸连同L-缬氨酸和L-亮氨酸。
如本文所用,“γ-氨基丁酸通透酶”是具有γ-氨基丁酸通透酶的活性的多肽或蛋白质,并且指具有α-氨基丁酸或L-缬氨酸摄取活性的蛋白质或多肽。γ-氨基丁酸通透酶可以是对L-苯丙氨酸、L-酪氨酸、L-色氨酸或L-组氨酸以及α-氨基丁酸或L-缬氨酸——它们是在L-异亮氨酸生产过程中生成的副产物——具有摄取活性的蛋白质或多肽,但不限于此。γ-氨基丁酸通透酶可与芳香族氨基酸通透酶互换使用,并且编码γ-氨基丁酸通透酶的基因可与aroP基因互换使用,并且γ-氨基丁酸通透酶可与AroP互换使用。
γ-氨基丁酸通透酶可以是包含SEQ ID NO:1的氨基酸序列的蛋白质。包含SEQ IDNO:1的氨基酸序列的蛋白质可与具有SEQ ID NO:1的氨基酸序列的蛋白质和由SEQ ID NO:1的氨基酸序列组成的蛋白质互换使用。
具体地,SEQ ID NO:1可以是由aroP基因编码的γ-氨基丁酸通透酶的氨基酸序列,而SEQ ID NO:1的氨基酸序列可从各种数据库如NCBI GenBank获得,它是一种已知的数据库,但不限于此。例如,SEQ ID NO:1的氨基酸序列可衍生自棒状杆菌(Corynebacteriumsp.),也可衍生自谷氨酸棒状杆菌(Corynebacterium glutamicum),但不限于此,并且可非限制地包括活性与SEQ ID NO:1的氨基酸序列的活性相同的序列。此外,尽管在本申请中具有γ-氨基丁酸通透酶的活性的蛋白质已被描述为包括SEQ ID NO:1的氨基酸的多肽或蛋白质,但不排除在SEQ ID NO:1的氨基酸序列之前和之后添加无意义的序列或可能天然发生的突变或其沉默突变,并且对于本领域技术人员显而易见的是,活性与包括SEQ ID NO:1的氨基酸序列的蛋白质的活性相同或相应的蛋白质相应于本申请的具有氨基丁酸通透酶活性的多肽或蛋白质。作为具体实例,本申请的具有氨基丁酸通透酶活性的多肽可以是由SEQ ID NO:1的氨基酸序列组成的多肽,或是与其具有80%、85%、90%、95%、96%、97%、98%或99%或更高同源性或同一性的氨基酸序列。显而易见的是,氨基酸序列中一些序列被缺失、修饰、取代或添加的多肽也包括在本申请的多肽的范围内,只要该氨基酸序列具有这样的同源性或同一性并表现出与该多肽的功效相应的功效即可。
在本申请中,尽管将其描述为“包括具体SEQ ID NO:的氨基酸序列的多肽或蛋白质”、“由具体SEQ ID NO:的氨基酸序列组成的多肽或蛋白质”或“具有具体SEQ ID NO:的氨基酸序列的多肽或蛋白质”,但显而易见的是,氨基酸序列中一些序列被缺失、修饰、取代、保守取代或添加的蛋白质也可用于本申请中,只要其具有与由相应SEQ ID NO:的氨基酸序列组成的多肽相同或相应的活性即可。其实例包括氨基酸序列N端和/或C端可具有不改变蛋白质功能的序列添加、天然发生的突变、其沉默突变或保守取代的情况。
在本申请中,作为用于获得氨基丁酸通透酶的方法,可应用本领域公知的各种方法。作为方法的一个实例,可通过包括密码子优化的基因合成技术和基于微生物的大量基因组信息的生物信息学方法,使用用于筛选有用酶来源的方法来获得突变体菌株,从而以高效率从经常且广泛用于酶表达的微生物获得酶,但方法不限于此。
如本文所用,术语“变异体”或“变体”是指在遗传上或非遗传上表现出一种稳定表型改变的培养物或个体,而具体地,在本申请中,这可以是具有SEQ ID NO:1的氨基酸序列的氨基丁酸通透酶的氨基酸发生突变并且其活性与野生型的活性相比有效增加的变体,但不限于此。
如本文所用,术语“变体”或“修饰多肽”是指一个或多个氨基酸与所叙述序列在保守取代和/或修饰方面不同,但蛋白质的功能或性质得以保持的蛋白质。所述变体与已鉴定的序列存在若干氨基酸取代、缺失或添加的差异。这种变体通常可通过修饰蛋白质氨基酸序列中的一个或多个氨基酸并评估修饰蛋白质的特性来鉴定。换句话说,与天然蛋白的能力相比,所述变体的能力可增加、不变或降低。此外,一些变体可包括一个或多个部分如N端前导序列或跨膜结构域已被去除的修饰多肽。其它变体可包括从成熟蛋白质的N端和/或C端去除了部分的变体。术语“变体”或“修饰多肽”可与诸如修饰、修饰蛋白质、突变体、突变蛋白、差异(divergent)和变体之类的术语互换使用,但不限于此,只要它是以突变含义使用的术语即可。
出于本申请的目的,所述变体可以是与天然野生型或未修饰蛋白质相比具有增加的活性的修饰蛋白质,但不限于此。
如本文所用,术语“保守取代”是指一种氨基酸被具有相似的结构特性和/或化学特性的另一种氨基酸取代。所述变体可具有例如一个或多个保守取代,同时仍维持至少一种生物活性。这种氨基酸取代通常可基于残基的极性、电荷、可溶性、疏水性、亲水性和/或两亲性的相似性发生。
例如,含侧链的氨基酸可分类成含带电侧链的氨基酸当中带正电的(碱性)氨基酸(包括精氨酸、赖氨酸和组氨酸)和带负电的(酸性)氨基酸(包括谷氨酸和天冬氨酸);以及含不带电侧链的氨基酸,包括甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸、脯氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺。
所述变体可包括对多肽的二级结构和特性影响最小的氨基酸的缺失或添加。例如,多肽可与蛋白质N端的信号(或前导)序列缀合,该信号(或前导)序列参与共翻译地或翻译后地蛋白质转移。多肽还可与其它序列或连接体缀合,使鉴定、纯化或合成该多肽成为可能。
本申请的变体可具有γ-氨基丁酸通透酶的活性,并且可具有增加的γ-氨基丁酸通透酶的活性,但不限于此。
本申请的具有γ-氨基丁酸通透酶的活性的变体被描述为SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代的多肽或蛋白质,但不排除在SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代的氨基酸序列之前或之后添加无意义的序列,或可能天然发生的突变,或其沉默突变,并且对于本领域技术人员显而易见的是,活性与包括SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代的氨基酸序列的蛋白质的活性相同或相应的蛋白质相应于本申请的具有γ-氨基丁酸通透酶的活性的多肽、蛋白质或变体。作为具体实例,本申请的具有γ-氨基丁酸通透酶的活性的多肽或变体可以是由SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代的氨基酸序列组成的多肽,或是由与其具有80%、85%、90%、95%、96%、97%、98%或99%或更高同源性或同一性的氨基酸序列组成多肽。显而易见的是,氨基酸序列中一些序列被缺失、修饰、取代或添加的多肽也包括在本申请的多肽的范围内,只要该氨基酸序列具有这样的同源性或同一性并表现出与该多肽的功效相应的功效即可。
如本文所用,术语“相应”或“相应的位置”是指蛋白质或多肽中所叙述位置的氨基酸残基,或与蛋白质或多肽中所叙述残基相似、相同或同源的氨基酸残基。如本文所用,术语“相应区域”总体上是指相关蛋白质或参考蛋白质中类似或相应的位置。
在本申请中,可对本申请中使用的蛋白质中的氨基酸残基位置使用具体的编号。例如,可通过将本申请的蛋白质的多肽序列与待比较的目标蛋白进行比对,对与本申请的蛋白质中的氨基酸残基位置相应的位置重新编号。
如本文所用,术语“同源性”或“同一性”是指两个给定氨基酸序列或核苷酸序列之间的关系程度,并且可表示成百分比。术语同源性和同一性常常可互换使用。
通过标准比对算法确定保守多核苷酸或多肽的序列同源性或同一性,并且可与所用程序建立的默认空位罚分联用。基本上同源或相同的序列通常能够在中度或高度严格条件下沿完整序列或全长序列的至少约50%、60%、70%、80%或90%杂交。显而易见的是,杂交还包括多核苷酸中含有通用密码子或考虑密码子简并性的密码子的多核苷酸。
任意两个多核苷酸或多肽序列是否具有同源性、相似性或同一性都可例如采用像Pearson et al.(1988)Proc.Natl.Acad.Sci.USA 85:2444中那样的默认参数和已知的计算机算法如“FASTA”程序确定。可选地,可使用EMBOSS包(EMBOSS:The European MolecularBiology Open Software Suite,Rice et al.,2000,Trends Genet.16:276-277)(5.0.0版本或更高版本)的Needleman程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来确定同源性、相似性或同一性(包括GCG程序包(Devereux,J.,et al.,Nucleic Acids Research 12:387(1984))、BLASTP、BLASTN、FASTA(Atschul,S.F.,et al.,J MOLEC BIOL 215:403(1990);Guide to Huge Computers,Martin J.Bishop,ed.,Academic Press,San Diego,1994和CARILLO et al.(1988)SIAM JApplied Math 48:1073)。例如,可利用National Center for BiotechnologyInformation的BLAST或ClustalW来确定同源性、相似性或同一性。
多核苷酸或多肽的同源性、相似性或同一性可例如通过比较序列信息来确定,例如利用GAP计算机程序如Needleman et al.(1970),J Mol Biol.48:443——例如,从Smith和Waterman,Adv.Appl.Math(1981)2:482中可知。总之,在GAP程序中,同源性、相似性或同一性可被定义为通过将相似排列的符号(即核苷酸或氨基酸)的数量除以两个序列中较短者的符号总数而获得的值。GAP程序的默认参数可包括(1)二元比较矩阵(包含同一性数值1和非同一性数值0)和Gribskov et al.(1986)Nucl.Acids Res.14:6745的加权比较矩阵(或EDNAFULL(NCBI NUC4.4的EMBOSS版)替换矩阵),如Schwartz与Dayhoff编著的Atlas OfProtein Sequence And Structure,National Biomedical Research Foundation,pp.353-358(1979)中公开的;(2)每个空位3.0的罚分和每个空位中每个符号另外0.10的罚分(或10的空位开放罚分和0.5的空位扩展罚分);和(3)末端空位无罚分。
任意两个多核苷酸或多肽序列是否具有同源性、相似性或同一性可通过在限定的严格条件下通过DNA杂交实验比较序列来确认,并且待限定的适当的杂交条件在本领域的范围内,并且可通过本领域技术人员公知的方法来确定(例如,J.Sambrook et al.,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor Laboratorypress,Cold Spring Harbor,New York,1989;F.M.Ausubel et al.,Current Protocolsin Molecular Biology,John Wiley&Sons,Inc.,New York)。
本申请的另一方面提供多核苷酸,其编码本申请的γ-氨基丁酸通透酶变体。具体地,提供多核苷酸,其编码γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代。
所述SEQ ID NO:1、γ-氨基丁酸通透酶及其变体的氨基酸序列如上所述。
在本申请中,SEQ ID NO:1的氨基酸序列可例如由包括SEQ ID NO:2的核酸序列的多核苷酸编码,而γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代,可由包括SEQ ID NO:22至SEQ ID NO:24当中任意一个核酸序列的多核苷酸编码,但不限于此。
编码所述γ-氨基丁酸通透酶变体的多核苷酸可包括SEQ ID NO:22至SEQ ID NO:24当中的任意一个核酸序列,但不限于此。
如本文所用,术语“多核苷酸”是指作为核苷酸多聚物的具有一定长度或更长的DNA或RNA链,其中核苷酸单体通过共价键以长链形式连接。在本申请中,多核苷酸可编码表现出γ-氨基丁酸通透酶的活性的多肽,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代,但不限于此。
所述多核苷酸可非限制地包括编码表现出根据本申请的γ-氨基丁酸通透酶的活性的多肽的任意多核苷酸。在本申请中,编码γ-氨基丁酸通透酶的氨基酸序列的基因是aroP基因,并且该基因可源自属于棒状杆菌的微生物,并且具体地,它可源自谷氨酸棒状杆菌,但不限于此。
具体地,编码表现出γ-氨基丁酸通透酶的活性的多肽的多核苷酸可含有编码SEQID NO:1的氨基酸序列,或SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代的氨基酸序列的核酸序列。在所述多核苷酸中,由于密码子的简并性或考虑到要表达多肽的生物体中的优选密码子,可在多肽的氨基酸序列不改变的范围内对编码区进行各种修饰。所述多核苷酸可含有例如SEQ ID NO:2的核酸序列,并且可由与其具有80%,具体是90%或更高,更具体是95%或更高、96%或更高,97%或更高、98%或更高,或者再更具体是99%或更高同源性或同一性的核酸序列组成,但不限于此。
此外,本申请的多核苷酸可通过在严格条件下与可由已知基因序列(例如,与核酸序列的全部或部分互补的序列)制备的探针杂交而非限制地包含编码SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代的氨基酸序列的任意序列。
具体地,在SEQ ID NO:1的氨基酸序列中,编码相应于第212位的氨基酸被苏氨酸取代的变体的序列可包括SEQ ID NO:22,相应于第114位的氨基酸被苯丙氨酸取代的变体可包括SEQ ID NO:23,并且编码相应于第28位的氨基酸被缬氨酸取代的变体的序列可包括SEQ ID NO:24,但是这些序列不限于此。
“严格条件”是指能够在多核苷酸之间实现特异性杂交的条件。这种条件在文献(例如,上文J.Sambrook et al.)中有具体描述。其实例包括彼此具有高同源性或同一性的多核苷酸,例如,彼此具有40%或更高,具体地90%或更多,更具体地95%或更高、96%或更高、97%或更高、98%或更高,或者再更具体地99%或更高同源性或同一性的多核苷酸彼此杂交,而彼此具有比这更低的同源性或同一性的多核苷酸彼此不杂交的条件;或以相应于60℃1×SSC,0.1%SDS,具体地60℃,0.1×SSC,0.1%SDS,以及更具体地68℃,0.1×SSC,0.1%SDS的温度和盐浓度,在常规DNA杂交的洗涤条件下进行1次,具体为2次或3次洗涤的条件。
杂交要求两个核酸具有互补序列,但是取决于杂交的严格性,可能发生核酸之间的错配。术语“互补”用于描述能够彼此杂交的核苷酸碱基之间的关系。例如,关于DNA,腺嘌呤与胸腺嘧啶互补,并且胞嘧啶与鸟嘌呤互补。因此,本申请的多核苷酸不仅可以含有基本上相似的核酸序列,也含有分离的与整个序列互补的核酸片段。
具体地,可以利用杂交条件——包括Tm值为55℃的杂交步骤和上述条件来检测彼此具有同源性或同一性的多核苷酸。Tm值可以是60℃、63℃或65℃,但不限于此,并且可以由本领域技术人员根据其目的适当调整。
用于使多核苷酸杂交的适当的严格性取决于多核苷酸的长度和互补程度,并且这些参数是本领域公知的(参见上文Sambrook et al.,9.50-9.51,11.7-11.8)。
本申请的另一方面提供包含编码本申请的γ-氨基丁酸通透酶变体的多核苷酸的载体。具体地,提供载体,其包含多核苷酸,所述多核苷酸编码γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代。
所述SEQ ID NO:1的氨基酸序列、γ-氨基丁酸通透酶、变体和多核苷酸如上所述。
如本文所用,术语“载体”是指DNA制备物(preparation),其含有编码目标多肽的多核苷酸的核酸序列,该核酸序列与合适的表达控制区(或表达控制序列)可操作地连接使得可在合适的宿主中表达目标多肽。表达控制区可包括能够起始转录的启动子、用于调控这种转录的任意操纵子序列、编码合适的mRNA核糖体结合位点的序列以及控制转录和翻译终止的序列。在载体被转化到合适的宿主细胞后,其可独立于宿主基因组进行复制或发挥作用,并且可被整合到基因组本身中。
本申请中使用的载体没有特别限制,并且可使用本领域已知的任意载体。经常使用的载体的实例包括天然或重组状态下的质粒、粘粒、病毒和噬菌体。例如,pWE15、M13、MBL3、MBL4、IXII、ASHII、APII、t10、t11、Charon4A和Charon21A等可用作噬菌体载体或粘粒载体;而pBR体系、pUC体系、pBluescript II体系、pGEM体系、pTZ体系、pCL体系、pET体系等可用作质粒载体。具体地,可使用pDCM2(韩国专利申请Laid-Open号10-2020-0136813)、pACYC177、pACYC184、pCL、pECCG117、pUC19、pBR322、pMW118和pCC1BAC载体等。
作为实例,编码目标多肽的多核苷酸可通过用于细胞内染色体插入的载体插入染色体中。多核苷酸向染色体中的插入可通过本领域已知的任意方法(例如,同源重组)进行,但不限于此。载体可进一步包括选择标记来确定是否插入了染色体。选择标记用于选择转化了载体的细胞,也就是说,用于确定是否插入了目标核酸分子,并且可使用赋予可选择表型如抗药性、营养缺陷(auxotrophy)、细胞毒剂抗性或表面多肽表达的标记。在用选择剂处理的环境下,只有表达选择标记的细胞存活或表现出其它表达性状,因此可选择转化的细胞。
在本申请中,术语“表达盒”是指包括启动子和目标基因并因此可表达与启动子可操作地连接的目标基因的单位盒。有助于目标基因有效表达的各种因素可包含在基因表达盒的内部或外部。除了与目标基因可操作地连接的启动子之外,基因表达盒通常可包括转录终止信号、核糖体结合位点和翻译终止信号,但不限于此。
在本申请中,术语“转化”是指将包含编码目标蛋白的多核苷酸的载体导入宿主细胞或微生物中,使得由该多核苷酸编码的该蛋白可在宿主细胞中表达。转化的多核苷酸可包括所有这些,无论它们是插入宿主细胞的染色体中还是位于染色体之外,只要这些能够在宿主细胞中表达即可。多核苷酸包括编码目标蛋白的DNA和RNA。多核苷酸可以任意形式导入,只要其能够导入宿主细胞并在宿主细胞中表达即可。例如,可以表达盒的形式将多核苷酸导入宿主细胞,该表达盒是包括自我表达所需的所有元件的基因构建体。表达盒通常可包括与多核苷酸可操作地连接的启动子、转录终止信号、核糖体结合位点和翻译终止信号。表达盒可以是能够自我复制的表达载体的形式。多核苷酸可以其自身的形式导入宿主细胞中,并且可操作地连接到宿主细胞中表达所必需的序列,但不限于此。
如本文所用,术语“可操作地连接”是指起始和介导本申请的编码目标多肽的多核苷酸的转录的启动子序列和基因序列在功能上彼此连接。
用于转化本申请的载体的方法包括用于将核酸导入细胞的任意方法,并且可通过根据宿主细胞选择本领域已知的合适的标准技术来进行。例如,有电穿孔法、磷酸钙(CaPO4)沉淀法、氯化钙(CaCl2)沉淀法、微注射法、聚乙二醇(PEG)法、DEAE-葡聚糖法、阳离子脂质体法和乙酸锂-DMSO法,但方法不限于此。
本申请的又一方面提供微生物,其包含下列中的任意一种或多种:γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
在一个实施方式中,本申请的微生物可以是生产L-异亮氨酸的微生物,但不限于此。具体地,本申请的微生物可以是生产作为目标产物的L-异亮氨酸的微生物,并且可以是通过包括本申请的变体、多核苷酸或载体中的任意一种或多种而具有提高的L-异亮氨酸生产能力的微生物,但不限于此。
所述SEQ ID NO:1的氨基酸序列、γ-氨基丁酸通透酶、变体、多核苷酸、载体和L-异亮氨酸如上所述。
在本申请中,术语“微生物”包括野生型微生物和天然地或人工地发生了遗传修饰的微生物,并且是包括通过诸如插入外部基因或增强或弱化内源基因的活性等原因而弱化或增强特定机制的所有微生物在内的概念。在本申请中,所述微生物可非限制地包括导入或包括下列中的一种或多种的任意微生物:γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
在本申请中,所述微生物可包括下列中的任意一种或多种:所述多肽;编码所述多肽的多核苷酸;和包含所述多核苷酸的载体。
本申请的微生物可以是通过包括下列中的任意一种或多种而具有生产目标蛋白或参与目标蛋白生产的目标产物的能力的微生物:所述多肽;编码所述多肽的多核苷酸;和包含所述多核苷酸的载体,但不限于此。所述微生物可以是具有天然生产目标蛋白或目标产物的能力的微生物,或目标蛋白或目标产物生产能力被赋予不具有目标蛋白或目标产物生产能力的亲本菌株的微生物,但不限于此。
所述微生物是用含有编码本申请的多核苷酸和目标蛋白并且表达例如目标蛋白的基因的载体转化的细胞或微生物,而针对本申请的目的,宿主细胞或微生物可以是能够生产包括目标蛋白在内的目标产物的任意微生物。
所述微生物可以是重组微生物,并且重组可通过遗传修饰如转化来完成。
如本文所用,术语“生产目标蛋白或目标产物的微生物”包括野生型微生物和天然地或人工地发生了遗传修饰的微生物,是指特定机制因诸如插入外部基因或增强或失活内源基因活性等原因弱化或增强的微生物,并且可以是含有用于生产目标蛋白或目标产物的遗传修饰的微生物。
所述微生物可以是通过所述多肽、编码所述多肽的多核苷酸和包含所述多核苷酸的载体中的任意一种或多种进行遗传修饰的微生物;经修饰以表达所述多肽或编码所述多肽的多核苷酸的微生物;表达所述多肽或编码所述多肽的多核苷酸的重组微生物;或具有所述多肽活性的重组微生物,但不限于此。
出于本申请的目的,生产目标蛋白或目标产物的微生物可以是通过包括本申请的多核苷酸而具有提高的目标蛋白或目标产物生产能力的微生物。具体地,在本申请中,生产目标蛋白或目标产物的微生物或具有目标蛋白或目标产物生产能力的微生物可以是目标蛋白或目标产物生物合成途径中的基因的一部分被增强或弱化,或目标蛋白或目标产物降解途径中的基因的一部分被增强或弱化的微生物。
本申请的微生物可以是包含下列中的一种或多种的微生物:γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;编码所述变体的多核苷酸;和包含所述多核苷酸的载体,但不限于此。本申请的微生物可以是生产作为目标产物的L-异亮氨酸的微生物,并且与未修饰的或野生型微生物相比,可具有提高的L-异亮氨酸生产率或减少L-异亮氨酸生产过程中生成的副产物的量,但不限于此。
如本文所用,术语“待表达/被表达”是指目标蛋白被导入微生物或被修饰以在微生物中表达的状态。当目标蛋白是存在于微生物中的蛋白时,术语“待表达/被表达”是指与内在活性或修饰前的活性相比活性被增强的状态。
表达本申请的蛋白变体的微生物可以是经修饰以表达蛋白变体的微生物。因此,本申请的又一方面提供用于制备表达本申请的蛋白变体的微生物的方法。
在本申请中,术语“蛋白质的导入”是指微生物表现出该微生物最初不具有的特定蛋白质的活性,或者是指与内在活性或相应蛋白质修饰前的活性相比,微生物表现出提高的活性。例如,“蛋白质的导入”可指导入特定蛋白质,将编码特定蛋白质的多核苷酸导入微生物中的染色体中,或将包含编码特定蛋白质的多核苷酸的载体导入微生物中并且表现出特定蛋白质的活性。
如本文所用,术语多肽或蛋白质活性的“增强”是指多肽或蛋白质的活性与内在活性相比是增加的。增强可与诸如上调、过表达和增加等术语互换使用。这里,增加可包括表现出多肽或蛋白质最初不具有的活性,或表现出与内在活性或修饰前的活性相比提高的活性。“内在活性”是指当性状因天然或人工因素引起的遗传突变而改变时,转化前的亲本菌株或未修饰的微生物最初具有的特定多肽或蛋白质的活性。这可与“修饰前的活性”互换使用。多肽或蛋白质的活性与内在活性相比是“增强的”或“增加的”这一事实意味着,多肽或蛋白质的活性与转化前的亲本菌株或未修饰的微生物最初具有的特定多肽或蛋白质的活性相比是提高的。作为一个实例,与转化前的亲本菌株或未修饰的微生物的蛋白质活性相比,多肽或蛋白质的活性可提高至少1%、3%、5%、10%、25%、50%、75%、100%、125%、150%、200%、250%、300%、350%、400%或500%,并且至多1000%或2000%,但是多肽或蛋白质的活性的增强或增加不限于此。术语“约”是包括所有±0.5、±0.4、±0.3、±0.2、±0.1等的范围,并且包括与术语约之后的数值相等或相似的范围内的所有数值,但不限于此。
“活性增加”可通过导入外源多肽或蛋白质或增强内源多肽或蛋白质的活性来实现,但具体地,可通过增强内源多肽或蛋白质的活性来实现。多肽或蛋白质的活性是否增强,可通过相应多肽或蛋白质的活性程度或表达水平的增加或从相应蛋白质排泄的产物的量来确认。
多肽或蛋白质的活性的增强可以不受限制,只要可应用本领域公知的各种方法,并且目标多肽或蛋白质的活性与被修饰前的微生物相比能够被增强即可。方法不限于此,而是可使用本领域技术人员公知的基因工程和/或蛋白质工程,它们是分子生物学的常规方法(Sitnicka et al.Functional Analysis of Genes.Advances in CellBiology.2010,Vol.2.1-16,Sambrook et al.Molecular Cloning 2012,etc.)。
使用基因工程增强多肽或蛋白质的活性的方法可通过例如下列来执行:
1)编码所述多肽或蛋白质的基因或多核苷酸的细胞内拷贝数的增加,
2)染色体上编码所述多肽或蛋白质的基因表达控制区被表现出强活性的序列替换的方法,
3)所述多肽或蛋白质的起始密码子或5′-UTR区的核酸序列被修饰的方法,
4)染色体上的多核苷酸序列被修饰以增加所述多肽或蛋白质活性的方法,
5)导入表现出所述多肽或蛋白质活性的外源多核苷酸或所述多核苷酸的密码子优化的修饰多核苷酸,或
6)这些方法的组合,但不限于此。
采用蛋白质工程增强多肽或蛋白质的活性的方法可通过例如分析所述多肽或蛋白质的三级结构以选择暴露位点并且修饰或化学修饰暴露位点的方法来进行,但不限于此。
1)编码所述多肽或蛋白质的基因或多核苷酸的细胞内拷贝数的增加可通过本领域已知的任意方法实现,例如,通过将能够独立于宿主复制和发挥功能的载体导入宿主细胞中,编码相应多肽或蛋白质的基因或多核苷酸可操作地连接至所述载体。可选地,1)所述增加可通过将能够将所述基因或多核苷酸插入所述宿主细胞的染色体中的载体导入所述宿主细胞来实现,所述基因可操作地连接至所述载体,但不限于此。所述载体如上所述。
2)染色体上编码所述多肽或蛋白质的基因表达控制区(表达控制序列)被表现出强活性的序列替换的方法可通过本领域已知的任意方法进行,例如,通过核酸序列的缺失、插入、非保守或保守取代或其组合来引发所述序列中的突变以进一步增强表达控制区的活性,或通过用表现出强得多的活性的核酸序列替换所述表达控制区。所述表达控制区可包括但不特别限于启动子、操纵子序列、编码核糖体结合位点的序列、控制转录和翻译终止的序列等。所述方法可具体地连接强异源启动子而不是天然启动子,但不限于此。
已知的强启动子的实例包括但不限于cj1至cj7启动子(美国专利号7662943B2)、lac启动子、trp启动子、trc启动子、tac启动子、λ噬菌体PR启动子、PL启动子、tet启动子、gapA启动子、SPL7启动子、SPL13(sm3)启动子(美国专利号10584338B2)、O2启动子(美国专利号10273491B2)、tkt启动子和yccA启动子。
3)所述多肽或蛋白质的起始密码子或5′-UTR区的核酸序列被修饰的方法可以是本领域已知的任意方法,例如,可用相比于内源起始密码子,所述多肽或蛋白质的表达水平更高的另一起始密码子替换所述多肽或蛋白质的内源起始密码子,但不限于此。
4)染色体上的多核苷酸序列被修饰以增加所述多肽或蛋白质活性的方法可通过本领域已知的任意方法进行,例如,通过核酸序列的缺失、插入、非保守或保守取代或其组合来引发表达控制序列中的突变以进一步增强所述多核苷酸序列的活性,或通过用经改进以表现出强得多的活性的多核苷酸序列替换所述多核苷酸序列。所述替换可具体地是通过同源重组将基因插入染色体中,但不限于此。
在这种情况下使用的载体可进一步包括用于确认染色体是否被插入的选择标记。选择标记如上所述。
5)表现出所述多肽或蛋白质活性的外源多核苷酸的导入可通过本领域已知的任意方法实现,例如,通过将编码表现出的活性与所述多肽或蛋白质的活性相同/相似的多肽或蛋白质的外源多核苷酸或其密码子优化的修饰多核苷酸导入宿主细胞中。作为所述外源多核苷酸,任意外源多核苷酸都可在来源或序列方面不受限制地使用,只要它表现出的活性与所述多肽或蛋白质的活性相同/相似即可。可将所述外源多核苷酸的优化的密码子导入宿主细胞中,使得导入的外源多核苷酸的优化的转录和翻译在宿主细胞中进行。所述导入可通过本领域技术人员适当地选择已知的转化方法来进行,并且生产多肽或蛋白质,而其活性可随着导入的多核苷酸在宿主细胞中表达而增加。
最后,6)这些方法的组合可通过将方法1)至5)中的任意一种或多种一起应用来进行。
多肽或蛋白质活性的这种增强可以是基于野生型微生物菌株或被修饰前的微生物菌株中表达的多肽或蛋白质在活性或浓度,相应多肽或蛋白质的活性或浓度的增加,或是由相应多肽或蛋白质生产的产物的量的增加,但不限于此。
如本文所用,术语“被修饰前的菌株”或“被修饰前的微生物”不排除含有可能天然发生在微生物中的突变的菌株,并且可指野生型菌株或天然菌株本身,或性状由于天然或人工因素而被遗传突变改变前的菌株。“被修饰前的菌株”或“被修饰前的微生物”可与“未突变菌株”、“未修饰菌株”、“未突变微生物”、“未修饰微生物”或“参考微生物”互换使用。
在一个实施方式中,本申请的微生物可属于棒状杆菌,但不限于此。
本申请的“属于棒状杆菌的微生物”可包括属于棒状杆菌的所有微生物。所述属于棒状杆菌的微生物可具体地是谷氨酸棒状杆菌、克氏棒状杆菌(Corynebacteriumcrudilactis)、沙漠棒状杆菌(Corynebacterium deserti)、有效棒状杆菌(Corynebacterium efficiens)、石南棒状杆菌(Corynebacterium callunae)、停滞棒状杆菌(Corynebacterium stationis)、单一棒状杆菌(Corynebacterium singulare)、耐盐棒状杆菌(Corynebacterium halotolerans)、纹带棒状杆菌(Corynebacterium striatum)、产氨棒状杆菌(Corynebacterium ammoniagenes)、污染棒状杆菌(Corynebacteriumpollutisoli)、模拟棒状杆菌(Corynebacterium imitans)、睾丸棒状杆菌(Corynebacterium testudinoris)或微黄棒状杆菌(Corynebacterium flavescens),更具体地是谷氨酸棒状杆菌、石南棒状杆菌、钝齿棒状杆菌(Corynebacterium crenatum)或沙漠棒状杆菌。
在本申请中,微生物的亲本菌株可以是L-异亮氨酸的生物合成途径被另外地增强以增加L-异亮氨酸的产量的微生物,但不限于此。
具体地,为了增强L-异亮氨酸的生物合成途径,所述微生物可以是例如这样的微生物:其中aroP启动子被gapA启动子取代以增强该启动子的功能;向编码高丝氨酸脱氢酶的hom基因中另外导入遗传突变(R407H)以解除(resolve)对异亮氨酸的前体即苏氨酸的反馈抑制(韩国注册专利号10-1996769);导入编码L-苏氨酸脱水酶的ilvA基因的遗传突变(T381A,F383A)(韩国专利申请号10-2020-0078669);或另外向编码天冬氨酸激酶的lysC基因导入遗传突变(L377K)(美国注册公开号10662450B2)。然而,所述微生物不限于上述,并且可通过本领域已知的基因表达控制方法增加L-异亮氨酸的产量。
作为提高L-异亮氨酸产量的另一个实例,在本申请中,所述微生物的亲本菌株可以是另外地使弱化L-异亮氨酸生物合成途径的基因失活以提高L-异亮氨酸产量的微生物,但不限于此。
如本文所用,术语多肽或蛋白质的“失活”或“弱化”是包括与内在活性相比活性降低或无活性的概念。所述失活或弱化可与诸如下调、降低和减少等术语互换使用。所述失活或弱化还可包括:由于编码蛋白质的基因的突变等,与天然微生物所具有的蛋白质的活性相比,蛋白质本身的活性降低或消除的情况;由于对编码其的基因的表达抑制或翻译抑制,细胞中总蛋白质活性程度低于天然菌株的总蛋白质活性程度的情况;基因的表达完全不发生的情况;以及基因尽管表达但不表现出活性的情况。“内在活性”是指当性状因天然或人工因素引起的遗传突变而改变时,被转化前的亲本菌株或未修饰的微生物最初所具有的特定多肽或蛋白质的活性。这可与“修饰前的活性”互换使用。与内在活性相比,多肽或蛋白质的活性“降低”的事实意味着与被转化前的亲本菌株或未修饰的微生物最初具有的特定多肽或蛋白质的活性相比,活性降低。
这种蛋白质的失活或活性的弱化可通过应用本领域公知的各种方法来实现,但不限于此(Nakashima N.et al.,Bacterial cellular engineering by genome editingand gene silencing.Int J Mol Sci.2014;15(2):2773-2793,Sambrook etal.Molecular Cloning 2012,etc.)。
这些方法的实例包括,
1)编码所述蛋白质的基因的全部或部分被缺失的方法;
2)修饰表达控制区(或表达控制序列)以降低编码所述蛋白质的基因的表达;
3)修饰编码所述蛋白质的基因序列使得所述蛋白质的活性被消除或弱化;
4)导入与编码所述蛋白质的基因的转录物互补结合的反义寡核苷酸(例如,反义RNA);
5)通过向编码所述蛋白质的基因的Shine-Dalgarno序列的前端添加与Shine-Dalgarno序列互补的序列来形成二级结构以使核糖体不可能附着的方法;和
6)添加沿与编码所述蛋白质的基因的多核苷酸序列的开放阅读框(ORF)的3’端相反的方向转录的启动子(逆转录工程,RTE),并且蛋白质的失活或活性的弱化也可通过其组合来实现的方法,但不限于此。
具体地,编码所述蛋白质的基因的全部或部分被缺失的方法可通过用一些核苷酸序列通过用于在微生物中插入染色体的载体而缺失的多核苷酸或标记基因替换染色体中编码内源目标蛋白质的多核苷酸来进行。作为此类多核苷酸的部分或全部被缺失的方法的实例,可使用经由同源重组缺失多核苷酸的方法,所述方法不限于此。
基因的全部或部分被缺失的方法可通过使用光如紫外线或化学物质引发突变并从获得的突变体中选择缺乏目标基因的菌株来进行。基因缺失法包括通过DNA重组技术的方法。在DNA重组技术中,基因缺失可通过例如将含有与目标基因同源的核酸序列的核酸序列或载体注射到微生物中以引起同源重组来实现。注射的核酸序列或载体可包括显性选择标记,但不限于此。
修饰表达控制序列的方法可通过应用本领域公知的各种方法来进行。作为一个实例,所述方法可通过经多核苷酸序列的缺失、插入、非保守或保守取代或其组合来引发表达控制区(或表达控制序列)中的突变使得表达控制区(或表达控制序列)的活性进一步弱化,或通过用表现出弱得多的活性的多核苷酸序列替换所述多核苷酸序列来进行。所述表达控制区包括启动子、操纵子序列、编码核糖体结合位点的序列和调控转录和翻译终止的序列,但不限于此。
基因序列被修饰的方法可通过经基因序列的缺失、插入、非保守或保守取代或其组合来引发序列中的突变使得多肽的活性被进一步弱化,或通过用经改善以表现出弱得多的活性的基因序列或经改善以不表现出活性的基因序列来替换所述基因序列来进行,但不限于此。
例如,可通过将突变导入基因序列中以形成终止密码子来抑制或弱化所述基因的表达。
本申请的另一方面提供用于生产L-异亮氨酸的方法。具体地,所述方法提供这样的方法,其包括在培养基中培养包含下列中的一种或多种的微生物:γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
本申请的另一方面提供用于减少在L-异亮氨酸的生产期间生成的副产物的量的方法。具体地,所述方法提供这样的方法,其包括在培养基中培养包含下列中的一种或多种的微生物:γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
所述L-异亮氨酸、SEQ ID NO:1的氨基酸、γ-氨基丁酸通透酶、变体、多核苷酸、载体和微生物如上所述。
所述微生物可以属于棒状杆菌,具体是谷氨酸棒状杆菌,但不限于此。此内容如上所述。
在本申请中,术语“培养”是指使所述微生物在受适当控制的环境条件下生长。本申请的培养方法可根据本领域已知的合适的培养基和培养条件进行。本领域技术人员可根据所选菌株容易地调节和使用这种培养方法。具体地,所述培养可以是分批培养、连续培养和补料分批培养,但不限于此。
如本文所用,术语“培养基”是指混合了用于培养所述微生物所必需的营养物作为主要成分,并提供生存和发育所必需的营养物和生长因子(包括水)的材料。具体地,作为用于培养本申请的微生物的培养基和其它培养条件,可无特别限制地使用任意培养基,只要它是常规用于培养微生物的培养基即可。本申请的微生物可在有氧条件下于含有适当的碳源、氮源、磷源、无机化合物、氨基酸和/或维生素等的常规培养基中,同时控制温度、pH等进行培养。
在本申请中,碳源可包括碳水化合物,如葡萄糖、蔗糖(saccharose)、乳糖、果糖、蔗糖(sucrose)和麦芽糖;糖醇,如甘露醇和山梨糖醇;有机酸,如丙酮酸、乳酸和柠檬酸;以及氨基酸,如谷氨酸、甲硫氨酸和赖氨酸。可使用天然有机营养物,如淀粉水解物、糖蜜、赤糖糊、米糠、木薯、甘蔗废料和玉米浆。具体地,可使用碳水化合物如葡萄糖和灭菌的预处理糖蜜(即,转化为还原糖的糖蜜)。可以不受限制地以各种方式使用适当量的其它碳源。这些碳源可单独使用或以其两种或更多种的组合使用,但是碳源不限于此。
作为氮源,可以使用无机氮源,诸如氨、硫酸铵、氯化铵、醋酸铵、磷酸铵、碳酸铵和硝酸铵;和有机氮源,诸如氨基酸(如谷氨酸、甲硫氨酸和谷氨酰胺)、蛋白胨、NZ-胺、肉提取物、酵母提取物、麦芽提取物、玉米浆、酪蛋白水解物、鱼或其分解产物和脱脂豆饼或其分解产物。这些氮源可单独使用或以两种或更多种的组合使用,但是氮源不限于此。
磷源可包括磷酸二氢钾、磷酸氢钾或与其相应的含钠盐。作为无机化合物,可使用氯化钠、氯化钙、氯化铁、硫酸镁、硫酸铁、硫酸锰、碳酸钙等,而无机化合物除了这些之外还可包括氨基酸、维生素和/或合适的前体。这些组分或前体可分批或连续加入培养基中。然而,培养基不限于此。
在所述微生物的培养过程中,可以适当的方式向培养基中加入氢氧化铵、氢氧化钾、氨、磷酸和硫酸等化合物以调节培养基的pH值。在培养过程中,可使用消泡剂如脂肪酸聚乙二醇酯来抑制泡形成。可将氧气或含氧气体注入培养基中以维持培养基的需氧状态,也可注入氮气、氢气或二氧化碳气体或者可以不注射气体以维持厌氧和微需氧状态,但条件不限于此。
所述培养基的温度可以是20℃至50℃,具体是30℃至37℃,但不限于此。所述培养可连续进行,直到获得所需生产量的有用物质,而培养周期可具体为10小时至100小时,但不限于此。
具体地,用于棒状杆菌菌株的培养基可在文献(“普通细菌学方法手册(Manual ofMethods for General Bacteriology)”(Washington D.C.,USA,1981))中找到,但不限于此。
在一个实施方式中,所述用于生产L-异亮氨酸的方法、用于制备L-异亮氨酸的方法或用于减少L-异亮氨酸生产过程中生成的副产物的量的方法可进一步包括从培养基或微生物中回收L-异亮氨酸,但不限于此。
用于回收L-异亮氨酸的方法可以是根据本申请的用于培养微生物的方法,例如,分批、连续或补料分批培养方法,使用本领域已知的合适方法收集所需的L-异亮氨酸。例如,离心、过滤、用结晶的蛋白质沉淀剂处理(盐析法)、萃取、超声破碎、超滤、透析、各种类型的色谱法如分子筛色谱法(凝胶过滤)、吸附层析、离子交换层析、亲和层析和HPLC,以及这些方法的组合都可以使用,并且可使用本领域已知的任意合适的方法从培养基或微生物中回收所需的L-异亮氨酸。
生产方法可以包括另外的纯化过程。在纯化过程中,可使用本领域已知的任意合适的方法纯化回收的L-异亮氨酸。回收的L-异亮氨酸可以是纯化形式或含有所需产物的微生物发酵液(Introduction to Biotechnology and Genetic Engineering,A.J.Nair,2008)。
在一个实施方式中,所述用于生产L-异亮氨酸的方法或用于制备L-异亮氨酸的方法可以用于减少L-异亮氨酸生产过程中生成的副产物的量,但不限于此。
在本申请中,术语“副产物”包括在L-异亮氨酸生产期间可能生成的所有物质。副产物可以是选自α-氨基丁酸(AABA)或精氨酸(Arg,R)、组氨酸(His,H)、谷氨酸(Glu,E)、天冬氨酸(Asp,D)、甘氨酸(Gly,G)、丙氨酸(Ala,A)、缬氨酸(Val,V)、亮氨酸(Leu,L)、甲硫氨酸(Met,M)、苯丙氨酸(Phe,F)、色氨酸(Trp,W)、脯氨酸(Pro,P)、丝氨酸(Ser,S)、半胱氨酸(Cys,C)、酪氨酸(Tyr,Y)中的任意一种或多种。出于本申请的目的,副产物可以是选自由α-氨基丁酸(AABA)、缬氨酸、苯丙氨酸和亮氨酸中的任意一种或多种,可具体地是α-氨基丁酸或缬氨酸,但不限于此。
本申请的另一方面提供用于生产L-异亮氨酸的组合物。具体地,所述组合物提供微生物或所述微生物的培养物,其包含下列中的一种或多种:γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
所述SEQ ID NO:1的氨基酸、γ-氨基丁酸通透酶、变体、多核苷酸、载体、微生物和培养物如上所述。
所述用于生产L-异亮氨酸的组合物可指通过本申请的γ-氨基丁酸通透酶变体可由其高效生产L-异亮氨酸的组合物。所述组合物可非限制地包括所述γ-氨基丁酸通透酶变体或能够操作所述γ-氨基丁酸通透酶变体的配置。所述γ-氨基丁酸通透酶变体可以是被包括在载体中使得可操作地连接的基因可在导入的宿主细胞中表达的形式。
所述组合物还可包括冷冻保护剂或赋形剂。所述冷冻保护剂或赋形剂可以是非天然存在的物质或天然存在的物质,但不限于此。在另一个实施方式中,所述冷冻保护剂或赋形剂可以是菌株并非天然接触的物质,也可以是并非同时与菌株一起天然地被包括的物质,但不限于此。
本申请的另一方面提供γ-氨基丁酸通透酶变体或微生物用于生产L-异亮氨酸的用途,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;所述微生物包含所述变体、编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
所述变体、多核苷酸、载体、微生物和异亮氨酸如上所述。
[实施发明的形式]
在下文中,将参考实施例更详细地描述本申请。然而,这些实施例和实验实施例是为了说明本申请,而本申请的范围不限于这些实施例和实验实施例。
参考实施例1:aroP基因过表达载体的构建
根据本申请的目的,为了更清楚地证实由编码γ-氨基丁酸通透酶的aroP基因及其变体引起的转化,使aroP基因在谷氨酸棒状杆菌ATCC13032菌株中过表达。
为了过表达编码γ-氨基丁酸通透酶的aroP基因,构建这样一种质粒载体:其中通过用gapA启动子替换aroP基因启动子来增强aroP启动子。
为了构建aroP启动子被gapA启动子取代的菌株,使用ATCC13032染色体作为模板以及SEQ ID NO:4与SEQ ID NO:5、SEQ ID NO:6与SEQ ID NO:7或SEQ ID NO:8与SEQ IDNO:9的引物进行PCR。用于进行这些PCR中每一项的引物如下表1中呈现。
[表1]
采用PfuUltraTM高保真DNA聚合酶(Stratagene)作为PCR反应的聚合酶,其中PCR条件为95℃变性30秒;55℃退火30秒;和72℃聚合1分钟,并且在这些条件下的变性、退火和聚合重复28次。结果,分别获得关于gapA启动子部分和aroP基因起始密码子,在5’上游区的1,000bp DNA片段和在3’下游区的1,392bp DNA片段。再用这三个扩增的DNA片段作为模板并用SEQ ID NO:4和SEQ ID NO:9的引物进行PCR。作为PCR条件,95℃变性5分钟,然后重复6次95℃变性30秒;退火,和72℃聚合2分钟,然后重复20次95℃变性30秒;55℃退火30秒;和72℃聚合2分钟,然后72℃聚合5分钟。结果,扩增了包含gapA启动子的编码aroP基因的2.4kbDNA片段。使用QUIAGEN的PCR纯化试剂盒纯化扩增产物,并将其用作载体构建的插入DNA片段。
同时,将通过上述PCR扩增的插入DNA片段与用限制酶SmaI消化然后在65℃下热处理20分钟的pDCM2载体以1:2摩尔比(M)混合,并根据所提供的制造商手册使用TaKaRa的infusion克隆试剂盒(TaKaRa’s infusion cloning kit)将插入DNA片段克隆到pDCM2载体中,从而构建用gapA启动子取代aroP启动子的待导入染色体的载体pDCM2-PgapA-aroP。
参考实施例2:生产L-异亮氨酸的菌株的制备
野生型谷氨酸棒状杆菌具有生产L-异亮氨酸的能力,但不会过量生产L-异亮氨酸。因此,根据本申请的目的,为了证实提高L-异亮氨酸生产能力的遗传性状,采用具有提高的L-异亮氨酸生产能力的菌株。
首先,从野生型谷氨酸棒状杆菌ATCC13032中开发生产L-异亮氨酸的菌株。具体地,为了解除对L-异亮氨酸生物合成途径中异亮氨酸的前体即苏氨酸的反馈抑制,通过突变编码高丝氨酸脱氢酶的hom基因,用组氨酸取代高丝氨酸脱氢酶的第407个氨基酸即精氨酸(韩国注册专利号10-1996769)。具体地,编码hom(R407H)的多核苷酸序列示于SEQ IDNO:10中。
具体地,为了制备导入hom(R407H)突变的菌株,使用谷氨酸棒状杆菌ATCC13032的染色体作为模板和分别为SEQ ID NO:11和SEQ ID NO:12或SEQ ID NO:13和SEQ ID NO:14的引物进行PCR。用于进行这些PCR中的每一项的引物序如下表2中呈现。
[表2]
采用PfuUltraTM高保真DNA聚合酶(Stratagene)作为PCR反应的聚合酶,PCR条件为95℃变性30秒;55℃退火30秒;和72℃聚合1分钟,并且在这些条件下的变性、退火和聚合重复28次。结果,分别获得关于hom基因突变,在5’上游区的1,000bp DNA片段和在3’下游区的1,000bp DNA片段。
用这两个扩增的DNA片段作为模板和SEQ ID NO:11和SEQ ID NO:14的引物进行PCR。作为PCR条件,95℃变性5分钟,然后重复28次95℃变性30秒;55℃退火30秒;和72℃聚合2分钟,然后72℃进行聚合5分钟。
结果,扩增了2kb DNA片段,其含有编码高丝氨酸脱氢酶变体的hom基因的突变,其中第407个精氨酸被组氨酸取代。使用PCR纯化试剂盒(QUIAGEN)纯化扩增产物,并将其用作载体构建的插入DNA片段。将65℃下热处理20分钟的pDCM2载体(韩国专利申请公开号10-2020-0136813)和纯化的扩增产物两者均用限制酶SmaI消化并且摩尔比(M)为1:2,并根据所提供的制造商手册使用TaKaRa的infusion克隆试剂盒将纯化的扩增产物克隆到pDCM2载体中,从而构建用于将hom(R407H)突变导入染色体的载体pDCM2-R407H。
经由电穿孔将构建的载体转化到谷氨酸棒状杆菌ATCC13032中,之后进行二次交换过程(secondary crossover process),得到染色体上含有hom(R407H)突变的菌株,命名为谷氨酸棒状杆菌ATCC13032 hom(R407H)。
为了释放反馈并增加所制备的ATCC13032 hom(R407H)菌株关于L-异亮氨酸的活性,通过突变编码L-苏氨酸脱水酶的基因即ilvA,用丙氨酸取代L-苏氨酸脱水酶的第381个氨基酸即苏氨酸(SEQ ID NO:25);并且用丙氨酸取代L-苏氨酸脱水酶的第383个氨基酸即苯丙氨酸。具体地,制备导入了ilvA(T381A,F383A)的菌株,编码ilvA(T381A,F383A)的多核苷酸由SEQ ID NO:15表示。
具体地,为了制备导入了ilvA(T381A,F383A)突变的菌株,使用谷氨酸棒状杆菌ATCC13032的染色体作为模板和SEQ ID NO:16和SEQ ID NO:17或SEQ ID NO:18和SEQ IDNO:19的引物进行PCR。用于进行这些PCR中每一项的引物序列如下表3呈现。
[表3]
采用PfuUltraTM高保真DNA聚合酶(Stratagene)作为PCR反应的聚合酶,PCR条件为95℃变性30秒;55℃退火30秒;和72℃聚合1分钟,并且在这些条件下的变性、退火和聚合重复28次。结果,分别获得关于ilvA基因的突变,在5’上游区的1,126bp DNA片段和在3’下游区的286bp DNA片段。
用这两个扩增的DNA片段作为模板和SEQ ID NO:16和SEQ ID NO:19的引物进行PCR。作为PCR条件,95℃变性5分钟,然后重复28次95℃变性30秒;55℃退火30秒;和72℃聚合2分钟,然后72℃进行聚合5分钟。
结果,扩增了1.4kb DNA片段,其含有编码L-苏氨酸脱水酶变体的ilvA基因的突变,其中第381个苏氨酸被丙氨酸取代并且第383个苯丙氨酸被丙氨酸取代。使用PCR纯化试剂盒(QUIAGEN)纯化扩增产物,并将其用作载体构建的插入DNA片段。将65℃下热处理20分钟的pDCM2载体(韩国专利申请公开号10-2020-0136813)和纯化的扩增产物两者均用限制酶SmaI消化并且摩尔比(M)为1:2,并根据所提供的制造商手册使用TaKaRa的infusion克隆试剂盒将纯化的扩增产物克隆到pDCM2载体中,从而构建用于将ilvA(T381A,F383A)突变导入染色体的载体pDCM2-ilvA(T381A,F383A)。
经由电穿孔将构建的载体转化到谷氨酸棒状杆菌ATCC13032 hom(R407H)中,之后进行二次交换过程,得到染色体上含有ilvA(T381A,F383A)突变的菌株,命名为谷氨酸棒状杆菌CA10-3101。
截至2020年5月27日,菌株CA10-3101已在布达佩斯条约下的国际保藏机构——韩国微生物保藏中心(Korean Culture Center of Microorganisms,KCCM)进行国际保藏,并且给予的保藏号为KCCM12739P。
为了进行参考,为证实向L-异亮氨酸生产菌株中导入ilvA(T381A,F383A)是否会释放反馈并增加关于L-异亮氨酸的活性从而提高L-异亮氨酸的生产效率,进行以下实验。具体地,测量L-异亮氨酸和L-苏氨酸在KCCM11248P/pECCG117-ilvA(T381A,F383A)菌株培养物——其中ilvA(T381A,F383A)突变通过电脉冲法被导入KCJI-38(KCCM11248P,韩国注册专利号10-1335789)菌株中,该菌株是经NTG(N-甲基-N′-硝基-N-亚硝基胍)处理的L-异亮氨酸生产菌——中的浓度,并且结果呈现在下表4中。
[表4]
菌株名称 | L-异亮氨酸(g/L) | L-苏氨酸(g/L) |
KCCM11248P | 1.5 | 0.5 |
KCCM11248P/pECCG117-ilvA(F383A) | 2.8 | 0.6 |
KCCM11248P/pECCG117-ilvA(T381A,F383A) | 4.0 | 0.0 |
如表4中呈现的,已证实与KCCM11248P或KCCM11248P/pECCG117-ilvA(F383A)菌株相比,在导入ilvA(T381A,F383A)突变的KCCM11248P/pECCG117-ilvA(T381A,F383A)菌株中,L-异亮氨酸的产量显著增加且L-苏氨酸的降解速率更高。换句话说,出于本申请的目的,证实ilvA(T381A,F383A)突变的导入释放反馈并增加关于L-异亮氨酸的活性。
实施例1:过表达aroP基因的L-异亮氨酸生产菌株的制备和aroP对L-异亮氨酸发酵纯度的影响的证实
为了证实在L-异亮氨酸生产过程中aroP过表达或突变是否会减少副产物的量并提高L-异亮氨酸的纯度,对aroP基因进行增强。为此,以参考实施例2中制备的L-异亮氨酸生产菌株CA10-3101为目标。具体地,经由电穿孔将参考实施例1中构建的载体转化到谷氨酸棒状杆菌CA10-3101中,之后进行二次交换过程以获得aroP启动子在染色体上被增强的菌株,并且此菌株被命名为谷氨酸棒状杆菌CA10-3117。将亲本菌株(CA10-3101)和aroP增强菌株(CA10-3117)分别接种到含有25mL异亮氨酸生产培养基的250mL角挡板烧瓶(corner-baffle flasks)中,然后在32℃下以200rpm振荡培养60小时来制备L-异亮氨酸。本实施例中使用的生产培养基的组成如下。
<生产培养基>
葡萄糖:10%,酵母提取物:0.2%,硫酸铵:1.6%,磷酸二氢钾:0.1%,七水硫酸镁:0.1%,七水硫酸铁:10mg/L,一水硫酸锰:10mg/L,生物素:200μg/L,且pH:7.2
培养完成后,使用高效液相色谱法(HPLC)测量L-异亮氨酸和副产物的产量,并且L-异亮氨酸和副产物在进行实验的每个菌株的培养物中的浓度呈现在下表5中。
[表5]
结果,如表5中呈现的,亲本菌株谷氨酸棒状杆菌CA10-3101生产浓度为2.5g/L的L-异亮氨酸,并且分别检测到0.9g/L和1.4g/L的主要副产物α-丁酮酸(α-ketobutyrate,AABA)和L-缬氨酸,但本实施例中制备的谷氨酸棒状杆菌CA10-3117——一种谷氨酸棒状杆菌aroP增强菌株——生产浓度为2.7g/L的L-异亮氨酸,因此证实表现出的L-异亮氨酸生产率与亲本菌株相比提高108%。此外,分别检测到0.4g/L和1.1g/L的副产物α-丁酮酸和缬氨酸,因此证实由本实施例中制备的菌株生产的副产物α-丁酮酸和缬氨酸的量与由亲本菌株生产的副产物α-丁酮酸和缬氨酸的量相比分别减少55%和21%。
基于以上结果,证实aroP基因能够通过减少L-异亮氨酸的副产物的量和提高L-异亮氨酸的生产率而成为用于提高L-异亮氨酸发酵纯度的目标。因此,利用随机诱变法进一步改进aroP并开发出优异的aroP变体。
实施例2:修饰的aroP文库载体的构建
基于参考实施例1中构建的载体,制备aroP修饰文库。为此,使用易错PCR试剂盒(ClontechPCR随机诱变试剂盒)制备文库,并在可能发生突变的条件下使用SEQID NO:8和SEQ ID NO:9作为引物进行PCR反应。
具体地,在每1,000bp可能发生0至3个突变的条件下进行PCR反应,使得在94℃预热30秒后,重复25次94℃30秒,68℃1分钟和30秒的过程。此时,使用大引物(megaprimer)(500ng至125ng)使获得的产物重复经历25次95℃50秒,60℃50秒,68℃12分钟的过程,然后用DpnI处理,转化到大肠杆菌DH5α中,并铺涂在含卡那霉素(25mg/L)的LB固体培养基上。选择20个转化菌落后获得质粒,并分析多核苷酸序列,结果证实突变以2个突变/kb的频率被导入不同的位置。取约20,000个转化的大肠杆菌菌落并提取质粒,命名为pTOPO-aroP-文库。
实施例3:导入aroP文库的L-异亮氨酸生产菌株的制备
将实施例2中制备的pTOPO-aroP-文库通过电穿孔转化到谷氨酸棒状杆菌CA10-3101中,然后铺涂在含25mg/L卡那霉素的营养培养基上以取得插入了突变体基因的菌株菌落为5,000个,并将这些菌落中的每一个命名为从CA10-3101/pTOPO-aroPm1到CA10-3101/pTOPO-aroPm 5000。
为了在所取得的5,000个菌落当中鉴定出L-异亮氨酸生产率提高和副产物量降低的菌落,如下评估每个菌落的发酵效力。将亲本菌株和突变体菌株分别接种到含25mL异亮氨酸生产培养基的250mL角挡板烧瓶中,然后在32℃下以200rpm振荡培养60小时以制备L-异亮氨酸。本实施例中使用的生产培养基的组成如下。
<生产培养基>
葡萄糖:10%,酵母提取物:0.2%,硫酸铵:1.6%,磷酸二氢钾:0.1%,七水硫酸镁:0.1%,七水硫酸铁:10mg/L,一水硫酸锰:10mg/L,生物素:200μg/L,且pH:7.2
培养结束后,使用高效液相色谱法(HPLC)测量L-异亮氨酸和L-苏氨酸的产量,并且下表6中呈现在进行实验的每个菌株的培养物中L-异亮氨酸、L-缬氨酸和AABA的浓度。
[表6]
-副产物的比率:副产物(AABA、L-缬氨酸)浓度/(异亮氨酸+副产物)浓度
结果,如表6呈现的,鉴定出三个菌株,与亲本菌株谷氨酸棒状杆菌CA10-3101相比,它们表现出L-异亮氨酸生产率的提高,并且与亲本菌株相比,生产副产物AABA和L-缬氨酸的量降低。对这三个突变体菌株进行测序,并将aroP基因与野生型ATCC13032中的进行比较,结果证实这三个突变体菌株在aroP基因中含有突变。
具体地,证实在CA10-3101/pTOPO-aroPm138菌株中,aroP的氨基酸序列中第212个氨基酸即甘氨酸被苏氨酸取代(G212T);在CA10-3101/pTOPO-aroPm2542菌株中,aroP的氨基酸序列中第114个氨基酸即异亮氨酸被苯丙氨酸取代(I114F);并且在CA10-3101/pTOPO-aroPm3798菌株中,aroP的氨基酸序列中第28个氨基酸即丙氨酸被缬氨酸取代(A28V)。基于上述结果,证实这三个突变体菌株相比于亲本菌株能以更高效率和更高得率生产L-异亮氨酸。更具体地,当导入aroP(G212T)、aroP(I114)或aroP(A28V)的各菌株与亲本菌株比较时,生产相似浓度的L-异亮氨酸,AABA浓度分别降低约33%、78%和56%,L-缬氨酸浓度分别降低约0%、42%和8%,而副产物(AABA、缬氨酸)的比率分别降低16%、44%和22%,并且证实导入aroP(G212T)、aroP(I114)或aroP(A28V)的菌株中,降低副产物的量的效果非常优异。
实施例4:导入修饰的aroP的L-异亮氨酸生产菌株的制备
将aroP(I114)变体——在实施例3中制备的三种类型的修饰aroP当中具有最高的L-异亮氨酸生产率和副产物减少率——转化到谷氨酸棒状杆菌CA10-3101中。
具体地,像参考实施例1中一样,分别用ATCC13032的染色体作为模板和SEQ IDNO:4与SEQ ID NO:5、SEQ ID NO:6与SEQ ID NO:7的引物,或用pTOPO-aroPm2542的染色体作为模板和SEQ ID NO:8与SEQ ID NO:9的引物进行PCR。采用PfuUltraTM高保真DNA聚合酶(Stratagene)作为PCR反应的聚合酶,PCR条件为95℃变性30秒;55℃退火30秒;和72℃聚合1分钟,并重复28次变性、退火和聚合。结果,分别获得关于gapA启动子部分和aroP基因起始密码子,在5’上游区的1,000bp DNA片段和在3’下游区的1,392bp DNA片段。用这三个扩增的DNA片段为模板和SEQ ID NO:4与SEQ ID NO:9的引物进行PCR。作为PCR条件,95℃变性5分钟,然后重复6次95℃变性30秒;和72℃聚合2分钟,然后重复20次95℃变性30秒;55℃退火30秒;和72℃聚合2分钟,然后72℃进行聚合5分钟。结果,扩增包含gapA启动子的编码aroP基因的2.4kb DNA片段。使用QUIAGEN的PCR纯化试剂盒纯化扩增产物并将其用作载体构建的插入DNA片段。同时,将通过上述PCR扩增的插入DNA片段与用限制酶SmaI消化并在65℃下热处理20分钟的pDCM2载体以1:2摩尔比(M)混合,并根据所提供的制造商手册使用TaKaRa的infusion克隆试剂盒将插入DNA片段克隆到pDCM2载体中,从而构建用gapA启动子取代aroP启动子的待导入染色体的载体pDCM2-PgapA-aroP(I114F)。
经由电穿孔将上述构建的载体转化到谷氨酸棒状杆菌CA10-3101中,之后进行二次交换过程以获得修饰的aroP启动子被增强的菌株,并且CA10-3101::PgapA-aroP(I114F)被命名为CA10-3118。对于生产L-异亮氨酸的亲本菌株(CA10-3101)、实施例1中制备的aroP增强菌株(CA10-3117)和本实施例中制备的导入变体aroP(I114F)的菌株(CA10-3101),如下评价每种菌株的发酵效力以证实增加L-异亮氨酸生产率和减少副产物的量的效果。将亲本菌株和这些菌株分别接种于含25mL异亮氨酸生产培养基的250mL角挡板烧瓶中,然后在32℃下以200rpm振荡培养60小时以制备L-异亮氨酸。本实施例中使用的生产培养基的组成如下。
<生产培养基>
葡萄糖:10%,酵母提取物:0.2%,硫酸铵:1.6%,磷酸二氢钾:0.1%,七水硫酸镁:0.1%,七水硫酸铁:10mg/L,一水硫酸锰:10mg/L,生物素:200μg/L,且pH:7.2
培养完成后,使用高效液相色谱法(HPLC)测量L-异亮氨酸、AABA和L-缬氨酸的浓度,而结果呈现在下表7中。
[表7]
-副产物的比率:副产物(AABA、L-缬氨酸)浓度/(异亮氨酸+副产物)浓度
如表7中呈现的,证实与亲本菌株(CA10-3101)相比,aroP增强菌株(CA10-3117)、aroP(G212T)变体导入菌株、aroP(I114F)变体导入菌株(CA10-3118)和aroP(A28V)变体导入菌株生产的L-异亮氨酸的量增加,并且副产物(即AABA和L-缬氨酸)的浓度与亲本菌株相比是降低的。
具体地,与亲本菌株和aroP增强菌株相比,aroP(G212T)导入菌株生产的L-异亮氨酸的量分别增加15%和7%;与亲本菌株相比,aroP(G212T)导入菌株生产的AABA的量减少44%;并且与亲本菌株相比,aroP(G212T)导入菌株生产的L-缬氨酸的量减少20%。
证实与亲本菌株和aroP增强菌株相比,aroP(I114F)变体导入菌株生产的AABA的量分别减少88%和50%;并且与亲本菌株和aroP增强菌株相比,aroP(I114F)变体导入菌株生产的L-缬氨酸的量分别减少42%和30%。
证实与亲本菌株和aroP增强菌株相比,aroP(A28V)导入菌株生产的L-异亮氨酸的量分别增加19%和11%;与亲本菌株相比,aroP(A28V)导入菌株生产的AABA的量减少56%;并且与亲本菌株和aroP增强菌株相比,aroP(A28V)导入菌株生产的L-缬氨酸的量分别减少25%和10%。
此外,与亲本菌株相比,aroP(G212T)变体导入菌株、aroP(I114F)变体导入菌株和aroP(A28V)变体导入菌株的副产物(AABA、L-缬氨酸)的生产量与L-异亮氨酸和副产物的生产量之比降低约29%、47%和33%,而与aroP增强菌株相比降低3%、27%和9%,从而证实aroP(G212T)、aroP(I114F)和aroP(A28V)变体导入菌株中副产物的生产量降低,而异亮氨酸生产率和纯度在这些菌株中得到显著提高。
CA10-3118菌株已在布达佩斯条约下的国际保藏机构——韩国微生物保藏中心(KCCM)进行国际保藏,并且给予的保藏号为KCCM12857P。
实施例5:由L-异亮氨酸生产菌株构建aroP增强菌株和aroP变体导入菌株
通过电脉冲法,分别将显示出L-异亮氨酸产量的增加和副产物生产量的减少的aroP增强(导入gapA启动子)和aroP变体导入KCJI-38(KCCM11248P,韩国注册专利号10-1335789)菌株中,该菌株是经NTG(N-甲基-N′-硝基-N-亚硝基胍)处理的L-异亮氨酸生产菌,然后铺涂在含25mg/L卡那霉素的选择培养基上,并将其转化,之后进行二次交换过程以获得染色体上aroP增强和aroP修饰的增强菌株。此后,以与实施例1中相同的方式测量培养物中L-异亮氨酸和副产物的浓度,而结果呈现在下表8中。
[表8]
-副产物的比率:副产物(AABA、L-缬氨酸)浓度/(异亮氨酸+副产物)浓度
如表8中呈现的,证实与亲本菌株KCCM11248P相比,导入aroP的KCCM11248PΔPn-aroP::PgapA-aroP菌株显示出L-异亮氨酸生产量的增加和副产物生产量的减少,而与KCCM11248P和KCCM11248PΔPn-aroP::PgapA-aroP菌株相比,导入aroP变体的KCCM11248PΔPn-aroP::PgapA-aroP(G212T)、KCCM11248PΔPn-aroP::PgapA-aroP(I114F)和KCCM11248PΔPn-aroP::PgapA-aroP(A28V)菌株显示出L-异亮氨酸生产量的增加。
与KCCM11248P和KCCM11248PΔPn-aroP::PgapA-aroP菌株相比,KCCM11248PΔPn-aroP::PgapA-aroP(I114F)菌株显示出AABA(即副产物)的量分别减少约57%和25%,并且L-缬氨酸的量分别减少约33%和20%;而与KCCM11248P相比,KCCM11248PΔPn-aroP::PgapA-aroP(G212T)和KCCM11248PΔPn-aroP::PgapA-aroP(A28V)菌株显示出AABA(副产物)的量减少约43%和43%,并且L-缬氨酸的量减少约8%和17%,从而表明副产物减少率显著增加。
此外,与亲本菌株相比,这些变体菌株KCCM11248PΔPn-aroP::PgapA-aroP(G212T)、KCCM11248PΔPn-aroP::PgapA-aroP(I114F)和KCCM11248PΔPn-aroP::PgapA-aroP(A28V)中每一种的副产物(AABA、L-缬氨酸)生产量与(L-异亮氨酸+副产物(AABA、L-缬氨酸)的生产量之比显示出分别降低23%、34%和2%,而与aroP增强菌株相比,降低23%、16%和2%。因此,证实aroP(G212T)、aroP(I114F)或aroP(A28V)导入菌株中的副产物生产量显著减少,同时其L-异亮氨酸生产率和纯度显著提高。
上述结果证实aroP增强菌株及其变体能够增加L-异亮氨酸的生产量。此外,由于证实aroP增强菌株及其变体能够有助于提高L-异亮氨酸生产和纯化过程中的纯度,因此证实这些变异体具有增加L-异亮氨酸产量的作用。
基于以上描述,本领域技术人员将理解,本申请可以不同的具体形式实现而不改变其技术精神或基本特征。因此,应当理解,上述实施方式不是限制性的,而是在所有方面都是说明性的。本公开的范围由所附权利要求而非由它们之前的描述来限定,因此落入权利要求的界限或这种界限的等同物内的所有改变和修改都旨在被权利要求所涵盖。
<110> CJ第一制糖株式会社
<120> 新型伽马氨基丁酸通透酶变体及使用其生产异亮氨酸的方法
<130> OPA21253
<150> KR 10-2020-0173743
<151> 2020-12-11
<160> 25
<170> KoPatentIn 3.0
<210> 1
<211> 463
<212> PRT
<213> 未知
<220>
<223> aroP
<400> 1
Met Ala Lys Ser Asn Glu Gly Leu Gly Thr Gly Leu Arg Thr Arg His
1 5 10 15
Leu Thr Met Met Gly Leu Gly Ser Ala Ile Gly Ala Gly Leu Phe Leu
20 25 30
Gly Thr Gly Val Gly Ile Arg Ala Ala Gly Pro Ala Val Leu Leu Ala
35 40 45
Tyr Ile Ile Ala Gly Ala Ile Val Val Leu Val Met Gln Met Leu Gly
50 55 60
Glu Met Ala Ala Ala Arg Pro Ala Ser Gly Ser Phe Ser Arg Tyr Gly
65 70 75 80
Glu Asp Ala Phe Gly His Trp Ala Gly Phe Ser Leu Gly Trp Leu Tyr
85 90 95
Trp Phe Met Leu Ile Met Val Met Gly Ala Glu Met Thr Gly Ala Ala
100 105 110
Ala Ile Met Gly Ala Trp Phe Gly Val Glu Pro Trp Ile Pro Ser Leu
115 120 125
Val Cys Val Val Phe Phe Ala Val Val Asn Leu Val Ala Val Arg Gly
130 135 140
Phe Gly Glu Phe Glu Tyr Trp Phe Ala Phe Ile Lys Val Ala Val Ile
145 150 155 160
Ile Ala Phe Leu Ile Ile Gly Ile Ala Leu Ile Phe Gly Trp Leu Pro
165 170 175
Gly Ser Thr Phe Val Gly Thr Ser Asn Phe Ile Gly Asp His Gly Phe
180 185 190
Met Pro Asn Gly Ile Ser Gly Val Ala Ala Gly Leu Leu Ala Val Ala
195 200 205
Phe Ala Phe Gly Gly Ile Glu Ile Val Thr Ile Ala Ala Ala Glu Ser
210 215 220
Asp Lys Pro Arg Glu Ala Ile Ser Leu Ala Val Arg Ala Val Ile Trp
225 230 235 240
Arg Ile Ser Val Phe Tyr Leu Gly Ser Val Leu Val Ile Thr Phe Leu
245 250 255
Met Pro Tyr Glu Ser Ile Asn Gly Ala Asp Thr Ala Ala Glu Ser Pro
260 265 270
Phe Thr Gln Ile Leu Ala Met Ala Asn Ile Pro Gly Thr Val Gly Phe
275 280 285
Met Glu Ala Ile Ile Val Leu Ala Leu Leu Ser Ala Phe Asn Ala Gln
290 295 300
Ile Tyr Ala Thr Ser Arg Leu Val Phe Ser Met Ala Asn Arg Gln Asp
305 310 315 320
Ala Pro Arg Val Phe Ser Lys Leu Ser Thr Ser His Val Pro Thr Asn
325 330 335
Ala Val Leu Leu Ser Met Phe Phe Ala Phe Val Ser Val Gly Leu Gln
340 345 350
Tyr Trp Asn Pro Ala Gly Leu Leu Asp Phe Leu Leu Asn Ala Val Gly
355 360 365
Gly Cys Leu Ile Val Val Trp Ala Met Ile Thr Leu Ser Gln Leu Lys
370 375 380
Leu Arg Lys Glu Leu Gln Ala Asn Asp Glu Ile Ser Thr Val Arg Met
385 390 395 400
Trp Ala His Pro Trp Leu Gly Ile Leu Thr Leu Val Leu Leu Ala Gly
405 410 415
Leu Val Ala Leu Met Leu Gly Asp Ala Ala Ser Arg Ser Gln Val Tyr
420 425 430
Ser Val Ala Ile Val Tyr Gly Phe Leu Val Leu Leu Ser Phe Val Thr
435 440 445
Val Asn Ser Pro Leu Arg Gly Gly Arg Thr Pro Ser Asp Leu Asn
450 455 460
<210> 2
<211> 1392
<212> DNA
<213> 未知
<220>
<223> aroP
<400> 2
atggctaaat ctaatgaagg gctgggaacc ggacttcgga cccgccacct cacaatgatg 60
ggactcggct ccgcaattgg tgccggactg ttcctcggca ccggcgttgg tatccgcgca 120
gccggccccg cagtgctcct ggcgtacatc atcgccggag ccatcgttgt gcttgttatg 180
caaatgctcg gcgagatggc tgctgcccgt cccgcctccg gatcgttttc acgttacggc 240
gaggatgctt tcggccactg ggctggtttc tccctcggtt ggttgtactg gttcatgctg 300
attatggtga tgggcgccga aatgactggc gctgctgcca tcatgggtgc atggttcggc 360
gtcgaaccgt ggattccttc gcttgtctgc gtggtcttct tcgctgtggt gaacctcgtc 420
gcggttcgcg gtttcggtga attcgagtac tggttcgcat tcattaaggt cgcggtgatc 480
atcgctttcc tcatcattgg tattgctctt attttcggat ggcttcccgg atccaccttt 540
gttggaacct caaacttcat cggtgatcac ggattcatgc ccaatggtat ttctggtgtt 600
gctgctggtt tgctcgcggt ggcttttgcc tttggtggca ttgaaattgt caccattgca 660
gctgcagagt ccgataagcc acgtgaagct atttccctgg cggtgcgtgc cgtgatttgg 720
cgtatttcag tcttttactt gggctctgtt ttggtcatca ctttcctcat gccttatgag 780
tcgatcaatg gtgccgacac cgctgcggaa tcccccttca cccaaatcct ggcgatggca 840
aacatccctg gcacggttgg tttcatggaa gcgatcatcg ttctagcact gctttccgct 900
ttcaacgccc aaatctatgc cacttctcgt ttggtatttt ccatggcgaa tcgacaagac 960
gctccgcgag ttttcagtaa gctcagcacc agccacgtcc ccaccaatgc ggtgctgttg 1020
tccatgttct tcgccttcgt ttcagttggt ttgcagtact ggaatccagc cggtctgctt 1080
gatttcctcc tcaacgctgt tggcggttgt ttgattgtgg tgtgggcaat gatcactttg 1140
tcacagttga aactccgcaa agaactgcaa gcaaacgatg aaatctccac ggttcgcatg 1200
tgggcgcacc catggttagg catcctcacc ttggttttgt tggcaggact cgttgctctc 1260
atgctcggcg acgcagcctc ccgcagccag gtttactcag tggcaattgt gtacggattc 1320
ttggttcttt tgtccttcgt cacagttaac agcccattgc gcggaggtcg caccccttcc 1380
gacttgaact ga 1392
<210> 3
<211> 463
<212> PRT
<213> 未知
<220>
<223> aroP
<400> 3
Met Ala Lys Ser Asn Glu Gly Leu Gly Thr Gly Leu Arg Thr Arg His
1 5 10 15
Leu Thr Met Met Gly Leu Gly Ser Ala Ile Gly Ala Gly Leu Phe Leu
20 25 30
Gly Thr Gly Val Gly Ile Arg Ala Ala Gly Pro Ala Val Leu Leu Ala
35 40 45
Tyr Ile Ile Ala Gly Ala Ile Val Val Leu Val Met Gln Met Leu Gly
50 55 60
Glu Met Ala Ala Ala Arg Pro Ala Ser Gly Ser Phe Ser Arg Tyr Gly
65 70 75 80
Glu Asp Ala Phe Gly His Trp Ala Gly Phe Ser Leu Gly Trp Leu Tyr
85 90 95
Trp Phe Met Leu Ile Met Val Met Gly Ala Glu Met Thr Gly Ala Ala
100 105 110
Ala Ile Met Gly Ala Trp Phe Gly Val Glu Pro Trp Ile Pro Ser Leu
115 120 125
Val Cys Val Val Phe Phe Ala Val Val Asn Leu Val Ala Val Arg Gly
130 135 140
Phe Gly Glu Phe Glu Tyr Trp Phe Ala Phe Ile Lys Val Ala Val Ile
145 150 155 160
Ile Ala Phe Leu Ile Ile Gly Ile Ala Leu Ile Phe Gly Trp Leu Pro
165 170 175
Gly Ser Thr Phe Val Gly Thr Ser Asn Phe Ile Gly Asp His Gly Phe
180 185 190
Met Pro Asn Gly Ile Ser Gly Val Ala Ala Gly Leu Leu Ala Val Ala
195 200 205
Phe Ala Phe Thr Gly Ile Glu Ile Val Thr Ile Ala Ala Ala Glu Ser
210 215 220
Asp Lys Pro Arg Glu Ala Ile Ser Leu Ala Val Arg Ala Val Ile Trp
225 230 235 240
Arg Ile Ser Val Phe Tyr Leu Gly Ser Val Leu Val Ile Thr Phe Leu
245 250 255
Met Pro Tyr Glu Ser Ile Asn Gly Ala Asp Thr Ala Ala Glu Ser Pro
260 265 270
Phe Thr Gln Ile Leu Ala Met Ala Asn Ile Pro Gly Thr Val Gly Phe
275 280 285
Met Glu Ala Ile Ile Val Leu Ala Leu Leu Ser Ala Phe Asn Ala Gln
290 295 300
Ile Tyr Ala Thr Ser Arg Leu Val Phe Ser Met Ala Asn Arg Gln Asp
305 310 315 320
Ala Pro Arg Val Phe Ser Lys Leu Ser Thr Ser His Val Pro Thr Asn
325 330 335
Ala Val Leu Leu Ser Met Phe Phe Ala Phe Val Ser Val Gly Leu Gln
340 345 350
Tyr Trp Asn Pro Ala Gly Leu Leu Asp Phe Leu Leu Asn Ala Val Gly
355 360 365
Gly Cys Leu Ile Val Val Trp Ala Met Ile Thr Leu Ser Gln Leu Lys
370 375 380
Leu Arg Lys Glu Leu Gln Ala Asn Asp Glu Ile Ser Thr Val Arg Met
385 390 395 400
Trp Ala His Pro Trp Leu Gly Ile Leu Thr Leu Val Leu Leu Ala Gly
405 410 415
Leu Val Ala Leu Met Leu Gly Asp Ala Ala Ser Arg Ser Gln Val Tyr
420 425 430
Ser Val Ala Ile Val Tyr Gly Phe Leu Val Leu Leu Ser Phe Val Thr
435 440 445
Val Asn Ser Pro Leu Arg Gly Gly Arg Thr Pro Ser Asp Leu Asn
450 455 460
<210> 4
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 4
aattcgagct cggtaccctt ccccctggag tccgca 36
<210> 5
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 5
ataggctcgg tcgtttttag gcttgtatca accgtaaacc ca 42
<210> 6
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 6
tgggtttacg gttgatacaa gcctaaaaac gaccgagcct at 42
<210> 7
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
ccttcattag atttagccat gtgtctcctc taaagattgt 40
<210> 8
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 8
acaatcttta gaggagacac atggctaaat ctaatgaagg 40
<210> 9
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 9
gtcgactcta gaggatcccc tcagttcaag tcggaagggg tgcga 45
<210> 10
<211> 1338
<212> DNA
<213> 未知
<220>
<223> hom
<400> 10
atgacctcag catctgcccc aagctttaac cccggcaagg gtcccggctc agcagtcgga 60
attgcccttt taggattcgg aacagtcggc actgaggtga tgcgtctgat gaccgagtac 120
ggtgatgaac ttgcgcaccg cattggtggc ccactggagg ttcgtggcat tgctgtttct 180
gatatctcaa agccacgtga aggcgttgca cctgagctgc tcactgagga cgcttttgca 240
ctcatcgagc gcgaggatgt tgacatcgtc gttgaggtta tcggcggcat tgagtaccca 300
cgtgaggtag ttctcgcagc tctgaaggcc ggcaagtctg ttgttaccgc caataaggct 360
cttgttgcag ctcactctgc tgagcttgct gatgcagcgg aagccgcaaa cgttgacctg 420
tacttcgagg ctgctgttgc aggcgcaatt ccagtggttg gcccactgcg tcgctccctg 480
gctggcgatc agatccagtc tgtgatgggc atcgttaacg gcaccaccaa cttcatcttg 540
gacgccatgg attccaccgg cgctgactat gcagattctt tggctgaggc aactcgtttg 600
ggttacgccg aagctgatcc aactgcagac gtcgaaggcc atgacgccgc atccaaggct 660
gcaattttgg catccatcgc tttccacacc cgtgttaccg cggatgatgt gtactgcgaa 720
ggtatcagca acatcagcgc tgccgacatt gaggcagcac agcaggcagg ccacaccatc 780
aagttgttgg ccatctgtga gaagttcacc aacaaggaag gaaagtcggc tatttctgct 840
cgcgtgcacc cgactctatt acctgtgtcc cacccactgg cgtcggtaaa caagtccttt 900
aatgcaatct ttgttgaagc agaagcagct ggtcgcctga tgttctacgg aaacggtgca 960
ggtggcgcgc caaccgcgtc tgctgtgctt ggcgacgtcg ttggtgccgc acgaaacaag 1020
gtgcacggtg gccgtgctcc aggtgagtcc acctacgcta acctgccgat cgctgatttc 1080
ggtgagacca ccactcgtta ccacctcgac atggatgtgg aagatcgcgt gggggttttg 1140
gctgaattgg ctagcctgtt ctctgagcaa ggaatctccc tgcgtacaat ccgacaggaa 1200
gagcgcgatg atgatgcaca tctgatcgtg gtcacccact ctgcgctgga atctgatctt 1260
tcccgcaccg ttgaactgct gaaggctaag cctgttgtta aggcaatcaa cagtgtgatc 1320
cgcctcgaaa gggactaa 1338
<210> 11
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 11
tcgagctcgg taccccgctt ttgcactcat cgagc 35
<210> 12
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
cacgatcaga tgtgcatcat cat 23
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
atgatgatgc acatctgatc gtg 23
<210> 14
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
ctctagagga tccccgagca tcttccaaaa ccttg 35
<210> 15
<211> 1311
<212> DNA
<213> 未知
<220>
<223> ilvA
<400> 15
atgagtgaaa catacgtgtc tgagaaaagt ccaggagtga tggctagcgg agcggagctg 60
attcgtgccg ccgacattca aacggcgcag gcacgaattt cctccgtcat tgcaccaact 120
ccattgcagt attgccctcg tctttctgag gaaaccggag cggaaatcta ccttaagcgt 180
gaggatctgc aggatgttcg ttcctacaag atccgcggtg cgctgaactc tggagcgcag 240
ctcactcagg agcagcgcga tgcaggtatc gttgccgcat ctgcaggtaa ccatgcccag 300
ggcgtggcct atgtgtgcaa gtccttgggc gttcagggac gcatctatgt tcctgtgcag 360
actccaaagc aaaagcgtga ccgcatcatg gttcacggcg gagagtttgt ctccttggtg 420
gtcactggca ataacttcga cgaagcatcg gctgcagcgc atgaagatgc agagcgcacc 480
ggcgcaacgc tgatcgagcc tttcgatgct cgcaacaccg tcatcggtca gggtacagtg 540
gctgctgaga tcttgtcgca gctgacttcc atgggcaaga gtgcagatca cgtgatggtt 600
ccagtcggcg gtggcggact tcttgcaggt gtggtcagct acatggctga tatggcacct 660
cgcactgcga tcgttggtat cgaaccagcg ggagcagcat ccatgcaggc tgcattgcac 720
aatggtggac caatcacttt ggagactgtt gatccctttg tggacggcgc agcagtcaaa 780
cgtgtcggag atctcaacta caccatcgtg gagaagaacc agggtcgcgt gcacatgatg 840
agcgcgaccg agggcgctgt gtgtactgag atgctcgatc tttaccaaaa cgaaggcatc 900
atcgcggagc ctgctggcgc gctgtctatc gctgggttga aggaaatgtc ctttgcacct 960
ggttctgtcg tggtgtgcat catctctggt ggcaacaacg atgtgctgcg ttatgcggaa 1020
atcgctgagc gctccttggt gcaccgcggt ttgaagcact acttcttggt gaacttcccg 1080
caaaagcctg gtcagttgcg tcacttcctg gaagatatcc tgggaccgga tgatgacatc 1140
gcgctggcag agtacctcaa gcgcaacaac cgtgagaccg gtactgcgtt ggtgggtatt 1200
cacttgagtg aagcatcagg attggattct ttgctggaac gtatggagga atcggcaatt 1260
gattcccgtc gcctcgagcc gggcacccct gagtacgaat acttgaccta a 1311
<210> 16
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 16
tcgagctcgg tacccatgag tgaaacatac gtgtc 35
<210> 17
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
gcgcttgagg tactctgcca gcgcgatgtc atcatccgg 39
<210> 18
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
ccggatgatg acatcgcgct ggcagagtac ctcaagcgc 39
<210> 19
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 19
ctctagagga tcccccgtca ccgacacctc caca 34
<210> 20
<211> 463
<212> PRT
<213> 未知
<220>
<223> aroP
<400> 20
Met Ala Lys Ser Asn Glu Gly Leu Gly Thr Gly Leu Arg Thr Arg His
1 5 10 15
Leu Thr Met Met Gly Leu Gly Ser Ala Ile Gly Ala Gly Leu Phe Leu
20 25 30
Gly Thr Gly Val Gly Ile Arg Ala Ala Gly Pro Ala Val Leu Leu Ala
35 40 45
Tyr Ile Ile Ala Gly Ala Ile Val Val Leu Val Met Gln Met Leu Gly
50 55 60
Glu Met Ala Ala Ala Arg Pro Ala Ser Gly Ser Phe Ser Arg Tyr Gly
65 70 75 80
Glu Asp Ala Phe Gly His Trp Ala Gly Phe Ser Leu Gly Trp Leu Tyr
85 90 95
Trp Phe Met Leu Ile Met Val Met Gly Ala Glu Met Thr Gly Ala Ala
100 105 110
Ala Phe Met Gly Ala Trp Phe Gly Val Glu Pro Trp Ile Pro Ser Leu
115 120 125
Val Cys Val Val Phe Phe Ala Val Val Asn Leu Val Ala Val Arg Gly
130 135 140
Phe Gly Glu Phe Glu Tyr Trp Phe Ala Phe Ile Lys Val Ala Val Ile
145 150 155 160
Ile Ala Phe Leu Ile Ile Gly Ile Ala Leu Ile Phe Gly Trp Leu Pro
165 170 175
Gly Ser Thr Phe Val Gly Thr Ser Asn Phe Ile Gly Asp His Gly Phe
180 185 190
Met Pro Asn Gly Ile Ser Gly Val Ala Ala Gly Leu Leu Ala Val Ala
195 200 205
Phe Ala Phe Gly Gly Ile Glu Ile Val Thr Ile Ala Ala Ala Glu Ser
210 215 220
Asp Lys Pro Arg Glu Ala Ile Ser Leu Ala Val Arg Ala Val Ile Trp
225 230 235 240
Arg Ile Ser Val Phe Tyr Leu Gly Ser Val Leu Val Ile Thr Phe Leu
245 250 255
Met Pro Tyr Glu Ser Ile Asn Gly Ala Asp Thr Ala Ala Glu Ser Pro
260 265 270
Phe Thr Gln Ile Leu Ala Met Ala Asn Ile Pro Gly Thr Val Gly Phe
275 280 285
Met Glu Ala Ile Ile Val Leu Ala Leu Leu Ser Ala Phe Asn Ala Gln
290 295 300
Ile Tyr Ala Thr Ser Arg Leu Val Phe Ser Met Ala Asn Arg Gln Asp
305 310 315 320
Ala Pro Arg Val Phe Ser Lys Leu Ser Thr Ser His Val Pro Thr Asn
325 330 335
Ala Val Leu Leu Ser Met Phe Phe Ala Phe Val Ser Val Gly Leu Gln
340 345 350
Tyr Trp Asn Pro Ala Gly Leu Leu Asp Phe Leu Leu Asn Ala Val Gly
355 360 365
Gly Cys Leu Ile Val Val Trp Ala Met Ile Thr Leu Ser Gln Leu Lys
370 375 380
Leu Arg Lys Glu Leu Gln Ala Asn Asp Glu Ile Ser Thr Val Arg Met
385 390 395 400
Trp Ala His Pro Trp Leu Gly Ile Leu Thr Leu Val Leu Leu Ala Gly
405 410 415
Leu Val Ala Leu Met Leu Gly Asp Ala Ala Ser Arg Ser Gln Val Tyr
420 425 430
Ser Val Ala Ile Val Tyr Gly Phe Leu Val Leu Leu Ser Phe Val Thr
435 440 445
Val Asn Ser Pro Leu Arg Gly Gly Arg Thr Pro Ser Asp Leu Asn
450 455 460
<210> 21
<211> 463
<212> PRT
<213> 未知
<220>
<223> aroP
<400> 21
Met Ala Lys Ser Asn Glu Gly Leu Gly Thr Gly Leu Arg Thr Arg His
1 5 10 15
Leu Thr Met Met Gly Leu Gly Ser Ala Ile Gly Val Gly Leu Phe Leu
20 25 30
Gly Thr Gly Val Gly Ile Arg Ala Ala Gly Pro Ala Val Leu Leu Ala
35 40 45
Tyr Ile Ile Ala Gly Ala Ile Val Val Leu Val Met Gln Met Leu Gly
50 55 60
Glu Met Ala Ala Ala Arg Pro Ala Ser Gly Ser Phe Ser Arg Tyr Gly
65 70 75 80
Glu Asp Ala Phe Gly His Trp Ala Gly Phe Ser Leu Gly Trp Leu Tyr
85 90 95
Trp Phe Met Leu Ile Met Val Met Gly Ala Glu Met Thr Gly Ala Ala
100 105 110
Ala Ile Met Gly Ala Trp Phe Gly Val Glu Pro Trp Ile Pro Ser Leu
115 120 125
Val Cys Val Val Phe Phe Ala Val Val Asn Leu Val Ala Val Arg Gly
130 135 140
Phe Gly Glu Phe Glu Tyr Trp Phe Ala Phe Ile Lys Val Ala Val Ile
145 150 155 160
Ile Ala Phe Leu Ile Ile Gly Ile Ala Leu Ile Phe Gly Trp Leu Pro
165 170 175
Gly Ser Thr Phe Val Gly Thr Ser Asn Phe Ile Gly Asp His Gly Phe
180 185 190
Met Pro Asn Gly Ile Ser Gly Val Ala Ala Gly Leu Leu Ala Val Ala
195 200 205
Phe Ala Phe Gly Gly Ile Glu Ile Val Thr Ile Ala Ala Ala Glu Ser
210 215 220
Asp Lys Pro Arg Glu Ala Ile Ser Leu Ala Val Arg Ala Val Ile Trp
225 230 235 240
Arg Ile Ser Val Phe Tyr Leu Gly Ser Val Leu Val Ile Thr Phe Leu
245 250 255
Met Pro Tyr Glu Ser Ile Asn Gly Ala Asp Thr Ala Ala Glu Ser Pro
260 265 270
Phe Thr Gln Ile Leu Ala Met Ala Asn Ile Pro Gly Thr Val Gly Phe
275 280 285
Met Glu Ala Ile Ile Val Leu Ala Leu Leu Ser Ala Phe Asn Ala Gln
290 295 300
Ile Tyr Ala Thr Ser Arg Leu Val Phe Ser Met Ala Asn Arg Gln Asp
305 310 315 320
Ala Pro Arg Val Phe Ser Lys Leu Ser Thr Ser His Val Pro Thr Asn
325 330 335
Ala Val Leu Leu Ser Met Phe Phe Ala Phe Val Ser Val Gly Leu Gln
340 345 350
Tyr Trp Asn Pro Ala Gly Leu Leu Asp Phe Leu Leu Asn Ala Val Gly
355 360 365
Gly Cys Leu Ile Val Val Trp Ala Met Ile Thr Leu Ser Gln Leu Lys
370 375 380
Leu Arg Lys Glu Leu Gln Ala Asn Asp Glu Ile Ser Thr Val Arg Met
385 390 395 400
Trp Ala His Pro Trp Leu Gly Ile Leu Thr Leu Val Leu Leu Ala Gly
405 410 415
Leu Val Ala Leu Met Leu Gly Asp Ala Ala Ser Arg Ser Gln Val Tyr
420 425 430
Ser Val Ala Ile Val Tyr Gly Phe Leu Val Leu Leu Ser Phe Val Thr
435 440 445
Val Asn Ser Pro Leu Arg Gly Gly Arg Thr Pro Ser Asp Leu Asn
450 455 460
<210> 22
<211> 1392
<212> DNA
<213> 未知
<220>
<223> aroP
<400> 22
atggctaaat ctaatgaagg gctgggaacc ggacttcgga cccgccacct cacaatgatg 60
ggactcggct ccgcaattgg tgccggactg ttcctcggca ccggcgttgg tatccgcgca 120
gccggccccg cagtgctcct ggcgtacatc atcgccggag ccatcgttgt gcttgttatg 180
caaatgctcg gcgagatggc tgctgcccgt cccgcctccg gatcgttttc acgttacggc 240
gaggatgctt tcggccactg ggctggtttc tccctcggtt ggttgtactg gttcatgctg 300
attatggtga tgggcgccga aatgactggc gctgctgcca tcatgggtgc atggttcggc 360
gtcgaaccgt ggattccttc gcttgtctgc gtggtcttct tcgctgtggt gaacctcgtc 420
gcggttcgcg gtttcggtga attcgagtac tggttcgcat tcattaaggt cgcggtgatc 480
atcgctttcc tcatcattgg tattgctctt attttcggat ggcttcccgg atccaccttt 540
gttggaacct caaacttcat cggtgatcac ggattcatgc ccaatggtat ttctggtgtt 600
gctgctggtt tgctcgcggt ggcttttgcc tttaccggca ttgaaattgt caccattgca 660
gctgcagagt ccgataagcc acgtgaagct atttccctgg cggtgcgtgc cgtgatttgg 720
cgtatttcag tcttttactt gggctctgtt ttggtcatca ctttcctcat gccttatgag 780
tcgatcaatg gtgccgacac cgctgcggaa tcccccttca cccaaatcct ggcgatggca 840
aacatccctg gcacggttgg tttcatggaa gcgatcatcg ttctagcact gctttccgct 900
ttcaacgccc aaatctatgc cacttctcgt ttggtatttt ccatggcgaa tcgacaagac 960
gctccgcgag ttttcagtaa gctcagcacc agccacgtcc ccaccaatgc ggtgctgttg 1020
tccatgttct tcgccttcgt ttcagttggt ttgcagtact ggaatccagc cggtctgctt 1080
gatttcctcc tcaacgctgt tggcggttgt ttgattgtgg tgtgggcaat gatcactttg 1140
tcacagttga aactccgcaa agaactgcaa gcaaacgatg aaatctccac ggttcgcatg 1200
tgggcgcacc catggttagg catcctcacc ttggttttgt tggcaggact cgttgctctc 1260
atgctcggcg acgcagcctc ccgcagccag gtttactcag tggcaattgt gtacggattc 1320
ttggttcttt tgtccttcgt cacagttaac agcccattgc gcggaggtcg caccccttcc 1380
gacttgaact ga 1392
<210> 23
<211> 1392
<212> DNA
<213> 未知
<220>
<223> aroP
<400> 23
atggctaaat ctaatgaagg gctgggaacc ggacttcgga cccgccacct cacaatgatg 60
ggactcggct ccgcaattgg tgccggactg ttcctcggca ccggcgttgg tatccgcgca 120
gccggccccg cagtgctcct ggcgtacatc atcgccggag ccatcgttgt gcttgttatg 180
caaatgctcg gcgagatggc tgctgcccgt cccgcctccg gatcgttttc acgttacggc 240
gaggatgctt tcggccactg ggctggtttc tccctcggtt ggttgtactg gttcatgctg 300
attatggtga tgggcgccga aatgactggc gctgctgcct tcatgggtgc atggttcggc 360
gtcgaaccgt ggattccttc gcttgtctgc gtggtcttct tcgctgtggt gaacctcgtc 420
gcggttcgcg gtttcggtga attcgagtac tggttcgcat tcattaaggt cgcggtgatc 480
atcgctttcc tcatcattgg tattgctctt attttcggat ggcttcccgg atccaccttt 540
gttggaacct caaacttcat cggtgatcac ggattcatgc ccaatggtat ttctggtgtt 600
gctgctggtt tgctcgcggt ggcttttgcc tttggtggca ttgaaattgt caccattgca 660
gctgcagagt ccgataagcc acgtgaagct atttccctgg cggtgcgtgc cgtgatttgg 720
cgtatttcag tcttttactt gggctctgtt ttggtcatca ctttcctcat gccttatgag 780
tcgatcaatg gtgccgacac cgctgcggaa tcccccttca cccaaatcct ggcgatggca 840
aacatccctg gcacggttgg tttcatggaa gcgatcatcg ttctagcact gctttccgct 900
ttcaacgccc aaatctatgc cacttctcgt ttggtatttt ccatggcgaa tcgacaagac 960
gctccgcgag ttttcagtaa gctcagcacc agccacgtcc ccaccaatgc ggtgctgttg 1020
tccatgttct tcgccttcgt ttcagttggt ttgcagtact ggaatccagc cggtctgctt 1080
gatttcctcc tcaacgctgt tggcggttgt ttgattgtgg tgtgggcaat gatcactttg 1140
tcacagttga aactccgcaa agaactgcaa gcaaacgatg aaatctccac ggttcgcatg 1200
tgggcgcacc catggttagg catcctcacc ttggttttgt tggcaggact cgttgctctc 1260
atgctcggcg acgcagcctc ccgcagccag gtttactcag tggcaattgt gtacggattc 1320
ttggttcttt tgtccttcgt cacagttaac agcccattgc gcggaggtcg caccccttcc 1380
gacttgaact ga 1392
<210> 24
<211> 1392
<212> DNA
<213> 未知
<220>
<223> aroP
<400> 24
atggctaaat ctaatgaagg gctgggaacc ggacttcgga cccgccacct cacaatgatg 60
ggactcggct ccgcaattgg tgttggactg ttcctcggca ccggcgttgg tatccgcgca 120
gccggccccg cagtgctcct ggcgtacatc atcgccggag ccatcgttgt gcttgttatg 180
caaatgctcg gcgagatggc tgctgcccgt cccgcctccg gatcgttttc acgttacggc 240
gaggatgctt tcggccactg ggctggtttc tccctcggtt ggttgtactg gttcatgctg 300
attatggtga tgggcgccga aatgactggc gctgctgcca tcatgggtgc atggttcggc 360
gtcgaaccgt ggattccttc gcttgtctgc gtggtcttct tcgctgtggt gaacctcgtc 420
gcggttcgcg gtttcggtga attcgagtac tggttcgcat tcattaaggt cgcggtgatc 480
atcgctttcc tcatcattgg tattgctctt attttcggat ggcttcccgg atccaccttt 540
gttggaacct caaacttcat cggtgatcac ggattcatgc ccaatggtat ttctggtgtt 600
gctgctggtt tgctcgcggt ggcttttgcc tttggtggca ttgaaattgt caccattgca 660
gctgcagagt ccgataagcc acgtgaagct atttccctgg cggtgcgtgc cgtgatttgg 720
cgtatttcag tcttttactt gggctctgtt ttggtcatca ctttcctcat gccttatgag 780
tcgatcaatg gtgccgacac cgctgcggaa tcccccttca cccaaatcct ggcgatggca 840
aacatccctg gcacggttgg tttcatggaa gcgatcatcg ttctagcact gctttccgct 900
ttcaacgccc aaatctatgc cacttctcgt ttggtatttt ccatggcgaa tcgacaagac 960
gctccgcgag ttttcagtaa gctcagcacc agccacgtcc ccaccaatgc ggtgctgttg 1020
tccatgttct tcgccttcgt ttcagttggt ttgcagtact ggaatccagc cggtctgctt 1080
gatttcctcc tcaacgctgt tggcggttgt ttgattgtgg tgtgggcaat gatcactttg 1140
tcacagttga aactccgcaa agaactgcaa gcaaacgatg aaatctccac ggttcgcatg 1200
tgggcgcacc catggttagg catcctcacc ttggttttgt tggcaggact cgttgctctc 1260
atgctcggcg acgcagcctc ccgcagccag gtttactcag tggcaattgt gtacggattc 1320
ttggttcttt tgtccttcgt cacagttaac agcccattgc gcggaggtcg caccccttcc 1380
gacttgaact ga 1392
<210> 25
<211> 436
<212> PRT
<213> 未知
<220>
<223> ilvA
<400> 25
Met Ser Glu Thr Tyr Val Ser Glu Lys Ser Pro Gly Val Met Ala Ser
1 5 10 15
Gly Ala Glu Leu Ile Arg Ala Ala Asp Ile Gln Thr Ala Gln Ala Arg
20 25 30
Ile Ser Ser Val Ile Ala Pro Thr Pro Leu Gln Tyr Cys Pro Arg Leu
35 40 45
Ser Glu Glu Thr Gly Ala Glu Ile Tyr Leu Lys Arg Glu Asp Leu Gln
50 55 60
Asp Val Arg Ser Tyr Lys Ile Arg Gly Ala Leu Asn Ser Gly Ala Gln
65 70 75 80
Leu Thr Gln Glu Gln Arg Asp Ala Gly Ile Val Ala Ala Ser Ala Gly
85 90 95
Asn His Ala Gln Gly Val Ala Tyr Val Cys Lys Ser Leu Gly Val Gln
100 105 110
Gly Arg Ile Tyr Val Pro Val Gln Thr Pro Lys Gln Lys Arg Asp Arg
115 120 125
Ile Met Val His Gly Gly Glu Phe Val Ser Leu Val Val Thr Gly Asn
130 135 140
Asn Phe Asp Glu Ala Ser Ala Ala Ala His Glu Asp Ala Glu Arg Thr
145 150 155 160
Gly Ala Thr Leu Ile Glu Pro Phe Asp Ala Arg Asn Thr Val Ile Gly
165 170 175
Gln Gly Thr Val Ala Ala Glu Ile Leu Ser Gln Leu Thr Ser Met Gly
180 185 190
Lys Ser Ala Asp His Val Met Val Pro Val Gly Gly Gly Gly Leu Leu
195 200 205
Ala Gly Val Val Ser Tyr Met Ala Asp Met Ala Pro Arg Thr Ala Ile
210 215 220
Val Gly Ile Glu Pro Ala Gly Ala Ala Ser Met Gln Ala Ala Leu His
225 230 235 240
Asn Gly Gly Pro Ile Thr Leu Glu Thr Val Asp Pro Phe Val Asp Gly
245 250 255
Ala Ala Val Lys Arg Val Gly Asp Leu Asn Tyr Thr Ile Val Glu Lys
260 265 270
Asn Gln Gly Arg Val His Met Met Ser Ala Thr Glu Gly Ala Val Cys
275 280 285
Thr Glu Met Leu Asp Leu Tyr Gln Asn Glu Gly Ile Ile Ala Glu Pro
290 295 300
Ala Gly Ala Leu Ser Ile Ala Gly Leu Lys Glu Met Ser Phe Ala Pro
305 310 315 320
Gly Ser Val Val Val Cys Ile Ile Ser Gly Gly Asn Asn Asp Val Leu
325 330 335
Arg Tyr Ala Glu Ile Ala Glu Arg Ser Leu Val His Arg Gly Leu Lys
340 345 350
His Tyr Phe Leu Val Asn Phe Pro Gln Lys Pro Gly Gln Leu Arg His
355 360 365
Phe Leu Glu Asp Ile Leu Gly Pro Asp Asp Asp Ile Thr Leu Phe Glu
370 375 380
Tyr Leu Lys Arg Asn Asn Arg Glu Thr Gly Thr Ala Leu Val Gly Ile
385 390 395 400
His Leu Ser Glu Ala Ser Gly Leu Asp Ser Leu Leu Glu Arg Met Glu
405 410 415
Glu Ser Ala Ile Asp Ser Arg Arg Leu Glu Pro Gly Thr Pro Glu Tyr
420 425 430
Glu Tyr Leu Thr
435
Claims (15)
1.伽马(γ)-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代。
2.多核苷酸,其编码权利要求1所述的变体。
3.载体,其包含权利要求2所述的多核苷酸。
4.微生物,其包含下列中的任意一种或多种:权利要求1所述的变体;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
5.根据权利要求4所述的微生物,其中所述微生物生产L-异亮氨酸。
6.根据权利要求4所述的微生物,其中所述微生物是棒状杆菌属(Corynebacterium)的微生物。
7.根据权利要求4所述的微生物,其中所述微生物是谷氨酸棒状杆菌(Corynebacterium glutamicum)。
8.用于生产L-异亮氨酸的方法,所述方法包括在培养基中培养包含下列中的一种或多种的微生物:γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
9.根据权利要求8所述的用于生产L-异亮氨酸的方法,进一步包括从所述培养基或微生物中回收L-异亮氨酸。
10.根据权利要求8所述的用于生产L-异亮氨酸的方法,其中所述微生物是棒状杆菌属的微生物。
11.根据权利要求8所述的用于生产L-异亮氨酸的方法,其中所述方法用于减少L-异亮氨酸的生产期间生成的副产物的量。
12.根据权利要求11所述的用于生产L-异亮氨酸的方法,其中所述副产物是选自α-氨基丁酸(AABA)、缬氨酸、苯丙氨酸和亮氨酸的任意一种或多种。
13.用于减少L-异亮氨酸的生产期间生成的副产物的量的方法,所述方法包括在培养基中培养包含下列中的一种或多种的微生物:γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
14.用于生产L-异亮氨酸的组合物,所述组合物包含微生物或所述微生物的培养物,所述微生物包含下列中的一种或多种:γ-氨基丁酸通透酶变体,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
15.γ-氨基丁酸通透酶变体或微生物用于生产L-异亮氨酸的用途,其中SEQ ID NO:1的氨基酸序列中相应于第212位的氨基酸被苏氨酸取代,相应于第114位的氨基酸被苯丙氨酸取代,或相应于第28位的氨基酸被缬氨酸取代;所述微生物包含所述变体、编码所述变体的多核苷酸;和包含所述多核苷酸的载体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2020-0173743 | 2020-12-11 | ||
KR1020200173743A KR102464883B1 (ko) | 2020-12-11 | 2020-12-11 | 신규한 감마-아미노부티르산 퍼미에이즈 변이체 및 이를 이용한 이소류신 생산 방법 |
PCT/KR2021/018520 WO2022124786A1 (ko) | 2020-12-11 | 2021-12-08 | 신규한 감마-아미노부티르산 퍼미에이즈 변이체 및 이를 이용한 이소류신 생산 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117480250A true CN117480250A (zh) | 2024-01-30 |
Family
ID=81973440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180093144.4A Pending CN117480250A (zh) | 2020-12-11 | 2021-12-08 | 新型伽马氨基丁酸通透酶变体及使用其生产异亮氨酸的方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240110161A1 (zh) |
EP (1) | EP4245850A4 (zh) |
KR (1) | KR102464883B1 (zh) |
CN (1) | CN117480250A (zh) |
AU (1) | AU2021398499A1 (zh) |
CA (1) | CA3201761A1 (zh) |
WO (1) | WO2022124786A1 (zh) |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0167132B1 (en) * | 1984-06-29 | 1992-01-02 | Ajinomoto Co., Inc. | Process for producing l-isoleucine by fermentation |
JP3975470B2 (ja) * | 1994-05-30 | 2007-09-12 | 味の素株式会社 | 発酵法によるl−イソロイシンの製造法 |
DE19523279A1 (de) * | 1995-06-27 | 1997-01-09 | Forschungszentrum Juelich Gmbh | Verfahren zur mikrobiellen Herstellung von Aminosäuren mittels rekombinanter Mikroorganismen mit erhöhter Sekretionsrate |
JPH10237030A (ja) | 1997-02-26 | 1998-09-08 | Ajinomoto Co Inc | 分岐鎖アミノ酸の精製法 |
PL1664318T3 (pl) * | 2004-01-30 | 2010-03-31 | Ajinomoto Kk | Mikroorganizm wytwarzający L-aminokwas i sposób wytwarzania L-aminokwasu |
KR100620092B1 (ko) | 2004-12-16 | 2006-09-08 | 씨제이 주식회사 | 코리네박테리움 속 세포로부터 유래된 신규한 프로모터서열, 그를 포함하는 발현 카세트 및 벡터, 상기 벡터를포함하는 숙주 세포 및 그를 이용하여 유전자를 발현하는방법 |
KR101335789B1 (ko) | 2012-01-13 | 2013-12-02 | 씨제이제일제당 (주) | L-이소루신을 생산하는 미생물 및 이를 이용한 l-이소루신 제조방법 |
EP2762571A1 (de) * | 2013-01-30 | 2014-08-06 | Evonik Industries AG | Mikroorganismus und Verfahren zur fermentativen Herstellung von Aminosäuren |
EP2811028B1 (de) | 2013-06-03 | 2017-02-01 | Evonik Degussa GmbH | Verfahren zur Herstellung von L-Valin unter Verwendung rekombinanter Corynebakterien enthaltend das durch Propionat induzierbare ilvBN-Operon |
KR101632642B1 (ko) | 2015-01-29 | 2016-06-22 | 씨제이제일제당 주식회사 | 신규한 프로모터 및 그의 용도 |
KR101747542B1 (ko) * | 2015-10-23 | 2017-06-15 | 씨제이제일제당 (주) | L-이소루신 생산능을 가지는 코리네박테리움 속 미생물 및 이를 이용하여 l-이소루신을 생산하는 방법 |
KR101751967B1 (ko) * | 2015-10-29 | 2017-06-30 | 대상 주식회사 | 부산물의 생성이 감소된 이소루이신 생산능 변이 균주 |
MY186296A (en) | 2016-08-31 | 2021-07-06 | Cj Cheiljedang Corp | Novel promoter and use thereof |
KR102011994B1 (ko) | 2017-06-30 | 2019-08-20 | 씨제이제일제당 주식회사 | 신규한 아스파토키나제 변이체 및 이를 이용한 l-아미노산의 제조방법 |
JP6951291B2 (ja) | 2017-11-22 | 2021-10-20 | 川崎重工業株式会社 | 船尾フィンおよびそれを備えた船舶 |
KR101996769B1 (ko) | 2018-12-21 | 2019-10-01 | 씨제이제일제당 (주) | 변이형 호모세린 디하이드로게나제 및 이를 이용한 호모세린 또는 호모세린 유래 l-아미노산의 생산 방법 |
KR102278000B1 (ko) | 2020-03-17 | 2021-07-15 | 씨제이제일제당 주식회사 | 프리페네이트 디하이드라타아제 활성 강화를 통한 l-트립토판을 생산하는 방법 |
-
2020
- 2020-12-11 KR KR1020200173743A patent/KR102464883B1/ko active IP Right Grant
-
2021
- 2021-12-08 CN CN202180093144.4A patent/CN117480250A/zh active Pending
- 2021-12-08 US US18/266,447 patent/US20240110161A1/en active Pending
- 2021-12-08 EP EP21903832.0A patent/EP4245850A4/en active Pending
- 2021-12-08 CA CA3201761A patent/CA3201761A1/en active Pending
- 2021-12-08 WO PCT/KR2021/018520 patent/WO2022124786A1/ko active Application Filing
- 2021-12-08 AU AU2021398499A patent/AU2021398499A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4245850A4 (en) | 2024-05-15 |
WO2022124786A1 (ko) | 2022-06-16 |
US20240110161A1 (en) | 2024-04-04 |
KR102464883B1 (ko) | 2022-11-09 |
KR20220083467A (ko) | 2022-06-20 |
JP2023553134A (ja) | 2023-12-20 |
CA3201761A1 (en) | 2022-06-16 |
AU2021398499A1 (en) | 2023-07-06 |
AU2021398499A9 (en) | 2024-08-01 |
EP4245850A1 (en) | 2023-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102183209B1 (ko) | L-쓰레오닌 배출 단백질의 변이체 및 이를 이용한 l-쓰레오닌 생산 방법 | |
KR102363913B1 (ko) | L-쓰레오닌 디하이드라타아제의 신규 변이체 및 이를 이용한 l-이소류신 생산 방법 | |
CN116917473A (zh) | 预苯酸脱水酶变体以及使用其生产支链氨基酸的方法 | |
CN117321193A (zh) | 新型支链氨基酸转氨酶变体及使用其生产异亮氨酸的方法 | |
EP4321622A1 (en) | L-arginine-producing corynebacterium sp. microorganism and l-arginine production method using same | |
KR102147381B1 (ko) | 아세토하이드록시산 신타제 신규 변이체 및 이를 포함하는 미생물 | |
RU2826168C1 (ru) | Новый вариант гамма-аминобутиратпермеазы и способ получения изолейцина с его использованием | |
KR102464883B1 (ko) | 신규한 감마-아미노부티르산 퍼미에이즈 변이체 및 이를 이용한 이소류신 생산 방법 | |
JP7572559B2 (ja) | 新規なガンマ-アミノ酪酸パーミアーゼ変異体及びこれを用いたイソロイシン生産方法 | |
KR102673796B1 (ko) | 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법 | |
KR102694516B1 (ko) | L-글루타민 생산능이 향상된 미생물 및 이를 이용한 l-글루타민 생산 방법 | |
KR102679080B1 (ko) | 변이형 atp-의존적 프로테아제 및 이를 이용한 l-아미노산의 생산 방법 | |
CA3233425A1 (en) | Novel acetohydroxy acid synthase mutant and l-isoleucine production method using same | |
AU2022260752A1 (en) | L-amino-acid-producing corynebacterium sp. microorganism, and method for producing l-amino acids by using same | |
EP4435108A1 (en) | L-isoleucine-producing microorganism and l-isoleucine producing method using same | |
EP4276177A1 (en) | Novel citrate synthase variant and method for producing o-acetyl-l-homoserine or l-methionine using same | |
KR20230131654A (ko) | 변이형 l-쓰레오닌 배출 단백질 및 이를 이용한 l-쓰레오닌 생산 방법 | |
KR20230131653A (ko) | 변이형 l-쓰레오닌 배출 단백질 및 이를 이용한 l-쓰레오닌 생산 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |