CN112823165B - 新型l-色氨酸输出蛋白变体及使用其生产l-色氨酸的方法 - Google Patents
新型l-色氨酸输出蛋白变体及使用其生产l-色氨酸的方法 Download PDFInfo
- Publication number
- CN112823165B CN112823165B CN202080004146.7A CN202080004146A CN112823165B CN 112823165 B CN112823165 B CN 112823165B CN 202080004146 A CN202080004146 A CN 202080004146A CN 112823165 B CN112823165 B CN 112823165B
- Authority
- CN
- China
- Prior art keywords
- leu
- ala
- gly
- amino acid
- val
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 title claims abstract description 442
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 368
- 229960004799 tryptophan Drugs 0.000 title claims abstract description 241
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 154
- 238000004519 manufacturing process Methods 0.000 title claims description 71
- 244000005700 microbiome Species 0.000 claims abstract description 128
- 230000000694 effects Effects 0.000 claims abstract description 76
- 150000001413 amino acids Chemical class 0.000 claims description 388
- 235000001014 amino acid Nutrition 0.000 claims description 266
- 229940024606 amino acid Drugs 0.000 claims description 263
- 235000018102 proteins Nutrition 0.000 claims description 144
- 239000013598 vector Substances 0.000 claims description 61
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Chemical group CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 52
- 108091033319 polynucleotide Proteins 0.000 claims description 48
- 102000040430 polynucleotide Human genes 0.000 claims description 48
- 239000002157 polynucleotide Substances 0.000 claims description 48
- 229960000310 isoleucine Drugs 0.000 claims description 43
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical group CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 42
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Chemical group CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 42
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical group CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 37
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical group CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 34
- 241000186216 Corynebacterium Species 0.000 claims description 32
- 241000588722 Escherichia Species 0.000 claims description 32
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical group CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 32
- 235000004279 alanine Nutrition 0.000 claims description 32
- 239000004474 valine Chemical group 0.000 claims description 32
- 230000001965 increasing effect Effects 0.000 claims description 22
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 15
- 238000012258 culturing Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 abstract description 97
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 abstract description 51
- 108020004414 DNA Proteins 0.000 description 145
- 230000002209 hydrophobic effect Effects 0.000 description 68
- 241000588724 Escherichia coli Species 0.000 description 65
- 241000186226 Corynebacterium glutamicum Species 0.000 description 61
- 239000013612 plasmid Substances 0.000 description 52
- 229960003136 leucine Drugs 0.000 description 47
- 239000002609 medium Substances 0.000 description 47
- 238000006467 substitution reaction Methods 0.000 description 45
- 230000000875 corresponding effect Effects 0.000 description 44
- 239000012634 fragment Substances 0.000 description 43
- 230000035772 mutation Effects 0.000 description 43
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 40
- 108010050848 glycylleucine Proteins 0.000 description 39
- 241000880493 Leptailurus serval Species 0.000 description 38
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 31
- 229960001153 serine Drugs 0.000 description 31
- 108010052285 Membrane Proteins Proteins 0.000 description 29
- 210000004027 cell Anatomy 0.000 description 29
- 238000004925 denaturation Methods 0.000 description 26
- 230000036425 denaturation Effects 0.000 description 26
- 101150044170 trpE gene Proteins 0.000 description 26
- 102000018697 Membrane Proteins Human genes 0.000 description 25
- 238000004520 electroporation Methods 0.000 description 25
- 210000000349 chromosome Anatomy 0.000 description 24
- 230000014509 gene expression Effects 0.000 description 24
- 231100000350 mutagenesis Toxicity 0.000 description 24
- 229960003767 alanine Drugs 0.000 description 23
- 238000002703 mutagenesis Methods 0.000 description 23
- 229960004295 valine Drugs 0.000 description 23
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 22
- 101100408135 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) phnA gene Proteins 0.000 description 22
- 108010008355 arginyl-glutamine Proteins 0.000 description 22
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 22
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 21
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 21
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 21
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 21
- 238000000855 fermentation Methods 0.000 description 21
- 230000004151 fermentation Effects 0.000 description 21
- 238000002744 homologous recombination Methods 0.000 description 21
- 230000006801 homologous recombination Effects 0.000 description 21
- 229920001184 polypeptide Polymers 0.000 description 21
- 102000004196 processed proteins & peptides Human genes 0.000 description 21
- 108090000765 processed proteins & peptides Proteins 0.000 description 21
- 108010004914 prolylarginine Proteins 0.000 description 21
- 238000011144 upstream manufacturing Methods 0.000 description 21
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 20
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 20
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 20
- BXICSAQLIHFDDL-YUMQZZPRSA-N Gly-Lys-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BXICSAQLIHFDDL-YUMQZZPRSA-N 0.000 description 20
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 20
- 239000002773 nucleotide Substances 0.000 description 20
- 125000003729 nucleotide group Chemical group 0.000 description 20
- 108010080629 tryptophan-leucine Proteins 0.000 description 20
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 19
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 19
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 19
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 19
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 19
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 19
- 241000589989 Helicobacter Species 0.000 description 19
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 19
- HQPHMEPBNUHPKD-XIRDDKMYSA-N Leu-Cys-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N HQPHMEPBNUHPKD-XIRDDKMYSA-N 0.000 description 19
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 19
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 19
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 19
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 19
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 19
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 19
- 108010036413 histidylglycine Proteins 0.000 description 19
- 108010064235 lysylglycine Proteins 0.000 description 19
- 108010051242 phenylalanylserine Proteins 0.000 description 19
- 108010029020 prolylglycine Proteins 0.000 description 19
- VWWKKDNCCLAGRM-GVXVVHGQSA-N (2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]acetyl]amino]-3-methylbutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VWWKKDNCCLAGRM-GVXVVHGQSA-N 0.000 description 18
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 18
- ZODMADSIQZZBSQ-FXQIFTODSA-N Ala-Gln-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZODMADSIQZZBSQ-FXQIFTODSA-N 0.000 description 18
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 18
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 18
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 18
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 18
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 18
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 18
- LUJQEUOZJUWRRX-BPUTZDHNSA-N Asn-Trp-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(O)=O LUJQEUOZJUWRRX-BPUTZDHNSA-N 0.000 description 18
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 18
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 18
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 18
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 18
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 18
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 18
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 18
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 18
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 18
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 18
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 18
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 18
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 18
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 18
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 18
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 18
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 18
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 18
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 18
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 18
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 18
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 18
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 18
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 18
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 18
- PNHRPOWKRRJATF-IHRRRGAJSA-N Met-Tyr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 PNHRPOWKRRJATF-IHRRRGAJSA-N 0.000 description 18
- 108010079364 N-glycylalanine Proteins 0.000 description 18
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 18
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 18
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 18
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 18
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 18
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 18
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 18
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 18
- XQMGDVVKFRLQKH-BBRMVZONSA-N Trp-Val-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O)=CNC2=C1 XQMGDVVKFRLQKH-BBRMVZONSA-N 0.000 description 18
- NMOIRIIIUVELLY-WDSOQIARSA-N Trp-Val-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)C(C)C)=CNC2=C1 NMOIRIIIUVELLY-WDSOQIARSA-N 0.000 description 18
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 18
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 18
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 18
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 18
- 108010009932 leucyl-alanyl-glycyl-valine Proteins 0.000 description 18
- 108010085203 methionylmethionine Proteins 0.000 description 18
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 18
- 108010073969 valyllysine Proteins 0.000 description 18
- 230000006872 improvement Effects 0.000 description 17
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 17
- 238000012163 sequencing technique Methods 0.000 description 17
- 238000002741 site-directed mutagenesis Methods 0.000 description 17
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 16
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 16
- 238000010353 genetic engineering Methods 0.000 description 16
- IFGCUJZIWBUILZ-UHFFFAOYSA-N sodium 2-[[2-[[hydroxy-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyphosphoryl]amino]-4-methylpentanoyl]amino]-3-(1H-indol-3-yl)propanoic acid Chemical compound [Na+].C=1NC2=CC=CC=C2C=1CC(C(O)=O)NC(=O)C(CC(C)C)NP(O)(=O)OC1OC(C)C(O)C(O)C1O IFGCUJZIWBUILZ-UHFFFAOYSA-N 0.000 description 16
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 15
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 15
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 15
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 15
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 15
- -1 aromatic amino acids Chemical class 0.000 description 15
- 239000000203 mixture Substances 0.000 description 15
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 14
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 14
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 14
- 239000013611 chromosomal DNA Substances 0.000 description 14
- 239000007787 solid Substances 0.000 description 14
- 108010038745 tryptophylglycine Proteins 0.000 description 14
- 244000025254 Cannabis sativa Species 0.000 description 13
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 13
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 13
- 238000000137 annealing Methods 0.000 description 13
- 230000012010 growth Effects 0.000 description 13
- 238000004128 high performance liquid chromatography Methods 0.000 description 13
- 238000006116 polymerization reaction Methods 0.000 description 13
- 230000000379 polymerizing effect Effects 0.000 description 13
- 108091008146 restriction endonucleases Proteins 0.000 description 13
- 102220251380 rs1421690648 Human genes 0.000 description 13
- 241000588813 Alcaligenes faecalis Species 0.000 description 12
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 12
- 102220522174 Corepressor interacting with RBPJ 1_L81A_mutation Human genes 0.000 description 12
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 12
- 102220496976 Platelet-activating factor acetylhydrolase 2, cytoplasmic_L79A_mutation Human genes 0.000 description 12
- 101150024271 TKT gene Proteins 0.000 description 12
- 229940005347 alcaligenes faecalis Drugs 0.000 description 12
- 239000010949 copper Substances 0.000 description 12
- 229910052802 copper Inorganic materials 0.000 description 12
- 238000009396 hybridization Methods 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 229930027917 kanamycin Natural products 0.000 description 12
- 229960000318 kanamycin Drugs 0.000 description 12
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 12
- 229930182823 kanamycin A Natural products 0.000 description 12
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 12
- 102220500581 Fermitin family homolog 1_L79I_mutation Human genes 0.000 description 11
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 11
- 102220471249 M-phase inducer phosphatase 1_S82A_mutation Human genes 0.000 description 11
- 241000589614 Pseudomonas stutzeri Species 0.000 description 11
- 238000010367 cloning Methods 0.000 description 11
- 238000012790 confirmation Methods 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 102200146932 rs34936594 Human genes 0.000 description 11
- 102220622548 Histamine N-methyltransferase_S80A_mutation Human genes 0.000 description 10
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 10
- 230000003115 biocidal effect Effects 0.000 description 10
- 102200089577 c.239G>T Human genes 0.000 description 10
- 230000003834 intracellular effect Effects 0.000 description 10
- 102220602191 m7GpppX diphosphatase_I83A_mutation Human genes 0.000 description 10
- 150000002993 phenylalanine derivatives Chemical class 0.000 description 10
- 102200079845 rs1209154325 Human genes 0.000 description 10
- 102220124791 rs200399046 Human genes 0.000 description 10
- 102220023550 rs371429653 Human genes 0.000 description 10
- 102220023192 rs387907509 Human genes 0.000 description 10
- 102220046254 rs587782772 Human genes 0.000 description 10
- 102220076626 rs796052849 Human genes 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- 239000008103 glucose Substances 0.000 description 9
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 8
- 101100455080 Bacillus subtilis (strain 168) lmrB gene Proteins 0.000 description 8
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 8
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 8
- 238000002156 mixing Methods 0.000 description 8
- 101150012186 mtr gene Proteins 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 101150006320 trpR gene Proteins 0.000 description 8
- 101150062776 yccA gene Proteins 0.000 description 8
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 7
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 7
- 239000004473 Threonine Substances 0.000 description 7
- 239000002253 acid Substances 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 239000012153 distilled water Substances 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 230000002018 overexpression Effects 0.000 description 7
- 229960005190 phenylalanine Drugs 0.000 description 7
- 229960002898 threonine Drugs 0.000 description 7
- 101150099895 tnaA gene Proteins 0.000 description 7
- 239000004471 Glycine Substances 0.000 description 6
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 229940041514 candida albicans extract Drugs 0.000 description 6
- 230000010261 cell growth Effects 0.000 description 6
- 230000002759 chromosomal effect Effects 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 229960002449 glycine Drugs 0.000 description 6
- 230000002401 inhibitory effect Effects 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 229960002429 proline Drugs 0.000 description 6
- 239000012138 yeast extract Substances 0.000 description 6
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 5
- 101150007813 NIH gene Proteins 0.000 description 5
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 5
- 229960005091 chloramphenicol Drugs 0.000 description 5
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 235000013379 molasses Nutrition 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 239000013587 production medium Substances 0.000 description 5
- 238000002708 random mutagenesis Methods 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 4
- NGHMDNPXVRFFGS-IUYQGCFVSA-N D-erythrose 4-phosphate Chemical compound O=C[C@H](O)[C@H](O)COP(O)(O)=O NGHMDNPXVRFFGS-IUYQGCFVSA-N 0.000 description 4
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 4
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 4
- 101100070556 Oryza sativa subsp. japonica HSFA4D gene Proteins 0.000 description 4
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 4
- 102000018120 Recombinases Human genes 0.000 description 4
- 108010091086 Recombinases Proteins 0.000 description 4
- 101150099282 SPL7 gene Proteins 0.000 description 4
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 229910021529 ammonia Inorganic materials 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000007789 gas Substances 0.000 description 4
- 238000012268 genome sequencing Methods 0.000 description 4
- 229960002989 glutamic acid Drugs 0.000 description 4
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 4
- 150000002614 leucines Chemical group 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 235000006109 methionine Nutrition 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 150000003354 serine derivatives Chemical group 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 229960000268 spectinomycin Drugs 0.000 description 4
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 3
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 3
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 3
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 3
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 3
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 3
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 3
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 3
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 3
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 3
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- 150000008575 L-amino acids Chemical class 0.000 description 3
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 3
- WBRJVRXEGQIDRK-XIRDDKMYSA-N Leu-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 WBRJVRXEGQIDRK-XIRDDKMYSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- MFDDVIJCQYOOES-GUBZILKMSA-N Met-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N MFDDVIJCQYOOES-GUBZILKMSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 3
- 241000190967 Rhodospirillum Species 0.000 description 3
- 241000589970 Spirochaetales Species 0.000 description 3
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 3
- XZSJDSBPEJBEFZ-QRTARXTBSA-N Trp-Asn-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O XZSJDSBPEJBEFZ-QRTARXTBSA-N 0.000 description 3
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 3
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 3
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 3
- 125000003277 amino group Chemical group 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009697 arginine Nutrition 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 3
- FAPWYRCQGJNNSJ-UBKPKTQASA-L calcium D-pantothenic acid Chemical compound [Ca+2].OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O.OCC(C)(C)[C@@H](O)C(=O)NCCC([O-])=O FAPWYRCQGJNNSJ-UBKPKTQASA-L 0.000 description 3
- 229960002079 calcium pantothenate Drugs 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 229960002433 cysteine Drugs 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 235000018977 lysine Nutrition 0.000 description 3
- 108010005942 methionylglycine Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000011218 seed culture Methods 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 229960000344 thiamine hydrochloride Drugs 0.000 description 3
- 235000019190 thiamine hydrochloride Nutrition 0.000 description 3
- 239000011747 thiamine hydrochloride Substances 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 229960004441 tyrosine Drugs 0.000 description 3
- XWHHYOYVRVGJJY-UHFFFAOYSA-N 4-fluorophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-UHFFFAOYSA-N 0.000 description 2
- INPQIVHQSQUEAJ-UHFFFAOYSA-N 5-fluorotryptophan Chemical compound C1=C(F)C=C2C(CC(N)C(O)=O)=CNC2=C1 INPQIVHQSQUEAJ-UHFFFAOYSA-N 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- PWAIZUBWHRHYKS-MELADBBJSA-N Asp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)O)N)C(=O)O PWAIZUBWHRHYKS-MELADBBJSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000186146 Brevibacterium Species 0.000 description 2
- 101100148606 Caenorhabditis elegans pst-1 gene Proteins 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- QUQHPUMRFGFINP-BPUTZDHNSA-N Cys-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CS)N QUQHPUMRFGFINP-BPUTZDHNSA-N 0.000 description 2
- 238000007702 DNA assembly Methods 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 2
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 2
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 2
- SIKJAQJRHWYJAI-UHFFFAOYSA-N Indole Chemical compound C1=CC=C2NC=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 2
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 2
- UMIHVJQSXFWWMW-JBACZVJFSA-N Phe-Trp-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UMIHVJQSXFWWMW-JBACZVJFSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 2
- 241000588768 Providencia Species 0.000 description 2
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 2
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 2
- QWZIOCFPXMAXET-CIUDSAMLSA-N Ser-Arg-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QWZIOCFPXMAXET-CIUDSAMLSA-N 0.000 description 2
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 2
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229960002885 histidine Drugs 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 150000002484 inorganic compounds Chemical class 0.000 description 2
- 229910010272 inorganic material Inorganic materials 0.000 description 2
- 150000002519 isoleucine derivatives Chemical group 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 229960004452 methionine Drugs 0.000 description 2
- 230000002906 microbiologic effect Effects 0.000 description 2
- 238000002715 modification method Methods 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 229960003966 nicotinamide Drugs 0.000 description 2
- 235000005152 nicotinamide Nutrition 0.000 description 2
- 239000011570 nicotinamide Substances 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 101150108487 pst2 gene Proteins 0.000 description 2
- 229940107700 pyruvic acid Drugs 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 239000010936 titanium Substances 0.000 description 2
- 229910052719 titanium Inorganic materials 0.000 description 2
- 239000011573 trace mineral Substances 0.000 description 2
- 235000013619 trace mineral Nutrition 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- APJYDQYYACXCRM-UHFFFAOYSA-N tryptamine Chemical compound C1=CC=C2C(CCN)=CNC2=C1 APJYDQYYACXCRM-UHFFFAOYSA-N 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- WTFXTQVDAKGDEY-UHFFFAOYSA-N (-)-chorismic acid Natural products OC1C=CC(C(O)=O)=CC1OC(=C)C(O)=O WTFXTQVDAKGDEY-UHFFFAOYSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 101100159893 Aeromonas salmonicida yggA gene Proteins 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- IVKWMMGFLAMMKJ-XVYDVKMFSA-N Ala-His-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IVKWMMGFLAMMKJ-XVYDVKMFSA-N 0.000 description 1
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 1
- QQACQIHVWCVBBR-GVARAGBVSA-N Ala-Ile-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QQACQIHVWCVBBR-GVARAGBVSA-N 0.000 description 1
- LNNSWWRRYJLGNI-NAKRPEOUSA-N Ala-Ile-Val Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O LNNSWWRRYJLGNI-NAKRPEOUSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 1
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 1
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 241001465677 Ancylostomatoidea Species 0.000 description 1
- 101100533902 Arabidopsis thaliana SPL13A gene Proteins 0.000 description 1
- 101100533904 Arabidopsis thaliana SPL13B gene Proteins 0.000 description 1
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- PQWTZSNVWSOFFK-FXQIFTODSA-N Arg-Asp-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N PQWTZSNVWSOFFK-FXQIFTODSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- HIMXTOIXVXWHTB-DCAQKATOSA-N Arg-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HIMXTOIXVXWHTB-DCAQKATOSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 1
- GOKCTAJWRPSCHP-VHWLVUOQSA-N Asn-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N GOKCTAJWRPSCHP-VHWLVUOQSA-N 0.000 description 1
- NTWOPSIUJBMNRI-KKUMJFAQSA-N Asn-Lys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTWOPSIUJBMNRI-KKUMJFAQSA-N 0.000 description 1
- RDLYUKRPEJERMM-XIRDDKMYSA-N Asn-Trp-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O RDLYUKRPEJERMM-XIRDDKMYSA-N 0.000 description 1
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- 101100021490 Bacillus subtilis (strain 168) lnrK gene Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 101100379641 Escherichia coli (strain K12) argO gene Proteins 0.000 description 1
- 101100117984 Escherichia coli (strain K12) eamB gene Proteins 0.000 description 1
- 101100454725 Escherichia coli (strain K12) leuE gene Proteins 0.000 description 1
- 101100319877 Escherichia coli (strain K12) yahN gene Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 1
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 1
- UWQDKRIZSROAKS-FJXKBIBVSA-N Gly-Met-Thr Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWQDKRIZSROAKS-FJXKBIBVSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000590008 Helicobacter sp. Species 0.000 description 1
- 241000605016 Herbaspirillum Species 0.000 description 1
- 241000739044 Herbaspirillum rhizosphaerae Species 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 1
- MASWXTFJVNRZPT-NAKRPEOUSA-N Ile-Met-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)O)N MASWXTFJVNRZPT-NAKRPEOUSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 229910021578 Iron(III) chloride Inorganic materials 0.000 description 1
- QNAYBMKLOCPYGJ-UWTATZPHSA-N L-Alanine Natural products C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 1
- 235000019766 L-Lysine Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 1
- 235000014852 L-arginine Nutrition 0.000 description 1
- 229930064664 L-arginine Natural products 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- 229930182844 L-isoleucine Natural products 0.000 description 1
- 239000004395 L-leucine Substances 0.000 description 1
- 235000019454 L-leucine Nutrition 0.000 description 1
- UCUNFLYVYCGDHP-BYPYZUCNSA-N L-methionine sulfone Chemical compound CS(=O)(=O)CC[C@H](N)C(O)=O UCUNFLYVYCGDHP-BYPYZUCNSA-N 0.000 description 1
- 229930182821 L-proline Natural products 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- PPTAQBNUFKTJKA-BJDJZHNGSA-N Leu-Cys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PPTAQBNUFKTJKA-BJDJZHNGSA-N 0.000 description 1
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- VTKPSXWRUGCOAC-GUBZILKMSA-N Met-Ala-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCSC VTKPSXWRUGCOAC-GUBZILKMSA-N 0.000 description 1
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- ORRNBLTZBBESPN-HJWJTTGWSA-N Met-Ile-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ORRNBLTZBBESPN-HJWJTTGWSA-N 0.000 description 1
- JCMMNFZUKMMECJ-DCAQKATOSA-N Met-Lys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JCMMNFZUKMMECJ-DCAQKATOSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 101100043227 Oryza sativa subsp. japonica SPL13 gene Proteins 0.000 description 1
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 1
- NRKNYPRRWXVELC-NQCBNZPSSA-N Phe-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NRKNYPRRWXVELC-NQCBNZPSSA-N 0.000 description 1
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 1
- BPCLGWHVPVTTFM-QWRGUYRKSA-N Phe-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O BPCLGWHVPVTTFM-QWRGUYRKSA-N 0.000 description 1
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 1
- YRHRGNUAXGUPTO-PMVMPFDFSA-N Phe-Trp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCCCN)C(=O)O)N YRHRGNUAXGUPTO-PMVMPFDFSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 1
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- 108010009736 Protein Hydrolysates Proteins 0.000 description 1
- 241000813090 Rhizoctonia solani Species 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 101000837455 Thermus aquaticus DNA polymerase I, thermostable Proteins 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- WPSYJHFHZYJXMW-JSGCOSHPSA-N Trp-Gln-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O WPSYJHFHZYJXMW-JSGCOSHPSA-N 0.000 description 1
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 1
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- DBMMKEHYWIZTPN-JYJNAYRXSA-N Val-Cys-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N DBMMKEHYWIZTPN-JYJNAYRXSA-N 0.000 description 1
- CJDZKZFMAXGUOJ-IHRRRGAJSA-N Val-Cys-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CJDZKZFMAXGUOJ-IHRRRGAJSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- JVYIGCARISMLMV-HOCLYGCPSA-N Val-Gly-Trp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N JVYIGCARISMLMV-HOCLYGCPSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 1
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 1
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 1
- WHVSJHJTMUHYBT-SRVKXCTJSA-N Val-Met-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N WHVSJHJTMUHYBT-SRVKXCTJSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 150000001371 alpha-amino acids Chemical class 0.000 description 1
- 235000008206 alpha-amino acids Nutrition 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 235000012501 ammonium carbonate Nutrition 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003674 animal food additive Substances 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 238000000738 capillary electrophoresis-mass spectrometry Methods 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 108010079058 casein hydrolysate Proteins 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- WTFXTQVDAKGDEY-HTQZYQBOSA-N chorismic acid Chemical compound O[C@@H]1C=CC(C(O)=O)=C[C@H]1OC(=C)C(O)=O WTFXTQVDAKGDEY-HTQZYQBOSA-N 0.000 description 1
- 239000007376 cm-medium Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 241000186254 coryneform bacterium Species 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000003721 exogen phase Effects 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 235000013402 health food Nutrition 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 235000014304 histidine Nutrition 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- PZOUSPYUWWUPPK-UHFFFAOYSA-N indole Natural products CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 1
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine Natural products C1=CC=C2CC=NC2=C1 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 1
- 239000003978 infusion fluid Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- RBTARNINKXHZNM-UHFFFAOYSA-K iron trichloride Chemical compound Cl[Fe](Cl)Cl RBTARNINKXHZNM-UHFFFAOYSA-K 0.000 description 1
- RUTXIHLAWFEWGM-UHFFFAOYSA-H iron(3+) sulfate Chemical compound [Fe+3].[Fe+3].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O RUTXIHLAWFEWGM-UHFFFAOYSA-H 0.000 description 1
- 229910000360 iron(III) sulfate Inorganic materials 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 229940099596 manganese sulfate Drugs 0.000 description 1
- 239000011702 manganese sulphate Substances 0.000 description 1
- 235000007079 manganese sulphate Nutrition 0.000 description 1
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 1
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920001522 polyglycol ester Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 101150094644 rhtC gene Proteins 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- WPLOVIFNBMNBPD-ATHMIXSHSA-N subtilin Chemical compound CC1SCC(NC2=O)C(=O)NC(CC(N)=O)C(=O)NC(C(=O)NC(CCCCN)C(=O)NC(C(C)CC)C(=O)NC(=C)C(=O)NC(CCCCN)C(O)=O)CSC(C)C2NC(=O)C(CC(C)C)NC(=O)C1NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C1NC(=O)C(=C/C)/NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C2NC(=O)CNC(=O)C3CCCN3C(=O)C(NC(=O)C3NC(=O)C(CC(C)C)NC(=O)C(=C)NC(=O)C(CCC(O)=O)NC(=O)C(NC(=O)C(CCCCN)NC(=O)C(N)CC=4C5=CC=CC=C5NC=4)CSC3)C(C)SC2)C(C)C)C(C)SC1)CC1=CC=CC=C1 WPLOVIFNBMNBPD-ATHMIXSHSA-N 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 101150014795 tktA gene Proteins 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000002525 ultrasonication Methods 0.000 description 1
- 238000003828 vacuum filtration Methods 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 101150051662 yddG gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/22—Tryptophan; Tyrosine; Phenylalanine; 3,4-Dihydroxyphenylalanine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/22—Tryptophan; Tyrosine; Phenylalanine; 3,4-Dihydroxyphenylalanine
- C12P13/227—Tryptophan
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/15—Corynebacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/185—Escherichia
- C12R2001/19—Escherichia coli
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本申请涉及具有色氨酸输出活性的蛋白质变体、生产L‑色氨酸和表达蛋白质变体的微生物、以及使用该微生物生产L‑色氨酸的方法。
Description
技术领域
本公开涉及具有色氨酸输出活性的新型蛋白质变体、表达该蛋白质变体的生产L-色氨酸的微生物、以及使用该微生物生产L-色氨酸的方法。
背景技术
色氨酸(其是一种必需氨基酸)已被广泛用作饲料添加剂、药物(例如输液溶液)、保健食品材料等的原料。目前,使用微生物的直接发酵方法主要用于生产L-色氨酸。
以前,通过化学或物理突变表现出对类似物抗性的选择菌株已主要被用作生产L-色氨酸的微生物。然而,随着20世纪90年代基因重组技术的快速发展和分子水平调控机制被鉴定,主要通过利用基因工程技术使用重组菌株。
同时,能够输出特定氨基酸的基因的表达已有助于增加微生物中相应氨基酸的产率。棒杆菌属(genus Corynebacterium)微生物中L-赖氨酸输出基因(lysE)的表达增强已提高了赖氨酸的产率(WO9723597A2)。另外,大肠杆菌(E.coli)中rhtC基因的增强已提高了对L-苏氨酸的抗性,并同时也已提高了L-高丝氨酸、L-苏氨酸和L-亮氨酸的产率(EP1013765A1)。另外,专利号EP1016710B1公开了通过增强yahN、yeaS、yfiK和yggA基因提高了L-谷氨酸、L-赖氨酸、L-苏氨酸、L-丙氨酸、L-组氨酸、L-脯氨酸、L-精氨酸、L-缬氨酸和L-异亮氨酸的产率,这些基因的功能尚未在大肠杆菌中被鉴定。
然而,直到最近尚未报道对L-色氨酸显示出特异性的输出蛋白。尽管大肠杆菌的yddG基因是已知的,但它对L-苯丙氨酸比对L-色氨酸显示出更高的特异性(FEMSMicrobiol Lett 275(2007),312至318)。另外,在主要用作生产L-氨基酸发酵菌株的棒杆菌属的微生物中,尚未报道输出L-色氨酸或芳香族氨基酸的基因(J Ind MicrobiolBiotechnol.2015May;42(5):787至797)。
发明内容
[技术问题]
本公开的发明人已成功地在生产L-色氨酸的微生物中表达了对L-色氨酸具有特异性的新型色氨酸输出蛋白,且结果,他们已经发现L-色氨酸生产量显著提高了。此外,通过突变的引入进一步提高了输出相应膜蛋白的能力,他们已经确认了L-色氨酸生产量显著提高了。由此,已经完成了本公开。
[技术方案]
本公开的目的是提供具有L-色氨酸输出活性的蛋白质变体,其中选自与SEQ IDNO:1的氨基酸序列中第79位至第83位的氨基酸对应的氨基酸中的至少一个氨基酸被疏水性或脂肪族氨基酸取代。
本公开的另一目的是提供编码变体的多核苷酸;和包含多核苷酸的载体。
本公开的又一目的是提供表达蛋白质变体的生产L-色氨酸的微生物。
本公开的又一目的是提供生产L-色氨酸的方法,其包括在培养基中培养微生物。
本公开的又一目的是提供蛋白质变体的用于增加L-色氨酸生产的用途。
[技术效果]
本公开的发明人已经发现了对L-色氨酸具有特异性的新型的输出基因,并且已经尝试在生产L-色氨酸的微生物中表达该基因。结果,他们已经确认了该微生物与其中不表达该基因的其亲本菌株相比,能够显著提高L-色氨酸的生成量,并且也已经发现了由该基因编码的蛋白质变体,该变体允许该微生物更显著地提高L-色氨酸生产量,从而确认L-色氨酸可以通过其有效地生产。
附图说明
图1显示根据葡萄糖消耗的谷氨酸棒杆菌(Corynebacterium glutamicum)的修饰菌株CA04-8352和CA04-8405中的色氨酸胞内浓度。
具体实施方式
在下文中,将更详细描述本公开。同时,本公开所公开的每个描述和实施方式可以应用于不同的描述和实施方式中的每个。换句话说,本公开中所公开的各种组成部分的所有组合都被包括在本公开的范围内。进一步地,本公开的范围不应受下面提供的详细描述的限制。
本公开的一个方面提供了具有L-色氨酸输出能力的蛋白质变体,其中蛋白质变体包含SEQ ID NO:1的氨基酸序列中的至少一个突变。
突变可以包括其中选自从SEQ ID NO:1的氨基酸序列的N-端的第79个氨基酸至第83个氨基酸中的至少一个氨基酸被不同的氨基酸取代的突变。
蛋白质变体可以是具有L-色氨酸输出活性的蛋白质变体,其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位氨基酸中的至少一个氨基酸被不同的氨基酸取代。具体地,蛋白质变体可以是具有L-色氨酸输出活性的蛋白质变体,其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被疏水性氨基酸或脂肪族氨基酸取代。
如本文所用,术语“L-色氨酸”(其是α-氨基酸中的一种)是指不在体内合成的必需氨基酸,并且它是具有化学式C11H12N2O2的芳香族L-氨基酸。
在本公开中,“具有L-色氨酸输出能力的蛋白质”或“具有L-色氨酸输出活性的蛋白质”是指具有在细胞外特异性地输出L-色氨酸的活性的膜蛋白。
具有L-色氨酸输出活性的蛋白质可以是具有L-色氨酸输出活性的源自根际草螺菌(Herbaspirillum rhizosphaerae)的蛋白质。具有L-色氨酸输出活性的源自根际草螺菌的蛋白质可以是例如包含SEQ ID NO:1的氨基酸序列的蛋白质。包含SEQ ID NO:1的氨基酸序列的蛋白质可以与具有SEQ ID NO:1的氨基酸序列的蛋白质和由SEQ ID NO:1的氨基酸序列组成的蛋白质互换使用。
特别地,“根际草螺菌”是属于草螺菌属(genus Herbaspirillum)的革兰氏阴性细菌。在韩国,作为从郁陵岛(Ulleung island)等分离的菌株,根际草螺菌可以从土壤的根际分离。
另外,尽管具有L-色氨酸输出活性的本公开的蛋白质被定义为包含SEQ ID NO:1的氨基酸序列的蛋白质,但是它不排除在SEQ ID NO:1的氨基酸序列的上游或下游无意义的序列的添加、可天然发生的突变、或其沉默突变,且对于本领域技术人员是显而易见的是,具有与包含SEQ ID NO:1的氨基酸序列的蛋白质相同或相应的活性的任何蛋白质都属于具有L-色氨酸输出活性的本公开的蛋白质。具体地,例如,具有L-色氨酸输出活性的本公开的蛋白质可以是由SEQ ID NO:1的氨基酸序列组成的蛋白质、或与SEQ ID NO:1的氨基酸序列具有80%、90%、95%、97%或更高同源性或同一性的氨基酸序列组成的蛋白质。另外,显而易见的是只要该蛋白质具有上述同源性或同一性中的任何的氨基酸序列,并表现出对应于上述蛋白质的效果,则在部分序列中具有缺失、修饰、取代或添加的氨基酸序列的任何蛋白质也可以属于本公开的待突变的蛋白质的范围。
也就是说,在本公开中,即使在将其描述为“具有特定SEQ ID NO的氨基酸序列的蛋白质或多肽”或“由特定SEQ ID NO的氨基酸序列组成的蛋白质或多肽”的情况下,显而易见的是,只要该蛋白质具有与由相应SEQ ID NO的氨基酸序列组成的多肽的活性相同或对应的活性,则具有部分序列中缺失、修饰、取代或添加的氨基酸序列的任何蛋白质也可用于本公开。例如,显而易见的是,只要多肽具有与SEQ ID NO:1相同或对应的活性,则“由SEQID NO:1的氨基酸序列组成的多肽”也可以属于“由SEQ ID NO:1的氨基酸序列组成的多肽”。
本公开中提供的具有L-色氨酸输出能力的蛋白质变体可以是指这样的变体,其中在具有上述L-色氨酸输出能力的蛋白质中,在其特定位置的氨基酸被取代,并且与突变前的蛋白质的L-色氨酸输出能力相比所得到的L-色氨酸输出能力超过100%。
如本文所用,术语“变体”是指其中在保守取代和/或修饰中,至少一个氨基酸与所列举序列的氨基酸不同,但是维持蛋白质的功能和性质的蛋白质。变体通过几个氨基酸的取代、缺失或添加而与鉴定的序列不同。通常可以通过修饰上述蛋白质的氨基酸序列中的一个或多个氨基酸并评估上述修饰的蛋白质的性质来鉴定这样的变体。也就是说,相对于其天然蛋白质的能力,变体的能力可以增加、不变或减小。另外,一些变体可包括其中一个或多个部分(例如,N端前导序列或跨膜结构域)被移除的变体。其它变体可包括其中成熟蛋白质的N-和/或C-端的部分被移除的变体。术语“变体”可与“修饰”、“修饰蛋白”、“修饰多肽”、“突变体”、“突变蛋白质(mutein)”、“趋异的(divergent)”、“变体”等互换使用,但是只要这些术语用于表明被变异,待使用的术语不限于此且可以使用任何术语。为了本公开的目的,变体可指其中与天然野生型或未修饰蛋白的活性相比,突变蛋白质的活性增加的变体,但变体不限于此。
如本文所用,术语“保守取代”是指一个氨基酸被具有类似结构和/或化学性质的另一个氨基酸取代。例如,变体可保留一种或多种生物活性同时具有一个或多个保守取代。这种氨基酸取代通常可基于残基的极性、电荷、溶解度、疏水性、亲水性、和/或两亲性性质的相似性而发生。例如,在带电氨基酸中,带正电的(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸;带负电的(酸性)氨基酸包括谷氨酸和天冬氨酸。在不带电的氨基酸中,非极性氨基酸包括甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、蛋氨酸、苯丙氨酸、色氨酸、和脯氨酸;极性或亲水性氨基酸包括丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺、和谷氨酰胺;以及芳香氨基酸包括苯丙氨酸、色氨酸和酪氨酸。
进一步地,变体可包括对多肽的性质和二级结构具有最小影响的氨基酸的缺失或添加。例如,多肽可以与共翻译时或翻译后指导蛋白质转移的蛋白质N-端处的信号(或前导)序列缀合。另外,多肽也可以与另一序列或连接子缀合用于多肽的鉴定、纯化或合成。
只要取代的氨基酸与取代前的氨基酸不同,“用不同氨基酸的取代”不受限制。也就是说,只要将SEQ ID NO:1的氨基酸序列的N-端的第79个氨基酸(即亮氨酸)用亮氨酸以外的氨基酸取代;将SEQ ID NO:1的氨基酸序列的N-端的第80个氨基酸(即,丝氨酸)用丝氨酸以外的氨基酸取代;将SEQ ID NO:1的氨基酸序列的N-端的第81个氨基酸(即亮氨酸)用亮氨酸以外的氨基酸取代;将SEQ ID NO:1的氨基酸序列的N-端的第82个氨基酸(即,丝氨酸)用丝氨酸以外的氨基酸取代;或者将SEQ ID NO:1的氨基酸序列的N-端的第83个氨基酸(即异亮氨酸)用异亮氨酸以外的氨基酸取代,“用不同氨基酸的取代”不受限制。同时,当在本公开中表达为“特定氨基酸被取代”时,即使未具体说明氨基酸已被不同的氨基酸取代,显然,氨基酸被与取代之前的氨基酸不同的氨基酸取代。
可替代地,蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被取代前的氨基酸以外的氨基酸(不包括酸性氨基酸和碱性氨基酸)取代的变体。可替代地,蛋白质变体可以是具有不带电的氨基酸的变体,其中取代的氨基酸与取代前的氨基酸不同,但蛋白质变体不限于此。
可替代地,蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被与取代前的氨基酸不同的疏水性氨基酸和脂肪族氨基酸之间的氨基酸取代的变体。具体地,蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被疏水性(非极性)氨基酸和脂肪族氨基酸之间的任一个氨基酸取代的变体。脂肪族氨基酸可以是例如选自甘氨酸、丙氨酸、缬氨酸、亮氨酸、和异亮氨酸的氨基酸,但脂肪族氨基酸不限于此。疏水性(非极性)氨基酸可以是例如选自甘氨酸、蛋氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、酪氨酸、和色氨酸的氨基酸,但疏水性(非极性)氨基酸不限于此。
可替代地,蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被小尺寸氨基酸中与取代前的氨基酸不同的氨基酸取代的变体,但蛋白质变体不限于此。
如本文所用,术语“小尺寸氨基酸”包括20种氨基酸中具有相对小尺寸的氨基酸(即,甘氨酸、丙氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、和天冬酰胺),并且具体地,可以指甘氨酸、丙氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸和脯氨酸,但是小尺寸氨基酸不限于此;且更具体地,小尺寸氨基酸可以指甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、和苏氨酸,但小尺寸氨基酸不限于此。
可替代地,蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被选自丙氨酸、缬氨酸、亮氨酸和异亮氨酸的氨基酸取代的变体,但蛋白质变体不限于此。
具体地,蛋白质变体中被不同氨基酸的取代可以是选自下列取代的一个或多个取代,取代由以下取代组成:其中SEQ ID NO:1的氨基酸序列中的第79个氨基酸(即,亮氨酸)被丙氨酸、缬氨酸、或异亮氨酸取代的取代;其中SEQ ID NO:1的氨基酸序列中的第80个氨基酸(即,丝氨酸)被丙氨酸、缬氨酸、亮氨酸、或异亮氨酸取代的取代;其中SEQ ID NO:1的氨基酸序列中的第81个氨基酸(即,亮氨酸)被丙氨酸、缬氨酸、或异亮氨酸取代的取代;其中SEQ ID NO:1的氨基酸序列中的第82个氨基酸(即,丝氨酸)被丙氨酸、缬氨酸、亮氨酸、或异亮氨酸取代的取代;以及其中SEQ ID NO:1的氨基酸序列中的第83个氨基酸(即,异亮氨酸)被丙氨酸、缬氨酸、或亮氨酸取代,但取代不限于此。
由此,与突变前的蛋白质相比,本公开的蛋白质变体具有增强的L-色氨酸输出能力。
显然,本公开的蛋白质变体(其中SEQ ID NO:1的从N-端第79位至第83位的氨基酸中的至少一个氨基酸被不同的氨基酸取代)包括其中与第79位至第83位相对应的位置的氨基酸被不同的氨基酸取代的蛋白质变体。
本领域普通技术人员将能够通过应用本领域已知的确认序列比对、同源性或同一性的方法将任何序列与本公开的SEQ ID NO:1比较,来鉴定任何序列中任何位置的氨基酸是否是与SEQ ID NO:1的第79位至第83位的氨基酸相对应的氨基酸。
因此,虽然本文没有另外描述,但显然,涉及“SEQ ID NO:1的第79位至第83位的氨基酸”的描述也可以是应用于任何序列(例如与SEQ ID NO:1具有50%、60%、70%、80%、或90%、或更高同一性的序列)中的“与SEQ ID NO:1的第79位至第83位的氨基酸相对应的氨基酸”的描述。
例如,本公开的蛋白质变体可以是其中与第79位至第83位的氨基酸对应的氨基酸被不同的氨基酸取代并且与SEQ ID NO:1具有70%、80%、90%、或95%同一性的蛋白质变体,但本公开的蛋白质变体不限于此。
其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的一个或多个氨基酸被不同的氨基酸取代的蛋白质变体可以是包括SEQ ID NO:131至SEQ ID NO:147中的任何一个氨基酸序列的蛋白质变体;具体地,可以是基本上由SEQ ID NO:131至SEQ ID NO:147中的任何一个氨基酸序列组成的蛋白质变体;并且更具体地,可以是由SEQ ID NO:131至SEQ ID NO:147中的任何一个氨基酸序列组成的蛋白质变体,但是本公开的蛋白质变体不限于此。
另外,蛋白质变体可以包含SEQ ID NO:131至SEQ ID NO:147中的任何一个氨基酸序列;或氨基酸序列,其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被固定,并且其与SEQ ID NO:1具有80%或更高的同源性或同一性,但蛋白质变体不限于此。具体地,本公开的突变多肽可包括与SEQ ID NO:131至SEQ ID NO:147的任一氨基酸序列具有至少80%、90%、95%、96%、97%、98%、或99%的同源性或同一性的多肽。另外,显而易见的是,只要蛋白质具有任何上述同源性或同一性并且表现出与上述蛋白质相对应的效果,在第79位至第83位的氨基酸以外的序列部分中具有被缺失、修饰、取代、或添加的氨基酸序列的任何蛋白质也可被包括在本公开的范围内。
如本文所用,术语“同源性”或“同一性”是指两个给定氨基酸序列或核苷酸序列之间的相关程度,并且其可以表示为百分比。这些术语“同源性”和“同一性”经常可以互换使用。
保守的多核苷酸或多肽的序列同源性或同一性可以通过标准比对算法来确定,并且由使用的程序建立的默认空位罚值(default gap penalty)可以与其一起使用。实际上,同源性或同一性序列可以在中等或高度严格的条件下沿着整个序列或整个长度的至少约50%、60%、70%、80%、或90%彼此杂交。在杂交中,也可以考虑包括代替密码子的简并密码子的多核苷酸。
任意两个多核苷酸或多肽序列是否具有同源性、相似性、或同一性,可利用本领域已知的计算机算法(例如“FASTA”程序)利用Pearson等人(1988)[Proc.Natl.Acad.Sci.USA85:2444]引入的默认参数来确定。可替代地,可使用EMBOSS包的Needleman程序(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)(5.0.0或更高版本)中执行的Needleman-Wunsch算法(1970,J.Mol.Biol.48:443-453)来确定。(包括GCG程序包(Devereux,J.等人,NucleicAcids Research 12:387(1984))、BLASTP、BLASTN、FASTA(Atschul,[S.][F.][ET AL,JMOLEC BIOL 215]:403(1990);Guide to Huge Computers,Martin J.Bishop,[ED.,]Academic Press,San Diego,1994,和[CARILLO ETA/.](1988)SIAM J Applied Math 48:1073)。例如,同源性、相似性、或同一性可利用来自美国国家生物技术信息中心(NationalCenter for Biotechnology Information)数据库的BLAST或ClustalW来确定。
多核苷酸或多肽之间的同源性、相似性、或同一性可通过利用GAP计算机程序(如Smith和Waterman(Adv.Appl.Math(1981)2:482)公开的,如Needleman等人,(J MolBiol.48:443(1970))引入的程序)比较给定的序列信息来确定。简而言之,GAP程序将同源性、相似性、或同一性定义为相似的比对符号(即,核苷酸或氨基酸)的数量除以两序列中较短者的符号总数。GAP程序的默认参数可包括:(1)二进制比较矩阵(包括同一性值为1和非同一性值为0)和如Schwartz and Dayhoff,eds.描述的Gribskov等人,(Nucl.AcidsRes.14:6745(1986))的加权比较矩阵(Atlas Of Protein Sequence And Structure,National Biomedical Research Foundation,pp.353-358(1979)或EDNAFULL(NCBINUC4.4的EMBOSS版本)取代矩阵);(2)每个空位的罚值为3.0,且每个空位中的每个符号附加0.10罚值(或空位开放罚值(gap open penalty)为10和空位延伸罚值(gap extensionpenalty)为0.5);和(3)末端空位无罚值。
另外,任何两个多核苷酸或多肽序列是否具有同源性、相似性或同一性可以通过在定义的严格条件下进行的southern杂交实验来比较这些序列来确认,并且可以在本领域的范围内并通过本领域技术人员公知的方法来确定要定义的适当杂交条件(例如,J.Sambrook等人,Molecular Cloning,A Laboratory Manual,2nd Edition,Cold SpringHarbor Laboratory press,Cold Spring Harbor,New York,1989;F.M.Ausubel等人,Current Protocols in Molecular Biology,John Wiley&Sons,Inc.,纽约)。
如本文所用,关于术语蛋白质的“待表达/表达”是指其中靶蛋白被引入到微生物中或靶蛋白被修饰以在微生物中被表达的状态。当靶蛋白是存在于微生物中的蛋白时,术语是指其中与其内源蛋白的活性或其修饰前的活性相比,蛋白质的活性被增强的状态。为了本公开的目的,“靶蛋白”可以是具有上述L-色氨酸输出能力的蛋白质的变体。
具体地,术语“蛋白质的引入”意指微生物表现出其中原先不具有的特定蛋白质的活性,或与其内源蛋白活性或修饰前的蛋白活性相比,微生物表现出增强的活性。例如,术语“蛋白质的引入”可以意指将编码特定蛋白的多核苷酸引入到微生物的染色体中;或者将包括编码特定蛋白的多核苷酸的载体引入到微生物中,且从而允许表现特定蛋白的活性。另外,术语“活性的增强”意指与其内源活性或其修饰前的活性相比,特定蛋白质的活性被增强。术语“内源活性”是指在微生物的性状由于天然或人工因素导致的遗传突变而改变的情况下,修饰前亲本菌株原先具有的特定蛋白的活性。
具体地,在本公开中,可以通过选自以下的一种或多种方法来实现活性的增强,方法由以下组成:增加编码蛋白质变体的基因的细胞内拷贝数的方法;将突变引入到编码蛋白质变体的基因的表达控制序列的方法;用具有强活性的序列替换编码具有L-色氨酸输出活性的蛋白质变体的基因的表达控制序列的方法;用编码蛋白质变体的基因替换染色体上编码具有L-色氨酸输出活性的天然蛋白质的基因的方法;进一步将突变引入编码具有L-色氨酸输出活性的蛋白质的基因,使得蛋白质变体的活性被增强的方法;以及将蛋白质变体引入微生物中的方法,但增强活性方法不限于此。
在上文中,可以以基因与载体可操作地连接的形式或通过将基因插入到宿主细胞的染色体中的形式进行增加基因拷贝数的方法,但是方法不特别限于此。具体地,通过将载体引入到宿主细胞中可以增加基因的拷贝数,其中载体(编码本公开的蛋白的多核苷酸可操作地连接至载体且无论宿主细胞如何载体都能够复制和起作用)被引入到宿主细胞中。可替代地,通过将载体(多核苷酸可操作连接至载体且载体能将多核苷酸插入到宿主细胞的染色体中)引入到宿主细胞的染色体中可以增加基因的拷贝数。可以通过本领域已知的方法(例如,同源重组)实现将多核苷酸插入到染色体中。
然后,用于增加多核苷酸表达的表达控制序列的修饰可以通过以下来进行:通过缺失、插入、非保守或保守取代、或其组合来诱导核酸序列中的突变,以进一步增强表达控制序列的活性;或者通过用具有更强活性的核酸序列替换表达控制序列,但是表达控制序列的修饰方法并不特别限于此。表达控制序列可以包括启动子、操纵基因序列、编码核糖体结合位点的序列、控制转录和翻译终止的序列等,但表达控制序列不特别限于此。
可以替换原始启动子,将强启动子与多核苷酸的表达单元的上游区域连接,但不限于此。本领域已知的强启动子的实例可以包括cj1至cj7启动子(韩国专利号10-0620092)、lac启动子、trp启动子、trc启动子、tac启动子、λ噬菌体PR启动子、PL启动子、tet启动子、gapA启动子、SPL7启动子、SPL13(sm3)启动子(韩国专利号10-1783170)、O2启动子(韩国专利号10-1632642)、tkt启动子、yccA启动子等,但强启动子不限于此。
进一步地,染色体上的多核苷酸序列的修饰可以通过以下进行:通过缺失、插入、非保守或保守取代、或其组合来诱导表达控制序列上的突变,以进一步增强多核苷酸序列的活性;或者通过用改良的多核苷酸序列替换多核苷酸序列以具有更强活性,但是多核苷酸序列的修饰方法并不特别限于此。
基于野生型或未经修饰的微生物菌株中蛋白质的活性或浓度,如上所述的蛋白活性的引入和增强通常可以将相应蛋白质的活性或浓度增加至少1%、至少10%、至少25%、至少50%、至少75%、至少100%、至少150%、至少200%、至少300%、至少400%、或至少500%、和至多1000%或2000%,但增加的范围不限于此。
本公开的另一方面提供了编码以上蛋白质变体的多核苷酸。
如本文所用,术语“多核苷酸”是指作为核苷酸聚合物的具有超过一定长度的DNA或RNA链,其是通过共价键连接的核苷酸单体的长链,且更具体地,是指编码蛋白质变体的多核苷酸片段。
只要多核苷酸序列编码具有L-色氨酸输出能力的蛋白质变体,编码本公开的蛋白质变体的多核苷酸可以不受限制地包括任何多核苷酸序列。
在本公开中,编码具有L-色氨酸输出能力的蛋白质的氨基酸序列的基因可以是wex基因,可以源自根际草螺菌,具体地,可以是编码SEQ ID NO:1的氨基酸序列的核苷酸序列,且更具体地,可以是包括SEQ ID NO:2的核苷酸序列的核苷酸序列,但基因不限于此。
考虑到密码子简并性和要表达多肽的生物有机体中优选的密码子,可以在不改变多肽的氨基酸序列的范围内,在编码本公开的蛋白质变体的多核苷酸的编码区中进行各种修饰。具体地,可以不受限制地包括编码蛋白质变体(其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被不同的氨基酸取代)的任何多核苷酸序列。例如,本公开的多核苷酸可以是本公开的蛋白质变体,且具体地,可以是编码包括SEQID NO:131至SEQ ID NO:147中任一个的氨基酸序列的蛋白质、或者具有与蛋白质同源性或同一性的多肽的多核苷酸序列,但本公开的多核苷酸不限于此,且更具体地,可以是包括SEQ ID NO:80、81、82、89、90、91、92、101、102、103、110、111、112、113、122、123和124的多核苷酸序列中任一个多核苷酸序列的多核苷酸,但本公开的多核苷酸不限于此。同源性和同一性与上述相同。
此外,可以不受限制地包括通过与可由已知的基因序列制备的任何探针(例如,对上述多核苷酸序列的全部或部分的互补序列)在严格条件下杂交而编码蛋白质变体(其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被不同的氨基酸取代)的任何序列。
术语“严格条件”是指使多核苷酸之间能够特异性杂交的条件。这些条件被具体的描述在文献(例如,J Sambrook等人,同上)中。例如,条件可以包括在具有高同源性(同源性是40%或更高、具体地是90%或更高、更具体地是95%或更高、甚至更具体地是97%或更高、和最具体地是99%或更高)的基因之间进行杂交,而在具有低于上述同源性的同源性的基因之间不进行杂交;或在southern杂交的常规洗涤条件下进行,即,在对应于60℃、1×SSC、和0.1%SDS,具体地60℃、0.1×SSC、和0.1%SDS,和更具体地68℃、0.1×SSC、和0.1%SDS的盐浓度和温度下,洗涤一次、具体地两次或三次。然而,杂交条件不限于此,而可以由本领域技术人员根据目的适当地调节。
尽管根据杂交的严格程度,碱基之间的错配是可能的,但杂交需要两个核苷酸包含互补序列。术语“互补”用于描述能够彼此杂交的核苷酸碱基之间的关系。例如,关于DNA,腺苷与胸腺嘧啶互补,以及胞嘧啶与鸟嘌呤互补。因此,本公开可包括与整个序列互补的分离的多核苷酸片段以及实质上相似的多核苷酸序列。
具体地,可在55℃的Tm值下,使用杂交条件(其包括杂交步骤)并使用上述条件来检测具有同源性的多核苷酸。另外,Tm值可以是60℃、63℃、或65℃,但温度不限于此,并且可以由本领域技术人员根据目的适当地调节。
适合于多核苷酸杂交的严格程度取决于多核苷酸的长度和互补程度,并且变量在本领域是公知的(参见Sambrook等人,同上,9.50至9.51和11.7至11.8)。
本公开的又一方面提供了载体,其包括编码蛋白质变体的多核苷酸。
如本文所用,术语“载体”是指包括编码靶蛋白的多核苷酸的核苷酸序列的DNA构建体,编码靶蛋白的多核苷酸的核苷酸序列可操作地连接至合适的控制序列,使得靶蛋白可以在合适的宿主中表达。控制序列包括能够启动转录的启动子、用于控制转录的任何操纵基因序列、编码适当的mRNA核糖体结合位点的序列、以及控制转录和翻译终止的序列。转化到合适的宿主细胞中以后,载体可以与宿主基因组无关地复制或起作用,或者可以整合到宿主基因组本身中。
本公开中所用的载体不受特别限制,而可以使用本领域已知的任何载体。常规使用的载体的实例可以包括天然或重组质粒、粘粒、病毒和噬菌体。例如,pWE15、M13、MBL3、MBL4、IXII、ASHII、APII、t10、t11、Charon4A、Charon21A等可以用作噬菌体载体或粘粒载体;且基于pBR、pUC、pBluescriptII、pGEM、pTZ、pCL、pET等的载体可以用作质粒载体。具体地,可以使用载体,如pDZ、pACYC177、pACYC184、pCL、pECCG117、pUC19、pBR322、pMW118、pCC1BAC等。
例如,可以通过用于细胞内染色体插入的载体,用突变的多核苷酸替换染色体中编码靶蛋白的多核苷酸。可以使用本领域已知的任何方法(例如,同源重组)进行将多核苷酸插入到染色体中,但方法不限于此。载体可以进一步包括用于确认其成功插入到染色体中的选择标记。选择标记用于选择用载体转化的细胞,即以确认靶核酸分子是否已经成功插入,并且可以使用能够提供可选择表型的标记(例如,抗药性、辅源营养、对细胞毒剂的抗性,和表面蛋白的表达等)。在处理选择剂的情况下,只有能够表达选择标记的细胞才能够存活或表达其它表型性状,从而能够容易地选择经转化的细胞。
本公开的另一个目的是提供生产L-色氨酸的微生物,其表达具有L-色氨酸输出活性的蛋白质变体。
如本文所用,术语“生产L-色氨酸的微生物”是指与野生型或未经修饰的微生物菌株相比,能够在培养基中从碳源过量生产L-色氨酸的微生物。另外,生产L-色氨酸的微生物可以是重组微生物。具体地,该微生物可以是肠杆菌属(genus Enterobacter)的微生物、埃希氏菌属(genus Escherichia)的微生物、欧文氏菌属(genus Erwinia)的微生物、沙雷氏菌属(genus Serratia)的微生物、普罗威登斯菌属(genus Providencia)的微生物、棒杆菌属的微生物、或短杆菌属(genus Brevibacterium)的微生物,但只要该微生物能生产L-色氨酸,微生物的类型不特别地受限制。更具体地,微生物可以是棒杆菌属的微生物或埃希氏菌属的微生物。
甚至更具体地,埃希氏菌属的微生物可以是大肠杆菌,以及棒杆菌属的微生物可以是谷氨酸棒杆菌,但是可以不受限制地包括其中引入具有L-色氨酸输出活性的蛋白质或活性增强且因此L-色氨酸生产量能增加的埃希氏菌属或棒杆菌属的任何微生物。
在上述微生物中,可以使用通过增强tktA基因的表达或通过阻断L-色氨酸生物合成途径中的分支途径以连续供应前体(例如,赤藓糖-4-磷酸;E4P)和有效能量利用来增加L-色氨酸生物合成的方法、或使用利用较少量ATP的方法等,来增加L-色氨酸生产量。
具体地,在本公开中,只要亲本菌株是生产L-色氨酸的微生物,生产L-色氨酸的微生物(其表达具有L-色氨酸输出活性的蛋白质或蛋白质变体,或者其被修饰使得具有L-色氨酸输出活性的蛋白质或蛋白质变体能被表达)的亲本菌株不特别地被限制。生产L-色氨酸的微生物可以是其中竞争途径中的基因、L-色氨酸操纵基因的定向途径中的调节子、用于输入L-色氨酸的基因、或用于输入和分解L-色氨酸的基因的活性被削弱或失活,以增强L-色氨酸生物合成途径的微生物;和/或可以是其中L-色氨酸操纵基因活性被过表达的微生物。具体地,与其内源活性相比,trpR(即,用于调控色氨酸合成的酶组的基因,其可抑制L-色氨酸生物合成基因(trpEDCBA)的表达)的活性、或Mtr(即,将细胞外L-色氨酸输入到细胞中的膜蛋白)的活性可以被削弱或除去。
为了实现上述目的,本公开的另一方面提供了用于生产色氨酸的方法,其包括在培养基中培养表达蛋白质变体的生产L-色氨酸的微生物。
L-色氨酸、具有L-色氨酸输出活性和包含SEQ ID NO:1的氨基酸序列的蛋白质、蛋白质的表达和微生物与上述相同。
如本文所用,术语“培养”意指使微生物在适当控制的环境条件下生长。本公开的培养过程可以在本领域已知的合适培养基和培养条件下进行。根据待选择的菌株,本领域技术人员可以容易地调节这种培养过程以供使用。具体地,培养过程可以以本领域已知的分批培养、连续培养和补料分批培养进行,但培养过程不限于此。
如本文所用,术语“培养基”是指含有培养微生物所需的营养物质作为主要成分的物质混合物,并且其提供了营养物质、生长因子等以及对生存和生长至关重要的水。具体地,作为用于培养本公开的微生物使用的培养基和其它培养条件可以不受特别限制地使用微生物常规培养使用的任何培养基。然而,可以在需氧条件下在含有适当碳源、氮源、磷源、无机化合物、氨基酸和/或维生素等的常规培养基中,同时调节温度、pH等来培养本公开的微生物。
在本公开中,碳源可以包括碳水化合物(例如,葡萄糖、果糖、蔗糖、麦芽糖等);糖醇(例如,甘露醇、山梨糖醇等);有机酸(例如,丙酮酸、乳酸、柠檬酸等);氨基酸(例如,谷氨酸、蛋氨酸、赖氨酸等)等。另外,碳源可以包括天然有机营养物(例如,淀粉水解物、糖蜜、黑糖蜜、米糠、木薯、甘蔗糖蜜、玉米浆等)。具体地,可以使用碳水化合物,如葡萄糖和灭菌的预处理糖蜜(即,糖蜜被转化为还原糖),且另外,可以不受限制地使用适当量的各种其它碳源。可以单独使用或以两种或多种的组合使用这些碳源,但碳源不限于此。
氮源的实例可以包括无机氮源(例如,氨、硫酸铵、氯化铵、乙酸铵、磷酸铵、碳酸铵、硝酸铵等);氨基酸(例如,谷氨酸、蛋氨酸、谷氨酰胺等);和有机氮源(例如,蛋白胨、N-Z胺、肉提取物、酵母提取物、麦芽提取物、玉米浆、酪蛋白水解产物、鱼或其分解产物、脱脂大豆饼或其分解产物等)。可以单独使用或以两种或多种的组合使用这些氮源,但氮源不限于此。
磷源的实例可以包括磷酸二氢钾、磷酸氢二钾、相应的含钠盐等。无机化合物的实例可以包括氯化钠、氯化钙、氯化铁、硫酸镁、硫酸铁、硫酸锰、碳酸钙等。另外,除此之外,可以包括氨基酸、维生素和/或适当的前体。可以将这些构成成分或前体添加到分批培养或连续培养的培养基中,但不限于此。
在本公开中,通过以适当的方式向培养基添加化合物(例如,氢氧化铵、氢氧化钾、氨、磷酸、硫酸等),可以在培养微生物期间调节培养基的pH值。另外,在培养期间,可以添加消泡剂(例如,脂肪酸聚乙二醇酯)以防止泡沫产生。另外,可以将氧气或含氧气体注入到培养基中以维持培养基的需氧状态;或者,可以在不注入气体或将氮、氢或二氧化碳气体注入到培养基中以便维持培养基的厌氧或微需氧状态,但气体不限于此。
培养基温度可以在从20℃至50℃的范围内,并具体地在从30℃至37℃的范围内,但培养基温度不限于此。可以继续培养直至获得所需量的有用物质,并具体地培养10至100小时,但培养周期不限于此。
生产方法可包括从培养的培养基或微生物中回收L-色氨酸。
在回收色氨酸的步骤中,可以使用本公开的用于培养微生物的方法(例如,根据分批培养过程、连续培养过程或补料分批培养过程,使用本领域已知的合适方法)从培养基中回收期望的L-色氨酸。例如,可以单独或组合使用诸如离心、过滤、用蛋白结晶沉淀剂处理(盐析法)、萃取、超声波破碎、超滤、透析、各种色谱(例如,分子筛色谱(凝胶过滤)、吸附色谱、离子交换色谱、亲和色谱法等)和HPLC的方法,但是方法不限于此。
生产方法可以包括纯化过程。在纯化过程中,可以使用本领域已知的适当纯化方法纯化回收的L-色氨酸。
本公开的另一方面提供了增加微生物的L-色氨酸输出能力的方法,其包括修饰微生物,使得具有L-色氨酸输出活性的蛋白质变体(其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位氨基酸中的至少一个氨基酸被不同的氨基酸取代)可以在微生物中表达。
本公开的又一方面提供了蛋白质变体的用于增加L-色氨酸输出能力的用途。
本公开的又一方面提供了蛋白质变体的用于增加L-色氨酸生产能力的用途。
由于本公开的蛋白质变体可增加微生物的L-色氨酸输出能力,因此其可用于增加L-色氨酸的生产。蛋白质变体和其它氨基酸与上述相同。
实施例
在下文中,将通过示例性实施方式详细描述本公开。然而,提供这些示例性实施方式仅是为了说明的目的,而不意图限制本公开的范围。
实施例1:输出基因的筛选和选择
作为以具有YdeD(即,源自大肠杆菌的EamA家族)的氨基酸序列作为查询序列基于NCBI和KEGG数据库的PSI-BLAST筛选结果,选择了被认为能够输出色氨酸的膜蛋白的30个候选基因和具有这些基因的生物有机体。在它们中,考虑到适用于生产菌株的生物安全水平和可用性,选择了5种生物有机体,如下表1所示。
[表1]预期具有能够输出芳香族氨基酸的膜蛋白的微生物
实施例2:制备其中引入源自根际草螺菌的基因的棒杆菌属微生物
编码实施例1中选择的源自根际草螺菌的膜蛋白的基因具有SEQ ID NO:1的氨基酸序列。关于编码膜蛋白的基因及其相邻核苷酸序列的信息(登记号NZ_LFLU01000012.1)获自NIH基因库(NIH GenBank)。
基于获得的核苷酸序列信息合成了用于将源自根际草螺菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自根际草螺菌的基因,使用根际草螺菌菌株的染色体DNA作为模板以及SEQ ID NO:3和SEQ ID NO:4的引物进行了PCR。使用SolgTMPfu-X DNA聚合酶作为聚合酶,以及如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火40秒,以及在72℃下聚合1分钟;以及在72℃下聚合5分钟。
结果,获得了956 bp的基因片段,其包含924 bp的基因(SEQ ID NO:2)。
SEQ ID NO:3(wex-1)
TAGAGGAGACACAACATGAATAGCAAGAAGGCCAC
SEQ ID NO:4(wex-2)
ggctcttcctgtttAGTCTACAAACAGTCCGCCAC
为了获得源自谷氨酸棒杆菌的gapA启动子,使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:6的引物进行了PCR。使用SolgTM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)作为聚合酶,以及如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火40秒,以及在72℃下聚合30秒;以及在72℃下聚合5分钟。
SEQ ID NO:5(PgapA-1)
cccttccggtttAGTTTGAAGCCAGTGTGAGTTGC
SEQ ID NO:6(PgapA(-wex)-2)
CTTCTTGCTATTCATGTTGTGTCTCCTCTAAAGATTGTA
通过Gibson装配方法(DG Gibson等人,NATURE METHODS,VOL.6 NO.5,MAY 2009,NEBuilder HiFi DNA Assembly Master Mix)克隆了扩增的gapA启动子区域、源自根际草螺菌的基因片段和用ScaI限制性酶切割的pDZTn载体(韩国专利号10-1126041),以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Hrh。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合,然后在50℃下温育1小时来进行了克隆。
通过电穿孔将制备的pDZTn-PgapA-Hrh载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中(Appl.Microbiol.Biotechnol.(1999)52:541-545)以及然后进行二次交换以获得其中一个拷贝的PgapA-Hrh基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
SEQ ID NO:7(确认_PgapA-wex-1)
CGGATTATGCCAATGATGTG
SEQ ID NO:8(确认_PgapA-wex-2)
CACGATCACCAACATTCAGG
将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Hrh。
实施例3:制备其中引入源自施氏假单胞菌的基因的棒杆菌属微生物
编码实施例1中选择的源自施氏假单胞菌的膜蛋白的基因具有SEQ ID NO:9的氨基酸序列。关于相应基因及其相邻核苷酸序列的信息(登记号NC_018177.1)获自NIH基因库。
基于获得的核苷酸序列信息合成了用于将源自施氏假单胞菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自施氏假单胞菌的基因,使用施氏假单胞菌菌株的染色体DNA作为模板以及SEQ ID NO:11和SEQ ID NO:12的引物以与实施例2中相同的方式进行了PCR。
结果,获得了977 bp的基因片段,其包含945 bp的输出基因(SEQ ID NO:10)。
SEQ ID NO:11(Pst-1)
TAGAGGAGACACAACATGAAAAACCAGCGTAAAGC
SEQ ID NO:12(Pst-2)
ggctcttcctgtttAGTTTATCCGTTTCGACGCGG
对于使用源自谷氨酸棒杆菌的gapA启动子,使用谷氨酸棒杆菌ATCC13869的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:13的引物以与实施例2中相同的方式进行了PCR。
SEQ ID NO:13(PgapA(-Pst)-2)
ACGCTGGTTTTTCATGTTGTGTCTCCTCTAAAGATTGTA
通过Gibson装配方法克隆了扩增的gapA启动子区域、源自施氏假单胞菌的基因片段和用ScaI限制性酶切割的pDZTn载体,以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Pst。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合,然后在50℃下温育1小时来进行了克隆。
通过电穿孔将制备的pDZTn-PgapA-Pst载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中(Appl.Microbiol.Biotechnol.(1999)52:541-545)以及然后进行二次交换以获得其中一个拷贝的PgapA-Pst基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Pst。
实施例4:制备其中引入源自粪产碱菌的基因的棒杆菌属微生物
编码实施例1中选择的源自粪产碱菌的膜蛋白的基因具有SEQ ID NO:14的氨基酸序列。关于相应基因及其相邻核苷酸序列的信息(登记号NZ_CP013119.1)获自NIH基因库。
基于获得的核苷酸序列信息合成了将源自粪产碱菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自粪产碱菌的基因,使用粪产碱菌菌株的染色体DNA作为模板以及SEQ ID NO:16和SEQ ID NO:17的引物以与实施例2中相同的方式进行了PCR。
结果,获得了943bp的基因片段,其包含912bp的输出基因(SEQ ID NO:15)。
SEQ ID NO:16(Afa-1)
TAGAGGAGACACAACATGAAGCAATCTGATAAGGC
SEQ ID NO:17(Afa-2)
gctcttcctgtttAGTTCAGGCAGCGCTTTTTAGT
为了获得源自谷氨酸棒杆菌的gapA启动子,使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:18的引物以与实施例2中相同的方式进行了PCR。
SEQ ID NO:18(PgapA(-Afa)-2)
ATCAGATTGCTTCATGTTGTGTCTCCTCTAAAGATTGTA
通过Gibson装配方法克隆了扩增的gapA启动子区域、源自粪产碱菌的基因片段和用ScaI限制性酶切割的pDZTn载体,以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Afa。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合,然后在50℃下温育1小时来进行了克隆。
通过电穿孔将制备的pDZTn-PgapA-Afa载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中以及然后进行二次交换以获得其中一个拷贝的PgapA-Afa基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Afa。
实施例5:制备其中引入源自钩虫贪铜菌的基因的棒杆菌属微生物
编码实施例1中选择的源自钩虫贪铜菌的膜蛋白的基因具有SEQ ID NO:19的氨基酸序列。关于相应基因及其相邻核苷酸序列的信息(登记号AM260480.1)获自NIH基因库。
基于获得的核苷酸序列信息合成了将源自钩虫贪铜菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自钩虫贪铜菌的基因,使用钩虫贪铜菌菌株的染色体DNA作为模板以及SEQ ID NO:21和SEQ ID NO:22的引物以与实施例2中相同的方式进行了PCR。
结果,获得了977bp的基因片段,其包含源自钩虫贪铜菌的945bp的输出基因(SEQID NO:20)。
SEQ ID NO:21(Cne-1)
TAGAGGAGACACAACATGCAAAGCAAGAGCAAAGC
SEQ ID NO:22(Cne-2)
ggctcttcctgtttAGTTCACGGTTCCTGGACACG
为了获得源自谷氨酸棒杆菌的gapA启动子,使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:23的引物以与实施例2中相同的方式进行了PCR。
SEQ ID NO:23(PgapA(-Cne)-2)
GCTCTTGCTTTGCATGTTGTGTCTCCTCTAAAGATTGTA
通过Gibson装配方法克隆了扩增的gapA启动子区域、源自钩虫贪铜菌的基因片段和用ScaI限制性酶切割的pDZTn载体,以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Cne。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合,然后在50℃下温育1小时来进行了克隆。
通过电穿孔将制备的pDZTn-PgapA-Cne载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中以及然后进行二次交换以获得其中一个拷贝的PgapA-Cne基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Cne。
实施例6:制备其中引入源自大肠杆菌str.K-12substr.MG1655的基因的棒杆菌属
微生物
编码实施例1中选择的源自大肠杆菌str.K-12substr.MG1655的膜蛋白的基因具有SEQ ID NO:24的氨基酸序列。关于相应基因及其相邻核苷酸序列的信息(登记号NC_000913.3)获自NIH基因库。
基于获得的核苷酸序列信息合成了将源自大肠杆菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自大肠杆菌的基因,使用大肠杆菌菌株的染色体DNA作为模板以及SEQ ID NO:26和SEQ ID NO:27的引物以与实施例2中相同的方式进行了PCR。
结果,获得了913bp的基因片段,其包含882bp的输出基因(SEQ ID NO:25)。
SEQ ID NO:26(Eco-1)
TAGAGGAGACACAACATGACACGACAAAAAGCAAC
SEQ ID NO:27(Eco-2)
gctcttcctgtttAGTTTAACCACGACGTGTCGCC
为了获得源自谷氨酸棒杆菌的gapA启动子,使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:28的引物以与实施例2中相同的方式进行了PCR。
SEQ ID NO:28(PgapA(-Eco)-2)
TTTTTGTCGTGTCATGTTGTGTCTCCTCTAAAGATTG
通过Gibson装配方法克隆了扩增的gapA启动子区域、源自大肠杆菌的基因片段和用ScaI限制性酶切割的pDZTn载体,以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Eco。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合,然后在50℃下温育1小时来进行了克隆。
通过电穿孔将制备的pDZTn-PgapA-Eco载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中以及然后进行二次交换以获得其中一个拷贝的PgapA-Eco基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Eco。
实施例7:测量其中引入源自各种微生物的基因的棒杆菌属微生物菌株中的MIC
为了确认在实施例2至6中制备的5种类型谷氨酸棒杆菌菌株(即,ATCC13869::PgapA-Hrh、ATCC13869::PgapA-Pst、ATCC13869::PgapA-Afa、ATCC13869::PgapA-Cne和ATCC13869::PgapA-Eco)中色氨酸输出活性的存在,使用色氨酸类似物和苯丙氨酸类似物(即,另一种芳香族氨基酸)进行了最小抑制浓度(MIC)实验。将5种不同的谷氨酸棒杆菌菌株(每种引入有编码膜蛋白的基因)在基本液体培养基中在30℃下培养了24小时,分别稀释至3×103个细胞和3×104个细胞的浓度,以及然后在其中添加了色氨酸类似物和苯丙氨酸类似物的基本固体培养基中进行点样培养。
对于最小抑制浓度(MIC)实验,将p-氟-DL-苯丙氨酸(2.5 mg/mL)或5-氟-DL-色氨酸(0.25μg/mL)添加到最小固体培养基中,并在60小时后观察细胞生长(表2)。
在其中以2.5 mg/mL的浓度添加了苯丙氨酸类似物的条件下,选择的5种类型基因的引入全部能够使细胞生长。在它们中,源自根际草螺菌、粪产碱菌和大肠杆菌的基因的引入显示了最高的细胞生长。与以上三种菌株相比,源自施氏假单胞菌的基因的引入显示出细胞生长略微减少,并且源自钩虫贪铜菌的基因的引入显示出最低的细胞生长。在相同条件下,野生型ATCC13869菌株不生长。另外,在以0.25μg/mL的浓度添加了色氨酸类似物的条件下,仅源自根际草螺菌的基因的引入能够使细胞生长。
从上述结果可以看出,据观察即使引入之间存在活性差异,所选择的5种类型基因的引入全部显示出对苯丙氨酸和苯丙氨酸类似物的抗性。相反,关于色氨酸和色氨酸类似物,仅源自根际草螺菌的基因的引入显示出对其具有特异性和优异的抗性。基于这些结果,可以解释为仅由源自根际草螺菌的基因编码的膜蛋白可以作为对于色氨酸的输出蛋白。
基本培养基(pH7.2)
葡萄糖10g、KH2PO4 1g、K2HPO4 2g、MgSO4.7H2O 0.4g、尿素2g、(NH4)2SO4 5g、NaCl0.5g、烟酰胺5μg、泛酸钙0.1μg、生物素0.2μg、硫胺素盐酸盐(Thiamine HCl)3μg、痕量元素溶液1 mL(基于1L蒸馏水)
痕量元素溶液
Na2B4O7 10H2O 0.09 g、(NH4)6Mo7O27 4H2O 0.04 g、ZnSO4.7H2O 0.01 g、CuSO4 5H2O0.27 g、MnCl2.4H2O 0.01 g、FeCl3.6H2O 1 g、CaCl2 0.01 g(基于1L蒸馏水)
[表2]在含有苯丙氨酸类似物或色氨酸类似物的基本培养基中,其中引入源自各种微生物的基因的谷氨酸棒杆菌菌株的生长
实施例8:制备其中引入源自各种微生物的基因的用于大肠杆菌的表达载体
为了确认源自实施例1中所选择的各种微生物的基因在大肠杆菌中对色氨酸或其类似物的抗性,将基因中的每种克隆到pCL1920(即,大肠杆菌表达载体)中并用大肠杆菌W3110的yccA启动子表达。
为了获得源自根际草螺菌的基因片段,使用根际草螺菌菌株的染色体DNA作为模板以及SEQ ID NO:29和SEQ ID NO:30的引物进行了PCR。将SolgTM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)用作聚合酶,并如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火40秒,以及在72℃下聚合1分钟;以及在72℃下聚合5分钟。
SEQ ID NO:29(Hrh-3)
ATAGAGAGTGACTCAATGAATAGCAAGAAGGCCAC
SEQ ID NO:30(Hrh-4)
TCGAGCTCGGTACCCCTACAAACAGTCCGCCAC
为了获得源自大肠杆菌W3110的yccA启动子,使用大肠杆菌W3110的基因组DNA作为模板以及SEQ ID NO:31和SEQ ID NO:32的引物进行PCR。将SolgTM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)用作聚合酶,以及如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火40秒,以及在72℃下聚合10秒;以及在72℃下聚合5分钟。
SEQ ID NO:31(PyccA-1)
CTCTAGAGGATCCCCTTCCAGATCAAATGCGTAA
SEQ ID NO:32(PyccA(-Hrh)-2)
CTTCTTGCTATTCATTGAGTCACTCTCTATGACAG
通过Gibson装配方法克隆了扩增的yccA启动子区域、源自根际草螺菌的基因片段和用SmaI限制性酶切割的pCL1920载体(pSC101ori,Spr),以及从而获得了重组质粒。将重组质粒命名为pCL1920-PyccA-Hrh。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合,然后在50℃下温育1小时来进行了克隆。将获得的pCL1920-PyccA-Hrh引入到野生型大肠杆菌W3110中,以及从而制备了W3110/pCL1920-PyccA-Hrh(即,其中表达基因的转化体)。
为了获得源自施氏假单胞菌的基因片段,使用施氏假单胞菌菌株的染色体DNA作为模板以及SEQ ID NO:33和SEQ ID NO:34的引物进行了PCR。另外,以与从上述根际草螺菌菌株获得基因片段相同的方式进行了PCR,不同之处在于使用了SEQ ID NO:35的引物,该引物用于获得源自大肠杆菌W3110的yccA启动子供使用。
SEQ ID NO:33(Pst-3)
ATAGAGAGTGACTCAATGAAAAACCAGCGTAAAGC
SEQ ID NO:34(Pst-4)
TCGAGCTCGGTACCCTTATCCGTTTCGACGCGG
SEQ ID NO:35(PyccA(-Pst)-2)
ACGCTGGTTTTTCATTGAGTCACTCTCTATGACAG
由此,获得了重组质粒并将其命名为pCL1920-PyccA-Pst。将表达载体pCL1920-PyccA-Pst转化到野生型大肠杆菌W3110中,以及从而制备了W3110/pCL1920-PyccA-Pst(即,其中表达基因的转化体)。
其中表达源自粪产碱菌菌株的基因的转化体的制备过程与上述相同,不同之处在于使用粪产碱菌菌株的染色体DNA作为模板以及SEQ ID NO:36和SEQ ID NO:37的引物进行了PCR,以及使用了用于获得yccA启动子的SEQ ID NO:38的引物。
SEQ ID NO:36(Afa-3)
ATAGAGAGTGACTCAATGAAGCAATCTGATAAGGC
SEQ ID NO:37(Afa-4)
TCGAGCTCGGTACCCTCAGGCAGCGCTTTTTAGT
SEQ ID NO:38(PyccA(-Afa)-2)
ATCAGATTGCTTCATTGAGTCACTCTCTATGACAG
由此,获得了在其中克隆了源自粪产碱菌的基因的重组质粒并将其命名为pCL1920-PyccA-Afa。将表达载体pCL1920-PyccA-Afa转化到野生型大肠杆菌W3110中,以及从而制备了W3110/pCL1920-PyccA-Afa(即,转化体)。
为了获得源自钩虫贪铜菌菌株的基因片段,使用钩虫贪铜菌菌株的染色体DNA作为模板以及SEQ ID NO:39和SEQ ID NO:40的引物进行了PCR。另外,以与从上述根际草螺菌菌株获得基因片段相同的方式进行了PCR,不同之处在于使用SEQ ID NO:41的引物,该引物用于获得源自大肠杆菌W3110的yccA启动子供使用。
SEQ ID NO:39(Cne-3)
ATAGAGAGTGACTCAATGCAAAGCAAGAGCAAAGC
SEQ ID NO:40(Cne-4)
TCGAGCTCGGTACCCTCACGGTTCCTGGACACG
SEQ ID NO:41(PyccA(-Cne)-2)
GCTCTTGCTTTGCATTGAGTCACTCTCTATGACAG
由此,获得了重组质粒并将其命名为pCL1920-PyccA-Cne。将表达载体pCL1920-PyccA-Cne转化到野生型大肠杆菌W3110中,以及从而制备了W3110/pCL1920-PyccA-Cne(即,其中表达基因的转化体)。
为了获得源自大肠杆菌菌株的基因片段,使用大肠杆菌str.K-12substr.MG1655菌株的染色体DNA作为模板以及SEQ ID NO:42和SEQ ID NO:43的引物进行了PCR。另外,以与从上述根际草螺菌菌株获得基因片段相同的方式进行了PCR,不同之处在于使用SEQ IDNO:44的引物,该引物用于获得源自大肠杆菌W3110的yccA启动子供使用。
SEQ ID NO:42(Eco-3)
ATAGAGAGTGACTCAATGACACGACAAAAAGCAAC
SEQ ID NO:43(Eco-4)
TCGAGCTCGGTACCCTTAACCACGACGTGTCGCC
SEQ ID NO:44(PyccA(-Eco)-2)
TTTTTGTCGTGTCATTGAGTCACTCTCTATGACAG
由此,获得了重组质粒并将其命名为pCL1920-PyccA-Eco。将表达载体pCL1920-PyccA-Eco引入到野生型大肠杆菌W3110中,以及从而制备了W3110/pCL1920-PyccA-Cne(即,其中表达基因的转化体)。
实施例9:测量其中过表达源自各种微生物的膜蛋白的基因的大肠杆菌的MIC
为了确认其中过表达实施例8中制备的5种类型基因的大肠杆菌菌株(即,W3110/pCL1920-PyccA-Hrh、W3110/pCL1920-PyccA-Pst、W3110/pCL1920-PyccA-Afa、W3110/pCL1920-PyccA-Cne、和W3110/pCL1920-PyccA-Eco)的抗性,使用色氨酸类似物和苯丙氨酸类似物进行了最小抑制浓度(MIC)实验。将其中过表达5种类型基因的大肠杆菌菌株在含有壮观霉素(50μg/mL)的M9基本液体培养基中在37℃下培养了15小时,分别稀释至104个细胞和105个细胞的浓度,以及然后在其中添加了色氨酸类似物或苯丙氨酸类似物的含有壮观霉素(50μg/mL)的M9葡萄糖基本固体培养基中点样培养。对于最小抑制浓度(MIC)实验,将p-氟-DL-苯丙氨酸(2mg/mL)或5-氟-DL-色氨酸(0.7μg/mL)添加到M9基本固体培养基中,以及在48小时后观察细胞生长(表3)。
如同在谷氨酸棒杆菌菌株中,当过表达源自大肠杆菌的基因时,在添加了苯丙氨酸类似物的条件下,大肠杆菌菌株显示出优异的生长,并且源自粪产碱菌的基因的过表达也显示出显著的生长。然而,源自根际草螺菌、施氏假单胞菌、和钩虫贪铜菌的基因的过表达未显示出与W3110/pCL1920(即,对照组)中相当的生长。相反,全部5种类型所选择的基因的过表达使得在添加色氨酸类似物的条件下使全部细胞生长成为可能。在它们中,源自根际草螺菌的基因的过表达显示出最高的生长,并且源自粪产碱菌和大肠杆菌的输出基因的过表达显示出第二高的生长。源自施氏假单胞菌和钩虫贪铜菌的输出基因的过表达显示出可忽略的生长。
关于大肠杆菌菌株中5种类型基因的MIC实验结果与谷氨酸棒杆菌中观察的那些相似。源自根际草螺菌的基因在谷氨酸棒杆菌和大肠杆菌菌株中均显示出对色氨酸及其类似物的特异性和优异的抗性,且源自大肠杆菌的输出基因显示出对苯丙氨酸及其类似物的输出抗性高于对色氨酸的输出抗性。从这些结果,确定了源自根际草螺菌的基因显示出对谷氨酸棒杆菌和大肠杆菌菌株中的色氨酸的特异性和优异的输出能力。
[表3]在含有苯丙氨酸类似物或色氨酸类似物的基本培养基中,其中每个基因过表达的大肠杆菌菌株的生长
参考例1:制备谷氨酸棒杆菌属的生产L-色氨酸的微生物
生产L-色氨酸的菌株是从野生型谷氨酸棒杆菌ATCC13869中开发的。由于野生型谷氨酸棒杆菌不能生产L-色氨酸,或者即使可能的话,也只能生产非常少量,因此尝试使用其中增强生产L-色氨酸所必需的生物合成途径的菌株作为亲本菌株。具体地,通过增强启动子增加了L-色氨酸生物合成基因的操纵基因的表达。另外,为了释放TrpE蛋白的反馈抑制,TrpE的第38个氨基酸(即,丝氨酸)被精氨酸取代(Journal of Bacteriology,Nov.1987,p.5330-5332)。
对于上述遗传操作,首先,获得了trpE启动子的上游区域和TrpE的第38个氨基酸突变的下游区域用于染色体中的同源重组。具体地,通过使用谷氨酸棒杆菌的染色体DNA作为模板以及SEQ ID NO:45和SEQ ID NO:46的引物进行了PCR,获得了trpE启动子上游区域的遗传片段,而通过使用谷氨酸棒杆菌的染色体DNA作为模板以及SEQ ID NO:47和SEQ IDNO:48的引物进行PCR,获得了TrpE的第38个氨基酸突变的下游区域的遗传片段。
SEQ ID NO:45(Pspl7-trpE(S38R)_L-1)
TCGAGCTCGGTACCCAAACAACTGCGACGTGTGTC
SEQ ID NO:46(Pspl7-trpE(S38R)_L-2)
CATGAAGCGCCGGTACCTTAATCATTTTTGGGTTC
SEQ ID NO:47(Pspl7-trpE(S38R)_R-1)
GCCCTGTTGGAACGCGCTGATATCACCACCAAGAA
SEQ ID NO:48(Pspl7-trpE(S38R)_R-2)
CTCTAGAGGATCCCCAGATGTCACCGTTGTAAATG
将SolgTM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)用作聚合酶,并如下进行了PCR:在95℃下变性5分钟;30个循环的在95℃下变性30秒,在60℃下退火30秒,以及在72℃下聚合60秒;以及在72℃下聚合5分钟。
使用合成的启动子SPL7(SEQ ID NO:49)作为模板以及SEQ ID NO:50和SEQ IDNO:51的引物进行了PCR。
SEQ ID NO:50(Pspl7-1)
CCCAAAAATGATTAAGGTACCGGCGCTTCATGTCA
SEQ ID NO:51(Pspl7-2)
GGGATTCGTGCTCATGATATCTGTTTTGATCTCCTCC
将SolgTM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)用作聚合酶,并如下进行了PCR:在95℃下变性5分钟;30个循环的在95℃下变性30秒,在60℃下退火30秒,以及在72℃下聚合30秒;以及在72℃下聚合5分钟。
为了获得源自谷氨酸棒杆菌的TrpE的上游片段(包括从第1个氨基酸至突变的第38个氨基酸的氨基酸序列),使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:52和SEQ ID NO:53的引物进行了PCR。
SEQ ID NO:52(trpE(S38R)-1)
ATCAAAACAGATATCATGAGCACGAATCCCCATGT
SEQ ID NO:53(trpE(S38R)-2)
GTGGTGATATCAGCGCGTTCCAACAGGGCTGCATC
将SolgTM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)用作聚合酶,并如下进行了PCR:在95℃下变性5分钟;30个循环的在95℃下变性30秒,在60℃下退火30秒,以及在72℃下聚合30秒;以及在72℃下聚合5分钟。
使用Gibson装配方法通过克隆trpE启动子的扩增上游区域和TrpE的突变的第38个氨基酸的下游区域、SPL7启动子和TrpE的上游片段、以及用SmaI限制性酶切割的pDZ载体获得了重组质粒。将重组质粒命名为pDZ-PSPL7-trpE(S38R)。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合,然后在50℃下温育1小时来进行了克隆。
通过电穿孔将制备的pDZ-PSPL7-trpE(S38R)载体转化到谷氨酸棒杆菌ATCC13869菌株中以及然后进行二次交换。然后,获得了其中染色体中的trpE的启动子被SPL7启动子(即,更强的启动子)替换并且TrpE的第38个氨基酸(即,丝氨酸)被精氨酸替换的菌株。通过基因组测序和使用SEQ ID NO:54和SEQ ID NO:55的引物(其可以扩增插入基因的同源重组的上游区域和下游区域)的PCR方法,确认了相应的遗传操作,并且将所得菌株命名为CA04-8325。
SEQ ID NO:54(确认_Pspl7-trpE(S38R)-1)
GAAGAAGAGGCTGCAGATG
SEQ ID NO:55(确认_Pspl7-trpE(S38R)-2)
GATCAGCGCCATCATGTT
色氨酸生产通过芳香族氨基酸代谢途径发生,并且该代谢途径从磷酸烯醇丙酮酸和赤藓糖4-磷酸之间的缩合反应开始。因此,这两种前体的平稳供应对于色氨酸的生产是必需的,并且为了平稳供应已知相对缺乏的赤藓糖4-磷酸而进行了tkt基因的过表达。
对于上述遗传操作,使用谷氨酸棒杆菌的染色体DNA作为模板以及SEQ ID NO:56和SEQ ID NO:57的引物进行了PCR以获得用于额外插入tkt基因的上游区域,以及使用SEQID NO:58和SEQ ID NO:59的引物以获得用于额外插入tkt基因的下游区域。
SEQ ID NO:56(Pn-tkt_L-1)
TCGAGCTCGGTACCCAAACTTTGAGTGGGTGCGTG
SEQ ID NO:57(Pn-tkt_L-2)
TCGAGCTACGAGGGCGGTTCCCAGCCCTTCATTAG
SEQ ID NO:58(Pn-tkt_R-1)
ATTAACGGTTAATTGATTCTGGACGTCATGACTAC
SEQ ID NO:59(Pn-tkt_R-2)
CTCTAGAGGATCCCCGCCTCGATGATGCAGTCGTC
将SolgTM Pfu-X DNA聚合酶用作聚合酶,并如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火40秒,以及在72℃下聚合30秒;以及在72℃下聚合5分钟。
为了获得tkt基因及其启动子,使用野生型谷氨酸棒杆菌ATCC13869的染色体DNA作为模板以及SEQ ID NO:60和SEQ ID NO:61的引物进行PCR,以及从而获得了包括其启动子的tkt基因。
SEQ ID NO:60(Pn-tkt-1)
GAAGGGCTGGGAACCGCCCTCGTAGCTCGAGAGTT
SEQ ID NO:61(Pn-tkt-2)
CATGACGTCCAGAATCAATTAACCGTTAATGGAGTCC
将SolgTM Pfu-X DNA聚合酶用作聚合酶,并如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火40秒,以及在72℃下聚合1分20秒;以及在72℃下聚合5分钟。
使用Gibson装配方法通过克隆用于额外插入tkt基因的扩增的上游区域和用于额外插入tkt基因的下游区域、包括tkt启动子的tkt基因、和通过SmaI限制性酶切割的用于染色体转化的pDZ载体获得了重组质粒,并且将所得重组质粒命名为pDZ-Pn-tkt。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合,然后在50℃下温育1小时来进行了克隆。
通过电穿孔将制备的pDZ-Pn-tkt载体转化到CJ04-8325菌株中以及然后进行二次交换,以获得其中包括tkt启动子的tkt基因被插入到染色体中的菌株。通过基因组测序和使用SEQ ID NO:62和SEQ ID NO:63的引物的PCR方法,确认了相应的遗传操作,该引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。将所得菌株命名为CA04-8352。CA04-8352菌株于2018年2月2日根据布达佩斯条约的规定国际保藏于国际保藏机构韩国微生物保藏中心(KCCM),并指定了保藏号KCCM12218P。
SEQ ID NO:62(确认_Pn-tkt-1)
ACCCAGAACCCCAAATTTTC
SEQ ID NO:63(确认_Pn-tkt-2)
TTGAGTTCGACAACTTTGG
实施例10:通过其中引入源自根际草螺菌和大肠杆菌的基因的棒杆菌属微生物的
色氨酸生产
将源自根际草螺菌的基因引入到CA04-8352中,该基因在实施例7中的色氨酸类似物的最小抑制浓度下显示出优异的活性,CA04-8352是参考例1中制备的生产色氨酸的菌株。为此目的,通过电穿孔将用于引入实施例2中制备的源自根际草螺菌的基因的pDZTn-PgapA-Hrh载体转化到CA04-8352(即,生产色氨酸的菌株)中并进行如实施例2中的过程,以及从而获得了其中一个拷贝的源自根际草螺菌的基因被插入到转座子基因之间的菌株。将所得菌株命名为CA04-8405。
另外,将源自大肠杆菌的基因引入到CA04-8352(即,生产色氨酸的菌株)中作为对照组。通过电穿孔将用于引入实施例6中制备的源自大肠杆菌的基因的pDZTn-PgapA-Eco载体转化到CA04-8352(即,生产色氨酸的菌株)中并进行如实施例6中的过程,以及从而获得了其中一个拷贝的源自大肠杆菌的基因被插入到转座子基因之间的菌株。将所得菌株命名为CA04-8406。
通过以下方法培养由上述过程获得的菌株CA04-8405和CA04-8406以确认相对于参考例1中制备的作为对照组的CA04-8352菌株的色氨酸生产量。将每种菌株接种到含有种子培养基(25mL)的250mL拐角-挡板烧瓶(corner-baffle flask)中并在30℃下以200rpm振荡培养20小时。然后,将每种种子培养溶液(1mL)接种到含有生产培养基(25mL)的250mL拐角-挡板烧瓶中并在30℃下以200rpm振荡培养24小时。培养完成后,通过HPLC测量了L-色氨酸生产量。
种子培养基(pH7.0)
葡萄糖20g、蛋白胨10g、酵母提取物5g、尿素1.5g、KH2PO4 4g、K2HPO4 8g、MgSO4·7H2O 0.5g、生物素100μg、硫胺素盐酸盐1000μg、泛酸钙2000μg、烟酰胺2000μg(基于1L蒸馏水)
生产培养基(pH7.0)
葡萄糖30g、(NH4)2SO4 15g、MgSO4·7H2O 1.2g、KH2PO4 1g、酵母提取物5g、生物素900μg、硫胺素盐酸盐4500μg、泛酸钙4500μg、CaCO3 30g(基于1L蒸馏水)
[表4]确认通过CA04-8352(生产L-色氨酸的谷氨酸棒杆菌菌株)、CA04-8405(其中插入源自根际草螺菌的基因的菌株)和CA04-8406(其中插入源自大肠杆菌的基因的菌株)的L-色氨酸生产量
在培养基中通过CA04-8352、CA04-8405和CA04-8406菌株的L-色氨酸生产的结果显示于上表4中。其中引入源自根际草螺菌的基因的CA04-8405菌株在烧瓶培养中生产最终浓度为1.52g/L的L-色氨酸,并且与CA04-8352菌株(即,对照组)相比,这是约5倍的提高。这表明源自根际草螺菌的基因能显著提高谷氨酸棒杆菌菌株中的L-色氨酸生产。相反,其中引入源自大肠杆菌基因的CA04-8406菌株生产浓度为0.23g/L的L-色氨酸,这几乎与CA04-8352菌株(即,CA04-8406菌株的亲本菌株)的L-色氨酸生产量相同。如在实施例7和9中确认的色氨酸类似物和苯丙氨酸类似物的最小抑制浓度(MIC)实验中所确认的,源自大肠杆菌的基因被认为是显示出对苯丙氨酸的特异性高于对色氨酸的特异性的输出基因。根据布达佩斯条约的规定,CA04-8405菌株于2017年8月21日国际保藏于国际保藏机构韩国微生物保藏中心(KCCM),并指定了保藏号KCCM12099P(CA04-8405)。
实施例11:分析其中引入源自根际草螺菌的基因的谷氨酸棒杆菌中的细胞内色氨
酸代谢物
为了明确确认细胞内色氨酸浓度是否随着CA04-8405菌株(即,生产色氨酸的菌株)的色氨酸输出能力的提高而降低,使用有机溶剂通过萃取方法测量了CA04-8405菌株及CA04-8352(即,CA04-8405菌株的亲本菌株)中的细胞内色氨酸浓度。
用于分析细胞内代谢物的方法根据参考文献中所述的方法进行(Nakamura J等人,Appl.Environ.Microbiol.73(14):4491-4498,2007)。
首先,关于突变的谷氨酸棒杆菌菌株CA04-8352和CA04-8405,将每种菌株接种到含有种子培养基(25mL)的250mL拐角-挡板烧瓶中并在30℃下以200rpm振荡培养20小时。然后,将每种种子培养溶液(1mL)接种到含有生产培养基(25mL)的250mL拐角-挡板烧瓶中并在30℃下以200rpm振荡培养。根据葡萄糖消耗分析了细胞内色氨酸浓度三次。通过快速真空过滤(Durapore HV,0.45μm;Millipore,Billerica,MA)将每个步骤中的培养细胞与培养液分离。将吸附有细胞的过滤器用蒸馏水(10mL)洗涤两次,以及在含有5μM吗啉乙磺酸和5μM蛋氨酸砜的甲醇中浸泡10分钟。将氯仿(1.6mL)和蒸馏水(0.64μL)添加到上面获得的细胞提取物(1.6mL)中并充分混合,并且仅将水相施加到旋转柱上以除去蛋白质杂质。使用毛细管电泳质谱法分析了过滤的提取物,且结果显示在图1中。
如图1所示,确认了与其亲本菌株CA04-8352相比,CA04-8405菌株显示出细胞内色氨酸浓度降低至33%至41%的水平。这些结果表明由于源自根际草螺菌的基因的表达,谷氨酸棒杆菌菌株细胞内生产的色氨酸平稳地向细胞外输出,因而CA04-8405菌株的细胞内色氨酸浓度降低。从这些结果,确认了源自根际草螺菌的基因是编码具有色氨酸特异性输出能力的膜蛋白的基因。
参考例2:制备生产L-色氨酸的埃希氏菌属微生物
埃希氏菌属的生产L-色氨酸的微生物是从野生型大肠杆菌W3110中开发的。为了确认是否随着具有L-色氨酸输出活性的蛋白被修饰以表达,色氨酸生产量显著增加,将制备以生产L-色氨酸的菌株用作亲本菌株。具体地,L-色氨酸生物合成基因(trpEDCBA)——其参与从分支酸(Chorismate)生产L-色氨酸——的表达被TrpR抑制。因此,除去了编码TrpR的trpR基因。另外,为了释放根据L-色氨酸生产的提高的TrpE多肽的反馈抑制,从TrpE的N-端的第21个氨基酸(即,脯氨酸)被丝氨酸取代(J.Biochem.Mol.Biol.32,20-24(1999))。
Mtr膜蛋白具有将细胞外L-色氨酸引入到细胞中的作用,并且TnaA蛋白具有将细胞内L-色氨酸和水分子分解成吲哚、丙酮酸和氨(NH3)的作用。因此,除去了抑制L-色氨酸生产并分解L-色氨酸的mtr和tnaA基因。
为了除去这些基因,使用了λ-red重组方法(使用PCR产物在大肠杆菌K-12中一步灭活染色体基因,Datsenko KA,Wanner BL.,Proc Natl Acad Sci USA.2000Jun 6;97(12):6640-6645)。为了除去mtr基因,使用pKD4载体作为模板以及SEQ ID NO:64和SEQ IDNO:65的引物进行了PCR。结果,获得了1580bp基因片段,其中FRT-卡那霉素-FRT盒被结合到mtr基因侧翼的一对50bp同源核苷酸(其中其间发生染色体同源重组)。pKD4载体的卡那霉素抗生素标记用于确认靶基因的除去和抗生素基因的插入,并且FRT区域具有在除去靶基因后除去抗生素标记的作用。
将SolgTM Pfu-X DNA聚合酶用作聚合酶,并如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火40秒,以及在72℃下聚合1分钟;以及在72℃下聚合5分钟。
SEQ ID NO:64(Δmtr盒-1)
TGCAATGCATAACAACGCAGTCGCACTATTTTTCACTGGAGAGAAGCCCTGTGTAGGCTGGAGCTGCTTC
SEQ ID NO:65(Δmtr盒-2)
TGCAATGCATAACAACGCAGTCGCACTATTTTTCACTGGAGAGAAGCCCTGTCCATATGAATATCCTCCT
通过电穿孔将表达λred重组酶(gam、bet和exo基因)的pKD46载体转化到大肠杆菌W3110菌株中,并将菌株涂布在含有卡那霉素(50mg/L)的LB固体培养基上。当OD600达到约0.1时,通过添加10mM L-阿拉伯糖,其中确认了pKD46载体转化的大肠杆菌W3110菌株诱导重组酶的表达。当OD600达到约0.6时,将菌株制备成感受态细胞,并通过电穿孔转化了上述过程中获得的线性基因片段,其中FRT-卡那霉素-FRT盒被结合到mtr基因侧翼的一对50bp同源核苷酸。对于在含有卡那霉素(25mg/L)的LB固体培养基上生长的菌落,使用SEQ IDNO:66和SEQ ID NO:67的引物进行了菌落PCR,并选择了其中制得782bp基因片段的菌落。
SEQ ID NO:66(确认_盒-1)
GGGCAGGATCTCCTGTCATC
SEQ ID NO:67(确认_Δmtr-2)
AAATGTCGGATAAGGCACCG
将由于同源重组的发生其中除去了mtr基因的菌株制备成感受态细胞,以除去卡那霉素抗生素标记,以及然后通过电穿孔用pCP20载体转化。pCP20载体表达FLP蛋白,以及从而识别卡那霉素抗生素侧翼的FRT位点并在染色体中与其结合,从而除去FRT位点之间的抗生素标记。将含有氨苄青霉素(100mg/L)和氯霉素(25mg/L)的LB固体培养基中生长的pCP20载体转化菌株在LB液体培养基中在30℃下培养1小时,进一步在42℃下培养15小时,以及在LB固体培养基上涂布。在含有氨苄青霉素(100mg/L)和氯霉素(25mg/L)的LB固体培养基;含有卡那霉素(12.5mg/L)的LB固体培养基;和不含有抗生素的LB固体培养基中培养生长的菌落。仅选择了在不含有抗生素的LB固体培养基中生长的菌落。最终通过基因组测序确认了mtr基因的除去,并将该菌株命名为CA04-9300。
通过上述方法进行了遗传操作以除去tnaA基因。使用pKD4载体作为模板以及SEQID NO:68和SEQ ID NO:69的引物进行了PCR,以及从而获得了1580bp基因片段,其中FRT-卡那霉素-FRT盒被结合到tnaA基因侧翼的一对50bp同源核苷酸(其中其间发生染色体同源重组)。将SolgTM Pfu-X DNA聚合酶用作聚合酶,以及如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火40秒,以及在72℃下聚合1分钟;以及在72℃下聚合5分钟。
SEQ ID NO:68(ΔtnaA盒-1)
TGTAATATTCACAGGGATCACTGTAATTAAAATAAATGAAGGATTATGTAGTGTAGGCTGGAGCTGCTTC
SEQ ID NO:69(ΔtnaA盒-2)
TGTAGGGTAAGAGAGTGGCTAACATCCTTATAGCCACTCTGTAGTATTAAGTCCATATGAATATCCTCCT
确认了pKD46载体的转化。用上述过程中获得的线性基因片段(其中FRT-卡那霉素-FRT盒被结合到tnaA基因侧翼的一对50bp同源核苷酸)通过电穿孔转化CA04-9300(其中通过添加10mM L-阿拉伯糖表达了重组酶)。对于在含有卡那霉素(25mg/L)的LB固体培养基上生长的菌落,使用SEQ ID NO:66和SEQ ID NO:70的引物进行了菌落PCR,以及选择了其中制得787bp基因片段的菌落。
SEQ ID NO:70(确认_ΔtnaA-2)
ACATCCTTATAGCCACTCTG
将由于同源重组其中除去了tnaA基因的菌株制备成感受态细胞,以除去卡那霉素抗生素标记,以及然后用pCP20载体转化,以及制备了其中通过表达FLP蛋白除去了卡那霉素抗生素标记的菌株。最终通过基因组测序确认了tnaA基因的除去,并将该菌株命名为CA04-9301。
为了除去trpR基因,使用pKD4载体作为模板以及SEQ ID NO:71和SEQ ID NO:72的引物进行了PCR,以及从而获得了基因片段(1580bp),其中FRT-卡那霉素-FRT盒被结合到trpR基因侧翼的一对50bp同源核苷酸(其中其间发生染色体同源重组)。将SolgTM Pfu-XDNA聚合酶用作聚合酶,以及如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火40秒,以及在72℃下聚合1分钟;以及在72℃下聚合5分钟。
SEQ ID NO:71(ΔtrpR盒-1)
TACAACCGGGGGAGGCATTTTGCTTCCCCCGCTAACAATGGCGACATATTGTGTAGGCTGGAGCTGCTTC
SEQ ID NO:72(ΔtrpR盒-2)
GCATTCGGTGCACGATGCCTGATGCGCCACGTCTTATCAGGCCTACAAAAGTCCATATGAATATCCTCCT
确认了pKD46载体的转化。用上述过程中获得的线性基因片段(其中FRT-卡那霉素-FRT盒被结合到trpR基因侧翼的一对50bp同源核苷酸)通过电穿孔转化CA04-9301(其中通过添加10mM L-阿拉伯糖表达了重组酶)。对于在含有卡那霉素(25mg/L)的LB固体培养基上生长的菌落,使用SEQ ID NO:66和SEQ ID NO:73的引物进行了菌落PCR,以及选择了其中制得838bp基因片段的菌落。
SEQ ID NO:73(确认_ΔtrpR-2)
AGGACGGATAAGGCGTTCAC
将由于同源重组其中除去了trpR基因的菌株制备成感受态细胞,以除去卡那霉素抗生素标记,以及然后用pCP20载体转化,以及制备了其中通过表达FLP蛋白除去了卡那霉素抗生素标记的菌株。最终通过基因组测序确认了trpR基因的除去,并将该菌株命名为CA04-9307。
为了向CA04-9307菌株提供反馈抗性trpE性状,使用大肠杆菌W3110 gDNA作为模板以及SEQ ID NO:74和SEQ ID NO:75的引物(这两个引物均包含EcoRI限制性位点)进行了PCR,以及从而获得了含有EcoRI限制性位点的1575bp的trpE基因片段。将SolgTM Pfu-X DNA聚合酶用作聚合酶,并如下进行了PCR:在95℃下变性2分钟;27个循环的在95℃下变性20秒,在62℃下退火1分钟,以及在72℃下聚合1分钟;以及在72℃下聚合5分钟。
SEQ ID NO:74(trpE-1)
GAATTCATGCAAACACAAAAACCGAC
SEQ ID NO:75(trpE-2)
GAATTCTCAGAAAGTCTCCTGTGCA
在用EcoRI限制性酶分别处理通过上述方法获得的trpE基因片段和pSG76-C质粒(Journal of Bacteriology,July 1997,p.4426-4428)后进行了克隆。通过电穿孔将克隆的质粒转化到大肠杆菌DH5α中,以及在含有氯霉素(25μg/mL)的LB平板上选择了转化的大肠杆菌DH5α菌株,以及从而获得了pSG76-C-trpE质粒。
使用以上获得的pSG76-C-trpE质粒以及SEQ ID NO:76和SEQ ID NO:77的引物通过定点诱变(Stratagene,USA)制备了pSG76-C-trpE(P21S)。
SEQ ID NO:76(trpE(P21S)-1)
CGCTTATCGCGACAATTCCACCGCGCTTTTTCACCAG
SEQ ID NO:77(trpE(P21S)-2)
CTGGTGAAAAAGCGCGGTGGAATTGTCGCGATAAGCG
将pSG76-C-trpE(P21S)质粒转化到CA04-9307菌株中,在LB-Cm培养基(酵母提取物10g/L、NaCl 5g/L、胰蛋白胨10g/L、和氯霉素25μg/L)中培养,以及选择了对氯霉素具有抗性的菌落。所选择的转化体是其中通过首次插入将pSG76-C-trpE(P21S)质粒插入到基因组的trpE区域中的菌株。用pAScep质粒(其表达切割存在于pSG76-C质粒中的I-SceI区域的限制性酶I-SceI)转化其中插入获得的trpE(P21S)基因的菌株(Journal ofBacteriology,July 1997,p.4426-4428),以及选择了在LB-Ap(酵母提取物10g/L、NaCl5g/L、胰蛋白胨10g/L、和氨苄青霉素100μg/L)中生长的菌株。使用SEQ ID NO:74和SEQ IDNO:75的引物扩增了选择的菌株中的trpE基因,并且通过测序确认了扩增的trpE基因被替换为trpE(P21S)基因。将由此制备的菌株命名为CA04-4303。
实施例12:其中引入源自根际草螺菌的基因的埃希氏菌属微生物的L-色氨酸生产
将实施例8中制备的pCL1920-PyccA-Hrh引入到参考例2中制备的CA04-4303菌株中,以及从而制备其中过表达源自根际草螺菌的基因的CA04-4306菌株。另外,将作为对照组的pCL1920载体转化到CA04-4303菌株中。为了确认两种菌株(即,CA04-4303/pCL1920和CA04-4306)中L-色氨酸生产量,将这些菌株在含有壮观霉素(50mg/L)的LB液体培养基中培养12小时。然后,将这些菌株各自接种到含有25mL生产培养基的250mL拐角-挡板烧瓶中,使得初始OD600值变为0.01,以及然后在37℃下以200rpm振荡培养48小时。培养完成后,通过HPLC测量了L-色氨酸生产量。
关于培养基中CA04-4303/pCL1920和CA04-4306菌株中L-色氨酸生产的结果显示在下表5中。其中引入并过表达了源自根际草螺菌的基因的菌株CA04-4306在烧瓶培养中显示了2.1g/L的最终L-色氨酸浓度,其比对照组的最终L-色氨酸浓度高约50%。这表明源自根际草螺菌的基因在大肠杆菌中也能输出L-色氨酸,以及从而显著提高其L-色氨酸生产。
生产培养基(pH 7.0)
葡萄糖70g、(NH4)2SO4 20g、MgSO4·7H2O 1g、KH2PO4 2g、酵母提取物2.5g、柠檬酸钠5g、NaCl 1g、CaCO3 40g(基于1L蒸馏水)
[表5]确认源自大肠杆菌的L-色氨酸生产菌株(CA04-4303)和其中过表达源自根际草螺菌的输出基因的L-色氨酸生产菌株(CA04-4306)中的L-色氨酸生产量
因此,从实施例7和9的结果可以看出,源自根际草螺菌的基因显示出对L-色氨酸及其类似物的高特异性和优异的抗性。从实施例10和12的结果中可以看出,源自根际草螺菌的基因均提高了谷氨酸棒杆菌和大肠杆菌菌株中的L-色氨酸生产。另外,在实施例11中观察到了源自根际草螺菌的基因基本上向细胞外输出色氨酸。结果,将源自根际草螺菌的基因命名为wex(色氨酸(W)输出基因)。
实施例13:使用随机诱变改进Wex输出能力
在该实施例中,进行了易错PCR以对野生型wex基因施加随机诱变,并且在进行易错PCR时,使用了多样化PCR随机诱变试剂盒(Diversify PCR Random Mutagenesis Kit)(Clontech,USA)。
为了获得引入随机诱变的wex基因的变体,使用实施例8中制备的pCL1920-PyccA-wex作为模板以及SEQ ID NO:78和SEQ ID NO:79进行了易错PCR。
为了选择突变率条件,如下根据MnSO4的浓度,用两种组成进行了易错PCR。
SEQ ID NO:78(wex-1)
ACTCTAGAGGATCCCCTTCCAGATCAAATGCGTAA
SEQ ID NO:79(wex-2)
ATTCGAGCTCGGTACCCCTACAAACAGTCCGCCAC
[表6]用于易错PCR的组成(单位:μL)
情况# | 1 | 2 |
10X钛Taq缓冲液 | 5 | 5 |
MnSO4(8mM) | 1 | 2 |
dGTP(2mM) | 1 | 1 |
50X Diversify dNTP混合物 | 1 | 1 |
钛Taq聚合酶 | 1 | 1 |
引物混合物 | 2 | 2 |
模板DNA(1ng/uL) | 1 | 1 |
PCR级水 | 38 | 37 |
总体积 | 50 | 50 |
[表7]易错PCR循环
使用易错PCR(其在表6和表7的条件下进行)和pCL1920(其用SmaI限制性酶切割)的产物,通过Gibson装配方法(DG Gibson等人,Nature Methods,VOL.6NO.5,MAY 2009,NEBuilder HiFi DNA Assembly Master Mix)获得了重组突变质粒文库。通过上述方法获得的突变体文库、pCL1920-PyccA-Hrh和pCL1920被转化到大肠杆菌W3110细胞中,在含有壮观霉素(50g/L)的LB平板培养基中培养,以及从突变体文库中筛选出50个菌落。进行了测序以确定它们的突变率和在多种位置突变的存在/不存在。作为测序结果,情况#1条件的突变率为1.3kb-1,以及情况#2条件的突变率为2.5kb-1。情况#1和#2都被确定满足适合获得突变体文库的突变率,并使用在上述条件下制备的文库进行了筛选有效突变的过程。
含有50μg/mL 5'-氟色氨酸(即,L-色氨酸类似物)的300μL的M9基本培养基被等分到96深孔板的每个孔中,随后接种先前转化的突变体文库(即,W3110/pCL1920-PyccA-Hrh、W3110/pCL1920、和W3110/pCL1920-PyccA-wex突变体文库)的每个菌落。在1200rpm/37℃下进行了培养,以及培养16小时后在600nm波长下测量了OD。与对照菌株(W3110/pCL1920和W3110/pCL1920-PyccA-Hrh)的情况一样,在深孔板中几乎没有观察到大多数突变体文库的生长。它们当中,筛选了具有改善生长的51个菌落,以及从菌落中分别提取了pCL1920-PyccA-wex突变质粒,并再转化到大肠杆菌W3110菌株中以评价再现性。在其中通常含有浓度为50μg/mL的5'-氟色氨酸的M9基本培养基中,观察到了在M9基本培养基中显示出特异性生长改善的10种菌株,并记录了它们的OD。
[表8]其中在含有L-色氨酸类似物的基本培养基中生长得到改善的wex文库
光密度(OD600) | |
W3110/pCL1920 | 0.189 |
W3110/pCL1920-PyccA-Hrh | 0.393 |
W3110/pCL1920-PyccA-wex突变体文库(1-3 8G) | 0.791 |
W3110/pCL1920-PyccA-wex突变体文库(1-4 6D) | 1.026 |
W3110/pCL1920-PyccA-wex突变体文库(2-1 10C) | 0.748 |
W3110/pCL1920-PyccA-wex突变体文库(2-12 8C) | 0.773 |
W3110/pCL1920-PyccA-wex突变体文库(2-15 6B) | 0.825 |
W3110/pCL1920-PyccA-wex突变体文库(2-18 3F) | 0.921 |
W3110/pCL1920-PyccA-wex突变体文库(3-3 6D) | 0.831 |
W3110/pCL1920-PyccA-wex突变体文库(3-6 11F) | 0.749 |
W3110/pCL1920-PyccA-wex突变体文库(5-5 10B) | 0.766 |
W3110/pCL1920-PyccA-wex突变体文库(5-18 6B) | 0.783 |
从10株筛选的突变株中提取pCL1920-PyccA-wex突变质粒后,进行了测序以确认它们的突变,以及结果确认了突变发生在编码序列(CDS)(其不在启动子区域中)中。另外,确认了,10株突变株中的8株中突变位点集中在Wex膜蛋白的氨基酸序列的第79个氨基酸(即,亮氨酸)至第83个氨基酸(即,异亮氨酸)的区域中,且大多数突变是用疏水性氨基酸、脂肪族氨基酸、或相对小的L-氨基酸取代它们。因此,确定了Wex膜蛋白的氨基酸序列的第79位至第83位可以是引入突变以提高L-色氨酸输出能力的核心区域。在这方面,尝试通过用各种疏水性氨基酸(一种或多种)、脂肪族氨基酸(一种或多种)、或相对较小的L-氨基酸(一种或多种)取代相应序列中的氨基酸(一个或多个)来提高其活性。
实施例14:棒杆菌属微生物中Wex序列的第79个氨基酸(亮氨酸)被疏水性氨基酸
取代
尝试通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中的第79个氨基酸亮氨酸(下文称为第79位或在第79个位置的亮氨酸),以确认输出L-色氨酸的改进的效力。使用实施例2中制备的pDZTn-PgapA-Hrh作为模板进行了定点诱变,以生产亮氨酸以外的三种不同氨基酸的突变。通过以下方法进行了定点诱变。
[表9]定点诱变的PCR组成
单位(μL) | |
10X pfu-X缓冲液 | 5 |
10mM dNTP混合物 | 1 |
pfu-X聚合酶 | 1 |
诱变正向引物(5pmol) | 2 |
诱变反向引物(5pmol) | 2 |
pDZTn-PgapA-Hrh(模板DNA,200ng/μL) | 1 |
dH2O | 38 |
总计 | 50 |
[表10]定点诱变的PCR循环
为了Wex氨基酸序列的第79位的氨基酸(即,亮氨酸)被不同的疏水性氨基酸(即,丙氨酸(A)(SEQ ID NO:80、SEQ ID NO:131)、缬氨酸(V)(SEQ ID NO:81、SEQ ID NO:132)、和异亮氨酸(I)(SEQ ID NO:82、SEQ ID NO:133))中的每个取代,如表9中所示,使用表11中表明的各诱变引物组制备了PCR混合物,并按照表10中所示的下列方法进行了PCR。PCR完成后,向其中添加了1μL的DpnI限制性酶,以及在37℃下处理混合物1小时。将3μL经DpnI处理的DNA转化到DH5α感受态细胞中,以获得突变体pDZTn-PgapA-wex质粒,以及通过测序确认了表11中表明的每个突变。
[表11]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列的第79位的氨基酸被分别突变
将如表11中所示制备的pDZTn-PgapA-wex L79A、pDZTn-PgapA-wex L79V和pDZTn-PgapA-wex L79I载体通过电穿孔各自转化到参考例1中制备的CA04-8352菌株中,以及然后进行了二次交换,以分别获得其中突变wex基因被插入到染色体中的三种菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
获得的突变株分别命名为CA04-8352(wex L79A)、CA04-8352(wex L79V)和CA04-8352(wex L79I)。
为了确认CA04-8352、CA04-8405、CA04-8352(wex L79A)、CA04-8352(wex L79V)和CA04-8352(wex L79I)菌株中的色氨酸生产量,通过与实施例10中相同的方法培养了这些菌株。培养完成后,通过HPLC测量了每种菌株中的L-色氨酸生产量。
[表12]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(Wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列的第79位氨基酸被分别突变的突变株(CA04-8352(wex L79A)、CA04-8352(wex L79V)和CA04-8352(wex L79I))中L-色氨酸生产量
如表12的结果中所示,与引入野生型Wex的CA04-8405菌株相比,其中Wex氨基酸序列第79位的亮氨酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了1.59%p至2.95%p。特别地,wex L79A突变株显示了最大的L-色氨酸发酵产率的提高,且这些结果表明用不同疏水性氨基酸取代Wex氨基酸序列第79位的亮氨酸可以显著增加Wex的L-色氨酸输出能力的活性。
实施例15:棒杆菌属微生物中Wex序列的第80个氨基酸(丝氨酸)被疏水性氨基酸
取代
尝试通过用疏水性氨基酸取代Wex膜蛋白的氨基酸序列中的第80个氨基酸丝氨酸(下文称为第80位的丝氨酸),以确认输出L-色氨酸的效力。通过与实施例14中相同的方法,使用pDZTn-PgapA-wex作为模板进行了定点诱变,以产生为四种不同类型的疏水性氨基酸的突变。
另外,使用与实施例14中相同的方法,用不同的疏水性氨基酸(即,丙氨酸(A)(SEQID NO:89、SEQ ID NO:134)、缬氨酸(V)(SEQ ID NO:90、SEQ ID NO:135)、亮氨酸(L)(SEQID NO:91、SEQ ID NO:136)和异亮氨酸(I)(SEQ ID NO:92、SEQ ID NO:137))中的每个取代Wex氨基酸序列的第80位的丝氨酸。用于获得pDZTn-PgapA-wex突变质粒的诱变引物组和突变形式与下表13中所示相同。
[表13]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列的第80位的氨基酸被分别突变
将如表13中所示制备的pDZTn-PgapA-wex S80A、pDZTn-PgapA-wex S80V、pDZTn-PgapA-wex S80L和pDZTn-PgapA-wex S80I载体通过电穿孔各自转化到CA04-8352菌株中,以及然后进行了二次交换,以分别获得其中突变wex基因被插入到染色体中的四种菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
获得的突变株分别命名为CA04-8352(wex S80A)、CA04-8352(wex S80V)、CA04-8352(wex S80L)、和CA04-8352(wex S80I)。
为了确认CA04-8352、CA04-8405、CA04-8352(wex S80A)、CA04-8352(wex S80V)、CA04-8352(wex S80L)、和CA04-8352(wex S80I)菌株中的色氨酸生产量,通过与实施例10中相同的方法培养了这些菌株。培养完成后,通过HPLC测定了每种菌株中的L-色氨酸生产量。
[表14]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列的第80位氨基酸被分别突变的突变株(CA04-8352(wex S80A)、CA04-8352(wex S80V)、CA04-8352(wex S80L)和CA04-8352(wex S80I))中L-色氨酸生产量
如表14的结果中所示,与引入野生型Wex的CA04-8405菌株相比,其中Wex氨基酸序列第80位的氨基酸分别被不同的疏水性氨基酸取代的四种突变体全部显示发酵产率提高了1.99%p至2.62%p。特别地,wex S80V突变株显示了最大的L-色氨酸发酵产率的提高,且这些结果表明,用不同疏水性氨基酸取代Wex氨基酸序列第80位的丝氨酸可以显著增加Wex的L-色氨酸输出能力的活性。
实施例16:棒杆菌属微生物中Wex序列的第81个氨基酸(亮氨酸)被疏水性氨基酸
取代
尝试通过用不同的疏水性氨基酸取代Wex膜蛋白的氨基酸序列中的第81个氨基酸亮氨酸(下文称为第81位的亮氨酸),以确认输出L-色氨酸的改进的效力。通过与实施例14中相同的方法,使用pDZTn-PgapA-wex作为模板进行了定点诱变,以产生为亮氨酸以外的三种不同类型的疏水性氨基酸的突变。
另外,使用与实施例14中相同的方法,用不同的疏水性氨基酸(即,丙氨酸(A)(SEQID NO:101、SEQ ID NO:138)、缬氨酸(V)(SEQ ID NO:102、SEQ ID NO:139)、和异亮氨酸(I)(SEQ ID NO:103、SEQ ID NO:140))中的每个取代Wex氨基酸序列的第81位的亮氨酸。用于获得pDZTn-PgapA-wex突变质粒的诱变引物组和突变形式与下表15中所示相同。
[表15]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列的第81位的氨基酸被分别突变
将如表15中所示制备的pDZTn-PgapA-wex L81A、pDZTn-PgapA-wex L81V和pDZTn-PgapA-wex L81I载体通过电穿孔各自转化到CA04-8352菌株中,以及然后进行二次交换,以分别获得其中突变wex基因被插入到染色体中的三种菌株。通过基因组测序和使用SEQ IDNO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
获得的突变株分别命名为CA04-8352(wex L81A)、CA04-8352(wex L81V)和CA04-8352(wex L81I)。
为了确认CA04-8352、CA04-8405、CA04-8352(wex L81A)、CA04-8352(wex L81V)和CA04-8352(wex L81I)中的色氨酸生产量,用与实施例10中相同的方法培养了这些菌株。培养完成后,通过HPLC测定了每种菌株中的L-色氨酸生产量。
[表16]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列的第81位氨基酸被分别突变的突变株(CA04-8352(wex L81A)、CA04-8352(wex L81V)和CA04-8352(wex L81I))中L-色氨酸生产量
如表16的结果中所示,与引入野生型Wex的CA04-8405菌株相比,其中Wex氨基酸序列第81位的氨基酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了2.03%p至2.87%p。特别地,wex L81A突变株显示了最大的L-色氨酸发酵产率的提高,且这些结果表明,用不同疏水性氨基酸取代Wex氨基酸序列第81位的亮氨酸可以显著增加Wex的L-色氨酸输出能力的活性。
实施例17:棒杆菌属微生物中Wex序列的第82个氨基酸(丝氨酸)被疏水性氨基酸
取代
尝试通过用疏水性氨基酸取代Wex膜蛋白的氨基酸序列中的第82个氨基酸丝氨酸(下文称为第82位的丝氨酸),以确认输出L-色氨酸的改进的效力。采用与实施例14中相同的方法,使用pDZTn-PgapA-wex作为模板进行了定点诱变,以产生为四种不同类型的疏水性氨基酸的突变。
另外,使用与实施例14中相同的方法,用不同的疏水性氨基酸(即,丙氨酸(A)(SEQID NO:110、SEQ ID NO:141)、缬氨酸(V)(SEQ ID NO:111、SEQ ID NO:142)、亮氨酸(L)(SEQID NO:112、SEQ ID NO:143)、和异亮氨酸(I)(SEQ ID NO:113、SEQ ID NO:144))中的每个取代Wex氨基酸序列的第82位的丝氨酸。用于获得pDZTn-PgapA-wex突变质粒的诱变引物组和突变形式与下表17中所示相同。
[表17]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列的第82位的氨基酸被分别突变
将如表17中所示制备的pDZTn-PgapA-wex S82A、pDZTn-PgapA-wex S82V、pDZTn-PgapA-wex S82L和pDZTn-PgapA-wex S82I载体通过电穿孔各自转化到CA04-8352菌株中,以及然后进行二次交换,以分别获得其中突变wex基因被插入染色体中的四种菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
获得的突变株分别命名为CA04-8352(wex S82A)、CA04-8352(wex S82V)、CA04-8352(wex S82L)、和CA04-8352(wex S82I)。
为了确认CA04-8352、CA04-8405、CA04-8352(wex S82A)、CA04-8352(wex S82V)、CA04-8352(wex S82L)、和CA04-8352(wex S82I)菌株中色氨酸的生产量,通过与实施例10中相同的方法培养了这些菌株。培养完成后,通过HPLC测定了每种菌株中的L-色氨酸生产量。
[表18]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列第82位氨基酸被分别突变的突变株(CA04-8352(wex S82A)、CA04-8352(wex S82V)、CA04-8352(wex S82L)和CA04-8352(wex S82I))中L-色氨酸生产量
如表18的结果所示,与引入野生型Wex的CA04-8405菌株相比,其中Wex氨基酸序列第82位的氨基酸分别被不同的疏水性氨基酸取代的四种突变体全部显示发酵产率提高了1.40%p至2.76%p。特别地,wex S82A突变株显示了最大的L-色氨酸发酵产率的提高,且这些结果表明,用不同疏水性氨基酸取代Wex氨基酸序列第82位的丝氨酸可以显著增加Wex的L-色氨酸输出能力的活性。
实施例18:棒杆菌属微生物中Wex序列的第83个氨基酸(异亮氨酸)被疏水性氨基
酸取代
尝试通过用不同的疏水性氨基酸取代Wex膜蛋白的氨基酸序列中的第83个氨基酸异亮氨酸(下文称为第83位的异亮氨酸),以确认输出L-色氨酸的改进的效力。通过与实施例14中相同的方法,使用pDZTn-PgapA-wex作为模板进行了定点诱变,以产生为异亮氨酸以外的三种不同类型的疏水性氨基酸的突变。
另外,使用与实施例14相同的方法,用不同的疏水性氨基酸(即,丙氨酸(A)(SEQID NO:122、SEQ ID NO:145)、缬氨酸(V)(SEQ ID NO:123、SEQ ID NO:146)和亮氨酸(L)(SEQ ID NO:124、SEQ ID NO:147))中的每个取代Wex氨基酸序列的第83位的异亮氨酸。用于获得pDZTn-PgapA-wex突变质粒的诱变引物组和突变形式与下表19中所示相同。
[表19]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列的第83位的氨基酸被分别突变
将如表19中所示制备的pDZTn-PgapA-wex I83A、pDZTn-PgapA-wex I83V和pDZTn-PgapA-wex I83L载体通过电穿孔各自转化到CA04-8352菌株中,以及然后进行二次交换,以分别获得其中突变wex基因被插入到染色体中的三种菌株。通过基因组测序和使用SEQ IDNO:7和SEQ ID NO:8的引物的PCR方法,确认了相应的遗传操作,引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。
获得的突变株分别命名为CA04-8352(wex I83A)、CA04-8352(wex I83V)和CA04-8352(wex I83L)。
为了确认CA04-8352、CA04-8405、CA04-8352(wex I83A)、CA04-8352(wex I83V)和CA04-8352(wex I83L)菌株中色氨酸的生产量,通过与实施例10中相同的方法培养了这些菌株。培养完成后,通过HPLC测定了每种菌株中的L-色氨酸生产量。
[表20]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列的第83位的氨基酸被分别突变的突变株(CA04-8352(wex I83A)、CA04-8352(wex I83V)和CA04-8352(wexI83L))中L-色氨酸生产量
如表20的结果所示,与引入野生型Wex的CA04-8405菌株相比,其中Wex氨基酸序列第83位的氨基酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了1.73%p至2.36%p。特别地,wex I83L突变株显示了最大的L-色氨酸发酵产率的提高,且这些结果表明,用不同疏水性氨基酸取代Wex氨基酸序列第83位的异亮氨酸可以显著增加Wex的L-色氨酸输出能力的活性。通过上述实施例2至6所示的结果,确认了用不同疏水性氨基酸取代Wex膜蛋白氨基酸序列中第79位至第83位的氨基酸可以显著增加谷氨酸棒杆菌菌株中L-色氨酸输出能力的活性。
将其中引入了本公开的突变体wex的CA04-8352(wex L79I)、CA04-8352(wexS80V)、CA04-8352(wex L81V)、CA04-8352(wex S82V)和CA04-8352(wex I83L)菌株分别命名为CM05-9022、CM05-9023、CM05-9024、CM05-9025和CM05-9026。这些菌株于2019年3月29日根据布达佩斯条约的规定国际保藏于国际保存机构韩国微生物保藏中心(KCCM),并指定了保藏号分别为KCCM12475P、KCCM12476P、KCCM12477P、KCCM12478P和KCCM12479P。
实施例19:埃希氏菌属微生物中Wex序列第79位的氨基酸(亮氨酸)被疏水性氨基
酸取代
根据在上述实施例14至18中所示的棒杆菌属微生物中引入Wex突变而提高L-色氨酸输出能力活性的效果在埃希氏菌属微生物中再次得到确认。
与棒杆菌属微生物中一样,尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第79位的氨基酸(即,亮氨酸),以确认输出L-色氨酸的改进的效力。使用实施例8中制备的pCL1920-PyccA-Hrh作为模板进行了定点诱变,以产生为除亮氨酸以外的三种不同类型的疏水性氨基酸的突变。通过以下方法进行了定点诱变。
[表21]定点诱变的PCR组成
单位(μL) | |
10X pfu-X缓冲液 | 5 |
10mM dNTP混合物 | 1 |
pfu-X聚合酶 | 1 |
诱变正向引物(5pmol) | 2 |
诱变反向引物(5pmol) | 2 |
pDZTn-PgapA-Hrh(模板DNA,200ng/μL) | 1 |
dH2O | 38 |
总计 | 50 |
[表22]定点诱变的PCR循环
为了用不同的疏水性氨基酸(即,丙氨酸(A)(SEQ ID NO:80、SEQ ID NO:131)、缬氨酸(V)(SEQ ID NO:81、SEQ ID NO:132)和异亮氨酸(I)(SEQ ID NO:82、SEQ ID NO:133))中的每个取代Wex氨基酸序列的第79位的氨基酸(即,亮氨酸),如表21中所示,使用表23中表明的各诱变引物组制备了PCR混合物,并按照表22中所示的下列方法进行了PCR。PCR完成后,向其中加入了1μL的DpnI限制性酶,以及在37℃下处理了混合物1小时。将3μL用DpnI处理的DNA转化到DH5α感受态细胞中,以获得突变体pCL1920-PgapA-wex质粒,以及通过测序确认了表23中表明的每个突变。
[表23]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列的第79位的氨基酸被分别突变
将如表23中所示制备的pCL1920-PyccA-wex L79A、pCL1920-PyccA-wex L79V和pCL1920-PyccA-wex L79I载体通过电穿孔各自转化到CA04-4303菌株中,以及从而获得了其中在第79位氨基酸中引入了彼此不同的突变wex基因中的每个的三种菌株。所获得的突变株分别命名为CA04-4303(wex L79A)、CA04-4303(wex L79V)和CA04-4303(wex L79I)。
为了使用实施例12中制备的CA04-4303(pCL1920)和CA04-4306菌株作为对照组确认CA04-4303(wex L79A)、CA04-4303(wex L79V)和CA04-4303(wex L79I)菌株中的色氨酸生产量,通过与实施例12中相同的方法培养了这些菌株。培养完成后,通过HPLC测定了每种菌株中的L-色氨酸生产量。
[表24]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列第79位的氨基酸被分别突变的突变株(CA04-4303(wex L79A)、CA04-4303(wex L79V)、和CA04-4303(wexL79I))中L-色氨酸生产量
如表24的结果所示,与引入野生型Wex的CA04-4306菌株相比,其中Wex氨基酸序列第79位的氨基酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了0.6%p至1.5%p。特别地,与谷氨酸棒杆菌的生产L-色氨酸的菌株中一样,具有wex L79A突变的大肠杆菌菌株显示了最大的L-色氨酸的发酵产率的提高,且这些结果表明,用不同疏水性氨基酸取代Wex氨基酸序列第79位的亮氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌属微生物中的Wex的L-色氨酸输出能力的活性。
实施例20:埃希氏菌属微生物中Wex序列第80位的氨基酸(丝氨酸)被疏水性氨基
酸取代
尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第80位的丝氨酸,以确认输出L-色氨酸的改进的效力。使用pCL1920-PyccA-wex作为模板,通过与实施例19相同的方法进行了定点诱变,以产生为四种不同类型的疏水性氨基酸的突变。
另外,使用与实施例19中相同的方法,用不同的疏水性氨基酸(即,丙氨酸(A)(SEQID NO:89、SEQ ID NO:134)、缬氨酸(V)(SEQ ID NO:90、SEQ ID NO:135)、亮氨酸(L)(SEQID NO:91、SEQ ID NO:136)和异亮氨酸(I)(SEQ ID NO:92、SEQ ID NO:137))中的每个取代Wex氨基酸序列的第80位的丝氨酸。用于获得突变pCL1920-PyccA-wex质粒的诱变引物组和突变形式与下表25中所示相同。
[表25]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列的第80位氨基酸被分别突变
将如表25中所示制备的pCL1920-PyccA-wex S80A、pCL1920-PyccA-wex S80V、pCL1920-PyccA-wex S80L和pCL1920-PyccA-wex S80I载体通过电穿孔各自转化到CA04-4303菌株中,以及从而获得了其中在第80位氨基酸中引入了彼此不同的突变wex基因中的每个的四种菌株。所获得的突变株分别命名为CA04-4303(wex S80A)、CA04-4303(wexS80V)、CA04-4303(wex S80L)和CA04-4303(wex S80I)。
为了确认CA04-4303(pCL1920)、CA04-4306、CA04-4303(wex S80A)、CA04-4303(wex S80V)、CA04-4303(wex S80L)和CA04-4303(wex S80I)菌株中色氨酸的生产量,使用与实施例12中相同的方法培养了这些菌株。培养完成后,通过HPLC测定了每种菌株中的L-色氨酸生产量。
[表26]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列的第80位的氨基酸被分别突变的突变株(CA04-4303(wex S80A)、CA04-4303(wex S80V)、CA04-4303(wexS80L)和CA04-4303(wex S80I))中L-色氨酸生产量
如表26的结果所示,与引入野生型Wex的CA04-4306菌株相比,其中Wex氨基酸序列第80位的氨基酸分别被不同的疏水性氨基酸取代的四种突变体全部显示发酵产率提高了0.3%p至1.2%p。特别地,与谷氨酸棒杆菌的生产L-色氨酸的菌株中一样,具有wex S80V突变的大肠杆菌菌株也显示了最大的L-色氨酸发酵产率的提高,且这些结果表明,用不同的疏水性氨基酸取代Wex氨基酸序列第80位的丝氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌属微生物中Wex的L-色氨酸输出能力的活性。
实施例21:埃希氏菌属微生物中Wex序列第81位的氨基酸(亮氨酸)被疏水性氨基
酸取代
尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第81位的亮氨酸,以确认输出L-色氨酸的改进的效力。使用pCL1920-PyccA-wex作为模板,通过与实施例19中相同的方法进行了定点诱变,以产生为除亮氨酸以外的三种不同类型的疏水性氨基酸的突变。
另外,使用与实施例19中相同的方法,用不同的疏水性氨基酸(即,丙氨酸(A)(SEQID NO:101、SEQ ID NO:138)、缬氨酸(V)(SEQ ID NO:102、SEQ ID NO:139)和异亮氨酸(I)(SEQ ID NO:103、SEQ ID NO:140))中的每个取代Wex氨基酸序列的第81位的亮氨酸。用于获得突变pCL1920-PyccA-wex质粒的诱变引物组和突变形式与下表27中所示相同。
[表27]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列第81位氨基酸被分别突变
将如表27中所示制备的pCL1920-PyccA-wex L81A、pCL1920-PyccA-wex L81V和pCL1920-PyccA-wex L81I载体通过电穿孔各自转化到CA04-4303菌株中,以及从而获得了其中在第81位氨基酸中引入了彼此不同的突变wex基因中的每个的三种菌株。所获得的突变株分别命名为CA04-4303(wex L81A)、CA04-4303(wex L81V)和CA04-4303(wex L81I)。
为了确认CA04-4303(pCL1920)、CA04-4306、CA04-4303(wex L81A)、CA04-4303(wex L81V)和CA04-4303(wex L81I)菌株中色氨酸的生产量,通过与实施例12中相同的方法培养了这些菌株。培养完成后,通过HPLC测定了每种菌株的L-色氨酸生产量。
[表28]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列第81位的氨基酸被分别突变的突变株(CA04-4303(wex L81A)、CA04-4303(wex L81V)和CA04-4303(wexL81I))中L-色氨酸生产量
如表28的结果所示,与引入野生型Wex的CA04-4306菌株相比,其中Wex氨基酸序列第81位的氨基酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了1.0%p至1.8%p。特别地,与谷氨酸棒杆菌的生产L-色氨酸的菌株中一样,具有wex L81A突变的大肠杆菌菌株也显示了最大的L-色氨酸发酵产率的提高,且这些结果表明,用不同的疏水性氨基酸取代Wex氨基酸序列第81位的亮氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌属微生物中Wex的L-色氨酸输出能力的活性。
实施例22:埃希氏菌属微生物中Wex序列第82位的氨基酸(丝氨酸)被疏水性氨基
酸取代
尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第82位的氨基酸(即丝氨酸),以确认输出L-色氨酸的改进的效力。使用pCL1920-PyccA-wex作为模板,通过与实施例19中相同的方法进行了定点诱变,以产生为四种不同类型的疏水性氨基酸的突变。
另外,使用与实施例19中相同的方法,用不同的疏水性氨基酸(即,丙氨酸(A)(SEQID NO:110、SEQ ID NO:141)、缬氨酸(V)(SEQ ID NO:111、SEQ ID NO:142)、亮氨酸(L)(SEQID NO:112、SEQ ID NO:143)和异亮氨酸(I)(SEQ ID NO:113、SEQ ID NO:144))中的每个取代Wex氨基酸序列的第82位的丝氨酸。用于获得突变pCL1920-PyccA-wex质粒的诱变引物组和突变形式与下表29中所示相同。
[表29]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列第82位氨基酸被分别突变
将如表29中所示制备的pCL1920-PyccA-wex S82A、pCL1920-PyccA-wex S82V、pCL1920-PyccA-wex S82L和pCL1920-PyccA-wex S82I载体通过电穿孔各自转化到CA04-4303菌株中,以及从而获得了其中在第82位氨基酸中引入了彼此不同的突变wex基因中的每个的四种菌株。所获得的突变株分别命名为CA04-4303(wex S82A)、CA04-4303(wexS82V)、CA04-4303(wex S82L)和CA04-4303(wex S82I)。
为了确认CA04-4303(pCL1920)、CA04-4306、CA04-4303(wex S82A)、CA04-4303(wex S82V)、CA04-4303(wex S82L)和CA04-4303(wex S82I)菌株中色氨酸的生产量,通过与实施例12中相同的方法培养了这些菌株。培养完成后,通过HPLC测定了每种菌株中的L-色氨酸生产量。
[表30]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列第82位的氨基酸被分别突变的突变株(CA04-4303(wex S82A)、CA04-4303(wex S82V)、CA04-4303(wexS82L)和CA04-4303(wex S82I))中L-色氨酸生产量
如表30的结果所示,与引入野生型Wex的CA04-4306菌株相比,其中Wex氨基酸序列第82位的氨基酸分别被不同的疏水性氨基酸取代的四种突变体全部显示发酵产率提高了0.2%p至1.4%p。与谷氨酸棒杆菌的生产L-色氨酸的菌株不同,具有wex S82V突变的大肠杆菌菌株显示了最大的L-色氨酸发酵产率的提高,且这些结果表明,用不同疏水性氨基酸取代Wex氨基酸序列第82位的丝氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌微生物中的Wex的L-色氨酸输出能力的活性。
实施例23:埃希氏菌属微生物中Wex序列第83位的氨基酸(异亮氨酸)被疏水性氨
基酸取代
尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第83位的氨基酸(即,异亮氨酸),以确认输出L-色氨酸的改进的效力。使用pCL1920-PyccA-wex作为模板,通过与实施例19中相同的方法进行定点诱变,以产生为异亮氨酸以外的三种疏水性氨基酸的突变。
另外,使用与实施例19中相同的方法,用不同的疏水性氨基酸(即,丙氨酸(A)(SEQID NO:122、SEQ ID NO:145)、缬氨酸(V)(SEQ ID NO:123、SEQ ID NO:146)、和亮氨酸(L)(SEQ ID NO:124、SEQ ID NO:147))中的每个取代Wex氨基酸序列的第83位的氨基酸(即,异亮氨酸)。用于获得突变pCL1920-PyccA-wex质粒的诱变引物组和突变形式与下表31中所示相同。
[表31]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组,该突变质粒中Wex氨基酸序列的第83位的氨基酸被分别突变
将如表31中所示制备的pCL1920-PyccA-wex I83A、pCL1920-PyccA-wex I83V和pCL1920-PyccA-wex I83L载体通过电穿孔各自转化到CA04-4303菌株中,以及从而获得了其中在第83位氨基酸中引入了彼此不同的突变wex基因中的每个的三种菌株。所获得的突变株分别命名为CA04-4303(wex I83A)、CA04-4303(wex I83V)和CA04-4303(wex I83L)。
为了确认CA04-4303(pCL1920)、CA04-4306、CA04-4303(wex I83A)、CA04-4303(wex I83V)和CA04-4303(wex I83L)菌株中色氨酸的生产量,用与实施例12中相同的方法培养了这些菌株。培养完成后,通过HPLC测定了每种菌株中的L-色氨酸生产量。
[表32]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列第83位的氨基酸被分别突变的突变株(CA04-4303(wex I83A)、CA04-4303(wex I83V)和CA04-4303(wexI83L))中的L-色氨酸生产量
如表32的结果所示,与引入野生型Wex的CA04-4306菌株相比,其中Wex氨基酸序列第83位的氨基酸分别被不同的疏水性氨基酸取代的三种突变株全部显示发酵产率提高了0.2%p至0.7%p。特别地,与谷氨酸棒杆菌的生产L-色氨酸的菌株中一样,具有wex I83L突变的大肠杆菌菌株也显示了最大的L-色氨酸发酵产率的提高,且这些结果表明,用不同的疏水性氨基酸取代Wex氨基酸序列第83位的异亮氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌属微生物中的Wex的L-色氨酸输出能力的活性。
根据以上所述,本公开所属领域的技术人员将能够理解,本公开可以在不修改本公开的技术概念或必要特征的情况下,以其它具体形式呈现。就这一点而言,本文公开的示例性实施方式仅用于说明性目的,而不应被解释为限制本公开的范围。本公开的范围应被解释为包括以下权利要求的含义和范围以及从其等同概念导出的所有改变或修改的形式,而不是以上详细描述。
<110> CJ第一制糖株式会社
<120> 新型L-色氨酸输出蛋白变体及使用其生产L-色氨酸的方法
<130> OPA19299
<150> KR 10-2019-0040397
<151> 2019-04-05
<160> 147
<170> KoPatentIn 3.0
<210> 1
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex AA 序列
<400> 1
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 2
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex NT 序列
<400> 2
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 3
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> wex - 1
<400> 3
tagaggagac acaacatgaa tagcaagaag gccac 35
<210> 4
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> wex - 2
<400> 4
ggctcttcct gtttagtcta caaacagtcc gccac 35
<210> 5
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> PgapA(-wex) - 1
<400> 5
cccttccggt ttagtttgaa gccagtgtga gttgc 35
<210> 6
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> PgapA(-wex) - 2
<400> 6
cttcttgcta ttcatgttgt gtctcctcta aagattgta 39
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 确认_PgapA-wex - 1
<400> 7
cggattatgc caatgatgtg 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 确认_PgapA-wex - 2
<400> 8
cacgatcacc aacattcagg 20
<210> 9
<211> 314
<212> PRT
<213> 人工序列
<220>
<223> Pst AA 序列
<400> 9
Met Lys Asn Gln Arg Lys Ala Thr Leu Ile Gly Leu Val Ala Ile Val
1 5 10 15
Leu Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu Ser Leu
20 25 30
Gly Ala Thr Gly Gly Ala Val Met Met Tyr Ser Val Ala Ser Val Met
35 40 45
Leu Leu Phe Thr Val Gly Phe Pro Arg Ile Arg Glu Phe Pro Arg Arg
50 55 60
Tyr Leu Val Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu
65 70 75 80
Ala Leu Ser Ile Gly Tyr Ala Asn Ser Ser Arg Gln Ala Ile Glu Val
85 90 95
Gly Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Ile Leu Ala Ala Ile
100 105 110
Leu Phe Asn Arg Gln Gln Ala Asn Leu Leu Ile Val Pro Gly Phe Leu
115 120 125
Ile Ala Ile Leu Gly Ile Cys Trp Val Leu Gly Gly Glu Gln Gly Leu
130 135 140
Asp Leu Ser Gly Met Thr Ala Asn Ile Arg Asp Asn Pro Leu Ser Tyr
145 150 155 160
Gly Leu Ala Phe Ala Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val
165 170 175
Thr Thr Arg Ile Ala Gly Gly Lys Asn Gly Val Thr Leu Phe Phe Met
180 185 190
Leu Thr Ala Leu Ala Leu Trp Ala Lys Tyr Leu Ala Ile Gly Gly Glu
195 200 205
Thr Met Glu Phe Ser Tyr His Ala Leu Ile Tyr Leu Val Leu Ala Ala
210 215 220
Ser Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His
225 230 235 240
Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Leu
245 250 255
Ser Ala Ala Leu Ala Ala Val Leu Leu Arg Thr Pro Leu Ser Leu Ser
260 265 270
Phe Trp Gln Gly Ala Ala Met Val Cys Ile Gly Ser Ile Leu Cys Trp
275 280 285
Phe Ala Thr Arg Ala Lys Pro Pro Glu Ser Ala Gln Ser Gly Asp Gln
290 295 300
Ala Ser Ala Thr Thr Pro Arg Arg Asn Gly
305 310
<210> 10
<211> 945
<212> DNA
<213> 人工序列
<220>
<223> Pst NT 序列
<400> 10
atgaaaaacc agcgtaaagc gaccctcatc gggctcgttg caattgtctt gtggagctcg 60
atcgtcggcc tgatccgggg cgtcagcgag agcctcggcg cgaccggtgg tgccgtcatg 120
atgtacagcg tcgcatcggt aatgctgttg ttcacggtcg gctttccgcg gatacgggag 180
ttcccccgac gctatcttgt ctggggcagc ctgctgttcg tctcgtacga gctgtgcctt 240
gccctgtcca tcggctacgc caacagcagc cgacaggcca tcgaggtcgg catggtcaat 300
tacctgtggc cggccttcac gatcctggcg gcgatcctgt tcaacaggca gcaggccaac 360
ctgctcatcg ttcccggctt cctcatcgcg atcctcggga tctgctgggt gctcggcggg 420
gaacaggggc tggacctgtc cgggatgacg gcgaacatcc gcgacaatcc cctcagctac 480
gggctggcct tcgccggcgc ggtgatctgg gcggcatact gcacggtgac cacgcggatc 540
gccggcggca agaacggtgt cacgctgttc ttcatgctga cggcattggc gctatgggcc 600
aagtacctgg ccatcggcgg ggaaacgatg gaattcagct accacgcgct gatctacctg 660
gtgctggccg cctccgcgat gggcttcggc tatgcggcgt ggaacgtcgg catcctgcac 720
ggcaatgtca ccgtcctcgc tggtgcttcg tatttcatcc cggtgctgtc cgccgccctg 780
gcggccgtac tgttgcgtac gccgctgtcg ctgtcgttct ggcagggtgc cgccatggtc 840
tgcatcgggt cgatcctctg ctggttcgcc acccgtgcga aaccgccaga atcggcgcag 900
tcgggtgacc aggccagcgc aaccacgccg cgtcgaaacg gataa 945
<210> 11
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pst-1
<400> 11
tagaggagac acaacatgaa aaaccagcgt aaagc 35
<210> 12
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pst-2
<400> 12
ggctcttcct gtttagttta tccgtttcga cgcgg 35
<210> 13
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> PgapA(-Pst)-2
<400> 13
acgctggttt ttcatgttgt gtctcctcta aagattgta 39
<210> 14
<211> 303
<212> PRT
<213> 人工序列
<220>
<223> Afa AA 序列
<400> 14
Met Lys Gln Ser Asp Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Val
1 5 10 15
Leu Trp Ser Thr Ile Val Gly Leu Ile Arg Ser Val Ser Asp Ser Leu
20 25 30
Gly Val Thr Gly Gly Ala Ala Leu Ile Tyr Thr Leu Ala Ser Val Phe
35 40 45
Leu Leu Leu Ser Val Gly Trp Val Arg Leu Arg Asp Phe Pro Arg Arg
50 55 60
Tyr Leu Ile Trp Gly Ser Val Leu Phe Val Cys Tyr Glu Leu Cys Leu
65 70 75 80
Ala Leu Ser Ile Gly Tyr Ala His Asn Ser Gln Gln Ala Ile Glu Val
85 90 95
Gly Met Val Asn Tyr Leu Trp Pro Thr Phe Thr Ile Val Ala Ala Ile
100 105 110
Leu Phe Asn Lys Gln Lys Ala Asn Gly Leu Leu Ala Pro Gly Leu Leu
115 120 125
Leu Ser Met Met Gly Ile Ser Trp Ile Leu Gly Gly Glu Gln Gly Leu
130 135 140
Ser Leu His Asn Ile Trp Leu Asn Val Gln Asp Asn Pro Leu Ser Tyr
145 150 155 160
Gly Leu Ala Phe Ser Gly Ala Leu Ile Trp Ala Gly Tyr Ser Thr Met
165 170 175
Thr Ala Arg Ile Ala Gln Gly Lys Asn Gly Ile Thr Leu Phe Phe Met
180 185 190
Leu Thr Ala Ala Ala Leu Trp Val Lys Tyr Leu Val Gln Gly Ala Pro
195 200 205
Ala Met Thr Phe Thr Val Pro Ala Leu Val Tyr Leu Leu Leu Ala Ala
210 215 220
Met Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His
225 230 235 240
Gly Asn Val Thr Ile Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Phe
245 250 255
Ser Ala Ala Leu Ser Thr Val Leu Leu Gln Ala Pro Leu Thr Leu Thr
260 265 270
Phe Trp Gln Gly Ser Ser Met Val Cys Leu Gly Ala Leu Leu Cys Trp
275 280 285
Leu Ala Ile Arg Val Arg Lys Pro Arg Ser Leu Lys Ser Ala Ala
290 295 300
<210> 15
<211> 912
<212> DNA
<213> 人工序列
<220>
<223> Afa NT 序列
<400> 15
atgaagcaat ctgataaggc aaccctgatc gggctgatcg ccattgtcct ttggagcacg 60
attgtcggcc tgatacgcag cgtcagcgac tctctgggcg taaccggcgg cgctgccctg 120
atttacaccc tggcctcggt ctttcttctt ttatcagtgg gctgggtacg cttgcgcgac 180
ttcccgcgtc gctacctgat ctggggcagt gtgctgtttg tctgctatga actctgcctg 240
gccctgtcca tcggctatgc ccacaacagc cagcaggcaa ttgaagtggg gatggtcaac 300
tatctgtggc cgacctttac cattgtggcc gccatcttgt tcaataagca aaaagccaat 360
gggctgcttg cacccggcct gctcttgtcc atgatgggaa tcagctggat tctgggcggc 420
gagcaaggct tgagcctgca caacatctgg ctgaatgtgc aggacaatcc cttgagctac 480
ggcctggcct ttagcggcgc gctgatctgg gccggctaca gcaccatgac cgcccgcatc 540
gcccagggca aaaatggcat caccctgttt ttcatgctga cggcagcggc cttgtgggtg 600
aagtacctgg tccaaggtgc tcctgccatg acgtttacgg ttcccgcctt ggtgtatttg 660
ctgctggcgg ccatggcgat gggctttggc tatgccgcct ggaatgtcgg tattttgcat 720
ggcaatgtca ccatcctggc cggcgcttcc tactttattc cggtattttc agccgccctg 780
tccaccgttt tgctgcaagc tccgttgacg ctgaccttct ggcaaggctc gtccatggtg 840
tgtttgggtg ccctgctatg ctggctggcc atccgggttc gcaaaccccg gtcactaaaa 900
agcgctgcct ga 912
<210> 16
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Afa-1
<400> 16
tagaggagac acaacatgaa gcaatctgat aaggc 35
<210> 17
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Afa-2
<400> 17
gctcttcctg tttagttcag gcagcgcttt ttagt 35
<210> 18
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> PgapA(-Afa)-2
<400> 18
atcagattgc ttcatgttgt gtctcctcta aagattgta 39
<210> 19
<211> 314
<212> PRT
<213> 人工序列
<220>
<223> Cne AA 序列
<400> 19
Met Gln Ser Lys Ser Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Leu
1 5 10 15
Leu Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu Asn Leu
20 25 30
Gly Ala Thr Gly Gly Ala Ala Met Ile Tyr Thr Val Ala Ser Ala Leu
35 40 45
Leu Leu Leu Thr Val Gly Phe Val Arg Met Gln Asp Phe Pro Arg Arg
50 55 60
Tyr Leu Val Trp Gly Ser Ile Leu Phe Val Ser Tyr Glu Leu Cys Leu
65 70 75 80
Ser Leu Ser Ile Gly Tyr Ala Asn Ser Ser Arg Gln Ala Ile Glu Val
85 90 95
Gly Met Val Asn Tyr Leu Trp Pro Ser Phe Thr Met Leu Cys Ala Ile
100 105 110
Ala Phe Asn Lys Gln Lys Ala Asn Leu Leu Ile Ile Pro Gly Phe Leu
115 120 125
Ile Ala Ile Leu Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu
130 135 140
Asp Phe Ala Gly Met Ala Glu Asn Ile Gln Asp Asn Pro Leu Ser Tyr
145 150 155 160
Gly Leu Ala Phe Leu Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val
165 170 175
Thr Asn Arg Ile Ala Glu Gly Arg Asn Gly Ile Thr Leu Phe Phe Met
180 185 190
Leu Thr Ala Leu Ala Leu Trp Ile Lys Tyr Phe Ala Thr Glu Ser Gly
195 200 205
Ser Met Glu Phe Ser Tyr Gln Ala Val Ile Tyr Leu Ala Leu Ala Ala
210 215 220
Ser Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His
225 230 235 240
Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Leu
245 250 255
Ser Ala Ala Leu Ala Ala Met Leu Leu Arg Thr Pro Leu Ser Ile Ala
260 265 270
Phe Trp Lys Gly Ala Ser Met Val Cys Ala Gly Ser Ile Leu Cys Trp
275 280 285
Leu Ala Thr Arg Gly Gln Arg Ser Lys Ala Pro Pro Leu Pro Glu Leu
290 295 300
Pro Gln Ser Arg Glu Arg Val Gln Glu Pro
305 310
<210> 20
<211> 945
<212> DNA
<213> 人工序列
<220>
<223> Cne NT 序列
<400> 20
atgcaaagca agagcaaagc aactctcatc gggctcatcg cgattctgtt atggagctcg 60
attgtcggcc tgattcgcgg tgtcagcgaa aaccttgggg caaccggtgg ggcggcaatg 120
atctataccg tcgcctcggc cctgctcttg ctgacagtcg gtttcgtcag aatgcaggat 180
tttccccggc gctatctggt ttggggaagc attctgttcg tttcgtacga gctgtgtctt 240
tccttgtcca ttggctacgc caacagcagc aggcaagcca ttgaggtggg gatggtcaac 300
tacttgtggc cgagcttcac catgctgtgt gccatcgcat tcaacaagca gaaggccaac 360
ttgctgatca ttcccggctt cctgatcgcc attctcggga tctgctgggt gcttggcggg 420
gatcagggcc tggacttcgc cgggatggcg gagaacatcc aggacaatcc gctcagctat 480
gggctggcct tccttggtgc cctgatctgg gcggcgtatt gcactgtgac caaccggatt 540
gccgaaggca ggaatggcat cacgctgttc ttcatgctga cagcgctggc gttgtggatc 600
aagtatttcg ccacagagag cgggtcgatg gaatttagct atcaggcagt gatttatctt 660
gcgttggccg cctctgcgat gggattcggc tatgcggcct ggaatgttgg catcctgcat 720
ggcaatgtca ccgtccttgc cggcgcttcc tacttcattc cggtactttc cgccgccctg 780
gcggccatgc tcttgcgtac acccctgtcg atcgccttct ggaagggcgc atccatggta 840
tgtgcggggt cgatcctctg ttggctggca acacgtgggc aacgttccaa ggcacctccg 900
ttgccggaat taccgcagtc gcgcgaacgt gtccaggaac cgtga 945
<210> 21
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Cne-1
<400> 21
tagaggagac acaacatgca aagcaagagc aaagc 35
<210> 22
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Cne-2
<400> 22
ggctcttcct gtttagttca cggttcctgg acacg 35
<210> 23
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> PgapA(-Cne)-2
<400> 23
gctcttgctt tgcatgttgt gtctcctcta aagattgta 39
<210> 24
<211> 293
<212> PRT
<213> 人工序列
<220>
<223> Eco AA 序列
<400> 24
Met Thr Arg Gln Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Val Leu
1 5 10 15
Trp Ser Thr Met Val Gly Leu Ile Arg Gly Val Ser Glu Gly Leu Gly
20 25 30
Pro Val Gly Gly Ala Ala Ala Ile Tyr Ser Leu Ser Gly Leu Leu Leu
35 40 45
Ile Phe Thr Val Gly Phe Pro Arg Ile Arg Gln Ile Pro Lys Gly Tyr
50 55 60
Leu Leu Ala Gly Ser Leu Leu Phe Val Ser Tyr Glu Ile Cys Leu Ala
65 70 75 80
Leu Ser Leu Gly Tyr Ala Ala Thr His His Gln Ala Ile Glu Val Gly
85 90 95
Met Val Asn Tyr Leu Trp Pro Ser Leu Thr Ile Leu Phe Ala Ile Leu
100 105 110
Phe Asn Gly Gln Lys Thr Asn Trp Leu Ile Val Pro Gly Leu Leu Leu
115 120 125
Ala Leu Val Gly Val Cys Trp Val Leu Gly Gly Asp Asn Gly Leu His
130 135 140
Tyr Asp Glu Ile Ile Asn Asn Ile Thr Thr Ser Pro Leu Ser Tyr Phe
145 150 155 160
Leu Ala Phe Ile Gly Ala Phe Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Asn Lys Tyr Ala Arg Gly Phe Asn Gly Ile Thr Val Phe Val Leu Leu
180 185 190
Thr Gly Ala Ser Leu Trp Val Tyr Tyr Phe Leu Thr Pro Gln Pro Glu
195 200 205
Met Ile Phe Ser Thr Pro Val Met Ile Lys Leu Ile Ser Ala Ala Phe
210 215 220
Thr Leu Gly Phe Ala Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Ile Met Ala Val Gly Ser Tyr Phe Thr Pro Val Leu Ser
245 250 255
Ser Ala Leu Ala Ala Val Leu Leu Ser Ala Pro Leu Ser Phe Ser Phe
260 265 270
Trp Gln Gly Ala Leu Met Val Cys Gly Gly Ser Leu Leu Cys Trp Leu
275 280 285
Ala Thr Arg Arg Gly
290
<210> 25
<211> 882
<212> DNA
<213> 人工序列
<220>
<223> Eco NT 序列
<400> 25
atgacacgac aaaaagcaac gctcataggg ctgatagcga tcgtcctgtg gagcacgatg 60
gtaggattga ttcgcggtgt cagtgagggg ctcggcccgg tcggcggcgc agctgctatc 120
tattcattaa gcgggctgct gttaatcttc acggttggat ttccgcgtat tcggcaaatc 180
ccgaaaggct atttactcgc cgggagtctg ttattcgtca gctatgaaat ctgtctggcg 240
ctttccttag ggtatgcggc gacccatcat caggcgattg aagtgggtat ggtgaactat 300
ctgtggccca gcctgacaat tctctttgcc attctgttta atggtcagaa aaccaactgg 360
ttgattgtac ctggattatt attagccctc gtcggcgtct gttgggtgtt aggcggtgac 420
aatgggttac attatgatga aatcatcaat aatatcacca ccagcccatt gagttatttc 480
ctggcgttca ttggtgcgtt tatctgggca gcctattgca cagtaacgaa taaatacgca 540
cgcggattta atggaattac cgtttttgtc ctgctaacgg gagcaagtct gtgggtttac 600
tattttctta cgccacaacc agaaatgata tttagcacgc ccgtcatgat taaactcatc 660
tctgcggcat ttaccttagg atttgcttat gctgcatgga atgtcggtat attgcatggc 720
aatgtcacca ttatggcggt aggttcgtat tttacgcctg tactttcctc agcgcttgca 780
gccgtgctgc tcagcgcccc gctgtcgttc tcgttctggc aaggcgcgct gatggtctgc 840
ggcggttccc tgctctgctg gctggcgaca cgtcgtggtt aa 882
<210> 26
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Eco-1
<400> 26
tagaggagac acaacatgac acgacaaaaa gcaac 35
<210> 27
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Eco-2
<400> 27
gctcttcctg tttagtttaa ccacgacgtg tcgcc 35
<210> 28
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> PgapA(-Eco)-2
<400> 28
tttttgtcgt gtcatgttgt gtctcctcta aagattg 37
<210> 29
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Hrh-3
<400> 29
atagagagtg actcaatgaa tagcaagaag gccac 35
<210> 30
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> Hrh-4
<400> 30
tcgagctcgg tacccctaca aacagtccgc cac 33
<210> 31
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> PyccA - 1
<400> 31
ctctagagga tccccttcca gatcaaatgc gtaa 34
<210> 32
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> PyccA(-Hrh)-2
<400> 32
cttcttgcta ttcattgagt cactctctat gacag 35
<210> 33
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pst-3
<400> 33
atagagagtg actcaatgaa aaaccagcgt aaagc 35
<210> 34
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> Pst-4
<400> 34
tcgagctcgg tacccttatc cgtttcgacg cgg 33
<210> 35
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> PyccA(-Pst)-2
<400> 35
acgctggttt ttcattgagt cactctctat gacag 35
<210> 36
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Afa-3
<400> 36
atagagagtg actcaatgaa gcaatctgat aaggc 35
<210> 37
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> Afa-4
<400> 37
tcgagctcgg taccctcagg cagcgctttt tagt 34
<210> 38
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> PyccA(-Afa)-2
<400> 38
atcagattgc ttcattgagt cactctctat gacag 35
<210> 39
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Cne-3
<400> 39
atagagagtg actcaatgca aagcaagagc aaagc 35
<210> 40
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> Cne-4
<400> 40
tcgagctcgg taccctcacg gttcctggac acg 33
<210> 41
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> PyccA(-Cne)-2
<400> 41
gctcttgctt tgcattgagt cactctctat gacag 35
<210> 42
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Eco-3
<400> 42
atagagagtg actcaatgac acgacaaaaa gcaac 35
<210> 43
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> Eco-4
<400> 43
tcgagctcgg tacccttaac cacgacgtgt cgcc 34
<210> 44
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> PyccA(-Eco)-2
<400> 44
tttttgtcgt gtcattgagt cactctctat gacag 35
<210> 45
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pspl7-trpE(S38R)_L-1
<400> 45
tcgagctcgg tacccaaaca actgcgacgt gtgtc 35
<210> 46
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pspl7-trpE(S38R)_L-2
<400> 46
catgaagcgc cggtacctta atcatttttg ggttc 35
<210> 47
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pspl7-trpE(S38R)_R-1
<400> 47
gccctgttgg aacgcgctga tatcaccacc aagaa 35
<210> 48
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pspl7-trpE(S38R)_R-2
<400> 48
ctctagagga tccccagatg tcaccgttgt aaatg 35
<210> 49
<211> 294
<212> DNA
<213> 人工序列
<220>
<223> spl7 启动子 序列
<400> 49
ggcgcttcat gtcaacaatc tttaacgttt tcaagttcac aagtcgtgtt caaatggtga 60
caagattgga cactgtgctg aattggcacc aagccctcat aaatgataga tctaaatcga 120
atatcaatat atggtctgtt tattggaacg cgtcccagtg gctgagacgc atccgctaaa 180
gccccaggaa ccctgtgcag aaagaacaaa taatcgtgaa ttttggcagc aacagcaatt 240
cctgctacaa ttgaaaacgt gcaaaagcat agattattgg aggagatcaa aaca 294
<210> 50
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pspl7 - 1
<400> 50
cccaaaaatg attaaggtac cggcgcttca tgtca 35
<210> 51
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> Pspl7 - 2
<400> 51
gggattcgtg ctcatgatat ctgttttgat ctcctcc 37
<210> 52
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> trpE (S38R) - 1
<400> 52
atcaaaacag atatcatgag cacgaatccc catgt 35
<210> 53
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> trpE (S38R) - 2
<400> 53
gtggtgatat cagcgcgttc caacagggct gcatc 35
<210> 54
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 确认_Pspl7-trpE(S38R) - 1
<400> 54
gaagaagagg ctgcagatg 19
<210> 55
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 确认_Pspl7-trpE(S38R) - 2
<400> 55
gatcagcgcc atcatgtt 18
<210> 56
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pn-tkt_L - 1
<400> 56
tcgagctcgg tacccaaact ttgagtgggt gcgtg 35
<210> 57
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pn-tkt_L - 2
<400> 57
tcgagctacg agggcggttc ccagcccttc attag 35
<210> 58
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pn-tkt_R - 1
<400> 58
attaacggtt aattgattct ggacgtcatg actac 35
<210> 59
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pn-tkt_R - 2
<400> 59
ctctagagga tccccgcctc gatgatgcag tcgtc 35
<210> 60
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Pn-tkt - 1
<400> 60
gaagggctgg gaaccgccct cgtagctcga gagtt 35
<210> 61
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> Pn-tkt - 2
<400> 61
catgacgtcc agaatcaatt aaccgttaat ggagtcc 37
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 确认_Pn-tkt - 1
<400> 62
acccagaacc ccaaattttc 20
<210> 63
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 确认_Pn-tkt - 2
<400> 63
ttgagttcga caactttgg 19
<210> 64
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 64
tgcaatgcat aacaacgcag tcgcactatt tttcactgga gagaagccct gtgtaggctg 60
gagctgcttc 70
<210> 65
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 65
tgcaatgcat aacaacgcag tcgcactatt tttcactgga gagaagccct gtccatatga 60
atatcctcct 70
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 66
gggcaggatc tcctgtcatc 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 67
aaatgtcgga taaggcaccg 20
<210> 68
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 68
tgtaatattc acagggatca ctgtaattaa aataaatgaa ggattatgta gtgtaggctg 60
gagctgcttc 70
<210> 69
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 69
tgtagggtaa gagagtggct aacatcctta tagccactct gtagtattaa gtccatatga 60
atatcctcct 70
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 70
acatccttat agccactctg 20
<210> 71
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 71
tacaaccggg ggaggcattt tgcttccccc gctaacaatg gcgacatatt gtgtaggctg 60
gagctgcttc 70
<210> 72
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 72
gcattcggtg cacgatgcct gatgcgccac gtcttatcag gcctacaaaa gtccatatga 60
atatcctcct 70
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 73
aggacggata aggcgttcac 20
<210> 74
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> trpE - 1
<400> 74
gaattcatgc aaacacaaaa accgac 26
<210> 75
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> trpE - 2
<400> 75
gaattctcag aaagtctcct gtgca 25
<210> 76
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> trpE(P21S) - 1
<400> 76
cgcttatcgc gacaattcca ccgcgctttt tcaccag 37
<210> 77
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> trpE(P21S) - 2
<400> 77
ctggtgaaaa agcgcggtgg aattgtcgcg ataagcg 37
<210> 78
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex-1)
<400> 78
actctagagg atccccttcc agatcaaatg cgtaa 35
<210> 79
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex-2)
<400> 79
attcgagctc ggtaccccta caaacagtcc gccac 35
<210> 80
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(L79A)
<400> 80
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcgcatcg 240
ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 81
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(L79V)
<400> 81
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcgtgtcg 240
ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 82
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(L79I)
<400> 82
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcatctcg 240
ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 83
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L79A-1)
<400> 83
gtgtcctacg aactctgcgc atcgctctcc atcggttatg 40
<210> 84
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L79A-2)
<400> 84
cataaccgat ggagagcgat gcgcagagtt cgtaggacac 40
<210> 85
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L79V-1)
<400> 85
gtgtcctacg aactctgcgt gtcgctctcc atcggttatg 40
<210> 86
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L79V-2)
<400> 86
cataaccgat ggagagcgac acgcagagtt cgtaggacac 40
<210> 87
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L79I-1)
<400> 87
gtgtcctacg aactctgcat ctcgctctcc atcggttatg 40
<210> 88
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L79I-2)
<400> 88
cataaccgat ggagagcgag atgcagagtt cgtaggacac 40
<210> 89
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(S80A)
<400> 89
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctggca 240
ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 90
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(S80V)
<400> 90
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctggtg 240
ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 91
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(S80L)
<400> 91
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgctg 240
ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 92
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(S80I)
<400> 92
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgatc 240
ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 93
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S80A-1)
<400> 93
gtcctacgaa ctctgcctgg cactctccat cggttatgcc 40
<210> 94
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S80A-2)
<400> 94
ggcataaccg atggagagtg ccaggcagag ttcgtaggac 40
<210> 95
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S80V-1)
<400> 95
gtcctacgaa ctctgcctgg tgctctccat cggttatgcc 40
<210> 96
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S80V-2)
<400> 96
ggcataaccg atggagagca ccaggcagag ttcgtaggac 40
<210> 97
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S80L-1)
<400> 97
gtcctacgaa ctctgcctgc tgctctccat cggttatgcc 40
<210> 98
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S80L-2)
<400> 98
ggcataaccg atggagagca gcaggcagag ttcgtaggac 40
<210> 99
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S80I-1)
<400> 99
gtcctacgaa ctctgcctga tcctctccat cggttatgcc 40
<210> 100
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S80I-2)
<400> 100
ggcataaccg atggagagga tcaggcagag ttcgtaggac 40
<210> 101
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(L81A)
<400> 101
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
gcatccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 102
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(L81V)
<400> 102
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
gtgtccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 103
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(L81I)
<400> 103
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
atctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 104
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L81A-1)
<400> 104
cctacgaact ctgcctgtcg gcatccatcg gttatgccaa tac 43
<210> 105
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L81A-2)
<400> 105
gtattggcat aaccgatgga tgccgacagg cagagttcgt agg 43
<210> 106
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L81V-1)
<400> 106
cctacgaact ctgcctgtcg gtgtccatcg gttatgccaa tac 43
<210> 107
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L81V-2)
<400> 107
gtattggcat aaccgatgga caccgacagg cagagttcgt agg 43
<210> 108
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L81I-1)
<400> 108
cctacgaact ctgcctgtcg atctccatcg gttatgccaa tac 43
<210> 109
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex L81I-2)
<400> 109
gtattggcat aaccgatgga gatcgacagg cagagttcgt agg 43
<210> 110
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(S82A)
<400> 110
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
ctcgcaatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 111
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(S82V)
<400> 111
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
ctcgtgatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 112
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(S82L)
<400> 112
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
ctcctgatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 113
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(S82I)
<400> 113
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
ctcatcatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 114
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S82A-1)
<400> 114
cgaactctgc ctgtcgctcg caatcggtta tgccaataca g 41
<210> 115
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S82A-2)
<400> 115
ctgtattggc ataaccgatt gcgagcgaca ggcagagttc g 41
<210> 116
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S82V-1)
<400> 116
cgaactctgc ctgtcgctcg tgatcggtta tgccaataca g 41
<210> 117
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S82V-2)
<400> 117
ctgtattggc ataaccgatc acgagcgaca ggcagagttc g 41
<210> 118
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S82L-1)
<400> 118
cgaactctgc ctgtcgctcc tgatcggtta tgccaataca g 41
<210> 119
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S82L-2)
<400> 119
ctgtattggc ataaccgatc aggagcgaca ggcagagttc g 41
<210> 120
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S82I-1)
<400> 120
cgaactctgc ctgtcgctca tcatcggtta tgccaataca g 41
<210> 121
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex S82I-2)
<400> 121
ctgtattggc ataaccgatg atgagcgaca ggcagagttc g 41
<210> 122
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(I83A)
<400> 122
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
ctctccgcag gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 123
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(I83V)
<400> 123
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
ctctccgtgg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 124
<211> 924
<212> DNA
<213> 人工序列
<220>
<223> wex(I83L)
<400> 124
atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60
gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120
tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180
ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240
ctctccctgg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300
ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360
atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420
caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480
ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540
aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600
tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660
ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720
aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780
gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840
gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900
gatgcggtgg cggactgttt gtag 924
<210> 125
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex I83A-1)
<400> 125
gaactctgcc tgtcgctctc cgcaggttat gccaatacag gcagg 45
<210> 126
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex I83A-2)
<400> 126
cctgcctgta ttggcataac ctgcggagag cgacaggcag agttc 45
<210> 127
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex I83V-1)
<400> 127
gaactctgcc tgtcgctctc cgtgggttat gccaatacag gcagg 45
<210> 128
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex I83V-2)
<400> 128
cctgcctgta ttggcataac ccacggagag cgacaggcag agttc 45
<210> 129
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex I83L-1)
<400> 129
gaactctgcc tgtcgctctc cctgggttat gccaatacag gcagg 45
<210> 130
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物(wex I83L-2)
<400> 130
cctgcctgta ttggcataac ccagggagag cgacaggcag agttc 45
<210> 131
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex L79A
<400> 131
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Ala Ser
65 70 75 80
Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 132
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex L79V
<400> 132
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Val Ser
65 70 75 80
Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 133
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex L79I
<400> 133
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Ile Ser
65 70 75 80
Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 134
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex S80A
<400> 134
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ala
65 70 75 80
Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 135
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex S80V
<400> 135
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Val
65 70 75 80
Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 136
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex S80L
<400> 136
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Leu
65 70 75 80
Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 137
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex S80I
<400> 137
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ile
65 70 75 80
Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 138
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex L81A
<400> 138
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Ala Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 139
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex L81V
<400> 139
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Val Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 140
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex L81I
<400> 140
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Ile Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 141
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex S82A
<400> 141
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Ala Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 142
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex S82V
<400> 142
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Val Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 143
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex S82L
<400> 143
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Leu Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 144
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex S82I
<400> 144
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Ile Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 145
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex I83A
<400> 145
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Ser Ala Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 146
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex I83V
<400> 146
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Ser Val Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
<210> 147
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> wex I83L
<400> 147
Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu
1 5 10 15
Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly
20 25 30
Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu
35 40 45
Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr
50 55 60
Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser
65 70 75 80
Leu Ser Leu Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser
85 90 95
Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala
100 105 110
Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu
115 120 125
Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp
130 135 140
Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly
145 150 155 160
Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr
165 170 175
Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu
180 185 190
Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro
195 200 205
Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala
210 215 220
Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly
225 230 235 240
Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser
245 250 255
Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe
260 265 270
Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu
275 280 285
Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala
290 295 300
Asp Cys Leu
305
Claims (7)
1.具有L-色氨酸输出活性的蛋白质变体,
其中SEQ ID NO:1的氨基酸序列中的第79位氨基酸被丙氨酸、缬氨酸或异亮氨酸取代,
其中SEQ ID NO:1的氨基酸序列中的第80位氨基酸被丙氨酸、缬氨酸、亮氨酸或异亮氨酸取代,
其中SEQ ID NO:1的氨基酸序列中的第81位氨基酸被丙氨酸、缬氨酸或异亮氨酸取代,
其中SEQ ID NO:1的氨基酸序列中的第82位氨基酸被丙氨酸、缬氨酸、亮氨酸或异亮氨酸取代,或
其中SEQ ID NO:1的氨基酸序列中的第83位氨基酸被丙氨酸、缬氨酸或亮氨酸取代。
2.根据权利要求1所述的蛋白质变体,其中所述蛋白质变体由选自SEQ ID NO:131至SEQ ID NO:147中的任一个氨基酸序列组成。
3.多核苷酸,其编码权利要求1至2中任一项所述的蛋白质变体。
4.载体,其包含权利要求3所述的多核苷酸。
5.生产L-色氨酸的微生物,其表达权利要求1至2中任一项所述的蛋白质变体,其中所述微生物属于棒杆菌属(genus Corynebacterium)或埃希氏菌属(genus Escherichia)。
6.生产L-色氨酸的方法,其包括:
在培养基中培养权利要求5所述的微生物;以及
从所述培养的培养基或培养的微生物中回收L-色氨酸。
7.蛋白质变体用于增加微生物的L-色氨酸生产的用途,
其中SEQ ID NO:1的氨基酸序列中的第79位氨基酸被丙氨酸、缬氨酸或异亮氨酸取代,
其中SEQ ID NO:1的氨基酸序列中的第80位氨基酸被丙氨酸、缬氨酸、亮氨酸或异亮氨酸取代,
其中SEQ ID NO:1的氨基酸序列中的第81位氨基酸被丙氨酸、缬氨酸或异亮氨酸取代,
其中SEQ ID NO:1的氨基酸序列中的第82位氨基酸被丙氨酸、缬氨酸、亮氨酸或异亮氨酸取代,或
其中SEQ ID NO:1的氨基酸序列中的第83位氨基酸被丙氨酸、缬氨酸或亮氨酸取代,
其中所述微生物属于棒杆菌属或埃希氏菌属。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190040397A KR102205717B1 (ko) | 2019-04-05 | 2019-04-05 | 신규 l-트립토판 배출 단백질 변이체 및 이를 이용한 l-트립토판을 생산하는 방법 |
KR10-2019-0040397 | 2019-04-05 | ||
PCT/KR2020/003855 WO2020204427A1 (ko) | 2019-04-05 | 2020-03-20 | 신규 l-트립토판 배출 단백질 변이체 및 이를 이용한 l-트립토판을 생산하는 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112823165A CN112823165A (zh) | 2021-05-18 |
CN112823165B true CN112823165B (zh) | 2024-03-26 |
Family
ID=72666413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080004146.7A Active CN112823165B (zh) | 2019-04-05 | 2020-03-20 | 新型l-色氨酸输出蛋白变体及使用其生产l-色氨酸的方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US11524981B2 (zh) |
EP (1) | EP3789398A4 (zh) |
JP (2) | JP7539871B2 (zh) |
KR (1) | KR102205717B1 (zh) |
CN (1) | CN112823165B (zh) |
BR (1) | BR112021000765B1 (zh) |
CA (1) | CA3105666C (zh) |
MX (1) | MX2021000685A (zh) |
RU (1) | RU2763603C1 (zh) |
WO (1) | WO2020204427A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102647745B1 (ko) * | 2020-05-27 | 2024-03-14 | 씨제이제일제당 주식회사 | 신규 l-타이로신 배출 단백질 변이체 및 이를 이용한 l-타이로신을 생산하는 방법 |
KR102284726B1 (ko) * | 2021-01-25 | 2021-08-02 | 씨제이제일제당 주식회사 | 신규한 타우토머레이즈 pptA 변이체 및 이를 이용한 L-트립토판 생산 방법 |
KR102284728B1 (ko) * | 2021-01-25 | 2021-08-02 | 씨제이제일제당 주식회사 | 신규한 H(+)/Cl(-) 익스체인지 트랜스포터 변이체 및 이를 이용한 L-트립토판 생산 방법 |
KR102284727B1 (ko) * | 2021-01-25 | 2021-08-02 | 씨제이제일제당 주식회사 | 신규한 단백질 HtrL 변이체 및 이를 이용한 L-트립토판 생산 방법 |
KR102284725B1 (ko) * | 2021-01-25 | 2021-08-02 | 씨제이제일제당 주식회사 | 신규한 페로체라테이즈 변이체 및 이를 이용한 l-트립토판 생산 방법 |
KR102284729B1 (ko) * | 2021-01-29 | 2021-08-02 | 씨제이제일제당 주식회사 | 신규한 시아네이트 트랜스포터 패밀리 단백질변이체 및 이를 이용한 l-트립토판 생산 방법 |
KR102688095B1 (ko) * | 2021-04-28 | 2024-07-24 | 씨제이제일제당 주식회사 | 변이형 SpoT 단백질 및 이를 이용한 L-아미노산을 생산하는 방법 |
WO2024090885A1 (ko) * | 2022-10-24 | 2024-05-02 | 대상 주식회사 | Dna-결합 전사 제어인자 malt 신규 변이체 및 이를 이용한 l-방향족 아미노산의 생산 방법 |
WO2024090884A1 (ko) * | 2022-10-24 | 2024-05-02 | 대상 주식회사 | 페닐알라닌:h+ 동시수송체 phep 신규 변이체 및 이를 이용한 l-방향족 아미노산의 생산 방법 |
KR20240105684A (ko) * | 2022-12-28 | 2024-07-08 | 씨제이제일제당 (주) | 외래 글루타민 신테타제가 도입된 미생물 및 이를 이용한 l-트립토판의 생산 방법 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1993461A (zh) * | 2004-08-03 | 2007-07-04 | 德古萨股份公司 | 使用肠杆菌科菌株生产l-氨基酸的方法 |
WO2007086618A1 (en) * | 2006-01-30 | 2007-08-02 | Ajinomoto Co., Inc. | L-amino acid producing bacterium and method of producing l-amino acid |
WO2007125954A1 (ja) * | 2006-04-28 | 2007-11-08 | Ajinomoto Co., Inc. | L-アミノ酸を生産する微生物及びl-アミノ酸の製造法 |
CN101273138A (zh) * | 2005-09-27 | 2008-09-24 | 味之素株式会社 | 产生l-氨基酸的细菌和用于产生l-氨基酸的方法 |
CN101838628A (zh) * | 2001-11-23 | 2010-09-22 | 味之素株式会社 | 利用埃希杆菌属细菌生产l-氨基酸的方法 |
KR101142885B1 (ko) * | 2003-12-15 | 2012-05-10 | 씨제이제일제당 (주) | 트립토판 생합성 관련 변이유전자를 함유한 대장균 변이주및 이를 이용한 트립토판 제조방법 |
CN107002074A (zh) * | 2015-06-10 | 2017-08-01 | 公立大学法人富山县立大学 | 活性型突变酶的制造方法及新型活性型突变酶、以及可溶性化突变蛋白的制造方法 |
KR20180089329A (ko) * | 2018-02-23 | 2018-08-08 | 씨제이제일제당 (주) | L-트립토판을 생산하는 재조합 코리네형 미생물 및 이를 이용한 l-트립토판을 생산하는 방법 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19548222A1 (de) | 1995-12-22 | 1997-06-26 | Forschungszentrum Juelich Gmbh | Verfahren zur mikrobiellen Herstellung von Aminosäuren durch gesteigerte Aktivität von Exportcarriern |
RU2148642C1 (ru) | 1998-12-23 | 2000-05-10 | ЗАО "Научно-исследовательский институт АДЖИНОМОТО-Генетика" (ЗАО "АГРИ") | Фрагмент днк rhtc, кодирующий синтез белка rhtc, придающего повышенную устойчивость к l-треонину бактериям escherichia coli, и способ получения l-аминокислоты |
RU2175351C2 (ru) | 1998-12-30 | 2001-10-27 | Закрытое акционерное общество "Научно-исследовательский институт "Аджиномото-Генетика" (ЗАО "АГРИ") | Фрагмент днк из escherichia coli, определяющий повышенную продукцию l-аминокислот (варианты), и способ получения l-аминокислот |
JPWO2007026958A1 (ja) * | 2005-09-01 | 2009-03-12 | サントリー株式会社 | トリプトファントランスポーター遺伝子及びその用途 |
DE102006032634A1 (de) * | 2006-07-13 | 2008-01-17 | Evonik Degussa Gmbh | Verfahren zur Herstellung von L-Aminosäuren |
HUE057864T2 (hu) * | 2012-01-10 | 2022-06-28 | Cj Cheiljedang Corp | Fokozott L-triptofán termeléssel rendelkezõ Escherichia coli mikroorganizmusok és eljárás L-triptofán elõállítására azok alkalmazásával |
WO2018116555A1 (ja) * | 2016-12-22 | 2018-06-28 | 昭和電工株式会社 | 接着剤、これを用いた積層体、電池外装材、並びに電池ケース及びその製造方法 |
KR101968317B1 (ko) * | 2018-02-23 | 2019-04-11 | 씨제이제일제당 주식회사 | 신규 l-트립토판 배출 단백질 및 이를 이용한 l-트립토판을 생산하는 방법 |
-
2019
- 2019-04-05 KR KR1020190040397A patent/KR102205717B1/ko active IP Right Grant
-
2020
- 2020-03-20 MX MX2021000685A patent/MX2021000685A/es unknown
- 2020-03-20 US US17/268,691 patent/US11524981B2/en active Active
- 2020-03-20 CN CN202080004146.7A patent/CN112823165B/zh active Active
- 2020-03-20 BR BR112021000765-2A patent/BR112021000765B1/pt active IP Right Grant
- 2020-03-20 JP JP2021517540A patent/JP7539871B2/ja active Active
- 2020-03-20 RU RU2020139396A patent/RU2763603C1/ru active
- 2020-03-20 CA CA3105666A patent/CA3105666C/en active Active
- 2020-03-20 EP EP20784578.5A patent/EP3789398A4/en active Pending
- 2020-03-20 WO PCT/KR2020/003855 patent/WO2020204427A1/ko active Application Filing
-
2022
- 2022-09-29 JP JP2022155934A patent/JP2022185040A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101838628A (zh) * | 2001-11-23 | 2010-09-22 | 味之素株式会社 | 利用埃希杆菌属细菌生产l-氨基酸的方法 |
KR101142885B1 (ko) * | 2003-12-15 | 2012-05-10 | 씨제이제일제당 (주) | 트립토판 생합성 관련 변이유전자를 함유한 대장균 변이주및 이를 이용한 트립토판 제조방법 |
CN1993461A (zh) * | 2004-08-03 | 2007-07-04 | 德古萨股份公司 | 使用肠杆菌科菌株生产l-氨基酸的方法 |
CN101273138A (zh) * | 2005-09-27 | 2008-09-24 | 味之素株式会社 | 产生l-氨基酸的细菌和用于产生l-氨基酸的方法 |
WO2007086618A1 (en) * | 2006-01-30 | 2007-08-02 | Ajinomoto Co., Inc. | L-amino acid producing bacterium and method of producing l-amino acid |
WO2007125954A1 (ja) * | 2006-04-28 | 2007-11-08 | Ajinomoto Co., Inc. | L-アミノ酸を生産する微生物及びl-アミノ酸の製造法 |
CN107002074A (zh) * | 2015-06-10 | 2017-08-01 | 公立大学法人富山县立大学 | 活性型突变酶的制造方法及新型活性型突变酶、以及可溶性化突变蛋白的制造方法 |
KR20180089329A (ko) * | 2018-02-23 | 2018-08-08 | 씨제이제일제당 (주) | L-트립토판을 생산하는 재조합 코리네형 미생물 및 이를 이용한 l-트립토판을 생산하는 방법 |
Non-Patent Citations (3)
Title |
---|
Jian Wang等.Genetic engineering of Escherichia coli to enhance production of L-tryptophan.Appl Microbiol Biotechnol.2013,第97卷7587-7596. * |
Jin-Ho Lee等. PRODUCTION OF L-TRYPTOPHAN BY MUTANTS OF CORYNEBACTERIUM GLUTAMICUM.Production of amino acids - Genetic and metabolic engineering approaches.2018,第26卷(第27期), 1187-2018. * |
宁正元.计算机在生物科学研究中的应用.出版发行:厦门:厦门大学出版社,2006,1-21. * |
Also Published As
Publication number | Publication date |
---|---|
JP2021525108A (ja) | 2021-09-24 |
JP7539871B2 (ja) | 2024-08-26 |
WO2020204427A1 (ko) | 2020-10-08 |
CN112823165A (zh) | 2021-05-18 |
RU2763603C1 (ru) | 2021-12-30 |
JP2022185040A (ja) | 2022-12-13 |
MX2021000685A (es) | 2021-03-25 |
KR20200118334A (ko) | 2020-10-15 |
EP3789398A4 (en) | 2021-08-25 |
CA3105666C (en) | 2023-06-27 |
US11524981B2 (en) | 2022-12-13 |
CA3105666A1 (en) | 2020-10-08 |
US20220009973A1 (en) | 2022-01-13 |
EP3789398A1 (en) | 2021-03-10 |
KR102205717B1 (ko) | 2021-01-22 |
BR112021000765B1 (pt) | 2022-05-10 |
BR112021000765A2 (pt) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112823165B (zh) | 新型l-色氨酸输出蛋白变体及使用其生产l-色氨酸的方法 | |
CN110418843B (zh) | 新型l-色氨酸输出蛋白及使用其生产l-色氨酸的方法 | |
AU2020346645B2 (en) | L-threonine export protein variant and method for production of L-threonine using same | |
JP2024112996A (ja) | 新規l-チロシン排出タンパク質変異体及びそれを用いてl-チロシンを生産する方法 | |
TWI832275B (zh) | 新穎YhhS變異體及使用其生產O-磷絲胺酸、半胱胺酸及半胱胺酸之衍生物的方法 | |
KR20230131654A (ko) | 변이형 l-쓰레오닌 배출 단백질 및 이를 이용한 l-쓰레오닌 생산 방법 | |
KR20230131653A (ko) | 변이형 l-쓰레오닌 배출 단백질 및 이를 이용한 l-쓰레오닌 생산 방법 | |
AU2021398499A1 (en) | NOVEL γ-AMINOBUTYRATE PERMEASE VARIANT AND METHOD FOR PRODUCING ISOLEUCINE BY USING SAME |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |