RU2813283C2 - Recombinant strain based on escherichia coli, a method of its construction and use - Google Patents
Recombinant strain based on escherichia coli, a method of its construction and use Download PDFInfo
- Publication number
- RU2813283C2 RU2813283C2 RU2021140066A RU2021140066A RU2813283C2 RU 2813283 C2 RU2813283 C2 RU 2813283C2 RU 2021140066 A RU2021140066 A RU 2021140066A RU 2021140066 A RU2021140066 A RU 2021140066A RU 2813283 C2 RU2813283 C2 RU 2813283C2
- Authority
- RU
- Russia
- Prior art keywords
- leu
- ala
- ile
- arg
- gly
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 241000588724 Escherichia coli Species 0.000 title claims description 46
- 238000010276 construction Methods 0.000 title description 38
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims abstract description 97
- 239000002773 nucleotide Substances 0.000 claims abstract description 76
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 76
- 230000035772 mutation Effects 0.000 claims abstract description 60
- 239000004473 Threonine Substances 0.000 claims abstract description 52
- 229960002898 threonine Drugs 0.000 claims abstract description 52
- 108091026890 Coding region Proteins 0.000 claims abstract description 38
- 101150080180 kdtA gene Proteins 0.000 claims abstract description 23
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims abstract description 20
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims abstract description 17
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims abstract description 17
- 238000004519 manufacturing process Methods 0.000 claims abstract description 17
- 241000894006 Bacteria Species 0.000 claims abstract description 12
- 229930024421 Adenine Natural products 0.000 claims abstract description 7
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims abstract description 7
- 229960000643 adenine Drugs 0.000 claims abstract description 7
- 230000002255 enzymatic effect Effects 0.000 claims abstract 8
- 239000013612 plasmid Substances 0.000 claims description 47
- 150000001413 amino acids Chemical group 0.000 claims description 22
- 241001646716 Escherichia coli K-12 Species 0.000 claims description 20
- 108090000623 proteins and genes Proteins 0.000 claims description 19
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 239000012634 fragment Substances 0.000 description 67
- 108020004414 DNA Proteins 0.000 description 48
- 101150078007 mntP gene Proteins 0.000 description 38
- 239000001963 growth medium Substances 0.000 description 30
- 238000012408 PCR amplification Methods 0.000 description 25
- 101150076547 spoT gene Proteins 0.000 description 23
- 239000007787 solid Substances 0.000 description 21
- 238000000246 agarose gel electrophoresis Methods 0.000 description 18
- 101100234243 Aquifex aeolicus (strain VF5) kdtA gene Proteins 0.000 description 16
- 102200006258 rs1554561099 Human genes 0.000 description 16
- 101150040194 waaA gene Proteins 0.000 description 16
- 238000001962 electrophoresis Methods 0.000 description 15
- 229940023064 escherichia coli Drugs 0.000 description 15
- 238000000137 annealing Methods 0.000 description 14
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 14
- 229960005091 chloramphenicol Drugs 0.000 description 14
- 238000004925 denaturation Methods 0.000 description 14
- 230000036425 denaturation Effects 0.000 description 14
- 238000012163 sequencing technique Methods 0.000 description 13
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 11
- 238000012258 culturing Methods 0.000 description 9
- 238000000855 fermentation Methods 0.000 description 9
- 230000004151 fermentation Effects 0.000 description 9
- 239000000203 mixture Substances 0.000 description 9
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- 238000012220 PCR site-directed mutagenesis Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 235000018102 proteins Nutrition 0.000 description 7
- 102000004169 proteins and genes Human genes 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 6
- 239000004471 Glycine Substances 0.000 description 6
- 241000880493 Leptailurus serval Species 0.000 description 6
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 6
- 108010044940 alanylglutamine Proteins 0.000 description 6
- 238000002744 homologous recombination Methods 0.000 description 6
- 230000006801 homologous recombination Effects 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 238000009630 liquid culture Methods 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 239000013641 positive control Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 4
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 4
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 4
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 4
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 4
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 229940024606 amino acid Drugs 0.000 description 4
- 235000001014 amino acid Nutrition 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 108010004914 prolylarginine Proteins 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- 239000012880 LB liquid culture medium Substances 0.000 description 3
- 108091027568 Single-stranded nucleotide Proteins 0.000 description 3
- 229930006000 Sucrose Natural products 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- 101150063416 add gene Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 239000012496 blank sample Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000011081 inoculation Methods 0.000 description 3
- 230000002906 microbiologic effect Effects 0.000 description 3
- 238000009629 microbiological culture Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 2
- 108010044087 AS-I toxin Proteins 0.000 description 2
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 2
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 2
- YWWATNIVMOCSAV-UBHSHLNASA-N Ala-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YWWATNIVMOCSAV-UBHSHLNASA-N 0.000 description 2
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- MIPWEZAIMPYQST-FXQIFTODSA-N Ala-Cys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O MIPWEZAIMPYQST-FXQIFTODSA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 2
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 2
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 2
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 2
- GRIFPSOFWFIICX-GOPGUHFVSA-N Ala-His-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GRIFPSOFWFIICX-GOPGUHFVSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- RGDKRCPIFODMHK-HJWJTTGWSA-N Ala-Leu-Leu-His Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RGDKRCPIFODMHK-HJWJTTGWSA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 2
- AWNAEZICPNGAJK-FXQIFTODSA-N Ala-Met-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O AWNAEZICPNGAJK-FXQIFTODSA-N 0.000 description 2
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 2
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 2
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 2
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 2
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 2
- XAXMJQUMRJAFCH-CQDKDKBSSA-N Ala-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 XAXMJQUMRJAFCH-CQDKDKBSSA-N 0.000 description 2
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 2
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 2
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 2
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- UPKMBGAAEZGHOC-RWMBFGLXSA-N Arg-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O UPKMBGAAEZGHOC-RWMBFGLXSA-N 0.000 description 2
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 2
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 2
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 2
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 2
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 2
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 2
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 2
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 2
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 2
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 2
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 2
- CNKAZIGBGQIHLL-GUBZILKMSA-N Asp-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N CNKAZIGBGQIHLL-GUBZILKMSA-N 0.000 description 2
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 2
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 2
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 2
- JXGJJQJHXHXJQF-CIUDSAMLSA-N Asp-Met-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O JXGJJQJHXHXJQF-CIUDSAMLSA-N 0.000 description 2
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 2
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 2
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 2
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 2
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 2
- YFXFOZPXVFPBDH-VZFHVOOUSA-N Cys-Ala-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)CS)C(O)=O YFXFOZPXVFPBDH-VZFHVOOUSA-N 0.000 description 2
- PRVVCRZLTJNPCS-FXQIFTODSA-N Cys-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N PRVVCRZLTJNPCS-FXQIFTODSA-N 0.000 description 2
- XGIAHEUULGOZHH-GUBZILKMSA-N Cys-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N XGIAHEUULGOZHH-GUBZILKMSA-N 0.000 description 2
- LDIKUWLAMDFHPU-FXQIFTODSA-N Cys-Cys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LDIKUWLAMDFHPU-FXQIFTODSA-N 0.000 description 2
- MJOYUXLETJMQGG-IHRRRGAJSA-N Cys-Tyr-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MJOYUXLETJMQGG-IHRRRGAJSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 2
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 2
- SSWAFVQFQWOJIJ-XIRDDKMYSA-N Gln-Arg-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N SSWAFVQFQWOJIJ-XIRDDKMYSA-N 0.000 description 2
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 2
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 2
- MCAVASRGVBVPMX-FXQIFTODSA-N Gln-Glu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MCAVASRGVBVPMX-FXQIFTODSA-N 0.000 description 2
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 2
- TWTWUBHEWQPMQW-ZPFDUUQYSA-N Gln-Ile-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWTWUBHEWQPMQW-ZPFDUUQYSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 2
- XUZQMPGBGFQJMY-SRVKXCTJSA-N Gln-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XUZQMPGBGFQJMY-SRVKXCTJSA-N 0.000 description 2
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 2
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 2
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 2
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 2
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 2
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 2
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 2
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 2
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 2
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 2
- JJSVALISDCNFCU-SZMVWBNQSA-N Glu-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JJSVALISDCNFCU-SZMVWBNQSA-N 0.000 description 2
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 2
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 2
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 2
- RUDRIZRGOLQSMX-IUCAKERBSA-N Gly-Met-Met Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O RUDRIZRGOLQSMX-IUCAKERBSA-N 0.000 description 2
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 2
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 2
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 2
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 2
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 2
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 2
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 2
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 2
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 2
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 2
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 2
- DMAPKBANYNZHNR-ULQDDVLXSA-N His-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DMAPKBANYNZHNR-ULQDDVLXSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 2
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 2
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 2
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 2
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 2
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 2
- IALVDKNUFSTICJ-GMOBBJLQSA-N Ile-Met-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IALVDKNUFSTICJ-GMOBBJLQSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 2
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 2
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 2
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 2
- XVUAQNRNFMVWBR-BLMTYFJBSA-N Ile-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N XVUAQNRNFMVWBR-BLMTYFJBSA-N 0.000 description 2
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 2
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- YWCJXQKATPNPOE-UKJIMTQDSA-N Ile-Val-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YWCJXQKATPNPOE-UKJIMTQDSA-N 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 2
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 2
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 2
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 2
- MDVZJYGNAGLPGJ-KKUMJFAQSA-N Leu-Asn-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MDVZJYGNAGLPGJ-KKUMJFAQSA-N 0.000 description 2
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 2
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 2
- QDSKNVXKLPQNOJ-GVXVVHGQSA-N Leu-Gln-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QDSKNVXKLPQNOJ-GVXVVHGQSA-N 0.000 description 2
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 2
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 2
- KVOFSTUWVSQMDK-KKUMJFAQSA-N Leu-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KVOFSTUWVSQMDK-KKUMJFAQSA-N 0.000 description 2
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 2
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 2
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 2
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 2
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 2
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 2
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 2
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 2
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 2
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 2
- JQECLVNLAZGHRQ-CIUDSAMLSA-N Met-Asp-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O JQECLVNLAZGHRQ-CIUDSAMLSA-N 0.000 description 2
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 2
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 2
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 2
- RVYDCISQIGHAFC-ZPFDUUQYSA-N Met-Ile-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O RVYDCISQIGHAFC-ZPFDUUQYSA-N 0.000 description 2
- MVMNUCOHQGYYKB-PEDHHIEDSA-N Met-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCSC)N MVMNUCOHQGYYKB-PEDHHIEDSA-N 0.000 description 2
- FTQOFRPGLYXRFM-CYDGBPFRSA-N Met-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCSC)N FTQOFRPGLYXRFM-CYDGBPFRSA-N 0.000 description 2
- JYPITOUIQVSCKM-IHRRRGAJSA-N Met-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCSC)N JYPITOUIQVSCKM-IHRRRGAJSA-N 0.000 description 2
- FDGAMQVRGORBDV-GUBZILKMSA-N Met-Ser-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCSC FDGAMQVRGORBDV-GUBZILKMSA-N 0.000 description 2
- FZDOBWIKRQORAC-ULQDDVLXSA-N Met-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCSC)N FZDOBWIKRQORAC-ULQDDVLXSA-N 0.000 description 2
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 2
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 2
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 2
- OXUMFAOVGFODPN-KKUMJFAQSA-N Phe-Asn-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OXUMFAOVGFODPN-KKUMJFAQSA-N 0.000 description 2
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 2
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 2
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 2
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 2
- SFKOEHXABNPLRT-KBPBESRZSA-N Phe-His-Gly Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)NCC(O)=O SFKOEHXABNPLRT-KBPBESRZSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- MJQFZGOIVBDIMZ-WHOFXGATSA-N Phe-Ile-Gly Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O MJQFZGOIVBDIMZ-WHOFXGATSA-N 0.000 description 2
- BYAIIACBWBOJCU-URLPEUOOSA-N Phe-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BYAIIACBWBOJCU-URLPEUOOSA-N 0.000 description 2
- SZYBZVANEAOIPE-UBHSHLNASA-N Phe-Met-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SZYBZVANEAOIPE-UBHSHLNASA-N 0.000 description 2
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 2
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 2
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 2
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- OFGUOWQVEGTVNU-DCAQKATOSA-N Pro-Lys-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OFGUOWQVEGTVNU-DCAQKATOSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 2
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 2
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 2
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 2
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 2
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 2
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 2
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 2
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 2
- XZUBGOYOGDRYFC-XGEHTFHBSA-N Thr-Ser-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O XZUBGOYOGDRYFC-XGEHTFHBSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 2
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- VZBWRZGNEPBRDE-HZUKXOBISA-N Trp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N VZBWRZGNEPBRDE-HZUKXOBISA-N 0.000 description 2
- IJRXQJVGFBSKIV-ZFWWWQNUSA-N Trp-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CNC2=CC=CC=C21)N IJRXQJVGFBSKIV-ZFWWWQNUSA-N 0.000 description 2
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 2
- MPYZGXUYLNPSNF-NAZCDGGXSA-N Trp-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O MPYZGXUYLNPSNF-NAZCDGGXSA-N 0.000 description 2
- WDIJBEWLXLQQKD-ULQDDVLXSA-N Tyr-Arg-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O WDIJBEWLXLQQKD-ULQDDVLXSA-N 0.000 description 2
- FFCRCJZJARTYCG-KKUMJFAQSA-N Tyr-Cys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O FFCRCJZJARTYCG-KKUMJFAQSA-N 0.000 description 2
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 2
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 2
- NOOMDULIORCDNF-IRXDYDNUSA-N Tyr-Gly-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NOOMDULIORCDNF-IRXDYDNUSA-N 0.000 description 2
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 2
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- WOCYUGQDXPTQPY-FXQIFTODSA-N Val-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N WOCYUGQDXPTQPY-FXQIFTODSA-N 0.000 description 2
- YFOCMOVJBQDBCE-NRPADANISA-N Val-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N YFOCMOVJBQDBCE-NRPADANISA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 2
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 2
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- MHAHQDBEIDPFQS-NHCYSSNCSA-N Val-Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C MHAHQDBEIDPFQS-NHCYSSNCSA-N 0.000 description 2
- RKIGNDAHUOOIMJ-BQFCYCMXSA-N Val-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 RKIGNDAHUOOIMJ-BQFCYCMXSA-N 0.000 description 2
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 2
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 2
- QTPQHINADBYBNA-DCAQKATOSA-N Val-Ser-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN QTPQHINADBYBNA-DCAQKATOSA-N 0.000 description 2
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 2
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 2
- WFTKOJGOOUJLJV-VKOGCVSHSA-N Val-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O)NC(=O)[C@@H]([NH3+])C(C)C)=CNC2=C1 WFTKOJGOOUJLJV-VKOGCVSHSA-N 0.000 description 2
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 2
- WBPFYNYTYASCQP-CYDGBPFRSA-N Val-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N WBPFYNYTYASCQP-CYDGBPFRSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 2
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 238000012257 pre-denaturation Methods 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- KWTSXDURSIMDCE-QMMMGPOBSA-N (S)-amphetamine Chemical compound C[C@H](N)CC1=CC=CC=C1 KWTSXDURSIMDCE-QMMMGPOBSA-N 0.000 description 1
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- PPTAQBNUFKTJKA-BJDJZHNGSA-N Leu-Cys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PPTAQBNUFKTJKA-BJDJZHNGSA-N 0.000 description 1
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 229940025084 amphetamine Drugs 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- KRALOLGXHLZTCW-UHFFFAOYSA-L calcium;2-acetyloxybenzoate Chemical compound [Ca+2].CC(=O)OC1=CC=CC=C1C([O-])=O.CC(=O)OC1=CC=CC=C1C([O-])=O KRALOLGXHLZTCW-UHFFFAOYSA-L 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000019621 digestibility Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 150000002333 glycines Chemical class 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000007065 protein hydrolysis Effects 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Abstract
Description
Настоящая заявка испрашивает приоритет на основании заявки на патент Китая №2019109262958, поданной в Национальное управление интеллектуальной собственности Китая 27 сентября 2019 года, и заявки на патент Китая №2019108046792, поданной 28 августа 2019 года, а также заявки на патент Китая №2019108046881, поданной 28 августа 2019 года, каждая из которых полностью включена в данный документ посредством ссылки.This application claims priority based on Chinese Patent Application No. 2019109262958 filed with the National Intellectual Property Office of China on September 27, 2019, and Chinese Patent Application No. 2019108046792 filed on August 28, 2019, and Chinese Patent Application No. 2019108046881 filed on 28 August 2019, each of which is incorporated herein by reference in its entirety.
ОБЛАСТЬ ТЕХНИКИTECHNICAL FIELD
Настоящее изобретение относится к технической области генной инженерии и микроорганизмов, и, в частности, к рекомбинантному штамму с модифицированным геном kdtA, способу его конструирования и его применению.The present invention relates to the technical field of genetic engineering and microorganisms, and in particular to a recombinant strain with a modified kdtA gene, a method for its construction and its use.
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE ART
L-треонин является одной из восьми незаменимых аминокислот, и представляет собой аминокислоту, которую люди и животные не могут синтезировать самостоятельно. L-треонин способен улучшать усвояемость зерна, регулировать баланс метаболизма in vivo и способствовать росту и развитию организмов, и поэтому он широко применяется в кормовой, медицинской и пищевой промышленности.L-threonine is one of the eight essential amino acids, and is an amino acid that humans and animals cannot synthesize on their own. L-threonine is able to improve grain digestibility, regulate in vivo metabolic balance and promote the growth and development of organisms, and therefore it is widely used in the feed, medical and food industries.
В настоящее время L-треонин может быть получен в основном с использованием метода химического синтеза, метода гидролиза белков и метода микробиологической ферментации, при этом метод микробиологической ферментации имеет преимущества, заключающиеся в низкой стоимости производства, высокой интенсивности производства и небольшом уровне загрязнения окружающей среды, поэтому данный метод является наиболее широко применяемым среди методов промышленного производства L-треонина. Для продуцирования L-треонина путем микробиологической ферментации могут быть использованы различные бактерии, такие как мутанты, полученные при индукции Escherichia coli (Е. coli), Corynebacterium и Serratia дикого типа, в качестве штаммов-продуцентов. Конкретные примеры включают мутанты, резистентные к аналогам аминокислот или различные аукстрофы, такие как метионин, треонин и изолейцин. Однако при традиционной мутационной селекции штамм растет медленно и производит больше побочных продуктов из-за случайных мутаций, так что получить высокопродуктивный штамм непросто. Следовательно, конструирование рекомбинантной Е. coli с помощью метаболической инженерии является эффективным способом получения L-треонина. В настоящее время сверхэкспрессия или аттенуация генов ключевых ферментов пути синтеза аминокислот и конкурентного пути, опосредованного экспрессионными плазмидами, является основным средством генетической модификации Е. coli. По-прежнему существует необходимость в разработке более экономичного способа получения L-треонина с высокой производительностью.At present, L-threonine can be produced mainly by chemical synthesis method, protein hydrolysis method and microbiological fermentation method, and the microbiological fermentation method has the advantages of low production cost, high production intensity and little environmental pollution, so This method is the most widely used among methods for the industrial production of L-threonine. To produce L-threonine by microbiological fermentation, various bacteria, such as mutants obtained by induction of Escherichia coli (E. coli), Corynebacterium and wild-type Serratia, can be used as producer strains. Specific examples include mutants resistant to amino acid analogues or various auxtrophes such as methionine, threonine and isoleucine. However, in traditional mutation breeding, the strain grows slowly and produces more by-products due to random mutations, so it is not easy to obtain a high-yielding strain. Therefore, the construction of recombinant E. coli by metabolic engineering is an effective way to obtain L-threonine. Currently, overexpression or attenuation of genes for key enzymes in the amino acid synthesis pathway and the competition pathway mediated by expression plasmids is the main means of genetic modification of E. coli. There is still a need to develop a more economical method for producing L-threonine with high throughput.
Е. coli в качестве хозяина для экзогенной экспрессии генов, обладает преимуществами, такими как чистый генетический фон, простые условия технической эксплуатации и культивирования, экономичная крупномасштабная ферментация, и поэтому эксперты в области генной инженерии уделяют ей все больше внимание. Геномная ДНК Е. coli представляет собой кольцевую молекулу в нуклеоиде, а также может быть представлено множество кольцевых плазмидных ДНК. Нуклеоид в клетках Е. coli имеет одну молекулу ДНК, длина которой составляет примерно 4700000 пар оснований, а также содержит 4400 генов, распределенных в молекуле ДНК, и каждый ген имеет среднюю длину примерно 1000 пар оснований. Среди штаммов Е. coli, используемых обычно в молекулярной биологии, наиболее часто используемыми штаммами в экспериментах по рекомбинации ДНК, за некоторым исключением, являются штамм Е. Coli К12 и его производные.E. coli as a host for exogenous gene expression has advantages such as pure genetic background, simple technical operation and cultivation conditions, and economical large-scale fermentation, and therefore it is receiving increasing attention from genetic engineering experts. The genomic DNA of E. coli is a circular molecule in the nucleoid, and there may also be a variety of circular plasmid DNAs. The nucleoid in E. coli cells has a single DNA molecule that is approximately 4,700,000 base pairs in length and also contains 4,400 genes distributed within the DNA molecule, with each gene having an average length of approximately 1,000 base pairs. Among the E. coli strains commonly used in molecular biology, the most frequently used strains in DNA recombination experiments, with some exceptions, are E. Coli strain K12 and its derivatives.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION
Согласно настоящему изобретению предложены рекомбинантный штамм на основе штамма Escherichia coli К12 или его производный штамм, способ его рекомбинантного конструирования и его применение для ферментационного получения аминокислоты. Настоящее изобретение главным образом относится к гену дикого типа kdtA (последовательность ОРС представлена в последовательности 73556-74833, идентификационный номер в GenBank СР032667.1), гену дикого типа spoT (последовательность ОРС представлена в последовательности 3815907-3818015, идентификационный номер в GenBank АР009048.1), гену дикого типа yebN (последовательность ОРС представлена в последовательности 1907402-1907968, идентификационный номер в GenBank АР009048.1) штамма К12 Е. coli и его производным (таким как MG1655 и W3110), а также в настоящем изобретении обнаружено, что мутантный ген, полученный при подвергании гена сайт-направленному мутагенезу, и рекомбинантный штамм, содержащий ген, могут быть использованы для продуцирования L-треонина, и по сравнению с немутантным штаммом дикого типа, полученный штамм значительно увеличивает производительность L-треонина и характеризуется хорошей стабильностью, а также имеет более низкую стоимость производства в качестве штамма для продуцирования L-треонина.According to the present invention, a recombinant strain based on the Escherichia coli K12 strain or a derivative strain thereof, a method for its recombinant construction and its use for fermentation production of amino acids are proposed. The present invention mainly relates to the wild-type kdtA gene (ORF sequence represented by sequence 73556-74833, GenBank accession number CP032667.1), wild-type spoT gene (ORF sequence represented by sequence 3815907-3818015, GenBank accession number AP009048.1 ), the wild-type yebN gene (the ORF sequence is represented by sequence 1907402-1907968, GenBank accession number AP009048.1) of E. coli strain K12 and its derivatives (such as MG1655 and W3110), and in the present invention it is found that the mutant gene , obtained by subjecting the gene to site-directed mutagenesis, and the recombinant strain containing the gene can be used to produce L-threonine, and compared with the wild-type non-mutant strain, the resulting strain significantly increases the productivity of L-threonine and has good stability, as well as has a lower production cost as an L-threonine producing strain.
На основании указанных выше данных, настоящее изобретение обеспечивает следующие три технических решения:Based on the above data, the present invention provides the following three technical solutions:
Согласно первому техническому решению предложена нуклеотидная последовательность, содержащая последовательность, образованную вследствие мутации в 82-ом основании кодирующей последовательности гена kdtA дикого типа, представленная в SEQ ID NO: 1.According to the first technical solution, a nucleotide sequence is proposed containing a sequence formed due to a mutation in the 82nd base of the coding sequence of the wild type kdtA gene presented in SEQ ID NO: 1.
В соответствии с настоящим изобретением мутация представляет собой изменение в основании/нуклеотиде в сайте, и способ мутации может быть по меньшей мере одним, выбранным из следующих способов: мутагенез, сайт-направленный мутагенез в ходе ПЦР и/или гомологическая рекомбинация и т.д.According to the present invention, a mutation is a change in a base/nucleotide at a site, and the mutation method may be at least one selected from the following methods: mutagenesis, PCR site-directed mutagenesis and/or homologous recombination, etc.
В соответствии с настоящим изобретением мутация заключается в том, что гуанин (Г) заменен на аденин (А) в 82-ом основании в SEQ ID NO: 1; в частности, мутантная нуклеотидная последовательность представлена в SEQ ID NO: 2.In accordance with the present invention, the mutation is that guanine (G) is replaced by adenine (A) at the 82nd base in SEQ ID NO: 1; in particular, the mutant nucleotide sequence is shown in SEQ ID NO: 2.
Настоящее изобретение также обеспечивает рекомбинантный белок, кодируемый указанной выше нуклеотидной последовательностью.The present invention also provides a recombinant protein encoded by the above nucleotide sequence.
Рекомбинантный белок, раскрытый в данном документе, содержит аминокислотную последовательность SEQ ID NO: 4.The recombinant protein disclosed herein contains the amino acid sequence of SEQ ID NO: 4.
Настоящее изобретение также обеспечивает рекомбинантный вектор, содержащий указанную выше нуклеотидную последовательность или рекомбинантный белок. Рекомбинантный вектор, раскрытый в данном документе, конструируют путем введения указанной выше нуклеотидной последовательности в плазмиду; в одном варианте осуществления плазмида представляет собой плазмиду pKOV. В частности, нуклеотидная последовательность и плазмида могут быть расщеплены эндонуклеазой с образованием комплементарных липких концов, которые лигируются для конструирования рекомбинантного вектора.The present invention also provides a recombinant vector containing the above nucleotide sequence or recombinant protein. The recombinant vector disclosed herein is constructed by introducing the above nucleotide sequence into a plasmid; in one embodiment, the plasmid is a pKOV plasmid. In particular, the nucleotide sequence and plasmid can be digested with an endonuclease to form complementary overhangs, which are ligated to construct a recombinant vector.
Настоящее изобретение также обеспечивает рекомбинантный штамм, который содержит кодирующую нуклеотидную последовательность гена akdtA, содержащую точечную мутацию, возникающую в кодирующей последовательности. Рекомбинантный штамм, раскрытый в данном документе, содержит указанную выше нуклеотидную последовательность.The present invention also provides a recombinant strain that contains a coding nucleotide sequence of the akdtA gene containing a point mutation occurring in the coding sequence. The recombinant strain disclosed herein contains the above nucleotide sequence.
В одном варианте реализации настоящего изобретения рекомбинантный штамм содержит нуклеотидную последовательность, представленную в SEQ ID NO: 2. В одном варианте реализации настоящего изобретения рекомбинантный штамм содержит аминокислотную последовательность, представленную в SEQ ID NO: 4. Рекомбинантный штамм, раскрытый в данном документе, конструируют путем введения указанного выше рекомбинантного вектора в штамм-хозяин; штамм-хозяин конкретно не определен, он может быть выбран из известных в данной области техники штаммов, продуцирующих L-треонин, которые содержат ген kdtA, например, Escherichia coli. В одном варианте настоящего изобретения штаммом-хозяином является штамм Е. coli К12 (W3110) или штамм Е. coli CGMCC 7.232. Рекомбинантный штамм, раскрытый в данном документе, использует плазмиду pKOV в качестве вектора.In one embodiment of the present invention, the recombinant strain contains the nucleotide sequence set forth in SEQ ID NO: 2. In one embodiment of the present invention, the recombinant strain contains the amino acid sequence set forth in SEQ ID NO: 4. The recombinant strain disclosed herein is constructed by introducing the above recombinant vector into the host strain; The host strain is not specifically defined, but may be selected from L-threonine-producing strains known in the art that contain the kdtA gene, for example Escherichia coli. In one embodiment of the present invention, the host strain is E. coli strain K12 (W3110) or E. coli strain CGMCC 7.232. The recombinant strain disclosed herein uses the pKOV plasmid as a vector.
Рекомбинантный штамм согласно настоящему изобретению может дополнительно содержать или не содержать другие модификации.The recombinant strain of the present invention may or may not additionally contain other modifications.
Настоящее изобретение также обеспечивает способ конструирования рекомбинантного штамма, который содержит следующий этап:The present invention also provides a method for constructing a recombinant strain, which comprises the following step:
модификация нуклеотидной последовательности кодирующей области гена kdtA дикого типа, представленной в SEQ ID NO: 1, для обеспечения возможности возникновения мутации в 82-ом основании последовательности с получением рекомбинантного штамма, продуцирующего L-треонин, содержащего мутантный кодирующий ген kdtA. В соответствии со способом конструирования согласно настоящему изобретению модификация включает применение по меньшей мере одного из следующих способов: мутагенез, сайт-направленный мутагенез и/или гомологическая рекомбинация и т.п. В соответствии со способом конструирования согласно настоящему изобретению мутация заключается в том, что гуанин (Г) заменен на аденин (А) в 82-ом основании в SEQ ID NO: 1; в частности, мутантная нуклеотидная последовательность представлена в SEQ ID NO: 2.modifying the nucleotide sequence of the wild-type kdtA gene coding region shown in SEQ ID NO: 1 to allow a mutation to occur at the 82nd base of the sequence to produce a recombinant L-threonine-producing strain containing a mutant kdtA coding gene. According to the construction method of the present invention, modification includes the use of at least one of the following methods: mutagenesis, site-directed mutagenesis and/or homologous recombination, and the like. According to the construction method of the present invention, the mutation is that guanine (G) is replaced by adenine (A) at the 82nd base of SEQ ID NO: 1; in particular, the mutant nucleotide sequence is shown in SEQ ID NO: 2.
Кроме того, способ конструирования включает следующие этапы:In addition, the construction method includes the following steps:
(1) модификация нуклеотидной последовательности области открытой рамки считывания гена kdtA дикого типа, представленной в SEQ ID NO: 1, для обеспечения возможности возникновения мутации в 82-ом основании последовательности с получением мутантной нуклеотидной последовательности области открытой рамки считывания гена kdtA;(1) modifying the nucleotide sequence of the wild-type kdtA gene open reading frame region shown in SEQ ID NO: 1 to allow mutation to occur at the 82nd base of the sequence to obtain a mutant nucleotide sequence of the kdtA gene open reading frame region;
(2) лигирование мутантной нуклеотидной последовательности с плазмидой для конструирования рекомбинантного вектора; и(2) ligating the mutant nucleotide sequence to the plasmid to construct a recombinant vector; And
(3) введение рекомбинантного вектора в штамм-хозяин для получения рекомбинантного штамма, продуцирующего L-треонин, имеющего точечную мутацию. В соответствии со способом конструирования согласно настоящему изобретению этап (1) включает: конструирование кодирующей области гена kdtA, содержащей точечную мутацию, в частности включающее синтез двух пар праймеров для амплификации фрагментов кодирующей области гена kdtA в соответствии с кодирующей последовательностью гена kdtA, а также введение точечной мутации в кодирующую область гена kdtA дикого типа (SEQ ID NO: 1) с применением методик ПЦР сайт-направленного мутагенеза для получения нуклеотидной последовательности (SEQ ID NO: 2) кодирующей области гена kdtA, содержащей точечную мутацию, где нуклеотидная последовательность обозначена как kdtA(G82A). (3) introducing a recombinant vector into a host strain to obtain a recombinant L-threonine-producing strain having a point mutation. According to the construction method of the present invention, step (1) includes: constructing a coding region of the kdtA gene containing a point mutation, particularly including synthesizing two pairs of primers for amplifying fragments of the coding region of the kdtA gene in accordance with the coding sequence of the kdtA gene, and introducing a point mutation mutations into the coding region of the wild-type kdtA gene (SEQ ID NO: 1) using PCR site-directed mutagenesis techniques to obtain the nucleotide sequence (SEQ ID NO: 2) of the coding region of the kdtA gene containing a point mutation, where the nucleotide sequence is designated kdtA ( G82A).
В одном варианте реализации настоящего изобретения на этапе (1) праймерами являются:In one embodiment of the present invention, in step (1), the primers are:
Р1: 5' ЦГГГАТЦЦАЦЦАГТГААЦЦГЦЦААЦА 3' (SEQ ID NO: 5);P1: 5' CGGGATCCACAGTGAACCCGCCAACA 3' (SEQ ID NO: 5);
Р2: 5' ТГЦГЦГГАЦГТААГАЦТЦ 3' (SEQ ID NO: 6);P2: 5' TGCGCGGACTGTAAGACTC 3' (SEQ ID NO: 6);
Р3: 5' ГАГТЦТТАЦГТЦЦГЦГЦА 3' (SEQ ID NO: 7); иP3: 5' GAGTCTTACGTCCGCGCA 3' (SEQ ID NO: 7); And
Р4: 5' ААГГААААААГЦГГЦЦГЦТТЦЦЦГЦАЦЦТТТАТТГ 3' (SEQ ID NO: 8).P4: 5' AAGGAAAAAAGCGGCCGCTTTCCCCGCACCTTTTATTG 3' (SEQ ID NO: 8).
В одном варианте реализации настоящего изобретения этап (1) включает: применение праймеров Р1/Р2 и Р3/Р4 для амплификации в ходе ПЦР с применением Е. coli К12 в качестве матрицы для получения двух выделенных фрагментов ДНК (kdtA Up и kdtA Down), имеющих длину 927 п. о. и 695 п. о. и содержащих кодирующие области гена kdtA; разделение и очистку двух фрагментов ДНК с использованием электрофореза в агарозном геле, а затем выполнение ПЦР с перекрывающимися праймерами с применением Р1 и Р4 в качестве праймеров и двух фрагментов ДНК в качестве матриц для получения kdtAG82A-Up-Down.In one embodiment of the present invention, step (1) includes: using primers P1/P2 and P3/P4 for PCR amplification using E. coli K12 as a template to obtain two isolated DNA fragments (kdtA Up and kdtA Down) having length 927 bp. and 695 p.o. and containing coding regions of the kdtA gene; separating and purifying the two DNA fragments using agarose gel electrophoresis, and then performing PCR with overlapping primers using P1 and P4 as primers and the two DNA fragments as templates to obtain kdtA G82A -Up-Down.
В одном варианте реализации настоящего изобретения нуклеотидная последовательность kdtAG82A-Up-Down имеет длину 1622 п.о.In one embodiment of the present invention, the nucleotide sequence of kdtA G82A -Up-Down is 1622 bp in length.
В одном варианте реализации настоящего изобретения ПЦР-амплификацию осуществляют следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С в течение 30 с и элонгация при 72°С в течение 30 с (30 циклов). В одном варианте реализации настоящего изобретения ПЦР-амплификацию с перекрывающимися праймерами осуществляют следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С в течение 30 с и элонгация при 72°С в течение 60 с (30 циклов).In one embodiment of the present invention, PCR amplification is performed as follows: denaturation at 94°C for 30 seconds, annealing at 52°C for 30 seconds, and elongation at 72°C for 30 seconds (30 cycles). In one embodiment of the present invention, PCR amplification with overlapping primers is performed as follows: denaturation at 94°C for 30 seconds, annealing at 52°C for 30 seconds, and elongation at 72°C for 60 seconds (30 cycles).
В соответствии со способом конструирования согласно настоящему изобретению этапAccording to the construction method according to the present invention, the step
(2) включает: конструирование рекомбинантного вектора, в частности включающее разделение и очистку фрагмента kdtA(G82A)-Up-Down с использованием электрофореза в агарозном геле, затем расщепление очищенного фрагмента и плазмиды pKOV с использованием BamH I/Not I, и разделение и очистку расщепленного фрагмента kdtA(G82A)-Up-Down и расщепленной плазмиды pKOV с использованием электрофореза в агарозном геле с последующим лигированием для получения рекомбинантного вектора pKOY-kdtA(G82A).(2) includes: construction of a recombinant vector, specifically comprising separation and purification of the kdtA (G82A) -Up-Down fragment using agarose gel electrophoresis, then digestion of the purified fragment and the pKOV plasmid using BamHI/NotI, and separation and purification cleaved kdtA (G82A) -Up-Down fragment and cleaved pKOV plasmid using agarose gel electrophoresis followed by ligation to obtain the recombinant vector pKOY-kdtA (G82A) .
В соответствии со способом конструирования согласно настоящему изобретению этапAccording to the construction method according to the present invention, the step
(3) включает: конструирование рекомбинантного штамма, в частности включающее трансформацию рекомбинантного вектора pKOV-kdtA(G82A) в штамм-хозяин для получения рекомбинантного штамма.(3) includes: constructing a recombinant strain, particularly comprising transforming the recombinant vector pKOV-kdtA (G82A) into a host strain to obtain a recombinant strain.
В одном варианте реализации настоящего изобретения трансформация на этапе (3) представляет собой процесс электротрансформации; например, на этапе (3) рекомбинантный вектор вводят в штамм-хозяин.In one embodiment of the present invention, the transformation in step (3) is an electrical transformation process; for example, in step (3), the recombinant vector is introduced into the host strain.
В соответствии со способом конструирования согласно настоящему изобретению указанный способ дополнительно включает этап скрининга рекомбинантного штамма; например, скрининг осуществляют с использованием культуральной среды с хл ор амфе николо м.According to the construction method of the present invention, the method further includes the step of screening a recombinant strain; for example, screening is carried out using a culture medium containing chlorine amphetamine.
Настоящее изобретение также обеспечивает рекомбинантный штамм, полученный с помощью указанного выше способа конструирования.The present invention also provides a recombinant strain obtained using the above construction method.
Настоящее изобретение также обеспечивает применение рекомбинантного штамма для получения L-треонина или увеличения ферментационного объема L-треонина. Применение рекомбинантного штамма для получения L-треонина включает ферментацию рекомбинантного штамма для получения L-треонина.The present invention also provides the use of a recombinant strain to produce L-threonine or increase the fermentation volume of L-threonine. Use of the recombinant strain to produce L-threonine involves fermenting the recombinant strain to produce L-threonine.
Согласно второму техническому решению предложена нуклеотидная последовательность, содержащая нуклеотидную последовательность, образованную вследствие мутации в 520-ом основании кодирующей последовательности гена spoT, представленная в SEQ ID NO: 13.According to the second technical solution, a nucleotide sequence is proposed that contains a nucleotide sequence formed due to a mutation in the 520th base of the coding sequence of the spoT gene, presented in SEQ ID NO: 13.
В соответствии с настоящим изобретением мутация представляет собой изменение в основании/нуклеотиде в сайте, и способ мутации может быть по меньшей мере одним, выбранным из следующих способов: мутагенез, сайт-направленный мутагенез в ходе ПЦР и/или гомологическая рекомбинация и т.д.According to the present invention, a mutation is a change in a base/nucleotide at a site, and the mutation method may be at least one selected from the following methods: mutagenesis, PCR site-directed mutagenesis and/or homologous recombination, etc.
В соответствии с настоящим изобретением мутация заключается в том, что гуанин (Г) заменен на тимин (Т) в 520-ом основании в SEQ ID NO: 13; в частности, мутантная нуклеотидная последовательность представлена в SEQ ID NO: 14.In accordance with the present invention, the mutation is that guanine (G) is replaced by thymine (T) at the 520th base in SEQ ID NO: 13; in particular, the mutant nucleotide sequence is shown in SEQ ID NO: 14.
Настоящее изобретение обеспечивает рекомбинантный белок, кодируемый указанной выше нуклеотидной последовательностью.The present invention provides a recombinant protein encoded by the above nucleotide sequence.
Рекомбинантный белок, раскрытый в данном документе, содержит аминокислотную последовательность, представленную в SEQ ID NO: 16; в частности, рекомбинантный белок содержит замену глицина на цистеин в 174-ом положении аминокислотной последовательности, представленной в SEQ ID NO: 15.The recombinant protein disclosed herein contains the amino acid sequence set forth in SEQ ID NO: 16; in particular, the recombinant protein contains a replacement of glycine with cysteine at position 174 of the amino acid sequence shown in SEQ ID NO: 15.
Настоящее изобретение обеспечивает рекомбинантный вектор, содержащий указанную выше нуклеотидную последовательность или рекомбинантный белок. Рекомбинантный вектор, раскрытый в данном документе, конструируют путем введения указанной выше нуклеотидной последовательности в плазмиду; в одном варианте осуществления плазмида представляет собой плазмиду pKOV. В частности, нуклеотидная последовательность и плазмида могут быть расщеплены эндонуклеазой с образованием комплементарных липких концов, которые лигируются для конструирования рекомбинантного вектора.The present invention provides a recombinant vector containing the above nucleotide sequence or recombinant protein. The recombinant vector disclosed herein is constructed by introducing the above nucleotide sequence into a plasmid; in one embodiment, the plasmid is a pKOV plasmid. In particular, the nucleotide sequence and plasmid can be digested with an endonuclease to form complementary overhangs, which are ligated to construct a recombinant vector.
Настоящее изобретение также обеспечивает рекомбинантный штамм, содержащий кодирующую нуклеотидную последовательность гена spoT, содержащую точечную мутацию в кодирующей последовательности, например, кодирующая нуклеотидная последовательность гена spoT, представленная в SEQ ID NO: 13, содержащая точечную мутацию в 520-ом основании.The present invention also provides a recombinant strain containing a spoT gene coding nucleotide sequence containing a point mutation in the coding sequence, for example, the spoT gene coding nucleotide sequence shown in SEQ ID NO: 13 containing a point mutation at base 520 .
В соответствии с настоящим изобретением мутация заключается в замене гуанина (Г) на тимин (Т) в 520-ом основании в SEQ ID NO: 13.In accordance with the present invention, the mutation is to replace guanine (G) with thymine (T) at the 520th base in SEQ ID NO: 13.
В одном варианте реализации настоящего изобретения рекомбинантный штамм содержит нуклеотидную последовательность, представленную в SEQ ID NO: 14.In one embodiment of the present invention, the recombinant strain contains the nucleotide sequence set forth in SEQ ID NO: 14.
В одном варианте реализации настоящего изобретения рекомбинантный штамм содержит аминокислотную последовательность, представленную в SEQ ID NO: 16. Рекомбинантный штамм, раскрытый в данном документе, конструируют путем введения указанного выше рекомбинантного вектора в штамм-хозяин; штамм-хозяин конкретно не определен, он может быть выбран из известных в данной области техники штаммов, продуцирующих L-треонин, которые содержат ген spoT, например, Escherichia coli. В одном варианте реализации настоящего изобретения штаммом-хозяином является штамм Е. coli К12 (W3110) или штамм Е. coli CGMCC 7.232.In one embodiment of the present invention, the recombinant strain contains the amino acid sequence set forth in SEQ ID NO: 16. The recombinant strain disclosed herein is constructed by introducing the above recombinant vector into a host strain; The host strain is not specifically defined, but may be selected from L-threonine-producing strains known in the art that contain the spoT gene, for example Escherichia coli. In one embodiment of the present invention, the host strain is E. coli strain K12 (W3110) or E. coli strain CGMCC 7.232.
Для рекомбинантного штамма, раскрытого в данном документе, использовали плазмиду pKOV в качестве вектора.For the recombinant strain disclosed herein, plasmid pKOV was used as a vector.
Рекомбинантный штамм согласно настоящему изобретению может дополнительно содержать или не содержать другие модификации.The recombinant strain of the present invention may or may not additionally contain other modifications.
Настоящее изобретение обеспечивает способ конструирования рекомбинантного штамма, который содержит следующий этап:The present invention provides a method for constructing a recombinant strain, which comprises the following step:
модификация нуклеотидной последовательности кодирующей области гена spoT, представленной в SEQ ID NO: 13, для обеспечения возможности возникновения мутации в 520-ом основании последовательности с получением рекомбинантного штамма, содержащего мутантный кодирующий ген spoT.modifying the nucleotide sequence of the coding region of the spoT gene shown in SEQ ID NO: 13 to allow a mutation to occur at the 520th base of the sequence to produce a recombinant strain containing a mutant coding spoT gene.
В соответствии со способом конструирования согласно настоящему изобретению модификация включает применение по меньшей мере одного из следующих способов: мутагенез, ПЦР сайт-направленный мутагенез и/или гомологическая рекомбинация и т.п.According to the construction method of the present invention, modification includes the use of at least one of the following methods: mutagenesis, PCR site-directed mutagenesis and/or homologous recombination, and the like.
В соответствии со способом конструирования согласно настоящему изобретению мутация заключается в том, что гуанин (Г) заменен на тимин (Т) в 520-ом основании в SEQ ID NO: 13; в частности, мутантная нуклеотидная последовательность представлена в SEQ ID NO: 14.According to the construction method of the present invention, the mutation is that guanine (G) is replaced by thymine (T) at the 520th base in SEQ ID NO: 13; in particular, the mutant nucleotide sequence is shown in SEQ ID NO: 14.
Кроме того, способ конструирования включает следующие этапы:In addition, the construction method includes the following steps:
(1) модификация нуклеотидной последовательности области открытой рамки считывания гена spoT дикого типа, представленной в SEQ ID NO: 13, для обеспечения возможности возникновения мутации в 520-ом основании последовательности с получением мутантной нуклеотидной последовательности;(1) modifying the nucleotide sequence of the open reading frame region of the wild-type spoT gene shown in SEQ ID NO: 13 to allow a mutation to occur at base 520 of the sequence to produce a mutant nucleotide sequence;
(2) лигирование мутантной нуклеотидной последовательности с плазмидой для конструирования рекомбинантного вектора; и(2) ligating the mutant nucleotide sequence to the plasmid to construct a recombinant vector; And
(3) введение рекомбинантного вектора в штамм-хозяин для получения рекомбинантного штамма, имеющего точечную мутацию.(3) introducing a recombinant vector into a host strain to obtain a recombinant strain having a point mutation.
В соответствии со способом конструирования согласно настоящему изобретению этап (1) включает: конструирование кодирующей области гена spoT, содержащей точечную мутацию, в частности включающее синтез двух пар праймеров для амплификации фрагментов кодирующей области гена spoT в соответствии с кодирующей последовательностью гена spoT, а также введение точечной мутации в кодирующую область гена spoT дикого типа (SEQ ID NO: 13) с применением методик ПЦР сайт-направленного мутагенеза для получения нуклеотидной последовательности (SEQ ID NO: 14) кодирующей области гена spoT, содержащей точечную мутацию, где нуклеотидная последовательность обозначена как spoT(G520T).According to the construction method of the present invention, step (1) includes: constructing a coding region of the spoT gene containing a point mutation, particularly including synthesizing two pairs of primers for amplifying fragments of the coding region of the spoT gene according to the coding sequence of the spoT gene, and introducing a point mutation mutations into the coding region of the wild-type spoT gene (SEQ ID NO: 13) using PCR site-directed mutagenesis techniques to obtain the nucleotide sequence (SEQ ID NO: 14) of the coding region of the spoT gene containing a point mutation, where the nucleotide sequence is designated spoT ( G520T) .
В одном варианте реализации настоящего изобретения на этапе (1) праймерами являются:In one embodiment of the present invention, in step (1), the primers are:
Р1: 5' ЦГГГАТЦЦГААЦАГЦААГАГЦАГГААГЦ 3' (SEQ ID NO: 17);P1: 5' CGGGATCCGAACAGCAAGAGCAGGAAGC 3' (SEQ ID NO: 17);
Р2: 5' ТГТГГТГГАТАЦАТАААЦГ 3' (SEQ ID NO: 18);P2: 5' TGTGTGTGGATACATAAAACG 3' (SEQ ID NO: 18);
Р3: 5' ГЦАЦЦГТТТАТГТАТЦЦАЦЦ 3'(SEQ ID NO: 19); иP3: 5' GCACCGTTTATGTATCCACC 3'(SEQ ID NO: 19); And
P4: 5' ААГГААААААГЦГГЦЦГЦАЦГАЦАААГТТЦАГЦЦААГЦ 3' (SEQ ID NO: 20).P4: 5' AAGGAAAAAAGCGGCCGCATCGACAAGTTCAAGCCAAGC 3' (SEQ ID NO: 20).
В одном варианте реализации настоящего изобретения этап (1) включает: применение праймеров Р1/Р2 и Р3/Р4 для амплификации в ходе ПЦР с применением Е. coli К12 в качестве матрицы для получения двух выделенных фрагментов ДНК (spoT(G520T)-Up и spoT(G520T)-Down), имеющих длину 620 п.о. и 880 п.о. и содержащих кодирующие области гена spoT, содержащие точечную мутацию; разделение и очистку двух фрагментов ДНК с использованием электрофореза в агарозном геле, а затем выполнение ПЦР с перекрывающимися праймерами с применением Р1 и Р4 в качестве праймеров и двух фрагментов ДНК в качестве матриц для получения фрагмента spoT(G520T)-Up-Down.In one embodiment of the present invention, step (1) includes: using primers P1/P2 and P3/P4 for PCR amplification using E. coli K12 as a template to obtain two isolated DNA fragments (spoT (G520T) -Up and spoT (G520T) -Down), having a length of 620 bp. and 880 bp and containing coding regions of the spoT gene containing a point mutation; separating and purifying the two DNA fragments using agarose gel electrophoresis, and then performing PCR with overlapping primers using P1 and P4 as primers and the two DNA fragments as templates to obtain the spoT (G520T) -Up-Down fragment.
В одном варианте реализации настоящего изобретения нуклеотидная последовательность фрагмента spoT(G520T)-Up-Down имеет длину 1500 п.о.In one embodiment of the present invention, the nucleotide sequence of the spoT (G520T) -Up-Down fragment is 1500 bp in length.
В одном варианте реализации настоящего изобретения ПЦР-амплификацию осуществляют следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С в течение 30 с и элонгация при 72°С в течение 30 с (30 циклов).In one embodiment of the present invention, PCR amplification is performed as follows: denaturation at 94°C for 30 seconds, annealing at 52°C for 30 seconds, and elongation at 72°C for 30 seconds (30 cycles).
В одном варианте реализации настоящего изобретения ПЦР-амплификацию с перекрывающимися праймерами осуществляют следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С в течение 30 с и элонгация при 72°С в течение 60 с (30 циклов).In one embodiment of the present invention, PCR amplification with overlapping primers is performed as follows: denaturation at 94°C for 30 seconds, annealing at 52°C for 30 seconds, and elongation at 72°C for 60 seconds (30 cycles).
В соответствии со способом конструирования согласно настоящему изобретению этап (2) включает: конструирование рекомбинантного вектора, в частности включающее разделение и очистку фрагмента spoT(G520T)-Up-Down с использованием электрофореза в агарозном геле, затем расщепление очищенного фрагмента и плазмиды pKOV с использованием BamHI/Not I, и разделение и очистку расщепленного фрагмента и расщепленной плазмиды pKOV с использованием электрофореза в агарозном геле с последующим лигированием для получения рекомбинантного вектора pKOY-spoT(G520T).According to the construction method of the present invention, step (2) includes: constructing a recombinant vector, particularly including resolving and purifying the spoT (G520T) -Up-Down fragment using agarose gel electrophoresis, then digesting the purified fragment and plasmid pKOV using BamHI /Not I, and separation and purification of the digested fragment and digested pKOV plasmid using agarose gel electrophoresis followed by ligation to obtain the recombinant vector pKOY-spoT (G520T) .
В соответствии со способом конструирования согласно настоящему изобретению этап (3) включает: конструирование рекомбинантного штамма, в частности включающее введение рекомбинантного вектора pKOV-spoT(G520T) в штамм-хозяин для получения рекомбинантного штамма.According to the construction method of the present invention, step (3) includes: constructing a recombinant strain, particularly including introducing the recombinant vector pKOV-spoT (G520T) into a host strain to obtain a recombinant strain.
В одном варианте реализации настоящего изобретения введение на этапе (3) представляет собой процесс электротрансформации.In one embodiment of the present invention, the introduction in step (3) is an electrotransformation process.
В соответствии со способом конструирования согласно настоящему изобретению способ дополнительно включает этап скрининга рекомбинантного штамма; например, скрининг осуществляют с использованием культуральной среды с хлорамфениколом. Настоящее изобретение также обеспечивает рекомбинантный штамм, полученный с помощью указанного выше способа конструирования.According to the construction method of the present invention, the method further includes the step of screening a recombinant strain; for example, screening is carried out using culture medium with chloramphenicol. The present invention also provides a recombinant strain obtained using the above construction method.
Настоящее изобретение обеспечивает применение указанного выше рекомбинантного штамма для получения L-треонина.The present invention provides the use of the above recombinant strain for the production of L-threonine.
Применение нуклеотидной последовательности, рекомбинантного белка, рекомбинантного вектора и рекомбинантного штамма для получения L-треонина включает ферментацию рекомбинантного штамма для получения L-треонина.The use of a nucleotide sequence, a recombinant protein, a recombinant vector, and a recombinant strain to produce L-threonine involves fermenting the recombinant strain to produce L-threonine.
Согласно третьему техническому решению предложена нуклеотидная последовательность, содержащая нуклеотидную последовательность, образованную вследствие мутации в 74-ом основании кодирующей последовательности гена yebN дикого типа, представленная в SEQ ID NO: 23.According to the third technical solution, a nucleotide sequence is proposed that contains a nucleotide sequence formed due to a mutation in the 74th base of the coding sequence of the wild type yebN gene presented in SEQ ID NO: 23.
В соответствии с настоящим изобретением мутация заключается в том, что гуанин (Г) заменен на аденин (А) в 74-ом основании в SEQ ID NO: 23; в частности, нуклеотидная последовательность представлена в SEQ ID NO: 24. Мутация представляет собой изменение в основании/нуклеотиде в сайте, и способ мутации может быть по меньшей мере одним, выбранным из следующих способов: мутагенез, сайт-направленный мутагенез в ходе ПЦР и/или гомологическая рекомбинация и т.д.In accordance with the present invention, the mutation is that guanine (G) is replaced by adenine (A) at the 74th base in SEQ ID NO: 23; in particular, the nucleotide sequence is shown in SEQ ID NO: 24. A mutation is a change in base/nucleotide at a site, and the mutation method may be at least one selected from the following methods: mutagenesis, site-directed mutagenesis by PCR and/ or homologous recombination, etc.
Настоящее изобретение обеспечивает рекомбинантный белок, кодируемый указанной выше нуклеотидной последовательностью.The present invention provides a recombinant protein encoded by the above nucleotide sequence.
Рекомбинантный белок, раскрытый в данном документе, содержит аминокислотную последовательность, представленную в SEQ ID NO: 26; в частности, рекомбинантный белок содержит замену глицина на аспаргиновую кислоту в 25-ом положении аминокислотной последовательности, представленной в SEQ ID NO: 25. Настоящее изобретение обеспечивает рекомбинантный вектор, содержащий указанную выше нуклеотидную последовательность или рекомбинантный белок. Рекомбинантный вектор, раскрытый в данном документе, конструируют путем введения указанной выше нуклеотидной последовательности в плазмиду; в одном варианте осуществления плазмида представляет собой плазмиду pKOV. В частности, нуклеотидная последовательность и плазмида могут быть расщеплены эндонуклеазой с образованием комплементарных липких концов, которые лигируются для конструирования рекомбинантного вектора.The recombinant protein disclosed herein contains the amino acid sequence set forth in SEQ ID NO: 26; in particular, the recombinant protein contains a substitution of glycine for aspartic acid at the 25th position of the amino acid sequence shown in SEQ ID NO: 25. The present invention provides a recombinant vector containing the above nucleotide sequence or recombinant protein. The recombinant vector disclosed herein is constructed by introducing the above nucleotide sequence into a plasmid; in one embodiment, the plasmid is a pKOV plasmid. In particular, the nucleotide sequence and plasmid can be digested with an endonuclease to form complementary overhangs, which are ligated to construct a recombinant vector.
Настоящее изобретение также обеспечивает рекомбинантный штамм, содержащий кодирующую нуклеотидную последовательность гена yebN, содержащую точечную мутацию в кодирующей последовательности, например, кодирующая нуклеотидная последовательность Teu&yebN, представленная в SEQ ID NO: 23, содержащая точечную мутацию в 74-ом основании.The present invention also provides a recombinant strain containing the coding nucleotide sequence of the yebN gene containing a point mutation in the coding sequence, for example, the coding nucleotide sequence Teu&yebN shown in SEQ ID NO: 23 containing a point mutation in the 74th base.
Согласно рекомбинантному штамму, кодирующая нуклеотидная последовательность гена yebN, содержит мутацию, при которой гуанин (Г) заменен на аденин (А) в 74-ом основании в SEQ ID NO: 23.According to the recombinant strain, the coding nucleotide sequence of the yebN gene contains a mutation in which guanine (G) is replaced by adenine (A) at the 74th base in SEQ ID NO: 23.
В одном варианте реализации настоящего изобретения рекомбинантный штамм содержит нуклеотидную последовательность, представленную в SEQ ID NO: 24. В одном варианте реализации настоящего изобретения рекомбинантный штамм содержит аминокислотную последовательность, представленную в SEQ ID NO: 26. Рекомбинантный штамм, раскрытый в данном документе, конструируют путем введения указанного выше рекомбинантного вектора в штамм-хозяин; штамм-хозяин конкретно не определен, он может быть выбран из известных в данной области техники штаммов, продуцирующих L-треонин, которые содержат ген yebN, например, Escherichia coli. В одном варианте реализации настоящего изобретения штаммом-хозяином является Е. coli К12, его производный штамм Е. coli К12 (W3110) или штамм E. coli CGMCC 7.232.In one embodiment of the present invention, the recombinant strain contains the nucleotide sequence set forth in SEQ ID NO: 24. In one embodiment of the present invention, the recombinant strain contains the amino acid sequence set forth in SEQ ID NO: 26. The recombinant strain disclosed herein is constructed by introducing the above recombinant vector into the host strain; The host strain is not specifically defined, but may be selected from L-threonine-producing strains known in the art that contain the yebN gene, for example Escherichia coli. In one embodiment of the present invention, the host strain is E. coli K12, its derivative strain E. coli K12 (W3110), or E. coli strain CGMCC 7.232.
Для рекомбинантного штамма, раскрытого в данном документе, использовали плазмиду pKOV в качестве вектора.For the recombinant strain disclosed herein, plasmid pKOV was used as a vector.
Рекомбинантный штамм согласно настоящему изобретению может дополнительно содержать или не содержать другие модификации.The recombinant strain of the present invention may or may not additionally contain other modifications.
Настоящее изобретение обеспечивает способ конструирования рекомбинантного штамма, который содержит следующий этап:The present invention provides a method for constructing a recombinant strain, which comprises the following step:
модификация нуклеотидной последовательности кодирующей области гена yebN дикого типа, представленной в SEQ ID NO: 23, для обеспечения возможности возникновения мутации в 74-ом основании последовательности с получением рекомбинантного штамма, содержащего мутантный кодирующий ген yebN. В соответствии со способом конструирования согласно настоящему изобретению модификация включает применение по меньшей мере одного из следующих способов: мутагенез, ПЦР сайт-направленный мутагенез и/или гомологическая рекомбинация и т.п.modifying the nucleotide sequence of the wild-type yebN gene coding region shown in SEQ ID NO: 23 to allow a mutation to occur at the 74th base of the sequence to produce a recombinant strain containing the mutant yebN coding gene. According to the construction method of the present invention, modification includes the use of at least one of the following methods: mutagenesis, PCR site-directed mutagenesis and/or homologous recombination, and the like.
В соответствии со способом конструирования согласно настоящему изобретению мутация заключается в том, что гуанин (Г) заменен на аденин (А) в 74-ом основании в SEQ ID NO: 23; в частности, мутантная нуклеотидная последовательность представлена в SEQ ID NO: 24.According to the construction method of the present invention, the mutation is that guanine (G) is replaced by adenine (A) at the 74th base in SEQ ID NO: 23; in particular, the mutant nucleotide sequence is shown in SEQ ID NO: 24.
Кроме того, способ конструирования включает следующие этапы:In addition, the construction method includes the following steps:
(1) модификация нуклеотидной последовательности области открытой рамки считывания гена yebN дикого типа, представленной в SEQ ID NO: 1, для обеспечения возможности возникновения мутации в 74-ом основании последовательности с получением мутантной нуклеотидной последовательности области открытой рамки считывания тепа, yebN;(1) modifying the nucleotide sequence of the open reading frame region of the wild-type yebN gene shown in SEQ ID NO: 1 to allow a mutation to occur at the 74th base of the sequence to produce a mutant nucleotide sequence of the open reading frame region of the yebN gene;
(2) лигирование мутантной нуклеотидной последовательности с плазмидой для конструирования рекомбинантного вектора; и(2) ligating the mutant nucleotide sequence to the plasmid to construct a recombinant vector; And
(3) введение рекомбинантного вектора в штамм-хозяин для получения рекомбинантного штамма, содержащего точечную мутацию.(3) introducing the recombinant vector into the host strain to obtain a recombinant strain containing the point mutation.
В соответствии со способом конструирования согласно настоящему изобретению этап (1) включает: конструирование кодирующей области reuayebN, содержащей точечную мутацию, в частности включающее синтез двух пар праймеров для амплификации фрагментов кодирующей области гена yebN в соответствии с кодирующей последовательностью гена yebN, а также введение точечной мутации в кодирующую область гена yebN дикого типа (SEQ ID NO: 23) с применением методик ПЦР сайт-направленного мутагенеза для получения нуклеотидной последовательности (SEQ ID NO: 24) кодирующей области гена yebN, содержащей точечную мутацию, где нуклеотидная последовательность обозначена как yebN(G74A).According to the construction method of the present invention, step (1) includes: constructing a reuayebN coding region containing a point mutation, particularly including synthesizing two pairs of primers for amplifying fragments of the yebN gene coding region according to the coding sequence of the yebN gene, and introducing a point mutation into the coding region of the wild-type yebN gene (SEQ ID NO: 23) using PCR site-directed mutagenesis techniques to obtain the nucleotide sequence (SEQ ID NO: 24) of the coding region of the yebN gene containing a point mutation, where the nucleotide sequence is designated yebN (G74A ) .
В одном варианте реализации настоящего изобретения на этапе (1) праймерами являются:In one embodiment of the present invention, in step (1), the primers are:
Р1: 5' ЦГГГАТЦЦЦТТЦГЦЦААТГТЦТГГАТТГ 3' (SEQ ID NO: 27);P1: 5' CGGGATCCCTTTCGCCAATGTCTGGGATTG 3' (SEQ ID NO: 27);
Р2: 5' АТГГАГГГТГГЦАТСТТТАЦ 3' (SEQ ID NO: 28);P2: 5' ATGGAGGGGTGGCATSTTTTATS 3' (SEQ ID NO: 28);
Р3: 5' ТГЦАТЦААТЦГГТАААГАТГ 3' (SEQ ID NO: 29); иP3: 5' TGCATCAATTCGGTAAAAGATG 3' (SEQ ID NO: 29); And
Р4: 5' ААГГААААААГЦГГЦЦГЦЦААЦТЦГЦАЦТЦТГЦТГТА 3' (SEQ ID NO: 30). В одном варианте реализации настоящего изобретения этап (1) включает: применение праймеров Р1/Р2 и Р3/Р4 для амплификации в ходе ПЦР с применением Е. coli К12 в качестве матрицы для получения двух выделенных фрагментов ДНК (yebN(G74A)-Up и yebN(G74A)-Down), имеющих длину 690 п.о. и 700 п.о. и содержащих кодирующие области гена yebN, содержащие точечную мутацию; разделение и очистку двух фрагментов ДНК с использованием электрофореза в агарозном геле, а затем выполнение ПЦР с перекрывающимися праймерами с применением Р1 и Р4 в качестве праймеров и двух фрагментов ДНК в качестве матриц для получения фрагмента yebN(G74A)-Up-Down.P4: 5' AAGGAAAAAAGCGGGCCGCCAACCTGCACCTCTGCTGTA 3' (SEQ ID NO: 30). In one embodiment of the present invention, step (1) includes: using primers P1/P2 and P3/P4 for PCR amplification using E. coli K12 as a template to obtain two isolated DNA fragments (yebN (G74A) -Up and yebN (G74A) -Down), having a length of 690 bp. and 700 bp and containing coding regions of the yebN gene containing a point mutation; separating and purifying the two DNA fragments using agarose gel electrophoresis, and then performing PCR with overlapping primers using P1 and P4 as primers and the two DNA fragments as templates to obtain the yebN (G74A) -Up-Down fragment.
В одном варианте реализации настоящего изобретения нуклеотидная последовательность фрагмента yebN(G74A)-Up-Down имеет длину 1340 п.о.In one embodiment of the present invention, the nucleotide sequence of the yebN (G74A) -Up-Down fragment is 1340 bp in length.
В одном варианте реализации настоящего изобретения ПЦР-амплификацию осуществляют следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С в течение 30 с и элонгация при 72°С в течение 30 с (30 циклов).In one embodiment of the present invention, PCR amplification is performed as follows: denaturation at 94°C for 30 seconds, annealing at 52°C for 30 seconds, and elongation at 72°C for 30 seconds (30 cycles).
В одном варианте реализации настоящего изобретения ПЦР-амплификацию с перекрывающимися праймерами осуществляют следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С в течение 30 с и элонгация при 72°С в течение 60 с (30 циклов).In one embodiment of the present invention, PCR amplification with overlapping primers is performed as follows: denaturation at 94°C for 30 seconds, annealing at 52°C for 30 seconds, and elongation at 72°C for 60 seconds (30 cycles).
В соответствии со способом конструирования согласно настоящему изобретению этап (2) включает: конструирование рекомбинантного вектора, в частности включающее разделение и очистку фрагмента yebN(G74A)-Up-Down с использованием электрофореза в агарозном геле, затем расщепление очищенного фрагмента и плазмиды pKOV с использованием BamH I/Not I, и разделение и очистку расщепленного фрагмента yebN(G74A)-Up-Down и расщепленной плазмиды pKOV с использованием электрофореза в агарозном геле с последующим лигированием для получения рекомбинантного вектора pKON-yebN(G74A).According to the construction method of the present invention, step (2) includes: constructing a recombinant vector, particularly including resolving and purifying the yebN (G74A) -Up-Down fragment using agarose gel electrophoresis, then cleaving the purified fragment and plasmid pKOV using BamH I/Not I, and separation and purification of the cleaved yebN (G74A) -Up-Down fragment and the cleaved pKOV plasmid using agarose gel electrophoresis followed by ligation to obtain the recombinant vector pKON-yebN (G74A) .
В соответствии со способом конструирования согласно настоящему изобретению этап (3) включает: конструирование рекомбинантного штамма, в частности включающий введение рекомбинантного вектора pKOV-yebN(G74A) в штамм-хозяин для получения рекомбинантного штамма.According to the construction method of the present invention, step (3) includes: constructing a recombinant strain, particularly including introducing the recombinant vector pKOV-yebN (G74A) into a host strain to obtain a recombinant strain.
В одном варианте реализации настоящего изобретения введение на этапе (3) представляет собой процесс электротрансформации.In one embodiment of the present invention, the introduction in step (3) is an electrotransformation process.
В соответствии со способом конструирования согласно настоящему изобретению способ дополнительно включает этап скрининга рекомбинантного штамма; например, скрининг осуществляют с использованием культуральной среды с хлорамфениколом. Настоящее изобретение также обеспечивает рекомбинантный штамм, полученный с помощью указанного выше способа конструирования.According to the construction method of the present invention, the method further includes the step of screening a recombinant strain; for example, screening is carried out using culture medium with chloramphenicol. The present invention also provides a recombinant strain obtained using the above construction method.
Настоящее изобретение обеспечивает применение указанной выше нуклеотидной последовательности, рекомбинантного белка, рекомбинантного вектора и рекомбинантного штамма для получения L-треонина.The present invention provides the use of the above nucleotide sequence, recombinant protein, recombinant vector and recombinant strain for the production of L-threonine.
Применение рекомбинантного штамма для получения L-треонина включает ферментацию рекомбинантного штамма для получения L-треонина.Use of the recombinant strain to produce L-threonine involves fermenting the recombinant strain to produce L-threonine.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
Указанные выше и другие признаки и преимущества настоящего изобретения описаны и проиллюстрированы более подробно в последующем описании примеров настоящего изобретения. Следует понимать, что следующие примеры предназначены для иллюстрации технических решений настоящего изобретения и никоим образом не предназначены для ограничения объема правовой охраны настоящего изобретения, определенного в формуле изобретения и ее эквивалентах.The above and other features and advantages of the present invention are described and illustrated in more detail in the following description of examples of the present invention. It should be understood that the following examples are intended to illustrate the technical solutions of the present invention and are in no way intended to limit the scope of legal protection of the present invention as defined in the claims and their equivalents.
Если не указано иное, представленные в настоящем описании материалы и реагенты либо коммерчески доступны, либо могут быть получены специалистом в данной области техники в свете предшествующего уровня техники.Unless otherwise indicated, the materials and reagents presented herein are either commercially available or can be obtained by one skilled in the art in light of the prior art.
Пример 1Example 1
(1) Конструирование Плазмиды pKOV-kdtA(G82A) с Кодирующей Областью Гена kdtA, Содержащей Сайт-Направленную Мутацию (G28A) (эквивалентно замене аланина на треонин в 28-ом положении (А28Т) в аминокислотной последовательности SEQ ID NO: 3, кодирующей белок дикого типа, причем измененной аминокислотной последовательностью является SEQ ID NO: 4). 3-дезокси-О-маннозосульфамилтрансферазу кодировали геном kdtA, и в штамме Е. coli К12 и его производном штамме (например, MG1655) последовательность ОРС гена kdtA дикого типа представлена в последовательности 73556-74833, идентификационный номер в GenBank СР032667.1. Две пары праймеров для амплификации kdtA были сконструированы и синтезированы в соответствии с последовательностью, и вектор был сконструирован для основания Г, замененного на основание А в 82-ом положении, в последовательности кодирующей области гена kdtA исходного штамма. Праймеры (синтезированные Shanghai Invitrogen Corporation) имели следующее строение:(1) Construction of Plasmid pKOV-kdtA (G82A) with the Coding Region of the kdtA Gene Containing a Site-Directed Mutation (G28A) (equivalent to the replacement of alanine with threonine at position 28 (A28T) in the amino acid sequence SEQ ID NO: 3 encoding the protein wild type, the altered amino acid sequence being SEQ ID NO: 4). 3-deoxy-O-mannosesulfamyltransferase is encoded by the kdtA gene, and in E. coli strain K12 and its derivative strain (eg, MG1655), the ORF sequence of the wild-type kdtA gene is represented by sequence 73556-74833, GenBank accession number CP032667.1. Two pairs of kdtA amplification primers were designed and synthesized according to the sequence, and a vector was constructed for base G replaced with base A at position 82 in the coding region sequence of the kdtA gene of the original strain. The primers (synthesized by Shanghai Invitrogen Corporation) had the following structure:
Р1: 5' ЦГГГАТЦЦАЦЦАГТГААЦЦГЦЦААЦА 3' (SEQ ID NO: 5);P1: 5' CGGGATCCACAGTGAACCCGCCAACA 3' (SEQ ID NO: 5);
Р2: 5' ТГЦГЦГГАЦГТААГАЦТЦ 3' (SEQ ID NO: 6);P2: 5' TGCGCGGACTGTAAGACTC 3' (SEQ ID NO: 6);
Р3: 5' ГАГТЦТТАЦГТЦЦГЦГЦА 3' (SEQ ID NO: 7); иP3: 5' GAGTCTTACGTCCGCGCA 3' (SEQ ID NO: 7); And
Р4: 5' ААГГААААААГЦГГЦЦГЦТТЦЦЦГЦАЦЦТТТАТТГ 3' (SEQ ID NO: 8). Способ конструирования был следующим: применение праймеров Р1/Р2 и Р3/Р4 для амплификации в ходе ПЦР с использованием в качестве матрицы генома дикого штамма Е. coli К12, для получения двух фрагментов ДНК, имеющих длину 927 п. о. и 695 п. о. и точечную мутацию (фрагменты kdtA(G82A)-Up и kdtA(G82A)-Down). Амплификацию с помощью метода ПЦР выполняли следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С в течение 30 с и элонгация при 72°С в течение 30 с (30 циклов). Два фрагмента ДНК были разделены и очищены с помощью электрофореза в агарозном геле, и затем два очищенных фрагмента ДНК использовали в качестве матриц, а Р1 и Р4 использовали в качестве праймеров для выполнения ПЦР с перекрывающимися праймерами, чтобы получить фрагмент (kdtA(G82A)-Up-Down), имеющий длину примерно 1622 п.о.. Амплификацию с помощью метода ПЦР с перекрывающимися праймерами выполняли следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С в течение 30 с и элонгация при 72°С в течение 60 с (30 циклов). Фрагмент kdtA(G82A)-Up-Down был разделен и очищен с использованием метода электрофореза в агарозном геле, затем очищенный фрагмент и плазмида pKOV (приобретена у Addgene) были расщеплены BanK VNotl, и расщепленный фрагмент kdtA(G82A)-Up-Down и расщепленная плазмида pKOV были разделены и очищены с использованием метода электрофореза в агарозном геле с последующим лигированием для получения вектора pKO V- kdtA(G82A). Вектор рКО V-kdtA(GS2A) был отправлен в компанию, занимающуюся секвенированием, для секвенирования и идентификации, результат показан в SEQ ID NO: 11, и вектор рКО V -kdtA(GS2A) с правильной точечной мутацией (kdtA(GS2A)) был сохранен для последующего использования. (2) Конструирование Модифицированного Штамма с геном kdtA(GS2A) . Содержащим Точечную МутациюP4: 5' AAGGAAAAAAGCGGCCGCTTTCCCCGCACCTTTTATTG 3' (SEQ ID NO: 8). The construction method was as follows: the use of primers P1/P2 and P3/P4 for PCR amplification using the genome of the wild strain E. coli K12 as a template to obtain two DNA fragments having a length of 927 bp. and 695 p.o. and point mutation (fragments kdtA (G82A) -Up and kdtA (G82A) -Down). PCR amplification was performed as follows: denaturation at 94°C for 30 s, annealing at 52°C for 30 s, and elongation at 72°C for 30 s (30 cycles). The two DNA fragments were separated and purified by agarose gel electrophoresis, and then the two purified DNA fragments were used as templates, and P1 and P4 were used as primers to perform PCR with overlapping primers to obtain the fragment (kdtA (G82A) -Up -Down), having a length of approximately 1622 bp. PCR amplification with overlapping primers was performed as follows: denaturation at 94°C for 30 s, annealing at 52°C for 30 s and elongation at 72°C for 60 s (30 cycles). The kdtA (G82A) -Up-Down fragment was separated and purified using agarose gel electrophoresis method, then the purified fragment and plasmid pKOV (purchased from Addgene) were digested with BanK VNotl, and the cleaved kdtA (G82A) -Up-Down fragment and cleaved The pKOV plasmid was separated and purified using agarose gel electrophoresis followed by ligation to produce the pKO V-kdtA (G82A) vector. The V-kdtA (GS2A) pKO vector was submitted to a sequencing company for sequencing and identification, the result is shown in SEQ ID NO: 11, and the V-kdtA (GS2A) pKO vector with the correct point mutation (kdtA (GS2A) ) was saved for later use. (2) Construction of a Modified Strain with the kdtA (GS2A) gene . Containing a Point Mutation
Ген kdtA дикого типа был сохранен на хромосомах штамма Escherichia coli дикого типа Е. coli К12 (W3110) и штамма Е. coli CGMCC 7.232, обладающего высокой способностью к продуцированию L-треонина (сохранен в China General Microbiological Culture Collection Center). Сконструированная плазмида pKOV-kdtA(GS2A) была перенесена в Е. coli K12 (W3110) и Е. coliCGM.CC 7.232, соответственно, и путем аллельной замены основание Г было заменено на основание А в 82-ом положении последовательностей гена kdtA в хромосомах двух штаммов. Указанный способ осуществляли следующим образом: трансформация плазмиды рКО V -kdtA(G82A) в компетентные клетки бактерии-хозяина посредством процесса электротрансформации, и добавление клеток в 0,5 мл жидкой культуральной среды SOC; перемешивание смеси в шейкере при 30°С и 100 об/мин в течение 2 часов; нанесение на твердую культуральную среду LB, содержащую хлорамфеникол (34 мг/мл), 100 мкл культурального раствора, и культивирование при 30°С в течение 18 часов; отбор выращенных моноклональных колоний, инокуляция колоний в 10 мл жидкой культуральной среды LB, и культивирование при при 37°С и 200 об/мин в течение 8 часов; нанесение на твердую культуральную среду LB, содержащую хлорамфеникол (34 мг/мл), 100 мкл культурального раствора, и культивирование при 42°С в течение 12 часов; отбор 15 единичных колоний, инокуляция колоний в 1 мл жидкой среды LB и культивирование при 37°С и 200 об/мин в течение 4 часов; нанесение на твердую культуральную среду, содержащую 10% сахарозы, 100 мкл культурального раствора, и культивирование при 30°С в течение 24 часов; отбор моноклональных колоний и выделение колоний на твердой культуральной среде LB, содержащей хлорамфеникол (34 мг/мл) и в соотношении один к одному с твердой культуральной средой LB; и отбор штаммов, которые растут на твердой культуральной среде LB и не растут на твердой культуральной среде LB, содержащей хлорамфеникол (34 мг/мл) для индентификации методом ПЦР-амплификации. Праймеры (синтезированные Shanghai hivitrogen Corporation) для применения в ПЦР-амплификации были следующими:The wild-type kdtA gene was conserved on the chromosomes of the wild-type Escherichia coli strain E. coli K12 (W3110) and the highly capable L-threonine-producing E. coli strain CGMCC 7.232 (preserved in the China General Microbiological Culture Collection Center). The constructed plasmid pKOV-kdtA (GS2A) was transferred into E. coli K12 (W3110) and E. coliCGM.CC 7.232, respectively, and by allelic replacement, base G was replaced by base A at position 82 of the kdtA gene sequences in the chromosomes of the two strains. This method was carried out as follows: transformation of the plasmid pKO V -kdtA(G82A) into competent cells of the host bacterium through the electrotransformation process, and adding the cells to 0.5 ml of liquid culture medium SOC; stirring the mixture in a shaker at 30°C and 100 rpm for 2 hours; applying 100 μl of culture solution to LB solid culture medium containing chloramphenicol (34 mg/ml), and culturing at 30°C for 18 hours; selecting grown monoclonal colonies, inoculating colonies in 10 ml of LB liquid culture medium, and culturing at 37°C and 200 rpm for 8 hours; applying 100 μl of culture solution to LB solid culture medium containing chloramphenicol (34 mg/ml), and culturing at 42°C for 12 hours; selection of 15 single colonies, inoculation of colonies in 1 ml of liquid LB medium and cultivation at 37°C and 200 rpm for 4 hours; application to a solid culture medium containing 10% sucrose, 100 μl of culture solution, and cultivation at 30°C for 24 hours; selecting monoclonal colonies and isolating colonies on LB solid culture medium containing chloramphenicol (34 mg/ml) and in a one to one ratio with LB solid culture medium; and selecting strains that grow on solid LB culture medium and do not grow on solid LB culture medium containing chloramphenicol (34 mg/ml) for identification by PCR amplification. The primers (synthesized by Shanghai hivitrogen Corporation) for use in PCR amplification were as follows:
Р5: 5' ЦТТЦЦЦГАААГЦЦГАТТГ3' (SEQ ID NO: 9); иP5: 5' CTTCCCGAAAAGGCCGATTG3' (SEQ ID NO: 9); And
Р6: 5' АЦАААТАТАЦТТТААТЦ 3' (SEQ ID NO: 10).P6: 5' ACAAATATATTTAATTC 3' (SEQ ID NO: 10).
SSCP (Анализ конформационного полиморфизма однонитевой ДНК) электрофорез выполняли на продукте, амплифицированном в ходе ПЦР; амплифицированный фрагмент плазмиды pKOV-kdtA(G82A) использовали для положительного контроля, амплифицированный фрагмент Escherichia coli дикого типа использовали для отрицательного контроля, и воду использовали для бланковой пробы. В SSCP-электрофорезе одноцепочечные нуклеотидные цепочки, имеющие одинаковую длину, но разное строение последовательностей, образовали различные пространственные структуры в ледяной ванне, а также обладали различной подвижностью во время электрофореза. Следовательно, положение фрагмента при электрофорезе не соответствует положению материала, используемого для отрицательного контроля, и штаммом, в случае которого положение фрагмента при электрофорезе соответствует положению материала, используемого для положительного контроля, является штамм с успешно замененной аллелью. ПЦР-амплификацию выполняли на целевом фрагменте путем применения штамма с успешно замененной аллелью в качестве матрицы и применения праймеров Р5 и Р6, а затем целевой фрагмент лигировали с вектором pMD19-T для секвенирования. Путем сравнения последовательностей, полученных в результате секвенирования было определено, что рекон, образованный путем замены основания Г на основание А в 82-ом положении в последовательности кодирующей области гена kdtA является успешно модифицированным штаммом, и результаты секвенирования показаны в SEQ ID NO: 12. Рекон, полученный от Е. coli K12 (W3110) был назван YPThr07, и рекон, полученный от E. coli CGMCC 7.232 был назван YPThr 08.SSCP (Single-Strand DNA Conformational Polymorphism Assay) electrophoresis was performed on the PCR-amplified product; the amplified fragment of plasmid pKOV-kdtA (G82A) was used for the positive control, the amplified fragment of wild-type Escherichia coli was used for the negative control, and water was used for the blank sample. In SSCP electrophoresis, single-stranded nucleotide chains having the same length but different sequence structures formed different spatial structures in the ice bath and also had different mobility during electrophoresis. Therefore, the position of the fragment on electrophoresis does not correspond to the position of the material used for the negative control, and a strain in which the position of the fragment on electrophoresis corresponds to the position of the material used for the positive control is the strain with the allele successfully replaced. PCR amplification was performed on the target fragment by using the successfully replaced allele strain as a template and using primers P5 and P6, and then the target fragment was ligated into the pMD19-T vector for sequencing. By comparing the sequences obtained from sequencing, it was determined that the recon formed by replacing base G with base A at position 82 in the sequence of the coding region of the kdtA gene was a successfully modified strain, and the sequencing results are shown in SEQ ID NO: 12. Recon , derived from E. coli K12 (W3110) was named YPThr07, and the recon derived from E. coli CGMCC 7.232 was named YPThr 08.
(3) Эксперимент по Ферментации Треонина(3) Threonine Fermentation Experiment
Штамм Е. coli K12 (W3110), штамм Е. coli CGMCC 7.232 и мутантные штаммы YPThr07 и YPThr08 инокулировали при 25 мл в жидкой культуральной среде, описанной в Таблице 1, соответственно, и культивировали при 37°С и 200 об/мин в течение 12 часов. Затем 1 мл полученной культуры каждого штамма инокулировали в 25 мл жидкой питательной среды, описанной в Таблице 1, и подвергали ферментации при 37°С и 200 об/мин в течение 36 часов. Содержание L-треонина определяли с помощью метода ВЭЖХ, отбирвали три копии каждого штамма, рассчитывали среднее значение, результаты представлены в Таблице 2.E. coli strain K12 (W3110), E. coli strain CGMCC 7.232 and mutant strains YPThr07 and YPThr08 were inoculated at 25 ml in the liquid culture medium described in Table 1, respectively, and cultured at 37°C and 200 rpm for 12 hours. Then, 1 ml of the resulting culture of each strain was inoculated into 25 ml of the liquid nutrient medium described in Table 1, and fermented at 37°C and 200 rpm for 36 hours. The L-threonine content was determined using the HPLC method, three copies of each strain were selected, the average value was calculated, the results are presented in Table 2.
Как видно из результатов Таблицы 2, замена аланина в 28-ом положении аминокислотной последовательности гена kdtA на треонин способствует увеличению продуктивности L-треонина для исходного штамма, продуцирующего L-треонин, как с высокой, так и с низкой продуктивностью.As can be seen from the results of Table 2, replacing alanine in the 28th position of the amino acid sequence of the kdtA gene with threonine helps to increase the productivity of L-threonine for the original strain producing L-threonine, both with high and low productivity.
Пример 2Example 2
(1) Конструирование Плазмиды pKOV-spoT(G520T) с Кодирующей Областью Гена spoT, Содержащей Сайт-Направленную Мутацию (G520T) (эквивалентно замене глицина на цистеин в 174-ом положении (G174C) в кодирующей белок аминокислотной последовательности SEQ ID NO: 15, измененной аминокислотной последовательностью является SEQ ID NO: 16)(1) Construction of Plasmid pKOV-spoT (G520T) with the Coding Region of the spoT Gene Containing a Site-Directed Mutation (G520T) (equivalent to the replacement of glycine by cysteine at position 174 (G174C) in the protein-coding amino acid sequence SEQ ID NO: 15, the altered amino acid sequence is SEQ ID NO: 16)
Фермент SPOT кодировали геном spoT, и в штамме Е. coli K12 и его производном штамме (например, W3110), последовательность ОРС гена spoT дикого типа представлена в последовательности 3815907-3818015, идентификационный номер в GenBank АР009048.1. Две пары праймеров для амплификации spoT были сконструированы и синтезированы в соответствии с последовательностью, и вектор был сконструирован для основания Г, замененного на основание А в 520-ом положении, в последовательности кодирующей области гена spoT исходного штамма. Праймеры (синтезированные Шанхайской корпорацией mvitrogen) имеют следующее строение:The SPOT enzyme is encoded by the spoT gene, and in E. coli strain K12 and its derivative strain (eg, W3110), the ORF sequence of the wild-type spoT gene is represented by sequence 3815907-3818015, GenBank accession number AP009048.1. Two pairs of spoT amplification primers were designed and synthesized according to the sequence, and a vector was constructed for base G replaced with base A at position 520 in the coding region sequence of the spoT gene of the original strain. The primers (synthesized by Shanghai mvitrogen Corporation) have the following structure:
Р1: 5' ЦГГГАТЦЦГААЦАГЦААГАГЦАГГААГЦ 3' (подчеркнутая часть обозначает участок вырезки эндонуклеазой рестрикции BamYL I) (SEQ ID NO: 17);P1: 5' CGGGATCCGAACAGCAAGAGCAGGAAGC 3' (the underlined portion indicates the BamYL I restriction endonuclease cut site) (SEQ ID NO: 17);
P2: 5' ТГТГГТГГАТАЦАТАААЦГ 3' (SEQ ID NO: 18);P2: 5' TGTGTGTGGATACATAAAACG 3' (SEQ ID NO: 18);
P3: 5' ГЦАЦЦГТТТАТГТАТЦЦАЦЦ 3' (SEQ ID NO: 19); иP3: 5' GCACCGTTTATGTATCCACC 3' (SEQ ID NO: 19); And
P1: 5' ААГГААААААГЦГГЦЦГЦАЦГАЦАААГТТЦАГЦЦААГЦ 3' (подчеркнутая часть обозначает участок вырезки эндонуклеазой рестрикции Not I)(SEQ ID NO: 20); Способ конструирования был следующим: применение праймеров Р1/Р2 и Р3/Р4 для амплификации в ходе ПЦР с использованием в качестве матрицы генома дикого штамма Е. coli K12, для получения двух фрагментов ДНК, имеющих длину 620 п.о. и 880 п.о. и точечную мутацию (фрагменты spoT(G520T)-Up и spoT(G520T)-Down). ПЦР-система: 10 × Ex Taq буфер 5 мкл, смесь dNTP (2,5 ммоль каждая) 4 мкл, Mg2+(25 ммоль) 4 мкл, праймеры (10 пмоль) 2 мкл каждый, Ex Taq (5 Ед/мкл) 0,25 мкл, общий объем 50 мкл, где ПЦР проводили следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С при 30 с, элонгация при 72°С в течение 30 с (30 циклов). Два фрагмента ДНК были разделены и очищены с помощью электрофореза в агарозном геле, и затем два очищенных фрагмента ДНК использовали в качестве матриц, а Р1 и Р4 использовали в качестве праймеров для выполнения ПЦР с перекрывающимися праймерами, чтобы получить фрагмент (spoT(G520T)-Up-Down), имеющий длину примерно 1500 п. о.. ПЦР-система: 10 х Ex Taq буфер 5 мкл, смесь dNTP (2,5 ммоль каждая) 4 мкл, Mg2+(25 ммоль) 4 мкл, праймеры (10 пмоль) 2 мкл каждый, Ex Taq (5 Ед/мкл) 0,25 мкл, общий объем 50 мкл, где ПЦР с перекрывающимися праймерами проводили следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С при 30 с, элонгация при 72°С в течение 60 с (30 циклов). Фрагмент spoT(G520T)-Up-Down был разделен и очищен с использованием метода электрофореза в агарозном геле, затем очищенный фрагмент и плазмида pKOV (приобретена у Addgene) были расщеплены BamH I/NotI, и расщепленный фрагмент spoT(G520T)-Up-Down и расщепленная плазмида pKOV были разделены и очищены с использованием метода электрофореза в агарозном геле с последующим лигированием для получения вектора рКО V-spoT(G520T). Вектор pKOV-spoT(G520T) был отправлен в компанию, занимающуюся секвенированием, для секвенирования и идентификации, а вектор pKOY-spoT(G520T) с корректной точечной мутацией (spoT(G520T)) был сохранен для последующего использования.P1: 5' AAGGAAAAAAGCGGGCCGCACGCAAGCAAGTTCAGCCCAAGC 3' (the underlined portion indicates the Not I restriction endonuclease cut site) (SEQ ID NO: 20); The construction method was as follows: the use of primers P1/P2 and P3/P4 for PCR amplification using the genome of the wild strain E. coli K12 as a template to obtain two DNA fragments having a length of 620 bp. and 880 bp and point mutation (fragments spoT (G520T) -Up and spoT (G520T) -Down). PCR system: 10 × Ex Taq buffer 5 µl, dNTP mixture (2.5 mmol each) 4 µl, Mg 2+ (25 mmol) 4 µl, primers (10 pmol) 2 µl each, Ex Taq (5 U/µl ) 0.25 μl, total volume 50 μl, where PCR was performed as follows: denaturation at 94°C for 30 s, annealing at 52°C for 30 s, elongation at 72°C for 30 s (30 cycles). The two DNA fragments were separated and purified by agarose gel electrophoresis, and then the two purified DNA fragments were used as templates, and P1 and P4 were used as primers to perform PCR with overlapping primers to obtain the fragment (spoT (G520T) -Up -Down), having a length of approximately 1500 bp. PCR system: 10 x Ex Taq buffer 5 μl, dNTP mixture (2.5 mmol each) 4 μl, Mg 2+ (25 mmol) 4 μl, primers (10 pmol) 2 µl each, Ex Taq (5 U/µl) 0.25 µl, total volume 50 µl, where PCR with overlapping primers was carried out as follows: denaturation at 94°C for 30 s, annealing at 52°C for 30 s, elongation at 72°C for 60 s (30 cycles). The spoT (G520T) -Up-Down fragment was separated and purified using agarose gel electrophoresis method, then the purified fragment and plasmid pKOV (purchased from Addgene) were digested with BamH I/NotI, and the digested spoT (G520T) -Up-Down fragment and cleaved pKOV plasmid were separated and purified using agarose gel electrophoresis followed by ligation to obtain the pKO vector V-spoT (G520T) . The pKOV-spoT (G520T) vector was sent to a sequencing company for sequencing and identification, and the pKOY-spoT (G520T) vector with the correct point mutation (spoT (G520T) ) was stored for later use.
(2) Конструирование Модифицированного Штамма с геном spoT(G520T), Содержащим Точечную Мутацию(2) Construction of a Modified Strain with the spoT gene (G520T) Containing a Point Mutation
Ген spoT дикого типа был сохранен на хромосомах штамма Escherichia coli дикого типа Е. coli K12 (W3110) и штамма Е. coli CGMCC 7.232, обладающего высокой способностью к продуцированию L-треонина (сохранен в China General Microbiological Culture Collection Center). Сконструированная плазмида pKOV-spoT(G520T) была перенесена в Е. coli K12 (W3110) и Е. coliCGM.CC 7.232, соответственно, и путем аллельной замены основание Г было заменено на основание Т в 520-м положении последовательностей гена spoT в хромосомах двух штаммов. Указанный способ осуществляли следующим образом: трансформация плазмиды pKO V-spoT(G520T) в компетентные клетки бактерии-хозяина посредством процесса электротрансформации, и добавление клеток в 0.5 мл жидкой культуральной среды SOC; перемешивание смеси в шейкере при 30°С и 100 об/мин в течение 2 часов; нанесение на твердую культуральную среду LB, содержащую хлорамфеникол (34 мкг/мл), 100 мкл культурального раствора, и культивирование при 30°С в течение 18 часов; отбор выращенных моноклональных колоний, инокуляция колоний в 10 мл жидкой культуральной среды LB, и культивирование при при 37°С и 200 об/мин в течение 8 часов; нанесение на твердую культуральную среду LB, содержащую хлорамфеникол (34 мкг/мл), 100 мкл культурального раствора, и культивирование при 42°С в течение 12 часов; отбор 15 единичных колоний, инокуляция колоний в 1 мл жидкой среды LB и культивирование при 37°С и 200 об/мин в течение 4 часов; нанесение на твердую культуральную среду, содержащую 10% сахарозы, 100 мкл культурального раствора, и культивирование при 30°С в течение 24 часов; отбор моноклональных колоний и выделение колоний на твердой культуральной среде LB, содержащей хлорамфеникол (34 мкг/мл) и в соотношении один к одному с твердой культуральной средой LB; и отбор штаммов, которые растут на твердой культуральной среде LB и не растут на твердой культуральной среде LB, содержащей хлорамфеникол (34 мкг/мл) для индентификации методом ПЦР-амплификации. Праймеры (синтезированные Shanghai Invitrogen Corporation) для амплификации в ходе ПЦР были следующими:The wild-type spoT gene was conserved on the chromosomes of the wild-type Escherichia coli strain E. coli K12 (W3110) and the highly capable L-threonine-producing E. coli strain CGMCC 7.232 (preserved in the China General Microbiological Culture Collection Center). The constructed plasmid pKOV-spoT (G520T) was transferred into E. coli K12 (W3110) and E. coliCGM.CC 7.232, respectively, and by allelic replacement, the G base was replaced with a T base at position 520 of the spoT gene sequences in the chromosomes of the two strains. This method was carried out as follows: transformation of the plasmid pKO V-spoT (G520T) into competent host bacterial cells through the electrotransformation process, and adding the cells to 0.5 ml of SOC liquid culture medium; stirring the mixture in a shaker at 30°C and 100 rpm for 2 hours; applying 100 μl of culture solution to LB solid culture medium containing chloramphenicol (34 μg/ml), and culturing at 30°C for 18 hours; selecting grown monoclonal colonies, inoculating colonies in 10 ml of LB liquid culture medium, and culturing at 37°C and 200 rpm for 8 hours; applying 100 μl of culture solution to LB solid culture medium containing chloramphenicol (34 μg/ml), and culturing at 42°C for 12 hours; selection of 15 single colonies, inoculation of colonies in 1 ml of liquid LB medium and cultivation at 37°C and 200 rpm for 4 hours; application to a solid culture medium containing 10% sucrose, 100 μl of culture solution, and cultivation at 30°C for 24 hours; selecting monoclonal colonies and isolating colonies on LB solid culture medium containing chloramphenicol (34 μg/ml) and in a one-to-one ratio with LB solid culture medium; and selecting strains that grow on solid LB culture medium and do not grow on solid LB culture medium containing chloramphenicol (34 μg/ml) for identification by PCR amplification. The primers (synthesized by Shanghai Invitrogen Corporation) for PCR amplification were as follows:
Р5: 5' ЦТТТЦГЦААГАТГАТТАТГГ 3' (SEQ ID NO: 21); иP5: 5' CTTTTGCAAGATGATTATGG 3' (SEQ ID NO: 21); And
Р6: 5' ЦАЦГГТАТТЦЦЦГЦТТЦЦТГ 3' (SEQ ID NO: 22).P6: 5' CACGGTATTCCCGCTTTCTCTG 3' (SEQ ID NO: 22).
ПЦР-система: 10 × Ex Taq буфер 5 мкл, смесь dNTP (2,5 ммоль каждая) 4 мкл, Mg2+(25 ммоль) 4 мкл, праймеры (10 пмоль) 2 мкл каждый, Ex Taq (5 Ед/мкл) 0,25 мкл, общий объем 50 мкл, где ПЦР-амплификацию проводили следующим образом: преденатурация при 94°С в течение 5 минут, (денатурация при 94°С в течение 30 с, отжиг при 52°С при 30 с, элонгация при 72°С в течение 30 с, 30 циклов), и переэлонгация при 72°С в течение 10 минут. SSCP (Анализ конформационного полиморфизма однонитевой ДНК) электрофорез выполняли на продукте, амплифицированном в ходе ПЦР; амплифицированный фрагмент плазмиды pKOV-spoT(G520T) использовали для положительного контроля, амплифицированный фрагмент Escherichia coli дикого типа использовали для отрицательного контроля, и воду использовали для бланковой пробы. В SSCP-электрофорезе одноцепочечные нуклеотидные цепочки, имеющие одинаковую длину, но разное строение последовательностей, образовали различные пространственные структуры в ледяной ванне, а также обладали различной подвижностью во время электрофореза. Следовательно, положение фрагмента при электрофорезе не соответствует положению материала, используемого для отрицательного контроля, и штаммом, в случае которого положение фрагмента при электрофорезе соответствует положению материала, используемого для положительного контроля, является штамм с успешно замененной аллелью. ПЦР-амплификация была выполнена на целевом фрагменте путем применения штамма с успешно замененной аллелью в качестве матрицы и применения праймеров Р5 и Р6, а затем целевой фрагмент лигировали с вектором pMD19-T для секвенирования. Путем сравнения последовательностей, полученных в результате секвенирования было определено, что рекон, образованный путем замены основания Г на основание Т в 520-м положении в последовательности кодирующей области гена spoT является успешно модифицированным штаммом. Рекон, полученный от Е. coli K12 (W3110) был назван YPThr03, и рекон, полученный от Е. coli CGMCC 7.232 был назван YPThr 04.PCR system: 10 × Ex Taq buffer 5 µl, dNTP mixture (2.5 mmol each) 4 µl, Mg 2+ (25 mmol) 4 µl, primers (10 pmol) 2 µl each, Ex Taq (5 U/µl ) 0.25 μl, total volume 50 μl, where PCR amplification was carried out as follows: predenaturation at 94°C for 5 minutes, (denaturation at 94°C for 30 s, annealing at 52°C for 30 s, elongation at 72°C for 30 s, 30 cycles), and re-elongation at 72°C for 10 minutes. SSCP (Single-Strand DNA Conformational Polymorphism Assay) electrophoresis was performed on the PCR-amplified product; the amplified fragment of plasmid pKOV-spoT (G520T) was used for the positive control, the amplified fragment of wild-type Escherichia coli was used for the negative control, and water was used for the blank sample. In SSCP electrophoresis, single-stranded nucleotide chains having the same length but different sequence structures formed different spatial structures in the ice bath and also had different mobility during electrophoresis. Therefore, the position of the fragment on electrophoresis does not correspond to the position of the material used for the negative control, and a strain in which the position of the fragment on electrophoresis corresponds to the position of the material used for the positive control is the strain with the allele successfully replaced. PCR amplification was performed on the target fragment by using the successfully replaced allele strain as a template and using primers P5 and P6, and then the target fragment was ligated into the pMD19-T vector for sequencing. By comparing the sequences obtained from sequencing, it was determined that the recon formed by replacing the G base with a T base at position 520 in the sequence of the coding region of the spoT gene was a successfully modified strain. The recon derived from E. coli K12 (W3110) was named YPThr03, and the recon derived from E. coli CGMCC 7.232 was named YPThr 04.
(3) Эксперимент по Ферментации Треонина(3) Threonine Fermentation Experiment
Штамм Е. coli К12 (W3110), штамм Е. coli CGMCC 7.232 и мутантные штаммы YPThr03 и YPThr04 инокулировали при 25 мл в жидкой культуральной среде, описанной в Таблице 1, соответственно, и культивировали при 37°С и 200 об/мин в течение 12 часов. Затем 1 мл полученной культуры каждого штамма инокулировали в 25 мл жидкой питательной среды, описанной в Таблице 1, и подвергали ферментации при 37°С и 200 об/мин в течение 36 часов. Содержание L-треонина определяли с помощью метода ВЭЖХ, отбирали три копии каждого штамма, рассчитывали среднее значение, результаты представлены в Таблице 2.E. coli strain K12 (W3110), E. coli strain CGMCC 7.232 and mutant strains YPThr03 and YPThr04 were inoculated at 25 ml in the liquid culture medium described in Table 1, respectively, and cultured at 37°C and 200 rpm for 12 hours. Then, 1 ml of the resulting culture of each strain was inoculated into 25 ml of the liquid nutrient medium described in Table 1, and fermented at 37°C and 200 rpm for 36 hours. The L-threonine content was determined using the HPLC method, three copies of each strain were selected, the average value was calculated, the results are presented in Table 2.
Как видно из результатов Таблицы 2, замена глицина в 174-ом положении аминокислотной последовательности гена spoT на цистеин способствует увеличению продуктивности L-треонина для исходного штамма, продуцирующего L-треонин, как с высокой, так и с низкой продуктивностью.As can be seen from the results of Table 2, replacing glycine in the 174th position of the amino acid sequence of the spoT gene with cysteine helps to increase the productivity of L-threonine for the original strain producing L-threonine, both with high and low productivity.
Пример 3:Example 3:
(1) Конструирование Плазмиды pKOV-yebN(G74A) с Кодирующей Областью Гена yebN, Содержащей Сайт-Направленную Мутацию (G74A) (эквивалентно замене глицина на аспаргиновую кислоту в 25-м основании (G25D) в кодирующей белок аминокислотной последовательности SEQ ID NO: 25, измененной аминокислотной последовательностью является SEQ ID NO: 26)(1) Construction of Plasmid pKOV-yebN (G74A) with the Coding Region of the yebN Gene Containing a Site-Directed Mutation (G74A) (equivalent to the replacement of glycine with aspartic acid at the 25th base (G25D) in the protein-coding amino acid sequence SEQ ID NO: 25 , the altered amino acid sequence is SEQ ID NO: 26)
Фермент YEBN кодировали геном yebN, и в штамме Е. coli К12 и его производном штамме (например, W3110) последовательность ОРС гена yebN дикого типа представлена в последовательности 1907402-1907968, идентификационный номер в GenBank АР009048.1. Две пары праймеров для амплификации yebN были сконструированы и синтезированы в соответствии с последовательностью, и вектор был сконструирован для основания Г, замененного на основание А в 74-ом положении, в последовательности кодирующей области гена yebN исходного штамма. Праймеры (синтезированные Шанхайской корпорацией mvitrogen) имеют следующее строение:The YEBN enzyme is encoded by the yebN gene, and in E. coli strain K12 and its derivative strain (eg, W3110), the ORF sequence of the wild-type yebN gene is represented by sequence 1907402-1907968, GenBank accession number AP009048.1. Two pairs of yebN amplification primers were designed and synthesized according to the sequence, and a vector was constructed for base G replaced with base A at position 74 in the coding region sequence of the yebN gene of the original strain. The primers (synthesized by Shanghai mvitrogen Corporation) have the following structure:
Р1: 5' ЦГГГАТЦЦЦТТЦГЦЦААТГТЦТГГАТТГ 3' (подчеркнутая часть обозначает участок вырезки эндонуклеазой рестрикции Bam Н I) (SEQ ID NO: 27);P1: 5' CGGGATCCCTTTCGCCAATGTCTGGATTG 3' (the underlined part indicates the site of excision by Bam H I restriction endonuclease) (SEQ ID NO: 27);
Р2: 5' АТГГАГГГТГГЦАТЦТТТАЦ 3' (SEQ ID NO: 28);P2: 5' ATGGAGGGGTGGCATCTTTAC 3' (SEQ ID NO: 28);
Р3: 5' ТГЦАТЦААТЦГГТАААГАТГ 3' (SEQ ID NO:29); иP3: 5' TGCATCAATTCGGTAAAAGATG 3' (SEQ ID NO:29); And
Р4: 5' ААГГААААААГЦГГЦЦГЦЦААЦТЦЦГЦАЦТЦТГЦТГТА 3' (подчеркнутая часть обозначает участок вырезки эндонуклеазой рестрикции Not I) (SEQ ID NO: 30). Способ конструирования был следующим: применение праймеров Р1/Р2 и Р3/Р4 для амплификации в ходе ПЦР с использованием в качестве матрицы генома дикого штамма Е. coli K12, для получения двух фрагментов ДНК, имеющих длину 690 п. о. и 700 п. о. и точечную мутацию (фрагменты yebN(G74A)-Up и yebN(G74A)-Down). ПЦР-система: 10 × Ex Taq буфер 5 мкл, смесь dNTP (2,5 ммоль каждая) 4 мкл, Mg2+(25 ммоль) 4 мкл, праймеры (10 пмоль) 2 мкл каждый, Ex Taq (5 Ед/мкл) 0,25 мкл, общий объем 50 мкл, где ПЦР проводили следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С при 30 с, элонгация при 72°С в течение 30 с (30 циклов). Два фрагмента ДНК были разделены и очищены с помощью электрофореза в агарозном геле, и затем два очищенных фрагмента ДНК использовали в качестве матриц, а Р1 и Р4 использовали в качестве праймеров для выполнения ПЦР с перекрывающимися праймерами, чтобы получить фрагмент (yebN(G74A)-Up-Down), имеющий длину примерно 1340 п.о.P4: 5' AAGGAAAAAAGCGGGCCGCCAACCTCCGCACCTCTGCTGTA 3' (the underlined portion indicates the Not I restriction endonuclease cut site) (SEQ ID NO: 30). The construction method was as follows: the use of primers P1/P2 and P3/P4 for PCR amplification using the genome of the wild strain E. coli K12 as a template to obtain two DNA fragments having a length of 690 bp. and 700 p.o. and a point mutation (fragments yebN (G74A) -Up and yebN (G74A) -Down). PCR system: 10 × Ex Taq buffer 5 µl, dNTP mixture (2.5 mmol each) 4 µl, Mg 2+ (25 mmol) 4 µl, primers (10 pmol) 2 µl each, Ex Taq (5 U/µl ) 0.25 μl, total volume 50 μl, where PCR was performed as follows: denaturation at 94°C for 30 s, annealing at 52°C for 30 s, elongation at 72°C for 30 s (30 cycles). The two DNA fragments were separated and purified by agarose gel electrophoresis, and then the two purified DNA fragments were used as templates, and P1 and P4 were used as primers to perform PCR with overlapping primers to obtain the fragment (yebN (G74A) -Up -Down), having a length of approximately 1340 bp.
ПЦР-система: 10 × Ex Taq буфер 5 мкл, смесь dNTP (2,5 ммоль каждая) 4 мкл, Mg2+(25 ммоль) 4 мкл, праймеры (10 пмоль) 2 мкл каждый, Ex Taq (5 Ед/мкл) 0,25 мкл, общий объем 50 мкл, где ПЦР с перекрывающимися праймерами проводили следующим образом: денатурация при 94°С в течение 30 с, отжиг при 52°С при 30 с, элонгация при 72°С в течение 60 с (30 циклов).PCR system: 10 × Ex Taq buffer 5 µl, dNTP mixture (2.5 mmol each) 4 µl, Mg 2+ (25 mmol) 4 µl, primers (10 pmol) 2 µl each, Ex Taq (5 U/µl ) 0.25 μl, total volume 50 μl, where PCR with overlapping primers was carried out as follows: denaturation at 94°C for 30 s, annealing at 52°C for 30 s, elongation at 72°C for 60 s (30 cycles).
Фрагмент yebN(G74A)-Up-Down был разделен и очищен с использованием метода электрофореза в агарозном геле, затем очищенный фрагмент и плазмида pKOV (приобретена у Addgene) были расщеплены BamH I/NotI, и расщепленный фрагмент yebN(G74A)-Up-Down и расщепленная плазмида pKOV были разделены и очищены с использованием метода электрофореза в агарозном геле с последующим лигированием для получения вектора pKO V - yebN(G74A) Вектор pKOY-yebN(G74A) был отправлен в компанию, занимающуюся секвенированием, для секвенирования и идентификации, а вектор pKOV-yebN(G74A) с корректной точечной мутацией (yebN(G74A)) был сохранен для последующего использования.The yebN (G74A) -Up-Down fragment was separated and purified using agarose gel electrophoresis method, then the purified fragment and plasmid pKOV (purchased from Addgene) were digested with BamH I/NotI, and the digested yebN (G74A) -Up-Down fragment and cleaved pKOV plasmid were separated and purified using agarose gel electrophoresis followed by ligation to produce the pKO V - yebN (G74A) vector. The pKOY-yebN (G74A) vector was sent to a sequencing company for sequencing and identification, and the vector pKOV-yebN (G74A) with the correct point mutation (yebN (G74A) ) was saved for later use.
(2) Конструирование Модифицированного Штамма с геном yebN(G74A), Содержащим Точечную Мутацию(2) Construction of a Modified Strain with the yebN (G74A) Gene Containing a Point Mutation
Ген yebN дикого типа был сохранен на хромосомах штамма Escherichia coli дикого типа Е. coli K12 (W3110) и штамма Е. coli CGMCC 7.232, обладающего высокой способностью к продуцированию L-треонина (сохранен в China General Microbiological Culture Collection Center). Сконструированная плазмида pKOV-yebN(G74A) была перенесена в Е. coli K12 (W3110) и Е. coZ/CGMCC 7.232, соответственно, и путем аллельной замены основание Г было заменено на основание А в 74-омположении последовательностей генауе&Ув хромосомах двух штаммов.The wild-type yebN gene was conserved on the chromosomes of the wild-type Escherichia coli strain E. coli K12 (W3110) and the highly capable L-threonine-producing E. coli strain CGMCC 7.232 (preserved in the China General Microbiological Culture Collection Center). The constructed plasmid pKOV-yebN (G74A) was transferred into E. coli K12 (W3110) and E. coZ/CGMCC 7.232, respectively, and by allelic substitution, the G base was replaced by an A base at the 74th position of the genome sequences of the two strains.
Указанный способ осуществляли следующим образом: трансформация плазмиды рКО V -yebN(G74A) в компетентные клетки бактерии-хозяина посредством процесса электротрансформации, и добавление клеток в 0.5 мл жидкой культуральной среды SOC; перемешивание смеси в шейкере при 30°С и 100 об/мин в течение 2 часов; нанесение на твердую культуральную среду LB, содержащую хлорамфеникол (34 мкг/мл), 100 мкл культурального раствора, и культивирование при 30°С в течение 18 часов; отбор выращенных моноклональных колоний, инокуляция колоний в 10 мл жидкой культуральной среды LB, и культивирование при при 37°С и 200 об/мин в течение 8 часов; нанесение на твердую культуральную среду LB, содержащую хлорамфеникол (34 мкг/мл), 100 мкл культурального раствора, и культивирование при 42°С в течение 12 часов; отбор 1-5 единичных колоний, инокуляция колоний в 1 мл жидкой среды LB и культивирование при 37°С и 200 об/мин в течение 4 часов; нанесение на твердую культуральную среду, содержащую 10% сахарозы, 100 мкл культурального раствора, и культивирование при 30°С в течение 24 часов; отбор моноклональных колоний и выделение колоний на твердой культуральной среде LB, содержащей хлорамфеникол (34 мкг/мл) и в соотношении один к одному с твердой культуральной средой LB; и отбор штаммов, которые растут на твердой культуральной среде LB и не растут на твердой культуральной среде LB, содержащей хлорамфеникол (34 мкг/мл) для индентификации методом ПЦР-амплификации. Праймеры (синтезированные Shanghai Invitrogen Corporation) для амплификации в ходе ПЦР были следующими:This method was carried out as follows: transformation of the plasmid pKO V -yebN (G74A) into competent cells of the host bacterium through the process of electrotransformation, and adding the cells to 0.5 ml of liquid culture medium SOC; stirring the mixture in a shaker at 30°C and 100 rpm for 2 hours; applying 100 μl of culture solution to LB solid culture medium containing chloramphenicol (34 μg/ml), and culturing at 30°C for 18 hours; selecting grown monoclonal colonies, inoculating colonies in 10 ml of LB liquid culture medium, and culturing at 37°C and 200 rpm for 8 hours; applying 100 μl of culture solution to LB solid culture medium containing chloramphenicol (34 μg/ml), and culturing at 42°C for 12 hours; selection of 1-5 single colonies, inoculation of colonies in 1 ml of liquid LB medium and cultivation at 37°C and 200 rpm for 4 hours; application to a solid culture medium containing 10% sucrose, 100 μl of culture solution, and cultivation at 30°C for 24 hours; selecting monoclonal colonies and isolating colonies on LB solid culture medium containing chloramphenicol (34 μg/ml) and in a one-to-one ratio with LB solid culture medium; and selecting strains that grow on solid LB culture medium and do not grow on solid LB culture medium containing chloramphenicol (34 μg/ml) for identification by PCR amplification. The primers (synthesized by Shanghai Invitrogen Corporation) for PCR amplification were as follows:
Р5: 5' ЦЦАТЦАЦГГЦТТГТТГТТЦ 3' (SEQ ID NO: 31); иP5: 5' CCATCACCGGCTTGTTTGTTC 3' (SEQ ID NO: 31); And
Р6: 5' АЦГААААЦЦЦТЦААТААТЦ 3' (SEQ ID NO: 32).P6: 5' ACGAAAAATCCTTCAATAATTC 3' (SEQ ID NO: 32).
ПЦР-система: 10 × Ex Taq буфер 5 мкл, смесь dNTP (2,5 ммоль каждая) 4 мкл, Mg2+(25 ммоль) 4 мкл, праймеры (10 пмоль) 2 мкл каждый, Ex Taq (5 Ед/мкл) 0,25 мкл, общий объем 50 мкл, где ПЦР-амплификацию проводили следующим образом: преденатурация при 94°С в течение 5 минут, (денатурация при 94°С в течение 30 с, отжиг при 52°С при 30 с, элонгация при 72°С в течение 30 с, 30 циклов), и переэлонгация при 72°С в течение 10 минут.SSCP (Анализ конформационного полиморфизма однонитевой ДНК) электрофорез выполняли на продукте, амплифицированном в ходе ПЦР; амплифицированный фрагмент плазмиды pKOV-yebN(G74A) использовали для положительного контроля, амплифицированный фрагмент Escherichia coli дикого типа использовали для отрицательного контроля, и воду использовали для бланковой пробы. В SSCP-электрофорезе одноцепочечные нуклеотидные цепочки, имеющие одинаковую длину, но разное строение последовательностей, образовали различные пространственные структуры в ледяной ванне, а также обладали различной подвижностью во время электрофореза. Следовательно, положение фрагмента при электрофорезе не соответствует положению материала, используемого для отрицательного контроля, и штаммом, в случае которого положение фрагмента при электрофорезе соответствует положению материала, используемого для положительного контроля, является штамм с успешно замененной аллелью. ПЦР-амплификация была выполнена на целевом фрагменте путем применения штамма с успешно замененной аллелью в качестве матрицы и применения праймеров Р5 и Р6, а затем целевой фрагмент лигировали с вектором pMD19-T для секвенирования. Путем сравнения последовательностей, полученных в результате секвенирования было определено, что рекон, образованный путем замены основания Г на основание А в 74-м положении в последовательности кодирующей области гена yebN является успешно модифицированным штаммом. Рекон, полученный от Е. coli K12 (W3110) был назван YPThr05, и рекон, полученный от Е. coli CGMCC 7.232 был назван YPThr 06.PCR system: 10 × Ex Taq buffer 5 µl, dNTP mixture (2.5 mmol each) 4 µl, Mg 2+ (25 mmol) 4 µl, primers (10 pmol) 2 µl each, Ex Taq (5 U/µl ) 0.25 μl, total volume 50 μl, where PCR amplification was carried out as follows: predenaturation at 94°C for 5 minutes, (denaturation at 94°C for 30 s, annealing at 52°C for 30 s, elongation at 72°C for 30 s, 30 cycles), and re-elongation at 72°C for 10 minutes. SSCP (Single-Strand DNA Conformational Polymorphism Analysis) electrophoresis was performed on the PCR-amplified product; the amplified fragment of plasmid pKOV-yebN (G74A) was used for the positive control, the amplified fragment of wild-type Escherichia coli was used for the negative control, and water was used for the blank sample. In SSCP electrophoresis, single-stranded nucleotide chains having the same length but different sequence structures formed different spatial structures in the ice bath and also had different mobility during electrophoresis. Therefore, the position of the fragment on electrophoresis does not correspond to the position of the material used for the negative control, and a strain in which the position of the fragment on electrophoresis corresponds to the position of the material used for the positive control is the strain with the allele successfully replaced. PCR amplification was performed on the target fragment by using the successfully replaced allele strain as a template and using primers P5 and P6, and then the target fragment was ligated into the pMD19-T vector for sequencing. By comparing the sequences obtained from sequencing, it was determined that the recon formed by replacing base G with base A at position 74 in the sequence of the coding region of the yebN gene was a successfully modified strain. The recon derived from E. coli K12 (W3110) was named YPThr05, and the recon derived from E. coli CGMCC 7.232 was named YPThr 06.
(3) Эксперимент по Ферментации Треонина(3) Threonine Fermentation Experiment
Штамм Е. coli К12 (W3110), штамм Е. coli CGMCC 7.232 и мутантные штаммы YPThr05 и YPThr06 инокулировали при 25 мл в жидкой культуральной среде, описанной в Таблице 1, соответственно, и культивировали при 37°С и 200 об/мин в течение 12 часов. Затем 1 мл полученной культуры каждого штамма инокулировали в 25 мл жидкой питательной среды, описанной в Таблице 1, и подвергали ферментации при 37°С и 200 об/мин в течение 36 часов. Содержание L-треонина определяли с помощью метода ВЭЖХ, отбирали три копии каждого штамма, рассчитывали среднее значение, результаты представлены в Таблице 2.E. coli strain K12 (W3110), E. coli strain CGMCC 7.232 and mutant strains YPThr05 and YPThr06 were inoculated at 25 ml in the liquid culture medium described in Table 1, respectively, and cultured at 37°C and 200 rpm for 12 hours. Then, 1 ml of the resulting culture of each strain was inoculated into 25 ml of the liquid nutrient medium described in Table 1, and fermented at 37°C and 200 rpm for 36 hours. The L-threonine content was determined using the HPLC method, three copies of each strain were selected, the average value was calculated, the results are presented in Table 2.
Как видно из результатов Таблицы 2, замена глицина в 25-ом положении аминокислотной последовательности гена yebN на аспаргиновую кислоту способствует увеличению продуцирования L-треонина исходным штаммом, продуцирующим L-треонин, как с высокой, так и с низкой продуктивностью.As can be seen from the results of Table 2, the replacement of glycine in the 25th position of the amino acid sequence of the yebN gene with aspartic acid helps to increase the production of L-threonine by the original strain producing L-threonine, both with high and low productivity.
Примеры согласно настоящему изобретению описаны выше. Однако настоящее изобретение не ограничивается приведенными выше примерами. Любые изменения, эквиваленты, улучшения и т.п., внесенные без отступления от существа и принципа настоящего изобретения, подпадают под объем правовой охраны настоящего изобретения.Examples according to the present invention are described above. However, the present invention is not limited to the above examples. Any changes, equivalents, improvements, etc., made without departing from the essence and principle of the present invention, fall within the scope of legal protection of the present invention.
--->--->
Лист последовательностей Sequence Sheet
<110> Heilongjiang Eppen Biotech Co., Ltd<110> Heilongjiang Eppen Biotech Co., Ltd
<120> РЕКОМБИНАНТНЫЙ ШТАММ НА ОСНОВЕ ESCHERICHIACOLI, СПОСОБ ЕГО <120> RECOMBINANT STRAIN BASED ON ESCHERICHIACOLI, ITS METHOD
КОНСТРУИРОВАНИЯ И ЕГО ПРИМЕНЕНИЕDESIGN AND ITS APPLICATION
<130> CPWO20110939<130>CPWO20110939
<160> 32<160> 32
<170> SIPOSequenceListing 1.0<170> SIPOSequenceListing 1.0
<210> 1<210> 1
<211> 1278<211> 1278
<212> ДНК<212> DNA
<213> Escherichia coli<213> Escherichia coli
<400> 1<400> 1
atgctcgaat tgctttacac cgcccttctc taccttattc agccgctgat ctggatacgg atgctcgaat tgctttacac cgcccttctc taccttattc agccgctgat ctggatacgg
60 60
ctctgggtgc gcggacgtaa ggctccggcc tatcgaaaac gctggggtga acgttacggt ctctgggtgc gcggacgtaa ggctccggcc tatcgaaaac gctggggtga acgttacggt
120 120
ttttaccgcc atccgctaaa accaggcggc attatgctgc actccgtctc cgtcggtgaa ttttaccgcc atccgctaaa accaggcggc attatgctgc actccgtctc cgtcggtgaa
180 180
actctggcgg caatcccgtt ggtgcgcgcg ctgcgtcatc gttatcctga tttaccgatt actctggcgg caatcccgtt ggtgcgcgcg ctgcgtcatc gttatcctga tttaccgatt
240 240
accgtaacaa ccatgacgcc aaccggttcg gagcgcgtac aatcggcttt cgggaaggat accgtaacaa ccatgacgcc aaccggttcg gagcgcgtac aatcggcttt cgggaaggat
300 300
gttcagcacg tttatctgcc gtatgatctg cccgatgcac tcaaccgttt cctgaataaa gttcagcacg tttatctgcc gtatgatctg cccgatgcac tcaaccgttt cctgaataaa
360 360
gtcgacccta aactggtgtt gattatggaa accgaactat ggcctaacct gattgcggcg gtcgacccta aactggtgtt gattatggaa accgaactat ggcctaacct gattgcggcg
420 420
ctacataaac gtaaaattcc gctggtgatc gctaacgcgc gactctctgc ccgctcggcc ctacataaac gtaaaattcc gctggtgatc gctaacgcgc gactctctgc ccgctcggcc
480 480
gcaggttatg ccaaactggg taaattcgtc cgtcgcttgc tgcgtcgtat tacgctgatt gcaggttatg ccaaactggg taaattcgtc cgtcgcttgc tgcgtcgtat tacgctgatt
540 540
gctgcgcaaa atgaagaaga tggtgcacgt tttgtggcgc tgggcgcaaa aaataatcag gctgcgcaaa atgaagaaga tggtgcacgt tttgtggcgc tgggcgcaaa aaataatcag
600 600
gtgaccgtta ccggtagcct gaaattcgat atttctgtaa cgccgcagtt ggctgctaaa gtgaccgtta ccggtagcct gaaattcgat atttctgtaa cgccgcagtt ggctgctaaa
660 660
gccgtgacgc tgcgccgcca gtgggcacca caccgcccgg tatggattgc caccagcact gccgtgacgc tgcgccgcca gtgggcacca caccgcccgg tatggattgc caccagcact
720 720
cacgaaggcg aagagagtgt ggtgatcgcc gcacatcagg cattgttaca gcaattcccg cacgaaggcg aagagagtgt ggtgatcgcc gcacatcagg cattgttaca gcaattcccg
780 780
aatttattgc tcatcctggt accccgtcat ccggaacgct tcccggatgc gattaacctt aatttattgc tcatcctggt accccgtcat ccggaacgct tcccggatgc gattaacctt
840 840
gtccgccagg ctggactaag ctatatcaca cgctcttcag gggaagtccc ctccaccagc gtccgccagg ctggactaag ctatatcaca cgctcttcag gggaagtccc ctccaccagc
900 900
acgcaggttg tggttggcga tacgatgggc gagttgatgt tactgtatgg cattgccgat acgcaggttg tggttggcga tacgatgggc gagttgatgt tactgtatgg cattgccgat
960 960
ctcgcctttg ttggcggttc actggttgaa cgtggtgggc ataatccgct ggaagctgcc ctcgcctttg ttggcggttc actggttgaa cgtggtgggc ataatccgct ggaagctgcc
1020 1020
gcacacgcta ttccggtatt gatggggccg catactttta actttaaaga catttgcgcg gcacacgcta ttccggtatt gatggggccg catactttta actttaaaga catttgcgcg
1080 1080
cggctggagc aggcaagcgg gctgattacc gttaccgatg ccactacgct tgcaaaagag cggctggagc aggcaagcgg gctgattacc gttaccgatg ccactacgct tgcaaaagag
1140 1140
gtttcctctt tactcaccga cgccgattac cgtagtttct atggccgtca tgccgttgaa gtttcctctt tactcaccga cgccgattac cgtagtttct atggccgtca tgccgttgaa
1200 1200
gtactgtatc aaaaccaggg cgcgctacag cgtctgcttc aactgctgga accttacctg gtactgtatc aaaaccaggg cgcgctacag cgtctgcttc aactgctgga accttacctg
1260 1260
ccaccgaaaacgcattga ccaccgaaaacgcattga
12781278
<210> 2<210> 2
<211> 1278<211> 1278
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 2<400> 2
atgctcgaattgctttacaccgcccttctctaccttattcagccgctgatctggatacgg atgctcgaattgctttacaccgcccttctctaccttattcagccgctgatctggatacgg
6060
ctctgggtgcgcggacgtaagactccggcctatcgaaaacgctggggtgaacgttacggt ctctgggtgcgcggacgtaagactccggcctatcgaaaacgctggggtgaacgttacggt
120120
ttttaccgccatccgctaaaaccaggcggcattatgctgcactccgtctccgtcggtgaa ttttaccgccatccgctaaaaccaggcggcattatgctgcactccgtctccgtcggtgaa
180180
actctggcggcaatcccgttggtgcgcgcgctgcgtcatcgttatcctgatttaccgatt actctggcggcaatcccgttggtgcgcgcgctgcgtcatcgttatcctgatttaccgatt
240240
accgtaacaaccatgacgccaaccggttcggagcgcgtacaatcggctttcgggaaggat accgtaacaaccatgacgccaaccggttcggagcgcgtacaatcggctttcgggaaggat
300300
gttcagcacgtttatctgccgtatgatctgcccgatgcactcaaccgtttcctgaataaa gttcagcacgtttatctgccgtatgatctgcccgatgcactcaaccgtttcctgaataaa
360360
gtcgaccctaaactggtgttgattatggaaaccgaactatggcctaacctgattgcggcg gtcgaccctaaactggtgttgattatggaaaccgaactatggcctaacctgattgcggcg
420420
ctacataaacgtaaaattccgctggtgatcgctaacgcgcgactctctgcccgctcggcc ctacataaacgtaaaattccgctggtgatcgctaacgcgcgactctctgcccgctcggcc
480480
gcaggttatgccaaactgggtaaattcgtccgtcgcttgctgcgtcgtattacgctgatt gcaggttatgccaaactgggtaaattcgtccgtcgcttgctgcgtcgtattacgctgatt
540540
gctgcgcaaaatgaagaagatggtgcacgttttgtggcgctgggcgcaaaaaataatcag gctgcgcaaaatgaagaagatggtgcacgttttgtggcgctgggcgcaaaaaataatcag
600600
gtgaccgttaccggtagcctgaaattcgatatttctgtaacgccgcagttggctgctaaa gtgaccgttaccggtagcctgaaattcgatatttctgtaacgccgcagttggctgctaaa
660660
gccgtgacgctgcgccgccagtgggcaccacaccgcccggtatggattgccaccagcact gccgtgacgctgcgccgccagtgggcaccacaccgcccggtatggattgccaccagcact
720720
cacgaaggcgaagagagtgtggtgatcgccgcacatcaggcattgttacagcaattcccg cacgaaggcgaagagagtgtggtgatcgccgcacatcaggcattgttacagcaattcccg
780780
aatttattgctcatcctggtaccccgtcatccggaacgcttcccggatgcgattaacctt aatttattgctcatcctggtaccccgtcatccggaacgcttcccggatgcgattaacctt
840840
gtccgccaggctggactaagctatatcacacgctcttcaggggaagtcccctccaccagc gtccgccaggctggactaagctatatcacacgctcttcaggggaagtcccctccaccagc
900900
acgcaggttgtggttggcgatacgatgggcgagttgatgttactgtatggcattgccgat acgcaggttgtggttggcgatacgatgggcgagttgatgttactgtatggcattgccgat
960960
ctcgcctttgttggcggttcactggttgaacgtggtgggcataatccgctggaagctgcc ctcgcctttgttggcggttcactggttgaacgtggtgggcataatccgctggaagctgcc
10201020
gcacacgctattccggtattgatggggccgcatacttttaactttaaagacatttgcgcg gcacacgctattccggtattgatggggccgcatacttttaactttaaagacatttgcgcg
10801080
cggctggagcaggcaagcgggctgattaccgttaccgatgccactacgcttgcaaaagag cggctggagcaggcaagcgggctgattaccgttaccgatgccactacgcttgcaaaagag
11401140
gtttcctctttactcaccgacgccgattaccgtagtttctatggccgtcatgccgttgaa gtttcctctttactcaccgacgccgattaccgtagtttctatggccgtcatgccgttgaa
12001200
gtactgtatcaaaaccagggcgcgctacagcgtctgcttcaactgctggaaccttacctg gtactgtatcaaaaccagggcgcgctacagcgtctgcttcaactgctggaaccttacctg
12601260
ccaccgaaaa cgcattga ccaccgaaaa cgcattga
1278 1278
<210> 3<210> 3
<211> 425<211> 425
<212> БЕЛОК<212> PROTEIN
<213> Escherichia coli<213> Escherichia coli
<400> 3<400> 3
Met Leu Glu Leu Leu Tyr Thr Ala Leu Leu Tyr Leu Ile Gln Pro LeuMet Leu Glu Leu Leu Tyr Thr Ala Leu Leu Tyr Leu Ile Gln Pro Leu
1 5 10 151 5 10 15
Ile Trp Ile Arg Leu Trp Val Arg Gly Arg Lys Ala Pro Ala Tyr ArgIle Trp Ile Arg Leu Trp Val Arg Gly Arg Lys Ala Pro Ala Tyr Arg
20 25 30 20 25 30
Lys Arg Trp Gly Glu Arg Tyr Gly Phe Tyr Arg His Pro Leu Lys ProLys Arg Trp Gly Glu Arg Tyr Gly Phe Tyr Arg His Pro Leu Lys Pro
35 40 45 35 40 45
Gly Gly Ile Met Leu His Ser Val Ser Val Gly Glu Thr Leu Ala AlaGly Gly Ile Met Leu His Ser Val Ser Val Gly Glu Thr Leu Ala Ala
50 55 60 50 55 60
Ile Pro Leu Val Arg Ala Leu Arg His Arg Tyr Pro Asp Leu Pro IleIle Pro Leu Val Arg Ala Leu Arg His Arg Tyr Pro Asp Leu Pro Ile
65 70 75 8065 70 75 80
Thr Val Thr Thr Met Thr Pro Thr Gly Ser Glu Arg Val Gln Ser AlaThr Val Thr Thr Met Thr Pro Thr Gly Ser Glu Arg Val Gln Ser Ala
85 90 95 85 90 95
Phe Gly Lys Asp Val Gln His Val Tyr Leu Pro Tyr Asp Leu Pro AspPhe Gly Lys Asp Val Gln His Val Tyr Leu Pro Tyr Asp Leu Pro Asp
100 105 110 100 105 110
Ala Leu Asn Arg Phe Leu Asn Lys Val Asp Pro Lys Leu Val Leu IleAla Leu Asn Arg Phe Leu Asn Lys Val Asp Pro Lys Leu Val Leu Ile
115 120 125 115 120 125
Met Glu Thr Glu Leu Trp Pro Asn Leu Ile Ala Ala Leu His Lys ArgMet Glu Thr Glu Leu Trp Pro Asn Leu Ile Ala Ala Leu His Lys Arg
130 135 140 130 135 140
Lys Ile Pro Leu Val Ile Ala Asn Ala Arg Leu Ser Ala Arg Ser AlaLys Ile Pro Leu Val Ile Ala Asn Ala Arg Leu Ser Ala Arg Ser Ala
145 150 155 160145 150 155 160
Ala Gly Tyr Ala Lys Leu Gly Lys Phe Val Arg Arg Leu Leu Arg ArgAla Gly Tyr Ala Lys Leu Gly Lys Phe Val Arg Arg Leu Leu Arg Arg
165 170 175 165 170 175
Ile Thr Leu Ile Ala Ala Gln Asn Glu Glu Asp Gly Ala Arg Phe ValIle Thr Leu Ile Ala Ala Gln Asn Glu Glu Asp Gly Ala Arg Phe Val
180 185 190 180 185 190
Ala Leu Gly Ala Lys Asn Asn Gln Val Thr Val Thr Gly Ser Leu LysAla Leu Gly Ala Lys Asn Asn Gln Val Thr Val Thr Gly Ser Leu Lys
195 200 205 195 200 205
Phe Asp Ile Ser Val Thr Pro Gln Leu Ala Ala Lys Ala Val Thr LeuPhe Asp Ile Ser Val Thr Pro Gln Leu Ala Ala Lys Ala Val Thr Leu
210 215 220 210 215 220
Arg Arg Gln Trp Ala Pro His Arg Pro Val Trp Ile Ala Thr Ser ThrArg Arg Gln Trp Ala Pro His Arg Pro Val Trp Ile Ala Thr Ser Thr
225 230 235 240225 230 235 240
His Glu Gly Glu Glu Ser Val Val Ile Ala Ala His Gln Ala Leu LeuHis Glu Gly Glu Glu Ser Val Val Ile Ala Ala His Gln Ala Leu Leu
245 250 255 245 250 255
Gln Gln Phe Pro Asn Leu Leu Leu Ile Leu Val Pro Arg His Pro GluGln Gln Phe Pro Asn Leu Leu Leu Ile Leu Val Pro Arg His Pro Glu
260 265 270 260 265 270
Arg Phe Pro Asp Ala Ile Asn Leu Val Arg Gln Ala Gly Leu Ser TyrArg Phe Pro Asp Ala Ile Asn Leu Val Arg Gln Ala Gly Leu Ser Tyr
275 280 285 275 280 285
Ile Thr Arg Ser Ser Gly Glu Val Pro Ser Thr Ser Thr Gln Val ValIle Thr Arg Ser Ser Gly Glu Val Pro Ser Thr Ser Thr Gln Val Val
290 295 300 290 295 300
Val Gly Asp Thr Met Gly Glu Leu Met Leu Leu Tyr Gly Ile Ala AspVal Gly Asp Thr Met Gly Glu Leu Met Leu Leu Tyr Gly Ile Ala Asp
305 310 315 320305 310 315 320
Leu Ala Phe Val Gly Gly Ser Leu Val Glu Arg Gly Gly His Asn ProLeu Ala Phe Val Gly Gly Ser Leu Val Glu Arg Gly Gly His Asn Pro
325 330 335 325 330 335
Leu Glu Ala Ala Ala His Ala Ile Pro Val Leu Met Gly Pro His ThrLeu Glu Ala Ala Ala His Ala Ile Pro Val Leu Met Gly Pro His Thr
340 345 350 340 345 350
Phe Asn Phe Lys Asp Ile Cys Ala Arg Leu Glu Gln Ala Ser Gly LeuPhe Asn Phe Lys Asp Ile Cys Ala Arg Leu Glu Gln Ala Ser Gly Leu
355 360 365 355 360 365
Ile Thr Val Thr Asp Ala Thr Thr Leu Ala Lys Glu Val Ser Ser LeuIle Thr Val Thr Asp Ala Thr Thr Leu Ala Lys Glu Val Ser Ser Leu
370 375 380 370 375 380
Leu Thr Asp Ala Asp Tyr Arg Ser Phe Tyr Gly Arg His Ala Val GluLeu Thr Asp Ala Asp Tyr Arg Ser Phe Tyr Gly Arg His Ala Val Glu
385 390 395 400385 390 395 400
Val Leu Tyr Gln Asn Gln Gly Ala Leu Gln Arg Leu Leu Gln Leu LeuVal Leu Tyr Gln Asn Gln Gly Ala Leu Gln Arg Leu Leu Gln Leu Leu
405 410 415 405 410 415
Glu Pro Tyr Leu Pro Pro Lys Thr HisGlu Pro Tyr Leu Pro Pro Lys Thr His
420 425 420 425
<210> 4<210> 4
<211> 425<211> 425
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<400> 4<400> 4
Met Leu Glu Leu Leu Tyr Thr Ala Leu Leu Tyr Leu Ile Gln Pro LeuMet Leu Glu Leu Leu Tyr Thr Ala Leu Leu Tyr Leu Ile Gln Pro Leu
1 5 10 151 5 10 15
Ile Trp Ile Arg Leu Trp Val Arg Gly Arg Lys Thr Pro Ala Tyr ArgIle Trp Ile Arg Leu Trp Val Arg Gly Arg Lys Thr Pro Ala Tyr Arg
20 25 30 20 25 30
Lys Arg Trp Gly Glu Arg Tyr Gly Phe Tyr Arg His Pro Leu Lys ProLys Arg Trp Gly Glu Arg Tyr Gly Phe Tyr Arg His Pro Leu Lys Pro
35 40 45 35 40 45
Gly Gly Ile Met Leu His Ser Val Ser Val Gly Glu Thr Leu Ala AlaGly Gly Ile Met Leu His Ser Val Ser Val Gly Glu Thr Leu Ala Ala
50 55 60 50 55 60
Ile Pro Leu Val Arg Ala Leu Arg His Arg Tyr Pro Asp Leu Pro IleIle Pro Leu Val Arg Ala Leu Arg His Arg Tyr Pro Asp Leu Pro Ile
65 70 75 8065 70 75 80
Thr Val Thr Thr Met Thr Pro Thr Gly Ser Glu Arg Val Gln Ser AlaThr Val Thr Thr Met Thr Pro Thr Gly Ser Glu Arg Val Gln Ser Ala
85 90 95 85 90 95
Phe Gly Lys Asp Val Gln His Val Tyr Leu Pro Tyr Asp Leu Pro AspPhe Gly Lys Asp Val Gln His Val Tyr Leu Pro Tyr Asp Leu Pro Asp
100 105 110 100 105 110
Ala Leu Asn Arg Phe Leu Asn Lys Val Asp Pro Lys Leu Val Leu IleAla Leu Asn Arg Phe Leu Asn Lys Val Asp Pro Lys Leu Val Leu Ile
115 120 125 115 120 125
Met Glu Thr Glu Leu Trp Pro Asn Leu Ile Ala Ala Leu His Lys ArgMet Glu Thr Glu Leu Trp Pro Asn Leu Ile Ala Ala Leu His Lys Arg
130 135 140 130 135 140
Lys Ile Pro Leu Val Ile Ala Asn Ala Arg Leu Ser Ala Arg Ser AlaLys Ile Pro Leu Val Ile Ala Asn Ala Arg Leu Ser Ala Arg Ser Ala
145 150 155 160145 150 155 160
Ala Gly Tyr Ala Lys Leu Gly Lys Phe Val Arg Arg Leu Leu Arg ArgAla Gly Tyr Ala Lys Leu Gly Lys Phe Val Arg Arg Leu Leu Arg Arg
165 170 175 165 170 175
Ile Thr Leu Ile Ala Ala Gln Asn Glu Glu Asp Gly Ala Arg Phe ValIle Thr Leu Ile Ala Ala Gln Asn Glu Glu Asp Gly Ala Arg Phe Val
180 185 190 180 185 190
Ala Leu Gly Ala Lys Asn Asn Gln Val Thr Val Thr Gly Ser Leu LysAla Leu Gly Ala Lys Asn Asn Gln Val Thr Val Thr Gly Ser Leu Lys
195 200 205 195 200 205
Phe Asp Ile Ser Val Thr Pro Gln Leu Ala Ala Lys Ala Val Thr LeuPhe Asp Ile Ser Val Thr Pro Gln Leu Ala Ala Lys Ala Val Thr Leu
210 215 220 210 215 220
Arg Arg Gln Trp Ala Pro His Arg Pro Val Trp Ile Ala Thr Ser ThrArg Arg Gln Trp Ala Pro His Arg Pro Val Trp Ile Ala Thr Ser Thr
225 230 235 240225 230 235 240
His Glu Gly Glu Glu Ser Val Val Ile Ala Ala His Gln Ala Leu LeuHis Glu Gly Glu Glu Ser Val Val Ile Ala Ala His Gln Ala Leu Leu
245 250 255 245 250 255
Gln Gln Phe Pro Asn Leu Leu Leu Ile Leu Val Pro Arg His Pro GluGln Gln Phe Pro Asn Leu Leu Leu Ile Leu Val Pro Arg His Pro Glu
260 265 270 260 265 270
Arg Phe Pro Asp Ala Ile Asn Leu Val Arg Gln Ala Gly Leu Ser TyrArg Phe Pro Asp Ala Ile Asn Leu Val Arg Gln Ala Gly Leu Ser Tyr
275 280 285 275 280 285
Ile Thr Arg Ser Ser Gly Glu Val Pro Ser Thr Ser Thr Gln Val ValIle Thr Arg Ser Ser Gly Glu Val Pro Ser Thr Ser Thr Gln Val Val
290 295 300 290 295 300
Val Gly Asp Thr Met Gly Glu Leu Met Leu Leu Tyr Gly Ile Ala AspVal Gly Asp Thr Met Gly Glu Leu Met Leu Leu Tyr Gly Ile Ala Asp
305 310 315 320305 310 315 320
Leu Ala Phe Val Gly Gly Ser Leu Val Glu Arg Gly Gly His Asn ProLeu Ala Phe Val Gly Gly Ser Leu Val Glu Arg Gly Gly His Asn Pro
325 330 335 325 330 335
Leu Glu Ala Ala Ala His Ala Ile Pro Val Leu Met Gly Pro His ThrLeu Glu Ala Ala Ala His Ala Ile Pro Val Leu Met Gly Pro His Thr
340 345 350 340 345 350
Phe Asn Phe Lys Asp Ile Cys Ala Arg Leu Glu Gln Ala Ser Gly LeuPhe Asn Phe Lys Asp Ile Cys Ala Arg Leu Glu Gln Ala Ser Gly Leu
355 360 365 355 360 365
Ile Thr Val Thr Asp Ala Thr Thr Leu Ala Lys Glu Val Ser Ser LeuIle Thr Val Thr Asp Ala Thr Thr Leu Ala Lys Glu Val Ser Ser Leu
370 375 380 370 375 380
Leu Thr Asp Ala Asp Tyr Arg Ser Phe Tyr Gly Arg His Ala Val GluLeu Thr Asp Ala Asp Tyr Arg Ser Phe Tyr Gly Arg His Ala Val Glu
385 390 395 400385 390 395 400
Val Leu Tyr Gln Asn Gln Gly Ala Leu Gln Arg Leu Leu Gln Leu LeuVal Leu Tyr Gln Asn Gln Gly Ala Leu Gln Arg Leu Leu Gln Leu Leu
405 410 415 405 410 415
Glu Pro Tyr Leu Pro Pro Lys Thr HisGlu Pro Tyr Leu Pro Pro Lys Thr His
420 425420 425
<210> 5<210> 5
<211> 26<211> 26
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 5<400> 5
cgggatccaccagtgaaccgccaaca cgggatccaccagtgaaccgccaaca
26 26
<210> 6<210> 6
<211> 18<211> 18
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 6<400> 6
tgcgcggacgtaagactc tgcgcggacgtaagactc
18 18
<210> 7<210> 7
<211> 18<211> 18
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 7<400> 7
gagtcttacgtccgcgca gagtcttacgtccgcgca
18 18
<210> 8<210> 8
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 8<400> 8
aaggaaaaaagcggccgcttcccgcacctttattg aaggaaaaaagcggccgcttcccgcacctttattg
3535
<210> 9<210> 9
<211> 18<211> 18
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 9<400> 9
cttcccgaaagccgattg cttcccgaaagccgattg
18 18
<210> 10<210> 10
<211> 18<211> 18
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 10<400> 10
acaaaatatactttaatc acaaaatatactttaatc
18 18
<210> 11<210> 11
<211> 1596<211> 1596
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 11<400> 11
accagtgaaccgccaacaaaggcgagatcggcaatgccatacagtaacatcaactcgccc accagtgaaccgccaacaaaggcgagatcggcaatgccatacagtaacatcaactcgccc
6060
atcgtatcgccaaccacaacctgcgtgctggtggaggggacttcccctgaagagcgtgtg atcgtatcgccaaccacaacctgcgtgctggtggaggggacttcccctgaagagcgtgtg
120120
atatagcttagtccagcctggcggacaaggttaatcgcatccgggaagcgttccggatga atatagcttagtccagcctggcggacaaggttaatcgcatccgggaagcgttccggatga
180180
cggggtaccaggatgagcaataaattcgggaattgctgtaacaatgcctgatgtgcggcg cggggtaccaggatgagcaataaattcgggaattgctgtaacaatgcctgatgtgcggcg
240240
atcaccacactctcttcgccttcgtgagtgctggtggcaatccataccgggcggtgtggt atcaccacactctcttcgccttcgtgagtgctggtggcaatccataccgggcggtgtggt
300300
gcccactggcggcgcagcgtcacggctttagcagccaactgcggcgttacagaaatatcg gcccactggcggcgcagcgtcacggctttagcagccaactgcggcgttacagaaatatcg
360360
aatttcaggctaccggtaacggtcacctgattattttttgcgcccagcgccacaaaacgt aatttcaggctaccggtaacggtcacctgattattttttgcgcccagcgccacaaaacgt
420420
gcaccatcttcttcattttgcgcagcaatcagcgtaatacgacgcagcaagcgacggacg gcaccatcttcttcattttgcgcagcaatcagcgtaatacgacgcagcaagcgacggacg
480480
aatttacccagtttggcataacctgcggccgagcgggcagagagtcgcgcgttagcgatc aatttacccagtttggcataacctgcggccgagcgggcagagagtcgcgcgttagcgatc
540540
accagcggaattttacgtttatgtagcgccgcaatcaggttaggccatagttcggtttcc accagcggaattttacgtttatgtagcgccgcaatcaggttaggccatagttcggtttcc
600600
ataatcaacaccagtttagggtcgactttattcaggaaacggttgagtgcatcgggcaga ataatcaacaccagtttagggtcgactttattcaggaaacggttgagtgcatcgggcaga
660660
tcatacggcagataaacgtgctgaacatccttcccgaaagccgattgtacgcgctccgaa tcatacggcagataaacgtgctgaacatccttcccgaaagccgattgtacgcgctccgaa
720720
ccggttggcgtcatggttgttacggtaatcggtaaatcaggataacgatgacgcagcgcg ccggttggcgtcatggttgttacggtaatcggtaaatcaggataacgatgacgcagcgcg
780780
cgcaccaacgggattgccgccagagtttcaccgacggagacggagtgcagcataatgccg cgcaccaacgggattgccgccagagtttcaccgacggagacggagtgcagcataatgccg
840840
cctggttttagcggatggcggtaaaaaccgtaacgttcaccccagcgttttcgataggcc cctggttttagcggatggcggtaaaaaccgtaacgttcaccccagcgttttcgataggcc
900900
ggagacttacgtccgcgcacccagagccgtatccagatcagcggctgaataaggtagaga ggagacttacgtccgcgcacccagagccgtatccagatcagcggctgaataaggtagaga
960960
agggcggtgtaaagcaattcgagcatagtaaatagctgacttatggatgtgctggggatt agggcggtgtaaagcaattcgagcatagtaaatagctgacttatggatgtgctggggatt
10201020
ctatgtatttagctgtggctttaccattacttttcccgtttttgacttaaatagcttcag ctatgtatttagctgtggctttaccattacttttcccgtttttgacttaaatagcttcag
10801080
tttggtctgatctgccgctacatcttcattttttttgtatttttatgcgattcattgaaa tttggtctgatctgccgctacatcttcattttttttgtatttttatgcgattcattgaaa
11401140
ctcggccccattttcaaatctacataggccgtactgacattatcgaaatgctatttttta ctcggccccattttcaaatctacataggccgtactgacattatcgaaatgctatttttta
12001200
tctatttgatttttatgattaaagtatattttgtgtataaaaatcattcgggtcggattg tctatttgatttttatgattaaagtatattttgtgtataaaaatcattcgggtcggattg
12601260
ctgcgaaagaaatgatacactagcacgtcaaagtaagtgcgttatcagtattcaggtagc ctgcgaaagaaatgatacactagcacgtcaaagtaagtgcgttatcagtattcaggtagc
13201320
tgttgagcctggggcggtagcgtgcttttttctgcttaacttaaccagacaatcacacaa tgttgagcctggggcggtagcgtgcttttttctgcttaacttaaccagacaatcacacaa
13801380
aagagtcgctagtggaaaagccatttcgaaaaatcctggtcataaagatgcgatatcatg aagagtcgctagtggaaaagccatttcgaaaaatcctggtcataaagatgcgatatcatg
14401440
gggatatgttattaactactcctgtcatcagtacgctcaagcagaattatcctgatgcaa gggatatgttattaactactcctgtcatcagtacgctcaagcagaattatcctgatgcaa
15001500
aaatcgatatgctgctttatcaggacaccatccctattttgtctgaaaacccggaaatta aaatcgatatgctgctttatcaggacaccatccctattttgtctgaaaacccggaaatta
15601560
atgcgctctatgggataagcaataaaggtgcgggaa atgcgctctatgggataagcaataaaggtgcgggaa
15961596
<210> 12<210> 12
<211> 544<211> 544
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 12<400> 12
cttcccgaaagccgattgtacgcgctccgaaccggttggcgtcatggttgttacggtaat cttcccgaaagccgattgtacgcgctccgaaccggttggcgtcatggttgttacggtaat
6060
cggtaaatcaggataacgatgacgcagcgcgcgcaccaacgggattgccgccagagtttc cggtaaatcaggataacgatgacgcagcgcgcgcaccaacgggattgccgccagagtttc
120120
accgacggagacggagtgcagcataatgccgcctggttttagcggatggcggtaaaaacc accgacggagacggagtgcagcataatgccgcctggttttagcggatggcggtaaaaacc
180180
gtaacgttcaccccagcgttttcgataggccggagacttacgtccgcgcacccagagccg gtaacgttcaccccagcgttttcgataggccggagacttacgtccgcgcacccagagccg
240240
tatccagatcagcggctgaataaggtagagaagggcggtgtaaagcaattcgagcatagt tatccagatcagcggctgaataaggtagagaagggcggtgtaaagcaattcgagcatagt
300300
aaatagctgacttatggatgtgctggggattctatgtatttagctgtggctttaccatta aaatagctgacttatggatgtgctggggattctatgtatttagctgtggctttaccatta
360360
cttttcccgtttttgacttaaatagcttcagtttggtctgatctgccgctacatcttcat cttttcccgtttttgacttaaatagcttcagtttggtctgatctgccgctacatcttcat
420420
tttttttgtatttttatgcgattcattgaaactcggccccattttcaaatctacataggc tttttttgtatttttatgcgattcattgaaactcggccccatttcaaatctacataggc
480480
cgtactgacattatcgaaatgctattttttatctatttgatttttatgattaaagtatat cgtactgacattatcgaaatgctattttttatctatttgatttttatgattaaagtatat
540540
tttg tttg
544 544
<210> 13<210> 13
<211> 2109<211> 2109
<212> ДНК<212> DNA
<213>Escherichiacoli<213>Escherichia coli
<400> 13<400> 13
atgtatctgtttgaaagcctgaatcaactgattcaaacctacctgccggaagaccaaatc atgtatctgtttgaaagcctgaatcaactgattcaaacctacctgccggaagaccaaatc
6060
aagcgtctgcggcaggcgtatctcgttgcacgtgatgctcacgaggggcaaacacgttca aagcgtctgcggcaggcgtatctcgttgcacgtgatgctcacgaggggcaaacacgttca
120120
agcggtgaaccctatatcacgcacccggtagcggttgcctgcattctggccgagatgaaa agcggtgaaccctatatcacgcacccggtagcggttgcctgcattctggccgagatgaaa
180180
ctcgactatgaaacgctgatggcggcgctgctgcatgacgtgattgaagatactcccgcc ctcgactatgaaacgctgatggcggcgctgctgcatgacgtgattgaagatactcccgcc
240240
acctaccaggatatggaacagctttttggtaaaagcgtcgccgagctggtagagggggtg acctaccaggatatggaacagctttttggtaaaagcgtcgccgagctggtagagggggtg
300300
tcgaaacttgataaactcaagttccgcgataagaaagaggcgcaggccgaaaactttcgc tcgaaacttgataaactcaagttccgcgataagaaagaggcgcaggccgaaaactttcgc
360360
aagatgattatggcgatggtgcaggatatccgcgtcatcctcatcaaacttgccgaccgt aagatgattatggcgatggtgcaggatatccgcgtcatcctcatcaaacttgccgaccgt
420420
acccacaacatgcgcacgctgggctcacttcgcccggacaaacgtcgccgcatcgcccgt acccacaacatgcgcacgctgggctcacttcgcccggacaaacgtcgccgcatcgcccgt
480480
gaaactctcgaaatttatagcccgctggcgcaccgtttaggtatccaccacattaaaacc gaaactctcgaaatttatagcccgctggcgcaccgtttaggtatccaccacattaaaacc
540540
gaactcgaagagctgggttttgaggcgctgtatcccaaccgttatcgcgtaatcaaagaa gaactcgaagagctgggttttgaggcgctgtatcccaaccgttatcgcgtaatcaaagaa
600600
gtggtgaaagccgcgcgcggcaaccgtaaagagatgatccagaagattctttctgaaatc gtggtgaaagccgcgcgcggcaaccgtaaagagatgatccagaagattctctttctgaaatc
660660
gaagggcgtttgcaggaagcgggaataccgtgccgcgtcagtggtcgcgagaagcatctt gaagggcgtttgcaggaagcgggaataccgtgccgcgtcagtggtcgcgagaagcatctt
720720
tattcgatttactgcaaaatggtgctcaaagagcagcgttttcactcgatcatggacatc tattcgatttactgcaaaatggtgctcaaagagcagcgttttcactcgatcatggacatc
780780
tacgctttccgcgtgatcgtcaatgattctgacacctgttatcgcgtgctgggccagatg tacgctttccgcgtgatcgtcaatgattctctgacacctgttatcgcgtgctgggccagatg
840840
cacagcctgtacaagccgcgtccgggccgcgtgaaagactatatcgccattccaaaagcg cacagcctgtacaagccgcgtccgggccgcgtgaaagactatatcgccattccaaaagcg
900900
aacggctatcagtctttgcacacctcgatgatcggcccgcacggtgtgccggttgaggtc aacggctatcagtctttgcacacctcgatgatcggcccgcacggtgtgccggttgaggtc
960960
cagatccgtaccgaagatatggaccagatggcggagatgggtgttgccgcgcactgggct cagatccgtaccgaagatatggaccagatggcggagatgggtgttgccgcgcactgggct
10201020
tataaagagcacggcgaaaccagtactaccgcacaaatccgcgcccagcgctggatgcaa tataaagagcacggcgaaaccagtactaccgcacaaatccgcgcccagcgctggatgcaa
10801080
agcctgctggagctgcaacagagcgccggtagttcgtttgaatttatcgagagcgttaaa agcctgctggagctgcaacagagcgccggtagttcgtttgaatttatcgagagcgttaaa
11401140
tccgatctcttcccggatgagatttacgttttcacaccggaagggcgcattgtcgagctg tccgatctcttcccggatgagatttacgttttcacaccggaagggcgcattgtcgagctg
12001200
cctgccggtgcaacgcccgtcgacttcgcttatgcagtgcataccgatatcggtcatgcc cctgccggtgcaacgcccgtcgacttcgcttatgcagtgcataccgatatcggtcatgcc
12601260
tgcgtgggcgcacgcgttgaccgccagccttacccgctgtcgcagccgcttaccagcggt tgcgtgggcgcacgcgttgaccgccagccttacccgctgtcgcagccgcttaccagcggt
13201320
caaaccgttgaaatcattaccgctccgggcgctcgcccgaatgccgcttggctgaacttt caaaccgttgaaatcattaccgctccgggcgctcgcccgaatgccgcttggctgaacttt
13801380
gtcgttagctcgaaagcgcgcgccaaaattcgtcagttgctgaaaaacctcaagcgtgat gtcgttagctcgaaagcgcgcgccaaaattcgtcagttgctgaaaaacctcaagcgtgat
14401440
gattctgtaagcctgggccgtcgtctgctcaaccatgctttgggtggtagccgtaagctg gattctgtaagcctgggccgtcgtctgctcaaccatgctttgggtggtagccgtaagctg
15001500
aatgaaatcccgcaggaaaatattcagcgcgagctggatcgcatgaagctggcaacgctt aatgaaatcccgcaggaaaatattcagcgcgagctggatcgcatgaagctggcaacgctt
15601560
gacgatctgctggcagaaatcggacttggtaacgcaatgagcgtggtggtcgcgaaaaat gacgatctgctggcagaaatcggacttggtaacgcaatgagcgtggtggtcgcgaaaaat
16201620
ctgcaacatggggacgcctccattccaccggcaacccaaagccacggacatctgcccatt ctgcaacatggggacgcctccattccaccggcaacccaaagccacggacatctgcccatt
16801680
aaaggtgccgatggcgtgctgatcacctttgcgaaatgctgccgccctattcctggcgac aaaggtgccgatggcgtgctgatcacctttgcgaaatgctgccgccctattcctggcgac
17401740
ccgattatcgcccacgtcagccccggtaaaggtctggtgatccaccatgaatcctgccgt ccgattatcgcccacgtcagccccggtaaaggtctggtgatccaccatgaatcctgccgt
18001800
aatatccgtggctaccagaaagagccagagaagtttatggctgtggaatgggataaagag aatatccgtggctaccagaaagagccagagaagtttatggctgtggaatgggataaagag
18601860
acggcgcaggagttcatcaccgaaatcaaggtggagatgttcaatcatcagggtgcgctg acggcgcaggagttcatcaccgaaatcaaggtggagatgttcaatcatcagggtgcgctg
19201920
gcaaacctgacggcggcaattaacaccacgacttcgaatattcaaagtttgaatacggaa gcaaacctgacggcggcaattaacaccacgacttcgaatattcaaagtttgaatacggaa
19801980
gagaaagatggtcgcgtctacagcgcctttattcgtctgaccgctcgtgaccgtgtgcat gagaaagatggtcgcgtctacagcgcctttattcgtctgaccgctcgtgaccgtgtgcat
20402040
ctggcgaatatcatgcgcaaaatccgcgtgatgccagacgtgattaaagtcacccgaaac ctggcgaatatcatgcgcaaaatccgcgtgatgccagacgtgattaaagtcacccgaaac
21002100
cgaaattaa cgaaattaa
2109 2109
<210> 14<210> 14
<211> 2109<211> 2109
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 14<400> 14
atgtatctgtttgaaagcctgaatcaactgattcaaacctacctgccggaagaccaaatc atgtatctgtttgaaagcctgaatcaactgattcaaacctacctgccggaagaccaaatc
6060
aagcgtctgcggcaggcgtatctcgttgcacgtgatgctcacgaggggcaaacacgttca aagcgtctgcggcaggcgtatctcgttgcacgtgatgctcacgaggggcaaacacgttca
120120
agcggtgaaccctatatcacgcacccggtagcggttgcctgcattctggccgagatgaaa agcggtgaaccctatatcacgcacccggtagcggttgcctgcattctggccgagatgaaa
180180
ctcgactatgaaacgctgatggcggcgctgctgcatgacgtgattgaagatactcccgcc ctcgactatgaaacgctgatggcggcgctgctgcatgacgtgattgaagatactcccgcc
240240
acctaccaggatatggaacagctttttggtaaaagcgtcgccgagctggtagagggggtg acctaccaggatatggaacagctttttggtaaaagcgtcgccgagctggtagagggggtg
300300
tcgaaacttgataaactcaagttccgcgataagaaagaggcgcaggccgaaaactttcgc tcgaaacttgataaactcaagttccgcgataagaaagaggcgcaggccgaaaactttcgc
360360
aagatgattatggcgatggtgcaggatatccgcgtcatcctcatcaaacttgccgaccgt aagatgattatggcgatggtgcaggatatccgcgtcatcctcatcaaacttgccgaccgt
420420
acccacaacatgcgcacgctgggctcacttcgcccggacaaacgtcgccgcatcgcccgt acccacaacatgcgcacgctgggctcacttcgcccggacaaacgtcgccgcatcgcccgt
480480
gaaactctcgaaatttatagcccgctggcgcaccgtttatgtatccaccacattaaaacc gaaactctcgaaatttatagcccgctggcgcaccgtttatgtatccaccacattaaaacc
540540
gaactcgaagagctgggttttgaggcgctgtatcccaaccgttatcgcgtaatcaaagaa gaactcgaagagctgggttttgaggcgctgtatcccaaccgttatcgcgtaatcaaagaa
600600
gtggtgaaagccgcgcgcggcaaccgtaaagagatgatccagaagattctttctgaaatc gtggtgaaagccgcgcgcggcaaccgtaaagagatgatccagaagattctctttctgaaatc
660660
gaagggcgtttgcaggaagcgggaataccgtgccgcgtcagtggtcgcgagaagcatctt gaagggcgtttgcaggaagcgggaataccgtgccgcgtcagtggtcgcgagaagcatctt
720720
tattcgatttactgcaaaatggtgctcaaagagcagcgttttcactcgatcatggacatc tattcgatttactgcaaaatggtgctcaaagagcagcgttttcactcgatcatggacatc
780780
tacgctttccgcgtgatcgtcaatgattctgacacctgttatcgcgtgctgggccagatg tacgctttccgcgtgatcgtcaatgattctctgacacctgttatcgcgtgctgggccagatg
840840
cacagcctgtacaagccgcgtccgggccgcgtgaaagactatatcgccattccaaaagcg cacagcctgtacaagccgcgtccgggccgcgtgaaagactatatcgccattccaaaagcg
900900
aacggctatcagtctttgcacacctcgatgatcggcccgcacggtgtgccggttgaggtc aacggctatcagtctttgcacacctcgatgatcggcccgcacggtgtgccggttgaggtc
960960
cagatccgtaccgaagatatggaccagatggcggagatgggtgttgccgcgcactgggct cagatccgtaccgaagatatggaccagatggcggagatgggtgttgccgcgcactgggct
10201020
tataaagagcacggcgaaaccagtactaccgcacaaatccgcgcccagcgctggatgcaa tataaagagcacggcgaaaccagtactaccgcacaaatccgcgcccagcgctggatgcaa
10801080
agcctgctggagctgcaacagagcgccggtagttcgtttgaatttatcgagagcgttaaa agcctgctggagctgcaacagagcgccggtagttcgtttgaatttatcgagagcgttaaa
11401140
tccgatctcttcccggatgagatttacgttttcacaccggaagggcgcattgtcgagctg tccgatctcttcccggatgagatttacgttttcacaccggaagggcgcattgtcgagctg
12001200
cctgccggtgcaacgcccgtcgacttcgcttatgcagtgcataccgatatcggtcatgcc cctgccggtgcaacgcccgtcgacttcgcttatgcagtgcataccgatatcggtcatgcc
12601260
tgcgtgggcgcacgcgttgaccgccagccttacccgctgtcgcagccgcttaccagcggt tgcgtgggcgcacgcgttgaccgccagccttacccgctgtcgcagccgcttaccagcggt
13201320
caaaccgttgaaatcattaccgctccgggcgctcgcccgaatgccgcttggctgaacttt caaaccgttgaaatcattaccgctccgggcgctcgcccgaatgccgcttggctgaacttt
13801380
gtcgttagctcgaaagcgcgcgccaaaattcgtcagttgctgaaaaacctcaagcgtgat gtcgttagctcgaaagcgcgcgccaaaattcgtcagttgctgaaaaacctcaagcgtgat
14401440
gattctgtaagcctgggccgtcgtctgctcaaccatgctttgggtggtagccgtaagctg gattctgtaagcctgggccgtcgtctgctcaaccatgctttgggtggtagccgtaagctg
15001500
aatgaaatcccgcaggaaaatattcagcgcgagctggatcgcatgaagctggcaacgctt aatgaaatcccgcaggaaaatattcagcgcgagctggatcgcatgaagctggcaacgctt
15601560
gacgatctgctggcagaaatcggacttggtaacgcaatgagcgtggtggtcgcgaaaaat gacgatctgctggcagaaatcggacttggtaacgcaatgagcgtggtggtcgcgaaaaat
16201620
ctgcaacatggggacgcctccattccaccggcaacccaaagccacggacatctgcccatt ctgcaacatggggacgcctccattccaccggcaacccaaagccacggacatctgcccatt
16801680
aaaggtgccgatggcgtgctgatcacctttgcgaaatgctgccgccctattcctggcgac aaaggtgccgatggcgtgctgatcacctttgcgaaatgctgccgccctattcctggcgac
17401740
ccgattatcgcccacgtcagccccggtaaaggtctggtgatccaccatgaatcctgccgt ccgattatcgcccacgtcagccccggtaaaggtctggtgatccaccatgaatcctgccgt
18001800
aatatccgtggctaccagaaagagccagagaagtttatggctgtggaatgggataaagag aatatccgtggctaccagaaagagccagagaagtttatggctgtggaatgggataaagag
18601860
acggcgcaggagttcatcaccgaaatcaaggtggagatgttcaatcatcagggtgcgctg acggcgcaggagttcatcaccgaaatcaaggtggagatgttcaatcatcagggtgcgctg
19201920
gcaaacctgacggcggcaattaacaccacgacttcgaatattcaaagtttgaatacggaa gcaaacctgacggcggcaattaacaccacgacttcgaatattcaaagtttgaatacggaa
19801980
gagaaagatggtcgcgtctacagcgcctttattcgtctgaccgctcgtgaccgtgtgcat gagaaagatggtcgcgtctacagcgcctttattcgtctgaccgctcgtgaccgtgtgcat
20402040
ctggcgaatatcatgcgcaaaatccgcgtgatgccagacgtgattaaagtcacccgaaac ctggcgaatatcatgcgcaaaatccgcgtgatgccagacgtgattaaagtcacccgaaac
21002100
cgaaattaa cgaaattaa
2109 2109
<210> 15<210> 15
<211> 702<211> 702
<212> БЕЛОК<212> PROTEIN
<213> Escherichia coli<213> Escherichia coli
<400> 15<400> 15
Met Tyr Leu Phe Glu Ser Leu Asn Gln Leu Ile Gln Thr Tyr Leu ProMet Tyr Leu Phe Glu Ser Leu Asn Gln Leu Ile Gln Thr Tyr Leu Pro
1 5 10 151 5 10 15
Glu Asp Gln Ile Lys Arg Leu Arg Gln Ala Tyr Leu Val Ala Arg AspGlu Asp Gln Ile Lys Arg Leu Arg Gln Ala Tyr Leu Val Ala Arg Asp
20 25 30 20 25 30
Ala His Glu Gly Gln Thr Arg Ser Ser Gly Glu Pro Tyr Ile Thr HisAla His Glu Gly Gln Thr Arg Ser Ser Gly Glu Pro Tyr Ile Thr His
35 40 45 35 40 45
Pro Val Ala Val Ala Cys Ile Leu Ala Glu Met Lys Leu Asp Tyr GluPro Val Ala Val Ala Cys Ile Leu Ala Glu Met Lys Leu Asp Tyr Glu
50 55 60 50 55 60
Thr Leu Met Ala Ala Leu Leu His Asp Val Ile Glu Asp Thr Pro AlaThr Leu Met Ala Ala Leu Leu His Asp Val Ile Glu Asp Thr Pro Ala
65 70 75 8065 70 75 80
Thr Tyr Gln Asp Met Glu Gln Leu Phe Gly Lys Ser Val Ala Glu LeuThr Tyr Gln Asp Met Glu Gln Leu Phe Gly Lys Ser Val Ala Glu Leu
85 90 95 85 90 95
Val Glu Gly Val Ser Lys Leu Asp Lys Leu Lys Phe Arg Asp Lys LysVal Glu Gly Val Ser Lys Leu Asp Lys Leu Lys Phe Arg Asp Lys Lys
100 105 110 100 105 110
Glu Ala Gln Ala Glu Asn Phe Arg Lys Met Ile Met Ala Met Val GlnGlu Ala Gln Ala Glu Asn Phe Arg Lys Met Ile Met Ala Met Val Gln
115 120 125 115 120 125
Asp Ile Arg Val Ile Leu Ile Lys Leu Ala Asp Arg Thr His Asn MetAsp Ile Arg Val Ile Leu Ile Lys Leu Ala Asp Arg Thr His Asn Met
130 135 140 130 135 140
Arg Thr Leu Gly Ser Leu Arg Pro Asp Lys Arg Arg Arg Ile Ala ArgArg Thr Leu Gly Ser Leu Arg Pro Asp Lys Arg Arg Arg Ile Ala Arg
145 150 155 160145 150 155 160
Glu Thr Leu Glu Ile Tyr Ser Pro Leu Ala His Arg Leu Gly Ile HisGlu Thr Leu Glu Ile Tyr Ser Pro Leu Ala His Arg Leu Gly Ile His
165 170 175 165 170 175
His Ile Lys Thr Glu Leu Glu Glu Leu Gly Phe Glu Ala Leu Tyr ProHis Ile Lys Thr Glu Leu Glu Glu Leu Gly Phe Glu Ala Leu Tyr Pro
180 185 190 180 185 190
Asn Arg Tyr Arg Val Ile Lys Glu Val Val Lys Ala Ala Arg Gly AsnAsn Arg Tyr Arg Val Ile Lys Glu Val Val Lys Ala Ala Arg Gly Asn
195 200 205 195 200 205
Arg Lys Glu Met Ile Gln Lys Ile Leu Ser Glu Ile Glu Gly Arg LeuArg Lys Glu Met Ile Gln Lys Ile Leu Ser Glu Ile Glu Gly Arg Leu
210 215 220 210 215 220
Gln Glu Ala Gly Ile Pro Cys Arg Val Ser Gly Arg Glu Lys His LeuGln Glu Ala Gly Ile Pro Cys Arg Val Ser Gly Arg Glu Lys His Leu
225 230 235 240225 230 235 240
Tyr Ser Ile Tyr Cys Lys Met Val Leu Lys Glu Gln Arg Phe His SerTyr Ser Ile Tyr Cys Lys Met Val Leu Lys Glu Gln Arg Phe His Ser
245 250 255 245 250 255
Ile Met Asp Ile Tyr Ala Phe Arg Val Ile Val Asn Asp Ser Asp ThrIle Met Asp Ile Tyr Ala Phe Arg Val Ile Val Asn Asp Ser Asp Thr
260 265 270 260 265 270
Cys Tyr Arg Val Leu Gly Gln Met His Ser Leu Tyr Lys Pro Arg ProCys Tyr Arg Val Leu Gly Gln Met His Ser Leu Tyr Lys Pro Arg Pro
275 280 285 275 280 285
Gly Arg Val Lys Asp Tyr Ile Ala Ile Pro Lys Ala Asn Gly Tyr GlnGly Arg Val Lys Asp Tyr Ile Ala Ile Pro Lys Ala Asn Gly Tyr Gln
290 295 300 290 295 300
Ser Leu His Thr Ser Met Ile Gly Pro His Gly Val Pro Val Glu ValSer Leu His Thr Ser Met Ile Gly Pro His Gly Val Pro Val Glu Val
305 310 315 320305 310 315 320
Gln Ile Arg Thr Glu Asp Met Asp Gln Met Ala Glu Met Gly Val AlaGln Ile Arg Thr Glu Asp Met Asp Gln Met Ala Glu Met Gly Val Ala
325 330 335 325 330 335
Ala His Trp Ala Tyr Lys Glu His Gly Glu Thr Ser Thr Thr Ala GlnAla His Trp Ala Tyr Lys Glu His Gly Glu Thr Ser Thr Thr Ala Gln
340 345 350 340 345 350
Ile Arg Ala Gln Arg Trp Met Gln Ser Leu Leu Glu Leu Gln Gln SerIle Arg Ala Gln Arg Trp Met Gln Ser Leu Leu Glu Leu Gln Gln Ser
355 360 365 355 360 365
Ala Gly Ser Ser Phe Glu Phe Ile Glu Ser Val Lys Ser Asp Leu PheAla Gly Ser Ser Phe Glu Phe Ile Glu Ser Val Lys Ser Asp Leu Phe
370 375 380 370 375 380
Pro Asp Glu Ile Tyr Val Phe Thr Pro Glu Gly Arg Ile Val Glu LeuPro Asp Glu Ile Tyr Val Phe Thr Pro Glu Gly Arg Ile Val Glu Leu
385 390 395 400385 390 395 400
Pro Ala Gly Ala Thr Pro Val Asp Phe Ala Tyr Ala Val His Thr AspPro Ala Gly Ala Thr Pro Val Asp Phe Ala Tyr Ala Val His Thr Asp
405 410 415 405 410 415
Ile Gly His Ala Cys Val Gly Ala Arg Val Asp Arg Gln Pro Tyr ProIle Gly His Ala Cys Val Gly Ala Arg Val Asp Arg Gln Pro Tyr Pro
420 425 430 420 425 430
Leu Ser Gln Pro Leu Thr Ser Gly Gln Thr Val Glu Ile Ile Thr AlaLeu Ser Gln Pro Leu Thr Ser Gly Gln Thr Val Glu Ile Ile Thr Ala
435 440 445 435 440 445
Pro Gly Ala Arg Pro Asn Ala Ala Trp Leu Asn Phe Val Val Ser SerPro Gly Ala Arg Pro Asn Ala Ala Trp Leu Asn Phe Val Val Ser Ser
450 455 460 450 455 460
Lys Ala Arg Ala Lys Ile Arg Gln Leu Leu Lys Asn Leu Lys Arg AspLys Ala Arg Ala Lys Ile Arg Gln Leu Leu Lys Asn Leu Lys Arg Asp
465 470 475 480465 470 475 480
Asp Ser Val Ser Leu Gly Arg Arg Leu Leu Asn His Ala Leu Gly GlyAsp Ser Val Ser Leu Gly Arg Arg Leu Leu Asn His Ala Leu Gly Gly
485 490 495 485 490 495
Ser Arg Lys Leu Asn Glu Ile Pro Gln Glu Asn Ile Gln Arg Glu LeuSer Arg Lys Leu Asn Glu Ile Pro Gln Glu Asn Ile Gln Arg Glu Leu
500 505 510 500 505 510
Asp Arg Met Lys Leu Ala Thr Leu Asp Asp Leu Leu Ala Glu Ile GlyAsp Arg Met Lys Leu Ala Thr Leu Asp Asp Leu Leu Ala Glu Ile Gly
515 520 525 515 520 525
Leu Gly Asn Ala Met Ser Val Val Val Ala Lys Asn Leu Gln His GlyLeu Gly Asn Ala Met Ser Val Val Val Ala Lys Asn Leu Gln His Gly
530 535 540 530 535 540
Asp Ala Ser Ile Pro Pro Ala Thr Gln Ser His Gly His Leu Pro IleAsp Ala Ser Ile Pro Pro Ala Thr Gln Ser His Gly His Leu Pro Ile
545 550 555 560545 550 555 560
Lys Gly Ala Asp Gly Val Leu Ile Thr Phe Ala Lys Cys Cys Arg ProLys Gly Ala Asp Gly Val Leu Ile Thr Phe Ala Lys Cys Cys Arg Pro
565 570 575 565 570 575
Ile Pro Gly Asp Pro Ile Ile Ala His Val Ser Pro Gly Lys Gly LeuIle Pro Gly Asp Pro Ile Ile Ala His Val Ser Pro Gly Lys Gly Leu
580 585 590 580 585 590
Val Ile His His Glu Ser Cys Arg Asn Ile Arg Gly Tyr Gln Lys GluVal Ile His His Glu Ser Cys Arg Asn Ile Arg Gly Tyr Gln Lys Glu
595 600 605 595 600 605
Pro Glu Lys Phe Met Ala Val Glu Trp Asp Lys Glu Thr Ala Gln GluPro Glu Lys Phe Met Ala Val Glu Trp Asp Lys Glu Thr Ala Gln Glu
610 615 620 610 615 620
Phe Ile Thr Glu Ile Lys Val Glu Met Phe Asn His Gln Gly Ala LeuPhe Ile Thr Glu Ile Lys Val Glu Met Phe Asn His Gln Gly Ala Leu
625 630 635 640625 630 635 640
Ala Asn Leu Thr Ala Ala Ile Asn Thr Thr Thr Ser Asn Ile Gln SerAla Asn Leu Thr Ala Ala Ile Asn Thr Thr Thr Ser Asn Ile Gln Ser
645 650 655 645 650 655
Leu Asn Thr Glu Glu Lys Asp Gly Arg Val Tyr Ser Ala Phe Ile ArgLeu Asn Thr Glu Glu Lys Asp Gly Arg Val Tyr Ser Ala Phe Ile Arg
660 665 670 660 665 670
Leu Thr Ala Arg Asp Arg Val His Leu Ala Asn Ile Met Arg Lys IleLeu Thr Ala Arg Asp Arg Val His Leu Ala Asn Ile Met Arg Lys Ile
675 680 685 675 680 685
Arg Val Met Pro Asp Val Ile Lys Val Thr Arg Asn Arg AsnArg Val Met Pro Asp Val Ile Lys Val Thr Arg Asn Arg Asn
690 695 700 690 695 700
<210> 16<210> 16
<211> 702<211> 702
<212> БЕЛОК<212> PROTEIN
<213> Escherichia coli<213> Escherichia coli
<400> 16<400> 16
Met Tyr Leu Phe Glu Ser Leu Asn Gln Leu Ile Gln Thr Tyr Leu ProMet Tyr Leu Phe Glu Ser Leu Asn Gln Leu Ile Gln Thr Tyr Leu Pro
1 5 10 151 5 10 15
Glu Asp Gln Ile Lys Arg Leu Arg Gln Ala Tyr Leu Val Ala Arg AspGlu Asp Gln Ile Lys Arg Leu Arg Gln Ala Tyr Leu Val Ala Arg Asp
20 25 30 20 25 30
Ala His Glu Gly Gln Thr Arg Ser Ser Gly Glu Pro Tyr Ile Thr HisAla His Glu Gly Gln Thr Arg Ser Ser Gly Glu Pro Tyr Ile Thr His
35 40 45 35 40 45
Pro Val Ala Val Ala Cys Ile Leu Ala Glu Met Lys Leu Asp Tyr GluPro Val Ala Val Ala Cys Ile Leu Ala Glu Met Lys Leu Asp Tyr Glu
50 55 60 50 55 60
Thr Leu Met Ala Ala Leu Leu His Asp Val Ile Glu Asp Thr Pro AlaThr Leu Met Ala Ala Leu Leu His Asp Val Ile Glu Asp Thr Pro Ala
65 70 75 8065 70 75 80
Thr Tyr Gln Asp Met Glu Gln Leu Phe Gly Lys Ser Val Ala Glu LeuThr Tyr Gln Asp Met Glu Gln Leu Phe Gly Lys Ser Val Ala Glu Leu
85 90 95 85 90 95
Val Glu Gly Val Ser Lys Leu Asp Lys Leu Lys Phe Arg Asp Lys LysVal Glu Gly Val Ser Lys Leu Asp Lys Leu Lys Phe Arg Asp Lys Lys
100 105 110 100 105 110
Glu Ala Gln Ala Glu Asn Phe Arg Lys Met Ile Met Ala Met Val GlnGlu Ala Gln Ala Glu Asn Phe Arg Lys Met Ile Met Ala Met Val Gln
115 120 125 115 120 125
Asp Ile Arg Val Ile Leu Ile Lys Leu Ala Asp Arg Thr His Asn MetAsp Ile Arg Val Ile Leu Ile Lys Leu Ala Asp Arg Thr His Asn Met
130 135 140 130 135 140
Arg Thr Leu Gly Ser Leu Arg Pro Asp Lys Arg Arg Arg Ile Ala ArgArg Thr Leu Gly Ser Leu Arg Pro Asp Lys Arg Arg Arg Ile Ala Arg
145 150 155 160145 150 155 160
Glu Thr Leu Glu Ile Tyr Ser Pro Leu Ala His Arg Leu Cys Ile HisGlu Thr Leu Glu Ile Tyr Ser Pro Leu Ala His Arg Leu Cys Ile His
165 170 175 165 170 175
His Ile Lys Thr Glu Leu Glu Glu Leu Gly Phe Glu Ala Leu Tyr ProHis Ile Lys Thr Glu Leu Glu Glu Leu Gly Phe Glu Ala Leu Tyr Pro
180 185 190 180 185 190
Asn Arg Tyr Arg Val Ile Lys Glu Val Val Lys Ala Ala Arg Gly AsnAsn Arg Tyr Arg Val Ile Lys Glu Val Val Lys Ala Ala Arg Gly Asn
195 200 205 195 200 205
Arg Lys Glu Met Ile Gln Lys Ile Leu Ser Glu Ile Glu Gly Arg LeuArg Lys Glu Met Ile Gln Lys Ile Leu Ser Glu Ile Glu Gly Arg Leu
210 215 220 210 215 220
Gln Glu Ala Gly Ile Pro Cys Arg Val Ser Gly Arg Glu Lys His LeuGln Glu Ala Gly Ile Pro Cys Arg Val Ser Gly Arg Glu Lys His Leu
225 230 235 240225 230 235 240
Tyr Ser Ile Tyr Cys Lys Met Val Leu Lys Glu Gln Arg Phe His SerTyr Ser Ile Tyr Cys Lys Met Val Leu Lys Glu Gln Arg Phe His Ser
245 250 255 245 250 255
Ile Met Asp Ile Tyr Ala Phe Arg Val Ile Val Asn Asp Ser Asp ThrIle Met Asp Ile Tyr Ala Phe Arg Val Ile Val Asn Asp Ser Asp Thr
260 265 270 260 265 270
Cys Tyr Arg Val Leu Gly Gln Met His Ser Leu Tyr Lys Pro Arg ProCys Tyr Arg Val Leu Gly Gln Met His Ser Leu Tyr Lys Pro Arg Pro
275 280 285 275 280 285
Gly Arg Val Lys Asp Tyr Ile Ala Ile Pro Lys Ala Asn Gly Tyr GlnGly Arg Val Lys Asp Tyr Ile Ala Ile Pro Lys Ala Asn Gly Tyr Gln
290 295 300 290 295 300
Ser Leu His Thr Ser Met Ile Gly Pro His Gly Val Pro Val Glu ValSer Leu His Thr Ser Met Ile Gly Pro His Gly Val Pro Val Glu Val
305 310 315 320305 310 315 320
Gln Ile Arg Thr Glu Asp Met Asp Gln Met Ala Glu Met Gly Val AlaGln Ile Arg Thr Glu Asp Met Asp Gln Met Ala Glu Met Gly Val Ala
325 330 335 325 330 335
Ala His Trp Ala Tyr Lys Glu His Gly Glu Thr Ser Thr Thr Ala GlnAla His Trp Ala Tyr Lys Glu His Gly Glu Thr Ser Thr Thr Ala Gln
340 345 350 340 345 350
Ile Arg Ala Gln Arg Trp Met Gln Ser Leu Leu Glu Leu Gln Gln SerIle Arg Ala Gln Arg Trp Met Gln Ser Leu Leu Glu Leu Gln Gln Ser
355 360 365 355 360 365
Ala Gly Ser Ser Phe Glu Phe Ile Glu Ser Val Lys Ser Asp Leu PheAla Gly Ser Ser Phe Glu Phe Ile Glu Ser Val Lys Ser Asp Leu Phe
370 375 380 370 375 380
Pro Asp Glu Ile Tyr Val Phe Thr Pro Glu Gly Arg Ile Val Glu LeuPro Asp Glu Ile Tyr Val Phe Thr Pro Glu Gly Arg Ile Val Glu Leu
385 390 395 400385 390 395 400
Pro Ala Gly Ala Thr Pro Val Asp Phe Ala Tyr Ala Val His Thr AspPro Ala Gly Ala Thr Pro Val Asp Phe Ala Tyr Ala Val His Thr Asp
405 410 415 405 410 415
Ile Gly His Ala Cys Val Gly Ala Arg Val Asp Arg Gln Pro Tyr ProIle Gly His Ala Cys Val Gly Ala Arg Val Asp Arg Gln Pro Tyr Pro
420 425 430 420 425 430
Leu Ser Gln Pro Leu Thr Ser Gly Gln Thr Val Glu Ile Ile Thr AlaLeu Ser Gln Pro Leu Thr Ser Gly Gln Thr Val Glu Ile Ile Thr Ala
435 440 445 435 440 445
Pro Gly Ala Arg Pro Asn Ala Ala Trp Leu Asn Phe Val Val Ser SerPro Gly Ala Arg Pro Asn Ala Ala Trp Leu Asn Phe Val Val Ser Ser
450 455 460 450 455 460
Lys Ala Arg Ala Lys Ile Arg Gln Leu Leu Lys Asn Leu Lys Arg AspLys Ala Arg Ala Lys Ile Arg Gln Leu Leu Lys Asn Leu Lys Arg Asp
465 470 475 480465 470 475 480
Asp Ser Val Ser Leu Gly Arg Arg Leu Leu Asn His Ala Leu Gly GlyAsp Ser Val Ser Leu Gly Arg Arg Leu Leu Asn His Ala Leu Gly Gly
485 490 495 485 490 495
Ser Arg Lys Leu Asn Glu Ile Pro Gln Glu Asn Ile Gln Arg Glu LeuSer Arg Lys Leu Asn Glu Ile Pro Gln Glu Asn Ile Gln Arg Glu Leu
500 505 510 500 505 510
Asp Arg Met Lys Leu Ala Thr Leu Asp Asp Leu Leu Ala Glu Ile GlyAsp Arg Met Lys Leu Ala Thr Leu Asp Asp Leu Leu Ala Glu Ile Gly
515 520 525 515 520 525
Leu Gly Asn Ala Met Ser Val Val Val Ala Lys Asn Leu Gln His GlyLeu Gly Asn Ala Met Ser Val Val Val Ala Lys Asn Leu Gln His Gly
530 535 540 530 535 540
Asp Ala Ser Ile Pro Pro Ala Thr Gln Ser His Gly His Leu Pro IleAsp Ala Ser Ile Pro Pro Ala Thr Gln Ser His Gly His Leu Pro Ile
545 550 555 560545 550 555 560
Lys Gly Ala Asp Gly Val Leu Ile Thr Phe Ala Lys Cys Cys Arg ProLys Gly Ala Asp Gly Val Leu Ile Thr Phe Ala Lys Cys Cys Arg Pro
565 570 575 565 570 575
Ile Pro Gly Asp Pro Ile Ile Ala His Val Ser Pro Gly Lys Gly LeuIle Pro Gly Asp Pro Ile Ile Ala His Val Ser Pro Gly Lys Gly Leu
580 585 590 580 585 590
Val Ile His His Glu Ser Cys Arg Asn Ile Arg Gly Tyr Gln Lys GluVal Ile His His Glu Ser Cys Arg Asn Ile Arg Gly Tyr Gln Lys Glu
595 600 605 595 600 605
Pro Glu Lys Phe Met Ala Val Glu Trp Asp Lys Glu Thr Ala Gln GluPro Glu Lys Phe Met Ala Val Glu Trp Asp Lys Glu Thr Ala Gln Glu
610 615 620 610 615 620
Phe Ile Thr Glu Ile Lys Val Glu Met Phe Asn His Gln Gly Ala LeuPhe Ile Thr Glu Ile Lys Val Glu Met Phe Asn His Gln Gly Ala Leu
625 630 635 640625 630 635 640
Ala Asn Leu Thr Ala Ala Ile Asn Thr Thr Thr Ser Asn Ile Gln SerAla Asn Leu Thr Ala Ala Ile Asn Thr Thr Thr Ser Asn Ile Gln Ser
645 650 655 645 650 655
Leu Asn Thr Glu Glu Lys Asp Gly Arg Val Tyr Ser Ala Phe Ile ArgLeu Asn Thr Glu Glu Lys Asp Gly Arg Val Tyr Ser Ala Phe Ile Arg
660 665 670 660 665 670
Leu Thr Ala Arg Asp Arg Val His Leu Ala Asn Ile Met Arg Lys IleLeu Thr Ala Arg Asp Arg Val His Leu Ala Asn Ile Met Arg Lys Ile
675 680 685 675 680 685
Arg Val Met Pro Asp Val Ile Lys Val Thr Arg Asn Arg AsnArg Val Met Pro Asp Val Ile Lys Val Thr Arg Asn Arg Asn
690 695 700690 695 700
<210> 17<210> 17
<211> 28<211> 28
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 17<400> 17
cgggatccgaacagcaagagcaggaagc cgggatccgaacagcaagagcaggaagc
28 28
<210> 18<210> 18
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 18<400> 18
tgtggtggatacataaacg tgtggtggatacataaacg
19 19
<210> 19<210> 19
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 19<400> 19
gcaccgtttatgtatccacc gcaccgtttatgtatccacc
20 20
<210> 20<210> 20
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 20<400> 20
aaggaaaaaagcggccgcacgacaaagttcagccaagc aaggaaaaaagcggccgcacgacaaagttcagccaagc
3838
<210> 21<210> 21
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 21<400> 21
ctttcgcaagatgattatgg ctttcgcaagatgattatgg
20 20
<210> 22<210> 22
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 22<400> 22
cacggtattcccgcttcctg caggtattcccgcttcctg
20 20
<210> 23<210> 23
<211> 567<211> 567
<212> ДНК<212> DNA
<213>Escherichiacoli<213>Escherichiacoli
<400> 23<400> 23
atgaatatcactgctactgttcttcttgcgtttggtatgtcgatggatgcatttgctgca atgaatatcactgctactgttcttcttgcgtttggtatgtcgatggatgcatttgctgca
6060
tcaatcggtaaaggtgccaccctccataaaccgaaattttctgaagcattgcgaaccggc tcaatcggtaaaggtgccaccctccataaaccgaaattttctgaagcattgcgaaccggc
120120
cttatttttggtgccgtcgaaaccctgacgccgctgatcggctggggaatgggcatgtta cttatttttggtgccgtcgaaaccctgacgccgctgatcggctggggaatgggcatgtta
180180
gccagccggtttgtccttgaatggaaccactggattgcgtttgtgctgctgatattcctc gccagccggtttgtccttgaatggaaccactggattgcgtttgtgctgctgatattcctc
240240
ggcgggcgaatgattattgagggttttcgtggcgcagatgatgaagatgaagagccgcgc ggcgggcgaatgattattgagggttttcgtggcgcagatgatgaagatgaagagccgcgc
300300
cgtcgacacggtttctggctactggtaaccaccgcgattgccaccagcctggatgccatg cgtcgacacggtttctggctactggtaaccaccgcgattgccaccagcctggatgccatg
360360
gctgtgggtgttggtcttgctttcctgcaggtcaacattatcgcgaccgcattggccatt gctgtgggtgttggtcttgctttcctgcaggtcaacattatcgcgaccgcattggccatt
420420
ggttgtgcaaccttgattatgtcaacattagggatgatggttggtcgctttatcggctca ggttgtgcaaccttgattatgtcaacattagggatgatggttggtcgctttatcggctca
480480
attattgggaaaaaagcggaaattctcggcgggctggtgctgatcggcatcggcgtccag attattgggaaaaaagcggaaattctcggcgggctggtgctgatcggcatcggcgtccag
540540
atcctctggacgcacttccacggttaa atcctctggacgcacttccacggttaa
567567
<210> 24<210> 24
<211> 567<211> 567
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 24<400> 24
atgaatatcactgctactgttcttcttgcgtttggtatgtcgatggatgcatttgctgca atgaatatcactgctactgttcttcttgcgtttggtatgtcgatggatgcatttgctgca
6060
tcaatcggtaaagatgccaccctccataaaccgaaattttctgaagcattgcgaaccggc tcaatcggtaaagatgccaccctccataaaccgaaattttctgaagcattgcgaaccggc
120120
cttatttttggtgccgtcgaaaccctgacgccgctgatcggctggggaatgggcatgtta cttatttttggtgccgtcgaaaccctgacgccgctgatcggctggggaatgggcatgtta
180180
gccagccggtttgtccttgaatggaaccactggattgcgtttgtgctgctgatattcctc gccagccggtttgtccttgaatggaaccactggattgcgtttgtgctgctgatattcctc
240240
ggcgggcgaatgattattgagggttttcgtggcgcagatgatgaagatgaagagccgcgc ggcgggcgaatgattattgagggttttcgtggcgcagatgatgaagatgaagagccgcgc
300300
cgtcgacacggtttctggctactggtaaccaccgcgattgccaccagcctggatgccatg cgtcgacacggtttctggctactggtaaccaccgcgattgccaccagcctggatgccatg
360360
gctgtgggtgttggtcttgctttcctgcaggtcaacattatcgcgaccgcattggccatt gctgtgggtgttggtcttgctttcctgcaggtcaacattatcgcgaccgcattggccatt
420420
ggttgtgcaaccttgattatgtcaacattagggatgatggttggtcgctttatcggctca ggttgtgcaaccttgattatgtcaacattagggatgatggttggtcgctttatcggctca
480480
attattgggaaaaaagcggaaattctcggcgggctggtgctgatcggcatcggcgtccag attattgggaaaaaagcggaaattctcggcgggctggtgctgatcggcatcggcgtccag
540540
atcctctgga cgcacttcca cggttaa atcctctgga cgcacttcca cggttaa
567 567
<210> 25<210> 25
<211> 188<211> 188
<212> БЕЛОК<212> PROTEIN
<213> Escherichia coli<213> Escherichia coli
<400> 25<400> 25
Met Asn Ile Thr Ala Thr Val Leu Leu Ala Phe Gly Met Ser Met AspMet Asn Ile Thr Ala Thr Val Leu Leu Ala Phe Gly Met Ser Met Asp
1 5 10 151 5 10 15
Ala Phe Ala Ala Ser Ile Gly Lys Gly Ala Thr Leu His Lys Pro LysAla Phe Ala Ala Ser Ile Gly Lys Gly Ala Thr Leu His Lys Pro Lys
20 25 30 20 25 30
Phe Ser Glu Ala Leu Arg Thr Gly Leu Ile Phe Gly Ala Val Glu ThrPhe Ser Glu Ala Leu Arg Thr Gly Leu Ile Phe Gly Ala Val Glu Thr
35 40 45 35 40 45
Leu Thr Pro Leu Ile Gly Trp Gly Met Gly Met Leu Ala Ser Arg PheLeu Thr Pro Leu Ile Gly Trp Gly Met Gly Met Leu Ala Ser Arg Phe
50 55 60 50 55 60
Val Leu Glu Trp Asn His Trp Ile Ala Phe Val Leu Leu Ile Phe LeuVal Leu Glu Trp Asn His Trp Ile Ala Phe Val Leu Leu Ile Phe Leu
65 70 75 8065 70 75 80
Gly Gly Arg Met Ile Ile Glu Gly Phe Arg Gly Ala Asp Asp Glu AspGly Gly Arg Met Ile Ile Glu Gly Phe Arg Gly Ala Asp Asp Glu Asp
85 90 95 85 90 95
Glu Glu Pro Arg Arg Arg His Gly Phe Trp Leu Leu Val Thr Thr AlaGlu Glu Pro Arg Arg Arg His Gly Phe Trp Leu Leu Val Thr Thr Ala
100 105 110 100 105 110
Ile Ala Thr Ser Leu Asp Ala Met Ala Val Gly Val Gly Leu Ala PheIle Ala Thr Ser Leu Asp Ala Met Ala Val Gly Val Gly Leu Ala Phe
115 120 125 115 120 125
Leu Gln Val Asn Ile Ile Ala Thr Ala Leu Ala Ile Gly Cys Ala ThrLeu Gln Val Asn Ile Ile Ala Thr Ala Leu Ala Ile Gly Cys Ala Thr
130 135 140 130 135 140
Leu Ile Met Ser Thr Leu Gly Met Met Val Gly Arg Phe Ile Gly SerLeu Ile Met Ser Thr Leu Gly Met Met Val Gly Arg Phe Ile Gly Ser
145 150 155 160145 150 155 160
Ile Ile Gly Lys Lys Ala Glu Ile Leu Gly Gly Leu Val Leu Ile GlyIle Ile Gly Lys Lys Ala Glu Ile Leu Gly Gly Leu Val Leu Ile Gly
165 170 175 165 170 175
Ile Gly Val Gln Ile Leu Trp Thr His Phe His GlyIle Gly Val Gln Ile Leu Trp Thr His Phe His Gly
180 185 180 185
<210> 26<210> 26
<211> 188<211> 188
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<400> 26<400> 26
Met Asn Ile Thr Ala Thr Val Leu Leu Ala Phe Gly Met Ser Met AspMet Asn Ile Thr Ala Thr Val Leu Leu Ala Phe Gly Met Ser Met Asp
1 5 10 151 5 10 15
Ala Phe Ala Ala Ser Ile Gly Lys Asp Ala Thr Leu His Lys Pro LysAla Phe Ala Ala Ser Ile Gly Lys Asp Ala Thr Leu His Lys Pro Lys
20 25 30 20 25 30
Phe Ser Glu Ala Leu Arg Thr Gly Leu Ile Phe Gly Ala Val Glu ThrPhe Ser Glu Ala Leu Arg Thr Gly Leu Ile Phe Gly Ala Val Glu Thr
35 40 45 35 40 45
Leu Thr Pro Leu Ile Gly Trp Gly Met Gly Met Leu Ala Ser Arg PheLeu Thr Pro Leu Ile Gly Trp Gly Met Gly Met Leu Ala Ser Arg Phe
50 55 60 50 55 60
Val Leu Glu Trp Asn His Trp Ile Ala Phe Val Leu Leu Ile Phe LeuVal Leu Glu Trp Asn His Trp Ile Ala Phe Val Leu Leu Ile Phe Leu
65 70 75 8065 70 75 80
Gly Gly Arg Met Ile Ile Glu Gly Phe Arg Gly Ala Asp Asp Glu AspGly Gly Arg Met Ile Ile Glu Gly Phe Arg Gly Ala Asp Asp Glu Asp
85 90 95 85 90 95
Glu Glu Pro Arg Arg Arg His Gly Phe Trp Leu Leu Val Thr Thr AlaGlu Glu Pro Arg Arg Arg His Gly Phe Trp Leu Leu Val Thr Thr Ala
100 105 110 100 105 110
Ile Ala Thr Ser Leu Asp Ala Met Ala Val Gly Val Gly Leu Ala PheIle Ala Thr Ser Leu Asp Ala Met Ala Val Gly Val Gly Leu Ala Phe
115 120 125 115 120 125
Leu Gln Val Asn Ile Ile Ala Thr Ala Leu Ala Ile Gly Cys Ala ThrLeu Gln Val Asn Ile Ile Ala Thr Ala Leu Ala Ile Gly Cys Ala Thr
130 135 140 130 135 140
Leu Ile Met Ser Thr Leu Gly Met Met Val Gly Arg Phe Ile Gly SerLeu Ile Met Ser Thr Leu Gly Met Met Val Gly Arg Phe Ile Gly Ser
145 150 155 160145 150 155 160
Ile Ile Gly Lys Lys Ala Glu Ile Leu Gly Gly Leu Val Leu Ile GlyIle Ile Gly Lys Lys Ala Glu Ile Leu Gly Gly Leu Val Leu Ile Gly
165 170 175 165 170 175
Ile Gly Val Gln Ile Leu Trp Thr His Phe His GlyIle Gly Val Gln Ile Leu Trp Thr His Phe His Gly
180 185 180 185
<210> 27<210> 27
<211> 28<211> 28
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 27<400> 27
cgggatccct tcgccaatgt ctggattg cgggatccct tcgccaatgt ctggattg
28 28
<210> 28<210> 28
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 28<400> 28
atggagggtg gcatctttac atggagggtg gcatctttac
20 20
<210> 29<210> 29
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 29<400> 29
tgcatcaatc ggtaaagatg tgcatcaatc ggtaaagatg
20 20
<210> 30<210> 30
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 30<400> 30
aaggaaaaaa gcggccgcca actccgcact ctgctgta aaggaaaaaa gcggccgcca actccgcact ctgctgta
38 38
<210> 31<210> 31
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 31<400> 31
ccatcacggcttgttgttc ccaccacggcttgttgttc
19 19
<210> 32<210> 32
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<400> 32<400> 32
acgaaaaccctcaataatc acgaaaaccctcaataatc
19 19
<---<---
Claims (13)
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910804688.1 | 2019-08-28 | ||
CN201910804679.2 | 2019-08-28 | ||
CN201910926295.8 | 2019-09-27 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2023120081A Division RU2023120081A (en) | 2019-08-28 | 2020-08-27 | RECOMBINANT STRAIN BASED ON ESCHERICHIA COLI, METHOD OF ITS CONSTRUCTION AND ITS APPLICATION |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2021140066A RU2021140066A (en) | 2023-09-28 |
RU2813283C2 true RU2813283C2 (en) | 2024-02-09 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2244007C2 (en) * | 2002-02-27 | 2005-01-10 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Method for preparing l-threonine, strain escherichia coli as producer of threonine (variants) |
CN107267568A (en) * | 2017-07-21 | 2017-10-20 | 徐州工程学院 | Utilize method of the spoT gene deletion strains by fermenting and producing L amino acid |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2244007C2 (en) * | 2002-02-27 | 2005-01-10 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Method for preparing l-threonine, strain escherichia coli as producer of threonine (variants) |
CN107267568A (en) * | 2017-07-21 | 2017-10-20 | 徐州工程学院 | Utilize method of the spoT gene deletion strains by fermenting and producing L amino acid |
Non-Patent Citations (2)
Title |
---|
Escherichia coli str. K-12 substr. MG1655 strain K-12 chromosome, complete genome. Найдено онлайн: https://www.ncbi.nlm.nih.gov/nucleotide/CP032667.1?report=genbank&log$=nucltop&blast_rank=70&RID=81BFDBKF013 Дата обращения 07.06.2023. * |
база данных GenBank: * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113667682B (en) | YH66-RS11190 gene mutant and application thereof in preparation of L-valine | |
CN110592109B (en) | Recombinant strain modified by spoT gene and construction method and application thereof | |
CN110846333B (en) | Recombinant strain modified by deoB gene and construction method and application thereof | |
CN110592084B (en) | Recombinant strain transformed by rhtA gene promoter, construction method and application thereof | |
CN111471693B (en) | Corynebacterium glutamicum for producing lysine and construction method and application thereof | |
WO2023231547A1 (en) | Ncgl2747 gene mutant and use thereof in preparation of l-lysine | |
RU2813283C2 (en) | Recombinant strain based on escherichia coli, a method of its construction and use | |
CN114181288B (en) | Process for producing L-valine, gene used therefor and protein encoded by the gene | |
CN110564742B (en) | Recombinant strain modified by yebN gene and construction method and application thereof | |
CN110804617B (en) | KdtA gene modified recombinant strain and construction method and application thereof | |
CN114540399A (en) | Method for preparing L-valine and gene mutant and biological material used by same | |
RU2813511C2 (en) | Recombinant strain based on escherichia coli and method of its construction and use | |
JP7471395B2 (en) | Recombinant strains based on Escherichia coli and methods for their construction and use | |
JP7461463B2 (en) | Recombinant strains based on Escherichia coli and methods for their construction and use | |
US20220324919A1 (en) | Escherichia coli-based recombinant strain, construction method therefor and use thereof | |
RU2792116C2 (en) | Method for production of l-lysin by modifying aconitase gene and/or its regulative elements | |
CN117551708A (en) | Method for preparing L-glutamic acid and related BBD29_13530 gene mutant thereof | |
CN114315999A (en) | LeuD protein mutant and related biological material and application thereof in preparation of L-valine | |
CN115820706A (en) | Galactose-1-uridine phosphate acyltransferase mutant and application thereof in preparation of L-lysine | |
KR100629773B1 (en) | Vectors containing guaA gene expressible in Escherichia coli Escherichia cells harboring the same and processes for accumulating 5'-guanylic acid synthetase in a medium using them | |
CN114751966A (en) | Application of YH66_04585 protein and related biological materials thereof in improving arginine yield | |
CN114507273A (en) | Application of YH66_07020 protein and related biological material thereof in improving yield of arginine | |
CN116904418A (en) | yfdH gene mutant and application thereof in preparation of L-valine | |
CN114410615A (en) | YH66_00525 protein and application of encoding gene thereof in regulation and control of bacterial arginine yield | |
CN114292315A (en) | ppc mutant and application thereof in preparation of L-valine |