KR20230145055A - L-글루탐산 생산성이 향상된 균주 및 이의 구성 방법및 적용 - Google Patents
L-글루탐산 생산성이 향상된 균주 및 이의 구성 방법및 적용 Download PDFInfo
- Publication number
- KR20230145055A KR20230145055A KR1020237025466A KR20237025466A KR20230145055A KR 20230145055 A KR20230145055 A KR 20230145055A KR 1020237025466 A KR1020237025466 A KR 1020237025466A KR 20237025466 A KR20237025466 A KR 20237025466A KR 20230145055 A KR20230145055 A KR 20230145055A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- bbd29
- amino acid
- sequence
- glutamic acid
- Prior art date
Links
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 title claims abstract description 171
- 229960002989 glutamic acid Drugs 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims description 54
- 239000000203 mixture Substances 0.000 title description 14
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 141
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 88
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 88
- 239000002157 polynucleotide Substances 0.000 claims abstract description 88
- 230000035772 mutation Effects 0.000 claims abstract description 66
- 241000186226 Corynebacterium glutamicum Species 0.000 claims abstract description 56
- 238000004519 manufacturing process Methods 0.000 claims abstract description 37
- 239000002773 nucleotide Substances 0.000 claims abstract description 24
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 24
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims abstract description 20
- 229930024421 Adenine Natural products 0.000 claims abstract description 9
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims abstract description 9
- 229960000643 adenine Drugs 0.000 claims abstract description 9
- 108020004414 DNA Proteins 0.000 claims description 100
- 241000894006 Bacteria Species 0.000 claims description 71
- 239000013598 vector Substances 0.000 claims description 61
- 244000005700 microbiome Species 0.000 claims description 59
- 102000053602 DNA Human genes 0.000 claims description 40
- 230000014509 gene expression Effects 0.000 claims description 38
- 102000004169 proteins and genes Human genes 0.000 claims description 32
- 108091026890 Coding region Proteins 0.000 claims description 22
- 150000001413 amino acids Chemical group 0.000 claims description 22
- 150000007523 nucleic acids Chemical class 0.000 claims description 22
- 102000039446 nucleic acids Human genes 0.000 claims description 21
- 108020004707 nucleic acids Proteins 0.000 claims description 21
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 20
- 229930182817 methionine Natural products 0.000 claims description 14
- 241000186216 Corynebacterium Species 0.000 claims description 10
- 229960000310 isoleucine Drugs 0.000 claims description 10
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 10
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 9
- 229940024606 amino acid Drugs 0.000 claims description 8
- 239000012620 biological material Substances 0.000 claims description 7
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 claims description 6
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 claims description 6
- 238000006467 substitution reaction Methods 0.000 claims description 6
- 238000012258 culturing Methods 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 125000000539 amino acid group Chemical group 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 238000010362 genome editing Methods 0.000 claims description 3
- 241000186146 Brevibacterium Species 0.000 claims description 2
- 241001517047 Corynebacterium acetoacidophilum Species 0.000 claims description 2
- 241000186145 Corynebacterium ammoniagenes Species 0.000 claims description 2
- 241000186248 Corynebacterium callunae Species 0.000 claims description 2
- 241000319304 [Brevibacterium] flavum Species 0.000 claims description 2
- 108020001507 fusion proteins Proteins 0.000 claims description 2
- 102000037865 fusion proteins Human genes 0.000 claims description 2
- 238000004321 preservation Methods 0.000 claims description 2
- 239000013612 plasmid Substances 0.000 description 56
- 239000012634 fragment Substances 0.000 description 47
- 125000003275 alpha amino acid group Chemical group 0.000 description 35
- 239000002609 medium Substances 0.000 description 26
- 235000018102 proteins Nutrition 0.000 description 19
- 210000004027 cell Anatomy 0.000 description 17
- 229930027917 kanamycin Natural products 0.000 description 17
- 229960000318 kanamycin Drugs 0.000 description 17
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 17
- 229930182823 kanamycin A Natural products 0.000 description 17
- 238000010276 construction Methods 0.000 description 14
- 238000000855 fermentation Methods 0.000 description 14
- 230000004151 fermentation Effects 0.000 description 14
- 238000003860 storage Methods 0.000 description 14
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 12
- 210000000349 chromosome Anatomy 0.000 description 12
- 235000013922 glutamic acid Nutrition 0.000 description 12
- 239000004220 glutamic acid Substances 0.000 description 12
- 238000012408 PCR amplification Methods 0.000 description 11
- 238000002703 mutagenesis Methods 0.000 description 9
- 231100000350 mutagenesis Toxicity 0.000 description 9
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 8
- 238000000137 annealing Methods 0.000 description 8
- 238000004925 denaturation Methods 0.000 description 8
- 230000036425 denaturation Effects 0.000 description 8
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 8
- 238000002744 homologous recombination Methods 0.000 description 8
- 230000006801 homologous recombination Effects 0.000 description 8
- 238000012257 pre-denaturation Methods 0.000 description 8
- 230000006798 recombination Effects 0.000 description 8
- 238000005215 recombination Methods 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 230000029087 digestion Effects 0.000 description 7
- 238000001962 electrophoresis Methods 0.000 description 7
- 239000001963 growth medium Substances 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 108010079364 N-glycylalanine Proteins 0.000 description 6
- 235000001014 amino acid Nutrition 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 230000000813 microbial effect Effects 0.000 description 6
- 230000002018 overexpression Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 210000004881 tumor cell Anatomy 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 235000011194 food seasoning agent Nutrition 0.000 description 4
- 239000007789 gas Substances 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000002246 antineoplastic agent Substances 0.000 description 3
- 229940041181 antineoplastic drug Drugs 0.000 description 3
- 230000037429 base substitution Effects 0.000 description 3
- 229960005091 chloramphenicol Drugs 0.000 description 3
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 3
- 239000002537 cosmetic Substances 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 229940049906 glutamate Drugs 0.000 description 3
- 229930195712 glutamate Natural products 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 238000007857 nested PCR Methods 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- -1 sodium monolauryl phthalate glutamate Chemical compound 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 2
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 2
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 2
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 2
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 2
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 2
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 2
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- YEVZMOUUZINZCK-LKTVYLICSA-N Ala-Glu-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YEVZMOUUZINZCK-LKTVYLICSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 2
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 2
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 2
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 2
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 2
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- UBEKKPOFLCVTEZ-UHFFFAOYSA-N Arg-Lys-Val-Ser Chemical compound OCC(C(O)=O)NC(=O)C(C(C)C)NC(=O)C(CCCCN)NC(=O)C(N)CCCN=C(N)N UBEKKPOFLCVTEZ-UHFFFAOYSA-N 0.000 description 2
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 2
- UGZUVYDKAYNCII-ULQDDVLXSA-N Arg-Phe-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UGZUVYDKAYNCII-ULQDDVLXSA-N 0.000 description 2
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 2
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 2
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 2
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 2
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 2
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 2
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 2
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 2
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 2
- LGYZYFFDELZWRS-DCAQKATOSA-N Glu-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O LGYZYFFDELZWRS-DCAQKATOSA-N 0.000 description 2
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 2
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 2
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 2
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 2
- PHONXOACARQMPM-BQBZGAKWSA-N Gly-Ala-Met Chemical compound [H]NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O PHONXOACARQMPM-BQBZGAKWSA-N 0.000 description 2
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 2
- PEZZSFLFXXFUQD-XPUUQOCRSA-N Gly-Cys-Val Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O PEZZSFLFXXFUQD-XPUUQOCRSA-N 0.000 description 2
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 2
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 101000829171 Hypocrea virens (strain Gv29-8 / FGSC 10586) Effector TSP1 Proteins 0.000 description 2
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 2
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 2
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- GPXFZVUVPCFTMG-AVGNSLFASA-N Leu-Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C GPXFZVUVPCFTMG-AVGNSLFASA-N 0.000 description 2
- XYUBOFCTGPZFSA-WDSOQIARSA-N Leu-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 XYUBOFCTGPZFSA-WDSOQIARSA-N 0.000 description 2
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 2
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 2
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 2
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 2
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 2
- BLIPQDLSCFGUFA-GUBZILKMSA-N Met-Arg-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O BLIPQDLSCFGUFA-GUBZILKMSA-N 0.000 description 2
- MTBVQFFQMXHCPC-CIUDSAMLSA-N Met-Glu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MTBVQFFQMXHCPC-CIUDSAMLSA-N 0.000 description 2
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 2
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 2
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 2
- 108010021466 Mutant Proteins Proteins 0.000 description 2
- 102000008300 Mutant Proteins Human genes 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 2
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 2
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 2
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 2
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 2
- RORUIHAWOLADSH-HJWJTTGWSA-N Phe-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 RORUIHAWOLADSH-HJWJTTGWSA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 2
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 2
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- AUQGUYPHJSMAKI-CYDGBPFRSA-N Pro-Ile-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 AUQGUYPHJSMAKI-CYDGBPFRSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 2
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 2
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 2
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 2
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 2
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 2
- HAYADTTXNZFUDM-IHRRRGAJSA-N Ser-Tyr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HAYADTTXNZFUDM-IHRRRGAJSA-N 0.000 description 2
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 2
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 2
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 2
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- XGJLNBNZNMVJRS-NRPADANISA-N Val-Glu-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O XGJLNBNZNMVJRS-NRPADANISA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 2
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 2
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012262 fermentative production Methods 0.000 description 2
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 210000000653 nervous system Anatomy 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 101150028074 2 gene Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 101100268670 Caenorhabditis elegans acc-3 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 239000004278 EU approved seasoning Substances 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000724791 Filamentous phage Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 1
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108010020346 Polyglutamic Acid Proteins 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000012271 agricultural production Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 210000004720 cerebrum Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229940044683 chemotherapy drug Drugs 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000003974 emollient agent Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 239000000417 fungicide Substances 0.000 description 1
- 229920000370 gamma-poly(glutamate) polymer Polymers 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 235000018343 nutrient deficiency Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 229960004793 sucrose Drugs 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 238000005891 transamination reaction Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/34—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/14—Glutamic acid; Glutamine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/15—Corynebacterium
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/20—Fertilizers of biological origin, e.g. guano or fertilizers made from animal corpses
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 L-글루탐산 생산성이 향상된 균주 및 이의 제조 방법 및 적용를 개시한다. 본 발명은 코리네박테리움 글루타미쿰의 야생형 BBD29_00405 유전자에 점 돌연변이를 도입함으로써, SEQ ID NO:1에 표시된 제 597 부위의 염기가 구아닌(G)에서 아데닌(A)으로 돌연변이된 뉴클레오타이드 서열을 얻는다. 본 발명은 또한 해당 폴리뉴클레오타이드 서열을 L-글루탐산을 생산하는 코리네박테리움 글루타미쿰에 도입하여 얻은 재조합 균주, 즉 점 돌연변이를 포함하는 BBD29_00405 유전자를 포함하는 재조합 균주를 제공하며, 얻어진 균주는 변형되지 않은 균주에 비해 고농도의 L-글루탐산을 생산하는 데 유리하다.
Description
본 발명은 유전공학 및 미생물 기술 분야에 속하며, 특히 L-글루탐산 생산성이 향상된 균주 및 이의 구성 방법 및 적용에 관한 것이다.
화학 명칭이 L-2-아미노글루타르산으로 알려진 L-글루탐산은 분자식이 C5H9O4N이고 분자량이 147.13이다. L-글루탐산은 비필수 아미노산이다. 생물 유기체에 존재하는 글루탐산은 모두 L-형 글루탐산이다. 또한 L-글루탐산은 조미료의 전구체 물질이다. 조미료는 섭취된 후 위장에서 글루탐산으로 전환되어 소화 및 흡수되어 단백질 합성에 참여할 수 있으며, 트랜스아미네이션을 통해 다른 아미노산을 합성하는 데 사용할 수 있고, 영양가치가 비교적 높다. 식품에 널리 사용되는 것 외에도 의약품, 화장품 및 농업 생산에도 사용된다. 인체의 모든 주요 기관 중에서 글루탐산염은 대뇌에 함량이 가장 풍부하며, 동시에 글루탐산은 인간의 대뇌 대사에 관여하는 유일한 아미노산으로 신경계통의 기능 유지에 중요한 역할을 한다. 따라서, 신경 장애가 있는 사람들은 글루탐산 섭취를 늘리면 신경계통의 기능을 향상시킬 수 있다. 화장품 산업에서 글루탐산은 폴리 글루탐산 나트륨 합성에 사용된다. 이 물질은 흡습성이 매우 강하기 때문에 에몰리언트로 사용될 수 있다. 글루탐산은 또한 염화 라우로프탈레인과 결합하여 화장품 산업에서 널리 사용되는 소듐모노라우릴프탈레이트글루타메이트을 생성 할 수 있다. 글루탐산은 주로 농업에서 글루탐산 케톤과 같은 살균제를 생산하는 데 사용된다. 글루탐산은 또한 작물의 질소, 인 및 칼륨 흡수를 촉진하기 위해 비료를 주는 과정에 비료 운반체로 사용된다.
1956년 자연계에서 글루탐산을 생산하는 박테리아, 즉 코리네박테리움 글루타미쿰이 분리되어 조미료 생산 역사에 중대한 변혁을 가져왔다. 1957년 발효 방법으로 조미료를 생산하는 시대가 시작되었다. 발효 방법으로 글루탐산을 생산하는 데 성공한 것은 전체 발효 산업에 위대한 창안이며, 동시에 다른 발효 제품의 연구와 생산도 크게 촉진시켰다. 산업 발효에 있어서, 발효 생산 수준을 결정하는 주요 요인은 균주의 성능, 발효 공정 및 하류 추출 공정 등이다. 이러한 요인 가운데서 균주의 산 생산 수준은 발효의 성공 또는 실패의 관건적인 내부 요인이다. 좋은 균주를 선택하는 것은 여전히 높은 L- 글루탐산 생산의 핵심이며, 전통적인 돌연변이 유발 기술과 결합 된 높은 처리량 스크리닝 기술의 개발에 따라, 알려지지 않은 특성을 가진 높은 수율의 L- 글루탐산 돌연변이 균주를 찾는 데 도움이 된다. 이러한 돌연변이 균주는 L-글루탐산 대사 경로의 한 지점의 활성을 변경하거나 전체 경로의 재조합 통합을 변경하여 산 생산량을 개선할 수 있다.
L-글루탐산 생산량을 높일 수 있는 균주를 일부 선별하였지만, 날로 증가하는 수요를 충족시키기 위해서는 여전히 L-글루탐산 생산이 높은 돌연변이 균주를 더 많이 찾을 필요가 있다.
종래 기술의 결함에 대응하여, 본 발명은 폴리 뉴클레오티드 및 상기 폴리 뉴클레오티드를 포함하는 재조합 균주를 제공하며, 또한 재조합 균주를 사용하여 박테리아의 L-글루탐산 생산 능력을 향상시킨다. 상술한 목적을 구현하기 위해, 본 발명의 발명자는 L-글루탐산 생산 능력이 있는 코리네박테리움 글루타미쿰 ATCC13869 게놈(GenBank: CP016335.1)의 BBD29_00405 유전자(GenBank: ANU32350.1)는 변형하거나 이의 발현을 개선하여 L-글루탐산 생산이 향상된 재조합 균주를 얻을 수 있으며, 변형되지 않은 야생형 균주에 비해 재조합 균주의 L-글루탐산 생산 능력이 더 강하다는 것을 발견하였다.
본 발명은 다음과 같은 기술 방안을 사용하여 구현된다.
본 발명의 일 측면은, SEQ ID NO: 3에 표시된 바와 같은 아미노산 서열을 코딩하는 폴리뉴클레오티드의 발현이 개선된 L-글루탐산을 생성하는 박테리아를 제공한다. 본 발명에 따르면, 상기 개선된 발현은 상기 폴리뉴클레오티드의 발현이 향상되거나, SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드에 점 돌연변이가 있거나, SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드에 점 돌연변이가 있고 발현이 향상되는 것을 특징으로 한다.
상기 SEQ ID NO: 3의 아미노산 서열은 유전자 BBD29_00405에 의해 코딩된 단백질이다.
상기 박테리아는 변형되지 않은 균주에 비해 L-글루탐산 생산 능력이 향상된다.
본 발명에서, "L-글루탐산 생산 능력을 가진 박테리아"라는 용어는 박테리아가 배지에서 배양될 때 L-글루탐산을 수집할 수 있을 정도로 배지 및/또는 박테리아의 세포 내에서 목적 L-글루탐산을 생산 및 축적하는 능력을 가진 박테리아를 지칭한다. L-글루탐산 생산 능력이 있는 박테리아는 변형되지 않은 균주에서 얻을 수 있는 양보다 더 많은 양으로 배지 및/또는 박테리아의 세포에 목적 L-글루탐산을 축적할 수 있는 박테리아 일 수 있다.
"변형되지 않은 균주"라는 용어는 아직 특정한 특성을 가지도록 변형되지 않은 대조 균주를 의미한다. 즉, 변형되지 않은 균주의 실예로는 야생형 균주 및 모계 균주가 포함된다.
본 발명에서, 달리 명시되지 않는 한, "L-글루탐산"이라는 용어는 유리 형태의 L-글루탐산, 이의 염 또는 이의 혼합물을 지칭한다.
상기 폴리뉴클레오티드는 SEQ ID NO: 3의 아미노산 서열과 약 90% 이상, 약 92% 이상, 약 95% 이상, 약 97% 이상, 약 98% 이상 또는 약 99% 이상의 서열 상동성이 있는 아미노산 서열을 코딩할 수 있다. 본 명세서에서 사용되는 "상동성"이라는 용어는 두 가지 폴리뉴클레오티드 또는 두 가지 폴리펩티드 모듈 사이의 백분율 동일성을 의미한다. 한 모듈과 다른 모듈 사이의 서열 상동성은 본 영역에 알려진 방법을 사용하여 측정할 수 있다. 예를 들어, 이러한 서열 상동성은 BLAST 알고리즘에 의해 측정할 수 있다.
폴리뉴클레오티드의 발현은, 발현 조절 서열의 치환 또는 돌연변이, 폴리뉴클레오티드 서열에 돌연변이 도입, 염색체 삽입 또는 벡터 도입을 통한 폴리뉴클레오티드의 복사 수 증가 또는 이의 조합 등에 의해 강화될 수 있다.
폴리뉴클레오티드의 발현 조절 서열은 변형될 수 있다. 발현 조절 서열은 그와 조작 가능하게 연결된 폴리뉴클레오티드의 발현을 제어하며, 예를 들어 프로모터, 터미네이터, 인핸서 및 사일런서 등을 포함할 수 있다. 폴리뉴클레오티드는 시작 코돈이 변화할 수 있다. 폴리뉴클레오티드는 염색체의 특정 부위에 통합되어 복제 수를 증가시킬 수 있다. 본 명세서에서 특정 부위는 트랜스포존 부위 또는 유전자 간 부위를 포함할 수 있다. 또한, 폴리뉴클레오티드를 발현 벡터에 통합하여 상기 발현 벡터를 숙주 세포에 도입하여, 복제 수를 증가시킬 수 있다.
본 발명의 일 실시예에서, 미생물 염색체의 특정 부위에 점 돌연변이가 있는 폴리뉴클레오티드 또는 폴리뉴클레오티드를 통합함으로써, 복제 수를 증가시킨다.
본 발명의 일 실시예에서, 상기 핵산 서열은 프로모터 서열이 있는 폴리뉴클레오티드 또는 프로모터 서열을 가진 점 돌연변이가 있는 폴리뉴클레오티드를 미생물 염색체의 특정 부위에 통합시킴으로써 과발현된다.
본 발명의 일 실시예에서, 폴리뉴클레오티드 또는 점 돌연변이가 있는 폴리뉴클레오티드를 발현 벡터에 통합하고, 상기 발현 벡터를 숙주 세포에 도입하여, 복제 수를 증가시킨다.
본 발명의 일 실시예에서, 프로모터 서열이 있는 폴리뉴클레오티드 또는 프로모터 서열이 있는 점 돌연변이를 가진 폴리뉴클레오티드를 발현 벡터에 통합하고, 상기 발현 벡터를 숙주 세포에 도입하여 상기 아미노산 서열을 과발현시킨다.
본 발명의 특정 실시예에서, 상기 폴리뉴클레오드티드는 SEQ ID NO: 1의 뉴클레오드 서열을 포함할 수 있다.
본 발명의 일 실시예에서, SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드는 SEQ ID NO: 3의 아미노산 서열의 제 199 부위에서 메티오닌이 다른 아미노산으로 치환되도록 하는 점 돌연변이가 있다.
본 발명에 따르면, 제 199 부위의 메티오닌이 이소류신으로 치환되는 것이바람직하다.
본 발명에 따른 SEQ ID NO: 3에 표시된 아미노산 서열에서 제 199 부위의 메티오닌을 이소류신으로 치환한 후의 아미노산 서열은 SEQ ID NO: 4에 표시된 바와 같다.
본 발명의 일 실시예에서, 상기 점 돌연변이가 있는 폴리뉴클레오티드 서열은, SEQ ID NO: 1에 표시된 폴리뉴클레오티드 서열에서 제 597 부위의 염기에 돌연변이가 발생하여 형성된 것이다.
본 발명에 따르면, 상기 돌연변이는 SEQ ID NO: 1에 표시된 폴리뉴클레오티드 서열의 제 597 부위에서 염기 구아닌(G)이 아데닌(A)으로 돌연변이되는 것을 포함한다.
본 발명의 일 실시예에서, 상기 점 돌연변이가 있는 폴리뉴클레오티드 서열은 SEQ ID NO: 2에 표시된 폴리뉴클레오티드 서열을 포함한다.
본 명세서에서 사용되는 "작동 가능한 연결"이라는 용어는 조절 서열과 폴리뉴클레오티드 서열 사이의 기능적 연결을 의미하며, 이로부터 조절 서열이 폴리뉴클레오티드 서열의 전사 및/또는 번역을 제어한다. 조절 서열은 폴리뉴클레오티드의 발현 수준을 증가시킬 수 있는 강한 프로모터일 수 있다. 조절 서열은 코리네박테리움 속에 속하는 미생물에서 유래한 프로모터일 수도 있고, 또는 다른 미생물에서 유래한 프로모터일 수 있다. 예를 들어, 프로모터는 트릭(trc) 프로모터, 갭(gap) 프로모터, 타크(tac) 프로모터, T7 프로모터, 락(lac) 프로모터, 트립(trp) 프로모터, 아라바드(araBAD) 프로모터 또는 cj7 프로모터일 수 있다.
본 발명의 구체적인 일 실시예에서, 상기 프로모터는 SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드(BBD29_00405)의 프로모터이다.
본 명세서에서 사용되는 바와 같이, "벡터"라는 용어는 유전자를 함유한 조절 서열과 유전자 서열을 가리키며, 적절한 숙주 세포에서 표적 유전자를 발현하도록 구성된 폴리뉴클레오티드 구조체를 지칭한다. 또는, 벡터는 숙주 세포에 벡터를 도입한 결과 숙주 세포 게놈 내의 내인성 유전자의 조절 서열이 변경되거나 발현될 수 있는 표적 유전자가 숙주 게놈의 특정 부위에 삽입될 수 있도록 상동 재조합에 사용될 수 있는 서열을 포함하는 폴리뉴클레오티드 구조체를 지칭할 수도 있다. 이와 관련하여, 본 발명에 사용되는 벡터는 숙주 세포에 벡터의 도입 또는 숙주 세포의 염색체에 벡터의 삽입을 결정하기 위한 선택 마커를 더 포함할 수 있다. 선택 마커는 의약품 내성, 영양 결핍형, 세포 독성 물질에 대한 내성 또는 표면 단백질의 발현과 같은 선택 가능한 표현형을 부여하는 마커를 포함할 수 있다. 이러한 선택적 약제로 처리된 환경에서는 선택 마커만 발현하는 세포가 생존하거나 다른 표현형 특성을 나타낼 수 있기 때문에 형질 전환된 세포를 선택할 수 있다. 본 명세서에 기술된 벡터는 당업자에게 알려져 있으며, 플라스미드, 파지(예를 들어, 감마 파지 또는 M13 필라멘트 파지 등), 점막(즉, 코스 플라스미드) 또는 바이러스 벡터를 포함하지만 이에 국한되지 않는다.
본 발명의 일부 구체적인 실시예에서, 사용되는 벡터는 pK18mobsacB 플라스미드, pXMJ19 플라스미드이다.
본 명세서에서 사용되는 바와 같이, "형질전환"이라는 용어는 폴리뉴클레오티드를 숙주 세포에 도입하여, 폴리뉴클레오티드가 게놈 외 구성 요소로서 또는 숙주 세포의 게놈에 삽입되어 복제될 수 있도록 하는 것을 가리킨다. 본 발명에 사용되는 벡터를 형질전환하는 방법에는 세포에 핵산을 도입하는 방법이 포함될 수 있다. 또는, 관련 기술에 개시된 바와 같이, 숙주 세포에 따라 전기 펄스 방법을 실행할 수 있다.
본 명세서에서, 상기 미생물은 효모, 박테리아, 조류 또는 진균일 수 있다.
본 발명에 따르면, 상기 박테리아는 코리네박테리움 아세토아시도필룸 (Corynebacterium acetoacidophilum), 코리네박테리움 아세토글루타미쿰 (Corynebacterium acetoglutamicum), 코리네박테리움 칼루내(Corynebacterium callunae), 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum), 브레비박테리움 플라븀 (Brevibacterium flavum), 브레비박테리움 락토퍼멘텀(Brevibacterium lactofermentum ), 코리네박테리움 암모니아게네스 (Corynebacterium ammoniagenes), 코리네박테리움 페키넨스(Corynebacterium pekinense), 브레비박테리움 사카로리티쿰(Brevibacterium saccharolyticum), 브레비박테리움 로세움 (Brevibacterium roseum) 브레비박테리움 티오제니탈리스(Brevibacterium thiogenitalis)과 같은 코리네박테리움 속에 속하는 미생물일 수 있다.
본 발명의 일 실시예에서, 코리네박테리움 속에 속하는 상기 미생물은 코리네박테리움 글루타미쿰 ATCC 13869이다.
본 발명의 일 실시예에서, 글루타미쿰 속에 속하는 상기 미생물은 코리네박테리움 글루타미쿰 YPGLU001로서, 2020년 11월 23일에 중국 미생물 균주 보관 관리 위원회 일반 미생물학 센터에 보관되었으며, 주소는 베이징 차오양구 베이천서로 1호원 3호이고, 우편번호는 100101이고, 보관 기관의 약칭은 CGMCC이고, 생물 보관 번호는 CGMCC No. 21220이다.
본 발명의 제2 측면은 폴리뉴클레오티드 서열, 상기 폴리뉴클레오티드 서열에 의해 코딩되는 아미노산 서열, 상기 폴리뉴클레오티드 서열을 포함하는 재조합 벡터, 상기 폴리뉴클레오티드 서열을 포함하는 재조합 균주를 제공한다.
본 발명에 따르면, 상기 폴리뉴클레오티드 서열에는 SEQ ID NO: 3에 표시된 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드가 포함되며, 상기 서열의 제 199 부위에서 메티오닌이 다른 아미노산으로 치환된다.
본 발명에 따르면, 제 199 부위의 메티오닌이 이소류신으로 치환되는 것이 바람직하다.
본 발명에 따르면, SEQ ID NO: 3에 표시된 아미노산 서열은, 그 중 제 199 부위의 메티오닌이 SEQ ID NO: 4에 표시된 바와 같은 이소류신으로 치환된다.
본 발명에 따르면, SEQ ID NO: 3에 표시된 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열은 SEQ ID NO: 1에 표시된 바와 같은 폴리뉴클레오티드 서열을 포함하는 것이 바람직하다.
본 발명의 일 실시예에서, 상기 폴리뉴클레오티드 서열은 SEQ ID NO: 1에 표시된 폴리뉴클레오티드 서열의 제 597 부위에서 염기에 돌연변이가 발생하여 형성된 것이다.
본 발명에 따르면, 상기 돌연변이는 상기 부위의 염기/뉴클레오티드의 변화를 의미하며, 상기 돌연변이 방법은 돌연변이 유발, PCR 정점 돌연변이 방법 및/또는 상동 재조합 등 방법 중 적어도 하나에서 선택될 수 있다. 본 발명에서, PCR 정점 돌연변이 방법 및/또는 상동 재조합이 사용되는 것이 바람직하다.
본 발명에 따르면, 상기 돌연변이는 SEQ ID NO: 1에 표시된 폴리뉴클레오티드 서열의 제 597 부위에서 구아닌(G)이 아데닌(A)으로 돌연변이된 것을 포함한다.
본 발명의 일 실시예에서, 상기 폴리뉴클레오티드 서열은 SEQ ID NO: 2에 표시된 폴리뉴클레오티드 서열을 포함한다.
본 발명에 따르면, 상기 아미노산 서열은 SEQ ID NO: 4에 표시된 바와 같은 아미노산 서열을 포함한다.
본 발명에 따르면, 상기 재조합 벡터는 상기 폴리뉴클레오티드 서열을 플라스미드에 도입함으로써 구성된다.
본 발명의 일 실시예에서, 상기 플라스미드는 pK18mobsacB 플라스미드이다.
본 발명의 다른 실시예에서, 상기 플라스미드는 pXMJ19 플라스미드이다.
구체적으로, 상기 폴리뉴클레오티드 서열 및 상기 플라스미드는 네뷰이더(NEBuider) 재조합 시스템에 의해 재조합 벡터로 구성될 수 있다.
본 발명에 따르면, 상기 재조합 균주는 상기 폴리뉴클레오티드 서열을 포함한다.
본 발명의 일 실시예로서, 상기 재조합 균주의 시작 박테리아는 코리네박테리움 글루타미쿰 YPGLU001이며, 생물 보관 번호는 CGMCC No. 21220이다.
본 발명의 일 실시예로서, 상기 재조합 균주의 시작 박테리아는 ATCC 13869이다.
본 발명의 제 3 측면은, L-글루탐산의 생산에 있어서 상술한 폴리뉴클레오티드 서열, 상기 폴리뉴클레오티드 서열에 의해 코딩되는 아미노산 서열, 상기 폴리뉴클레오티드 서열을 포함하는 재조합 벡터 및 상기 폴리뉴클레오티드 서열을 포함하는 재조합 균주의 적용을 제공한다.
본 발명의 제 4 측면은, L- 글루탐산 생산을 위한 재조합 균주를 구성하는 방법을 추가로 제공한다.
본 발명에 따르면, 상기 구성 방법은 다음 단계를 포함한다.
숙주 균주에서 SEQ ID NO: 1에 도시된 바와 같은 야생형 BBD29_00405 유전자의 폴리뉴클레오티드 서열을 변형하여, 이의 제 597 부위에 있는 염기에 돌연변이를 발생시켜 돌연변이된 BBD29_00405 코드 유전자를 포함하는 재조합 균주를 얻는 단계를 포함한다.
본 발명에 따른 구성 방법은, 상기 변형은 돌연변이 유발, PCR 정점 돌연변이 방법 및/또는 상동 재조합 등 방법 중 적어도 한 가지를 포함한다.
본 발명에 따른 구성 방법에서, 상기 돌연변이는 SEQ ID NO: 1에서 제 597 부위의 염기가 구아닌(G)에서 아데닌(A)으로 돌연변이하는 것을 의미한다. 구체적으로, 상기 돌연변이 BBD29_00405 코딩 유전자를 포함하는 폴리뉴클레오티드 서열은 SEQ ID NO: 2에 표시된 바와 같다.
또한, 상기 구성 방법은,
(1) SEQ ID NO: 1에 표시된 바와 같은 야생형 BBD29_00405 유전자의 제 597 부위에서 염기에 돌연변이가 발생하여 돌연변이된 BBD29_00405 유전자 폴리뉴클레오티드 서열을 얻기 위해 뉴클레오티드 서열을 변형시키는 단계;
(2) 재조합 벡터를 구성하기 위해 상기 돌연변이된 폴리뉴클레오티드 서열을 플라스미드에 결합시키는 단계;
(3) 상기 돌연변이된 BBD29_00405 코딩 유전자를 포함하는 재조합 균주를 얻기 위해 상기 재조합 벡터를 숙주 균주에 도입하는 단계를 포함한다
본 발명에 따른 구성 방법에서, 상기 단계 (1)은 점 돌연변이된 BBD29_00405 유전자 구성 과정: 변형되지 않은 균주의 게놈 서열에 따라, 두 쌍의 프라이머 P1와 P2 및 P3와 P4를 합성하여 BBD29_00405 유전자 단편을 증폭시키고, PCR 정점 돌연변이에 의해 야생형 BBD29_00405 유전자 SEQ ID NO : 1에 점 돌연변이를 도입하여 BBD29_00405G597A로 표시된 점 돌연변이된 BBD29_00405 유전자 뉴클레오티드 서열 SEQ ID NO : 2를 얻는 단계를 포함한다.
본 발명의 일 실시예에서, 상기 변형되지 않은 균주 게놈은 균주 ATCC13869로부터 유래될 수 있으며, 이의 게놈 서열 GenBank:CP016335.1은 NCBI 웹사이트로부터 얻을 수 있다.
본 발명의 일 실시예에서, 상기 단계(1)의 상기 프라이머는 다음과 같다.
P1: 5'CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGATGACTATTAATGTC TCCGA3' (SEQ ID NO: 5)
P2: 5' AGACCGGCATCAAGTATGGTCTGGGCA3'(SEQ ID NO: 6)
P3: 5' TGCCCAGACCATACTTGATGCCGGTCT3'(SEQ ID NO: 7)
P4: 5'CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCCTAGCCGGCGTAA GGATCCCGGAT 3' (SEQ ID NO: 8)
본 발명의 일 실시예에서, 상기 PCR 증폭은 다음과 같은 방법으로 수행된다. 94℃에서 5분 동안 사전 변성, 94℃에서 30초 동안 변성, 52℃에서 30초 동안 어닐링, 72℃에서 40초 동안 연장(30 사이클)시킨 다음, 72℃에서 10분 동안 초과 연장시킨다.
본 발명의 일 실시예에서, 상기 중첩 PCR 증폭은 다음과 같은 방법으로 수행된다. 94℃에서 5분 동안 사전 변성, 94℃에서 30초 동안 변성, 52℃에서 30초 동안 어닐링, 72℃에서 100초 동안 연장(30사이클)시킨 다음, 72℃에서 10분 동안 초과 연장시킨다.
본 발명에 따른 구성 방법에 있어서, 상기 단계(2)는 재조합 플라스미드를 얻기 위해 분리 정제된 BBD29_00405G597A 및 pK18mobsacB 플라스미드를 네뷰이더(NEBuider) 재조합 시스템에 의해 조립하는 과정을 포함하는 재조합 플라스미드를 구성하는 단계를 포함한다.
본 발명에 따른 구성 방법에 있어서, 상기 단계(3)은 재조합 균주를 얻기 위해 재조합 플라스미드를 숙주 균주로 형질전환하여 재조합 균주를 구성하는 단계를 포함한다.
본 발명의 일 실시예에서, 상기 단계(3)에서 형질전환은 전기 전환 방법에 의한 것이다.
본 발명의 일 실시예에서, 상기 숙주 균주는 ATCC 13869이다.
본 발명의 일 실시예에서, 상기 숙주 균주는 코리네박테리움 글루타미쿰 YPGLU001이고, 생물 보관 번호는 CGMCC No. 21220이다.
본 발명의 일 실시예에서, 상기 재조합은 상동 재조합에 의해 구현된다.
본 발명의 제5 측면에서, L-글루탐산을 생성하는 재조합 균주를 구성하는 방법을 추가로 제공한다.
본 발명에 따르면, 상기 구성 방법은,
BBD29_00405의 상류 및 하류 상동 암 단편, BBD29_00405 유전자의 코딩 영역 및 이의 프로모터 영역의 서열을 증폭하여, 상기 균주가 BBD29_00405 또는 BBD29_00405G597A 유전자의 과발현을 구현하도록 상동 재조합 방식으로 숙주 균주의 게놈에 BBD29_00405 또는 BBD29_00405G597A 유전자를 도입하는 단계를 포함한다.
본 발명의 일 실시예에서, 상류 상동 암 단편을 증폭하기 위한 프라이머는 다음과 같다.
P7: 5'CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGGACCCGCTTGCCAT ACGAAG 3'
P8: 5'CCTACCACGA CGAGCACTAC ATCTACTCAT CTGAAGAATC 3'
본 발명의 일 실시예에서, 하류 상동 암 단편을 증폭하기 위한 프라이머는 다음과 같다.
P11: 5'GGGATCCTTA CGCCGGCTAG TTCGTGGGCA CTCTGGTTTG 3'
P12: 5'CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCCATAAGAAACA ACCACTTCC 3'
본 발명의 일 실시예에서, 상기 유전자 코딩 영역 및 그 프로모터 영역의 서열을 증폭하기 위한 프라이머는 다음과 같다.
P9: 5'GATTCTTCAG ATGAGTAGAT GTAGTGCTCG TCGTGGTAGG 3' (SEQ ID NO: 13)
P10: 5'CAAACCAGAG TGCCCACGAA CTAGCCGGCG TAAGGATCCC 3'(SEQ ID NO: 14)
본 발명의 일 실시예에서, 통합된 상동 암 단편은, 상기 P7/P12를 프라이머로 사용하고 증폭된 상류 상동 암 단편, 하류 상동 암 단편, 유전자의 코딩 영역 및 그 프로모터 영역 서열 단편의 세 단편을 혼합하여 템플릿으로 사용하여 증폭하여 얻는다.
본 발명의 일 실시예에서, 사용된 PCR 시스템은 l0 x Ex Taq 버퍼 5 μL, dNTP 혼합물(각각 2.5mM) 4 μL , Mg2+(25mM) 4 μL, 프라이머(l0pM) 각각 2 μL, Ex Taq(5U/μL) 0.25 μL, 총 부피는 50 μL이다. PCR 증폭은 94℃에서 5분 동안 사전 변성, 94℃에서 30초 동안 변성, 52℃에서 30초 동안 어닐링, 72℃에서 180초 동안 연장(30사이클)시킨 다음, 72℃에서 10분 동안 과도 연장시키는 방식으로 수행된다.
본 발명의 일 실시예에서, NEBuider 재조합 시스템을 사용하여 셔틀 플라스미드 PK18mobsacB 및 통합 상동 암 단편을 조립함으로써 통합 플라스미드를 얻는다.
본 발명의 일 실시예에서, 통합 플라스미드를 숙주 균주에 감염시켜 상동 재조합 방식으로 숙주 균주의 게놈에 BBD29_00405 또는 BBD29_00405G597A 유전자를 도입한다.
본 발명의 일 실시예에서, 상기 숙주 균주는 코리네박테리움 글루타미쿰 YPGLU001이고, 생물 보관 번호는 CGMCC No. 21220이다.
본 발명의 일 실시예에서, 상기 숙주 균주는 ATCC 13869이다.
본 발명의 일 실시예에서, 상기 숙주 균주는 SEQ ID NO: 2에 표시된 폴리뉴클레오티드 서열이 있는 균주이다.
본 발명의 제6 측면에서, L-글루탐산을 생산하는 재조합 균주를 구성하는 방법을 추가로 제공한다.
본 발명에 따르면, 상기 구성 방법은,
BBD29_00405 유전자의 코딩 영역 및 프로모터 영역의 서열 또는 BBD29_00405G597A 유전자의 코딩 영역 및 프로모터 영역의 서열을 증폭하여, 과발현 플라스미드 벡터를 구성하고, 상기 벡터를 숙주 균주로 옮겨 상기 균주에서 BBD29_00405 또는 BBD29_00405G597A 유전자의 과발현을 구현하는 단계를 포함한다.
본 발명의 일 실시예에서, 상기 유전자의 코딩 영역의 서열 및 그 프로모터 영역의 서열을 증폭하기 위한 프라이머는 다음과 같다.
P17: 5'GCTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCC GTAG TGCTCG TCGTGGTAGG 3' (SEQ ID NO: 21)
P18: 5'ATCAGGCTGAAAATCTTCTCTCATCCGCCAAAACCTAGCCGGCG TAAGGATCCCGGAT 3' (SEQ ID NO: 22).
본 발명의 일 실시예에서, 상기 PCR 시스템은 l0ХEx Taq 버퍼 5 μL, dNTP 혼합물(각각 2.5mM) 4 μL, Mg2+(25mM) 4 μL, 프라이머(l0pM) 각각 2 μL, Ex Taq(5U/μL) 0.25 μL, 총 부피는 50 μL이다. 상기 PCR 증폭은 94℃에서 5분 동안 사전 변성, 94℃에서 30초 동안 변성, 52℃에서 30초 동안 어닐링, 72℃에서 100초 동안 연장(30사이클)시킨 다음, 72℃에서 10분 동안 과도 연장시키는 방식으로 수행된다.
본 발명의 일 실시예에서, 과발현 플라스미드는, NEBuider 재조합 시스템을 사용하여 셔틀 플라스미드 pXMJ19와 자체 프로모터가 있는 BBD29_00405 또는 BBD29_00405G597A 단편을 조립하여 얻는다.
본 발명의 일 실시예에서, 상기 숙주 균주는 코리네박테리움 글루타미쿰 YPGLU001이고, 생물 보관 번호는 CGMCC No. 21220이다.
본 발명의 일 실시예에서, 상기 숙주 균주는 ATCC 13869이다.
본 발명의 일 실시예에서, 상기 숙주 균주는 SEQ ID NO: 2에 표시된 폴리뉴클레오티드 서열이 있는 균주이다.
본 발명에서는, L-글루탐산의 발효 생산에 단독으로 적용할 수 있거나 다른 L-글루탐산을 생성하는 박테리아와 혼합되어 L-글루탐산의 발효 생산에 적용할 수 있는 재조합 균주를 얻는다.
본 발명의 다른 측면에서, 상기 박테리아를 배양하고 배양액으로부터 L-글루탐산을 얻는 방법을 포함하는 L-글루탐산을 생산하는 방법을 제공한다.
박테리아의 배양은, 본 분야에 알려진 배양 조건 하에 적절한 배지에서 수행될 수 있다. 배지에는 탄소 공급원, 질소 공급원, 미량 원소 및 이들의 조합이 포함될 수 있다. 배양액의 pH는 배양 중에 조정할 수 있다. 또한, 배양할 때 소포제를 사용하여 가스 기포가 발생되는 것을 방지하는 단계가 포함될 수 있다. 또한, 배양할 때 배양액에 가스를 주입하는 단계를 포함할 수 있다. 가스는 배양액의 호기성 조건을 유지할 수 있는 임의의 가스를 포함할 수 있다. 배양에서, 배양액의 온도는 20 내지 45℃일 수 있다 생성된 L-글루탐산은 황산이나 염산으로 배양액을 처리한 후, 음이온 교환 크로마토그래피, 농축, 결정화 및 등전점 침전과 같은 방법의 조합에 의해 배양액으로부터 회수될 수 있다.
본 발명은 또한 단백질 BBD29_00405M199I로 불리우는 단백질을 제공하며, 상기 단백질은,
A1) 아미노산 서열이 SEQ ID NO: 4인 단백질;
A2) SEQ ID NO: 4에 표시된 아미노산 서열을 아미노산 잔기의 치환 및/또는 결실 및/또는 첨가를 거쳐서 얻어진 A1)에 표시된 단백질과 80% 이상의 동일성을 가지고 또한 동일한 기능을 가진 단백질;
A3) A1) 또는 A2)의 N 말단 및/또는 C 말단에 라벨을 결합하여 얻어진 동일한 기능을 가진 융합 단백질 중 어느 한 가지일 수 있다.
본 발명은 또한 BBD29_00405G597A라고 불리는 핵산 분자를 제공하며, 상기 핵산 분자 BBD29_00405G597A는,
B1) 상기 단백질 BBD29_00405M199I를 코딩하는 핵산 분자;
B2) 코딩 서열이 SEQ ID NO: 2에 표시된 DNA 분자;
B3) 뉴클레오티드 서열이 SEQ ID NO: 2에 표시된 DNA 분자 중 어느 한 가지일 수 있다.
SEQ ID NO: 2에 표시된 DNA 분자는 본 발명의 상기 BBD29_00405G597A 유전자이다.
SEQ ID NO: 2에 표시된 DNA 분자(BBD29_00405G597A 유전자)는 SEQ ID NO: 4에 표시된 단백질 BBD29_00405M199I를 코딩한다.
상기 단백질 BBD29_00405M199I의 아미노산 서열(SEQ ID NO: 4)은 SEQ ID NO: 3의 제 199 부위에서 메티오닌(M)이 이소류신(I)으로 변경되어 파생된 것다.
본 발명은 또한 생물 재료를 제공하며, 상기 생물 재료는,
C1) 상기 핵산 분자 BBD29_00405G597A를 포함하는 발현 카세트;
C2) 상기 핵산 분자 BBD29_00405G597A를 포함하는 재조합 벡터, 또는 C1)의 상기 발현 카세트를 포함하는 재조합 벡터;
C3) 상기 핵산 분자 BBD29_00405G597A를 포함하는 재조합 미생물, 또는 C1)의 상기 발현 카세트를 포함하는 재조합 미생물, 또는 C2)의 상기 재조합 벡터를 포함하는 재조합 미생물 중 어느 한 가지일 수 있다.
본 발명은 또한 D1) -D8) 중 어느 하나가 다음 중 어느 한 가지에 적용되는 것을 제공한다.
F1) 미생물의 L-글루탐산 생산량 조절에서 D1) -D8) 중 어느 하나가 적용된다.
F2) L-글루탐산을 생산하는 유전자 공정 박테리아 구성에서 D1) -D8) 중 어느 하나가 적용된다.
F3) L-글루탐산의 제조에서 D1)-D8) 중 어느 하나가 적용된다.
여기서, 상기 D1)-D8)은,
D1) 상기 단백질 BBD29_00405M199I이고;
D2) 상기 핵산 분자 BBD29_00405G597A이며;
D3) 상기 생물 재료이고;
D4) 뉴클레오티드 서열이 SEQ ID NO: 1인 DNA 분자이며;
D5) SEQ ID NO: 1에 표시된 뉴클레오티드 서열이 변형 및/또는 하나 이상의 뉴클레오티드의 치환 및/또는 결실 및/또는 첨가를 거쳐서 얻어진 SEQ ID NO: 1에 표시된 DNA 분자와 90% 이상의 동일성을 가지며, 또한 동일한 기능을 가지는 DNA 분자이고;
D6) D4) 또는 D5)의 상기 DNA 분자를 포함하는 발현 카세트이며;
D7) D4) 또는 D5)의 상기 DNA 분자를 포함하는 재조합 벡터, 또는 D6)의 상기 발현 카세트를 포함하는 재조합 벡터이고;
D8) D4) 또는 D5)의 상기 DNA 분자를 포함하는 재조합 미생물, 또는 D6)의 상기 발현 카세트를 포함하는 재조합 미생물, 또는 D7)의 상기 재조합 벡터를 포함하는 재조합 미생물이다.
SEQ ID NO: 1에 표시된 DNA 분자는 본 발명에 따른 BBD29_00405 유전자이다.
SEQ ID NO: 1에 표시된 DNA 분자(BBD29_00405 유전자)는 SEQ ID NO: 3에 표시된 단백질을 코딩한다.
본 명세서에서, 상동성은 아미노산 서열 또는 뉴클레오티드 서열의 동일성을 의미한다. 아미노산 서열의 동일성은 NCBI 홈페이지 웹사이트의 BLAST 페이지와 같은 국제 인터넷에서 상동성 검색 사이트를 사용하여 측정할 수 있다. 예를 들어, 고급 BLAST2.1에서 blastp를 프로그램으로 사용하고, 기대값을 10으로 설정하며, 모든 필터를 OFF로 설정하고, BL0SUM62를 매트릭스로 사용하고, 갭 존재 비용, 잔기당 갭 비용 및 람다 비율을 각각 11, 1 및 0.85(기본값)로 설정하여 한 쌍의 아미노산 서열의 동일성을 검색하고 계산하여 동일성 값(%)을 얻는다.
본 명세서에서 상기 80% 이상의 동일성은 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성일 수 있다.
본 명세서에서 90% 이상의 동일성은 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 동일성일 수 있다.
본 명세서에서, 상기 미생물의 L-글루탐산 생산량 조절은 미생물에서의 L-글루탐산의 축적량을 증가시키거나 감소시키는 것(즉, L-글루탐산의 생합성을 촉진하거나 억제하는 것)일 수 있다.
본 발명은 또한 미생물에서 L-글루탐산의 생산량을 증가시키는 방법을 제공하며, 상기 방법은,
E1) 목적 미생물에서 상기 핵산 분자 BBD29_00405G597A의 발현량 또는 함량을 증가시켜, L-글루탐산 생산량이 상기 목적 미생물보다 높은 미생물을 획득하는 단계;
E2) 목적 미생물에서 D4) 또는 D5)의 상기 DNA 분자의 발현량 또는 함량을 증가시켜, L-글루탐산 생산량이 상기 목적 미생물보다 높은 미생물을 획득하는 단계;
E3) 상기 목적 미생물에서 뉴클레오티드 서열이 SEQ ID NO: 1인 DNA 분자를 돌연변이시켜 L-글루탐산 생산량이 상기 목적 미생물보다 높은 미생물을 획득하는 단계 중 어느 하나를 포함한다.
상기 방법에서, 상기 돌연변이는 점 돌연변이(point mutation), 즉 단일 뉴클레오티드의 돌연변이일 수 있다.
상술한 방법에서, 상기 점 돌연변이는, SEQ ID NO: 1에 표시된 DNA 분자에 의해 코딩되는 아미노산 서열의 제 199 부위에서 알라닌 잔기가 다른 아미노산 잔기로 돌연변이된 것일 수 있다.
상술한 방법에서, 상기 점 돌연변이는 SEQ ID NO: 1에 표시된 DNA 분자에 의해 코딩되는 아미노산 서열의 제 199 부위에서 알라닌이 트리오닌으로 돌연변이되어, 아미노산 서열이 SEQ ID NO: 4인 돌연변이 단백질 BBD29_00405M199I를 획득하는 것일 수 있다.
상기 돌연변이는 정점 돌연변이를 통해 유전자 중 어느 하나 이상의 염기가 변경되어 해당 단백질의 아미노산 조성이 변경되어, 새로운 단백질이 생성되거나 원래 단백질에 새로운 기능이 생성되는 것, 즉 유전자 정점 돌연변이를 의미한다. 올리고뉴클레오티드 프라이머를 매개로하는 정점 돌연변이, PCR을 매개로하는 정점 돌연변이 또는 카세트 돌연변이와 같은 유전자의 정점 돌연변이를 위한 기술은 당업자에게 잘 알려져 있다.
본 명세서의 상기 점 돌연변이는 단일 염기 치환, 단일 염기 삽입 또는 단일 염기 결실일 수 있으며, 구체적으로 단일 염기 치환일 수 있다. 상기 단일 염기 치환은 대립 유전자 치환일 수 있다.
상기 점 돌연변이는 BBD29_00405 유전자(SEQ ID NO: 1)의 제 597 부위에서 구아닌(G)의 핵산 변형일 수 있다.
구체적으로, 상기 점 돌연변이는 BBD29_00405 유전자(SEQ ID NO: 1)의 제 597 부위에서 구아닌(G)이 아데닌(A)으로 돌연변이되어 SEQ ID NO: 2에 도시된 DNA 분자를 얻는 돌연변이일 수 있다.
본 명세서에서 상기 재조합 벡터는 구체적으로 재조합 벡터 pK18-BBD29_00405G597A, PK18mobsacB-BBD29_00405, PK18mobsacB-BBD29_00405G597A, pXMJ19-BBD29_00405 또는 pXMJ19-BBD29℃11265G597A이다.
상기 재조합 벡터 pK18-BBD29_00405G597A는 SEQ ID NO: 2에 표시된 돌연변이 유전자 BBD29_00405G597A의 제 1-1473 부위에 표시된 DNA 분자를 포함하며, 구체적으로, pK18mobsacB 벡터의 다른 염기 서열을 변경하지 않고 SEQ ID NO: 31에 표시된 DNA 단편 BBD29_00405G597A-위-아래 단편을 pK18mobsacB 벡터의 Xbal I 인식 부위 사이에 삽입하여 얻어진 재조합 벡터이다.
상기 재조합 벡터 PK18mobsacB-BBD29_00405는 외인성 유전자 BBD29_00405를 숙주 염색체에 통합하고, 생산된 박테리아에서 야생형 BBD29_00405 유전자를 과발현하는 데 사용된다.
상기 재조합 벡터 PK18mobsacB-BBD29_00405G597A는 외인성 유전자 BBD29_00405G597A를 숙주 염색체에 통합하고, 생산된 박테리아에서 돌연변이형 유전자 BBD29_00405G597A를 과발현하는 데 사용된다.
상기 재조합 벡터 pK19-BBD29_00405는 플라스미드를 통해 외인성 유전자 BBD29_00405를 염색체 외부에서 발현시키고, 생산된 박테리아에서 야생형 BBD29_00405 유전자를 과발현하는 데 사용된다.
상기 재조합 벡터 pK19-BBD29_00405G597A는 플라스미드를 통해 외인성 유전자 BBD29_00405G597A를 염색체 외부에서 발현시키고, 생산된 박테리아에서 돌연변이형 유전자 BBD29_00405G597A를 과발현하는 데 사용된다.
상기 재조합 벡터 pK18-BBD29_00405G597A, PK18mobsacB-BBD29_00405, PK18mobsacB-BBD29_00405G597A, pXMJ19-BBD29_00405 및 pXMJ19-BBD29_00405G597A는 모두 본 발명의 보호 범위 내에 있다.
본 명세서에서, 상기 재조합 미생물은 구체적으로 재조합 박테리아 YPG-025, YPG-026, YPG-027, YPG-028 또는 YPG-029일 수 있다.
상기 재조합 박테리아 YPG-025는 상기 재조합 벡터 pK18-BBD29_00405G597A를 코리네박테리움 글루타이니쿰 CGMCC No. 21220으로 형질 전환하여 얻은 재조합 박테리아로서, 상기 재조합 박테리아 YPG-025는 SEQ ID NO: 2에 표시된 돌연변이된 유전자 BBD29_00405G597A를 포함한다.
상기 재조합 박테리아 YPG-026은 SEQ ID NO: 1에 표시된 BBD29_00405 유전자의 이중 사본을 포함한다. BBD29_00405 유전자의 이중 사본을 포함하는 재조합 박테리아는 BBD29_00405 유전자의 발현량을 현저하고 안정적으로 증가시킨다. 재조합 박테리아 YPG-026은 게놈에서 야생형 BBD29_00405 유전자가 과발현된 공학 박테리아이다.
상기 재조합 박테리아 YPG-027은 SEQ ID NO: 2에 표시된 돌연변이된 BBD29_00405G597A 유전자를 포함한다. 재조합 박테리아 YPG-027은 게놈에서 돌연변이형 유전자 BBD29_00405G597A를 과발현시키는 공학 박테리아이다.
재조합 박테리아 YPG-028은 SEQ ID NO: 1에 표시된 BBD29_00405 유전자의 이중 사본을 포함한다. 재조합 박테리아 YPG-028은 플라스미드에, 즉 염색체 외부에서 플라스미드 pXMJ19-BBD29_00405에 의해 야생형 BBD29_00405 유전자를 과발현하는 공학 박테리아이다.
재조합 박테리아 YPG-029는 SEQ ID NO: 2에 표시된 돌연변이된 BBD29_00405G597A 유전자를 포함한다. 재조합 박테리아 YPG-029는 플라스미드에, 즉 염색체 외부에서 플라스미드 pXMJ19-BBD29_00405G597A에 의해 돌연변이 BBD29_00405G597A 유전자를 과발현하는 공학 박테리아이다.
상기 재조합 박테리아 YPG-025, YPG-025, YPG-027, YPG-027 및 YPG-029는 모두 본 발명의 보호 범위 내에 있다.
본 발명은 또한 상기 재조합 미생물을 구성하는 방법을 제공하며, 상기 방법은,
F1) 상기 재조합 미생물을 얻기 위해 상기 핵산 분자 BBD29_00405G597A를 목적 미생물에 도입하는 단계;
F2) 상기 재조합 미생물을 얻기 위해, SEQ ID NO: 1에 표시된 DNA 분자를 목적 미생물에 도입하는 단계;
F3) 유전자 편집 수단(예를 들어, 단일 염기 유전자 편집)을 사용하여, 목적 미생물이 SEQ ID NO: 2에 표시된 DNA 분자를 포함하도록, SEQ ID NO: 1에 표시된 DNA 분자를 편집하는 단계 중 어느 하나를 포함한다.
상기 도입은 화학적 형질 전환 또는 전기 충격 형질 전환과 같은 임의의 공지된 형질 전환 방법에 의해, 본 발명의 DNA 분자를 운반하는 벡터를 숙주 박테리아로 형질 전환하는 것일 수 있다. 도입된 DNA 분자는 단일 사본 또는 다중 사본일 수 있다. 상기 도입은 외인성 유전자를 숙주 염색체에 통합하거나 플라스미드에 의해 염색체 외부에서 발현될 수 있다.
본 발명은 또한 L-글루탐산을 제조하는 방법을 제공하며, 상기 방법은 본 명세서의 임의의 상기 재조합 미생물을 사용하여 L-글루탐산을 생산하는 단계를 포함한다.
상기 방법에서, 상기 방법은 L-글루탐산의 제조를 위한 발효 방법일 수 있으며, 상기 재조합 미생물은 코리네박테리움(Corynebacteriuin) 속, 특히 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 및 이의 변이체일 수 있다.
생물 보관 정보 설명
코리네박테리움 글루타미쿰(Corynebacterhim glutamicum)은 중국 미생물 균주 보관 관리 위원회 일반 미생물 센터에 보관하고 있으며, 보관 주소는 베이징 차오양구 베이천 서로 1호원 3호이고, 우편 번호는 1000101이며, 보관 기관의 약칭은 CGMCC이고, 보관 날짜는 2020년 11월 23일이고, 생물 보관 번호는 CGMCC No. 21220이며, 균주명은 YPGLU001이다.
아래, 구체적인 실시형태와 결합하여 본 발명의 기술 방안에 대해 더 상세하게 설명한다. 다음의 실시예는, 본 발명의 범위를 한정하기 위한 것이 아니라, 다만 본 발명을 예시적으로 설명하고 해석하기 위한 것이다. 본 발명의 상기 내용에 기초하여 구현된 모든 기술은 본 발명이 의도하는 보호 범위 내에 포함된다.
달리 명시되지 않는 한, 다음 실시예에서 사용되는 원료 및 시약은 모두 상업적으로 이용 가능하거나 공지된 방법으로 제조할 수 있다. 다음 실시예에서 특정 조건이 명시되지 않은 실험 방법은, 일반적으로 Sambrook 등과 같은 분자 클론: 실험실 매뉴얼(뉴욕: Cold Spring Harbor Laboratory Press, 1989)에 설명한 조건 또는 제조업체가 제안하는 조건에 따른다.
달리 정의되거나 배경에 의해 명확하게 표시되지 않는 한, 본 개시의 모든 기술과 과학 용어는 본 개시가 속하는 기술 분야에서 일반 기술자에게 통상적으로 이해되는 것과 동일한 의미를 가진다.
다음 실시예에서, 상기 균주의 배양에 사용되는 기본 배지의 조성은 동일하며 이 기본 배지의 조성에 상응한 수요되는 자당, 카나마이신 또는 클로람페니콜 등이 첨가된다. 고형물이 필요한 경우, 2%의 한천을 첨가하면 되고, pH 7.0이고, 배양 온도 30℃이다. 기본 배지의 용질 조성은 아래 표 1에 표시되었으며, 표 1에 표시된 용질을 물에 용해시켜 기본 배지를 얻는다.
다음 실시예에서, 코리네박테리움 글루타미쿰 YPGLU001 CGMCC No. 21220은 2020년 11월 23일에, 중국 미생물 균주 보관 관리 위원회 일반 미생물 센터(약칭은 CGMCC이고, 주소는 베이징 조양구 베이천 서로 1호원 3호, 중국 과학원 미생물 연구소)에서, 보관 등록 번호가 CGMCC No. 21220로 보관되었다. 코리네박테리움 글루타미쿰 YPGLU001은 코리네박테리움 글루타미쿰 CGMCC No. 21220으로도 불리운다.
실시예 1 점 돌연변이된 BBD29_00405 유전자의 코딩 영역을 포함하는 형질전환 벡터 pK18- BBD29_00405G597A의 구성
NCBI에 개시된 코리네박테리움 글루타미쿰 ATCC13869의 게놈(GenBank: CP016335.1) 서열을 기반으로, BBD29_00405 유전자(GenBank: AKF27993.1)의 코딩 영역 서열을 증폭하기 위해 두 쌍의 프라이머를 설계 및 합성하여, 균주 ATCC13869 및 L-글루탐산을 많이 생산하는 코리네박테리움 글루타미쿰 YPGLU001(생물 보관 번호 CGMCC No. 21220)에 대립 유전자 치환을 통해 점 돌연변이를 도입했다. 코딩 단백질에 해당하는 아미노산 서열은 SEQ ID NO: 3이며, BBD29_00405 유전자의 뉴클레오티드 서열은 제 597 부위에 있는 구아닌(G)이 아데닌(A)(SEQ ID NO: 2: BBD29_00405G597A)으로 변경되고, 코딩 단백질에 해당하는 아미노산 서열의 제 199 부위에 있는 메티오닌(M)이 이소류신(I)(SEQ ID NO: 4: BBD29_00405M199I)으로 변경된다.
야생형 BBD29_00405 유전자의 뉴클레오티드 서열은 SEQ ID NO: 1이고, BBD29_00405 단백질을 코딩하는 아미노산 서열은 SEQ ID NO: 3이다.
BBD29_00405G597A 돌연변이 유전자의 뉴클레오티드 서열은 SEQ ID NO: 2이고, BBD29_00405M1991 돌연변이 단백질을 코딩하는 아미노산 서열은 SEQ ID NO: 4이다.
프라이머는 아래와 같이 설계되어 있다(상하이 invitrogen사에 의해 합성, 여기서 밑줄이 그어진 부분은 돌연변이 염기임).
P1: 5'CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGATGACTATTAATGTC TCCGA3' (SEQ ID NO: 5)
P2: 5'AGACCGGCATCAAGTATGGTCTGGGCA3'(SEQ ID NO: 6)
P3: 5'TGCCCAGACCATACTTGATGCCGGTCT3'(SEQ ID NO: 7)
P4: 5'CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCCTAGCCGGCGTAA GGATCCCGGAT 3' (SEQ ID NO: 8)
구성 방법: 코리네박테리움 글루타미쿰 ATCC13869를 템플릿으로 사용하고, 프라이머 P1과 P2 및 P3과 P4를 사용하여 각각 PCR 증폭하였다.
PCR 시스템: l0ХEx Taq 버퍼 5 μL, dNTP 혼합물(각각 2.5mM) 4 μL, Mg2+(25mM) 4 μL, 프라이머(l0pM)는 각각 2 μL, Ex Taq(5U/μL) 0.25 μL, 템플릿은 1 μL, 나머지는 물이며, 총 부피는 50 μL이다.
상기 PCR 증폭은 다음과 같은 방식으로 수행되었다. 94℃에서 5분 동안 사전 변성, 94℃에서 30초 동안 변성, 52℃에서 30초 동안 어닐링, 72℃에서 40초 동안 연장을 30사이클 수행한 다음, 72℃에서 l0분 동안 과도 연장시켜, 크기가 각각 647bp 및 927bp이고 BBD29_00405 유전자의 코딩 영역을 포함하는 두 개의 DNA 단편(BBD29_00405G597A 위(SEQ ID NO: 29) 및 BBD29_00405G597A-아래(SEQ ID NO: 30))을 얻었다.
BBD29_00405G597A 위 및 BBD29_00405G597A 아래를 아가로스 겔 전기 영동으로 분리 정제한다. 상기 두 개의 DNA 단편을 템플릿으로 사용하고, P1 및 P4를 프라이머로 사용하여 중첩 PCR을 통해 증폭하여, 길이가 약 1547 bp이고 뉴클레오티드 서열이 SEQ ID 번호 31인 BBD29_00405G597A 위-아래 단편을 얻었다.
PCR 시스템: l0ХEx Taq 버퍼 5 μL, dNTP 혼합물(각각 2.5mM) 4 μL, Mg2+(25mM) 4 μL, 프라이머(l0pM)는 각각 2 μL, Ex Taq(5U/μL) 0.25 μL, 템플렛은 1μL이고, 나머지는 물이며, 총 부피는 50 μL이다.
상기 중첩 PCR 증폭은 다음과 같이 수행되었다. 94℃에서 5분 동안 사전 변성, 94℃에서 30초 동안 변성, 52℃에서 30초 동안 어닐링, 72℃에서 100초 동안 연장(30 사이클)시킨 다음, 72℃에서 10분 동안 과도 연장시켰다.
이 DNA 단편은 ATCC13869의 돌연변이 유발 균주 코리네박테리움 글루타미쿰 YPGLU001(생물 보관 번호 CGMCC No. 21220)의 BBD29_00405 유전자의 코딩 영역에 있는 제 597 부위에서 구아닌(G)이 아데닌(A)으로 변화되도록 하고, 최종적으로 코딩된 단백질의 제 199 부위의 아미노산이 메티오닌(M)에서 이소류신(I)으로 변화되도록 한다.
pK18mobsacB 플라스미드(Addgene사에서 구입)를 Xba I로 분해한 후, BBD29_00405G597A-위-아래 및 선형화된 pK18mobsacB 플라스미드를 아가로스 겔 전기영동으로 분리 및 정제한 다음, NEBuider 재조합 시스템(NEB E5520S)으로 조립하여 상기 플라스미드에 카나마이신 내성 마커가 포함되어 있는 벡터 pK18-BBD29_00405G597A를 얻었다. 벡터 pK18-BBD29_00405G597A는 염기서열 분석 및 동정을 위해 시퀀싱 업체로 보내졌고, 정확한 점 돌연변이(G-A)가 포함된 벡터 pK18-BBD29_00405G597A는 백업용으로 보관하였다.
재조합 벡터 pK18-BBD29_00405G597A는 pK18mobsacB 벡터의 다른 염기서열을 변경하지 않고, SEQ ID NO: 31에 표시된 DNA 단편 pK18-BBD29_00405G597A-위-아래 단편을 pK18mobsacB 벡터의 Xbal I 인식 부위 사이에 삽입하여 얻어진 재조합 벡터이다.
실시예 2 점 돌연변이된 BBD29_00405G597A를 포함하는 공학 균주 구성
구성 방법: 대립 유전자 치환 플라스미드 pK18-BBD29_00405G597A를 전기 충격 형질전환에 의해 L-글루탐산을 많이 생산하는 코리네박테리움 글루타미쿰 YPGLU001(생물 보관 번호 CGMCC No. 21220이고, 상기 균주의 염색체에 야생형 BBD29_00405 유전자 코딩 영역이 유지되는 것을 확인하기 위해 시퀀싱됨)에 형질전환되었다. 생산된 단일 콜로니는 각각 프라이머 P1과 범용 프라이머 M13R에 의해 확인하였으며, 약 1554bp(SEQ ID NO: 32) 크기의 밴드로 증폭된 균주는 양성 균주로 확인되었다. 양성 균주는 15% 자당을 함유한 배지에서 배양하였다. 생산된 단일 콜로니는 각각 카나마이신을 함유한 배지와 카나마이신을 함유하지 않은 배지에서 배양하였다. 카나마이신을 함유하지 않은 배지에서 성장하나 카나마이신을 함유한 배지에서 성장하지 않는 균주는 아래 프라이머(상하이 Invitrogen사에서 합성)를 사용하여 PCR로 추가로 확인하였다.
P5: 5' AGAAGGCAACCTGCGCATGA 3' (SEQ ID NO: 9)
P6: 5' ATCGGGTTGGAAATCGCAGA 3' (SEQ ID NO: 10);
범용 프라이머 M13R의 서열은 M13R:5'CAG GAA ACA GCT ATG ACC3'이다.
상술한 PCR 증폭 산물261bp (SEQ ID NO: 33)을 고온에서 변성시키고 얼음 욕조에서 SSCP 전기 영동(플라스미드 pK18-BBD29_00405G597A로 증폭된 단편은 양성 대조군으로 사용되었고, ATCC13869로 증폭된 단편은 음성 대조군으로 사용되었으며, 물은 블랭크 대조군으로 사용되었다)을 수행하였으며, 균주마다 단편 구조가 다르고 전기영동 부위가 다르기 때문에, 단편의 전기영동 부위가 음성 대조군의 부위와는 일치하지 않고 양성 대조군 단편과 일치하는 균주는 대립 유전자 치환에 성공한 균주이다.
대립 유전자 치환에 성공한 균주의 목적 단편은 프라이머 P5 및 P6을 사용하여 다시 PCR로 증폭시키고, 시퀀싱을 위해 PMD19-T 벡터에 결합시켜, 염기 서열을 비교하여 교체 성공 여부를 확인하였다. 또한 글루탐산 생산량이 높은 코리네박테리움 글루타미쿰 YPGLU001(생물 보존 번호 CGMCC No. 21220) 교체에 성공한 돌연변이 균주는 YPG-025로 명명하였다.
재조합 박테리아 YPG-025는 대립 유전자 치환 방식으로 코리네박테리움 글루타미쿰 CGMCC No. 21220의 BBD29_00405 유전자의 코딩 영역(SEQ ID NO:1)에 점 돌연변이 G597A를 도입하여, 상기 서열의 다른 서열은 변하지 않고 상기 유전자 제597 부위의 G가 A로 변이된, 점 돌연변이(G-A)를 포함하는 유전자 공학 박테리아 YPG-025를 얻었다.
코리네박테리움 글루타미쿰 CGMCC 21220에 비해, 코리네박테리움 글루타미쿰 YPG-025는 코리네박테리움 글루타미쿰 CGMCC21220의 게놈에서 SEQ ID NO: 1에 표시된 BBD29_00405 유전자가 SEQ ID NO: 2에 표시된 BBD29_00405G597A 유전자로 대체된다는 점에서만 차이가 있다. SEQ ID NO: 1 및 SEQ ID NO: 2 사이에는 제 597 부위에서 단 하나의 뉴클레오티드 차이만 있다.
SSCP 전기영동 PAGE의 준비 및 조건은 다음의 표 2와 같다.
실시예 3 게놈에서 BBD29_00405 또는 BBD29_00405G597A 유전자를 과발현하는 공학 균주 구성
NCBI에 개시된 코리네박테리움 글루타미쿰 ATCC13869의 게놈(GenBank: CP016335.1) 서열을 기반으로, 상류 및 하류 상동 암 단편과 BBD29_00405 유전자의 코딩 및 프로모터 영역의 서열을 증폭하고, 상동 재조합을 통해 균주 코리네박테리움 글루타미쿰 YPGLU001(생물 보관 번호 CGMCC No. 21220)에 BBD29_00405 또는 BBD29_00405G597A 유전자를 도입하도록 세 쌍의 프라이머를 설계 및 합성하였다.
프라이머는 다음과 같이 설계되었다(상하이 invitrogen사에서 합성).
P7: 5' CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGGACCCGCTTGCCAT ACGAAG 3'
P8: 5' CCTACCACGA CGAGCACTAC ATCTACTCAT CTGAAGAATC 3'
P9: 5' GATTCTTCAG ATGAGTAGAT GTAGTGCTCG TCGTGGTAGG 3'
P10: 5' CAAACCAGAG TGCCCACGAA CTAGCCGGCG TAAGGATCCC 3'
P11: 5' GGGATCCTTA CGCCGGCTAG TTCGTGGGCA CTCTGGTTTG 3'
P12: 5' CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCCATAAGAAACA ACCACTTCC 3'
구성 방법: 코리네박테리움 글루타미쿰 ATCC13869 또는 YPI019를 템플릿으로 사용하고, 프라이머 P7/P8 , P9/P10, P11/P12로 각각 PCR 증폭을 수행하여, 약 806bp의 상류 상동 암 단편, 약 1777bp의 BBD29_00405(SEQ ID NO: 34) 또는 BBD29_00405G597A 유전자 단편(SEQ ID NO: 36) 및 약 788 bp의 하류 상동 암 단편(SEQ ID NO: 37)을 얻었다. 위의 세 개의 증폭된 단편을 혼합하여 템플렛으로 사용하고, P7/P12를 프라이머로 사용하여 증폭하여, 3291 bp의 통합 상동 암 단편 상류-BBD29 00405-하류(SEQ ID NO: 38) 또는 통합 상동 암 단편 상류-BBD29_00405G597A-하류(SEQ ID NO: 39)을 얻었다. PCR 반응이 완성된 후, 증폭된 생성물을 전기 영동으로 회수하고, 컬럼 DNA 겔 회수 키트를 사용하여 약 3291bp의 원하는 DNA 단편을 회수하고, NEBuider 재조합 시스템을 사용하여, Xba I 분해하여 회수된 셔틀 플라스미드 pK18mobsacB에 연결하여 통합 플라스미드(즉, 재조합 벡터) pK18mobsacB-BBD29_00405 또는 pK18mobsacB-BBD29_00405G597A를 얻었다. 플라스미드에는 카나마이신 내성 마커가 포함되어 있어 카나마이신 스크리닝을 통해 플라스미드가 게놈에 통합된 재조합체를 얻을 수 있다.
pK18mobsacB-BBD29_00405는 셔틀 플라스미드 pkl8mobsacB의 Xba I 분해 부위 사이에 통합 상동 암 단편 상류-BBD29_00405-하류(SEQ ID NO: 38)을 삽입하여 얻은 재조합 벡터이다.
pK18mobsacB-BBD29_00405는 셔틀 플라스미드 pkl8mobsacB의 Xba I 분해 부위 사이에 통합 상동 암 단편 상류-BBD29_00405G597A-하류(SEQ ID NO: 39)을 삽입하여 얻은 재조합 벡터이다.
PCR 시스템: l0ХEx Taq 버퍼 5 μL, dNTP 혼합물(각각 2.5mM) 4 μL, Mg2+(25mM) 4 μL, 프라이머(l0pM)는 각각 2 μL, Ex Taq(5U/μL) 0.25 μL, 템플릿은 1 μL이고, 나머지는 물이며, 총 부피는 50 μL이다.
상기 PCR 증폭은 다음과 같은 방식으로 수행되었다. 94℃에서 5분 동안 사전 변성, 94℃에서 30초 동안 변성, 52℃에서 30초 동안 어닐링, 72℃에서 180초 동안 연장(30 사이클)시킨 다음, 72℃에서 10분 동안 과도 연장시켰다.
두 개의 통합 플라스미드를 각각 코리네박테리움 글루타미쿰 YPGLU001(생물 보관 번호 CGMCC No. 21220) 균주로 전기 전환하고, 생성된 단일 콜로니를 배양하여 P13/P14 프라이머로 PCR 동정을 수행하여, 약 1970 bp(SEQ ID NO: 40) 크기로 PCR 증폭된 단편을 함유하는 단일 콜로니는 양성 균주로 확인되었고, 단편으로 증폭되지 않은 단일 콜로니는 원균으로 확인되었다. 양성 균주를 15% 자당으로 스크리닝하고 각각 카나마이신을 함유한 배지와 카나마이신을 함유하지 않은 배지에서 배양하였다. 카나마이신을 함유하지 않은 배지에서 성장하나 카나마이신을 함유한 배지에서는 성장하지 않는 균주는 P15/P16 프라이머를 사용하여 PCR로 추가로 동정을 수행하여, 약 1758bp(SEQ ID NO: 41) 크기로 증폭된 균주는 BBD29_00405 또는 BBD29_00405G597A 유전자가 코리네박테리움 글루타미쿰 YPGLU001(생물 보관 번호 CGMCC No. 21220)의 게놈에 통합된 균주이며, 이는 YPG-026(돌연변이 부위 없음) 및 YPG-027(돌연변이 부위 있음)로 명명하였다.
P13: 5' GTCCAAGGTGACGGCCGCAC 3'
P14: 5' AGCTTCGCCGATGTTGCGCA 3'
P15: 5' AGGTTGCACCCGCCATCGCTGCA 3'
P16: 5' ATATTCGGCCCAGCAGCAGC 3'
재조합 박테리아 YPG-026은 통합 상동 암 단편의 상류-BBD29_00405-하류(SEQ ID NO: 38)를 균주 코리네박테리움 글루타미쿰 YPGLU001의 게놈에 통합하여 SEQ ID NO: 1에 표시된 BBD29_00405 유전자의 이중 사본을 포함하는 재조합 박테리아를 얻고, BBD29_00405 유전자의 이중 사본을 포함하는 재조합 박테리아는 BBD29_00405 유전자의 발현량을 현저하고 안정적으로 향상시킬 수 있다.
재조합 박테리아 YPG027은 균주 코리네박테리움 글루타미쿰 YPGLU001의 게놈에 통합 상동 암 단편 상류-BBD29_00405G597A-하류(SEQ ID NO: 39)을 통합하여, SEQ ID NO: 2에 표시된 BBD29_00405G597A 돌연변이 유전자를 포함하는 재조합 박테리아이다.
실시예 4 플라스미드에서 BBD29_00405 또는 BBD29_00405G597A 유전자를 과발현하는 공학 균주 구성
NCBI에 개시된 코리네박테리움 글루타미쿰 ATCC13869의 게놈(GenBank: CP016335.1) 서열을 기반으로, BBD29_00405 유전자의 코딩 영역 및 프로모터 영역을 증폭하는 한 쌍의 프라이머를 설계하고 합성하였으며, 프라이머는 다음과 같이 설계하였다(상하이 invitrogen사에서 합성).
P17: 5' GCTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCGTAGTGCTCGTCGT GGTAGG 3'
P18: 5' ATCAGGCTGAAAATCTTCTCTCATCCGCCAAAACCTAGCCGGCGTAAGG ATCCCGGAT 3'
구성 방법: ATCC13869 또는 YPG-0025를 각각 템플릿으로 사용하고 프라이머 P17/P18로 PCR 증폭을 수행하여, 약 1807bp 의 BBD29_00405를 함유한 DNA 분자(SEQ ID NO: 42) 또는 BBD29_00405G597A를 함유한 DNA 분자(SEQ ID NO: 43)를 얻었다. 증폭된 생성물을 전기 영동으로 회수하여, 컬럼 DNA 겔 회수 키트를 사용하여 원하는 1807bp의 DNA 단편을 회수하고, NEBuider 재조합 시스템을 사용하여 EcoR I 분해에 의해 회수된 셔틀 플라스미드 pXMJ19( BioVector NTCC BiovectorpXMJ19)에 결합하여, 과발현 플라스미드 pXMJ19-BBD29_00405 또는 pXMJ19℃00405G597A를 얻었다. 플라스미드는 클로람페니콜 내성 마커를 포함하며 클로람페니콜 스크리닝을 통해 플라스미드가 균주로 형질 전환될 수 있다.
PCR 시스템: l0ХEx Taq 버퍼 5 μL , dNTP 혼합물(각각 2.5mM) 4 μL , Mg2+(25mM) 4 μL, 프라이머(l0pM) 각각 2 μL, Ex Taq(5U/μL) 0.25 μL, 템플렛은 1 μL이고, 나머지는 물이며, 총 부피는 50 μL이다.
상기 PCR 증폭은 다음과 같은 방식으로 수행되었다. 94℃에서 5분 동안 사전 변성, 94℃에서 30초 동안 변성, 52℃에서 30초 동안 어닐링, 72℃에서 100초 동안 연장(30사이클)시킨 다음, 72℃에서 l0분 동안 과도 연장시킨다.
재조합 벡터 pXMJ19-BBD29_00405는, BBD29_00405를 함유한 DNA 분자(SEQ ID NO: 42)를 셔틀 플라스미드 pXMJ19의 EcoR I 분해 부위 사이에 삽입하여 얻은 재조합 벡터이다.
재조합 벡터 pXMJ19-BBD29_00405G597A는, BBD29_00405G597A를 함유한 DNA 분자(SEQ ID NO: 43)를 셔틀 플라스미드 pXMJ19의 EcoR I 분해 부위 사이에 삽입하여 얻은 재조합 벡터이다.
플라스미드를 코리네박테리움 글루타미쿰 YPGLU001(생물 보관 번호 CGMCC No. 21220)로 전기 전환시키고, 생성된 단일 콜로니를 배양하여 M13R(-48) 및 P18 프라이머를 사용하여 PCR 동정을 수행하여, 약 1846bp 크기로 증폭된 PCR 단편(SEQ ID NO: 44)을 포함하는 균주를 전이 균주로 확인하고, 이를 YPG-028(점 돌연변이 없음) 및 YPG-029(점 돌연변이 있음)로 명명하였다.
M13R(-48)의 서열은 다음과 같다.
5'AGCGGATAAC AATTTCACAC AGGA3'
재조합 박테리아 YPG-028은 SEQ ID NO: 1에 표시된 BBD29_00405 유전자의 이중 사본을 포함한다. 재조합 박테리아 YPG-028은 플라스미드, 즉 염색체 외부에서 플라스미드 pXMJ19-BBD29_00405에 의해 야생형 BBD29_00405 유전자를 과발현하는 공학 박테리아이다.
재조합 박테리아 YPG-029는 SEQ ID NO: 2에 표시된 돌연변이된 BBD29_00405G597A 유전자를 포함한다. 재조합 박테리아 YPG-029는 플라스미드, 즉 염색체 외부에서 플라스미드 pXMJ19-BBD29_00405G597A에 의해 돌연변이형 BBD29_00405G597A 유전자를 과발현하는 공학 박테리아이다.
실시예 5 게놈에서 BBD29_00405 유전자가 누락된 공학 균주 구성
NCBI에서 개시한 코리네박테리움 글루타미쿰 ATCC13869의 게놈(GenBank: CP016335.1) 서열을 기반으로, 두 쌍의 BBD29_00405 유전자의 코딩 영역 양단에 있는 단편을 증폭하는 프라이머를 합성하여, 상류 및 하류 상동 암 단편으로 하였다. 프라이머는 다음과 같이 설계되었다(상하이 잉쥔사에서 합성).
P19: 5' CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGGTCTGGGGGTGAG CGCGGAT 3'
P20: 5' AGGAAAATAACGCATCCATCTGCCCCTTTACAAATCCACCGCAAACACTG GGAT 3'
P21: 5' TGGATTTGTAAAGGGGCAGATGGATGCGTTATTTTCCTTCACTTTTCGTATC CA 3'
P22: 5' CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCCTCTGGCGCATCG AACAGGTCGAAGGA 3'
코리네박테리움 글루타미쿰 ATCC13869를 템플릿으로 사용하고 P19/P20 및 P21/P22를 프라이머로 각각 PCR 증폭을 수행하여, 709bp(SEQ ID NO: 45)의 상류 상동 암 단편(SEQ ID NO: 45) 및 734bp(SEQ ID NO: 46)의 하류 상동 암 단편을 얻었다. 프라이머 P19/P22를 사용하여 중첩 PCR을 수행하여 1405bp(SEQ ID NO: 47)의 전체 상동 암 단편을 얻었다. PCR 반응이 완료된 후, 증폭된 생성물을 전기 영동으로 회수하고, 컬럼 DNA 겔 회수 키트를 사용하여 원하는 1405bp의 DNA 단편을 회수하고, NEBuiderM 재조합 시스템을 통해 Xba I로 분해하여 회수된 셔틀 플라스미드를 pkl8mobsacB 플라스미드에 결합하여, 녹아웃 플라스미드를 얻었다. 이 플라스미드에는 카나마이신 내성 마커가 포함되어 있다.
녹아웃 플라스미드를 코리네박테리움 글루타미쿰 YPGLU001(생물 보관 번호 CGMCC No. 21220)로 전기 전환하고, 생성된 단일 콜로니를 배양한 다음, 각각 아래 프라이머(상하이 잉쥔사에서 합성)를 사용하여 PCR 동정을 수행하였다.
P23: 5' GTCTGGGGGTGAGCGCGGAT 3'
P24: 5' CTCTGGCGCATCGAACAGGTCGAAGGA 3'
상술한 PCR로 약 1331bp(SEQ ID NO: 49) 및 2804bp(SEQ ID NO: 48) 크기의 밴드가 증폭된 균주는 양성 균주이고, 2804bp 크기의 밴드만 증폭된 균주는 원주이다. 양성 균주를 15% 자당 배지에서 스크리닝한 후, 카나마이신을 함유한 배지와 카나마이신을 함유하지 않은 배지에서 각각 배양하였고, 카나마이신을 함유하지 않은 배지에서 성장하나 카나마이신을 함유한 배지에서 성장하지 않는 균주를 선택하여, P23/P24 프라이머를 사용하여 PCR로 추가 동정을 수행하였다. 1331bp 크기의 밴드가 증폭된 균주는 BBD29_00405 유전자의 코딩 영역이 녹아웃된 유전자 공학 균주이고, 이를 YPG-030으로 명명하였다.
재조합 박테리아 YPG-030는 코리네박테리움 글루타미쿰 CGMCC No. 21220의 게놈에서 BBD29_00405 유전자가 녹아웃된 균주이다.
실시예 6 L-글루탐산 발효 실험
실시예 2 내지 5에서 구성된 균주 YPG-025, YPG-026, YPG-027, YPG-028, YPG-029, YPG-030 및 코리네박테리움 글루타미쿰 YPGLU001(생물 보관 번호 CGMCC No. 21220) 원래 균주를 표 3에 표시된 배지와 표 4에 표시된 발효 제어 공정을 사용하여BLBIO-5GC-4-H 모델의 발효기(상하이 바이룬 바이오테크놀로지 유한공사에서 구입)에서 발효 실험을 수행하여 발효 생성물을 수집하였다.
접종을 완료한 초기 시각, 시스템 균 농도는 15g/L이다. 발효 과정: 50-55% 포도당 수용액을 첨가하여 시스템 당 함량(잔당)을 제어하였다.
각 균주를 세 번 반복하여 실험하였으며, 결과를 표 5에 표시하였다.
상술한 발효 배지는, 표 3에 표시된 용질을 물에 용해하여 얻어진 발효 배지이다.
결과는 표 5에 표시된 바와 같이, L-글루탐산을 생산하는 공학 박테리아 코리네박테리움 글루타미쿰 YPGLU001(생물 보존 번호 CGMCC No. 21220)에서, BBD29_00405 유전자의 코딩 영역에 대한 BBD29_00405G597A의 점 돌연변이는, 모두 ^글루탐산 생산에 기여하였다. BBD29_00405. BBD29_00405G597A를 과발현하는 것은 L-글루탐산 생산양 증가에 도움이 있으나, BBD29_00405 유전자의 녹아웃은 L-글루탐산 축적에 불리하였다.
이상에서 본 발명에 대해 설명하였다. 그러나, 본 발명은 이러한 실시예에 한정되지 않는다. 본 발명의 정신 및 원칙 내에서 이루어진 모든 수정, 균등한 대체 및 개선 등은 모두 본 발명의 보호 범위 내에 포함되어야 한다.
산업화 적용
본 발명은 BBD29_00405 유전자를 녹아웃시킴으로써, 이 유전자에 의해 코팅되는 생성물이 L-글루탐산을 생산하는 능력에 영향을 미치는 것으로 밝혀졌다. 코딩 서열에 점 돌연변이를 도입하거나, 이 유전자의 사본 수를 증가시키거나 과발현시켜 재조합 균주를 획득하고, 획득한 균주는 변형되지 않은 균주에 비해 고농도의 L-글루탐산을 생산하는 데 유리하였다. 본 발명이 제공하는 CTD-2256P15.2 또는 이에 의해 코딩되는 마이크로 펩티드 PACMP의 억제제는, 종양 세포 또는 종양 조직에 작용할 때 종양 세포의 생장을 현저히 억제하고, 종양 세포의 사멸을 증가시키며 종양 부피를 감소시켜 우수한 항종양 효과를 가진다. 본 발명이 제공하는 새로운 항종양 의약품 조합 방안은 CTD-2256P15.2의 억제제 또는 암호화 된 마이크로 펩티드 PACMP의 억제제를 다른 항종양 의약품에 결합하여 사용하면, 종양 세포에 대한 항종양 의약품의 살상 효과를 크게 향상시키고, 종양 세포의 화학적 저항성을 감소시켜 종양의 임상 치료 효과를 개선할 수 있다. CTD-2256P15.2는 화학요법에 내성이 있는 종양 조직 및 세포주에서 높게 발현되었으며, 그 높은 발현은 종양 환자의 무질병 진행 생존율 및 전체 생존율과 유의한 마이너스 관계가 있다. 본 발명이 제공하는 CTD2256P15.2 유전자 발현 수준을 종양 환자의 화학 요법에 대한 민감성 및 예후를 예측하는 분자 지표로 적용함으로써, 종양 환자의 임상 화확 요법 약품을 효과적으로 안내하고 치료 예후를 평가하기 위한 새로운 표준을 개척하였다.
구체적으로, 본 발명은 먼저 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) CGMCC No. 21220의 BBD29_00405 유전자에서 코딩 영역(SEQ ID NO: 1)의 코딩 영역에 대립 유전자 치환에 의한 점 돌연변이를 도입하여, 점 돌연변이(G-A)를 포함하는 유전자 공학 박테리아 YPG-025를 구성하였다. 생산된 박테리아에서 야생형 BBD29_00405 유전자 또는 그 돌연변이 유전자BBD29_00405G597A의 과발현이 L-글루탐산의 생산량을 증가시킬 수 있는지 추가로 조사하고 검증하기 위해, 외인성 유전자를 각각 숙주 염색체에 통합하거나 플라스미드에 의해 염색체의 외부에서 발현하여, 게놈과 플라스미드에서 BBD29_00405 유전자 또는 BBD29_00405G597A 유전자를 과발현하는 공학 박테리아 YPG-026. YPG-027. YPG-028 및 YPG-029를 구성하였다. 실험 결과, BBD29_00405 유전자 및 이의 변이체는 L-글루탐산의 생합성에 관여하는 것으로 나타났으며, 미생물에서 L-글루탐산의 축적양은 BBD29_00405 유전자의 과발현 또는 녹아웃 또는 정점 돌연변이(예를 들어, 점 돌연변이)에 의해 조절할 수 있다. BBD29_00405 유전자의 코딩 영역에 대해 점 돌연변이를 일으키거나 생산된 박테리아에서 BBD29_00405 유전자 또는 그 돌연변이 유전자 BBD29_00405G597A의 과발현은, L-글루탐산 생산량 및 전환율을 높이는 데 도움이 되지만, BBD29_00405 유전자의 녹아웃 또는 약화는 L-글루탐산의 축적에 불리하였다. BBD29_00405 유전자 및 이의 변이체(예를 들어, BBD29_00405G597A 유전자)로 L-글루탐산을 생성하기 위한 유전자 공학 균주를 구성하여, L-글루탐산 생산량 개선을 촉진하고, 산업화 생산에 부합되는 높은 수율, 고품질 균주를 배양하는 데 사용할 수 있으며, 이는 L-글루탐산의 산업화 생산에 광범위한 적용 가치와 중요한 경제적 중요성을 가지고 있다.
SEQUENCE LISTING
<110> 닝샤 이핀 생명 과학기술 주식 유한회사
<120>L-글루탐산 생산성이 향상된 균주 및 이의 구성 방법 및 적용
<150>CN202011631311.X
<151>2020-12-30
<160> 49
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1473
<212> DNA
<213>코리네박테리움 글루타미쿰(Corynebacterium glutamicum)
<400> 1
atgactatta atgtctccga actacttgcc aaagtcccca cgggtctact gattggtgat 60
tcctgggtgg aagcatccga gggcggtact ttcgatgtgg aaaacccagc gacgggtgaa 120
acaatcgcaa cgctcgcgtc tgctacttcc gaggatgcac tggctgctct tgatgctgca 180
tgcgctgttc aggccgagtg ggctaggacg ccagcgcgcg agcgttctaa tattttacga 240
cgcggtttcg agctcgtcgc ggaacgtgca gaagagttcg ccaccctcat gaccttggaa 300
atgggcaaac ctttggctga agctcgcggc gaagtcacct acggcaacga attcctgcgc 360
tggttctctg aggaagcagt ccgcctctac ggccgctacg gtgctacccc agaaggcaac 420
ctgcgcatga tgaccacccg caaaccagtt ggcccctgcc tgttgatcac cccatggaac 480
ttcccactag caatggccac ccgtaaggtt gcacccgcca tcgctgcagg ttgtgtcatg 540
gtgctcaagc cagctcgcct gaccccgctg acctcccagt attttgccca gaccatgctt 600
gatgccggtc ttccagcagg tgtcctcaat gtggtctccg gtgcttccgc ctctgcgatt 660
tccaacccga ttatggaaga cgatcgcctt cgtaaagtct cattcaccgg ctccacccca 720
gttggccagc agctgctcaa aaaggctgcc gataaagttc tgcgcacctc catggaactc 780
ggcggcaacg cacctttcat tgtcttcgag gacgccgacc tagatctcgc gatcgaaggt 840
gccatgggcg caaaaatgcg caacatcggc gaagcttgca ccgcagccaa ccgtttccta 900
gtccacgaat ccgtcgccga tgaattcggc cgacgcttcg cagcccgcct cgaggaacaa 960
gtcctaggca acggcctcga cgaaggcgtc accgtaggcc cattggttga ggaaaaagca 1020
cgaaacagcg ttgcatcgct tgtcgacgcc gccgtctccg aaggtgccac cgtcctcacc 1080
ggtggcaagg ccggcacagg tgcaggctac ttctacgaac caacggtgct cacgggagtt 1140
tcaacagatg cagccatcct gaacgaagag atcttcggtc ccgtcgcacc gatcgtcacc 1200
ttctctgatg aagctgaagc tctgcgccta gccaattcca ccgaatacgg cctggcctcc 1260
tacgtgttca cccaagacac ctcacgcatc ttccgcgtct ccgacggcct cgagttcggc 1320
ctagtgggcg tcaactccgg tgtcatctct aacgccgctg caccttttgg tggcgtaaaa 1380
caatccggaa tgggccgcga aggtggtctc gaaggaattg aagagtacac ctccgtgcag 1440
tacatcggta tccgggatcc ttacgccggc tag 1473
<210> 2
<211> 1473
<212> DNA
<213>코리네박테리움 글루타미쿰(Corynebacterium glutamicum)
<400> 2
atgactatta atgtctccga actacttgcc aaagtcccca cgggtctact gattggtgat 60
tcctgggtgg aagcatccga gggcggtact ttcgatgtgg aaaacccagc gacgggtgaa 120
acaatcgcaa cgctcgcgtc tgctacttcc gaggatgcac tggctgctct tgatgctgca 180
tgcgctgttc aggccgagtg ggctaggacg ccagcgcgcg agcgttctaa tattttacga 240
cgcggtttcg agctcgtcgc ggaacgtgca gaagagttcg ccaccctcat gaccttggaa 300
atgggcaaac ctttggctga agctcgcggc gaagtcacct acggcaacga attcctgcgc 360
tggttctctg aggaagcagt ccgcctctac ggccgctacg gtgctacccc agaaggcaac 420
ctgcgcatga tgaccacccg caaaccagtt ggcccctgcc tgttgatcac cccatggaac 480
ttcccactag caatggccac ccgtaaggtt gcacccgcca tcgctgcagg ttgtgtcatg 540
gtgctcaagc cagctcgcct gaccccgctg acctcccagt attttgccca gaccatactt 600
gatgccggtc ttccagcagg tgtcctcaat gtggtctccg gtgcttccgc ctctgcgatt 660
tccaacccga ttatggaaga cgatcgcctt cgtaaagtct cattcaccgg ctccacccca 720
gttggccagc agctgctcaa aaaggctgcc gataaagttc tgcgcacctc catggaactc 780
ggcggcaacg cacctttcat tgtcttcgag gacgccgacc tagatctcgc gatcgaaggt 840
gccatgggcg caaaaatgcg caacatcggc gaagcttgca ccgcagccaa ccgtttccta 900
gtccacgaat ccgtcgccga tgaattcggc cgacgcttcg cagcccgcct cgaggaacaa 960
gtcctaggca acggcctcga cgaaggcgtc accgtaggcc cattggttga ggaaaaagca 1020
cgaaacagcg ttgcatcgct tgtcgacgcc gccgtctccg aaggtgccac cgtcctcacc 1080
ggtggcaagg ccggcacagg tgcaggctac ttctacgaac caacggtgct cacgggagtt 1140
tcaacagatg cagccatcct gaacgaagag atcttcggtc ccgtcgcacc gatcgtcacc 1200
ttctctgatg aagctgaagc tctgcgccta gccaattcca ccgaatacgg cctggcctcc 1260
tacgtgttca cccaagacac ctcacgcatc ttccgcgtct ccgacggcct cgagttcggc 1320
ctagtgggcg tcaactccgg tgtcatctct aacgccgctg caccttttgg tggcgtaaaa 1380
caatccggaa tgggccgcga aggtggtctc gaaggaattg aagagtacac ctccgtgcag 1440
tacatcggta tccgggatcc ttacgccggc tag 1473
<210> 3
<211> 490
<212> PRT
<213>코리네박테리움 글루타미쿰(Corynebacterium glutamicum)
<400> 3
Met Thr Ile Asn Val Ser Glu Leu Leu Ala Lys Val Pro Thr Gly Leu
1 5 10 15
Leu Ile Gly Asp Ser Trp Val Glu Ala Ser Glu Gly Gly Thr Phe Asp
20 25 30
Val Glu Asn Pro Ala Thr Gly Glu Thr Ile Ala Thr Leu Ala Ser Ala
35 40 45
Thr Ser Glu Asp Ala Leu Ala Ala Leu Asp Ala Ala Cys Ala Val Gln
50 55 60
Ala Glu Trp Ala Arg Thr Pro Ala Arg Glu Arg Ser Asn Ile Leu Arg
65 70 75 80
Arg Gly Phe Glu Leu Val Ala Glu Arg Ala Glu Glu Phe Ala Thr Leu
85 90 95
Met Thr Leu Glu Met Gly Lys Pro Leu Ala Glu Ala Arg Gly Glu Val
100 105 110
Thr Tyr Gly Asn Glu Phe Leu Arg Trp Phe Ser Glu Glu Ala Val Arg
115 120 125
Leu Tyr Gly Arg Tyr Gly Ala Thr Pro Glu Gly Asn Leu Arg Met Met
130 135 140
Thr Thr Arg Lys Pro Val Gly Pro Cys Leu Leu Ile Thr Pro Trp Asn
145 150 155 160
Phe Pro Leu Ala Met Ala Thr Arg Lys Val Ala Pro Ala Ile Ala Ala
165 170 175
Gly Cys Val Met Val Leu Lys Pro Ala Arg Leu Thr Pro Leu Thr Ser
180 185 190
Gln Tyr Phe Ala Gln Thr Met Leu Asp Ala Gly Leu Pro Ala Gly Val
195 200 205
Leu Asn Val Val Ser Gly Ala Ser Ala Ser Ala Ile Ser Asn Pro Ile
210 215 220
Met Glu Asp Asp Arg Leu Arg Lys Val Ser Phe Thr Gly Ser Thr Pro
225 230 235 240
Val Gly Gln Gln Leu Leu Lys Lys Ala Ala Asp Lys Val Leu Arg Thr
245 250 255
Ser Met Glu Leu Gly Gly Asn Ala Pro Phe Ile Val Phe Glu Asp Ala
260 265 270
Asp Leu Asp Leu Ala Ile Glu Gly Ala Met Gly Ala Lys Met Arg Asn
275 280 285
Ile Gly Glu Ala Cys Thr Ala Ala Asn Arg Phe Leu Val His Glu Ser
290 295 300
Val Ala Asp Glu Phe Gly Arg Arg Phe Ala Ala Arg Leu Glu Glu Gln
305 310 315 320
Val Leu Gly Asn Gly Leu Asp Glu Gly Val Thr Val Gly Pro Leu Val
325 330 335
Glu Glu Lys Ala Arg Asn Ser Val Ala Ser Leu Val Asp Ala Ala Val
340 345 350
Ser Glu Gly Ala Thr Val Leu Thr Gly Gly Lys Ala Gly Thr Gly Ala
355 360 365
Gly Tyr Phe Tyr Glu Pro Thr Val Leu Thr Gly Val Ser Thr Asp Ala
370 375 380
Ala Ile Leu Asn Glu Glu Ile Phe Gly Pro Val Ala Pro Ile Val Thr
385 390 395 400
Phe Ser Asp Glu Ala Glu Ala Leu Arg Leu Ala Asn Ser Thr Glu Tyr
405 410 415
Gly Leu Ala Ser Tyr Val Phe Thr Gln Asp Thr Ser Arg Ile Phe Arg
420 425 430
Val Ser Asp Gly Leu Glu Phe Gly Leu Val Gly Val Asn Ser Gly Val
435 440 445
Ile Ser Asn Ala Ala Ala Pro Phe Gly Gly Val Lys Gln Ser Gly Met
450 455 460
Gly Arg Glu Gly Gly Leu Glu Gly Ile Glu Glu Tyr Thr Ser Val Gln
465 470 475 480
Tyr Ile Gly Ile Arg Asp Pro Tyr Ala Gly
485 490
<210> 4
<211> 490
<212> PRT
<213>코리네박테리움 글루타미쿰(Corynebacterium glutamicum)
<400> 4
Met Thr Ile Asn Val Ser Glu Leu Leu Ala Lys Val Pro Thr Gly Leu
1 5 10 15
Leu Ile Gly Asp Ser Trp Val Glu Ala Ser Glu Gly Gly Thr Phe Asp
20 25 30
Val Glu Asn Pro Ala Thr Gly Glu Thr Ile Ala Thr Leu Ala Ser Ala
35 40 45
Thr Ser Glu Asp Ala Leu Ala Ala Leu Asp Ala Ala Cys Ala Val Gln
50 55 60
Ala Glu Trp Ala Arg Thr Pro Ala Arg Glu Arg Ser Asn Ile Leu Arg
65 70 75 80
Arg Gly Phe Glu Leu Val Ala Glu Arg Ala Glu Glu Phe Ala Thr Leu
85 90 95
Met Thr Leu Glu Met Gly Lys Pro Leu Ala Glu Ala Arg Gly Glu Val
100 105 110
Thr Tyr Gly Asn Glu Phe Leu Arg Trp Phe Ser Glu Glu Ala Val Arg
115 120 125
Leu Tyr Gly Arg Tyr Gly Ala Thr Pro Glu Gly Asn Leu Arg Met Met
130 135 140
Thr Thr Arg Lys Pro Val Gly Pro Cys Leu Leu Ile Thr Pro Trp Asn
145 150 155 160
Phe Pro Leu Ala Met Ala Thr Arg Lys Val Ala Pro Ala Ile Ala Ala
165 170 175
Gly Cys Val Met Val Leu Lys Pro Ala Arg Leu Thr Pro Leu Thr Ser
180 185 190
Gln Tyr Phe Ala Gln Thr Ile Leu Asp Ala Gly Leu Pro Ala Gly Val
195 200 205
Leu Asn Val Val Ser Gly Ala Ser Ala Ser Ala Ile Ser Asn Pro Ile
210 215 220
Met Glu Asp Asp Arg Leu Arg Lys Val Ser Phe Thr Gly Ser Thr Pro
225 230 235 240
Val Gly Gln Gln Leu Leu Lys Lys Ala Ala Asp Lys Val Leu Arg Thr
245 250 255
Ser Met Glu Leu Gly Gly Asn Ala Pro Phe Ile Val Phe Glu Asp Ala
260 265 270
Asp Leu Asp Leu Ala Ile Glu Gly Ala Met Gly Ala Lys Met Arg Asn
275 280 285
Ile Gly Glu Ala Cys Thr Ala Ala Asn Arg Phe Leu Val His Glu Ser
290 295 300
Val Ala Asp Glu Phe Gly Arg Arg Phe Ala Ala Arg Leu Glu Glu Gln
305 310 315 320
Val Leu Gly Asn Gly Leu Asp Glu Gly Val Thr Val Gly Pro Leu Val
325 330 335
Glu Glu Lys Ala Arg Asn Ser Val Ala Ser Leu Val Asp Ala Ala Val
340 345 350
Ser Glu Gly Ala Thr Val Leu Thr Gly Gly Lys Ala Gly Thr Gly Ala
355 360 365
Gly Tyr Phe Tyr Glu Pro Thr Val Leu Thr Gly Val Ser Thr Asp Ala
370 375 380
Ala Ile Leu Asn Glu Glu Ile Phe Gly Pro Val Ala Pro Ile Val Thr
385 390 395 400
Phe Ser Asp Glu Ala Glu Ala Leu Arg Leu Ala Asn Ser Thr Glu Tyr
405 410 415
Gly Leu Ala Ser Tyr Val Phe Thr Gln Asp Thr Ser Arg Ile Phe Arg
420 425 430
Val Ser Asp Gly Leu Glu Phe Gly Leu Val Gly Val Asn Ser Gly Val
435 440 445
Ile Ser Asn Ala Ala Ala Pro Phe Gly Gly Val Lys Gln Ser Gly Met
450 455 460
Gly Arg Glu Gly Gly Leu Glu Gly Ile Glu Glu Tyr Thr Ser Val Gln
465 470 475 480
Tyr Ile Gly Ile Arg Asp Pro Tyr Ala Gly
485 490
<210> 5
<211> 56
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 5
cagtgccaag cttgcatgcc tgcaggtcga ctctagatga ctattaatgt ctccga 56
<210> 6
<211> 27
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 6
agaccggcat caagtatggt ctgggca 27
<210> 7
<211> 27
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 7
tgcccagacc atacttgatg ccggtct 27
<210> 8
<211> 62
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 8
cagctatgac catgattacg aattcgagct cggtacccct agccggcgta aggatcccgg 60
at 62
<210> 9
<211> 20
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 9
agaaggcaac ctgcgcatga 20
<210> 10
<211> 20
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 10
atcgggttgg aaatcgcaga 20
<210> 11
<211> 56
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 11
cagtgccaag cttgcatgcc tgcaggtcga ctctaggacc cgcttgccat acgaag 56
<210> 12
<211> 40
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 12
cctaccacga cgagcactac atctactcat ctgaagaatc 40
<210> 13
<211> 40
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 13
gattcttcag atgagtagat gtagtgctcg tcgtggtagg 40
<210> 14
<211> 40
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 14
caaaccagag tgcccacgaa ctagccggcg taaggatccc 40
<210> 15
<211> 40
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 15
gggatcctta cgccggctag ttcgtgggca ctctggtttg 40
<210> 16
<211> 58
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 16
cagctatgac catgattacg aattcgagct cggtacccca taagaaacaa ccacttcc 58
<210> 17
<211> 20
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 17
gtccaaggtg acggccgcac 20
<210> 18
<211> 20
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 18
agcttcgccg atgttgcgca 20
<210> 19
<211> 23
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 19
aggttgcacc cgccatcgct gca 23
<210> 20
<211> 20
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 20
atattcggcc cagcagcagc 20
<210> 21
<211> 56
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 21
gcttgcatgc ctgcaggtcg actctagagg atccccgtag tgctcgtcgt ggtagg 56
<210> 22
<211> 58
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 22
atcaggctga aaatcttctc tcatccgcca aaacctagcc ggcgtaagga tcccggat 58
<210> 23
<211> 56
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 23
cagtgccaag cttgcatgcc tgcaggtcga ctctaggtct gggggtgagc gcggat 56
<210> 24
<211> 54
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 24
aggaaaataa cgcatccatc tgccccttta caaatccacc gcaaacactg ggat 54
<210> 25
<211> 54
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 25
tggatttgta aaggggcaga tggatgcgtt attttccttc acttttcgta tcca 54
<210> 26
<211> 65
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 26
cagctatgac catgattacg aattcgagct cggtacccct ctggcgcatc gaacaggtcg 60
aagga 65
<210> 27
<211> 20
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 27
gtctgggggt gagcgcggat 20
<210> 28
<211> 27
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 28
ctctggcgca tcgaacaggt cgaagga 27
<210> 29
<211> 647
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 29
cagtgccaag cttgcatgcc tgcaggtcga ctctagatga ctattaatgt ctccgaacta 60
cttgccaaag tccccacggg tctactgatt ggtgattcct gggtggaagc atccgagggc 120
ggtactttcg atgtggaaaa cccagcgacg ggtgaaacaa tcgcaacgct cgcgtctgct 180
acttccgagg atgcactggc tgctcttgat gctgcatgcg ctgttcaggc cgagtgggct 240
aggacgccag cgcgcgagcg ttctaatatt ttacgacgcg gtttcgagct cgtcgcggaa 300
cgtgcagaag agttcgccac cctcatgacc ttggaaatgg gcaaaccttt ggctgaagct 360
cgcggcgaag tcacctacgg caacgaattc ctgcgctggt tctctgagga agcagtccgc 420
ctctacggcc gctacggtgc taccccagaa ggcaacctgc gcatgatgac cacccgcaaa 480
ccagttggcc cctgcctgtt gatcacccca tggaacttcc cactagcaat ggccacccgt 540
aaggttgcac ccgccatcgc tgcaggttgt gtcatggtgc tcaagccagc tcgcctgacc 600
ccgctgacct cccagtattt tgcccagacc atacttgatg ccggtct 647
<210> 30
<211> 927
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 30
tgcccagacc atacttgatg ccggtcttcc agcaggtgtc ctcaatgtgg tctccggtgc 60
ttccgcctct gcgatttcca acccgattat ggaagacgat cgccttcgta aagtctcatt 120
caccggctcc accccagttg gccagcagct gctcaaaaag gctgccgata aagttctgcg 180
cacctccatg gaactcggcg gcaacgcacc tttcattgtc ttcgaggacg ccgacctaga 240
tctcgcgatc gaaggtgcca tgggcgcaaa aatgcgcaac atcggcgaag cttgcaccgc 300
agccaaccgt ttcctagtcc acgaatccgt cgccgatgaa ttcggccgac gcttcgcagc 360
ccgcctcgag gaacaagtcc taggcaacgg cctcgacgaa ggcgtcaccg taggcccatt 420
ggttgaggaa aaagcacgaa acagcgttgc atcgcttgtc gacgccgccg tctccgaagg 480
tgccaccgtc ctcaccggtg gcaaggccgg cacaggtgca ggctacttct acgaaccaac 540
ggtgctcacg ggagtttcaa cagatgcagc catcctgaac gaagagatct tcggtcccgt 600
cgcaccgatc gtcaccttct ctgatgaagc tgaagctctg cgcctagcca attccaccga 660
atacggcctg gcctcctacg tgttcaccca agacacctca cgcatcttcc gcgtctccga 720
cggcctcgag ttcggcctag tgggcgtcaa ctccggtgtc atctctaacg ccgctgcacc 780
ttttggtggc gtaaaacaat ccggaatggg ccgcgaaggt ggtctcgaag gaattgaaga 840
gtacacctcc gtgcagtaca tcggtatccg ggatccttac gccggctagg ggtaccgagc 900
tcgaattcgt aatcatggtc atagctg 927
<210> 31
<211> 1547
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 31
cagtgccaag cttgcatgcc tgcaggtcga ctctagatga ctattaatgt ctccgaacta 60
cttgccaaag tccccacggg tctactgatt ggtgattcct gggtggaagc atccgagggc 120
ggtactttcg atgtggaaaa cccagcgacg ggtgaaacaa tcgcaacgct cgcgtctgct 180
acttccgagg atgcactggc tgctcttgat gctgcatgcg ctgttcaggc cgagtgggct 240
aggacgccag cgcgcgagcg ttctaatatt ttacgacgcg gtttcgagct cgtcgcggaa 300
cgtgcagaag agttcgccac cctcatgacc ttggaaatgg gcaaaccttt ggctgaagct 360
cgcggcgaag tcacctacgg caacgaattc ctgcgctggt tctctgagga agcagtccgc 420
ctctacggcc gctacggtgc taccccagaa ggcaacctgc gcatgatgac cacccgcaaa 480
ccagttggcc cctgcctgtt gatcacccca tggaacttcc cactagcaat ggccacccgt 540
aaggttgcac ccgccatcgc tgcaggttgt gtcatggtgc tcaagccagc tcgcctgacc 600
ccgctgacct cccagtattt tgcccagacc atacttgatg ccggtcttcc agcaggtgtc 660
ctcaatgtgg tctccggtgc ttccgcctct gcgatttcca acccgattat ggaagacgat 720
cgccttcgta aagtctcatt caccggctcc accccagttg gccagcagct gctcaaaaag 780
gctgccgata aagttctgcg cacctccatg gaactcggcg gcaacgcacc tttcattgtc 840
ttcgaggacg ccgacctaga tctcgcgatc gaaggtgcca tgggcgcaaa aatgcgcaac 900
atcggcgaag cttgcaccgc agccaaccgt ttcctagtcc acgaatccgt cgccgatgaa 960
ttcggccgac gcttcgcagc ccgcctcgag gaacaagtcc taggcaacgg cctcgacgaa 1020
ggcgtcaccg taggcccatt ggttgaggaa aaagcacgaa acagcgttgc atcgcttgtc 1080
gacgccgccg tctccgaagg tgccaccgtc ctcaccggtg gcaaggccgg cacaggtgca 1140
ggctacttct acgaaccaac ggtgctcacg ggagtttcaa cagatgcagc catcctgaac 1200
gaagagatct tcggtcccgt cgcaccgatc gtcaccttct ctgatgaagc tgaagctctg 1260
cgcctagcca attccaccga atacggcctg gcctcctacg tgttcaccca agacacctca 1320
cgcatcttcc gcgtctccga cggcctcgag ttcggcctag tgggcgtcaa ctccggtgtc 1380
atctctaacg ccgctgcacc ttttggtggc gtaaaacaat ccggaatggg ccgcgaaggt 1440
ggtctcgaag gaattgaaga gtacacctcc gtgcagtaca tcggtatccg ggatccttac 1500
gccggctagg ggtaccgagc tcgaattcgt aatcatggtc atagctg 1547
<210> 32
<211> 1554
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 32
cagtgccaag cttgcatgcc tgcaggtcga ctctagatga ctattaatgt ctccgaacta 60
cttgccaaag tccccacggg tctactgatt ggtgattcct gggtggaagc atccgagggc 120
ggtactttcg atgtggaaaa cccagcgacg ggtgaaacaa tcgcaacgct cgcgtctgct 180
acttccgagg atgcactggc tgctcttgat gctgcatgcg ctgttcaggc cgagtgggct 240
aggacgccag cgcgcgagcg ttctaatatt ttacgacgcg gtttcgagct cgtcgcggaa 300
cgtgcagaag agttcgccac cctcatgacc ttggaaatgg gcaaaccttt ggctgaagct 360
cgcggcgaag tcacctacgg caacgaattc ctgcgctggt tctctgagga agcagtccgc 420
ctctacggcc gctacggtgc taccccagaa ggcaacctgc gcatgatgac cacccgcaaa 480
ccagttggcc cctgcctgtt gatcacccca tggaacttcc cactagcaat ggccacccgt 540
aaggttgcac ccgccatcgc tgcaggttgt gtcatggtgc tcaagccagc tcgcctgacc 600
ccgctgacct cccagtattt tgcccagacc atacttgatg ccggtcttcc agcaggtgtc 660
ctcaatgtgg tctccggtgc ttccgcctct gcgatttcca acccgattat ggaagacgat 720
cgccttcgta aagtctcatt caccggctcc accccagttg gccagcagct gctcaaaaag 780
gctgccgata aagttctgcg cacctccatg gaactcggcg gcaacgcacc tttcattgtc 840
ttcgaggacg ccgacctaga tctcgcgatc gaaggtgcca tgggcgcaaa aatgcgcaac 900
atcggcgaag cttgcaccgc agccaaccgt ttcctagtcc acgaatccgt cgccgatgaa 960
ttcggccgac gcttcgcagc ccgcctcgag gaacaagtcc taggcaacgg cctcgacgaa 1020
ggcgtcaccg taggcccatt ggttgaggaa aaagcacgaa acagcgttgc atcgcttgtc 1080
gacgccgccg tctccgaagg tgccaccgtc ctcaccggtg gcaaggccgg cacaggtgca 1140
ggctacttct acgaaccaac ggtgctcacg ggagtttcaa cagatgcagc catcctgaac 1200
gaagagatct tcggtcccgt cgcaccgatc gtcaccttct ctgatgaagc tgaagctctg 1260
cgcctagcca attccaccga atacggcctg gcctcctacg tgttcaccca agacacctca 1320
cgcatcttcc gcgtctccga cggcctcgag ttcggcctag tgggcgtcaa ctccggtgtc 1380
atctctaacg ccgctgcacc ttttggtggc gtaaaacaat ccggaatggg ccgcgaaggt 1440
ggtctcgaag gaattgaaga gtacacctcc gtgcagtaca tcggtatccg ggatccttac 1500
gccggctagg ggtaccgagc tcgaattcgt aatcatggtc atagctgttt cctg 1554
<210> 33
<211> 261
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 33
agaaggcaac ctgcgcatga tgaccacccg caaaccagtt ggcccctgcc tgttgatcac 60
cccatggaac ttcccactag caatggccac ccgtaaggtt gcacccgcca tcgctgcagg 120
ttgtgtcatg gtgctcaagc cagctcgcct gaccccgctg acctcccagt attttgccca 180
gaccatgctt gatgccggtc ttccagcagg tgtcctcaat gtggtctccg gtgcttccgc 240
ctctgcgatt tccaacccga t 261
<210> 34
<211> 806
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 34
cagtgccaag cttgcatgcc tgcaggtcga ctctaggacc cgcttgccat acgaagtcct 60
ggagaagatc tccacccgca tcaccaacga agttccagac gtaaaccgcg tggttttgga 120
cgtaacctcc aagccaccag gaaccatcga atgggagtag gccttaaatg agccttcgtt 180
aagcggcaat caccttatcg gtgattgccg ctttcccatt tctccgggtt ttctggaact 240
ttttgggcgt atgctgggaa tgatcttatt attttgattt cagaaagcag gagagaccag 300
atgagcgaaa tccttgaaac ctactgggca ccccacttcg gaaacaccga tgaagccgca 360
gcactcgttt catacttggc acaagcttcc ggtgatccta ttgaggttca caccctgttc 420
ggggatttag gtttagacgg actctctgga aactacaccg acactgagat cgacggctac 480
ggcgacgcat tcctgctggt tgcagcacta gcagtgttga tggctgaaaa caaagcatcc 540
ggcggcgtga atctgggtga agttggggga gctgataaat cgatccggct gcatgttgaa 600
tccaaggaaa acacccagat caacaccgca ttgaagtact ttgcgctttc cccagaagac 660
cacgcagcgg cagatcgctt cgatgaggat gacctgtctg agcttgccaa cttgagtgaa 720
gagctgcgcg gacagctgga ctaattgctg cccgtttaag gagtccgatt cttcagatga 780
gtagatgtag tgctcgtcgt ggtagg 806
<210> 35
<211> 1777
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 35
gattcttcag atgagtagat gtagtgctcg tcgtggtagg tgcgcagcag agattcaggc 60
gcacgaccag aaagcacgtg gctgagcttc cagccggacg ttgtggccgg agtaaaaatc 120
catccaaact ttccgcgatg ctggtaaacc tgtggatgtc aatgcctttg atttgaacta 180
agcacaggac tacctcgacg ccggcgccaa ctttgtccga gtcggtgccg atgtccagca 240
actcaacgct gctggatacg aaaagtgaag gaaaataacg catcatgact attaatgtct 300
ccgaactact tgccaaagtc cccacgggtc tactgattgg tgattcctgg gtggaagcat 360
ccgagggcgg tactttcgat gtggaaaacc cagcgacggg tgaaacaatc gcaacgctcg 420
cgtctgctac ttccgaggat gcactggctg ctcttgatgc tgcatgcgct gttcaggccg 480
agtgggctag gacgccagcg cgcgagcgtt ctaatatttt acgacgcggt ttcgagctcg 540
tcgcggaacg tgcagaagag ttcgccaccc tcatgacctt ggaaatgggc aaacctttgg 600
ctgaagctcg cggcgaagtc acctacggca acgaattcct gcgctggttc tctgaggaag 660
cagtccgcct ctacggccgc tacggtgcta ccccagaagg caacctgcgc atgatgacca 720
cccgcaaacc agttggcccc tgcctgttga tcaccccatg gaacttccca ctagcaatgg 780
ccacccgtaa ggttgcaccc gccatcgctg caggttgtgt catggtgctc aagccagctc 840
gcctgacccc gctgacctcc cagtattttg cccagaccat gcttgatgcc ggtcttccag 900
caggtgtcct caatgtggtc tccggtgctt ccgcctctgc gatttccaac ccgattatgg 960
aagacgatcg ccttcgtaaa gtctcattca ccggctccac cccagttggc cagcagctgc 1020
tcaaaaaggc tgccgataaa gttctgcgca cctccatgga actcggcggc aacgcacctt 1080
tcattgtctt cgaggacgcc gacctagatc tcgcgatcga aggtgccatg ggcgcaaaaa 1140
tgcgcaacat cggcgaagct tgcaccgcag ccaaccgttt cctagtccac gaatccgtcg 1200
ccgatgaatt cggccgacgc ttcgcagccc gcctcgagga acaagtccta ggcaacggcc 1260
tcgacgaagg cgtcaccgta ggcccattgg ttgaggaaaa agcacgaaac agcgttgcat 1320
cgcttgtcga cgccgccgtc tccgaaggtg ccaccgtcct caccggtggc aaggccggca 1380
caggtgcagg ctacttctac gaaccaacgg tgctcacggg agtttcaaca gatgcagcca 1440
tcctgaacga agagatcttc ggtcccgtcg caccgatcgt caccttctct gatgaagctg 1500
aagctctgcg cctagccaat tccaccgaat acggcctggc ctcctacgtg ttcacccaag 1560
acacctcacg catcttccgc gtctccgacg gcctcgagtt cggcctagtg ggcgtcaact 1620
ccggtgtcat ctctaacgcc gctgcacctt ttggtggcgt aaaacaatcc ggaatgggcc 1680
gcgaaggtgg tctcgaagga attgaagagt acacctccgt gcagtacatc ggtatccggg 1740
atccttacgc cggctagttc gtgggcactc tggtttg 1777
<210> 36
<211> 1777
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 36
gattcttcag atgagtagat gtagtgctcg tcgtggtagg tgcgcagcag agattcaggc 60
gcacgaccag aaagcacgtg gctgagcttc cagccggacg ttgtggccgg agtaaaaatc 120
catccaaact ttccgcgatg ctggtaaacc tgtggatgtc aatgcctttg atttgaacta 180
agcacaggac tacctcgacg ccggcgccaa ctttgtccga gtcggtgccg atgtccagca 240
actcaacgct gctggatacg aaaagtgaag gaaaataacg catcatgact attaatgtct 300
ccgaactact tgccaaagtc cccacgggtc tactgattgg tgattcctgg gtggaagcat 360
ccgagggcgg tactttcgat gtggaaaacc cagcgacggg tgaaacaatc gcaacgctcg 420
cgtctgctac ttccgaggat gcactggctg ctcttgatgc tgcatgcgct gttcaggccg 480
agtgggctag gacgccagcg cgcgagcgtt ctaatatttt acgacgcggt ttcgagctcg 540
tcgcggaacg tgcagaagag ttcgccaccc tcatgacctt ggaaatgggc aaacctttgg 600
ctgaagctcg cggcgaagtc acctacggca acgaattcct gcgctggttc tctgaggaag 660
cagtccgcct ctacggccgc tacggtgcta ccccagaagg caacctgcgc atgatgacca 720
cccgcaaacc agttggcccc tgcctgttga tcaccccatg gaacttccca ctagcaatgg 780
ccacccgtaa ggttgcaccc gccatcgctg caggttgtgt catggtgctc aagccagctc 840
gcctgacccc gctgacctcc cagtattttg cccagaccat acttgatgcc ggtcttccag 900
caggtgtcct caatgtggtc tccggtgctt ccgcctctgc gatttccaac ccgattatgg 960
aagacgatcg ccttcgtaaa gtctcattca ccggctccac cccagttggc cagcagctgc 1020
tcaaaaaggc tgccgataaa gttctgcgca cctccatgga actcggcggc aacgcacctt 1080
tcattgtctt cgaggacgcc gacctagatc tcgcgatcga aggtgccatg ggcgcaaaaa 1140
tgcgcaacat cggcgaagct tgcaccgcag ccaaccgttt cctagtccac gaatccgtcg 1200
ccgatgaatt cggccgacgc ttcgcagccc gcctcgagga acaagtccta ggcaacggcc 1260
tcgacgaagg cgtcaccgta ggcccattgg ttgaggaaaa agcacgaaac agcgttgcat 1320
cgcttgtcga cgccgccgtc tccgaaggtg ccaccgtcct caccggtggc aaggccggca 1380
caggtgcagg ctacttctac gaaccaacgg tgctcacggg agtttcaaca gatgcagcca 1440
tcctgaacga agagatcttc ggtcccgtcg caccgatcgt caccttctct gatgaagctg 1500
aagctctgcg cctagccaat tccaccgaat acggcctggc ctcctacgtg ttcacccaag 1560
acacctcacg catcttccgc gtctccgacg gcctcgagtt cggcctagtg ggcgtcaact 1620
ccggtgtcat ctctaacgcc gctgcacctt ttggtggcgt aaaacaatcc ggaatgggcc 1680
gcgaaggtgg tctcgaagga attgaagagt acacctccgt gcagtacatc ggtatccggg 1740
atccttacgc cggctagttc gtgggcactc tggtttg 1777
<210> 37
<211> 788
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 37
gggatcctta cgccggctag ttcgtgggca ctctggtttg gttaccagga tgggttagtc 60
attctgatca gcgaattcca cgttcacatc gccaattcca gagttcacaa ccagattcag 120
cattggacct tctagatcag cattgtgggc ggtgagatct ccaacatcac agcgcgctgt 180
gcccacaccg gcggtacaac ttaggctcac gggcacatca tcgggcaggg tgaccatgac 240
ttcgccgatc cctgaggtga tttggatgtt ttgttcctga tccaattggg tgaggtggct 300
gaaatcgagg ttcatttcac ccacgccaga ggtgtagctg ctgaggagtt catcgttggt 360
ggggatgaga ttgacatcgc cgattccagg gtcgtcttca aagtagatgg gatcgatatt 420
tgaaataaac aggcctgcga gggcgctcat gacaactccg gtaccaacta caccgccgac 480
aatccatggc cacacatggc gctttttctg aggcttttgt ggagggactt gtacatccca 540
ggtgttgtat tggttttggg caagtggatc ccaatgaggc gcttcggggg tttgttgcgc 600
gaagggtgca tagtagccct caacgggggt gatagtgctt agatctggtt ggggttgtgg 660
gtagagatct tcgtttttca tggtggcatc ctcagaaaca gtgaattcag tggtgagtag 720
tccgcggggt ggaagtggtt gtttcttatg gggtaccgag ctcgaattcg taatcatggt 780
catagctg 788
<210> 38
<211> 3291
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 38
cagtgccaag cttgcatgcc tgcaggtcga ctctaggacc cgcttgccat acgaagtcct 60
ggagaagatc tccacccgca tcaccaacga agttccagac gtaaaccgcg tggttttgga 120
cgtaacctcc aagccaccag gaaccatcga atgggagtag gccttaaatg agccttcgtt 180
aagcggcaat caccttatcg gtgattgccg ctttcccatt tctccgggtt ttctggaact 240
ttttgggcgt atgctgggaa tgatcttatt attttgattt cagaaagcag gagagaccag 300
atgagcgaaa tccttgaaac ctactgggca ccccacttcg gaaacaccga tgaagccgca 360
gcactcgttt catacttggc acaagcttcc ggtgatccta ttgaggttca caccctgttc 420
ggggatttag gtttagacgg actctctgga aactacaccg acactgagat cgacggctac 480
ggcgacgcat tcctgctggt tgcagcacta gcagtgttga tggctgaaaa caaagcatcc 540
ggcggcgtga atctgggtga agttggggga gctgataaat cgatccggct gcatgttgaa 600
tccaaggaaa acacccagat caacaccgca ttgaagtact ttgcgctttc cccagaagac 660
cacgcagcgg cagatcgctt cgatgaggat gacctgtctg agcttgccaa cttgagtgaa 720
gagctgcgcg gacagctgga ctaattgctg cccgtttaag gagtccgatt cttcagatga 780
gtagatgtag tgctcgtcgt ggtaggtgcg cagcagagat tcaggcgcac gaccagaaag 840
cacgtggctg agcttccagc cggacgttgt ggccggagta aaaatccatc caaactttcc 900
gcgatgctgg taaacctgtg gatgtcaatg cctttgattt gaactaagca caggactacc 960
tcgacgccgg cgccaacttt gtccgagtcg gtgccgatgt ccagcaactc aacgctgctg 1020
gatacgaaaa gtgaaggaaa ataacgcatc atgactatta atgtctccga actacttgcc 1080
aaagtcccca cgggtctact gattggtgat tcctgggtgg aagcatccga gggcggtact 1140
ttcgatgtgg aaaacccagc gacgggtgaa acaatcgcaa cgctcgcgtc tgctacttcc 1200
gaggatgcac tggctgctct tgatgctgca tgcgctgttc aggccgagtg ggctaggacg 1260
ccagcgcgcg agcgttctaa tattttacga cgcggtttcg agctcgtcgc ggaacgtgca 1320
gaagagttcg ccaccctcat gaccttggaa atgggcaaac ctttggctga agctcgcggc 1380
gaagtcacct acggcaacga attcctgcgc tggttctctg aggaagcagt ccgcctctac 1440
ggccgctacg gtgctacccc agaaggcaac ctgcgcatga tgaccacccg caaaccagtt 1500
ggcccctgcc tgttgatcac cccatggaac ttcccactag caatggccac ccgtaaggtt 1560
gcacccgcca tcgctgcagg ttgtgtcatg gtgctcaagc cagctcgcct gaccccgctg 1620
acctcccagt attttgccca gaccatgctt gatgccggtc ttccagcagg tgtcctcaat 1680
gtggtctccg gtgcttccgc ctctgcgatt tccaacccga ttatggaaga cgatcgcctt 1740
cgtaaagtct cattcaccgg ctccacccca gttggccagc agctgctcaa aaaggctgcc 1800
gataaagttc tgcgcacctc catggaactc ggcggcaacg cacctttcat tgtcttcgag 1860
gacgccgacc tagatctcgc gatcgaaggt gccatgggcg caaaaatgcg caacatcggc 1920
gaagcttgca ccgcagccaa ccgtttccta gtccacgaat ccgtcgccga tgaattcggc 1980
cgacgcttcg cagcccgcct cgaggaacaa gtcctaggca acggcctcga cgaaggcgtc 2040
accgtaggcc cattggttga ggaaaaagca cgaaacagcg ttgcatcgct tgtcgacgcc 2100
gccgtctccg aaggtgccac cgtcctcacc ggtggcaagg ccggcacagg tgcaggctac 2160
ttctacgaac caacggtgct cacgggagtt tcaacagatg cagccatcct gaacgaagag 2220
atcttcggtc ccgtcgcacc gatcgtcacc ttctctgatg aagctgaagc tctgcgccta 2280
gccaattcca ccgaatacgg cctggcctcc tacgtgttca cccaagacac ctcacgcatc 2340
ttccgcgtct ccgacggcct cgagttcggc ctagtgggcg tcaactccgg tgtcatctct 2400
aacgccgctg caccttttgg tggcgtaaaa caatccggaa tgggccgcga aggtggtctc 2460
gaaggaattg aagagtacac ctccgtgcag tacatcggta tccgggatcc ttacgccggc 2520
tagttcgtgg gcactctggt ttggttacca ggatgggtta gtcattctga tcagcgaatt 2580
ccacgttcac atcgccaatt ccagagttca caaccagatt cagcattgga ccttctagat 2640
cagcattgtg ggcggtgaga tctccaacat cacagcgcgc tgtgcccaca ccggcggtac 2700
aacttaggct cacgggcaca tcatcgggca gggtgaccat gacttcgccg atccctgagg 2760
tgatttggat gttttgttcc tgatccaatt gggtgaggtg gctgaaatcg aggttcattt 2820
cacccacgcc agaggtgtag ctgctgagga gttcatcgtt ggtggggatg agattgacat 2880
cgccgattcc agggtcgtct tcaaagtaga tgggatcgat atttgaaata aacaggcctg 2940
cgagggcgct catgacaact ccggtaccaa ctacaccgcc gacaatccat ggccacacat 3000
ggcgcttttt ctgaggcttt tgtggaggga cttgtacatc ccaggtgttg tattggtttt 3060
gggcaagtgg atcccaatga ggcgcttcgg gggtttgttg cgcgaagggt gcatagtagc 3120
cctcaacggg ggtgatagtg cttagatctg gttggggttg tgggtagaga tcttcgtttt 3180
tcatggtggc atcctcagaa acagtgaatt cagtggtgag tagtccgcgg ggtggaagtg 3240
gttgtttctt atggggtacc gagctcgaat tcgtaatcat ggtcatagct g 3291
<210> 39
<211> 3291
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 39
cagtgccaag cttgcatgcc tgcaggtcga ctctaggacc cgcttgccat acgaagtcct 60
ggagaagatc tccacccgca tcaccaacga agttccagac gtaaaccgcg tggttttgga 120
cgtaacctcc aagccaccag gaaccatcga atgggagtag gccttaaatg agccttcgtt 180
aagcggcaat caccttatcg gtgattgccg ctttcccatt tctccgggtt ttctggaact 240
ttttgggcgt atgctgggaa tgatcttatt attttgattt cagaaagcag gagagaccag 300
atgagcgaaa tccttgaaac ctactgggca ccccacttcg gaaacaccga tgaagccgca 360
gcactcgttt catacttggc acaagcttcc ggtgatccta ttgaggttca caccctgttc 420
ggggatttag gtttagacgg actctctgga aactacaccg acactgagat cgacggctac 480
ggcgacgcat tcctgctggt tgcagcacta gcagtgttga tggctgaaaa caaagcatcc 540
ggcggcgtga atctgggtga agttggggga gctgataaat cgatccggct gcatgttgaa 600
tccaaggaaa acacccagat caacaccgca ttgaagtact ttgcgctttc cccagaagac 660
cacgcagcgg cagatcgctt cgatgaggat gacctgtctg agcttgccaa cttgagtgaa 720
gagctgcgcg gacagctgga ctaattgctg cccgtttaag gagtccgatt cttcagatga 780
gtagatgtag tgctcgtcgt ggtaggtgcg cagcagagat tcaggcgcac gaccagaaag 840
cacgtggctg agcttccagc cggacgttgt ggccggagta aaaatccatc caaactttcc 900
gcgatgctgg taaacctgtg gatgtcaatg cctttgattt gaactaagca caggactacc 960
tcgacgccgg cgccaacttt gtccgagtcg gtgccgatgt ccagcaactc aacgctgctg 1020
gatacgaaaa gtgaaggaaa ataacgcatc atgactatta atgtctccga actacttgcc 1080
aaagtcccca cgggtctact gattggtgat tcctgggtgg aagcatccga gggcggtact 1140
ttcgatgtgg aaaacccagc gacgggtgaa acaatcgcaa cgctcgcgtc tgctacttcc 1200
gaggatgcac tggctgctct tgatgctgca tgcgctgttc aggccgagtg ggctaggacg 1260
ccagcgcgcg agcgttctaa tattttacga cgcggtttcg agctcgtcgc ggaacgtgca 1320
gaagagttcg ccaccctcat gaccttggaa atgggcaaac ctttggctga agctcgcggc 1380
gaagtcacct acggcaacga attcctgcgc tggttctctg aggaagcagt ccgcctctac 1440
ggccgctacg gtgctacccc agaaggcaac ctgcgcatga tgaccacccg caaaccagtt 1500
ggcccctgcc tgttgatcac cccatggaac ttcccactag caatggccac ccgtaaggtt 1560
gcacccgcca tcgctgcagg ttgtgtcatg gtgctcaagc cagctcgcct gaccccgctg 1620
acctcccagt attttgccca gaccatactt gatgccggtc ttccagcagg tgtcctcaat 1680
gtggtctccg gtgcttccgc ctctgcgatt tccaacccga ttatggaaga cgatcgcctt 1740
cgtaaagtct cattcaccgg ctccacccca gttggccagc agctgctcaa aaaggctgcc 1800
gataaagttc tgcgcacctc catggaactc ggcggcaacg cacctttcat tgtcttcgag 1860
gacgccgacc tagatctcgc gatcgaaggt gccatgggcg caaaaatgcg caacatcggc 1920
gaagcttgca ccgcagccaa ccgtttccta gtccacgaat ccgtcgccga tgaattcggc 1980
cgacgcttcg cagcccgcct cgaggaacaa gtcctaggca acggcctcga cgaaggcgtc 2040
accgtaggcc cattggttga ggaaaaagca cgaaacagcg ttgcatcgct tgtcgacgcc 2100
gccgtctccg aaggtgccac cgtcctcacc ggtggcaagg ccggcacagg tgcaggctac 2160
ttctacgaac caacggtgct cacgggagtt tcaacagatg cagccatcct gaacgaagag 2220
atcttcggtc ccgtcgcacc gatcgtcacc ttctctgatg aagctgaagc tctgcgccta 2280
gccaattcca ccgaatacgg cctggcctcc tacgtgttca cccaagacac ctcacgcatc 2340
ttccgcgtct ccgacggcct cgagttcggc ctagtgggcg tcaactccgg tgtcatctct 2400
aacgccgctg caccttttgg tggcgtaaaa caatccggaa tgggccgcga aggtggtctc 2460
gaaggaattg aagagtacac ctccgtgcag tacatcggta tccgggatcc ttacgccggc 2520
tagttcgtgg gcactctggt ttggttacca ggatgggtta gtcattctga tcagcgaatt 2580
ccacgttcac atcgccaatt ccagagttca caaccagatt cagcattgga ccttctagat 2640
cagcattgtg ggcggtgaga tctccaacat cacagcgcgc tgtgcccaca ccggcggtac 2700
aacttaggct cacgggcaca tcatcgggca gggtgaccat gacttcgccg atccctgagg 2760
tgatttggat gttttgttcc tgatccaatt gggtgaggtg gctgaaatcg aggttcattt 2820
cacccacgcc agaggtgtag ctgctgagga gttcatcgtt ggtggggatg agattgacat 2880
cgccgattcc agggtcgtct tcaaagtaga tgggatcgat atttgaaata aacaggcctg 2940
cgagggcgct catgacaact ccggtaccaa ctacaccgcc gacaatccat ggccacacat 3000
ggcgcttttt ctgaggcttt tgtggaggga cttgtacatc ccaggtgttg tattggtttt 3060
gggcaagtgg atcccaatga ggcgcttcgg gggtttgttg cgcgaagggt gcatagtagc 3120
cctcaacggg ggtgatagtg cttagatctg gttggggttg tgggtagaga tcttcgtttt 3180
tcatggtggc atcctcagaa acagtgaatt cagtggtgag tagtccgcgg ggtggaagtg 3240
gttgtttctt atggggtacc gagctcgaat tcgtaatcat ggtcatagct g 3291
<210> 40
<211> 1970
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 40
gtccaaggtg acggccgcac ctacggacac ccaatcgtgc tgcgcccagt atcttccgaa 60
gacgcaatga ccgccgactg gacccgcttg ccatacgaag tcctggagaa gatctccacc 120
cgcatcacca acgaagttcc agacgtaaac cgcgtggttt tggacgtaac ctccaagcca 180
ccaggaacca tcgaatggga gtaggcctta aatgagcctt cgttaagcgg caatcacctt 240
atcggtgatt gccgctttcc catttctccg ggttttctgg aactttttgg gcgtatgctg 300
ggaatgatct tattattttg atttcagaaa gcaggagaga ccagatgagc gaaatccttg 360
aaacctactg ggcaccccac ttcggaaaca ccgatgaagc cgcagcactc gtttcatact 420
tggcacaagc ttccggtgat cctattgagg ttcacaccct gttcggggat ttaggtttag 480
acggactctc tggaaactac accgacactg agatcgacgg ctacggcgac gcattcctgc 540
tggttgcagc actagcagtg ttgatggctg aaaacaaagc atccggcggc gtgaatctgg 600
gtgaagttgg gggagctgat aaatcgatcc ggctgcatgt tgaatccaag gaaaacaccc 660
agatcaacac cgcattgaag tactttgcgc tttccccaga agaccacgca gcggcagatc 720
gcttcgatga ggatgacctg tctgagcttg ccaacttgag tgaagagctg cgcggacagc 780
tggactaatt gctgcccgtt taaggagtcc gattcttcag atgagtagat gtagtgctcg 840
tcgtggtagg tgcgcagcag agattcaggc gcacgaccag aaagcacgtg gctgagcttc 900
cagccggacg ttgtggccgg agtaaaaatc catccaaact ttccgcgatg ctggtaaacc 960
tgtggatgtc aatgcctttg atttgaacta agcacaggac tacctcgacg ccggcgccaa 1020
ctttgtccga gtcggtgccg atgtccagca actcaacgct gctggatacg aaaagtgaag 1080
gaaaataacg catcatgact attaatgtct ccgaactact tgccaaagtc cccacgggtc 1140
tactgattgg tgattcctgg gtggaagcat ccgagggcgg tactttcgat gtggaaaacc 1200
cagcgacggg tgaaacaatc gcaacgctcg cgtctgctac ttccgaggat gcactggctg 1260
ctcttgatgc tgcatgcgct gttcaggccg agtgggctag gacgccagcg cgcgagcgtt 1320
ctaatatttt acgacgcggt ttcgagctcg tcgcggaacg tgcagaagag ttcgccaccc 1380
tcatgacctt ggaaatgggc aaacctttgg ctgaagctcg cggcgaagtc acctacggca 1440
acgaattcct gcgctggttc tctgaggaag cagtccgcct ctacggccgc tacggtgcta 1500
ccccagaagg caacctgcgc atgatgacca cccgcaaacc agttggcccc tgcctgttga 1560
tcaccccatg gaacttccca ctagcaatgg ccacccgtaa ggttgcaccc gccatcgctg 1620
caggttgtgt catggtgctc aagccagctc gcctgacccc gctgacctcc cagtattttg 1680
cccagaccat gcttgatgcc ggtcttccag caggtgtcct caatgtggtc tccggtgctt 1740
ccgcctctgc gatttccaac ccgattatgg aagacgatcg ccttcgtaaa gtctcattca 1800
ccggctccac cccagttggc cagcagctgc tcaaaaaggc tgccgataaa gttctgcgca 1860
cctccatgga actcggcggc aacgcacctt tcattgtctt cgaggacgcc gacctagatc 1920
tcgcgatcga aggtgccatg ggcgcaaaaa tgcgcaacat cggcgaagct 1970
<210> 41
<211> 1758
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 41
aggttgcacc cgccatcgct gcaggttgtg tcatggtgct caagccagct cgcctgaccc 60
cgctgacctc ccagtatttt gcccagacca tgcttgatgc cggtcttcca gcaggtgtcc 120
tcaatgtggt ctccggtgct tccgcctctg cgatttccaa cccgattatg gaagacgatc 180
gccttcgtaa agtctcattc accggctcca ccccagttgg ccagcagctg ctcaaaaagg 240
ctgccgataa agttctgcgc acctccatgg aactcggcgg caacgcacct ttcattgtct 300
tcgaggacgc cgacctagat ctcgcgatcg aaggtgccat gggcgcaaaa atgcgcaaca 360
tcggcgaagc ttgcaccgca gccaaccgtt tcctagtcca cgaatccgtc gccgatgaat 420
tcggccgacg cttcgcagcc cgcctcgagg aacaagtcct aggcaacggc ctcgacgaag 480
gcgtcaccgt aggcccattg gttgaggaaa aagcacgaaa cagcgttgca tcgcttgtcg 540
acgccgccgt ctccgaaggt gccaccgtcc tcaccggtgg caaggccggc acaggtgcag 600
gctacttcta cgaaccaacg gtgctcacgg gagtttcaac agatgcagcc atcctgaacg 660
aagagatctt cggtcccgtc gcaccgatcg tcaccttctc tgatgaagct gaagctctgc 720
gcctagccaa ttccaccgaa tacggcctgg cctcctacgt gttcacccaa gacacctcac 780
gcatcttccg cgtctccgac ggcctcgagt tcggcctagt gggcgtcaac tccggtgtca 840
tctctaacgc cgctgcacct tttggtggcg taaaacaatc cggaatgggc cgcgaaggtg 900
gtctcgaagg aattgaagag tacacctccg tgcagtacat cggtatccgg gatccttacg 960
ccggctagtt cgtgggcact ctggtttggt taccaggatg ggttagtcat tctgatcagc 1020
gaattccacg ttcacatcgc caattccaga gttcacaacc agattcagca ttggaccttc 1080
tagatcagca ttgtgggcgg tgagatctcc aacatcacag cgcgctgtgc ccacaccggc 1140
ggtacaactt aggctcacgg gcacatcatc gggcagggtg accatgactt cgccgatccc 1200
tgaggtgatt tggatgtttt gttcctgatc caattgggtg aggtggctga aatcgaggtt 1260
catttcaccc acgccagagg tgtagctgct gaggagttca tcgttggtgg ggatgagatt 1320
gacatcgccg attccagggt cgtcttcaaa gtagatggga tcgatatttg aaataaacag 1380
gcctgcgagg gcgctcatga caactccggt accaactaca ccgccgacaa tccatggcca 1440
cacatggcgc tttttctgag gcttttgtgg agggacttgt acatcccagg tgttgtattg 1500
gttttgggca agtggatccc aatgaggcgc ttcgggggtt tgttgcgcga agggtgcata 1560
gtagccctca acgggggtga tagtgcttag atctggttgg ggttgtgggt agagatcttc 1620
gtttttcatg gtggcatcct cagaaacagt gaattcagtg gtgagtagtc cgcggggtgg 1680
aagtggttgt ttcttatgca acgcccacca catggctaaa aggcaaaggt aagtaatggc 1740
tgctgctggg ccgaatat 1758
<210> 42
<211> 1807
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 42
gcttgcatgc ctgcaggtcg actctagagg atccccgtag tgctcgtcgt ggtaggtgcg 60
cagcagagat tcaggcgcac gaccagaaag cacgtggctg agcttccagc cggacgttgt 120
ggccggagta aaaatccatc caaactttcc gcgatgctgg taaacctgtg gatgtcaatg 180
cctttgattt gaactaagca caggactacc tcgacgccgg cgccaacttt gtccgagtcg 240
gtgccgatgt ccagcaactc aacgctgctg gatacgaaaa gtgaaggaaa ataacgcatc 300
atgactatta atgtctccga actacttgcc aaagtcccca cgggtctact gattggtgat 360
tcctgggtgg aagcatccga gggcggtact ttcgatgtgg aaaacccagc gacgggtgaa 420
acaatcgcaa cgctcgcgtc tgctacttcc gaggatgcac tggctgctct tgatgctgca 480
tgcgctgttc aggccgagtg ggctaggacg ccagcgcgcg agcgttctaa tattttacga 540
cgcggtttcg agctcgtcgc ggaacgtgca gaagagttcg ccaccctcat gaccttggaa 600
atgggcaaac ctttggctga agctcgcggc gaagtcacct acggcaacga attcctgcgc 660
tggttctctg aggaagcagt ccgcctctac ggccgctacg gtgctacccc agaaggcaac 720
ctgcgcatga tgaccacccg caaaccagtt ggcccctgcc tgttgatcac cccatggaac 780
ttcccactag caatggccac ccgtaaggtt gcacccgcca tcgctgcagg ttgtgtcatg 840
gtgctcaagc cagctcgcct gaccccgctg acctcccagt attttgccca gaccatgctt 900
gatgccggtc ttccagcagg tgtcctcaat gtggtctccg gtgcttccgc ctctgcgatt 960
tccaacccga ttatggaaga cgatcgcctt cgtaaagtct cattcaccgg ctccacccca 1020
gttggccagc agctgctcaa aaaggctgcc gataaagttc tgcgcacctc catggaactc 1080
ggcggcaacg cacctttcat tgtcttcgag gacgccgacc tagatctcgc gatcgaaggt 1140
gccatgggcg caaaaatgcg caacatcggc gaagcttgca ccgcagccaa ccgtttccta 1200
gtccacgaat ccgtcgccga tgaattcggc cgacgcttcg cagcccgcct cgaggaacaa 1260
gtcctaggca acggcctcga cgaaggcgtc accgtaggcc cattggttga ggaaaaagca 1320
cgaaacagcg ttgcatcgct tgtcgacgcc gccgtctccg aaggtgccac cgtcctcacc 1380
ggtggcaagg ccggcacagg tgcaggctac ttctacgaac caacggtgct cacgggagtt 1440
tcaacagatg cagccatcct gaacgaagag atcttcggtc ccgtcgcacc gatcgtcacc 1500
ttctctgatg aagctgaagc tctgcgccta gccaattcca ccgaatacgg cctggcctcc 1560
tacgtgttca cccaagacac ctcacgcatc ttccgcgtct ccgacggcct cgagttcggc 1620
ctagtgggcg tcaactccgg tgtcatctct aacgccgctg caccttttgg tggcgtaaaa 1680
caatccggaa tgggccgcga aggtggtctc gaaggaattg aagagtacac ctccgtgcag 1740
tacatcggta tccgggatcc ttacgccggc taggttttgg cggatgagag aagattttca 1800
gcctgat 1807
<210> 43
<211> 1807
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 43
gcttgcatgc ctgcaggtcg actctagagg atccccgtag tgctcgtcgt ggtaggtgcg 60
cagcagagat tcaggcgcac gaccagaaag cacgtggctg agcttccagc cggacgttgt 120
ggccggagta aaaatccatc caaactttcc gcgatgctgg taaacctgtg gatgtcaatg 180
cctttgattt gaactaagca caggactacc tcgacgccgg cgccaacttt gtccgagtcg 240
gtgccgatgt ccagcaactc aacgctgctg gatacgaaaa gtgaaggaaa ataacgcatc 300
atgactatta atgtctccga actacttgcc aaagtcccca cgggtctact gattggtgat 360
tcctgggtgg aagcatccga gggcggtact ttcgatgtgg aaaacccagc gacgggtgaa 420
acaatcgcaa cgctcgcgtc tgctacttcc gaggatgcac tggctgctct tgatgctgca 480
tgcgctgttc aggccgagtg ggctaggacg ccagcgcgcg agcgttctaa tattttacga 540
cgcggtttcg agctcgtcgc ggaacgtgca gaagagttcg ccaccctcat gaccttggaa 600
atgggcaaac ctttggctga agctcgcggc gaagtcacct acggcaacga attcctgcgc 660
tggttctctg aggaagcagt ccgcctctac ggccgctacg gtgctacccc agaaggcaac 720
ctgcgcatga tgaccacccg caaaccagtt ggcccctgcc tgttgatcac cccatggaac 780
ttcccactag caatggccac ccgtaaggtt gcacccgcca tcgctgcagg ttgtgtcatg 840
gtgctcaagc cagctcgcct gaccccgctg acctcccagt attttgccca gaccatactt 900
gatgccggtc ttccagcagg tgtcctcaat gtggtctccg gtgcttccgc ctctgcgatt 960
tccaacccga ttatggaaga cgatcgcctt cgtaaagtct cattcaccgg ctccacccca 1020
gttggccagc agctgctcaa aaaggctgcc gataaagttc tgcgcacctc catggaactc 1080
ggcggcaacg cacctttcat tgtcttcgag gacgccgacc tagatctcgc gatcgaaggt 1140
gccatgggcg caaaaatgcg caacatcggc gaagcttgca ccgcagccaa ccgtttccta 1200
gtccacgaat ccgtcgccga tgaattcggc cgacgcttcg cagcccgcct cgaggaacaa 1260
gtcctaggca acggcctcga cgaaggcgtc accgtaggcc cattggttga ggaaaaagca 1320
cgaaacagcg ttgcatcgct tgtcgacgcc gccgtctccg aaggtgccac cgtcctcacc 1380
ggtggcaagg ccggcacagg tgcaggctac ttctacgaac caacggtgct cacgggagtt 1440
tcaacagatg cagccatcct gaacgaagag atcttcggtc ccgtcgcacc gatcgtcacc 1500
ttctctgatg aagctgaagc tctgcgccta gccaattcca ccgaatacgg cctggcctcc 1560
tacgtgttca cccaagacac ctcacgcatc ttccgcgtct ccgacggcct cgagttcggc 1620
ctagtgggcg tcaactccgg tgtcatctct aacgccgctg caccttttgg tggcgtaaaa 1680
caatccggaa tgggccgcga aggtggtctc gaaggaattg aagagtacac ctccgtgcag 1740
tacatcggta tccgggatcc ttacgccggc taggttttgg cggatgagag aagattttca 1800
gcctgat 1807
<210> 44
<211> 1846
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 44
agcggataac aatttcacac aggaaacaga attaattaag cttgcatgcc tgcaggtcga 60
ctctagagga tccccgtagt gctcgtcgtg gtaggtgcgc agcagagatt caggcgcacg 120
accagaaagc acgtggctga gcttccagcc ggacgttgtg gccggagtaa aaatccatcc 180
aaactttccg cgatgctggt aaacctgtgg atgtcaatgc ctttgatttg aactaagcac 240
aggactacct cgacgccggc gccaactttg tccgagtcgg tgccgatgtc cagcaactca 300
acgctgctgg atacgaaaag tgaaggaaaa taacgcatca tgactattaa tgtctccgaa 360
ctacttgcca aagtccccac gggtctactg attggtgatt cctgggtgga agcatccgag 420
ggcggtactt tcgatgtgga aaacccagcg acgggtgaaa caatcgcaac gctcgcgtct 480
gctacttccg aggatgcact ggctgctctt gatgctgcat gcgctgttca ggccgagtgg 540
gctaggacgc cagcgcgcga gcgttctaat attttacgac gcggtttcga gctcgtcgcg 600
gaacgtgcag aagagttcgc caccctcatg accttggaaa tgggcaaacc tttggctgaa 660
gctcgcggcg aagtcaccta cggcaacgaa ttcctgcgct ggttctctga ggaagcagtc 720
cgcctctacg gccgctacgg tgctacccca gaaggcaacc tgcgcatgat gaccacccgc 780
aaaccagttg gcccctgcct gttgatcacc ccatggaact tcccactagc aatggccacc 840
cgtaaggttg cacccgccat cgctgcaggt tgtgtcatgg tgctcaagcc agctcgcctg 900
accccgctga cctcccagta ttttgcccag accatacttg atgccggtct tccagcaggt 960
gtcctcaatg tggtctccgg tgcttccgcc tctgcgattt ccaacccgat tatggaagac 1020
gatcgccttc gtaaagtctc attcaccggc tccaccccag ttggccagca gctgctcaaa 1080
aaggctgccg ataaagttct gcgcacctcc atggaactcg gcggcaacgc acctttcatt 1140
gtcttcgagg acgccgacct agatctcgcg atcgaaggtg ccatgggcgc aaaaatgcgc 1200
aacatcggcg aagcttgcac cgcagccaac cgtttcctag tccacgaatc cgtcgccgat 1260
gaattcggcc gacgcttcgc agcccgcctc gaggaacaag tcctaggcaa cggcctcgac 1320
gaaggcgtca ccgtaggccc attggttgag gaaaaagcac gaaacagcgt tgcatcgctt 1380
gtcgacgccg ccgtctccga aggtgccacc gtcctcaccg gtggcaaggc cggcacaggt 1440
gcaggctact tctacgaacc aacggtgctc acgggagttt caacagatgc agccatcctg 1500
aacgaagaga tcttcggtcc cgtcgcaccg atcgtcacct tctctgatga agctgaagct 1560
ctgcgcctag ccaattccac cgaatacggc ctggcctcct acgtgttcac ccaagacacc 1620
tcacgcatct tccgcgtctc cgacggcctc gagttcggcc tagtgggcgt caactccggt 1680
gtcatctcta acgccgctgc accttttggt ggcgtaaaac aatccggaat gggccgcgaa 1740
ggtggtctcg aaggaattga agagtacacc tccgtgcagt acatcggtat ccgggatcct 1800
tacgccggct aggttttggc ggatgagaga agattttcag cctgat 1846
<210> 45
<211> 709
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 45
cagtgccaag cttgcatgcc tgcaggtcga ctctaggtct gggggtgagc gcggatctga 60
ggcggtgacg tattaccagt attcctgggg tcgggcgcgt cgtagtttac gaggaatgga 120
ggagcagatt gcaaaagctg agcgtgcggt agccggcctc gttccggtca agcgttatcg 180
gtatgttgat cttaaagctg cacaaaagca ggtcaaccat gcattagcag ataagtatcg 240
ggcgttggct ggggtgaaag gatacgagac ctcacgcagt gatcttgctg ctggtgaggt 300
tattggggca tatcgtcagt tgtttaaaat tgagaaggcg tttcggatgg cgaagtcgga 360
tttgaaggct tgtccgattt ttcatcggaa gaaggattcg attgatgcgc atttaacgat 420
tgtgatggta tcgatggctg tggggcatgt gttggaacag cggtcggggt tgtcgttgaa 480
gcggttggtg cggatattga agagataccg cactttcact gtggaggtgg ctggccacag 540
ggttttcgct caggctccgg ttcctgatga tgttgcgtta attgttgatc ggttacctaa 600
accgtcagac taaaatggcc taagtcaggc aaaacacaaa aaatccacca caaacatccc 660
agtgtttgcg gtggatttgt aaaggggcag atggatgcgt tattttcct 709
<210> 46
<211> 734
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 46
tggatttgta aaggggcaga tggatgcgtt attttccttc acttttcgta tccagcagcg 60
ttgagttgct ggacatcggc accgactcgg acaaagttgg cgccggcgtc gaggtagtcc 120
tgtgcttagt tcaaatcaaa ggcattgaca tccacaggtt taccagcatc gcggaaagtt 180
tggatggatt tttactccgg ccacaacgtc cggctggaag ctcagccacg tgctttctgg 240
tcgtgcgcct gaatctctgc tgcgcaccta ccacgacgag cactacccag ctgcggcaaa 300
cctcattgct ttcgataagg gatggtccac cctcatggtc cctcagctgg aagatccaga 360
ggctgtggag aggtactacg ttgctgcgga ggaattcacc gccggattcc tcaccgaaaa 420
ccaggacaat ctgatcactg cgggcacgga gcaccaggcg ctcgcgagcg gcttcccggt 480
ggggcgtcgc ttcaagtccg atattgcttt acgacgctgc gatgcggtga ccacccacat 540
cggccacgaa cactccgccg atggtcgatg gaagaaagcg aagactcacc actcaaccgc 600
ttcaccccag aagacggcga ccgcaacgca gtcttcgata tcaaggccat ctaccagcag 660
cattaccact ccttcgacct gttcgatgcg ccagaggggt accgagctcg aattcgtaat 720
catggtcata gctg 734
<210> 47
<211> 1405
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 47
cagtgccaag cttgcatgcc tgcaggtcga ctctaggtct gggggtgagc gcggatctga 60
ggcggtgacg tattaccagt attcctgggg tcgggcgcgt cgtagtttac gaggaatgga 120
ggagcagatt gcaaaagctg agcgtgcggt agccggcctc gttccggtca agcgttatcg 180
gtatgttgat cttaaagctg cacaaaagca ggtcaaccat gcattagcag ataagtatcg 240
ggcgttggct ggggtgaaag gatacgagac ctcacgcagt gatcttgctg ctggtgaggt 300
tattggggca tatcgtcagt tgtttaaaat tgagaaggcg tttcggatgg cgaagtcgga 360
tttgaaggct tgtccgattt ttcatcggaa gaaggattcg attgatgcgc atttaacgat 420
tgtgatggta tcgatggctg tggggcatgt gttggaacag cggtcggggt tgtcgttgaa 480
gcggttggtg cggatattga agagataccg cactttcact gtggaggtgg ctggccacag 540
ggttttcgct caggctccgg ttcctgatga tgttgcgtta attgttgatc ggttacctaa 600
accgtcagac taaaatggcc taagtcaggc aaaacacaaa aaatccacca caaacatccc 660
agtgtttgcg gtggatttgt aaaggggcag atggatgcgt tattttcctt cacttttcgt 720
atccagcagc gttgagttgc tggacatcgg caccgactcg gacaaagttg gcgccggcgt 780
cgaggtagtc ctgtgcttag ttcaaatcaa aggcattgac atccacaggt ttaccagcat 840
cgcggaaagt ttggatggat ttttactccg gccacaacgt ccggctggaa gctcagccac 900
gtgctttctg gtcgtgcgcc tgaatctctg ctgcgcacct accacgacga gcactaccca 960
gctgcggcaa acctcattgc tttcgataag ggatggtcca ccctcatggt ccctcagctg 1020
gaagatccag aggctgtgga gaggtactac gttgctgcgg aggaattcac cgccggattc 1080
ctcaccgaaa accaggacaa tctgatcact gcgggcacgg agcaccaggc gctcgcgagc 1140
ggcttcccgg tggggcgtcg cttcaagtcc gatattgctt tacgacgctg cgatgcggtg 1200
accacccaca tcggccacga acactccgcc gatggtcgat ggaagaaagc gaagactcac 1260
cactcaaccg cttcacccca gaagacggcg accgcaacgc agtcttcgat atcaaggcca 1320
tctaccagca gcattaccac tccttcgacc tgttcgatgc gccagagggg taccgagctc 1380
gaattcgtaa tcatggtcat agctg 1405
<210> 48
<211> 2804
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 48
gtctgggggt gagcgcggat ctgaggcggt gacgtattac cagtattcct ggggtcgggc 60
gcgtcgtagt ttacgaggaa tggaggagca gattgcaaaa gctgagcgtg cggtagccgg 120
cctcgttccg gtcaagcgtt atcggtatgt tgatcttaaa gctgcacaaa agcaggtcaa 180
ccatgcatta gcagataagt atcgggcgtt ggctggggtg aaaggatacg agacctcacg 240
cagtgatctt gctgctggtg aggttattgg ggcatatcgt cagttgttta aaattgagaa 300
ggcgtttcgg atggcgaagt cggatttgaa ggcttgtccg atttttcatc ggaagaagga 360
ttcgattgat gcgcatttaa cgattgtgat ggtatcgatg gctgtggggc atgtgttgga 420
acagcggtcg gggttgtcgt tgaagcggtt ggtgcggata ttgaagagat accgcacttt 480
cactgtggag gtggctggcc acagggtttt cgctcaggct ccggttcctg atgatgttgc 540
gttaattgtt gatcggttac ctaaaccgtc agactaaaat ggcctaagtc aggcaaaaca 600
caaaaaatcc accacaaaca tcccagtgtt tgcggtggat ttgtaaaggg gcagatgcta 660
gccggcgtaa ggatcccgga taccgatgta ctgcacggag gtgtactctt caattccttc 720
gagaccacct tcgcggccca ttccggattg ttttacgcca ccaaaaggtg cagcggcgtt 780
agagatgaca ccggagttga cgcccactag gccgaactcg aggccgtcgg agacgcggaa 840
gatgcgtgag gtgtcttggg tgaacacgta ggaggccagg ccgtattcgg tggaattggc 900
taggcgcaga gcttcagctt catcagagaa ggtgacgatc ggtgcgacgg gaccgaagat 960
ctcttcgttc aggatggctg catctgttga aactcccgtg agcaccgttg gttcgtagaa 1020
gtagcctgca cctgtgccgg ccttgccacc ggtgaggacg gtggcacctt cggagacggc 1080
ggcgtcgaca agcgatgcaa cgctgtttcg tgctttttcc tcaaccaatg ggcctacggt 1140
gacgccttcg tcgaggccgt tgcctaggac ttgttcctcg aggcgggctg cgaagcgtcg 1200
gccgaattca tcggcgacgg attcgtggac taggaaacgg ttggctgcgg tgcaagcttc 1260
gccgatgttg cgcatttttg cgcccatggc accttcgatc gcgagatcta ggtcggcgtc 1320
ctcgaagaca atgaaaggtg cgttgccgcc gagttccatg gaggtgcgca gaactttatc 1380
ggcagccttt ttgagcagct gctggccaac tggggtggag ccggtgaatg agactttacg 1440
aaggcgatcg tcttccataa tcgggttgga aatcgcagag gcggaagcac cggagaccac 1500
attgaggaca cctgctggaa gaccggcatc aagcatggtc tgggcaaaat actgggaggt 1560
cagcggggtc aggcgagctg gcttgagcac catgacacaa cctgcagcga tggcgggtgc 1620
aaccttacgg gtggccattg ctagtgggaa gttccatggg gtgatcaaca ggcaggggcc 1680
aactggtttg cgggtggtca tcatgcgcag gttgccttct ggggtagcac cgtagcggcc 1740
gtagaggcgg actgcttcct cagagaacca gcgcaggaat tcgttgccgt aggtgacttc 1800
gccgcgagct tcagccaaag gtttgcccat ttccaaggtc atgagggtgg cgaactcttc 1860
tgcacgttcc gcgacgagct cgaaaccgcg tcgtaaaata ttagaacgct cgcgcgctgg 1920
cgtcctagcc cactcggcct gaacagcgca tgcagcatca agagcagcca gtgcatcctc 1980
ggaagtagca gacgcgagcg ttgcgattgt ttcacccgtc gctgggtttt ccacatcgaa 2040
agtaccgccc tcggatgctt ccacccagga atcaccaatc agtagacccg tggggacttt 2100
ggcaagtagt tcggagacat taatagtcat gatgcgttat tttccttcac ttttcgtatc 2160
cagcagcgtt gagttgctgg acatcggcac cgactcggac aaagttggcg ccggcgtcga 2220
ggtagtcctg tgcttagttc aaatcaaagg cattgacatc cacaggttta ccagcatcgc 2280
ggaaagtttg gatggatttt tactccggcc acaacgtccg gctggaagct cagccacgtg 2340
ctttctggtc gtgcgcctga atctctgctg cgcacctacc acgacgagca ctacccagct 2400
gcggcaaacc tcattgcttt cgataaggga tggtccaccc tcatggtccc tcagctggaa 2460
gatccagagg ctgtggagag gtactacgtt gctgcggagg aattcaccgc cggattcctc 2520
accgaaaacc aggacaatct gatcactgcg ggcacggagc accaggcgct cgcgagcggc 2580
ttcccggtgg ggcgtcgctt caagtccgat attgctttac gacgctgcga tgcggtgacc 2640
acccacatcg gccacgaaca ctccgccgat ggtcgatgga agaaagcgaa gactcaccac 2700
tcaaccgctt caccccagaa gacggcgacc gcaacgcagt cttcgatatc aaggccatct 2760
accagcagca ttaccactcc ttcgacctgt tcgatgcgcc agac 2804
<210> 49
<211> 1331
<212> DNA
<213>인공서열(Artificial Sequence)
<400> 49
gtctgggggt gagcgcggat ctgaggcggt gacgtattac cagtattcct ggggtcgggc 60
gcgtcgtagt ttacgaggaa tggaggagca gattgcaaaa gctgagcgtg cggtagccgg 120
cctcgttccg gtcaagcgtt atcggtatgt tgatcttaaa gctgcacaaa agcaggtcaa 180
ccatgcatta gcagataagt atcgggcgtt ggctggggtg aaaggatacg agacctcacg 240
cagtgatctt gctgctggtg aggttattgg ggcatatcgt cagttgttta aaattgagaa 300
ggcgtttcgg atggcgaagt cggatttgaa ggcttgtccg atttttcatc ggaagaagga 360
ttcgattgat gcgcatttaa cgattgtgat ggtatcgatg gctgtggggc atgtgttgga 420
acagcggtcg gggttgtcgt tgaagcggtt ggtgcggata ttgaagagat accgcacttt 480
cactgtggag gtggctggcc acagggtttt cgctcaggct ccggttcctg atgatgttgc 540
gttaattgtt gatcggttac ctaaaccgtc agactaaaat ggcctaagtc aggcaaaaca 600
caaaaaatcc accacaaaca tcccagtgtt tgcggtggat ttgtaaaggg gcagatggat 660
gcgttatttt ccttcacttt tcgtatccag cagcgttgag ttgctggaca tcggcaccga 720
ctcggacaaa gttggcgccg gcgtcgaggt agtcctgtgc ttagttcaaa tcaaaggcat 780
tgacatccac aggtttacca gcatcgcgga aagtttggat ggatttttac tccggccaca 840
acgtccggct ggaagctcag ccacgtgctt tctggtcgtg cgcctgaatc tctgctgcgc 900
acctaccacg acgagcacta cccagctgcg gcaaacctca ttgctttcga taagggatgg 960
tccaccctca tggtccctca gctggaagat ccagaggctg tggagaggta ctacgttgct 1020
gcggaggaat tcaccgccgg attcctcacc gaaaaccagg acaatctgat cactgcgggc 1080
acggagcacc aggcgctcgc gagcggcttc ccggtggggc gtcgcttcaa gtccgatatt 1140
gctttacgac gctgcgatgc ggtgaccacc cacatcggcc acgaacactc cgccgatggt 1200
cgatggaaga aagcgaagac tcaccactca accgcttcac cccagaagac ggcgaccgca 1260
acgcagtctt cgatatcaag gccatctacc agcagcatta ccactccttc gacctgttcg 1320
atgcgccaga g 1331
Claims (20)
- L-글루탐산을 생성하는 박테리아로서, SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드의 발현이 개선되고;
바람직하게는, 상기 개선된 발현은 SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드의 발현이 강화되고, 또는 SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드에 점 돌연변이가 있고, 또는 SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드에 점 돌연변이가 있어 발현이 강화되는 것을 특징으로 하는 세균. - 제 1 항에 있어서,
SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드의 점 돌연변이로 인해, SEQ ID NO: 3의 아미노산 서열의 제 199 부위에 있는 메티오닌이 다른 아미노산으로 치환되고; 바람직하게는 제 199 부위에 있는 메티오닌이 이소류신으로 치환되는 것을 특징으로 하는 세균. - 제 1 항 또는 제 2 항 중 어느 한 항에 있어서,
SEQ ID NO: 3의 아미노산 서열을 코딩하는 폴리뉴클레오티드는 SEQ ID NO: 1의 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 세균. - 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
상기 점 돌연변이가 있는 폴리뉴클레오티드 서열은 SEQ ID NO: 1에 표시된 폴리뉴클레오티드 서열에서 제 597 부위의 염기에 돌연변이가 발생하여 형성되고;
바람직하게는, 상기 돌연변이는 SEQ ID NO: 1에 표시된 폴리뉴클레오티드 서열에서 제 597 부위의 염기가 구아닌(G)에서 아데닌(A)으로 돌연변이되는 것을 포함하며;
바람직하게는, 상기 점 돌연변이가 있는 폴리뉴클레오티드 서열은 SEQ ID NO: 2에 표시된 폴리뉴클레오티드 서열을 포함하는 것을 특징으로 하는 세균. - 제 1항 내지 제 4 항 중 어느 한 항에 있어서,
상기 박테리아는 코리네박테리움 속 박테리아로서, 바람직하게는, 코리네박테리움 아세토아시도필룸(Corynebacterium acetoacidophilum), 코리네박테리움 아세토글루타미쿰 (Corynebacterium acetoglutamicum), 코리네박테리움 칼루내(Corynebacterium callunae), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 브레비박테리움 플라븀(Brevibacterium flavum), 브레비박테리움 락토퍼멘텀(Brevibacterium lactofermentum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 페키넨스(Corynebacterium pekinense), 브레비박테리움 사카로리티쿰(Brevibacterium saccharolyticum), 브레비박테리움 로세움 (Brevibacterium roseum), 브레비박테리움 티오제니탈리스(Brevibacterium thiogenitalis)이고, 더 바람직하게는 코리네박테리움 글루타미쿰 YPGLU001이고, 생물 보존 번호가 CGMCC No. 21220이며, 또는 코리네박테리움 글루타미쿰 ATCC 13869인
것을 특징으로 하는 세균. - L-글루탐산을 생산하는 방법으로서,
상기 방법은 제 1 항 내지 제 5 항 중 어느 한 항에 따른 박테리아를 배양하고, 상기 배양물로부터 L-글루탐산을 회수하는 단계를 포함하는 것을 특징으로 하는 방법. - 폴리뉴클레오티드로서,
SEQ ID NO: 3에 표시된 아미노산 서열을 함유하는 아미노산 서열을 코딩하는 폴리뉴클레오티드를 포함하며, 제 199 부위에서 메티오닌이 다른 아미노산으로 치환되고, 바람직하게는 제 199 부위에서 메티오닌이 이소류신으로 치환되며;
바람직하게는, 상기 폴리뉴클레오티드는 SEQ ID NO: 4에 표시된 아미노산 서열을 함유하는 아미노산 서열을 코딩하는 폴리뉴클레오티드를 포함하고;
바람직하게는, 상기 폴리뉴클레오티드 서열은 SEQ ID NO: 1에 표시된 폴리뉴클레오티드 서열의 제 597 부위에서 염기가 돌연변이되어 형성되며; 바람직하게는, 상기 돌연변이는 SEQ ID NO: 1에 표시된 폴리뉴클레오티드 서열의 제 597 부위에서 염기가 구아닌(G)에서 아데닌(A)으로 돌연변이되고,
바람직하게는, 상기 폴리뉴클레오티드 서열은 SEQ ID NO: 2에 표시된 폴리뉴클레오티드 서열을 포함하는 것을 특징으로 하는 폴리뉴클레오티드. - 단백질로서,
상기 단백질은 아미노산 서열이 SEQ ID NO: 4에 표시된 바와 같은 것을 특징으로 하는 단백질. - 제 7 항에 따른 폴리뉴클레오티드 및/또는 제 8 항에 따른 단백질을 포함하는 것을 특징으로 하는 재조합 벡터, 발현 카세트, 형질전환 세포주 및/또는 재조합 박테리아.
- L-글루탐산 생산에서, 제 7 항에 따른 폴리뉴클레오티드, 제 8 항에 따른 단백질, 제 9 항에 따른 재조합 벡터, 발현 카세트, 형질전환 세포주 및/또는 재조합 박테리아의 적용.
- 단백질로서,
상기 단백질은,
A1) 아미노산 서열이 SEQ ID NO: 4인 단백질;
A2) SEQ ID NO: 4에 표시된 아미노산 서열이 아미노산 잔기의 치환 및/또는 결실 및/또는 첨가를 거쳐서 얻어진 A1)에 표시된 단백질과 80% 이상의 동일성을 가지며 동일한 기능이 있는 단백질;
A3) A1) 또는 A2)의 N 말단 및/또는 C 말단에 라벨을 결합하여 얻어진 동일한 기능을 가진 융합 단백질 중 어느 하나인 것을 특징으로 하는 단백질. - 핵산 분자로서,
상기 핵산 분자는,
B1) 제 11 항에 따른 상기 단백질을 코딩하는 핵산 분자;
B2) 코딩 서열이 SEQ ID NO: 2에 표시된 DNA 분자;
뉴클레오티드 서열이 SEQ ID NO: 2에 표시된 DNA 분자 중 어느 하나인
것을 특징으로 하는 핵산 분자. - 생물 재료로서,
상기 생물 재료는
C1) 제 12 항에 따른 핵산 분자를 함유하는 발현 카세트;
C2) 제 12 항에 따른 핵산 분자를 함유한 재조합 벡터, 또는 C1)의 상기 발현 카세트를 함유한 재조합 벡터;
C3) 제 12 항에 따른 핵산 분자를 함유한 재조합 미생물, 또는 C1)의 상기 발현 카세트를 함유한 재조합 미생물, 또는 C2)의 상기 재조합 벡터를 함유한 재조합 미생물 중 어느 하나인 것을 특징으로 하는 생물 재료. - D1)-D8) 중 어느 하나의
F1) 미생물의 L-글루탐산 생산량을 조정함에 있어서 D1)-D8) 중 어느 한 항의 적용;
F2) L-글루탐산을 생산하는 유전자 공학 박테리아를 구성함에 있어서 D1)-D8) 중 어느 한 항의 적용;
F3) L-글루탐산을 제조함에 있어서 D1)-D8) 중 어느 한 항의 적용 중 어느 하나에 대한 적용으로서,
상기 D1)-D8)는,
D1) 제 11 항에 따른 단백질이고;
D2) 제 12 항에 따른 핵산 분자이며;
D3) 제 13 항에 따른 생물 재료이고;
D4) 뉴클레오티드 서열이 SEQ ID NO: 1인 DNA분자이며;
D5) SEQ ID NO: 1에 표시된 뉴클레오티드 서열이 변형 및/또는 여러 개의 뉴클레오티드의 치환 및/또는 결실 및/또는 첨가를 거쳐서 얻어진 SEQ ID NO: 1에 표시된 DNA 분자와 90% 이상의 동일성을 가지며, 또한 동일한 기능을 가진 DNA분자이며;
D6) D4) 또는 D5) 중 상기 DNA 분자를 포함하는 발현 카세트이고;
D7) D4) 또는 D5) 중 상기 DNA 분자를 함유하는 재조합 벡터, 또는 D6)의 상기 발현 카세트를 포함하는 재조합 벡터이며;
D8) D4) 또는 D5) 중 상기DNA 분자를 함유하는 재조합 미생물, 또는 D6)의 상기 발현 카세트를 함유하는 재조합 미생물, 또는 D7)의 상기 재조합 벡터를 포함하는 재조합 미생물인 것을 특징으로 하는 적용. - 미생물에서 L-글루탐산의 생산량을 증가시키는 방법으로서, 상기 방법은,
E1) 목적 미생물에서 제 12 항에 따른 핵산 분자의 발현량 또는 함량을 증가시켜, L-글루탐산 생산량이 상기 목적 미생물보다 더 높은 미생물을 얻는 단계;
E2) 목적 미생물에서 제 14 항의 D4) 또는 D5)에 따른 DNA분자의 발현량 또는 함량을 증가시켜, L-글루탐산의 생산량이 상기 목적 미생물보다 높은 미생물을 얻는 단계;
E3) 상기 목적 미생물에서 뉴클레오티드 서열이 SEQ ID NO: 1인 DNA 분자를 돌연변이시켜, L-글루탐산의 생산량이 상기 목적 미생물보다 높은 미생물을 얻는 단계 중 어느 하나를 포함하는 것을 특징으로 하는 방법. - 제 15 항에 있어서, 상기 돌연변이는 점 돌연변이인 것을 특징으로 하는 방법.
- 제 16 항에 있어서, 상기 점 돌연변이는 SEQ ID NO: 1에 표시된 DNA 분자에 의해 코딩되는 아미노산 서열의 제 199 부위에서 메티오닌 잔기가 다른 아미노산 잔기로 돌연변이되는 것을 특징으로 하는 방법.
- 제 16 항 또는 제 17 항에 있어서, 상기 점 돌연변이는 SEQ ID NO: 1에 표시된 DNA 분자에 의해 코딩되는 아미노산 서열의 제 199 부위에서 메티오닌이 이소류신으로 돌연변이되어 아미노산 서열이 SEQ ID NO: 4인 돌연변이 단백질을 얻는 것을 특징으로 하는 방법.
- 제 13 항 또는제 14 항에 따른 재조합 미생물을 구성하는 방법으로서, 상기 방법은,
F1) 상기 재조합 미생물을 얻기 위해 제 12 항에 따른 핵산 분자를 목적 미생물에 도입하는 단계;
F2) 상기 재조합 미생물을 얻기 위해 SEQ ID NO: 1에 표시된 DNA 분자를 목적 미생물에 도입하는 단계;
F3) 유전자 편집 수단을 이용하여 SEQ ID NO: 1에 표시된 DNA 분자를 편집하여, SEQ ID NO: 2에 표시된 DNA 분자가 목적 미생물에 함유되도록 하는 단계 중 적어도 하나를 포함하는 것을 특징으로 하는 방법. - L-글루탐산을 제조하는 방법으로서, 상기 방법은 제 13 항 또는 제 14 항에 따른 재조합 미생물을 사용하여 L-글루탐산을 제조하는 단계를 포함하는 것을 특징으로 하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011631311.XA CN112646767B (zh) | 2020-12-30 | 2020-12-30 | 具有增强的l-谷氨酸生产力的菌株及其构建方法与应用 |
CN202011631311.X | 2020-12-30 | ||
PCT/CN2021/142440 WO2022143763A1 (zh) | 2020-12-30 | 2021-12-29 | 具有增强的l-谷氨酸生产力的菌株及其构建方法与应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230145055A true KR20230145055A (ko) | 2023-10-17 |
Family
ID=75366785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237025466A KR20230145055A (ko) | 2020-12-30 | 2021-12-29 | L-글루탐산 생산성이 향상된 균주 및 이의 구성 방법및 적용 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240067998A1 (ko) |
EP (1) | EP4273228A1 (ko) |
JP (1) | JP2024505808A (ko) |
KR (1) | KR20230145055A (ko) |
CN (1) | CN112646767B (ko) |
WO (1) | WO2022143763A1 (ko) |
ZA (1) | ZA202306650B (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112646767B (zh) * | 2020-12-30 | 2022-08-09 | 宁夏伊品生物科技股份有限公司 | 具有增强的l-谷氨酸生产力的菌株及其构建方法与应用 |
CN115124605B (zh) * | 2022-03-15 | 2023-08-04 | 吉林大学 | 耐高温元件突变体及其在生产氨基酸中的应用 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101082050A (zh) * | 1999-06-25 | 2007-12-05 | Basf公司 | 编码胁迫、抗性和耐受性蛋白的谷氨酸棒杆菌基因 |
KR100930842B1 (ko) * | 2004-09-10 | 2009-12-10 | 아지노모토 가부시키가이샤 | L-글루탐산 생산 미생물 및 l-글루탐산의 제조방법 |
DE102005013676A1 (de) * | 2005-03-24 | 2006-09-28 | Degussa Ag | Allele des zwf-Gens aus coryneformen Bakterien |
KR101307348B1 (ko) * | 2010-11-02 | 2013-09-11 | 대상 주식회사 | L―글루탐산 고생산능 코리네박테리움 글루타미쿰 변이 균주 |
JP5867586B2 (ja) * | 2012-02-27 | 2016-02-24 | トヨタ自動車株式会社 | 炭化水素合成酵素遺伝子及びその利用 |
KR102023618B1 (ko) * | 2012-07-27 | 2019-09-20 | 삼성전자주식회사 | 1,4-bdo 생성능이 개선된 변이 미생물 및 이를 이용한 1,4-bdo의 제조방법 |
KR101377097B1 (ko) * | 2012-11-14 | 2014-03-20 | 대상 주식회사 | L―글루탐산 고생산능 코리네박테리움 글루타미쿰 변이 균주 |
CN109971660A (zh) * | 2017-12-28 | 2019-07-05 | 上海医药工业研究院 | 一种头孢菌素c的制备方法及其所用的基因工程菌 |
KR102075160B1 (ko) * | 2018-12-13 | 2020-02-10 | 대상 주식회사 | L-글루탐산 생산능이 향상된 변이 균주 및 이를 이용한 l-글루탐산의 제조 방법 |
CN110607313B (zh) * | 2019-09-27 | 2021-06-22 | 内蒙古伊品生物科技有限公司 | 一种高产l-赖氨酸的重组菌株及其构建方法与应用 |
CN111979165B (zh) * | 2020-08-07 | 2021-05-07 | 黑龙江伊品生物科技有限公司 | 一种产l-赖氨酸的重组菌株及其构建方法与应用 |
CN112646767B (zh) * | 2020-12-30 | 2022-08-09 | 宁夏伊品生物科技股份有限公司 | 具有增强的l-谷氨酸生产力的菌株及其构建方法与应用 |
-
2020
- 2020-12-30 CN CN202011631311.XA patent/CN112646767B/zh active Active
-
2021
- 2021-12-29 WO PCT/CN2021/142440 patent/WO2022143763A1/zh active Application Filing
- 2021-12-29 US US18/270,491 patent/US20240067998A1/en active Pending
- 2021-12-29 EP EP21914495.3A patent/EP4273228A1/en active Pending
- 2021-12-29 JP JP2023540092A patent/JP2024505808A/ja active Pending
- 2021-12-29 KR KR1020237025466A patent/KR20230145055A/ko unknown
-
2023
- 2023-06-28 ZA ZA2023/06650A patent/ZA202306650B/en unknown
Also Published As
Publication number | Publication date |
---|---|
CN112646767A (zh) | 2021-04-13 |
WO2022143763A1 (zh) | 2022-07-07 |
CN112646767B (zh) | 2022-08-09 |
ZA202306650B (en) | 2024-02-28 |
JP2024505808A (ja) | 2024-02-08 |
US20240067998A1 (en) | 2024-02-29 |
EP4273228A1 (en) | 2023-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113667682B (zh) | Yh66-rs11190基因突变体及其在制备l-缬氨酸中的应用 | |
CN113683667B (zh) | Yh66-rs10865基因改造得到的工程菌及其在制备缬氨酸中的应用 | |
KR20230145055A (ko) | L-글루탐산 생산성이 향상된 균주 및 이의 구성 방법및 적용 | |
WO2023231547A1 (zh) | NCgl2747基因突变体及其在制备L-赖氨酸中的应用 | |
WO2022143761A1 (zh) | 一种改造基因bbd29_04920的产l-谷氨酸的重组菌株及其构建方法与应用 | |
CN111961635B (zh) | 一种产l-赖氨酸的重组菌株及其构建方法与应用 | |
CN113683666A (zh) | Yh66-rs07020基因改造得到的工程菌及其在制备缬氨酸中的应用 | |
CN114540399B (zh) | 一种制备l-缬氨酸的方法及其所用基因突变体和生物材料 | |
CN114181288B (zh) | 制备l-缬氨酸的方法及其所用的基因与该基因编码的蛋白质 | |
CN114349831B (zh) | aspA基因突变体、重组菌及制备L-缬氨酸的方法 | |
CN114409751B (zh) | 一种yh66_04470基因突变的重组菌及其在制备精氨酸中的应用 | |
CN112625992B (zh) | 一种改造基因bbd29_11265产l-谷氨酸的重组菌株及其构建方法与应用 | |
CN112725253B (zh) | 一种改造基因bbd29_14900的重组菌株及其构建方法与应用 | |
CN112522175B (zh) | 一种改造基因bbd29_09525产l-谷氨酸的重组菌株及其构建方法与应用 | |
CN112538491B (zh) | 一种基于yh66_08550基因的产l-异亮氨酸的重组菌株及其构建方法与应用 | |
CN114277069B (zh) | 制备l-缬氨酸的方法及其所用生物材料 | |
CN114315998B (zh) | Cey17_rs00300基因突变体及其在制备l-缬氨酸中的应用 | |
CN114539367B (zh) | Cey17_rs11900基因突变体及其在制备l-缬氨酸中的应用 | |
CN114317583B (zh) | 构建产l-缬氨酸的重组微生物的方法及其所用核酸分子 | |
CN114540262B (zh) | 构建产l-缬氨酸的重组微生物的方法及其所用核酸分子和生物材料 | |
CN114560918B (zh) | Yh66_14275蛋白或其突变体在制备l-精氨酸中的应用 | |
JP2002051790A (ja) | コリネ型細菌のアルギニンリプレッサー欠失株及びl−アルギニンの製造法 | |
CN112626098A (zh) | 一种改造kgd基因的重组菌株及其构建方法与产L-异亮氨酸的应用 | |
KR20230042224A (ko) | L-아미노산을 생산하는 재조합 균주 및 이의 구축 방법과 응용 |