KR20230070943A - 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 - Google Patents
바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 Download PDFInfo
- Publication number
- KR20230070943A KR20230070943A KR1020210157042A KR20210157042A KR20230070943A KR 20230070943 A KR20230070943 A KR 20230070943A KR 1020210157042 A KR1020210157042 A KR 1020210157042A KR 20210157042 A KR20210157042 A KR 20210157042A KR 20230070943 A KR20230070943 A KR 20230070943A
- Authority
- KR
- South Korea
- Prior art keywords
- biotin
- polypeptide
- sequence
- seq
- amino acid
- Prior art date
Links
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 title claims abstract description 227
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 156
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 156
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 156
- 229960002685 biotin Drugs 0.000 title claims abstract description 113
- 235000020958 biotin Nutrition 0.000 title claims abstract description 113
- 239000011616 biotin Substances 0.000 title claims abstract description 113
- 230000000694 effects Effects 0.000 title claims abstract description 81
- 101710117026 Biotin synthase Proteins 0.000 title claims abstract description 59
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 51
- 244000005700 microbiome Species 0.000 claims abstract description 79
- 108091033319 polynucleotide Proteins 0.000 claims description 97
- 102000040430 polynucleotide Human genes 0.000 claims description 97
- 239000002157 polynucleotide Substances 0.000 claims description 97
- 241000588724 Escherichia coli Species 0.000 claims description 53
- 235000001014 amino acid Nutrition 0.000 claims description 43
- 150000001413 amino acids Chemical class 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 34
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 13
- 235000004279 alanine Nutrition 0.000 claims description 13
- 239000000203 mixture Substances 0.000 claims description 12
- 238000012258 culturing Methods 0.000 claims description 10
- 108010042833 7,8-diaminopelargonic acid aminotransferase Proteins 0.000 claims description 9
- 108010031096 8-amino-7-oxononanoate synthase Proteins 0.000 claims description 7
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 6
- 239000004473 Threonine Substances 0.000 claims description 6
- 101710108743 Malonyl-[acyl-carrier protein] O-methyltransferase Proteins 0.000 claims description 5
- 241000588722 Escherichia Species 0.000 claims description 4
- 241000488157 Escherichia sp. Species 0.000 claims description 4
- 108010050073 dethiobiotin synthetase Proteins 0.000 claims description 4
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 claims description 4
- 102000055026 Protein O-Methyltransferase Human genes 0.000 claims 1
- 239000013598 vector Substances 0.000 description 82
- 108090000623 proteins and genes Proteins 0.000 description 70
- 125000003275 alpha amino acid group Chemical group 0.000 description 58
- 108020004414 DNA Proteins 0.000 description 56
- 229940024606 amino acid Drugs 0.000 description 39
- 239000012634 fragment Substances 0.000 description 36
- 230000014509 gene expression Effects 0.000 description 30
- 101150029327 bioB gene Proteins 0.000 description 29
- 239000002609 medium Substances 0.000 description 29
- 210000004027 cell Anatomy 0.000 description 28
- 235000018102 proteins Nutrition 0.000 description 28
- 102000004169 proteins and genes Human genes 0.000 description 28
- 241000607715 Serratia marcescens Species 0.000 description 26
- 230000000875 corresponding effect Effects 0.000 description 26
- 230000035772 mutation Effects 0.000 description 26
- 239000002773 nucleotide Substances 0.000 description 22
- 125000003729 nucleotide group Chemical group 0.000 description 22
- 230000004048 modification Effects 0.000 description 21
- 238000012986 modification Methods 0.000 description 21
- 230000002018 overexpression Effects 0.000 description 20
- 230000001965 increasing effect Effects 0.000 description 19
- 210000000349 chromosome Anatomy 0.000 description 18
- 102220076579 rs574164748 Human genes 0.000 description 18
- 238000006467 substitution reaction Methods 0.000 description 17
- 230000009466 transformation Effects 0.000 description 16
- 238000006116 polymerization reaction Methods 0.000 description 14
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- 238000000746 purification Methods 0.000 description 12
- 108091081024 Start codon Proteins 0.000 description 11
- 101150031021 birA gene Proteins 0.000 description 11
- 150000007523 nucleic acids Chemical group 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 10
- 239000007787 solid Substances 0.000 description 10
- 230000014616 translation Effects 0.000 description 10
- 238000007792 addition Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000010276 construction Methods 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000004925 denaturation Methods 0.000 description 8
- 230000036425 denaturation Effects 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 7
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 7
- 239000013604 expression vector Substances 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 108091008146 restriction endonucleases Proteins 0.000 description 7
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 6
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 6
- 101100218845 Escherichia coli (strain K12) bioH gene Proteins 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 238000000137 annealing Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 235000000346 sugar Nutrition 0.000 description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 5
- 230000002238 attenuated effect Effects 0.000 description 5
- 230000001851 biosynthetic effect Effects 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000004885 tandem mass spectrometry Methods 0.000 description 5
- 229960002898 threonine Drugs 0.000 description 5
- 235000008521 threonine Nutrition 0.000 description 5
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 4
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 4
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 4
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 239000004472 Lysine Substances 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 239000007789 gas Substances 0.000 description 4
- 238000003208 gene overexpression Methods 0.000 description 4
- 235000013922 glutamic acid Nutrition 0.000 description 4
- 229960002989 glutamic acid Drugs 0.000 description 4
- 239000004220 glutamic acid Substances 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 238000001802 infusion Methods 0.000 description 4
- 235000018977 lysine Nutrition 0.000 description 4
- 229960003646 lysine Drugs 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 229960004452 methionine Drugs 0.000 description 4
- 235000006109 methionine Nutrition 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 235000013379 molasses Nutrition 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000035939 shock Effects 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 239000011782 vitamin Substances 0.000 description 4
- 108020005544 Antisense RNA Proteins 0.000 description 3
- 241000186226 Corynebacterium glutamicum Species 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000003184 complementary RNA Substances 0.000 description 3
- 229960002433 cysteine Drugs 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 229960002743 glutamine Drugs 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- -1 malonyl thioester Chemical class 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- LYCRXMTYUZDUGA-UYRKPTJQSA-N pimeloyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CCCCCC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LYCRXMTYUZDUGA-UYRKPTJQSA-N 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003827 upregulation Effects 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 2
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 2
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 2
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 2
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 2
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 2
- RYRQZJVFDVWURI-SRVKXCTJSA-N Arg-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N RYRQZJVFDVWURI-SRVKXCTJSA-N 0.000 description 2
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 2
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 2
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 2
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 2
- JUUMIGUJJRFQQR-KKUMJFAQSA-N Cys-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O JUUMIGUJJRFQQR-KKUMJFAQSA-N 0.000 description 2
- SNHRIJBANHPWMO-XGEHTFHBSA-N Cys-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)N)O SNHRIJBANHPWMO-XGEHTFHBSA-N 0.000 description 2
- TXCCRYAZQBUCOV-CIUDSAMLSA-N Cys-Pro-Gln Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O TXCCRYAZQBUCOV-CIUDSAMLSA-N 0.000 description 2
- NXQCSPVUPLUTJH-WHFBIAKZSA-N Cys-Ser-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O NXQCSPVUPLUTJH-WHFBIAKZSA-N 0.000 description 2
- 238000007702 DNA assembly Methods 0.000 description 2
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 2
- NPTGGVQJYRSMCM-GLLZPBPUSA-N Gln-Gln-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPTGGVQJYRSMCM-GLLZPBPUSA-N 0.000 description 2
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 2
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 2
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 2
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- GQGAFTPXAPKSCF-WHFBIAKZSA-N Gly-Ala-Cys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(=O)O GQGAFTPXAPKSCF-WHFBIAKZSA-N 0.000 description 2
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- SJLKKOZFHSJJAW-YUMQZZPRSA-N Gly-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN SJLKKOZFHSJJAW-YUMQZZPRSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 101100008681 Glycine max DHPS1 gene Proteins 0.000 description 2
- YERBCFWVWITTEJ-NAZCDGGXSA-N His-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N)O YERBCFWVWITTEJ-NAZCDGGXSA-N 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 2
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 2
- AYLAAGNJNVZDPY-CYDGBPFRSA-N Ile-Met-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N AYLAAGNJNVZDPY-CYDGBPFRSA-N 0.000 description 2
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 2
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 2
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 2
- UQJOKDAYFULYIX-AVGNSLFASA-N Lys-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 UQJOKDAYFULYIX-AVGNSLFASA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 2
- UJDMTKHGWSBHBX-IHRRRGAJSA-N Met-Cys-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UJDMTKHGWSBHBX-IHRRRGAJSA-N 0.000 description 2
- PHWSCIFNNLLUFJ-NHCYSSNCSA-N Met-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N PHWSCIFNNLLUFJ-NHCYSSNCSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 2
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 2
- HQVPQHLNOVTLDD-IHRRRGAJSA-N Phe-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N HQVPQHLNOVTLDD-IHRRRGAJSA-N 0.000 description 2
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 2
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 2
- GCFNFKNPCMBHNT-IRXDYDNUSA-N Phe-Tyr-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)NCC(=O)O)N GCFNFKNPCMBHNT-IRXDYDNUSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 2
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 2
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 2
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 2
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 2
- AWQGDZBKQTYNMN-IHRRRGAJSA-N Pro-Phe-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC(=O)O)C(=O)O AWQGDZBKQTYNMN-IHRRRGAJSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 241000607714 Serratia sp. Species 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 2
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- YPBYQWFZAAQMGW-XIRDDKMYSA-N Trp-Lys-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N YPBYQWFZAAQMGW-XIRDDKMYSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- CYDVHRFXDMDMGX-KKUMJFAQSA-N Tyr-Asn-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O CYDVHRFXDMDMGX-KKUMJFAQSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 2
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 239000000074 antisense oligonucleotide Substances 0.000 description 2
- 238000012230 antisense oligonucleotides Methods 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 229960003121 arginine Drugs 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 229960005261 aspartic acid Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 229910000019 calcium carbonate Inorganic materials 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000007857 degradation product Substances 0.000 description 2
- 235000014113 dietary fatty acids Nutrition 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229930195729 fatty acid Natural products 0.000 description 2
- 239000000194 fatty acid Substances 0.000 description 2
- 150000004665 fatty acids Chemical class 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 229960002449 glycine Drugs 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 229960002885 histidine Drugs 0.000 description 2
- 235000014304 histidine Nutrition 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 229910010272 inorganic material Inorganic materials 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 229960003136 leucine Drugs 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 229960005190 phenylalanine Drugs 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 229960002429 proline Drugs 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 229960001153 serine Drugs 0.000 description 2
- 235000004400 serine Nutrition 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 229960004793 sucrose Drugs 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 229960004799 tryptophan Drugs 0.000 description 2
- 229960004441 tyrosine Drugs 0.000 description 2
- 235000002374 tyrosine Nutrition 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 229960004295 valine Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- KCEGBPIYGIWCDH-JGVFFNPUSA-N (7R,8S)-7,8-diaminononanoic acid Chemical compound C[C@H](N)[C@H](N)CCCCCC(O)=O KCEGBPIYGIWCDH-JGVFFNPUSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 1
- GUAHPAJOXVYFON-UHFFFAOYSA-N 8-amino-7-oxononanoic acid Chemical compound CC([NH3+])C(=O)CCCCCC([O-])=O GUAHPAJOXVYFON-UHFFFAOYSA-N 0.000 description 1
- 241000023308 Acca Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 101100533902 Arabidopsis thaliana SPL13A gene Proteins 0.000 description 1
- 101100533904 Arabidopsis thaliana SPL13B gene Proteins 0.000 description 1
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 1
- 101100455080 Bacillus subtilis (strain 168) lmrB gene Proteins 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 101150039072 INSA gene Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 108030006637 Malonyl-[acyl-carrier protein] O-methyltransferases Proteins 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- FMYLZGQFKPHXHI-GUBZILKMSA-N Met-Met-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O FMYLZGQFKPHXHI-GUBZILKMSA-N 0.000 description 1
- ILKCLLLOGPDNIP-RCWTZXSCSA-N Met-Met-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ILKCLLLOGPDNIP-RCWTZXSCSA-N 0.000 description 1
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 1
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101100070556 Oryza sativa subsp. japonica HSFA4D gene Proteins 0.000 description 1
- 101100043227 Oryza sativa subsp. japonica SPL13 gene Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 108010009736 Protein Hydrolysates Proteins 0.000 description 1
- 101150099282 SPL7 gene Proteins 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 230000037354 amino acid metabolism Effects 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 235000012501 ammonium carbonate Nutrition 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 108010038083 amyloid fibril protein AS-SAM Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003674 animal food additive Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 108010079058 casein hydrolysate Proteins 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000006482 condensation reaction Methods 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004129 fatty acid metabolism Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 102000054767 gene variant Human genes 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 230000004153 glucose metabolism Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- FBAFATDZDUQKNH-UHFFFAOYSA-M iron chloride Chemical compound [Cl-].[Fe] FBAFATDZDUQKNH-UHFFFAOYSA-M 0.000 description 1
- 229910000358 iron sulfate Inorganic materials 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 229940099596 manganese sulfate Drugs 0.000 description 1
- 239000011702 manganese sulphate Substances 0.000 description 1
- 235000007079 manganese sulphate Nutrition 0.000 description 1
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920001522 polyglycol ester Polymers 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000007398 protein translocation Effects 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 150000003254 radicals Chemical class 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 150000007944 thiolates Chemical class 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 101150062776 yccA gene Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/13—Transferases (2.) transferring sulfur containing groups (2.8)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
- C12P17/185—Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system
- C12P17/186—Heterocyclic compounds containing sulfur atoms as ring hetero atoms in the condensed system containing a 2-oxo-thieno[3,4-d]imidazol nucleus, e.g. Biotin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y208/00—Transferases transferring sulfur-containing groups (2.8)
- C12Y208/01—Sulfurtransferases (2.8.1)
- C12Y208/01006—Biotin synthase (2.8.1.6)
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 출원은 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체, 상기 변이체를 포함하는 미생물, 및 상기 균주를 이용한 바이오틴 생산 방법에 관한 것이다.
Description
본 출원은 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 또는 이를 이용한 바이오틴 생산 방법에 관한 것이다.
바이오틴(Biotin) 은 세포 성장 및 단백질 생성, 활성에 중요한 역할을 하는 비타민 B군 (Vitamin B7)에 속하며, 동식물 그리고 미생물에 있어 필수적인 영양소이다. 황을 포함하는 1개의 링 구조가 또 다른 링 구조에 연결되어 있는 구조를 갖는 바이오틴은 멀티 카복실라제 (carboxylase)의 조효소로써 기능하며 포도당 대사를 비롯하여 아미노산과 지방산 대사 과정에서도 중요한 역할을 수행한다.
바이오틴은 많은 미생물 종이 생합성을 할 수 있는데 반해 대부분의 동물들은 스스로 합성할 수 없기 때문에 필수 비타민으로 분류되어 식품이나 사료 첨가제, 혹은 다른 의약품의 합성 및 생산의 원료로 이용되는 등 그 유용성이 매우 큰 물질이다. 특히 최근에는 항생제 규제확대로 인한 비타민 수요가 증가되는 추세를 보이며 판가가 점차 상승되고 있다. 그러나 시장에 판매되고 있는 대부분의 바이오틴은 다단계 화학 공법을 통한 생산으로만 진행되고 있어 필환경시대가 도래한 현재 생물학적 생산 기술공법에 대한 요구도가 높아지고 있다. 그러나, 생물학적 생산 기술공법은 2000년대 이후 거의 진보된 문헌이나 특허가 없는 것으로 보여지며, 생산 효율도 높지 않다. 따라서 바이오틴의 생물학적 생산 기술공법을 다수 확보하는 것은 중요하다.
따라서, 이러한 배경 하에 바이오틴 생산능 증가를 위한 연구가 여전히 필요한 실정이다.
본 출원의 하나의 목적은 바이오틴 신타제(biotin synthase) 활성을 갖는 폴리펩티드 변이체를 제공하는 것이다.
본 출원의 다른 하나의 목적은 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 상기 폴리뉴클레오티드를 포함하는 재조합 벡터를 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 바이오틴 신타제의 활성을 갖는 폴리펩티드 변이체를 포함하는, 바이오틴을 생산하는 미생물을 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 상기 바이오틴을 생산하는 미생물을 포함하는 바이오틴 생산용 조성물을 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 상기 바이오틴을 생산하는 미생물을 배양하는 단계를 포함하는 바이오틴 생산 방법을 제공하는 것이다.
본 출원에서는 바이오틴 생산능을 향상시킬 수 있는 바이오틴 신타제 또는 이의 변이체를 탐색하고, 이를 미생물에 도입함으로써, 바이오틴 생산능이 우수한 재조합 미생물(균주)을 제공하고자 한다.
상기 목적을 달성하기 위한 본 출원의 일 양상은 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체를 제공할 수 있다.
본 출원에서, “바이오틴 신타제(biotin synthase; EC 2.8.1.6)”는 데티오바이오틴(dethiobiotin, DTB;)로부터 바이오틴으로의 전환을 촉매하는 효소로서, 라디칼 메커니즘을 이용하여, 데티오바이오틴을 티올화(thiolate)하여 바이오틴으로 전환하는 SAM 의존 효소를 의미할 수 있다. 상기 바이오틴 신타제는 상기 활성을 갖는 효소면 미생물 유래에 상관없이 포함될 수 있고, 예를 들면 세라티아 속(Serratia sp.; 예를 들면 세라티아 마르세센스(Serratia marcescens)) 또는 에스케리키아 속(Escherichia sp.; 예를 들면 대장균(Escherichia coli)) 미생물 유래일 수 있다. 상기 바이오틴 신타제는 BioB 단백질 또는 BioB와 혼용하여 사용될 수 있다. 일 예에서, 상기 바이오틴 신타제는 서열번호 1의 아미노산 서열을 포함하거나 서열번호 1의 아미노산 서열로 이루어진 것일 수 있으며 바이오틴 신타제와 동일하거나 상응하는 전환 활성을 갖는다면 서열번호 1의 아미노산 서열에서 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 폴리펩티드도 본 출원의 범위 내에 포함될 수 있다. 또한 미생물의 유래에 상관없이 서열번호 1의 아미노산 서열과 적어도 60% 이상, 70% 이상, 80% 이상, 85% 이상, 90% 이상, 92% 이상, 94% 이상, 96% 이상, 98% 이상, 또는 99% 이상, 99.5% 이상 또는 99.8% 이상의 상동성 또는 동일성을 갖는 폴리펩티드로서, 바이오틴 신타제와 동일하거나 상응하는 전환 활성을 갖는 폴리펩티드도 상기 바이오틴 신타제로서 본 출원의 범위 내에 포함될 수 있다.
본 출원에서, '특정 서열번호로 기재된 아미노산 서열을 포함하는 폴리펩티드(또는 단백질)', '특정 서열번호로 기재된 아미노산 서열로 이루어진 폴리펩티드(또는 단백질)'라고 기재되어 있다 하더라도, 해당 서열번호의 아미노산 서열로 이루어진 폴리펩티드(또는 단백질)와 동일 혹은 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 폴리펩티드(또는 단백질)도 본 출원의 변이 대상이 되는 단백질 또는 폴리펩티드로 사용될 수 있다. 예를 들면, 서열번호 1의 아미노산 서열의 일부 서열이 결실, 변형 또는 치환된 서열을 가지거나 서열번호 1의 아미노산 서열에 일부 서열이 부가된 서열을 가지는 폴리펩티드(또는 단백질)는 '서열번호 1의 아미노산 서열로 이루어진 폴리펩티드'와 동일한 혹은 상응하는 활성을 가진다면 '서열번호 1의 아미노산 서열로 이루어진 폴리펩티드'에 속할 수 있다.
상기 바이오틴 신타제의 아미노산 서열 및 바이오틴 신타제를 암호화하는 유전자의 염기 서열은 미국 생물공학정보센터(NCBI) 및 일본 DNA 데이터 뱅크(DDBJ)와 같은 당업계에 공지된 데이터 베이스로부터 용이하게 얻을 수 있고, 예를 들면, GenBank Accession No. WP_000951213.1일 수 있다. 상기 바이오틴 신타제를 암호화하는 유전자는 bioB 유전자일 수 있으며, 상기 바이오틴 신타제는 bioB 유전자에 의해 암호화되는 것일 수 있다.
본 출원에서, 폴리뉴클레오티드 또는 폴리펩티드가 "특정 핵산 서열(염기서열) 또는 아미노산 서열을 포함한다" 함은 상기 폴리뉴클레오티드 또는 폴리펩티드가 상기 특정 핵산 서열(염기서열) 또는 아미노산 서열로 이루어지거나 이를 필수적으로 포함하는 것을 의미할 수 있으며, 상기 폴리뉴클레오티드 또는 폴리펩티드의 본래의 기능 및/또는 목적하는 기능을 유지하는 범위에서 상기 특정 핵산 서열(염기서열) 또는 아미노산 서열에 변이(결실, 치환, 변형, 및/또는 부가)가 가해진 서열을 포함하는 것(또는 상기 변이를 배제하지 않는 것)으로 해석될 수 있다. 일 예에서, 폴리뉴클레오티드 또는 폴리펩티드가 "특정 핵산 서열(염기서열) 또는 아미노산 서열을 포함한다" 함은 상기 폴리뉴클레오티드 또는 폴리펩티드가 (i) 상기 특정 핵산 서열(염기서열) 또는 아미노산 서열로 이루어지거나 이를 필수적으로 포함하거나, 또는 (ii) 상기 특정 핵산 서열(염기서열) 또는 아미노산 서열과 적어도 60% 이상, 70% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 98% 이상, 99.5% 이상, 또는 99.9% 이상의 상동성을 갖는 핵산 서열 또는 아미노산 서열로 이루어지거나 이를 필수적으로 포함하고 본래의 기능 및/또는 목적하는 기능을 유지하는 것을 의미할 수 있다.
본 출원에서, ‘상동성 (homology)’ 또는 ‘동일성 (identity)’은 두 개의 주어진 아미노산 서열 또는 염기 서열 상호간 유사한 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 일부분과 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드와의 하이브리드화 역시 포함됨이 자명하다.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.
일 예에서, 상기 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체는 서열번호 1의 아미노산 서열 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 갖는 아미노산 서열에서, 서열번호 1의 아미노산 서열의 3번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환된 것일 수 있다. 또한, 일 예에서, 본 출원의 폴리펩티드 변이체는 서열번호 1의 아미노산 서열의 3번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환된 폴리펩티드로서 서열번호 1의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함하는 폴리펩티드일 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 본 출원의 변이체에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 변이체도 본 출원의 변이체에 포함됨은 자명하다. 예를 들면, 상기 아미노산 서열 N-말단, C-말단 그리고/또는 내부에 본 출원의 변이체의 기능을 변경하지 않는 서열 추가 또는 결실, 자연적으로 발생할 수 있는 돌연변이, 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 가지는 경우이다.
상기 “보존적 치환(conservative substitution)”은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 단백질 또는 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다.
본 출원에서, "변이체(variant)"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)되어 상기 변이체의 변이 전 아미노산 서열과 상이하나 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다. 이러한 변이체는 일반적으로 상기 폴리펩티드의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 폴리펩티드의 특성을 평가하여 동정(identify)될 수 있다. 즉, 변이체의 능력은 변이 전 폴리펩티드에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이체를 포함할 수 있다. 다른 변이체는 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이체를 포함할 수 있다. 상기 용어 “변이체”는 변이형, 변형, 변이형 폴리펩티드, 변이된 단백질, 변이 및 변이체 등의 용어(영문 표현으로는 modification, modified polypeptide, modified protein, mutant, mutein, divergent 등)가 혼용되어 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다. 일 예에서, 상기 변이체는 서열번호 1의 아미노산 서열의 3번째 위치에 상응하는 아미노산인 알라닌이 다른 아미노산(예를 들면, 알라닌 외의 다른 아미노산)으로 치환된, 서열번호 21로 기재된 아미노산 서열을 포함하는 폴리펩티드일 수 있다.
또한, 변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 변이체의 N-말단에는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이동(translocation)에 관여하는 시그널(또는 리더) 서열이 컨쥬게이트 될 수 있다. 또한 상기 변이체는 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.
본 출원에서, ‘서열번호 ~의 아미노산 서열에서 ~번째’는 ‘서열번호 ~의 아미노산 서열로 구성되는(또는 이루어지는) 폴리펩티드의 N-말단에서 ~번째’와 동일한 의미로 사용될 수 있다.
본 출원에서, "상응하는(corresponding to)"은, 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다.
예를 들어, 임의의 아미노산 서열을 서열번호 1과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 1의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.
이러한 정렬에는 예를 들어 Needleman-Wunsch 알고리즘 (Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needle 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지 않고 당업계에 알려진 서열 정렬 프로그램, 쌍 서열(pairwise sequence) 비교 알고리즘 등을 적절히 사용할 수 있다.
일 예에서, 상기 폴리펩티드 변이체는 서열번호 1의 아미노산 서열의 3번째 위치에 상응하는 아미노산인 알라닌이 다른 아미노산으로 치환되고, 서열번호 1의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다.
일 예에서, 상기 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체는 서열번호 1의 아미노산 서열에서 3번째 아미노산이 다른 아미노산으로 치환된 것일 수 있다.
상기 다른 아미노산은 치환되기 전에 상기 위치(서열번호 1 의 아미노산 서열에서 이에 상응하는 위치)에 존재하던 아미노산(예를 들면, 알라닌) 외의 다른 종류의 아미노산 잔기를 의미할 수 있고, 예를 들면, 프롤린, 아르기닌, 류신, 이소류신, 발린, 페닐알라닌, 트립토판, 메티오닌, 글리신, 세린, 쓰레오닌, 시스테인, 티로신, 아스파라진, 글루타민, 리신, 히스티딘, 아스파르트산, 및 글루탐산일 수 있다.
일 예에 따른 폴리펩티드 변이체는,
서열번호 1의 3번째 위치에 상응하는 아미노산인 알라닌이 알라닌 이외의 다른 아미노산으로 치환된 것일 수 있다. 상기 알라닌 이외의 다른 아미노산은 알지닌, 프롤린, 류신, 이소류신, 발린, 페닐알라닌, 트립토판, 메티오닌, 글리신, 세린, 트레오닌, 시스테인, 티로신, 아스파라진, 글루타민, 리신, 히스티딘, 아스파르트산 및 글루탐산을 포함할 수 있다. 일 구체예에 따른 폴리펩티드 변이체는 상기 3번째 위치에 상응하는 알라닌이 쓰레오닌으로 치환된 것일 수 있다.
일 예에 따른 폴리펩티드 변이체는 서열번호 1의 아미노산 서열에서 3번째 알라닌이 쓰레오닌으로 치환된 것일 수 있다.
일 예에 따른 폴리펩티드 변이체는 서열번호 21의 아미노산 서열을 포함하거나 서열번호 21의 아미노산 서열로 필수적으로 이루어질(essentially consisting of) 수 있다.
일 예에 따른 폴리펩티드 변이체는 서열번호 1 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 갖는 아미노산 서열에서, 서열번호 1의 아미노산 서열의 3번째 잔기에 상응하는 아미노산이 다른 아미노산으로 치환되어, 치환 전의 폴리펩티드 보다 바이오틴 생산 활성이 증가된 것일 수 있다 .
본 출원에서 용어, 폴리펩티드 활성의 “강화”는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 활성화(activation), 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 활성화, 강화, 상향조절, 과발현, 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 “내재적 활성”은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 “변형 전 활성”과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 “강화”, “상향조절”, “과발현” 또는 “증가”한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성 및/또는 농도(발현량)에 비하여 향상된 것을 의미한다.
상기 강화는 외래의 폴리펩티드를 도입하거나, 내재적인 폴리펩티드의 활성 강화 및/또는 농도(발현량)를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.
상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).
구체적으로, 본 출원의 폴리펩티드의 강화는
1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가;
2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체;
3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;
4) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드의 아미노산 서열의 변형;
5) 폴리펩티드 활성이 강화도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형 (예를 들어, 폴리펩티드의 활성이 강화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 폴리뉴클레오티드 서열의 변형);
6) 폴리펩티드의 활성을 나타내는 외래 폴리펩티드 또는 이를 코딩하는 외래 폴리뉴클레오티드의 도입;
7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화;
8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식; 또는
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.
보다 구체적으로,
상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터의 숙주세포 내로의 도입에 의해 달성되는 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 카피 이상 도입에 의해 달성되는 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.
상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일 예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.
공지된 강력한 프로모터의 예에는 cj1 내지 cj7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터, yccA 프로모터 등이 있으나, 이에 제한되지 않는다.
상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈을 코딩하는 염기 서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.
상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커 (selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.
상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.
상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.
상기 8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식하는 것은, 예를 들어 분석하고자 하는 폴리펩티드의 서열정보를 기지 단백질들의 서열정보가 저장된 데이터베이스와 비교함으로써 서열의 유사성 정도에 따라 주형 단백질 후보를 결정하고 이를 토대로 구조를 확인하여, 변형하거나 화학적으로 수식할 노출 부위를 선택하여 변형 또는 수식하는 것일 수 있다.
이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도 발현량이 야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 용어, 폴리펩티드의 “약화”는 내재적 활성에 비하여 활성이 감소되거나 또는 활성이 없는 것을 모두 포함하는 개념이다. 상기 약화는 불활성화(inactivation), 결핍(deficiency), 하향조절(down-regulation), 감소(decrease), 저하(reduce), 감쇠(attenuation) 등의 용어와 혼용될 수 있다.
상기 약화는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드의 변이 등으로 폴리펩티드 자체의 활성이 본래 미생물이 가지고 있는 폴리펩티드의 활성에 비해 감소 또는 제거된 경우, 이를 코딩하는 폴리뉴클레오티드의 유전자의 발현 저해 또는 폴리펩티드로의 번역(translation) 저해 등으로 세포 내에서 전체적인 폴리펩티드 활성 정도 및/또는 농도(발현량)가 천연형 균주에 비하여 낮은 경우, 상기 폴리뉴클레오티드의 발현이 전혀 이루어지지 않은 경우, 및/또는 폴리뉴클레오티드의 발현이 되더라도 폴리펩티드의 활성이 없는 경우 역시 포함할 수 있다. 상기 “내재적 활성”은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주, 야생형 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 “변형 전 활성”과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 “불활성화, 결핍, 감소, 하향조절, 저하, 감쇠”한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성에 비하여 낮아진 것을 의미한다.
이러한 폴리펩티드의 활성의 약화는, 당업계에 알려진 임의의 방법에 의하여 수행될 수 있으나 이로 제한되는 것은 아니며, 당해 분야에 잘 알려진 다양한 방법의 적용으로 달성될 수 있다(예컨대, Nakashima N et al., Bacterial cellular engineering by genome editing and gene silencing. Int J Mol Sci. 2014;15(2):2773-2793, Sambrook et al. Molecular Cloning 2012 등).
구체적으로, 본 출원의 폴리펩티드의 약화는
1) 폴리펩티드를 코딩하는 유전자 전체 또는 일부의 결손;
2) 폴리펩티드를 코딩하는 유전자의 발현이 감소하도록 발현조절영역(또는 발현조절서열)의 변형;
3) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 구성하는 아미노산 서열의 변형(예컨대, 아미노산 서열 상의 1 이상의 아미노산의 삭제/치환/부가);
4) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 코딩하는 유전자 서열의 변형 (예를 들어, 폴리펩티드의 활성이 제거 또는 약화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 핵산염기 서열 상의 1 이상의 핵산염기의 삭제/치환/부가);
5) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;
6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입;
7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가;
8) 폴리펩티드를 코딩하는 유전자 서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE); 또는
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.
예컨대,
상기 1) 폴리펩티드를 코딩하는 상기 유전자 일부 또는 전체의 결손은, 염색체 내 내재적 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드 전체의 제거, 일부 뉴클레오티드가 결실된 폴리뉴클레오티드로의 교체 또는 마커 유전자로 교체일 수 있다.
또한, 상기 2) 발현조절영역(또는 발현조절서열)의 변형은, 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 발현조절영역(또는 발현조절서열) 상의 변이 발생, 또는 더욱 약한 활성을 갖는 서열로의 교체일 수 있다. 상기 발현조절영역에는 프로모터, 오퍼레이터 서열, 리보좀 결합부위를 코딩하는 서열, 및 전사와 해독의 종결을 조절하는 서열을 포함하나, 이에 한정되는 것은 아니다.
또한, 상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 낮은 다른 개시코돈을 코딩하는 염기서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.
또한, 상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은 폴리펩티드의 활성을 약화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 약한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 없도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 예를 들면, 폴리뉴클레오티드 서열 내 변이를 도입하여 종결 코돈을 형성시킴으로써, 유전자의 발현을 저해하거나 약화시킬 수 있으나, 이에 제한되지 않는다.
상기 6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입은 예를 들어 문헌 [Weintraub, H. et al., Antisense-RNA as a molecular tool for genetic analysis, Reviews - Trends in Genetics, Vol. 1(1) 1986]을 참고할 수 있다.
상기 7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가는 mRNA 번역을 불가능하게 하거나 속도를 저하시키는 것일 수 있다.
상기 8) 폴리펩티드를 코딩하는 유전자서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE)는 상기 폴리펩티드를 코딩하는 유전자의 전사체에 상보적인 안티센스 뉴클레오티드를 만들어 활성을 약화하는 것일 수 있다.
또 다른 양상은 상기 폴리펩티드 변이체를 코딩하는 폴리뉴클레오티드를 제공할 수 있다.
본 출원에서, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이체를 코딩하는 폴리뉴클레오티드 단편을 의미한다.
본 출원의 변이체를 코딩하는 폴리뉴클레오티드는 서열번호 21로 기재된 아미노산 서열을 코딩하는 염기서열을 포함할 수 있다. 본 출원의 일 예로, 본 출원의 폴리뉴클레오티드는 서열번호 22의 서열을 가지거나 포함할 수 있다. 또한, 본 출원의 폴리뉴클레오티드는 서열번호 22의 서열로 이루어지거나, 필수적으로 구성될 수 있다.
본 출원의 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 변이체를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 본 출원의 변이체의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 본 출원의 폴리뉴클레오티드는 서열번호 2의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 2의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다. 이때, 상기 상동성 또는 동일성을 갖는 서열에서, 서열번호 1의 220번째 위치에 상응하는 아미노산을 코딩하는 코돈은, 시스테인을 코딩하는 코돈 중 하나일 수 있다.
또한, 본 출원의 폴리뉴클레오티드는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 본 출원의 폴리뉴클레오티드 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화할 수 있는 서열이라면 제한없이 포함될 수 있다. 상기 “엄격한 조건(stringent condition)”이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(J. Sambrook et al.,Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al.,Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8 참조)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1×SSC, 0.1% SDS, 구체적으로 60℃, 0.1×SSC, 0.1% SDS, 보다 구체적으로 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(miS.martch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, “상보적”은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.
구체적으로, 본 출원의 폴리뉴클레오티드와 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
상기 폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(예컨대, J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition; F.M. Ausubel et al.,Current Protocols in Molecular Biology, 9.50-9.51, 11.7-11.8 참조).
또 다른 양상은 상기 폴리뉴클레오티드를 포함하는 벡터를 제공할 수 있다. 상기 벡터는 상기 폴리뉴클레오티드를 숙주세포에서 발현시키기 위한 발현 벡터일 수 있으나, 이에 제한되지 않는다.
본 출원에서, “벡터"는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 포함하는 DNA 제조물을 포함할 수 있다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pDZ계, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pDC, pDCM2, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.
일례로 세포 내 염색체 삽입용 벡터를 통해 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
본 출원에서 용어 "형질전환"은 표적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 폴리펩티드가 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 폴리펩티드를 코딩하는 DNA 및/또는 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이체를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다.
또 다른 양상은, 바이오틴 신타제 활성이 강화된, 바이오틴을 생산하는 미생물을 제공할 수 있다. 일 예에서 상기 바이오틴 신타제는 세라티아 속(Serratia sp.; 예를 들면 세라티아 마르세센스(Serratia marcescens)) 또는 에스케리키아 속(Escherichia sp.; 예를 들면 대장균 (Escherichia coli)) 미생물 유래일 수 있다. 폴리펩티드(예를 들면, 바이오틴 신타제) 활성의 강화와 관련해서는 전술한 바와 같다.
일 예에서 상기 미생물은 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드; 본 출원의 폴리펩티드 변이체; 상기 폴리펩티드 또는 상기 폴리펩티드 변이체를 암호화하는 폴리뉴클레오티드; 및 상기 폴리뉴클레오티드를 포함하는 벡터로 이루어지는 군에서 선택된 1종 이상을 포함할 수 있다.
일 예에서, 상기 미생물은 7,8-디아미노-펠라르곤산 아미노트랜스퍼라제(7,8-diamino-pelargonic acid aminotransferase), 8-아미노-7-옥소노나노에이트 신타아제(8-amino-7-oxononanoate synthase), 말로닐-ACP O-메틸트랜스퍼라제(Malonyl-ACP O-methyltransferase), 및 데티오바이오틴 신테타제(Dethiobiotin synthetase)으로 이루어진 군에서 선택된 1종 이상의 활성이 추가로 강화된 것일 수 있고, 예를 들면, 본 출원의 변이체를 암호화도록 변이된 bioB 유전자를 포함하는 bioABFCD 오페론이 도입된 것일 수 있다. 폴리펩티드 활성의 강화와 관련해서는 전술한 바와 같다.
본 출원에서, “7,8-디아미노-펠라르곤산 아미노트랜스퍼라제(7,8-diamino-pelargonic acid aminotransferase)”는 8-아미노-7-옥소노나노에이트 신타아제(8-amino-7-oxononanoate synthase)의 활성으로 생산된 8-amino-7-oxononanoate (7-Keto-8-aminopelargonic acid; KAPA)에 SAM 또는 라이신 같은 아민기를 가진 효소 특이적 특정 물질로부터 얻은 alpha-amino group을 결합시켜 7,8-diamino-pelargonic acid (DAPA)를 생성하는 단백질을 의미할 수 있다.
본 출원에서, “8-아미노-7-옥소노나노에이트 신타아제(8-amino-7-oxononanoate synthase)”는 6-carboxyhexanoyl-CoA (Pimeloyl-coA/ACP)와 알라닌의 탈탄산 축합반응을 촉매하는 단백질을 의미할 수 있다.
본 출원에서, “말로닐-ACP O-메틸트랜스퍼라제(Malonyl-ACP O-methyltransferase 또는 Malonyl-[acyl-carrier protein] O-methyltransferase)”는 지방산 생합성 경로 중의 탄소 중합체를 pimeloyl-coA/ACP 로 전환하는 효소로 malonyl thioester의 카복시 그룹을 메틸 에스터 화 시키는 단백질을 의미할 수 있다.
본 출원에서, “데티오바이오틴 신테타제(Dethiobiotin synthetase)”는 바이오틴 생산 전구물질인 데티오바이오틴을 7,8-diamino-pelargonic acid (DAPA)로부터 전환시키는 효소를 의미할 수 있다.
본 출원에서 용어, "균주(또는, 미생물)"는 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 폴리펩티드, 단백질 또는 산물의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.
본 출원의 균주는 서열번호 1의 아미노산 서열을 포함하는 폴리펩티드; 본 출원의 변이체, 본 출원의 폴리뉴클레오티드 및 본 출원의 폴리뉴클레오티드를 포함하는 벡터 중 어느 하나 이상을 포함하는 균주; 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 발현하도록 변형된 균주; 본 출원의 변이체, 또는 본 출원의 폴리뉴클레오티드를 발현하는 균주 (예컨대, 재조합 균주); 또는 본 출원의 변이체 활성을 갖는 균주 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.
본 출원의 균주는 바이오틴 생산능을 가진 균주일 수 있다.
본 출원의 균주는 자연적으로 바이오틴 신타제 또는 바이오틴 생산능을 가지고 있는 미생물, 또는 바이오틴 신타제 또는 바이오틴 생산능이 없는 모균주에 본 출원의 변이체 또는 이를 코딩하는 폴리뉴클레오티드(또는 상기 폴리뉴클레오티드를 포함하는 벡터)가 도입되거나 및/또는 바이오틴 생산능이 부여된 미생물일 수 있으나 이에 제한되지 않는다.
일 예로, 본 출원의 균주는 본 출원의 폴리뉴클레오티드 또는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어, 본 출원의 변이체를 발현하는 세포 또는 미생물로서, 본 출원의 목적상 본 출원의 균주는 본 출원의 변이체를 포함하여 바이오틴을 생산할 수 있는 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 균주는 천연의 야생형 미생물 또는 바이오틴을 생산하는 미생물에 본 출원의 변이체를 코딩하는 폴리뉴클레오티드가 도입됨으로써 바이오틴 신타제 활성을 갖는 변이체가 발현되어, 바이오틴 생산능이 증가된 재조합 균주일 수 있다. 상기 바이오틴 생산능이 증가된 재조합 균주는, 천연의 야생형 미생물 또는 바이오틴 신타제 비변형 미생물(즉, 야생형 바이오틴 신타제를 발현하는 미생물)에 비하여 바이오틴 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다. 그 예로, 상기 바이오틴 생산능의 증가 여부를 비교하는 대상 균주인, 바이오틴 신타제 비변형 미생물은 야생형 대장균, 대장균 W3110, 대장균 CV04-0002 균주, 및/또는 대장균 CV04-0104 균주(상기 CV04-0002 균주 기반의 대장균 생합성 오페론이 추가 도입된 균주)일 수 있으나, 이에 제한되지 않는다.
일 예로, 상기 생산능이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물의 바이오틴 생산량(또는 생산능)에 비해 약 1% 이상, 약 2.5% 이상, 약 5% 이상, 약 6% 이상, 약 7% 이상, 약 8% 이상, 약 9% 이상, 약 10% 이상, 약 10.5% 이상, 약 11% 이상, 약 11.5%이상, 약 12% 이상, 약 12.5% 이상, 약 13% 이상, 약 13.5% 이상, 약 14% 이상, 약 14.5% 이상, 약 15% 이상, 약 15.5% 이상, 약 16% 이상, 약 16.5% 이상, 약 17% 이상, 약 17.5% 이상, 약 18% 이상, 약 18.5% 이상, 약 19% 이상, 약 19.5% 이상, 약 20% 이상, 약 20.5% 이상, 약 21% 이상, 약 21.5% 이상, 약 22% 이상, 약 22.5% 이상, 약 23% 이상, 약 23.5% 이상, 약 24% 이상, 약 24.5% 이상, 약 25% 이상, 약 25.5% 이상, 약 26% 이상, 약 26.5% 이상, 약 27% 이상, 약 27.5% 이상, 약 28% 이상, 약 28.5% 이상, 약 29% 이상, 약 29.5% 이상, 약 30% 이상, 약 31% 이상, 약 32% 이상, 약 33% 이상, 약 34% 이상, 또는 약 35% 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 200% 이하, 약 150% 이하, 약 100% 이하, 약 50% 이하, 약 45% 이하, 약 40% 이하, 또는 약 35% 이하일 수 있음) 증가된 것일 수 있다. 다른 예에서, 상기 생산량이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물에 비하여, 바이오틴 생산량(또는 생산능)이 약 1.1배 이상, 약 1.12배 이상, 약 1.13배 이상, 1.15배 이상, 1.16배 이상, 1.17배 이상, 1.18배 이상, 1.19배 이상, 약 1.2 배 이상, 1.25배 이상, 또는 약 1.3배 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 10배 이하, 약 5배 이하, 약 3배 이하, 또는 약 2배 이하일 수 있음) 증가된 것일 수 있으나, 이에 제한되지 않는다. 상기 용어 “약(about)”은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.
본 출원에서, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 예를 들어, 상기 비변형 미생물은 본 명세서에 기재된 바이오틴 신타제 변이체가 도입되지 않거나 도입되기 전의 균주를 의미할 수 있다. 상기 "비변형 미생물"은 “변형 전 균주”, “변형 전 미생물”, “비변이 균주”, “비변형 균주”, “비변이 미생물” 또는 “기준 미생물”과 혼용될 수 있다.
상기 미생물은 에스케리키아 속(Escherichia sp.)일 수 있으며, 상기 에스케리키아 속 미생물은 대장균(Escherichia coli)일 수 있다.
본 출원의 미생물에서 폴리뉴클레오티드의 일부 또는 전체의 변형(예컨대, 상술한 단백질 변이체를 코딩하기 위한 변형)은 (a) 미생물 내 염색체 삽입용 벡터를 이용한 상동 재조합 또는 유전자가위 (engineered nuclease, e.g., CRISPR-Cas9)을 이용한 유전체 교정 및/또는 (b) 자외선 및 방사선 등과 같은 빛 및/또는 화학물질 처리에 의해 유도될 수 있으나 이에 제한되지 않는다. 상기 유전자 일부 또는 전체의 변형 방법에는 DNA 재조합 기술에 의한 방법이 포함될 수 있다. 예를 들면, 목적 유전자와 상동성이 있는 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열 또는 벡터를 상기 미생물에 주입하여 상동 재조합(homologous recombination)이 일어나게 함으로써 유전자 일부 또는 전체의 결손이 이루어질 수 있다. 상기 주입되는 뉴클레오티드 서열 또는 벡터는 우성 선별 마커를 포함할 수 있으나, 이에 제한되는 것은 아니다.
다른 양상은 상기 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체, 상기 변이체를 암호화하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 포함하는 벡터, 및 상기 미생물(또는 균주, 재조합 세포)로 이루어진 군에서 선택된 1종 이상을 포함하는, 바이오틴 생산용 조성물을 제공할 수 있다. 상기 변이체, 폴리뉴클레오티드, 벡터, 및 미생물 등은 전술한 바와 같다.
일 예에서, 상기 생산용 조성물은 바이오틴 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.
다른 양상은 상기 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체, 이를 암호화하는 폴리뉴클레오티드, 및/또는 상기 폴리뉴클레오티드를 포함하는 재조합 벡터를 미생물에 도입(예를 들면, 형질전환)시키는 단계를 포함하는, 상기 미생물의 바이오틴 생산능 증가 방법 또는 상기 미생물에 바이오틴 생산능을 부여하는 방법을 제공할 수 있다.
본 출원의 또 다른 하나의 양태는 본 출원의 미생물을 배지에서 배양하는 단계를 포함하는, 바이오틴 생산방법을 제공한다.
본 출원에서, "배양"은 본 출원의 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및/또는 유가식일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서, "배지"는 본 출원의 미생물을 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 미생물의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 미생물을 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다. 구체적으로, 미생물에 대한 배양 배지는 문헌["Manual of Methods for General Bacteriology" by the American Society for Bacteriology (Washington D.C., USA, 1981)] 등에서 찾아볼 수 있다.
본 출원에서 상기 탄소원으로는 글루코오스, 사카로오스, 락토오스, 프룩토오스, 수크로오스, 말토오스 등과 같은 탄수화물; 만니톨, 소르비톨 등과 같은 당 알코올, 피루브산, 락트산, 시트르산 등과 같은 유기산; 글루탐산, 메티오닌, 리신 등과 같은 아미노산 등이 포함될 수 있다. 또한, 전분 가수분해물, 당밀, 블랙스트랩 당밀, 쌀겨울, 카사버, 사탕수수 찌꺼기 및 옥수수 침지액 같은 천연의 유기 영양원을 사용할 수 있으며, 구체적으로는 글루코오스 및 살균된 전처리 당밀(즉, 환원당으로 전환된 당밀) 등과 같은 탄수화물이 사용될 수 있으며, 그 외의 적정량의 탄소원을 제한 없이 다양하게 이용할 수 있다. 이들 탄소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 질소원으로는 암모니아, 황산암모늄, 염화암모늄, 초산암모늄, 인산암모늄, 탄산안모늄, 질산암모늄 등과 같은 무기질소원; 글루탐산, 메티오닌, 글루타민 등과 같은 아미노산, 펩톤, NZ-아민, 육류 추출물, 효모 추출물, 맥아 추출물, 옥수수 침지액, 카세인 가수분해물, 어류 또는 그의 분해생성물, 탈지 대두 케이크 또는 그의 분해 생성물 등과 같은 유기 질소원이 사용될 수 있다. 이들 질소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 인원으로는 인산 제1칼륨, 인산 제2칼륨, 또는 이에 대응되는 소디움-함유 염 등이 포함될 수 있다. 무기화합물로는 염화나트륨, 염화칼슘, 염화철, 황산마그네슘, 황산철, 황산망간, 탄산칼슘 등이 사용될 수 있으며, 그 외에 아미노산, 비타민 및/또는 적절한 전구체 등이 포함될 수 있다. 이들 구성성분 또는 전구체는 배지에 회분식 또는 연속식으로 첨가될 수 있다. 그러나, 이에 한정되는 것은 아니다.
또한, 본 출원의 미생물의 배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산, 황산 등과 같은 화합물을 배지에 적절한 방식으로 첨가하여, 배지의 pH를 조정할 수 있다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한, 배지의 호기 상태를 유지하기 위하여, 배지 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으며, 이에 한정되는 것은 아니다.
본 출원의 배양에서 배양온도는 20 내지 45℃, 구체적으로는 25 내지 40℃ 를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 배양에 의하여 생산된 바이오틴은 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.
본 출원의 바이오틴 생산방법은, 본 출원의 미생물을 준비하는 단계, 상기 미생물을 배양하기 위한 배지를 준비하는 단계, 또는 이들의 조합(순서에 무관, in any order)을, 예를 들어, 상기 배양하는 단계 이전에, 추가로 포함할 수 있다.
본 출원의 바이오틴 생산방법은, 상기 배양에 따른 배지(배양이 수행된 배지) 또는 상기 미생물로부터 바이오틴을 회수하는 단계를 추가로 포함할 수 있다. 상기 회수하는 단계는 상기 배양하는 단계 이후에 추가로 포함될 수 있다.
상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 바이오틴을 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 바이오틴을 회수할 수 있다.
또한, 본 출원의 바이오틴 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다. 일 예에서, 본 출원의 바이오틴 생산방법이 회수 단계와 정제 단계를 모두 포함하는 경우, 상기 회수 단계와 정제 단계는 순서에 상관없이 이시적(또는 연속적)으로 수행되거나, 동시에 또는 하나의 단계로 통합되어 수행될 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 방법에서, 변이체, 폴리뉴클레오티드, 벡터 및 균주 등은 전술한 바와 같다.
본 출원의 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체를 포함하는, 미생물을 배양하는 경우, 기존 비변형 폴리펩티드를 갖는 미생물에 비해 고수율로 바이오틴 생산이 가능하다.
본 발명은 하기 실시예를 들어 더욱 자세히 설명할 것이나, 하기 실시예로 권리범위가 한정되는 의도는 아니다.
실시예 1.
S
.
marcescens
유래 바이오틴 신타제 변이체
실시예 1-1.
S. marcescens
유래 바이오틴 신타제 변이체 발현 벡터 제작 및 변이 균주 제작
세라티아 마르세센스(Serratia marcescens 또는 S.mar) 유래 바이오틴 신타제 단백질에서 세 번째 위치의 아미노산인 알라닌 잔기를 쓰레오닌으로 치환한 형태의 변이체(A3T, S.mar)가 바이오틴 생산에 미치는 영향을 확인하고자, 상기 언급한 아미노산 변이가 포함된 과발현 벡터를 제작하였다.
pSC101 오리진을 포함하는 pCL1920벡터 (GenBank No AB236930)를 기반으로 S. marcescens 유래 bioB 유전자의 자가 프로모터를 이용하여 bioB 유전자가 코딩하는 단백질만을 발현할 수 있는 과발현 벡터 2종을 제작하였다. 벡터를 제작하기 위해 S.mar 야생형 균주(KTCT NO. 2354)의 염색체를 주형으로 하여 서열번호 3와 서열번호 4의 프라이머 쌍을 이용하여 PCR하여 변이가 포함되지 않은 야생형 bioB 유전자를 획득하고, 서열번호 3와 서열번호 5, 서열번호 6와 서열번호 4의 프라이머 쌍을 이용하여 PCR하여 변이체를 코딩하는 bioB 유전자를 획득하였다. 사용한 프라이머 서열은 표 1에 기재하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 25회 반복한 후, 72℃에서 5분간 중합반응을 수행하는 조건으로 PCR을 수행하였다. 그 결과 야생형 단편조각 1166bp의 bioB(S.mar Wt) (서열번호 7)과 변이체형 단편조각인 132bp의 bioB(g7a) 1 (서열번호 8)와 1075bp의 bioB(g7a) 2 (서열번호 9)의 DNA 단편을 수득하였다. 수득한 DNA 산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 SmaI의 제한효소로 처리된 pCL1920 벡터와 다카라(TaKaRa)의 Infusion Cloning Kit를 사용하여 클로닝함으로써 2종의 야생형 바이오틴 신타제 과발현 벡터 pCL1920-Pn-bioB(S.mar)와 변이형 바이오틴 신타제 과발현 벡터 pCL1920-Pn-bioB(A3T, S.mar)를 제작하였다.
명칭 | 서열(5'->3') | 서열번호 |
VB07_0001 | GACTCTAGAGGATCCCCgggTGTTGTAAACCAAATTGGAT | 서열번호 3 |
VB07_0002 | ATTCGAGCTCGGTACCCgggTCACGGCGCCGCGTTGTAAA | 서열번호 4 |
VB07_0003 | TGTCCAGTGAATGCGGTCGGTCATCATGGCGTCTCCAAAAC | 서열번호 5 |
VB07_0004 | GTTTTGGAGACGCCATGATGACCGACCGCATTCACTGGACA | 서열번호 6 |
바이오틴 생산능 증가여부를 확인하기 위해 상기 제작된 2종의 bioB 유전자 과발현 벡터 (야생형 바이오틴 신타제 과발현 벡터 pCL1920-Pn-bioB(S.mar)와 변이형 바이오틴 신타제 과발현 벡터 pCL1920-Pn-bioB(A3T, S.mar))를 열충격법(Heat shock transformation)으로 바이오틴이 소량 생산되는 대장균 균주 (CV04-0002)에 도입하였다. 대조군으로 pCL1920 벡터를 CV04-0002 균주에 도입하였다.
상기 CV04-0002 균주는 대장균(W3110) birA 유전자가 제거되고 코리네박테리움 글루타미쿰 유래 birA 유전자가 삽입된 균주(W3110 ΔbirA(E.co)::Pcj1_birA(C.gl))로서, 다음과 같은 방법으로 수득하였다:
대장균 W3110 염색체 DNA를 주형으로 하여 VB7_7 (서열번호 32)과 VB7_8 (서열번호 33)의 프라이머를 이용하여 업스트림 (Upstream) 지역 약 0.5 kb (서열번호 34; 업스트림 단편), VB7_9 (서열번호 35)와 VB7_10 (서열번호 36)의 프라이머를 이용하여 다운스트림 (Downstream) 지역 약 0.5 kb의 (서열번호 37; 다운스트림 단편) 유전자 단편을 PCR 수행을 통해 수득하였다. PCR 반응을 위한 중합효소로는 SolgTM Pfu-X DNA 폴리머라제를 사용하였으며, PCR 증폭 조건은 95℃에서 5분간 변성 후, 95℃ 30초 변성, 55℃ 60초 어닐링, 72℃ 30초 중합을 30회 반복한 후, 72℃에서 5분간 중합반응을 수행하여 수득하였다. 수득한 DNA 산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 증폭된 birA 업스트림 및 다운스트림 단편, 그리고 EcoRⅤ 제한효소로 절단된 염색체 형질전환용 벡터 pSKH vector(WO2020032590A1 참조)를 깁슨 어셈블리 (DG Gibson et al., NATURE METHODS, VOL.6 NO.5, MAY 2009, NEBuilder HiFi DNA Assembly Master Mix) 방법을 이용하여 클로닝함으로써 birA 유전자 결손 및 타겟 유전자 삽입용 벡터 pSKHΔbirA(E.co)를 제작하였다. 다음으로 birA 유전자 결손 벡터 pSKHΔbirA(E.co)를 기반으로 기공지된 cj1 프로모터를 포함한 코리네박테리움 글루타미쿰 유래 birA 유전자를 삽입하는 벡터를 제작하였다. 우선 합성 cj1 프로모터 DNA (서열번호 38)를 주형으로 VB7_11 (서열번호 39)과 VB7_15 (서열번호 40)의 프라이머를 사용하여 약 0.3 kb의 cj1 프로모터 단편을 PCR 수행을 통해 수득하고, 코리네박테리움 글루타미쿰 ATCC13032 염색체 DNA를 주형으로 하여 VB7_16 (서열번호 41)과 VB7_17 (서열번호 42)의 프라이머를 사용하여 약 0.8 kb의 birA 유전자 단편을 PCR 수행을 통해 수득하였다(서열번호 43). 수득한 DNA 산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 cj1 프로모터와 각 각의 birA 유전자 단편, 그리고 ScaⅠ제한효소로 절단된 pSKHΔbirA(E.co) 벡터를 깁슨 어셈블리 방법을 이용하여 클로닝함으로써 재조합 플라스미드를 획득하여, SKHΔbirA(E.co)::Pcj1_birA(C.gl)로 명명하였다. 상기 얻어진 pSKHΔbirA(E.co)::Pcj1_birA(C.gl)를 야생형 대장균 W3110 electro-competent cell에 전기천공법으로 형질전환(transformation) 후, 2차 교차 과정을 거쳐 CV04-0002 (W3110 ΔbirA(E.co)::Pcj1_birA(C.gl))를 수득하였다.
각각의 균주를 LB 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. LB 고체 배지에서 밤새 배양한 균주를 하기 표 2의 조성을 갖는 역가 배지 25㎖에 접종한 다음, 이를 30℃, 200rpm의 배양기에서 40시간 동안 배양하고, 각 균주의 바이오틴 생산량을 MS-MS 기법을 이용하여 측정하고, 그 결과를 표 3에 나타내었다.
조성 | 농도(g/L) |
포도당 | 30 |
KH2PO4 | 0.3 |
K2HPO4 | 0.6 |
효모액기스 | 2.5 |
(NH4)2SO4 | 15 |
MgSO4,7H2O | 1 |
FeSO4,7H2O | 0.030 |
NaCl | 2.5 |
탄산칼슘 | 40 |
균주명 | OD562nm | 소모당(g/L) | 바이오틴(mg/L) |
E.coli CV04-0002/pCL1920 | 35.3 | 30 | 0.17 |
E.coli CV04-0002/ pCL1920-Pn-bioB(S.mar) | 34.1 | 30 | 0.35 |
E.coli CV04-0002/ pCL1920-Pn-bioB(A3T, S.mar) | 34.3 | 30 | 0.49 |
상기 표 3에서 볼 수 있는 바와 같이, S. marcescens 균주 유래의 bioB 유전자가 과발현된 균주의 경우 바이오틴 생산량이 증가하였으며, S. marcescens 유래 바이오틴 신타아제 변이체(A3T, S.mar)가 도입된 균주(CV04-0002/pCL1920-Pn-bioB(A3T, S.mar))도 변이체가 도입되지 않은 모균주 및 야생형 바이오틴 신타아제가 도입된 균주 대비 바이오틴 생산량이 증가하였다.
실시예 1-2.
S. marcescens
유래 바이오틴 신타제 변이체를 포함하는 바이오틴 오페론의 발현 벡터 제작 및 변이 균주 제작
본 실시예에서 바이오틴 오페론이 모두 포함된 바이오틴 생합성 강화 기반에서도 bioB 유전자의 변이형태가 바이오틴 생산 증가에 더 큰 영향을 줄 수 있는지 확인하고자 하였다. pCL1920벡터를 기반으로 S. marcescens 유래 바이오틴 오페론 bioABFCD 유전자의 자가 프로모터를 이용하여 bioABFCD 유전자가 코딩하는 단백질을 발현할 수 있는 과발현 벡터 2종을 제작하였다. 벡터를 제작하기 위해 S.mar 야생형 (KTCT NO: 2354) 균주의 염색체를 주형으로 하여 서열번호 10와 서열번호 11의 프라이머 쌍을 이용하여 PCR하여 변이가 포함되지 않은 야생형 bioABFCD 오페론 유전자를 획득하였고, 서열번호 10와 서열번호 5, 서열번호 11와 서열번호 6의 프라이머 쌍을 각각 이용하여 PCR하여 변이체(A3T, S.ma)를 암호화할 수 있는 bioB 유전자를 포함한 bioABFCD 오페론 유전자를 획득하였다. 사용한 프라이머의 서열은 표 1 및 표 4에 기재하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 6분을 25회 반복한 후, 72℃에서 10분간 중합반응을 수행하였다. 그 결과 야생형 단편조각 5016bp의 bioABFCD(Wt) (서열번호 12) 과 변이체형 단편조각인 1407bp의 bioAB (g7a)FCD 1 (서열번호 13)와 3650bp의 bioAB (g7a)FCD 2 (서열번호 14)의 DNA 단편을 수득하였다. 수득한 DNA산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 SmaI의 제한효소로 처리된 pCL1920 벡터와 다카라(TaKaRa)의 Infusion Cloning Kit를 사용하여 클로닝함으로써 2종의 야생형 과발현 벡터 pCL1920-Pn-bioABFCD(S.mar)와 변이형 과발현 벡터 pCL1920-Pn-bioAB(A3T, S.mar)FCD를 제작하였다.
명칭 | 서열(5'->3') | 서열번호 |
VB07_0005 | GACTCTAGAGGATCCCCgggTTAACGCGCGGCGTCGGCCA | 서열번호 10 |
VB07_0006 | ATTCGAGCTCGGTACCCgggTCACTGCGCCAGCAAGCTGA | 서열번호 11 |
바이오틴 생산능 증가여부를 확인하기 위해 상기 제작된 2종의 bioABFCD 유전자 과발현 벡터 (야생형 과발현 벡터 pCL1920-Pn-bioABFCD(S.ma)와 변이형 과발현 벡터 pCL1920-Pn-bioAB(A3T, S.ma)FCD)를 열충격법으로 바이오틴이 소량 생산되는 대장균 균주(CV04-0002)에 도입하였다. 대조군으로서 pCL1920 벡터를 CV04-0002 균주에 도입하였다.
각각의 균주를 LB 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. LB 고체 배지에서 밤새 배양한 균주를 상기 표 2의 조성을 갖는 역가배지 25㎖에 접종한 다음, 이를 30℃, 200 rpm의 배양기에서 48 시간 동안 배양하고, 각 균주의 바이오틴 생산량을 MS-MS 기법을 이용하여 측정하고, 그 결과를 표 5에 나타내었다.
균주명 | OD562nm | 소모당(g/L) | 바이오틴(mg/L) |
E.coli CV04-0002/pCL1920 | 36.1 | 30 | 0.2 |
E.coli CV04-0002/ pCL1920-Pn- bioABFCD (S.mar) | 35.6 | 30 | 1.6 |
E.coli CV04-0002/ pCL1920-Pn- bioAB (A3T, S.mar) FCD | 35.8 | 30 | 2.7 |
상기 표 5에서 볼 수 있는 바와 같이, 세라티아 균주 유래의 바이오틴 오페론이 과발현된 균주의 바이오틴 생산량이 증가하였고, 확인할 수 있었고, bioB 유전자가 코딩하는 단백질(바이오틴 신타제)에 A3T 변이를 포함하는 바이오틴 오페론이 도입된 pCL1920-Pn-bioAB(A3T, S.ma)FCD 균주의 바이오틴 생산량은 변이체가 도입되지 않은 모균주 및 야생형 바이오틴 오페론이 도입된 균주 대비 증가하였다.
실시예 2. 대장균 유래 바이오틴 신타제
실시예 2-1. 대장균 유래 바이오틴 신타제 발현 벡터 제작 및 변이 균주 제작
본 실시예에서 S. marcescens 유래 바이오틴 신타제와 대장균 유래 바이오틴 신타제의 바이오틴 생산에 미치는 영향 비교를 위해서 대장균 유래 bioB 유전자의 과발현 벡터를 제작하였다.
pCL1920벡터를 기반으로 대장균 유래 bioB 유전자의 자가 프로모터를 이용하여 bioB 유전자가 코딩하는 단백질만을 발현할 수 있는 과발현 벡터를 제작하였다. 벡터를 제작하기 위해 E. coli W3110 균주의 염색체를 주형으로 하여 서열번호 15과 서열번호 16의 프라이머 쌍을 이용하여 PCR하여 변이가 포함되지 않은 야생형 bioB 유전자를 획득하였다. 사용한 프라이머 서열은 표 6에 기재하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 2분을 25회 반복한 후, 72℃에서 5분간 중합반응을 수행하였다. 그 결과 야생형 단편조각 1167bp의 bioB(Wt, Eco) (서열번호 17) DNA 단편을 수득하였다. 수득한 DNA산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 SmaI의 제한효소로 처리된 pCL1920 벡터와 다카라(TaKaRa)의 Infusion Cloning Kit를 사용하여 클로닝함으로써 2종의 bioB 코딩 단백질 야생형 바이오틴 신타제 과발현 벡터 pCL1920-Pn-bioB(Eco, WT) 를 제작하였다.
명칭 | 서열(5'->3') | 서열번호 |
VB07_0007 | GACTCTAGAGGATCCCCgggAATCGACTTGTAAACCAAAT | 서열번호 15 |
VB07_0008 | ATTCGAGCTCGGTACCCgggTCATAATGCTGCCGCGTTGT | 서열번호 16 |
바이오틴 생산능 증가여부를 확인하기 위해 상기에서 제작된 bioB 유전자 과발현 벡터 (야생형 과발현 벡터 pCL1920-Pn-bioB(Eco)를 열충격법으로 바이오틴이 소량 생산되는 대장균 균주(CV04-0002)(실시예 1-1 참조)에 도입하였다. 대조군으로 pCL1920 벡터도 CV04-0002 균주에 도입하였다.
각각의 균주를 LB 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. LB 고체 배지에서 밤새 배양한 균주를 상기 표 2의 조성을 갖는 역가 배지 25㎖에 접종한 다음, 이를 30℃, 200rpm의 배양기에서 40시간 동안 배양하고, 각 균주의 바이오틴 생산량을 MS-MS 기법을 이용하여 측정하고, 그 결과를 표 7에 나타내었다.
균주명 | OD562nm | 소모당(g/L) | 바이오틴(mg/L) |
E.coli CV04-0002/pCL1920 | 35.1 | 30 | 0.16 |
E.coli CV04-0002/pCL1920-Pn-bioB(Eco) | 34.4 | 30 | 0.23 |
상기 표 7에서 볼 수 있는 바와 같이, 야생형 바이오틴 신타제를 발현할 수 있는 벡터가 도입된 균주(E.coli CV04-0002/pCL1920-Pn-bioB(Eco))는 공벡터가 들어간 균주 보다 바이오틴 생산량이 소폭 증가하였다.
실시예 2-2. 대장균 유래 바이오틴 신타제를 포함하는 바이오틴 오페론의 발현 벡터 제작 및 변이 균주 제작
바이오틴 오페론이 모두 포함된 바이오틴 생합성 강화벡터 기반에서도 bioB 유전자의 변이가 바이오틴 생산 증가에 더 큰 영향을 줄 수 있는지 확인하기 위하여 pCL1920벡터(GenBank No AB236930)를 기반으로 대장균 유래 바이오틴 오페론 bioABFCD 유전자의 자가 프로모터를 이용하여 bioABFCD bioB 유전자가 코딩하는 단백질만을 발현할 수 있는 과발현 벡터를 제작하였다. 벡터를 제작하기 위해 대장균 W3110 균주의 염색체를 주형으로 하여 서열번호 18와 서열번호 19의 프라이머 쌍을 이용하여 PCR하여 변이가 포함되지 않은 야생형 bioABFCD 오페론 유전자를 획득하였다. PCR 반응을 위한 중합효소로는 PfuUltraTM 고-신뢰 DNA 폴리머라제(Stratagene)를 사용하였으며, PCR 조건은 변성 95℃, 30초; 어닐링 55℃, 30초; 및 중합반응 72℃, 6분을 25회 반복한 후, 72℃에서 10분간 중합반응을 수행하였다. 그 결과 야생형 단편조각 5020bp의 bioABFCD(Eco WT) (서열번호 20) DNA 단편을 수득하였다. 수득한 DNA산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 SmaI의 제한효소로 처리된 pCL1920 벡터와 다카라(TaKaRa)의 Infusion Cloning Kit를 사용하여 클로닝함으로써 2종의 bioABFCD 코딩 단백질 야생형 과발현 벡터 pCL1920-Pn-bioABFCD(Eco) 를 제작하였다.
명칭 | 서열(5'->3') | 서열번호 |
VB07_0009 | GACTCTAGAGGATCCCCgggTTATTGGCAAAAAAATGTTT | 서열번호 18 |
VB07_0010 | ATTCGAGCTCGGTACCCgggCTACAACAAGGCAAGGTTTA | 서열번호 19 |
바이오틴 생산능 증가여부를 확인하기 위해 상기 제작된 2종의 bioABFCD bioB 유전자 과발현 벡터 (야생형 과발현 벡터 pCL1920-Pn-bioABFCD(Eco)를 바이오틴이 소량 생산되는 대장균 균주 CV04-0002 (실시예 1-1)에 도입하였다. 대조군으로서 pCL1920 벡터를 CV04-0002 균주에 도입하였다.
각각의 균주를 LB 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. LB 고체 배지에서 밤새 배양한 균주를 상기 표 2의 조성을 갖는 역가배지 25㎖에 접종한 다음, 이를 30℃, 200 rpm의 배양기에서 48 시간 동안 배양하고, 배양액 중의 바이오틴 생산량을 MS-MS 방법으로 측정하고, 그 결과를 표 9에 나타내었다.
균주명 | OD562nm | 소모당(g/L) | 바이오틴(mg/L) |
E.coli CV04-0002/pCL1920 | 32.8 | 30 | 0.2 |
E.coli CV04-0002/pCL1920-Pn-bioABFCD(Eco) | 33.1 | 30 | 1.3. |
상기 표 9에서 볼 수 있는 바와 같이, 야생형 바이오틴 오페론이 과발현된 균주(E.coli CV04-0002/pCL1920-Pn-bioABFCD(Eco))는 대조군(E.coli CV04-0002/pCL1920) 보다 바이오틴 생산량이 증가하였다.
실시예 3. 바이오틴 고생산 균주 기반 바이오틴 신타제 변이체를 포함하는 바이오틴 오페론의 발현 벡터 제작 및 변이 균주 제작
실시예 1 및 2에서 제작한 3종의 바이오틴 생합성 오페론 강화 벡터 pCL1920-Pn-bioABFCD(S.mar), pCL1920-Pn-bioAB(A3T, S.mar)FCD, pCL1920-Pn-bioABFCD(Eco) 를 대장균 바이오틴 생합성 오페론이 추가 도입된 바이오틴 고생산 균주 CV04-0104 균주 기반으로 도입하였다. 바이오틴 고생산 균주 CV04-0104 균주는 CV04-0002 균주 기반으로 대장균 바이오틴 생합성 오페론을 insAB 유전자 자리에 1 copy 추가 삽입한 균주로 다음의 과정을 통해 제작하였다.
바이오틴 고생산 균주 제작 벡터를 제작하기 위해 대장균 W3110를 주형으로 insA 업스트림 (Upstream) 및 다운스트림 (Downstream) 지역, 그리고 바이오틴 오페론 단편을 수득하였다. 구체적으로, PCR 수행을 통해 대장균 W3110 염색체 DNA를 주형으로 하여 VB07_0011 (서열번호 23)과 VB07_0012 (서열번호 24)의 프라이머를 이용하여 업스트림 (Upstream) 지역 약 0.5 kb (서열번호 25), VB07_0013 (서열번호 26)과 VB07_0014 (서열번호 27)의 프라이머를 이용하여 바이오틴 오페론 지역 약 5 Kb의 유전자 단편(서열번호 28), VB07_0015 (서열번호 29)과 VB07_0016 (서열번호 30)의 프라이머를 이용하여 다운스트림 (Downstream) 지역 약 0.5 kb의 (서열번호 31) 유전자 단편을 수득하였다. PCR 반응을 위한 중합효소로는 SolgTM Pfu-X DNA 폴리머라제를 사용하였으며, PCR 증폭 조건은 95℃에서 5분간 변성 후, 95℃ 30초 변성, 55℃ 60초 어닐링, 72℃ 30초 중합을 30회 반복한 후, 72℃에서 5분간 중합반응을 수행하여 각각의 단편을 PCR 산물로서 수득하였다. 수득한 PCR 산물을 QIAGEN사의 PCR Purification kit를 사용하여 정제한 후 증폭된 insAB 유전자의 업스트림과 다운스트림, 바이오틴 오페론 단편을 이용하여 벡터를 제작하였다. PCT 등록특허 WO2020032590A1에 기재된 방법대로, 유전자 치환 벡터 pSKH를 이용하여 EcoRⅤ 제한효소로 절단한 뒤 상기 준비된 PCR 산물을 깁슨 어셈블리(DG Gibson et al., NATURE METHODS, VOL.6 NO.5, MAY 2009, NEBuilder HiFi DNA Assembly Master Mix) 방법으로 클로닝하여 바이오틴 오페론 1copy 추가 벡터 pSKHΔinsAB::Pn-bioABFCD를 제작하였다. 클로닝은 깁슨 어셈블리 시약과 각 유전자 단편들을 혼합 후 50℃에 1시간 보존함으로써 수행하였다.
상기 제작된 벡터 pSKHΔinsAB::Pn-bioABFCD를 전기천공법을 통해 CV04-0002 균주 (실시예 1-1)에 도입하여 바이오틴 오페론이 추가된 바이오틴 생합성 강화균주 CV04-0104 균주를 제작하였다.
사용된 프라이머 서열을 하기의 표 10에 나타내었다:
명칭 | 서열(5'->3') | 서열번호 |
VB07_0011 | gggcTGCAGGAATTCGATCCAGATACGCTTTTTCCA | 서열번호 23 |
VB07_0012 | AAACATTTTTTTGCCAATAACACGCAAGCACCTTAAAATCAC | 서열번호 24 |
VB07_0013 | GTGATTTTAAGGTGCTTGCGTGTTATTGGCAAAAAAATGTTT | 서열번호 26 |
VB07_0014 | TCAGATAATGCCCGATGACCCTACAACAAGGCAAGGTTTAT | 서열번호 27 |
VB07_0015 | ATAAACCTTGCCTTGTTGTAGGGTCATCGGGCATTATCTGA | 서열번호 29 |
VB07_0016 | GCTAGGTCGACTAGCGTGATGCCTTTTTTGTCGTGGGT | 서열번호 30 |
상기 준비된 CV04-0104 균주에 실시예 1 및 2에서 제작한 3종의 바이오틴 생합성 오페론 강화 벡터 pCL1920-Pn-bioABFCD(S.mar), pCL1920-Pn-bioAB(A3T, S.mar)FCD, pCL1920-Pn-bioABFCD(Eco)를 각각 열충격 도입법을 이용하여 도입하여, E.coli CV04-0104/pCL1920-Pn-bioABFCD(S.mar), E. coli CV04-0104/pCL1920-Pn-bioAB(A3T, S.mar)FCD, 및 E.coli CV04-0104/pCL1920-Pn-bioABFCD(Eco)를 각각 제작하였다. 대조군으로, CV04-0104 균주에 pCL1920가 도입된 E.coli CV04-0104/pCL1920를 준비하였다.
각각의 균주를 LB 고체 배지에 도말한 후 30℃ 배양기에서 밤새 배양하였다. LB 고체 배지에서 밤새 배양한 균주를 상기 표 2의 조성을 갖는 역가 배지 25㎖에 접종한 다음, 이를 30℃, 200rpm의 배양기에서 40시간 동안 배양하고, 각 균주의 바이오틴 생산량을 MS-MS 기법을 이용하여 측정하고, 그 결과를 표 11에 나타내었다.
균주명 | OD562nm | 소모당(g/L) | 바이오틴(mg/L) |
E.coli CV04-0104/pCL1920 | 36.7 | 30 | 1.5 |
E.coli CV04-0104/pCL1920-Pn- bioABFCD(S.mar) | 36.1 | 30 | 4.5 |
E.coli CV04-0104/pCL1920-Pn- bioAB(A3T, S.mar)FCD | 35.4 | 30 | 7.1 |
E.coli CV04-0104/pCL1920-Pn- bioABFCD(Eco) | 36.5 | 30 | 4.3 |
상기 표 11에서 볼 수 있는 바와 같이, 세라티아 마르세센스 또는 대장균 유래의 바이오틴 생합성 오페론이 도입된 균주들의 경우 대조군 (E.coli CV04-0104/ pCL1920) 대비 모두 바이오틴 농도가 크게 향상되었다.
특히, 세라티아 마르세센스 유래의 바이오틴 신타제에 A3T 변이가 도입된 E. coli CV04-0104/ pCL1920-Pn-bioAB(A3T, S.mar)FCD 의 바이오틴 생산량이 변이가 도입되지 않은 E.coli CV04-0104/ pCL1920-Pn-bioABFCD(S.mar) 균주보다 증가하였고 이는 대장균 유래의 바이오틴 생합성 오페론이 강화된 E.coli CV04-0104/pCL1920-Pn-bioABFCD(Eco) 균주의 바이오틴 생산량 대비 향상하였다.
<110> CJ CheilJedang Corporation
<120> Polypeptide variant having biotin synthase activity and biotin
production method using the same
<130> DPP20205278KR
<160> 43
<170> koPatentIn 3.0
<210> 1
<211> 346
<212> PRT
<213> Artificial Sequence
<220>
<223> wild-type biotin synthase (BioB) of Serratia marcescens
<400> 1
Met Met Ala Asp Arg Ile His Trp Thr Val Gly Gln Ala Gln Ala Leu
1 5 10 15
Phe Asp Lys Pro Leu Leu Glu Leu Leu Phe Glu Ala Gln Thr Val His
20 25 30
Arg Gln His Phe Asp Pro Arg Gln Val Gln Val Ser Thr Leu Leu Ser
35 40 45
Ile Lys Thr Gly Ala Cys Pro Glu Asp Cys Lys Tyr Cys Pro Gln Ser
50 55 60
Ser Arg Tyr Lys Thr Gly Leu Glu Ser Glu Arg Leu Met Gln Val Glu
65 70 75 80
Gln Val Leu Glu Ser Ala Arg Lys Ala Lys Ala Asn Gly Ser Thr Arg
85 90 95
Phe Cys Met Gly Ala Ala Trp Lys Asn Pro His Glu Arg Asp Met Pro
100 105 110
Tyr Leu Gln Gln Met Val Gln Gly Val Lys Ala Met Gly Met Glu Thr
115 120 125
Cys Met Thr Leu Gly Thr Leu Asp Gly Thr Gln Ala Glu Arg Leu Ala
130 135 140
Glu Ala Gly Leu Asp Tyr Tyr Asn His Asn Leu Asp Thr Ser Pro Glu
145 150 155 160
Phe Tyr Gly Ser Ile Ile Thr Thr Arg Ser Tyr Gln Glu Arg Leu Asp
165 170 175
Thr Leu Asp Lys Val Arg Asp Ala Gly Ile Lys Val Cys Ser Gly Gly
180 185 190
Ile Val Gly Leu Gly Glu Thr Val Arg Asp Arg Ala Gly Leu Leu Val
195 200 205
Gln Leu Ala Asn Leu Pro Lys Pro Pro Glu Ser Val Pro Ile Asn Met
210 215 220
Leu Val Lys Val Lys Gly Thr Pro Leu Ala Asp Asn Asp Asp Val Asp
225 230 235 240
Pro Phe Asp Phe Ile Arg Thr Ile Ala Val Ala Arg Ile Met Met Pro
245 250 255
Ser Ser Tyr Val Arg Leu Ser Ala Gly Arg Glu Gln Met Asn Glu Gln
260 265 270
Thr Gln Ala Met Cys Phe Met Ala Gly Ala Asn Ser Ile Phe Tyr Gly
275 280 285
Cys Lys Leu Leu Thr Thr Pro Asn Pro Glu Glu Asp Lys Asp Leu Gln
290 295 300
Leu Phe Arg Lys Leu Gly Leu Asn Pro Gln Gln Thr Ala Thr Glu His
305 310 315 320
Gly Asp Asn Gln Gln Gln Gln Val Leu Ala Lys Gln Leu Leu Asn Ala
325 330 335
Asp Thr Ala Glu Phe Tyr Asn Ala Ala Leu
340 345
<210> 2
<211> 1041
<212> DNA
<213> Artificial Sequence
<220>
<223> gene encoding wild-type biotin synthase (BioB) of Serratia
marcescens
<400> 2
atgatggccg accgcattca ctggacagta gggcaagccc aggccctgtt tgataaaccg 60
ctgctggaac tgctgttcga agcgcaaacc gtacaccgcc agcacttcga cccgcgtcag 120
gtgcaggtca gcacgctgct gtcgatcaag accggcgctt gcccggaaga ctgcaaatac 180
tgcccgcaga gctcacgcta caagaccggc ctggagtcgg agcggctgat gcaggtcgag 240
caggtgctgg aatcggcacg caaggccaag gcgaacggtt cgacccgttt ttgcatgggc 300
gcggcgtgga agaacccgca cgagcgcgat atgccttatc tgcagcaaat ggtgcagggc 360
gtgaaagcga tgggcatgga aacctgcatg acgctgggca cattggatgg cacccaggcc 420
gagcggctgg cggaggccgg gctggattac tacaaccata acctcgacac ctcgccggag 480
ttctacggca gcatcatcac cacccgcagc taccaggagc gcctggatac gctcgacaag 540
gtgcgcgacg ccggcatcaa agtgtgctcc ggcggcatcg tcgggctggg tgaaacggtg 600
cgcgatcgcg ccgggctgct ggtgcagctg gccaacctgc caaaaccacc ggagagcgtg 660
ccgatcaaca tgttggtgaa ggtgaaaggc acgccgctgg cggataacga tgacgtcgat 720
ccgtttgatt tcatccgcac catcgcggtg gcgcgcatca tgatgccatc ttcttatgtc 780
cgtctctccg caggccgcga acagatgaac gaacagacgc aggcgatgtg cttcatggcc 840
ggcgccaact cgatcttcta cggttgcaag ctgctgacca cgccgaatcc ggaagaagac 900
aaagacctgc agctgttccg caagctgggg ctcaacccgc agcagaccgc aaccgaacac 960
ggcgacaacc agcaacagca ggtgctggcc aagcaactgc tgaacgccga taccgccgag 1020
ttttacaacg cggcgccgtg a 1041
<210> 3
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0001
<400> 3
gactctagag gatccccggg tgttgtaaac caaattggat 40
<210> 4
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0002
<400> 4
attcgagctc ggtacccggg tcacggcgcc gcgttgtaaa 40
<210> 5
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0003
<400> 5
tgtccagtga atgcggtcgg tcatcatggc gtctccaaaa c 41
<210> 6
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0004
<400> 6
gttttggaga cgccatgatg accgaccgca ttcactggac a 41
<210> 7
<211> 1166
<212> DNA
<213> Artificial Sequence
<220>
<223> wild-type bioB gene fragment of Serratia marcescens (1166bp),
wherein atg at positions 106-108 is a start codon for encoding
SEQ ID NO: 1
<400> 7
gactctagag gatccccggg tgttgtaaac caaattggat taaaattggt tgacagtata 60
tccacaatat ttaaactggc gacacttttt cgttttggag acgccatgat ggccgaccgc 120
attcactgga cagtagggca agcccaggcc ctgtttgata aaccgctgct ggaactgctg 180
ttcgaagcgc aaaccgtaca ccgccagcac ttcgacccgc gtcaggtgca ggtcagcacg 240
ctgctgtcga tcaagaccgg cgcttgcccg gaagactgca aatactgccc gcagagctca 300
cgctacaaga ccggcctgga gtcggagcgg ctgatgcagg tcgagcaggt gctggaatcg 360
gcacgcaagg ccaaggcgaa cggttcgacc cgtttttgca tgggcgcggc gtggaagaac 420
ccgcacgagc gcgatatgcc ttatctgcag caaatggtgc agggcgtgaa agcgatgggc 480
atggaaacct gcatgacgct gggcacattg gatggcaccc aggccgagcg gctggcggag 540
gccgggctgg attactacaa ccataacctc gacacctcgc cggagttcta cggcagcatc 600
atcaccaccc gcagctacca ggagcgcctg gatacgctcg acaaggtgcg cgacgccggc 660
atcaaagtgt gctccggcgg catcgtcggg ctgggtgaaa cggtgcgcga tcgcgccggg 720
ctgctggtgc agctggccaa cctgccaaaa ccaccggaga gcgtgccgat caacatgttg 780
gtgaaggtga aaggcacgcc gctggcggat aacgatgacg tcgatccgtt tgatttcatc 840
cgcaccatcg cggtggcgcg catcatgatg ccatcttctt atgtccgtct ctccgcaggc 900
cgcgaacaga tgaacgaaca gacgcaggcg atgtgcttca tggccggcgc caactcgatc 960
ttctacggtt gcaagctgct gaccacgccg aatccggaag aagacaaaga cctgcagctg 1020
ttccgcaagc tggggctcaa cccgcagcag accgcaaccg aacacggcga caaccagcaa 1080
cagcaggtgc tggccaagca actgctgaac gccgataccg ccgagtttta caacgcggcg 1140
ccgtgacccg ggtaccgagc tcgaat 1166
<210> 8
<211> 132
<212> DNA
<213> Artificial Sequence
<220>
<223> bioB gene mutant (g7a) fragment of Serratia marcescens (132bp),
wherein atg at positions 106-108 corresponds to the start codon
of SEQ ID NO: 7
<400> 8
gactctagag gatccccggg tgttgtaaac caaattggat taaaattggt tgacagtata 60
tccacaatat ttaaactggc gacacttttt cgttttggag acgccatgat gaccgaccgc 120
attcactgga ca 132
<210> 9
<211> 1075
<212> DNA
<213> Artificial Sequence
<220>
<223> bioB gene mutant (g7a) fragment of Serratia marcescens (1075bp),
wherein atg at positions 15-17 corresponds to the start codon of
SEQ ID NO: 7
<400> 9
gttttggaga cgccatgatg accgaccgca ttcactggac agtagggcaa gcccaggccc 60
tgtttgataa accgctgctg gaactgctgt tcgaagcgca aaccgtacac cgccagcact 120
tcgacccgcg tcaggtgcag gtcagcacgc tgctgtcgat caagaccggc gcttgcccgg 180
aagactgcaa atactgcccg cagagctcac gctacaagac cggcctggag tcggagcggc 240
tgatgcaggt cgagcaggtg ctggaatcgg cacgcaaggc caaggcgaac ggttcgaccc 300
gtttttgcat gggcgcggcg tggaagaacc cgcacgagcg cgatatgcct tatctgcagc 360
aaatggtgca gggcgtgaaa gcgatgggca tggaaacctg catgacgctg ggcacattgg 420
atggcaccca ggccgagcgg ctggcggagg ccgggctgga ttactacaac cataacctcg 480
acacctcgcc ggagttctac ggcagcatca tcaccacccg cagctaccag gagcgcctgg 540
atacgctcga caaggtgcgc gacgccggca tcaaagtgtg ctccggcggc atcgtcgggc 600
tgggtgaaac ggtgcgcgat cgcgccgggc tgctggtgca gctggccaac ctgccaaaac 660
caccggagag cgtgccgatc aacatgttgg tgaaggtgaa aggcacgccg ctggcggata 720
acgatgacgt cgatccgttt gatttcatcc gcaccatcgc ggtggcgcgc atcatgatgc 780
catcttctta tgtccgtctc tccgcaggcc gcgaacagat gaacgaacag acgcaggcga 840
tgtgcttcat ggccggcgcc aactcgatct tctacggttg caagctgctg accacgccga 900
atccggaaga agacaaagac ctgcagctgt tccgcaagct ggggctcaac ccgcagcaga 960
ccgcaaccga acacggcgac aaccagcaac agcaggtgct ggccaagcaa ctgctgaacg 1020
ccgataccgc cgagttttac aacgcggcgc cgtgacccgg gtaccgagct cgaat 1075
<210> 10
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0005
<400> 10
gactctagag gatccccggg ttaacgcgcg gcgtcggcca 40
<210> 11
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0006
<400> 11
attcgagctc ggtacccggg tcactgcgcc agcaagctga 40
<210> 12
<211> 5016
<212> DNA
<213> Artificial Sequence
<220>
<223> bioABFCD(Wt) fragment of Serratia marcescens (5016bp)
<400> 12
gactctagag gatccccggg ttaacgcgcg gcgtcggcca cggcggcggt caggcggctg 60
agctgttccg cttcgatgat gtaaggcggc atcaggtaaa tcagcttgcc gaacggccgg 120
atccataccc cgcgctcgac gaacccgcgc tgcagctcgg cgacatccac cggttcgcgc 180
atctccacca ccccaatcgc gcccagcacc cgcacgtcgg ccaccttcgg cagcgccgcc 240
aacggcaaca gttcccgctt caactgggtt tcgatggcgc tcacctgcgc ctgccagcga 300
ttttccgcca gcagcgccag actggcgtcc gccacggcgc aggccagcgg attgcccata 360
aaggtcggcc cgtgcataaa gcagccggcc gcgccgttgc tgatggtctc cgccacgtgg 420
cgggtagtca aggtggcgga aagggtcata tagccgccgg tcagcgcctt gcccagacag 480
agaatgtccg gcaccacctg cgcgtgctcg caggcgaaca gcttgccggt gcggccgaaa 540
ccggtggcga tctcgtcggc gatcagcagc acctgatggc gatcgcacag ctcgcgcacc 600
cgcttgagat aggtcggatg gtagatgcgc atgccgccgg cgccttgcac caccggttcc 660
agaatcaccg ccgccacttc accggcgtgc tgctccagca gcgcggcgaa cggcgcgata 720
tcctcttcac gccattcctc gtcgaagcgg cactgcggcg cggtggcgaa caggtgcggc 780
gccagatacc cctgatagag gctgtgcatc gagttgtccg gatcgcagac cgacatcgcg 840
ccgaaggtat cgccgtgata gccgtggcgc agcgtcagga tgcgctgccg gcgctcgccg 900
cgcgcctgcc agtactgcag cgccattttc agcgacactt ctaccgccac cgaaccagag 960
tccgccagga acacgcactg cagtgcttcc ggcgtcattt ccaccagccg acggcacaac 1020
gagatggcgg ccggatgggt aatgccgccg aacatcacgt gcgacatctt ctccaactgc 1080
tggctggcgg cctgattcag acgcggatgg ttgtaaccgt ggatcgccgc ccaccaggag 1140
gacatgccgt ccaccagact ccggccgtcc gccagctgca gttcgacgcc gctggccgat 1200
tcgatcgggt aacagggtaa cgggcggctc atggaggtgt aggggtgcca gatatggcgt 1260
tggtcaaacg ccaggtcgga agcggtgaca gacattgttg taaaccaaat tggattaaaa 1320
ttggttgaca gtatatccac aatatttaaa ctggcgacac tttttcgttt tggagacgcc 1380
atgatggccg accgcattca ctggacagta gggcaagccc aggccctgtt tgataaaccg 1440
ctgctggaac tgctgttcga agcgcaaacc gtacaccgcc agcacttcga cccgcgtcag 1500
gtgcaggtca gcacgctgct gtcgatcaag accggcgctt gcccggaaga ctgcaaatac 1560
tgcccgcaga gctcacgcta caagaccggc ctggagtcgg agcggctgat gcaggtcgag 1620
caggtgctgg aatcggcacg caaggccaag gcgaacggtt cgacccgttt ttgcatgggc 1680
gcggcgtgga agaacccgca cgagcgcgat atgccttatc tgcagcaaat ggtgcagggc 1740
gtgaaagcga tgggcatgga aacctgcatg acgctgggca cattggatgg cacccaggcc 1800
gagcggctgg cggaggccgg gctggattac tacaaccata acctcgacac ctcgccggag 1860
ttctacggca gcatcatcac cacccgcagc taccaggagc gcctggatac gctcgacaag 1920
gtgcgcgacg ccggcatcaa agtgtgctcc ggcggcatcg tcgggctggg tgaaacggtg 1980
cgcgatcgcg ccgggctgct ggtgcagctg gccaacctgc caaaaccacc ggagagcgtg 2040
ccgatcaaca tgttggtgaa ggtgaaaggc acgccgctgg cggataacga tgacgtcgat 2100
ccgtttgatt tcatccgcac catcgcggtg gcgcgcatca tgatgccatc ttcttatgtc 2160
cgtctctccg caggccgcga acagatgaac gaacagacgc aggcgatgtg cttcatggcc 2220
ggcgccaact cgatcttcta cggttgcaag ctgctgacca cgccgaatcc ggaagaagac 2280
aaagacctgc agctgttccg caagctgggg ctcaacccgc agcagaccgc aaccgaacac 2340
ggcgacaacc agcaacagca ggtgctggcc aagcaactgc tgaacgccga taccgccgag 2400
ttttacaacg cggcgccgtg atgagctggc agcaacgcat cgagcaggcg ctggctgagc 2460
ggcgcctgaa cgccgcctac cgccggcgac agaccaccga gggcggcaac ggccgccaga 2520
tccggctcgg cgatcgtctc tatctgaact tctcgggcaa cgactacctg ggcttgagcc 2580
aggatgcgcg ggtgatcgcc gcctggcagc agggcgcgca gcgttacggc gtcggcagcg 2640
gcggttcggg ccacgtgacc ggttttagcg cggcgcatca ggcgctggaa gagcaactgg 2700
cggcttggct cggctatccg cgcgcgctgc tgttcatctc cggctacgcc gccaaccagg 2760
cggtgctggc ggcgttgatg caaaagggcg atcgcatttt ggccgatcgt ctcagccatg 2820
cctcgctgct ggaggcggcg gcgcagtcgc cggccgagct gcgccggttc cagcacaatc 2880
aaccgcaggc cttggcggat ctgctggcca aaccctgcga cgggcagcgg ctggcggtca 2940
ccgaaggggt gttcagcatg gatggcgacg gcgcgccgtt ggcggagctg catcgcttaa 3000
cccgtgcggc gggcgcctgg ctgatggtgg atgacgccca cggcatcggc gtgcgcggcg 3060
aacaaggccg cggcagttgc tggcagcagg gcgtgcgccc tgaactgctg gtggcgacct 3120
tcggcaaggc gttcggcgtc agcggcgcgg cggtgctgtg cgatgaggcg accgccgagt 3180
atctgctgca gttcgcccgc catctgatct acagcaccgc gatgccgccg gcgcaggcct 3240
gcgcgctgca ggcggcgctg gcccgtattc gagagggtga tgatctgcga gcccggctgc 3300
aggacaacat tcggcgtttc cgtcagggcg cggcgccgtt ggcgctgacc ctgacggatt 3360
ccgacaccgc catccagccg ctgctggtgg gggataatca gcgcgcgctc gatctggcga 3420
cccgcctgcg cgagtgcggc ctgtgggtga gcgccatccg tccgccgacg gtgcccccgg 3480
gcggcgcgcg gctgcgcatt accctgacgg cggcgcatca gtcgcaggat atcgatcgcc 3540
tgctggaggt gctgaatgac gtcagccaat gacacagtga acaaacaggc ggtcgcctcg 3600
gccttcagcc gcgcggccgg cagctacgat gccgccgccg cgctgcagcg tgacgttggc 3660
gagcgcttac tggggatggg gagttcccac ccgggcgaac agctgctgga cgccggctgc 3720
ggcaccggct atttcagccg tatgtggcgt gagcgcggca aacgggtgac cgcgctcgat 3780
ttggcgccgg gcatgctgga cgtcgcccgc caacggcagg cggcgcatca ttatctgctg 3840
ggcgatatcg aacaggtgcc gctgcccgat gcggcgatgg acatctgttt cagcagcctg 3900
gtggtgcagt ggtgcagcga tctgcctgcc gcgctggcag agctgtatcg cgtgacccgt 3960
cccggcggcg tgatcctgtt ttccacgctg gcggcgggct cgctgcagga attgggggac 4020
gcctggcaac aggtggacgg cgaacgtcac gtgaacgcct ttttgccgtt gacgcagatc 4080
cgcaccgcct gcgccgccta tcgacacgag ctggtgacgg agttgcgcac cctgaactac 4140
ccggacgtga tgacgctgat gcgttcgctc aagggcatcg gggcgacgca tttgcatcag 4200
gggcgtgagg gcggcctgat gtcgcgtggc cgcctcgccg cgctgcaggc ggcttacccg 4260
tgccggcagg ggcagttccc gctcagctat catctggctt atggagtgat ttatcgtgag 4320
taaacgttgg ttcgtgaccg gcaccgacac cgaagtgggg aaaaccgtcg ccagcagcgc 4380
cttgctgcag gccgccaacc gggcgggcta ccgcagcgcc ggctataagc cggtggcctc 4440
cggcagcgag atgaccgccg aggggctgcg caacggcgac gcgctggcgc tgcaggccaa 4500
cagcggtgtg gcgctggatt acgacgaagt gaacccttac gtatttgccg aaccgacctc 4560
gccgcatatc gtcagcgccg atgaaggccg gccgatcgac gcggcgcggc tgtccgacgg 4620
cctgcgccgg ctggagcagc gcgccgactg ggtgctggtc gagggggccg gcgggtggtt 4680
taccccgttg tcggcggagt acaccttcgc cgactgggtg cggcaagagc aactgccggt 4740
gatcctggtg gtgggcatca agctgggctg catcaaccac gcggtgctga cggcccaggc 4800
ggtgcaacag gccgggctga cgctggccgg ttggatcgcc aacgacgtgg cgccgccggg 4860
gcggcggcat caggaatacc tggctacgct gcgccgtatg ctgcccgcgc cgctgctggg 4920
cgaaatcccg cacctgccgc aggccgaacg ggcgccgctg gggcagtatc tggatatcag 4980
cttgctggcg cagtgacccg ggtaccgagc tcgaat 5016
<210> 13
<211> 1407
<212> DNA
<213> Artificial Sequence
<220>
<223> bioAB(g7a)FCD mutant fragment of Serratia marcescens (1407bp)
<400> 13
gactctagag gatccccggg ttaacgcgcg gcgtcggcca cggcggcggt caggcggctg 60
agctgttccg cttcgatgat gtaaggcggc atcaggtaaa tcagcttgcc gaacggccgg 120
atccataccc cgcgctcgac gaacccgcgc tgcagctcgg cgacatccac cggttcgcgc 180
atctccacca ccccaatcgc gcccagcacc cgcacgtcgg ccaccttcgg cagcgccgcc 240
aacggcaaca gttcccgctt caactgggtt tcgatggcgc tcacctgcgc ctgccagcga 300
ttttccgcca gcagcgccag actggcgtcc gccacggcgc aggccagcgg attgcccata 360
aaggtcggcc cgtgcataaa gcagccggcc gcgccgttgc tgatggtctc cgccacgtgg 420
cgggtagtca aggtggcgga aagggtcata tagccgccgg tcagcgcctt gcccagacag 480
agaatgtccg gcaccacctg cgcgtgctcg caggcgaaca gcttgccggt gcggccgaaa 540
ccggtggcga tctcgtcggc gatcagcagc acctgatggc gatcgcacag ctcgcgcacc 600
cgcttgagat aggtcggatg gtagatgcgc atgccgccgg cgccttgcac caccggttcc 660
agaatcaccg ccgccacttc accggcgtgc tgctccagca gcgcggcgaa cggcgcgata 720
tcctcttcac gccattcctc gtcgaagcgg cactgcggcg cggtggcgaa caggtgcggc 780
gccagatacc cctgatagag gctgtgcatc gagttgtccg gatcgcagac cgacatcgcg 840
ccgaaggtat cgccgtgata gccgtggcgc agcgtcagga tgcgctgccg gcgctcgccg 900
cgcgcctgcc agtactgcag cgccattttc agcgacactt ctaccgccac cgaaccagag 960
tccgccagga acacgcactg cagtgcttcc ggcgtcattt ccaccagccg acggcacaac 1020
gagatggcgg ccggatgggt aatgccgccg aacatcacgt gcgacatctt ctccaactgc 1080
tggctggcgg cctgattcag acgcggatgg ttgtaaccgt ggatcgccgc ccaccaggag 1140
gacatgccgt ccaccagact ccggccgtcc gccagctgca gttcgacgcc gctggccgat 1200
tcgatcgggt aacagggtaa cgggcggctc atggaggtgt aggggtgcca gatatggcgt 1260
tggtcaaacg ccaggtcgga agcggtgaca gacattgttg taaaccaaat tggattaaaa 1320
ttggttgaca gtatatccac aatatttaaa ctggcgacac tttttcgttt tggagacgcc 1380
atgatgaccg accgcattca ctggaca 1407
<210> 14
<211> 3650
<212> DNA
<213> Artificial Sequence
<220>
<223> bioAB(g7a)FCD mutant fragment of Serratia marcescens (3650bp)
<400> 14
gttttggaga cgccatgatg accgaccgca ttcactggac agtagggcaa gcccaggccc 60
tgtttgataa accgctgctg gaactgctgt tcgaagcgca aaccgtacac cgccagcact 120
tcgacccgcg tcaggtgcag gtcagcacgc tgctgtcgat caagaccggc gcttgcccgg 180
aagactgcaa atactgcccg cagagctcac gctacaagac cggcctggag tcggagcggc 240
tgatgcaggt cgagcaggtg ctggaatcgg cacgcaaggc caaggcgaac ggttcgaccc 300
gtttttgcat gggcgcggcg tggaagaacc cgcacgagcg cgatatgcct tatctgcagc 360
aaatggtgca gggcgtgaaa gcgatgggca tggaaacctg catgacgctg ggcacattgg 420
atggcaccca ggccgagcgg ctggcggagg ccgggctgga ttactacaac cataacctcg 480
acacctcgcc ggagttctac ggcagcatca tcaccacccg cagctaccag gagcgcctgg 540
atacgctcga caaggtgcgc gacgccggca tcaaagtgtg ctccggcggc atcgtcgggc 600
tgggtgaaac ggtgcgcgat cgcgccgggc tgctggtgca gctggccaac ctgccaaaac 660
caccggagag cgtgccgatc aacatgttgg tgaaggtgaa aggcacgccg ctggcggata 720
acgatgacgt cgatccgttt gatttcatcc gcaccatcgc ggtggcgcgc atcatgatgc 780
catcttctta tgtccgtctc tccgcaggcc gcgaacagat gaacgaacag acgcaggcga 840
tgtgcttcat ggccggcgcc aactcgatct tctacggttg caagctgctg accacgccga 900
atccggaaga agacaaagac ctgcagctgt tccgcaagct ggggctcaac ccgcagcaga 960
ccgcaaccga acacggcgac aaccagcaac agcaggtgct ggccaagcaa ctgctgaacg 1020
ccgataccgc cgagttttac aacgcggcgc cgtgatgagc tggcagcaac gcatcgagca 1080
ggcgctggct gagcggcgcc tgaacgccgc ctaccgccgg cgacagacca ccgagggcgg 1140
caacggccgc cagatccggc tcggcgatcg tctctatctg aacttctcgg gcaacgacta 1200
cctgggcttg agccaggatg cgcgggtgat cgccgcctgg cagcagggcg cgcagcgtta 1260
cggcgtcggc agcggcggtt cgggccacgt gaccggtttt agcgcggcgc atcaggcgct 1320
ggaagagcaa ctggcggctt ggctcggcta tccgcgcgcg ctgctgttca tctccggcta 1380
cgccgccaac caggcggtgc tggcggcgtt gatgcaaaag ggcgatcgca ttttggccga 1440
tcgtctcagc catgcctcgc tgctggaggc ggcggcgcag tcgccggccg agctgcgccg 1500
gttccagcac aatcaaccgc aggccttggc ggatctgctg gccaaaccct gcgacgggca 1560
gcggctggcg gtcaccgaag gggtgttcag catggatggc gacggcgcgc cgttggcgga 1620
gctgcatcgc ttaacccgtg cggcgggcgc ctggctgatg gtggatgacg cccacggcat 1680
cggcgtgcgc ggcgaacaag gccgcggcag ttgctggcag cagggcgtgc gccctgaact 1740
gctggtggcg accttcggca aggcgttcgg cgtcagcggc gcggcggtgc tgtgcgatga 1800
ggcgaccgcc gagtatctgc tgcagttcgc ccgccatctg atctacagca ccgcgatgcc 1860
gccggcgcag gcctgcgcgc tgcaggcggc gctggcccgt attcgagagg gtgatgatct 1920
gcgagcccgg ctgcaggaca acattcggcg tttccgtcag ggcgcggcgc cgttggcgct 1980
gaccctgacg gattccgaca ccgccatcca gccgctgctg gtgggggata atcagcgcgc 2040
gctcgatctg gcgacccgcc tgcgcgagtg cggcctgtgg gtgagcgcca tccgtccgcc 2100
gacggtgccc ccgggcggcg cgcggctgcg cattaccctg acggcggcgc atcagtcgca 2160
ggatatcgat cgcctgctgg aggtgctgaa tgacgtcagc caatgacaca gtgaacaaac 2220
aggcggtcgc ctcggccttc agccgcgcgg ccggcagcta cgatgccgcc gccgcgctgc 2280
agcgtgacgt tggcgagcgc ttactgggga tggggagttc ccacccgggc gaacagctgc 2340
tggacgccgg ctgcggcacc ggctatttca gccgtatgtg gcgtgagcgc ggcaaacggg 2400
tgaccgcgct cgatttggcg ccgggcatgc tggacgtcgc ccgccaacgg caggcggcgc 2460
atcattatct gctgggcgat atcgaacagg tgccgctgcc cgatgcggcg atggacatct 2520
gtttcagcag cctggtggtg cagtggtgca gcgatctgcc tgccgcgctg gcagagctgt 2580
atcgcgtgac ccgtcccggc ggcgtgatcc tgttttccac gctggcggcg ggctcgctgc 2640
aggaattggg ggacgcctgg caacaggtgg acggcgaacg tcacgtgaac gcctttttgc 2700
cgttgacgca gatccgcacc gcctgcgccg cctatcgaca cgagctggtg acggagttgc 2760
gcaccctgaa ctacccggac gtgatgacgc tgatgcgttc gctcaagggc atcggggcga 2820
cgcatttgca tcaggggcgt gagggcggcc tgatgtcgcg tggccgcctc gccgcgctgc 2880
aggcggctta cccgtgccgg caggggcagt tcccgctcag ctatcatctg gcttatggag 2940
tgatttatcg tgagtaaacg ttggttcgtg accggcaccg acaccgaagt ggggaaaacc 3000
gtcgccagca gcgccttgct gcaggccgcc aaccgggcgg gctaccgcag cgccggctat 3060
aagccggtgg cctccggcag cgagatgacc gccgaggggc tgcgcaacgg cgacgcgctg 3120
gcgctgcagg ccaacagcgg tgtggcgctg gattacgacg aagtgaaccc ttacgtattt 3180
gccgaaccga cctcgccgca tatcgtcagc gccgatgaag gccggccgat cgacgcggcg 3240
cggctgtccg acggcctgcg ccggctggag cagcgcgccg actgggtgct ggtcgagggg 3300
gccggcgggt ggtttacccc gttgtcggcg gagtacacct tcgccgactg ggtgcggcaa 3360
gagcaactgc cggtgatcct ggtggtgggc atcaagctgg gctgcatcaa ccacgcggtg 3420
ctgacggccc aggcggtgca acaggccggg ctgacgctgg ccggttggat cgccaacgac 3480
gtggcgccgc cggggcggcg gcatcaggaa tacctggcta cgctgcgccg tatgctgccc 3540
gcgccgctgc tgggcgaaat cccgcacctg ccgcaggccg aacgggcgcc gctggggcag 3600
tatctggata tcagcttgct ggcgcagtga cccgggtacc gagctcgaat 3650
<210> 15
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0007
<400> 15
gactctagag gatccccggg aatcgacttg taaaccaaat 40
<210> 16
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0008
<400> 16
attcgagctc ggtacccggg tcataatgct gccgcgttgt 40
<210> 17
<211> 1167
<212> DNA
<213> Artificial Sequence
<220>
<223> wild-type bioB fragment of E. coli (1167bp)
<400> 17
gactctagag gatccccggg aatcgacttg taaaccaaat tgaaaagatt taggtttaca 60
agtctacacc gaattaacaa caaaaaacac gttttggaga agccccatgg ctcaccgccc 120
acgctggaca ttgtcgcaag tcacagaatt atttgaaaaa ccgttgctgg atctgctgtt 180
tgaagcgcag caggtgcatc gccagcattt cgatcctcgt caggtgcagg tcagcacgtt 240
gctgtcgatt aagaccggag cttgtccgga agattgcaaa tactgcccgc aaagctcgcg 300
ctacaaaacc gggctggaag ccgagcggtt gatggaagtt gaacaggtgc tggagtcggc 360
gcgcaaagcg aaagcggcag gatcgacgcg cttctgtatg ggcgcggcgt ggaagaatcc 420
ccacgaacgc gatatgccgt acctggaaca aatggtgcag ggggtaaaag cgatggggct 480
ggaggcgtgt atgacgctgg gcacgttgag tgaatctcag gcgcagcgcc tcgcgaacgc 540
cgggctggat tactacaacc acaacctgga cacctcgccg gagttttacg gcaatatcat 600
caccacacgc acttatcagg aacgcctcga tacgctggaa aaagtgcgcg atgccgggat 660
caaagtctgt tctggcggca ttgtgggctt aggcgaaacg gtaaaagatc gcgccggatt 720
attgctgcaa ctggcaaacc tgccgacgcc gccggaaagc gtgccaatca acatgctggt 780
gaaggtgaaa ggcacgccgc ttgccgataa cgatgatgtc gatgcctttg attttattcg 840
caccattgcg gtcgcgcgga tcatgatgcc aacctcttac gtgcgccttt ctgccggacg 900
cgagcagatg aacgaacaga ctcaggcgat gtgctttatg gcaggcgcaa actcgatttt 960
ctacggttgc aaactgctga ccacgccgaa tccggaagaa gataaagacc tgcaactgtt 1020
ccgcaaactg gggctaaatc cgcagcaaac tgccgtgctg gcaggggata acgaacaaca 1080
gcaacgtctt gaacaggcgc tgatgacccc ggacaccgac gaatattaca acgcggcagc 1140
attatgaccc gggtaccgag ctcgaat 1167
<210> 18
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0009
<400> 18
gactctagag gatccccggg ttattggcaa aaaaatgttt 40
<210> 19
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0010
<400> 19
attcgagctc ggtacccggg ctacaacaag gcaaggttta 40
<210> 20
<211> 5020
<212> DNA
<213> Artificial Sequence
<220>
<223> wold-type bioABFCD(Eco) fragment of E. coli (5020bp)
<400> 20
gactctagag gatccccggg ttattggcaa aaaaatgttt catcctgtac cgcgcggtta 60
accgctgcgg tcagacgctg caactgttgc gggagaataa tatagggcgg catcaggtaa 120
atcagtttgc caaaaggccg gatccagaca ccctgttcga caaagaattt ttgcagcgcc 180
gccatattca ccggatgagt ggtttcgacc acgccaatgg cccccagtac gcgcacatcg 240
gcaaccattt cggcatcacg ggcgggggca agttgctcgc gcagctgtac ttcaatatcc 300
gccacctgtt gctgccagtc gccagattcg agaatcgcca ggctggcgtt tgctgccgcg 360
caggccagcg gattgcccat aaaagttggc ccatgcataa agcaaccggc ttcaccgtta 420
ctgatggttt ctgcaacctc gcgcgtggtg agtgtggcgg aaagggtcat tgtgccgccg 480
gttaaggctt taccgaggca caaaatgtcc ggcgcgattt ctgcatgttc acaggcaaac 540
agtttcccgg tacgaccaaa tccagtggcg atctcgtcgg caatcagcaa gataccttcg 600
cgatcgcata ttttgcggat tcgttttaac cattccggat ggtacatgcg catcccgcct 660
gcgccctgga caatcggctc aatgatcacc gccgcgattt catgacgatg cgccgccatc 720
aggcgggcaa agcccaccat atcgcgctca tcccattcgc catccatgcg gctttgcggg 780
gcgggagcaa acaggttttc tggcaggtag cctttccaca gactgtgcat tgagttatcc 840
ggatcgcaca ccgacatcgc gccaaaggta tcgccatgat aaccattgcg gaaggtcaga 900
aaacgctggc gcgcttcgcc tttggcttgc cagtactgca acgccatttt catcgccact 960
tccaccgcta cggaaccgga gtccgcgaga aaaacgcact ccagcggttg cggcgtcatc 1020
gccaccagtt tgcggcacag ctcaatggct ggcgcatggg tgataccgcc aaacatcaca 1080
tgcgacatgg catcaatttg cgacttcatc gccgcattaa gctgcgggtg attgtagccg 1140
tggatcgccg cccaccagga cgacataccg tcaaccaggc gtctgccgtc agacaaaatc 1200
agctcgcaac cttcggcgct caccaccgga taaaccggca gaggggaggt catggatgtg 1260
tatgggtgcc agatatggcg ttggtcaaag gcaagatcgt ccgttgtcat aatcgacttg 1320
taaaccaaat tgaaaagatt taggtttaca agtctacacc gaattaacaa caaaaaacac 1380
gttttggaga agccccatgg ctcaccgccc acgctggaca ttgtcgcaag tcacagaatt 1440
atttgaaaaa ccgttgctgg atctgctgtt tgaagcgcag caggtgcatc gccagcattt 1500
cgatcctcgt caggtgcagg tcagcacgtt gctgtcgatt aagaccggag cttgtccgga 1560
agattgcaaa tactgcccgc aaagctcgcg ctacaaaacc gggctggaag ccgagcggtt 1620
gatggaagtt gaacaggtgc tggagtcggc gcgcaaagcg aaagcggcag gatcgacgcg 1680
cttctgtatg ggcgcggcgt ggaagaatcc ccacgaacgc gatatgccgt acctggaaca 1740
aatggtgcag ggggtaaaag cgatggggct ggaggcgtgt atgacgctgg gcacgttgag 1800
tgaatctcag gcgcagcgcc tcgcgaacgc cgggctggat tactacaacc acaacctgga 1860
cacctcgccg gagttttacg gcaatatcat caccacacgc acttatcagg aacgcctcga 1920
tacgctggaa aaagtgcgcg atgccgggat caaagtctgt tctggcggca ttgtgggctt 1980
aggcgaaacg gtaaaagatc gcgccggatt attgctgcaa ctggcaaacc tgccgacgcc 2040
gccggaaagc gtgccaatca acatgctggt gaaggtgaaa ggcacgccgc ttgccgataa 2100
cgatgatgtc gatgcctttg attttattcg caccattgcg gtcgcgcgga tcatgatgcc 2160
aacctcttac gtgcgccttt ctgccggacg cgagcagatg aacgaacaga ctcaggcgat 2220
gtgctttatg gcaggcgcaa actcgatttt ctacggttgc aaactgctga ccacgccgaa 2280
tccggaagaa gataaagacc tgcaactgtt ccgcaaactg gggctaaatc cgcagcaaac 2340
tgccgtgctg gcaggggata acgaacaaca gcaacgtctt gaacaggcgc tgatgacccc 2400
ggacaccgac gaatattaca acgcggcagc attatgagct ggcaggagaa aatcaacgcg 2460
gcgctcgatg cgcggcgtgc tgccgatgcc ctgcgtcgcc gttatccggt ggcgcaagga 2520
gccggacgct ggctggtggc ggatgatcgc cagtatctga acttttccag taacgattat 2580
ttaggtttaa gccatcatcc gcaaattatc cgtgcctggc agcagggggc ggagcaattt 2640
ggcatcggta gcggcggctc cggtcacgtc agcggttata gcgtggtgca tcaggcactg 2700
gaagaagagc tggccgagtg gcttggctat tcgcgggcac tgctgtttat ctctggtttc 2760
gccgctaatc aggcagttat tgccgcgatg atggcgaaag aggaccgtat tgctgccgac 2820
cggcttagcc atgcctcatt gctggaagct gccagtttaa gcccgtcgca gcttcgccgt 2880
tttgctcata acgatgtcac tcatttggcg cgattgcttg cttccccctg tccggggcag 2940
caaatggtgg tgacagaagg cgtgttcagc atggacggcg atagtgcgcc actggcggaa 3000
atccagcagg taacgcaaca gcacaatggc tggttgatgg tcgatgatgc ccacggcacg 3060
ggcgttatcg gggagcaggg gcgcggcagc tgctggctgc aaaaggtaaa accagaattg 3120
ctggtagtga cttttggcaa aggatttggc gtcagcgggg cagcggtgct ttgctccagt 3180
acggtggcgg attatctgct gcaattcgcc cgccacctta tctacagcac cagtatgccg 3240
cccgctcagg cgcaggcatt acgtgcgtcg ctggcggtca ttcgcagtga tgagggtgat 3300
gcacggcgcg aaaaactggc ggcactcatt acgcgttttc gtgccggagt acaggatttg 3360
ccgtttacgc ttgctgattc atgcagcgcc atccagccat tgattgtcgg tgataacagc 3420
cgtgcgttac aactggcaga aaaactgcgt cagcaaggct gctgggtcac ggcgattcgc 3480
ccgccaaccg tacccgctgg tactgcgcga ctgcgcttaa cgctaaccgc tgcgcatgaa 3540
atgcaggata tcgaccgtct gctggaggtg ctgcatggca acggttaata aacaagccat 3600
tgcagcggca tttggtcggg cagccgcaca ctatgagcaa catgcagatc tacagcgcca 3660
gagtgctgac gccttactgg caatgcttcc acagcgtaaa tacacccacg tactggacgc 3720
gggttgtgga cctggctgga tgagccgcca ctggcgggaa cgtcacgcgc aggtgacggc 3780
cttagatctc tcgccgccaa tgcttgttca ggcacgccag aaggatgccg cagaccatta 3840
tctggcggga gatatcgaat ccctgccgtt agcgactgcg acgttcgatc ttgcatggag 3900
caatctcgca gtgcagtggt gcggtaattt atccacggca ctccgcgagc tgtatcgggt 3960
ggtgcgcccc aaaggcgtgg tcgcgtttac cacgctggtg cagggatcgt tacccgaact 4020
gcatcaggcg tggcaggcgg tggacgagcg tccgcatgct aatcgctttt taccgccaga 4080
tgaaatcgaa cagtcgctga acggcgtgca ttatcaacat catattcagc ccatcacgct 4140
gtggtttgat gatgcgctca gtgccatgcg ttcgctgaaa ggcatcggtg ccacgcatct 4200
tcatgaaggg cgcgacccgc gaatattaac gcgttcgcag ttgcagcgat tgcaactggc 4260
ctggccgcaa cagcaggggc gatatcctct gacgtatcat ctttttttgg gagtgattgc 4320
tcgtgagtaa acgttatttt gtcaccggaa cggataccga agtggggaaa actgtcgcca 4380
gttgtgcact tttacaagcc gcaaaggcag caggctaccg gacggcaggt tataaaccgg 4440
tcgcctctgg cagcgaaaag accccggaag gtttacgcaa tagcgacgcg ctggcgttac 4500
agcgcaacag cagcctgcag ctggattacg caacagtaaa tccttacacc ttcgcagaac 4560
ccacttcgcc gcacatcatc agcgcgcaag agggcagacc gatagaatca ttggtaatga 4620
gcgccggatt acgcgcgctt gaacaacagg ctgactgggt gttagtggaa ggtgctggcg 4680
gctggtttac gccgctttct gacactttca cttttgcaga ttgggtaaca caggaacaac 4740
tgccggtgat actggtagtt ggtgtgaaac tcggctgtat taatcacgcg atgttgactg 4800
cacaggtaat acaacacgcc ggactgactc tggcgggttg ggtggcgaac gatgttacgc 4860
ctccgggaaa acgtcacgct gaatatatga ccacgctcac ccgcatgatt cccgcgccgc 4920
tgctgggaga gatcccctgg cttgcagaaa atccagaaaa tgcggcaacc ggaaagtaca 4980
taaaccttgc cttgttgtag cccgggtacc gagctcgaat 5020
<210> 21
<211> 346
<212> PRT
<213> Artificial Sequence
<220>
<223> mutant biotin synthase (BioB) of Serratia marcescens
<400> 21
Met Met Thr Asp Arg Ile His Trp Thr Val Gly Gln Ala Gln Ala Leu
1 5 10 15
Phe Asp Lys Pro Leu Leu Glu Leu Leu Phe Glu Ala Gln Thr Val His
20 25 30
Arg Gln His Phe Asp Pro Arg Gln Val Gln Val Ser Thr Leu Leu Ser
35 40 45
Ile Lys Thr Gly Ala Cys Pro Glu Asp Cys Lys Tyr Cys Pro Gln Ser
50 55 60
Ser Arg Tyr Lys Thr Gly Leu Glu Ser Glu Arg Leu Met Gln Val Glu
65 70 75 80
Gln Val Leu Glu Ser Ala Arg Lys Ala Lys Ala Asn Gly Ser Thr Arg
85 90 95
Phe Cys Met Gly Ala Ala Trp Lys Asn Pro His Glu Arg Asp Met Pro
100 105 110
Tyr Leu Gln Gln Met Val Gln Gly Val Lys Ala Met Gly Met Glu Thr
115 120 125
Cys Met Thr Leu Gly Thr Leu Asp Gly Thr Gln Ala Glu Arg Leu Ala
130 135 140
Glu Ala Gly Leu Asp Tyr Tyr Asn His Asn Leu Asp Thr Ser Pro Glu
145 150 155 160
Phe Tyr Gly Ser Ile Ile Thr Thr Arg Ser Tyr Gln Glu Arg Leu Asp
165 170 175
Thr Leu Asp Lys Val Arg Asp Ala Gly Ile Lys Val Cys Ser Gly Gly
180 185 190
Ile Val Gly Leu Gly Glu Thr Val Arg Asp Arg Ala Gly Leu Leu Val
195 200 205
Gln Leu Ala Asn Leu Pro Lys Pro Pro Glu Ser Val Pro Ile Asn Met
210 215 220
Leu Val Lys Val Lys Gly Thr Pro Leu Ala Asp Asn Asp Asp Val Asp
225 230 235 240
Pro Phe Asp Phe Ile Arg Thr Ile Ala Val Ala Arg Ile Met Met Pro
245 250 255
Ser Ser Tyr Val Arg Leu Ser Ala Gly Arg Glu Gln Met Asn Glu Gln
260 265 270
Thr Gln Ala Met Cys Phe Met Ala Gly Ala Asn Ser Ile Phe Tyr Gly
275 280 285
Cys Lys Leu Leu Thr Thr Pro Asn Pro Glu Glu Asp Lys Asp Leu Gln
290 295 300
Leu Phe Arg Lys Leu Gly Leu Asn Pro Gln Gln Thr Ala Thr Glu His
305 310 315 320
Gly Asp Asn Gln Gln Gln Gln Val Leu Ala Lys Gln Leu Leu Asn Ala
325 330 335
Asp Thr Ala Glu Phe Tyr Asn Ala Ala Leu
340 345
<210> 22
<211> 1041
<212> DNA
<213> Artificial Sequence
<220>
<223> mutant bioB of Serratia marcescens encoding mutant biotin
synthase of SEQ ID NO: 21
<400> 22
atgatgaccg accgcattca ctggacagta gggcaagccc aggccctgtt tgataaaccg 60
ctgctggaac tgctgttcga agcgcaaacc gtacaccgcc agcacttcga cccgcgtcag 120
gtgcaggtca gcacgctgct gtcgatcaag accggcgctt gcccggaaga ctgcaaatac 180
tgcccgcaga gctcacgcta caagaccggc ctggagtcgg agcggctgat gcaggtcgag 240
caggtgctgg aatcggcacg caaggccaag gcgaacggtt cgacccgttt ttgcatgggc 300
gcggcgtgga agaacccgca cgagcgcgat atgccttatc tgcagcaaat ggtgcagggc 360
gtgaaagcga tgggcatgga aacctgcatg acgctgggca cattggatgg cacccaggcc 420
gagcggctgg cggaggccgg gctggattac tacaaccata acctcgacac ctcgccggag 480
ttctacggca gcatcatcac cacccgcagc taccaggagc gcctggatac gctcgacaag 540
gtgcgcgacg ccggcatcaa agtgtgctcc ggcggcatcg tcgggctggg tgaaacggtg 600
cgcgatcgcg ccgggctgct ggtgcagctg gccaacctgc caaaaccacc ggagagcgtg 660
ccgatcaaca tgttggtgaa ggtgaaaggc acgccgctgg cggataacga tgacgtcgat 720
ccgtttgatt tcatccgcac catcgcggtg gcgcgcatca tgatgccatc ttcttatgtc 780
cgtctctccg caggccgcga acagatgaac gaacagacgc aggcgatgtg cttcatggcc 840
ggcgccaact cgatcttcta cggttgcaag ctgctgacca cgccgaatcc ggaagaagac 900
aaagacctgc agctgttccg caagctgggg ctcaacccgc agcagaccgc aaccgaacac 960
ggcgacaacc agcaacagca ggtgctggcc aagcaactgc tgaacgccga taccgccgag 1020
ttttacaacg cggcgccgtg a 1041
<210> 23
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0011
<400> 23
gggctgcagg aattcgatcc agatacgctt tttcca 36
<210> 24
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0012
<400> 24
aaacattttt ttgccaataa cacgcaagca ccttaaaatc ac 42
<210> 25
<211> 594
<212> DNA
<213> Artificial Sequence
<220>
<223> insAB upstream fragment (594bp)
<400> 25
gggctgcagg aattcgatcc agatacgctt tttccagcgc gtttcggcga aacaggtcca 60
ccatcacgcg tttggcgata gtgcagagga aggagcgagg atcgcggatc gtcgagagcg 120
tttcgctgac cattacccgc aaaaaagtgt cctgggcaat gtcatctgca tcaaaagcag 180
actggagttt gcgcgtcagc cagcttttca accagccgtg atgtgtgcca taaagcgact 240
cgaacgttaa ggaagctgtg gtagtggcgc ggtcagacat gcggagtgca tcaaaagtta 300
attatcacgt agtcatatta atatgagaat ggttatcatt acaattggaa ataaaattgt 360
ttccaataga catttttaac atgttgtttt tctaagtgtt ataaggtagg tataaaatgg 420
gatggagcct ctgcttctgg catgtgtcgg tcagaatgac tcatgatgtg gtctgctatt 480
attgacatcc tcactgccct aaaggatggg gatttcggta atgctgccaa cttactgatt 540
tagtgtatga tggtgatttt aaggtgcttg cgtgttattg gcaaaaaaat gttt 594
<210> 26
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0013
<400> 26
gtgattttaa ggtgcttgcg tgttattggc aaaaaaatgt tt 42
<210> 27
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0014
<400> 27
tcagataatg cccgatgacc ctacaacaag gcaaggttta t 41
<210> 28
<211> 5022
<212> DNA
<213> Artificial Sequence
<220>
<223> biotin operon fragment (10044bp)
<400> 28
gtgattttaa ggtgcttgcg tgttattggc aaaaaaatgt ttcatcctgt accgcgcggt 60
taaccgctgc ggtcagacgc tgcaactgtt gcgggagaat aatatagggc ggcatcaggt 120
aaatcagttt gccaaaaggc cggatccaga caccctgttc gacaaagaat ttttgcagcg 180
ccgccatatt caccggatga gtggtttcga ccacgccaat ggcccccagt acgcgcacat 240
cggcaaccat ttcggcatca cgggcggggg caagttgctc gcgcagctgt acttcaatat 300
ccgccacctg ttgctgccag tcgccagatt cgagaatcgc caggctggcg tttgctgccg 360
cgcaggccag cggattgccc ataaaagttg gcccatgcat aaagcaaccg gcttcaccgt 420
tactgatggt ttctgcaacc tcgcgcgtgg tgagtgtggc ggaaagggtc attgtgccgc 480
cggttaaggc tttaccgagg cacaaaatgt ccggcgcgat ttctgcatgt tcacaggcaa 540
acagtttccc ggtacgacca aatccagtgg cgatctcgtc ggcaatcagc aagatacctt 600
cgcgatcgca tattttgcgg attcgtttta accattccgg atggtacatg cgcatcccgc 660
ctgcgccctg gacaatcggc tcaatgatca ccgccgcgat ttcatgacga tgcgccgcca 720
tcaggcgggc aaagcccacc atatcgcgct catcccattc gccatccatg cggctttgcg 780
gggcgggagc aaacaggttt tctggcaggt agcctttcca cagactgtgc attgagttat 840
ccggatcgca caccgacatc gcgccaaagg tatcgccatg ataaccattg cggaaggtca 900
gaaaacgctg gcgcgcttcg cctttggctt gccagtactg caacgccatt ttcatcgcca 960
cttccaccgc tacggaaccg gagtccgcga gaaaaacgca ctccagcggt tgcggcgtca 1020
tcgccaccag tttgcggcac agctcaatgg ctggcgcatg ggtgataccg ccaaacatca 1080
catgcgacat ggcatcaatt tgcgacttca tcgccgcatt aagctgcggg tgattgtagc 1140
cgtggatcgc cgcccaccag gacgacatac cgtcaaccag gcgtctgccg tcagacaaaa 1200
tcagctcgca accttcggcg ctcaccaccg gataaaccgg cagaggggag gtcatggatg 1260
tgtatgggtg ccagatatgg cgttggtcaa aggcaagatc gtccgttgtc ataatcgact 1320
tgtaaaccaa attgaaaaga tttaggttta caagtctaca ccgaattaac aacaaaaaac 1380
acgttttgga gaagccccat ggctcaccgc ccacgctgga cattgtcgca agtcacagaa 1440
ttatttgaaa aaccgttgct ggatctgctg tttgaagcgc agcaggtgca tcgccagcat 1500
ttcgatcctc gtcaggtgca ggtcagcacg ttgctgtcga ttaagaccgg agcttgtccg 1560
gaagattgca aatactgccc gcaaagctcg cgctacaaaa ccgggctgga agccgagcgg 1620
ttgatggaag ttgaacaggt gctggagtcg gcgcgcaaag cgaaagcggc aggatcgacg 1680
cgcttctgta tgggcgcggc gtggaagaat ccccacgaac gcgatatgcc gtacctggaa 1740
caaatggtgc agggggtaaa agcgatgggg ctggaggcgt gtatgacgct gggcacgttg 1800
agtgaatctc aggcgcagcg cctcgcgaac gccgggctgg attactacaa ccacaacctg 1860
gacacctcgc cggagtttta cggcaatatc atcaccacac gcacttatca ggaacgcctc 1920
gatacgctgg aaaaagtgcg cgatgccggg atcaaagtct gttctggcgg cattgtgggc 1980
ttaggcgaaa cggtaaaaga tcgcgccgga ttattgctgc aactggcaaa cctgccgacg 2040
ccgccggaaa gcgtgccaat caacatgctg gtgaaggtga aaggcacgcc gcttgccgat 2100
aacgatgatg tcgatgcctt tgattttatt cgcaccattg cggtcgcgcg gatcatgatg 2160
ccaacctctt acgtgcgcct ttctgccgga cgcgagcaga tgaacgaaca gactcaggcg 2220
atgtgcttta tggcaggcgc aaactcgatt ttctacggtt gcaaactgct gaccacgccg 2280
aatccggaag aagataaaga cctgcaactg ttccgcaaac tggggctaaa tccgcagcaa 2340
actgccgtgc tggcagggga taacgaacaa cagcaacgtc ttgaacaggc gctgatgacc 2400
ccggacaccg acgaatatta caacgcggca gcattatgag ctggcaggag aaaatcaacg 2460
cggcgctcga tgcgcggcgt gctgccgatg ccctgcgtcg ccgttatccg gtggcgcaag 2520
gagccggacg ctggctggtg gcggatgatc gccagtatct gaacttttcc agtaacgatt 2580
atttaggttt aagccatcat ccgcaaatta tccgtgcctg gcagcagggg gcggagcaat 2640
ttggcatcgg tagcggcggc tccggtcacg tcagcggtta tagcgtggtg catcaggcac 2700
tggaagaaga gctggccgag tggcttggct attcgcgggc actgctgttt atctctggtt 2760
tcgccgctaa tcaggcagtt attgccgcga tgatggcgaa agaggaccgt attgctgccg 2820
accggcttag ccatgcctca ttgctggaag ctgccagttt aagcccgtcg cagcttcgcc 2880
gttttgctca taacgatgtc actcatttgg cgcgattgct tgcttccccc tgtccggggc 2940
agcaaatggt ggtgacagaa ggcgtgttca gcatggacgg cgatagtgcg ccactggcgg 3000
aaatccagca ggtaacgcaa cagcacaatg gctggttgat ggtcgatgat gcccacggca 3060
cgggcgttat cggggagcag gggcgcggca gctgctggct gcaaaaggta aaaccagaat 3120
tgctggtagt gacttttggc aaaggatttg gcgtcagcgg ggcagcggtg ctttgctcca 3180
gtacggtggc ggattatctg ctgcaattcg cccgccacct tatctacagc accagtatgc 3240
cgcccgctca ggcgcaggca ttacgtgcgt cgctggcggt cattcgcagt gatgagggtg 3300
atgcacggcg cgaaaaactg gcggcactca ttacgcgttt tcgtgccgga gtacaggatt 3360
tgccgtttac gcttgctgat tcatgcagcg ccatccagcc attgattgtc ggtgataaca 3420
gccgtgcgtt acaactggca gaaaaactgc gtcagcaagg ctgctgggtc acggcgattc 3480
gcccgccaac cgtacccgct ggtactgcgc gactgcgctt aacgctaacc gctgcgcatg 3540
aaatgcagga tatcgaccgt ctgctggagg tgctgcatgg caacggttaa taaacaagcc 3600
attgcagcgg catttggtcg ggcagccgca cactatgagc aacatgcaga tctacagcgc 3660
cagagtgctg acgccttact ggcaatgctt ccacagcgta aatacaccca cgtactggac 3720
gcgggttgtg gacctggctg gatgagccgc cactggcggg aacgtcacgc gcaggtgacg 3780
gccttagatc tctcgccgcc aatgcttgtt caggcacgcc agaaggatgc cgcagaccat 3840
tatctggcgg gagatatcga atccctgccg ttagcgactg cgacgttcga tcttgcatgg 3900
agcaatctcg cagtgcagtg gtgcggtaat ttatccacgg cactccgcga gctgtatcgg 3960
gtggtgcgcc ccaaaggcgt ggtcgcgttt accacgctgg tgcagggatc gttacccgaa 4020
ctgcatcagg cgtggcaggc ggtggacgag cgtccgcatg ctaatcgctt tttaccgcca 4080
gatgaaatcg aacagtcgct gaacggcgtg cattatcaac atcatattca gcccatcacg 4140
ctgtggtttg atgatgcgct cagtgccatg cgttcgctga aaggcatcgg tgccacgcat 4200
cttcatgaag ggcgcgaccc gcgaatatta acgcgttcgc agttgcagcg attgcaactg 4260
gcctggccgc aacagcaggg gcgatatcct ctgacgtatc atcttttttt gggagtgatt 4320
gctcgtgagt aaacgttatt ttgtcaccgg aacggatacc gaagtgggga aaactgtcgc 4380
cagttgtgca cttttacaag ccgcaaaggc agcaggctac cggacggcag gttataaacc 4440
ggtcgcctct ggcagcgaaa agaccccgga aggtttacgc aatagcgacg cgctggcgtt 4500
acagcgcaac agcagcctgc agctggatta cgcaacagta aatccttaca ccttcgcaga 4560
acccacttcg ccgcacatca tcagcgcgca agagggcaga ccgatagaat cattggtaat 4620
gagcgccgga ttacgcgcgc ttgaacaaca ggctgactgg gtgttagtgg aaggtgctgg 4680
cggctggttt acgccgcttt ctgacacttt cacttttgca gattgggtaa cacaggaaca 4740
actgccggtg atactggtag ttggtgtgaa actcggctgt attaatcacg cgatgttgac 4800
tgcacaggta atacaacacg ccggactgac tctggcgggt tgggtggcga acgatgttac 4860
gcctccggga aaacgtcacg ctgaatatat gaccacgctc acccgcatga ttcccgcgcc 4920
gctgctggga gagatcccct ggcttgcaga aaatccagaa aatgcggcaa ccggaaagta 4980
cataaacctt gccttgttgt agggtcatcg ggcattatct ga 5022
<210> 29
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0015
<400> 29
ataaaccttg ccttgttgta gggtcatcgg gcattatctg a 41
<210> 30
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB07_0016
<400> 30
gctaggtcga ctagcgtgat gccttttttg tcgtgggt 38
<210> 31
<211> 536
<212> DNA
<213> Artificial Sequence
<220>
<223> insAB downstream fragment (536bp)
<400> 31
ataaaccttg ccttgttgta gggtcatcgg gcattatctg aacataaaac actatcagta 60
agttggagtc attaccgacc atgtttattt catacattgt gggtattgtt cttattatcg 120
ccgctaatca ataaaatcct gccccatatc tacatggggc agttgttcat tcttttagtg 180
tggtaattca cacgccagca aaaactctgc cgttccttca tcaacaatca ggtccgtgac 240
atatcctccc agcagggcac ccaacgttgc gtcatagcct ctttccccac cagcaaggaa 300
gatcttccgt tcaatctgcc ttagctgagc cagactgatt cccagaatac gctggtcaac 360
atcagccacg acgggcatcc cttccttgtc atagaagcga ccacaaatga cacctactgc 420
gcctaaatcc cgatacgtct gcatttcctt cttattcagc acgcccaccc gaatcagggg 480
attttcatca agcgcgttac ccacgacaaa aaaggcatca cgctagtcga cctagc 536
<210> 32
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB7_7
<400> 32
ctgcaggaat tcgatttcgc tattgtagcc gtagg 35
<210> 33
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB7_8
<400> 33
ctgcactacg cagggtggca cggtgttatc cttca 35
<210> 34
<211> 515
<212> DNA
<213> Artificial Sequence
<220>
<223> birA upstream fragment for exogenous insertion
<400> 34
ttcgctattg tagccgtagg tctgcgtctg ccaaaagagt ggcaacctgt actaacgtat 60
ggtgacttaa ctcgtctgga tcctacaaca gtaacgccac agcaagtatt taatgcggtg 120
tgtcatatgc gcaccaccaa actccctgat ccaaaagtga atggcaatgc cggtagtttc 180
ttcaaaaacc ctgttgtatc tgccgaaacg gctaaagcat tactgtcaca atttccaaca 240
gcaccaaatt acccccaggc ggatggttca gtaaaactgg cagcaggttg gcttatcgat 300
cagtgccagc taaaagggat gcaaataggt ggggctgcgg tgcaccgtca acaggcgtta 360
gttctcatta atgaagacaa tgcaaaaagc gaagatgttg tacagctggc gcatcatgta 420
agacagaaag ttggtgaaaa atttaatgtc tggcttgagc ctgaagtccg ctttattggt 480
gcatcaggtg aagtgagcgc agtggagaca atttc 515
<210> 35
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB7_9
<400> 35
gataacaccg tgccaccctg cgtagtgcag aaaaa 35
<210> 36
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB7_10
<400> 36
gtcgactagc gtgatatgca tcgcctggtg aagtt 35
<210> 37
<211> 512
<212> DNA
<213> Artificial Sequence
<220>
<223> birA downstream fragment for exogenous insertion
<400> 37
gaaaggggag tattcgctcc cctgcaaatt atttgcgtag tctgacctct tctaccgcat 60
gattagcact tttcgtcagg attaaactgg cgcgctcacg agtaggtaga atattttgct 120
ttaagttcag ccagttgatc tctttccaca atgtcatggc agtcttaatc gcttcttctt 180
tagttaattt cgcgtagtta tgaaaatagg aatccgggtc ggtaaaagcc ccttcgcgga 240
atttcagaaa acggttgata taccatgtct gaagtaagtc ttccggtgca tcaacatata 300
tcgaaaaatc gacaaaatca gaaacaaata catgatgtgg atcgtgtgga taatccatcc 360
cgctctgtaa gacatttaac ccttcaagaa ttaaaatatc aggctgaaca accgttttat 420
ctccatccgg gatcacatca taaataagat gtgagtaaac aggtgctgta acgtttggca 480
cgccggattt gagatcggaa acaaacttca cc 512
<210> 38
<211> 304
<212> DNA
<213> Artificial Sequence
<220>
<223> cj1 promoter
<400> 38
caccgcgggc ttattccatt acatggaatg accaggaatg gcagggaatg cgacgaaatt 60
gactgtgtcg ggagcttctg atccgatgct gccaaccagg agagaaaata atgacatgtg 120
caggcacgct ggtgagctgg agatttatga tctcaagtac cttttttctt gcactcgagg 180
gggctgagtg ccagaatggt tgctgacacc aggttgaggt tggtacacac tcaccaatcc 240
tgccgtcgcg ggcgcctgcg tggaacataa accttgagtg aaacccaatc taggagatta 300
agat 304
<210> 39
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB7_11
<400> 39
gtcgactagc gtgatatgca tcgcctggtg aagtt 35
<210> 40
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB7_15
<400> 40
ctttaagggc gacatatctt aatctcctag attgg 35
<210> 41
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB7_16
<400> 41
aatctaggag attaagatat gtcgccctta aagcg 35
<210> 42
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> primer_VB7_17
<400> 42
tctgcactac gcagggttac tgcaggcgaa ggtgc 35
<210> 43
<211> 861
<212> DNA
<213> Artificial Sequence
<220>
<223> birA gene of Corynebacterium glutamicum (861bp)
<400> 43
atgtcgccct taaagcgcgc ttttcgacgc gaccccacta cattggcttc catgaacgtt 60
gacatttcac gatccagaga gccgctaaac gttgagctcc tgaaggaaaa attgctccaa 120
aacggtgact ttggccaggt catttacgaa aaagtgacag gctccactaa tgctgacttg 180
ctggcacttg caggttctgg cgctccaaac tggacggtga aaactgtcga gtttcaagat 240
catgcgcgtg ggcgactcgg ccgcccgtgg tctgcccctg agggttccca aacaatcgtg 300
tctgtgctcg ttcaactatc tattgatcaa gtggaccgga ttggcactat tccactcgcg 360
gcgggactcg ctgtcatgga tgcgttgaat gacctcggtg tggaaggtgc cggactgaaa 420
tggcccaacg atgttcaaat ccacggcaag aaactctgcg gcatcctggt ggaagccacc 480
ggctttgatt ccaccccaac agttgtcatc ggttggggca ctaatatcag cctgactaaa 540
gaggagcttc ctgttcctca tgcaacttcc ctcgcattgg aaggtgttga agtcgacaga 600
accacattcc ttattaatat gctcacacat ctgcatactc gactggacca gtggcagggt 660
ccaagtgtgg attggctcga tgattaccgt gcggtatgtt ccagtattgg ccaagatgtt 720
cgagtgcttc tacctgggga taaagaactc ttaggtgaag cgatcggtgt cgcgactggc 780
ggagaaattc gtgttcgcga tgcttcgggc accgttcaca ccctcaacgc cggtgaaatt 840
acgcaccttc gcctgcagta a 861
Claims (11)
- 서열번호 1의 3번째 위치에 상응하는 아미노산인 알라닌이 알라닌 이외의 다른 아미노산으로 치환된, 바이오틴 신타제(Biotin synthase) 활성을 갖는 폴리펩티드 변이체.
- 제1항에 있어서, 상기 3번째 위치에 상응하는 아미노산인 알라닌이 쓰레오닌으로 치환된, 폴리펩티드 변이체.
- 제1항에 있어서, 서열번호 21의 아미노산 서열을 포함하는, 폴리펩티드 변이체.
- 제1항 내지 제3항 중 어느 한 항의 폴리펩티드 변이체를 암호화하는, 폴리뉴클레오티드.
- 제1항에 따른 폴리펩티드 변이체 및 상기 폴리펩티드 변이체를 암호화하는 폴리뉴클레오티드로 이루어지는 군에서 선택된 1종 이상을 포함하는, 미생물.
- 제5항에 있어서, 상기 미생물은 7,8-디아미노-펠라르곤산 아미노트랜스퍼라제(7,8-diamino-pelargonic acid aminotransferase), 8-아미노-7-옥소노나노에이트 신타아제(8-amino-7-oxononanoate synthase), 말로닐-ACP O-메틸트랜스퍼라제(Malonyl-ACP O-methyltransferase), 및 데티오바이오틴 신테타제(Dethiobiotin synthetase)으로 이루어진 군에서 선택된 1종 이상의 활성이 추가로 강화된, 미생물.
- 제5항에 있어서, 상기 미생물은 에스케리키아 속(Escherichia sp.)인, 미생물.
- 제7항에 있어서, 상기 에스케리키아 속 미생물은 대장균(Escherichia coli)인, 미생물.
- 제5항 내지 제8항 중 어느 한 항의 미생물을 포함하는, 바이오틴 생산용 조성물.
- 제5항 내지 제8항 중 어느 한 항의 미생물을 배지에서 배양하는 단계를 포함하는, 바이오틴의 생산 방법.
- 제10항에 있어서, 상기 방법은 배양된 배지 또는 미생물에서 바이오틴을 회수하는 단계를 추가로 포함하는, 바이오틴의 생산 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210157042A KR20230070943A (ko) | 2021-11-15 | 2021-11-15 | 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 |
PCT/KR2022/017832 WO2023085874A1 (ko) | 2021-11-15 | 2022-11-14 | 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210157042A KR20230070943A (ko) | 2021-11-15 | 2021-11-15 | 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230070943A true KR20230070943A (ko) | 2023-05-23 |
Family
ID=86336464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210157042A KR20230070943A (ko) | 2021-11-15 | 2021-11-15 | 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20230070943A (ko) |
WO (1) | WO2023085874A1 (ko) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3428078B2 (ja) * | 1992-09-10 | 2003-07-22 | 住友化学工業株式会社 | ビオチンの製造方法および使用される微生物 |
JP3566287B2 (ja) * | 1992-10-02 | 2004-09-15 | ロンザ ア−ゲ− | ビオチンの生物工学的製造方法 |
US5859335A (en) * | 1994-12-08 | 1999-01-12 | Novartis Finance Corporation | Enhanced biotin biosynthesis in plant tissue |
WO2021050371A1 (en) * | 2019-09-09 | 2021-03-18 | Albert Einstein College Of Medicine | Biotin synthases for efficient production of biotin |
-
2021
- 2021-11-15 KR KR1020210157042A patent/KR20230070943A/ko not_active Application Discontinuation
-
2022
- 2022-11-14 WO PCT/KR2022/017832 patent/WO2023085874A1/ko unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023085874A1 (ko) | 2023-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102277408B1 (ko) | 신규한 포르메이트 의존성 포스포리보실글리신아미드 포밀 전이효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102277407B1 (ko) | 신규한 글루타메이트 합성 효소 서브 유니트 알파 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
KR102284730B1 (ko) | 신규한 수용성 피리딘 뉴클레오티드 트랜스수소효소 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR102274484B1 (ko) | 신규한 f0f1 atp 합성효소 서브유닛 알파 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102284731B1 (ko) | 신규한 아이소시트르산 디하이드로게네이즈 키나아제/포스파타제 효소 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR102273639B1 (ko) | 신규한 이중기능성 메틸렌테트라히드로폴레이트 탈수소효소/메테닐테트라하이드로폴레이트 사이클로하이드롤라아제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102267931B1 (ko) | 신규한 5-(카르복시아미노)이미다졸리보뉴클레오티드합성효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102273638B1 (ko) | 신규한 포스포글리세린산 디하이드로게나제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102287112B1 (ko) | 신규한 쿠퍼익스포팅 P-type 에이티피에이즈 A 변이체 및 이를 이용한 L-트립토판 생산 방법 | |
KR102273640B1 (ko) | 신규한 f0f1 atp 합성효소 서브유닛 감마 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102277409B1 (ko) | 신규한 2중기능성 포스포리보실아미노이미다졸카르복사미드 포밀트랜스퍼라아제/imp 사이클로하이드롤라아제 변이체 및 이를 이용한 imp 생산 방법 | |
KR102527096B1 (ko) | 프리페네이트 탈수 효소 (Prephenate dehydratase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 | |
KR102279696B1 (ko) | 신규한 l-세린 암모니아 분해 효소 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102527895B1 (ko) | GlxR 단백질 변이체 또는 이를 이용한 쓰레오닌 생산방법 | |
KR102287111B1 (ko) | 신규한 데옥시구아노신트리포스페이트 트리포스포하이드로레이즈 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR102287114B1 (ko) | 신규한 사이토신 퍼미에이즈 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR102284725B1 (ko) | 신규한 페로체라테이즈 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR20220110412A (ko) | 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법 | |
KR20220110413A (ko) | 신규한 단백질 변이체 및 이를 이용한 l-라이신 생산 방법 | |
KR20230070943A (ko) | 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 | |
KR102673796B1 (ko) | 신규한 아세토하이드록시산 신테아제 변이체 및 이를 이용한 l-이소류신 생산방법 | |
KR102495918B1 (ko) | aroG 알돌라아제 (Phospho-2-dehydro-3-deoxyheptonate aldolase) 변이체 및 이를 이용한 분지쇄 아미노산 생산 방법 | |
RU2791243C1 (ru) | Новый вариант растворимой пиридиннуклеотидтрансгидрогеназы и способ получения l-триптофана с его применением | |
RU2794484C1 (ru) | Новый вариант dahp синтазы и способ получения l-лизина с его применением | |
KR102284728B1 (ko) | 신규한 H(+)/Cl(-) 익스체인지 트랜스포터 변이체 및 이를 이용한 L-트립토판 생산 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |