KR102611977B1 - 신규한 베타-카로틴 15,15 -옥시게네이즈 변이체 및 이를 이용한 레티노이드 생산방법 - Google Patents
신규한 베타-카로틴 15,15 -옥시게네이즈 변이체 및 이를 이용한 레티노이드 생산방법 Download PDFInfo
- Publication number
- KR102611977B1 KR102611977B1 KR1020210093034A KR20210093034A KR102611977B1 KR 102611977 B1 KR102611977 B1 KR 102611977B1 KR 1020210093034 A KR1020210093034 A KR 1020210093034A KR 20210093034 A KR20210093034 A KR 20210093034A KR 102611977 B1 KR102611977 B1 KR 102611977B1
- Authority
- KR
- South Korea
- Prior art keywords
- amino acid
- present application
- microorganism
- variant
- sequence
- Prior art date
Links
- OENHQHLEOONYIE-UKMVMLAPSA-N all-trans beta-carotene Natural products CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C OENHQHLEOONYIE-UKMVMLAPSA-N 0.000 title claims abstract description 37
- 235000013734 beta-carotene Nutrition 0.000 title claims abstract description 37
- 239000011648 beta-carotene Substances 0.000 title claims abstract description 37
- TUPZEYHYWIEDIH-WAIFQNFQSA-N beta-carotene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2=CCCCC2(C)C TUPZEYHYWIEDIH-WAIFQNFQSA-N 0.000 title claims abstract description 37
- 229960002747 betacarotene Drugs 0.000 title claims abstract description 37
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 37
- OENHQHLEOONYIE-JLTXGRSLSA-N β-Carotene Chemical compound CC=1CCCC(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C OENHQHLEOONYIE-JLTXGRSLSA-N 0.000 title claims abstract description 37
- 244000005700 microbiome Species 0.000 claims abstract description 107
- 150000004492 retinoid derivatives Chemical class 0.000 claims abstract description 42
- 239000000203 mixture Substances 0.000 claims abstract description 11
- 108091033319 polynucleotide Proteins 0.000 claims description 102
- 102000040430 polynucleotide Human genes 0.000 claims description 102
- 239000002157 polynucleotide Substances 0.000 claims description 102
- 150000001413 amino acids Chemical class 0.000 claims description 90
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 39
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 23
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 22
- 239000004474 valine Substances 0.000 claims description 22
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 claims description 20
- 229960003471 retinol Drugs 0.000 claims description 16
- 235000020944 retinol Nutrition 0.000 claims description 16
- 239000011607 retinol Substances 0.000 claims description 16
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 13
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 claims description 13
- 238000012258 culturing Methods 0.000 claims description 10
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 9
- 230000002207 retinal effect Effects 0.000 claims description 9
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 claims description 6
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 claims description 4
- NCYCYZXNIZJOKI-OVSJKPMPSA-N retinal group Chemical group C\C(=C/C=O)\C=C\C=C(\C=C\C1=C(CCCC1(C)C)C)/C NCYCYZXNIZJOKI-OVSJKPMPSA-N 0.000 claims description 4
- 229930002330 retinoic acid Natural products 0.000 claims description 4
- 229960001727 tretinoin Drugs 0.000 claims description 4
- 241000490645 Yarrowia sp. Species 0.000 claims description 3
- WWDMJSSVVPXVSV-YCNIQYBTSA-N retinyl ester Chemical compound CC1CCCC(C)(C)C1\C=C\C(\C)=C\C=C\C(\C)=C\C(O)=O WWDMJSSVVPXVSV-YCNIQYBTSA-N 0.000 claims description 3
- 241000235013 Yarrowia Species 0.000 claims description 2
- 235000001014 amino acid Nutrition 0.000 description 95
- 229940024606 amino acid Drugs 0.000 description 94
- 229920001184 polypeptide Polymers 0.000 description 85
- 108090000765 processed proteins & peptides Proteins 0.000 description 85
- 102000004196 processed proteins & peptides Human genes 0.000 description 85
- 108020004414 DNA Proteins 0.000 description 56
- 230000000694 effects Effects 0.000 description 51
- 230000000875 corresponding effect Effects 0.000 description 48
- 239000013598 vector Substances 0.000 description 39
- 108090000623 proteins and genes Proteins 0.000 description 35
- 210000004027 cell Anatomy 0.000 description 28
- 239000002609 medium Substances 0.000 description 27
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 20
- 230000014509 gene expression Effects 0.000 description 20
- 235000018102 proteins Nutrition 0.000 description 18
- 102000004169 proteins and genes Human genes 0.000 description 18
- 238000006467 substitution reaction Methods 0.000 description 18
- 108020004705 Codon Proteins 0.000 description 17
- 230000001965 increasing effect Effects 0.000 description 17
- 230000035772 mutation Effects 0.000 description 17
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 16
- 210000000349 chromosome Anatomy 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 235000004554 glutamine Nutrition 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 239000013641 positive control Substances 0.000 description 10
- 229940035893 uracil Drugs 0.000 description 10
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 9
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 9
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 9
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 9
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 9
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 9
- 235000004279 alanine Nutrition 0.000 description 9
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 9
- 229960000310 isoleucine Drugs 0.000 description 9
- 239000003550 marker Substances 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 239000007787 solid Substances 0.000 description 9
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 8
- 229910052757 nitrogen Inorganic materials 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 101100127715 Phaffia rhodozyma crtYB gene Proteins 0.000 description 7
- 101100061456 Streptomyces griseus crtB gene Proteins 0.000 description 7
- 101150011633 crtI gene Proteins 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 5
- 101710173432 Phytoene synthase Proteins 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 238000004925 denaturation Methods 0.000 description 5
- 230000036425 denaturation Effects 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 108060004506 lycopene beta-cyclase Proteins 0.000 description 5
- 108060004507 lycopene cyclase Proteins 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 108010001545 phytoene dehydrogenase Proteins 0.000 description 5
- 238000006116 polymerization reaction Methods 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- FPIPGXGPPPQFEQ-BOOMUCAASA-N Vitamin A Natural products OC/C=C(/C)\C=C\C=C(\C)/C=C/C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-BOOMUCAASA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 235000013379 molasses Nutrition 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 108010044292 tryptophyltyrosine Proteins 0.000 description 4
- 235000019155 vitamin A Nutrition 0.000 description 4
- 239000011719 vitamin A Substances 0.000 description 4
- 229940045997 vitamin a Drugs 0.000 description 4
- 101710158485 3-hydroxy-3-methylglutaryl-coenzyme A reductase Proteins 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- KWYUFKZDYYNOTN-UHFFFAOYSA-M Potassium hydroxide Chemical compound [OH-].[K+] KWYUFKZDYYNOTN-UHFFFAOYSA-M 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 241000222057 Xanthophyllomyces dendrorhous Species 0.000 description 3
- 150000004347 all-trans-retinol derivatives Chemical class 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 235000006109 methionine Nutrition 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- LLMSELCKURJSJI-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-4-methylsulfanylbutanoyl)amino]-3-methylpentanoyl]amino]-4-methylpentanoyl]amino]-3-methylpentanoic acid Chemical compound CCC(C)C(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(C(C)CC)NC(=O)C(N)CCSC LLMSELCKURJSJI-UHFFFAOYSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 2
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 2
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 2
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 2
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 2
- MSWSRLGNLKHDEI-ACZMJKKPSA-N Ala-Ser-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O MSWSRLGNLKHDEI-ACZMJKKPSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 2
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 2
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 2
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- RMFITHMDQGFSDC-UBHSHLNASA-N Asp-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RMFITHMDQGFSDC-UBHSHLNASA-N 0.000 description 2
- VTYYLEPIZMXCLO-UHFFFAOYSA-L Calcium carbonate Chemical compound [Ca+2].[O-]C([O-])=O VTYYLEPIZMXCLO-UHFFFAOYSA-L 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- WTXCNOPZMQRTNN-BWBBJGPYSA-N Cys-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)O WTXCNOPZMQRTNN-BWBBJGPYSA-N 0.000 description 2
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 2
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 2
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 2
- FJCGVRRVBKYYOU-DCAQKATOSA-N His-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N FJCGVRRVBKYYOU-DCAQKATOSA-N 0.000 description 2
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 2
- DEMIXZCKUXVEBO-BWAGICSOSA-N His-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O DEMIXZCKUXVEBO-BWAGICSOSA-N 0.000 description 2
- SWBUZLFWGJETAO-KKUMJFAQSA-N His-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O SWBUZLFWGJETAO-KKUMJFAQSA-N 0.000 description 2
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 2
- YPWHUFAAMNHMGS-QSFUFRPTSA-N Ile-Ala-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YPWHUFAAMNHMGS-QSFUFRPTSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- DJQUZZAFLFQVFL-UHFFFAOYSA-N Ile-Gly-Leu-Pro Chemical compound CCC(C)C(N)C(=O)NCC(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O DJQUZZAFLFQVFL-UHFFFAOYSA-N 0.000 description 2
- CCYGNFBYUNHFSC-MGHWNKPDSA-N Ile-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CCYGNFBYUNHFSC-MGHWNKPDSA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 2
- RQQCJTLBSJMVCR-DSYPUSFNSA-N Ile-Leu-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RQQCJTLBSJMVCR-DSYPUSFNSA-N 0.000 description 2
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 2
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 2
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 2
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 2
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 2
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 2
- WWEWGPOLIJXGNX-XUXIUFHCSA-N Lys-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N WWEWGPOLIJXGNX-XUXIUFHCSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 2
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 2
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 2
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 2
- BKWJQWJPZMUWEG-LFSVMHDDSA-N Phe-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BKWJQWJPZMUWEG-LFSVMHDDSA-N 0.000 description 2
- BRDYYVQTEJVRQT-HRCADAONSA-N Phe-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BRDYYVQTEJVRQT-HRCADAONSA-N 0.000 description 2
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 2
- HTXVATDVCRFORF-MGHWNKPDSA-N Phe-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N HTXVATDVCRFORF-MGHWNKPDSA-N 0.000 description 2
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 2
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 2
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 2
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 2
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 2
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 2
- WKCFCVBOFKEVKY-HSCHXYMDSA-N Trp-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WKCFCVBOFKEVKY-HSCHXYMDSA-N 0.000 description 2
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 2
- LWHUUHCERHMOAB-WDSOQIARSA-N Trp-Pro-His Chemical compound N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O LWHUUHCERHMOAB-WDSOQIARSA-N 0.000 description 2
- UMIACFRBELJMGT-GQGQLFGLSA-N Trp-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UMIACFRBELJMGT-GQGQLFGLSA-N 0.000 description 2
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 2
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 2
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 2
- UPODKYBYUBTWSV-BZSNNMDCSA-N Tyr-Phe-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=C(O)C=C1 UPODKYBYUBTWSV-BZSNNMDCSA-N 0.000 description 2
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 2
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 2
- VSCIANXXVZOYOC-AVGNSLFASA-N Val-Pro-His Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VSCIANXXVZOYOC-AVGNSLFASA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- -1 etc. Chemical class 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 2
- 239000012913 medium supplement Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000007857 nested PCR Methods 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 229960004793 sucrose Drugs 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 239000010936 titanium Substances 0.000 description 2
- 229910052719 titanium Inorganic materials 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PAWQVTBBRAZDMG-UHFFFAOYSA-N 2-(3-bromo-2-fluorophenyl)acetic acid Chemical compound OC(=O)CC1=CC=CC(Br)=C1F PAWQVTBBRAZDMG-UHFFFAOYSA-N 0.000 description 1
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241000609240 Ambelania acida Species 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- VHUUQVKOLVNVRT-UHFFFAOYSA-N Ammonium hydroxide Chemical compound [NH4+].[OH-] VHUUQVKOLVNVRT-UHFFFAOYSA-N 0.000 description 1
- 239000004254 Ammonium phosphate Substances 0.000 description 1
- 101100533902 Arabidopsis thaliana SPL13A gene Proteins 0.000 description 1
- 101100533904 Arabidopsis thaliana SPL13B gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101100455080 Bacillus subtilis (strain 168) lmrB gene Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 102220526128 Dihydrofolate reductase_I74V_mutation Human genes 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 101150099000 EXPA1 gene Proteins 0.000 description 1
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 102100029095 Exportin-1 Human genes 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- TYRMVTKPOWPZBC-SXNHZJKMSA-N Gln-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)N)N TYRMVTKPOWPZBC-SXNHZJKMSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 102000004286 Hydroxymethylglutaryl CoA Reductases Human genes 0.000 description 1
- 108090000895 Hydroxymethylglutaryl CoA Reductases Proteins 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101100070556 Oryza sativa subsp. japonica HSFA4D gene Proteins 0.000 description 1
- 101100043227 Oryza sativa subsp. japonica SPL13 gene Proteins 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101150099282 SPL7 gene Proteins 0.000 description 1
- 101100010928 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) tuf gene Proteins 0.000 description 1
- 101100119348 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) EXP1 gene Proteins 0.000 description 1
- 101100079104 Schizosaccharomyces pombe (strain 972 / ATCC 24843) arm1 gene Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 101100269618 Streptococcus pneumoniae serotype 4 (strain ATCC BAA-334 / TIGR4) aliA gene Proteins 0.000 description 1
- 101150001810 TEAD1 gene Proteins 0.000 description 1
- 101150074253 TEF1 gene Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102100029898 Transcriptional enhancer factor TEF-1 Human genes 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000201640 Yarrowia lipolytica PO1f Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- GZCGUPFRVQAUEE-SLPGGIOYSA-N aldehydo-D-glucose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O GZCGUPFRVQAUEE-SLPGGIOYSA-N 0.000 description 1
- 229930002945 all-trans-retinaldehyde Natural products 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000000908 ammonium hydroxide Substances 0.000 description 1
- 229910000148 ammonium phosphate Inorganic materials 0.000 description 1
- 235000019289 ammonium phosphates Nutrition 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 239000010905 bagasse Substances 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- GUBGYTABKSRVRQ-QUYVBRFLSA-N beta-maltose Chemical compound OC[C@H]1O[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@H](O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@@H]1O GUBGYTABKSRVRQ-QUYVBRFLSA-N 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 229910000019 calcium carbonate Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000005018 casein Substances 0.000 description 1
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 1
- 235000021240 caseins Nutrition 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- MNNHAPBLZZVQHP-UHFFFAOYSA-N diammonium hydrogen phosphate Chemical compound [NH4+].[NH4+].OP([O-])([O-])=O MNNHAPBLZZVQHP-UHFFFAOYSA-N 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000013681 dietary sucrose Nutrition 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108700002148 exportin 1 Proteins 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- FBAFATDZDUQKNH-UHFFFAOYSA-M iron chloride Chemical compound [Cl-].[Fe] FBAFATDZDUQKNH-UHFFFAOYSA-M 0.000 description 1
- 229910000358 iron sulfate Inorganic materials 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 229940099596 manganese sulfate Drugs 0.000 description 1
- 239000011702 manganese sulphate Substances 0.000 description 1
- 235000007079 manganese sulphate Nutrition 0.000 description 1
- 229910000357 manganese(II) sulfate Inorganic materials 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000006151 minimal media Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001477 organic nitrogen group Chemical group 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920001522 polyglycol ester Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000007398 protein translocation Effects 0.000 description 1
- 229940107700 pyruvic acid Drugs 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 102200052800 rs2303436 Human genes 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000005846 sugar alcohols Chemical class 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241000556533 uncultured marine bacterium Species 0.000 description 1
- 241000324730 uncultured marine bacterium 66A03 Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- NCYCYZXNIZJOKI-UHFFFAOYSA-N vitamin A aldehyde Natural products O=CC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-UHFFFAOYSA-N 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 101150062776 yccA gene Proteins 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0069—Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P23/00—Preparation of compounds containing a cyclohexene ring having an unsaturated side chain containing at least ten carbon atoms bound by conjugated double bonds, e.g. carotenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/11—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of two atoms of oxygen (1.13.11)
- C12Y113/11063—Beta-carotene 15,15'-dioxygenase (1.13.11.63)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 출원은 신규한 베타-카로틴 15,15'-옥시게네이즈 변이체 변이체, 상기 변이체를 포함하는 미생물, 상기 미생물을 이용한 레티노이드 생산방법, 및 레티노이드 생산용 조성물에 관한 것이다.
Description
본 출원은 신규한 베타-카로틴 15,15'-옥시게네이즈 변이체, 상기 변이체를 포함하는 미생물, 상기 미생물을 이용한 레티노이드 생산방법, 및 레티노이드 생산용 조성물에 관한 것이다.
지용성 비타민 중 하나로서 필수 영양소인 비타민 A 및 이를 포함하는 개념인 레티노이드는 현재 화학합성법으로 생산 및 판매되고 있으나, 원자재 수급 등에 대한 이유로 미생물 발효 기반의 레티노이드를 생산하고자 하는 연구 즉, 고효율 생산 미생물 및 발효공정기술 개발을 위한 다양한 연구들이 수행되고 있다. 예를 들어, 레티노이드 생합성에 관여하는 효소를 코딩하는 유전자의 발현을 증가시키거나 또는 생합성에 불필요한 유전자를 제거하는 것과 같은 목적 물질 특이적 접근 방법이 그것이다. 상기 레티노이드 생합성에 관여하는 효소로는 일 예로, 베타-카로틴 15,15'-옥시게네이즈 등이 있다(US 2020-0277644 A1).
그러나, 베타-카로틴 15,15'-옥시게네이즈에 대한 연구는 미미하고 비타민 A의 수요 증가에 따라 효과적인 비타민 A의 생산능 증가를 위한 연구가 여전히 필요한 실정이다.
본 출원의 하나의 목적은 베타-카로틴 15,15'-옥시게네이즈 변이체를 제공하는 것이다.
본 출원의 다른 하나의 목적은 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 본 출원의 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 미생물을 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 본 출원의 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 미생물을 배지에서 배양하는 단계를 포함하는, 레티노이드 생산방법을 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 본 출원의 변이체, 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 미생물, 또는 이의 배양물을 포함하는 레티노이드 생산용 조성물을 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 본 출원의 변이체, 상기 변이체를 코딩하는 폴리뉴클레오티드, 또는 이를 포함하는 미생물 중 어느 하나 이상의 레티노이드 생산 용도를 제공하는 것이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다. 또한, 본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 출원의 하나의 양태는 서열번호 1의 아미노산 서열의 N-말단으로부터 43번 위치에 상응하는 아미노산인 알라닌, 58번 위치에 상응하는 아미노산인 류신, 및 74번 위치에 상응하는 아미노산인 이소류신 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된, 베타-카로틴 15,15'-옥시게네이즈 변이체를 제공한다.
상기 베타-카로틴 15,15'-옥시게네이즈 변이체는 베타-카로틴 15,15-옥시게네이즈 활성을 갖는 폴리펩티드 또는, 베타-카로틴 15,15'-옥시게네이즈에서 서열번호 1의 N-말단으로부터 43번, 58번, 및 74번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 다른 아미노산으로 치환된 변이체일 수 있다. 구체적으로, 상기 43번, 58번, 및 74번 위치 중 1 이상, 2 이상, 또는 3 이상의 위치의 아미노산이 치환된 것일 수 있으나, 이에 제한되지 않는다.
상기 변이체의 모체가 되는 베타-카로틴 15,15'-옥시게네이즈 활성을 갖는 폴리펩티드 또는 베타-카로틴 15,15'-옥시게네이즈에 있어서, 서열번호 1의 아미노산 서열의 N-말단으로부터 43번 위치에 상응하는 아미노산은 알라닌; 58번 위치에 상응하는 아미노산은 류신; 및/또는 74번 위치에 상응하는 아미노산은 이소류신일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 상기 변이체는 서열번호 1의 아미노산 서열의 N-말단으로부터 43번 위치에 상응하는 아미노산이 알라닌 외의 아미노산으로 치환; 58번 위치에 상응하는 아미노산이 류신 외의 아미노산으로 치환; 74번 위치에 상응하는 아미노산이 이소류신 외의 아미노산으로 치환 중 어느 하나 이상의 치환을 포함하는 것일 수 있으나, 이에 제한되지 않는다.
상기 "다른 아미노산"은 치환 전 아미노산과 치환 전의 아미노산과 다른 아미노산이면 제한되지 않는다. 한편, 본 출원에서 '특정 아미노산이 치환되었다'고 표현하는 경우, 다른 아미노산으로 치환되었다고 별도로 표기하지 않더라도 치환 전의 아미노산과 다른 아미노산으로 치환되는 것임은 자명하다.
상기 다른 아미노산으로의 치환은 비극성(nonpolar) 아미노산, 극성(polar) 아미노산, 또는 양으로 하전된(염기성) 아미노산으로의 치환일 수 있다. 구체적으로, 상기 비극성(nonpolar) 아미노산은 글리신, 알라닌, 발린, 류신, 이소류신, 메티오닌, 및 프롤린으로 이루어지는 군에서 선택되는 것일 수 있으나, 이에 제한되지 않는다. 상기 극성(polar) 아미노산은 친수성(hydrophilic) 아미노산과 혼용될 수 있으며, 세린, 트레오닌, 시스테인, 티로신, 아스파라긴 및 글루타민으로 이루어진 군에서 선택되는 것일 수 있고, 상기 양으로 하전된(염기성) 아미노산은 아르기닌, 라이신, 및 히스티딘으로 이루어진 군에서 선택되는 것일 수 있으나, 이에 제한되지 않는다.
본 출원의 변이체는 참조(reference) 단백질인 서열번호 1의 아미노산 서열의 43번, 58번, 및 74번 위치에 상응하는 아미노산 중 어느 하나 이상의 아미노산이 비극성 아미노산, 극성 아미노산, 또는 양으로 하전된(염기성) 아미노산 중 치환 전 아미노산과 다른 아미노산으로 치환된 변이체일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 상기 43번 위치에 상응하는 아미노산의 다른 아미노산으로의 치환은 비극성 아미노산; 상기 58번 위치에 상응하는 아미노산의 다른 아미노산으로의 치환은 극성 아미노산; 및 74번 위치에 상응하는 아미노산의 다른 아미노산으로의 치환은 비극성 아미노산으로의 치환일 수 있으나, 이에 제한되지 않는다.
상기 비극성 아미노산은 발린일 수 있고, 상기 극성 아미노산은 글루타민일 수 있으나, 이에 제한되지 않는다.
상기 다른 아미노산은 발린 또는 글루타민일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 본 출원의 변이체는 서열번호 1의 아미노산 서열의 43번 위치에 상응하는 아미노산이 발린으로 치환; 58번 위치에 상응하는 아미노산이 글루타민으로 치환; 74번 위치에 상응하는 아미노산이 발린으로 치환; 및 이들의 조합으로 구성되는 군에서 선택되어 치환된 것일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 본 출원의 변이체는 서열번호 1의 아미노산 서열의 N-말단으로부터 i) 43번 위치에 상응하는 아미노산인 알라닌이 발린으로 치환; ii) 58번 위치에 상응하는 아미노산인 류신이 글루타민으로 치환; iii) 74번 위치에 상응하는 아미노산인 이소류신이 발린으로 치환; iv) 43번 위치에 상응하는 아미노산인 알라닌이 발린으로 치환되고 58번 위치에 상응하는 아미노산인 류신이 글루타민으로 치환; v) 58번 위치에 상응하는 아미노산인 류신이 글루타민으로 치환되고 74번 위치에 상응하는 아미노산인 이소류신이 발린으로 치환; vi) 43번 위치에 상응하는 아미노산인 알라닌이 발린으로 치환되고 74번 위치에 상응하는 아미노산인 이소류신이 발린으로 치환; 또는 vii) 43번 위치에 상응하는 아미노산인 알라닌이 발린으로 치환, 58번 위치에 상응하는 아미노산인 류신이 글루타민으로 치환, 및 74번 위치에 상응하는 아미노산인 이소류신이 발린으로 치환된 것일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 본 출원의 변이체는 서열번호 1의 아미노산 서열의 43번 위치에 상응하는 아미노산인 알라닌이 발린으로 치환, 58번 위치에 상응하는 아미노산인 류신이 글루타민으로 치환, 및 74번 위치에 상응하는 아미노산인 이소류신이 발린으로 치환된, 서열번호 3으로 기재된 아미노산 서열을 포함하는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원의 변이체는 서열번호 3으로 기재된 아미노산 서열을 가지거나, 포함하거나, 이루어지거나, 상기 아미노산 서열로 필수적으로 이루어질(essentially consisting of) 수 있다.
또한, 본 출원의 변이체는 상기 서열번호 3으로 기재된 아미노산 서열에서 서열번호 1의 아미노산 서열을 기준으로 43번 위치에 상응하는 아미노산은 발린, 58번 위치에 상응하는 아미노산은 글루타민, 및 74번 위치에 상응하는 아미노산은 발린으로 고정되고, 상기 서열번호 3으로 기재된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 이러한 각각의 서열의 고정된 위치 외에 상기 상동성 또는 동일성을 가지며 본 출원의 변이체에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 변이체도 본 출원의 범위 내에 포함됨은 자명하다.
예를 들어, 상기 아미노산 서열 N-말단, C-말단 그리고/또는 내부에 본 출원의 변이체의 기능을 변경하지 않는 서열 추가 또는 결실, 자연적으로 발생할 수 있는 돌연변이, 잠재성 돌연변이(silent mutation) 또는 보존적 치환을 가지는 경우이다.
상기 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 단백질 또는 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다.
본 출원에서 용어, "변이체(variant)"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)되어 상기 변이체의 변이 전 아미노산 서열과 상이하나 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다. 이러한 변이체는 일반적으로 상기 폴리펩티드의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 폴리펩티드의 특성을 평가하여 동정(identify)될 수 있다. 즉, 변이체의 능력은 변이 전 폴리펩티드에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이체를 포함할 수 있다. 다른 변이체는 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이체를 포함할 수 있다. 상기 용어 "변이체"는 변이형, 변형, 변이형 폴리펩티드, 변이된 단백질, 변이 및 변이체 등의 용어(영문 표현으로는 modification, modified polypeptide, modified protein, mutant, mutein, divergent 등)가 혼용되어 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다.
또한, 변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 변이체의 N-말단에는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이동(translocation)에 관여하는 시그널(또는 리더) 서열이 컨쥬게이트 될 수 있다. 또한 상기 변이체는 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.
본 출원에서 용어, '상동성(homology)' 또는 '동일성(identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열 상호간 유사한 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 일부분과 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드와의 하이브리드화 역시 포함됨이 자명하다.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al(1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387(1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math(1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al.(1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.
본 출원의 일 예로, 본 출원의 변이체는 베타-카로틴 15,15'-옥시게네이즈 효소 활성을 가질 수 있다. 또한, 본 출원의 변이체는 베타-카로틴 15,15'-옥시게네이즈 활성을 갖는 야생형 폴리펩티드에 비해 레티노이드(retinoid) 생산능이 증가되도록 하는 활성을 가질 수 있다.
본 출원에서 용어, "베타-카로틴 15,15'-옥시게네이즈(beta-carotene 15,15'-oxygenase)"는 한 분자의 베타-카로틴(beta-carotene)을 절단하여 두 분자의 레티날(retinal)로 전환시키는 작용을 촉매하는 기능을 갖는 것이다.
본 출원의 베타-카로틴 15,15'-옥시게네이즈는 본 출원에서 제공하는 베타-카로틴 15,15'-옥시게네이즈 변이체를 제조하기 위해 변형이 가해지는 베타-카로틴 15,15'-옥시게네이즈 또는 베타-카로틴 15,15'-옥시게네이즈 활성을 갖는 폴리펩티드일 수 있다. 구체적으로, 자연적으로 발생하는 폴리펩티드 또는 야생형 폴리펩티드일 수 있고, 이의 성숙 폴리펩티드일 수 있으며, 이의 변이체 또는 기능적 단편을 포함할 수 있으나 본 출원의 베타-카로틴 15,15'-옥시게네이즈 변이체의 모체(parent)가 될 수 있는 한 제한 없이 포함된다.
본 출원에서 상기 베타-카로틴 15,15'-옥시게네이즈는 이에 제한되지는 않으나, 서열번호 1의 폴리펩티드일 수 있다. 또한, 서열번호 1의 폴리펩티드와 약 80%. 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성을 갖는 폴리펩티드일 수 있으며, 서열번호 1의 아미노산 서열로 이루어진 폴리펩티드와 동일 혹은 상응하는 활성을 가지는 경우라면 제한 없이 베타-카로틴 15,15'-옥시게네이즈 범위에 포함된다.
구체적으로, 본 출원의 베타-카로틴 15,15'-옥시게네이즈는 BCO 또는 Blh로 혼용하여 사용될 수 있다. 본 출원에서 상기 베타-카로틴 15,15'-옥시게네이즈는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있다. 구체적으로 blh에 의해 코딩되는 베타-카로틴 15,15'-옥시게네이즈 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다.
본 출원에서, 용어 "상응하는(corresponding to)"은, 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다.
예를 들어, 임의의 아미노산 서열을 서열번호 1과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 1의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.
이러한 정렬에는 예를 들어 Needleman-Wunsch 알고리즘(Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needleman 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지 않고 당업계에 알려진 서열 정렬 프로그램, 쌍 서열(pairwise sequence) 비교 알고리즘 등을 적절히 사용할 수 있다.
본 출원의 다른 하나의 양태는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공한다.
본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이체를 코딩하는 폴리뉴클레오티드 단편을 의미한다.
본 출원의 변이체를 코딩하는 폴리뉴클레오티드는 일 예로 서열번호 3으로 기재된 아미노산 서열을 코딩하는 염기서열을 포함할 수 있다. 본 출원의 일 예로, 본 출원의 폴리뉴클레오티드는 서열번호 4의 서열을 가지거나 포함할 수 있다. 또한, 본 출원의 폴리뉴클레오티드는 서열번호 4의 서열로 이루어지거나, 필수적으로 구성될 수 있다.
본 출원의 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 변이체를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 본 출원의 변이체의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 본 출원의 폴리뉴클레오티드는 서열번호 4와 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 4의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다.
이때, 상기 상동성 또는 동일성을 갖는 서열에서, 서열번호 3의 43번 위치에 상응하는 아미노산을 코딩하는 코돈은, 발린을 코딩하는 코돈 중 하나이고, 58번 위치에 상응하는 아미노산을 코딩하는 코돈은, 글루타민을 코딩하는 코돈 중 하나이며, 74번 위치에 상응하는 아미노산을 코딩하는 코돈은, 발린을 코딩하는 코돈 중 하나일 수 있다.
또한, 본 출원의 폴리뉴클레오티드는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 본 출원의 폴리뉴클레오티드 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화할 수 있는 서열이라면 제한없이 포함될 수 있다. 상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(J. Sambrook et al.,Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al.,Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8 참조)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1ХSSC, 0.1% SDS, 구체적으로 60℃, 0.1ХSSC, 0.1% SDS, 보다 구체적으로 68℃ 0.1ХSSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.
구체적으로, 본 출원의 폴리뉴클레오티드와 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60℃, 63℃ 또는 65℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
상기 폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(예컨대, J. Sambrook et al., 상동).
본 출원의 또 다른 하나의 양태는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 제공한다. 상기 벡터는 상기 폴리뉴클레오티드를 숙주세포에서 발현시키기 위한 발현 벡터일 수 있으나, 이에 제한되지 않는다.
본 출원의 벡터는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 포함하는 DNA 제조물을 포함할 수 있다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pDZ계, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pDC, pDCM2(대한민국 공개특허공보 제10-2020-0136813호), pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC, pIMR53 벡터 등을 사용할 수 있다.
일례로 세포 내 염색체 삽입용 벡터를 통해 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
본 출원에서 용어 "형질전환"은 표적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 폴리펩티드가 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 폴리펩티드를 코딩하는 DNA 및/또는 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이체를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 포함하는 미생물을 제공한다.
본 출원의 미생물은 본 출원의 변이체, 상기 변이체를 코딩하는 폴리뉴클레오티드, 및 상기 폴리뉴클레오티드를 포함하는 벡터 중 어느 하나 이상을 포함하는 것일 수 있다. 본 출원의 미생물은 본 출원의 변이형 폴리펩티드, 상기 폴리펩티드를 암호화하는 폴리뉴클레오티드, 또는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 포함할 수 있다.
본 출원에서 용어, "균주" 또는 "미생물"은 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 폴리펩티드, 단백질 또는 산물의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.
본 출원의 미생물은 본 출원의 변이체, 본 출원의 폴리뉴클레오티드 및 본 출원의 폴리뉴클레오티드를 포함하는 벡터 중 어느 하나 이상을 포함하는 미생물; 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 발현하도록 변형된 미생물; 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 발현하는 미생물(예컨대, 재조합 미생물); 또는 본 출원의 변이체 활성을 갖는 미생물(예컨대, 재조합 미생물)일 수 있으나, 이에 제한되지 않는다. 상기 미생물은 라이코펜 사이클라제/파이토엔 신타아제(lycopene cyclase/phytoene synthase, crtYB) 및 파이토엔 디새튜라아제(phytoene desaturase, crtI) 단백질을 코딩하는 폴리뉴클레오티드를 내재적으로 포함하거나 상기 단백질을 코딩하는 폴리뉴클레오티드를 더 포함하도록 변형되어 이들 단백질 활성을 나타내거나 활성이 강화된 미생물일 수 있다. 또한 상기 미생물은 라이코펜 사이클라제/파이토엔 신타아제(lycopene cyclase/phytoene synthase, crtYB) 및 파이토엔 디새튜라아제(phytoene desaturase, crtI) 단백질의 활성이 없는 모균주가 상기 단백질을 코딩하는 폴리뉴클레오티드를 포함하도록 변형되어, 이들 단백질 활성을 나타내는 미생물일 수 있다. 상기 라이코펜 사이클라제/파이토엔 신타아제 또는 파이토엔 디새튜라아제는 크산토필로마이세스 덴드로하우스(Xanthophyllomyces dendrorhous) 유래의 단백질일 수 있으나 이에 제한되지 않는다. 일 구체 예로 상기 라이코펜 사이클라제/파이토엔 신타아제 또는 파이토엔 디새튜라아제를 코딩하는 폴리뉴클레오티드는 각각 서열번호 13 또는 서열번호 14의 서열을 가지거나 포함하는 것일 수 있다. 상기 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 변이체를 발현시키고자 하는 미생물에서 선호되는 코돈을 고려하여, 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 상기 폴리뉴클레오티드는 서열번호 13 또는 서열번호 14의 서열과 상동성 또는 동일성이 70% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 13 또는 서열번호 14의 서열과 상동성 또는 동일성이 70%이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다.
본 출원의 미생물은 레티노이드 생산능을 가진 것일 수 있고, 레티놀 생산능을 가진 것일 수 있다.
본 출원에서 "레티노이드"는 비타민 A로서의 작용을 할 수 있거나, 이와 관련된 물질을 의미한다. 구체적으로, 상기 레티노이드는 레티놀(retinol), 레티날(retinal), 레티닐 에스터(retinyl ester), 및 레티노산(retinoic acid)으로 구성되는 군에서 선택되는 어느 하나 이상일 수 있다. 본 출원의 미생물은 레티날 및 레티놀 생산능을 가진 미생물일 수 있으며, 레티노산은 레티놀로부터 전환되어 생산될 수 있다.
본 출원의 미생물은 자연적으로 베타-카로틴 15,15'-옥시게네이즈 또는 레티노이드 생산능을 가지고 있는 미생물, 또는 베타-카로틴 15,15'-옥시게네이즈 또는 레티노이드 생산능이 없는 모균주에 본 출원의 변이체 또는 이를 코딩하는 폴리뉴클레오티드 (또는 상기 폴리뉴클레오티드를 포함하는 벡터)가 도입되거나 및/또는 레티노이드 생산능이 부여된 미생물일 수 있으나 이에 제한되지 않는다.
일 예로, 본 출원의 미생물은 본 출원의 폴리뉴클레오티드 또는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어, 본 출원의 변이체를 발현하는 세포 또는 미생물로서, 본 출원의 목적상 본 출원의 미생물은 본 출원의 변이체를 포함하여 레티노이드를 생산할 수 있는 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 미생물은 천연의 야생형 미생물 또는 레티노이드를 생산하는 미생물에 본 출원의 변이체를 코딩하는 폴리뉴클레오티드가 도입됨으로써 베타-카로틴 15,15'-옥시게네이즈 변이체가 발현되어, 레티노이드 생산능이 증가된 재조합 미생물일 수 있다. 상기 레티노이드 생산능이 증가된 재조합 미생물은, 천연의 야생형 미생물 또는 이중기능성 베타-카로틴 15,15'-옥시게네이즈 비변형 미생물(즉, 야생형 베타-카로틴 15,15'-옥시게네이즈 (서열번호 1)를 발현하는 미생물 또는 변이형 (서열번호 3 또는 상기에서 설명한 베타-카로틴 15,15'-옥시게네이즈 변이체) 단백질을 발현하지 않는 미생물)에 비하여 레티노이드 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다. 그 예로, 상기 레티노이드 생산능의 증가 여부를 비교하는 대상 미생물인, 베타-카로틴 15,15'-옥시게네이즈 비변형 미생물은 CC08-1023 균주일 수 있으나, 이에 제한되지 않는다.
일 예로, 상기 생산능이 증가된 재조합 미생물은 변이 전 모균주 또는 비변형 미생물의 레티노이드 생산능에 비하여 약 1% 이상, 구체적으로는 약 1% 이상, 약 2.5% 이상, 약 5% 이상, 약 6% 이상, 약 7% 이상, 약 8% 이상, 약 9% 이상, 약 10% 이상, 약 11% 이상, 약 11.5% 이상, 약 12% 이상, 약 12.5% 이상, 약 13% 이상, 약 13.5% 이상, 약 14% 이상, 약 14.5% 이상, 약 15% 이상, 약 15.5% 이상, 약 16% 이상, 약 16.5% 이상, 약 17% 이상, 약 17.5% 이상, 약 18% 이상, 약 20% 이상, 약 22% 이상, 약 24% 이상, 약 26% 이상, 약 28% 이상, 약 30% 이상, 약 32% 이상, 약 34% 이상, 약 36% 이상, 약 37% 이상, 약 38% 이상, 약 39% 이상, 약 40% 이상, 약 41% 이상, 약 41.5% 이상, 약 42% 이상, 약 42.5% 이상, 약 43% 이상, 약 43.5% 이상, 약 44% 이상, 약 44.5% 이상, 약 45% 이상, 약 45.5% 이상, 또는 약 46% 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 200% 이하, 약 150% 이하, 약 100% 이하, 또는 약 50% 이하일 수 있음) 증가된 것일 수 있으나, 변이 전 모균주 또는 비변형 미생물의 생산능에 비해 +값의 증가량을 갖는 한, 이에 제한되지 않는다. 다른 예에서, 상기 생산능이 증가된 재조합 미생물은 변이 전 모균주 또는 비변형 미생물에 비하여, 레티노이드 생산능이 약 1.01배 이상, 약 1.02배 이상, 약 1.03배 이상, 약 1.05배 이상, 약 1.06배 이상, 약 1.07배 이상, 약 1.08배 이상, 약 1.09배 이상, 약 1.10배 이상, 약 1.11배 이상, 약 1.12배 이상, 약 1.13배 이상, 약 1.14배 이상, 약 1.15배 이상, 약 1.16배 이상, 약 1.17배 이상, 약 1.18배 이상, 약 1.20배 이상, 약 1.22배 이상, 약 1.24배 이상, 약 1.26배 이상, 약 1.28배 이상, 약 1.30배 이상, 약 1.32배 이상, 약 1.34배 이상, 약 1.36배 이상, 약 1.38배 이상, 약 1.40배 이상, 약 1.41배 이상, 약 1.42배 이상, 약 1.43배 이상, 약 1.44배 이상, 약 1.45배 이상, 또는 약 1.46배 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 10배 이하, 약 5배 이하, 약 3배 이하, 또는 약 2배 이하일 수 있음) 증가된 것일 수 있으나, 이에 제한되지 않는다. 상기 용어 “약(about)”은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.
본 출원에서 용어, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 예를 들어, 상기 비변형 미생물은 본 명세서에 기재된 베타-카로틴 15,15'-옥시게네이즈 변이체가 도입되지 않거나 도입되기 전의 균주를 의미할 수 있다. 상기 "비변형 미생물"은 "변형 전 균주", "변형 전 미생물", "비변이 균주", "비변형 균주", "비변이 미생물" 또는 "기준 미생물"과 혼용될 수 있다.
본 출원의 또 다른 일 예로, 본 출원의 미생물은 야로위아(Yarrowia sp.) 속 미생물일 수 있고, 구체적으로 야로위아 리폴리티카 (Yarrowia lipolytica)일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어, 폴리펩티드 활성의 "강화"는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 활성화(activation), 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 활성화, 강화, 상향조절, 과발현, 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 “내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "강화", "상향조절", "과발현" 또는 "증가"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성 및/또는 농도(발현량)에 비하여 향상된 것을 의미한다.
상기 강화는 외래의 폴리펩티드를 도입하거나, 내재적인 폴리펩티드의 활성 강화 및/또는 농도(발현량)를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.
상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).
구체적으로, 본 출원의 폴리펩티드 활성의 강화는
1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가;
2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체;
3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;
4) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드의 아미노산 서열의 변형;
5) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형(예를 들어, 폴리펩티드의 활성이 강화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 폴리뉴클레오티드 서열의 변형);
6) 폴리펩티드의 활성을 나타내는 외래 폴리펩티드 또는 이를 코딩하는 외래 폴리뉴클레오티드의 도입;
7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화;
8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식; 또는
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.
보다 구체적으로,
상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터의 숙주세포 내로의 도입에 의해 달성되는 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 카피 이상 도입에 의해 달성되는 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.
상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일 예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.
공지된 강력한 프로모터의 예에는 CJ1 내지 CJ7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터, yccA 프로모터, TEFINt 프로모터, EXP1 프로모터, TEF1 프로모터 등이 있으나, 이에 제한되지 않는다.
상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈을 코딩하는 염기 서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.
상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.
상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.
상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.
상기 8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식하는 것은, 예를 들어 분석하고자 하는 폴리펩티드의 서열정보를 기지 단백질들의 서열정보가 저장된 데이터베이스와 비교함으로써 서열의 유사성 정도에 따라 주형 단백질 후보를 결정하고 이를 토대로 구조를 확인하여, 변형하거나 화학적으로 수식할 노출 부위를 선택하여 변형 또는 수식하는 것일 수 있다.
이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도 발현량이 야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 미생물에서 폴리뉴클레오티드의 일부 또는 전체의 변형은 (a) 미생물 내 염색체 삽입용 벡터를 이용한 상동 재조합 또는 유전자가위(engineered nuclease, e.g., CRISPR-Cas9)을 이용한 유전체 교정 및/또는 (b) 자외선 및 방사선 등과 같은 빛 및/또는 화학물질 처리에 의해 유도될 수 있으나 이에 제한되지 않는다. 상기 유전자 일부 또는 전체의 변형 방법에는 DNA 재조합 기술에 의한 방법이 포함될 수 있다. 예를 들면, 목적 유전자와 상동성이 있는 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열 또는 벡터를 상기 미생물에 주입하여 상동 재조합(homologous recombination)이 일어나게 함으로써 유전자 일부 또는 전체의 결손이 이루어질 수 있다. 상기 주입되는 뉴클레오티드 서열 또는 벡터는 우성 선별 마커를 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 미생물에서, 변이체, 폴리뉴클레오티드 및 레티노이드 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 포함하는 미생물을 배지에서 배양하는 단계를 포함하는, 레티노이드 생산방법을 제공한다.
본 출원의 레티노이드 생산방법은 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드 또는 본 출원의 벡터를 포함하는 미생물을 배지에서 배양하는 단계를 포함할 수 있다.
본 출원에서, 용어 "배양"은 본 출원의 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및/또는 유가식일 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 용어, "배지"는 본 출원의 미생물을 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 미생물의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 미생물을 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.
본 출원에서 상기 탄소원으로는 글루코오스, 사카로오스, 락토오스, 프룩토오스, 수크로오스, 말토오스 등과 같은 탄수화물; 만니톨, 소르비톨 등과 같은 당 알코올, 피루브산, 락트산, 시트르산 등과 같은 유기산; 글루탐산, 메티오닌, 리신 등과 같은 아미노산 등이 포함될 수 있다. 또한, 전분 가수분해물, 당밀, 블랙스트랩 당밀, 쌀겨울, 카사버, 사탕수수 찌꺼기 및 옥수수 침지액 같은 천연의 유기 영양원을 사용할 수 있으며, 구체적으로는 글루코오스 및 살균된 전처리 당밀(즉, 환원당으로 전환된 당밀) 등과 같은 탄수화물이 사용될 수 있으며, 그 외의 적정량의 탄소원을 제한 없이 다양하게 이용할 수 있다. 이들 탄소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 질소원으로는 암모니아, 황산암모늄, 염화암모늄, 초산암모늄, 인산암모늄, 탄산안모늄, 질산암모늄 등과 같은 무기질소원; 글루탐산, 메티오닌, 글루타민 등과 같은 아미노산, 펩톤, NZ-아민, 육류 추출물, 효모 추출물, 맥아 추출물, 옥수수 침지액, 카세인 가수분해물, 어류 또는 그의 분해생성물, 탈지 대두 케이크 또는 그의 분해 생성물 등과 같은 유기 질소원이 사용될 수 있다. 이들 질소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.
상기 인원으로는 인산 제1칼륨, 인산 제2칼륨, 또는 이에 대응되는 소디움-함유 염 등이 포함될 수 있다. 무기화합물로는 염화나트륨, 염화칼슘, 염화철, 황산마그네슘, 황산철, 황산망간, 탄산칼슘 등이 사용될 수 있으며, 그 외에 아미노산, 비타민 및/또는 적절한 전구체 등이 포함될 수 있다. 이들 구성성분 또는 전구체는 배지에 회분식 또는 연속식으로 첨가될 수 있다. 그러나, 이에 한정되는 것은 아니다.
또한, 본 출원의 미생물의 배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산, 황산 등과 같은 화합물을 배지에 적절한 방식으로 첨가하여, 배지의 pH를 조정할 수 있다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한, 배지의 호기 상태를 유지하기 위하여, 배지 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으며, 이에 한정되는 것은 아니다.
본 출원의 배양에서 배양온도는 20 내지 45℃구체적으로는 25 내지 40℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 배양에 의하여 생산된 레티노이드는 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.
본 출원의 레티노이드 생산방법은, 본 출원의 미생물을 준비하는 단계, 상기 미생물을 배양하기 위한 배지를 준비하는 단계, 또는 이들의 조합(순서에 무관, in any order)을, 예를 들어, 상기 배양하는 단계 이전에, 추가로 포함할 수 있다.
본 출원의 레티노이드 생산방법은, 상기 배양에 따른 배지(배양이 수행된 배지) 또는 본 출원의 미생물로부터 레티노이드를 회수하는 단계를 추가로 포함할 수 있다. 상기 회수하는 단계는 상기 배양하는 단계 이후에 추가로 포함될 수 있다.
상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 레티노이드를 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 세포 파쇄, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 레티노이드를 회수할 수 있다.
또한, 본 출원의 레티노이드 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다. 일 예에서, 본 출원의 레티노이드 생산방법이 회수 단계와 정제 단계를 모두 포함하는 경우, 상기 회수 단계와 정제 단계는 순서에 상관없이 연속적 또는 비연속적으로 수행되거나, 동시에 또는 하나의 단계로 통합되어 수행될 수 있으나, 이에 제한되는 것은 아니다.
본 출원에서 레티노이드의 일종인 레티놀 유도체 생산방법은, 상기 배양하는 단계는 레티놀을 레티놀 유도체로 전환하는 단계를 추가로 포함할 수 있다. 본 출원의 레티놀 유도체 생산방법에 있어서, 상기 전환하는 단계는 상기 배양하는 단계 또는 상기 회수하는 단계 이후에 추가로 포함될 수 있다. 상기 전환하는 단계는 당해 기술 분야에 공지된 적합한 방법을 이용하여 수행할 수 있다(Jang et al. Microbial Cell Factories 2011, 10:59, Choi et al. antioxidants. 2020).
본 출원의 방법에서, 변이체, 폴리뉴클레오티드, 벡터 및 미생물 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체, 상기 변이체를 코딩하는 폴리뉴클레오타이드, 상기 폴리뉴클레오타이드를 포함하는 벡터 또는 본 출원의 폴리뉴클레오티드를 포함하는 미생물; 이를 배양한 배지; 또는 이들 중 2 이상의 조합을 포함하는 레티노이드 생산용 조성물을 제공한다.
본 출원의 조성물은 레티노이드 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 조성물에서, 변이체, 폴리뉴클레오티드, 벡터, 미생물, 배지 및 레티노이드 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체, 폴리뉴클레오티드, 벡터, 및 미생물 중 어느 하나 이상의 레티노이드 생산 용도를 제공한다.
상기 변이체, 폴리뉴클레오티드, 벡터, 미생물, 및 레티노이드 등은 상기 다른 양태에서 기재한 바와 같다.
본 출원의 베타-카로틴 15,15'-옥시게네이즈 변이체를 포함하는, 미생물을 배양하는 경우, 기존 비변형 폴리펩티드를 갖는 미생물에 비해 고수율의 레티노이드 생산이 가능하다.
이하 본 출원을 실시예에 의해 보다 상세하게 설명한다. 그러나 하기 실시예는 본 출원을 예시하기 위한 바람직한 실시양태에 불과한 것이며 따라서, 본 출원의 권리범위를 이에 한정하는 것으로 의도되지는 않는다. 한편, 본 명세서에 기재되지 않은 기술적인 사항들은 본 출원의 기술 분야 또는 유사 기술 분야에서 숙련된 통상의 기술자이면 충분히 이해하고 용이하게 실시할 수 있다.
실시예 1. BCO 변이 벡터 라이브러리 구축
해양세균 66A03(Uncultured marine bacterium 66A03) 유래의 BCO 유전자를 증폭하기 위해 UniProtKB (UniProt Knowledgebase)에 등록되어 있는 아미노산 서열(Q4PNI0)에 근거하여 서열번호 1의 아미노산 서열 및 서열번호 2의 폴리뉴클레오티드 서열을 확보하였다. Error-prone PCR을 통해 random 변이를 유도하기 위해 diversify PCR random mutagenesis kit(Takara社)를 사용하였다. PCR 조건 및 방법은 최적화를 통해 user manual의 buffer 조건 1 및 2로 각각 진행하였다. 구체적인 Error-prone PCR 조건은 하기 표 1에 나타내었다.
마크로젠社에 합성 의뢰한 해양세균 66A03유래의 야생형 BCO 유전자(서열번호 1)를 주형으로 하고, 서열번호 5와 서열번호 6의 프라이머를 이용하여 PCR을 수행하였다. PCR 조건은 변성 95℃, 30초; 어닐링 55℃ 30초; 및 중합반응 68℃ 1분을 25회 반복 수행하였다. PCR로 증폭된 2 가지 조건의 BCO PCR products를 혼합하여 pIMR53-TEFINtp-CYC1t 벡터 기반 BCO 변이 벡터 라이브러리를 제작하였다.
Buffer 조건 1 | Buffer 조건 2 | |
PCR grade water | 40 ㎕ | 39 ㎕ |
10X Titanium Taq buffer | 5 ㎕ | 5 ㎕ |
MnSO4 | 0 ㎕ | 1 ㎕ |
dGTP | 1 ㎕ | 1 ㎕ |
50X Diversify dNTP Mix | 1 ㎕ | 1 ㎕ |
Primer mix | 1 ㎕ | 1 ㎕ |
Template DNA | 1 ㎕ | 1 ㎕ |
Titanium Taq polymerase | 1 ㎕ | 1 ㎕ |
pIMR53-TEFINtp-CYC1t 벡터는 하기와 같은 방법으로 제작되었다.
TEFINtp를 증폭하기 위해 야로위아 리폴리티카 (Yarrowia lipolytica) PO1f 게놈 DNA를 주형으로 하고 서열번호 7과 서열번호 8의 프라이머를 이용하여 PCR을 수행하였고, CYC1 터미네이터를 증폭하기 위해 사카로마이세스 세레비지에 (Saccharomyces cerevisiae) 게놈 DNA를 주형으로 하고 서열번호 9와 서열번호 10 의 프라이머를 이용하여 PCR을 수행하였다. PCR 조건으로, 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 68°C, 1분을 32회 반복 수행하였다. 추가적으로 pIMR53 벡터를 주형으로 하고 서열번호 11과 서열번호 12의 프라이머를 이용하여 PCR을 수행하였다. PCR 조건으로, 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 68°C, 5분을 32회 반복 수행하였다.
그 결과 6,774bp의 linearized pIMR53, 531bp의 TEFINtp, 그리고 248bp의 CYC1t를 얻었다. PCR로 증폭된 상기 TEFINtp 및 CYC1t DNA 단편은 Infusion 클로닝 키트(Invitrogen)를 사용하여 pIMR53 벡터에 접합한 후 대장균 DH5α에 형질전환하고, 30 mg/L의 앰피실린이 포함된 LB 고체배지에 도말하였다.
PCR을 통해 목적한 TEFINt 프로모터와 CYC1 터미네이터가 삽입된 플라스미드로 형질 전환된 콜로니를 선별한 후, 통상적으로 알려진 플라스미드 추출법을 이용하여 플라스미드를 획득하였고, 이 플라스미드를 pIMR53-TEFINtp-CYC1t이라 명명하였다.
실시예 2. 레티노이드 생산용
Yarrowia lipolytica
플랫폼 균주 제작
실시예 2-1.
X. dendrorhous
유래 crtYB-crtI 삽입주 제작
레티노이드 생산을 위한 플랫폼 균주 제작을 위해 고지방 효모인 Yarrowia lipolytica CC08-0125 (기탁번호 KCCM12972P) 균주의 게놈에 Xanthophyllomyces dendrorhous 유래 lycopene cyclase/phytoene synthase (crtYB)와 phytoene desaturase(crtI) 유전자를 삽입하였다. crtYB는 NCBI(National Center for Biotechnology Information Search database)에 등록되어 있는 염기서열(GenBank: AY177204.1)에 근거하여 서열번호 13의 폴리뉴클레오티드를 확보하였고, crtI는 NCBI에 등록되어 있는 염기서열(GenBank: AY177424.1)에 근거하여 서열번호 14의 폴리뉴클레오티드를 확보하였다. crtYB와 crtI의 폴리뉴클레오티드 서열은 마크로젠社를 통해 TEFINtp-crtYB-CYC1t(서열번호 15), TEFINtp-crtI-CYC1t(서열번호 16)의 형태로 유전자를 합성하였으며, 선별 마커로는 Y. lipolytica 의 URA3 유전자(서열번호 17)를 이용하여 MHY1(YALI0B21582g) 유전자 위치에 삽입되는 카세트를 디자인 하였다. 합성된 crtYB, crtI 유전자 및 KCCM12972P 게놈 DNA를 주형으로 하고 서열번호 18 및 서열번호 19, 서열번호 20 및 서열번호 21, 서열번호 22 및 서열번호 23, 서열번호 24 및 서열번호 25, 서열번호 26 및 서열번호 27, 서열번호 28 및 서열번호 29의 프라이머를 이용하여 각각의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 3분 30초를 35회 반복 수행하였다. 그 결과로 얻어진 5개의 DNA 단편은 overlap extension PCR을 통해 하나의 카세트로 제작되었다.
이렇게 제작된 카세트를 열충격법 (D.-C. Chen et al., Appl Microbiol Biotechnol, 1997) 으로 KCCM12972P 균주에 도입한 후, uracil이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 30 및 서열번호 31의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 spotting하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 자란 콜로니를 획득함으로써 URA3 마커를 회수하였다.
실시예 2-2. HMGR 강화주 제작
앞서 실시예 2-1에서 제작된 crtYB, crtI 유전자가 삽입된 균주의 하이드록시메틸글루타릴 리덕테이즈(3-hydroxy-3-methylglutaryl-CoA reductase, HMGR)유전자의 native 프로모터(서열번호 32) 부위를 TEFINt 프로모터로 교체하기 위한 카세트를 디자인하였고, KCCM12972P 게놈 DNA를 주형으로 하고 서열번호 33 및 서열번호 34, 서열번호 35 및 서열번호 36, 서열번호 37 및 서열번호 38, 서열번호 39 및 서열번호 40, 서열번호 41 및 서열번호 42의 프라이머를 이용하여 각각의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 1분 30초를 35회 반복 수행하였다. 그 결과로 얻어진 5개의 DNA 단편은 overlap extension PCR을 통해 하나의 카세트로 제작되었다.
이렇게 제작된 카세트를 열충격법으로 실시예 2-1에서 제작한 균주에 도입한 후, uracil이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 43 및 서열번호 44의 프라이머를 이용하여 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 spotting하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 자란 콜로니를 획득함으로써 URA3 마커를 회수하였다. 최종적으로 제작된 레티노이드 생산 플랫폼 균주를 CC08-1023으로 명명하였다.
< Yarrowia lipolytica minimal media1 (YLMM1)>
포도당 20 g/L, 아미노산을 포함하지 않는 효모 질소 염기(Yeast nitrogen base without amino acids) 6.7 g/L, 우라실을 포함하지 않는 효모 합성 드롭 아웃 배지 보충물 (Yeast Synthetic Drop-out Medium Supplements without uracil) 2 g/L, 한천(agar) 15 g/L
<5-Fluoroorotic Acid (5-FOA)>
포도당 20 g/L, 아미노산을 포함하지 않는 효모 질소 염기(Yeast nitrogen base without amino acids) 6.7 g/L, 우라실을 포함하지 않는 효모 합성 드롭 아웃 배지 보충물 (Yeast Synthetic Drop-out Medium Supplements without uracil) 2 g/L, 우라실(Uracil) 50 μg/mL, 5-플루오로 오로틴산(5-Fluoroorotic acid; 5-FOA) 1 g/L, 한천(agar) 15 g/L
실시예 3. BCO 활성 강화주 1차 선별
활성이 강화된 BCO 선별을 위해 레티노이드 생산 플랫폼 균주인 CC08-1023 균주에 pIMR53(negative control, NC) 벡터, pIMR53-TEFINtp-BCO(야생형, 서열번호 2)-CYC1t 벡터(positive control, PC), 및 실시예 1에서 구축된 BCO random 변이체 발현 벡터 라이브러리를 열 충격법(heat-shock)으로 형질 전환하였다. 이후, uracil이 포함되지 않은 고체배지에서 형성된 콜로니를 획득하였다.
96 deep-well plate 31판에 우라실이 포함되지 않은 YLMM2(Yarrowia lipolytica minimal media2) 액체배지를 350 ㎕씩 분주하고, 획득한 콜로니들을 접종하여 30°C에서 48시간 동안 배양하였다. 이후, 우라실이 포함되지 않은 YLMM1 고체배지에 spotting하여 30℃ 에서 3일간 배양하였다. 배양 종료 후, 배양된 총 3,000 콜로니들 중에서 positive control (CC08-1023/pIMR53-TEFINtp-BCO-CYC1t) 대비 색깔이 옅은 균주 17종을 1차로 선별하였다. 상기 YLMM2의 제조방법 및 조성은 하기와 같다.
<YLMM2 (pH 7.0)>
포도당 40 g/L, 아미노산 및 암모늄 설페이트가 없는 효모 질소 염기(Yeast nitrogen base without amino acids and ammonium sulfate) 1.7 g/L, 우라실(Uracil) 0.5 g/L, 암모늄 설페이트(Ammonium sulfate) 2.5 g/L를 0.1 M 포스페이트 완충액(sodium phosphate buffer)(pH 7.0)에 녹인다.
실시예 4. BCO 활성 강화주 2차 선별
실시예 3에서 1차로 선별된 17종에 대해 플라스크 평가를 진행하였다.
우라실이 포함되지 않은 YLMM2(Yarrowia lipolytica minimal media 2) 50 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에, 상기 17종의 균주 및 PC(positive control) 벡터로 형질 전환된 균주를 초기 OD가 1이 되도록 접종하고, 30℃에서 48시간 동안, 250 rpm으로 진탕 배양하였다. 배양 종료 후, 배양액 1 ㎖을 원심 분리하여 상등액을 제거하였다. 다음으로, DMSO(Dimethyl sulfoxide, sigma社) 0.5 ㎖을 첨가하고 55℃에서 10분동안 2,000rpm에서 진탕하여 셀을 파쇄하였다. 추가로, 아세톤(sigma社) 0.5 ㎖을 첨가고 45℃에서 15분동안 2,000rpm에서 진탕하여 레티놀 및 레티날을 추출하였고, HPLC 설비로 농도를 분석하였다. 분석된 OD, 레티놀 및 레티날 농도 결과는 표 2에 표시하였다.
Number | OD(A600) | Retinol(mg/L) | Retinal(mg/L) | Retinol(%) |
NC | 65 | ND | ND | - |
PC | 61 | 8.2 | 1.4 | 100 |
1 | 64 | 12.0 | 1.9 | 146 |
2 | 42 | 7.0 | 1.2 | 85 |
3 | 32 | 4.9 | 0.8 | 59 |
4 | 66 | 9.7 | 1.5 | 118 |
5 | 57 | 9.3 | 1.5 | 113 |
6 | 44 | 6.1 | 1.0 | 74 |
7 | 47 | 6.0 | 1.0 | 72 |
8 | 38 | 5.9 | 1.0 | 72 |
9 | 56 | 7.1 | 1.2 | 86 |
10 | 47 | 7.0 | 1.1 | 85 |
11 | 58 | 7.7 | 1.3 | 94 |
12 | 52 | 8.3 | 1.3 | 101 |
13 | 46 | 7.1 | 1.2 | 86 |
14 | 46 | 7.1 | 1.2 | 86 |
15 | 54 | 6.9 | 1.1 | 84 |
16 | 58 | 8.7 | 1.4 | 106 |
17 | 54 | 7.7 | 1.3 | 94 |
이후, 평가 시료로부터 추출된 레티놀 농도를 2차 선별을 위한 기준으로 이용하였다. 평가 균주 중 5종(number1,4,5,12,16)이 PC(positive control) 대비 레티놀 농도(Retinol(%))가 증가한 것을 확인하였다. 특히나 1번 균주의 경우 PC(positive control) 대비 레티놀 농도가 약 46% 증가함을 확인하였다. 따라서 레티놀 농도 상승폭이 가장 큰 1번 균주에서 형질 전환된 플라스미드를 추출하여 BCO ORF에 위치한 random 변이를 확인하기 위한 서열분석을 진행하였다. Zymoprep yeast plasmid miniprep kit2(Zymo research社)를 사용하여 선별된 균주로부터 형질 전환된 BCO 플라스미드를 추출하고 서열분석의 신뢰도를 높이기 위해 서열번호 45와 서열번호 46을 사용하여 양방향으로 서열분석을 진행하였다. 그 결과, BCO ORF내에서 돌연변이 수는 3개로 확인되었으며, 확인된 돌연변이는 표 3에 나타내었다.
변이주 Number | Amino acid seq (Nucleotide seq) |
1 | A43V(GCC→GTC) |
L58Q(CTG→CAG) | |
I74V(ATC→GTC) |
상기 결과로부터 본 출원의 BCO 변이체를 도입할 경우 레티노이드 생산량을 증가시킬 수 있음을 확인하였다.
이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.
<110> CJ CheilJedang Corporation
<120> Novel beta-carotene 15,15'-oxygenase variant and a method for
producing retinoids using the same
<130> KPA210466-KR
<160> 46
<170> KoPatentIn 3.0
<210> 1
<211> 275
<212> PRT
<213> Artificial Sequence
<220>
<223> Blh_WT
<400> 1
Met Gly Leu Met Leu Ile Asp Trp Cys Ala Leu Ala Leu Val Val Phe
1 5 10 15
Ile Gly Leu Pro His Gly Ala Leu Asp Ala Ala Ile Ser Phe Ser Met
20 25 30
Ile Ser Ser Ala Lys Arg Ile Ala Arg Leu Ala Gly Ile Leu Leu Ile
35 40 45
Tyr Leu Leu Leu Ala Thr Ala Phe Phe Leu Ile Trp Tyr Gln Leu Pro
50 55 60
Ala Phe Ser Leu Leu Ile Phe Leu Leu Ile Ser Ile Ile His Phe Gly
65 70 75 80
Met Ala Asp Phe Asn Ala Ser Pro Ser Lys Leu Lys Trp Pro His Ile
85 90 95
Ile Ala His Gly Gly Val Val Thr Val Trp Leu Pro Leu Ile Gln Lys
100 105 110
Asn Glu Val Thr Lys Leu Phe Ser Ile Leu Thr Asn Gly Pro Thr Pro
115 120 125
Ile Leu Trp Asp Ile Leu Leu Ile Phe Phe Leu Cys Trp Ser Ile Gly
130 135 140
Val Cys Leu His Thr Tyr Glu Thr Leu Arg Ser Lys His Tyr Asn Ile
145 150 155 160
Ala Phe Glu Leu Ile Gly Leu Ile Phe Leu Ala Trp Tyr Ala Pro Pro
165 170 175
Leu Val Thr Phe Ala Thr Tyr Phe Cys Phe Ile His Ser Arg Arg His
180 185 190
Phe Ser Phe Val Trp Lys Gln Leu Gln His Met Ser Ser Lys Lys Met
195 200 205
Met Ile Gly Ser Ala Ile Ile Leu Ser Cys Thr Ser Trp Leu Ile Gly
210 215 220
Gly Gly Ile Tyr Phe Phe Leu Asn Ser Lys Met Ile Ala Ser Glu Ala
225 230 235 240
Ala Leu Gln Thr Val Phe Ile Gly Leu Ala Ala Leu Thr Val Pro His
245 250 255
Met Ile Leu Ile Asp Phe Ile Phe Arg Pro His Ser Ser Arg Ile Lys
260 265 270
Ile Lys Asn
275
<210> 2
<211> 828
<212> DNA
<213> Artificial Sequence
<220>
<223> blh_WT
<400> 2
atgggcttga tgttaattga ttggtgtgct ttagcattgg ttgtgtttat tggtttgcca 60
catggtgcct tagatgctgc tatttctttt tcaatgattt cttcagcaaa gagaattgct 120
agattagcag gaatactatt aatttacctg ttgttagcaa ccgcattttt tttaatttgg 180
tatcaattac cagcattttc tcttcttatt tttcttttga taagcataat ccattttgga 240
atggctgatt tcaatgcatc cccaagtaaa cttaagtggc ctcatattat tgcacatggc 300
ggcgttgtta ctgtttggtt gccgcttatc caaaaaaatg aagttacgaa gctattttca 360
atattaacaa atggtccaac tcccatttta tgggacatac tattgatatt ttttttatgt 420
tggagcatag gagtatgtct tcatacctat gaaactttac gttctaaaca ttataatatc 480
gcctttgaac ttattggatt aatttttcta gcctggtatg cacccccact cgttactttt 540
gccacatact tctgctttat ccacagcaga cgtcacttta gttttgtttg gaaacagtta 600
cagcatatga gttcaaaaaa aatgatgata ggtagtgcca ttattttatc ttgtacgagc 660
tggttgatag gcggaggaat atattttttc ctcaattcga aaatgattgc cagtgaagct 720
gctttacaaa ctgtctttat tggtcttgca gctttaacag ttcctcacat gatacttatc 780
gactttatat ttagaccaca ctcttccaga attaaaatca aaaattga 828
<210> 3
<211> 275
<212> PRT
<213> Artificial Sequence
<220>
<223> Blh_VT
<400> 3
Met Gly Leu Met Leu Ile Asp Trp Cys Ala Leu Ala Leu Val Val Phe
1 5 10 15
Ile Gly Leu Pro His Gly Ala Leu Asp Ala Ala Ile Ser Phe Ser Met
20 25 30
Ile Ser Ser Ala Lys Arg Ile Ala Arg Leu Val Gly Ile Leu Leu Ile
35 40 45
Tyr Leu Leu Leu Ala Thr Ala Phe Phe Gln Ile Trp Tyr Gln Leu Pro
50 55 60
Ala Phe Ser Leu Leu Ile Phe Leu Leu Val Ser Ile Ile His Phe Gly
65 70 75 80
Met Ala Asp Phe Asn Ala Ser Pro Ser Lys Leu Lys Trp Pro His Ile
85 90 95
Ile Ala His Gly Gly Val Val Thr Val Trp Leu Pro Leu Ile Gln Lys
100 105 110
Asn Glu Val Thr Lys Leu Phe Ser Ile Leu Thr Asn Gly Pro Thr Pro
115 120 125
Ile Leu Trp Asp Ile Leu Leu Ile Phe Phe Leu Cys Trp Ser Ile Gly
130 135 140
Val Cys Leu His Thr Tyr Glu Thr Leu Arg Ser Lys His Tyr Asn Ile
145 150 155 160
Ala Phe Glu Leu Ile Gly Leu Ile Phe Leu Ala Trp Tyr Ala Pro Pro
165 170 175
Leu Val Thr Phe Ala Thr Tyr Phe Cys Phe Ile His Ser Arg Arg His
180 185 190
Phe Ser Phe Val Trp Lys Gln Leu Gln His Met Ser Ser Lys Lys Met
195 200 205
Met Ile Gly Ser Ala Ile Ile Leu Ser Cys Thr Ser Trp Leu Ile Gly
210 215 220
Gly Gly Ile Tyr Phe Phe Leu Asn Ser Lys Met Ile Ala Ser Glu Ala
225 230 235 240
Ala Leu Gln Thr Val Phe Ile Gly Leu Ala Ala Leu Thr Val Pro His
245 250 255
Met Ile Leu Ile Asp Phe Ile Phe Arg Pro His Ser Ser Arg Ile Lys
260 265 270
Ile Lys Asn
275
<210> 4
<211> 828
<212> DNA
<213> Artificial Sequence
<220>
<223> blh_VT
<400> 4
atgggcctga tgctgatcga ctggtgtgcc ctggccctgg tggtgttcat cggcctgccc 60
cacggcgccc tggacgccgc catctctttc tctatgatct cttctgccaa gcgaatcgcc 120
cgactggtcg gcatcctgct gatctacctg ctgctggcca ccgccttctt ccagatctgg 180
taccagctgc ccgccttctc tctgctgatc ttcctgctgg tctctatcat ccacttcggc 240
atggccgact tcaacgcctc tccctctaag ctgaagtggc cccacatcat cgcccacggc 300
ggcgtggtga ccgtgtggct gcccctgatc cagaagaacg aggtgaccaa gctgttctct 360
atcctgacca acggccccac ccccatcctg tgggacatcc tgctgatctt cttcctgtgt 420
tggtctatcg gcgtgtgtct gcacacctac gagaccctgc gatctaagca ctacaacatc 480
gccttcgagc tgatcggcct gatcttcctg gcctggtacg ccccccccct ggtgaccttc 540
gccacctact tctgtttcat ccactctcga cgacacttct ctttcgtgtg gaagcagctg 600
cagcacatgt cttctaagaa gatgatgatc ggctctgcca tcatcctgtc ttgtacctct 660
tggctgatcg gcggcggcat ctacttcttc ctgaactcta agatgatcgc ctctgaggcc 720
gccctgcaga ccgtgttcat cggcctggcc gccctgaccg tgccccacat gatcctgatc 780
gacttcatct tccgacccca ctcttctcga atcaagatca agaactag 828
<210> 5
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> BCO-F
<400> 5
ttttgcagta ctaaccgcag ggcctgatgc tgatcgactg 40
<210> 6
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> BCO-R
<400> 6
tgacataact aattacatga ctagttcttg atcttgattc 40
<210> 7
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-F
<400> 7
cctttcgtct tcaaggaatt agagaccggg ttggcggcgc 40
<210> 8
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-R
<400> 8
cgtgacataa ctaattacat gactgcggtt agtactgcaa aaag 44
<210> 9
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> CYC1t-F
<400> 9
ctttttgcag tactaaccgc agtcatgtaa ttagttatgt cacg 44
<210> 10
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> CYC1t-R
<400> 10
tcgtcgcggc cgcggcgcgc cggcaaatta aagccttcga gcgt 44
<210> 11
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> pIMR53-F
<400> 11
gcgccgccaa cccggtctct aattccttga agacgaaagg 40
<210> 12
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> pIMR53-R
<400> 12
acgctcgaag gctttaattt gccggcgcgc cgcggccgcg acga 44
<210> 13
<211> 2019
<212> DNA
<213> Artificial Sequence
<220>
<223> X. dendrorhous crtYB
<400> 13
atgacggctc tcgcatatta ccagatccat ctgatctata ctctcccaat tcttggtctt 60
ctcggcctgc tcacttcccc gattttgaca aaatttgaca tctacaaaat atcgatcctc 120
gtatttattg cgtttagtgc aaccacacca tgggactcat ggatcatcag aaatggcgca 180
tggacatatc catcagcgga gagtggccaa ggcgtgtttg gaacgtttct agatgttcca 240
tatgaagagt acgctttctt tgtcattcaa accgtaatca ccggcttggt ctacgtcttg 300
gcaactaggc accttctccc atctctcgcg cttcccaaga ctagatcgtc cgccctttct 360
ctcgcgctca aggcgctcat ccctctgccc attatctacc tatttaccgc tcaccccagc 420
ccatcgcccg acccgctcgt gacagatcac tacttctaca tgcgggcact ctccttactc 480
atcaccccac ctaccatgct cttggcagca ttatcaggcg aatatgcttt cgattggaaa 540
agtggccgag caaagtcaac tattgcagca atcatgatcc cgacggtgta tctgatttgg 600
gtagattatg ttgctgtcgg tcaagactct tggtcgatca acgatgagaa gattgtaggg 660
tggaggcttg gaggtgtact acccattgag gaagctatgt tcttcttact gacgaatcta 720
atgattgttc tgggtctgtc tgcctgcgat catactcagg ccctatacct gctacacggt 780
cgaactattt atggcaacaa aaagatgcca tcttcatttc ccctcattac accgcctgtg 840
ctctccctgt tttttagcag ccgaccatac tcttctcagc caaaacgtga cttggaactg 900
gcagtcaagt tgttggagga aaagagccgg agcttttttg ttgcctcggc tggatttcct 960
agcgaagtta gggagaggct ggttggacta tacgcattct gccgggtgac tgatgatctt 1020
atcgactctc ctgaagtatc ttccaacccg catgccacaa ttgacatggt ctccgatttt 1080
cttaccctac tatttgggcc cccgctacac ccttcgcaac ctgacaagat cctttcttcg 1140
cctttacttc ctccttcgca cccttcccga cccacgggaa tgtatcccct cccgcctcct 1200
ccttcgctct cgcctgccga gctcgttcaa ttccttaccg aaagggttcc cgttcaatac 1260
catttcgcct tcaggttgct cgctaagttg caagggctga tccctcgata cccactcgac 1320
gaactcctta gaggatacac cactgatctt atctttccct tatcgacaga ggcagtccag 1380
gctcggaaga cgcctatcga gaccacagct gacttgctgg actatggtct atgtgtagca 1440
ggctcagtcg ccgagctatt ggtctatgtc tcttgggcaa gtgcaccaag tcaggtccct 1500
gccaccatag aagaaagaga agctgtgtta gtggcaagcc gagagatggg aactgccctt 1560
cagttggtga acattgctag ggacattaaa ggggacgcaa cagaagggag attttaccta 1620
ccactctcat tctttggtct tcgggatgaa tcaaagcttg cgatcccgac tgattggacg 1680
gaacctcggc ctcaagattt cgacaaactc ctcagtctat ctccttcgtc cacattacca 1740
tcttcaaacg cctcagaaag cttccggttc gaatggaaga cgtactcgct tccattagtc 1800
gcctacgcag aggatcttgc caaacattct tataagggaa ttgaccgact tcctaccgag 1860
gttcaagcgg gaatgcgagc ggcttgcgcg agctacctac tgatcggccg agagatcaaa 1920
gtcgtttgga aaggagacgt cggagagaga aggacagttg ccggatggag gagagtacgg 1980
aaagtcttga gtgtggtcat gagcggatgg gaagggcag 2019
<210> 14
<211> 1966
<212> DNA
<213> Artificial Sequence
<220>
<223> X. dendrorhous crtI
<400> 14
atgggaaaag aacaagatca ggataaaccc acagctatca tcgtgggatg tggtatcggt 60
ggaatcgcca ctgccgctcg tcttgctaaa gaaggtttcc aggtcacggt gttcgagaag 120
aacgactact ccggaggtcg atgctcttta atcgagcgag atggttatcg attcgatcag 180
gggcccagtt tgctgctctt gccagatctc ttcaagcaga cattcgaaga tttgggagag 240
aagatggaag attgggtcga tctcatcaag tgtgaaccca actatgtttg ccacttccac 300
gatgaagaga ctttcactct ttcaaccgac atggcgttgc tcaagcggga agtcgagcgt 360
tttgaaggca aagatggatt tgatcggttc ttgtcgttta tccaagaagc ccacagacat 420
tacgagcttg ctgtcgttca cgtcctgcag aagaacttcc ctggcttcgc agcattctta 480
cggctacagt tcattggcca aatcctggct cttcacccct tcgagtctat ctggacaaga 540
gtttgtcgat atttcaagac cgacagatta cgaagagtct tctcgtttgc agtgatgtac 600
atgggtcaaa gcccatacag tgcgcccgga acatattcct tgctccaata caccgaattg 660
accgagggca tctggtatcc gagaggaggc ttttggcagg ttcctaatac tcttcttcag 720
atcgtcaagc gcaacaatcc ctcagccaag ttcaatttca acgctccagt ttcccaggtt 780
cttctctctc ctgccaagga ccgagcgact ggtgttcgac ttgaatccgg cgaggaacat 840
cacgccgatg ttgtgattgt caatgctgac ctcgtttacg cctccgagca cttgattcct 900
gacgatgcca gaaacaagat tggccaactg ggtgaagtca agagaagttg gtgggctgac 960
ttagttggtg gaaagaagct caagggaagt tgcagtagtt tgagcttcta ctggagcatg 1020
gaccgaatcg tggacggtct gggcggacac aatatcttct tggccgagga cttcaaggga 1080
tcattcgaca caatcttcga ggagttgggt ctcccagccg atccttcctt ttacgtgaac 1140
gttccctcgc gaatcgatcc ttctgccgct cccgaaggca aagatgctat cgtcattctt 1200
gtgccgtgtg gccatatcga cgcttcgaac cctcaagatt acaacaagct tgttgctcgg 1260
gcaaggaagt ttgtgatcca cacgctttcc gccaagcttg gacttcccga ctttgaaaaa 1320
atgattgtgg cagagaaggt tcacgatgct ccctcttggg agaaagaatt caacctcaag 1380
gacggaagca tcttgggact ggctcacaac tttatgcaag ttcttggttt caggccgagc 1440
accagacatc ccaagtatga caagttgttc tttgtcgggg cttcgactca tcccggaact 1500
ggggttccca tcgtcttggc tggagccaag ttaactgcca accaagttct cgaatccttt 1560
gaccgatccc cagctccaga tcccaatatg tcactctccg taccatatgg aaaacctctc 1620
aaatcaaatg gaacgggtat cgattctcag gtccagctga agttcatgga tttggagaga 1680
tgggtatacc ttttggtgtt gttgattggg gccgtgatcg ctcgatccgt tggtgttctt 1740
gctttctgaa gcaagacaac gatcctttct tagagtttta ttttagtctc ttcctgtgtt 1800
ctctctatat acatactctg ctcgtctgtt ctcttctcga gggttcctct ttactttgtg 1860
tcagagtcat acccggtctc tcaacgtccg tttgagggct agacaattgt tagtctcgaa 1920
atctccatca cctcaagtct gatgttcatc atctttttta ttcgtt 1966
<210> 15
<211> 2830
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-crtYB-CYC1t
<400> 15
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gacggctctc 540
gcatattacc agatccatct gatctatact ctcccaattc ttggtcttct cggtctgctc 600
acttccccga ttttgacaaa atttgacatc tacaaaatat cgatcctcgt atttattgcg 660
tttagtgcaa ccacaccatg ggactcatgg atcatcagaa atggcgcatg gacatatcca 720
tcagcggaga gtggccaagg cgtgtttgga acgtttctag atgttccata tgaagagtac 780
gctttctttg tcattcaaac cgtaatcacc ggcttggtct acgtcttggc aactaggcac 840
cttctcccat ctctcgcgct tcccaagact agatcgtccg ccctttctct cgcgctcaag 900
gcgctcatcc ctctgcccat tatctaccta tttaccgctc accccagccc atcgcccgac 960
ccgctcgtga cagatcacta cttctacatg cgggcactct ccttactcat caccccacct 1020
accatgctct tggcagcatt atcaggcgaa tatgctttcg attggaaaag tggccgagca 1080
aagtcaacta ttgcagcaat catgatcccg acggtgtatc tgatttgggt agattatgtt 1140
gctgtcggtc aagactcttg gtcgatcaac gatgagaaga ttgtagggtg gaggcttgga 1200
ggtgtactac ccattgagga agctatgttc ttcttactga cgaatctaat gattgttctg 1260
ggtctgtctg cctgcgatca tactcaggcc ctatacctgc tacacggtcg aactatttat 1320
ggcaacaaaa agatgccatc ttcatttccc ctcattacac cgcctgtgct ctccctgttt 1380
tttagcagcc gaccatactc ttctcagcca aaacgtgact tggaactggc agtcaagttg 1440
ttggaggaaa agagccggag cttttttgtt gcctcggctg gatttcctag cgaagttagg 1500
gagaggctgg ttggactata cgcattctgc cgggtgactg atgatcttat cgactctcct 1560
gaagtatctt ccaacccgca tgccacaatt gacatggtct ccgattttct taccctacta 1620
tttgggcccc cgctacaccc ttcgcaacct gacaagatcc tttcttcgcc tttacttcct 1680
ccttcgcacc cttcccgacc cacgggaatg tatcccctcc cgcctcctcc ttcgctctcg 1740
cctgccgagc tcgttcaatt ccttaccgaa agggttcccg ttcaatacca tttcgccttc 1800
aggttgctcg ctaagttgca agggctgatc cctcgatacc cactcgacga actccttaga 1860
ggatacacca ctgatcttat ctttccttta tcgacagagg cagtccaggc tcggaagacg 1920
cctatcgaga ccacagctga cttgctggac tatggtctat gtgtagcagg ctcagtcgcc 1980
gagctattgg tctatgtctc ttgggcaagt gcaccaagtc aggtccctgc caccatagaa 2040
gaaagagaag ctgtgttagt ggcaagccga gagatgggaa ctgcccttca gttggtgaac 2100
attgctaggg acattaaagg ggacgcaaca gaagggagat tttacctacc actctcattc 2160
tttggtcttc gggatgaatc aaagcttgcg atcccgactg attggacgga acctcggcct 2220
caagatttcg acaaactcct cagtctatct ccttcgtcca cattaccatc ttcaaacgcc 2280
tcagaaagct tccggttcga atggaagacg tactcgcttc cattagtcgc ctacgcagag 2340
gatcttgcca aacattctta taagggaatt gaccgacttc ctaccgaggt tcaagcggga 2400
atgcgagcgg cttgcgcgag ctacctactg atcggccgag agatcaaagt cgtttggaaa 2460
ggagacgtcg gagagagaag gacagttgcc ggatggagga gagtacggaa agtcttgagt 2520
gtggtcatga gcggatggga agggcagtaa ctcgagtcat gtaattagtt atgtcacgct 2580
tacattcacg ccctcccccc acatccgctc taaccgaaaa ggaaggagtt agacaacctg 2640
aagtctaggt ccctatttat ttttttatag ttatgttagt attaagaacg ttatttatat 2700
ttcaaatttt tctttttttt ctgtacagac gcgtgtacgc atgtaacatt atactgaaaa 2760
ccttgcttga gaaggttttg ggacgctcga aggctttaat ttgcggcgcg cggaggccct 2820
ttcgtcttca 2830
<210> 16
<211> 2555
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-crtI-CYC1t
<400> 16
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gggaaaagaa 540
caagatcagg ataaacccac agctatcatc gtgggatgtg gtatcggtgg aatcgccact 600
gccgctcgtc ttgctaaaga aggtttccag gtcacggtgt tcgagaagaa cgactactcc 660
ggaggtcgat gctctttaat cgagcgagat ggttatcgat tcgatcaggg gcccagtttg 720
ctgctcttgc cagatctctt caagcagaca ttcgaagatt tgggagagaa gatggaagat 780
tgggtcgatc tcatcaagtg tgaacccaac tatgtttgcc acttccacga tgaagagact 840
ttcactcttt caaccgacat ggcgttgctc aagcgggaag tcgagcgttt tgaaggcaaa 900
gatggatttg atcggttctt gtcgtttatc caagaagccc acagacatta cgagcttgct 960
gtcgttcacg tcctgcagaa gaacttccct ggcttcgcag cattcttacg gctacagttc 1020
attggccaaa tcctggctct tcaccccttc gagtctatct ggacaagagt ttgtcgatat 1080
ttcaagaccg acagattacg aagagtcttc tcgtttgcag tgatgtacat gggtcaaagc 1140
ccatacagtg cgcccggaac atattccttg ctccaataca ccgaattgac cgagggcatc 1200
tggtatccga gaggaggctt ttggcaggtt cctaatactc ttcttcagat cgtcaagcgc 1260
aacaatccct cagccaagtt caatttcaac gctccagttt cccaggttct tctctctcct 1320
gccaaggacc gagcgactgg tgttcgactt gaatccggcg aggaacatca cgccgatgtt 1380
gtgattgtca atgctgacct cgtttacgcc tccgagcact tgattcctga cgatgccaga 1440
aacaagattg gccaactggg tgaagtcaag agaagttggt gggctgactt agttggtgga 1500
aagaagctca agggaagttg cagtagtttg agcttctact ggagcatgga ccgaatcgtg 1560
gacggtctgg gcggacacaa tatcttcttg gccgaggact tcaagggatc attcgacaca 1620
atcttcgagg agttgggtct cccagccgat ccttcctttt acgtgaacgt tccctcgcga 1680
atcgatcctt ctgccgctcc cgaaggcaaa gatgctatcg tcattcttgt gccgtgtggc 1740
catatcgacg cttcgaaccc tcaagattac aacaagcttg ttgctcgggc aaggaagttt 1800
gtgatccaca cgctttccgc caagcttgga cttcccgact ttgaaaaaat gattgtggca 1860
gagaaggttc acgatgctcc ctcttgggag aaagaattca acctcaagga cggaagcatc 1920
ttgggactgg ctcacaactt tatgcaagtt cttggtttca ggccgagcac cagacatccc 1980
aagtatgaca agttgttctt tgtcggggct tcgactcatc ccggaactgg ggttcccatc 2040
gtcttggctg gagccaagtt aactgccaac caagttctcg aatcctttga ccgatcccca 2100
gctccagatc ccaatatgtc actctccgta ccatatggaa aacctctcaa atcaaatgga 2160
acgggtatcg attctcaggt ccagctgaag ttcatggatt tggagagatg ggtatacctt 2220
ttggtattgt tgattggggc cgtgatcgct cgatccgttg gtgttcttgc tttctgactc 2280
gagtcatgta attagttatg tcacgcttac attcacgccc tccccccaca tccgctctaa 2340
ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta 2400
tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg tacagacgcg 2460
tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga cgctcgaagg 2520
ctttaatttg ccggccgcga cgagtatctg tctga 2555
<210> 17
<211> 1533
<212> DNA
<213> Artificial Sequence
<220>
<223> Y. lipolytica URA3
<400> 17
tgcctcctgt ctgactcgtc attgccgcct ttggagtacg actccaacta tgagtgtgct 60
tggatcactt tgacgataca ttcttcgttg gaggctgtgg gtctgacagc tgcgttttcg 120
gcgcggttgg ccgacaacaa tatcagctgc aacgtcattg ctggctttca tcatgatcac 180
atttttgtcg gcaaaggcga cgcccagaga gccattgacg ttctttctaa tttggaccga 240
tagccgtata gtccagtcta tctataagtt caactaactc gtaactatta ccataacata 300
tacttcactg ccccagataa ggttccgata aaaagttctg cagactaaat ttatttcagt 360
ctcctcttca ccaccaaaat gccctcctac gaagctcgag ctaacgtcca caagtccgcc 420
tttgccgctc gagtgctcaa gctcgtggca gccaagaaaa ccaacctgtg tgcttctctg 480
gatgttacca ccaccaagga gctcattgag cttgccgata aggtcggacc ttatgtgtgc 540
atgatcaaga cccatatcga catcattgac gacttcacct acgccggcac tgtgctcccc 600
ctcaaggaac ttgctcttaa gcacggtttc ttcctgttcg aggacagaaa gttcgcagat 660
attggcaaca ctgtcaagca ccagtacaag aacggtgtct accgaatcgc cgagtggtcc 720
gatatcacca acgcccacgg tgtacccgga accggaatca ttgctggcct gcgagctggt 780
gccgaggaaa ctgtctctga acagaagaag gaggacgtct ctgactacga gaactcccag 840
tacaaggagt tcctggtccc ctctcccaac gagaagctgg ccagaggtct gctcatgctg 900
gccgagctgt cttgcaaggg ctctctggcc actggcgagt actccaagca gaccattgag 960
cttgcccgat ccgaccccga gtttgtggtt ggcttcattg cccagaaccg acctaagggc 1020
gactctgagg actggcttat tctgaccccc ggggtgggtc ttgacgacaa gggagacgct 1080
ctcggacagc agtaccgaac tgttgaggat gtcatgtcta ccggaacgga tatcataatt 1140
gtcggccgag gtctgtacgg ccagaaccga gatcctattg aggaggccaa gcgataccag 1200
aaggctggct gggaggctta ccagaagatt aactgttaga ggttagacta tggatatgtc 1260
atttaactgt gtatatagag agcgtgcaag tatggagcgc ttgttcagct tgtatgatgg 1320
tcagacgacc tgtctgatcg agtatgtatg atactgcaca acctgtgtat ccgcatgatc 1380
tgtccaatgg ggcatgttgt tgtgtttctc gatacggaga tgctgggtac aagtagctaa 1440
tacgattgaa ctacttatac ttatatgagg cttgaagaaa gctgacttgt gtatgactta 1500
ttctcaacta catccccagt cacaatacca cca 1533
<210> 18
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm1-F
<400> 18
gtgcgcttct ctcgtctcgg taaccctgtc 30
<210> 19
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm1-R
<400> 19
atgcgccgcc aacccggtct ctggggtgtg gtggatgggg tgtg 44
<210> 20
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-crtYB-CYC1t-F
<400> 20
cacaccccat ccaccacacc ccagagaccg ggttggcggc gcat 44
<210> 21
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-crtYB-CYC1t-R
<400> 21
cgccgccaac ccggtctctt gaagacgaaa gggcctccg 39
<210> 22
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-crtI-CYC1t-F
<400> 22
cggaggccct ttcgtcttca agagaccggg ttggcggcg 39
<210> 23
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-crtI-CYC1t-R
<400> 23
gacgagtcag acaggaggca tcagacagat actcgtcgcg 40
<210> 24
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Repeat-URA3-F
<400> 24
cgcgacgagt atctgtctga tgcctcctgt ctgactcgtc 40
<210> 25
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Repeat-URA3-R
<400> 25
atgacgagtc agacaggagg catggtggta ttgtgactgg ggat 44
<210> 26
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Repeat-F
<400> 26
atccccagtc acaataccac catgcctcct gtctgactcg tcat 44
<210> 27
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Repeat-R
<400> 27
cggcgtcctt ctcgtagtcc gcttttggtg gtgaagagga gact 44
<210> 28
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm1-F
<400> 28
agtctcctct tcaccaccaa aagcggacta cgagaaggac gccg 44
<210> 29
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm1-R
<400> 29
ccactcgtca ccaacagtgc cgtgtgttgc 30
<210> 30
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> MHY1-CF
<400> 30
tcgtacgtct ataccaacag atgg 24
<210> 31
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> MHY1-CR
<400> 31
cgcatacaca cacactgccg gggg 24
<210> 32
<211> 550
<212> DNA
<213> Artificial Sequence
<220>
<223> HMGR native promoter region
<400> 32
tccacacgtc gttctttttt ccttagcctt ttttgcagtg cgcgtgtccc aaaccccagc 60
tctacacacc agcacaaaca aagttaagct cagggttgtc gttgaggtcg cttactgtag 120
tcagtgctcg tatggttcgt tcaattttcg ccaaaaatcg ttttgccttt gtatcttggg 180
aataacatca actgtggttc ttcaacaggc ctaaggaacg aaacaagccg gaccaagatc 240
aggttcaagg tgagtactga gaaggaatag aaggcctaaa ggcgcaaacc gacaggtggc 300
aacagctcca caccgaccac gaaggccacg aaatcaaggg gtcctaaagt tagtctttgt 360
ggcctcgacg gtcagcgaaa acgcgagacc acaacgcgat cagaaccagg acctaaacaa 420
cacaggacgg ggtcacaata ggcttgaaca gcaagtacaa gctgtgatct ctctatattt 480
gattctcaaa ccacccctga ctacttcagc gcctctgtga cacagccccc ctatcatccg 540
actaacacag 550
<210> 33
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm2-F
<400> 33
gacaatgcct cgaggaggtt taaaagtaac t 31
<210> 34
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Left arm2-R
<400> 34
gcgccgccaa cccggtctct ctgtgttagt cggatgatag g 41
<210> 35
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-F
<400> 35
cctatcatcc gactaacaca gagagaccgg gttggcggcg c 41
<210> 36
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-R
<400> 36
gacgagtcag acaggaggca ctgcggttag tactgcaaaa ag 42
<210> 37
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> URA3-F
<400> 37
ctttttgcag tactaaccgc agtgcctcct gtctgactcg tc 42
<210> 38
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> URA3-R
<400> 38
atgcgccgcc aacccggtct cttggtggta ttgtgactgg ggat 44
<210> 39
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Repeat-F
<400> 39
atccccagtc acaataccac caagagaccg ggttggcggc gcat 44
<210> 40
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Repeat-R
<400> 40
ctttccaata gctgcttgta gctgcggtta gtactgcaaa a 41
<210> 41
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm2-F
<400> 41
ttttgcagta ctaaccgcag ctacaagcag ctattggaaa g 41
<210> 42
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Right arm2-R
<400> 42
gcttaatgtg attgatctca aacttgatag 30
<210> 43
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> HMGR-CF
<400> 43
gctgtctctg cgagagcacg tcga 24
<210> 44
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> HMGR-CR
<400> 44
ggttcgcaca acttctcggg tggc 24
<210> 45
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> BCO-sq1
<400> 45
cttctgagta taagaatcat tcaa 24
<210> 46
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> BCO-sq2
<400> 46
tttgaaatat aaataacgtt ctta 24
Claims (15)
- 서열번호 1의 아미노산 서열의 N-말단으로부터 43번 위치에 상응하는 아미노산이 발린, 58번 위치에 상응하는 아미노산이 글루타민, 및 74번 위치에 상응하는 아미노산이 발린으로 치환된, 베타-카로틴 15,15'-옥시게네이즈 변이체.
- 삭제
- 삭제
- 삭제
- 제1항의 변이체를 코딩하는 폴리뉴클레오티드.
- 제1항의 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하는, 미생물.
- 제6항에 있어서, 상기 미생물은 레티노이드 생산능을 갖는 것인, 미생물.
- 제7항에 있어서, 상기 레티노이드는 레티날, 레티놀, 레티닐 에스터, 및 레티노산으로 구성되는 군에서 선택되는 어느 하나 이상인, 미생물.
- 제6항에 있어서, 상기 미생물은 야로위아 속(Yarrowia sp.)인, 미생물.
- 제6항에 있어서, 상기 미생물은 야로위아 리폴리티카 (Yarrowia lipolytica) 인, 미생물.
- 제1항의 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 미생물을 배지에서 배양하는 단계를 포함하는, 레티노이드 생산방법.
- 제11항에 있어서, 상기 방법은 상기 배지 또는 미생물로부터 레티노이드를 회수하는 단계를 추가로 포함하는 레티노이드 생산방법.
- 제11항에 있어서, 상기 미생물은 야로위아 속(Yarrowia sp.)인, 레티노이드 생산방법.
- 제11항에 있어서, 상기 레티노이드는 레티날, 레티놀, 레티닐 에스터, 및 레티노산으로 구성되는 군에서 선택되는 어느 하나 이상인, 레티노이드 생산방법.
- 제1항의 변이체, 제6항의 미생물, 또는 상기 미생물의 배양물을 포함하는 레티노이드 생산용 조성물.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210093034A KR102611977B1 (ko) | 2021-07-15 | 2021-07-15 | 신규한 베타-카로틴 15,15 -옥시게네이즈 변이체 및 이를 이용한 레티노이드 생산방법 |
AU2022312354A AU2022312354A1 (en) | 2021-07-15 | 2022-07-15 | Novel beta-carotene 15,15-oxygenase variant and retinoid production method using same |
CA3225924A CA3225924A1 (en) | 2021-07-15 | 2022-07-15 | Novel beta-carotene 15,15-oxygenase variant and retinoid production method using same |
PCT/KR2022/010385 WO2023287256A1 (ko) | 2021-07-15 | 2022-07-15 | 신규한 베타-카로틴 15,15 -옥시게네이즈 변이체 및 이를 이용한 레티노이드 생산방법 |
EP22842518.7A EP4361259A1 (en) | 2021-07-15 | 2022-07-15 | Novel beta-carotene 15,15-oxygenase variant and retinoid production method using same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210093034A KR102611977B1 (ko) | 2021-07-15 | 2021-07-15 | 신규한 베타-카로틴 15,15 -옥시게네이즈 변이체 및 이를 이용한 레티노이드 생산방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230012324A KR20230012324A (ko) | 2023-01-26 |
KR102611977B1 true KR102611977B1 (ko) | 2023-12-08 |
Family
ID=84919557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210093034A KR102611977B1 (ko) | 2021-07-15 | 2021-07-15 | 신규한 베타-카로틴 15,15 -옥시게네이즈 변이체 및 이를 이용한 레티노이드 생산방법 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP4361259A1 (ko) |
KR (1) | KR102611977B1 (ko) |
AU (1) | AU2022312354A1 (ko) |
CA (1) | CA3225924A1 (ko) |
WO (1) | WO2023287256A1 (ko) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100620092B1 (ko) | 2004-12-16 | 2006-09-08 | 씨제이 주식회사 | 코리네박테리움 속 세포로부터 유래된 신규한 프로모터서열, 그를 포함하는 발현 카세트 및 벡터, 상기 벡터를포함하는 숙주 세포 및 그를 이용하여 유전자를 발현하는방법 |
KR101632642B1 (ko) | 2015-01-29 | 2016-06-22 | 씨제이제일제당 주식회사 | 신규한 프로모터 및 그의 용도 |
ES2907694T3 (es) | 2016-08-31 | 2022-04-26 | Cj Cheiljedang Corp | Nuevo promotor y uso del mismo |
WO2019058000A1 (en) * | 2017-09-25 | 2019-03-28 | Dsm Ip Assets B.V. | BIOSYNTHESIS OF RETINOIDS |
EP3687488A1 (en) | 2017-09-25 | 2020-08-05 | DSM IP Assets B.V. | Production of trans-retinal |
KR102202606B1 (ko) * | 2018-11-30 | 2021-01-15 | (주)바이오스플래시 | 바이오레티놀을 생산하는 미생물 및 이를 이용한 바이오레티놀의 생산방법 |
EP3999634A1 (en) * | 2019-07-16 | 2022-05-25 | DSM IP Assets B.V. | Novel beta-carotene oxidases |
KR102278000B1 (ko) | 2020-03-17 | 2021-07-15 | 씨제이제일제당 주식회사 | 프리페네이트 디하이드라타아제 활성 강화를 통한 l-트립토판을 생산하는 방법 |
-
2021
- 2021-07-15 KR KR1020210093034A patent/KR102611977B1/ko active IP Right Grant
-
2022
- 2022-07-15 CA CA3225924A patent/CA3225924A1/en active Pending
- 2022-07-15 AU AU2022312354A patent/AU2022312354A1/en active Pending
- 2022-07-15 EP EP22842518.7A patent/EP4361259A1/en active Pending
- 2022-07-15 WO PCT/KR2022/010385 patent/WO2023287256A1/ko active Application Filing
Non-Patent Citations (2)
Title |
---|
Biotechnology Letters, 2010, 32권, p957-961 |
NCBI, GenBank accession no. Q4PNI0.1, Beta-carotene 15,15`-dioxygenase (2020.12.02.) |
Also Published As
Publication number | Publication date |
---|---|
KR20230012324A (ko) | 2023-01-26 |
WO2023287256A1 (ko) | 2023-01-19 |
AU2022312354A1 (en) | 2024-02-22 |
CA3225924A1 (en) | 2023-01-19 |
EP4361259A1 (en) | 2024-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102284730B1 (ko) | 신규한 수용성 피리딘 뉴클레오티드 트랜스수소효소 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR102277407B1 (ko) | 신규한 글루타메이트 합성 효소 서브 유니트 알파 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
KR102274484B1 (ko) | 신규한 f0f1 atp 합성효소 서브유닛 알파 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102267931B1 (ko) | 신규한 5-(카르복시아미노)이미다졸리보뉴클레오티드합성효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102284731B1 (ko) | 신규한 아이소시트르산 디하이드로게네이즈 키나아제/포스파타제 효소 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR102277408B1 (ko) | 신규한 포르메이트 의존성 포스포리보실글리신아미드 포밀 전이효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102287112B1 (ko) | 신규한 쿠퍼익스포팅 P-type 에이티피에이즈 A 변이체 및 이를 이용한 L-트립토판 생산 방법 | |
KR102273638B1 (ko) | 신규한 포스포글리세린산 디하이드로게나제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102277409B1 (ko) | 신규한 2중기능성 포스포리보실아미노이미다졸카르복사미드 포밀트랜스퍼라아제/imp 사이클로하이드롤라아제 변이체 및 이를 이용한 imp 생산 방법 | |
KR102273639B1 (ko) | 신규한 이중기능성 메틸렌테트라히드로폴레이트 탈수소효소/메테닐테트라하이드로폴레이트 사이클로하이드롤라아제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102273640B1 (ko) | 신규한 f0f1 atp 합성효소 서브유닛 감마 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102611977B1 (ko) | 신규한 베타-카로틴 15,15 -옥시게네이즈 변이체 및 이를 이용한 레티노이드 생산방법 | |
KR102284725B1 (ko) | 신규한 페로체라테이즈 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR102287111B1 (ko) | 신규한 데옥시구아노신트리포스페이트 트리포스포하이드로레이즈 변이체 및 이를 이용한 l-트립토판 생산 방법 | |
KR102600520B1 (ko) | 제라닐제라닐 피로포스페이트 신타아제 변이체 및 이를 이용한 테트라테르펜, 이의 전구체, 및 테트라테르펜을 전구체로 하는 물질의 생산방법 | |
RU2793368C1 (ru) | Новый вариант регулятора транскрипции и способ получения L-валина с его применением | |
RU2792640C1 (ru) | Новый вариант глицеральдегид-3-фосфатдегидрогеназы и способ получения l-валина с его применением | |
RU2794484C1 (ru) | Новый вариант dahp синтазы и способ получения l-лизина с его применением | |
RU2793436C1 (ru) | Новый вариант сахарофосфат-изомеразы/эпимеразы и способ получения l-лизина с его применением | |
KR102281371B1 (ko) | 신규한 글리세르알데히드-3-인산탈수소효소 변이체 및 이를 이용한 l-발린 생산 방법 | |
RU2794279C1 (ru) | Новый вариант 2-изопропилмалатсинтазы и способ получения L-валина с его применением | |
KR102279137B1 (ko) | 신규한 아데닌 포스포리보실기 전이효소 변이체 및 이를 이용한 imp 생산 방법 | |
RU2793438C1 (ru) | Новый вариант микотионредуктазы и способ получения l-лизина с его применением | |
KR102281370B1 (ko) | 신규한 2-이소프로필말레이트합성효소 변이체 및 이를 이용한 l-발린 생산 방법 | |
RU2795162C1 (ru) | Новый вариант регулятора транскрипции WHCA семейства WHIB и способ получения L-валина с его применением |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |