KR20230138333A - 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법 - Google Patents
헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법 Download PDFInfo
- Publication number
- KR20230138333A KR20230138333A KR1020220036258A KR20220036258A KR20230138333A KR 20230138333 A KR20230138333 A KR 20230138333A KR 1020220036258 A KR1020220036258 A KR 1020220036258A KR 20220036258 A KR20220036258 A KR 20220036258A KR 20230138333 A KR20230138333 A KR 20230138333A
- Authority
- KR
- South Korea
- Prior art keywords
- microorganism
- seq
- dna
- yarrowia
- cassette
- Prior art date
Links
- 244000005700 microbiome Species 0.000 title claims abstract description 116
- 235000021466 carotenoid Nutrition 0.000 title claims abstract description 68
- 150000001747 carotenoids Chemical class 0.000 title claims abstract description 68
- 102100039291 Geranylgeranyl pyrophosphate synthase Human genes 0.000 title claims abstract description 61
- 239000002243 precursor Substances 0.000 title claims abstract description 51
- 108010066605 Geranylgeranyl-Diphosphate Geranylgeranyltransferase Proteins 0.000 title claims abstract description 41
- 241000168517 Haematococcus lacustris Species 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims description 27
- 150000001875 compounds Chemical class 0.000 title description 3
- 241000235013 Yarrowia Species 0.000 claims abstract description 49
- 238000004519 manufacturing process Methods 0.000 claims abstract description 48
- 239000000463 material Substances 0.000 claims abstract description 11
- 239000000203 mixture Substances 0.000 claims abstract description 7
- 108091033319 polynucleotide Proteins 0.000 claims description 82
- 102000040430 polynucleotide Human genes 0.000 claims description 82
- 239000002157 polynucleotide Substances 0.000 claims description 82
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 claims description 45
- 239000000126 substance Substances 0.000 claims description 41
- OENHQHLEOONYIE-UKMVMLAPSA-N all-trans beta-carotene Natural products CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C OENHQHLEOONYIE-UKMVMLAPSA-N 0.000 claims description 33
- 235000013734 beta-carotene Nutrition 0.000 claims description 33
- 239000011648 beta-carotene Substances 0.000 claims description 33
- TUPZEYHYWIEDIH-WAIFQNFQSA-N beta-carotene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2=CCCCC2(C)C TUPZEYHYWIEDIH-WAIFQNFQSA-N 0.000 claims description 33
- 229960002747 betacarotene Drugs 0.000 claims description 33
- OENHQHLEOONYIE-JLTXGRSLSA-N β-Carotene Chemical compound CC=1CCCC(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C OENHQHLEOONYIE-JLTXGRSLSA-N 0.000 claims description 33
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 claims description 24
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 22
- 229960003471 retinol Drugs 0.000 claims description 21
- 235000020944 retinol Nutrition 0.000 claims description 21
- 239000011607 retinol Substances 0.000 claims description 21
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 claims description 15
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 claims description 15
- 229940031439 squalene Drugs 0.000 claims description 15
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 claims description 15
- 150000004492 retinoid derivatives Chemical group 0.000 claims description 9
- 238000012258 culturing Methods 0.000 claims description 8
- 239000006227 byproduct Substances 0.000 claims description 7
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- YYGNTYWPHWGJRM-AAJYLUCBSA-N squalene group Chemical group CC(C)=CCC\C(\C)=C\CC\C(\C)=C\CC\C=C(/C)\CC\C=C(/C)\CCC=C(C)C YYGNTYWPHWGJRM-AAJYLUCBSA-N 0.000 claims 1
- 108020004414 DNA Proteins 0.000 description 122
- 238000003780 insertion Methods 0.000 description 100
- 230000037431 insertion Effects 0.000 description 100
- 239000013615 primer Substances 0.000 description 95
- 239000002987 primer (paints) Substances 0.000 description 95
- 229920001184 polypeptide Polymers 0.000 description 70
- 108090000765 processed proteins & peptides Proteins 0.000 description 70
- 102000004196 processed proteins & peptides Human genes 0.000 description 70
- 108090000623 proteins and genes Proteins 0.000 description 66
- 230000000694 effects Effects 0.000 description 54
- 150000001413 amino acids Chemical group 0.000 description 35
- 101150080339 BTS1 gene Proteins 0.000 description 31
- 239000002609 medium Substances 0.000 description 30
- 101000895629 Synechococcus sp. (strain ATCC 27264 / PCC 7002 / PR-6) Geranylgeranyl pyrophosphate synthase Proteins 0.000 description 29
- 101150077059 TPS1 gene Proteins 0.000 description 28
- 101150114010 ggs1 gene Proteins 0.000 description 28
- 101000888406 Homo sapiens Geranylgeranyl pyrophosphate synthase Proteins 0.000 description 27
- 102000004169 proteins and genes Human genes 0.000 description 25
- 210000004027 cell Anatomy 0.000 description 24
- 101150050575 URA3 gene Proteins 0.000 description 22
- 239000007787 solid Substances 0.000 description 21
- 239000013598 vector Substances 0.000 description 21
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 20
- 210000000349 chromosome Anatomy 0.000 description 19
- 230000014509 gene expression Effects 0.000 description 19
- 239000003550 marker Substances 0.000 description 19
- 108020004705 Codon Proteins 0.000 description 18
- 230000001965 increasing effect Effects 0.000 description 18
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 17
- 102000004286 Hydroxymethylglutaryl CoA Reductases Human genes 0.000 description 16
- 108090000895 Hydroxymethylglutaryl CoA Reductases Proteins 0.000 description 16
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 15
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 10
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 10
- 229940035893 uracil Drugs 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 9
- 101100061456 Streptomyces griseus crtB gene Proteins 0.000 description 8
- 101150011633 crtI gene Proteins 0.000 description 8
- 239000002773 nucleotide Substances 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 7
- 101100127715 Phaffia rhodozyma crtYB gene Proteins 0.000 description 7
- 238000000137 annealing Methods 0.000 description 7
- 238000004925 denaturation Methods 0.000 description 7
- 230000036425 denaturation Effects 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 238000007857 nested PCR Methods 0.000 description 7
- 238000006116 polymerization reaction Methods 0.000 description 7
- 230000035939 shock Effects 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 101710173432 Phytoene synthase Proteins 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 108060004506 lycopene beta-cyclase Proteins 0.000 description 6
- 108060004507 lycopene cyclase Proteins 0.000 description 6
- 108010001545 phytoene dehydrogenase Proteins 0.000 description 6
- 108010007508 Farnesyltranstransferase Proteins 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- NCYCYZXNIZJOKI-UHFFFAOYSA-N vitamin A aldehyde Natural products O=CC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-UHFFFAOYSA-N 0.000 description 5
- OINNEUNVOZHBOX-QIRCYJPOSA-K 2-trans,6-trans,10-trans-geranylgeranyl diphosphate(3-) Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C\COP([O-])(=O)OP([O-])([O-])=O OINNEUNVOZHBOX-QIRCYJPOSA-K 0.000 description 4
- 102100033195 DNA ligase 4 Human genes 0.000 description 4
- OINNEUNVOZHBOX-XBQSVVNOSA-N Geranylgeranyl diphosphate Natural products [P@](=O)(OP(=O)(O)O)(OC/C=C(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)O OINNEUNVOZHBOX-XBQSVVNOSA-N 0.000 description 4
- 101000927810 Homo sapiens DNA ligase 4 Proteins 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- 241000222057 Xanthophyllomyces dendrorhous Species 0.000 description 4
- 101100278191 Yarrowia lipolytica (strain CLIB 122 / E 150) LIG4 gene Proteins 0.000 description 4
- 238000013019 agitation Methods 0.000 description 4
- 229930002945 all-trans-retinaldehyde Natural products 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 235000020945 retinal Nutrition 0.000 description 4
- 239000011604 retinal Substances 0.000 description 4
- 230000002207 retinal effect Effects 0.000 description 4
- NCYCYZXNIZJOKI-OVSJKPMPSA-N retinal group Chemical group C\C(=C/C=O)\C=C\C=C(\C=C\C1=C(CCCC1(C)C)C)/C NCYCYZXNIZJOKI-OVSJKPMPSA-N 0.000 description 4
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108090000417 Oxygenases Proteins 0.000 description 3
- 102000004020 Oxygenases Human genes 0.000 description 3
- 101100114901 Streptomyces griseus crtI gene Proteins 0.000 description 3
- FPIPGXGPPPQFEQ-BOOMUCAASA-N Vitamin A Natural products OC/C=C(/C)\C=C\C=C(\C)/C=C/C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-BOOMUCAASA-N 0.000 description 3
- 101100449751 Zymoseptoria tritici (strain CBS 115943 / IPO323) GGS1 gene Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- 101150000046 crtE gene Proteins 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- KBPHJBAIARWVSC-XQIHNALSSA-N trans-lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C KBPHJBAIARWVSC-XQIHNALSSA-N 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 235000019155 vitamin A Nutrition 0.000 description 3
- 239000011719 vitamin A Substances 0.000 description 3
- 229940045997 vitamin a Drugs 0.000 description 3
- ATCICVFRSJQYDV-UHFFFAOYSA-N (6E,8E,10E,12E,14E,16E,18E,20E,22E,26E)-2,6,10,14,19,23,27,31-octamethyldotriaconta-2,6,8,10,12,14,16,18,20,22,26,30-dodecaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CC=CC(C)=CC=CC=C(C)C=CC=C(C)C=CC=C(C)CCC=C(C)C ATCICVFRSJQYDV-UHFFFAOYSA-N 0.000 description 2
- YVLPJIGOMTXXLP-UHFFFAOYSA-N 15-cis-phytoene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CC=CC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)C YVLPJIGOMTXXLP-UHFFFAOYSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 241000023308 Acca Species 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 101150079432 GGPPS1 gene Proteins 0.000 description 2
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 2
- UPYKUZBSLRQECL-UKMVMLAPSA-N Lycopene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1C(=C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=C)CCCC2(C)C UPYKUZBSLRQECL-UKMVMLAPSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- ANVAOWXLWRTKGA-XHGAXZNDSA-N all-trans-alpha-carotene Chemical compound CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1C(C)=CCCC1(C)C ANVAOWXLWRTKGA-XHGAXZNDSA-N 0.000 description 2
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 2
- FDSDTBUPSURDBL-LOFNIBRQSA-N canthaxanthin Chemical compound CC=1C(=O)CCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C(=O)CCC1(C)C FDSDTBUPSURDBL-LOFNIBRQSA-N 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000008121 dextrose Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 101150068630 ggpS gene Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 2
- 229960005375 lutein Drugs 0.000 description 2
- KBPHJBAIARWVSC-RGZFRNHPSA-N lutein Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\[C@H]1C(C)=C[C@H](O)CC1(C)C KBPHJBAIARWVSC-RGZFRNHPSA-N 0.000 description 2
- 239000012913 medium supplement Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- CBIDRCWHNCKSTO-UHFFFAOYSA-N prenyl diphosphate Chemical compound CC(C)=CCO[P@](O)(=O)OP(O)(O)=O CBIDRCWHNCKSTO-UHFFFAOYSA-N 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 229930002330 retinoic acid Natural products 0.000 description 2
- WWDMJSSVVPXVSV-YCNIQYBTSA-N retinyl ester Chemical compound CC1CCCC(C)(C)C1\C=C\C(\C)=C\C=C\C(\C)=C\C(O)=O WWDMJSSVVPXVSV-YCNIQYBTSA-N 0.000 description 2
- 230000037432 silent mutation Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229960001727 tretinoin Drugs 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 241000324730 uncultured marine bacterium 66A03 Species 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- FJHBOVDFOQMZRV-XQIHNALSSA-N xanthophyll Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C=C(C)C(O)CC2(C)C FJHBOVDFOQMZRV-XQIHNALSSA-N 0.000 description 2
- JKQXZKUSFCKOGQ-JLGXGRJMSA-N (3R,3'R)-beta,beta-carotene-3,3'-diol Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C[C@@H](O)CC1(C)C JKQXZKUSFCKOGQ-JLGXGRJMSA-N 0.000 description 1
- VYIRVAXUEZSDNC-TXDLOWMYSA-N (3R,3'S,5'R)-3,3'-dihydroxy-beta-kappa-caroten-6'-one Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC(=O)[C@]1(C)C[C@@H](O)CC1(C)C VYIRVAXUEZSDNC-TXDLOWMYSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- YVLPJIGOMTXXLP-UUKUAVTLSA-N 15,15'-cis-Phytoene Natural products C(=C\C=C/C=C(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C)(\CC/C=C(\CC/C=C(\CC/C=C(\C)/C)/C)/C)/C YVLPJIGOMTXXLP-UUKUAVTLSA-N 0.000 description 1
- YVLPJIGOMTXXLP-BAHRDPFUSA-N 15Z-phytoene Natural products CC(=CCCC(=CCCC(=CCCC(=CC=C/C=C(C)/CCC=C(/C)CCC=C(/C)CCC=C(C)C)C)C)C)C YVLPJIGOMTXXLP-BAHRDPFUSA-N 0.000 description 1
- YLZOPXRUQYQQID-UHFFFAOYSA-N 3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-1-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]propan-1-one Chemical compound N1N=NC=2CN(CCC=21)CCC(=O)N1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F YLZOPXRUQYQQID-UHFFFAOYSA-N 0.000 description 1
- SEHFUALWMUWDKS-UHFFFAOYSA-N 5-fluoroorotic acid Chemical compound OC(=O)C=1NC(=O)NC(=O)C=1F SEHFUALWMUWDKS-UHFFFAOYSA-N 0.000 description 1
- 101150058502 Acaca gene Proteins 0.000 description 1
- 240000000073 Achillea millefolium Species 0.000 description 1
- 235000007754 Achillea millefolium Nutrition 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- UWQJHXKARZWDIJ-ZLUOBGJFSA-N Ala-Ala-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O UWQJHXKARZWDIJ-ZLUOBGJFSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- MAEQBGQTDWDSJQ-LSJOCFKGSA-N Ala-Met-His Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MAEQBGQTDWDSJQ-LSJOCFKGSA-N 0.000 description 1
- BFMIRJBURUXDRG-DLOVCJGASA-N Ala-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 BFMIRJBURUXDRG-DLOVCJGASA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 101100533902 Arabidopsis thaliana SPL13A gene Proteins 0.000 description 1
- 101100533904 Arabidopsis thaliana SPL13B gene Proteins 0.000 description 1
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 1
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 1
- JEBFVOLFMLUKLF-IFPLVEIFSA-N Astaxanthin Natural products CC(=C/C=C/C(=C/C=C/C1=C(C)C(=O)C(O)CC1(C)C)/C)C=CC=C(/C)C=CC=C(/C)C=CC2=C(C)C(=O)C(O)CC2(C)C JEBFVOLFMLUKLF-IFPLVEIFSA-N 0.000 description 1
- 101100455080 Bacillus subtilis (strain 168) lmrB gene Proteins 0.000 description 1
- HRQKOYFGHJYEFS-UHFFFAOYSA-N Beta psi-carotene Chemical compound CC(C)=CCCC(C)=CC=CC(C)=CC=CC(C)=CC=CC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C HRQKOYFGHJYEFS-UHFFFAOYSA-N 0.000 description 1
- 239000004322 Butylated hydroxytoluene Substances 0.000 description 1
- NLZUEZXRPGMBCV-UHFFFAOYSA-N Butylhydroxytoluene Chemical compound CC1=CC(C(C)(C)C)=C(O)C(C(C)(C)C)=C1 NLZUEZXRPGMBCV-UHFFFAOYSA-N 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- VYIRVAXUEZSDNC-LOFNIBRQSA-N Capsanthyn Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC(=O)C2(C)CC(O)CC2(C)C VYIRVAXUEZSDNC-LOFNIBRQSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101150032609 GGS gene Proteins 0.000 description 1
- 101100264215 Gallus gallus XRCC6 gene Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- GVVPGTZRZFNKDS-YFHOEESVSA-N Geranyl diphosphate Natural products CC(C)=CCC\C(C)=C/COP(O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-YFHOEESVSA-N 0.000 description 1
- 101710114973 Geranylgeranyl pyrophosphate synthase Proteins 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZTVGZOIBLRPQNR-KKUMJFAQSA-N Glu-Met-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZTVGZOIBLRPQNR-KKUMJFAQSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- ZALGPUWUVHOGAE-GVXVVHGQSA-N Glu-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZALGPUWUVHOGAE-GVXVVHGQSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 1
- 241000168525 Haematococcus Species 0.000 description 1
- AKAPKBNIVNPIPO-KKUMJFAQSA-N His-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 AKAPKBNIVNPIPO-KKUMJFAQSA-N 0.000 description 1
- FSOXZQBMPBQKGJ-QSFUFRPTSA-N His-Ile-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 FSOXZQBMPBQKGJ-QSFUFRPTSA-N 0.000 description 1
- TVMNTHXFRSXZGR-IHRRRGAJSA-N His-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O TVMNTHXFRSXZGR-IHRRRGAJSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- FVEWRQXNISSYFO-ZPFDUUQYSA-N Ile-Arg-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FVEWRQXNISSYFO-ZPFDUUQYSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 1
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- JEVVKJMRZMXFBT-XWDZUXABSA-N Lycophyll Natural products OC/C(=C/CC/C(=C\C=C\C(=C/C=C/C(=C\C=C\C=C(/C=C/C=C(\C=C\C=C(/CC/C=C(/CO)\C)\C)/C)\C)/C)\C)/C)/C JEVVKJMRZMXFBT-XWDZUXABSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- RAAVFTFEAUAVIY-DCAQKATOSA-N Met-Glu-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N RAAVFTFEAUAVIY-DCAQKATOSA-N 0.000 description 1
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- VWFHWJGVLVZVIS-QXEWZRGKSA-N Met-Val-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O VWFHWJGVLVZVIS-QXEWZRGKSA-N 0.000 description 1
- 101100107522 Mus musculus Slc1a5 gene Proteins 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 1
- ATCICVFRSJQYDV-DDRHJXQASA-N Neurosporene Natural products C(=C\C=C\C(=C/C=C/C=C(\C=C\C=C(/CC/C=C(\CC/C=C(\C)/C)/C)\C)/C)\C)(\C=C\C=C(/CC/C=C(\C)/C)\C)/C ATCICVFRSJQYDV-DDRHJXQASA-N 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 101100070556 Oryza sativa subsp. japonica HSFA4D gene Proteins 0.000 description 1
- 101100043227 Oryza sativa subsp. japonica SPL13 gene Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 1
- OOUTWVMJGMVRQF-DOYZGLONSA-N Phoenicoxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)C(=O)C(O)CC1(C)C)C=CC=C(/C)C=CC2=C(C)C(=O)CCC2(C)C OOUTWVMJGMVRQF-DOYZGLONSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 241001483078 Phyto Species 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- 101150099282 SPL7 gene Proteins 0.000 description 1
- 101100392393 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) BTS1 gene Proteins 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- XOTBWOCSLMBGMF-SUSMZKCASA-N Thr-Glu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOTBWOCSLMBGMF-SUSMZKCASA-N 0.000 description 1
- GRIUMVXCJDKVPI-IZPVPAKOSA-N Thr-Thr-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GRIUMVXCJDKVPI-IZPVPAKOSA-N 0.000 description 1
- GIOBXJSONRQHKQ-RYUDHWBXSA-N Tyr-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GIOBXJSONRQHKQ-RYUDHWBXSA-N 0.000 description 1
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 1
- XLDYBRXERHITNH-QSFUFRPTSA-N Val-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)C(C)C XLDYBRXERHITNH-QSFUFRPTSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- PYXQBKJPHNCTNW-CYDGBPFRSA-N Val-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N PYXQBKJPHNCTNW-CYDGBPFRSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 229930003316 Vitamin D Natural products 0.000 description 1
- QYSXJUFSXHHAJI-XFEUOLMDSA-N Vitamin D3 Natural products C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C/C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-XFEUOLMDSA-N 0.000 description 1
- 102100036976 X-ray repair cross-complementing protein 6 Human genes 0.000 description 1
- 241001000247 Xanthophyllomyces Species 0.000 description 1
- 101100342590 Yarrowia lipolytica (strain CLIB 122 / E 150) KU70 gene Proteins 0.000 description 1
- JKQXZKUSFCKOGQ-LQFQNGICSA-N Z-zeaxanthin Natural products C([C@H](O)CC=1C)C(C)(C)C=1C=CC(C)=CC=CC(C)=CC=CC=C(C)C=CC=C(C)C=CC1=C(C)C[C@@H](O)CC1(C)C JKQXZKUSFCKOGQ-LQFQNGICSA-N 0.000 description 1
- QOPRSMDTRDMBNK-RNUUUQFGSA-N Zeaxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCC(O)C1(C)C)C=CC=C(/C)C=CC2=C(C)CC(O)CC2(C)C QOPRSMDTRDMBNK-RNUUUQFGSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005377 adsorption chromatography Methods 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- JKQXZKUSFCKOGQ-LOFNIBRQSA-N all-trans-Zeaxanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2=C(C)CC(O)CC2(C)C JKQXZKUSFCKOGQ-LOFNIBRQSA-N 0.000 description 1
- 239000011795 alpha-carotene Substances 0.000 description 1
- 235000003903 alpha-carotene Nutrition 0.000 description 1
- ANVAOWXLWRTKGA-HLLMEWEMSA-N alpha-carotene Natural products C(=C\C=C\C=C(/C=C/C=C(\C=C\C=1C(C)(C)CCCC=1C)/C)\C)(\C=C\C=C(/C=C/[C@H]1C(C)=CCCC1(C)C)\C)/C ANVAOWXLWRTKGA-HLLMEWEMSA-N 0.000 description 1
- -1 and Yl Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 235000013793 astaxanthin Nutrition 0.000 description 1
- 239000001168 astaxanthin Substances 0.000 description 1
- MQZIGYBFDRPAKN-ZWAPEEGVSA-N astaxanthin Chemical compound C([C@H](O)C(=O)C=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C(=O)[C@@H](O)CC1(C)C MQZIGYBFDRPAKN-ZWAPEEGVSA-N 0.000 description 1
- 229940022405 astaxanthin Drugs 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 229940095259 butylated hydroxytoluene Drugs 0.000 description 1
- 235000010354 butylated hydroxytoluene Nutrition 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 235000012682 canthaxanthin Nutrition 0.000 description 1
- 239000001659 canthaxanthin Substances 0.000 description 1
- 229940008033 canthaxanthin Drugs 0.000 description 1
- 235000018889 capsanthin Nutrition 0.000 description 1
- WRANYHFEXGNSND-LOFNIBRQSA-N capsanthin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC(=O)C2(C)CCC(O)C2(C)C WRANYHFEXGNSND-LOFNIBRQSA-N 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 150000001746 carotenes Chemical class 0.000 description 1
- 235000005473 carotenes Nutrition 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- OVSVTCFNLSGAMM-KGBODLQUSA-N cis-phytofluene Natural products CC(=CCCC(=CCCC(=CCCC(=CC=C/C=C(C)/C=C/C=C(C)/CCC=C(/C)CCC=C(C)C)C)C)C)C OVSVTCFNLSGAMM-KGBODLQUSA-N 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 239000013601 cosmid vector Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000012055 fruits and vegetables Nutrition 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 239000011663 gamma-carotene Substances 0.000 description 1
- 235000000633 gamma-carotene Nutrition 0.000 description 1
- HRQKOYFGHJYEFS-RZWPOVEWSA-N gamma-carotene Natural products C(=C\C=C\C(=C/C=C/C=C(\C=C\C=C(/C=C/C=1C(C)(C)CCCC=1C)\C)/C)\C)(\C=C\C=C(/CC/C=C(\C)/C)\C)/C HRQKOYFGHJYEFS-RZWPOVEWSA-N 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000012637 gene transfection Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 108091022928 glucosylglycerol-phosphate synthase Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 101150085005 ku70 gene Proteins 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 235000012680 lutein Nutrition 0.000 description 1
- 239000001656 lutein Substances 0.000 description 1
- ORAKUVXRZWMARG-WZLJTJAWSA-N lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C ORAKUVXRZWMARG-WZLJTJAWSA-N 0.000 description 1
- 235000012661 lycopene Nutrition 0.000 description 1
- 239000001751 lycopene Substances 0.000 description 1
- 229960004999 lycopene Drugs 0.000 description 1
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 235000008665 neurosporene Nutrition 0.000 description 1
- 239000001688 paprika extract Substances 0.000 description 1
- 235000012658 paprika extract Nutrition 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 235000011765 phytoene Nutrition 0.000 description 1
- 235000002677 phytofluene Nutrition 0.000 description 1
- OVSVTCFNLSGAMM-UZFNGAIXSA-N phytofluene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC(C)=CC=C\C=C(/C)\C=C\C=C(C)CCC=C(C)CCC=C(C)C OVSVTCFNLSGAMM-UZFNGAIXSA-N 0.000 description 1
- ZYSFBWMZMDHGOJ-SGKBLAECSA-N phytofluene Natural products CC(=CCCC(=CCCC(=CCCC(=CC=C/C=C(C)/CCC=C(/C)C=CC=C(/C)CCC=C(C)C)C)C)C)C ZYSFBWMZMDHGOJ-SGKBLAECSA-N 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 150000003254 radicals Chemical class 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- GREHPZMOJNYZIO-QXBAZQDESA-N retinoyl coa Chemical compound C([C@@H]1[C@H]([C@@H](O)[C@@H](O1)N1C2=NC=NC(N)=C2N=C1)OP(O)(O)=O)OP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCSC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C GREHPZMOJNYZIO-QXBAZQDESA-N 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 208000017520 skin disease Diseases 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 239000003270 steroid hormone Substances 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 150000003535 tetraterpenes Chemical class 0.000 description 1
- 235000009657 tetraterpenes Nutrition 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- ZIUDAKDLOLDEGU-UHFFFAOYSA-N trans-Phytofluen Natural products CC(C)=CCCC(C)CCCC(C)CC=CC(C)=CC=CC=C(C)C=CCC(C)CCCC(C)CCC=C(C)C ZIUDAKDLOLDEGU-UHFFFAOYSA-N 0.000 description 1
- ZCIHMQAPACOQHT-ZGMPDRQDSA-N trans-isorenieratene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/c1c(C)ccc(C)c1C)C=CC=C(/C)C=Cc2c(C)ccc(C)c2C ZCIHMQAPACOQHT-ZGMPDRQDSA-N 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 229930195735 unsaturated hydrocarbon Natural products 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000019166 vitamin D Nutrition 0.000 description 1
- 239000011710 vitamin D Substances 0.000 description 1
- 150000003710 vitamin D derivatives Chemical class 0.000 description 1
- 229940046008 vitamin d Drugs 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 235000008210 xanthophylls Nutrition 0.000 description 1
- 101150062776 yccA gene Proteins 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
- 235000010930 zeaxanthin Nutrition 0.000 description 1
- 239000001775 zeaxanthin Substances 0.000 description 1
- 229940043269 zeaxanthin Drugs 0.000 description 1
- CPYIZQLXMGRKSW-UHFFFAOYSA-N zinc;iron(3+);oxygen(2-) Chemical compound [O-2].[O-2].[O-2].[O-2].[Fe+3].[Fe+3].[Zn+2] CPYIZQLXMGRKSW-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/14—Fungi; Culture media therefor
- C12N1/16—Yeasts; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P23/00—Preparation of compounds containing a cyclohexene ring having an unsaturated side chain containing at least ten carbon atoms bound by conjugated double bonds, e.g. carotenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01029—Geranylgeranyl diphosphate synthase (2.5.1.29)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Mycology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Botany (AREA)
- Virology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 출원은 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제(Geranylgeranyl pyrophosphate synthase)를 발현하는, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는 야로위아 속 미생물; 이를 이용한 카로티노이드 또는 이를 전구체로 하는 물질 생산방법; 카로티노이드 또는 이를 전구체로 하는 물질 생산용 조성물; 및 상기 야로위아 속 미생물 또는 이의 배양물의 카로티노이드 또는 이를 전구체로 하는 물질 생산 용도에 관한 것이다.
Description
본 출원은 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제(Geranylgeranyl pyrophosphate synthase)를 발현하는, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는 야로위아 속 미생물; 이를 이용한 카로티노이드 또는 이를 전구체로 하는 물질 생산방법; 카로티노이드 또는 이를 전구체로 하는 물질 생산용 조성물; 및 상기 야로위아 속 미생물 또는 이의 배양물의 카로티노이드 또는 이를 전구체로 하는 물질 생산 용도에 관한 것이다.
카로티노이드 및 레티노이드는 식물 및 동물에서 다양한 기능을 발휘함에 따라, 식품, 사료 등 다방면의 산업 분야에서 이용되고 있다. 그 중에서도 베타카로틴과 같은 카로티노이드는 자유라디칼 제거, 동물에서 비타민 A의 모체, 척추동물의 면역시스템 증강, 및 폐암 위험성 감소와 같은 기능이 보고된 물질이며, 레티노이드는 비타민 A인 레티놀과 화학적으로 연관된 물질군으로서 화장품, 피부질환 치료제 등으로도 사용되기도 한다.
그러나, 이러한 장점에도 불구하고, 카로티노이드(예를 들어, 베타카로틴) 및 레티노이드(예를 들어, 레티놀)은 동물의 체내에서 합성되지 않거나 합성량이 부족하다. 또한, 변이된 미생물을 이용하여 산업적 생산을 도모하더라도(미국등록특허 제7745170호), 여전히 이들을 고순도로 생산하는 것이 어려운 실정이다.
일 예로, 카로티노이드 또는 레티노이드를 생산하는 미생물을 제작하는 과정에서 스쿠알렌(C30) 등이 부산물로 함께 생산될 수 있다. 그러므로, 카로티노이드 또는 레티노이드를 효율적으로 생산하는 데에 기여하는 제라닐제라닐 피로포스페이트 신타아제 발굴이 이들의 생성량 증대 및 경쟁경로에서 생성되는 스쿠알렌 감소를 위해 필수적이다.
본 출원의 하나의 목적은 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 발현하는, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는 야로위아 속 미생물을 제공하는 것이다.
본 출원의 다른 하나의 목적은 상기 야로위아 속 미생물을 이용한 카로티노이드 또는 이를 전구체로 하는 물질 생산방법을 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 상기 야로위아 속 미생물 또는 이의 배양물을 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산용 조성물을 제공하는 것이다.
본 출원의 또 다른 하나의 목적은 상기 야로위아 속 미생물 또는 이의 배양물의 카로티노이드 또는 이를 전구체로 하는 물질 생산 용도를 제공하는 것이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다. 또한, 본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 출원이 속하는 기술 분야의 수준 및 본 출원의 내용이 보다 명확하게 설명된다.
본 출원의 일 양태는 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제(Geranylgeranyl pyrophosphate synthase)를 발현하는, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는, 야로위아 속 미생물을 제공한다.
본 출원에서 "제라닐제라닐 피로포스페이트 신타아제(Geranylgeranyl pyrophosphate synthase)"는 제라닐제라닐 피로포스페이트(Geranylgeranyl pyrophosphate; GGPP)의 합성을 촉매할 수 있는 효소이다. 상기 제라넬제라닐 피로포스페이트 신타아제의 기질은 이소펜테닐 피로포스페이트(isopentenyl pyrophosphate; IPP) 및 디메틸알릴 피로포스페이트(dimethylallyl pyrophosphate; DMAPP)일 수 있다. 상기 제라닐제라닐 피로포스페이트 신타아제는 'GGS', 'GGPPS', 'GGPS', 'GGPPS1' 또는 '제라닐제라닐 피로포스페이트 신타아제 활성을 갖는 폴리펩티드'로도 명명될 수 있다.
일 구현 예로, 본 출원의 미생물은 외래 단백질인 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제 단백질을 포함하거나 발현하는 야로위아 속 미생물로서, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는 것일 수 있다.
본 출원의 GGPPS 단백질의 아미노산 서열은 GGPPS 유전자에 의해 코딩되는 제라닐제라닐 피로포스페이트 신타아제 활성을 갖는 단백질 서열일 수 있다. 상기 아미노산 서열은 공지의 데이터 베이스인 NCBI의 GenBank 등 다양한 데이터 베이스에서 그 서열을 얻을 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 본 출원의 GGPPS 단백질은 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래일 수 있고, 이와 동일한 서열 또는 활성을 갖는 한 본 출원에 포함된다.
일 구현 예로, 본 출원의 GGPPS 단백질은 서열번호 103 또는 이와 80% 이상의 상동성 또는 동일성을 갖는 아미노산 서열을 포함하거나, 가지거나, 이루어지거나, 상기 아미노산 서열로 필수적으로 이루어지는(essentially consisting of) 것일 수 있다.
또한, 본 출원의 GGPPS 단백질의 일 구현 예를 서열번호 103를 포함하는 단백질로 기재하였으나, 서열번호 103의 아미노산 서열 앞뒤로의 무의미한 서열 추가 또는 자연적으로 발생할 수 있는 돌연변이, 또는 이의 잠재성 돌연변이(silent mutation)를 제외하는 것이 아니며, 상기 아미노산 서열을 포함하는 단백질과 서로 동일 또는 상응하는 활성을 가지는 경우라면 본 출원의 GGPPS 단백질에 해당됨은 당업자에게 자명하다.
구체적으로, 본 출원의 GGPPS 단백질은 서열번호 103의 아미노산 서열을 포함하거나, 또는 서열번호 103의 아미노산 서열과 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 상기 상동성 또는 동일성을 가지며, 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 가지더라도 본 출원의 범위 내에 포함됨은 자명하다.
본 출원에서 '특정 서열번호로 기재된 아미노산 서열을 포함하는 폴리펩티드 또는 단백질', '특정 서열번호로 기재된 아미노산 서열로 이루어진 폴리펩티드 또는 단백질' 또는 '특정 서열번호로 기재된 아미노산 서열을 갖는 폴리펩티드 또는 단백질'라고 기재되어 있더라도, 해당 서열번호의 아미노산 서열로 이루어진 폴리펩티드와 동일 혹은 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원에서 사용될 수 있음은 자명하다. 예를 들어, 상기 아미노산 서열 N-말단, 내부, 그리고/또는 C-말단에 단백질의 기능을 변경하지 않는 서열 추가, 자연적으로 발생할 수 있는 돌연변이, 이의 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 가지는 경우이다.
상기 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다.
본 출원에서 용어, '상동성 (homology)' 또는 '동일성 (identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열 상호간 동일 또는 유사한 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90%에 해당하는 일부분과 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화에는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드와의 하이브리드화 역시 포함됨이 자명하다.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.
또한, 임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 정의된 엄격한 조건하에서 써던 혼성화 실험에 의해 서열을 비교함으로써 확인할 수 있으며, 정의되는 적절한 혼성화 조건은 해당 기술 범위 내이고, 당업자에게 잘 알려진 방법(예컨대, J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York)으로 결정될 수 있다.
본 출원에서 단백질의 발현은 미생물 내로 단백질을 코딩하는 유전자(폴리뉴클레오티드)를 도입하거나 또는 단백질의 주입에 의한 것일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 본 출원의 미생물은 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제 유전자가 도입된 것일 수 있다. 또한, 제라닐제라닐 피로포스페이트 신타아제 유전자 도입은 상기 도입 후 추가적으로 이의 활성을 강화하는 것도 포함할 수 있다.
본 출원에서, 제라닐제라닐 피로포스페이트 신타아제 유전자'는 'ggs', 'ggpps', 'ggps', 'GGS 유전자', 'GGPPS 유전자', 'GGPS 유전자'. '제라닐제라닐 피로포스페이트 신타아제를 코딩하는 유전자', '제라닐제라닐 피로포스페이트 신타아제를 코딩하는 폴리뉴클레오티드', 또는 '제라닐제라닐 피로포스페이트 신타아제 활성을 갖는 폴리펩티드를 코딩하는 폴리뉴클레오티드'와 혼용되어 사용될 수 있다.
상기 제라닐제라닐 피로포스페이트 신타아제 유전자는 공지의 데이터 베이스인 NCBI의 GenBank 등 다양한 데이터 베이스에서 그 서열을 얻을 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제 유전자는 서열번호 1의 염기서열을 포함하거나, 가지거나, 또는 이루어지는 것일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 서열번호 1의 염기서열로 구성되는 제라닐제라닐 피로포스페이트 신타아제 유전자는 야로위아 속 미생물 또는 보다 구체적으로 야로위아 리폴리티카에 적합하도록 코돈 최적화된 것일 수 있다.
본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 가닥이다.
상기 폴리뉴클레오티드 또는 유전자는 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 제라닐제라닐 피로포스페이트 신타아제 폴리펩티드를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 폴리펩티드의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 상기 폴리뉴클레오티드 또는 유전자는 예를 들면 서열번호 1의 염기서열을 포함할 수 있으며, 이와 상동성 또는 동일성이 80% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상인 염기서열로 이루어질 수 있으나, 이에 제한되지 않는다.
또한, 본 출원의 폴리뉴클레오티드 또는 유전자는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이드리드화하여, 서열번호 103의 아미노산 서열을 코딩하는 서열이라면 제한없이 포함될 수 있다. 상기 “엄격한 조건(stringent condition)”이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(예컨대, J. Sambrook et al., 상동)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 40% 이상, 구체적으로 90% 이상, 보다 구체적으로 95% 이상, 96% 이상, 97% 이상, 98% 이상, 더욱 구체적으로 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1×SSC, 0.1% SDS, 구체적으로 60℃, 0.1×SSC, 0.1% SDS, 보다 구체적으로 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, “상보적”은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.
구체적으로, 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(Sambrook et al., supra, 9.50-9.51, 11.7-11.8 참조).
일 구현 예로, 본 출원의 미생물은 본 출원의 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제 유전자 또는 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 포함할 수 있다.
본 출원의 벡터는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 포함하는 DNA 제조물을 포함할 수 있다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pDZ계, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pDC, pDCM2(대한민국 공개특허공보 제10-2020-0136813호), pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC, pIMR53 벡터 등을 사용할 수 있다.
일례로 세포 내 염색체 삽입용 벡터를 통해 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
본 출원에서 용어 "형질전환"은 표적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 폴리펩티드가 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 폴리펩티드를 코딩하는 DNA 및/또는 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다.
일 구현 예로, 본 출원의 헤마토코쿠스 플루비알리스 유래 GGPPS를 발현하는 야로위아 속 미생물에서 이를 발현하지 않는 야로위아 속 미생물에 비해 제라닐제라닐 피로포스페이트 신타아제 활성이 강화된 것일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자가 도입된 야로위아 속 미생물에서 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자가 도입되지 않은 야로위아 속 미생물에 비해 제라닐제라닐 피로포스페이트 신타아제 활성이 강화된 것일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자에 의해 코딩되는 제라닐제라닐 피로포스페이트 신타아제가 도입된 야로위아 속 미생물은 크산토필마로마이세스 덴드로로스(Xanthophyllomyces dendrorhous) 유래의 crtE 또는 이의 변이 유전자 crtEM1, 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 유래의 BTS1 유전자, 또는 야로위아 리폴리티카(Yarrowia lipolytica) 유래 GGS1 유전자에 의해 코딩되는 제라닐제라닐 피로포스페이트 신타아제가 도입된 야로위아 속 미생물에 비해 제라닐제라닐 피로포스페이트 신타아제 활성이 강화된 것일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어, "야로위아 속 미생물" 또는 "야로위아 속 균주"는 야로위아 속 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 야로위아 속 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거는 등의 원인으로 인해서 특정 기작이 강화된 야로위아 속 미생물로서, 카로티노이드 또는 이를 전구체로 하는 물질의 생산을 위하여 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자를 포함하는 야로위아 속 미생물일 수 있다.
본 출원의 미생물은 본 출원의 GGPPS 단백질, 상기 GGPPS 단백질을 코딩하는 GGPS 유전자 또는 폴리뉴클레오티드, 또는 상기 유전자 또는 폴리뉴클레오티드를 포함하는 벡터 중 어느 하나 이상을 포함하는 미생물; 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 단백질 또는 GGPPS 유전자를 발현하도록 변형된 미생물; 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 단백질 또는 GGPPS 유전자를 발현하는 미생물(예컨대, 재조합 균주); 또는 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 활성을 갖는 균주 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.
본 출원의 균주는 자연적으로 제라닐제라닐 피로포스페이트 신타아제, 또는 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 가지고 있는 미생물; 또는 제라닐제라닐 피로포스페이트 신타아제, 또는 카로티노이드 또는 이를 전구체로 하는 물질의 생산능이 없는 모균주에 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 단백질, 유전자, 폴리뉴클레오티드, 또는 이를 포함하는 벡터가 도입되어 제라닐제라닐 피로포스페이트 신타아제 및 카로티노이드 또는 이를 전구체로 하는 물질의 생산능이 강화되거나 부여된 미생물일 수 있으나 이에 제한되지 않는다.
일 예로, 본 출원의 균주는 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS 단백질, 유전자, 폴리뉴클레오티드, 또는 이를 포함하는 벡터로 형질전환되어, 카로티노이드 또는 이를 전구체로 하는 물질을 생산할 수 있거나 생산능이 증가된 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 균주는 천연의 야생형 미생물 또는 카로티노이드 또는 이를 전구체로 하는 물질을 생산하는 미생물에 본 출원의 헤마토코쿠스 플루비알리스 유래의 GGPPS가 발현되어, 카로티노이드 또는 이를 전구체로 하는 물질 생산능이 증가된 재조합 균주일 수 있다. 상기 카로티노이드 또는 이를 전구체로 하는 물질 생산능이 증가된 재조합 균주는, 천연의 야생형 미생물 또는 제라닐제라닐 피로포스페이트 신타아제 비변형 미생물 (즉, 야생형 제라닐제라닐 피로포스페이트 신타아제 유전자(서열번호 11)를 포함하는 야로위아 속 미생물 또는 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제 유전자(서열번호 1)가 도입되지 않는 야로위아 속 미생물)에 비하여 카로티노이드 또는 이를 전구체로 하는 물질 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다.
일 예로, 본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산능이 증가된 균주는 헤마토코쿠스 플루비알리스 유래의 GGPPS(일 예로, 서열번호 103)를 포함하지 않거나; 크산토필마로마이세스 덴드로로스 유래의 CrtE 또는 이의 변이형 CrtEM1, 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 유래의 BTS1, 또는 야로위아 리폴리티카(Yarrowia lipolytica) GGS1을 포함하는 야로위아 속 미생물과 비교하여 카로티노이드 또는 이를 전구체로 하는 물질의 생산능이 증가된 미생물일 수 있으나, 이에 제한되지 않는다. 그 예로, 상기 카로티노이드 또는 이를 전구체로 하는 물질 생산능의 증가 여부를 비교하는 대상 균주인, 비변형 미생물은 CC08-1023균주 일 수 있으나, 이에 제한되지 않는다.
일 예로, 상기 생산능이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물의 베타카로틴 또는 레티놀 생산능에 비하여 약 0.001% 이상 또는 0.01% 이상 베타카로틴 또는 레티놀 생산능이 높아진 것일 수 있으나, 변이 전 모균주 또는 비변형 미생물의 생산능에 비해 +값의 증가량을 갖는 한, 이에 제한되지 않는다. 상기 용어 "약(about)"은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.
본 출원에서 용어, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 예를 들어, 상기 비변형 미생물은 본 명세서에 기재된 헤마토코쿠스 플루비알리스 유래의 GGPPS가 발현되지 않거나 도입되기 전의 균주를 의미할 수 있다. 상기 "비변형 미생물"은 "변형 전 균주", "변형 전 미생물", "비변이 균주", "비변형 균주", "비변이 미생물" 또는 "기준 미생물"과 혼용될 수 있다.
본 출원의 미생물은 야로위아 속일 수 있고, 구체적으로는 야로위아 리폴리티카(Yarrowia lipolytica)일 수 있으나, 이에 제한되지 않는다.
본 출원의 미생물에서 폴리뉴클레오티드의 일부 또는 전체의 변형은 (a) 미생물 내 염색체 삽입용 벡터를 이용한 상동 재조합 또는 유전자가위 (engineered nuclease, e.g., CRISPR-Cas9)을 이용한 유전체 교정 및/또는 (b) 자외선 및 방사선 등과 같은 빛 및/또는 화학물질 처리에 의해 유도될 수 있으나 이에 제한되지 않는다. 상기 유전자 일부 또는 전체의 변형 방법에는 DNA 재조합 기술에 의한 방법이 포함될 수 있다. 예를 들면, 목적 유전자와 상동성이 있는 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열 또는 벡터를 상기 미생물에 주입하여 상동 재조합(homologous recombination)이 일어나게 함으로써 유전자 일부 또는 전체의 결손이 이루어질 수 있다. 상기 주입되는 뉴클레오티드 서열 또는 벡터는 우성 선별 마커를 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 미생물은 라이코펜 사이클라제/파이토엔 신타아제(lycopene cyclase/phytoene synthase, crtYB), 파이토엔 디새튜라아제(phytoene desaturase, crtI) 및 베타카로틴 15, 15'-옥시게나제(beta-carotene 15,15'-oxygenase; BLH) 단백질을 코딩하는 폴리뉴클레오티드를 포함하도록 변형된 야로위아 속 미생물일 수 있다.
본 출원의 미생물은 라이코펜 사이클라제/파이토엔 신타아제(lycopene cyclase/phytoene synthase, crtYB) 및 파이토엔 디새튜라아제(phytoene desaturase, crtI) 단백질을 코딩하는 폴리뉴클레오티드를 더 포함하도록 변형되어, 이들 단백질 활성을 나타내는 미생물 또는 이들 단백질 활성이 강화된 미생물일 수 있다. 상기 라이코펜 사이클라제/파이토엔 신타아제 또는 파이토엔 디새튜라아제는 크산토필로마이세스 덴드로하우스(Xanthophyllomyces dendrorhous) 유래의 단백질일 수 있으나 이에 제한되지 않는다. 일 구현 예로 상기 라이코펜 사이클라제/파이토엔 신타아제 또는 파이토엔 디새튜라아제를 코딩하는 폴리뉴클레오티드는 각각 NCBI(National Center for Biotechnology Information Search database)에 등록되어 있는 염기서열(GenBank: AY177204.1 또는 GenBank: AY177424.1)에 근거하여 가지거나 포함하는 것일 수 있다. 일 구현 예로 상기 라이코펜 사이클라제/파이토엔 신타아제 또는 파이토엔 디새튜라아제를 코딩하는 폴리뉴클레오티드는 각각 서열번호 71 또는 서열번호 72를 가지거나 포함하는 것일 수 있다. 상기 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 폴리펩티드를 발현시키고자 하는 미생물에서 선호되는 코돈을 고려하여, 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 상기 폴리뉴클레오티드는 서열번호 71 또는 서열번호 72의 서열과 상동성 또는 동일성이 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 71 또는 서열번호 72의 서열과 상동성 또는 동일성이 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다.
본 출원의 미생물은 베타카로틴 15, 15'-옥시게나제(beta-carotene 15,15'-oxygenase; BLH) 단백질을 코딩하는 폴리뉴클레오티드를 더 포함하도록 변형되어, 이들 단백질 활성을 나타내는 미생물 또는 이들 단백질 활성이 강화된 미생물일 수 있으나, 이에 제한되지 않는다. 상기 베타카로틴 15, 15'-옥시게나제는 해양세균 66A03(Uncultured marine bacterium 66A03) 유래의 단백질일 수 있으나, 이에 제한되지 않는다. 일 구현 예로 상기 베타카로틴 15, 15'-옥시게나제를 코딩하는 폴리뉴클레오티드는 UniProtKB(UniProt Knowledgebase)에 등록되어 있는 아미노산 서열(Q4PNI0)에 근거하여 가지거나 포함하는 것일 수 있다. 일 구현 예로 상기 베타카로틴 15, 15'-옥시게나제를 코딩하는 폴리뉴클레오티드는 서열번호 13의 서열을 가지거나 포함하는 것일 수 있다. 상기 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 폴리펩티드를 발현시키고자 하는 미생물에서 선호되는 코돈을 고려하여, 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 상기 폴리뉴클레오티드는 서열번호 13의 서열과 상동성 또는 동일성이 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 13의 서열과 상동성 또는 동일성이 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어, 폴리펩티드 활성의 "강화"는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 활성화(activation), 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 활성화, 강화, 상향조절, 과발현, 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 "내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "강화", "상향조절", "과발현" 또는 "증가"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성 및/또는 농도(발현량)에 비하여 향상된 것을 의미한다.
상기 강화는 외래의 폴리펩티드 또는 유전자를 도입하거나, 내재적인 폴리펩티드의 활성 강화 및/또는 농도(발현량)를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.
상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).
구체적으로, 본 출원의 폴리펩티드 활성의 강화는
1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가;
2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체;
3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;
4) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드의 아미노산 서열의 변형;
5) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형 (예를 들어, 폴리펩티드의 활성이 강화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 폴리뉴클레오티드 서열의 변형);
6) 폴리펩티드의 활성을 나타내는 외래 폴리펩티드 또는 이를 코딩하는 외래 폴리뉴클레오티드의 도입;
7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화;
8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식; 또는
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.
보다 구체적으로,
상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터의 숙주세포 내로의 도입에 의해 달성되는 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 카피 이상 도입에 의해 달성되는 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.
상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일 예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.
공지된 강력한 프로모터의 예에는 CJ1 내지 CJ7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터, yccA 프로모터, TEFINt 프로모터 등이 있으나, 이에 제한되지 않는다.
상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈을 코딩하는 염기 서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.
상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커 (selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.
상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.
상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.
상기 8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식하는 것은, 예를 들어 분석하고자 하는 폴리펩티드의 서열정보를 기지 단백질들의 서열정보가 저장된 데이터베이스와 비교함으로써 서열의 유사성 정도에 따라 주형 단백질 후보를 결정하고 이를 토대로 구조를 확인하여, 변형하거나 화학적으로 수식할 노출 부위를 선택하여 변형 또는 수식하는 것일 수 있다.
이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도 발현량이 야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.
일 구현 예로, 본 출원의 미생물은 헤마토코쿠스 플루비알리스 유래의 GGPPS 유전자를 도입함으로써 GGPPS 활성이 강화된 것일 수 있으나, 이에 제한되지 않는다.
본 출원의 미생물은 카로티노이드 또는 이를 전구체로 하는 물질 생산능을 갖는 것일 수 있다.
본 출원에서 용어 "카로티노이드"는 과일 및 야채에서 노란색 등의 색을 내게 하는 테트라테르펜(tetraterpene) 또는 이의 유도체를 의미한다.
일 구현 예로, 상기 카로티노이드는 크산토필(xanthophyll), 카로틴(carotene), 알파카로틴(alpha-carotene), 베타카로틴(beta-carotene), 감마카로틴(gamma-carotene), 피토엔(phytoene), 피토플루엔(phytofluene), 뉴로스포렌(neurosporene), 루테인(lutein), 라이코펜(lycopene), 제아잔틴(Zeaxanthin), 캡산틴(Capsanthin), 칸타잔틴(Canthaxanthin), 및 아스타잔틴(Astaxanthin)으로 구성되는 군에서 선택되는 어느 하나 이상일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 상기 카로티노이드를 전구체로 하는 물질은 레티노이드일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어 "레티노이드"는 화학적으로 비타민 A군 또는 이와 화학적으로 연관된 화합물군을 의미한다.
일 구현 예로, 상기 레티노이드는 레티놀, 레티날, 레티노산, 및 레티닐 에스터로 구성되는 군에서 선택되는 어느 하나일 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 본 출원의 미생물은 부산물 생산능이 감소된 것일 수 있으나, 이에 제한되지 않는다.
본 출원에서 부산물은 카로티노이드 또는 이를 전구체로 하는 물질 생산 시, 이들을 제외한 모든 물질을 의미할 수 있다. 일 예로, 베타카로틴 생산 시 발생하는 대표적인 부산물은 스쿠알렌일 수 있다.
본 출원에서 "스쿠알렌"은 불포화 탄화수소(C30H50)로서, 스테로이드 호르몬, 비타민 D 등의 생합성에도 이용되는 물질이다. 본 출원의 미생물은 베타카로틴 생산 경로에서 생성되는 부산물을 감소시킨 것일 수 있으며, 구체적으로 스쿠알렌 생산을 감소시킨 것일 수 있으나, 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는 본 출원의 야로위아 속 미생물을 배지에서 배양하는 단계를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산방법을 제공한다.
상기 미생물, 카로티노이드, 이를 전구체로 하는 물질은 다른 양태에서 설명한 바와 같다.
본 출원에서, 용어 "배양"은 본 출원의 야로위아 속 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원에서, 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및/또는 유가식일 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 야로위아 속 미생물을 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다.
본 출원의 배양에서 배양온도는 20 내지 35 구체적으로는 25 내지 35를 유지할 수 있고, 약 10 내지 160 시간, 약 20 시간 내지 130 시간, 약 24 시간 내지 120 시간, 약 36 시간 내지 120 시간, 약 48시간 내지 120시간, 약 48 시간, 약 72 시간, 또는 약 120 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 배양에 의하여 생산된 카로티노이드 또는 이를 전구체로 하는 물질은 배지 중으로 분비되거나 미생물 내에 잔류할 수 있다.
본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산방법은, 본 출원의 야로위아 속 미생물을 준비하는 단계, 상기 미생물을 배양하기 위한 배지를 준비하는 단계, 또는 이들의 조합(순서에 무관, in any order)을, 예를 들어, 상기 배양하는 단계 이전에, 추가로 포함할 수 있다.
본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산방법은, 상기 야로위아 속 미생물 배양에 따른 배지(배양이 수행된 배지) 또는 본 출원의 야로위아 속 미생물로부터 카로티노이드 또는 이를 전구체로 하는 물질을 회수하는 단계를 추가로 포함할 수 있다. 상기 회수하는 단계는 상기 배양하는 단계 이후에 추가로 포함될 수 있다.
상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 레티놀을 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 세포 파쇄, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 레티놀을 회수할 수 있다.
또한, 본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다. 일 예에서, 본 출원의 카로티노이드 또는 이를 전구체로 하는 물질 생산방법이 회수 단계와 정제 단계를 모두 포함하는 경우, 상기 회수 단계와 정제 단계는 순서에 상관없이 이시적(또는 연속적)으로 수행되거나, 동시에 또는 하나의 단계로 통합되어 수행될 수 있으나, 이에 제한되는 것은 아니다.
본 출원의 카로티노이드의 생산방법은 본 출원의 미생물이 생산한 베타카로틴을 베타카로틴 이외의 카로티노이드로 전환하는 단계를 추가로 포함할 수 있다. 본 출원의 카로티노이드 생산방법에 있어서, 상기 전환하는 단계는 상기 배양하는 단계 또는 상기 회수하는 단계 이후에 추가로 포함될 수 있다. 상기 전환하는 단계는 당해 기술분야에 공지된 적합한 방법을 이용하여 수행할 수 있다. 예컨데, 상기 전환은 화학적으로, 또는 효소를 이용하여 수행할 수 있으나, 이에 제한되지 않는다.
본 출원의 레티노이드의 생산방법은 본 출원의 야로위아 속 미생물이 생산한 레티놀을 레티놀 이외의 레티노이드로 전환하는 단계를 추가로 포함할 수 있다. 본 출원의 레티노이드 생산방법에 있어서, 상기 전환하는 단계는 상기 배양하는 단계 또는 상기 회수하는 단계 이후에 추가로 포함될 수 있다. 상기 전환하는 단계는 당해 기술분야에 공지된 적합한 방법을 이용하여 수행할 수 있다. 예컨데, 상기 전환은 레티놀 아실트렌스퍼라아제(retinol acyltransferase)를 이용하여 수행할 수 있으나, 이에 제한되지 않는다.
일 구현 예로, 상기 레티놀 이외의 레티노이드는 레티날, 레티노산, 및 레티닐 에스터로 구성되는 군에서 선택되는 어느 하나일 수 있으나, 레티노이드에 포함되는 한 이에 제한되지 않는다.
본 출원의 또 다른 하나의 양태는 본 출원의 야로위아 속 미생물 또는 이의 배양물을 포함하는 카로티노이드 또는 이를 전구체로 하는 물질의 생산용 조성물을 제공한다.
상기 미생물, 카로티노이드, 또는 이를 전구체로 하는 물질은 다른 양태에서 설명한 바와 같다.
본 출원의 조성물은 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 또 다른 하나의 양태는 본 출원의 미생물 또는 이의 배양물의 카로티노이드 또는 이를 전구체로 하는 물질의 생산 용도를 제공한다.
상기 미생물, 카로티노이드, 또는 이를 전구체로 하는 물질은 다른 양태에서 설명한 바와 같다.
본 출원은 Haematococcus pluvialis 유래 제라닐제라닐 피로포스페이트 신타아제 유전자를 야로위아 속 미생물에 도입함으로써 카로티노이드 및 이를 전구체로 하는 물질의 생산을 효과적으로 증가시킬 수 있다.
도 1은 여러 미생물 유래의 GGPP synthase 유전자 도입주 플라스크 평가 결과를 나타낸 도이다.
도 2는 Mb.BCO 도입주 플라스크 평가 결과 결과를 나타낸 도이다,
도 2는 Mb.BCO 도입주 플라스크 평가 결과 결과를 나타낸 도이다,
이하 본 출원을 실시예에 의해 보다 상세하게 설명한다. 그러나 하기 실시예는 본 출원을 예시하기 위한 바람직한 실시양태에 불과한 것이며 따라서, 본 출원의 권리범위를 이에 한정하는 것으로 의도되지는 않는다. 한편, 본 명세서에 기재되지 않은 기술적인 사항들은 본 출원의 기술 분야 또는 유사 기술 분야에서 숙련된 통상의 기술자이면 충분히 이해하고 용이하게 실시할 수 있다.
실시예 1. 카로티노이드 또는 이를 전구체로 하는 물질의 생산용 플랫폼 균주 제작
실시예 1-1.
X. dendrorhous
유래 crtYB-crtI 삽입주 제작
카로티노이드 또는 이를 전구체로 하는 물질의 생산을 위한 플랫폼 균주 제작을 위해 고지방 효모인 야로위아 리폴리티카(Yarrowia lipolytica) CC08-0125(기탁번호 KCCM12972P) 균주의 게놈에 Xanthophyllomyces dendrorhous 유래 lycopene cyclase/phytoene synthase (crtYB)와 phytoene desaturase(crtI) 유전자를 삽입하였다.
crtYB의 경우 NCBI(National Center for Biotechnology Information Search database)에 등록되어 있는 염기서열(GenBank: AY177204.1)에 근거하여 서열번호 71의 폴리뉴클레오티드를 확보하였고, crtI의 경우 NCBI에 등록되어 있는 염기서열(GenBank: AY177424.1)에 근거하여 서열번호 72의 폴리뉴클레오티드를 확보하였다. crtYB와 crtI의 폴리뉴클레오티드 서열은 마크로젠社를 통해 TEFINtp-crtYB-CYC1t(서열번호 73), TEFINtp-crtI-CYC1t(서열번호 74)의 형태로 유전자를 합성하였으며, 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 75)를 이용하여 MHY1(YALI0B21582g) 유전자 위치에 삽입되는 카세트를 디자인하였다. 합성된 crtYB, crtI 유전자 및 KCCM12972P 게놈 DNA를 주형으로 하고 서열번호 76 및 서열번호 77, 서열번호 78 및 서열번호 79, 서열번호 80 및 서열번호 81, 서열번호 82 및 서열번호 83, 서열번호 84 및 서열번호 85, 및 서열번호 86 및 서열번호 87의 프라이머를 이용하여 각각의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 3분을 35회 반복 수행하였다. 그 결과로 얻어진 5개의 DNA 단편은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.
이렇게 제작된 카세트를 열충격법 (D.-C. Chen et al., Appl Microbiol Biotechnol, 1997) 으로 KCCM12972P 균주에 도입한 후, 우라실(uracil)이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 88 및 서열번호 89의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 spotting하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 자란 콜로니를 획득함으로써 URA3 마커를 회수하였다.
서열번호 | 서열(5'- 3') | PCR 산물 |
76 | GTGCGCTTCTCTCGTCTCGGTAACCCTGTC | Homology left arm |
77 | ATGCGCCGCCAACCCGGTCTCTGGGGTGTGGTGGATGGGGTGTG | |
78 | CACACCCCATCCACCACACCCCAGAGACCGGGTTGGCGGCGCAT | TEFINtp-crtYB-CYC1t |
79 | CGCCGCCAACCCGGTCTCTTGAAGACGAAAGGGCCTCCG | |
80 | CGGAGGCCCTTTCGTCTTCAAGAGACCGGGTTGGCGGCG | TEFINtp-crtI-CYC1t |
81 | GACGAGTCAGACAGGAGGCATCAGACAGATACTCGTCGCG | |
82 | CGCGACGAGTATCTGTCTGATGCCTCCTGTCTGACTCGTC | URA3 |
83 | ATGACGAGTCAGACAGGAGGCATGGTGGTATTGTGACTGGGGAT | |
84 | ATCCCCAGTCACAATACCACCATGCCTCCTGTCTGACTCGTCAT | Repeat region |
85 | CGGCGTCCTTCTCGTAGTCCGCTTTTGGTGGTGAAGAGGAGACT | |
86 | AGTCTCCTCTTCACCACCAAAAGCGGACTACGAGAAGGACGCCG | Homology right arm |
87 | CCACTCGTCACCAACAGTGCCGTGTGTTGC | |
88 | TCGTACGTCTATACCAACAGATGG | Forward |
89 | CGCATACACACACACTGCCGGGGG | Reverse |
실시예 1-2. HMGR 강화주 제작
앞서 실시예 1-1에서 제작된 균주의 하이드록시메틸글루타릴 리덕테이즈(3-hydroxy-3-methylglutaryl-CoA reductase, HMGR)유전자의 native 프로모터(서열번호 90) 부위를 TEFINt 프로모터로 교체하기 위한 카세트를 디자인하였고, KCCM12972P 게놈 DNA를 주형으로 하고 서열번호 91 및 서열번호 92, 서열번호 93 및 서열번호 94, 서열번호 95 및 서열번호 96, 서열번호 97 및 서열번호 98, 및 서열번호 99 및 서열번호 100의 프라이머를 이용하여 각각의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 1분 30초를 35회 반복 수행하였다. 그 결과로 얻어진 5개의 DNA 단편은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.
이렇게 제작된 카세트를 열충격법으로 실시예 1-1에서 제작한 균주에 도입한 후, 우라실이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 101 및 서열번호 102의 프라이머를 이용하여 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 spotting하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 자란 콜로니를 획득함으로써 URA3 마커를 회수하였다. 이에 따라 최종적으로 제작된 플랫폼 균주를 CC08-1023으로 명명하였다.
< Yarrowia lipolytica minimal media1 (YLMM1)>
포도당 20 g/L, 아미노산을 포함하지 않는 효모 질소 염기(Yeast nitrogen base without amino acids) 6.7 g/L, 우라실을 포함하지 않는 효모 합성 드롭 아웃 배지 보충물 (Yeast Synthetic Drop-out Medium Supplements without uracil) 2 g/L, 한천(agar) 15 g/L
<5-Fluoroorotic Acid (5-FOA)>
포도당 20 g/L, 아미노산을 포함하지 않는 효모 질소 염기(Yeast nitrogen base without amino acids) 6.7 g/L, 우라실을 포함하지 않는 효모 합성 드롭 아웃 배지 보충물 (Yeast Synthetic Drop-out Medium Supplements without uracil) 2 g/L, 우라실(Uracil) 50 μg/mL, 5-플루오로 오로틴산(5-FOA) 1 g/L, 한천(agar) 15 g/L
서열번호 | 서열(5'- 3') | PCR 산물 |
91 | GACAATGCCTCGAGGAGGTTTAAAAGTAACT | Homology left arm |
92 | GCGCCGCCAACCCGGTCTCTCTGTGTTAGTCGGATGATAGG | |
93 | CCTATCATCCGACTAACACAGAGAGACCGGGTTGGCGGCGC | TEFINt promoter |
94 | GACGAGTCAGACAGGAGGCACTGCGGTTAGTACTGCAAAAAG | |
95 | CTTTTTGCAGTACTAACCGCAGTGCCTCCTGTCTGACTCGTC | URA3 |
96 | ATGCGCCGCCAACCCGGTCTCTTGGTGGTATTGTGACTGGGGAT | |
97 | ATCCCCAGTCACAATACCACCAAGAGACCGGGTTGGCGGCGCAT | Repeat region |
98 | CTTTCCAATAGCTGCTTGTAGCTGCGGTTAGTACTGCAAAA | |
99 | TTTTGCAGTACTAACCGCAGCTACAAGCAGCTATTGGAAAG | Homology right arm |
100 | GCTTAATGTGATTGATCTCAAACTTGATAG | |
101 | GCTGTCTCTGCGAGAGCACGTCGA | Forward |
102 | GGTTCGCACAACTTCTCGGGTGGC | Reverse |
실시예 2. 헤마토코쿠스 플루비알리스(
Haematococcus pluvialis
) 유래의 제라닐제라닐 피로포스페이트 산타아제(Geranylgeranyl pyrophosphate synthase; GGPP synthase) 유전자 삽입주 제작
각기 다른 유래의 GGPP synthase 유전자(이하, GGPPS 유전자) 4종을 실시예 1에서 제작한 균주 CC08-1023의 게놈에 다음과 같이 각각 도입하였다.
실시예 2-1.
Haematococcus pluvialis
유래 GGPPS 삽입주 제작
Yarrowia lipolytica 염색체 상에 Haematococcus pluvialils 유래 GGPPS1 유전자(이하, Hp.GGPPS1)를 삽입하기 위해 Hp.GGPPS1은 NCBI(National Center for Biotechnology Information Search database)에 등록되어 있는 염기서열(GenBank: APX64485.1)에 근거하여 http://atgme.org를 통해 Y. lipolytica에 적합하도록 코돈 최적화를 진행하였고(서열번호 1), 마크로젠社를 통해 TEFINtp-코돈 최적화된 Hp.GGPPS1-CYC1t의 형태로 유전자를 합성하였으며(서열번호 4), 선별 마커로는 Y. lipolytica 의 URA3 유전자(서열번호 5)를 이용하여 LIG4(YALI0D21384g) 유전자 위치에 삽입되는 카세트를 디자인 하였다. 합성된 Hp.GGPPS1 유전자 및 KCCM12972P genomic DNA를 주형으로 하고, 하기 표 3과 같이 서열번호 15 및 서열번호 16, 서열번호 17 및 서열번호 18, 서열번호 19 및 서열번호 20, 서열번호 21 및 서열번호 22, 서열번호 23 및 서열번호 24, 서열번호 25 및 서열번호 26, 및 서열번호 27 및 서열번호 28의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, Hp.GGPPS1 ORF, CYC1 terminator, URA3, repeat region, 및 right homologous region 단편의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.
이렇게 제작된 카세트를 열충격법으로 CC08-1023 균주에 도입한 후, 우라실(uracil)이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 29 및 서열번호 30의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 도말하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 형성된 콜로니를 획득함으로써 URA3 마커를 제거하였다.
서열번호 | 서열(5'- 3') |
15 | CATCATTTCAAAAGAGGGAACAGC |
16 | CGCCGCCAACCCGGTCTCTGTGTTTGGCGGTGTGAGTTGTC |
17 | GACAACTCACACCGCCAAACACAGAGACCGGGTTGGCGGCG |
18 | CGGTTGTGCATGGCTCGGATCTGCGGTTAGTACTGCAAAAAGTGC |
19 | GCACTTTTTGCAGTACTAACCGCAGATCCGAGCCATGCACAACCG |
20 | AACTAATTACATGActcgaGCTAGTTCTTTCGGTAGCCGA |
21 | TCGGCTACCGAAAGAACTAGCtcgagTCATGTAATTAGTT |
22 | gacgagtcagacaggaggcaGCAAATTAAAGCCTTCGAGC |
23 | GCTCGAAGGCTTTAATTTGCtgcctcctgtctgactcgtc |
24 | AACTAATTACATGActcgaGtggtggtattgtgactgggg |
25 | ccccagtcacaataccaccaCtcgagTCATGTAATTAGTT |
26 | CCATATGGAGTGTTATTTGAAGGGGCAAATTAAAGCCTTCGAGC |
27 | GCTCGAAGGCTTTAATTTGCCCCTTCAAATAACACTCCATATGG |
28 | CCGATACAGTGTCCAAGTACG |
29 | GAGTGTCTGAAGACAAGGCTTC |
30 | GACGACAATGCTGAGCTCCG |
실시예 2-2.
Xanthophyllomyces dendrorhous
유래 crtE 변이 유전자 삽입주 제작
Yarrowia lipolytica 염색체 상에 Xanthophyllomyces dendrorhous 유래 crtE 변이 유전자 crtEM1 (서열번호 6, Hong et al., Applied Microbiology and Biotechnology, 2019 Jan;103(1):211-223)를 삽입하기 위해 , 마크로젠社를 통해 TEFINtp-crtEM1-TDH3t의 형태로 유전자를 합성하였으며(서열번호 8), 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 5)를 이용하여 LIG4(YALI0D21384g) 유전자 위치에 삽입되는 카세트를 디자인 하였다.
합성된 crtEM1 DNA와 KCCM12972P genomic DNA를 주형으로 하고 표 4와 같이 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 34, 서열번호 35 및 서열번호 36, 서열번호 37 및 서열번호 38, 서열번호 39 및 서열번호 40, 서열번호 41 및 서열번호 42, 및 서열번호 43 및 서열번호 44의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, crtEM1 ORF, TDH3 terminator, URA3, repeat region, 및 right homologous region 단편의 PCR을 수행하였다.
PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.
이렇게 제작된 카세트를 열충격법으로 CC08-1023균주에 도입한 후, 우라실이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 45 및 서열번호 46의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 도말하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 형성된 콜로니를 획득함으로써 URA3 마커를 제거하였다.
서열번호 | 서열(5'- 3') |
31 | CATCATTTCAAAAGAGGGAACAGC |
32 | CGCCGCCAACCCGGTCTCTGTGTTTGGCGGTGTGAGTTGTC |
33 | GACAACTCACACCGCCAAACACAGAGACCGGGTTGGCGGCG |
34 | CTGTGAGGATGTTCGCGTAATCCTGCGGTTAGTACTGCAAAAAGTGC |
35 | GCACTTTTTGCAGTACTAACCGCAGGATTACGCGAACATCCTCACAG |
36 | CTTCGCTCTTGATCTTCGGATAGTCACAGAGGGATATCGGCTAG |
37 | CTAGCCGATATCCCTCTGTGACTATCCGAAGATCAAGAGCGAAG |
38 | GACGAGTCAGACAGGAGGCAGTCTTGGAACGGTGAAAAAGCCTGC |
39 | GCAGGCTTTTTCACCGTTCCAAGACTGCCTCCTGTCTGACTCGTC |
40 | CGCTCTTGATCTTCGGATAGTGGTGGTATTGTGACTGGGGA |
41 | TCCCCAGTCACAATACCACCACTATCCGAAGATCAAGAGCG |
42 | CATATGGAGTGTTATTTGAAGGGGTCTTGGAACGGTGAAAAAGCCTGC |
43 | GCAGGCTTTTTCACCGTTCCAAGACCCCTTCAAATAACACTCCATATG |
44 | CCGATACAGTGTCCAAGTACG |
45 | GAGTGTCTGAAGACAAGGCTTC |
46 | GACGACAATGCTGAGCTCCG |
실시예 2-3.
Saccharomyces cerevisiae
유래 BTS1 삽입주 제작
Yarrowia lipolytica 염색체 상에 Saccharomyces cerevisiae 유래 BTS1 유전자(이하, Sc.BTS1)를 삽입하기 위해 BTS1은 KEGG(Kyoto Encyclopedia of Genes and Genomes)에 등록되어 있는 염기서열(YPL069C)에 근거하여 서열번호 9의 폴리뉴클레오티드를 확보하였다. 상기 BTS1의 폴리뉴클레오티드를 이용하여 TEFINtp-Sc.BTS1-TDH3t(서열번호 10)의 형태로 유전자를 합성하였다. 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 5)를 이용하여 LIG4(YALI0D21384g) 유전자 위치에 삽입되는 카세트를 디자인 하였다.
합성된 Sc.BTS1 DNA 및 KCCM12972P genomic DNA를 주형으로 하고 표 5와 같이 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 47, 서열번호 48 및 서열번호 49, 서열번호 50 및 서열번호 38, 서열번호 39 및 서열번호 40, 서열번호 41 및 서열번호 42, 서열번호 43 및 서열번호 44의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, Sc.BTS1 ORF, TDH3 terminator, URA3, repeat region, 및 right homologous region 단편의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.
이렇게 제작된 카세트를 열충격법으로 CC08-1023균주에 도입한 후, 우라실이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 45 및 서열번호 46의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 도말하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 형성된 콜로니를 획득함으로써 URA3 마커를 제거하였다.
서열번호 | 서열(5'- 3') |
47 | CAGCTCATCTATCTTGGCCTCCTGCGGTTAGTACTGCAAAAAGTGC |
48 | GCACTTTTTGCAGTACTAACCGCAGGAGGCCAAGATAGATGAGCTG |
49 | CTTCGCTCTTGATCTTCGGATAGTCACAATTCGGATAAGTGGTCTATTATATATAAC |
50 | GTTATATATAATAGACCACTTATCCGAATTGTGACTATCCGAAGATCAAGAGCGAAG |
실시예 2-4.
Yarrowia lipolytica
유래 GGS1 삽입주 제작
Yarrowia lipolytica 염색체 상에 Yarrowia lipolytica 유래 GGS1 유전자(이하, Yl.GGS1)를 삽입하기 위해 GGS1은 KEGG(Kyoto Encyclopedia of Genes and Genomes)에 등록되어 있는 염기서열(YALI0D17050g)에 근거하여 서열번호 11의 폴리뉴클레오티드를 확보하였다. 상기 Yl.GGS1의 폴리뉴클레오티드를 이용하여 TEFINtp-Yl.GGS1-TDH3t(서열번호 12)의 형태로 유전자를 합성하였다. 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 5)를 이용하여 LIG4(YALI0D21384g) 유전자 위치에 삽입되는 카세트를 디자인 하였다.
합성된 Yl.GGS1 유전자 및 KCCM12972P genomic DNA를 주형으로 하고 표 6과 같이 서열번호 31 및 서열번호 32, 서열번호 33 및 서열번호 51, 서열번호 52 및 서열번호 53, 서열번호 54 및 서열번호 38, 서열번호 39 및 서열번호 40, 서열번호 41 및 서열번호 42, 및 서열번호 43 및 서열번호 44의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, Yl.GGS1 ORF, TDH3 terminator, URA3, repeat region, 및 right homologous region 단편의 PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.
이렇게 제작된 카세트를 열충격법으로 CC08-1023균주에 도입한 후, 우라실이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 45 및 서열번호 46의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 도말하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 형성된 콜로니를 획득함으로써 URA3 마커를 제거하였다.
서열번호 | 서열(5'- 3') |
51 | CTTGAAATCCGCGCTGTTATAATCCTGCGGTTAGTACTGCAAAAAGTGC |
52 | GCACTTTTTGCAGTACTAACCGCAGGATTATAACAGCGCGGATTTCAAG |
53 | CTTCGCTCTTGATCTTCGGATAGTCACTGCGCATCCTCAAAGTAC |
54 | GTACTTTGAGGATGCGCAGTGACTATCCGAAGATCAAGAGCGAAG |
실시예 3. GGPP synthase 도입주 기반 베타카로틴 생산능 비교 평가
실시예 2-1 내지 2-4에서 확보한 균주와 실시예 1에서 확보한 모균주 CC08-1023를 포함하여 총 5종에 대해 플라스크 평가를 진행하였다. 상기 균주를 YPD(Yeast extract-Peptone-Dextrose) 배지 20ml을 포함하는 250ml 코너-바플 플라스크에 초기 OD 2가 되도록 접종하고 30℃에서 48시간 동안, 200rpm으로 진탕 배양하였다. 배양을 종료한 후, 배양액 1 ml을 원심 분리하여 상등액을 제거하였다. 상기 YPD 배지 조성은 다음과 같다.
< YPD liquid media >
4% 포도당, 1% yeast extract, 2% peptone의 비율로 0.1M 포스페이트 완충액(sodium phosphate buffer)(pH 7.0)에 녹인다.
그 다음으로, DMSO(Dimethyl sulfoxide, sigma 社, CAS number 67-68-5) 0.5ml을 첨가하고 55℃에서 10분 동안 진탕(agitation, 2,000rpm)하여 세포를 파쇄하였다. 추가로 아세톤(sigma社, CAS number 67-64-1) 0.5ml을 첨가하고 45℃에서 15분동안 진탕(agitation, 2,000rpm)하여 베타카로틴과 스쿠알렌 추출을 진행하였으며, HPLC 설비로 농도 분석을 하였다. 분석된 베타카로틴 및 스쿠알렌 농도를 측정한 결과를 도 1에 표시하였다.
그 결과, 도 1에서 나타난 바와 같이, CC08-1023(모균주), Hp.GGPPS1 도입주, crtEM1 도입주, Sc.BTS1 도입주, 및 Yl.GGS1 도입주에서의 베타카로틴 농도는 각각 5.49mg/L, 58.73mg/L, 40.58mg/L, 5.21mg/L, 및 49.22mg/L로 측정되었으며, 특히 Hp.GGPPS1를 도입하였을 때 베타카로틴이 모균주 대비 53.24mg/L 증가하여 베타카로틴 증가효과가 가장 우수함을 확인하였다.
추가적으로 스쿠알렌 농도는 각각 313.24mg/L, 200.31mg/L, 235.27mg/L, 253.28mg/L, 및 221.22mg/L로 측정되었으며, 유사하게 Hp.GGPPS1이 도입되었을 때 스쿠알렌 농도가 CC08-1023 균주 대비 112.93mg/L 감소하여 스쿠알렌 생산 저감 효과가 가장 우수함을 확인하였다.
이러한 결과를 바탕으로 야로위아 속 미생물에서는 Hp.GGPPS1이 GGPP synthase로써의 효과가 가장 우수하다는 것을 확인하였다. 놀랍게도, 근연관계를 갖는 사카로마이세스 세레비지에, 야로위아 리폴리티카, 및 크산토필마로마이세스 덴드로로스 유래의 제라닐제라닐 피로포스페이트 신타아제를 도입하였을 때에는 효과가 미미하였으나, 상대적으로 근연관계가 없는 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 도입하였을 때에는 효과가 현저하였다.
실시예 4. Beta-carotene 15,15'oxygenase(BCO) 유전자 도입주 제작
Yarrowia lipolytica 염색체 상에 해양세균 66A03(Uncultured marine bacterium 66A03) 유래 beta-carotene 15,15'oxygenase(이하, Mb.BCO) 유전자를 삽입하기 위해 Mb.BCO는 UniProtKB(UniProt Knowledgebase)에 등록되어 있는 아미노산 서열(Q4PNI0)에 근거하여 http://atgme.org를 통해 Yarrowia lipolytica에 적합하도록 코돈 최적화한 폴리뉴클레오티드 서열(서열번호 13)을 확보하였다. 상기 Mb.BCO 의 폴리뉴클레오티드를 이용하여 TEFINtp-코돈 최적화된 Mb.BCO-CYC1t(서열번호 14)의 형태로 유전자를 합성하였다. 선별 마커로는 Y. lipolytica의 URA3 유전자(서열번호 5)를 이용하여 KU70(YALI0C08701g) 유전자 위치에 삽입되는 카세트를 디자인 하였다. 합성된 Mb.BCO 및 KCCM12972P genomic DNA를 주형으로 하고 표 7과 같이 서열번호 55 및 서열번호 56, 서열번호 57 및 서열번호 58, 서열번호 59 및 서열번호 60, 서열번호 61 및 서열번호 62, 서열번호 63 및 서열번호 64, 서열번호 65 서열번호 66, 및 서열번호 67 및 서열번호 68의 프라이머를 이용하여 각각 left homologous region, TEFINt promoter, Mb.BCO ORF, CYC1 terminator, URA3, repeat region, 및 right homologous region PCR을 수행하였다. PCR 조건은 변성 95°C, 1분; 어닐링 55°C, 1분; 및 중합반응 72°C, 2분을 35회 반복 수행하였다. 그 결과로 얻어진 DNA 단편들은 overlap extension PCR을 통해 하나의 카세트로 제작하였다.
이렇게 제작된 카세트를 열충격법으로 실시예 2-1 내지 2-4에서 제작한 균주에 각각 도입한 후, 우라실이 포함되지 않은 고체배지(YLMM1)에서 형성된 콜로니를 획득하였다. 서열번호 69와 서열번호 70의 프라이머를 이용하여 게놈 내에 카세트 삽입이 확인된 콜로니들을 5-FOA 고체배지에 도말하여 30°C에서 3일간 배양하였고, 5-FOA 고체 배지에서 형성된 콜로니를 획득함으로써 URA3 마커를 제거하였다.
서열번호 | 서열(5'- 3') |
55 | GGCGTTTCAGGTGGTTGCGTGAGTG |
56 | GACACAAATGCGCCGCCAACCCGGTCTCTGCGGCGGTTCGTGGTTCGTGTTTC |
57 | GAAACACGAACCACGAACCGCCGCAGAGACCGGGTTGGCGGCGCATTTGTGTC |
58 | CAGTCGATCAGCATCAGGCCCTGCGGTTAGTACTGCAAAA |
59 | TTTTGCAGTACTAACCGCAGGGCCTGATGCTGATCGACTG |
60 | AACTAATTACATGActcgaGCTAGTTCTTGATCTTGATTC |
61 | GAATCAAGATCAAGAACTAGCtcgagTCATGTAATTAGTT |
62 | gacgagtcagacaggaggcaGCAAATTAAAGCCTTCGAGCGTCCC |
63 | GGGACGCTCGAAGGCTTTAATTTGCtgcctcctgtctgactcgtc |
64 | AACTAATTACATGActcgaGtggtggtattgtgactgggg |
65 | ccccagtcacaataccaccaCtcgagTCATGTAATTAGTT |
66 | GCAGCAGTCATACATGTTCTGAGGCAAATTAAAGCCTTCGAGCGTCCC |
67 | GGGACGCTCGAAGGCTTTAATTTGCCTCAGAACATGTATGACTGCTGC |
68 | CTACTTTGTGCAGATTGAGGCCAAG |
69 | GTCGTCTGTCTTCTCTTCAG |
70 | CCACCAAGATGGGCAAGAAG |
실시예 5. Beta-carotene 15,15'oxygenase(BCO) 유전자 도입주 레티놀 생산능 비교평가
실시예 4에서 확보한 균주 및 실시예 1에서 확보한 모균주 CC08-1023을 포함하여 총 5종에 대해 플라스크 평가를 진행하였다. 상기 균주를 YPD(Yeast extract-Peptone-Dextrose) 배지 20ml 및 butylated hydroxytoluene 0.05%을 포함하는 250ml 코너-바플 플라스크에 초기 OD 2가 되도록 접종하고 30℃에서 48시간 동안, 200rpm으로 진탕 배양하였다. 배양을 종료한 후, 배양액 1 ml를 원심분리하여 상등액을 제거하였다. 그 다음으로 DMSO(Dimethyl sulfoxide, sigma社) 0.5ml을 넣고 55℃에서 10분 동안 진탕(agitation 2,000rpm)하여 세포를 파쇄하였다. 추가로 아세톤(sigma社) 0.5ml을 첨가하고 45℃에서 15분동안 진탕(agitation, 2,000rpm)하여 레티놀, 레티날, 베타카로틴, 및 스쿠알렌 추출을 진행하였고, HPLC 설비로 각각을 농도 분석하였다. 분석된 레티놀, 레티날, 베타카로틴, 및 스쿠알렌 농도를 측정한 결과를 도 2에 표시하였다.
그 결과, 도 2에서와 같이, CC08-1023 균주에 Mb.BCO를 도입한 균주에서는 레티놀이 측정되지 않았다. 이와 달리 CC08-1023을 기반으로 Hp.GGPPS1, crtEM1, Sc.BTS1, 및 Yl,GGS1를 각각 도입한 후에 Mb.BCO를 도입한 균주 4종에서 각각 8.44mg/L, 2.78mg/L, 0mg/L, 및 4.35mg/L의 레티놀 농도가 측정되었다.
베타카로틴 농도는 상기 균주 5종에서 각각 3.68mg/L, 0.35mg.L, 2.47mg/L, 3.58mg/L, 및 0.98mg/L로 베타카로틴이 레티놀로 전환되어 낮은 베타카로틴 농도를 나타냄을 확인하였다. 또한, 상기 균주 5종에서 스쿠알렌 농도는 각각 309.88mg/L, 202.18mg/L, 282.19mg/L, 306.34mg/L, 및 269.18mg/L로 측정하였다.
이러한 결과를 바탕으로 GGPP 생합성 강화가 레티놀 생산능 증대에 긍정적인 효과가 있음이 확인되었다.
또한, 상기 결과를 통해, Hp.GGPPS1는 베타카로틴 생산, 스쿠알렌 감소, 및 레티놀 생산에 우수한 효과가 있음을 검증하였다.
이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.
<110> CJ CheilJedang Corporation
<120> Microorganism comprising Geranylgeranyl pyrophosphate synthase
derived from Haematococcus pluvialis, for producing carotenoid or
compound in which a precursor thereof is carotenoid, and method
using the same
<130> KPA220049-KR
<160> 103
<170> KoPatentIn 3.0
<210> 1
<211> 1017
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized Hp.GGPPS1 ORF
<400> 1
atgatccgag ccatgcacaa ccgagccccc accccccgaa cccgagtgtc tcacccccga 60
tctcaccgag ccctggccca cgtgtctgcc gtggccaccg ccggccaggt ggccgaggtg 120
cactctgccc ccgccttcga cttcgagatg tacatgcgag accgagccga gatggtgaac 180
aaggccctgg acgccgccct gccctctcga taccccgagg tgctggtgga ctctatgcga 240
tactctgtgc tggccggcgg caagcgagtg cgacccgccc tgaccctggc cgcctgtgac 300
ctggtgggcg gcgacatggc caccgccctg cccaccgcct gtgccatgga gatgatccac 360
accatgtctc tgatccacga cgacctgccc gccatggaca acgacgactt ccgacgaggc 420
cgacccacca accacaaggt gtacggcgag gacatcgcca tcctggccgg cgacgccctg 480
ctgtctttcg ccttcgagca catcgcccga gacaccaagg gcgtgcccgc cgacgccgtg 540
ctgaaggtga tcatggagct gggccgagcc gtgggcgccc agggcctgtc tgccggccag 600
gccgtggaca tcaagtctga gggccaggag gtgggcctgg aggtgctgga gtacatccac 660
caccacaaga ccgccgccct gctggaggcc gccgtggtgt gtggcgccct ggtgggcggc 720
gccgacaccg ccaccgtgga gaagctgcga aagtacgccc tgaacatcgg cctggccttc 780
caggtgatcg acgacatcct ggacgtgacc cagaccaccg agaccctggg caagaccgcc 840
gccaaggacc tggccgtgaa caagaccacc taccccaagc tgctgggcct ggaggcctct 900
cgaaaggtgg ccgacgacct gatccgagag gccatcgccc agctggacga gttcgagccc 960
gcccgaaagg cccccatggt ggccctggcc cacctgatcg gctaccgaaa gaactag 1017
<210> 2
<211> 531
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp promoter
<400> 2
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca g 531
<210> 3
<211> 254
<212> DNA
<213> Artificial Sequence
<220>
<223> CYC1 terminator
<400> 3
ctcgagtcat gtaattagtt atgtcacgct tacattcacg ccctcccccc acatccgctc 60
taaccgaaaa ggaaggagtt agacaacctg aagtctaggt ccctatttat ttttttatag 120
ttatgttagt attaagaacg ttatttatat ttcaaatttt tctttttttt ctgtacagac 180
gcgtgtacgc atgtaacatt atactgaaaa ccttgcttga gaaggttttg ggacgctcga 240
aggctttaat ttgc 254
<210> 4
<211> 1799
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-codon optimized Hp.GGPPS1-CYC1t
<400> 4
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gatccgagcc 540
atgcacaacc gagcccccac cccccgaacc cgagtgtctc acccccgatc tcaccgagcc 600
ctggcccacg tgtctgccgt ggccaccgcc ggccaggtgg ccgaggtgca ctctgccccc 660
gccttcgact tcgagatgta catgcgagac cgagccgaga tggtgaacaa ggccctggac 720
gccgccctgc cctctcgata ccccgaggtg ctggtggact ctatgcgata ctctgtgctg 780
gccggcggca agcgagtgcg acccgccctg accctggccg cctgtgacct ggtgggcggc 840
gacatggcca ccgccctgcc caccgcctgt gccatggaga tgatccacac catgtctctg 900
atccacgacg acctgcccgc catggacaac gacgacttcc gacgaggccg acccaccaac 960
cacaaggtgt acggcgagga catcgccatc ctggccggcg acgccctgct gtctttcgcc 1020
ttcgagcaca tcgcccgaga caccaagggc gtgcccgccg acgccgtgct gaaggtgatc 1080
atggagctgg gccgagccgt gggcgcccag ggcctgtctg ccggccaggc cgtggacatc 1140
aagtctgagg gccaggaggt gggcctggag gtgctggagt acatccacca ccacaagacc 1200
gccgccctgc tggaggccgc cgtggtgtgt ggcgccctgg tgggcggcgc cgacaccgcc 1260
accgtggaga agctgcgaaa gtacgccctg aacatcggcc tggccttcca ggtgatcgac 1320
gacatcctgg acgtgaccca gaccaccgag accctgggca agaccgccgc caaggacctg 1380
gccgtgaaca agaccaccta ccccaagctg ctgggcctgg aggcctctcg aaaggtggcc 1440
gacgacctga tccgagaggc catcgcccag ctggacgagt tcgagcccgc ccgaaaggcc 1500
cccatggtgg ccctggccca cctgatcggc taccgaaaga actagctcga gtcatgtaat 1560
tagttatgtc acgcttacat tcacgccctc cccccacatc cgctctaacc gaaaaggaag 1620
gagttagaca acctgaagtc taggtcccta tttatttttt tatagttatg ttagtattaa 1680
gaacgttatt tatatttcaa atttttcttt tttttctgta cagacgcgtg tacgcatgta 1740
acattatact gaaaaccttg cttgagaagg ttttgggacg ctcgaaggct ttaatttgc 1799
<210> 5
<211> 1533
<212> DNA
<213> Artificial Sequence
<220>
<223> URA3
<400> 5
tgcctcctgt ctgactcgtc attgccgcct ttggagtacg actccaacta tgagtgtgct 60
tggatcactt tgacgataca ttcttcgttg gaggctgtgg gtctgacagc tgcgttttcg 120
gcgcggttgg ccgacaacaa tatcagctgc aacgtcattg ctggctttca tcatgatcac 180
atttttgtcg gcaaaggcga cgcccagaga gccattgacg ttctttctaa tttggaccga 240
tagccgtata gtccagtcta tctataagtt caactaactc gtaactatta ccataacata 300
tacttcactg ccccagataa ggttccgata aaaagttctg cagactaaat ttatttcagt 360
ctcctcttca ccaccaaaat gccctcctac gaagctcgag ctaacgtcca caagtccgcc 420
tttgccgctc gagtgctcaa gctcgtggca gccaagaaaa ccaacctgtg tgcttctctg 480
gatgttacca ccaccaagga gctcattgag cttgccgata aggtcggacc ttatgtgtgc 540
atgatcaaga cccatatcga catcattgac gacttcacct acgccggcac tgtgctcccc 600
ctcaaggaac ttgctcttaa gcacggtttc ttcctgttcg aggacagaaa gttcgcagat 660
attggcaaca ctgtcaagca ccagtacaag aacggtgtct accgaatcgc cgagtggtcc 720
gatatcacca acgcccacgg tgtacccgga accggaatca ttgctggcct gcgagctggt 780
gccgaggaaa ctgtctctga acagaagaag gaggacgtct ctgactacga gaactcccag 840
tacaaggagt tcctggtccc ctctcccaac gagaagctgg ccagaggtct gctcatgctg 900
gccgagctgt cttgcaaggg ctctctggcc actggcgagt actccaagca gaccattgag 960
cttgcccgat ccgaccccga gtttgtggtt ggcttcattg cccagaaccg acctaagggc 1020
gactctgagg actggcttat tctgaccccc ggggtgggtc ttgacgacaa gggagacgct 1080
ctcggacagc agtaccgaac tgttgaggat gtcatgtcta ccggaacgga tatcataatt 1140
gtcggccgag gtctgtacgg ccagaaccga gatcctattg aggaggccaa gcgataccag 1200
aaggctggct gggaggctta ccagaagatt aactgttaga ggttagacta tggatatgtc 1260
atttaactgt gtatatagag agcgtgcaag tatggagcgc ttgttcagct tgtatgatgg 1320
tcagacgacc tgtctgatcg agtatgtatg atactgcaca acctgtgtat ccgcatgatc 1380
tgtccaatgg ggcatgttgt tgtgtttctc gatacggaga tgctgggtac aagtagctaa 1440
tacgattgaa ctacttatac ttatatgagg cttgaagaaa gctgacttgt gtatgactta 1500
ttctcaacta catccccagt cacaatacca cca 1533
<210> 6
<211> 1131
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized crtEM1 ORF
<400> 6
atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60
gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120
ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180
aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240
gtcctcaggc gtgggtcgcc tgtagcccat ctaatttacg ggattccgca gacaataaac 300
actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360
atacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcaaccgt ctcctctgca 420
tcctcctcct cctcggcctc gtctgaaaac gggggcacgt catctcctaa ttcgcagatt 480
ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatgct ttccctccat 540
agagggcaag gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600
tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660
atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720
ttccagatca gggatgacta tatgaacctt cagtcttctg agtatgccca tattaagaat 780
tttgcagagg acctcacaga aggaaaattc agttttccca ctatccactc gattcgtgcc 840
aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900
cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960
gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020
gcagaagcta actcaaagat tgatcttgga gacgtagagt cggaaggaag aacggggaag 1080
aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131
<210> 7
<211> 500
<212> DNA
<213> Artificial Sequence
<220>
<223> TDH3t
<400> 7
ctatccgaag atcaagagcg aagcaagttg taagtccagg acatgtttcc cgcccacgcg 60
agtgatttat aacacctctc ttttttgaca cccgctcgcc ttgaaattca tgtcacataa 120
attatagtca acgacgtttg aataacttgt cttgtagttc gatgatgatc atatgattac 180
attaatagta attactgtat ttgatatata tactaattac aatagtacat attagaacat 240
acaatagtta gtgccgtgaa gtggcttaaa ataccgcgag tcgattacgt aatattatat 300
ataatgtcaa agtggggtcc cagagccgaa gaaggtgctt ttcttgaaga tcccagtgta 360
ttggacaagt atatctgtct ctatgattgt ttttccaggt gaaaatgttg aacaaagtgt 420
ctactggagt ttgtaagcgc tggtgcgact ggggccactt ttaaaacccg ccttagcagg 480
ctttttcacc gttccaagac 500
<210> 8
<211> 2159
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-codon optimized crtEM1-TDH3t
<400> 8
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca ggattacgcg 540
aacatcctca cagcaattcc actcgagttt actcctcagg atgatatcgt gctccttgaa 600
ccgtatcact acctaggaaa gaaccctgga aaagaaattc gatcacaact catcgaggct 660
ttcaactatt ggttggatgt caagaaggag gatctcgagg tcatccagaa cgttgttggc 720
atgctacata ccgctagctt attaatggac gatgtggagg attcatcggt cctcaggcgt 780
gggtcgcctg tagcccatct aatttacggg attccgcaga caataaacac tgcaaactac 840
gtctactttc tggcttatca agagatcttc aagcttcgcc caacaccgat acccatgcct 900
gtaattcctc cttcatctgc ttcgcttcaa tcaaccgtct cctctgcatc ctcctcctcc 960
tcggcctcgt ctgaaaacgg gggcacgtca tctcctaatt cgcagattcc gttctcgaaa 1020
gatacgtatc ttgataaagt gatcacagac gagatgcttt ccctccatag agggcaaggc 1080
ctggagctat tctggagaga tagtctgacg tgtcctagcg aagaggaata tgtgaaaatg 1140
gttcttggaa agacgggagg tttgttccgt atagcggtca gattgatgat ggcaaagtca 1200
gaatgtgaca tagactttgt ccagcttgtc aacttgatct caatatactt ccagatcagg 1260
gatgactata tgaaccttca gtcttctgag tatgcccata ttaagaattt tgcagaggac 1320
ctcacagaag gaaaattcag ttttcccact atccactcga ttcgtgccaa cccctcatcg 1380
agactcgtca tcaatacgtt gcagaagaaa tcgacctctc ctgagatcct tcaccactgt 1440
gtaaactaca tgcgcacaga aacccactca ttcgaatata ctcaggaagt cctcaacacc 1500
ttgtcaggtg cactcgagag agaactagga aggcttcaag gagagttcgc agaagctaac 1560
tcaaagattg atcttggaga cgtagagtcg gaaggaagaa cggggaagaa cgtcaaattg 1620
gaagcgatcc tgaaaaagct agccgatatc cctctgtgac tatccgaaga tcaagagcga 1680
agcaagttgt aagtccagga catgtttccc gcccacgcga gtgatttata acacctctct 1740
tttttgacac ccgctcgcct tgaaattcat gtcacataaa ttatagtcaa cgacgtttga 1800
ataacttgtc ttgtagttcg atgatgatca tatgattaca ttaatagtaa ttactgtatt 1860
tgatatatat actaattaca atagtacata ttagaacata caatagttag tgccgtgaag 1920
tggcttaaaa taccgcgagt cgattacgta atattatata taatgtcaaa gtggggtccc 1980
agagccgaag aaggtgcttt tcttgaagat cccagtgtat tggacaagta tatctgtctc 2040
tatgattgtt tttccaggtg aaaatgttga acaaagtgtc tactggagtt tgtaagcgct 2100
ggtgcgactg gggccacttt taaaacccgc cttagcaggc tttttcaccg ttccaagac 2159
<210> 9
<211> 1008
<212> DNA
<213> Artificial Sequence
<220>
<223> Sc.BTS1 ORF
<400> 9
atggaggcca agatagatga gctgatcaat aatgatcctg tttggtccag ccaaaatgaa 60
agcttgattt caaaacctta taatcacatc cttttgaaac ctggcaagaa ctttagacta 120
aatttaatag ttcaaattaa cagagttatg aatttgccca aagaccagct ggccatagtt 180
tcgcaaattg ttgagctctt gcataattcc agccttttaa tcgacgatat agaagataat 240
gctcccttga gaaggggaca gaccacttct cacttaatct tcggtgtacc ctccactata 300
aacaccgcaa attatatgta tttcagagcc atgcaacttg tatcgcagct aaccacaaaa 360
gagcctttgt atcataattt gattacgatt ttcaacgaag aattgatcaa tctacatagg 420
ggacaaggct tggatatata ctggagagac tttctgcctg aaatcatacc tactcaggag 480
atgtatttga atatggttat gaataaaaca ggcggccttt tcagattaac gttgagactc 540
atggaagcgc tgtctccttc ctcacaccac ggccattcgt tggttccttt cataaatctt 600
ctgggtatta tttatcagat tagagatgat tacttgaatt tgaaagattt ccaaatgtcc 660
agcgaaaaag gctttgctga ggacattaca gaggggaagt tatcttttcc catcgtccac 720
gcccttaact tcactaaaac gaaaggtcaa actgagcaac acaatgaaat tctaagaatt 780
ctcctgttga ggacaagtga taaagatata aaactaaagc tgattcaaat actggaattc 840
gacaccaatt cattggccta caccaaaaat tttattaatc aattagtgaa tatgataaaa 900
aatgataatg aaaataagta tttacctgat ttggcttcgc attccgacac cgccaccaat 960
ttacatgacg aattgttata tataatagac cacttatccg aattgtga 1008
<210> 10
<211> 2036
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-Sc.BTS1-TDH3t
<400> 10
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca ggaggccaag 540
atagatgagc tgatcaataa tgatcctgtt tggtccagcc aaaatgaaag cttgatttca 600
aaaccttata atcacatcct tttgaaacct ggcaagaact ttagactaaa tttaatagtt 660
caaattaaca gagttatgaa tttgcccaaa gaccagctgg ccatagtttc gcaaattgtt 720
gagctcttgc ataattccag ccttttaatc gacgatatag aagataatgc tcccttgaga 780
aggggacaga ccacttctca cttaatcttc ggtgtaccct ccactataaa caccgcaaat 840
tatatgtatt tcagagccat gcaacttgta tcgcagctaa ccacaaaaga gcctttgtat 900
cataatttga ttacgatttt caacgaagaa ttgatcaatc tacatagggg acaaggcttg 960
gatatatact ggagagactt tctgcctgaa atcataccta ctcaggagat gtatttgaat 1020
atggttatga ataaaacagg cggccttttc agattaacgt tgagactcat ggaagcgctg 1080
tctccttcct cacaccacgg ccattcgttg gttcctttca taaatcttct gggtattatt 1140
tatcagatta gagatgatta cttgaatttg aaagatttcc aaatgtccag cgaaaaaggc 1200
tttgctgagg acattacaga ggggaagtta tcttttccca tcgtccacgc ccttaacttc 1260
actaaaacga aaggtcaaac tgagcaacac aatgaaattc taagaattct cctgttgagg 1320
acaagtgata aagatataaa actaaagctg attcaaatac tggaattcga caccaattca 1380
ttggcctaca ccaaaaattt tattaatcaa ttagtgaata tgataaaaaa tgataatgaa 1440
aataagtatt tacctgattt ggcttcgcat tccgacaccg ccaccaattt acatgacgaa 1500
ttgttatata taatagacca cttatccgaa ttgtgactat ccgaagatca agagcgaagc 1560
aagttgtaag tccaggacat gtttcccgcc cacgcgagtg atttataaca cctctctttt 1620
ttgacacccg ctcgccttga aattcatgtc acataaatta tagtcaacga cgtttgaata 1680
acttgtcttg tagttcgatg atgatcatat gattacatta atagtaatta ctgtatttga 1740
tatatatact aattacaata gtacatatta gaacatacaa tagttagtgc cgtgaagtgg 1800
cttaaaatac cgcgagtcga ttacgtaata ttatatataa tgtcaaagtg gggtcccaga 1860
gccgaagaag gtgcttttct tgaagatccc agtgtattgg acaagtatat ctgtctctat 1920
gattgttttt ccaggtgaaa atgttgaaca aagtgtctac tggagtttgt aagcgctggt 1980
gcgactgggg ccacttttaa aacccgcctt agcaggcttt ttcaccgttc caagac 2036
<210> 11
<211> 984
<212> DNA
<213> Artificial Sequence
<220>
<223> Yl.GGS1 ORF
<400> 11
atggattata acagcgcgga tttcaaggag atatggggca aggccgccga caccgcgctg 60
ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120
gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgagaccat ttcgcacatc 180
accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240
cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgcc 300
aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360
tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420
agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480
ggtggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540
catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600
attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660
gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatacg caccaacccg 720
gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780
tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagaggata 840
caggccatgt cactcaaggc aagttcgtac attgatgatc tagcagcagc tggccacgat 900
gtctccaagc tacgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960
aagtactttg aggatgcgca gtga 984
<210> 12
<211> 2012
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-Yl.GGS1-TDH3t
<400> 12
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca ggattataac 540
agcgcggatt tcaaggagat atggggcaag gccgccgaca ccgcgctgct gggaccgtac 600
aactacctcg ccaacaaccg gggccacaac atcagagaac acttgatcgc agcgttcgga 660
gcggttatca aggtggacaa gagcgatctc gagaccattt cgcacatcac caagattttg 720
cataactcgt cgctgcttgt tgatgacgtg gaagacaact cgatgctccg acgaggcctg 780
ccggcagccc attgtctgtt tggagtcccc caaaccatca actccgccaa ctacatgtac 840
tttgtggctc tgcaggaggt gctcaagctc aagtcttatg atgccgtctc cattttcacc 900
gaggaaatga tcaacttgca tagaggtcag ggtatggatc tctactggag agaaacactc 960
acttgcccct cggaagacga gtatctggag atggtggtgc acaagaccgg tggactgttt 1020
cggctggctc tgagacttat gctgtcggtg gcatcgaaac aggaggacca tgaaaagatc 1080
aactttgatc tcacacacct taccgacaca ctgggagtca tttaccagat tctggatgat 1140
tacctcaacc tgcagtccac ggaattgacc gagaacaagg gattctgcga agatatcagc 1200
gaaggaaagt tttcgtttcc gctgattcac agcatacgca ccaacccgga taaccacgag 1260
attctcaaca ttctcaaaca gcgaacaagc gacgcttcac tcaaaaagta cgccgtggac 1320
tacatgagaa cagaaaccaa gagtttcgac tactgcctca agaggataca ggccatgtca 1380
ctcaaggcaa gttcgtacat tgatgatcta gcagcagctg gccacgatgt ctccaagcta 1440
cgagccattt tgcattattt tgtgtccacc tctgactgtg aggagagaaa gtactttgag 1500
gatgcgcagt gactatccga agatcaagag cgaagcaagt tgtaagtcca ggacatgttt 1560
cccgcccacg cgagtgattt ataacacctc tcttttttga cacccgctcg ccttgaaatt 1620
catgtcacat aaattatagt caacgacgtt tgaataactt gtcttgtagt tcgatgatga 1680
tcatatgatt acattaatag taattactgt atttgatata tatactaatt acaatagtac 1740
atattagaac atacaatagt tagtgccgtg aagtggctta aaataccgcg agtcgattac 1800
gtaatattat atataatgtc aaagtggggt cccagagccg aagaaggtgc ttttcttgaa 1860
gatcccagtg tattggacaa gtatatctgt ctctatgatt gtttttccag gtgaaaatgt 1920
tgaacaaagt gtctactgga gtttgtaagc gctggtgcga ctggggccac ttttaaaacc 1980
cgccttagca ggctttttca ccgttccaag ac 2012
<210> 13
<211> 828
<212> DNA
<213> Artificial Sequence
<220>
<223> Codon optimized Mb.BCO ORF
<400> 13
atgggcctga tgctgatcga ctggtgtgcc ctggccctgg tggtgttcat cggcctgccc 60
cacggcgccc tggacgccgc catctctttc tctatgatct cttctgccaa gcgaatcgcc 120
cgactggccg gcatcctgct gatctacctg ctgctggcca ccgccttctt cctgatctgg 180
taccagctgc ccgccttctc tctgctgatc ttcctgctga tctctatcat ccacttcggc 240
atggccgact tcaacgcctc tccctctaag ctgaagtggc cccacatcat cgcccacggc 300
ggcgtggtga ccgtgtggct gcccctgatc cagaagaacg aggtgaccaa gctgttctct 360
atcctgacca acggccccac ccccatcctg tgggacatcc tgctgatctt cttcctgtgt 420
tggtctatcg gcgtgtgtct gcacacctac gagaccctgc gatctaagca ctacaacatc 480
gccttcgagc tgatcggcct gatcttcctg gcctggtacg ccccccccct ggtgaccttc 540
gccacctact tctgtttcat ccactctcga cgacacttct ctttcgtgtg gaagcagctg 600
cagcacatgt cttctaagaa gatgatgatc ggctctgcca tcatcctgtc ttgtacctct 660
tggctgatcg gcggcggcat ctacttcttc ctgaactcta agatgatcgc ctctgaggcc 720
gccctgcaga ccgtgttcat cggcctggcc gccctgaccg tgccccacat gatcctgatc 780
gacttcatct tccgacccca ctcttctcga atcaagatca agaactag 828
<210> 14
<211> 1610
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-codon optimized Mb.BCO-CYC1t
<400> 14
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gggcctgatg 540
ctgatcgact ggtgtgccct ggccctggtg gtgttcatcg gcctgcccca cggcgccctg 600
gacgccgcca tctctttctc tatgatctct tctgccaagc gaatcgcccg actggccggc 660
atcctgctga tctacctgct gctggccacc gccttcttcc tgatctggta ccagctgccc 720
gccttctctc tgctgatctt cctgctgatc tctatcatcc acttcggcat ggccgacttc 780
aacgcctctc cctctaagct gaagtggccc cacatcatcg cccacggcgg cgtggtgacc 840
gtgtggctgc ccctgatcca gaagaacgag gtgaccaagc tgttctctat cctgaccaac 900
ggccccaccc ccatcctgtg ggacatcctg ctgatcttct tcctgtgttg gtctatcggc 960
gtgtgtctgc acacctacga gaccctgcga tctaagcact acaacatcgc cttcgagctg 1020
atcggcctga tcttcctggc ctggtacgcc ccccccctgg tgaccttcgc cacctacttc 1080
tgtttcatcc actctcgacg acacttctct ttcgtgtgga agcagctgca gcacatgtct 1140
tctaagaaga tgatgatcgg ctctgccatc atcctgtctt gtacctcttg gctgatcggc 1200
ggcggcatct acttcttcct gaactctaag atgatcgcct ctgaggccgc cctgcagacc 1260
gtgttcatcg gcctggccgc cctgaccgtg ccccacatga tcctgatcga cttcatcttc 1320
cgaccccact cttctcgaat caagatcaag aactagctcg agtcatgtaa ttagttatgt 1380
cacgcttaca ttcacgccct ccccccacat ccgctctaac cgaaaaggaa ggagttagac 1440
aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta agaacgttat 1500
ttatatttca aatttttctt ttttttctgt acagacgcgt gtacgcatgt aacattatac 1560
tgaaaacctt gcttgagaag gttttgggac gctcgaaggc tttaatttgc 1610
<210> 15
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 15
catcatttca aaagagggaa cagc 24
<210> 16
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 16
cgccgccaac ccggtctctg tgtttggcgg tgtgagttgt c 41
<210> 17
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 17
gacaactcac accgccaaac acagagaccg ggttggcggc g 41
<210> 18
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 18
cggttgtgca tggctcggat ctgcggttag tactgcaaaa agtgc 45
<210> 19
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 19
gcactttttg cagtactaac cgcagatccg agccatgcac aaccg 45
<210> 20
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 20
aactaattac atgactcgag ctagttcttt cggtagccga 40
<210> 21
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 21
tcggctaccg aaagaactag ctcgagtcat gtaattagtt 40
<210> 22
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 22
gacgagtcag acaggaggca gcaaattaaa gccttcgagc 40
<210> 23
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 23
gctcgaaggc tttaatttgc tgcctcctgt ctgactcgtc 40
<210> 24
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 24
aactaattac atgactcgag tggtggtatt gtgactgggg 40
<210> 25
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 25
ccccagtcac aataccacca ctcgagtcat gtaattagtt 40
<210> 26
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 26
ccatatggag tgttatttga aggggcaaat taaagccttc gagc 44
<210> 27
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 27
gctcgaaggc tttaatttgc cccttcaaat aacactccat atgg 44
<210> 28
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Hp.GGPPS1 insertion
<400> 28
ccgatacagt gtccaagtac g 21
<210> 29
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for Hp.GGPPS1 insertion
<400> 29
gagtgtctga agacaaggct tc 22
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for Hp.GGPPS1 insertion
<400> 30
gacgacaatg ctgagctccg 20
<210> 31
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 31
catcatttca aaagagggaa cagc 24
<210> 32
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 32
cgccgccaac ccggtctctg tgtttggcgg tgtgagttgt c 41
<210> 33
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 33
gacaactcac accgccaaac acagagaccg ggttggcggc g 41
<210> 34
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 34
ctgtgaggat gttcgcgtaa tcctgcggtt agtactgcaa aaagtgc 47
<210> 35
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 35
gcactttttg cagtactaac cgcaggatta cgcgaacatc ctcacag 47
<210> 36
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 36
cttcgctctt gatcttcgga tagtcacaga gggatatcgg ctag 44
<210> 37
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 37
ctagccgata tccctctgtg actatccgaa gatcaagagc gaag 44
<210> 38
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 38
gacgagtcag acaggaggca gtcttggaac ggtgaaaaag cctgc 45
<210> 39
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 39
gcaggctttt tcaccgttcc aagactgcct cctgtctgac tcgtc 45
<210> 40
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 40
cgctcttgat cttcggatag tggtggtatt gtgactgggg a 41
<210> 41
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 41
tccccagtca caataccacc actatccgaa gatcaagagc g 41
<210> 42
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 42
catatggagt gttatttgaa ggggtcttgg aacggtgaaa aagcctgc 48
<210> 43
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 43
gcaggctttt tcaccgttcc aagacccctt caaataacac tccatatg 48
<210> 44
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtEM1, Sc. BTS1, or Yl.GGS1
insertion
<400> 44
ccgatacagt gtccaagtac g 21
<210> 45
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for crtEM1, Sc. BTS1, or
Yl.GGS1 insertion
<400> 45
gagtgtctga agacaaggct tc 22
<210> 46
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for crtEM1, Sc. BTS1, or
Yl.GGS1 insertion
<400> 46
gacgacaatg ctgagctccg 20
<210> 47
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Sc. BTS1 insertion
<400> 47
cagctcatct atcttggcct cctgcggtta gtactgcaaa aagtgc 46
<210> 48
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Sc. BTS1 insertion
<400> 48
gcactttttg cagtactaac cgcaggaggc caagatagat gagctg 46
<210> 49
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Sc. BTS1 insertion
<400> 49
cttcgctctt gatcttcgga tagtcacaat tcggataagt ggtctattat atataac 57
<210> 50
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Sc. BTS1 insertion
<400> 50
gttatatata atagaccact tatccgaatt gtgactatcc gaagatcaag agcgaag 57
<210> 51
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Yl.GGS1 insertion
<400> 51
cttgaaatcc gcgctgttat aatcctgcgg ttagtactgc aaaaagtgc 49
<210> 52
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Yl.GGS1 insertion
<400> 52
gcactttttg cagtactaac cgcaggatta taacagcgcg gatttcaag 49
<210> 53
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Yl.GGS1 insertion
<400> 53
cttcgctctt gatcttcgga tagtcactgc gcatcctcaa agtac 45
<210> 54
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Yl.GGS1 insertion
<400> 54
gtactttgag gatgcgcagt gactatccga agatcaagag cgaag 45
<210> 55
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 55
ggcgtttcag gtggttgcgt gagtg 25
<210> 56
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 56
gacacaaatg cgccgccaac ccggtctctg cggcggttcg tggttcgtgt ttc 53
<210> 57
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 57
gaaacacgaa ccacgaaccg ccgcagagac cgggttggcg gcgcatttgt gtc 53
<210> 58
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 58
cagtcgatca gcatcaggcc ctgcggttag tactgcaaaa 40
<210> 59
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 59
ttttgcagta ctaaccgcag ggcctgatgc tgatcgactg 40
<210> 60
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 60
aactaattac atgactcgag ctagttcttg atcttgattc 40
<210> 61
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 61
gaatcaagat caagaactag ctcgagtcat gtaattagtt 40
<210> 62
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 62
gacgagtcag acaggaggca gcaaattaaa gccttcgagc gtccc 45
<210> 63
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 63
gggacgctcg aaggctttaa tttgctgcct cctgtctgac tcgtc 45
<210> 64
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 64
aactaattac atgactcgag tggtggtatt gtgactgggg 40
<210> 65
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 65
ccccagtcac aataccacca ctcgagtcat gtaattagtt 40
<210> 66
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 66
gcagcagtca tacatgttct gaggcaaatt aaagccttcg agcgtccc 48
<210> 67
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 67
gggacgctcg aaggctttaa tttgcctcag aacatgtatg actgctgc 48
<210> 68
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for Mb.BCO insertion
<400> 68
ctactttgtg cagattgagg ccaag 25
<210> 69
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for Mb.BCO insertion
<400> 69
gtcgtctgtc ttctcttcag 20
<210> 70
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for Mb.BCO insertion
<400> 70
ccaccaagat gggcaagaag 20
<210> 71
<211> 2022
<212> DNA
<213> Artificial Sequence
<220>
<223> crtYB derived from X. dendrorhous
<400> 71
atgacggctc tcgcatatta ccagatccat ctgatctata ctctcccaat tcttggtctt 60
ctcggcctgc tcacttcccc gattttgaca aaatttgaca tctacaaaat atcgatcctc 120
gtatttattg cgtttagtgc aaccacacca tgggactcat ggatcatcag aaatggcgca 180
tggacatatc catcagcgga gagtggccaa ggcgtgtttg gaacgtttct agatgttcca 240
tatgaagagt acgctttctt tgtcattcaa accgtaatca ccggcttggt ctacgtcttg 300
gcaactaggc accttctccc atctctcgcg cttcccaaga ctagatcgtc cgccctttct 360
ctcgcgctca aggcgctcat ccctctgccc attatctacc tatttaccgc tcaccccagc 420
ccatcgcccg acccgctcgt gacagatcac tacttctaca tgcgggcact ctccttactc 480
atcaccccac ctaccatgct cttggcagca ttatcaggcg aatatgcttt cgattggaaa 540
agtggccgag caaagtcaac tattgcagca atcatgatcc cgacggtgta tctgatttgg 600
gtagattatg ttgctgtcgg tcaagactct tggtcgatca acgatgagaa gattgtaggg 660
tggaggcttg gaggtgtact acccattgag gaagctatgt tcttcttact gacgaatcta 720
atgattgttc tgggtctgtc tgcctgcgat catactcagg ccctatacct gctacacggt 780
cgaactattt atggcaacaa aaagatgcca tcttcatttc ccctcattac accgcctgtg 840
ctctccctgt tttttagcag ccgaccatac tcttctcagc caaaacgtga cttggaactg 900
gcagtcaagt tgttggagga aaagagccgg agcttttttg ttgcctcggc tggatttcct 960
agcgaagtta gggagaggct ggttggacta tacgcattct gccgggtgac tgatgatctt 1020
atcgactctc ctgaagtatc ttccaacccg catgccacaa ttgacatggt ctccgatttt 1080
cttaccctac tatttgggcc cccgctacac ccttcgcaac ctgacaagat cctttcttcg 1140
cctttacttc ctccttcgca cccttcccga cccacgggaa tgtatcccct cccgcctcct 1200
ccttcgctct cgcctgccga gctcgttcaa ttccttaccg aaagggttcc cgttcaatac 1260
catttcgcct tcaggttgct cgctaagttg caagggctga tccctcgata cccactcgac 1320
gaactcctta gaggatacac cactgatctt atctttccct tatcgacaga ggcagtccag 1380
gctcggaaga cgcctatcga gaccacagct gacttgctgg actatggtct atgtgtagca 1440
ggctcagtcg ccgagctatt ggtctatgtc tcttgggcaa gtgcaccaag tcaggtccct 1500
gccaccatag aagaaagaga agctgtgtta gtggcaagcc gagagatggg aactgccctt 1560
cagttggtga acattgctag ggacattaaa ggggacgcaa cagaagggag attttaccta 1620
ccactctcat tctttggtct tcgggatgaa tcaaagcttg cgatcccgac tgattggacg 1680
gaacctcggc ctcaagattt cgacaaactc ctcagtctat ctccttcgtc cacattacca 1740
tcttcaaacg cctcagaaag cttccggttc gaatggaaga cgtactcgct tccattagtc 1800
gcctacgcag aggatcttgc caaacattct tataagggaa ttgaccgact tcctaccgag 1860
gttcaagcgg gaatgcgagc ggcttgcgcg agctacctac tgatcggccg agagatcaaa 1920
gtcgtttgga aaggagacgt cggagagaga aggacagttg ccggatggag gagagtacgg 1980
aaagtcttga gtgtggtcat gagcggatgg gaagggcagt aa 2022
<210> 72
<211> 1749
<212> DNA
<213> Artificial Sequence
<220>
<223> crtI derived from X. dendrorhous
<400> 72
atgggaaaag aacaagatca ggataaaccc acagctatca tcgtgggatg tggtatcggt 60
ggaatcgcca ctgccgctcg tcttgctaaa gaaggtttcc aggtcacggt gttcgagaag 120
aacgactact ccggaggtcg atgctcttta atcgagcgag atggttatcg attcgatcag 180
gggcccagtt tgctgctctt gccagatctc ttcaagcaga cattcgaaga tttgggagag 240
aagatggaag attgggtcga tctcatcaag tgtgaaccca actatgtttg ccacttccac 300
gatgaagaga ctttcactct ttcaaccgac atggcgttgc tcaagcggga agtcgagcgt 360
tttgaaggca aagatggatt tgatcggttc ttgtcgttta tccaagaagc ccacagacat 420
tacgagcttg ctgtcgttca cgtcctgcag aagaacttcc ctggcttcgc agcattctta 480
cggctacagt tcattggcca aatcctggct cttcacccct tcgagtctat ctggacaaga 540
gtttgtcgat atttcaagac cgacagatta cgaagagtct tctcgtttgc agtgatgtac 600
atgggtcaaa gcccatacag tgcgcccgga acatattcct tgctccaata caccgaattg 660
accgagggca tctggtatcc gagaggaggc ttttggcagg ttcctaatac tcttcttcag 720
atcgtcaagc gcaacaatcc ctcagccaag ttcaatttca acgctccagt ttcccaggtt 780
cttctctctc ctgccaagga ccgagcgact ggtgttcgac ttgaatccgg cgaggaacat 840
cacgccgatg ttgtgattgt caatgctgac ctcgtttacg cctccgagca cttgattcct 900
gacgatgcca gaaacaagat tggccaactg ggtgaagtca agagaagttg gtgggctgac 960
ttagttggtg gaaagaagct caagggaagt tgcagtagtt tgagcttcta ctggagcatg 1020
gaccgaatcg tggacggtct gggcggacac aatatcttct tggccgagga cttcaaggga 1080
tcattcgaca caatcttcga ggagttgggt ctcccagccg atccttcctt ttacgtgaac 1140
gttccctcgc gaatcgatcc ttctgccgct cccgaaggca aagatgctat cgtcattctt 1200
gtgccgtgtg gccatatcga cgcttcgaac cctcaagatt acaacaagct tgttgctcgg 1260
gcaaggaagt ttgtgatcca cacgctttcc gccaagcttg gacttcccga ctttgaaaaa 1320
atgattgtgg cagagaaggt tcacgatgct ccctcttggg agaaagaatt caacctcaag 1380
gacggaagca tcttgggact ggctcacaac tttatgcaag ttcttggttt caggccgagc 1440
accagacatc ccaagtatga caagttgttc tttgtcgggg cttcgactca tcccggaact 1500
ggggttccca tcgtcttggc tggagccaag ttaactgcca accaagttct cgaatccttt 1560
gaccgatccc cagctccaga tcccaatatg tcactctccg taccatatgg aaaacctctc 1620
aaatcaaatg gaacgggtat cgattctcag gtccagctga agttcatgga tttggagaga 1680
tgggtatacc ttttggtgtt gttgattggg gccgtgatcg ctcgatccgt tggtgttctt 1740
gctttctga 1749
<210> 73
<211> 2804
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-crtYB-CYC1t
<400> 73
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gacggctctc 540
gcatattacc agatccatct gatctatact ctcccaattc ttggtcttct cggtctgctc 600
acttccccga ttttgacaaa atttgacatc tacaaaatat cgatcctcgt atttattgcg 660
tttagtgcaa ccacaccatg ggactcatgg atcatcagaa atggcgcatg gacatatcca 720
tcagcggaga gtggccaagg cgtgtttgga acgtttctag atgttccata tgaagagtac 780
gctttctttg tcattcaaac cgtaatcacc ggcttggtct acgtcttggc aactaggcac 840
cttctcccat ctctcgcgct tcccaagact agatcgtccg ccctttctct cgcgctcaag 900
gcgctcatcc ctctgcccat tatctaccta tttaccgctc accccagccc atcgcccgac 960
ccgctcgtga cagatcacta cttctacatg cgggcactct ccttactcat caccccacct 1020
accatgctct tggcagcatt atcaggcgaa tatgctttcg attggaaaag tggccgagca 1080
aagtcaacta ttgcagcaat catgatcccg acggtgtatc tgatttgggt agattatgtt 1140
gctgtcggtc aagactcttg gtcgatcaac gatgagaaga ttgtagggtg gaggcttgga 1200
ggtgtactac ccattgagga agctatgttc ttcttactga cgaatctaat gattgttctg 1260
ggtctgtctg cctgcgatca tactcaggcc ctatacctgc tacacggtcg aactatttat 1320
ggcaacaaaa agatgccatc ttcatttccc ctcattacac cgcctgtgct ctccctgttt 1380
tttagcagcc gaccatactc ttctcagcca aaacgtgact tggaactggc agtcaagttg 1440
ttggaggaaa agagccggag cttttttgtt gcctcggctg gatttcctag cgaagttagg 1500
gagaggctgg ttggactata cgcattctgc cgggtgactg atgatcttat cgactctcct 1560
gaagtatctt ccaacccgca tgccacaatt gacatggtct ccgattttct taccctacta 1620
tttgggcccc cgctacaccc ttcgcaacct gacaagatcc tttcttcgcc tttacttcct 1680
ccttcgcacc cttcccgacc cacgggaatg tatcccctcc cgcctcctcc ttcgctctcg 1740
cctgccgagc tcgttcaatt ccttaccgaa agggttcccg ttcaatacca tttcgccttc 1800
aggttgctcg ctaagttgca agggctgatc cctcgatacc cactcgacga actccttaga 1860
ggatacacca ctgatcttat ctttccttta tcgacagagg cagtccaggc tcggaagacg 1920
cctatcgaga ccacagctga cttgctggac tatggtctat gtgtagcagg ctcagtcgcc 1980
gagctattgg tctatgtctc ttgggcaagt gcaccaagtc aggtccctgc caccatagaa 2040
gaaagagaag ctgtgttagt ggcaagccga gagatgggaa ctgcccttca gttggtgaac 2100
attgctaggg acattaaagg ggacgcaaca gaagggagat tttacctacc actctcattc 2160
tttggtcttc gggatgaatc aaagcttgcg atcccgactg attggacgga acctcggcct 2220
caagatttcg acaaactcct cagtctatct ccttcgtcca cattaccatc ttcaaacgcc 2280
tcagaaagct tccggttcga atggaagacg tactcgcttc cattagtcgc ctacgcagag 2340
gatcttgcca aacattctta taagggaatt gaccgacttc ctaccgaggt tcaagcggga 2400
atgcgagcgg cttgcgcgag ctacctactg atcggccgag agatcaaagt cgtttggaaa 2460
ggagacgtcg gagagagaag gacagttgcc ggatggagga gagtacggaa agtcttgagt 2520
gtggtcatga gcggatggga agggcagtaa ctcgagtcat gtaattagtt atgtcacgct 2580
tacattcacg ccctcccccc acatccgctc taaccgaaaa ggaaggagtt agacaacctg 2640
aagtctaggt ccctatttat ttttttatag ttatgttagt attaagaacg ttatttatat 2700
ttcaaatttt tctttttttt ctgtacagac gcgtgtacgc atgtaacatt atactgaaaa 2760
ccttgcttga gaaggttttg ggacgctcga aggctttaat ttgc 2804
<210> 74
<211> 2531
<212> DNA
<213> Artificial Sequence
<220>
<223> TEFINtp-crtI-CYC1t
<400> 74
agagaccggg ttggcggcgc atttgtgtcc caaaaaacag ccccaattgc cccaattgac 60
cccaaattga cccagtagcg ggcccaaccc cggcgagagc ccccttctcc ccacatatca 120
aacctccccc ggttcccaca cttgccgtta agggcgtagg gtactgcagt ctggaatcta 180
cgcttgttca gactttgtac tagtttcttt gtctggccat ccgggtaacc catgccggac 240
gcaaaataga ctactgaaaa tttttttgct ttgtggttgg gactttagcc aagggtataa 300
aagaccaccg tccccgaatt acctttcctc ttcttttctc tctctccttg tcaactcaca 360
cccgaaatcg ttaagcattt ccttctgagt ataagaatca ttcaaaatgg tgagtttcag 420
aggcagcagc aattgccacg ggctttgagc acacggccgg gtgtggtccc attcccatcg 480
acacaagacg ccacgtcatc cgaccagcac tttttgcagt actaaccgca gggaaaagaa 540
caagatcagg ataaacccac agctatcatc gtgggatgtg gtatcggtgg aatcgccact 600
gccgctcgtc ttgctaaaga aggtttccag gtcacggtgt tcgagaagaa cgactactcc 660
ggaggtcgat gctctttaat cgagcgagat ggttatcgat tcgatcaggg gcccagtttg 720
ctgctcttgc cagatctctt caagcagaca ttcgaagatt tgggagagaa gatggaagat 780
tgggtcgatc tcatcaagtg tgaacccaac tatgtttgcc acttccacga tgaagagact 840
ttcactcttt caaccgacat ggcgttgctc aagcgggaag tcgagcgttt tgaaggcaaa 900
gatggatttg atcggttctt gtcgtttatc caagaagccc acagacatta cgagcttgct 960
gtcgttcacg tcctgcagaa gaacttccct ggcttcgcag cattcttacg gctacagttc 1020
attggccaaa tcctggctct tcaccccttc gagtctatct ggacaagagt ttgtcgatat 1080
ttcaagaccg acagattacg aagagtcttc tcgtttgcag tgatgtacat gggtcaaagc 1140
ccatacagtg cgcccggaac atattccttg ctccaataca ccgaattgac cgagggcatc 1200
tggtatccga gaggaggctt ttggcaggtt cctaatactc ttcttcagat cgtcaagcgc 1260
aacaatccct cagccaagtt caatttcaac gctccagttt cccaggttct tctctctcct 1320
gccaaggacc gagcgactgg tgttcgactt gaatccggcg aggaacatca cgccgatgtt 1380
gtgattgtca atgctgacct cgtttacgcc tccgagcact tgattcctga cgatgccaga 1440
aacaagattg gccaactggg tgaagtcaag agaagttggt gggctgactt agttggtgga 1500
aagaagctca agggaagttg cagtagtttg agcttctact ggagcatgga ccgaatcgtg 1560
gacggtctgg gcggacacaa tatcttcttg gccgaggact tcaagggatc attcgacaca 1620
atcttcgagg agttgggtct cccagccgat ccttcctttt acgtgaacgt tccctcgcga 1680
atcgatcctt ctgccgctcc cgaaggcaaa gatgctatcg tcattcttgt gccgtgtggc 1740
catatcgacg cttcgaaccc tcaagattac aacaagcttg ttgctcgggc aaggaagttt 1800
gtgatccaca cgctttccgc caagcttgga cttcccgact ttgaaaaaat gattgtggca 1860
gagaaggttc acgatgctcc ctcttgggag aaagaattca acctcaagga cggaagcatc 1920
ttgggactgg ctcacaactt tatgcaagtt cttggtttca ggccgagcac cagacatccc 1980
aagtatgaca agttgttctt tgtcggggct tcgactcatc ccggaactgg ggttcccatc 2040
gtcttggctg gagccaagtt aactgccaac caagttctcg aatcctttga ccgatcccca 2100
gctccagatc ccaatatgtc actctccgta ccatatggaa aacctctcaa atcaaatgga 2160
acgggtatcg attctcaggt ccagctgaag ttcatggatt tggagagatg ggtatacctt 2220
ttggtattgt tgattggggc cgtgatcgct cgatccgttg gtgttcttgc tttctgactc 2280
gagtcatgta attagttatg tcacgcttac attcacgccc tccccccaca tccgctctaa 2340
ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta 2400
tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg tacagacgcg 2460
tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga cgctcgaagg 2520
ctttaatttg c 2531
<210> 75
<211> 1533
<212> DNA
<213> Artificial Sequence
<220>
<223> URA3 derived from Y. lipolytica
<400> 75
tgcctcctgt ctgactcgtc attgccgcct ttggagtacg actccaacta tgagtgtgct 60
tggatcactt tgacgataca ttcttcgttg gaggctgtgg gtctgacagc tgcgttttcg 120
gcgcggttgg ccgacaacaa tatcagctgc aacgtcattg ctggctttca tcatgatcac 180
atttttgtcg gcaaaggcga cgcccagaga gccattgacg ttctttctaa tttggaccga 240
tagccgtata gtccagtcta tctataagtt caactaactc gtaactatta ccataacata 300
tacttcactg ccccagataa ggttccgata aaaagttctg cagactaaat ttatttcagt 360
ctcctcttca ccaccaaaat gccctcctac gaagctcgag ctaacgtcca caagtccgcc 420
tttgccgctc gagtgctcaa gctcgtggca gccaagaaaa ccaacctgtg tgcttctctg 480
gatgttacca ccaccaagga gctcattgag cttgccgata aggtcggacc ttatgtgtgc 540
atgatcaaga cccatatcga catcattgac gacttcacct acgccggcac tgtgctcccc 600
ctcaaggaac ttgctcttaa gcacggtttc ttcctgttcg aggacagaaa gttcgcagat 660
attggcaaca ctgtcaagca ccagtacaag aacggtgtct accgaatcgc cgagtggtcc 720
gatatcacca acgcccacgg tgtacccgga accggaatca ttgctggcct gcgagctggt 780
gccgaggaaa ctgtctctga acagaagaag gaggacgtct ctgactacga gaactcccag 840
tacaaggagt tcctggtccc ctctcccaac gagaagctgg ccagaggtct gctcatgctg 900
gccgagctgt cttgcaaggg ctctctggcc actggcgagt actccaagca gaccattgag 960
cttgcccgat ccgaccccga gtttgtggtt ggcttcattg cccagaaccg acctaagggc 1020
gactctgagg actggcttat tctgaccccc ggggtgggtc ttgacgacaa gggagacgct 1080
ctcggacagc agtaccgaac tgttgaggat gtcatgtcta ccggaacgga tatcataatt 1140
gtcggccgag gtctgtacgg ccagaaccga gatcctattg aggaggccaa gcgataccag 1200
aaggctggct gggaggctta ccagaagatt aactgttaga ggttagacta tggatatgtc 1260
atttaactgt gtatatagag agcgtgcaag tatggagcgc ttgttcagct tgtatgatgg 1320
tcagacgacc tgtctgatcg agtatgtatg atactgcaca acctgtgtat ccgcatgatc 1380
tgtccaatgg ggcatgttgt tgtgtttctc gatacggaga tgctgggtac aagtagctaa 1440
tacgattgaa ctacttatac ttatatgagg cttgaagaaa gctgacttgt gtatgactta 1500
ttctcaacta catccccagt cacaatacca cca 1533
<210> 76
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 76
gtgcgcttct ctcgtctcgg taaccctgtc 30
<210> 77
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 77
atgcgccgcc aacccggtct ctggggtgtg gtggatgggg tgtg 44
<210> 78
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 78
cacaccccat ccaccacacc ccagagaccg ggttggcggc gcat 44
<210> 79
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 79
cgccgccaac ccggtctctt gaagacgaaa gggcctccg 39
<210> 80
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 80
cggaggccct ttcgtcttca agagaccggg ttggcggcg 39
<210> 81
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 81
gacgagtcag acaggaggca tcagacagat actcgtcgcg 40
<210> 82
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 82
cgcgacgagt atctgtctga tgcctcctgt ctgactcgtc 40
<210> 83
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 83
atgacgagtc agacaggagg catggtggta ttgtgactgg ggat 44
<210> 84
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 84
atccccagtc acaataccac catgcctcct gtctgactcg tcat 44
<210> 85
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 85
cggcgtcctt ctcgtagtcc gcttttggtg gtgaagagga gact 44
<210> 86
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 86
agtctcctct tcaccaccaa aagcggacta cgagaaggac gccg 44
<210> 87
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for crtYB-crtI insertion
<400> 87
ccactcgtca ccaacagtgc cgtgtgttgc 30
<210> 88
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for crtYB-crtI insertion
<400> 88
tcgtacgtct ataccaacag atgg 24
<210> 89
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for crtYB-crtI insertion
<400> 89
cgcatacaca cacactgccg gggg 24
<210> 90
<211> 550
<212> DNA
<213> Artificial Sequence
<220>
<223> HMGR native promoter region
<400> 90
tccacacgtc gttctttttt ccttagcctt ttttgcagtg cgcgtgtccc aaaccccagc 60
tctacacacc agcacaaaca aagttaagct cagggttgtc gttgaggtcg cttactgtag 120
tcagtgctcg tatggttcgt tcaattttcg ccaaaaatcg ttttgccttt gtatcttggg 180
aataacatca actgtggttc ttcaacaggc ctaaggaacg aaacaagccg gaccaagatc 240
aggttcaagg tgagtactga gaaggaatag aaggcctaaa ggcgcaaacc gacaggtggc 300
aacagctcca caccgaccac gaaggccacg aaatcaaggg gtcctaaagt tagtctttgt 360
ggcctcgacg gtcagcgaaa acgcgagacc acaacgcgat cagaaccagg acctaaacaa 420
cacaggacgg ggtcacaata ggcttgaaca gcaagtacaa gctgtgatct ctctatattt 480
gattctcaaa ccacccctga ctacttcagc gcctctgtga cacagccccc ctatcatccg 540
actaacacag 550
<210> 91
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 91
gacaatgcct cgaggaggtt taaaagtaac t 31
<210> 92
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 92
gcgccgccaa cccggtctct ctgtgttagt cggatgatag g 41
<210> 93
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 93
cctatcatcc gactaacaca gagagaccgg gttggcggcg c 41
<210> 94
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 94
gacgagtcag acaggaggca ctgcggttag tactgcaaaa ag 42
<210> 95
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 95
ctttttgcag tactaaccgc agtgcctcct gtctgactcg tc 42
<210> 96
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 96
atgcgccgcc aacccggtct cttggtggta ttgtgactgg ggat 44
<210> 97
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 97
atccccagtc acaataccac caagagaccg ggttggcggc gcat 44
<210> 98
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 98
ctttccaata gctgcttgta gctgcggtta gtactgcaaa a 41
<210> 99
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 99
ttttgcagta ctaaccgcag ctacaagcag ctattggaaa g 41
<210> 100
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to prepare cassette for HMGR enhancement
<400> 100
gcttaatgtg attgatctca aacttgatag 30
<210> 101
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for HMGR enhancement
<400> 101
gctgtctctg cgagagcacg tcga 24
<210> 102
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer to confirm insertion of cassette for HMGR enhancement
<400> 102
ggttcgcaca acttctcggg tggc 24
<210> 103
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Hp.GGPP
<400> 103
Met Ile Arg Ala Met His Asn Arg Ala Pro Thr Pro Arg Thr Arg Val
1 5 10 15
Ser His Pro Arg Ser His Arg Ala Leu Ala His Val Ser Ala Val Ala
20 25 30
Thr Ala Gly Gln Val Ala Glu Val His Ser Ala Pro Ala Phe Asp Phe
35 40 45
Glu Met Tyr Met Arg Asp Arg Ala Glu Met Val Asn Lys Ala Leu Asp
50 55 60
Ala Ala Leu Pro Ser Arg Tyr Pro Glu Val Leu Val Asp Ser Met Arg
65 70 75 80
Tyr Ser Val Leu Ala Gly Gly Lys Arg Val Arg Pro Ala Leu Thr Leu
85 90 95
Ala Ala Cys Asp Leu Val Gly Gly Asp Met Ala Thr Ala Leu Pro Thr
100 105 110
Ala Cys Ala Met Glu Met Ile His Thr Met Ser Leu Ile His Asp Asp
115 120 125
Leu Pro Ala Met Asp Asn Asp Asp Phe Arg Arg Gly Arg Pro Thr Asn
130 135 140
His Lys Val Tyr Gly Glu Asp Ile Ala Ile Leu Ala Gly Asp Ala Leu
145 150 155 160
Leu Ser Phe Ala Phe Glu His Ile Ala Arg Asp Thr Lys Gly Val Pro
165 170 175
Ala Asp Ala Val Leu Lys Val Ile Met Glu Leu Gly Arg Ala Val Gly
180 185 190
Ala Gln Gly Leu Ser Ala Gly Gln Ala Val Asp Ile Lys Ser Glu Gly
195 200 205
Gln Glu Val Gly Leu Glu Val Leu Glu Tyr Ile His His His Lys Thr
210 215 220
Ala Ala Leu Leu Glu Ala Ala Val Val Cys Gly Ala Leu Val Gly Gly
225 230 235 240
Ala Asp Thr Ala Thr Val Glu Lys Leu Arg Lys Tyr Ala Leu Asn Ile
245 250 255
Gly Leu Ala Phe Gln Val Ile Asp Asp Ile Leu Asp Val Thr Gln Thr
260 265 270
Thr Glu Thr Leu Gly Lys Thr Ala Ala Lys Asp Leu Ala Val Asn Lys
275 280 285
Thr Thr Tyr Pro Lys Leu Leu Gly Leu Glu Ala Ser Arg Lys Val Ala
290 295 300
Asp Asp Leu Ile Arg Glu Ala Ile Ala Gln Leu Asp Glu Phe Glu Pro
305 310 315 320
Ala Arg Lys Ala Pro Met Val Ala Leu Ala His Leu Ile Gly Tyr Arg
325 330 335
Lys Asn
Claims (12)
- 헤마토코쿠스 플루비알리스(Haematococcus pluvialis) 유래의 제라닐제라닐 피로포스페이트 신타아제(Geranylgeranyl pyrophosphate synthase)를 발현하는, 카로티노이드 또는 이를 전구체로 하는 물질의 생산능을 갖는, 야로위아 속 미생물.
- 제1항에 있어서, 상기 제라닐제라닐 피로포스페이트 신타아제는 서열번호 103의 아미노산 서열로 이루어진 것인, 야로위아 속 미생물.
- 제1항에 있어서, 상기 제라닐제라닐 피로포스페이트 신타아제는 서열번호 1의 염기서열로 이루어진 폴리뉴클레오티드에 의해 코딩되는 것인, 야로위아 속 미생물.
- 제1항에 있어서, 상기 야로위아 속 미생물은 야로위아 리폴리티카인 것인, 야로위아 속 미생물.
- 제1항에 있어서, 상기 카로티노이드를 전구체로 하는 물질은 레티노이드인 것인, 야로위아 속 미생물.
- 제1항에 있어서, 상기 카로티노이드는 베타카로틴인 것인, 야로위아 속 미생물.
- 제5항에 있어서, 상기 레티노이드는 레티놀인 것인, 야로위아 속 미생물.
- 제1항에 있어서, 상기 야로위아 속 미생물은 부산물 생산능이 감소된 것인, 야로위아 속 미생물.
- 제8항에 있어서, 상기 부산물은 스쿠알렌인 것인, 야로위아 속 미생물.
- 제1항 내지 제9항 중 어느 한 항에 따른 야로위아 속 미생물을 배지에서 배양하는 단계; 및 상기 야로위아 속 미생물 또는 배지로부터 카로티노이드 또는 이를 전구체로 하는 물질을 회수하는 단계를 포함하는, 카로티노이드 또는 이를 전구체로 하는 물질 생산방법.
- 제10항에 있어서, 상기 야로위아 속 미생물이 생산한 베타카로틴을 베타카로틴 이외의 카로티노이드로 전환하는 단계; 또는
상기 야로위아 속 미생물이 생산한 레티놀을 레티놀 이외의 레티노이드로 전환하는 단계를 추가로 포함하는 것인, 카로티노이드 또는 이를 전구체로 하는 물질 생산방법.
- 제1항 내지 제9항 중 어느 한 항의 야로위아 속 미생물 또는 이의 배양물을 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산용 조성물.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220036258A KR20230138333A (ko) | 2022-03-23 | 2022-03-23 | 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법 |
PCT/KR2022/011049 WO2023182583A1 (ko) | 2022-03-23 | 2022-07-27 | 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220036258A KR20230138333A (ko) | 2022-03-23 | 2022-03-23 | 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230138333A true KR20230138333A (ko) | 2023-10-05 |
Family
ID=88101186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220036258A KR20230138333A (ko) | 2022-03-23 | 2022-03-23 | 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20230138333A (ko) |
WO (1) | WO2023182583A1 (ko) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101299567B1 (ko) * | 2010-12-02 | 2013-08-23 | 아주대학교산학협력단 | 아젤라잔틴a 대사회로의 구축 및 대장균을 통한 아젤라잔틴a의 합성 |
EP2935570B1 (en) * | 2012-12-20 | 2018-09-19 | DSM IP Assets B.V. | Carotene hydroxylase and its use for producing carotenoids |
KR102098170B1 (ko) * | 2018-09-21 | 2020-04-09 | 한국생산기술연구원 | 베타카로틴을 생산하는 미생물 및 이를 이용한 베타카로틴의 생산방법 |
KR102202606B1 (ko) * | 2018-11-30 | 2021-01-15 | (주)바이오스플래시 | 바이오레티놀을 생산하는 미생물 및 이를 이용한 바이오레티놀의 생산방법 |
-
2022
- 2022-03-23 KR KR1020220036258A patent/KR20230138333A/ko unknown
- 2022-07-27 WO PCT/KR2022/011049 patent/WO2023182583A1/ko unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023182583A1 (ko) | 2023-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102143964B1 (ko) | 신규한 분지쇄 아미노산 아미노트랜스퍼라제 변이체 및 이를 이용한 류신 생산방법 | |
KR102277408B1 (ko) | 신규한 포르메이트 의존성 포스포리보실글리신아미드 포밀 전이효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102277407B1 (ko) | 신규한 글루타메이트 합성 효소 서브 유니트 알파 변이체 및 이를 이용한 l-글루탐산 생산 방법 | |
KR102274484B1 (ko) | 신규한 f0f1 atp 합성효소 서브유닛 알파 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102277409B1 (ko) | 신규한 2중기능성 포스포리보실아미노이미다졸카르복사미드 포밀트랜스퍼라아제/imp 사이클로하이드롤라아제 변이체 및 이를 이용한 imp 생산 방법 | |
KR102267931B1 (ko) | 신규한 5-(카르복시아미노)이미다졸리보뉴클레오티드합성효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102273640B1 (ko) | 신규한 f0f1 atp 합성효소 서브유닛 감마 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR102273639B1 (ko) | 신규한 이중기능성 메틸렌테트라히드로폴레이트 탈수소효소/메테닐테트라하이드로폴레이트 사이클로하이드롤라아제 변이체 및 이를 이용한 xmp 또는 gmp 생산 방법 | |
KR20230138333A (ko) | 헤마토코쿠스 플루비알리스 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법 | |
KR20230138332A (ko) | 두날리엘라 살리나 유래의 제라닐제라닐 피로포스페이트 신타아제를 포함하는 카로티노이드 또는 이를 전구체로 하는 물질 생산 미생물 및 이를 이용한 카로티노이드 또는 레티노이드 생산방법 | |
KR102600520B1 (ko) | 제라닐제라닐 피로포스페이트 신타아제 변이체 및 이를 이용한 테트라테르펜, 이의 전구체, 및 테트라테르펜을 전구체로 하는 물질의 생산방법 | |
KR102611977B1 (ko) | 신규한 베타-카로틴 15,15 -옥시게네이즈 변이체 및 이를 이용한 레티노이드 생산방법 | |
KR102279137B1 (ko) | 신규한 아데닌 포스포리보실기 전이효소 변이체 및 이를 이용한 imp 생산 방법 | |
KR102665227B1 (ko) | 고농도 l-글루탐산을 생산하기 위한 균주 및 이를 이용한 l-글루탐산 생산방법 | |
RU2792640C1 (ru) | Новый вариант глицеральдегид-3-фосфатдегидрогеназы и способ получения l-валина с его применением | |
EP4092115B1 (en) | Novel dihydrolipoamide acetyltransferase variant and method for producing l-valine using same | |
EP4067484B1 (en) | Novel galactoside o-acetyltransferase variant, and method for producing l-glutamic acid using same | |
RU2793436C1 (ru) | Новый вариант сахарофосфат-изомеразы/эпимеразы и способ получения l-лизина с его применением | |
RU2794484C1 (ru) | Новый вариант dahp синтазы и способ получения l-лизина с его применением | |
KR102281371B1 (ko) | 신규한 글리세르알데히드-3-인산탈수소효소 변이체 및 이를 이용한 l-발린 생산 방법 | |
RU2794550C1 (ru) | "Новый вариант субъединиц гамма и тау ДНК-полимеразы III и способ получения L-лизина с его применением" | |
EP4050101B1 (en) | Novel phytoene synthase variant and method for producing xmp or gmp using same | |
RU2793368C1 (ru) | Новый вариант регулятора транскрипции и способ получения L-валина с его применением | |
KR102712136B1 (ko) | 바이오틴 신타제 활성을 갖는 폴리펩티드 변이체 및 이를 이용한 바이오틴 생산 방법 | |
EP4092114B1 (en) | Novel 2-isopropylmalate synthase variant and method for producing l-valine using same |