CN115996757A - 用于在产油酵母中表达基因的通用基因表达系统 - Google Patents
用于在产油酵母中表达基因的通用基因表达系统 Download PDFInfo
- Publication number
- CN115996757A CN115996757A CN202180041599.1A CN202180041599A CN115996757A CN 115996757 A CN115996757 A CN 115996757A CN 202180041599 A CN202180041599 A CN 202180041599A CN 115996757 A CN115996757 A CN 115996757A
- Authority
- CN
- China
- Prior art keywords
- seq
- promoter
- sequence
- plasmid
- gene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims description 180
- 230000014509 gene expression Effects 0.000 title claims description 81
- 240000004808 Saccharomyces cerevisiae Species 0.000 title abstract description 36
- 241000235015 Yarrowia lipolytica Species 0.000 claims abstract description 130
- 238000000034 method Methods 0.000 claims abstract description 37
- 241000221523 Rhodotorula toruloides Species 0.000 claims abstract description 35
- 239000013612 plasmid Substances 0.000 claims description 89
- 150000007523 nucleic acids Chemical group 0.000 claims description 68
- 230000001939 inductive effect Effects 0.000 claims description 59
- 108091026890 Coding region Proteins 0.000 claims description 53
- 230000002103 transcriptional effect Effects 0.000 claims description 49
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 48
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 45
- 239000003550 marker Substances 0.000 claims description 36
- 238000011144 upstream manufacturing Methods 0.000 claims description 27
- 238000013518 transcription Methods 0.000 claims description 25
- 230000035897 transcription Effects 0.000 claims description 25
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 20
- 108091005804 Peptidases Proteins 0.000 claims description 18
- 230000002457 bidirectional effect Effects 0.000 claims description 17
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 15
- 108020004707 nucleic acids Proteins 0.000 claims description 14
- 102000039446 nucleic acids Human genes 0.000 claims description 14
- 102000035195 Peptidases Human genes 0.000 claims description 11
- 101710196315 High affinity copper uptake protein 1 Proteins 0.000 claims description 10
- 235000019833 protease Nutrition 0.000 claims description 10
- 230000010076 replication Effects 0.000 claims description 10
- 241000588724 Escherichia coli Species 0.000 claims description 9
- 102100031577 High affinity copper uptake protein 1 Human genes 0.000 claims description 9
- 101150068888 MET3 gene Proteins 0.000 claims description 9
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 claims description 9
- 102100031145 Probable low affinity copper uptake protein 2 Human genes 0.000 claims description 9
- 101710095010 Probable low affinity copper uptake protein 2 Proteins 0.000 claims description 9
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 claims description 9
- 102100036976 X-ray repair cross-complementing protein 6 Human genes 0.000 claims description 9
- 101710124907 X-ray repair cross-complementing protein 6 Proteins 0.000 claims description 9
- 238000012217 deletion Methods 0.000 claims description 9
- 230000037430 deletion Effects 0.000 claims description 9
- 229920001184 polypeptide Polymers 0.000 claims description 9
- 108010051219 Cre recombinase Proteins 0.000 claims description 8
- 238000003776 cleavage reaction Methods 0.000 claims description 8
- 101100533228 Drosophila melanogaster Jon99Cii gene Proteins 0.000 claims description 7
- 230000007017 scission Effects 0.000 claims description 7
- 101150106567 ser1 gene Proteins 0.000 claims description 7
- 101000712600 Homo sapiens Thyroid hormone receptor beta Proteins 0.000 claims description 6
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 claims description 5
- 108091008146 restriction endonucleases Proteins 0.000 claims description 5
- 239000002773 nucleotide Substances 0.000 claims description 4
- 125000003729 nucleotide group Chemical group 0.000 claims description 4
- 239000003242 anti bacterial agent Substances 0.000 claims description 2
- 230000003115 biocidal effect Effects 0.000 claims description 2
- 239000003112 inhibitor Substances 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 62
- 239000010949 copper Substances 0.000 description 49
- 239000013604 expression vector Substances 0.000 description 45
- 108020004414 DNA Proteins 0.000 description 41
- 102000004169 proteins and genes Human genes 0.000 description 35
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 34
- 239000000047 product Substances 0.000 description 30
- 235000018102 proteins Nutrition 0.000 description 29
- 239000013598 vector Substances 0.000 description 22
- 239000004164 Wax ester Substances 0.000 description 20
- 235000019386 wax ester Nutrition 0.000 description 20
- 241000723792 Tobacco etch virus Species 0.000 description 19
- 230000000694 effects Effects 0.000 description 19
- 238000004519 manufacturing process Methods 0.000 description 17
- 150000001413 amino acids Chemical group 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 229940024606 amino acid Drugs 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 14
- 230000037361 pathway Effects 0.000 description 14
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 239000012634 fragment Substances 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 10
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 10
- 101150050575 URA3 gene Proteins 0.000 description 10
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 108091032917 Transfer-messenger RNA Proteins 0.000 description 9
- 238000010367 cloning Methods 0.000 description 9
- 229920001817 Agar Polymers 0.000 description 8
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 8
- 239000004365 Protease Substances 0.000 description 8
- 239000008272 agar Substances 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 7
- 230000003213 activating effect Effects 0.000 description 7
- 230000004913 activation Effects 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 150000002191 fatty alcohols Chemical class 0.000 description 7
- 230000006698 induction Effects 0.000 description 7
- 238000012269 metabolic engineering Methods 0.000 description 7
- 235000019419 proteases Nutrition 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 102100031780 Endonuclease Human genes 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 6
- 101150096566 clpX gene Proteins 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 238000012224 gene deletion Methods 0.000 description 6
- 238000010353 genetic engineering Methods 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 5
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 5
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 241001648840 Thosea asigna virus Species 0.000 description 5
- 101150074451 clpP gene Proteins 0.000 description 5
- 101150043719 clpP1 gene Proteins 0.000 description 5
- 101150102296 clpP2 gene Proteins 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 229910052802 copper Inorganic materials 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 229940035893 uracil Drugs 0.000 description 5
- 101001123535 Caenorhabditis elegans Phosphoethanolamine N-methyltransferase 2 Proteins 0.000 description 4
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 4
- 235000000177 Indigofera tinctoria Nutrition 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- 101001123534 Nicotiana tabacum Putrescine N-methyltransferase 2 Proteins 0.000 description 4
- 241000709664 Picornaviridae Species 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 229960000074 biopharmaceutical Drugs 0.000 description 4
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid group Chemical class C(CC(O)(C(=O)O)CC(=O)O)(=O)O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 238000003209 gene knockout Methods 0.000 description 4
- 229940097275 indigo Drugs 0.000 description 4
- COHYTHOBJLSHDF-UHFFFAOYSA-N indigo powder Natural products N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 4
- 230000002401 inhibitory effect Effects 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 229930014626 natural product Natural products 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 230000000754 repressing effect Effects 0.000 description 4
- RYALZZFZNGJXAF-AKGNYEKSSA-N 16(S)-glutathionyl-17(R)-hydroxy-(4Z,7Z,10,12,14,19Z)-docosahexaenoic acid Chemical compound CC\C=C/C[C@@H](O)[C@@H](SC[C@H](NC(=O)CC[C@H](N)C(O)=O)C(=O)NCC(O)=O)C=CC=CC=CC\C=C/C\C=C/CCC(O)=O RYALZZFZNGJXAF-AKGNYEKSSA-N 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- 229920002299 Cellodextrin Polymers 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- FFEARJCKVFRZRR-UHFFFAOYSA-N L-Methionine Natural products CSCCC(N)C(O)=O FFEARJCKVFRZRR-UHFFFAOYSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- 229930195722 L-methionine Natural products 0.000 description 3
- 102000003792 Metallothionein Human genes 0.000 description 3
- 108090000157 Metallothionein Proteins 0.000 description 3
- 108010091086 Recombinases Proteins 0.000 description 3
- 102000018120 Recombinases Human genes 0.000 description 3
- 241000201640 Yarrowia lipolytica PO1f Species 0.000 description 3
- FYGDTMLNYKFZSV-ZWSAEMDYSA-N cellotriose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-ZWSAEMDYSA-N 0.000 description 3
- ARUVKPQLZAKDPS-UHFFFAOYSA-L copper(II) sulfate Chemical compound [Cu+2].[O-][S+2]([O-])([O-])[O-] ARUVKPQLZAKDPS-UHFFFAOYSA-L 0.000 description 3
- 229910000366 copper(II) sulfate Inorganic materials 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000037353 metabolic pathway Effects 0.000 description 3
- 229960004452 methionine Drugs 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 2
- WUKLNYKELYBPSU-XFTLILIKSA-N 16(S)-glycinylcystein-S-yl-17(R)-hydroxy-(4Z,7Z,10,12,14,19Z)-docosahexaenoic acid Chemical compound CC\C=C/C[C@@H](O)[C@@H](SC[C@H](N)C(=O)NCC(O)=O)C=CC=CC=CC\C=C/C\C=C/CCC(O)=O WUKLNYKELYBPSU-XFTLILIKSA-N 0.000 description 2
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 2
- 108020005065 3' Flanking Region Proteins 0.000 description 2
- 108020005029 5' Flanking Region Proteins 0.000 description 2
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000214054 Equine rhinitis A virus Species 0.000 description 2
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 2
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- 101000589873 Homo sapiens Parathyroid hormone/parathyroid hormone-related peptide receptor Proteins 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 241000221961 Neurospora crassa Species 0.000 description 2
- 101150084130 OGDH gene Proteins 0.000 description 2
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 2
- 239000005642 Oleic acid Substances 0.000 description 2
- 102100032256 Parathyroid hormone/parathyroid hormone-related peptide receptor Human genes 0.000 description 2
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 2
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 2
- 235000004433 Simmondsia californica Nutrition 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 241000566589 Tyto alba Species 0.000 description 2
- 229910052770 Uranium Inorganic materials 0.000 description 2
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 235000015165 citric acid Nutrition 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- JAZBEHYOTPTENJ-UHFFFAOYSA-N eicosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O JAZBEHYOTPTENJ-UHFFFAOYSA-N 0.000 description 2
- 229960005135 eicosapentaenoic acid Drugs 0.000 description 2
- 235000020673 eicosapentaenoic acid Nutrition 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000009483 enzymatic pathway Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- 235000021472 generally recognized as safe Nutrition 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 2
- 150000002894 organic compounds Chemical class 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- YPJUNDFVDDCYIH-UHFFFAOYSA-N perfluorobutyric acid Chemical compound OC(=O)C(F)(F)C(F)(F)C(F)(F)F YPJUNDFVDDCYIH-UHFFFAOYSA-N 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- -1 rRNA Proteins 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000001718 repressive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 229960001153 serine Drugs 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000004936 stimulating effect Effects 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 208000011908 tetrasomy Diseases 0.000 description 2
- 229960002898 threonine Drugs 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 229960004295 valine Drugs 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- BCXBRXMGDFMQHD-UHFFFAOYSA-N 2-hexadecyl-3-oxoicosanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(=O)C(C(O)=O)CCCCCCCCCCCCCCCC BCXBRXMGDFMQHD-UHFFFAOYSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- 102000006589 Alpha-ketoglutarate dehydrogenase Human genes 0.000 description 1
- 108020004306 Alpha-ketoglutarate dehydrogenase Proteins 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 241000351920 Aspergillus nidulans Species 0.000 description 1
- JEBFVOLFMLUKLF-IFPLVEIFSA-N Astaxanthin Natural products CC(=C/C=C/C(=C/C=C/C1=C(C)C(=O)C(O)CC1(C)C)/C)C=CC=C(/C)C=CC=C(/C)C=CC2=C(C)C(=O)C(O)CC2(C)C JEBFVOLFMLUKLF-IFPLVEIFSA-N 0.000 description 1
- 101100434663 Bacillus subtilis (strain 168) fbaA gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 101100443211 Caenorhabditis elegans ogdh-2 gene Proteins 0.000 description 1
- 101100408676 Caenorhabditis elegans pmt-1 gene Proteins 0.000 description 1
- 101100408682 Caenorhabditis elegans pmt-2 gene Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108091004554 Copper Transport Proteins Proteins 0.000 description 1
- 102000037773 Copper transporters Human genes 0.000 description 1
- 108091006566 Copper transporters Proteins 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 108050004099 Diacylglycerol O-acyltransferase 1 Proteins 0.000 description 1
- 102100036869 Diacylglycerol O-acyltransferase 1 Human genes 0.000 description 1
- 101710088335 Diacylglycerol acyltransferase/mycolyltransferase Ag85A Proteins 0.000 description 1
- 101710088334 Diacylglycerol acyltransferase/mycolyltransferase Ag85B Proteins 0.000 description 1
- 101710088427 Diacylglycerol acyltransferase/mycolyltransferase Ag85C Proteins 0.000 description 1
- 239000004386 Erythritol Substances 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 101710089384 Extracellular protease Proteins 0.000 description 1
- 101150095274 FBA1 gene Proteins 0.000 description 1
- 108010022535 Farnesyl-Diphosphate Farnesyltransferase Proteins 0.000 description 1
- 208000014770 Foot disease Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101150081655 GPM1 gene Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000881168 Homo sapiens SPARC Proteins 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 101150021155 LIP2 gene Proteins 0.000 description 1
- 244000178870 Lavandula angustifolia Species 0.000 description 1
- 235000010663 Lavandula angustifolia Nutrition 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100490437 Mus musculus Acvrl1 gene Proteins 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 229910000672 PPGI Inorganic materials 0.000 description 1
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 1
- 241000283249 Physeteridae Species 0.000 description 1
- 101000621511 Potato virus M (strain German) RNA silencing suppressor Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101100027926 Rattus norvegicus Ogdh gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 241000223252 Rhodotorula Species 0.000 description 1
- 241000223253 Rhodotorula glutinis Species 0.000 description 1
- 102100037599 SPARC Human genes 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 241000221095 Simmondsia Species 0.000 description 1
- 244000044822 Simmondsia californica Species 0.000 description 1
- 102100037997 Squalene synthase Human genes 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000187389 Streptomyces lavendulae Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108700005085 Switch Genes Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010039538 alanyl-glycyl-aspartyl-valine Proteins 0.000 description 1
- 229930013930 alkaloid Natural products 0.000 description 1
- 150000003797 alkaloid derivatives Chemical class 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- HMTAHNDPLDKYJT-CBBWQLFWSA-N amorpha-4,11-diene Chemical compound C1=C(C)CC[C@H]2[C@H](C)CC[C@@H](C(C)=C)[C@H]21 HMTAHNDPLDKYJT-CBBWQLFWSA-N 0.000 description 1
- HMTAHNDPLDKYJT-UHFFFAOYSA-N amorphadiene Natural products C1=C(C)CCC2C(C)CCC(C(C)=C)C21 HMTAHNDPLDKYJT-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- BLUAFEHZUWYNDE-NNWCWBAJSA-N artemisinin Chemical compound C([C@](OO1)(C)O2)C[C@H]3[C@H](C)CC[C@@H]4[C@@]31[C@@H]2OC(=O)[C@@H]4C BLUAFEHZUWYNDE-NNWCWBAJSA-N 0.000 description 1
- 229930101531 artemisinin Natural products 0.000 description 1
- 229960004191 artemisinin Drugs 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- MQZIGYBFDRPAKN-ZWAPEEGVSA-N astaxanthin Chemical compound C([C@H](O)C(=O)C=1C)C(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)C(=O)[C@@H](O)CC1(C)C MQZIGYBFDRPAKN-ZWAPEEGVSA-N 0.000 description 1
- 239000001168 astaxanthin Substances 0.000 description 1
- 229940022405 astaxanthin Drugs 0.000 description 1
- 235000013793 astaxanthin Nutrition 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- 108010047754 beta-Glucosidase Proteins 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 239000001055 blue pigment Substances 0.000 description 1
- 101150033407 bpsA gene Proteins 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910052793 cadmium Inorganic materials 0.000 description 1
- BDOSMKKIYDKNTQ-UHFFFAOYSA-N cadmium atom Chemical compound [Cd] BDOSMKKIYDKNTQ-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 150000001991 dicarboxylic acids Chemical class 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- QYDYPVFESGNLHU-UHFFFAOYSA-N elaidic acid methyl ester Natural products CCCCCCCCC=CCCCCCCCC(=O)OC QYDYPVFESGNLHU-UHFFFAOYSA-N 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 229940009714 erythritol Drugs 0.000 description 1
- UNXHWFMMPAWVPI-ZXZARUISSA-N erythritol Chemical compound OC[C@H](O)[C@H](O)CO UNXHWFMMPAWVPI-ZXZARUISSA-N 0.000 description 1
- 235000019414 erythritol Nutrition 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 102000005970 fatty acyl-CoA reductase Human genes 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 101150084612 gpmA gene Proteins 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 108090001018 hexadecanal dehydrogenase (acylating) Proteins 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 229930002839 ionone Natural products 0.000 description 1
- 150000002499 ionone derivatives Chemical class 0.000 description 1
- 229940119170 jojoba wax Drugs 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 239000001102 lavandula vera Substances 0.000 description 1
- 235000018219 lavender Nutrition 0.000 description 1
- 239000002029 lignocellulosic biomass Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- QYDYPVFESGNLHU-KHPPLWFESA-N methyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC QYDYPVFESGNLHU-KHPPLWFESA-N 0.000 description 1
- 229940073769 methyl oleate Drugs 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 229930001119 polyketide Natural products 0.000 description 1
- 150000003881 polyketide derivatives Chemical class 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000011044 succinic acid Nutrition 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-N succinic acid group Chemical group C(CCC(=O)O)(=O)O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 239000010698 whale oil Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
- C12N2830/002—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/22—Cysteine endopeptidases (3.4.22)
- C12Y304/22044—Nuclear-inclusion-a endopeptidase (3.4.22.44)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Mycology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明公开了一种用于在包括解脂耶氏酵母和圆红冬孢酵母在内的产油酵母中表达多基因产物的新系统和方法。更具体地,本公开提供了在解脂耶氏酵母中有功能的新型启动子,其可用于生产范围广泛的生物产品。
Description
相关申请的交叉引用
本申请要求分别于2020年4月10日和2021年2月9日提交的美国临时专利申请号63/008,098和63/147,352的优先权,其公开内容明确并入本文。
政府权利
本发明是在政府支持下根据美国农业部国家食品和农业研究所授予的拨款/合同编号2019-31100-06053进行的。政府对本发明享有某些权利。
以电子方式提交的材料的引用并入
与本文一起提交的计算机可读的核苷酸/氨基酸序列表通过引用整体并入,其标识如下:26 KB ASCII(文本)文件,名为“335006_ST25”,创建于2021年4月6日。
背景技术
作为一种普遍认为安全(GRAS)的生物体,非传统酵母解脂耶氏酵母(Yarrowialipolytica)已被广泛使用和代谢改造以生产一系列可再生化学品和油脂化学品,包括脂肪醇、长链二羧酸,有机酸酸,包括琥珀酸和柠檬酸,聚酮化合物三乙酸内酯(TAL)和甜味剂赤藓糖醇。解脂耶氏酵母的合成生物学进一步使菌株能够产生有价值的天然产物,包括二十碳五烯酸(EPA)、虾青素和紫罗兰酮。目前已开发出一套遗传操作工具,包括营养缺陷型选择标记、用于靶向过表达和荧光标记的优化GFP,以及同源重组频率增加的Ku70缺失菌株。由于启动子在对于以最佳水平和特定时间控制基因表达的代谢工程中起到至关重要的作用,因此已经在解脂耶氏酵母中进行了天然启动子的表征和工程化。包括PFBA1、PTDH1、PGPM1、PTEF和PFBA1IN在内的各种天然启动子已被表征为组成型启动子,并已用于解脂耶氏酵母的代谢工程以生产不同的产品。通过添加上游激活序列(UAS)的串联拷贝,可以增强这些启动子中的一些(例如PTEF)的活性。除了组成型启动子外,还表征了生长阶段诱导型启动子hp4d、细胞色素P450基因(alk1)的正烷烃诱导型启动子、lip2和pox2的油酸或油酸甲酯诱导型启动子。然而,这些诱导型启动子的激活需要通过添加不同的碳源(主要是疏水性底物)作为诱导物来显著改变培养条件,并且这些启动子的活性受到培养基中葡萄糖的抑制,因此限制了它们的广泛应用。
除诱导型启动子外,阻抑型启动子也可用于调节和控制解脂耶氏酵母中的基因表达,以用于生产不同产品。具体而言,不是使基因缺失,而是可使阻抑型启动子通过使用特定的化学或环境因素来阻抑型启动子失活以达到抑制靶基因表达。阻抑型启动子对于代谢工程控制代谢通量非常有用,特别是当由于靶基因与细胞活力相关的基本功能而无法使该基因缺失时。例如,甲硫氨酸阻抑型启动子PMET3用于在酿酒酵母(Saccharomycescerevisiae)中抑制角鲨烯合酶的表达,并将通量引入青蒿素前体紫穗槐二烯(amorphadiene)的生物合成中。包括PTHR1、PMET3和PSER1在内的一组启动子已被表征为酿酒酵母和甲基营养酵母毕赤酵母(Pichia pastoris)中的阻抑型启动子。然而,没有关于解脂耶氏酵母的阻抑型启动子的公开报道。
圆红冬孢酵母(Rhodosporidium toruloides)也被称为Rhodosporidiumtoruloides(anamorph,Rhodotorula glutinis)是另一种重要的产油酵母,并且由于其高脂肪产量、对木质纤维素生物质水解产物中存在的抑制性化合物的耐受性以及其利用C5糖的能力,其引起了广泛关注。除了微生物脂质生产外,它还经过基因改造以生产脂肪醇和蓝色色素靛蓝。包括PPGI、PPGK、PFBA、PTPI和PGPD在内的多种组成型启动子已经从圆红冬孢酵母基因组中表征。异源途径的多框架工程可以提高成功生产天然产物的机会,并且宿主独立表达系统将进一步能够在不同框架生物体中快速构建。然而,还没有关于在解脂耶氏酵母和圆红冬孢酵母中均有功能的启动子的报道。
随着合成生物学的发展,已经实施了精细的方案和复杂的工程来重建人工生物系统,包括具有17个亚基的大蛋白复合物的表达、重新设计的细菌微区室细胞器(例如CO2固定羧基体)和模块化信号转导系统(例如细胞中的G蛋白偶联受体(GPCR)信号)。特别是,降解和生物合成途径都涉及多个基因来完成生化功能。为了让酿酒酵母产生植物来源的生物碱胡豆苷,在酵母菌株中表达21个外源基因。为了发现和设计天然产物生物合成,通过在异源宿主中的特征调控部分下表达目的基因来重构生物合成基因簇(BGC)。在细菌中,多个基因可以组织成一个合成的操纵子,并且其表达可以很容易地通过核糖体结合位点(RBS)进行调整。相反,为了构建真核生物中的通路,将BGS中的每个基因都克隆到上游(启动子)和下游(转录终止子)区域之间,然后将表达盒引入宿主。因此,不断需要表达多个基因的新工具来更有效地设计真核细胞工厂。
为了能够在真核生物中方便地表达多个基因,小核糖核酸病毒的2A肽已被用于模式生物酿酒酵母、甲基营养型酵母毕赤酵母和真菌构巢曲霉中。使用已知的自剪接2A肽,多顺反子基因可以翻译成肽并在翻译过程中“切割”。来自小核糖核酸病毒的2A肽已成功用于在多种真核细胞(包括真菌、植物、昆虫和哺乳动物)中表达异源基因。然而,来自包括马鼻炎A病毒(E2A)、人口蹄疫病毒(F2A)、猪捷申病毒-1(P2A)和明脉扁刺蛾(Thosea asigna)病毒(T2A)在内的不同病毒的由约20个氨基酸组成的2A肽表现出不同的切割效率,并且2A肽的功能未在产油酵母解脂耶氏酵母中进行测试。此外,使用2A肽的主要缺点之一是将部分消化的2A肽序列添加到蛋白质的C末端,从而干扰酶活性。据观察,在多顺反子构建体中与2A肽相连的基因的顺序对通路生产力有很大影响。最后,构建由用2A序列分隔的所有单个基因组成的多顺反子片段仍然费时费力。
在建立用于重要的工业相关菌株解脂耶氏酵母和圆红冬孢酵母的遗传操作的分子工具箱方面已经取得了实质性进展,然而,迄今已知的已开发表达系统具有许多缺点和局限性。
(a)解脂耶氏酵母中表征的诱导型启动子主要对疏水底物例如补充的油酸有响应,但被在培养基中的葡萄糖所抑制。这些启动子的应用受到限制,因为它需要碳源的剧烈变化。
(b)阻抑型启动子已被用作下调基因表达的重要工具。然而,在解脂耶氏酵母中没有报道这样的阻抑型启动子。
(c)要构建通用的基因表达系统,需要在不同菌株中发挥作用的启动子。尽管在工业相关生物解脂耶氏酵母和圆红冬孢酵母中已经表征了广泛的启动子,但没有发现在解脂耶氏酵母和圆红冬孢酵母二者中具有功能的报告基因。
(d)自剪接2A肽已被用作构建多顺反子转录本以在真核生物中表达多个基因的强大工具,但尚未探索其在解脂耶氏酵母中的应用。
(e)部分消化的2A肽序列将附加到蛋白质的C末端,因此可靠的表达系统的开发必须消除此附加短肽序列的干扰。
(f)使用传统的克隆方法开发由2A肽序列介导的多个基因组成的多顺反子构建体是一项劳动密集型过程。一种无缝组装由2A序列组成的基因片段的新方法可以促进大型多顺反子结构的构建。
本申请提供了方法和组合物,包括用于在产油酵母解脂耶氏酵母和圆红冬孢酵母中表达多个基因的表达载体。
发明内容
本公开涉及用于制备编码多个基因以调节包括解脂耶氏酵母和圆红冬孢酵母在内的产油酵母的酶促途径的核酸构建体的新系统和方法。这些含油酵母已成为通过合成生物学生产广泛生物产品的新型微生物基础。然而,目前可用于操作产油酵母的工具并不是最佳的。
根据本公开的一个实施方案,从解脂耶氏酵母中分离了六种具有双向功能的铜诱导型启动子和五种阻抑型启动子并用于表达载体中。本文公开的两种阻抑型启动子(SEQID NO:10-11)在非阻抑条件下显示出与强组成型启动子相比相对较高的活性,但可以通过在解脂耶氏酵母中补充低含量的Cu2+来几乎完全抑制。
根据一个实施方案,本文公开的Cu2+诱导型启动子,包括SEQ ID NOs:1-6的启动子序列,可以被工程化以通过可操作地连接串联的上游激活序列(UAS)来提高每个相应启动子的强度。这种工程化的启动子被成功地用于构建一种比天然Cu2+诱导型启动子和组成型启动子二者更高效的途径来生产新型高价值生物产品蜡酯。已通过修饰天然启动子圆红冬孢酵母(修饰的RtGPD;SEQ ID NO:21)开发了在解脂耶氏酵母和圆红冬孢酵母二者中有功能的合成启动子。通过使用来自小核糖核酸病毒的“自切割”2A肽序列,本文公开了一种精心制作但易于组装的载体系统,以在单个启动子的控制下方便地表达多个基因。总而言之,这些共同努力促进了一种新型遗传操作系统的开发,该系统可以方便地在解脂耶氏酵母和圆红冬孢酵母二者中表达多个基因,而无需依赖宿主的优化。它是适用于在选定的微生物宿主中进行多基因表达的强大工具。
根据一个实施方案,提供了在解脂耶氏酵母中有功能的新型诱导型和阻抑型启动子。这些包括包含选自SEQ ID NO:1-6的序列的Cu2+诱导型启动子,包含选自SEQ ID NO:7-9的序列的氨基酸阻抑型启动子和包含选自SEQ ID NO:10-11的序列的Cu2+阻抑型启动子。
根据一个实施方案,提供了转录元件,其包含启动子和可操作地连接到所述启动子的多接头,使得当编码序列通过多接头的核酸内切酶限制性位点之一插入多接头位点时,编码序列可操作地连接到启动子并且能够被所述启动子转录。在一个实施方案中,启动子包含选自由SEQ ID NO:1(PMT-1)、SEQ ID NO:2(PMT-2)、SEQ ID NO:3(PMT-3)、SEQ ID NO:4(PMT-4)、SEQ ID NO:5(PMT-5)、SEQ ID NO:6(PMT-6)、SEQ ID NO:7(PTHR1)、SEQ ID NO:8(PMET3)、SEQ ID NO:9(PSER1)、SEQ ID NO:10(PCTR1)和SEQ ID NO:11(PCTR2)组成的组的核酸序列,或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的核酸序列具有至少95%序列同一性的核酸序列,其中,启动子可操作地连接至多接头序列。在一个实施方案中,转录元件进一步包含用于表达插入多接头位点的编码序列所需的额外调节元件,包括上游激活序列、核糖体结合位点(RBS)(在酵母中,通常称为Kozak序列)、转录终止序列和聚腺苷酸化识别序列。
在一个实施方案中,转录元件的启动子是Cu2+诱导型启动子,其包含选自由SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的序列,任选地,其中诱导型启动子具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个UAS序列,其位于串联阵列的上游并且可操作地连接至所述启动子序列,任选地其中所述UAS序列包含SEQ ID NO:12的序列。
在一个实施方案中,转录元件的启动子是阻抑型启动子,其包含选自由SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的序列,任选地其中阻抑型启动子包含SEQ ID NO:10或SEQ ID NO:11的序列。
在一个实施方案中,转录元件被形成为质粒并且进一步包含选择标记基因和在解脂耶氏酵母和圆红冬孢酵母中起作用的复制起点以及任选地在大肠杆菌中起作用的第二复制起点。转录元件可进一步包含一系列串联重复的2A多肽编码核酸序列,每个序列在2A多肽编码核酸序列之前具有其自身独特的限制性位点,用于插入编码序列,其将编码序列可操作地连接至转录元件的启动子和其各自的2A多肽编码核酸序列。
在一个实施方案中,2A多肽编码核酸序列编码包含序列GSGEGRGSLLTCGDVEENPGP(SEQ ID NO:13)或GSGATNFSLLKQAGDVEENPGP(SEQ ID NO:14)的多肽,任选地,其中2A多肽编码核酸序列包含SEQ ID NO:15的序列。
在一个实施方案中,转录元件进一步包含编码TEV肽酶的核酸,任选地其中编码TEV肽酶的基因受诱导型启动子调节,任选地其中编码TEV肽酶的基因可操作地连接至作为多顺反子编码区的一部分的转录元件的诱导型启动子。编码TEV的基因的表达允许去除连接到由可操作地连接到转录元件启动子的多顺反子区域表达的蛋白质的C末端的部分2A肽。这种切割消除了由自切割后剩余的残留2A多肽引起的干扰,并增加了表达系统的可靠性。
分离和工程化的启动子可用作新的标准部件,以促进这一重要生物体的代谢工程和合成生物学。根据一个实施方案,本文公开的转录元件用于转化产油酵母解脂耶氏酵母和圆红冬孢酵母以改造细胞以产生所需产物。因此,本发明涵盖包含本文申请的任何转录元件的宿主细胞,其中,诱导型或阻抑型启动子可操作地连接至异源编码序列。更特别地,宿主细胞是解脂耶氏酵母或圆红冬孢酵母细胞,并且任选地宿主细胞是Ku70缺失菌株。在这种情况下,本申请还涵盖用于以可靠且方便的方式在产油酵母解脂耶氏酵母和圆红冬孢酵母中表达多个基因的方法和载体系统。平台中嵌入的独特方法克服了与解脂耶氏酵母和圆红冬孢酵母中多个基因的表达相关的技术挑战,用于构建导致生物燃料和天然产物生物合成的复杂途径。
根据本申请,提供了一组分子生物学工具用于非常规酵母解脂耶氏酵母的遗传操作。本申请的一个实施方案涉及一种工具箱套件,其包括易于组装和充分表征的遗传单元,包括标记、启动子、终止子和其他必要部分。该试剂盒的可用性通过开发用于生产多种生物基产品的重组菌株得到验证。通过使用工具箱套件,简化了程序,以允许对解脂耶氏酵母进行方便、标准化和可扩展的遗传操作,为解脂耶氏酵母中的基因表达、缺失和整合提供一站式综合工具。
附图说明
图1A和1B是表达元件的示意图,其包含启动子,该启动子可操作地连接至包含一系列独特的核酸内切酶限制性位点(图1A中的E1、E2和E3;以及图1B中的E1、E2、E3、E4、E5和E6)的多顺反子区域,这些核酸内切酶限制性位点中可以插入基因产物的编码序列。E1-E6中的每一个之后是2A编码序列,任选地之后是TEV基因。单一载体中元件的这种新组合允许快速构建用于解脂耶氏酵母和圆红冬孢酵母二者的多基因途径。
图2是呈现数据的条形图,其显示了具有和不具有0.2mM Cu2+诱导的六个克隆启动子PMT-1至PMT-6(分别为SEQ ID NO:1-6)的强度。通过使用在缺乏亮氨酸的合成培养基上生长5小时的细胞,实施LacZ测定以量化启动子的强度。
图3是呈现数据的条形图,其显示了在添加和不添加氨基酸的情况下包括PTHR1(SEQ ID NO:7)、PMET3(SEQ ID NO:8)和PSER1(SEQ ID NO:9)在内的三个启动子的强度。氨基酸为L-苏氨酸(Thr)、L-缬氨酸(Val)、L-甲硫氨酸(Met)和L-丝氨酸(Ser),最终含量范围为0.5至10mM。
图4是呈现数据的条形图,其显示了在添加和不添加Cu2+的情况下包括PCTR1(SEQID NO:10)和PCTR2(SEQ ID NO:11)在内的两个启动子的强度。启动子PTEF用作对照以比较强度。
图5是呈现数据的条形图,其显示了在存在和不存在Cu2+的情况下随着添加到PMT-2启动子上游的UAS拷贝数增加(范围从2到48)的PMT-2启动子的强度。
图6是显示在添加各种浓度的Cu2+的情况下天然启动子PMT-2和通过引入16个拷贝的UAS改造的修饰的(PMT-2-UAS16)的强度的图。
图7是呈现数据的条形图,其显示了由使用PMT-2启动子驱动MmWS表达并在40g/L葡萄糖上生长四天的重组体产生的脂肪醇(C16-C18)和WE的含量(详情参见实施方案5)。
图8是呈现数据的条形图,其显示在解脂耶氏酵母中测量的来自圆红冬孢酵母的包括PPGK、PFBA、PTPI和PGPD在内的四种充分表征的启动子的强度。在PTPI和PPGK上游添加16个拷贝的UAS显著增强了启动子在解脂耶氏酵母中的活性。
图9是开发的表达载体pYaliHex的示意图。
图10是用于克隆基因和组装多顺反子构建体的一种程序的示意图。
图11A-11C呈现关于在具有和不具有编码2A肽的序列的构建体中解脂耶氏酵母中GFP和红色荧光蛋白(RFP)的表达的数据。图11A是质粒pF2的示意图,其编码来自真菌粗糙脉孢菌(Neurospora crassa)的没有2A肽的纤维糊精转运蛋白(CDT1)的GFP融合体。图11B是质粒pSX30的示意图,其编码具有间插的2A肽的纤维糊精转运蛋白(CDT1)的GFP融合体。图11C是显示包含质粒pF2(16.7g/L)的重组体和包含质粒pSX30(20g/L)的重组体在纤维二糖上生长时的生长性能的图。
图12是表达载体pYLexp2的示意图。该载体包含启动子tef1N,它是用于解脂耶氏酵母中基因表达最常用的启动子之一。该图显示了pYLexp2中的主要特征及其组织(详情参见表1)。
图13是质粒pUra3lxop的示意图。该质粒包含标记基因ura3,其侧翼为loxP位点,loxP位点的侧翼为第一和第二多接头序列。第一和第二多接头允许插入与基因组序列具有同源性的核酸序列,其允许将质粒元件靶向插入基因组中。此外,可以将其他序列(例如诱导型或阻抑型启动子或基因构建体)插入质粒中,并用与基因组序列具有同源性的核酸序列括起来,用于以靶向方式插入基因组。该质粒代表用于解脂耶氏酵母(包括例如解脂耶氏酵母ΔKu70及其衍生物)中基因破坏和/或基因插入的一个实施方案。
图14提供了用于解脂耶氏酵母中基因缺失/置换的过程的示意图。与两个不同基因组序列具有高同源性(90-100%序列同一性)的5’侧翼和3’侧翼序列位于loxP侧翼序列之外以实现位于5’侧翼和3’侧翼序列之间的质粒序列的插入,其可以包括选择标记基因(例如,Ura3)和其他基因。
图15是表示使用本发明的启动子和表达载体来操纵多个基因的表达以重新定向解脂耶氏酵母的生物合成机制以产生靛蓝的示意图。更具体地,可以用包含单个双向诱导型启动子(例如包含选自SEQ ID NO:1-6的序列的启动子)的表达载体转化解脂耶氏酵母以同时诱导bspA和sfp编码序列的表达以产生活性全BspA酶。这两个基因,包括来自枯草芽孢杆菌(Bacillus subtilis)的sfp和来自淡紫灰链霉菌(Streptomyces lavendulae)的bpsA,是根据对于bspA的SEQ ID NO:25和对于sfp的SEQ ID NO:26中指定的解脂耶氏酵母的密码子合成的。此外,包含本发明的阻抑型启动子(例如,被Cu2+下调的SEQ ID NO:10或11的启动子)的表达载体可以可操作地连接至2-氧代戊二酸脱氢酶(ogdhl或ogdh2)编码序列并且Ogdh的表达可以下调以协助生产靛蓝。在进一步的实施方案中,编码Ogdh的构建体可以进一步包括编码SsrA肽标签的序列,该标签被添加到编码的Ogdh蛋白中,允许合成的蛋白质在诱导ClpXP蛋白酶体表达时降解,该蛋白酶体降解包含由11个氨基酸组成的ssrA肽AANDENYALAA(SEQ ID NO:27)的蛋白质,用于更严格地控制其表达(参见图16)。
图16是表示使用本发明的启动子和表达载体通过Cu2+介导的诱导和抑制启动子活性关闭靶基因活性的示意图。靶基因在Cu2+阻抑型启动子(例如SEQ ID NO:10(PCTR1))的控制下从表达载体表达,该表达载体将ssrA肽添加到靶基因的蛋白质产物的羧基末端。两个基因(clpX和clpP)各自置于两个Cu2+诱导型启动子(例如,分别为SEQ ID NO:1(PMT-1)和SEQID NO:2(PMT-2))的控制下,其中在被Cu2+诱导后,产生ClpXP蛋白酶的组装,该蛋白酶降解包含ssrA肽的蛋白质。包含图16的构建体的细胞(如图17所示)在没有启动子激活/抑制量的Cu2+的情况下产生靶基因产物,然而细胞与刺激量的Cu2+的接触不仅停止了新的靶蛋白合成,还消除了已经合成的靶蛋白,以更严格地控制靶基因表达。
图17是表达载体ClpXP的图。
具体实施方式
定义
除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员的通常理解相同的含义。
本文所用术语“约”是指比指出的值或值的范围大或小10%,但并未旨在将任何值或值的范围仅指定于该更广泛定义。以术语“约”开头的每个值或值的范围也意在涵盖指出绝对值或值的范围的实施方案。
如本文所用,术语“天然(native)”或“自然(natural)”定义了自然界中发现的条件。“天然DNA序列”是自然界中存在的DNA序列,它是通过自然方式产生的,而不是通过基因工程(例如,使用分子生物学/转化技术)产生的。
如本文所用,术语“内源”是指自然状态。例如,细胞内源分子(例如直接重复序列)是自然界中存在于细胞中的分子。“天然”化合物是未从其自然状态进行修饰的内源性化合物。
如本文所用,术语“外源”是指在自然界中发现的组合物中不存在的分子。细胞或细胞基因组的外源核酸是包含对于细胞/细胞基因组来说非天然的序列的核酸。
如本文所用,术语“异源”在核酸序列的上下文中定义了两个或更多个核酸的非天然并置。例如,可操作地连接到第二核酸的异源启动子定义了重组关系,其中启动子连接到该启动子未天然连接的序列。异源启动子可以是宿主细胞的外源性或其可以是宿主细胞的内源性(即,宿主细胞天然的多核苷酸,但由于通过重组DNA技术进行遗传操作而整合到非天然位置)。
如本文所用,术语“纯化的”和类似术语涉及分子或化合物相对于天然环境中通常与该分子或化合物相关的其他组分的富集。术语“纯化的”并不一定表示在该过程中已达到特定分子的完全纯度。如本文所用的“高度纯化的”化合物是指大于90%纯的化合物。
如本文所用,术语“可操作地连接”是指已被置于彼此功能关系中的两个组分。术语“可操作地连接”在用于指代调节序列和编码序列时表示调节序列影响连接的编码序列的表达。
“调节序列”、“调节元件”或“控制元件”是指影响转录的时间和水平/量、RNA加工或稳定性、或相关编码序列的翻译的核酸序列。调节序列可能包括启动子;翻译前导序列;5’和3’非翻译区,内含子;增强子;茎环结构;阻遏物结合序列;转录终止序列;聚腺苷酸化识别序列;等。特定调节序列可位于与其可操作连接的编码序列的上游和/或下游。此外,可操作地连接至编码序列的特定调节序列可位于双链核酸分子的相关互补链上。连接可以通过在方便的限制性位点连接来完成,然而,元件不需要连续以可操作地连接。
“启动子”是指启动可操作地连接到启动子的编码序列的转录并产生RNA的DNA序列。这种RNA可以编码蛋白质,或者可以本身具有功能,例如tRNA、mRNA或rRNA。通常,编码序列位于启动子序列的3’。在大多数时间导致基因在大多数细胞类型中转录的启动子在本文中称为“组成型启动子”。允许基因在特定细胞类型中或响应发育或环境线索而选择性转录的启动子在本文中称为“诱导型启动子”。
如本文所用,“双向启动子”是同时从双链启动子序列的两条链启动转录的启动子。双向启动子可位于编码在相反链上的两个相邻基因之间,其中相邻基因的5’末端彼此朝向并可操作地连接至双向启动子以基于单个启动子的激活同时转录两个基因。
如本文所用,“多接头”或“多克隆位点”可互换使用,并且定义了通常少于100个核苷酸的短DNA序列,其包含两个或更多个不同的限制酶切割识别位点。
如本文所用,术语“序列同一性”描述了被比较的两个序列(即,核酸或蛋白质序列)之间的匹配残基数与比对中被比较的残基总数的比率。可以使用本领域技术人员已知的任何标准技术来确定序列同一性的计算,包括例如使用基于BLASTTM的同源性搜索,其使用NCBI BLASTTM软件(2.2.23版),使用默认参数设置运行(Stephen F.Altschul等人(1997),"Gapped BLAST and PSI-BLAST:a new generation of protein databasesearch programs",Nucleic Acids Res.25:3389-3402)。
如本文所定义的“基因产物”是由基因产生的任何产物。例如,基因产物可以是基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、干扰RNA、核酶、结构RNA或任何其他类型的RNA)或通过mRNA翻译产生的蛋白质。基因表达可受到外部信号的影响,例如,细胞、组织或生物体暴露于增加或减少基因表达的试剂。基因的表达也可以在从DNA到RNA再到蛋白质的途径中的任何地方进行调节。基因表达的调节可以例如通过作用于转录、翻译、RNA运输和加工、中间分子如mRNA降解的控制或通过特定蛋白质分子在其生产后的激活、失活、区室化或降解或其组合来发生。可以通过本领域已知的任何方法在RNA水平或蛋白质水平测量基因表达,包括但不限于Northern印迹、RT-PCR、Western印迹,或体外、原位或体内蛋白质活性测定。
“宿主细胞”是被外源多核苷酸序列已经转化或转染或能够转化或转染的细胞。已经转化或转染的宿主细胞可以更具体地称为“重组宿主细胞”。
“营养缺陷型”是不能合成生长所必需的特定有机化合物的生物体。如本文所用的“营养缺陷型标记”定义了在营养缺陷型中缺失或缺陷的编码生长必需的有机化合物的基因。
实施方案
本公开涉及用于制备用于转化产油酵母(包括解脂耶氏酵母和圆红冬孢酵母)的核酸构建体的新系统和方法。更具体地,本文描述的表达载体可用于以受控方式同时表达多种基因产物以改变或调节解脂耶氏酵母和圆红冬孢酵母的酶促途径以生产期望产物。
根据一个实施方案,提供了在解脂耶氏酵母中有功能的新诱导型和阻抑型启动子。这些包括包含选自SEQ ID NO:1-6的序列的Cu2+诱导型启动子、包含选自SEQ ID NO:7-9的序列的阻抑型启动子和包含选自SEQ ID NO:10-11的序列的Cu2+阻抑型启动子。在一个实施方案中,这些启动子中的一个或多个作为表达载体的一部分存在,所述表达载体被配置用于插入目的编码序列,将SEQ ID NO:1-11的启动子序列之一可操作地连接至目的编码序列。这样的载体在被引入解脂耶氏酵母宿主细胞时允许在诱导型或阻抑型启动子的控制下表达目的编码序列。
根据一个实施方案,提供了一种转录元件,其包含启动子和可操作地连接到所述启动子的多接头,使得当编码序列通过多接头的核酸内切酶限制性位点之一插入多接头位点时,编码序列可操作地连接到启动子并且能够在引入到解脂耶氏酵母宿主细胞中时被所述启动子转录。在一个实施方案中,启动子包含850至903bp的核酸序列,该核酸序列包含选自由SEQ ID NO:1(PMT-1)、SEQ ID NO:2(PMT-2)、SEQ ID NO:3(PMT-3)、SEQ ID NO:4(PMT-4)、SEQ ID NO:5(PMT-5)、SEQ ID NO:6(PMT-6)、SEQ ID NO:7(PTHR1)、SEQ ID NO:8(PMET3)、SEQ IDNO:9(PSER1)、SEQ ID NO:10(PCTR1)和SEQ ID NO:11(PCTR2)组成的组的序列,或与选自由SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的核酸序列具有至少80%、85%、90%、95%或99%序列同一性的核酸序列,其中多接头可操作地连接到所述启动子序列,使得编码序列引入多接头区域会将编码序列置于启动子的转录控制之下。在一个实施方案中,转录元件进一步包含表达插入多接头位点的编码序列所需的额外调节元件,包括例如上游激活序列、核糖体结合位点(RBS)、翻译起始密码子、终止序列和聚腺苷酸化识别序列。在一个实施方案中,转录元件形成为质粒并且进一步包含选择标记基因和在靶宿主细胞(例如,大肠杆菌或解脂耶氏酵母宿主细胞)中有功能的复制起点。
根据一个实施方案,提供了一种转录元件,其包含双向启动子以及第一和第二多接头,其中第一和第二多接头在双链启动子的相对端可操作地连接至所述启动子,使得当通过第一和第二多接头的核酸内切酶限制性位点之一将第一编码序列插入到第一多接头位点并且将第二编码序列插入到第二多接头位点时,第一和第二编码序列两者可操作地连接到双向启动子并且在引入解脂耶氏酵母宿主细胞并激活启动子后两者通过所述启动子同时转录。在一个实施方案中,双向启动子选自包括SEQ ID NO:1(PMT-1)和SEQ ID NO:2(PMT-2)、SEQ ID NO:3(PMT-3)和SEQ ID NO:4(PMT-4)或SEQ ID NO:5(PMT-5)和SEQ ID NO:6(PMT-6)在内的三对核酸序列之一,或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列具有至少95%或99%序列同一性的核酸序列。在一个实施方案中,双向启动子包含SEQ ID NO:1(PMT-1)和SEQ ID NO:2(PMT-2),或包含与SEQ ID NO:1(PMT-1)和SEQ ID NO:2(PMT-2)具有至少95%或99%序列同一性的序列。
在一个实施方案中,转录元件的启动子是Cu2+诱导型启动子,其包含选自由SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的序列,或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQID NO:6组成的组的序列具有至少95%序列同一性的序列。在一个实施方案中,转录元件的启动子是Cu2+诱导型启动子,其包含选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4和SEQID NO:6组成的组的序列,或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4和SEQ IDNO:6组成的组的序列具有至少95%序列同一性的序列。在一个实施方案中,转录元件的启动子是Cu2+诱导型启动子,其包含选自由SEQ ID NO:2和SEQ ID NO:6组成的组的序列,或与SEQ ID NO:2或SEQ ID NO:6具有至少95%序列同一性的序列。在一个实施方案中,诱导型启动子具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或16个上游激活序列(UAS),其以串联阵列位于SEQ ID NO:1、2、3、4、5或6的启动子序列的上游,并且可操作地连接到所述启动子序列,任选地其中所述UAS序列包含SEQ ID NO:12的序列。
在一个实施方案中,转录元件的启动子是阻抑型启动子,其包含选自由SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的序列,或与选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的序列具有至少80%、85%、90%、95%或99%序列同一性的序列,任选地连接至多接头。
在一个实施方案中,转录元件的启动子是Cu2+阻抑型启动子,其包含选自由SEQ IDNO:10和SEQ ID NO:11组成的组的序列,或与选自由SEQ ID NO:10和SEQ ID NO:11组成的组的序列具有至少95%序列同一性的序列。
在一个实施方案中,阻抑型启动子包含SEQ ID NO:10或SEQ ID NO:11的序列,或与选自由SEQ ID NO:10和SEQ ID NO:11组成的组的序列具有至少95%序列同一性的序列,任选地连接至多接头。
在一个实施方案中,阻抑型启动子包含SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9的序列,或与选自由SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9组成的组的序列具有至少95%序列同一性的序列,任选地连接至多接头。
在一个实施方案中,转录元件被形成为质粒并且进一步包含选择标记基因和在解脂耶氏酵母和圆红冬孢酵母中起作用的复制起点以及任选地在大肠杆菌中起作用的第二复制起点。转录元件可以进一步包含一系列串联重复的2A多肽编码核酸序列,每个序列在2A多肽编码核酸序列之前具有其自己独特的限制性位点,以允许易于插入与转录元件的启动子及其各自的2A多肽编码核酸序列可操作连接的目的编码序列。如图1A所示,根据本申请的转录元件的一个实施方案包含可操作地连接至多顺反子区域的诱导型/阻抑型启动子(例如,包含SEQ ID NO:1-11的序列的启动子),其中多顺反子区域包括区域E1、E2和E3,每个区域代表一个或多个转录元件独特的限制性位点,每个区域后跟2A蛋白编码序列。因此,使用E1、E2和E3的独特限制性位点,可以将三个独立基因的编码序列引入构建体中,以置于启动子的转录控制之下,并用附着的2A多肽表达。
在一个实施方案中,2A多肽编码核酸序列编码包含GSGEGRGSLLTCGDVEENPGP(SEQID NO:13)或GSGATNFSLLKQAGDVEENPGP(SEQ ID NO:14)的序列的多肽,任选地其中2A多肽编码核酸序列包含SEQ ID NO:15的序列。
在一个实施方案中,转录元件进一步包含编码TEV肽酶的核酸,任选地其中编码TEV肽酶的基因由诱导型启动子调节,任选地其中编码TEV肽酶的基因可操作地连接至作为多顺反子编码区的一部分的转录元件的诱导型启动子(如图1A的实施方案所示)。编码TEV的基因的表达允许去除连接到由可操作地连接到转录元件启动子的多顺反子区域表达的蛋白质的C-末端的部分2A肽。这种切割消除了表达的多顺反子蛋白的自切割和释放后剩余的残留2A多肽造成的干扰,增加了表达系统的可靠性。
替代地,或除了图1A所示的实施方案之外,由于Cu2+诱导型启动子代表三对双向启动子(SEQ ID NO:1(PMT-1)和SEQ ID NO:2(PMT-2));(SEQ ID NO:3(PMT-3)和SEQ ID NO:4(PMT-4));以及(SEQ ID NO:5(PMT-5)和SEQ ID NO:6(PMT-6)),转录可以同时从转录元件的启动子的每条链发生。因此,两个多顺反子区域的同时转录可以在如图1B所示的构建体中发生。
根据一个实施方案,本文公开的任何转录元件进一步包含一个或多个上游激活序列(UAS),其位于启动子的上游并且可操作地连接至所述启动子序列。串联重复的UAS元件可以相同或不同,并且可以在1至16的数量范围。任选地,UAS序列可以包含SEQ ID NO:12的序列或与SEQ ID NO:12具有至少95%或99%序列同一性的序列。
在一个实施方案中,16个串联重复的包含SEQ ID NO:12的序列的UAS序列位于启动子的上游,其中启动子包含选自由(SEQ ID NO:1(PMT-1)和SEQ ID NO:2(PMT-2));(SEQ IDNO:3(PMT-3)和SEQ ID NO:4(PMT-4))以及(SEQ ID NO:5(PMT-5)和SEQ ID NO:6(PMT-6))组成的组的序列,或与选自由由(SEQ ID NO:1(PMT-1)和SEQ ID NO:2(PMT-2));(SEQ ID NO:3(PMT-3)和SEQ ID NO:4(PMT-4))以及(SEQ ID NO:5(PMT-5)和SEQ ID NO:6(PMT-6))组成的组的序列具有至少95%序列同一性的序列。根据一个实施方案,提供了一种转录元件,其中该元件包含位于启动子上游的1至16个串联重复的SEQ ID NO:12的UAS序列,或与SEQ ID NO:12具有至少99%序列同一性的序列,其中启动子包含选自由(SEQ ID NO:1(PMT-1)和SEQ IDNO:2(PMT-2));(SEQ ID NO:3(PMT-3)和SEQ ID NO:4(PMT-4))以及(SEQ ID NO:5(PMT-5)和SEQID NO:6(PMT-6))组成的组的序列,或与选自由由(SEQ ID NO:1(PMT-1)和SEQ ID NO:2(PMT-2));(SEQ ID NO:3(PMT-3)和SEQ ID NO:4(PMT-4))以及(SEQ ID NO:5(PMT-5)和SEQ IDNO:6(PMT-6))组成的组的序列具有至少95%序列同一性的序列。在一个实施方案中,多接头可操作地连接到包含UAS序列的启动子,并且任选地进一步包含位于所述多接头下游的一个或多个2A多肽编码核酸序列,其中每个2A多肽编码核酸序列之前是独特的核酸内切酶限制地点。在一个实施方案中,所编码的2A肽具有序列GSGEGRGSLLTCGDVEENPGP(SEQ ID NO:13)或GSGATNFSLLKQAGDVEENPGP(SEQ ID NO:14)的序列,并且任选地2A多肽编码核酸序列包含SEQ ID NO:15的序列或与SEQ ID NO:15具有至少95和或99%序列同一性的序列。
在一个实施方案中,本文公开的任何转录元件进一步包含位于所述启动子和多接头之间的核糖体结合位点和任选的翻译起始密码子。在另一个实施方案中,本文公开的任何转录元件进一步包含位于转录元件的核糖体结合位点和多接头之间的内含子序列,任选地,其中该内含子包含来自基因tef(SEQ ID NO:20)的第一个内含子。
根据一个实施方案,本文公开的任何转录元件可以形成为质粒,其中该质粒进一步包含选择标记。在一个实施方案中,选择标记是营养缺陷型标记,任选地其中营养缺陷型标记是leu2或ura 3。在一个实施方案中,选择标记是抗生素抗性基因,包括例如AmpR或TetR。在一个实施方案中,包含转录元件的质粒还包含一个或多个允许质粒在宿主生物体中复制的复制起点。在一个实施方案中,质粒包含解脂耶氏酵母和/或大肠杆菌的复制区。
如本文申请的转录元件可以进一步与表1-3中公开的任何元件组合。在一个实施方案中,将期望基因产物的编码序列插入本文公开的任何转录元件中,以将SEQ ID NO:1-11的启动子可操作地连接至异源编码序列。然后将构建体引入宿主细胞以修饰宿主细胞编码的基因的表达模式。在一个实施方案中,异源编码序列对于宿主细胞是内源性的,但异源编码序列并非天然可操作地连接至转录元件的启动子。在一个实施方案中,异源编码序列对于宿主细胞而言不是天然的并且代表外源序列。在一个实施方案中,宿主细胞是解脂耶氏酵母或圆红冬孢酵母宿主细胞。在一个实施方案中,宿主细胞是解脂耶氏酵母,并且任选地解脂耶氏酵母的Ku70缺失菌株。
在一个实施方案中,提供了一种用于通过诱导/抑制单个控制元件同时诱导或抑制两种基因产物的表达的方法。根据一个实施方案,同时诱导来自单个启动子的两个或更多个编码区的方法包括提供宿主细胞,所述宿主细胞包含Cu2+诱导型双向启动子,所述启动子可操作地连接至所述启动子的正链上的第一编码区和负链上的第二编码区,其中所述启动子包含选自以下组的一对核酸序列:由SEQ ID NO:1和SEQ ID NO:2、SEQ ID NO:3和SEQID NO:4以及SEQ ID NO:5和SEQ ID NO:6组成的成对序列,或与选自由SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列具有至少95%序列同一性的序列;以及使宿主细胞与一定量的Cu2+接触,所述Cu2+诱导所述启动子的双向转录以诱导所述第一和第二编码区的表达。在一个实施方案中,多个基因以串联阵列可操作地连接至所述启动子,其中2A多肽编码序列位于除所述多个基因中的最后一个之外的所有基因的3’末端,任选地,其中最后一个编码的基因产物是TEV肽酶。
在一个实施方案中,提供了一种用于同时抑制来自单个启动子的两个或更多个基因的表达的方法,包括提供宿主细胞,所述宿主细胞包含可操作地连接到编码多个基因的多顺反子区域的Cu2+诱导型启动子,如图1A中公开的,其中编码序列被编码2A蛋白的序列分开,并且任选地进一步包含可操作地连接至阻抑型启动子的TEV基因,其中所述启动子包含选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列,或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列具有至少95%序列同一性的序列;以及使宿主细胞与一定量的Cu2+接触,所述Cu2+诱导所述启动子的转录,从而诱导包含在多顺反子区中的编码区的表达。在一个实施方案中,启动子包含选自由SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:6组成的组的核酸序列,或与选自由SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:6组成的组的核酸序列具有至少95%序列同一性的序列。
在一个实施方案中,提供了一种用于同时抑制来自单个启动子的两个或更多个基因的表达的方法,包括提供宿主细胞,所述宿主细胞包含可操作地连接至编码多个基因的多顺反子区域的Cu2+阻抑型启动子,如图1A中公开的,其中编码序列被编码2A蛋白的序列分开,并且任选地进一步包含可操作地连接至阻抑型启动子的TEV基因,其中所述启动子包含选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的核酸序列,或与选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ IDNO:11组成的组的核酸序列具有至少95%序列同一性的序列,以及使所述宿主细胞与一定量的Cu2+或氨基酸接触,其抑制从所述启动子的转录,以抑制包含在多顺反子区中的编码区的表达。在一个实施方案中,阻抑型启动子包含选自由SEQ ID NO:10(CTR1)和SEQ ID NO:11(CTR2)组成的组的序列,并且宿主细胞与一定量的Cu2+接触,其抑制从所述启动子的转录。
根据一个实施方案,提供了用于与本公开的转录元件结合使用的构建体,其中补充构建体被设计用于解脂耶氏酵母或圆红冬孢酵母宿主序列的插入、缺失或替换。该方法包括使用包含或允许插入与宿主生物体的内源序列具有高度同源性的序列的载体。这样的构建体可用于使基因组序列缺失或破坏靶内源基因以产生无效突变体。通过在与宿主序列具有95%至100%序列同一性的两组核酸序列之间包括额外序列,补充构建体可用于将基因或基因部分(即,本文公开的任何诱导型或阻抑型启动子)插入到宿主生物体DNA的靶位置。在一个实施方案中,插入选自SEQ ID NO:1-6中任一个的诱导型启动子以替换靶基因的天然启动子并将编码的产物置于诱导型启动子的控制之下。在一个实施方案中,插入选自SEQ ID NO:7-11中任一个的阻抑型启动子以替换靶基因的天然启动子并将编码的产物置于阻抑型启动子的控制之下。在一个实施方案中,该构建体包含基因构建体,该基因构建体包含选自SEQ ID NO:7-11中任一个的启动子,其可操作地连接至具有开放阅读框的序列(即,编码序列),其中在宿主细胞转化后,该构建体将基因构建体完整插入宿主细胞的DNA中,任选地替换或禁用天然基因。
在一个实施方案中,补充构建体进一步包含也位于与宿主DNA具有高度序列同一性的两个序列之间的选择标记,以允许选择已成功完成同源重组事件的宿主细胞。在进一步的实施方案中,选择标记基因的侧翼可以是loxP位点,随后cre重组酶活性的引入导致选择标记基因的去除。
根据一个实施方案,提供了包含基因盒的补充构建体,其中该基因盒包含选择标记和启动子序列,所述启动子选自由SEQ ID NO:1(PMT-1)、SEQ ID NO:2(PMT-2)、SEQ ID NO:3(PMT-3)、SEQ ID NO:4(PMT-4)、SEQ ID NO:5(PMT-5)、SEQ ID NO:6(PMT-6)、SEQ ID NO:7(PTHR1)、SEQ ID NO:8(PMET3)、SEQ ID NO:9(PSER1)、SEQ ID NO:10(PCTR1)和SEQ ID NO:11(PCTR2)组成的组,或与选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的核酸序列具有至少90%、95%或99%序列同一性的核酸序列,其中所述基因盒在盒的两侧侧接有两组独特的多接头或具有与宿主细胞中包含的DNA序列具有95-100%序列同一性的两个不同DNA序列。在一个实施方案中,与宿主细胞中包含的DNA序列具有95-100%序列同一性的两个不同DNA序列包含26s rDNA序列。在一个实施方案中,选择标记基因侧接有loxP位点。在一个实施方案中,启动子序列位于侧接有loxP位点的区域之外,但在与宿主DNA具有高度序列同一性的序列包围的序列内,并且连接至多接头或基因编码序列。
根据一个实施方案,使用本文公开的补充质粒破坏解脂耶氏酵母中的基因并进一步去除伴随的选择标记(例如,ura3)的实验程序包括以下步骤。一种适用于此类程序的载体是载体pURA3loxp,如图13所示。使用载体的loxp位点侧翼的独特限制性位点,将与宿主序列具有高序列同一性的5’和3’序列插入载体中。这些5’和3’是根据宿主中的目标插入位点选择的,并且在一个实施方案中包含26s rDNA序列。质粒通常是线性化的,并且用线性化的质粒转化宿主细胞。基于通过PCR技术的选择和验证,鉴定包含期望重组事件的细胞。一旦鉴定出包含期望重组的细胞,随后就可以通过将cre重组酶活性引入重组宿主细胞来去除选择标记。根据一个实施方案,用质粒(例如pYKCre,参见表2)转化期望宿主转化体以切除位于loxp位点之间的序列(包括选择标记基因)。然后可以选择已消除选择标记和cre表达质粒的菌株。
根据一个实施方案,提供了用于操纵解脂耶氏酵母细胞的试剂盒。根据一个实施方案,试剂盒包括包含本文公开的转录元件的质粒和用于在解脂耶氏酵母中操纵基因表达的额外质粒构建体,包括表2中公开的任何质粒。
在一个实施方案中,包含在试剂盒中的包含SEQ ID NO:1-11的启动子中的任何一个的表达载体可以具有本文描述的任何其他元件,例如选择标记、克隆位点如多克隆位点(即多接头)、上游激活位点、增强子、终止序列、信号肽序列等。另一方面,表达载体可以是自主复制或整合到宿主细胞基因组中的载体。在另一个实施方案中,表达载体可以被环化或线性化(即,用限制性内切酶消化以便可以容易地将目的基因克隆到表达载体中)。在另一个实施方案中,试剂盒可以包括表达载体和编码用于表达的标记或对照基因的对照ORF(例如,编码LacZ-α片段的ORF),以用作对照以显示表达载体能够连接目的基因并与目的基因一起使用。
在另一个说明性方面,试剂盒可以包括与表达载体一起使用的其他组分,例如用于转化酵母细胞的组分、用于将目的蛋白质编码序列整合到表达载体中的限制酶、连接酶、用于纯化表达载体构建体的组分、缓冲液(例如,连接缓冲液)、使用说明(例如,以促进克隆),以及适用于用于制备和使用本文所述表达载体的试剂盒的任何其他组分。在另一个实施方案中,表达载体或试剂盒的任何其他组分可以在密封管(例如,灭菌或未灭菌)或任何其他合适的容器或包装(例如,灭菌或未灭菌)中包含在试剂盒中。包括包含选自SEQ IDNO:1-11的启动子序列的表达载体的前述段落中描述的试剂盒可以包括可操作地连接到启动子的蛋白质编码序列,其中蛋白质编码序列对于启动子是异源的(即,组合不会在自然界中发生)。
包括依赖于酶消化和连接以及吉布森组装的程序的一般克隆策略可用于制备本文公开的表达载体,如图10所示。在一个实施方案中,本公开的转录元件和表达载体包括位于多接头立即之前的ATG起始密码子。表达载体可用于靶基因的细胞内表达,或者它们可整合到宿主细胞的基因组中。通常,插入的编码序列包括翻译终止密码子,其中TAA最常用于解脂耶氏酵母。
可以通过引入独特的限制性位点(例如在开放阅读框(ORF)之前的多接头中列出的用于HindIII的AAGCTT)将待表达的目的基因插入到本文公开的表达载体中。包括leu2、CEN1-1和ORI1001在内的解脂耶氏酵母的复制区域可以包含在表达载体中,并且可以通过复制起点侧翼的限制性位点去除(参见例如图12中XbaI消化的使用)。类似地,适当放置的限制性位点的使用也可用于表达盒的回收和替换,参见例如图12,通过XbaI/SpeI消化并插入到其他表达载体的SpeI位点。可以使用表1中公开的元件交换不同载体之间的启动子和终止子序列。
在一个实施方案中,提供了一种试剂盒,其包含
第一质粒,其包含选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的诱导型启动子序列,以及多接头,其中所述多接头可操作地连接到所述启动子;以及
第二质粒,其中所述第二质粒包含
位于编码选择标记基因的核酸序列的侧翼的第一对和第二对34-bp loxp位点;
位于所述第一loxp位点上游的第一限制性位点;和
位于所述第二loxp位点下游的第二限制性位点,其中所述第一和第二限制性位点彼此不同并且是所述第二质粒所独有的。在一个实施方案中,试剂盒还包含选自由SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的阻抑型启动子。在一个实施方案中,阻抑型启动子在第一和第二限制性位点之间插入到第二质粒。在一个实施方案中,该阻抑型启动子形成为第三质粒。
在一个实施方案中,该试剂盒的第二质粒进一步包含在诱导型启动子的控制下编码cre重组酶的核酸序列。替代地,试剂盒可以包含第四质粒,其中所述第四质粒包含编码cre重组酶的核酸序列。在一个实施方案中,试剂盒的第二质粒进一步包含位于所述第一限制性位点上游的第一26s rDNA序列和位于所述第二限制性位点下游的第二26s rDNA序列。
在一个实施方案中,提供了一种试剂盒,其包含
第一质粒,其包含选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的诱导型启动子序列,以及多接头,其中所述多接头可操作地连接至所述诱导型启动子;以及
第二质粒,其中所述第二质粒包含
选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的阻抑型启动子,以及多接头,其中所述多接头可操作地连接至所述阻抑型启动子。在一个实施方案中,第二质粒包含位于多接头下游的SsrA编码序列,使得当编码序列插入多接头并且编码序列可操作地连接到启动子时,从所述构建体表达的蛋白质将包含C-末端SsrA肽标签。在进一步的实施方案中,试剂盒的第一质粒进一步包含可操作地连接至诱导型启动子的序列,其编码降解带SsrA标签的蛋白质的蛋白酶。在一个实施方案中,编码降解带SsrA标签的蛋白质的蛋白酶的各种亚基的核酸序列处于单个诱导型启动子的控制之下。在另一个实施方案中,编码降解带SsrA标签的蛋白质的蛋白酶的各种亚基的每个核酸序列处于不同的诱导型启动子之下。在该试剂盒的一个实施方案中,诱导型启动子选自SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:3ID NO:6组成的组。在试剂盒的一个实施方案中,第二质粒的阻抑型启动子选自由SEQ ID NO:10和SEQID NO:11组成的组。
图16提供了表示使用试剂盒组分制备系统的示意图,其中本发明的启动子和表达载体用于严格调节靶基因产物的表达并允许通过Cu2+介导的诱导和抑制的启动子活性快速关闭靶基因的活性。如图16所示,铜诱导型启动子(Pmt-1/Pmt-2)驱动从大肠杆菌中分离的基因clpX和clpP的表达。在大肠杆菌中,ClpX和ClpP一起形成ClpXP蛋白酶体,其可以选择性地识别和降解包含C末端11个氨基酸SsrA标签的蛋白质。靶基因在正常条件下表达,而在添加铜时会受到抑制。在一个实施方案中,所有四种组分都被设计在一个质粒中。靶基因在Cu2+阻抑型启动子(例如SEQ ID NO:10(PCTR1)或SEQ ID NO:11(PCTR2))的控制下从表达载体表达,其将ssrA肽添加到靶基因的蛋白质产物的羧基末端。两个基因(clpX和clpP)分别置于两个Cu2+诱导型启动子(例如,分别为SEQ ID NO:1(PMT-1)和SEQ ID NO:2(PMT-2),或选自SEQ IDNO:1-6的任何Cu2+诱导型启动子的诱导型启动子的任何组合)的控制下,其中在被Cu2+诱导后产生降解包含ssrA肽的蛋白质的ClpXP蛋白酶的组装体。在一个实施方案中,使用包含SEQ ID NO:1和SEQ ID NO:2的双向启动子驱动clpX和clpP表达离开双链载体的相反链。在一个实施方案中,clpX和clpP表达为多顺反子构建体的一部分,该多顺反子构建体可操作地连接到选自SEQ ID NO:1-6的启动子。包含图16的构建体的细胞在不存在启动子激活/抑制量的Cu2+的情况下产生靶基因产物,然而细胞与刺激量的Cu2+的接触不仅阻止新靶蛋白的合成(通过抑制靶基因产物的表达),而且还消除已经合成的靶蛋白(由于ClpXP蛋白酶的降解),以便更严格地控制靶基因表达。其他降解标签/蛋白酶组合是本领域技术人员已知的并且适用于本发明。
本公开的试剂盒包含在圆红冬孢酵母和解脂耶氏酵母中操纵基因表达所必需的元件。特别地,本公开提供了分离的遗传部分、方法和载体系统。分离出六个具有双向性的铜诱导型启动子和五个阻抑型启动子。在非抑制条件下,与强组成型启动子相比,Cu2+阻抑型启动子显示出相对较高的活性,但可以通过补充低含量的Cu2+来几乎完全抑制。其中一种Cu2+诱导型启动子被设计用于提高串联上游激活序列(UAS)的强度。工程启动子的效用和优势通过以比天然Cu2+诱导型和组成型启动子二者更高的滴度生产有价值的生物产品蜡酯得到验证。启动子被设计为在圆红冬孢酵母和解脂耶氏酵母二者中发挥作用。通过使用来自小核糖核酸病毒的自剪接2A肽,其允许在解脂耶氏酵母和圆红冬孢酵母中表达多顺反子基因。进一步引入编码烟草蚀纹病毒(TEV)蛋白酶的基因以去除附着在所表达蛋白质C末端的部分2A肽,从而消除对酶活性的干扰。开发了一种载体系统,用于无缝组装用2A肽间隔的多顺反子结构。本发明为产油酵母中的蛋白质表达、菌株工程改造和开发、复杂途径的构建以及复杂遗传网络的构建提供了强大的生物技术工具。
根据一个实施方案,新的启动子和包含这样的启动子的表达载体可在用于解脂耶氏酵母的途径工程化的应用中使用,以用于生物合成蜡酯、靛蓝、构建用于更严格控制的蛋白质表达/降解机制的系统,以及延伸宿主的底物范围以包括纤维二糖
实施例1
解脂耶氏酵母中双向铜诱导型启动子的鉴定
已在酿酒酵母中鉴定出Cu2+诱导型启动子PCUP1,该启动子是从编码金属硫蛋白的基因中分离出来的,金属硫蛋白是一种低分子量、富含半胱氨酸的蛋白质,并且能够结合重金属,如铜、锌、硒、镉、汞和银。如本文所公开,在解脂耶氏酵母基因组中检索到六个编码金属硫蛋白的基因,即MT-1至MT-6。这些启动子被组织为三对:位于DNA的相对链上的(PMT-1(SEQ ID NO:1)和PMT-2(SEQ ID NO:2);位于DNA的相对链上的(PMT-3(SEQ ID NO:3)和PMT-4(SEQ ID NO:4);以及位于DNA的相对链上的PMT-5(SEQ ID NO:5)和PMT-6(SEQ ID NO:6),双向化以控制解脂耶氏酵母中金属硫蛋白的表达。
通过使用β-半乳糖苷酶(LacZ),在存在CuSO4的情况下测量启动子PMT-1至PMT-6的强度。如图2所示,所有选择的启动子的强度都可以通过补充到培养基中的终浓度为0.2mM的CuSO4诱导,其不影响解脂耶氏酵母的细胞生长。在这些启动子中,在Cu2+存在下PMT-2具有最高强度,具有第二高活性的启动子是PMT-6。Cu2+对PMT-2实现了超过16倍的诱导。PMT-2和PMT-6二者的强度与之前鉴定的组成型启动子(如PTEF)相当,但它们可以被作为廉价和高效的诱导剂的Cu2+激活。特别地,启动子组成了三对双向启动子,包括PMT-1/PMT-2、PMT-3/PMT-4和PMT-5/PMT-6。
实施例2
解脂耶氏酵母中氨基酸阻抑型启动子的鉴定
为了分离解脂耶氏酵母中的阻抑型启动子,我们通过分别补充L-苏氨酸或L-缬氨酸、L-甲硫氨酸和L-丝氨酸检查了参与氨基酸生物合成的基因THR1(YALI0F13453p)、MET3(YALI0B08184p)和SER1(YALI0F06468p)的启动子强度。添加10mM氨基酸的PSER1的PTHR1的活性为其未添加氨基酸5小时后活性的约一半(见图3)。与非抑制条件相比,添加10mM L-甲硫氨酸后PMET3的强度保持66%。这些启动子的强度可以通过添加相应的氨基酸来抑制。
实施例3
解脂耶氏酵母中铜阻抑型启动子的鉴定
为了寻找对廉价化学品有反应的阻抑型启动子,克隆了属于铜转运蛋白家族的基因CTR1(YALI0C20295p)和CTR2(YALI0F24277p)的两个启动子,并进一步研究了它们的强度。如图4所示,低浓度的Cu2+几乎完全抑制了PCTR1和PCTR2的强度。存在0.16mM Cu2+时PCTR1的强度仅为未添加Cu2+时活性的5%。此外,没有抑制的PCTR1的强度远高于强启动子PTEF,而没有抑制的PCTR2的强度是PTEF的一半。
实施例4
解脂耶氏酵母中由PMT-2组成的杂种启动子的工程化
研究了UAS拷贝数对添加和不添加铜的PMT-2强度的影响(图5)。结果表明,当在PMT-2的上游添加16个串联重复的UAS(UAS16)时,无铜诱导的基础活性和存在0.1mM CuSO4的强度均达到其最高水平。即使没有铜诱导,PMT-2-UAS16也具有相对较高的基础强度。这表明PMT-2及其杂种形式PMT-2-UAS16均被最高达0.2mM的铜含量诱导,并且PMT-2-UAS16在相同条件下显示出比PMT-2更高的活性(图6)。通过使用串联的UAS,进一步增加了铜诱导型启动子的动态调节范围,从而为解脂耶氏酵母中的基因表达和代谢工程的控制提供了额外益处。
实施例5
分离和工程化启动子在解脂耶氏酵母用于生产蜡酯的代谢工程中的效用
为了证明在本研究中分离和工程化的启动子的效用,我们使用启动子PMT-2-UAS16设计了一条生产生物基长链蜡酯(WE)的途径。WE是广泛用于制造个人化妆品、药物和润滑剂的高价值产品。过去,WE是从鲸油中获得的;然而,现在禁止捕杀抹香鲸阻碍了它进入工业市场。目前用于WE生产的实践依赖于来自灌木荷荷巴(Simmondsia chinensis)的荷荷巴油,荷荷巴适应干旱地区如沙漠地区,但不适合大规模种植。有限的可用性和高生产成本阻碍了WE在广泛应用中的使用。WE的微生物生产提供了一种替代途径,可以潜在地克服这些障碍并促进WE的可持续、大规模和高效生产。在我们之前的研究中,我们通过表达编码来自谷仓猫头鹰(Tyto alba)的脂酰辅酶A还原酶的TaFAR基因,对解脂耶氏酵母进行工程化以生产脂肪醇(C16-C18)。在本发明中,我们通过表达来自小鼠(Mus musculus)的密码子优化的MmWS基因SEQ ID NO:16)来扩展该脂肪醇形成途径以生产WE,该基因编码WE合酶/酰基辅酶A:二酰基甘油酰基转移酶(WS/DGAT)。
气相色谱(GC)分析表明,在存在0.2mM CuSO4的情况下,在PMT-2-UAS16的控制下表达MmWS的菌株产生了一种代谢物,其保留时间与标准棕榈酰基棕榈酸(C16,C16)的保留时间相匹配。我们通过GC-MS进一步确认了产品的结构,包括其他次要产品,包括硬脂酰基硬脂酸(C18,C18)和棕榈油酰基硬脂酸(C16:1,C18)。由在40g/L葡萄糖上生长4天的重组体产生的WE滴度最高达199.4mg/L,高于通过PTEF驱动表达MmWS的脂肪醇生产菌株产生的179.6mg/L的WE滴度。类似地,在添加0.2mM Cu2+的情况下通过使用PMT-2表达MmWS导致150.9mg/L的WE积累。所有菌株仍然产生高含量的脂肪醇(图7)。本研究证明了通过产油酵母的工程化首次形成长链WE,并且通过途径工程化和发酵优化均可实现更高的产量。已经设计了启动子,并且启动子的效用已在解脂耶氏酵母用于生产新型高价值产品WE的代谢工程中得到验证。
实施例6
来自圆红冬孢酵母的天然启动子的工程化
在解脂耶氏酵母中测量了来自圆红冬孢酵母的四个充分表征的启动子的强度,包括PPGK、PFBA、PTPI和PGPD。如图8所示,与天然启动子PTEF相比,它们在解脂耶氏酵母中的活性非常低。我们通过添加解脂耶氏酵母16个拷贝的UAS进一步改造了启动子PGPD,并将所得的杂种启动子命名为PGPD-UAS16。新启动子的活性显著增加,甚至高于解脂耶氏酵母天然启动子TEF(图8)。进一步使用启动子PTEF-UAS16(SEQ ID NO:21,启动子上游有16个UAS元件修饰)替代质粒pYaliHex中的启动子,新载体可直接用于解脂耶氏酵母和圆红冬孢酵母中的基因表达,而不需要宿主依赖性优化。
实施例7
表达载体pYaliHex的开发
如图9所示,开发了质粒pYaliHex以用于在解脂耶氏酵母中表达多个基因。在pYaliHex中,有被编码两个连续2A肽的序列间隔开的编码gfp和TEV肽酶的基因。该质粒提供了多个限制性位点如HindIII、PstI、SmaI以用于克隆靶基因。pYaliHex中的氨苄青霉素抗性基因被修饰以包括限制性位点PmeI和SwaI。
实施例8
使用开发的载体系统组装多顺反子结构
如图10所示,可以进行三个步骤来克隆目的基因并组装由T2A肽序列组成的多顺反子结构。(1)将目的基因克隆到质粒pYaliHex中;(2)通过PmeI(回收供体片段)或SwaI(回收受体片段)对重组质粒进行线性化;以及(3)基于产生的同源区域,使用吉布森组装来组装PmeI消化和SwaI消化的片段。由于SwaI和PmeI限制性位点都已再生,所得质粒可以重新用作供体或受体片段以与其他基因或多顺反子构建体融合。
实施例9
解脂耶氏酵母中纤维二糖代谢途径的工程化
将利用纤维二糖的代谢途径通过编码纤维糊精转运蛋白的CDT1和编码β-葡萄糖苷酶的BGL两个粗糙链孢霉基因的异质表达引入到解脂耶氏酵母中。使用两种方法来表达CDT1和BGL。第一种是用T2A肽序列分离的CDT1和BGL的共表达。在第二种表达载体pSX30中,CDT1和BGL被TEV切割位点和T2A肽序列隔开,并且还包括TEV编码序列。如图11A-11C所示,携带第二种载体的菌株(pSX30)在相同培养条件下表现出比携带pF2的重组体在纤维二糖上更好的生长性能。这些结果突出了表达TEV肽酶以去除添加到蛋白质(如本实施例中的CDT1)中的部分切割的2A肽的优势,从而使该途径达到更好的性能(图11C)。
实施例10
编码蛋白Ku70的基因被破坏的解脂耶氏酵母的产生
分离出了多种解脂耶氏酵母菌株并报告了多种应用,例如柠檬酸发酵、脂质生产和环境生物修复等。其中,法国单倍体菌株W29(ATCC 20460)是最广泛表征的菌株之一。来源于菌株W29的解脂耶氏酵母PO1f(ATCC MYA-2613)是一种营养缺陷型菌株,其无法在缺乏亮氨酸和尿嘧啶的培养基上生长,并且无法产生胞外蛋白酶。解脂耶氏酵母W29和PO1f的基因组已经完全测序。由于明确的遗传背景和营养缺陷型,解脂耶氏酵母PO1f已被广泛基因工程改造。在该实施方案中,通过敲除解脂耶氏酵母PO1f中编码Ku70蛋白的基因开发了解脂耶氏酵母ΔKu70。Ku70蛋白的缺失可以通过增加引入的基因片段与解脂耶氏酵母中的靶基因之间的同源重组来促进基因缺失和替换的过程。
亲本菌株解脂耶氏酵母W29(ATCC 20460)和解脂耶氏酵母PO1f(ATCC MYA-2613)购自美国典型培养物保藏中心(ATCC)。将与Ku70的上游和下游区域同源的约2.0-kb DNA片段依次克隆到质粒pUra3loxp中。将所得质粒线性化后,将DNA转化到解脂耶氏酵母PO1f中,并通过PCR筛选转化体。在确认Ku70缺失后,从菌株中去除ura3,并进一步去除携带Cre重组酶基因的质粒pYLCre。在该菌株中,Ku70蛋白被破坏以简化生成基因敲除和其他位点特异性同源基因整合事件的程序。解脂耶氏酵母ΔKu70的优点是无需筛选许多转化体即可获得用于基因缺失或位点特异性基因掺入基因组的理想菌株。
解脂耶氏酵母宿主菌株ΔKu70是一种营养缺陷型菌株,在leu2和uar3基因二者中具有突变。解脂耶氏酵母ΔKu70可以在完全培养基如酵母提取物-蛋白胨-葡萄糖(YPD)培养基或补充有尿嘧啶和亮氨酸的基本培养基上在28-30℃生长。用于转化解脂耶氏酵母ΔKu70的质粒携带leu2或ura3基因,与宿主中的相应缺陷基因互补。可以根据其在缺乏尿嘧啶或亮氨酸的培养基上生长的能力来选择转化体。在转化之前,解脂耶氏酵母ΔKu70不能在没有亮氨酸或尿嘧啶的基本培养基上生长。
实施例11
用于解脂耶氏酵母的表达载体
要在解脂耶氏酵母中表达异源基因和天然基因,需要功能性启动子通过使用可复制或整合质粒来驱动基因表达。作为合成生物学中的重要工具,启动子已被表征和并对解脂耶氏酵母进行工程化。该试剂盒提供了包含跨越广泛强度范围的单个和单一启动子的表达载体,并且还包括使用铜诱导型启动子构建的表达载体(表1)。这些表达载体提供了必要的工具来微调靶基因的表达。在该系统中,表达盒可以很容易地从载体中通过用指定的限制性内切酶(如XbaI/SpeI)消化回收,然后可以方便地与另一个进行组装。多基因表达可以通过包含启动子、克隆基因和终止子的表达盒的顺序组装来实现。此外,还提供了包含来自xpr2启动子的串联16个拷贝的上游激活序列(UAS16)的载体,用于对天然启动子进行工程化。该试剂盒中提供了编码β-半乳糖苷酶的基因lacZ,用于验证和量化启动子的强度(表2)。最后,通过将表达盒克隆到包含同源序列例如特定靶基因座或部分26s rDNA的质粒中并转化解脂耶氏酵母,可以将表达盒以单拷贝或高拷贝进一步引入到基因组中(表2)。
该试剂盒中包含的一组表达载体如表1所示。表1中列出的所有载体均包含大肠杆菌和解脂耶氏酵母的复制位点,作为大肠杆菌选择标记的氨苄青霉素抗性基因,以及作为解脂耶氏酵母的选择标记的leu2。大多数大肠杆菌菌株如Top10、DH5α和JM109可用于基因克隆和质粒增殖。表达载体pYLexp2包含启动子tef1N,它是解脂耶氏酵母中基因表达最常用的启动子之一。以下图显示了pYLexp2中的主要特征及其组织(图12和表3)。表2提供了本文使用的质粒列表和质粒的主要特征。表2包括根据本发明开发的用于产生敲除菌株的质粒、用于将基因片段整合到酵母基因组中的质粒和携带cre编码重组酶的质粒的特征。
表1.用于根据本公开使用开发的表达载体
表2.根据本公开使用的其他质粒
表3.表达载体pYLexp2的一般特征(见图12)
实施例12
用表达载体转化解脂耶氏酵母
用于解脂耶氏酵母转化的质粒DNA可用常规分子生物学技术制备。无需线性化,源自该试剂盒(表2)中提供的表达载体的质粒可用于直接转化解脂耶氏酵母。尽管已经为解脂耶氏酵母的遗传转化开发了各种方案和方法,但由于方便和高效,建议按照制造商的指南用Frozen-EZ酵母转化II试剂盒(Zymo Research,Irvine,CA,U.S.)进行转化。可以将酵母转化体铺在不含亮氨酸的合成培养基琼脂平板上,该培养基由以下组成:20g/L葡萄糖、6.7g/L酵母氮碱(YNB),不含氨基酸并且具有硫酸铵(US Biologicals),补充有2.0g/L的缺乏亮氨酸的完全氨基酸补充(US Biologicals)。在28-30℃下培养3天后,可以看到菌落并准备好从琼脂平板上挑取。同样,不含亮氨酸的合成液体培养基可用于培养重组体。
实施例13
解脂耶氏酵母中基因的缺失和整合
基因的缺失可用于研究基因功能和阻断代谢途径。解脂耶氏酵母基因敲除的产生涉及开发包含上游和下游同源臂和选择标记(例如uar3)的质粒,以替换要敲除的靶基因。该质粒用于转化解脂耶氏酵母,任选地使用线性化质粒,并验证基因缺失。在这个实施方案中,uar3侧翼具有34-bp loxp位点,因此在确认期望重组事件后,可通过编码重组酶的cre的表达去除选择标记(参见图14)。通过这种迭代基因整合和标记管理过程,可以产生解脂耶氏酵母的组合基因敲除。此外,可以将表达盒克隆到含有用于将它们整合到位点特异性位点的同源区域的质粒中。通常,基因在酵母基因组中的存在比在可复制载体中克隆的基因的存在更稳定。最后通过26s rDNA整合,将基因片段以高拷贝数整合到基因组中。
下面提供了一组用于使解脂耶氏酵母中的靶基因缺失的程序:
步骤1:生成破坏质粒并用线性化质粒转化酵母
靶基因(任选的26s rDNA序列)的约1-kb同源5’侧翼和3’侧翼可以分别克隆到质粒pUra3loxp中的ApaI/XbaI和SpeI/NdeI限制性位点(质粒图谱见图13)。所得质粒的线性化可以通过用ApaI或NdeI单消化而不破坏克隆的片段来进行,然后回收的DNA可用于转化解脂耶氏酵母ΔKu70。使用Frozen-EZ酵母转化II试剂盒(Zymo Research,Irvine,CA,U.S.)进行转化后,酵母转化体可以在由合成培养基琼脂平板上在28-30℃下生长,该培养基由20g/L葡萄糖、6.7g/L YNB(US Biologicals)并补充有缺乏尿嘧啶的氨基酸(USBiologicals)组成。
步骤2:通过PCR诊断验证基因敲除
2-3天后,挑取单个菌落,并在YPD肉汤中在28-30℃下进一步培养。同时,可以在YPD琼脂平板上复制菌落。通常,6个菌落足以获得基因被破坏的菌株。培养1-2天后,将1.0ml酵母培养物用于提取基因组DNA。尽管有不同的方法和试剂盒可用于从酵母细胞中提取基因组DNA,但以下程序已被验证为一种高效、快速且廉价的方法,以获得适用于PCR的相对高质量的基因组DNA。
1).收获细胞并重悬在由200mM乙酸锂和1% SDS组成的500μl裂解液中;
2).在70℃下孵育20分钟;
3).添加等体积的氯仿:异戊醇(24:1),涡旋并且离心;
4).收集水相,并且添加两倍体积的96-100%乙醇;
5).在冰箱于-20℃保持至少2小时,离心得到沉淀的DNA;
6).用1ml 70%乙醇清洗DNA沉淀;
7).将沉淀溶解在30μl的H2O或TE缓冲液中;
8).在20-ul反应混合物中使用0.5μl DNA溶液作为模板进行PCR;
ura3-testF、ura3-testR的引物和位于5’和3’侧翼外侧的两个引物(F和R)旨在生成PCR产物以验证交叉事件。本实施方案中使用的引物和ura-testF、ura3-testR的序列(5’至3’)为:
ura3-testF:TCCTGGAGGCAGAAGAACTT(SEQ ID NO:18);
ura3-testR:AGCCCTTCTGACTCACGTAT(SEQ ID NO:19);
然而,可以根据uar3标记的序列设计其他合适的引物来执行类似的功能。通过进行琼脂糖凝胶电泳检查PCR产物的大小来验证基因敲除。
步骤3:通过重组酶的表达来回收标记
以下步骤可用于去除敲除菌株中的ura3标记。
1).在YPD肉汤中于28-30℃培养鉴定出的敲除菌株的单菌落。收获细胞后,用带有编码cre重组酶的核酸的质粒pYLCre转化菌株。将酵母转化体铺在不含亮氨酸的合成YNB培养基的琼脂平板上;
2).从不含亮氨酸的合成YNB培养基的琼脂平板中挑取转化体,并将其接种到YPD肉汤中;
3).在YPD琼脂平板上对过夜培养物划线得到单菌落,并且在28-30℃孵育1天;
4).挑出单个菌落(通常10个菌株就足够了)并将它们复制到两个合成培养基平板上:对uar-和leu-以及YPD琼脂平板具有选择性。不能在不含尿嘧啶的培养基上生长的细胞没有ura3,质粒pYLCre在不能在不含亮氨酸的培养基上生长的细胞中丢失。为了验证标记丢失,可以使用适当的引物进行PCR。不含ura3基因且不含质粒pYLCre的菌株可用于下一轮的基因缺失。
SEQUENCE LISTING
<110> 华盛顿州立大学;熊小超;陈树林
<120> 用于在产油酵母中表达基因的通用基因表达系统
<130> 67635-335006
<150> 63/008,098
<151> 2020-04-10
<150> 63/147,352
<151> 2021-02-09
<160> 27
<170> PatentIn version 3.5
<210> 1
<211> 903
<212> DNA
<213> 解脂耶氏酵母
<400> 1
tgagatagtg agtttggaag tagtgttgag agtggtgaat gaaaagatgt ctgtgcagtg 60
agaaaaggag ggacatctgg ccgtatttat agattttccc gttcctagat cttcaaaata 120
cagttgtatt cagccgcagc gcaaagtacg catctgcatc ggcagtagca ctaatgtcgc 180
aaagaatgcg gttagacaaa gaaaaaaggc acagccgtgg cacaaacttc tcatatctcc 240
aatgattgac taagatttag gtggcgctaa agtaaacaat gtctttgtag aacttgctag 300
aagggtctga aagagaatgg aaatgtgtaa aggtgtgaag gatagtaatt gtacaagggt 360
gtacgagaag caactcaacc tggactatgt ggattcgatt cacctacttt taacattcaa 420
ctcgaactaa tgtcattata agcgtgccac tcaagtctct atccttctcc attcttccaa 480
cgtctgtgtc aggtgcatcg tacatattgt agatctctcg tcaaagttcc gaagtgtata 540
ttccaatagg actccgaaaa cgcacaagtc cacatgatgc tagacattcg gactccgaaa 600
cactaggagg ggctattatt gtgagatatt tcattattaa tgccgtttgg ccgaatttag 660
ccccgtttca gtggtatttt accgcgcatt actggagcat tcgaggggtt tatgctgcta 720
aggtttcgct tgtatgcgag atgcgagatt atcgctgcgg ctgaaataat tagtaaaaaa 780
gtgaaaaatt accagattgc aatatgtgct cttcgcaaca gcagcagcag atataaatag 840
gagacgagat ccgcaattcg gttgtcacac actcacacac acacacacac acacacacac 900
ata 903
<210> 2
<211> 903
<212> DNA
<213> 解脂耶氏酵母
<400> 2
tatgtgtgtg tgtgtgtgtg tgtgtgtgtg agtgtgtgac aaccgaattg cggatctcgt 60
ctcctattta tatctgctgc tgctgttgcg aagagcacat attgcaatct ggtaattttt 120
cactttttta ctaattattt cagccgcagc gataatctcg catctcgcat acaagcgaaa 180
ccttagcagc ataaacccct cgaatgctcc agtaatgcgc ggtaaaatac cactgaaacg 240
gggctaaatt cggccaaacg gcattaataa tgaaatatct cacaataata gcccctccta 300
gtgtttcgga gtccgaatgt ctagcatcat gtggacttgt gcgttttcgg agtcctattg 360
gaatatacac ttcggaactt tgacgagaga tctacaatat gtacgatgca cctgacacag 420
acgttggaag aatggagaag gatagagact tgagtggcac gcttataatg acattagttc 480
gagttgaatg ttaaaagtag gtgaatcgaa tccacatagt ccaggttgag ttgcttctcg 540
tacacccttg tacaattact atccttcaca cctttacaca tttccattct ctttcagacc 600
cttctagcaa gttctacaaa gacattgttt actttagcgc cacctaaatc ttagtcaatc 660
attggagata tgagaagttt gtgccacggc tgtgcctttt ttctttgtct aaccgcattc 720
tttgcgacat tagtgctact gccgatgcag atgcgtactt tgcgctgcgg ctgaatacaa 780
ctgtattttg aagatctagg aacgggaaaa tctataaata cggccagatg tccctccttt 840
tctcactgca cagacatctt ttcattcacc actctcaaca ctacttccaa actcactatc 900
tca 903
<210> 3
<211> 889
<212> DNA
<213> 解脂耶氏酵母
<400> 3
tgtgagtttg caagtgtgga gagtggtaga tgagatgatt tgtttctgtg tactgagaaa 60
aggagggaga tgtggcccta tttatagatt ttttcagttc ctagatttac aagatacagt 120
tttattcagc cgcagcacaa cgcacgcatc tgcatcagca gtagcactaa tgtcgcaaat 180
aatggggtta gacaaagaaa atggcacagc cgtggcacaa acctcgcata tcaccagtga 240
ttgacttaga tttaggtggc gctaaggtat acaatgtctt tgtggaactt gctagaaggg 300
tctgaaagag tatggtgtgt ataaacatgt aaagcataga ctgtgtataa gggtgtacga 360
gaaccatttc aacttggact atgtggattc gattcaccta cttttgacac tcgatttgaa 420
cacatttcat aatgagcgtt ccactcaagt ccctatcctt ctccattctt ccaacgtctg 480
tatcaggtgc atcgtagatc tctcgtcaaa gttgaaagtg aacatgtgag actcgaaaaa 540
cgcacgataa agtccacatg atgccagcca tttggactcc gaaacacttg aaggtgatat 600
tattgtcaga tctgtcatta ttataccgct tgatccaatt taggtccatt tcaatagtat 660
tttatggtgc atcactggaa cattcgagcg gtatatgctg ctaaggtttc gcttgtatgc 720
gagatgcgag attgtcgctg caactgaaat aattagtaaa aaaagtgaaa agttatcaga 780
tggcaaaatg tgctcgtcgc aacagcagca gtagatataa ataggagatg aggtccatgg 840
tttgtctctc tctctcacac acacacacac acacacaacc acaaccaca 889
<210> 4
<211> 896
<212> DNA
<213> 解脂耶氏酵母
<400> 4
tgtggttgtg gttgtgtgtg tgtgtgtgtg tgtgagagag agagacaaac catggacctc 60
atctcctatt tatatctact gctgctgttg cgacgagcac attttgccat ctgataactt 120
ttcacttttt ttactaatta tttcagttgc agcgacaatc tcgcatctcg catacaagcg 180
aaaccttagc agcatatacc gctcgaatgt tccagtgatg caccataaaa tactattgaa 240
atggacctaa attggatcaa gcggtataat aatgacagat ctgacaataa tatcaccttc 300
aagtgtttcg gagtccaaat ggctggcatc atgtggactt tatcgtgcgt ttttcgagtc 360
tcacatgttc actttcaact ttgacgagag atctacgatg cacctgatac agacgttgga 420
agaatggaga aggataggga cttgagtgga acgctcatta tgaaatgtgt tcaaatcgag 480
tgtcaaaagt aggtgaatcg aatccacata gtccaagttg aaatggttct cgtacaccct 540
tatacacagt ctatgcttta catgtttata cacaccatac tctttcagac ccttctagca 600
agttccacaa agacattgta taccttagcg ccacctaaat ctaagtcaat cactggtgat 660
atgcgaggtt tgtgccacgg ctgtgccatt ttctttgtct aaccccatta tttgcgacat 720
tagtgctact gctgatgcag atgcgtgcgt tgtgctgcgg ctgaataaaa ctgtatcttg 780
taaatctagg aactgaaaaa atctataaat agggccacat ctccctcctt ttctcagtac 840
acagaaacaa atcatctcat ctaccactct ccacacttgc aaactcacat ttcaca 896
<210> 5
<211> 852
<212> DNA
<213> 解脂耶氏酵母
<400> 5
tgtgatagtg tgtttgtgtg taggtggtgt tggagatgag atggtgtgtc tgtgtactga 60
gaaaaggagg gataacgggc cgtatttata gattttcccg ttcctagatc tacaagatac 120
agttgtattc agccgcagca caatgcacgc atgggcatgg cagtagcact aatgtcgcaa 180
agaatggggt caaacaaaga gagagacgcg gctgtggcac aatgatctca tatctagaac 240
attcgtaaca gattagatgg cgctatgtaa acaatgtctt tatggaatgg ggaaagaaga 300
tgggggaaga ctgtagccaa cgccgcacca aaagtgacct caactgaccc atatacacga 360
gactcacttg cttccagatc cctccttgat cctcctatcg gaaacgagct cacttcacat 420
ctaccagctc ttctgcttcg cagatcaccc ccagtaccta ctccaagctc aaagtacatt 480
ccagtcggac tccgaaaaaa cgcaatatac tctaatatga ggctgtcgga ctccgaaaca 540
ctaaacaatc gccatttttg tctgattcaa tacatattaa caccaattct ctctttaaat 600
ccctttcagc tccttgatgg gttctggaat attcgagcgg attgtgctgc taaggtttcc 660
attgtatgca aggtgcgaga ttatcgctgc ggctgaagaa actcaaaatg tgaaagttca 720
tgatatggcg aagagtgcgc ccaagacgaa tgccagcact ggacaatata aatagaagat 780
ggaatccgcc gttcaattca atcacaaata caaacactca caaacactca caaacactca 840
cacacaacca ca 852
<210> 6
<211> 850
<212> DNA
<213> 解脂耶氏酵母
<400> 6
tggttgtgtg tgagtgtttg tgagtgtttg tgagtgtttg tatttgtgat tgaattgaac 60
ggcggattcc atcttctatt tatattgtcc agtgctggca ttcgtcttgg gcgcactctt 120
cgccatatca tgaactttca cattttgagt ttcttcagcc gcagcgataa tctcgcacct 180
tgcatacaat ggaaacctta gcagcacaat ccgctcgaat attccagaac ccatcaagga 240
gctgaaaggg atttaaagag agaattggtg ttaatatgta ttgaatcaga caaaaatggc 300
gattgtttag tgtttcggag tccgacagcc tcatattaga gtatattgcg ttttttcgga 360
gtccgactgg aatgtacttt gagcttggag taggtactgg gggtgatctg cgaagcagaa 420
gagctggtag atgtgaagtg agctcgtttc cgataggagg atcaaggagg gatctggaag 480
caagtgagtc tcgtgtatat gggtcagttg aggtcacttt tggtgcggcg ttggctacag 540
tcttccccca tcttctttcc ccattccata aagacattgt ttacatagcg ccatctaatc 600
tgttacgaat gttctagata tgagatcatt gtgccacagc cgcgtctctc tctttgtttg 660
accccattct ttgcgacatt agtgctactg ccatgcccat gcgtgcattg tgctgcggct 720
gaatacaact gtatcttgta gatctaggaa cgggaaaatc tataaatacg gcccgttatc 780
cctccttttc tcagtacaca gacacaccat ctcatctcca acaccaccta cacacaaaca 840
cactatcaca 850
<210> 7
<211> 500
<212> DNA
<213> 解脂耶氏酵母
<400> 7
ttgcgagggg agaccagaca tggtggaagc acatgagggc ggggggccga tgccggtgct 60
ggaaagtcga ggtttgcaag ctgcatttcg acaaacttgc ggttcagtca cactccaaca 120
acctggtaac tccacacaag ccacaaatcc gttgtaccgt ttcagctaca ccgccacaag 180
tttttttcat tttgagccac aacctggatt tcacatcaga catgaactga ttaggctctg 240
tgggggggga tggcacagat aagcagttga tgtagcagaa gagaggggtt ggggcggatt 300
ctcgagactc catcctgttg ttttatcacg tgacttgtgt acttgtgtgc ttgtggctct 360
ttcactgctt ccgttgcatt tgagcccctc cagttgaccc agaccctcca tggaacacgt 420
ctctaaacaa ggtttagttt ttccaaatga ctgaatactc cgaaatcagt cgcagagaga 480
cttaacacac tccaccacaa 500
<210> 8
<211> 781
<212> DNA
<213> 解脂耶氏酵母
<400> 8
gagacccccg aacaaatgtg ccacaccctt gccaaaatga cgaatacacg gcgtcgcggc 60
cgggaatcga actcttggca ccgccacagg agtgaaattt gaaatttgaa atttgaaaaa 120
taattcacat tttgagtttc aataatatat cgatgaccct cccaaaagac ccaagtcgag 180
acgcaaaaaa acacccagac gacatggatg cggtcacgtg accgcaaaaa ccgccccgga 240
aatccgtttg tgacgtgttc aattccatct ctatgttttt ctgcggtttc tacgatgccg 300
caatggtggc caatgtgcgt ttcactgccg tagtggctgg aacaagccac agggggtcgt 360
cgggccaatc agacggtccc tgacatggtt ctgcgcccta acccgggaac tctaaccccc 420
gtggtggcgc aatcgctgtc ttcatgtgct ttatctcacg tgacggctgg aatctggcag 480
aagacggagt atgtacattt tgtcgttggt cacgttatcc ctaaaacgtg gtgtttaaac 540
tggtcgaatg cttggcccag aacacaagaa gaaaaaaacg agacaacttg atcagtttca 600
acgccacagc aagcttgtct tcactgtggt tggtcttctc cacgccacaa gcaacacgta 660
catgtcaatt acgtcagggt cttttaagtt ctgtggcttt tgaaccagtt ataaagaacc 720
aaccaccctt ttttcaaagc taatcaagac ggggaaattt tttttttgat atttttcgac 780
a 781
<210> 9
<211> 599
<212> DNA
<213> 解脂耶氏酵母
<400> 9
tctagaaatt atattttttt ctgcatatac atattcattt aatagaggag caaagattct 60
tatccccact caagtaattt gttgctataa ctaccaacct ggaccaaccg tacatagtcg 120
tagcgattat tacaacacac ccgaaaacac cataaaaacc ctgtaattcg atacattgga 180
attcgatcag aaaacaatgt ctcttactat cagtttcgat cactaaacct ctctctttac 240
catttgtata tattcaactc cttctggtat acacacatgc ccacaccaac tgtacacact 300
caacactgcg gctcatatat gcaccatgta tgacgcaacg tctcagtcac catctcagtg 360
aaccagtatg taggtgtgtg gtgggttgta cccagacgtg ttccagaata tatatataaa 420
gggccgattt ctcgttttca aacctctcca aactgcacaa tccaaccacc aagagtcact 480
cctcctctaa tacactgtga ctcttctgac tcgggaatca aactttttac agtcacttta 540
taggtgcagc agtatctcga tctcaggaca accacagaat caccacctac tacgacaca 599
<210> 10
<211> 791
<212> DNA
<213> 解脂耶氏酵母
<400> 10
gatcagaact aagctaacac tacagtagaa acagaagaga agccacgaga ggagaaaagg 60
tcacgtgatc cacgagataa caccctccct gatatgttac gtcacgtggc acattctatc 120
ccttctgtgc aatgtcacgt gcctgacctt tctcttcgac cgagagtcct acttttactt 180
gcagctttct cgccgcaccc tctaaatttg ctcgtcggtg catttacgat gtacagttgc 240
gaatctcggg tgattttttg ctcacatttt ggcggtagag cacttctttc cggtgcgaaa 300
tccgtcaaaa tgcaagttcg gggtatttgc gactatggtg atagttttgg aagtgtttct 360
gagtcaatta ctttgggatt ctccttctca ttcccttttg tatatggtat tctatggcat 420
gtatcatggc ttggagttgt ctgaaactca aaatacacct tgataaaatc tgattatctt 480
taacctaaaa gaggtagatc ggaagagtac gaagatagtt ttccggaaca gctacggaaa 540
acggtttgtg aatattaagg gaagttgggg accatggttt tcgtgtcaca tgatctacaa 600
gttgtgtccc ctgtgtgtgt tttgtgtcct gcagtttctg taacgcagtt gtatgtacag 660
tatgtacagt accaggacat actcctaacg ggcctcctct tgcacctgca cctggacgag 720
caaatttcga gcagatatcg agttaccatg caaagatcgg cgtatatata gacaggagct 780
tgggcctatg t 791
<210> 11
<211> 408
<212> DNA
<213> 解脂耶氏酵母
<400> 11
accaatgacc atccagtaaa ctcttcccag aaaccctggt cttggagatc cgtccgagtt 60
gtatgagccc tgtccctggt ttttggcggt ggccagaatg tcgtagacca tgttgtgagt 120
gacttcgagg gagtttgctg agaataggaa cctcctggag ctggtcgtaa ggactccgat 180
accacacact ctttacagtt tgctcaaaga tgcatagtgt tccgctagct agtaatagta 240
taaatctatt cgcacataga ctcagatttt ccagctgaaa cgagcaaata tcaaactcaa 300
aaaagagaca tcagcagctc ataattccag tatttccatc tcttttttat tcaactccaa 360
caccatttct cacacacaaa aatgagccac gaccacggaa gcatggat 408
<210> 12
<211> 105
<212> DNA
<213> 解脂耶氏酵母
<400> 12
ctgaggtgtc tcacaagtgc cgtgcagtcc cgcccccact tgcttctctt tgtgtgtagt 60
gtacgtacat tatcgagacc gttgttcccg cccacctcga tccgg 105
<210> 13
<211> 21
<212> PRT
<213> 明脉扁刺β四体病毒
<400> 13
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 14
<211> 22
<212> PRT
<213> 野猪
<400> 14
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 15
<211> 63
<212> DNA
<213> 明脉扁刺β四体病毒
<400> 15
ggctccggcg agggccgagg ctccctgctg acctgcggcg acgtcgagga gaaccccggc 60
ccc 63
<210> 16
<211> 1026
<212> DNA
<213> 小家鼠
<400> 16
aagcttatgt tctggcccac caagaaggac ctgaagaccg ctatggaggt cttcgctctc 60
ttccagtggg ccctgtctgc tctcgtcatc gtgaccaccg tcatcattgt gaacctgtac 120
ctcgtcgtgt tcacctccta ctggcccgtc accgtgctga tgctcacctg gctggccttc 180
gactggaaga cccctgagcg aggcggtcga cgattcacct gcgtgcgaaa gtggcgactg 240
tggaagcact actctgacta cttccccctc aagatggtca agaccaagga catctccccc 300
gaccgaaact acattctggt ttgtcacccc cacggcctca tggctcactc ttgtttcggt 360
cacttcgcta ccgacaccac cggtttctcc aagaccttcc ccggaattac cccctacatg 420
ctgaccctcg gcgctttctt ctgggtcccc ttcctgcgag actacgtgat gtctaccggt 480
tcctgctctg tctcccgatc ctctatggac ttcctgctca cccagaaggg caccggtaac 540
atgctcgtgg tggtggtggg aggcctcgcc gagtgtcgat actctacccc cggctccacc 600
accctgttcc tcaagaagcg acagggattc gtccgaaccg ctctgaagca cggcgtgtcc 660
ctcatccctg cctacgcttt cggagagacc gacctgtacg accagcacat tttcaccccc 720
ggtggattcg tcaaccgatt ccagaagtgg ttccagaaga tggtgcacat ctacccctgt 780
gccttctacg gacgaggcct gaccaagaac tcttggggtc tgctccccta ctcccagccc 840
gtcaccaccg tggtgggaga gcctctgcct ctccccaaga tcgagaaccc ctctgaggag 900
attgtggcca agtaccacac cctgtacatt gacgctctgc gaaagctctt cgaccagcac 960
aagaccaagt tcggcatctc cgagacccag gagctcgtca ttgtgtaagt cattgtgtaa 1020
cccggg 1026
<210> 17
<211> 729
<212> DNA
<213> 烟草蚀纹病毒
<400> 17
atgggcgagt ctctgttcaa gggccccaga gactacaacc ccatctcctc caccatctgt 60
catctgacca acgagtccga tggtcacact acctccctct acggtatcgg cttcggcccc 120
ttcatcatca ctaacaagca tctgtttcga cgaaataacg gtactctgct cgtgcaatcc 180
ctccacggcg tgttcaaagt caagaacacc accaccctcc agcagcacct cattgacggc 240
cgagacatga tcatcattcg aatgcccaag gacttccccc cctttcccca gaagctcaag 300
tttcgagagc cccagcgaga ggaacgaatc tgtctggtca ccaccaactt ccagaccaag 360
tccatgtcct ccatggtgtc cgacacctct tgcactttcc cctcctctga cggcatcttc 420
tggaagcact ggatccagac caaggacggt cagtgcggtt ctcctctggt ctccactcga 480
gacggcttca tcgtgggcat ccactccgcc tccaacttca ccaacaccaa taactacttc 540
acctccgtcc ccaagaactt catggagctg ctgactaacc aagaggccca gcagtgggtg 600
tctggttggc gactcaacgc cgattccgtg ctctggggcg gccacaaagt cttcatggtc 660
aagcccgagg agccttttca gcccgtcaag gaggccaccc agctcatgaa cagacgacga 720
cgacgataa 729
<210> 18
<211> 20
<212> DNA
<213> 人工合成序列
<220>
<223> ura3检测引物
<400> 18
tcctggaggc agaagaactt 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> ura3检测引物
<400> 19
agcccttctg actcacgtat 20
<210> 20
<211> 122
<212> DNA
<213> 解脂耶氏酵母
<400> 20
gtgagtttca gaggcagcag caattgccac gggctttgag cacacggccg ggtgtggtcc 60
cattcccatc gacacaagac gccacgtcat ccgaccagca ctttttgcag tactaaccgc 120
ag 122
<210> 21
<211> 792
<212> DNA
<213> 圆红冬孢酵母
<400> 21
cggcttgttc tctcctgctc tggtgggctg gcctgacatg taatgtgctc cgccgcaagt 60
ccgtcgtcgg tctcaattcg acgttgaaag ggcatagcgc aaggaagaac cctctgcgga 120
catgcagaat tactggctcg cctgctcctt cgtctactgg aataagtcct gtctcgttaa 180
agccccaacg tcgtttttcg acgtttgtaa ggcgcaagag gtgctatggg ctacgcagga 240
agctgagagg acatagaagt cgggggagga acggcgcaga gcggcagttg cggaagcatg 300
aggaaagcga gacggtccag catctgcagc gccaatccgc aatctcctgg ttgagcctgc 360
accggaagcg tcggaacagt atgcgcagag tcgaacgcaa gtaagaaaga cgcaccctca 420
cactcgctta cttcgagcca tacaacggat caaagctgcg cgtatctcgg cttgtaaggg 480
ccggaaagca acctcggaga tggacacgtc acatcaccaa cttatcgatc tcggccgtcg 540
acgtcgcaga gagggcgaga gaagcggtga aggagggaaa caacccctcg agagcatgat 600
ccgaccgaat ctgcagcgca ggaagccgtt acaagcccgc ctcgagcgca ggtcgggtcc 660
agccggggga cgaaacgcgc gaggctgatt cgtgagcgaa ggaagccgca tcgacaagtt 720
cgctcccctt tgccctcttt cccatcaccc gttctcgcct tacccgctca gaacaacacc 780
agatcactca ca 792
<210> 22
<211> 380
<212> DNA
<213> 圆红冬孢酵母
<400> 22
tagacgcacc tcctccagct tcacctgctt ccaacctttt ccaccgcctg caaccgcact 60
ttcgcctcgt tccttcggac tcttgcggct gcgatgttgt ccagcatcga caggagctgc 120
tttactttcg cttgacctgc ttgccacctg gtgctcgcac gatgccatat atcgcgaggg 180
aggcgagaga gcggagttgg ctggatgacg ctcgctccgg cttgcagctg gttgttacgg 240
tgttgcaaga atttctgtgc agtttgtacg agtggccccg cgttgtggat gatgtcggtt 300
cggttggcac ggccttgctc gctcgctctc tcgttgctcc tcgctcttca ccacttcact 360
tctaacacta actagctaca 380
<210> 23
<211> 785
<212> DNA
<213> 圆红冬孢酵母
<400> 23
tagcggcatg tcccgtcact gtccgcgagg tctgtagaag gagaacgagg tcgatgacgg 60
tgcgtcgagg tcgaggagga cgagagaacc gcccgacgcc gttggaagcc tcgctcccgg 120
tccgagcgag tgtagacaga gtcgaacagg gacgcagcag ccacagcggg acgcttgagc 180
gatgagcgag gtcgtggcgt ccgccaactt gctcgtcgcc gtcgaacctg gcttgggttc 240
gttctcacca ctcgctctca gctcttcttc cacgtgagct tggtttgaac actgcttggc 300
ttttcctaag accgtcggac tcgtctcgca cggcgaagcg gcggtgggaa cgggtcgggg 360
acgaacgggg cgaacgattc catcggatgg agccgaaaca cggcgacgac ggcttgggac 420
tggctcggtt gggttgatat ggatacagag acgctggatc aggctatgga tgaagttgca 480
gacatcccag tgctgtgtgg acgccatgct gacctcgcca tcttctcccc gtcgaccatc 540
cctcccgact cgccattcgc gctgatcccg cgtcggatcc tgcctgttgc acctcttgcg 600
tgagtcttac agcttctcta caccctgccg cggcatcgag gtaacccgga tctttctccc 660
tcgcctttgc caacctccgt cagatttgga cccccgctca acaacttcga ccgaacccac 720
cgcttttctc gcttttctcg acacgccagt cgctttcgca gacacctatc cgcacctaag 780
caacc 785
<210> 24
<211> 370
<212> DNA
<213> 圆红冬孢酵母
<400> 24
tgcagtgcac tctgttgctc gtatcatgtc ccactccctt gtatccctcg agtcggtcga 60
ctcttccctg gcgagtccaa gcggaggagg tggtcgtcgc ctgacccgct cggagtgcgc 120
cgctcgactt ggccctggga gaacaagcct gtgtgagtct gtctagcctg tcagcgaatg 180
cgccagacga gtgcaagcgg gtgagcgagg tcgaccctgc tcgtcactcg ctcgtcgggt 240
gcggccgcat cgttgaactt gcacttctca ctcgcactcg ctctggtaca gctacagtca 300
ctcgcttact actctgcagg ttcacagcaa ctcacccgtc caactcccac cctcccccgt 360
gcagcccacc 370
<210> 25
<211> 3849
<212> DNA
<213> 淡紫灰链霉菌
<400> 25
atgactctgc aagaaacctc tgtgctggaa cccactctgc aaggcaccac caccctcccc 60
ggtctgctgg ctcaaagagt ggccgagcat cccgaggcta ttgccgtggc ctaccgagac 120
gataaactga ccttccgaga gctggcttct cgatctgccg ctctggctga ctatctggag 180
catctcggtg tgtctgccga tgattgcgtc ggtctcttcg tcgaaccctc tattgatctg 240
atggtcggtg cttggggtat cctcaatgct ggcgctgcct atctccctct gtctcccgag 300
taccccgaag acagactccg atacatgatc gagaactctg agaccaagat tattctggct 360
cagcaacgac tggtctcccg actgagagag ctggctccca aagacgtgac tattgtgacc 420
ctccgagagt ccgaggcctt cgtccgaccc gagggcactg aggctcccgc cgctagatct 480
gctagacccg acaccctcgc ctacgtcatc tacacctctg gctctaccgg caagcccaag 540
ggtgtgatga tcgagcaccg atccatcgtg aatcagctcg gttggctgag agagacctat 600
gccattgacc gatccaaggt catcctccag aagaccccta tgtccttcga tgctgcccag 660
tgggagattc tctcccccgc taacggtgcc actgtggtga tgggtgctcc cggcgtgtac 720
gctgatcccg agggcctcat cgagactatc gtgaagcaca acgtcaccac cctccagtgt 780
gtgcccactc tgctccaagg cctcattgat actgagaagt tccccgagtg cgtgtccctc 840
cagcaaatct tttctggcgg cgaagctctg tctcgactgc tggccatcca gactacccaa 900
gagatgcccg gccgagctct gatcaacgtg tacggcccta ccgagaccac tattaattcc 960
tcctccttcc ccgtcgatcc cgccgatctg gatgaaggcc cccagtctat ttccattggt 1020
tcccccgtcc acggcactac ctaccatatt ctggacaagg agaccctcaa gcccgtcggt 1080
gtcggtgaga ttggtgagct gtatatcggt ggcatccagc tggctcgagg ctatctgcac 1140
agagacgatc tcaccgccga acgattcctc gagatcgagc tcgaggaagg cgccgaaccc 1200
gtccgactgt acaaaactgg cgatctgggt cagtggaaca atgatggcac cgtgcagttc 1260
gctggccgag ctgacaatca agtgaagctc cgaggctacc gagtcgagct cgacgagatc 1320
tctctcgcca tcgagaacca cgattgggtg cgaaacgccg ccgtcatcgt caagaatgac 1380
ggtcgaactg gctttcagaa cctcatcgct tgcatcgagc tgtccgagaa ggaagccgcc 1440
ctcatggatc aaggtaatca cggctcccac cacgcttcca aaaagtccaa gctccaagtc 1500
aaggcccagc tgtctaaccc cggtctgaga gatgacgccg aactggccgc cagacccgcc 1560
tttgatctgg agggtgccga acccaccccc gagcagagag ctagagtgtt cgcccgaaaa 1620
acctaccgat tttacgaggg tggcgctgtg actcaagccg atctgctggg tctgctcggc 1680
gccaccgtca ctgctggtta ctccagaaag gctgctgacc tcgcccccgc tgagctcggc 1740
cagatcctcc gatggtttgg ccaatacatc tccgaggaac gactgctgcc taagtacggt 1800
tatgcctccc ccggcgccct ctacgccact caaatgtact ttgagctcga gggcgtcggt 1860
ggcctcaagc ccggctacta ctactatcag cccgtgagac accagctcgt gctgatttcc 1920
gagcgagagg ccaccggtaa ggctactgcc caaatccatt tcatcggcaa gaaatccggc 1980
atcgagcccg tctacaaaaa caatattctg gaggtgctcg agattgagac tggccacatg 2040
gtcggtctgt ttgaacagat tctgcccgcc tatggtctgg atatccacga ccgagcttac 2100
gaacccgccg tcaaagatct gctggacgtg gctgacgagg actactatct gggtactttt 2160
gagctcgtgc ctcacgctgg cgccagagac gatcaagccg aggtgtacgt ccaaactcac 2220
ggtggtaagg tggccggtct gcccgaaggt cagtatcgat acgaaaacgg cgaactcacc 2280
cgattttccg acgacatcgt gctgaagaag catgtcattg ccatcaacca atctgtgtac 2340
caagccgctt cctttggcat ctccgtgtat tccagagccg aggaggagtg gctcaaatac 2400
attaccctcg gcaagaaact ccagcatctg atgatgaacg gcctcaacct cggctttatg 2460
tcctccggtt actcttctaa gaccggcaac cctctccccg cctctcgacg aatggacgct 2520
gtcctcggtg ccaatggcgt ggactctgct cccatgtact ttttcgtcgg cggcagaatc 2580
tccgatgagc aaattggcca cgagggtatg cgagaagact ccgtccacat gcgaggtccc 2640
gccgaactca ttagagacga cctcgtgtcc ttcctccccg attatatgat ccccaaccga 2700
gtggtggtct ttgaccgact gcctctgtcc gccaacggta aaattgacgt gaaggctctg 2760
gccgcttccg atcaagtcaa tgctgagctc gtcgagcgac cttttgtcgc cccccgaacc 2820
gaaaccgaga aagaaatcgc cgccgtctgg gagaaggctc tgcgacgaga aaacgcctct 2880
gtccaagatg atttcttcga atccggcggc aactctctga tcgccgtggg tctcgtcaga 2940
gaactgaacg ctcgactcgg tgtctccctc cctctccagt ctgtgctgga gtcccccacc 3000
atcgagaagc tggccagacg actggaaaga gaagtcgctc aagagtcctc ccgattcgtg 3060
cgactccacg ccgaaaccgg caaggcccga cccgtcatct gttggcccgg tctgggcggt 3120
taccctatga atctgcgatc cctcgctggt gaaatcggcc tcggcagatc cttctacggc 3180
gtccagtctt atggcatcaa cgagggcgaa actccctatg agaccatcac cgagatggcc 3240
aaaaaagaca ttgaggctct gaaggaaatt cagcccgccg gcccttacac tctgtggggt 3300
tactcctttg gcgctagagt cgctttcgaa accgcttacc agctcgagca agctggcgaa 3360
aaggtggaca atctgtttct gattgccccc ggctccccta aagtgcgagc cgagaacggt 3420
aaggtgtggg gccgagaggc ctccttcgct aaccgaggct acaccactat tctcttttcc 3480
gtcttcaccg gcaccatttc tggtcccgat ctggacagat gtctggaaac tgtcactgac 3540
gaagcctcct tcgccgagtt catctccgag ctcaagggta tcgacgtcga tctggctaga 3600
cgaatcatct ccgtggtggg tcaaacctac gagtttgagt attctttcca cgagctcgct 3660
gagcgaactc tgcaagcccc tatttccatc ttcaaggccg tgggcgacga ctactccttc 3720
ctcgagaact cttctggcta ctctgccgaa cctcccactg tcattgatct cgacgccgac 3780
cattactctc tgctgagaga ggacatcggc gagctggtca agcacatccg atatctgctg 3840
ggcgagtaa 3849
<210> 26
<211> 675
<212> DNA
<213> 枯草芽孢杆菌
<400> 26
atgaagatct acggcatcta catggatcga cccctctctc aagaggagaa cgagcgattc 60
atgtccttca tctcccccga gaagcgagag aagtgccgac gattctacca caaggaggac 120
gctcaccgaa ctctgctcgg tgacgtgctg gtccgatccg tcatttccag acagtaccag 180
ctcgacaagt ctgacatccg attttccacc caagagtacg gcaagccttg catccccgat 240
ctgcccgacg cccacttcaa catctcccac tctggtcgat gggtgatctg cgccttcgat 300
tcccagccca ttggcatcga catcgaaaag accaagccca tctctctgga gatcgccaag 360
cgattcttct ctaagactga gtactccgat ctcctcgcca aggacaaaga cgagcagact 420
gactacttct accacctctg gtccatgaag gagtccttca tcaagcaaga gggtaagggt 480
ctgtctctcc ctctggactc cttctccgtg cgactgcacc aagacggtca agtctctatc 540
gagctgcccg actcccactc tccttgctac atcaaaacct acgaggtgga ccccggctac 600
aaaatggctg tgtgtgccgc tcaccccgac ttccccgagg acatcaccat ggtgtcctac 660
gaggagctgc tctaa 675
<210> 27
<211> 11
<212> PRT
<213> 大肠杆菌
<400> 27
Ala Ala Asn Asp Glu Asn Tyr Ala Leu Ala Ala
1 5 10
Claims (28)
1.一种转录元件,其包含:
启动子;和
多接头,
其中所述启动子包含选来自于SEQ ID NO:1(PMT-1)、SEQ ID NO:2(PMT-2)、SEQ ID NO:3(PMT-3)、SEQ ID NO:4(PMT-4)、SEQ ID NO:5(PMT-5)、SEQ ID NO:6(PMT-6)、SEQ ID NO:7(PTHR1)、SEQ ID NO:8(PMET3)、SEQ ID NO:9(PSER1)、SEQ ID NO:10(PCTR1)和SEQ ID NO:11(PCTR2)组成的组的核酸序列,或与选来自于SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQID NO:11组成的组的核酸序列具有至少95%序列同一性的核酸序列,并且进一步地,其中所述多接头可操作地连接至所述启动子序列。
2.根据权利要求1所述的转录元件,其中所述启动子序列包含选来自于SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的序列,任选地其中所述启动子序列包含选自由SEQ ID NO:2和SEQ ID NO:6组成的组的序列,任选地其中所述启动子包含SEQ ID NO:1和SEQ ID NO:2。
3.根据权利要求2所述的转录元件,进一步包含可操作地连接到所述启动子序列的1至16个UAS序列,任选地其中所述UAS序列中的每一个是相同的并且包含SEQ ID NO:12的序列。
4.权利要求1-3中任一项所述的转录元件,进一步包含位于所述多接头下游的2A多肽编码核酸序列,任选地其中编码的2A肽具有序列GSGEGRGSLLTCGDVEENPGP(SEQ ID NO:13)或GSGATNFSLLKQAGDVEENPGP(SEQ ID NO:14)。
5.根据权利要求4所述的转录元件,其中所述2A多肽编码核酸序列包含与SEQ ID NO:15具有99%序列同一性的序列。
6.根据权利要求4或5所述的转录元件,其中所述转录元件包含多个2A多肽编码核酸序列,其中所述多个2A多肽编码核酸序列中的每一个各自由至少一个对所述转录元件独特的限制酶切割位点进行。
7.根据权利要求6所述的转录元件,还包含编码TEV肽酶的核苷酸序列。
8.根据权利要求1-7中任一项所述的转录元件,还包含来自位于所述启动子和所述多接头之间的基因tef的第一内含子。
9.根据权利要求1-8中任一项所述的转录元件,其形成为质粒。
10.根据权利要求2-9中任一项所述的转录元件,其中所述启动子在启动子序列的每一端侧翼具有多接头序列。
11.根据权利要求1-10中任一项所述的转录元件,进一步包含选择标记,任选地其中所述选择标记是营养缺陷型标记,任选地其中所述营养缺陷型标记是leu2。
12.根据权利要求1-11中任一项所述的转录元件,进一步包含抗生素抗性基因作为选择标记。
13.根据权利要求1-12中任一项所述的转录元件,进一步包含解脂耶氏酵母(Yarrowialipolytica)的复制区。
14.根据权利要求1-13中任一项所述的转录元件,进一步包含大肠杆菌(E.coli)的复制区。
15.根据权利要求1-14中任一项所述的转录元件,其中所述启动子可操作地连接至异源编码序列。
16.包含权利要求15所述的核酸的解脂耶氏酵母(Y.lipolytica)或圆红冬孢酵母(Rhodotorula toruloides)宿主细胞,任选地其中所述宿主细胞是Ku70缺失菌株。
17.一种通过诱导单个控制元件同时诱导两种基因产物表达的方法,所述方法包括
提供宿主细胞,所述宿主细胞包含可操作地连接至所述启动子的正链上的第一基因和负链上的第二基因的Cu2+诱导型启动子,其中所述启动子包含选自由SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列,或与由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组的核酸序列具有至少95%序列同一性的序列;
使所述宿主细胞与一定量的Cu2+接触,所述Cu2+诱导所述启动子的双向转录以诱导所述第一和第二基因的表达。
18.根据权利要求17所述的方法,其中多个基因以串联阵列可操作地连接至所述启动子,其中2A多肽编码序列位于所述多个基因中除了最后一个之外的所有基因的3’末端。
19.权利要求17或18的方法,进一步包括降低内源基因表达的步骤,其中
通过使所述宿主细胞与抑制剂接触来抑制可操作地连接到所述内源基因的可抑制异源启动子,任选地其中所述阻抑型启动子包含选自由SEQ ID NO:10(CTR1)和SEQ ID NO:11(CTR2)组成的组的序列。
20.一种试剂盒,其包含
诱导型启动子序列,其选自由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6组成的组,任选地形成为第一质粒;以及
第二质粒,其中所述第二质粒包含
位于编码选择标记基因的核酸序列的侧翼的第一对和第二对34-bp loxp位点;
位于所述第一loxp位点上游的第一限制性位点;以及
位于所述第二loxp位点下游的第二限制性位点,其中所述第一和第二限制性位点彼此不同并且是所述第二质粒所独有的。
21.根据权利要求20所述的试剂盒,其中所述诱导型启动子可操作地连接至多接头并形成为第一质粒。
22.根据权利要求20或21中任一项所述的试剂盒,进一步包含阻抑型启动子,其选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组,任选地形成为第三质粒。
23.根据权利要求20-22中任一项所述的试剂盒,其中所述第二质粒进一步包含在诱导型启动子的控制下编码cre重组酶的核酸序列。
24.根据权利要求20-22中任一项所述的试剂盒,进一步包含第四质粒,其中所述第四质粒包含编码cre重组酶的核酸序列。
25.根据权利要求22-24中任一项所述的试剂盒,其中所述第二质粒还包含位于所述第一限制性位点上游的第一26s rDNA序列和位于所述第二限制性位点下游的第二26s rDNA序列。
26.一种试剂盒,其包含
第一质粒,其包含由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5和SEQ ID NO:6组成的组的诱导型启动子序列,以及多接头,其中所述多接头可操作地连接到所述诱导型启动子;以及
第二质粒,其中所述第二质粒包含
选自由SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11组成的组的阻抑型启动子,以及多接头,其中所述多接头可操作地连接至所述阻抑型启动子。
27.根据权利要求26所述的试剂盒,其中所述阻抑型启动子选自由SEQ ID NO:10和SEQID NO:11组成的组。
28.权利要求20-27中任一项的试剂盒,其中1-16个UAS元件位于诱导型和/或阻抑型启动子的上游。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063008098P | 2020-04-10 | 2020-04-10 | |
US63/008,098 | 2020-04-10 | ||
US202163147352P | 2021-02-09 | 2021-02-09 | |
US63/147,352 | 2021-02-09 | ||
PCT/US2021/026202 WO2021207374A2 (en) | 2020-04-10 | 2021-04-07 | A universal gene expression system for expressing genes in oleaginous yeasts |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115996757A true CN115996757A (zh) | 2023-04-21 |
Family
ID=78023546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180041599.1A Pending CN115996757A (zh) | 2020-04-10 | 2021-04-07 | 用于在产油酵母中表达基因的通用基因表达系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230183722A1 (zh) |
EP (1) | EP4133091A4 (zh) |
CN (1) | CN115996757A (zh) |
WO (1) | WO2021207374A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118580979A (zh) * | 2024-06-27 | 2024-09-03 | 杭州精构生物科技有限责任公司 | 一种高产虾青素的工程菌及其构建方法与应用 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112017001567A2 (pt) * | 2014-07-25 | 2017-11-21 | Novogy Inc | promotores derivados de yarrowia lipolytica e arxula adeninivorans, e métodos de uso dos mesmos |
DK3242948T3 (da) * | 2015-01-06 | 2022-03-07 | Dsm Ip Assets Bv | Crispr-cas-system til en yarrowia-værtscelle |
CN111886241A (zh) * | 2018-01-09 | 2020-11-03 | 库尔生物制药有限公司 | 多聚体t细胞调节多肽及其使用方法 |
US11572546B2 (en) * | 2019-07-29 | 2023-02-07 | Ginkgo Bioworks, Inc. | Methods and compositions involving promoters derived from Yarrowia lipolytica |
-
2021
- 2021-04-07 CN CN202180041599.1A patent/CN115996757A/zh active Pending
- 2021-04-07 US US17/995,624 patent/US20230183722A1/en active Pending
- 2021-04-07 EP EP21783977.8A patent/EP4133091A4/en not_active Withdrawn
- 2021-04-07 WO PCT/US2021/026202 patent/WO2021207374A2/en not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118580979A (zh) * | 2024-06-27 | 2024-09-03 | 杭州精构生物科技有限责任公司 | 一种高产虾青素的工程菌及其构建方法与应用 |
CN118580979B (zh) * | 2024-06-27 | 2025-04-29 | 杭州精构生物科技有限责任公司 | 一种高产虾青素的工程菌及其构建方法与应用 |
Also Published As
Publication number | Publication date |
---|---|
EP4133091A2 (en) | 2023-02-15 |
WO2021207374A2 (en) | 2021-10-14 |
EP4133091A4 (en) | 2024-07-03 |
US20230183722A1 (en) | 2023-06-15 |
WO2021207374A3 (en) | 2021-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10557114B2 (en) | Thioesterases and cells for production of tailored oils | |
CN105121624A (zh) | 制备脂肪二羧酸的生物学方法 | |
Han et al. | Leucine zipper-mediated targeting of multi-enzyme cascade reactions to inclusion bodies in Escherichia coli for enhanced production of 1-butanol | |
JP2023507891A (ja) | リパーゼ改変株 | |
US11795464B2 (en) | Inducible production-phase promoters for coordinated heterologous expression in yeast | |
KR20150128770A (ko) | 티오에스테라아제 및 맞춤형 오일 생산용 세포 | |
US12049617B2 (en) | Optimization of C-8 sterol isomerization | |
CN105647822B (zh) | 一株过表达来源于寄生疫霉的ω-3脱饱和酶的重组高山被孢霉、其构建方法及应用 | |
CN118813433A (zh) | 一种生产β-胡萝卜素的基因工程菌及其制备方法和应用 | |
JP2018501810A (ja) | 天然又は改変真核細胞の生理機能に正の作用を有する細菌シャペロンの組合せ | |
CN115996757A (zh) | 用于在产油酵母中表达基因的通用基因表达系统 | |
CN112920960B (zh) | 一种提高酿酒酵母棕榈油酸含量的方法 | |
CN111088175A (zh) | 一种产红没药烯的解脂耶氏酵母及其构建方法与用途 | |
US20220127648A1 (en) | Genetically engineered yeast yarrowia lipolytica and methods for producing bio-based glycolic acid | |
CN110997703A (zh) | 新丙酮酸转移酶 | |
CN104673814A (zh) | 一种来自于阴沟肠杆菌的l-苏氨酸醛缩酶及其应用 | |
CN112391300A (zh) | 水飞蓟来源的黄酮3β-羟化酶及其辅酶的应用 | |
CN108779444A (zh) | 生产脂肪酸的方法 | |
CN112154213B (zh) | C-5甾醇去饱和的优化 | |
CN114540403A (zh) | 酯化虾青素的制造方法及酯化基因的应用 | |
KR20220098155A (ko) | 비바이러스성 전사 활성화 도메인들 및 그와 관련된 방법들 및 이용들 | |
Li | CRISPR/Cas9-Enabled Functional Genomic Editing in the Thermotolerant Yeast Kluyveromyces marxianus | |
WO2017163946A1 (ja) | 誘導型プロモーター | |
KR102566555B1 (ko) | 델타-9-지방산불포화 효소를 암호화 하는 유전자 및 이의 용도 | |
KR102212882B1 (ko) | 지방산 생산능이 증가된 클라미도모나스 속 미세조류 및 클라미도모나스 속 미세조류의 지방산 생산능을 증가시키는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |