ES2633587T3 - Producción de ácidos grasos por expresión heteróloga de agrupamientos de genes a partir de mixobacterias - Google Patents
Producción de ácidos grasos por expresión heteróloga de agrupamientos de genes a partir de mixobacterias Download PDFInfo
- Publication number
- ES2633587T3 ES2633587T3 ES11721794.3T ES11721794T ES2633587T3 ES 2633587 T3 ES2633587 T3 ES 2633587T3 ES 11721794 T ES11721794 T ES 11721794T ES 2633587 T3 ES2633587 T3 ES 2633587T3
- Authority
- ES
- Spain
- Prior art keywords
- seq
- amino acid
- acid sequence
- gene
- domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 108
- 230000014509 gene expression Effects 0.000 title claims abstract description 67
- 235000014113 dietary fatty acids Nutrition 0.000 title claims description 40
- 229930195729 fatty acid Natural products 0.000 title claims description 40
- 239000000194 fatty acid Substances 0.000 title claims description 40
- 150000004665 fatty acids Chemical class 0.000 title claims description 40
- 241000863434 Myxococcales Species 0.000 title claims description 27
- 108091008053 gene clusters Proteins 0.000 title description 60
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 506
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 107
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 claims abstract description 106
- 238000000034 method Methods 0.000 claims abstract description 73
- 150000001413 amino acids Chemical class 0.000 claims abstract description 64
- 102000057234 Acyl transferases Human genes 0.000 claims abstract description 60
- 108700016155 Acyl transferases Proteins 0.000 claims abstract description 60
- 108090001042 Hydro-Lyases Proteins 0.000 claims abstract description 47
- 102000004867 Hydro-Lyases Human genes 0.000 claims abstract description 47
- 101001014220 Monascus pilosus Dehydrogenase mokE Proteins 0.000 claims abstract description 38
- 101000573542 Penicillium citrinum Compactin nonaketide synthase, enoyl reductase component Proteins 0.000 claims abstract description 38
- 230000008569 process Effects 0.000 claims abstract description 35
- 125000002252 acyl group Chemical group 0.000 claims abstract description 33
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 31
- 102000004190 Enzymes Human genes 0.000 claims abstract description 22
- 108090000790 Enzymes Proteins 0.000 claims abstract description 22
- 108010078791 Carrier Proteins Proteins 0.000 claims abstract description 21
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims abstract description 15
- 230000006696 biosynthetic metabolic pathway Effects 0.000 claims abstract description 14
- 229910052799 carbon Inorganic materials 0.000 claims abstract description 13
- 101001110310 Lentilactobacillus kefiri NADP-dependent (R)-specific alcohol dehydrogenase Proteins 0.000 claims abstract description 11
- 108700026220 vif Genes Proteins 0.000 claims abstract description 5
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 54
- 102000004169 proteins and genes Human genes 0.000 claims description 241
- 108020004414 DNA Proteins 0.000 claims description 32
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 17
- 241000894006 Bacteria Species 0.000 claims description 16
- 239000000203 mixture Substances 0.000 claims description 16
- 102000014914 Carrier Proteins Human genes 0.000 claims description 14
- 102000002754 Glycerol-3-Phosphate O-Acyltransferase Human genes 0.000 claims description 9
- 108010018837 Glycerol-3-Phosphate O-Acyltransferase Proteins 0.000 claims description 9
- MBMBGCFOFBJSGT-KUBAVDMBSA-N all-cis-docosa-4,7,10,13,16,19-hexaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCC(O)=O MBMBGCFOFBJSGT-KUBAVDMBSA-N 0.000 claims description 7
- JAZBEHYOTPTENJ-UHFFFAOYSA-N eicosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCC(O)=O JAZBEHYOTPTENJ-UHFFFAOYSA-N 0.000 claims description 7
- 241000233866 Fungi Species 0.000 claims description 6
- JAZBEHYOTPTENJ-JLNKQSITSA-N all-cis-5,8,11,14,17-icosapentaenoic acid Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O JAZBEHYOTPTENJ-JLNKQSITSA-N 0.000 claims description 6
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 4
- 101710146995 Acyl carrier protein Proteins 0.000 claims description 3
- 241000589776 Pseudomonas putida Species 0.000 claims description 3
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 claims description 3
- 229960004488 linolenic acid Drugs 0.000 claims description 3
- 101001074429 Bacillus subtilis (strain 168) Polyketide biosynthesis acyltransferase homolog PksD Proteins 0.000 claims description 2
- 101000936617 Bacillus velezensis (strain DSM 23117 / BGSC 10A6 / FZB42) Polyketide biosynthesis acyltransferase homolog BaeD Proteins 0.000 claims description 2
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 claims description 2
- 235000020661 alpha-linolenic acid Nutrition 0.000 claims description 2
- 235000020778 linoleic acid Nutrition 0.000 claims description 2
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 claims description 2
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 claims 1
- 238000012258 culturing Methods 0.000 abstract description 2
- 108020004705 Codon Proteins 0.000 description 76
- 101150013914 PFA3 gene Proteins 0.000 description 58
- 241000775131 Aetherobacter Species 0.000 description 41
- 230000001851 biosynthetic effect Effects 0.000 description 36
- 241000775172 Aetherobacter fasciculatus Species 0.000 description 34
- 101100407828 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) ptr-3 gene Proteins 0.000 description 30
- 230000015572 biosynthetic process Effects 0.000 description 29
- 235000020660 omega-3 fatty acid Nutrition 0.000 description 25
- 241000598397 Schizochytrium sp. Species 0.000 description 23
- 239000000047 product Substances 0.000 description 20
- 241000490596 Shewanella sp. Species 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 18
- 230000002068 genetic effect Effects 0.000 description 17
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 16
- 238000000855 fermentation Methods 0.000 description 16
- 230000004151 fermentation Effects 0.000 description 16
- 241001532577 Sorangium Species 0.000 description 15
- 230000000694 effects Effects 0.000 description 15
- 239000012634 fragment Substances 0.000 description 15
- 244000005700 microbiome Species 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 15
- 102000039446 nucleic acids Human genes 0.000 description 15
- 238000012546 transfer Methods 0.000 description 15
- 239000002609 medium Substances 0.000 description 14
- 241000929620 Moritella marina ATCC 15381 Species 0.000 description 13
- 241000863422 Myxococcus xanthus Species 0.000 description 13
- 150000001875 compounds Chemical class 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 241001208362 Photobacterium profundum SS9 Species 0.000 description 11
- 241000862997 Sorangium cellulosum Species 0.000 description 11
- 239000002253 acid Substances 0.000 description 11
- 230000001413 cellular effect Effects 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 10
- 238000010276 construction Methods 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 210000004899 c-terminal region Anatomy 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 230000001580 bacterial effect Effects 0.000 description 8
- 230000002210 biocatalytic effect Effects 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 102100039805 G patch domain-containing protein 2 Human genes 0.000 description 7
- 101001034114 Homo sapiens G patch domain-containing protein 2 Proteins 0.000 description 7
- 101100165658 Alternaria brassicicola bsc5 gene Proteins 0.000 description 6
- 101100032924 Bacillus subtilis (strain 168) radA gene Proteins 0.000 description 6
- 101100492392 Didymella fabae pksAC gene Proteins 0.000 description 6
- 101710145505 Fiber protein Proteins 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 241001025880 Myxococcus xanthus DK 1622 Species 0.000 description 6
- 102000004316 Oxidoreductases Human genes 0.000 description 6
- 108090000854 Oxidoreductases Proteins 0.000 description 6
- 101100226893 Phomopsis amygdali PaP450-2 gene Proteins 0.000 description 6
- 241000192142 Proteobacteria Species 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000012010 growth Effects 0.000 description 6
- 239000002054 inoculum Substances 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- 101150031810 AGP1 gene Proteins 0.000 description 5
- 241000775179 Aetherobacter rufus Species 0.000 description 5
- 101100165663 Alternaria brassicicola bsc8 gene Proteins 0.000 description 5
- 241000235349 Ascomycota Species 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 101100226896 Phomopsis amygdali PaMT gene Proteins 0.000 description 5
- 241000607568 Photobacterium Species 0.000 description 5
- 241001260361 Photobacterium profundum Species 0.000 description 5
- 241000235648 Pichia Species 0.000 description 5
- 241000235342 Saccharomycetes Species 0.000 description 5
- 241000478624 Sorangium cellulosum So ce56 Species 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108020001778 catalytic domains Proteins 0.000 description 5
- 238000004587 chromatography analysis Methods 0.000 description 5
- 235000020673 eicosapentaenoic acid Nutrition 0.000 description 5
- 229960005135 eicosapentaenoic acid Drugs 0.000 description 5
- 238000004817 gas chromatography Methods 0.000 description 5
- 238000010353 genetic engineering Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 108020001580 protein domains Proteins 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 108020004465 16S ribosomal RNA Proteins 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 4
- 102100034613 Annexin A2 Human genes 0.000 description 4
- 108090000668 Annexin A2 Proteins 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 239000002028 Biomass Substances 0.000 description 4
- 241000195493 Cryptophyta Species 0.000 description 4
- 101100111747 Eupenicillium brefeldianum Bref-PKS gene Proteins 0.000 description 4
- -1 MAT Chemical compound 0.000 description 4
- 241000863420 Myxococcus Species 0.000 description 4
- 101100226895 Phomopsis amygdali PaP450-3 gene Proteins 0.000 description 4
- 101710130262 Probable Vpr-like protein Proteins 0.000 description 4
- 241000233671 Schizochytrium Species 0.000 description 4
- 241000863430 Shewanella Species 0.000 description 4
- 108700005078 Synthetic Genes Proteins 0.000 description 4
- 108700014220 acyltransferase activity proteins Proteins 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- YZXBAPSDXZZRGB-DOFZRALJSA-N arachidonic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(O)=O YZXBAPSDXZZRGB-DOFZRALJSA-N 0.000 description 4
- 101150083238 bsc7 gene Proteins 0.000 description 4
- 125000004432 carbon atom Chemical group C* 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 210000005036 nerve Anatomy 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 150000003904 phospholipids Chemical class 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- KUZABABLVHWUGR-UHFFFAOYSA-N 2-hydroxyheptadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)C(O)=O KUZABABLVHWUGR-UHFFFAOYSA-N 0.000 description 3
- 101150002976 ACP1 gene Proteins 0.000 description 3
- 241001156739 Actinobacteria <phylum> Species 0.000 description 3
- 101100165241 Arabidopsis thaliana BCP1 gene Proteins 0.000 description 3
- 241000863426 Archangiaceae Species 0.000 description 3
- 208000016444 Benign adult familial myoclonic epilepsy Diseases 0.000 description 3
- 102000011802 Beta-ketoacyl synthases Human genes 0.000 description 3
- 108050002233 Beta-ketoacyl synthases Proteins 0.000 description 3
- 241001135761 Deltaproteobacteria Species 0.000 description 3
- 101100536194 Escherichia coli prrB gene Proteins 0.000 description 3
- 241000192128 Gammaproteobacteria Species 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 101100275987 Halothiobacillus neapolitanus (strain ATCC 23641 / c2) csoS4B gene Proteins 0.000 description 3
- 108010061833 Integrases Proteins 0.000 description 3
- 241000276942 Kofleriaceae Species 0.000 description 3
- 241000235058 Komagataella pastoris Species 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 241000592260 Moritella Species 0.000 description 3
- 241000294598 Moritella marina Species 0.000 description 3
- 241000863421 Myxococcaceae Species 0.000 description 3
- 241000276945 Nannocystaceae Species 0.000 description 3
- 101150110809 ORM1 gene Proteins 0.000 description 3
- 241000180682 Phaselicystidaceae Species 0.000 description 3
- 241000863008 Polyangiaceae Species 0.000 description 3
- 101710101995 Pre-hexon-linking protein IIIa Proteins 0.000 description 3
- 241000235344 Saccharomycetaceae Species 0.000 description 3
- 241001466451 Stramenopiles Species 0.000 description 3
- 241000187747 Streptomyces Species 0.000 description 3
- 101100406376 Streptomyces antibioticus orfB gene Proteins 0.000 description 3
- 108090000782 Transferred entry: 4.2.1.59 Proteins 0.000 description 3
- 102000008579 Transposases Human genes 0.000 description 3
- 108010020764 Transposases Proteins 0.000 description 3
- 108010084455 Zeocin Proteins 0.000 description 3
- 238000013019 agitation Methods 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- 230000021615 conjugation Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 235000020669 docosahexaenoic acid Nutrition 0.000 description 3
- 229940090949 docosahexaenoic acid Drugs 0.000 description 3
- 101150089204 easF gene Proteins 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- 208000016427 familial adult myoclonic epilepsy Diseases 0.000 description 3
- ZGNITFSDLCMLGI-UHFFFAOYSA-N flubendiamide Chemical compound CC1=CC(C(F)(C(F)(F)F)C(F)(F)F)=CC=C1NC(=O)C1=CC=CC(I)=C1C(=O)NC(C)(C)CS(C)(=O)=O ZGNITFSDLCMLGI-UHFFFAOYSA-N 0.000 description 3
- VZCCETWTMQHEPK-QNEBEIHSSA-N gamma-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCC(O)=O VZCCETWTMQHEPK-QNEBEIHSSA-N 0.000 description 3
- 235000003869 genetically modified organism Nutrition 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- ZOCYQVNGROEVLU-UHFFFAOYSA-N isopentadecanoic acid Chemical compound CC(C)CCCCCCCCCCCC(O)=O ZOCYQVNGROEVLU-UHFFFAOYSA-N 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 235000019198 oils Nutrition 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 3
- 229930001119 polyketide Natural products 0.000 description 3
- 229930000044 secondary metabolite Natural products 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- GEHPRJRWZDWFBJ-FOCLMDBBSA-N (2E)-2-heptadecenoic acid Chemical compound CCCCCCCCCCCCCC\C=C\C(O)=O GEHPRJRWZDWFBJ-FOCLMDBBSA-N 0.000 description 2
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 2
- ROTVJTQFFYWWKB-UHFFFAOYSA-N 15-methylhexadec-2-enoic acid Chemical compound CC(C)CCCCCCCCCCCC=CC(O)=O ROTVJTQFFYWWKB-UHFFFAOYSA-N 0.000 description 2
- UGAGPNKCDRTDHP-UHFFFAOYSA-N 16-hydroxyhexadecanoic acid Chemical compound OCCCCCCCCCCCCCCCC(O)=O UGAGPNKCDRTDHP-UHFFFAOYSA-N 0.000 description 2
- JGHSBPIZNUXPLA-UHFFFAOYSA-N 2-Hydroxyhexadecanoic acid Natural products CCCCCCCCCCCCCCC(O)C(O)=O JGHSBPIZNUXPLA-UHFFFAOYSA-N 0.000 description 2
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 2
- 108030005924 3-hydroxypropionyl-CoA dehydratases Proteins 0.000 description 2
- 108030005917 4-hydroxybutanoyl-CoA dehydratases Proteins 0.000 description 2
- USVPNLRUHJWRFA-UHFFFAOYSA-N 5-methylhexa-2,4-dienoic acid Chemical compound CC(C)=CC=CC(O)=O USVPNLRUHJWRFA-UHFFFAOYSA-N 0.000 description 2
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 2
- 101150065296 ACP2 gene Proteins 0.000 description 2
- 241000203809 Actinomycetales Species 0.000 description 2
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 2
- 101100165660 Alternaria brassicicola bsc6 gene Proteins 0.000 description 2
- 101100512049 Arabidopsis thaliana LWD2 gene Proteins 0.000 description 2
- 241000863007 Archangium Species 0.000 description 2
- 101100499295 Bacillus subtilis (strain 168) disA gene Proteins 0.000 description 2
- 241000277113 Byssovorax Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 241000862992 Chondromyces Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241001646999 Corallococcus Species 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- 241000863004 Cystobacter Species 0.000 description 2
- 241001600177 Cystobacterineae Species 0.000 description 2
- 241001595875 Enhygromyxa Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 244000043261 Hevea brasiliensis Species 0.000 description 2
- 241000277101 Hyalangium Species 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 241000276954 Jahnella Species 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 241000863006 Melittangium Species 0.000 description 2
- 241000775184 Minicystis rosea Species 0.000 description 2
- 241000276944 Nannocystineae Species 0.000 description 2
- 241000862996 Nannocystis Species 0.000 description 2
- 101150007210 ORF6 gene Proteins 0.000 description 2
- 101150084291 ORFC gene Proteins 0.000 description 2
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 2
- 239000005642 Oleic acid Substances 0.000 description 2
- 241000233654 Oomycetes Species 0.000 description 2
- 235000021314 Palmitic acid Nutrition 0.000 description 2
- 241000206744 Phaeodactylum tricornutum Species 0.000 description 2
- 241000180704 Phaselicystis Species 0.000 description 2
- 101100226894 Phomopsis amygdali PaGT gene Proteins 0.000 description 2
- 101100226885 Phomopsis amygdali PaP450-4 gene Proteins 0.000 description 2
- 241001423784 Plesiocystis Species 0.000 description 2
- 241000862998 Polyangium Species 0.000 description 2
- 101710188299 Protein I Proteins 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 108700005075 Regulator Genes Proteins 0.000 description 2
- 241000316848 Rhodococcus <scale insect> Species 0.000 description 2
- 241001600176 Sorangiineae Species 0.000 description 2
- 241000863002 Stigmatella Species 0.000 description 2
- 101100350254 Streptomyces antibioticus oleV gene Proteins 0.000 description 2
- 101710193546 Tegument protein VP16 homolog Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 238000005273 aeration Methods 0.000 description 2
- 101150073130 ampR gene Proteins 0.000 description 2
- 235000021342 arachidonic acid Nutrition 0.000 description 2
- 229940114079 arachidonic acid Drugs 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000013611 chromosomal DNA Substances 0.000 description 2
- SECPZKHBENQXJG-UHFFFAOYSA-N cis-palmitoleic acid Natural products CCCCCCC=CCCCCCCCC(O)=O SECPZKHBENQXJG-UHFFFAOYSA-N 0.000 description 2
- 239000005516 coenzyme A Substances 0.000 description 2
- 229940093530 coenzyme a Drugs 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 235000012343 cottonseed oil Nutrition 0.000 description 2
- 235000013365 dairy product Nutrition 0.000 description 2
- 235000015872 dietary supplement Nutrition 0.000 description 2
- IQLUYYHUNSSHIY-HZUMYPAESA-N eicosatetraenoic acid Chemical compound CCCCCCCCCCC\C=C\C=C\C=C\C=C\C(O)=O IQLUYYHUNSSHIY-HZUMYPAESA-N 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 235000021323 fish oil Nutrition 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 150000002430 hydrocarbons Chemical class 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- IIUXHTGBZYEGHI-UHFFFAOYSA-N isoheptadecanoic acid Chemical compound CC(C)CCCCCCCCCCCCCC(O)=O IIUXHTGBZYEGHI-UHFFFAOYSA-N 0.000 description 2
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 2
- ZOCYQVNGROEVLU-UHFFFAOYSA-M isopentadecanoate Chemical compound CC(C)CCCCCCCCCCCC([O-])=O ZOCYQVNGROEVLU-UHFFFAOYSA-M 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 235000020978 long-chain polyunsaturated fatty acids Nutrition 0.000 description 2
- LTYOQGRJFJAKNA-DVVLENMVSA-N malonyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)CC(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 LTYOQGRJFJAKNA-DVVLENMVSA-N 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 2
- 235000021313 oleic acid Nutrition 0.000 description 2
- 229940012843 omega-3 fatty acid Drugs 0.000 description 2
- 150000003881 polyketide derivatives Chemical class 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- NNNVXFKZMRGJPM-KHPPLWFESA-N sapienic acid Chemical compound CCCCCCCCC\C=C/CCCCC(O)=O NNNVXFKZMRGJPM-KHPPLWFESA-N 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 150000003626 triacylglycerols Chemical class 0.000 description 2
- XSXIVVZCUAHUJO-AVQMFFATSA-N (11e,14e)-icosa-11,14-dienoic acid Chemical compound CCCCC\C=C\C\C=C\CCCCCCCCCC(O)=O XSXIVVZCUAHUJO-AVQMFFATSA-N 0.000 description 1
- OOJGMLFHAQOYIL-SQIWNDBBSA-N (2e,4e)-hexadeca-2,4-dienoic acid Chemical compound CCCCCCCCCCC\C=C\C=C\C(O)=O OOJGMLFHAQOYIL-SQIWNDBBSA-N 0.000 description 1
- SBHCLVQMTBWHCD-METXMMQOSA-N (2e,4e,6e,8e,10e)-icosa-2,4,6,8,10-pentaenoic acid Chemical compound CCCCCCCCC\C=C\C=C\C=C\C=C\C=C\C(O)=O SBHCLVQMTBWHCD-METXMMQOSA-N 0.000 description 1
- FPRKGXIOSIUDSE-SYACGTDESA-N (2z,4z,6z,8z)-docosa-2,4,6,8-tetraenoic acid Chemical compound CCCCCCCCCCCCC\C=C/C=C\C=C/C=C\C(O)=O FPRKGXIOSIUDSE-SYACGTDESA-N 0.000 description 1
- YUFFSWGQGVEMMI-UHFFFAOYSA-N (7Z,10Z,13Z,16Z,19Z)-7,10,13,16,19-docosapentaenoic acid Natural products CCC=CCC=CCC=CCC=CCC=CCCCCCC(O)=O YUFFSWGQGVEMMI-UHFFFAOYSA-N 0.000 description 1
- YUFFSWGQGVEMMI-RCHUDCCISA-N (7e,10e,13e,16e,19e)-docosa-7,10,13,16,19-pentaenoic acid Chemical compound CC\C=C\C\C=C\C\C=C\C\C=C\C\C=C\CCCCCC(O)=O YUFFSWGQGVEMMI-RCHUDCCISA-N 0.000 description 1
- HOBAELRKJCKHQD-UHFFFAOYSA-N (8Z,11Z,14Z)-8,11,14-eicosatrienoic acid Natural products CCCCCC=CCC=CCC=CCCCCCCC(O)=O HOBAELRKJCKHQD-UHFFFAOYSA-N 0.000 description 1
- OYHQOLUKZRVURQ-NTGFUMLPSA-N (9Z,12Z)-9,10,12,13-tetratritiooctadeca-9,12-dienoic acid Chemical compound C(CCCCCCC\C(=C(/C\C(=C(/CCCCC)\[3H])\[3H])\[3H])\[3H])(=O)O OYHQOLUKZRVURQ-NTGFUMLPSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- MZGZQWAWDYAUSF-UHFFFAOYSA-N 2-hydroxyheptadec-2-enoic acid Chemical compound CCCCCCCCCCCCCCC=C(O)C(O)=O MZGZQWAWDYAUSF-UHFFFAOYSA-N 0.000 description 1
- 108030005656 3-hydroxyacyl-[acyl-carrier-protein] dehydratases Proteins 0.000 description 1
- 102100037149 3-oxoacyl-[acyl-carrier-protein] synthase, mitochondrial Human genes 0.000 description 1
- 108010009924 Aconitate hydratase Proteins 0.000 description 1
- 102000009836 Aconitate hydratase Human genes 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 102100034544 Acyl-CoA 6-desaturase Human genes 0.000 description 1
- 102100022463 Alpha-1-acid glycoprotein 1 Human genes 0.000 description 1
- 101100437888 Alternaria brassicicola bsc11 gene Proteins 0.000 description 1
- 102000003991 Aminoacyltransferases Human genes 0.000 description 1
- 108090000438 Aminoacyltransferases Proteins 0.000 description 1
- 241000200158 Amphidinium Species 0.000 description 1
- 241000337031 Anaeromyxobacter Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241001474374 Blennius Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 241001148757 Byssovorax cruenta Species 0.000 description 1
- 102100021973 Carbonyl reductase [NADPH] 1 Human genes 0.000 description 1
- 241001055195 Cardamine graeca Species 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 238000003512 Claisen condensation reaction Methods 0.000 description 1
- 241000193464 Clostridium sp. Species 0.000 description 1
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 241000186031 Corynebacteriaceae Species 0.000 description 1
- 241001655326 Corynebacteriales Species 0.000 description 1
- 241000186226 Corynebacterium glutamicum Species 0.000 description 1
- 101000979117 Curvularia clavata Nonribosomal peptide synthetase Proteins 0.000 description 1
- 241001464430 Cyanobacterium Species 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 1
- 235000021298 Dihomo-γ-linolenic acid Nutrition 0.000 description 1
- 241000758536 Dikarya Species 0.000 description 1
- 241001480031 Dipodascaceae Species 0.000 description 1
- 235000021292 Docosatetraenoic acid Nutrition 0.000 description 1
- 235000021297 Eicosadienoic acid Nutrition 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 1
- 102000015303 Fatty Acid Synthases Human genes 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 1
- OPGOLNDOMSBSCW-CLNHMMGSSA-N Fursultiamine hydrochloride Chemical compound Cl.C1CCOC1CSSC(\CCO)=C(/C)N(C=O)CC1=CN=C(C)N=C1N OPGOLNDOMSBSCW-CLNHMMGSSA-N 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000705947 Glossomastix chrysoplasta Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000341975 Haliangium Species 0.000 description 1
- 101100275984 Halothiobacillus neapolitanus (strain ATCC 23641 / c2) csoS4A gene Proteins 0.000 description 1
- 244000286779 Hansenula anomala Species 0.000 description 1
- 235000014683 Hansenula anomala Nutrition 0.000 description 1
- 101000957437 Homo sapiens Mitochondrial carnitine/acylcarnitine carrier protein Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- 241000276943 Kofleria Species 0.000 description 1
- 102100023162 L-serine dehydratase/L-threonine deaminase Human genes 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 108010037138 Linoleoyl-CoA Desaturase Proteins 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- LTYOQGRJFJAKNA-KKIMTKSISA-N Malonyl CoA Natural products S(C(=O)CC(=O)O)CCNC(=O)CCNC(=O)[C@@H](O)C(CO[P@](=O)(O[P@](=O)(OC[C@H]1[C@@H](OP(=O)(O)O)[C@@H](O)[C@@H](n2c3ncnc(N)c3nc2)O1)O)O)(C)C LTYOQGRJFJAKNA-KKIMTKSISA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241001305626 Methylibium petroleiphilum PM1 Species 0.000 description 1
- 102100038738 Mitochondrial carnitine/acylcarnitine carrier protein Human genes 0.000 description 1
- 101100226030 Mus musculus Erg28 gene Proteins 0.000 description 1
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 1
- 101150050438 NPPA gene Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 101100226897 Phomopsis amygdali PaAT-1 gene Proteins 0.000 description 1
- 101100226886 Phomopsis amygdali PaPT gene Proteins 0.000 description 1
- 241001450594 Pichiaceae Species 0.000 description 1
- 241000947836 Pseudomonadaceae Species 0.000 description 1
- 241001291885 Pseudomonas putida GB-1 Species 0.000 description 1
- 241000233639 Pythium Species 0.000 description 1
- 241000277100 Pyxidicoccus Species 0.000 description 1
- 101100220583 Rhizobium meliloti (strain 1021) cheD gene Proteins 0.000 description 1
- 241000223252 Rhodotorula Species 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 241001538194 Shewanella oneidensis MR-1 Species 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 241000863001 Stigmatella aurantiaca Species 0.000 description 1
- 101100350255 Streptomyces antibioticus oleW gene Proteins 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- 241000204060 Streptomycetaceae Species 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241001136489 Talaromyces stipitatus Species 0.000 description 1
- 241001491687 Thalassiosira pseudonana Species 0.000 description 1
- 241001197925 Theila Species 0.000 description 1
- 241000233675 Thraustochytrium Species 0.000 description 1
- 241000144181 Thraustochytrium aureum Species 0.000 description 1
- HXWJFEZDFPRLBG-UHFFFAOYSA-N Timnodonic acid Natural products CCCC=CC=CCC=CCC=CCC=CCCCC(O)=O HXWJFEZDFPRLBG-UHFFFAOYSA-N 0.000 description 1
- 241000235006 Torulaspora Species 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 101100169253 Walleye dermal sarcoma virus orfA gene Proteins 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical group NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 238000010564 aerobic fermentation Methods 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000002518 antifoaming agent Substances 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000000721 bacterilogical effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000036995 brain health Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 125000001721 carboxyacetyl group Chemical group 0.000 description 1
- 150000007942 carboxylates Chemical group 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 108010079058 casein hydrolysate Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- CYQFCXCEBYINGO-IAGOWNOFSA-N delta1-THC Chemical compound C1=C(C)CC[C@H]2C(C)(C)OC3=CC(CCCCC)=CC(O)=C3[C@@H]21 CYQFCXCEBYINGO-IAGOWNOFSA-N 0.000 description 1
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 235000013367 dietary fats Nutrition 0.000 description 1
- HOBAELRKJCKHQD-QNEBEIHSSA-N dihomo-γ-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCCCC(O)=O HOBAELRKJCKHQD-QNEBEIHSSA-N 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 101150017627 easG gene Proteins 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 235000021588 free fatty acids Nutrition 0.000 description 1
- VZCCETWTMQHEPK-UHFFFAOYSA-N gamma-Linolensaeure Natural products CCCCCC=CCC=CCC=CCCCCC(O)=O VZCCETWTMQHEPK-UHFFFAOYSA-N 0.000 description 1
- 235000020664 gamma-linolenic acid Nutrition 0.000 description 1
- 229960002733 gamolenic acid Drugs 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 235000021474 generally recognized As safe (food) Nutrition 0.000 description 1
- 235000021472 generally recognized as safe Nutrition 0.000 description 1
- 235000021473 generally recognized as safe (food ingredients) Nutrition 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 239000005457 ice water Substances 0.000 description 1
- 230000036737 immune function Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000011090 industrial biotechnology method and process Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- YAQXGBBDJYBXKL-UHFFFAOYSA-N iron(2+);1,10-phenanthroline;dicyanide Chemical compound [Fe+2].N#[C-].N#[C-].C1=CN=C2C3=NC=CC=C3C=CC2=C1.C1=CN=C2C3=NC=CC=C3C=CC2=C1 YAQXGBBDJYBXKL-UHFFFAOYSA-N 0.000 description 1
- 125000000468 ketone group Chemical group 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 238000002803 maceration Methods 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 239000002075 main ingredient Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 125000000346 malonyl group Chemical group C(CC(=O)*)(=O)* 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 150000002763 monocarboxylic acids Chemical class 0.000 description 1
- 150000002772 monosaccharides Chemical class 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 229960002969 oleic acid Drugs 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 235000021315 omega 9 monounsaturated fatty acids Nutrition 0.000 description 1
- 239000006014 omega-3 oil Substances 0.000 description 1
- 101150040063 orf gene Proteins 0.000 description 1
- 101150063939 orfA gene Proteins 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 229940094443 oxytocics prostaglandins Drugs 0.000 description 1
- 238000004810 partition chromatography Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 125000000830 polyketide group Chemical group 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 150000003180 prostaglandins Chemical class 0.000 description 1
- 238000007348 radical reaction Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 241000137058 saccharomyceta Species 0.000 description 1
- 108020000318 saccharopine dehydrogenase Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 230000035943 smell Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- JIWBIWFOSCKQMA-UHFFFAOYSA-N stearidonic acid Natural products CCC=CCC=CCC=CCC=CCCCCC(O)=O JIWBIWFOSCKQMA-UHFFFAOYSA-N 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000008399 tap water Substances 0.000 description 1
- 235000020679 tap water Nutrition 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- LKOVPWSSZFDYPG-WUKNDPDISA-N trans-octadec-2-enoic acid Chemical compound CCCCCCCCCCCCCCC\C=C\C(O)=O LKOVPWSSZFDYPG-WUKNDPDISA-N 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 1
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
- C12P7/6432—Eicosapentaenoic acids [EPA]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
- C12P7/6427—Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
- C12P7/6434—Docosahexenoic acids [DHA]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y103/00—Oxidoreductases acting on the CH-CH group of donors (1.3)
- C12Y103/01—Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
- C12Y103/01009—Enoyl-[acyl-carrier-protein] reductase (NADH) (1.3.1.9)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y203/00—Acyltransferases (2.3)
- C12Y203/01—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
- C12Y203/01051—1-Acylglycerol-3-phosphate O-acyltransferase (2.3.1.51)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
Proceso de producción de ácidos grasos poliinsaturados por expresión de genes heterólogos de enzimas de la vía biosintética de ácidos grasos poliinsaturados en un organismo de producción, que comprende el cultivo del organismo de producción en presencia de una fuente de carbono fermentable, - en el que el organismo de producción se manipula genéticamente para comprender un primer gen, un segundo gen y un tercer gen, - en el que el primer gen contiene un dominio I que codifica una enoil reductasa que tiene una identidad de secuencia de aminoácidos de al menos el 59 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 13, SEQ ID NO: 44, SEQ ID NO: 75, SEQ ID NO: 109, SEQ ID NO: 133 y/o SEQ ID NO: 149, y - en el que el segundo gen contiene un dominio IIa que codifica una cetosintasa y una malonil-CoAtransacilasa que tiene una identidad de secuencia de aminoácidos de al menos el 57 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 16, SEQ ID NO: 47, SEQ ID NO: 78 y/o SEQ ID NO: 112, un dominio IIb que codifica al menos una proteína transportadora de acilos que tiene una identidad de secuencia de aminoácidos de al menos el 26 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 19, SEQ ID NO: 50, SEQ ID NO: 81, SEQ ID NO: 115 y/o SEQ ID NO: 155; un dominio IIc que codifica una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoácidos de al menos el 47 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 22, SEQ ID NO: 53, SEQ ID NO: 84, SEQ ID NO: 118 y/o SEQ ID NO: 158; y - en el que el tercer gen contiene un dominio IIIa que codifica una cetosintasa y un factor de longitud de cadena que tiene una identidad de secuencia de aminoácidos de al menos el 46 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 25, SEQ ID NO: 56, SEQ ID NO: 87, SEQ ID NO: 121 y/o SEQ ID NO: 161; y un dominio IIIb que codifica al menos una deshidratasa que tiene una identidad de secuencia de aminoácidos de al menos el 42 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 28, SEQ ID NO: 59, SEQ ID NO: 90, SEQ ID NO: 124 y/o SEQ ID NO: 164, y un dominio que codifica una aciltransferasa (AT) caracterizado por que la aciltransferasa codificada es una acil-glicerol-fosfato aciltransferasa (AGPAT) que tiene una identidad de secuencia de aminoácidos de al menos el 50 % con respecto a una secuencia de aminoácidos codificada por el dominio IV* contenido en el grupo que comprende SEQ ID NO: 30, SEQ ID NO: 61, SEQ ID NO: 95, SEQ ID NO: 129, SEQ ID NO: 135 y/o SEQ ID NO: 169, y secuencias de aminoácidos codificadas por una sección de secuencia de ácidos nucleicos contenida en el grupo que comprende SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.
Description
5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Produccion de acidos grasos por expresion heterologa de agrupamientos de genes a partir de mixobacterias
La invencion proporciona un metodo de produccion de acidos grasos poliinsaturados (AGPI) de cadena larga, preferentemente acidos grasos poliinsaturados omega-3, por expresion heterologa de agrupamientos de genes que codifican una via biosintetica de AGPI, procedentes de cepas especfficas de mixobacterias. Estos agrupamientos de genes unicos pueden clonarse e incorporate en una amplia serie de organismos que son adecuados para la produccion de AGPI en cantidades mejoradas, particularmente AGPI omega-3, por expresion heterologa.
Antecedentes tecnicos de la invencion
Los acidos grasos poliinsaturados de cadena larga, incluyendo los de la familia omega-3 que se conocen asimismo como AGPI u>-3 ("omega-3"), son acidos grasos interesantes en la naturaleza. Son importantes constituyentes de los fosfolfpidos que desempenan un papel en la disminucion de la rigidez de la membrana. El acido eicosapentaenoico (AEP) es un constituyente principal de los fosfolfpidos del cerebro humano y sirve como precursor de las prostaglandinas y resolvinas. Otro AGPI destacado de la familia omega-3 es el acido docosahexaenoico (ADH). La mejora en la funcion cognitiva y conductual en el desarrollo infantil parece estar correlacionada con altos niveles de este compuesto. Los AGPI omega-3, y en particular para ADH y AEP, han demostrado efectos beneficiosos sobre la salud p. ej., en la prevencion del cancer, artritis reumatoide, enfermedades cardiovasculares, mejora de la funcion inmunitaria, y salud ocular y cerebral (Teale, MC (ed.) 2006, "Omega-3 fatty acid research", Nova Science Publishers. Nueva York, y referencias en el mismo). Debido a estas propiedades beneficiosas, los AGPI omega-3 se estan utilizando ampliamente como lfpidos nutricionales en complementos de salud y dieteticos y como ingredientes funcionales en un amplio intervalo de alimentos. Los AGPI omega-3 comprenden actualmente uno de los segmentos de mayor y solido crecimiento del mercado en el sector de la industria de alimentos y bebidas, con un incremento esencial de la demanda en los ultimos anos. En estos dfas, el aceite de pescado es la fuente natural mas abundante y ampliamente utilizada de acidos grasos omega-3, pero la fuente designada sufre un exceso de pesca, carece de suministro de aceite de alta calidad con un contenido suficiente de ADH/AEP, y presenta problemas de calidad (olores, desaffos en la formula etc.). Procesos alternativos que implican algas y oomicetos como organismos productores se establecen o se estan desarrollando (Hinzpeter, Grasas y Aceites (2006) 57:336-342; Ward, Process Biochemistry (2005) 40:3627-3652). Dado que el suministro de aceite de pescado de alta calidad es cada vez mas limitado, se ha tratado de encontrar fuentes biologicas alternatives sostenibles. Se han explorado varios grupos de algas marinas durante mas de 20 anos y algunos productos basados en la biomasa de algas han llegado entretanto al mercado. Algunos oomicetos pertenecientes al grupo de los stramenopiles (un grupo de organismos eucariotas similares a las algas tambien conocido como "Chromophyta") tambien se notificaron ocasionalmente para producir los compuestos mencionados anteriormente (p. ej., de los generos Achyla y Pythium; (Aki, J. Ferm Bioeng. (1998) 86:504-507; Cheng, Biores. Technol. (1999) 67:101-110; Athalye, J. Agric. Food Chem. (2009) 57:2739-2744). En otros stramenopiles (p. ej., los generos Schizochytrium y Thraustochytrium; como se describe en los documentos US 7022512 y WO2007/068997) y en especies de Amphidinium dinofiagellate (documento US 2006/0099694), el ADH puede representar hasta el 48 % del contenido de acidos grasos de las celulas, que es el contenido mas elevado hasta ahora conocido en las eucariotas. No obstante, el cultivo de estos organismos a escala industrial aun supone un reto incluso despues de varios anos de desarrollo. Otras fuentes biologicas alternatives de AGPI omega-3 hasta el momento descubiertas son eubacterias procariotas [Nichols, Curr. Opin. Biotechnol. (1999) 10:240-246; Gentile, J. Appl. Microbiol. (2003) 95:1124-1133]. No obstante, la explotacion comercial de estos organismos para la produccion de AGPI a escala industrial se ve obstaculizada por las caracterfsticas de lento crecimiento de estos microorganismos psicrofilos, asf como su rendimiento y productividad inherentemente bajos. La expresion heterologa de agrupamientos de genes de AGPI omega-3 en los organismos adecuados industriales constituye una alternativa valida a la produccion de los AGPI omega-3 deseados a escala industrial, que tiene multiples ventajas en cuanto a los procesos de produccion que utilizan las cepas de tipo natural. Se ha establecido desde hace mucho tiempo que los AGPI omega-3 se biosintetizan de una manera similar a la de los metabolitos secundarios de los policetidos tanto en organismos procariotas como eucariotas (vease vista general de Metz, Science (2001) 293:290293), que permite la utilizacion de tecnicas para metodos similares como las que se han establecido en biotecnologfa microbiana a efectos de mejorar y modificar la produccion de agentes antibioticos y anticancerfgenos. Para las mixobacterias, este tipo de trabajo en relacion con la evaluacion de la biosfntesis de los metabolitos secundarios se ha descrito y se explica en revisiones recientes. (Wenzel, Curr. Opin. Biotechnol. (2005), 16:594-606; Wenzel, Curr. Opin. Drug Discov & Develop. (2009), 12 (2):220-230; Wenzel, Nat. Prod. Rep. (2009), 26 (11):1385- 1407).
La organizacion de los genes de AGPI en agrupamientos de genes permite su clonacion y transferencia a huespedes heterologos, que per se pueden ser organismos procariotas o eucariotas.
Los agrupamientos de genes que codifican las enzimas de la via sintetica para la biosfntesis de AGPI omega-3 se conocen de diversas bacterias marinas, incluyendo especies de los generos Moritella (Tanaka, Biotechnol. Lett. (1999) 21:641-646; Morita, Biochem Soc Trans 28:943-945 (2000)), Photobacterium (Allen, Microbiology (2002) 148:1903-1913), y Shewanella (Lee, J. Microbiol. Biotechnol. (2009) 19:881-887). Tales agrupamientos de genes biosintecticos de AGPI omega-3 bacterianos ya se transfirieron y se expresaron en Escherichia coli (Lee, Biotechnol.
5
10
15
20
25
30
35
40
45
50
55
60
65
Bioproc. Engin. (2006) 11:51 0-51 5; Orikasa, Biotechnol. Lett. (2006) 28:1841-1847; Orikasa, Biotechnol. Lett. (2007) 29:803-812). Ademas, la produccion heterologa de AEP se potencio mediante la sustitucion de secuencias promotoras en los agrupamientos de genes implicados en la biosfntesis (Lee, Biotechnol. Lett. (2008) 30:21392142). El agrupamiento de genes de AEP a partir de Shewanella sp. tambien se expreso en la cianobacteria marina transgenica del genera Synechococcus (Takeyama, Microbiology (1997) 143 (Pt 8):2725-2731 Orikasa, Biotechnol. Lett. (2007) 29,803-809), se observo una produccion heterologa de AEP potenciada en celulas de E. coli que co- expresan genes implicados en la biosfntesis de AEP y fragmentos de ADN exogeno incluyendo un gen de la catalasa de alto rendimiento. Los rendimientos de AEP aumentaron del 3 % al 12 % del contenido total de acidos grasos. Jiang (Methods in Enzymology (2009 ) 459,80-96) ha resumido la investigacion previa sobre la caracterizacion de los dominios de la protefna transportadora de acilos en tandem importantes en las sintasas de acidos grasos poliinsaturados, tambien represento diversos estudios que implicaban la expresion heterologa de los respectivos genes en Ecoli. Estos ejemplos muestran que es factible alcanzar la produccion heterologa de genes de AGPI omega-3 bacterianos, a pesar de que ningun producto comercial basado en tales tecnicas ha resultado hasta el momento. Hasta ahora nunca se han identificado agrupamientos de genes de AGPI omega-3 mixobacterianos y por consiguiente no se han expresado de manera heterologa. Las vfas biosinteticas de productos naturales mixobacterianos se han expresado con exito en una variedad de huespedes heterologos, incluyendo Pseudomonas putida (Gross, Chem. Biol, (2006) 13:1253-1264; Wenzel, Chem. Biol. (2005) 12 (3):349-356).
Debido a la gran importancia comercial de estos productos, existen varios ejemplos para la viabilidad de la expresion heterologa de los genes implicados en la biosfntesis de AGPI omega-3 a partir de varios organismos eucariotas y procariotas en plantas y hongos transgenicos. Como se ejemplifica por Domergue (Plant Physiol. (2003) 131, 16481660) y los genes biosinteticos de acidos grasos de la alga stramenopile, Phaeodactylum tricornutum, incluso la aclaracion de la biosfntesis de ciertas fuentes biologicas marinas que no son faciles de cultivar en el laboratorio han implicado a menudo su expresion heterologa en Saccharomyces cerevisiae u otras levaduras. Cipak (Free Radic. Biol. & Med. (2006) 40, 897-906) expreso un gen desaturasa a partir de la Hevea brasiliensis, arbol del caucho y tambien en S. cerevisiae. Tonon (2005, Plant Physiol. 138, 402-408) utilizo el mismo huesped para expresar y caracterizar una acil-coenzima A (acil-CoA) sintetasa que se descubrio de la minerfa genomica en la diatomea Thalassiosira pseudonana. Hsiao (2007, Mar. Biotechnol. 9,154-165) tambien utilizo S. cerevisiae como huesped para la expresion heterologa y la caracterizacion funcional de una delta-6 desaturasa a partir de la microalga marina Glossomastix chrysoplasta. Lee (2008, Biotechnol. Bioproc. Engin., 13, 524-532) ha demostrado con exito la actividad de la delta-9 elongasa, una enzima crucial en la biosfntesis de AGPI omega-3 a partir de stramenopile, Thraustochytrium aureum mediante la expresion heterologa en la levadura Pichia pastors. Li (Biotechnol. Lett., 31, 1011-1017) notifico una mejora en la produccion de acido araquidonico y acido eicosapentaenoico al aumentar el numero de copias de los genes que codifican la desaturasa y elongasa de acidos grasos a partir de la alga Phaeodactylum tricornutum en Pichia pastoris como huesped heterologo; no obstante, solo se alcanzaron porcentajes relativamente bajos de AGPI de 0,1 y 0,1 %, respectivamente del contenido de acidos grasos totales de Pichia pastoris. Esta ultima levadura, asf como Yarrowia lipolytica, Hansenula anomala, y otras levaduras metilotroficas y/u oleaginosas, parecen ideales para la produccion de AGPI, ya que son organismos productores industriales bien establecidos (Banlar, Appl. Microbiol. Biotechnol. (2009) 84, 47-865; Silva, J. Food, Agric & Environment. 2009, 7,268.273). Ademas, las levaduras oleaginosas, que son especialmente organismos de produccion preferentes y que son capaces de crecer en ambientes altamente lipofilos, pueden acumular grandes cantidades de lfpidos y pueden utilizar un amplio intervalo de hidrocarburos como sustratos. Otras aplicaciones de hongos semejantes a levaduras en microbiologfa y biotecnologfa industrial se han resumido por Porro (2005, Mol. Biotechnol. 31,245-259) e Idiris (2010, Appl. Microbiol. Biotechnol. 86:403-417).
Graham (Curr. Opin. Biotechnol. (2007) 18 (2), 142-147) ha resumido el estado de la tecnica en la ingenierfa metabolica de las plantas transgenicas para la biosfntesis de AGPI omega-3. Destaco, en particular, los recientes avances en el diseno racional de los cultivos de semillas oleaginosas con un contenido elevado de AGPI omega-3, pero tambien discutio varios factores que pueden ser responsables de los hasta ahora bajos rendimientos inherentes observados, que hasta el momento han impedido el desarrollo de procesos de produccion competitivos de AGPI mediante el uso de semillas oleaginosas u otras plantas de semillas. Taylor (Plant Biotechnol. J. (2009) 7, 925-938) ha identificado y clonado recientemente la 3-cetoacil-CoA sintasa de Cardamine graeca y notifico su expresion heterologa en semillas oleaginosas de Brassica, resultando en un aumento de las tasas de produccion de los AGPI, acido nervonico y notifico un aumento de 15 veces del acido nervonico en el huesped heterologo. No obstante, el acido nervonico es un AGPI omega-9, en lugar de un omega-3, y por el momento no ha alcanzado la importancia comercial de ADH y AEP. Ademas, el acido nervonico se deriva de la elongacion del acido oleico en la naturaleza.
Lee et al. (Biotech. Bioproc. Eng. (2006) 11, 510-515) describen la expresion heterologa de un agrupamiento de genes putativo de policetido sintetasa de Shewanella oneidensis MR-1 para la produccion de AEP en E. coli, el agrupamiento de genes se diferencia de la presente invencion al menos en que no comprende una acil-glicerol- fosfato aciltransferasa (AGPAT) como se describe en la presente memoria. El agrupamiento de genes se identifica solo como un fragmento de ADN de 20,195 kb obtenido por PCR larga utilizando un par de cebadores, cuyas secuencias nudeotidicas se dan, y por los tamanos del fragmento de restriccion generado por BglII y NdeI.
Orikasa et al. (Biotechnol. Lett. (2006) 28, 1841-1847) describen la sfntesis de ADH en E. coli mediante la expresion de un agrupamiento de genes a partir de Moritella marina MP-1. El agrupamiento de genes utilizado por Orikasa et
5
10
15
20
25
30
35
40
45
50
55
60
65
al., tampoco comprende una acil-glicerol-fosfato aciltransferasa (AGPAT) como se describe en la presente memoria pero en su lugar se describe otra aciltransferasa que es bastante diferente en terminos de identidad proteica (Ej. 7).
Otros documentos se refieren a la produccion de acidos grasos mediante el cultivo de productores naturales de los mismos. El documento WO 2010/063451A1 ensena en general un metodo de produccion de acidos grasos poliinsaturados mediante el cultivo de cepas especfficas mixobacterianas, pero falla, no obstante, en revelar cualquier secuencia especffica que podrfa utilizarse en la expresion heterologa. De manera similar, Garcia R et al., (J Bacteriol. abril de 2011; 193(8)1930-42) revisa el contenido intracelular de los acidos grasos en diversas cepas mixobacterianas, pero ni se refiere o desvela las secuencias genicas especfficas requeridas para la produccion de acidos grasos.
Schneiker et al. (Nature Biotechnology (2007) 25, 1281-1289) describen la secuenciacion del genoma completo de Sorangium cellulosum e identifican agrupamientos de genes de policetido sintetasa implicados en la sfntesis de compuestos antibioticos individuales. Una comparacion con el genoma de Myxococcus xanthus revelo una carencia de sintenia global.
Dickschat et al. (Org. Biomol. Chem. (2005) 3, 2824-2831) describen el analisis del perfil de los acidos grasos de Stigmatella aurantiaca utilizando GC-MS, y las etapas de sfntesis de la biosfntesis.
Hay una demanda de metodos para la produccion de AGPI, particularmente AGPI que contienen 3, 4 o mas dobles enlaces, cuyos metodos biosintetizan los AGPI de novo, en lugar de modificar, p. ej., alargar, otros acidos grasos que, a su vez, sirven como precursores.
Objeto de la invencion
Es un objeto de la invencion proporcionar un metodo para la produccion de AGPI que tiene ventajas en comparacion con los metodos de la tecnica anterior, preferentemente un proceso de produccion utilizando fermentacion de un microorganismo huesped que expresa las enzimas pertinentes de la via sintetica.
Descripcion general de la invencion
La invencion consigue el objeto por el proceso de produccion como se define en las reivindicaciones, especialmente al proporcionar las secuencias de ADN que codifican las enzimas de la vfa sintetica para la sfntesis de AGPI, un microorganismo que se manipula geneticamente para contener estas secuencias de ADN para la expresion heterologa, y un proceso de produccion de uno o mas acidos grasos poliinsaturados mediante el cultivo del microorganismo que se manipula geneticamente para contener secuencias de ADN que codifican las enzimas de la via sintetica para la sfntesis de AGPI para la expresion genica heterologa, comprendiendo el proceso preferentemente las etapas que consisten en
(i) proporcionar un organismo de produccion que comprenda un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados, siendo derivado dicho agrupamiento de genes de un organismo fuente que difiere del organismo de produccion; y que abarca una subsecuencia ER que codifica una enoil reductasa y una subsecuencia AT que codifica una aciltransferasa, en la que la subsecuencia AT se ubica aguas abajo con respecto a la subsecuencia ER;
(ii) cultivar el organismo de produccion de la etapa (i) en presencia de una fuente de carbono fermentable, tambien denominada cultivo, conforme la cual se producen uno o mas acidos grasos poliinsaturados; y
(iii) opcionalmente, recuperar uno o mas acidos grasos poliinsaturados, preferentemente aislar los acidos grasos poliinsaturados del caldo de fermentacion y/o del organismo de produccion.
Los inventores han descubierto sorprendentemente que los agrupamientos de genes biosinteticos de AGPI mixobacterianos, p. ej., derivados de Sorangium cellulosum y de Aetherobacter fasciculatus, que abarcan cada uno los genes pfa1, pfa2 y pfa3 y, por consiguiente, codifican las protefnas correspondientes Pfa1, Pfa2, y Pfa3, pueden utilizarse ventajosamente en la produccion de AGPI. El analisis de los loci biosinteticos muestra que la disposicion de los genes, asf como la organizacion de los dominios catalfticos en las protefnas biosinteticas difieren significativamente de las secuencias publicadas de los agrupamientos de genes de AGPI de diversos organismos. Para fines de la invencion, las expresiones secuencia de aminoacidos, peptido, protefna, y una seccion de uno de estos pueden utilizarse de manera intercambiable. La referenda a la funcion de una secuencia de aminoacidos codificada por una secuencia de acidos nudeicos puede incluir la referenda a la secuenaa de acidos nucleicos codificante, y ademas, la referenda a la funcion catalftica de un dominio puede tomarse como referenda a la seccion de secuencia de acidos nucleicos que codifica la seccion del peptido que tiene la funaon catalftica, cuya secaon de secuenca de acidos nucleicos tambien puede denominarse dominio de acidos nucleicos. Las secuencias y secciones de las mismas que se refieren como un dominio pueden incluir uno o mas centros catalfticos o dominios catalfticos, que p. ej., se designan de acuerdo con su funaon catalftica. Las identidades y similitudes de secuencia son preferentemente como se determina por el algoritmo ClustalW o Geneious que se describe en la presente memoria. Debido a la universalidad del codigo genetico, una secuenaa de acidos nucleicos que codifica un dominio se determina por la secuencia de aminoacidos del dominio, en la que preferentemente la secuencia de acidos nucleicos tiene un uso de codones o un sesgo de codones del microorganismo huesped que se manipula
5
10
15
20
25
30
35
40
45
50
55
60
65
geneticamente para contener genes heterologos que codifican el agrupamiento de genes de la enzima sintetica de AGPI, p. ej., una secuencia de acidos nucleicos que codifica el agrupamiento de genes y que tiene el uso del codon del microorganismo huesped.
En general, preferentemente el gen pfa 1 contiene un dominio I que comprende una secuencia de nucleotidos que codifica una enoil reductasa (ER), el gen pfa2 contiene un dominio Ila que comprende una secuencia de nucleotidos que codifica un dominio de cetosintasa (CS) y que codifica un dominio de malonil-CoA-transacilasa (MAT), un dominio lib que comprende una secuencia de nucleotidos que codifica al menos uno, preferentemente tres, cuatro o cinco dominios de la protefna transportadora de acilos (PPA), y un dominio iic que comprende una secuencia de nucleotidos que codifica un dominio de cetorreductasa (CR) y que codifica un dominio de deshidratasa (DH), y el gen pfa3 contiene un dominio Ilia que comprende una secuencia de nucleotidos que codifica un dominio de cetosintasa (CS) y que codifica un dominio del factor de longitud de cadena (FLC), un dominio IIIb que comprende una secuencia de nucleotidos que codifica uno, preferentemente dos dominios de deshidratasa (DH), y contiene un dominio IV* que comprende una secuencia de nucleotidos que codifica una acil-glicerol-fosfato aciltransferasa (AGPAT), en la que preferentemente los dominios se disponen de 5 a 3 en los respectivos genes. En el agrupamiento de genes sinteticos de Aetherobacter, entre la region IlIa y la region IIIb, se ha descubierto un dominio IV que codifica una acil transferasa. Por consiguiente, un dominio IV opcional que comprende una secuencia de nucleotidos que codifica un dominio de aciltransferasa (AT) se dispone en el gen pfa3 gen entre el dominio IlIa y el dominio IIIb, especialmente para la produccion de AEP y/o ADH. La acil-glicerol-fosfato aciltransferasa (AGPAT) codificada por el agrupamientos de genes, p. ej., por el dominio IV*, contenida preferentemente en pfa3, es una realizacion especffica de una aciltransferasa (AT).
Generalmente, el dominio I codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 12 o 13, SEQ ID NO: 43 o 44, SEQ ID NO: 74 o 75, SEQ ID NO: 108 o 109, SEQ ID NO: 132 o 133 y/o SEQ ID NO: 148 o 149;
el dominio Ila codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 15 o 16, SEQ ID NO: 46 o 47, SEQ ID NO: 77 o 78, SEQ ID NO: 111 o 112 y/o SEQ ID NO: 151 o 152;
el dominio lIb codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 18 o 19, SEQ ID NO: 49 o 50, SEQ ID NO: 80 o 81, SEQ ID NO: 114 o 115 y/o SEQ ID NO: 154 o 155;
el dominio IIc codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 21 o 22, SEQ ID NO: 52 o 53, SEQ ID NO: 83 o 84, SEQ ID NO: 117 o 118 y/o SEQ ID NO: 157 o 158;
el dominio IlIa codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 24 o 25, SEQ ID NO: 55 o 56, SEQ ID NO: 86 o 87, SEQ ID NO: 120 o 121 y/o SEQ ID NO: 160 o 161;
el dominio IIIb codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 27 o 28, SEQ ID NO: 58 o 59, SEQ ID NO: 89 o 90, SEQ ID NO: 123 o 124 y/o SEQ ID NO: 163 o 164.
El dominio IV opcional codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 92 o 93, SEQ ID NO: 126 o 127 y/o SEQ ID NO: 166 o 167.
Concretamente, la invencion proporciona un proceso de produccion de acidos grasos poliinsaturados mediante la expresion genica heterologa de las enzimas de la via biosintetica de acidos grasos poliinsaturados en un organismo de produccion, que comprende el cultivo del organismo de produccion en presencia de una fuente de carbono fermentable,
- en el que el organismo de produccion se manipula geneticamente para comprender un primer gen, un segundo gen y un tercer gen,
- en el que el primer gen contiene un dominio I que codifica una enoil reductasa que tiene una identidad de
secuencia de aminoacidos de al menos el 59 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 13, SEQ ID NO: 44, SEQ ID NO: 75, SEQ ID NO: 109, SEQ ID NO: 133 y/o SEQ ID NO: 149, y
- en el que el segundo gen contiene un dominio IIa que codifica una cetosintasa y una malonil-CoA-
transacilasa que tiene una identidad de secuencia de aminoacidos de al menos el 57 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 16, SEQ ID NO: 47, SEQ ID NO: 78 y/o SEQ ID NO: 112, un dominio IIb que codifica al menos una protefna transportadora de acilos que tiene una identidad de secuencia de aminoacidos de al menos el 26 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 19, SEQ ID NO: 50, SEQ ID NO: 81, SEQ ID NO: 115 y/o SEQ ID NO: 155; un dominio IIc que codifica una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 47 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 22, SEQ ID NO: 53, SEQ ID NO: 84, SEQ ID NO: 118 y/o SEQ ID NO: 158; y
- en el que el tercer gen contiene un dominio IIIa que codifica una cetosintasa y un factor de longitud de
cadena que tiene una identidad de secuencia de aminoacidos de al menos el 46 % con respecto a una
5
10
15
20
25
30
35
40
45
50
55
60
65
secuencia de aminoacidos del grupo que contiene SEQ ID NO: 25, SEQ ID NO: 56, SEQ ID NO: 87, SEQ ID NO: 121 y/o SEQ ID NO: 161; y un dominio IIIb que codifica al menos una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 42 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 28, SEQ ID NO: 59, SEQ ID NO: 90, SEQ ID NO: 124 y/o SEQ ID NO: 164, y un dominio que codifica una aciltransferasa (AT) caracterizado por que la aciltransferasa codificada es una acil-glicerol-fosfato aciltransferasa (AGPAt) que tiene una identidad de secuencia de aminoacidos de al menos el 50 % con respecto a una secuencia de aminoacidos codificada por el dominio IV* contenido en el grupo que comprende SEQ ID NO: 30, SEQ ID NO: 61, SEQ ID NO: 95, SEQ ID NO: 129, SEQ ID NO: 135 y/o SEQ ID nO: 169, y secuencias de aminoacidos codificadas por una seccion de secuencia de acidos nucleicos contenida en el grupo que comprende SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.
Preferentemente, cada uno de los genes, regiones y/o dominios codifica una secuencia de aminoacidos que tiene una identidad de al menos 60 %, al menos 85 %, al menos 90 %, y preferentemente al menos 95 % o al menos 98 % respecto a una o mas de las secuencias de aminoacidos para cada dominio como se da en la presente memoria, o como se codifica por una secuencia de acidos nucleicos para cada dominio como se da en la presente memoria.
Preferentemente, el dominio IV* codifica una secuencia de aminoacidos que tiene una identidad de secuencia de al menos el 50 %, 75 % o al menos el 84 %, mas preferentemente de al menos 90 %, 95 % o al menos 97 % o 98 % con respecto a una de las secuencias de aminoacidos dada para el dominio IV*, p. ej., a una secuencia de aminoacidos del dominio IV* contenida en el grupo que comprende o consiste en SEQ ID NO: 30, SEQ ID NO: 61 y/o una secuencia de aminoacidos del dominio IV* contenida en el grupo que comprende o consiste en SEQ ID NO: 95, SEQ ID NO: 129 o 130, SEQ ID NO: 135 y/o SEQ ID NO: 169, o como se codifica por una seccion de secuencia de acidos nucleicos que codifica un dominio IV*, p. ej., una seccion de secuencia de acidos nucleicos contenida en el grupo que comprende o consiste en SEQ ID NO: 29, SEQ ID NO: 60 y/o en el grupo que comprende o consiste en SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.
Ademas, el dominio IV* se contiene preferentemente en una secuencia de acidos nucleicos que codifica el producto genico Pfa3, preferentemente que codifica Pfa3 que tiene una identidad de secuencia de aminoacidos de al menos el 28 %, 30 %, al menos 32,5 %, o al menos 35 %, preferentemente al menos 40 %, al menos 42,5 %, al menos 54 %, mas preferente al menos 84 %, 90 % o 95 % con respecto a una de las secuencias de aminoacidos contenida en el grupo que comprende o consiste en SEQ ID NO: 10 y/o SEQ ID NO: 41 y/o en el grupo que comprende o consiste en SEQ ID NO: 72, SEQ ID NO: 106 y/o SEQ ID NO: 146.
Breve descripcion de los dibujos
La Figura 1 muestra una comparacion esquematica de agrupamientos de genes que codifican las vfas biosinteticas de acidos grasos poliinsaturados. Los organismos fuente se mencionan a la izquierda. Las abreviaturas (codigos proteicos) tienen los siguientes significados: ER = enoil reductasa; CS = beta-cetoacil sintasa; MAT = malonil-CoA- transacilasa; CR = cetorreductasa; DH = deshidratasa; FLC = factor de longitud de cadena; AT = aciltransferasa; PPA = protefna transportadora de acilos; AGPAT = acil-glicerol-fosfato aciltransferasa.
La Figura 2 muestra una construccion de acido nucleico para la expresion heterologa del agrupamiento de genes biosinteticos de AGPI a partir de Sorangium cellulosum So ce56 en otra mixobacteria p. ej., Myxococcus xanthus DK1622. Los genes biosinteticos de AGPI (pfa1, pfa2 y pfa3) estan bajo el control del promotor Ptet, la construccion se integra al azar en el cromosoma del huesped a traves de la transferencia del agrupamientos de genes mediada por transposones, transposasa: gen que codifica la transposasa, RI: repeticion invertida, ampR: gen de resistencia a ampicilina, BsdR: gen de resistencia a blasticidina, neoR: gen de resistencia a kanamicina, regulador tet: gen que codifica el represor del promotor Ptet, Ptet: promotor inducible de tetraciclina, oriT: origen de transferencia.
La Figura 3A muestra un cromatograma de cromatograffa de gases (CG) de extractos de acidos grasos celulares de S. cellulosum So ce56 de tipo de natural,
La Figura 3B muestra un cromatograma de cromatograffa de gases (CG) de extractos de acidos grasos celulares de M. xanthus::p15A-AGPI que alberga la construccion de expresion mostrada en la Figura 2,
La Figura 3C muestra un cromatograma de cromatograffa de gases (CG) de extractos de acidos grasos celulares de M. xanthus DK1622 de tipo natural.
La Figura 4 muestra una construccion de acidos nucleicos para la expresion heterologa del agrupamiento de genes biosinsteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 en otra mixobacteria p. ej., Myxococcus xanthus DK1622. Los genes biosinteticos de AGPI (pfa1, pfa2 y pfa3) estan bajo el control del promotor Ptet, la construccion se integra en el cromosoma del huesped a traves de sitios MX9 attB. mx9: gen que codifica la MX9 integrasa y que contiene el sitio de union del fago MX9 (attP), zeoR: gen de resistencia a zeocina, ampR: gen de resistencia a ampicilina, p15A ori: origen de replicacion de p15A neoR: gen de resistencia a kanamicina, Ptet: promotor inducible de tetraciclina.
La Figura 5 muestra un analisis por CG de los extractos de acidos grasos celulares de M. xanthus DK1622 de tipo
natural (A) y de extractos de acidos grasos celulares de M. xanthus::pPfaAf-Ptet-mx9.2 que alberga el agrupamiento de genes que contiene pfa1, pfa2 y pfa3 de la SEQ ID NO 63 (B). Los lfpidos celulares se hidrolizaron y los acidos grasos se derivatizaron para que pudiesen ser analizados por GC-MS. Se muestran derivados de los siguientes acidos grasos: acido hexadecanoico (16:0;1), acido iso-heptadienoico (iso-17:2u>5, 11; 2)acido heptadecenoico 5 (17:1u>7; 3), acido iso-heptadecenoico (iso-17:1u>5; 4), acido iso-heptadecanoico (iso-17:0; 5), acido iso-3-hidroxi-
pentadecanoico (iso-3-OH-15:0; 6), acido hexadecenoico (16:to7; 7), acido hidroxi -hexadecanoico (2-OH-16:0, 3- OH-16:0; 8), acido hidroxi-heptadecanoico (2-OH-17:0, 3-Oh-17:0; 9), acido eicosapentaenoico (20:5u>3, 6, 9, 12, 15; 10), acido iso-pentadecanoico (iso-15:0; 11), y acido docosahexaenoico (22:6 u>3, 6, 9, 12, 15 , 18; 12).
10 La Figura 6 muestra un arbol del metodo de Neighbour-Joining generado a partir de NCBI-BLASTn que muestra las afinidades de las secuencias de ADNr 16S de Aetherobacter fasciculatus.
La Figura 7 muestra un arbol del metodo de Neighbour-Joining basado en una secuencia del gen de ADNr 16S mixobacteriano, y que muestra la posicion filogenetica de AEP y ADH que producen cepas de Sorangium 15 cellulosum.
Breve descripcion del listado de secuencias
- Sorangium cellulosum (Soce56)
- Secuencia de ADN que codifica todo el agrupamiento implicado en la biosmtesis de AGPI: SEQ ID NO: 1;
- nt (nucleotidos) 1..1.650 de SEQ ID NO: 1 son codones (CDs) de pfa1 que codifica la protema: SEQ ID NO: 2
- nt 1.677..9.389 de SEQ ID NO: 1 son CDS de pfa2 que codifica la protema: SEQ ID NO: 3
- nt 9.386..17.176 de SEQ ID NO: 1 son CDS de pfa3 que codifica la protema: SEQ ID NO: 4
- Secuencia de ADN que codifica pfa1: SEQ ID NO: 5
- CDS de pfa1 que codifica la protema de SEQ ID NO: 6
- Secuencia de ADN que codifica pfa2: SEQ ID NO: 7
- CDS de pfa2 que codifica la protema de SEQ ID NO: 8
- Secuencia de ADN que codifica pfa3 SEQ ID NO: 9
- CDS de pfa3 que codifica la protema de SEQ ID NO: 10
- Secuencia de ADN que codifica el dominio I: SEQ ID NO: 11
- CDS de I que codifica la protema de SEQ ID NO: 12
- Protema del dominio I: SEQ ID NO: 13
- Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 14
- CDS de IIa que codifica la protema de SEQ ID NO: 15
- Proteina del dominio IIa: SEQ ID NO: 16
- Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 17
- CDS de IIb que codifica la protema de SEQ ID NO: 18
- Protema del dominio de IIb: SEQ ID NO: 19
- Secuencia de ADN que codifica el dominio IIc: SEQ ID NO: 20
- CDS de IIc que codifica la protema de SEQ ID NO: 21
- Protema del dominio de IIc: SEQ ID NO: 22
- Secuencia de ADN que codifica el dominio IIIa: SEQ ID NO: 23
- CDS de IIIa que codifica la protema de SEQ ID NO: 24
- Protema del dominio de IIIa: SEQ ID NO: 25
- Secuencia de ADN que codifica el dominio IIIb: SEQ ID NO: 26
- CDS de IIIb que codifica la protema de SEQ ID NO: 27
- Protema del dominio de IIIb: SEQ ID NO: 28
- Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 29
- CDS de IV* que codifica la proteina de SEQ ID NO: 30
- Protema del dominio de IV*: SEQ ID NO: 31
20
- Sorangium cellulosum Soce 377
- Secuencia de ADN que codifica todo el agrupamiento implicado en la biosmtesis de AGPI: SEQ ID NO: 32
- nt 1..1.650 de SEQ ID NO: 32 son CDS de pfa1 que codifica la protema: SEQ ID NO: 33
- nt 1.677..9.380 de SEQ ID NO: 32 son CDS de pfa2 que codifica la protema: SEQ ID NO: 34
- nt 9.377..17.221 de SEQ ID NO: 32 son CDS de pfa3 que codifica la proteina: SEQ ID NO: 35
- Secuencia de ADN que codifica pfa1: SEQ ID NO: 36
- CDS de pfa1 que codifica la protema de SEQ ID NO: 37
- Secuencia de ADN que codifica pfa2: SEQ ID NO: 38
- CDS de pfa2 que codifica la protema de SEQ ID NO: 39
- Secuencia de ADN que codifica pfa3 de SEQ ID NO: 40
- CDS de pfa3 que codifica la protema de SEQ ID NO: 41
- Secuencia de ADN que codifica el dominio I: SEQ ID
- CDS de I que codifica la protema de SEQ ID NO: 43
- Sorangium cellulosum Soce 377
- NO: 42
- Protefna del dominio I: SEQ ID NO: 44
- Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 45
- CDS de IIa que codifica la protefna de SEQ ID NO: 46
- Protefna del dominio IIa: SEQ ID NO: 47
- Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 48
- CDS de IIb que codifica la protefna de SEQ ID NO: 49
- Protefna del dominio de IIb: SEQ ID NO: 50
- Secuencia de ADN que codifica el dominio IIc: SEQ ID NO: 51
- CDS de IIc que codifica la protefna de SEQ ID NO: 52
- Protefna del dominio de IIc: SEQ ID NO: 53
- Secuencia de ADN que codifica el dominio IIIa: SEQ ID NO: 54
- CDS de IIIa que codifica la protefna de SEQ ID NO: 55
- Protefna del dominio de IIIa: SEQ ID NO: 56
- Secuencia de ADN que codifica el dominio IIIb: SEQ ID NO: 57
- CDS de IIIb que codifica la protefna de SEQ ID NO: 58
- Protefna del dominio de IIIb: SEQ ID NO: 59
- Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 60
- CDS de IV* que codifica la protefna de SEQ ID NO: 61
- Protefna del dominio de IV*: SEQ ID NO: 62
- Aetherobacter fasciculatus SBSr002
- Secuencia de ADN que codifica todo el agrupamiento implicado en la biosfntesis de AGPI: SEQ ID NO: 63
- nt 1..1.608 de SEQ ID NO: 63 son codones (CDS) de pfa1 que codifica la protefna: SEQ ID NO: 64
- nt 1.644..8.312 de SEQ ID NO: 63 son CDS de pfa2 que codifica la protefna: SEQ ID NO: 65
- nt 8.309..16.219 de SEQ ID NO: 63 son CDS de pfa3 que codifica la protefna: SEQ ID NO: 66
- Secuencia de ADN que codifica pfal: SEQ ID NO: 67
- CDS de pfa1 que codifica la protefna de SEQ ID NO: 68
- Secuencia de ADN que codifica pfa2: SEQ ID NO: 69
- CDS de pfa2 que codifica la protefna de SEQ ID NO: 70
- Secuencia de ADN que codifica pfa3 de SEQ ID NO: 71
- CDS de pfa3 que codifica la protefna de SEQ ID NO: 72
- Secuencia de ADN que codifica el dominio I: SEQ ID NO: 73
- CDS de I que codifica la protefna de SEQ ID NO: 74
- Protefna del dominio I: SEQ ID NO: 75
- Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 76
- CDS de IIa que codifica la protefna de SEQ ID NO: 77
- Protefna del dominio IIa: SEQ ID NO: 78
- Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 79
- CDS de IIb que codifica la protefna de SEQ ID NO: 80
- Protefna del dominio de IIb: SEQ ID NO: 81
- Secuencia de ADN que codifica el dominio IIc: SEQ ID NO: 82
- CDS de IIc que codifica la protefna de SEQ ID NO: 83
- Protefna del dominio de IIc: SEQ ID NO: 84
- Secuencia de ADN que codifica el dominio IIIa: SEQ ID NO: 85
- CDS de IIIa que codifica la protefna de SEQ ID NO: 86
- Protefna del dominio IIIa: SEQ ID NO: 87
- Secuencia de ADN que codifica el dominio IIIb: SEQ ID NO: 88
- CDS de IIIb que codifica la protefna de SEQ ID NO: 89
- Protefna del dominio IIIb: SEQ ID NO: 90
- Secuencia de ADN que codifica el dominio IV: SEQ ID NO: 91
- CDS de IV que codifica la protefna de SEQ ID NO: 92
- Protefna del dominio IV: SEQ ID NO: 93
- Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 94
- CDS de IV* que codifica la protefna de SEQ ID NO: 95
- Protefna del dominio de IV*: SEQ ID NO: 96
- Aetherobacter sp. SBSr008
- Secuencia de ADN que codifica todo el agrupamiento implicado en la biosfntesis de AGPI: SEQ ID NO: 97
- nt 1..1.608 de SEQ ID NO: 97 son CDS de pfa1 que codifica la protefna: SEQ ID NO: 98
- nt 1.644..8.342 de SEQ ID NO: 97 son CDS de pfa2 que codifica la protefna: SEQ ID NO: 99
- nt 18.339..16.243 de SEQ ID NO: 97 son CDS de pfa3
- Aetherobacter sp. SBSr008
- que codifica la protefna: SEQ ID NO: 100
- Secuencia de ADN que codifica pfal: SEQ ID NO: 101
- CDS de pfa1 que codifica la protefna de SEQ ID NO: 102
- Secuencia de ADN que codifica pfa2: SEQ ID NO: 103
- CDS de pfa2 que codifica la protefna de SEQ ID NO: 104
- Secuencia de ADN que codifica pfa3 de SEQ ID NO: 105
- CDS de pfa3 que codifica la protefna de SEQ ID NO: 106
- Secuencia de ADN que codifica el dominio I: SEQ ID NO: 107
- CDS de I que codifica la protefna de SEQ ID NO: 108
- Protefna del dominio I: SEQ ID NO: 109
- Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 110
- CDS de IIa que codifica la proteina de SEQ ID NO: 111
- Protefna del dominio IIa: SEQ ID NO: 112
- Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 113
- CDS de IIb que codifica la protefna de SEQ ID NO: 114
- Proteina del dominio IIb: SEQ ID NO: 115
- Secuencia de ADN que codifica el dominio IIc: SEQ ID NO: 116
- CDS de IIc que codifica la protefna de SEQ ID NO: 117
- Protefna del dominio IIc: SEQ ID NO: 118
- Secuencia de ADN que codifica el dominio IIIa: SEQ ID NO: 119
- CDS de IIIa que codifica la protefna de SEQ ID NO: 120
- Protefna del dominio IIIa: SEQ ID NO: 121
- Secuencia de ADN que codifica el dominio IIIb: SEQ ID NO: 122
- CDS de IIIb que codifica la protefna de SEQ ID NO: 123
- Protefna del dominio IIIb: SEQ ID NO: 124
- Secuencia de ADN que codifica el dominio IV: SEQ ID NO: 125
- CDS de IV que codifica la protefna de SEQ ID NO: 126
- Protefna del dominio IV: SEQ ID NO: 127
- Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 128
- CDS de IV* que codifica la protefna de SEQ ID NO: 129
- Protefna del dominio IV*: SEQ ID NO: 130
- Aetherobacter rufus SBSr003
- Secuencia de ADN que codifica el dominio I: SEQ ID NO: 131
- CDS de I que codifica la proteina de SEQ ID NO: 132
- Protefna del dominio I: SEQ ID NO: 133
- Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 134
- CDS de IV* que codifica la protefna de SEQ ID NO: 135
- Proteina del dominio IV*: SEQ ID NO: 136
- Minicystis rosea SBNa008
- Secuencia de ADN que codifica todo el agrupamiento implicado en la biosfntesis de AGPI: SEQ ID NO: 137
- nt 1..1.632 de SEQ ID NO: 137 son CDS de pfa1 que codifica la protefna: SEQ ID NO: 138
- nt 1.659..8.327 de SEQ ID NO: 137 son CDS de pfa2 que codifica la protefna: SEQ ID NO: 139
- nt 18.324..17.191 de SEQ ID NO: 137 son CDS de pfa3 que codifica la protefna: SEQ ID NO: 140
- Secuencia de ADN que codifica pfa1: SEQ ID NO: 141
- CDS de pfa1 que codifica la protefna de SEQ ID NO: 142
- Secuencia de ADN que codifica pfa2: SEQ ID NO: 143
- CDS de pfa2 que codifica la protefna de SEQ ID NO: 144
- Secuencia de ADN que codifica pfa3 de SEQ ID NO: 145
- CDS de pfa3 que codifica la proteina de SEQ ID NO: 146
- Secuencia de ADN que codifica el dominio I: SEQ ID NO: 147
- CDS de I que codifica la protefna de SEQ ID NO: 148
- Protefna del dominio I: SEQ ID NO: 149
- Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 150
- CDS de IIa que codifica la proteina de SEQ ID NO: 151
- Protefna del dominio IIa: SEQ ID NO: 152
- Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 153
- CDS de IIb que codifica la protefna de SEQ ID NO: 154
- Protefna del dominio IIb: SEQ ID NO: 155
- Secuencia de ADN que codifica el dominio IIc: SEQ ID
- CDS de IIc que codifica la protefna de SEQ ID NO: 157
5
10
15
20
25
30
35
40
45
50
- Minicystis rosea SBNa008
- NO: 156
- Protefna del dominio Ilc: SEQ ID NO: 158
- Secuencia de ADN que codifica el dominio llla: SEQ ID NO: 159
- CDS de llla que codifica la protefna de SEQ ID NO: 160
- Protefna del dominio llla: SEQ ID NO: 161
- Secuencia de ADN que codifica el dominio lllb: SEQ ID NO: 162
- CDS de lllb que codifica la protefna de SEQ ID NO: 163
- Protefna del dominio lllb: SEQ ID NO: 164
- Secuencia de ADN que codifica el dominio IV: SEQ ID NO: 165
- CDS de IV que codifica la protefna de SEQ ID NO: 166
- Protefna del dominio IV: SEQ ID NO: 167
- Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 168
- CDS de IV* que codifica la protefna de SEQ ID NO: 169
- Protefna del dominio IV*: SEQ ID NO: 170
SEQ ID NO: 1 es la secuencia de ADN de todo el agrupamiento de genes pfa de Sorangium cellulosum Soce56 que comprende 17.176 pb. El gen pfa1 se ubica desde la posicion 1 a la posicion 1.650, el gen pfa2 se ubica desde la posicion 1.677 a la posicion 9.389, y el gen pfa3 se ubica desde la posicion 9.386 a la posicion 17.176 y se solapa con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se muestran. SEQ ID NO: 2 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa1, SEQ ID NO: 3 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa2, SEQ ID NO: 4 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 5 con la secuencia de aminoacidos codificada como SEQ ID NO: 6. El gen pfa2 se muestra por separado como SEQ ID NO: 7 con la secuencia de aminoacidos codificada como SEQ ID NO: 8. El gen pfa3 se muestra por separado como SEQ ID NO: 9 con la secuencia de aminoacidos codificada como SEQ ID NO: 10.
SEQ ID NO: 32 es la secuencia de ADN de Sorangium cellulosum Soce377 que comprende 17.221 pb, en la que el gen pfa1 se ubica desde la posicion 1 a la posicion 1.650, el gen pfa2 se ubica desde la posicion 1.677 a la posicion 9.380, y el gen pfa3 se ubica desde la posicion 9.377 a la posicion 17.221 y se solapa con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se muestran. SEQ ID NO: 33 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa1, SEQ ID NO: 34 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa2, SEQ ID NO: 35 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 36 con la secuencia de aminoacidos codificada como SEQ ID NO: 37. El gen pfa2 se muestra por separado como SEQ ID NO: 38 con la secuencia de aminoacidos codificada como SEQ ID NO: 39. El gen pfa3 se muestra por separado como SEQ ID NO: 40 con la secuencia de aminoacidos codificada como SEQ ID NO: 41.
SEQ ID NO: 63 es la secuencia de ADN de todo el agrupamiento de genes pfa (16.219 pb) procedente de Aetherobacter fasciculatus SBSr002 (DSM 21835). El gen pfa1 se ubica desde la posicion 1 a la posicion 1.608, el gen pfa2 se ubica desde la posicion 1.644 a la posicion 8.312, y el gen pfa3 se ubica desde la posicion 8.309 a la posicion 16.219, superpuesto con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se muestran. SEQ ID NO: 64 es la secuencia de protefnas de SEQ ID NO: 63 codificada por el gen pfa1, SEQ ID NO: 65 es la secuencia de protefnas de SEQ ID NO: 63 codificada por el gen pfa2, SEQ ID NO: 66 es la secuencia de protefnas de SEQ ID NO: 63 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 67 con la secuencia de aminoacidos codificada como SEQ ID NO: 68. El gen pfa2 se muestra por separado como SEQ ID NO: 69 con la secuencia de aminoacidos codificada como SEQ ID NO: 70. El gen pfa3 se muestra por separado como SEQ ID NO: 71 con la secuencia de aminoacidos codificada como SEQ ID NO: 72.
SEQ ID NO: 97 es la secuencia de ADN de todo el agrupamiento de genes pfa (16.243 pb) procedente de Aetherobacter SBSr008. El gen pfa1 gen se ubica desde la posicion 1 a la posicion 1.608, el gen pfa2 se ubica desde la posicion 1.644 a la posicion 8.342, y el gen pfa3 se ubica desde la posicion 8.339 a la posicion 16.243, superpuesto con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se muestran. SEQ ID NO: 98 es la secuencia de protefnas de SEQ ID NO: 97 codificada por el gen pfa1, SEQ ID NO: 99 es la secuencia de protefnas de SEQ ID NO: 97 codificada por el gen pfa2, SEQ iD NO: 100 es la secuencia de protefnas de SEQ ID NO: 97 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 101 con la secuencia codificada de aminoacidos como SEQ ID NO: 102. El gen pfa2 se muestra por separado como SEQ ID NO: 103 con la secuencia de aminoacidos codificada como SEQ ID NO: 104. El gen pfa3 se muestra por separado como SEQ ID NO: 105 con la secuencia de aminoacidos codificada como SEQ ID NO: 106.
SEQ ID NO: 137 es la secuencia de ADN de todo el agrupamiento de genes pfa (17.191 pb) procedente de Aetherobacter SBNa008. El gen pfa1 se ubica desde la posicion 1 a la posicion 1.632, el gen pfa2 se ubica desde la posicion 1.659 a la posicion 8.327, y el gen pfa3 se ubica desde la posicion 8.324 a la posicion 17.191, superpuesto con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se
5
10
15
20
25
30
35
40
45
50
55
60
65
muestran. SEQ ID NO: 138 es la secuencia de protefnas de SEQ ID NO: 137 codificada por el gen pfal, SEQ ID NO:
139 es la secuencia de protefnas de SEQ ID NO: 137 codificada por el gen pfa2, SEQ ID NO: 140 es la secuencia de protefnas de SEQ ID NO: 137 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 141 con la secuencia codificada de aminoacidos como SEQ ID NO: 142. El gen pfa2 se muestra por separado como SEQ ID NO: 143 con la secuencia de aminoacidos codificada como SEQ ID NO: 144. El gen pfa3 se muestra por separado como SEQ ID NO: 145 con la secuencia de aminoacidos codificada como SEQ ID NO: 146.
Para Aetherobacter SBSr003, se dan las siguientes regiones del agrupamiento implicado en la sfntesis de AGPI: gen I como SEQ ID NO: 131 con la protefna codificada como SEQ ID nO: 132 y por separado como SEQ ID NO: 133, dominio IV* como SEQ ID NO: 134 con la protefna codificada como SEQ ID NO: 135 y por separado como SEQ ID NO: 136. Como SBSr003 se deposita bajo el Tratado de Budapest como DSM 23122 (DsMZ, Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH, Inhoffenstr. 7b, 38124 Braunschweig, Alemania, el 7 de octubre de 2007), el agrupamiento de genes sinteticos de AGPI de esta bacteria se abarca para los fines de la invencion. Este agrupamiento de genes contiene las secuencias codificantes dadas para SBSr003, y preferentemente se extiende desde su gen I a su dominio IV*. Preferentemente, este agrupamiento de genes de DSM 23122 codifica una secuencia de aminoacidos que tiene al menos una identidad de 60 %, al menos 85 %, al menos 90 %, y preferentemente al menos 95 % o al menos 98 % con respecto a una o mas de las secuencias de aminoacidos de los genes sinteticos de AGPI de Aetherobacter, especialmente con respecto a la secuencia de aminoacidos codificada por SEQ ID NO: 63 (secuencias de aminoacidos SEQ ID NO: 64 y 68, SEQ ID NO: 65 y 70, e incluyendo la SEQ ID NO: 64 y 72 ), por SEQ ID NO: 97 (secuencias de aminoacidos SEQ ID NO: 98 y 102, SEQ ID NO: 99 y 104, e incluyendo la SEQ ID NO: 100 y 106) y/o con respecto a la secuencia de aminoacidos codificada por la SEQ ID NO: 137 (secuencias de aminoacidos SeQ ID NO: 138 y 142, SEQ ID NO: 139 y 144, e incluyendo la SEQ ID NO:
140 y 146).
Descripcion detallada
Los inventores han identificado agrupamientos de genes biosinteticos de AGPI mixobacterianos a partir de la cepa de Sorangium cellulosum 56 (Soce56) y la cepa 377 (Soce377), asf como de Aetherobacter fasciculatus SBSr002 DSM 21835, Aetherobacter sp. SBSr008, Mnicystis rosea SBNa008, y en parte de Aetherobacter rufus SBSr003. El analisis de los loci biosinteticos de estos organismos fuente muestra que la disposicion de los genes, asf como la organizacion de los dominios catalfticos en las protefnas biosinteticas son altamente homologas pero difieren significativamente de las secuencias publicadas de los agrupamientos de genes de AGPI a partir de varios organismos (vease la Figura 1).
Un primer aspecto de la invencion se refiere a un proceso de produccion de uno o mas acidos grasos poliinsaturados por medio de la expresion genica heterologa, comprendiendo el proceso las etapas que consisten en:
(i) proporcionar un organismo de produccion que comprenda un agrupamiento de genes que codifica una vfa biosintetica de acidos grasos poliinsaturados, siendo derivado dicho agrupamiento de genes de un organismo fuente que difiere del organismo de produccion; y que abarca una subsecuencia ER que codifica una enoil reductasa y una subsecuencia AT que codifica una aciltransferasa, en la que la subsecuencia AT se ubica aguas abajo con respecto a la subsecuencia ER;
(ii) cultivar el organismo de produccion de la etapa (i) en presencia de una fuente de carbono fermentable, conforme la cual se producen uno o mas acidos grasos poliinsaturados; y
(iii) opcionalmente, recuperar uno o mas acidos grasos poliinsaturados.
El proceso de acuerdo con la invencion es util para la produccion de acidos grasos poliinsaturados (AGPI). La expresion "acido graso poliinsaturado" se utiliza en la presente memoria en el sentido generalmente conocido por el experto. Preferentemente, los acidos grasos poliinsaturados son acidos monocarboxflicos que comprenden de 12 a 30 atomos de carbono, mas preferentemente 18 a 24 atomos de carbono, particularmente de manera preferente 20 o 22 atomos de carbono. Preferentemente, la expresion "acido graso poliinsaturado" se refiere a una cadena hidrocarbonada larga compuesta de 18 o mas atomos de carbono que tienen al menos 2, preferentemente al menos 3 o al menos 4 dobles enlaces y un grupo carboxilato terminal. Preferentemente, los acidos grasos poliinsaturados comprenden al menos 2, mas preferentemente al menos 3, aun mas preferentemente al menos 4, al menos 5 o al menos 6 grupos etilenicamente insaturados (dobles enlaces C=C), que preferentemente no estan conjugados entre sf. Para los fines de la invencion, la expresion "acido graso poliinsaturado" tambien abarca derivados de acidos carboxflicos poliinsaturados tales como los derivados hidroxi y/o las sales. Como se conoce en el campo, un acido graso se puede esterificar para formar trigliceridos y/o fosfolfpidos, asf como esfingolfpidos. De este modo, en una realizacion, la presente invencion tambien se refiere a tales productos esterificados. Ademas, el producto de acidos grasos de la presente invencion puede ser libre de acidos grasos. Los acidos grasos libres tienen un grupo carboxilo libre, no estan conectados qufmicamente a cualquier otro compuesto incluyendo triacilgliceridos, fosfolfpidos o esfingolfpidos, y pueden estar presentes libremente en cualquier compartimiento de la celula.
En una realizacion preferente, al menos 1, mas preferentemente al menos 2, aun mas preferentemente al menos 3 y lo mas preferentemente todos los grupos etilenicamente insaturados tienen una configuracion cis [(Z)-configuracion].
5
10
15
20
25
30
35
40
45
50
55
60
65
Los acidos grasos poliinsaturados tfpicos son acido oleico, acido linoleico, acido alfa-linolenico, acido gamma- linolenico, acido dihomo-gamma-linolenico, acido araquidonico, acido 5,8,11,14,17-eicosapentaenoico (AEP), acido docosatetraenoico, acido estearidonico, acido eicosatetraenoico (ETE), acido 7,10,13,16,19-docosapentaenoico y acido 4,7,10,13,16,19-docosahexaeonico (ADH). Los acidos grasos poliinsaturados preferentes se seleccionan entre el grupo que consiste en (18:3), (18:4), (18:5), (20:3), (20:4), (20:5), (22:3), (22:4), (22:5), y (22:6).
En una realizacion particularmente preferente, los acidos grasos poliinsaturados son acidos grasos poliinsaturados u>-3. Los acidos grasos poliinsaturados preferentes se seleccionan entre el grupo que consiste en (18:3 -3^(18:4u>- 3), (18:5u>-3), (20:3u>-3), (20:4u>-3), (20:5u>-3), (22:3u>-3), (22:4u>-3), (22:5u>-3), y (22:6u>-3). Ejemplos preferentes de acidos grasos poliinsaturados u>-3 incluyen acido a -linolenico (18:3 AAL), acido eicosa-cis-5,8,11,14,17-pentaenoico (20:5 u>-3 AEP) y acido docosa-cis-4,7,10,13,16,19-hexaenoico (22:6 u>-3 ADH). En una realizacion preferente adicional, los acidos grasos insaturados omega-3 se seleccionan entre acido eicosapentaenoico (AEP), acido docosahexaenoico (ADH) y mezclas de los mismos. Estos compuestos tambien se conocen con sus nombres triviales acido timnodonico para AEP y acido cervonico para ADH, respectivamente.
En una realizacion particularmente preferente, uno o mas acidos grasos poliinsaturados se seleccionan entre el grupo que consiste en acido hexadecadienoico (16:2), acido hexadecenoico (16:1), acido hexadecanoico (16:0), acido heptadecenoico (17:1u>7), acido iso-heptadienoico (iso-17:2u>5, 11), acido iso-heptadecenoico (iso-17:1u>5), acido iso-heptadecanoico (iso-17:0), acido iso-3-hidroxi-pentadecanoico (iso-3-OH-15:0), acido y-linolenico (18:3 u>6), acido linoleico (18:2 u>6), acido octadecenoico (18:1), acido octadecanoico (18:0), acido 2-hidroxi-heptadecanoico (2- OH-17:0), acido 2-hidroxi-heptadecenoico (2-OH-17:1), acido hidroxi-hexadecanoico (2-OH-16:0, 3-OH-16:0), acido iso-pentadecanoico (iso-15:0) y acido eicosadienoico (20:2j6). De acuerdo con el proceso de la invebo, se producen uno o mas acidos grasos poliinsaturados. Asf, el proceso de acuerdo con la invencion produce normalmente una composicion a partir de la cual uno o mas acidos grasos poliinsaturados pueden recuperarse y aislarse, respectivamente, como se describe en la etapa opcional (iii).
Preferentemente, el proceso de acuerdo con la invencion produce una composicion que comprende mas de un acido graso poliinsaturado, p. ej., una composicion de al menos 2 o 3 AGPI, en la que un acido graso poliinsaturado particular es el ingrediente principal.
En una realizacion preferente, el contenido de un acido graso poliinsaturado particular asciende a al menos 40 % en peso, mas preferentemente al menos 45 % en peso, aun mas preferentemente al menos 50 % en peso, aun mas preferentemente al menos 55 % en peso, incluso mas preferentemente al menos 60 % en peso, lo mas preferentemente al menos 65 % en peso y en particular al menos 70 % en peso, basado en el peso total de todos los acidos grasos poliinsaturados contenidos en el composicion. En otra realizacion preferente, el contenido de dicho acido graso poliinsaturado particular asciende a al menos 75 % en peso, mas preferentemente al menos 80 % en peso, aun mas preferentemente al menos 82 % en peso, aun mas preferentemente al menos 84 % en peso, incluso mas preferentemente al menos 86 % en peso, mas preferentemente al menos 88 % en peso y en particular al menos 90 % en peso, basado en el peso total de todos los acidos grasos poliinsaturados contenidos en la composicion.
La invencion se refiere a un proceso de produccion de uno o mas acidos grasos poliinsaturados por medio de la expresion genica heterologa. Un experto conoce la expresion "expresion genica heterologa". Preferentemente, la expresion genica heterologa se define como la sfntesis de protefnas exogenas en un organismo huesped (organismo de produccion) despues de la transformacion de ese organismo por genes portadores de vectores de un organismo diferente (organismo fuente). Por "expresion genica" se entiende la produccion de un polipeptido funcional a traves de la transcripcion de un segmento de acido nucleico en ARNm y la traduccion del ARNm en una protefna. Por "expresion genica heterologa" se entiende generalmente que un acido nucleico, no presente de forma natural en el genoma del organismo de produccion, esta presente en el organismo de produccion y se vincula operativamente a las secuencias de acidos nucleicos promotoras y terminadoras de una manera que se expresa en el organismo de produccion. La expresion "vinculado operativamente" se refiere a la asociacion de un gen con una secuencia que controla su expresion en un fragmento de acido nucleico unico. Por ejemplo, un promotor se vincula operativamente con una secuencia codificante cuando es capaz de regular la expresion de esa secuencia codificante. Asimismo, en el presente contexto, la expresion genica heterologa se refiere ademas a la presencia de un acido nucleico con una funcion similar a un acido nucleico presente de forma natural, en la que la expresion de dicho producto de acido nucleico heterologo cambia la composicion de acidos grasos. Por expresion heterologa de un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados se entiende que varios genes se expresan de forma heterologa, cuyos productos genicos constituyen etapas en una via, no presentes de forma natural en el organismo de produccion.
De acuerdo con la etapa (i) del proceso de acuerdo con la invencion, se proporciona un organismo de produccion que comprende un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados. Para los fines de la memoria descriptiva, la expresion "agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados" se refiere a cualquier agrupamiento de genes que codifica una via biosintetica que es capaz de sintetizar uno o mas acidos grasos poliinsaturados por medio del organismo de produccion. Por expresion heterologa del agrupamiento de genes, varios genes se expresan de forma heterologa, cuyos productos genicos constituyen etapas en una via, no presentes de forma natural en el organismo de produccion. El agrupamiento de
5
10
15
20
25
30
35
40
45
50
55
60
65
genes puede comprender uno o mas genes, cada uno de los cuales puede codificar de forma independiente una protefna y/o enzima mono- o polifuncional. Para los fines de la memoria descriptiva, un gen se considera generalmente como una unidad de la herencia en un organismo vivo. Normalmente es un tramo de ADN que codifica un tipo de protefna o una cadena de ARN que tiene una funcion en el organismo. Preferentemente, un gen se define como una region localizable de la secuencia genomica, que corresponde a una unidad de herencia, que se asocia con regiones reguladoras, regiones transcritas, y/u otras regiones secuenciales funcionales.
Preferentemente, el agrupamiento de genes abarca al menos dos genes, mas preferentemente al menos 3 genes. Preferentemente, el agrupamiento de genes abarca como maxmo cuatro genes, mas preferentemente como maximo 3 genes. En una realizacion particularmente preferente, el agrupamiento de genes comprende exactamente tres genes, es decir, consiste en tres genes y, opcionalmente, material genetico entre dichos tres genes.
De acuerdo con la invencion, el agrupamiento de genes se deriva de un organismo fuente diferente del organismo de produccion. En este contexto, "derivado" significa preferentemente que el agrupamiento de genes procede de un organismo de origen natural (tipo natural) o de un organismo modificado geneticamente como organismo fuente. En este sentido, "originar" no significa necesariamente que el agrupamiento de genes haya sido biosintetizado por el organismo fuente, sino que tambien debe incluir metodos de amplificacion biotecnologicos, tales como PCR y sfntesis de novo a partir de componentes adecuados, tales como fosfoamiditas.
Cuando el agrupamiento de genes se origina a partir de un organismo geneticamente modificado, como organismo fuente, el genoma de dicho organismo geneticamente modificado tiene preferentemente una homologfa con su correspondiente organismo de origen natural (tipo natural) de al menos 90 %, mas preferentemente al menos 92 %, aun mas preferentemente al menos 94 %, aun mas preferentemente al menos 96 %, incluso mas preferentemente al menos 97 %, lo mas preferentemente al menos 98 % y en particular al menos 99 %. Para los fines de la invencion, el grado de "homologfa" se basa preferentemente en una comparacion de dos secuencias utilizando el algoritmo de BLASTn 2.2.22 de la url
http://blast.ncbi.nlm.nih.gov/Blast.cgi que se describe adicionalmente en Zhang Z et al. (2000) J Comput Biol 7: 203-214.
http://blast.ncbi.nlm.nih.gov/Blast.cgi que se describe adicionalmente en Zhang Z et al. (2000) J Comput Biol 7: 203-214.
Preferentemente, el numero de pares de bases (pb) que forma el agrupamiento de genes de acuerdo con la invencion esta dentro del intervalo de 5.000 a 30.000 pb, mas preferentemente 7.000 a 28.000 pb, aun mas preferentemente 9.000 a 26.000 pb, aun mas preferentemente 11.000 a 24.000 pb, lo mas preferentemente 13.000 a 22.000 pb y en particular 15.000 a 20.000 pb, o 16.200 a 17.300 pb.
De acuerdo con la invencion, el agrupamiento de genes abarca una subsecuencia ER que codifica una enoil reductasa y una subsecuencia AT que codifica una aciltransferasa, en la que la subsecuencia AT se ubica aguas abajo con respecto a la subsecuencia ER. En este sentido "subsecuencia" del agrupamiento de genes significa una secuencia de ADN ubicada en el agrupamiento de genes y dentro de un marco de lectura, cuya subsecuencia es mas corta que la secuencia de ADN general del agrupamiento de genes. En este sentido "aguas abajo" significa preferentemente mas cerca del extremo 3' de la secuencia de ADN. De este modo, la subsecuencia At se ubica mas cerca del extremo 3' que la subsecuencia ER. Un experto sabe que los peptidos o protefnas pueden calificarse como enoil reductasas y aciltransferasas, respectivamente, es decir, cuyos requisitos deben satisfacerse en relacion con la actividad biocatalftica.
Generalmente, una enoil reductasa es un tipo de enzima que actua sobre los grupos enoil. Las enoil reductasas se clasifican preferentemente en la categorfa EC 1.3 (oxidorreductasas que actuan sobre el grupo CH-CH de los donantes), subcategorfa EC 1.3.1 (con NAD o NADP como aceptor).
Generalmente, una aciltransferasa es un tipo de enzima transferasa que actua sobre grupos acilo. Las aciltransferasas se clasifican preferentemente en la categorfa EC 2.3 y comprenden las subcategorfas EC 2.3.1 (aciltransferasas que transfieren grupos distintos de los grupos amino-acilo), EC 2.3.2 (aminoaciltransferasas), y EC 2.3.3 (aciltransferasas que convierten grupos acilo en grupos alquilo tras la transferencia) desde las cuales la aciltransferasa de acuerdo con la invencion se seleccionan preferentemente.
De acuerdo con la invencion, la subsecuencia ER y/o subsecuencia AT no necesitan codificar protefnas y enzimas independientes separadas, respectivamente. Mas bien, es posible que la subsecuencia ER y/o subsecuencia AT codifiquen dominios de una protefna/enzima multifuncional que comprende la actividad biocatalftica respectiva entre otras actividades biocatalfticas. Asf, para los fines de la memoria descriptiva, la expresion "que codifica un(a)..." es sinonimo de "que codifica un peptido o protefna que tiene la actividad o funcionalidad de un(a)..., opcionalmente entre otras actividades o funcionalidades".
Preferentemente, el agrupamiento de genes comprende un primer gen, un segundo gen y un tercer gen, en el que el segundo gen se ubica aguas abajo con respecto al primer gen; y el tercer gen se ubica aguas abajo con respecto al segundo gen. En una realizacion preferente, la subsecuencia ER se ubica en el primer gen y/o la subsecuencia AT, que preferentemente es AGPAT, se ubica en el tercer gen.
En una realizacion preferente de la invencion, la subsecuencia ER codifica una protefna/enzima monofuncional que
5
10
15
20
25
30
35
40
45
50
55
60
65
no comprende dominios adicionales que exhiban otras actividades biocatalfticas. De acuerdo con la presente realizacion preferente, la subsecuencia ER se ubica preferentemente en el primer gen, para los fines de la memoria descriptive, preferentemente, tambien se refiere como "gen pfal". De este modo, la expresion heterologa del gen pfal en el organismo de produccion produce preferentemente una protefna/enzima preferentemente monofuncional que exhibe actividad enoil reductasa.
En una realizacion preferente de la invencion, la subsecuencia AT codifica un dominio de una protefna/enzima polifuncional que exhibe actividad aciltransferasa en el dominio codificado por la subsecuencia AT y exhibe adicionalmente actividades biocatalfticas adicionales en otros dominios codificados por mas subsecuencias. De acuerdo con la presente realizacion preferente, la subsecuencia AT se ubica preferentemente en el tercer gen, para los fines de la memoria descriptiva, preferentemente, tambien referido como "gen pfa3". De este modo, la expresion heterologa del gen pfa3 en el organismo de produccion produce preferentemente una protefna/enzima preferentemente polifuncional que exhibe actividad aciltransferasa en el dominio codificado por la subsecuencia AT, asf como actividades biocatalfticas adicionales en otros dominios que, a su vez, se codifican por otras subsecuencias que tambien se ubican en el gen pfa3.
Preferentemente, la enoil reductasa codificada por la subsecuencia ER tiene una identidad proteica con SEQ ID NO: 2 y/o con SEQ ID NO: 6 de al menos 46 %, mas preferentemente al menos 48 %, aun mas preferentemente al menos 50 %, aun mas preferentemente al menos 52 %, incluso mas preferentemente al menos 54 %, lo mas preferentemente al menos 56 %, y en particular al menos 58 %.
Preferentemente, la aciltransferasa codificada por la subsecuencia AGPAT tiene una identidad proteica con SEQ ID NO: 30 y/o con SEQ ID NO: 31 de al menos 2,5 %, mas preferentemente al menos 5,0 %, mas preferentemente al menos 7,5 %, aun mas preferentemente al menos 10 %, aun mas preferentemente al menos 12,5 %, incluso mas preferentemente al menos 15 %, lo mas preferentemente al menos 17,5 %, y en particular al menos 20 %, una identidad proteica de al menos preferentemente 22 %, p. ej., como se determina por medio del software Geneious y la herramienta de alineamiento Geneious Aignment, como se especifica en la presente memoria.
Preferentemente, la enoil reductasa codificada por la subsecuencia ER tiene una similitud proteica con SEQ ID NO: 2 y/o con SEQ ID NO: 6 de al menos 66 %, mas preferentemente al menos 67 %, aun mas preferentemente al menos 68 %, aun mas preferentemente al menos 69 %, incluso mas preferentemente al menos 70 %, lo mas preferentemente al menos 71 %, y en particular al menos 72 %.
Preferentemente, la aciltransferasa codificada por la subsecuencia AGPAT tiene una similitud proteica con SEQ ID NO: 66, SEQ ID NO: 72, SEQ ID NO: 31, SEQ ID NO: 62, SEQ ID NO: 96, SEQ ID NO: 130, SEQ ID NO: 136 y/o con SEQ ID NO: 170 de al menos 2,5 %, mas preferentemente al menos 5,0 %, mas preferentemente al menos
7,5 %, aun mas preferentemente al menos 10 %, aun mas preferentemente al menos 15 %, incluso mas
preferentemente al menos 20 %, preferentemente al menos 22 %, lo mas preferentemente al menos 25 %, y en particular al menos 27,5 %, determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Aignment, como se especifica en la presente memoria.
Preferentemente, la subsecuencia ER tiene una identidad por pares de ADN con SEQ ID NO: 67 y/o con SEQ ID NO: 63 nt 1-1.608 de al menos 60 %, mas preferentemente al menos 62 %, aun mas preferentemente al menos
64 %, aun mas preferentemente al menos 66 %, incluso mas preferentemente al menos 67 %, lo mas
preferentemente al menos 68 %, y en particular al menos 69 %.
Preferentemente, la subsecuencia AGPAT tiene una identidad por pares de ADN con SEQ ID NO: 63, nt 8.30916.219 y SEQ ID NO: 71 y/o con SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 136 y/o SEQ ID NO: 170 de al menos 46 %, mas preferentemente al menos 48 %, mas preferentemente al menos 50 %, aun mas preferentemente al menos 52 %, aun mas preferentemente al menos 54 %, incluso mas preferentemente al menos 56 %, mas preferentemente al menos 58 %, y en particular al menos 60 %, determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Clustal W, como se especifica en la presente memoria. Para los fines de la memoria descriptiva, identidad proteica es sinonimo de identidad de secuencia de protefnas, identidad por pares de ADN es sinonimo de identidad por pares de la secuencia de ADN y similitud proteica es sinonimo de similitud de la secuencia de protefnas.
La identidad proteica, similitud proteica e identidad por pares de ADN (alineamiento) se determinan en general preferentemente por medio del programa Geneious (
http://www.geneious.com/) utilizando una de las siguientes herramientas de alineamiento: Geneious Aignment (Drummond AJ, Ashton B, Cheung M, Heled J, Kearse M, Moir R, Stones-Havas S, Thierer T, Wilson A (2009) Geneious Pro v5.4.2, disponible en
http://www.geneious.com/). La identidad por pares de ADN puede determinarse alternativamente utilizando la herramienta Clustal W2.0.11 Aignment (Thompson, Nucleic Acids Res. 1994, 4673-4680). Los ajustes de parametros para la comparacion de secuencias proteicas son como indica preferentemente ClustalW Aignment: matriz de coste: BLOSUM, coste de apertura de huecos: 10, coste de extension de huecos: 0,1. Los ajustes de parametros para la comparacion de secuencias de ADN son como se indica preferentemente (A) Geneious Aignment: matriz de coste: 51 % de similitud (5,0/-3,0), penalizacion de apertura de huecos: 12, penalizacion de extension de huecos: 3, tipo de alineamiento:
http://www.geneious.com/) utilizando una de las siguientes herramientas de alineamiento: Geneious Aignment (Drummond AJ, Ashton B, Cheung M, Heled J, Kearse M, Moir R, Stones-Havas S, Thierer T, Wilson A (2009) Geneious Pro v5.4.2, disponible en
http://www.geneious.com/). La identidad por pares de ADN puede determinarse alternativamente utilizando la herramienta Clustal W2.0.11 Aignment (Thompson, Nucleic Acids Res. 1994, 4673-4680). Los ajustes de parametros para la comparacion de secuencias proteicas son como indica preferentemente ClustalW Aignment: matriz de coste: BLOSUM, coste de apertura de huecos: 10, coste de extension de huecos: 0,1. Los ajustes de parametros para la comparacion de secuencias de ADN son como se indica preferentemente (A) Geneious Aignment: matriz de coste: 51 % de similitud (5,0/-3,0), penalizacion de apertura de huecos: 12, penalizacion de extension de huecos: 3, tipo de alineamiento:
5
10
15
20
25
30
35
40
45
50
55
60
65
alineamiento global con huecos de extremo libres, y (B) Clustal W2.0.11 Alignment: matriz de coste: IUB, coste de apertura de huecos: 15, coste de extension de huecos: 6,66.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion abarca ademas una subsecuencia CS que codifica una cetosintasa (en lo sucesivo tambien referida como cetosintasa cs1) y/o al menos una subsecuencia DH que codifica una deshidratasa (en lo sucesivo tambien referida como deshidratasa dh1). En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion abarca ademas una subsecuencia CS que codifica una cetosintasa (en lo sucesivo tambien referida como cetosintasa cs1), una subsecuencia FLC que codifica un factor de longitud de cadena y/o al menos una subsecuencia DH que codifica una deshidratasa (en lo sucesivo tambien referida como deshidratasa dh1). Un experto sabe que los peptidos o protefnas pueden calificarse como cetosintasas, factores de longitud de cadena, y deshidratasas, respectivamente, es decir, cuyos requerimientos deben satisfacerse en relacion con la actividad biocatalftica. Generalmente, una beta-cetoacil sintasa es un tipo de enzima sintasa que sintetiza la cadena de carbono en un tipo de condensacion de Claisen. Las beta- cetoacil sintasas se clasifican preferentemente en la categorfa EC 2.3.1.41. Generalmente, un factor de longitud de cadena controla la longitud de cadena del acido graso a sintetizar. El factor de longitud de cadena tambien desempena un papel destacado en la sfntesis de policetido (cf. p. ej., Y Tang et al., J Am Chem Soc. 2003, 125(42), 12708-9).
Generalmente, una deshidratasa es un tipo de enzima que cataliza la eliminacion de oxfgeno e hidrogeno a partir de compuestos organicos en forma de agua (deshidratacion). Existen cuatro clases de deshidratasas: deshidratasas que actuan en esteres de 3-hidroxiacil-CoA reductasa (sin cofactores); deshidratasas que actuan en esteres de 2- hidroxiacil-CoA reductasa (reaccion radical, grupo que contiene [4Fe-4S]); deshidratasas que actuan en esteres 4- hidroxiacil-CoA (que contiene [4Fe-4S] y FAD); y deshidratasas que contienen un agrupamiento [4Fe-4S] como sitio activo (aconitasa, fumarasa, serina deshidratasa), a partir de las cuales se selecciona preferentemente la deshidratasa de acuerdo con la invencion. Preferentemente, las deshidratasas se clasifican en EC 4.2.1 (hid ro- liasas). Los ejemplos preferentes de deshidratasas son hidroxi-acil-deshidratasas, particularmente las p-hidroxi-acil- deshidratasas. En una realizacion preferente, la deshidratasa se selecciona entre el grupo que consiste en crotonoil- [protefna transportadora de acilos] hidratasa (EC 4.2.1.58), 3-hidroxioctanoil-[protefna transportadora de acilos] deshidratasa (EC 4.2.1.59), 3-hidroxidecanoil-[protefna transportadora de acilos] deshidratasa (EC 4.2.1.60), 3- hidroxipalmitoil-[protefna transportadora de acilos] deshidratasa (EC 4.2.1.61), enoil-CoA hidratasa de cadena larga (EC 4.2. 1.74), 3-hidroxipropionil-CoA deshidratasa (EC 4.2.1.116), y 4-hidroxibutanoil-CoA deshidratasa (EC 4.2.1.120).
En una realizacion preferente, la subsecuencia CS, la subsecuencia FLC, al menos una subsecuencia DH y/o la subsecuencia AT se ubican en el mismo gen, preferentemente en el tercer gen (es decir pfa3), que codifica preferentemente una protefna multifuncional que comprende al menos tres dominios, mas preferentemente al menos cuatro dominios y en particular preferentemente al menos cinco dominios.
En una realizacion preferente, el tercer gen codifica una protefna multifuncional que tiene al menos cuatro, preferentemente al menos cinco funcionalidades diferentes, en las que las subsecuencias que codifican las funcionalidades individuales diferentes abarcan la subsecuencia AT que codifica una aciltransferasa y en las que dicha subsecuencia AT se ubica aguas abajo con respecto a las otras subsecuencias.
En una realizacion preferente, el agrupamiento de genes, preferentemente el tercer gen (es decir, pfa3) comprende dos subsecuencias DH que codifican dos deshidratasas, a saber, deshidratasa dh1 y deshidratasa dh2, que pueden ser identicas o diferentes.
Preferentemente, el agrupamiento de genes abarca ademas una subsecuencia CS que codifica una cetosintasa (en lo sucesivo tambien referida como cetosintasa cs2), un subsecuencia MAT que codifica una malonil-CoA- transacilasa, al menos una subsecuencia PPA que codifica una protefna transportadora de acilos (en lo sucesivo referida como acp1), una subsecuencia CR que codifica una cetorreductasa y/o una subsecuencia DH que codifica una deshidratasa (en lo sucesivo tambien referida como deshidratasa dh3). La cetosintasa cs2 puede ser identica o diferente de la cetosintasa cs1 anteriormente mencionada.
La deshidratasa dh3 puede ser identica o diferente de las deshidratasas dh1 y dh2 anteriormente mencionadas, respectivamente.
Un experto sabe que los peptidos o protefnas pueden calificarse como malonil-CoA-transacilasa, protefna transportadora de acilos, y cetorreductasas, respectivamente, es decir, que los requerimientos deben satisfacerse en relacion con la actividad biocatalftica.
Generalmente, una malonil-CoA-transacilasa (tambien referida como [protefna transportadora de acilos] S- maloniltransferasa) cataliza la transferencia de un grupo malonilo de coenzima A a una protefna transportadora de acilos. Preferentemente, las malonil-CoA-transacilasas se clasifican en la categorfa EC 2.3.1.39.
Generalmente, una protefna transportadora de acilos es un pequeno polipeptido con el cual la cadena de carbono/o
5
10
15
20
25
30
35
40
45
50
55
60
65
acilo creciente se une por medio de un enlace tioester durante la biosfntesis (TDH Bugg (ed.) en Introduction to Enzym and Coenzyme Chemistry, 2a ed, 2004, Blackwell Publishing).
Generalmente, una cetorreductasa es una enzima que reduce grupos ceto. Preferentemente, las cetoreductasas se clasifican en la categorfa EC 1.1.1.184.
En una realizacion preferente, la subsecuencia CS, la subsecuencia MAT, al menos una subsecuencia PPA la subsecuencia CR y/o la subsecuencia DH se ubican en el mismo gen, preferentemente en el segundo gen (es decir, pfa2).
En una realizacion preferente, el agrupamiento de genes, preferentemente el segundo gen (es decir, pfa2) comprende al menos dos subsecuencias PPA que codifican dos protefnas transportadoras de acilos, a saber, protefnas transportadoras de acilos acp1 y protefna transportadora de acilos acp2, que pueden ser identicas o diferentes. En una realizacion preferente, el numero total de subsecuencias PPA que codifican las protefnas transportadoras de acilos es 5 o menos (acp1, acp2, acp3, acp4 y acp5). Dichas 5 o menos protefnas transportadoras de acilos pueden ser identicas o diferentes.
En una realizacion particularmente preferente, el agrupamiento de genes de acuerdo con la invencion comprende un primer gen (pfa1), un segundo gen (pfa2) y un tercer gen (pfa3), en el que el segundo gen se ubica opcionalmente aguas abajo con respecto al primer gen y el tercer gen se ubica opcionalmente aguas abajo con respecto al segundo gen; y
una subsecuencia ER que codifica un peptido o protefna que exhibe una actividad enoil reductasa, una subsecuencia CS2 que codifica un peptido o protefna que exhibe una actividad cetosintasa (cs2), una subsecuencia MAT que codifica un peptido o protefna que exhibe una actividad malonil-CoA-transacilasa, al menos una subsecuencia PPA que codifica un peptido o protefna que exhibe una funcionalidad de la protefna transportadora de acilos, una subsecuencia CR que codifica un peptido o protefna que exhibe una actividad cetorreductasa, una subsecuencia DH3 que codifica un peptido o protefna que exhibe una actividad deshidratasa (dh3), una subsecuencia CS1 que codifica un peptido o protefna que exhibe una actividad cetosintasa (cs1), una subsecuencia FLC que codifica un peptido o protefna que exhibe una funcionalidad del factor de longitud de cadena; dos subsecuencias DH1 y DH2 que codifican un peptido o protefna que exhibe una actividad deshidratasa (dh1 y dh2), y una subsecuencia AT que codifica un peptido o protefna que exhibe una actividad aciltransferasa; en la que la subsecuencia ER se ubica preferentemente en el primer gen (pfa1); las subsecuencias CS2, MAT, PPA CR y DH3 se ubican en el segundo gen (es decir, pfa2); y las subsecuencias CS1, FLC, DH1, DH2, y AT se ubican en el tercer gen (es decir, pfa3).
Preferentemente, las subsecuencias tienen el siguiente orden en el agrupamiento de genes (aguas arriba-aguas abajo, es decir, 5 -3'): ER, CS2, MAT, nPPA, CR, DH3, CS1, FLC, DH1, Dh2, AT, en el que n se refiere al numero de PPA preferentemente 1,2, 3, 4 o 5.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion comprende una subsecuencia que codifica una protefna Pfa1 que tiene una identidad proteica con la SEQ ID NO: 2, SEQ ID NO: 6 y/o con SEQ ID NO: 33, SEQ ID NO: 37 (Soce) y/o SEQ ID NO: 64, SEQ ID NO: 68 (Aetherobacter) y/o SEQ ID NO: 98, SEQ ID NO: 102 (Aetherobacter) y/o SEQ ID NO: 138, SEQ ID NO: 142 (Aetherobacter) de al menos 30 %, al menos 32,5 %, al menos 35 %, al menos 37,5 %, al menos 40 %, mas preferentemente al menos 42,5 %, al menos 44 %, aun mas preferentemente al menos 45 %, al menos 46,5 %, aun mas preferentemente al menos 47,5 %, incluso mas preferentemente al menos 49 %, al menos 50 %, al menos 51,5 %, lo mas preferentemente al menos 52,5 %, y en particular al menos 54 %, al menos 55 %, al menos 56 %, al menos 56,5 % aun mas preferentemente al menos 58 % o, al menos 59 %, aun mas preferentemente al menos 60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 %, determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica en la presente memoria. La protefna Pfa1 puede codificarse por una secuencia de ADN que tiene al menos 54 %, mas preferentemente al menos 56 %, aun mas preferentemente al menos 58 %, aun mas preferentemente al menos 60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 % con la SEQ ID NO: 5 y/o con la SEQ ID NO: 36 (Soce) y/o SEQ ID NO: 67 y/o SEQ ID NO: 101 y/o SEQ ID NO: 141 (Aetherobacter), determinada preferentemente por medio del software Geneious y la herramienta de alineamiento ClustalW, como se especifica en la presente memoria.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion comprende una subsecuencia que codifica una protefna Pfa2 que tiene una identidad proteica con SEQ ID NO: 3, SEQ ID NO: 8 y/o con SEQ ID NO: 34, SEQ ID NO: 39 (Soce) y/o SEQ ID NO: 65, SEQ ID NO: 70 (Aetherobacter) y/o SEQ ID NO: 99, SEQ ID NO: 104 (Aetherobacter) y/o SEQ ID NO: 139, SEQ ID NO: 144 (Aetherobacter) de al menos 30 %, al menos 32,5 %, al menos 35 %, al menos 37,5 %, al menos 40 %, mas preferentemente al menos 42,5 %, al menos 44 %, aun mas preferentemente al menos 45 %, al menos 46,5 %, aun mas preferentemente al menos 47,5 %, incluso mas preferentemente al menos 49 %, al menos 50 %, al menos 51,5 %, lo mas preferentemente al menos 52,5 %, y en particular al menos 54 %, al menos 55 %, al menos 56 %, al menos 56,5 % aun mas preferentemente al menos 58 %, al menos 59 %, aun mas preferentemente al menos 60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 %, determinada preferentemente por medio del
5
10
15
20
25
30
35
40
45
50
55
60
65
software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica en la presente memoria. La protefna Pfa2 puede codificarse por una secuencia de ADN que tiene al menos 54 %, mas preferentemente al menos 56 %, aun mas preferentemente al menos 58 %, aun mas preferentemente al menos
60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 % con la SEQ ID NO: 7 y/o con SEQ ID NO: 38 (Soce) y/o SEQ ID NO: 69 y/o SEQ ID NO: 103 y/o SEQ ID NO: 143 (Aetherobacter), determinada preferentemente por medio del software Geneious y la herramienta de alineamiento ClustalW, como se especifica en la presente memoria.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion comprende una subsecuencia que codifica una protefna Pfa3 que tiene una identidad proteica con la SEQ ID NO: 4, SEQ ID NO: 10 y/o con SEQ ID NO: 35, SEQ ID NO: 41 (Soce) y/o SEQ ID NO: 66, SEQ ID NO: 72 (Aetherobacter) y/o SEQ ID NO: 100, SEQ ID NO: 106 (Aetherobacter) y/o SEQ ID NO: 140, SEQ ID NO: 146 (Aetherobacter) de al menos 28 %, al menos 31 %, al menos 34 %, al menos 35 %, al menos 37 %, al menos 40 %, mas preferentemente al menos 43 %, al menos 46 %, aun mas preferentemente al menos 48 %, al menos 50 %, aun mas preferentemente al menos 52 %, incluso mas preferentemente al menos 54 % o al menos 56 %, aun mas preferentemente al menos 58 %, al menos 59 %, aun mas preferentemente al menos 60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 %, determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica en la presente memoria. La protefna Pfa3 puede codificarse por una secuencia de ADN que tiene al menos 49 %, mas preferentemente al menos 51 %, al menos 53,5 %, aun mas preferentemente al menos 56 %, al menos 57 %, al menos 58,5 %, aun mas preferentemente al menos 59 %, incluso mas preferentemente al menos 61 %, lo mas preferentemente al menos
63.5 %, y en particular al menos 66 % con la SEQ ID NO: 9 y/o con SEQ ID NO: 40 (Soce) y/o SEQ ID NO: 71 y/o SEQ ID NO: 105 y/o SEQ ID NO: 145 (Aetherobacter), determinada preferentemente por medio del software Geneious y la herramienta de alineamiento ClustalW, como se especifica en la presente memoria.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion comprende una subsecuencia que tiene una identidad por pares de AdN con SEQ ID NO: 1 y/o con SEQ ID NO: 32 (Soce) y/o con SEQ ID NO: 63, con SEQ ID NO: 97 y/o con SEQ ID NO: 137 (Aetherobacter) de al menos 49 %, mas preferentemente al menos 51 %, aun mas preferentemente al menos 53 %, mas preferentemente al menos 53,5 %, aun mas preferentemente al menos 55 %, aun mas preferentemente al menos 56 %, incluso mas preferentemente al menos 57 %, aun mas preferentemente al menos 58,5 %, lo mas preferentemente al menos 59 %, incluso mas preferentemente al menos
61 %, lo mas preferentemente al menos 63,5 %, y en particular al menos 66 %, como se determina preferentemente por medio de el software Geneious y la herramienta de alineamiento ClustalW, como se especifica en la presente memoria.
Preferentemente, el numero de pb del agrupamiento de genes que se abarca por cualquiera de las subsecuencias anteriores es de al menos 50 %, mas preferentemente al menos 55 %, aun mas preferentemente al menos 60 %, aun mas preferentemente al menos 65 %, incluso mas preferentemente al menos 70 %, lo mas preferentemente al menos 75 % y en particular al menos 80 %, del numero total de pb del agrupamiento de genes.
En general, el tipo de organismo de produccion que se emplea preferentemente en el proceso de acuerdo con la invencion no esta particularmente limitado.
Las mixobacterias se clasifican cientfficamente en el reino de manera preferente: bacterias, filo, proteobacterias, clase: deltaproteobacterias, orden: Myxococcales.
Para los fines de la invencion, los terminos "mixobacterias" y "cepa mixobacteriana" se refieren preferentemente a cualquier especie u otros miembros de microorganismos que pertenecen al orden de Myxococcales.
El termino utilizado "miembros" se utiliza preferentemente para cualquier cepa mixobacteriana de la invencion que se define como un vecino homologo de Aetherobacter.
Para los fines de la invencion, todas las relaciones taxonomicas utilizadas son acordes a Brenner DJ, et al. (eds.) Bergey's Manual of Systematic Bacteriology, 2a ed., Nueva York: Springer, especialmente los metodos de la invencion se refieren a esta norma.
Preferentemente, el genoma del organismo de produccion tiene un contenido GC de al menos 50,0 %, mas preferentemente al menos 52,5 %, aun mas preferentemente al menos 55,0 %, aun mas preferentemente al menos
57.5 %, incluso mas preferentemente al menos 60,0 %, lo mas preferentemente al menos 62,5 %, y en particular al menos 65,0 %.
Preferentemente, el organismo de produccion se selecciona entre el grupo que consiste en eubacterias gramnegativas, eubacterias grampositivas, hongos y levaduras.
De acuerdo con el proceso de acuerdo con la invencion, la produccion transcurre por medio de la expresion genica heterologa en un organismo de produccion que comprende un agrupamiento de genes derivado de un organismo
5
10
15
20
25
30
35
40
45
50
55
60
65
fuente que difiere del organismo de produccion.
El requisito previo mfriimo para satisfacer este requerimiento es que el organismo de produccion no sea identico al organismo de tipo natural que sirve como organismo fuente, es decir, el organismo fuente del que se origina el agrupamiento de genes identificado.
En una realizacion preferente, el organismo de produccion y el organismo fuente son microorganismos.
En lo que se refiere al grado taxonomico de la relacion, el organismo de produccion y el organismo fuente pertenecen preferentemente a diferentes especies o generos; mas preferentemente a diferentes infratribus, subtribus o tribus; aun mas preferentemente a diferentes infrafamilias, subfamilias o familias; aun mas preferentemente a diferentes subordenes u ordenes; incluso mas preferentemente a diferentes subgrupos o grupos; lo mas preferentemente a diferentes subclases o clases; y en particular a diferentes subfilos, filos, reinos o dominios.
En una realizacion preferente, el organismo de produccion es un organismo procariotico, preferentemente seleccionado entre eubacterias gramnegativas y eubacterias grampositivas.
Las eubacterias gramnegativas preferentes incluyen bacterias, proteobacterias, gammaproteobacterias (incluye Pseudomonas, Escherichia, Myxococcus); particularmente preferentes son Pseudomonas putida (proteobacterias, gammaproteobacterias), pseudomonadales, pseudomonadaceae, Pseudomonas, Escherichia coli (proteobacterias, gammaproteobacterias), Enterobacterales, Enterobacteriaceae, Escherichia, Myxococcus xanthus (proteobacterias), deltaproteobacterias, Myxococcales, cystobacterineae, myxoooccaceae, myxococcus.
Las eubacterias grampositivas preferentes incluyen actinobacterias; son particularmente preferentes los miembros de los generos Corynebacterium, Rhodococcus, Streptomyces, Bacillus, Corynebacterium glutamicum (bacterias), actinobacterias, actinobacteiidae, actinomycetales, corynebacterineae, corynebacteriaceae, corynebacterium, Rhodococcus jostii (bacterias, actinobacterias, actinobacteridae, actinomycetales, corynebacterineae), nocardiaceae, Rhodococcus, Streptomyces coelicolor (bacterias, actinobacterias, actinobacteridae, actinomycetales,
streptomydneae, streptomycetaceae, streptomyces).
En otra realizacion preferente, el organismo de produccion es un organismo eucariota, preferentemente seleccionado entre hongos y levaduras.
Los hongos y las levaduras preferentes incluyen Pichia pastoris (ascomycota, saccharomycetes, saccharomycetidae, pichiaceae, pichia), Saccharomyces cerevisiae (ascomycota, saccharomycetes, saccharomycetidae), saccharomycetaceae, Saccharomyces, hansenula spp. ascomycota, saccharomycetes, saccharomycetidae, saccharomycetaceae, Torulaspora spp. ascomycota, saccharomycetes, saccharomycetidae, saccharomycetaceae, Yarrowia lipolytica hongos; dikarya; ascomycota; saccharom yceta; saccharomycotina; saccharomycetes; saccharomycetales; dipodascaceae (incluyendo su etapa asexual, Candida lipolytica).
En una realizacion preferente, el organismo de produccion es una levadura metilotrofica u oleaginosa, es decir, la levadura que tiene una fisiologfa que le permite crecer en metanol y que por lo general tambien acumula una gran cantidad de acidos grasos para conservar energfa. Las preferentes son Hansenula, Pichia, Candida, Torulopsis, yarrowia y tambien la levadura basidiomycete Rhodotorula.
Normalmente, el organismo de produccion tiene un estado GRAS, es decir, esta generalmente reconocido como seguro.
De acuerdo con el proceso de la invencion, el agrupamiento de genes se deriva de un organismo fuente. El organismo fuente puede ser cualquier organismo que comprende un agrupamiento de genes que codifica una vi'a biosintetica del acido graso poliinsaturado y abarca una subsecuencia ER que codifica una enoil reductasa y una subsecuencia AT que codifica una aciltransferasa, en la que la subsecuencia AT se ubica aguas abajo con respecto a la subsecuencia ER.
Preferentemente, el organismo fuente se selecciona entre mixobacterias.
Se cree que las mixobacterias han evolucionado como un grupo monofiletico de organismos en el orden Myxococcales, un subgrupo delta en proteobacterias. En la actualidad, 3 subordenes (Cystobacterineae, Nannocystineae, y Sorangiineae) se reconocen en las mixobacterias [Reichenbach H (2005) Orden VIII. Myxococcales Tchan, Pochon y Prevot 1948, 398AL. En Brenner DJ, et al. (eds.) Bergey's manual of Systematic Bacteriology, 2a ed., vol. 2, parte C, pags. 1.059-1.072, Nueva York: Springer]. Estos subordenes se dividen en seis familias, a saber, Cystobacteraceae, Myxococcaceae, Nannocystaceae, Kofleriaceae, Polyangaceae y Phaselicystidaceae.
La familia Myxococcaceae se compone de los generos Myxococcus, Corallococcus y Pyxidicoccus. En la familia relacionada Cystobacteraceae, se conocen cinco generos (Cystobacter, Archangium, Hyalangium, Melittangium y
5
10
15
20
25
Stigmatella). Nannocystaceae del suborden Nannocsytineae se componen de Nannocystis y dos generos marinos (Enhygromyxa y Plesiocystis). Su familia relacionada Kofleriaceae se compone del genero terrestre Kofleria y el genero marino Heliangium. La familia Polyangiaceae abarca los generos Jahnella, Chondromyces, Polyangium, Byssovorax y Sorangium. Hasta el momento, los dos ultimos son los unicos generos conocidos de microorganismos degradadores de celulosa entre el orden; la mayorfa de los otros grupos taxonomicos son diffciles de aislar y cultivar. El genero recientemente descubierto, Phaselicystis, es el unico genero de la familia recientemente erigido Phaselicystidaceae [Garcia RO et al. (2009) Int J Syst Evol Microbiol 59:1524-1530]. En la actualidad, 20 generos son reconocibles y validamente descritos en mixobacterias para contener todos los aislados terrestres y marinos conocidos.
Myxococcales incluyen los siguientes subordenes ejemplificados que, a su vez, incluyen las siguientes familias ejemplificadas, generos ejemplificados y especies ejemplificadas. El organismo fuente se selecciona preferentemente entre cualquiera de las siguientes especies:
suborden familia genero especies (ejemplos preferentes
Cystob acerineae
Cystob acteraceae
Myxococcaceae
Nannocystineae
Haliangiaceae
(Kofleariaceaea)
Nannocystaceae
Sorangiinae
Phaselicystidaceae
Polyangiaceae
Sorangium
Archangium Cystob acter Hyalangium Melittangium Stigmatella
Anaeromyxob acter Corallococcus Myxococcus Pyxidiococcus
Haliangium
Nannocystis
Plesiocystis
Enhygromyxa Enhygromyxa salina
Phaselicystis
Polyangium
Jahnella
Chondromyces
Byssovorax Byssovorax cruenta
Aetherobacter Aetherobacter fasciculatus (DSM
21835)
Aetherobacterrufus (DSM 23122) Aetherobacter sp. (DSM 23098)
Sorangium cellulosum
Las relaciones filogeneticas como se infiere a partir de una comparacion de datos de la secuencia de ADNr 16S de los generos y especies representativos cuyos cultivos viables son existentes, se presentan en la Fig. 5.
En una realizacion preferente, el agrupamiento de genes se deriva de una cepa mixobacteriana que pertenece al suborden Soiang'ineae del orden Myxococcales. En otra realizacion preferente, el agrupamiento de genes se deriva de una cepa mixobacteriana que pertenece al suborden Polyangiaceae del orden Myxococcales. En una realizacion preferente, la cepa mixobacteriana se selecciona entre las cepas Aetherobacter fasciculatus DSM 21835, Aetherobacter rufus DSM 23122, y Aetherobacter sp. DSM 23098. En otra realizacion preferente, la cepa mixobacteriana es Sorangium cellulosum So ce56.
En una realizacion preferente, el agrupamiento de genes se deriva de una cepa mixobacteriana que produce una composicion que comprende acidos grasos poliinsaturados, en la que el contenido de acidos grasos poliinsaturados omega-3 es al menos el 10 %, preferentemente al menos 15 % en peso de contenido de acidos grasos celulares totales de la composicion.
5
10
15
20
25
30
35
40
45
50
55
60
65
Una vez que un agrupamiento de genes deseado de un organismo fuente se ha identificado y aislado, se puede expresar en un organismo de produccion. Para los fines de expresar de forma heterologa tal agrupamiento de genes en un organismo de produccion, este se vincula operativamente a una secuencia promotora y terminadora utilizando tecnicas o patrones de clonacion convencionales en los procedimientos in vitro, tales como fusion por PCR. El termino "promotor" se refiere a una secuencia de ADN capaz de controlar la expresion de un gen. Las construcciones que contienen agrupamientos de genes de interes pueden introducirse en el organismo de produccion por tecnicas convencionales. Estas tecnicas incluyen la transformacion, tal como, por ejemplo, en S. cerevisiae, la transformacion de acetato de litio, formacion de esferoplastos, y el uso de un mutante karl n.° 15 (Georgieva, B. et al, (2002) Meth. Enzymol. 350:278-89), fusion de protoplastos, lipofeccion, transfeccion, transduccion, conjugacion, infeccion, impacto balfstico, electroporacion, o cualquier otro metodo que introduce el ADN exogeno en la celula del organismo de produccion. Por razones de simplicidad, un organismo de produccion manipulado de esta manera se referira como "transform ado", "recombinante" o "geneticamente modificado". La construccion que se introduce en el organismo de produccion contiene preferentemente ademas del casete de expresion un gen marcador, que permite la identificacion de celulas transformadas y, en el caso de la expresion extracromosomica, tambien evita que la celula pierda la construccion.
La etapa (ii) del proceso de acuerdo con la invencion comprende el cultivo del organismo de produccion de la etapa
(i) en presencia de una fuente de carbono fermentable por la cual se producen uno o varios acidos grasos poliinsaturados.
Normalmente, los organismos de produccion se fermentan en un medio nutriente que contiene una fuente de carbono fermentable y un material protefnico. Las fuentes de carbono preferentes incluyen glucosa, azucar marron, sacarosa, glicerol, almidon, almidon de mafz, lactosa, dextrina, melaza, y similares. Las fuentes de nitrogeno preferentes incluyen harina de semilla de algodon, licor de maceracion del mafz, levadura, levadura de cerveza autolizada con solidos lacteos, soja triturada, harina de semillas de algodon, harina de mafz, solidos lacteos, digerido pancreatico de casefna, solidos de destilerfa, licores de peptona de origen animal, carne y trozos de hueso, y similares. Las combinaciones de estas fuentes de carbono y nitrogeno se pueden utilizar ventajosamente. No hay necesidad de anadir metales traza, p. ej., cinc, magnesio, manganeso, cobalto, hierro y similares, al medio de fermentacion ya que el agua del grifo y los ingredientes no purificados se utilizan como componentes del medio.
Preferentemente, la fuente de carbono fermentable esta libre de acidos grasos, preferentemente se selecciona entre el grupo que consiste en monosacaridos, oligosacaridos, polisacaridos, y aminas que contienen metanol y carbono.
La fermentacion a gran escala para cultivos de produccion se puede inducir a cualquier temperatura conductora para un crecimiento satisfactorio de los organismos de produccion entre aproximadamente 18 y 32 °C y preferentemente a aproximadamente 28 °C. Habitualmente, la produccion optima de los compuestos se obtiene en aproximadamente 2 a 8 dfas de fermentacion, y preferentemente en aproximadamente 4 a 5 dfas de fermentacion.
La produccion puede llevarse a cabo en matraces de agitacion pero tambien en medios solidos y fermentadores agitados. Cuando el crecimiento se lleva a cabo en matraces de agitacion o en grandes recipientes y tanques, es preferible utilizar la forma vegetativa, en lugar de la forma de esporas de los organismos de produccion para la inoculacion. Esto evita un retraso pronunciado en la produccion de los compuestos de AGPI y la utilizacion ineficaz asistente del equipo. En consecuencia, es deseable producir un inoculo vegetativo en un medio nutriente acuoso mediante la inoculacion de este medio con una alfcuota de un cultivo terrestre o inclinado. Cuando un inoculo vegetativo activo joven ha sido por lo tanto asegurado, se transfiere asepticamente a otros matraces de agitacion u otros dispositivos adecuados para la fermentacion de organismos de produccion. El medio en el que se produce el inoculo vegetativo puede ser el mismo, o diferente, al utilizado para la produccion de compuestos, siempre que se obtenga el crecimiento adecuado del microorganismo.
En general, se utiliza la siembra de las cepas bacterianas y la fermentacion y la produccion de compuestos en la fermentacion aerobia sumergida en recipientes agitados. La produccion es independiente de los contenedores, fermentadores y procedimientos iniciadores utilizados. Los compuestos tambien se pueden obtener por cultivo en matraz de agitacion, o en otros recipientes especialmente disenados, tales como tanques de fermentacion aero- elevado o Biowave. Para fermentaciones en grandes volumenes es preferible utilizar un inoculo vegetativo. El inoculo vegetativo se prepara inoculando un pequeno volumen del medio de cultivo con la forma de esporas o un sedimento liofilizado del organismo. El inoculo vegetativo se transfiere entonces a un recipiente de fermentacion, en el que, despues de un tiempo de incubacion adecuado, los compuestos se producen con un rendimiento optimo.
Como es habitual en el proceso de cultivo aerobio sumergido, el aire esteril se dispersa por el medio de cultivo. Para un crecimiento eficiente del organismo, el volumen del aire utilizado se encuentra en el intervalo de aproximadamente 0,25 a aproximadamente 0,5 vvm. Una tasa optima en un recipiente de 10 l es de aproximadamente 0,3 vvm con agitacion proporcionada por impulsores convencionales que giran a aproximadamente 240 rpm. La adicion de una pequena cantidad (es decir, 1 ml/l) de un agente antiespumante, tal como silicona para medios de fermentacion es necesaria si la formacion de espuma se convierte en un problema. Para los organismos microaerofilos puede ser favorable reducir aun mas la aireacion a efectos de soportar la
5
10
15
20
25
30
35
40
45
50
55
60
65
produccion de biomasa. La fermentacion se lleva a cabo por lo general en el modo por lotes, pero para lograr un mejor crecimiento y un mayor rendimiento del producto, fermentaciones por lotes semicontinuos pueden llevarse a cabo mediante el suministro de la fuente de nutrientes requerida para cultivar un cultivo una vez que se ha deplecionado en el medio de cultivo original.
Los productos deseados estaran normalmente presentes en su mayorfa en la biomasa de las cepas bacterianas fermentadas, pero en caso de su sobreproduccion, pueden ubicarse tambien en el filtrado de cultivo del caldo de fermentacion. El caldo de cultivo se puede separar por filtracion en un filtro prensa.
La etapa (iii) del proceso de acuerdo con la invencion solo es opcional y comprende la recuperacion de uno o mas acidos grasos poliinsaturados producidos en la etapa (ii).
Los metodos adecuados para la recuperacion de acidos grasos son conocidos por el experto e incluyen extraccion, cromatograffa y similares. En particular, una variedad de procedimientos se puede emplear para aislar y purificar los compuestos de AGPI a partir del caldo de fermentacion, por ejemplo, mediante procedimientos cromatograficos de adsorcion seguidos de elucion con un disolvente adecuado, cromatograffa en columna, cromatograffa de particion, por extraccion con fluidos supercrfticos, y combinaciones de los metodos antes mencionados.
Un aspecto adicional de la invencion se refiere a un metodo para producir uno o mas acidos grasos poliinsaturados por medio de la expresion genica heterologa de genes que codifican las enzimas de la via biosintetica para la sfntesis de AGPI como se describe en la presente memoria, comprendiendo el metodo preferentemente las etapas de:
(i) proporcionar un organismo de produccion que comprende un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados, derivando dicho agrupamiento de genes de un organismo fuente que difiere del organismo de produccion; y que abarca una primera subsecuencia y/o una segunda subsecuencia,
en la que la protefna codificada por dicha primera subsecuencia tiene una identidad proteica con la secuencia de aminoacidos de Pfa1 de al menos 46 %, mas preferentemente al menos 48 %, aun mas preferentemente al menos 50 %, aun mas preferentemente al menos 52 %, incluso mas preferentemente al menos 54 %, lo mas preferentemente al menos 56 %, y en particular al menos 58 %; determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica con mas detalle en la presente memoria; y/o
que codifica una protefna que tiene una identidad proteica con la secuencia de aminoacidos de Pfa2 de al menos
2.5 %, mas preferentemente al menos 5,0 %, mas preferentemente al menos 7,5 %, aun mas preferentemente al menos 10 %, aun mas preferentemente al menos 12,5 %, incluso mas preferentemente al menos 15 %, lo mas preferentemente al menos 17,5 %, y en particular al menos 20 %; y/o
la protefna codificada por dicha segunda subsecuencia tiene una identidad proteica con la secuencia de aminoacidos de Pfa3 de al menos 2,5 %, mas preferentemente al menos 5,0 %, mas preferentemente al menos
7.5 %, aun mas preferentemente al menos 10 %, aun mas preferentemente al menos 12,5 %, incluso mas preferentemente al menos 15 %, lo mas preferentemente al menos 17,5 %, y en particular al menos 20 %; determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica con mas detalle en la presente memoria;
(ii) cultivar el organismo de produccion de la etapa (i) en presencia de una fuente de carbono fermentable por medio de la cual se producen uno o mas acidos grasos poliinsaturados; y
(iii) opcionalmente, recuperar uno o mas acidos grasos poliinsaturados.
Preferentemente, la primera subsecuencia es una subsecuencia ER como se describe anteriormente y/o la segunda subsecuencia es una subsecuencia AT como se describe anteriormente.
Todas las realizaciones preferentes que se han descrito en relacion con el primer aspecto de la invencion (proceso de acuerdo con la invencion) tambien se refieren de manera analoga a este aspecto de la invencion (metodo de acuerdo con la invencion) y por lo tanto, no se repiten de aquf en adelante.
Se desvela adicionalmente en la presente memoria una composicion que comprende al menos dos acidos grasos poliinsaturados diferentes obtenibles por el proceso de acuerdo con la invencion y el metodo de acuerdo con la invencion, respectivamente.
La filogenia es conforme con las caracterfsticas morfologicas y fisiologicas de las mixobacterias. Lo mas importante, los perfiles de acidos grasos como se infiere por analisis por GC-MS del contenido de acidos grasos celulares se utilizan generalmente y se consideran aceptables para la segregacion taxonomica de mixobacterias, asf como muchos otros grupos de organismos bacterianos, ya que se descubrio que era una caracterfstica constante, al menos cuando se aplica una metodologfa estandarizada. Las primeras aplicaciones de esta tecnica se realizaron en la decada de 1980 [Tornabenet G (1985) Methods in Microbiology 18, 209-234]. Por lo tanto, tales perfiles de acidos grasos basados en GC-MS (o CG) se han utilizado ampliamente en la filogenia y la taxonomfa bacteriana.
5
10
15
20
25
30
35
40
45
50
55
60
65
Asf, los agrupamientos de genes derivados de diferentes especies competentes individuales, es decir especies diferentes que son capaces de produdr AGPI, dan productos de diferente composicion, es decir, productos que contienen diferentes AGPI y/o AGPI en diferentes cantidades. De este modo, los productos que pueden obtenerse por los diferentes procesos tienen caracterfsticas individuales que los distinguen entre si.
Un aspecto adicional de la invencion se refiere a un organismo de produccion transformado que comprende un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados como se ha definido anteriormente.
La invencion se describe ahora con mayor detalle con referenda a las figuras y por medio de ejemplos que, sin embargo, no deben interpretarse como limitantes del alcance de las reivindicaciones.
Aetherobacter fasciculatus, actualmente tambien denominada SBSr002, se deposito de acuerdo con el Tratado de Budapest en el DMSZ, Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH, Inhoffenstr. 7 B, 38124 Braunschweig, Alemania, el 27 de agosto de 2008, con el numero de deposito DSM 21835. Aetherobacter rufus, actualmente tambien denominada SBSr003, se deposito ante el DSMZ con el numero de deposito DSM 23122, y Aetherobacter sp, actualmente tambien denominada SBSr008, se deposito ante el DSMZ con el numero de deposito DSM 23098 ante DSMZ el 12 de noviembre de 2009.
A. fasciculatus DSM 21835 se identifico como un miembro de la clase mixobacterias, orden Myxococcales mostrando el enjambre caracterfstico de las celulas vegetativas gramnegativas, con forma de baston finas, formacon de cuerpos de fructificacion, y actividad bacteriolftica. La cepa es aerobia con respecto a aerobio facultativo, quimioheterotrofico, y tambien exhibe resistencia a diversos antibioticos. Los acidos grasos principales son C22:6 (aado docosahexaenoico), iso-C15:0, ante-iso C17:0 y C20:5 (acido eicosapentaenoico). El contenido de G + C del ADN genomico es 68,9 % en moles. La secuencia de ADNr 16S muestra una identidad del 96 % con respecto a Byssovorax cruenta de degradacion de celulosa y 95 % con respecto a Sorangium cellulosum. Esto demuestra claramente que la cepa pertenece al suborden Sorangiineae del orden Myxococcales. Ademas, la singularidad en las fases de crecimiento morfologico y el innovador perfil de acidos grasos, implican claramente que DSM 21835 pertenece a un nuevo taxon que se clasifica de forma propuesta como perteneciente al genero innovador Aetherobactery a la especie innovadora A. fasciculatus.
Ejemplo 1: Generacion de una construccion de expresion para un agrupamiento de genes biosinteticos para la codificacion de la produccion de AGPI
a) Subclonacion de los genes de AGPI y construccion de las construcciones de expresion:
Los genes de AGPI se subclonaron a partir de los cromosomas de las cepas de mixobacterias productoras de AGPI mediante la generacion de bibliotecas genomicas (p. ej., utilizando un cosmido, fosmido, vectores YAC o BAC) o mediante la amplificacion de genes de AGPI o fragmentos de los mismos por PCR seguido de subclonacion de los productos de PCR. Alternativamente, los genes de AGPI se subclonaron utilizando metodos que se basan en la recombinacion, p. ej., la tecnologfa de recombinacon Red/ET (Zhang Y, Nat. Genet. 1998, 20:123-128; Zhang Y, Nat. Biotechnol. 2000, 18:1314-1317) o la recombinadon en levaduras (Kouprina N, Nature Protocols 2008, 3:371377; Larionov V, P. Natl. Acad. Sci. EE.UU. 1996, 93:491-496; Wolfgang MC, Proc Natl. Acad. Sci. EE.UU. 2003, 100:8484-8489). En otro enfoque, las secuencias de ADN nativas o artificiales de genes de AGPI se sintetizaron qufimicamente de novo (p. ej., mediante sfntesis genica, que esta disponible comerdalmente). Un plasmido preferente que contiene todo el agrupamiento de genes de pfa1, pfa2, pfa3 se muestra en la Fig. 2. Los elementos de RI que flanquean el agrupamiento de genes son opcionales y preferentes para la co-transformacion de la seccion del plasmido que contiene el agrupamiento de genes y los elementos de RI de flanqueo con un gen que codifica una transposasa, que puede contenerse en la misma o en una construccion de acido nucleico separada.
Para movilizar los genes de AGPI, la construccion de expresion se modifico con elementos geneticos que permiten la transferencia, propagacion y control de la expresion en el huesped heterologo. Para la transferencia a traves de la conjugacion, se anade un origen de transferencia (oriT) a la construccion de expresion. Para la propagacion de los genes de AGPI en la celula huesped, las construcciones de expresion se equiparon con un origen de replicacion, que es funcional en la cepa huesped, o la construccon de expresion se integro en el cromosoma huesped utilizando diversos metodos. Para integrar al azar los genes de AGPI en el cromosoma huesped por transposicion (Fu J, Nucleic Acids Res. 2008, 36:e113), el agrupamiento de genes biosinteticos de AGPI junto con un marcador de seleccion adecuado se flanquea por elementos de repeticion invertida (RIs) y la construccion de expresion contiene la transposasa del transposon marino pMycoMar (vease la Figura 2) (Rubin EJ, P. Natl. Acad. Sci. EE.UU. 1999, 96:1645-1650). La integracion dirigida en el cromosoma huesped se logro mediante la recombinacion homologa o por medio de sitios de union al fago especffico del huesped catalizados por integrasas dedicadas (p. ej., sitios de union mX8 o MX9 en mixobacterias (Magrini V. J. Bacteriol. 1999, 181:4050-4061; Julien B, J. Bacteriol. 2003, 185:6325-6330), o el sitio de uniorfPC31 en actinomicetos (Kieser T: Practical Streptomyces Genetics. Norwich, Inglaterra: Fundacion John Innes, 2000)).
5
10
15
20
25
30
35
40
45
50
55
60
65
Para permitir y/u optimizar la expresion heterologa, el agrupamiento de genes biosinteticos de AGPI se modifico por elementos geneticos de modificacion por ingenierfa genetica implicados en la transcripcion/traduccion (p. ej., modificacion por ingenierfa genetica de promotores o sitios de union al ribosoma) o mediante la adaptacion de los codones de genes de AGPI para el uso del codon del huesped heterologo. Para la expresion heterologa en mixobacterias, las estructuras promotoras nativas se intercambiaron con PT7A1, Pm, Ptet (vease la Figura 2), el promotor npt derivado de tn5 u otros promotores (p. ej., promotores que estimulan la expresion de las vfas del metabolito secundario nativo). Para optimizar el perfil de produccion de AGPI, se modificaron por ingenierfa genetica las maquinarias biosinteticas de AGPI mixobacterianas (p. ej., mutacion/insercion/delecion/intercambio de dominios catalfticos) mediante la modificacion de los genes biosinteticos.
Eiemplo 2: Transferencia del agrupamiento de genes en un organismo huesped para la produccion heterologa de AGPI
Las construcciones de expresion de los agrupamientos de genes biosinteticos de AGPI mixobacterianos se transfirieron a las cepas huesped heterologas mediante electroporacion, conjugacion u otros metodos de transformacion (p. ej., transformacion de protoplastos/esferoblastos o utilizando la competencia natural). Los transformantes se analizaron genotfpicamente para la presencia (y la integracion correcta) de las construcciones que contienen el gen de AGPI. Las cepas huesped que contienen los agrupamientos de genes biosinteticos de AGPI mixobacterianos se cultivaron en condiciones apropiadas (p. ej., para M. xanthus: medio CTT a 30 °C durante 2-4 dfas). La produccion de AGPI se analizo por cromatograffa de gases acoplada a espectrometrfa de masas (GC-MS) utilizando el metodo FAME, p. ej., analisis de esterificacion metflica de acidos grasos.
Ejemplo 3: Generacion de una construccion de expresion para el agrupamiento de genes biosinteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 mediante metodos de clonacion convencionales
El agrupamiento de genes biosinteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 se amplifico por PCR a partir de ADN cromosomico. Para ello, el agrupamiento de genes se dividio en varias regiones, que se amplificaron individualmente mientras que los sitios de restriccion adecuados se introdujeron con las secuencias de cebadores. En total, 7 fragmentos se amplificaron por PCR: el gen completo pfa1 sin su secuencia promotora nativa (1, Swal-Spel-pfa1-HpaI), el extremo 5' del gen pfa2 (2, HpaI-5'pfa2-HindIII), la seccion central del gen pfa2 (3, HindIII-CRpfa2-NheI), el extremo 3 del gen pfa2 (4, Nhel -3'pfa2-AseI), el extremo 5' del gen pfa3 (5, AseI-5'pfa3- HindIII), la seccion central del gen pfa3 (6, HindIII-CRpfa3-NheI), y el extremo 3' del gen pfa3 (7, NheI-3'pfa3-SspI- PacI). Los productos de PCR se subclonaron mediante metodos de restriccion y ligamiento convencionales en un vector de clonacion de copias elevado (p. ej., derivado de pUC18). La subclonacion del fragmento 1 condujo al plasmido pPfa1, la subclonacion de fragmentos 2-4 en el mismo vector genero el plasmido pPfa2 y la subclonacion de los fragmentos 5-7 en el mismo vector proporciono el plasmido pPfa3. En la siguiente etapa, los tres genes biosinteticos de AGPI (pfa1, pfa2 y pfa3) se subclonaron en el mismo plasmido. Para ello, los genes pfa2 y pfa3 se ligaron en el plasmido pPfa1 que alberga el gen pfa1 que genera la construccion pPfa1-2-3. Los elementos geneticos requeridos para la expresion de los genes pfa en el huesped heterologo (secuencias promotoras, genes reguladores, sitios de union al ribosoma) se ligaron a traves de los sitios de restriccion SwaI-Spel derivados del fragmento 1. Los casetes requeridos para la transferencia y la replicacion o integracion en el cromosoma huesped se introdujeron a traves de sitios de restriccion unicos del plasmido pPfa1-2-3.
Ejemplo 4: Generacion de una construccion de expresion para el agrupamiento de genes biosinteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 mediante tecnicas de recombinacion genetica
El agrupamiento de genes biosinteticos de AGPI se subclono directamente a partir de ADN cromosomico de A. fasciculatus DSM 21835 mediante tecnicas de recombinacion. Para ello, el ADN genomico se digirio con enzimas de restriccion de corte en las regiones flanqueantes del agrupamiento de genes biosinteticos de AGPI revelando una mezcla de fragmentos de ADN genomico. Un casete que contiene un origen de replicacion, asf como un marcador de seleccion (p. ej., p15Aori-cmR de pACYC184 o p15Aori-ampR de pACYC177) se amplifico por PCR y brazos de homologfa a ambos extremos del fragmento de ADN genomico que alberga el agrupamiento de genes biosinteticos de AGPI se introdujeron con la secuencia del cebador. Ademas, se introdujeron sitios de restriccion unicos (p. ej., PacI) para la subclonacion posterior de casetes de transferencia junto con el brazo de homologfa del extremo 3' del agrupamiento de genes. El fragmento de ADN genomico que alberga el agrupamiento de genes biosinteticos de AGPI se subclono a continuacion en el producto de PCR por recombinacion homologa doble in vivo. La construccion recombinante se modifico adicionalmente mediante una segunda etapa de doble recombinacion homologa para integrar un gen de resistencia amplificado por PCR y flanqueado por dos brazos de homologfa y sitios de restriccion (p. ej., SwaI y Spel) en el extremo 5' del agrupamiento de genes biosinteticos de AGPI. A continuacion, la construccion obtenida se modifico por ingenierfa genetica adicionalmente mediante metodos de clonacion convencionales para introducir casetes requeridos para la transferencia y la expresion heterologa: elementos geneticos requeridos para la expresion de los genes pfa en el huesped heterologo (secuencias promotoras, genes reguladores, sitios de union a ribosomas) se ligaron a traves de sitios de restriccion SwaI-Spel y casetes requeridos para la transferencia y replicacion o integracion en el cromosoma del huesped se introdujeron a traves de sitios de
5
10
15
20
25
30
35
40
45
50
55
60
65
Ejemplo 5: Transformacion del agrupamiento de genes biosinteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 en organismos huesped y expresion heterologa
M. xanthus se cultivo en medio CTT (10 g/l de casitona, 10 ml/l de tampon Tris, 1 ml/l de tampon fosfato de potasio (pH 7,6; 86 ml de K2HPO4 1 M + 13,4 ml de KH2PO41 M), 10 ml/l de sulfato de magnesio 0,8 M) a 30 °C hasta que se alcanzo la DO600 de 0,5. 10 ml del cultivo bacteriano se centrifugaron a 13.000 rpm a 4 °C, el sedimento celular se lavo dos veces con agua destilada helada y finalmente se resuspendio en 40 pl de agua helada. La suspension celular se sometio a electroporacion con la construccion de expresion en una cubeta de electroporacion de 0,1 cm helada bajo las siguientes condiciones: 400 Q, 25 pF y 650 V para lograr una longitud de pulso de 8-9 ms. Despues, se anadio 1 ml de medio CTT y se incubaron las celulas durante 18 h a 30 °C. 3 ml de agar suave CTT (medio CTT mas 7,5 g/l de agar) que contiene 25 pl de 50 mg/ml de kanamicina se anadieron al cultivo y la mezcla se vertio sobre la superficie de placas de agar cTt (medio CTT mas 15 g/l de agar). Las placas se incubaron durante 3 dfas a 30 °C hasta que las colonias mutantes aparecieron. Los transform antes se analizaron luego genotfpica y fenotfpicamente.
Ejemplo 6: Produccion heterologa de AGPI
Mutantes de M. xanthus que albergan el agrupamiento de genes biosinteticos de AGPI se cultivaron en medio CTT suplementado con 50 pg/ml de kanamicina a 30 °C durante 3-5 dfas. El cultivo se centrifugo y se extrajeron los AGPI. Los acidos grasos celulares se extrajeron utilizando el metodo FAME [Bode HB et al. (2006) J. Bacteriol 188:6524-6528; Ring MW et al. (2006), J Biol Chem 281:36691-36700 (2006)]. Alfcuotas (1 pl) de los extractos se analizaron mediante GC-MS. Identificacion de los acidos grasos celulares incluyendo AEP y ADH: acidos grasos celulares incluyendo los AGPI omega-3 (AEP y ADH) se identificaron basandose en los patrones de fragmentacion y el tiempo de retencion. Estos acidos grasos (AG) se compararon con un patron de referencia de la mezcla por FAME (Sigma-Aldrich) que contiene 37 esteres metflicos de acidos grasos. La presencia de ADH y AEP se confirmo utilizando estandares de referencia de Sigma-Aldrich (cis-4,7,10,13,16,19-ADH, cis-5,8,11,14,17-AEP).
La construccion de acidos nucleicos para la expresion heterologa del agrupamiento de genes biosinteticos de AGPI a partir de Sorangium cellulosum So ce56 puede utilizarse para la expresion heterologa de los productos genicos sinteticos en las eubacterias o en otras mixobacteras, p. ej., Myxococcus xanthus DK1622.
La Fig. 3 muestra el resultado analftico de la produccion de AGPI por M. xanthus que contiene el agrupamiento de genes pfa1, pfa2, pfa3 de Soce56 (SEQ ID NO: 1) de una construccion de acido nucleico de acuerdo con la Fig. 2.
Como un ejemplo adicional para la produccion de AGPI utilizando un microorganismo productor que esta geneticamente manipulado para contener el agrupamiento de genes que codifica Pfa1, Pfa2 y Pfa3 para la expresion heterologa, M. xanthus se transformo con una construccion de acido nucleico como se muestra en la Fig. 4, que contenfa pfa1, pfa2, pfa3 clonado a partir de Aetherobacter SBSr002 (SEQ ID NO: 63, o alternativamente, SEQ ID NO: 67, SEQ iD NO: 69 y SEQ ID NO: 71). En detalle, el ADN genomico de DSM 21835 se digirio con el corte de ScaI en las regiones flanqueantes del agrupamiento de genes biosinteticos de AGPI revelando una mezcla de fragmentos de ADN genomico. Un casete que contiene un origen de replicacion p15A asf como un gen de resistencia a ampicilina (p15A ori-ampR de pACYC177) se amplifies por PCR y brazos de homologfa a ambos extremos del fragmento de ADN genomico que alberga el agrupamiento de genes biosinteticos de AGPI se introdujeron con la secuencia del cebador. Ademas, un sitio de restricdon unico PacI para la subdonacion posterior de casetes de transferencia se introdujo junto con el brazo de homologfa del extremo 3' del agrupamiento de genes. El fragmento de ADN genomico que alberga el agrupamiento de genes biosinteticos de AGPI se subclono a continuacion en el producto de PCR por doble recombinacion homologa in vivo. La construccion recombinante se modifico adicionalmente mediante una segunda etapa de doble recombinacion homologa para integrar un gen de resistencia a kanamicina, asf como un promotor Ptet amplificado por PCR y flanqueado por dos brazos de homologfa en el extremo 5' del agrupamiento de genes biosinteticos de AGPI. A continuacion, la construccion se modifico adicionalmente por ingenierfa genetica mediante metodos de clonacion convencionales: El casete zeoR-mx9 que contiene un gen de resistencia a zeocina y un gen que codifica la integrasa Mx9 con sitios de union correspondiente a fagos (attP) para la integracion en el cromosoma del huesped se introdujo a traves del sitio de restricdon unico PacI en el extremo 3' del agrupamiento de genes biosinteticos de AGPI. La construccion de expresion de AGPI se transforma entonces en M. xanthus DK1622. Los transformantes se analizaron genotfpica y fenotfpicamente. Los transformantes de M. xanthus que albergan el agrupamiento de genes biosinteticos de AGPI se cultivaron en medio CTT suplementado con 60 pg/ml de kanamicina y 20 pg/ml de zeocina a 30 °C durante 2-3 dfas. El cultivo se centrifugo y se extrajeron los AGPI, se esterificaron y se analizaron por GC-MS.
Como un ejemplo adicional para la producdon de AGPI mediante el cultivo de un organismo de produccion en un proceso de la invencion, se utilizo un biorreactor agitado de 10 l (Biostat E, Braun Melsungen) para cultivar la cepa de M. xanthus que alberga el agrupamiento de genes de AGPI de Soce56, y por separado M. xanthus que alberga el agrupamiento de genes de AGPI de Aetherobacter fasciculatus, cada una como se describe en la presente memoria, en el medio apropiado a 2 l/min de aireacion, agitacion a 120 rpm a 28 °C durante 5 a 7 dfas. Para la inoculacion, se
5
10
15
20
25
30
35
40
utilizaron precultivos en matraces de agitacion durante 72 h. Los analisis de AGPI metilado mostraron 0,4 a 1,6 % de acido Y-linolenico para cada cepa y 0,6 % de ADH para M. xanthus que expresa el agrupamiento de genes de A. fasciculatus en la biomasa seca.
Ejemplo 7: Comparacion de secuencias
Los dominios catalfticos en las nuevas sintasas de AGPI mixobacterianas se anotaron utilizando diversas herramientas bioinformaticas que se enumeran en la seccion siguiente, donde ER = enoil reductasa, CS = p-cetoaal sintasa, MAT = malonil/acetil transferasa, PPA = protefna transportadora de acilos, CR = p-cetoacilrreductasa, DH = p-hidroxiacil deshidratasa:
el dominio Pfa1_ER se anoto por alineamientos con las secuencias correspondientes de Shewanella sp. SCRC- 2738, Moritella marina MP-1, Photobacterium proiundum TC 9, y Schizochytrium sp. CACT_20888. Pfa2_CS-MAT-PPAs-CR se anoto con el analisis PKS/NRPS de Jacques Ravel, sitio web (
http://nrps.igs.umaryland.edu/nrps/).
http://nrps.igs.umaryland.edu/nrps/).
Pfa2_DH se anoto por alineamientos con las secuencias correspondientes de Shewanella sp. SCRC-2738, Moritella marina MP-1, Photobacterium proiundum SS9, y Schizochytrium sp. CACT_20888.
Pfa3_CS-FLC-DH-DH se anoto con la busqueda de secuencias Pfam (
http://pfam.sanger.ac.uk/).
http://pfam.sanger.ac.uk/).
Pfa3_AT se anoto por alineamientos con las secuencias correspondientes de Shewanella sp. SCRC-2738, Moritella marina MP-1, Photobacterium proiundum SS9, y Schizochytrium sp. CACT_20888. En una busqueda de secuencias BlastP (Instituto Nacional del Cancer, EE. Uu.:
http://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=Proteins) y Pfam (version 24.0; The Wellcome Trust Sanger Institute, Cambridge, RU:
http://pfam.sanger.ac.uk/), el acierto mas significativo representa un dominio AT, pero puede ser que sirva a otra funcion. Los dominios actualmente adicionales no identificados pueden codificarse en los genes descritos en la presente memoria. Ademas de las diferencias de organizacion entre los agrupamientos de genes, las regiones funcionales comparables en los agrupamientos de genes mixobacterianos, como se define en la Figura 1, muestran un nivel inesperadamente bajo de identidad de secuencias en la protefna, asf como en el nivel de ADN con respecto a los genes biosinteticos de AGPI conocidos (tabla 1) como se muestra en las tablas 2 y 3. La similitud de secuencias entre los genes de AGPI mixobacterianos de la invencion es en general mas alta (vease la tabla 4).
http://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=Proteins) y Pfam (version 24.0; The Wellcome Trust Sanger Institute, Cambridge, RU:
http://pfam.sanger.ac.uk/), el acierto mas significativo representa un dominio AT, pero puede ser que sirva a otra funcion. Los dominios actualmente adicionales no identificados pueden codificarse en los genes descritos en la presente memoria. Ademas de las diferencias de organizacion entre los agrupamientos de genes, las regiones funcionales comparables en los agrupamientos de genes mixobacterianos, como se define en la Figura 1, muestran un nivel inesperadamente bajo de identidad de secuencias en la protefna, asf como en el nivel de ADN con respecto a los genes biosinteticos de AGPI conocidos (tabla 1) como se muestra en las tablas 2 y 3. La similitud de secuencias entre los genes de AGPI mixobacterianos de la invencion es en general mas alta (vease la tabla 4).
Tabla.1::^gru2am^^osd:egenes.b|o|i^B^:osconocidoscom2ara^/os.que_co^f^|n:AGPI^^^i|as
- Cepa
- | N° de acceso a GenBank Producto Referenda
- Metz, Science 2001, 293:
- Shewanella sp.
- U73935.1 APE/ADP 290-293
- SCRC-2738
- Takeyama, Microbiol. 1997, 143:2725-2731 Tanaka, Biochem. Soc.
- Moritella marina
- Trans. 2000, 28:943-945:
- MP-1 CACT_15381
- AB025342.2 ADH Morita, Biotecnhol. Lett. 1999, 21:641-646
- Photob acterium
- AF409100.1 APE Allen, Microbiol. 2002,
- profundum SS9
- AF378327.2 148:1903-1913
- Schizochytrium sp.
- AF378328.2 ADH/ADP Metz, Science 2001
- CACT_20888
- AF378329.2
Numero de acceso a BLAST de Sorangium cellulosum Soce56: YP001611455.1
La siguiente comparacion de secuencias de las secuencias (AGPAT) del dominio IV* mixobacteriano del agrupamiento de genes de AGPI de Sorangium cellulosum So CE56 (= So ce56) y AGPAT de Aetherobacter fasciculatus DSM 21835 (= A. fasciculatus) con las secuencias correspondientes de los microorganismos comparativos Methylibium petroleiphilum PM1 (1a lfnea de cada cuadro) Clostridium sp. 7_2_43FAA (2a lfnea de cada cuadro), Talaromyces stipitatus CACT 10500 (3a lfnea de cada cuadro), y Pseudomonas putida GB-1 (4a lfnea de cada cuadro) muestran cada una importantes diferencias en las secuencias, tanto a nivel de ADN como proteico.
Tabla 2: Comparacion de secuencias del dominio IV* con dominios conocidos
Bloque superior: So ce56 frente a microorganismos comparativos Bloque inferior: A. fasciculatus frente a microorganismos comparativos
- Tipo
- herramienta Dominio IV*
- 55,1
- Identidad por pares de ADN [%]
- Geneious 15,8 49,4
- 53,7
- Tipo
- herramienta Dominio IV*
- ClustalW 50,2 35.4 43.4 47,6
- Identidad proteica [%]
- ClustalW 9 8 8 8
- Similitud proteica [%]
- ClustalW 14 15 16 13
- tipo
- herramienta Dominio IV*
- Identidad por pares de ADN [%]
- Geneious 53,2 57,1 48,5 52,0
- ClustalW
- 49,5 33,2 39,4 47,7
- Identidad proteica [%]
- ClustalW 14 12 16 17
- Similitud proteica [%]
- ClustalW 23 22 28 26
Las identidades y similitudes mas bien bajas del dominio IV* de Sorangium y Aetherobacterrespecto a los dominios funcionalmente similares de organismos conocidos muestran que los genes sinteticos utilizados en la invencion difieren significativamente de los genes previamente conocidos.
5
Comparacion de los dominios genicos de AGPI mixobacterianos y dominios de proteinas con genes/protefnas de AGPI bacterianos comparativos
La comparacion de la secuencia de la tabla 3 de los dominios de genes de AGPI de la invencion con dominios 10 homologos de microorganismos conocidos muestra importantes diferencias de secuencia entre los genes de la invencion y los genes conocidos, tanto a nivel de ADN como proteico.
Tabla 3: Comparacion de secuencias con genes comparativos
- tipo
- herramienta Regiones de agrupamientos de AGPI
- I
- IIa IIb IIc IIIa IIIb IV* vs. IV
- Identidad por pares de ADN [%]
- Geneious 53,6 53,5 52,4 50,2 50.0 51.1 55,2 50,9 53,7 48.1 46,3 47.2 47,0 44,6 46,5 50,3 46,7 49,5 46.8 45,0 45.8
- ClustalW
- 51,8 50,1 50,3 46,6 45,9 47,1 53,0 49,4 50,3 43,4 41,8 43,1 42,8 40,4 42,2 45,9 41.5 42.6 401 37,8 37,6
- Identidad proteica [%]
- ClustalW 45 44 44 37 35 36 41 39 41 21 26 25 23 22 24 31 28 31 9 11 12
- Similitud proteica [%]
- ClustalW 65 63 64 51 51 51 56 56 56 34 40 38 36 35 38 44 42 44 23 25 26
- tipo
- herramienta I IIa IIb IIc IIIa IIIb IV IV* vs. IV
- Identidad por pares de ADN [%]
- Geneious 53,1 50,2 58,6 48,5 47,6 49,4 48,2 46,8
5
10
15
20
25
30
35
40
45
50
- tipo
- herramienta I IIa IIb IIc IIIa IIIb IV IV* vs. IV
- 51,8 49,9 54,8 46,9 45,8 47,2 45,4 46,7
- 53,6 50,9 57,5 47,2 46,4 49,1 47,6 45,9
- 50,5 46,0 54,6 42,9 43,9 45,3 43,4 40,4
- ClustalW 49,1 47,2 52,5 40,9 42,0 41,7 39,7 38,5
- 51,7 47,3 54,3 42,1 42,3 45,0 40,9 39,9
- Identidad proteica [%]
- 45 36 26 22 24 23 8 8
- ClustalW 44 36 30 24 23 23 8 8
- 44 37 29 24 25 25 9 9
- Similitud proteica [%]
- 64 50 34 35 38 36 16 16
- ClustalW 63 50 41 38 37 36 14 15
- 63 51 37 36 39 35 16 18
Bloque superior: So ce56 comparada con los genes de AGPI de Shewanella (Ia linea de cada cuadro), Moritella marina (2a linea de cada cuadro), Photobacterium profundum (3a linea de cada cuadro),
Bloque inferior: A. fasciculatus comparada con los genes de AGPI de Shewanella (1a linea de cada cuadro), Moritella marina (2a linea de cada cuadro), Photobacterium profundum (3a linea de cada cuadro.)
f Los alineamientos se realizaron con el programa Geneious como se especifica en la presente memoria.
$ Definicion de las regiones alineadas:
Generalmente, los dominios del agrupamiento de genes de Soce y Aetherobacter (SBSr002) son como se describen en la breve descripcion del listado de secuencias.
Dominio I (comparacion de secuencias de ADN): la secuencia completa del gen de pfal de Soce56 y pfal de A. fasciculatus (SBSr002) se alineo contra las secuencias completas de genes de pfaD (= orf8) de Shewanella sp. SCRC-2738 (n.° acceso: U73935.1/30.730-32.361 nt), orf11 de Moritella marina MP-1 (n.° acceso: AB025342.2/27.119-28.735 nt) y pfaD de Photobacterium profundum SS9 (n.° acceso: AF409100.1/23.166-24.800 nt).
Dominio I (comparacion de secuencias proteicas): las secuencias de protefnas completas de Pfa1 de Soce56 o Pfa1 de A. fasciculatus se alinearon contra las secuencias de protefnas completas de PfaD (= orf8) de Shewanella sp. SCRC-2738 (n.° acceso: AAB81126.1/1-543 aa), Orf11 de Moritella marina MP-1 (n.° acceso: bAa89385.1/1-538 aa) y PfaD de Photobacterium profundum SS9 (n.° de acceso: AAL01063.1/1-544 aa).
Dominio IIa (comparacion de secuencias de ADN): el gen pfa2 de Soce56 y el gen pfa2 de A. fasciculatus se alinearon con el gen pfaA (= orf5) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1), con respecto al gen orf de Moritella marina MP-1 (n.° de acceso: AB025342.2) y al gen pfaA de Photobacterium profundum SS9 (n.° de acceso: AF409100.1).
Dominio IIa (comparacion de secuencias proteicas): la protefna Pfa2 de So ce56 y la protefna Pfa2 de A. fasciculatus se alinearon contra la protefna PfaA (= orf5) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81123.1), el extremo N-terminal de la protefna Orf8 de Moritella marina MP-1 (n.° de acceso: BAA89382.2) y el extremo N- terminal de la protefna PfaA de Photobacterium profundum SS9 (n.° de acceso: AAL01060.1).
Dominio IIb de (comparacion de secuencias de ADN): el gen pfa2 de So ce56 se alineo contra la seccion central del gen pfaA (= orf5) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1), el gen orf8 de Moritella marina MP-1 (n.° de acceso: AAB025342.2) el gen pfaA de Photobacterium profundum SS9 (n.° de acceso: AF409100.1).
Dominio IIb (comparacion de secuencias proteicas): la protefna Pfa2 de So ce56 se alineo contra la seccion central de la protefna PfaA (= orf5) de Shewanella sp. ScRc-2738 (n.° de acceso: AAB81123.1/1.244-1.747 aa), la seccion central de la protefna Orf8 de Moritella marina MP-1 (n.° de acceso: BAA89382.2/1.251-1734 aa) y la seccion central de la protefna PfaA a partir de Photobacterium profundum SS9 (n.° de acceso: AAL01060.1/1.227-1.700 aa).
Dominio IIc (comparacion de secuencias de ADN): el gen pfa2 de So ce56 y el gen pfa2 de A. fasciculatus se alinearon contra el extremo 3' del gen pfaA (= orf5) a partir de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1/19.147-22.176 nt), el extremo 3' del gen orf8 de Moritella marina MP-1 (n.° de acceso: AB025342.2/15.213-17.969 nt) y el extremo 3' del gen pfaA de Photobacterium profundum SS9 (n.° de acceso: AF409100.1/12.554-15.175 nt).
Dominio IIc (comparacion de secuencias proteicas): la protefna Pfa2 de So y la protefna Pfa2 de A. fasciculatus se alinearon contra el extremo C-terminal de la protefna PfaA (= orf5) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81123.1/1.748-2.756 aa), el extremo C-terminal de la protefna orf8 de Moritella marina MP-1 (n.° de acceso: BAA89382.2/1.735-2.652 aa) y el extremo C-terminal de la protefna PfaA de Photobacterium profundum SS9 (n.° de
5
10
15
20
25
30
35
40
45
50
acceso: AAL01060.1/1.701-2.573 aa).
Dominio Ilia (comparacion de secuencias de ADN): el gen pfa3 de So ce56 y el extremo 5' del gen pfa3 de A. fasciculatusse alinearon contra el extremo 5' del gen de pfaC (= orf7) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1/24.518-27.868 nt), el extremo 5' del gen orf10 de Moritella marina MP-1 (n.° de acceso: AB025342.2/20.847-24.044 nt) y el extremo 5' del gen pfaC de Photobacterium profundum SS9 (n.° de acceso: AF409100.1/17.271-20.528 nt).
Dominio Ilia (comparacion de secuencias proteicas): la protefna Pfa3 de So ce56 y la protefna Pfa3 de A. fasciculatus se alinearon contra el extremo N-terminal de la protefna pfaC (= orf7) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81125.1/1-1.117 aa), el extremo N-terminal de la protefna Orf10 de Moritella marina MP-1 (n.° de acceso: BAA89384.1/1-1.066 aa) y el extremo N-terminal de la protefna de PfaC de Photobacterium profundum SS9 (n.° de acceso: AAL01062.1/1-1.086 aa).
Dominio lllb (comparacion de secuencias de ADN): el gen pfa3 de Soce56 y el gen pfa3 de A. fasciculatus se alinearon contra el extremo 3' del gen de pfaC (= orf7) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1/27.869-30.532 nt), el extremo 3' del gen orf10 gen de Moritella marina MP-1 (n.° de acceso: AB025342.2/24.045-26.882 nt) y el extremo 3' del gen pfaC de Photobacterium profundum SS9 (n.° de acceso: AF409100.1/20.529-23.147 nt).
Dominio lllb (comparacion de secuencias proteicas): la protefna Pfa3 de So ce56 y la seccion central de la protefna Pfa3 de A. fasciculatus se alinearon contra el extremo C-terminal de la protefna PfaC (= orf7) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81125.1/1.118-2.004 aa), el extremo C-terminal de la protefna Orf10 de Moritella marina MP-1 (n.° de acceso: BAA89384.1/1.067-2.011 aa) y el extremo C-terminal de la protefna PfaC de Photobacterium profundum SS9 (n.° de acceso: AA_01062.1/1.087-1.958 aa).
Dominio lV* (comparacion de secuencias de ADN): el pfa3 de So ce56 y el extremo 3' del gen pfa3 de A. fasciculatus se alinearon contra las secuencias de genes completas de pfaB (= orf6) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1/22.176-24.518 nt), orf9 de Moritella marina MP-1 (n.° de acceso: AB025342.2/18.126-20.723 nt) y pfaB de Photobacterium Profundum ES9 (n.° de acceso: AF409100.1/15.175-17.274 nt).
Dominio lV* (comparacion de secuencias proteicas): la protefna Pfa3 de Soce56 y la protefna Pfa3 de A. fasciculatus se alinearon contra las secuencias de protefnas completas de PfaB (= orf6) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81124.1/1-780 aa), de Orf9 Moritella marina MP-1 (n.° de acceso: BAA89383.1/1-865 aa) y PfaB de Photobacterium Profundum Es9 (n.° de acceso: AAL01061.1/1-699 aa).
La Figura 1 muestra las regiones antes definidas l, lla, llb, llc, llla, lV si es aplicable, lllb y lV*.
De nuevo, la comparacion de secuencias de dominios de genes de AGPl de Soce56 y Aetherobacter con las de Schizochytrium muestra la homologfa de secuencia muy baja de los genes de la invencion con respecto a los genes conocidos de la sfntesis de AGPl.
Tabla 4: Comparacion de secuencias de genes/protefnas de AGPl mixobacterianos con genes/protefnas de AGPl a partir de Schizochytrium sp.
Bloque superior: Soce56 frente a Schizochytrium sp.
Bloque inferior: A. fasciculatus frente a Schizochytrium sp*.
- tipo
- herramienta Dominio del agrupamiento de AGPl$
- la
- lb lla llb llc llla lllb lV* vs. lV
- ldentidad por pares de ADN [%]
- Geneious 59,2 61,4 55,6 60,9 56,7 52,9 54,1 “510
- ClustalW
- 55,8 58,8 51,5 57,4 52,6 48,5 50,0 43,3
- ldentidad proteica [%]
- ClustalW 37 38 30 32 26 22 26 10
- Similitud proteica [%]
- ClustalW 57 57 44 42 39 34 38 20
- tipo
- herramienta la lb lla llb llc llla lllb lV lV* vs. lV
- ldentidad por pares de
- Geneious 58,3 61,3 55,9 62,8 56,7 52,8 54,9 53,2 51,1
- ADN [%]
- ClustalW 55,6 59,0 52,2 61,7 51,9 49,7 49,3 50,1 45,5
- ldentidad proteica [%]
- ClustalW 40 41 29 15 26 23 21 16 11
- Similitud proteica [%]
- ClustalW 57 58 43 21 42 35 31 26 22
$ Definicion de los dominios alineados: Los dominios del agrupamiento de genes de Soce56 y Aetherobacter (SBSr002) son como se describen en la breve descripcion del listado de secuencias.
5
10
15
20
25
30
35
40
45
50
55
60
65
Los dominios comparativos de Schizochytrium fueron:
Dominio Ia (comparacion de secuencias de ADN): extremo 3' del gen orfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378328.2/4.500-6.180 nt).
Dominio la (comparacion de secuencias proteicas): extremo C-terminal de la protefna OrfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72880.2/1500-2059 aa).
Dominio lb (comparacion de secuencias de ADN): extremo 3' del gen orfC (= subunidadC) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378329.2/2.848-4.509 nt).
Dominio lb (comparacion de secuencias proteicas): extremo C-terminal de la protefna OrfC (= SubunidadC) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72881.2/950-1.502 aa).
Dominio lla (comparacion de secuencias de ADN): extremo 5' del gen orfA (= subunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378327.2/1-3.699 nt).
Dominio lla (comparacion de secuencias proteicas): seccion del extremo N-terminal de la protefna OrfA (= SubunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72879.2/1-1.233 aa).
Dominio llb (comparacion de secuencias de ADN): Gen orfA (= subunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378327.2/3.700-6.198 nt).
Dominio llb (comparacion de secuencias proteicas): la protefna OrfA (= SubunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72879.2/1.234-2.066 aa).
Dominio llc (comparacion de secuencias de ADN): extremo 3' del gen orfA (= subunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378327.2/6.199-8.733 nt).
Dominio llc (comparacion de secuencias proteicas): seccion del extremo C-terminal de la protefna OrfA (= subunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72879.2/2.067-2.910 aa).
Dominio llla (comparacion de secuencias de ADN): extremo 5' del gen orfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378328.2/1-3.150 nt).
Dominio llla (comparacion de secuencias proteicas): seccion del extremo N-terminal de la protefna OrfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72880.2/1-1.050 aa).
Dominio lllb (comparacion de secuencias de ADN): extremo 5' del gen orfC (= subunidadC) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378329.2/1-2.847 nt).
Dominio lllb (comparacion de secuencias proteicas): seccion del extremo N-terminal de la protefna OrfC (= subunidadC) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72881.2/1-949 aa).
Dominio lV (comparacion de secuencias de ADN): la region central del gen orfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378328.2/3.151-4.497 nt) se compare con el dominio lV* de Sorangium, y con los dominios lV y lV* de Aetherobacter, respectivamente.
Dominio lV (comparacion de secuencias proteicas): la region central de la protefna OrfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72880.2/1.051-1.499 aa) se comparo con el dominio lV* de Sorangium, y con los dominios lV y lV* de Aetherobacter, respectivamente.
Una comparacion de secuencias entre los genes de AGPl en el nivel de ADN y de protefna muestra importantes homologfas de secuencia entre los dominios, genes y agrupamientos de genes de la invencion, en especial en el grupo de los dominios, genes y agrupamientos de genes de Sorangium, y en el grupo de los dominios, genes y agrupamientos de genes de Aetherobacter, respectivamente.
La Tabla 5 muestra a continuacion el resultado de la comparacion de secuencias para los dominios de Aetherobacter SBSr002 y SBSr008 (bloque superior), para los dominios de Aetherobacter SBSr002 y SBSr003 (bloque medio), y para los dominios de Aetherobacter SBSr008 y SBSr003 (bloque inferior).
La Tabla 6 muestra a continuacion el resultado de la comparacion de secuencias para los dominios de Sorangium, Soce56 y Soce377.
Los dominios utilizados en estas comparaciones son los descritos en el listado de secuencias.
Tabla 5: Comparacion de aenes/proteinas de AGPI micobacterianos de Aetherobacter
- tipo
- herramienta Dominios de los agrupamientos de AGPI
- I
- IIa IIb IIc IIIa IIIb IV IV* vs. IV
- Identidad por pares de ADN [%]
- Geneious 99,0 97,8 95,9 96,3 98,6 96,9 98,3 96,8
- ClustalW
- 99,0 97,8 95,9 96,3 98,6 96,9 98,3 96,8
- Identidad proteica [%]
- ClustalW 99 97 99 96 98 96 98 95
- Similitud proteica [%]
- ClustalW 99 98 99 97 98 97 99 98
- tipo
- herramienta I IV*
- Identidad por pares de ADN [%]
- Geneious 92,3 85,6
- ClustalW
- 92,3 85,4
- Identidad proteica [%]
- ClustalW 94 84
- Similitud proteica [%]
- ClustalW 96 88
- tipo
- herramienta I IV*
- Identidad por pares de ADN [%]
- Geneious 92,5 85,9
- ClustalW
- 92,5 85,5
- Identidad proteica [%]
- ClustalW 94 84
- Similitud proteica [%]
- ClustalW 97 89
5 Tabla 6: Comparacion de aenes/proteinas de AGPI micobacterianos de Sorangium
- tipo
- herramienta Dominios de los agrupamientos de AGPI
- I
- IIa IIb IIc IIIa IIIb IV*
- Identidad por pares de ADN [%]
- Geneious 98,2 95,8 91,1 97,8 96,1 97,0 96,9
- ClustalW
- 98,2 95,8 91,1 97,8 95,9 97,0 96,9
- Identidad proteica [%]
- ClustalW 98 94 90 97 94 95 97
- Similitud proteica [%]
- ClustalW 99 96 91 97 95 96 98
Estos analisis muestran los grados significativos de identidad de los dominios del agrupamiento de genes de AGPI para los grupos de genes de Sorangium y para el grupo de genes de Aetherobacter, respectivamente, en 10 combinacion con un grado significative de identidad de secuencia encontrado entre Sorangium y Aetherobacter, especialmente con respecto al dominio IV*.
Ademas, los dominios del agrupamiento de genes sinteticos de AGPI de Sorangium y Aetherobactertienen una alta identidad y similitud de protefnas como se muestra en la Tabla 7 a continuacion, que es, p. ej., significativamente 15 mayor que la identidad y similitud de protefnas, respectivamente, de Sorangium y Aetherobacter hacia las regiones y dominios de organismos conocidos pertinentes, p. ej., hacia los dominios funcionalmente similares de Shewanella, Moritella marina, y Photobacterium profundum como se muestra en la tabla 3, y hacia Schizochytrium como se muestra en la tabla 4.
20 Tabla 7: Comparacion de genes/protefnas de AGPI mixobacterianos de Sorangium y Aetherobacter
- tipo
- herramienta Dominios de los agrupamientos de AGPI
- I
- IIa IIb IIc IIIa IIIb IV*
- Identidad por pares de ADN [%]
- Geneious 70,4 69,8 67,5 65,9 65,3 69,0 63,5
- ClustalW
- 69,2 68,0 66,1 63,7 62,3 67,1 62,0
- Identidad proteica [%]
- Geneious 59 58 27 47 46 42 22
- ClustalW
- 59 57 26 47 47 42 24
- Similitud proteica [%]
- Geneious 73 67 34 61 56 49 29
- ClustalW
- 73 68 33 60 56 50 31
Por consiguiente, las enzimas de la via sintetica de AGPI de la invencion contienen un dominio que tiene actividad AGPAT y una secuencia de aminoacidos que es al menos 50 %, 85 %, 90 % o al menos 95 % identica a al menos 25 una secuencia de aminoacidos de un dominio IV* de Sorangium y/o de Aetherobacter como se describe en la presente memoria.
Claims (15)
- 51015202530354045505560651. Proceso de produccion de acidos grasos poliinsaturados por expresion de genes heterologos de enzimas de la via biosintetica de acidos grasos poliinsaturados en un organismo de produccion, que comprende el cultivo del organismo de produccion en presencia de una fuente de carbono fermentable,- en el que el organismo de produccion se manipula geneticamente para comprender un primer gen, unsegundo gen y un tercer gen,- en el que el primer gen contiene un dominio I que codifica una enoil reductasa que tiene una identidad desecuencia de aminoacidos de al menos el 59 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 13, SEQ ID NO: 44, SEQ ID NO: 75, SEQ ID NO: 109, SEQ ID NO: 133 y/o SEQ ID NO: 149, y- en el que el segundo gen contiene un dominio IIa que codifica una cetosintasa y una malonil-CoA-transacilasa que tiene una identidad de secuencia de aminoacidos de al menos el 57 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 16, SEQ ID NO: 47, SEQ ID NO: 78 y/o SEQ ID NO: 112, un dominio IIb que codifica al menos una protefna transportadora de acilos que tiene una identidad de secuencia de aminoacidos de al menos el 26 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 19, SEQ ID NO: 50, SEQ ID NO: 81, SEQ ID NO: 115 y/o SEQ ID NO: 155; un dominio IIc que codifica una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 47 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 22, SEQ ID NO: 53, SEQ ID NO: 84, SEQ ID NO: 118 y/o SEQ ID NO: 158; y- en el que el tercer gen contiene un dominio IIIa que codifica una cetosintasa y un factor de longitud decadena que tiene una identidad de secuencia de aminoacidos de al menos el 46 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 25, SEQ ID NO: 56, SEQ ID NO: 87, SEQ ID NO: 121 y/o SEQ ID NO: 161; y un dominio IIIb que codifica al menos una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 42 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 28, SEQ ID NO: 59, SEQ ID NO: 90, SEQ ID NO: 124 y/o SEQ ID NO: 164, y un dominio que codifica una aciltransferasa (AT) caracterizado por que la aciltransferasa codificada es una acil-glicerol-fosfato aciltransferasa (AGPAt) que tiene una identidad de secuencia de aminoacidos de al menos el 50 % con respecto a una secuencia de aminoacidos codificada por el dominio IV* contenido en el grupo que comprende SEQ ID NO: 30, SEQ ID NO: 61, SEQ ID NO: 95, SEQ ID NO: 129, SEQ ID NO: 135 y/o SEQ ID nO: 169, y secuencias de aminoacidos codificadas por una seccion de secuencia de acidos nucleicos contenida en el grupo que comprende SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.
- 2. Proceso de acuerdo con la reivindicacion 1, caracterizado por que el dominio IV* esta contenido en una secuencia de acidos nucleicos que codifica el producto genico Pfa3 que tiene una identidad de secuencia de aminoacidos de al menos el 28 % con respecto a una secuencia de aminoacidos contenida en el grupo que comprende SEQ ID NO: 10 y/o SEQ ID NO: 41, SEQ ID NO: 72, SEQ ID NO: 106 y/o SEQ ID NO: 146.
- 3. Proceso de acuerdo con la reivindicacion 1 o 2, caracterizado por que el tercer gen contiene un dominio IV que codifica una aciltransferasa (AT) que tiene una identidad de secuencia de aminoacidos de al menos el 98 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 93, SEQ ID NO: 127 y/o SEQ ID NO: 167, cuyo dominio IV se dispone entre el dominio IIIa y el dominio IIIb.
- 4. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el primer gen codifica una enoil reductasa que tiene una identidad de secuencia de aminoacidos de al menos el 30 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 6, SEQ ID NO: 37, SEQ ID NO: 68, SEQ ID NO: 102, SEQ ID NO: 132 y/o SEQ ID NO: 142.
- 5. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el segundo gen codifica una cetosintasa, una malonil-CoA-transacilasa, una protefna transportadora de acilos, una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 30 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 8, SEQ ID NO: 39, SEQ ID NO: 70, SeQ ID NO: 104 y/o SEQ ID NO: 144.
- 6. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el tercer gen codifica una cetosintasa, un factor de longitud de cadena, una deshidratasa, y la acil-glicerol-fosfato aciltransferasa (AGPAT) que tiene una identidad de secuencia de aminoacidos de al menos el 28 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 10, SEQ ID NO: 41, SEQ ID NO: 72, SeQ ID NO: 106 y/o SEQ ID NO: 146.
- 7. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el organismo de produccion se manipula geneticamente para codificar una protefna que tiene una identidad de secuencia de aminoacidos de al menos el 30 % con respecto a una secuencia de aminoacidos codificada por una secuencia de510152025303540455055ADN del grupo que consiste en SEQ ID NO: 1, SEQ ID NO: 32, SEQ ID NO: 63, SEQ ID NO: 97, SEQ ID NO: 137.
- 8. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que la identidad de secuencia de aminoacidos es de al menos el 60 %, de al menos el 85 %, de al menos el 90 % o de al menos el 95 %.
- 9. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que la fuente de carbono fermentable esta libre de acidos grasos.
- 10. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el acido graso poliinsaturado comprende al menos 3 grupos etilenicamente insaturados.
- 11. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el organismo de produccion se selecciona entre el grupo que consiste en eubacterias gramnegativas, eubacterias grampositivas, mixobacterias, hongos y levaduras
- 12. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el organismo de produccion se selecciona entre el grupo que consiste en Yarrowia lipolytica o Pseudomonas putida.
- 13. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por quei) un acido graso poliinsaturado esta presente en al menos 40 % en peso basado en el peso total de todos los acidos grasos poliinsaturados contenidos en la composicion y/oii) el acido graso poliinsaturado es acido eicosapentanoico (AEP), acido docosahexanoico (ADH), acido linoleico y/o acido linolenico.
- 14. Uso de un organismo de produccion, como se define en una cualquiera de las reivindicaciones 1 a 13, para la produccion de acidos grasos poliinsaturados.
- 15. Uso de un primer gen, de un segundo gen y de un tercer gen, para construir un organismo de produccion, en el que- el primer gen contiene un dominio I que codifica una enoil reductasa que tiene una identidad de secuencia de aminoacidos de al menos el 59 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 13, SEQ ID NO: 44, SEQ ID NO: 75, SEQ ID NO: 109, SEQ ID NO: 133 y/o SEQ ID NO: 149, y- el segundo gen contiene un dominio IIa que codifica una cetosintasa y una malonil-CoA-transacilasa que tiene una identidad de secuencia de aminoacidos de al menos el 57 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 16, SEQ ID NO: 47, SEQ ID nO: 78 y/o SEQ ID NO: 112, un dominio IIb que codifica al menos una protefna transportadora de acilos que tiene una identidad de secuencia de aminoacidos de al menos el 26 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 19, SEQ ID NO: 50, SEQ ID NO: 81, SEQ ID NO: 115 y/o SEQ ID NO: 155; y un dominio IIc que codifica una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 47 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 22, SEQ ID NO: 53, SEQ ID NO: 84, SEQ ID NO: 118 y/o SEQ ID NO: 158; y- el tercer gen contiene un dominio IIIa que codifica una cetosintasa y un factor de longitud de cadena que tiene una identidad de secuencia de aminoacidos de al menos el 46 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 25, SEQ ID NO: 56, SEQ ID NO: 87, SEQ ID NO: 121 y/o SEQ ID NO: 161; y un dominio IIIb que codifica al menos una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 42 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 28, SEQ ID NO: 59, SEQ ID NO: 90, SEQ ID NO: 124 y/o SEQ ID NO: 164, y un dominio que codifica una aciltransferasa (AT), caracterizado por que la aciltransferasa codificada es una acil- glicerol-fosfato aciltransferasa (AGPAT) que tiene una identidad de secuencia de aminoacidos de al menos el 50 % con respecto a una secuencia de aminoacidos codificada por el dominio IV* contenido en el grupo que comprende SEQ ID NO: 30, SEQ ID NO: 61, SEQ ID NO: 95, SEQ ID NO: 129, SEQ ID NO: 135 y/o SEQ ID NO: 169, y secuencias de aminoacidos codificadas por una seccion de secuencia de acidos nucleicos contenida en el grupo que comprende SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20100005644 EP2390343A1 (en) | 2010-05-31 | 2010-05-31 | Production of fatty acids by heterologous expression of gene clusters from myxobacteria |
EP10005644 | 2010-05-31 | ||
PCT/EP2011/058863 WO2011151298A1 (en) | 2010-05-31 | 2011-05-30 | Production of fatty acids by heterologous expression of gene clusters from myxobacteria |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2633587T3 true ES2633587T3 (es) | 2017-09-22 |
Family
ID=42790932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES11721794.3T Active ES2633587T3 (es) | 2010-05-31 | 2011-05-30 | Producción de ácidos grasos por expresión heteróloga de agrupamientos de genes a partir de mixobacterias |
Country Status (7)
Country | Link |
---|---|
US (2) | US9127298B2 (es) |
EP (2) | EP2390343A1 (es) |
JP (2) | JP6200807B2 (es) |
DK (1) | DK2576799T3 (es) |
ES (1) | ES2633587T3 (es) |
PT (1) | PT2576799T (es) |
WO (1) | WO2011151298A1 (es) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK2367950T3 (en) | 2008-12-01 | 2017-07-17 | Univ Saarland | PREPARATION OF OMEGA-3 FAT ACIDS USING MYXOBACTERIA |
US10131897B2 (en) | 2014-03-03 | 2018-11-20 | Synthetics Genomics, Inc. | Molecules associated with fatty acid biosynthetic pathways and uses thereof |
CN104328145B (zh) * | 2014-10-20 | 2017-05-17 | 南京大学 | 一种用基因工程大肠杆菌生产不饱和脂肪酸的方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6451567B1 (en) | 1988-09-07 | 2002-09-17 | Omegatech, Inc. | Fermentation process for producing long chain omega-3 fatty acids with euryhaline microorganisms |
CA2395622A1 (fr) | 2002-07-22 | 2004-01-22 | Edwin Bourget | Procede d'enrichissement en lipides et en acides gras omega-3 dans les cultures d'algues |
EP1963481A2 (en) | 2005-12-16 | 2008-09-03 | Avestha Gengraine Technologies PVT Ltd | Docosahexaenoic acid (dha) producing thraustochytrid strain - sc1 |
DK2367950T3 (en) | 2008-12-01 | 2017-07-17 | Univ Saarland | PREPARATION OF OMEGA-3 FAT ACIDS USING MYXOBACTERIA |
-
2010
- 2010-05-31 EP EP20100005644 patent/EP2390343A1/en not_active Withdrawn
-
2011
- 2011-05-30 EP EP11721794.3A patent/EP2576799B1/en active Active
- 2011-05-30 DK DK11721794.3T patent/DK2576799T3/en active
- 2011-05-30 JP JP2013512859A patent/JP6200807B2/ja active Active
- 2011-05-30 WO PCT/EP2011/058863 patent/WO2011151298A1/en active Application Filing
- 2011-05-30 PT PT117217943T patent/PT2576799T/pt unknown
- 2011-05-30 US US13/701,411 patent/US9127298B2/en active Active
- 2011-05-30 ES ES11721794.3T patent/ES2633587T3/es active Active
-
2015
- 2015-07-29 US US14/812,759 patent/US9574215B2/en active Active
-
2016
- 2016-02-26 JP JP2016036413A patent/JP2016136962A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP2390343A1 (en) | 2011-11-30 |
WO2011151298A1 (en) | 2011-12-08 |
JP2016136962A (ja) | 2016-08-04 |
JP2013529912A (ja) | 2013-07-25 |
US20130196391A1 (en) | 2013-08-01 |
US20160017388A1 (en) | 2016-01-21 |
EP2576799A1 (en) | 2013-04-10 |
US9574215B2 (en) | 2017-02-21 |
DK2576799T3 (en) | 2017-08-07 |
US9127298B2 (en) | 2015-09-08 |
JP6200807B2 (ja) | 2017-09-27 |
EP2576799B1 (en) | 2017-04-26 |
PT2576799T (pt) | 2017-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10246726B2 (en) | Photosynthetic production of 3-hydroxybutyrate from carbon dioxide | |
JP7261815B2 (ja) | ネルボン酸を生産する組換え酵母菌株およびその使用 | |
CA2687523A1 (en) | Chimeric pufa polyketide synthase systems and uses thereof | |
CN103842502A (zh) | 制备具有改良的脂肪链长度和饱和度特性的脂肪酸及其衍生物 | |
CN110157654A (zh) | 一种纳豆芽孢杆菌重组菌及其构建方法与应用 | |
CN105647822B (zh) | 一株过表达来源于寄生疫霉的ω-3脱饱和酶的重组高山被孢霉、其构建方法及应用 | |
US9574215B2 (en) | Production of fatty acids by heterologous expression of gene clusters from myxobacteria | |
CN113817782B (zh) | 一种庚二酸的全生物合成方法 | |
Zhang et al. | Manipulation of triacylglycerol biosynthesis in Nannochloropsis oceanica by overexpressing an Arabidopsis thaliana diacylglycerol acyltransferase gene | |
CN113286890A (zh) | 脂氧合酶催化从多不饱和脂肪酸(pufa)产生不饱和c10-醛 | |
CN102295691A (zh) | Bccp2基因及其在提高植物及藻类油脂含量方面的应用 | |
CN111094558A (zh) | 对产生中链脂肪酸衍生物具有改善的活性的硫酯酶变体 | |
JP6816970B2 (ja) | 多価不飽和脂肪酸ポリケチドシンターゼ及びその利用 | |
CN105861339B (zh) | 一株过表达gtp 环式水解酶基因的重组高山被孢霉、其构建方法及应用 | |
WO2022105841A1 (zh) | 一种脂肪酸延长酶基因和酯化酶基因在酵母合成神经酸和油脂中的应用 | |
JP4221476B2 (ja) | イコサペンタエン酸生合成遺伝子群をクローニングしたプラスミド及びイコサペンタエン酸を産生するラン藻 | |
WO1996021735A1 (fr) | Genes codant un groupe d'enzymes de biosynthese pour l'acide icosapentaenoique (epa) et procede d'obtention dudit acide | |
JP6619229B2 (ja) | アラキドン酸生産ポリケチドシンターゼ及びその利用 | |
JP7009009B2 (ja) | 高分子量コポリマーを合成するための遺伝子 | |
KR101390327B1 (ko) | 긴사슬 지방산 과발현용 형질전환 대장균의 제조방법 | |
CN114891822B (zh) | 高产γ-亚麻酸卷枝毛霉重组菌的构建方法、该方法构建的重组菌及应用 | |
WO2017097218A1 (zh) | 来源于寄生疫霉的用于合成多不饱和脂肪酸的ω-3脂肪酸脱饱和酶、含所述脂肪酸脱饱和酶的载体、重组微生物及其应用 | |
JP2021524262A (ja) | コリネ型細菌由来のD−キシロースデヒドロゲナーゼおよびD−キシロネートの生産(Herstellung)方法 | |
KR20110002130A (ko) | 부탄올 생성능을 가지는 재조합 미생물 및 이를 이용한 부탄올의 제조방법 | |
CN110066812A (zh) | 植物亚麻酸合成酶基因CsFAD2-2及其应用 |