BR112020005278A2 - produção heteróloga de ácido 10-metil esteárico por células que expressam metil transferase recombinante - Google Patents
produção heteróloga de ácido 10-metil esteárico por células que expressam metil transferase recombinante Download PDFInfo
- Publication number
- BR112020005278A2 BR112020005278A2 BR112020005278-7A BR112020005278A BR112020005278A2 BR 112020005278 A2 BR112020005278 A2 BR 112020005278A2 BR 112020005278 A BR112020005278 A BR 112020005278A BR 112020005278 A2 BR112020005278 A2 BR 112020005278A2
- Authority
- BR
- Brazil
- Prior art keywords
- seq
- methyl
- gene
- cell
- protein
- Prior art date
Links
- 108060004795 Methyltransferase Proteins 0.000 title claims abstract description 130
- 102000016397 Methyltransferase Human genes 0.000 title claims abstract description 43
- BEOUGZFCUMNGOU-UHFFFAOYSA-N tuberculostearic acid Chemical compound CCCCCCCCC(C)CCCCCCCCC(O)=O BEOUGZFCUMNGOU-UHFFFAOYSA-N 0.000 title abstract description 28
- 238000004519 manufacturing process Methods 0.000 title abstract description 23
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 85
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 70
- 150000002632 lipids Chemical class 0.000 claims abstract description 68
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 66
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 66
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims abstract description 53
- 102000004190 Enzymes Human genes 0.000 claims abstract description 28
- 241000192128 Gammaproteobacteria Species 0.000 claims abstract description 28
- 108090000790 Enzymes Proteins 0.000 claims abstract description 27
- 241000894006 Bacteria Species 0.000 claims abstract description 23
- 229920006395 saturated elastomer Polymers 0.000 claims abstract description 7
- 210000004027 cell Anatomy 0.000 claims description 244
- 108090000623 proteins and genes Proteins 0.000 claims description 224
- 108090000854 Oxidoreductases Proteins 0.000 claims description 126
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 98
- 229930195729 fatty acid Natural products 0.000 claims description 98
- 239000000194 fatty acid Substances 0.000 claims description 98
- 150000004665 fatty acids Chemical class 0.000 claims description 74
- 101150117543 tmpB gene Proteins 0.000 claims description 58
- 108020004705 Codon Proteins 0.000 claims description 44
- 102000004316 Oxidoreductases Human genes 0.000 claims description 43
- 230000014509 gene expression Effects 0.000 claims description 43
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 39
- 238000000034 method Methods 0.000 claims description 33
- -1 methylated onine Substances 0.000 claims description 31
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 30
- 241001135746 Desulfobacula Species 0.000 claims description 29
- 150000003904 phospholipids Chemical class 0.000 claims description 27
- 241000480843 Thiohalospira halophila Species 0.000 claims description 25
- 241000206589 Marinobacter Species 0.000 claims description 23
- 239000000758 substrate Substances 0.000 claims description 23
- DCXXMTOCNZCJGO-UHFFFAOYSA-N tristearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(OC(=O)CCCCCCCCCCCCCCCCC)COC(=O)CCCCCCCCCCCCCCCCC DCXXMTOCNZCJGO-UHFFFAOYSA-N 0.000 claims description 21
- 150000002148 esters Chemical class 0.000 claims description 17
- 150000001408 amides Chemical class 0.000 claims description 15
- 241000195493 Cryptophyta Species 0.000 claims description 14
- 241000196324 Embryophyta Species 0.000 claims description 14
- 241000235015 Yarrowia lipolytica Species 0.000 claims description 13
- 150000007970 thio esters Chemical class 0.000 claims description 13
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 12
- 238000006467 substitution reaction Methods 0.000 claims description 12
- 125000001931 aliphatic group Chemical group 0.000 claims description 10
- 150000007942 carboxylates Chemical class 0.000 claims description 10
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 10
- 210000005253 yeast cell Anatomy 0.000 claims description 9
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 claims description 8
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 7
- 241000223252 Rhodotorula Species 0.000 claims description 7
- 230000001580 bacterial effect Effects 0.000 claims description 7
- 108020001507 fusion proteins Proteins 0.000 claims description 7
- 102000037865 fusion proteins Human genes 0.000 claims description 7
- 229930182817 methionine Natural products 0.000 claims description 7
- 241000235648 Pichia Species 0.000 claims description 6
- 241000235555 Cunninghamella Species 0.000 claims description 5
- 241000235070 Saccharomyces Species 0.000 claims description 5
- 241000235013 Yarrowia Species 0.000 claims description 5
- 125000005647 linker group Chemical group 0.000 claims description 5
- 241001527609 Cryptococcus Species 0.000 claims description 4
- 241000178290 Geotrichum fermentans Species 0.000 claims description 4
- 241000221479 Leucosporidium Species 0.000 claims description 4
- 241001506047 Tremella Species 0.000 claims description 4
- 241001276012 Wickerhamomyces ciferrii Species 0.000 claims description 4
- 241001306132 Aurantiochytrium Species 0.000 claims description 3
- 241000222120 Candida <Saccharomycetales> Species 0.000 claims description 3
- 241000221760 Claviceps Species 0.000 claims description 3
- 241000221751 Claviceps purpurea Species 0.000 claims description 3
- 241000235649 Kluyveromyces Species 0.000 claims description 3
- 241001149698 Lipomyces Species 0.000 claims description 3
- 241000235575 Mortierella Species 0.000 claims description 3
- 241001112159 Ogataea Species 0.000 claims description 3
- 241000196250 Prototheca Species 0.000 claims description 3
- 241000235527 Rhizopus Species 0.000 claims description 3
- 241000221523 Rhodotorula toruloides Species 0.000 claims description 3
- 241000235346 Schizosaccharomyces Species 0.000 claims description 3
- 241000223230 Trichosporon Species 0.000 claims description 3
- 241000228212 Aspergillus Species 0.000 claims description 2
- 241000228245 Aspergillus niger Species 0.000 claims description 2
- 241001465318 Aspergillus terreus Species 0.000 claims description 2
- 241000003595 Aurantiochytrium limacinum Species 0.000 claims description 2
- 241000580885 Cutaneotrichosporon curvatus Species 0.000 claims description 2
- 241000235646 Cyberlindnera jadinii Species 0.000 claims description 2
- 241001491951 Filobasidium wieringae Species 0.000 claims description 2
- 241000159512 Geotrichum Species 0.000 claims description 2
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 claims description 2
- 241001138401 Kluyveromyces lactis Species 0.000 claims description 2
- 241001302784 Kodamaea Species 0.000 claims description 2
- 241001480034 Kodamaea ohmeri Species 0.000 claims description 2
- 241000235058 Komagataella pastoris Species 0.000 claims description 2
- 241000235048 Meyerozyma guilliermondii Species 0.000 claims description 2
- 241001443590 Naganishia albida Species 0.000 claims description 2
- 241000320412 Ogataea angusta Species 0.000 claims description 2
- 241001099341 Ogataea polymorpha Species 0.000 claims description 2
- 108700026244 Open Reading Frames Proteins 0.000 claims description 2
- 241000196248 Prototheca zopfii Species 0.000 claims description 2
- 244000184734 Pyrus japonica Species 0.000 claims description 2
- 240000005384 Rhizopus oryzae Species 0.000 claims description 2
- 235000013752 Rhizopus oryzae Nutrition 0.000 claims description 2
- 241000007101 Rhodotorula babjevae Species 0.000 claims description 2
- 244000253911 Saccharomyces fragilis Species 0.000 claims description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 claims description 2
- 241000370151 Wickerhamomyces Species 0.000 claims description 2
- 230000002538 fungal effect Effects 0.000 claims description 2
- 229940031154 kluyveromyces marxianus Drugs 0.000 claims description 2
- 241001531157 Arula Species 0.000 claims 2
- 150000001735 carboxylic acids Chemical class 0.000 claims 2
- 239000003446 ligand Substances 0.000 claims 2
- 241000907999 Mortierella alpina Species 0.000 claims 1
- 241000123447 Solicoccozyma terreus Species 0.000 claims 1
- 241001053370 Vanrija albida Species 0.000 claims 1
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 28
- 108010056856 methyl coenzyme M methylreductase Proteins 0.000 abstract description 8
- 230000001590 oxidative effect Effects 0.000 abstract description 7
- 230000002349 favourable effect Effects 0.000 abstract description 4
- 239000012530 fluid Substances 0.000 abstract description 4
- 239000000314 lubricant Substances 0.000 abstract description 4
- 108091005461 Nucleic proteins Proteins 0.000 abstract description 2
- 150000001413 amino acids Chemical group 0.000 description 52
- 101150052753 tmpA gene Proteins 0.000 description 42
- 125000003729 nucleotide group Chemical group 0.000 description 39
- 239000013598 vector Substances 0.000 description 37
- 239000002773 nucleotide Substances 0.000 description 36
- 238000013518 transcription Methods 0.000 description 29
- 230000035897 transcription Effects 0.000 description 29
- 101100207304 Pseudomonas stutzeri (strain A1501) tpm gene Proteins 0.000 description 28
- 239000013612 plasmid Substances 0.000 description 28
- 241000894007 species Species 0.000 description 25
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 23
- 229940088598 enzyme Drugs 0.000 description 21
- 239000003921 oil Substances 0.000 description 21
- 235000019198 oils Nutrition 0.000 description 21
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid group Chemical group C(CCCCCCC\C=C/CCCCCCCC)(=O)O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 21
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 20
- 239000005516 coenzyme A Substances 0.000 description 20
- 229940093530 coenzyme a Drugs 0.000 description 20
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 20
- 230000000694 effects Effects 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 18
- 241000588724 Escherichia coli Species 0.000 description 18
- 241000205085 Desulfobacter Species 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 16
- WLVDYCRJAOTRPO-UHFFFAOYSA-N 10-methylideneoctadecanoic acid Chemical compound CCCCCCCCC(=C)CCCCCCCCC(O)=O WLVDYCRJAOTRPO-UHFFFAOYSA-N 0.000 description 15
- 108091026890 Coding region Proteins 0.000 description 15
- 241000205111 Desulfobacter postgatei Species 0.000 description 15
- 239000000047 product Substances 0.000 description 14
- 230000009466 transformation Effects 0.000 description 13
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 12
- 241000205120 Desulfobacter curvatus Species 0.000 description 12
- 241001135747 Desulfobacula toluolica Species 0.000 description 12
- 108010001348 Diacylglycerol O-acyltransferase Proteins 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 150000001982 diacylglycerols Chemical class 0.000 description 12
- 238000002744 homologous recombination Methods 0.000 description 12
- 230000006801 homologous recombination Effects 0.000 description 12
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 11
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 11
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 11
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 11
- 239000005642 Oleic acid Substances 0.000 description 11
- 235000011187 glycerol Nutrition 0.000 description 11
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 11
- 102000002148 Diacylglycerol O-acyltransferase Human genes 0.000 description 10
- 241000206597 Marinobacter hydrocarbonoclasticus Species 0.000 description 10
- 210000000349 chromosome Anatomy 0.000 description 10
- 229940049964 oleate Drugs 0.000 description 10
- 108091033319 polynucleotide Proteins 0.000 description 10
- 102000040430 polynucleotide Human genes 0.000 description 10
- 239000002157 polynucleotide Substances 0.000 description 10
- 241000118305 Halofilum ochraceum Species 0.000 description 9
- 238000009825 accumulation Methods 0.000 description 9
- 239000002253 acid Substances 0.000 description 9
- 238000004113 cell culture Methods 0.000 description 9
- 244000005700 microbiome Species 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- 230000009261 transgenic effect Effects 0.000 description 9
- ITFOCFQAVPXNEV-UHFFFAOYSA-N 10Me16:0 fatty acid Natural products CCCCCCC(C)CCCCCCCCC(O)=O ITFOCFQAVPXNEV-UHFFFAOYSA-N 0.000 description 8
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 8
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- 108700019146 Transgenes Proteins 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 102100036869 Diacylglycerol O-acyltransferase 1 Human genes 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 150000003626 triacylglycerols Chemical class 0.000 description 6
- 241000206602 Eukaryota Species 0.000 description 5
- 241000233866 Fungi Species 0.000 description 5
- 241001551741 Thiohalospira Species 0.000 description 5
- 108020004566 Transfer RNA Proteins 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 238000006722 reduction reaction Methods 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- YKZYYJQOSPFUBU-UHFFFAOYSA-N CC(CCCCCCCCC(=O)O)CC=CCCCCC Chemical compound CC(CCCCCCCCC(=O)O)CC=CCCCCC YKZYYJQOSPFUBU-UHFFFAOYSA-N 0.000 description 4
- 102100030497 Cytochrome c Human genes 0.000 description 4
- 108010075031 Cytochromes c Proteins 0.000 description 4
- 101710088194 Dehydrogenase Proteins 0.000 description 4
- 108010057366 Flavodoxin Proteins 0.000 description 4
- 241000655604 Halofilum <alga> Species 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- ACFIXJIJDZMPPO-NNYOXOHSSA-N NADPH Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 ACFIXJIJDZMPPO-NNYOXOHSSA-N 0.000 description 4
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 4
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 4
- 125000002252 acyl group Chemical group 0.000 description 4
- 229960001570 ademetionine Drugs 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 239000003638 chemical reducing agent Substances 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108090000515 geranylgeranyl reductase Proteins 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 229940073769 methyl oleate Drugs 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- SECPZKHBENQXJG-FPLPWBNLSA-N palmitoleic acid Chemical compound CCCCCC\C=C/CCCCCCCC(O)=O SECPZKHBENQXJG-FPLPWBNLSA-N 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 108060007223 rubredoxin Proteins 0.000 description 4
- IQEHJWZJYAYAGK-RAXLEYEMSA-N (Z)-12-methylideneoctadec-9-enoic acid Chemical compound C=C(C\C=C/CCCCCCCC(=O)O)CCCCCC IQEHJWZJYAYAGK-RAXLEYEMSA-N 0.000 description 3
- LEYGUFPTYBALGM-NTMALXAHSA-N (Z)-13-methylideneoctadec-9-enoic acid Chemical compound C=C(CC\C=C/CCCCCCCC(=O)O)CCCCC LEYGUFPTYBALGM-NTMALXAHSA-N 0.000 description 3
- LFYUEOJLBULVHX-NTMALXAHSA-N (Z)-13-methyloctadec-9-enoic acid Chemical compound CC(CC\C=C/CCCCCCCC(=O)O)CCCCC LFYUEOJLBULVHX-NTMALXAHSA-N 0.000 description 3
- 101150084750 1 gene Proteins 0.000 description 3
- WNWUOCXVZAXSOT-UHFFFAOYSA-N 10-methylidenehexadecanoic acid Chemical compound CCCCCCC(=C)CCCCCCCCC(O)=O WNWUOCXVZAXSOT-UHFFFAOYSA-N 0.000 description 3
- 101150028074 2 gene Proteins 0.000 description 3
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 3
- 108050004099 Diacylglycerol O-acyltransferase 1 Proteins 0.000 description 3
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 3
- 101000927974 Homo sapiens Diacylglycerol O-acyltransferase 1 Proteins 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 239000008896 Opium Substances 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 239000008367 deionised water Substances 0.000 description 3
- 229910021641 deionized water Inorganic materials 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 235000021588 free fatty acids Nutrition 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 238000010363 gene targeting Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 150000002313 glycerolipids Chemical class 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- 229960001027 opium Drugs 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000005809 transesterification reaction Methods 0.000 description 3
- TZIRPWVOKZVXDH-RAXLEYEMSA-N (z)-12-methyloctadec-9-enoic acid Chemical compound CCCCCCC(C)C\C=C/CCCCCCCC(O)=O TZIRPWVOKZVXDH-RAXLEYEMSA-N 0.000 description 2
- JNXFRTYDFOUKBJ-UHFFFAOYSA-N 10-methylidenehexadec-2-enoic acid Chemical compound CCCCCCC(=C)CCCCCCC=CC(O)=O JNXFRTYDFOUKBJ-UHFFFAOYSA-N 0.000 description 2
- SSIGXICJSBTUQP-UHFFFAOYSA-N 10-methylideneoctadecan-1-amine Chemical compound CCCCCCCCC(=C)CCCCCCCCCN SSIGXICJSBTUQP-UHFFFAOYSA-N 0.000 description 2
- PVQYPMOOHOAHAC-UHFFFAOYSA-N 10-methyloctadecan-1-amine Chemical compound CCCCCCCCC(C)CCCCCCCCCN PVQYPMOOHOAHAC-UHFFFAOYSA-N 0.000 description 2
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 2
- 102100024088 40S ribosomal protein S7 Human genes 0.000 description 2
- 108010011619 6-Phytase Proteins 0.000 description 2
- 102000005416 ATP-Binding Cassette Transporters Human genes 0.000 description 2
- 108010006533 ATP-Binding Cassette Transporters Proteins 0.000 description 2
- 102000009836 Aconitate hydratase Human genes 0.000 description 2
- 108010009924 Aconitate hydratase Proteins 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102000004539 Acyl-CoA Oxidase Human genes 0.000 description 2
- 108020001558 Acyl-CoA oxidase Proteins 0.000 description 2
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 102000034263 Amino acid transporters Human genes 0.000 description 2
- 108050005273 Amino acid transporters Proteins 0.000 description 2
- 241001523626 Arxula Species 0.000 description 2
- 108010029692 Bisphosphoglycerate mutase Proteins 0.000 description 2
- 241001474374 Blennius Species 0.000 description 2
- BWENWWBXMOEPTB-UHFFFAOYSA-N C=C(CCCCCCCCC(=O)O)CC=CCCCCC Chemical compound C=C(CCCCCCCCC(=O)O)CC=CCCCCC BWENWWBXMOEPTB-UHFFFAOYSA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 102000034534 Cotransporters Human genes 0.000 description 2
- 108020003264 Cotransporters Proteins 0.000 description 2
- 241000201446 Desulfotignum balticum Species 0.000 description 2
- 101150099000 EXPA1 gene Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 102100029095 Exportin-1 Human genes 0.000 description 2
- 108010074122 Ferredoxins Proteins 0.000 description 2
- 102000001390 Fructose-Bisphosphate Aldolase Human genes 0.000 description 2
- 108010068561 Fructose-Bisphosphate Aldolase Proteins 0.000 description 2
- 102000013446 GTP Phosphohydrolases Human genes 0.000 description 2
- 108091006109 GTPases Proteins 0.000 description 2
- 101710091951 Glycerol-3-phosphate acyltransferase Proteins 0.000 description 2
- 102000000587 Glycerolphosphate Dehydrogenase Human genes 0.000 description 2
- 108010041921 Glycerolphosphate Dehydrogenase Proteins 0.000 description 2
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 2
- 102000005548 Hexokinase Human genes 0.000 description 2
- 108700040460 Hexokinases Proteins 0.000 description 2
- 108020003285 Isocitrate lyase Proteins 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 102000014842 Multidrug resistance proteins Human genes 0.000 description 2
- 108050005144 Multidrug resistance proteins Proteins 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 102000011025 Phosphoglycerate Mutase Human genes 0.000 description 2
- 108010038555 Phosphoglycerate dehydrogenase Proteins 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 241000192142 Proteobacteria Species 0.000 description 2
- 108010011939 Pyruvate Decarboxylase Proteins 0.000 description 2
- 102000013009 Pyruvate Kinase Human genes 0.000 description 2
- 108020005115 Pyruvate Kinase Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 101100119348 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) EXP1 gene Proteins 0.000 description 2
- 102000012479 Serine Proteases Human genes 0.000 description 2
- 108010022999 Serine Proteases Proteins 0.000 description 2
- 101100269618 Streptococcus pneumoniae serotype 4 (strain ATCC BAA-334 / TIGR4) aliA gene Proteins 0.000 description 2
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 2
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 102000004139 alpha-Amylases Human genes 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- 229940024171 alpha-amylase Drugs 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000032050 esterification Effects 0.000 description 2
- 238000005886 esterification reaction Methods 0.000 description 2
- 108700002148 exportin 1 Proteins 0.000 description 2
- 235000019387 fatty acid methyl ester Nutrition 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-M hexadecanoate Chemical compound CCCCCCCCCCCCCCCC([O-])=O IPCSVZSSVZVIGE-UHFFFAOYSA-M 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 150000002402 hexoses Chemical class 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 150000002430 hydrocarbons Chemical class 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229960000367 inositol Drugs 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 2
- 229940085127 phytase Drugs 0.000 description 2
- 239000004331 potassium propionate Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000010349 pulsation Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108010033405 ribosomal protein S7 Proteins 0.000 description 2
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 2
- 239000004299 sodium benzoate Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 239000004408 titanium dioxide Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241001670770 uncultured gamma proteobacterium Species 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- MUZYOAHCGSIXJH-UHFFFAOYSA-N (9R,10S)-9,10-methanohexadecanoic acid Natural products CCCCCCC1CC1CCCCCCCC(O)=O MUZYOAHCGSIXJH-UHFFFAOYSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- PORPENFLTBBHSG-MGBGTMOVSA-N 1,2-dihexadecanoyl-sn-glycerol-3-phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(O)=O)OC(=O)CCCCCCCCCCCCCCC PORPENFLTBBHSG-MGBGTMOVSA-N 0.000 description 1
- TZCPCKNHXULUIY-RGULYWFUSA-N 1,2-distearoyl-sn-glycero-3-phosphoserine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(=O)OC[C@H](N)C(O)=O)OC(=O)CCCCCCCCCCCCCCCCC TZCPCKNHXULUIY-RGULYWFUSA-N 0.000 description 1
- CNWINRVXAYPOMW-FCNJXWMTSA-N 1-stearoyl-2-arachidonoyl-sn-glycero-3-phospho-1D-myo-inositol 4,5-biphosphate Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)O[C@H](COC(=O)CCCCCCCCCCCCCCCCC)COP(O)(=O)O[C@@H]1[C@H](O)[C@H](O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H]1O CNWINRVXAYPOMW-FCNJXWMTSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000726119 Acidovorax Species 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 102000057234 Acyl transferases Human genes 0.000 description 1
- 108700016155 Acyl transferases Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- KYLIZBIRMBGUOP-UHFFFAOYSA-N Anetholtrithion Chemical compound C1=CC(OC)=CC=C1C1=CC(=S)SS1 KYLIZBIRMBGUOP-UHFFFAOYSA-N 0.000 description 1
- 101100170396 Arabidopsis thaliana DGAT3 gene Proteins 0.000 description 1
- 241000186063 Arthrobacter Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 101100208382 Danio rerio tmsb gene Proteins 0.000 description 1
- 241000201447 Desulfotignum Species 0.000 description 1
- 102100035762 Diacylglycerol O-acyltransferase 2 Human genes 0.000 description 1
- YPZRHBJKEMOYQH-UYBVJOGSSA-L FADH2(2-) Chemical compound C1=NC2=C(N)N=CN=C2N1[C@@H]([C@H](O)[C@@H]1O)O[C@@H]1COP([O-])(=O)OP([O-])(=O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C(NC(=O)NC2=O)=C2NC2=C1C=C(C)C(C)=C2 YPZRHBJKEMOYQH-UYBVJOGSSA-L 0.000 description 1
- YTNIXZGTHTVJBW-SCRDCRAPSA-N FMNH2 Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2NC2=C1NC(=O)NC2=O YTNIXZGTHTVJBW-SCRDCRAPSA-N 0.000 description 1
- VWWQXMAJTJZDQX-UHFFFAOYSA-N Flavine adenine dinucleotide Natural products C1=NC2=C(N)N=CN=C2N1C(C(O)C1O)OC1COP(O)(=O)OP(O)(=O)OCC(O)C(O)C(O)CN1C2=NC(=O)NC(=O)C2=NC2=C1C=C(C)C(C)=C2 VWWQXMAJTJZDQX-UHFFFAOYSA-N 0.000 description 1
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 1
- ZWZWYGMENQVNFU-UHFFFAOYSA-N Glycerophosphorylserin Natural products OC(=O)C(N)COP(O)(=O)OCC(O)CO ZWZWYGMENQVNFU-UHFFFAOYSA-N 0.000 description 1
- 102100027377 HBS1-like protein Human genes 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000930020 Homo sapiens Diacylglycerol O-acyltransferase 2 Proteins 0.000 description 1
- 101001009070 Homo sapiens HBS1-like protein Proteins 0.000 description 1
- 101000637726 Homo sapiens Toll/interleukin-1 receptor domain-containing adapter protein Proteins 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- NHTMVDHEPJAVLT-UHFFFAOYSA-N Isooctane Chemical compound CC(C)CC(C)(C)C NHTMVDHEPJAVLT-UHFFFAOYSA-N 0.000 description 1
- FFFHZYDWPBMWHY-VKHMYHEASA-N L-homocysteine Chemical compound OC(=O)[C@@H](N)CCS FFFHZYDWPBMWHY-VKHMYHEASA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000187481 Mycobacterium phlei Species 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- UBXIJOJXUFYNRG-RJKBCLGNSA-N PIP[3'](17:0/20:4(5Z,8Z,11Z,14Z)) Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)O[C@H](COC(=O)CCCCCCCCCCCCCCCC)COP(O)(=O)O[C@H]1C(O)C(O)C(O)[C@@H](OP(O)(O)=O)C1O UBXIJOJXUFYNRG-RJKBCLGNSA-N 0.000 description 1
- WSLBJQQQZZTFBA-MLUQOLBVSA-N PIP[4'](17:0/20:4(5Z,8Z,11Z,14Z)) Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)O[C@H](COC(=O)CCCCCCCCCCCCCCCC)COP(O)(=O)OC1C(O)C(O)C(OP(O)(O)=O)[C@@H](O)C1O WSLBJQQQZZTFBA-MLUQOLBVSA-N 0.000 description 1
- UBXIJOJXUFYNRG-MPJQEMCDSA-N PIP[5'](17:0/20:4(5Z,8Z,11Z,14Z)) Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)O[C@H](COC(=O)CCCCCCCCCCCCCCCC)COP(O)(=O)O[C@@H]1C(O)[C@H](O)C(O)C(OP(O)(O)=O)C1O UBXIJOJXUFYNRG-MPJQEMCDSA-N 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 235000021319 Palmitoleic acid Nutrition 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000221301 Puccinia graminis Species 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000007102 Rhodotorula paludigena Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- ZJUKTBDSGOFHSH-WFMPWKQPSA-N S-Adenosylhomocysteine Chemical compound O[C@@H]1[C@H](O)[C@@H](CSCC[C@H](N)C(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZJUKTBDSGOFHSH-WFMPWKQPSA-N 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 235000019486 Sunflower oil Nutrition 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 241000565016 Thiohalorhabdus Species 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 102100033598 Triosephosphate isomerase Human genes 0.000 description 1
- 101710194411 Triosephosphate isomerase 1 Proteins 0.000 description 1
- 101150071882 US17 gene Proteins 0.000 description 1
- 235000021322 Vaccenic acid Nutrition 0.000 description 1
- UWHZIFQPPBDJPM-FPLPWBNLSA-M Vaccenic acid Natural products CCCCCC\C=C/CCCCCCCCCC([O-])=O UWHZIFQPPBDJPM-FPLPWBNLSA-M 0.000 description 1
- MMWCIQZXVOZEGG-HOZKJCLWSA-N [(1S,2R,3S,4S,5R,6S)-2,3,5-trihydroxy-4,6-diphosphonooxycyclohexyl] dihydrogen phosphate Chemical compound O[C@H]1[C@@H](O)[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](O)[C@H]1OP(O)(O)=O MMWCIQZXVOZEGG-HOZKJCLWSA-N 0.000 description 1
- INAPMGSXUVUWAF-GCVPSNMTSA-N [(2r,3s,5r,6r)-2,3,4,5,6-pentahydroxycyclohexyl] dihydrogen phosphate Chemical compound OC1[C@H](O)[C@@H](O)C(OP(O)(O)=O)[C@H](O)[C@@H]1O INAPMGSXUVUWAF-GCVPSNMTSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229930002875 chlorophyll Natural products 0.000 description 1
- 235000019804 chlorophyll Nutrition 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- SECPZKHBENQXJG-UHFFFAOYSA-N cis-palmitoleic acid Natural products CCCCCCC=CCCCCCCCC(O)=O SECPZKHBENQXJG-UHFFFAOYSA-N 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- 238000007872 degassing Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 229940079919 digestives enzyme preparation Drugs 0.000 description 1
- JVSWJIKNEAIKJW-UHFFFAOYSA-N dimethyl-hexane Natural products CCCCCC(C)C JVSWJIKNEAIKJW-UHFFFAOYSA-N 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000012248 genetic selection Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 125000005456 glyceride group Chemical group 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 101150030475 impact gene Proteins 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 229940049918 linoleate Drugs 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000003641 microbiacidal effect Effects 0.000 description 1
- 229940124561 microbicide Drugs 0.000 description 1
- 238000013048 microbiological method Methods 0.000 description 1
- 150000002759 monoacylglycerols Chemical class 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000010525 oxidative degradation reaction Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 125000001095 phosphatidyl group Chemical group 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 101150067195 pmpB gene Proteins 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000027756 respiratory electron transport chain Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 239000002600 sunflower oil Substances 0.000 description 1
- TUNFSRHWOTWDNC-HKGQFRNVSA-N tetradecanoic acid Chemical compound CCCCCCCCCCCCC[14C](O)=O TUNFSRHWOTWDNC-HKGQFRNVSA-N 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 239000011732 tocopherol Substances 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 229930003799 tocopherol Natural products 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- UWHZIFQPPBDJPM-BQYQJAHWSA-N trans-vaccenic acid Chemical compound CCCCCC\C=C\CCCCCCCCCC(O)=O UWHZIFQPPBDJPM-BQYQJAHWSA-N 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 1
- 235000021122 unsaturated fatty acids Nutrition 0.000 description 1
- 150000004670 unsaturated fatty acids Chemical class 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0069—Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
-
- C—CHEMISTRY; METALLURGY
- C11—ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
- C11B—PRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
- C11B1/00—Production of fats or fatty oils from raw materials
- C11B1/10—Production of fats or fatty oils from raw materials by extracting
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6409—Fatty acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6463—Glycerides obtained from glyceride producing microorganisms, e.g. single cell oil
Abstract
A presente invenção refere-se a células, ácidos nucleicos e proteínas que podem ser usados para produzir (metil)lipídios ramificados, tais como ácidos 10-metil esteárico, e as composições que incluem tais lipídios. As células descritas no presente documento compreendem genes de metil transferase e/ou redutase de bactérias da classe Gammaproteobacteria, que codificam as enzimas que têm capacidade de catalisar a produção de (metil)lipídios ramificados a partir de lipídios insaturados não ramificados. Os (metil)lipídios ramificados saturados produzidos ao usar as modalidades da presente invenção têm uma fluidez a baixa temperatura favorável e uma estabilidade oxidativa favorável, que são propriedades desejáveis para lubrificantes e fluidos de especialidades.
Description
Relatório Descritivo da Patente de Invenção para "PRODU- ÇÃO HETERÓLOGA DE ÁCIDO 10-METIL ESTEÁRICO POR CÉLU- LAS QUE EXPRESSAM METIL TRANSFERASE RECOMBINANTE".
[0001] O presente pedido de patente reivindica o benefício da prio- ridade ao Pedido de Patente Provisório U.S. no. de série 62/561.136, depositado em 20 de setembro de 2017, incorporado ao presente do- cumento a título de referência em sua totalidade.
[0002] Este pedido de patente está é relacionado aos Pedidos de Patente U.S. no. de série 15/710.734 e PCT/US17/52491, ambos de- positados em 20 de setembro de 2017.
ANTECEDENTES DA INVENÇÃO A. Campo da Invenção
[0003] A invenção refere-se de maneira geral à produção de (me- til)lipídios ramificados por células que expressam metil transferases e/ou redutases recombinantes derivadas de Gammaproteobacteria. B. Descrição da Técnica Relacionada
[0004] Os ácidos graxos derivados de óleos de plantas agrícolas e animais encontram uso como lubrificantes industriais, fluidos hidráuli- cos, graxas, e outros líquidos de especialidades além de materiais de partida oleoquímicos para processamento. As propriedades físicas e químicas desses ácidos graxos resultam em grande parte de seus comprimentos da cadeia de carbono e número de ligações duplas in- saturadas. Os ácidos graxos são tipicamente 16:0 (dezesseis carbo- nos, nenhuma ligação dupla), 16:1 (dezesseis carbonos, 1 ligação du- pla), 18:0, 18:1, 18:2 ou 18:3. É importante observar que os ácidos graxos sem nenhuma ligação dupla (saturada) têm uma elevada esta- bilidade oxidativa, mas solidificam a baixas temperaturas. As ligações duplas melhoram a fluidez a baixas temperaturas, mas diminuem a estabilidade oxidativa. Essa alternativa acarreta desafios para o lubrifi- cante e as outras formulações de fluidos de especialidades, uma vez que o desempenho a longo prazo consistente (elevada estabilidade oxidativa) em uma faixa ampla de temperaturas operacionais é dese- jável. Os óleos de ácidos graxos altamente (oleicos) 18:1 conferem uma fluidez a baixas temperaturas com uma estabilidade oxidativa re- lativamente boa. Por conseguinte, vários produtos comerciais, tais co- mo o óleo de soja altamente oleico, o óleo de girassol altamente olei- co, e o óleo de alga altamente oleico, foram desenvolvidos com com- posições altamente oleicas. No entanto, o ácido oleico é um alceno, e sujeito à degradação oxidativa.
[0005] Uma alternativa superior é a adição de uma ramificação de metila totalmente saturada à cadeia de ácido graxo. Isto cria uma de- pressão similar da temperatura de fusão como uma ligação dupla, mas sem nenhuma diminuição na estabilidade oxidativa contra ácidos gra- xoOs lineares totalmente saturados. As ramificações de metila localiza- das perto do meio da cadeia de ácido graxo têm a maior depressão da temperatura de fusão. Vários processos químicos foram explorados para introduzir ramificações de metila; no entanto, o método industrial preferido resulta na colocação aleatória da ramificação de metila e cria uma quantidade substancial de subprodutos. Continua havendo uma necessidade quanto a processos eficientes e econômicos de produção de (metil)lipídios ramificados.
[0006] No presente documento são divulgadas células, ácidos nu- cleicos e proteínas que podem ser usados na produção de (me- til)lipídios ramificados, tais como o ácido 10-metil esteárico, e as com- posições que incluem tais lipídios. Os (metil)lipídios ramificados satu- rados produzidos ao usar as modalidades da presente invenção têm uma fluidez a baixa temperatura favorável e uma estabilidade oxidativa favorável, que são propriedades desejáveis para lubrificantes e fluidos de especialidades.
[0007] Vários aspectos referem-se a ácidos nucleicos que com- preendem um gene de tmpB recombinante que codifica uma proteína de metil transferase e/ou um gene de tmpA recombinante que codifica uma proteína de redutase. A proteína de metil transferase e/ou a pro- teína de redutase podem ser proteínas expressas pela espécie da classe Gammaproteobacteria (filo, Proteobacteria), e o gene de tmpB recombinante e/ou o gene de tmpA recombinante podem ser otimiza- dos no códon para a expressão em um filo diferente de bactérias ou em eucariotas (por exemplo, levedura, tal como Arxula adeninivorans (também conhecida como Blastobotrys adeninivorans ou Trichosporon adeninivorans), Saccharomyces cerevisiae ou Yarrowia lipolytica). O gene de tmpB recombinante ou o gene de tmpA recombinante podem ser operavelmente ligados a um promotor com capacidade de dirigir a expressão em um filo de bactérias que não Gammaproteobacteria ou em eucariotas (por exemplo, levedura). O ácido nucleico pode ser um plasmídeo ou um cromossoma.
[0008] Alguns aspectos referem-se a uma célula que compreende um ácido nucleico tal como descrito no presente documento. A célula pode compreender um (metil)lipídio ramificado, tal como o ácido 10- metil esteárico e/ou um lipídio substituído por exometileno, tal como o ácido 10-metileno esteárico. A célula pode ser uma célula eucariótica, tal como uma célula de alga, uma célula de levedura ou uma célula de planta.
[0009] Alguns aspectos referem-se a uma composição produzida mediante o cultivo de uma cultura de células que compreende células tal como descrito no presente documento. A composição de óleo pode compreender um (metil)lipídio ramificado, tal como o ácido 10-metil esteárico, e/ou um lipídio substituído por exometileno, tal como o ácido
10-metileno esteárico. Em algumas modalidades, a composição de óleo é produzida mediante o cultivo de uma cultura de célula e a recu- peração da composição de óleo da cultura de células, em que a com- posição de óleo compreende ácidos 10-metil graxos, e em que os áci- dos 10-metil graxos compreendem pelo menos cerca de 1% em peso do total de ácidos graxos na composição de óleo. Em algumas modali- dades, os ácidos 20-metil graxos compreendem pelo menos cerca de 15% em peso do total de ácidos graxos na composição de óleo.
[0010] Alguns aspectos referem-se a um método de produção de uma composição de óleo, em que o método compreende: o cultivo de uma cultura de células que compreende qualquer uma das células di- vulgadas no presente documento; e a recuperação da composição de óleo da cultura de células. Em algumas modalidades, o método tam- bém compreende a colocação da cultura de células em contato com um substrato que compreende um ácido graxo de 14 a 18 carbonos de comprimento com uma ligação dupla na posição A9, A10 ou A11. Em algumas modalidades, a recuperação da composição de óleo da cultu- ra de células compreende a recuperação dos lipídios que foram secre- tados pela célula. Em algumas modalidades, a produção da composi- ção de óleo compreende a realização de reações químicas ou então a realização de reações químicas nas quais substratos de ácido oleico e metionina são convertidos em ácido 10-metileno esteárico, em que as reações químicas são catalisadas por uma proteína de tmpB. Em al- gumas modalidades, a produção da composição de óleo compreende a realização de reações químicas ou a realização de reações químicas nas quais o ácido 10-metileno esteárico é reduzido em ácido 10-metil esteárico, em que as reações químicas são catalisadas pela proteína de tmpA. Em algumas modalidades, a redução é realizada ao usar NADPH, ferredoxina, flavodoxina, rubredoxina, citocromo c ou combi- nações destes como agentes redutores. Em qualquer um dos métodos divulgados no presente documento que envolvem reações de redução, pode ser usado qualquer um ou qualquer combinação, de NADPH, fer- redoxina, flavodoxina, rubredoxina e citocromo c.
[0011] Outros objetos, características e vantagens da presente in- venção tornar-se-ão aparentes a partir das figuras, descrição detalha- da, e exemplos a seguir. Deve ser compreendido, no entanto, que as figuras, a descrição detalhada e os exemplos, embora indiquem moda- lidades específicas da invenção, são fornecidos apenas a título de ilus- tração e não se prestam a qualquer limitação. Além disso, é contem- plado que mudanças e modificações dentro do caráter e do âmbito da invenção tornar-se-ão aparentes aos elementos versados na técnica a partir desta descrição detalhada.
[0012] A Figura 1 ilustra um possível mecanismo para a conversão de ácido oleico em ácido 10-metil esteárico. Um substrato de ácido oleico pode estar presente como uma cadeia de acila de um gliceroli- pídio ou um fosfolipídio. Um substrato de metionina, que doa o grupo metila, pode estar presente como S-adenosil metionina. Os substratos de ácido oleico e metionina podem ser convertidos em ácido 10- metileno esteárico (por exemplo, presente como uma cadeia de acila de um glicerolipídio ou um fosfolipídio) e homocisteína (por exemplo, presente como S-adenosil homocisteína). Esta reação pode ser catali- sada por uma proteína de tmpB tal como descrito no presente docu- mento, infra. O ácido 10-metileno esteárico (por exemplo, presente como uma cadeia de acila de um glicerolipídio ou um fosfolipídio) pode ser reduzido em ácido 10-metil esteárico. A redução pode ser catalisa- da por uma proteína de tmpA tal como descrito no presente documen- to, infra, por exemplo, sem limitação, ao usar NADPH como um agente redutor. Outros exemplos do agente redutor podem incluir, sem limita- ção, a ferredoxina, a flavodoxina, a rubredoxina, o citocromo c ou as combinações destes. A linguagem do relatório descritivo e das reivin- dicações, no entanto, não são limitadas a nenhum mecanismo de rea- ção particular.
[0013] A Figura 2 mostra a ocorrência de homólogos de sintase de fosfolipídio de acil ciclopropano graxo (cfa) e de ácido 10-metil palmíti- co (10Me16) em certas Gammaproteobacteria com genomas arranja- dos em sequência e perfis de lipídios observados.
[0014] As Figuras 3A-3B ilusttam mapas dos seguintes vetores, que codificam um óperon de tmp: pNC1071 (SEQ ID NO: 39), que in- clui um óperon de tmp de Desulfobacter postgatei; pnNC1072 (SEQ ID NO: 40), que inclui um óperon de tmp de Desulfobacula balticum, PNC1073 (SEQ ID NO: 41), que inclui um óperon de tmp de Desulfo- bacula toluolica; DpNC1074 (SEQ ID NO: 42), que inclui um óperon de tmp de Marinobacter hydrocarbonclasticus; e pnC1076 (SEQ ID NO: 43), que inclui um óperon de tmp de Thiohalospira halophila.
[0015] A Figura 4 é um gráfico que mostra a porcentagem dos áci- dos 10-metileno graxos em Saccharomyces cerevisae transformados com plasmídeos que expressam tmpB da espécie indicada: D. postga- tei (D.po.), D. balticum (D.ba.), D. toluolica (D.to.), M. hydrocarbonclas- ticus (M.hy.) e T. halophila (T.ha.) ou um controle de vetor vazio (-).
[0016] A Figura 5 é um gráfico que mostra a porcentagem dos áci- dos 10-metileno graxos em Yarrowiano lipolytica transformados com os plasmídeos que expressam tmpB da espécie indicada: D. postgatei (D.po.), D. balticum (D.ba.), D. toluolica (D.to.), M. hydrocarbonclasticus (M.hy.) e T. halophila (T.ha.) ou um controle de vetor vazio (-).
[0017] A Figura 6 mostra o perfil do ácido graxo de células Top10 de E. coli com os plasmídeos pNC1071, pNC1072, pNC1073, PNC1074, pNC1076 e pNC53 (vetor de controle vazio) cultivadas no meio LB. Os valores da porcentagem mostram a porcentagem em pe- so do ácido graxo indicado como uma porcentagem de todos os ácidos graxos. 14:0 = ácido mirístico, 16:0 = ácido palmítico, 16:159 = ácido palmitoleico, 16:0cyc = ácido 17A,cis-9,10-metileno hexadecanoico, 10-metileno 16:0 = ácido 10-metileno hexadecenoico, 18:1A511 = ácido vacênico, 18:0 = ácido esteárico, SD = desvio-padrão.
[0018] As Figuras 7A a 7D mostram um alinhamento de CLUSTAL OMEGA das sequências de proteínas de tmpB codificadas pelos ge- nes de tmpB de Desulfobacula balticum, Marinobacter hydrocarbon- clasticus, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum e Marinobacter aquaeolei, junto com a enzima de sin- tase de ácido ciclopropano graxo (Cfa) de Escherichia coli.
[0019] As Figuras 8A a 8D mostram as sequências de uma proteí- na de tmpA de alinhamento de CLUSTAL OMEGA codificadas pelos genes de tmpA de Desulfobacula balticum, Marinobacter hydrocarbon- clasticus, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum e Marinobacter aquaeolei, junto com a proteína de ge- ranilgeranil redutase de Archaeoglobus fulgidus AFO464.
DESCRIÇÃO DETALHADA DA INVENÇÃO A. Definições
[0020] Os artigos "um" e "uma" são usados no presente documen- to para se referir a um ou mais de um (isto é, a pelo menos um) do ob- jeto gramatical do artigo. A título de exemplo, "um elemento" significa um elemento ou mais de um elemento.
[0021] O termo "porção biologicamente ativa" refere-se a uma se- quência de aminoácido que é menor do que uma sequência de amino- ácidos de comprimento total, mas exibe pelo menos uma atividade da sequência de comprimento total. Por exemplo, uma porção biologica- mente ativa de uma metil transferase pode se referir a um ou mais domínios de tmpB que tem uma atividade biológica para converter o ácido oleico (por exemplo, um fosfolipídio que compreende um éster de oleato) e a metionina (por exemplo, a S-adenosil metionina) em ácido 10-metileno esteárico (por exemplo, um fosfolipídio que compre- ende um éster de estearato de 10-metileno). Uma porção biologica- mente ativa de uma redutase pode se referir a um ou mais domínios de tmpA que tem uma atividade biológica para converter o ácido 10- metileno esteárico (por exemplo, um fosfolipídio que compreende um éster de estearato de 10-metileno) e um agente redutor (por exemplo, ferrodoxina, flavodoxina, rubredoxina, citocromo c, NADH, NADPH, FAD, FADH2, FMNH>2) em ácido 10-metil esteárico (por exemplo, um fosfolipídio que compreende um éster de estearato de 10-metila). As porções biologicamente ativas de uma proteína incluem peptídeos ou os polipeptídios que compreendem sequências de aminoácidos sufici- entemente idênticas a ou derivadas da sequência de aminoácidos da proteína, por exemplo, a sequência de aminoácidos indicada nas SEQ ID NOs: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 ou 36, que incluem menos aminoácidos do que a proteína de comprimen- to total, e exibem pelo menos uma atividade da atividade, especial- mente a atividade de metil transferase ou redutase.
Uma porção biolo- gicamente ativa de uma proteína pode compreender, compreender pe- lo menos ou compreender no máximo, por exemplo, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192,
193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500 ou mais aminoácidos ou qualquer faixa aí derivável.
Tipicamente, as porções biologicamente ativas compreendem um domínio ou um moti- vo que tem uma atividade catalítica, tal como a atividade catalítica pa- ra produzir o ácido 10-metileno esteárico ou o ácido 10-metil esteárico.
Uma porção biologicamente ativa de uma proteína inclui as porções da proteína que têm a mesma atividade que o peptídeo de comprimento total e cada porção que tem mais atividade do que a base.
Por exem- plo, uma porção biologicamente ativa de uma enzima pode ter, ter pelo menos ou ter no máximo 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 10%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%, 100%, 100,1%, 100,2%, 100,3%, 100,4%, 100,5%, 100,6%, 100,7%, 100,8%, 100,9%, 101%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145%, 150%, 160%, 170%, 180%, 190%, 200%, 220%, 240%, 260%, 280%, 300%, 320%, 340%, 360%, 380%, 400% ou uma atividade mais ele- vada em relação à enzima de comprimento total (ou qualquer faixa aí derivável). Uma porção biologicamente ativa de uma proteína pode incluir as porções de uma proteína que não têm um domínio que vise a proteína a um compartimento celular.
[0022] Os termos "otimizado no códon" e "otimizado no códon para a célula" referem-se à codificação de sequências de nucleotídeos (por exemplo, genes) que foram alteradas para substituir pelo menos um códon que é relativamente raro em uma célula hospedeira desejada por um códon sinônimo que é relativamente predominante na célula hospedeira. A otimização de códon permite desse modo uma melhor utilização do tRNA de uma célula hospedeira ao combinando os có- dons de um gene recombinante com o tRNA da célula hospedeira. Por exemplo, o uso do códon da espécie Gammaproteobacteria (procario- tas) varia a partir do uso do códon de levedura (eucariotas). A eficiên- cia da tradução em uma célula hospedeira de levedura de um mRNA que codifica uma proteína de Gammaproteobacteria pode ser aumen- tada mediante a substituição dos códons do gene de Gammaprote- obacteria correspondente por códons que são mais predominantes na espécie de levedura particular. Um gene otimizado nos códons tem desse modo uma sequência de nucleotídeos que varia a partir de um gene natural.
[0023] O termo "promotor constitutivo" refere-se a um promotor que media a transcrição de um gene ligado operavelmente indepen- dente de um estímulo particular (por exemplo, independente da pre- sença de um reagente tal como isopropil B-D-1-tiogalactopiranoside).
[0024] O termo "DGAT1" refere-se a um gene que codifica uma proteína de diacil glicerol acil transferase do tipo 1, tal como um gene que codifica uma proteína DGA?2 de levedura.
[0025] O termo "DGAT?2" refere-se a um gene que codifica uma proteína de diacil glicerol acil transferase do tipo 2, tal como um gene que codifica uma proteína DGA1 de levedura.
[0026] "Diacil glicerídeo", "diacil glicerol" e "diglicerídeo" são éste- res que compreendem glicerol e dois ácidos graxos.
[0027] Os termos "diacil glicerol acil transferase" e "DGA" referem- se a qualquer proteína que catalisa a formação de triacil glicerídeos de diacil glicerol. As diacil glicerol acil transferases incluem as diacil glice- rol acil transferases do tipo 1 (DGA1), as diacil glicerol acil transfera- ses do tipo 2 (DGA2Z), e as diacil glicerol acil transferases do tipo 3 (DGA3) e todos os homólogos que catalisam a reação acima mencio- nada.
[0028] Os termos "diacil glicerol acil transferase, tipo 1" e "diacil glicerol acil transferases do tipo 1" referem-se a DGA?2 e aos ortólogos de DGA?2.
[0029] Os termos "diacil glicerol acil transferase, tipo 2" e o "diacil glicerol acil transferase do tipo 2" referem-se a DGA1 e aos ortólogos de DGA1.
[0030] O termo "domínio" refere-se a uma parte da sequência de aminoácidos de uma proteína que pode se desdobrar em uma estrutu- ra tridimensional estável independente da estrutura do restante da pro- teína.
[0031] O termo "fármaco" refere-se a qualquer molécula que inibe o crescimento ou a proliferação de células, propiciando desse modo uma vantagem seletiva às células que contêm um gene que confere resistência ao fármaco. Os fármacos incluem antibióticos, microbici- das, toxinas e pesticidas.
[0032] "Peso seco" e "peso de célula seca" referem-se ao peso determinado na ausência relativa da água. Por exemplo, a referência às células oleaginosas como compreendendo uma porcentagem espe- cífica de um componente particular pelo peso da célula seca significa que a porcentagem é calculada com base no peso da célula depois que substancialmente toda a água foi removida. O termo "% em peso seco", quando se refere a um ácido graxo específico (por exemplo, ácido oleico ou ácido 10-metil esteárico), inclui os ácidos graxos que estão presentes como carboxilatos, ésteres, tioésteres e amidas. Por exemplo, uma célula que compreende o ácido 10-metil esteárico como uma porcentagem de total de ácidos graxos pela % em peso de célula seca inclui o ácido 10-metil esteárico, o estearato de 10-metila, a por- ção estearato de 10-metila de um diacil glicerol que compreende um éster de estearato de 10-metila, a porção estearato de 10-metila de um triacil glicerol que compreende um éster de estearato de 10-metila, a porção estearato de 10-metila de um fosfolipídio que compreende um éster de estearato de 10-metila, e a porção de estearato de 10-metila de estearato de 10-metila CoA. O termo "% em peso seco", quando se refere a um tipo específico de ácido graxo (por exemplo, ácidos graxos C16, ácidos graxos C18), inclui os ácidos graxos que estão presentes como carboxilatos, ésteres, tioésteres e amidas tal como descritos acima (por exemplo, para o ácido 10-metil esteárico).
[0033] O termo "gene", tal como usado no presente documento, pode englobar as sequências genômicas que contêm éxons, em parti- cular as sequências de polinucleotídeos que codificam as sequências de polipeptídios envolvidas em uma atividade específica. O termo também engloba os ácidos nucleicos sintéticos que não derivaram da sequência genômica. Em determinadas modalidades, os genes não contêm íntrons, uma vez que eles são sintetizados com base na se- quência de DNA conhecida de cDNA e na sequência de proteínas. Em outras modalidades, os genes são o cDNA não nativo sintetizado em que os códons foram otimizados para a expressão em Y. lipolytica ou A. adeninivorans com base no uso de códons. O termo também pode incluir as moléculas de ácido nucleico que compreendem sequências de nucleotídeos a montante, a jusante e/ou de íntrons.
[0034] O termo "promotor induzível" refere-se a um promotor que media a transcrição de um gene operavelmente ligado em resposta a um estímulo particular.
[0035] O termo "integrado" refere-se a um ácido nucleico que é mantido em uma célula como uma inserção no genoma da célula, tal como a inserção em um cromossoma, incluindo inserções em um ge- noma de plastídio.
[0036] "Em ligação operável" e "ligado operavelmente" referem-se a uma ligação funcional entre duas sequências de ácidos nucleicos, tais como uma sequência de controle (tipicamente um promotor) e a sequência ligada (tipicamente uma sequência que codifica uma proteí- na, também chamada de uma sequência de codificação). Um promotor está em ligação operável com um gene ou é ligado operavelmente a um gene se ele pode mediar a transcrição do gene.
[0037] O termo "ácido nucleico" refere-se a uma forma polimérica de nucleotídeos de qualquer comprimento, desoxirribonucleotídeos ou ribonucleotídeos ou seus análogos. Os polinucleotídeos podem ter qualquer estrutura tridimensional, e podem executar qualquer função. O que segue são exemplos não limitadores de polinucleotídeos: regi- ões de codificação ou de não codificação de um gene ou fragmento de gene, loci (locus) definidos a partir da análise da ligação, éxons, ín- trons, RNA mensageiro (mMRNA), RNA de transferência, RNA ribosso-
mal, ribozimas, DNA, polinucleotídeos recombinantes, polinucleotídeos ramificados, plasmídeos, vetores, DNA isolado de qualquer sequência, RNA isolado de qualquer sequência, sondas de ácido nucleico, e inici- adores. Um polinucleotídeo pode compreender nucleotídeos modifica- dos, tais como nucleotídeos metilados e análogos de nucleotídeos. Se estiverem presentes, modificações na estrutura do nucleotídeo podem ser providas antes ou depois da montagem do polímero. Um polinu- cleotídeo também pode ser modificado, tal como através da conjuga- ção com um componente de etiquetagem. Em todas as sequências de ácidos nucleicos fornecidas no presente documento, os nucleotídeos U são intercambiáveis com os nucleotídeos T.
[0038] O termo "fosfolipídio" refere-se aos ésteres que compreen- dem glicerol, dois ácidos graxos e um fosfato. O fosfato pode ser cova- lentemente ligado ao carbono-3 do glicerol e não compreender ne- nhuma outra substituição, isto é, o fosfolipídio pode ser um ácido fosfa- tídico. O fosfato pode ser substituído por etanolamina (por exemplo, fosfatidil etanolamina), colina (por exemplo, fosfatidil colina), serina (por exemplo, fosfatidil serina), inositol (por exemplo, fosfatidil inositol), fosfato de inositol (por exemplo, fosfatidil inositol-3-fosfato, fosfatidil inositol-4-fosfato, fosfatidil inositol-5-fosfato), bisfosfato de inositol (por exemplo, fosfatidil inositol-4,5-bisfosfato) ou trifosfato de inositol (por exemplo, fosfatidil inositol-3,4,5-bisfosfato).
[0039] Tal como usado no presente documento, o termo "plasmí- deo" refere-se a uma molécula de DNA circular que é fisicamente se- parada do DNA genômico de um organismo. Os plasmídeos podem ser linearizados antes de serem introduzidos em uma célula hospedei- ra (indicado no presente documento como um plasmídeo linearizado). Os plasmídeos linearizados podem não ser autorreplicantes, mas po- dem se integrar em e ser replicados com o DNA genômico de um or- ganismo.
[0040] Um "promotor" é uma sequência de controle de ácido nu- cleico que dirige a transcrição de um ácido nucleico. Tal como usado no presente documento, um promotor inclui as sequências de ácidos nucleicos necessárias perto do sítio do início da transcrição.
[0041] O termo "proteína" refere-se às moléculas que compreen- dem uma sequência de aminoácidos, em que os aminoácidos são |i- gados por ligações peptídicas.
[0042] "Transformação" refere-se à transferência de um ácido nu- cleico a um organismo hospedeiro ou ao genoma de um organismo hospedeiro, o que resulta em uma herança geneticamente estável. Os organismos hospedeiros que contêm o ácido nucleico transformado são indicados como organismos "recombinantes", "transgênicos" ou "transformados". Desse modo, os ácidos nucleicos da presente inven- ção podem ser incorporados em construtos recombinantes, tipicamen- te construtos de DNA, com a capacidade de introdução em e replica- ção em uma célula hospedeira. Tal construto pode ser um vetor que inclui um sistema de replicação e sequências que têm a capacidade de transcrição e tradução de uma sequência de codificação de polipeptí- dios em uma dada célula hospedeira. Tipicamente, os vetores de ex- pressão incluem, por exemplo, um ou mais genes clonados sob o con- trole transcricional das sequências reguladoras 5' e 3' e um marcador selecionável. Tais vetores também podem conter uma região regulado- ra de promotor (por exemplo, uma região reguladora de controle da expressão indizível ou constitutiva regulada ambientalmente ou de modo desenvolvido ou específica de localização), um sítio de começo de iniciação da transcrição, um sítio de ligação de ribossomo, um sítio de terminação da transcrição, e/ou um sinal de poliadenilação.
[0043] O termo "célula transformada" refere-se a uma célula que é submetida a uma transformação. Desse modo, uma célula transforma- da compreende o genoma do pai e uma modificação genética herdá-
vel.
[0044] Os termos "triacilglicerídeo", "triacil glicerol", "triglicerídeo" e "TAG" são ésteres que compreendem glicerol e três ácidos graxos.
[0045] O termo "gene recombinante" refere-se a um gene que (1) está ligado operavelmente a um polinucleotídeo ao qual não é ligado na natureza ou (2) tem uma sequência de nucleotídeos diferente da sequência de nucleotídeos de ocorrência natural tal como, por exem- plo, de uma mutação que não ocorre naturalmente, uma sequência de códons otimizada ou um DNA que não contém íntrons de ocorrência natural que são encontrados no locus genômico do gene. O termo "re- combinante" pode ser usado em referência aos isolatos de DNA clo- nados, aos análogos de polinucleotídeos quimicamente sintetizados ou aos análogos de polinucleotídeos que são biologicamente sintetizados por sistemas heterólogos, bem como as proteínas e/ou mMRNAs codifi- cados por tais ácidos nucleicos. Desse modo, por exemplo, uma prote- ína sintetizada por um micro-organismo é recombinante se for sinteti- zada de um mMRNA que é sintetizado de um gene recombinante pre- sente na célula. Como outros exemplos, um gene pode ser um gene recombinante se for ligado operavelmente a um promotor diferente do promotor ao qual é ligado operavelmente na natureza ou se for conec- tado a um outro gene ou porção do mesmo e, junto com o outro gene ou parte do mesmo, codifica uma proteína que não é encontrada na natureza, tal como uma proteína de fusão ou uma proteína etiquetada com epítopo. B. Engenharia de Micróbios
1. Visão Global
[0046] Os genes e os produtos de genes podem ser introduzidos em células hospedeiras microbiais. As células hospedeiras apropria- das para a expressão dos genes e das moléculas de ácido nucleico são hospedeiros microbiais que podem ser encontrados amplamente dentro das famílias de fungos ou bactérias. Os exemplos de cepas hospedeiras apropriadas incluem, mas sem ficar a elas limitadas, es- pécies de fungos ou de leveduras, tais como Arxula, Aspegillus, Auran- tiochytrium, Candida, Claviceps, Cryptococcus, Cunninghamella, Han- senula, Kluyveromyces, Leucosporidiella, Lipomyces, Mortierella, Oga- taea, Pichia, Prototheca, Rhizopus, Rhodosporidium, Rhodotorula, Saccharomyces, Schizosaccharomyces, Tremella, trichosporon, Yar- rowia ou espécies de bactérias, tais como membros de proteobacteria e actinomicetes, bem como os gêneros Acinetobacter, Arthrobacter, Brevibacterium, Acidovorax, Bacillus, Clostridia, Streptomyces, Esche- richia, Salmonella, Pseudomonas e Cornyebacterium. Yarrowia li- polytica e Arxula adeninivorans são adequados para o uso como um micro-organismo hospedeiro porque podem acumular uma grande porcentagem de seu peso como triacil gliceróis.
[0047] Os sistemas de expressão microbial e os vetores de ex- pressão que contêm as sequências reguladoras que dirigem a expres- são de nível elevado de proteínas estranhas são conhecidos dos ele- mentos versados na técnica. Qualquer um destes pode ser usado para construir genes quiméricos para produzir qualquer um dos produtos de genes das presentes sequências. Esses genes quiméricos podem en- tão ser introduzidos em micro-organismos apropriados através de téc- nicas de transformação para prover a expressão de elevado nível das enzimas.
[0048] Por exemplo, um gene que codifica uma enzima pode ser clonado em um plasmídeo apropriado, e uma cepa parental de partida acima mencionada como um hospedeiro pode ser transformada com o plasmídeo resultante. Esta abordagem pode aumentar o número de cópias de cada um dos genes que codificam as enzimas e, como re- sultado, as atividades das enzimas podem ser aumentadas. O plasmí- deo não é limitado particularmente contanto que resulte em uma modi-
ficação genética desejada herdável à progênie do micro-organismo.
[0049] Os vetores ou os cassetes úteis para a transformação de células hospedeiras apropriadas são bem conhecidos. Tipicamente, o vetor ou cassete contém sequências que dirigem a transcrição e tra- dução do gene relevante, um marcador selecionável, e as sequências que permitem a replicação autônoma ou a integração cromossomal. Os vetores apropriados compreendem uma região 5' do gene que abriga controles da iniciação transcricional e uma região 3' do frag- mento de DNA que controla a terminação transcricional. Em determi- nadas modalidades, ambas as regiões de controle são derivadas dos genes homólogos à célula hospedeira transformada, embora deva ser compreendido que tais regiões de controle não precisam ser derivadas dos genes nativos à espécie específica escolhida como um hospedeiro de produção.
[0050] Os promotores, cDNAS e 3' UTRs, assim como outros ele- mentos dos vetores, podem ser gerados através de técnicas de clona- gem ao usar os fragmentos isolados de fontes nativas (vide, por exemplo, Green & Sambrook, Molecular Cloning: A Laboratory Manual, (4º ed., 2012); Patente U.S. no. 4.683.202 (incorporada a título de refe- rência)). Alternativamente, os elementos podem ser gerados sinteti- camente ao usar métodos conhecidos (vide, por exemplo, Gene 164:49-53 (1995)).
2. Recombinação Homóloga
[0051] A recombinação homóloga é a capacidade de sequências de DNA complementares de alinhar e trocar regiões de homologia. O DNA transgênico ("doador") que contém sequências homólogas às se- quências genômicas que estão sendo visadas ("molde") é introduzido no organismo e é então submetido à recombinação no genoma no sítio das sequências genômicas homólogas correspondentes.
[0052] A capacidade de realizar a recombinação homóloga em um organismo hospedeiro tem muitas implicações práticas para o que po- de ser realizado ao nível genético molecular e é útil na geração de um micróbio que possa produzir um produto desejado. Por natureza, a re- combinação homóloga é um evento de focalização de gene preciso e, desse modo, a maior parte das linhagens transgênicas geradas com a mesma sequência de foco será essencialmente idêntica em termos do fenótipo, necessitando da seleção de muito menos eventos de trans- formação. A recombinação homóloga também visa eventos de inser- ção de gene no cromossoma hospedeiro, o que resulta potencialmente em uma excelente estabilidade genética, até mesmo na ausência da seleção genética. Devido ao fato que loci cromossomas diferentes irão provavelmente causar impactos na expressão de gene, mesmo de promotores/UTRs exógenos, a recombinação homóloga pode ser um método de procurar loci em um ambiente de genoma não familiar e avaliar o impacto desses ambientes na expressão do gene.
[0053] Uma abordagem particularmente útil da engenharia genéti- ca ao usar a recombinação homóloga consiste em cooptar elementos reguladores hospedeiros específicos, tais como promotores/UTRs, pa- ra dirigir a expressão heteróloga do gene de uma maneira altamente específica.
[0054] Devido ao fato que a recombinação homóloga é um evento de focalização de gene preciso, ela pode ser usada para modificar com precisão qualquer(quaisquer) nucleotídeo(s) dentro um gene ou uma região de interesse, contanto que regiões de flanqueio suficientes tenham sido identificadas. Portanto, a recombinação homóloga pode ser usada como um meio para modificar as sequências reguladoras que causam impactos na expressão do gene de RNA e/ou proteínas. Ela também pode ser usada para modificar regiões de codificação de proteína em um esforço para modificar as atividades da enzima tais como a especificidade, as afinidades e Km do substrato, afetando des-
se modo uma mudança desejada no metabolismo da célula hospedei- ra. A recombinação homóloga provê meios poderosos para manipular o genoma hospedeiro, o que resulta em focalização de gene, conver- são de gene, deleção de gene, duplicação de gene, inversão de gene, e troca de elementos reguladores da expressão de gene tais como promotores, intensificadores e 3' UTRs.
[0055] A recombinação homóloga pode ser obtida ao usar constru- tos de focalização que contêm pedaços de sequências endógenas "pa- ra focalizar" o gene ou a região de interesse dentro do genoma endó- geno da célula hospedeiro. Tais sequências de focalização podem ser localizadas em 5' do gene ou da região de interesse, 3' do gene/da re- gião de interesse ou até mesmo flanquear o gene/a região de interes- se. Tais construtos de focalização podem ser transformados na célula hospedeira em um DNA de plasmídeo superengraçado com cadeia principal de vetor adicional, em um produto de PCR sem nenhuma ca- deia principal de vetor ou em uma molécula linearizada. Em alguns casos, pode ser vantajoso expor primeiramente as sequências homó- logas dentro do DNA transgênico (DNA do doador) ao cortar o DNA transgênico com uma enzima de restrição. Esta etapa pode aumentar a eficiência da recombinação e diminuir a ocorrência de eventos inde- sejados. Outros métodos de aumentar a eficiência da recombinação incluem o uso de PCR para gerar o DNA transgênico de transformação que contém as extremidades lineares homólogas às sequências ge- nômicas que estão sendo visadas.
3. Vetores e Componentes de Vetor
[0056] Os vetores para a transformação de micro-organismos de acordo com a presente invenção podem ser preparados por técnicas conhecidas familiares dos elementos versados na técnica em vista da descrição no presente documento. Um vetor contém tipicamente um ou mais genes, em que cada gene codifica para a expressão de um produto desejado (o produto do gene) e é ligado operavelmente a uma ou mais sequências de controle que regulam a expressão do gene ou focalizam o produto do gene em uma localização particular na célula recombinante. a. Sequências de Controle
[0057] As sequências de controle são ácidos nucleicos que regu- lam a expressão de uma sequência de codificação ou dirigem um pro- duto de gene a uma localização particular ou fora de uma célula. As sequências de controle que regulam a expressão incluem, por exem- plo, promotores que regulam a transcrição de uma sequência de codi- ficação e os terminais que terminam a transcrição de uma sequência de codificação. Uma outra sequência de controle é uma sequência 3' não transladada localizada na extremidade de uma sequência de codi- ficação que codifica um sinal de poliadenilação. As sequências de con- trole que dirigem produtos de gene a localizações particulares incluem aquelas que codificam os peptídeos de sinal, que dirigem a proteína à qual são unidos a uma localização particular dentro ou fora da célula.
[0058] Desse modo, um desenho de vetor exemplificador para a expressão de um gene em um micróbio contém uma sequência de co- dificação para um produto de gene desejado (por exemplo, um marca- dor selecionável ou uma enzima) em ligação operável com um promo- tor ativo em levedura. Alternativamente, se o vetor não contiver um promotor na ligação operável com a sequência de codificação de inte- resse, a sequência de codificação pode ser transformada em células de maneira tal que se torna ligada operavelmente a um promotor en- dógeno no ponto de integração do vetor. O promotor usado para ex- pressar um gene pode ser o promotor ligado naturalmente a esse gene ou um promotor diferente.
[0059] Um promotor pode ser geralmente caracterizado como constitutivo ou induzível. Os promotores constitutivos são geralmente ativos ou funcionam de modo a dirigir a expressão o tempo todo (ou em determinados momentos no ciclo de vida da célula) ao mesmo ní- vel. Os promotores induzíveis, por outro lado, são ativos (ou tornados inativos) ou são significativamente regulados para cima ou para baixo somente em resposta a um estímulo. Ambos os tipos de promotores encontram aplicação nos métodos da invenção. Os promotores induzí- veis úteis na invenção incluem aqueles que mediam a transcrição de um gene operavelmente ligado em resposta a um estímulo, tal como uma molécula pequena provida exogenamente, a temperatura (calor ou frio), falta de nitrogênio no meio de cultura, etc. Os promotores apropriados podem ativar a transcrição de um gene essencialmente silente ou regular para cima, por exemplo, substancialmente, a trans- crição de um gene operavelmente ligado que é transcrito a um nível baixo.
[0060] A inclusão da sequência de controle da região de termina- ção é opcional, e se for empregada, então a escolha é principalmente uma escolha conveniente, porque a região de terminação é relativa- mente permutável. A região de terminação pode ser nativa à região de iniciação transcricional (promotor), pode ser nativa à sequência do DNA de interesse ou pode ser obtenível de uma outra fonte (vide, por exemplo, Chen & Orozco, Nucleic Acid Research 16:8411 (1988)). b. Genes e Otimização de Códon
[0061] Tipicamente, um gene inclui um promotor, uma sequência de codificação e sequências de controle de terminação. Quando mon- tado pela tecnologia de DNA recombinante, um gene pode ser deno- minado um cassete de expressão e pode ser flanqueado por sítios de restrição para a inserção conveniente em um vetor que é usado para introduzir o gene recombinante em uma célula hospedeira. O cassete de expressão pode ser flanqueado por sequências de DNA do genoma ou outro alvo do ácido nucleico para facilitar a integração estável do cassete de expressão no genoma pela recombinação homóloga. Alter- nativamente, o vetor e seu cassete de expressão podem permanecer não integrados (por exemplo, um epissoma), em cujo caso o vetor in- clui tipicamente uma origem da replicação, que tem a capacidade de prover a replicação do DNA do vetor.
[0062] Um gene comum presente em um vetor é um gene que co- difica para uma proteína, cuja expressão permite que a célula recom- binante que contém a proteína seja diferenciada das células que não expressam a proteína. Tal gene, e seu produto de gene corresponden- te, são chamados de marcador selecionável ou marcador de seleção. Qualquer um de uma ampla variedade de marcadores selecionáveis pode ser empregado em um construto de transgene útil para transfor- mar os organismos da invenção.
[0063] Para a expressão ideal de uma proteína recombinante, é vantajoso o emprego de sequências de codificação que produzem o MRNA com os códons usados idealmente pela célula hospedeira a ser transformada. Desse modo, a expressão apropriada dos transgenes pode requerer que o uso do códon do transgene combine com a pola- rização de códon específica do organismo em que o transgene está sendo expresso. Os mecanismos precisos subjacentes a este efeito são muitos, mas incluem o equilíbrio apropriado de aglomerados de tRNA aminoacilados disponíveis com proteínas sintetizadas na célula, acoplados com uma tradução mais eficiente do RNA mensageiro transgênico (mMRNA) quando esta necessidade é satisfeita. Quando o uso do códon no transgene não é otimizado, os aglomerados de tRNA disponíveis não são suficientes para permitir a tradução eficiente do MRNA transgênico, o que resulta em parada ribossomal e terminação e na possível instabilidade do mMRNA transgênico. Os recursos para a otimização de códon de sequências de genes são descritos em Puigbo et al., Nucleic Acids Research 35:W126-31 (2007), e os princípios sub-
jacentes às estratégias de otimização de códon são descritos em An- gov, Biotechnology Journal (2011). Os bancos de dados públicos que fornecem estatísticas para o uso de códons por organismos diferentes estão disponíveis, inclusive em www.kKazusa.or.jp/codon/ e outros ban- cos de dados e recursos publicamente disponíveis.
4. Transformação
[0064] As células podem ser transformadas por qualquer técnica apropriada incluindo, por exemplo, biolística, eletroporação, transfor- mação com grânulos de vidro, e transformação de fios finos de carbo- neto de silício. Qualquer técnica conveniente para a introdução de um transgene em um micro-organismo pode ser empregada na presente invenção. A transformação pode ser obtida, por exemplo, pelo método de D. M. Morrison (Methods in Enzymology 68:326 (1979)), o método de aumento da permeabilidade de células recipientes para o DNA com cloreto de cálcio (Mandel & Higa, J. Molecular Biology, 53:159 (1970)) ou outros ainda.
[0065] Os exemplos da expressão de transgenes em levedura ole- aginosa (por exemplo, Yarrowia lipolytica) podem ser encontrados na literatura (Bordes et al., J. Microbiological Methods, 70:493 (2007); Chen et al., Applied Microbiology & Biotechnology 48:232 (1997)). Os exemplos da expressão de genes exógenos nas bactérias tais como E. coli são bem conhecidos (Green & Sambrook, Molecular Cloning: À Laboratory Manual, (4 ed., 2012)).
[0066] Os vetores para a transformação dos micro-organismos de acordo com a presente invenção podem ser preparados por técnicas conhecidas familiares dos elementos versados na técnica. Em uma modalidade, um desenho de vetor exemplificador para a expressão de um gene em um micro-organismo contém um gene que codifica uma enzima na ligação operável com um promotor ativo no micro- organismo. Alternativamente, se o vetor não contiver um promotor na ligação operável com o gene de interesse, o gene pode ser transfor- mado nas células de maneira tal que se torna ligado operavelmente a um promotor nativo no ponto de integração do vetor. O vetor também pode conter um segundo gene que codifica uma proteína. Opcional- mente, um ou ambos os genes são seguidos por uma sequência 3' não traduzida que contém um sinal de poliadenilação. Os cassetes de expressão que codificam os dois genes podem ser fisicamente ligados no vetor ou em vetores separados. A cotransformação de micróbios também pode ser usada, em que as moléculas distintas do vetor são usadas simultaneamente para transformar as células (Protist 155:381- 93 (2004)). As células transformadas podem ser opcionalmente seleci- onadas com base na capacidade de crescer na presença de antibiótico ou um outro marcador selecionável sob as condições em que as célu- las que não contêm o cassete de resistência não devem crescer.
C. Células, Ácidos Nucleicos, Composições e Métodos Exemplificadores
1. Células Transformadas
[0067] Em alguns aspectos, as modalidades da invenção incluem as células transformadas com um ou mais ácidos nucleicos que codifi- cam uma proteína de metil transferase e/ou redutase. Em algumas modalidades, a célula transformada é uma célula procariótica, tal como uma célula bacteriana. Em algumas modalidades, a célula é uma célu- la eucariótica, tal como uma célula de mamífero, uma célula de levedu- ra, uma célula de fungo filamentoso, uma célula protista, uma célula de alga, uma célula de ave, uma célula de planta ou uma célula de inseto. Em algumas modalidades, a célula é uma levedura. Os elementos ver- sados no estado da técnica irão reconhecer que muitas formas de fun- gos filamentosos produzem o crescimento do tipo da levedura, e a de- finição de levedura no presente documento engloba tais células. A cé- lula pode ser selecionada do grupo que consiste em algas, bactérias, mofos, fungos, plantas e leveduras. A célula pode ser uma levedura,
um fungo ou uma alga do tipo levedura. A célula pode ser selecionada de algas unicelulares traustoquitrídicas (Aurantiochytrium) e aclorofíli- cas (Prototheca).
[0068] A célula pode ser selecionada do grupo que consiste em Arxula, Aspegillus, Aurantiochytrium, Candida, Claviceps, Cryptococ- cus, Cunninghamella, Geotrichum, Hansenula, Kluyveromyces, Koda- maea, Leucosporidiella, Lipomyces, Mortierella, Ogataea, Pichia, Pro- totheca, Rhizopus, Rhodosporidium, Rhodotorula, Saccharomyces, Schizosaccharomyces, Tremella, Trichosporon, Wickerhamomyces e Yarrowia. É especificamente contemplado que um ou mais destes ti- pos de célula podem ser excluídos das modalidades da presente in- venção.
[0069] A célula pode ser selecionada do grupo que consiste em Arxula adeninivorans, Aspergillus niger, Aspergillus orzyae, Aspergillus terreus, Aurantiochytrium limacinum, Candida utilis, Claviceps purpu- rea, Cryptococcus albidus, Cryptococcus curvatus, Cryptococcus rami- rezgomezianus, Cryptococcus terreus, Cryptococcus wieringae, Cun- ninghamella echinulata, Cunninghamella japonica, Geotrichum fermen- tans, Hansenula polymorpha, Kluyveromyces lactis, Kluyveromyces marxianus, Kodamaea ohmeri, Leucosporidiella creatinivora, Li- pomyces lipofer, Lipomyces starkeyi, Lipomyces tetrasporus, Mortierel- la isabellina, Mortierella alpina, Ogataea polymorpha, Pichia ciferrii, Pichia guilliermondii, Pichia pastoris, Pichia stipites, Prototheca zopfii, Rhizopus arrhizus, Rhodosporidium babjevae, Rhodosporidium toruloi- des, Rhodosporidium paludigenum, Rhodotorula glutinis, Rhodotorula mucilaginosa, Saccharomyces cerevisiae, Schizosaccharomyces pom- be, Tremella enchepala, Trichosporon cutaneum, Trichosporon fer- mentans, Wickerhamomyces ciferrii e Yarrowia lipolytica. É especifi- camente contemplado que um ou mais destes tipos de célula podem ser excluídos das modalidades da presente invenção.
[0070] Em determinadas modalidades, a célula transformada com- preende cerca de, pelo menos cerca de ou no máximo cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 11%, 12%, 13%, T4%, 75%, 16%, 177%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85% ou mais lipídios tal como medido pela % em peso seco da célula ou qualquer faixa derivável na mesma. Em algumas modalidades, a célula trans- formada compreende ácidos graxos C18 a uma concentração de cerca de, pelo menos cerca de ou no máximo cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 172%, 13%, T4%, T5%, 16%, 77%, 178%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% ou 95% como uma porcentagem em peso do total de ácidos graxos C16 e C18 na célula ou qualquer faixa aí derivável.
[0071] Em algumas modalidades, a célula transformada compre- ende o ácido oleico a uma concentração de cerca de, pelo menos cer- ca de ou no máximo cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 13%, T4%, 15%, 16%, 17%, 18%, 19%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90% ou mais como uma porcentagem em peso do total de ácidos graxos C16 e C18 ou qualquer faixa aí derivável. Em algumas modalidades, a célula trans- formada compreende o ácido 10-metil esteárico a uma concentração de cerca de, pelo menos cerca de ou no máximo cerca de 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,
64%, 65%, 66%, 67%, 68%, 69%, 70%, 11%, 172%, 13%, T4%, 15%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90% ou mais como uma porcentagem em peso do total de ácidos graxos na célula ou qualquer faixa aí derivável.
[0072] Uma célula pode ser modificada para aumentar o seu teor de oleato, que serve como um substrato para a síntese do estearato de 10-metila. As modificações genéticas que aumentam o teor de olea- to são conhecidas (vide, por exemplo, a Publicação de Pedido de Pa- tente PCT no. WO16/094520, publicada em 16 de junho de 2016, in- corporada no presente documento a título de referência em sua totali- dade). Por exemplo, uma célula pode compreender um knockdown ou um knockout de desaturase A12, que favorece a acumulação de oleato e desfavorece a produção de linoleato. Uma célula pode compreender um gene de desaturase A9 recombinante, o que favorece a produção de oleato e desfavorece a acumulação de estearato. O gene de desa- turase A9 recombinante pode ser, por exemplo, o gene de desaturase 49 de Y. lipolytica, de Arxula adeninivorans ou de Puccinia graminis. Uma célula pode compreender um gene de elongase 1 recombinante, o que favorece a produção de oleato e desfavorece a acumulação de palmitato e palmitoleato. O gene de elongase 1 recombinante pode ser o gene de elongase 1 de Y. lipolytica. Uma célula pode compreender um gene de elongase 2 recombinante, o que favorece a produção de oleato e desfavorece a acumulação de palmitato e palmitoleato. O ge- ne de elongase 2 recombinante pode ser o gene de elongase 2 de R. norvegicus.
[0073] Uma célula pode ser modificada para aumentar o seu teor de triacil glicerol, aumentando desse modo o seu teor de estearato de 10-metila. As modificações genéticas que aumentam o teor de triacil glicerol são conhecidas (vide, por exemplo, a Publicação de Pedido de Patente PCT no. WO16/094520, publicada em 16 de junho de 2016,
incorporada no presente documento a título de referência em sua tota- lidade). Uma célula pode compreender um gene de diacil glicerol acil transferase recombinante (por exemplo, DGAT1, DGAT2 ou DGAT3), o que favorece a produção de triacil gliceróis e desfavorece a acumu- lação de diacil gliceróis. O gene de diacil glicerol acil transferase re- combinante pode ser, por exemplo, DGAT?2 (proteína DGA1 de codifi- cação) de Y. lipolytica, DGAT1 (proteína DGA?2 de codificação) de C. purpurea ou DGAT?2 (proteína DGA1 de codificação) de R. toruloides. A célula pode compreender um knockdown ou knockout do gene de glicerol-3-fosfato acil transferase (Sct1), o que pode favorecer a acu- mulação de triacil gliceróis, dependendo do tipo da célula. A célula po- de compreender um gene de glicerol-3-fosfato acil transferase recom- binante (Sct1) como gene Sct1 de A. adeninivorans, o que pode favo- recer a acumulação de triacil gliceróis. A célula pode compreender um knockdown ou knockout do gene de triacil glicerol lipase (TGL), o que pode favorecer a acumulação de triacil gliceróis na célula.
[0074] Vários aspectos da invenção referem-se a uma célula trans- formada. A célula transformada pode compreender um gene de metil transferase recombinante (por exemplo, um gene de tmpB), um gene de redutase recombinante (por exemplo, um gene de tmpA), um lipídio substituído por exometileno, e/ou um (metil)lipídio ramificado. O (me- til)lipídio ramificado pode ser um ácido carboxílico (por exemplo, o áci- do 10-metil esteárico, o ácido 10-metil palmítico, o ácido 12-metil olei- co, o ácido 13-metil oleico, o ácido 10-metil-octadec-12-enoico), car- boxilato (por exemplo, o estearato de 10-metila, o palmitato de 10- metia, o oleato de 12-metila, o oleato de 13-metila, 10-metil-octadec- 12-enoato), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipí- dio), tioéster (por exemplo, 10-metil estearil CoA, 10-metil palmitil CoA, 12-metil oleoil CoA, 13-metil oleoil CoA, 10-metil-octadec-12-enoil CoA) ou amida. Um lipídio substituído por exometileno pode ser um ácido carboxílico (por exemplo, o ácido 10-metileno esteárico, o ácido 10-metileno palmítico, o ácido 12-metileno oleico, o ácido 13-metileno oleico, o ácido 10-metileno-octadec-12-enoico), carboxilato (por exem- plo, o estearato de 10-metileno, o palmitato de 10-metileno, o oleato de 12-metileno, o oleato de 13-metileno, 10-metileno-octadec-12- enoato), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), tioéster (por exemplo, 10-metileno estearil CoA, 10-metileno palmitil CoA, 12-metileno oleoil CoA, 13-metileno oleoil CoA, 10-metileno- octadec-12-enoil CoA) ou amida. É especificamente contemplado que um ou mais dos lipídios acima podem ser excluídos das modalidades da presente invenção. O gene de metil transferase e o gene de redu- tase podem ter a capacidade de produzir em conjunto uma ramificação metilada de qualquer ácido graxo de 14 a 18 carbonos de comprimen- to com uma ligação dupla insaturada na posição A9, A10 ou A11. Áci- do graxo podem ser de 14, 15, 16, 17 ou 18 carbonos ou qualquer fai- xa aí derivável.
[0075] Os "ácidos graxo" existem geralmente em uma célula como um fosfolipídio ou triacil glicerol, embora também posam existir como um monoacil glicerol ou um diacil glicerol, por exemplo, como um in- termediário metabólico. Os ácidos graxos livres também existem na célula em equilíbrio entre um ânion de carboxilato relativamente abun- dante e um ácido de carga neutra relativamente escasso. O ácido gra- xo pode existir em uma célula como um tioéster, especialmente como um tioéster com a coenzima A (CoA), durante a biossíntese ou a oxi- dação. O ácido graxo pode existir em uma célula como uma amida, por exemplo, quando ligado covalentemente a uma proteína para an- corar a proteína a uma membrana.
[0076] Uma célula pode compreender qualquer um dos ácidos nu- cleicos descritos no presente documento, infra (vide, por exemplo, a seção B, a seguir). Uma célula pode compreender múltiplas cópias de qualquer um dos ácidos nucleicos descritos no presente documento. Isto pode ser realizado, por exemplo, ao incluir um gene de tmpB e/ou um gene de tmpB em um plasmídeo de elevado número de cópias que é transformado em uma célula.
[0077] O (metil)lipídio ramificado pode compreender uma cadeia alifática ramificada saturada (por exemplo, o ácido 10-metil esteárico, o ácido 10-metil palmítico) ou uma cadeia alifática ramificada insatura- da (por exemplo, o ácido 12-metil oleico, o ácido 13-metil oleico, o áci- do 10-metil-octadec-12-enoico). O (metil)lipídio ramificado pode com- preender uma cadeia alifática ramificada saturada ou insaturada que compreende um grupo metila ramificando.
[0078] Um lipídio substituído por exometileno pode compreender uma cadeia alifática ramificada (por exemplo, o ácido 10-metileno es- teárico, o ácido 10-metileno palmítico, o ácido 12-metileno oleico, o ácido 13-metileno oleico, o ácido 10-metileno-octadec-12-enoico). À cadeia alifática pode ser ramificada porque a cadeia alifática é substi- tuída com um grupo do exometileno.
[0079] O (metil)lipídio ramificado pode ser o estearato de 10-metila ou um ácido (ácido 10-metil esteárico), éster (por exemplo, diacil glice- rol, triacil glicerol, fosfolipídio), tivoéster (por exemplo, 10-metil estearil CoA) ou amida (por exemplo, 10-metil estearil amida) do mesmo. Por exemplo, o (metil)lipídio ramificado pode ser um diacil glicerol, um tria- cil glicerol ou um fosfolipídio, e o diacil glicerol, o triacil glicerol ou o fosfolipídio podem compreender um éster de estearato de 10-metila.
[0080] Um lipídio substituído por exometileno pode ser o estearato de 10-metileno ou um ácido (ácido 10-metileno esteárico), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), tioéster (por exem- plo, 10-metileno estearil CoA) ou amida (por exemplo, 10-metileno es- tearl amida) do mesmo. Por exemplo, o lipídio substituído por exometi- leno pode ser um diacil glicerol, um triacil glicerol ou um fosfolipídio, e o diacil glicerol, o triacil glicerol ou o fosfolipídio podem compreender um éster de 10-metileno estearato.
[0081] Em algumas modalidades, cerca de, pelo menos cerca de ou no máximo cerca de 1% em peso dos ácidos graxos da célula po- dem consistir em ácido 10-metil esteárico. Cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, T5%, 16%, 17%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso dos ácidos graxos da célula podem consistir em ácido 10-metil esteárico ou qualquer faixa aí deri- vável.
[0082] Em algumas modalidades, cerca de, pelo menos cerca de ou no máximo cerca de 1% em peso dos ácidos graxos da célula po- dem consistir em ácido 10-metileno esteárico. Cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 171%, 72%, 13%, T4%, T5%, 16%, TT%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso dos ácidos graxos da célula podem consistir em ácido 10-metileno esteárico ou qualquer fai- xa aí derivável.
[0083] Em algumas modalidades, cerca de, pelo menos cerca de ou no máximo cerca de 1% em peso dos ácidos graxos da célula po- dem consistir em um ou mais dos (metil)lipídios ramificados descritos no presente documento. Cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, T%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 11%, 12%, 13%, 74%, 175%, 176%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso dos ácidos graxos da célula podem consistir em um ou mais dos (metil)lipídios ramificados descritos no presente do- cumento ou qualquer faixa aí derivável.
[0084] Em algumas modalidades, cerca de, pelo menos cerca de ou no máximo cerca de 1% em peso dos ácidos graxos da célula po- dem consistir em um ou mais dos (metil)lipídios ramificados descritos no presente documento. Cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, T%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 11%, 12%, 13%, 74%, 175%, 176%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso dos ácidos graxos da célula podem consistir em um ou mais dos (metil)lipídios ramificados descritos no presente do- cumento ou qualquer faixa aí derivável.
[0085] Em algumas modalidades, a célula pode compreender cer- ca de, pelo menos cerca de ou no máximo cerca de 1% de ácido 10- metil esteárico tal como medido pela % em peso seco da célula. A cé- lula pode compreender cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49% ou 50% de ácido 10-metil esteárico tal como medido pela % em peso se- co da célula ou qualquer faixa aí derivável.
[0086] Em algumas modalidades, a célula pode compreender cer- ca de, pelo menos cerca de ou no máximo cerca de 1% de ácido 10- metileno esteárico tal como medido pela % em peso seco da célula. A célula pode compreender cerca de, pelo menos cerca de ou no máxi- mo cerca de 2%, de 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49% ou 50% de ácido 10-metil esteárico tal como medido pela % em peso seco da célula ou qualquer faixa aí derivável.
[0087] Uma célula não modificada do mesmo tipo (por exemplo, espécie) como uma célula da invenção pode não compreender o este- arato de 10-metila ou um ácido (ácido 10-metil esteárico), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), tioéster (por exem- plo, 10-metil estearil CoA) ou amida (por exemplo, 10-metil estearil amida) do mesmo (por exemplo, em que a célula não modificada não compreende um gene de metil transferase recombinante ou um gene de redutase recombinante). Uma célula não modificada do mesmo tipo (por exemplo, espécie) como uma célula da invenção pode não com- preender o estearato de 10-metileno ou um ácido (ácido 10-metileno esteárico), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipí- dio), ticoéster (por exemplo, 10-metileno estearil CoA) ou amida (por exemplo, 10-metileno estearil amida) do mesmo (por exemplo, em que a célula não modificada não compreende um gene de metil transferase recombinante ou um gene de redutase recombinante). Em algumas modalidades, uma célula não modificada da mesma espécie que a cé- lula não compreende (metil)lipídio ramificado e/ou um lipídio substituí- do por exometileno. Em algumas modalidades, uma célula não modifi- cada da mesma espécie que a célula não compreende um ou mais dos (metil)lipídio ramificados ou dos lipídios substituídos por exometi- leno descritos no presente documento.
[0088] Em algumas modalidades, uma célula pode expressar de maneira constitutiva a proteína codificada por um gene de metil trans- ferase e/ou gene de redutase recombinante. Uma célula pode expres- sar de maneira constitutiva uma proteína de metil transferase e/ou uma proteína de redutase.
2. Ácidos Nucleicos a. Geral
[0089] Vários aspectos da invenção referem-se a um ácido nuclei- co que compreende um gene de metil transferase recombinante, um gene de redutase recombinante ou ambos. O ácido nucleico pode ser, por exemplo, um plasmídeo. Em algumas modalidades, um gene de metil transferase recombinante e/ou um gene de redutase recombinan- te são integrados no genoma de uma célula, e desse modo o ácido nucleico pode ser um cromossoma. Em algumas modalidades, a in- venção refere-se a uma célula que compreende um gene de metil transferase recombinante, por exemplo, em que o gene de metil trans- ferase recombinante está presente em um plasmídeo ou cromossoma. Em algumas modalidades, a invenção refere-se a uma célula que compreende um gene de redutase recombinante, por exemplo, em que o gene de redutase recombinante está presente em um plasmídeo ou cromossoma. Um gene de metil transferase recombinante e um gene de redutase recombinante podem estar presentes em uma célula no mesmo ácido nucleico (por exemplo, o mesmo plasmídeo ou cromos- soma) ou em ácidos nucleicos diferentes (por exemplo, plasmídeos ou cromossomas diferentes).
[0090] Um ácido nucleico pode ser inerdável à progênie de uma célula transformada. Um gene tal como um gene de metil transferase recombinante ou um gene de redutase recombinante pode ser inerdá- vel devido ao fato que ele reside em um plasmídeo ou cromossoma. Em determinadas modalidades, um gene pode ser inerdável devido ao fato que ele é integrado no genoma da célula transformada.
[0091] Um gene pode compreender substituições conservadoras, deleções e/ou inserções enquanto ainda codifica uma proteína que tenha atividade. Por exemplo, códons podem ser otimizados para uma célula hospedeira particular, códons diferentes podem ser substituídos para fins de conveniência, tal como para introduzir um sítio de restri- ção ou para criar iniciadores de PCR ideais ou códons podem ser substituídos para uma outra finalidade. Similarmente, a sequência de nucleotídeos pode ser alterada para criar substituições conservadoras, deleções e/ou inserções de aminoácidos.
[0092] As proteínas podem compreender substituições conserva- doras, deleções e/ou inserções enquanto ainda mantêm a atividade. As tabelas de substituição conservadora são bem conhecidas no esta- do da técnica (Creighton, Proteins (2º. ed., 1992)).
[0093] As substituições, as deleções e/ou as inserções de aminoá- cidos podem ser feitas de imediato ao usar técnicas de manipulação de DNA recombinante. Os métodos para a manipulação das sequên- cias do DNA para produzir variante da substituição, da inserção ou da deleção de uma proteína são bem conhecidos no estado da técnica.
Esses métodos incluem a mutagênese M13, a mutagênese T7-Gen in vitro (USB, Cleveland, OH), a mutagênese Quick Change Site Directed (Stratagene, San Diego, CA), a mutagênese dirigida a sítio mediada por PCR, e os outros protocolos de mutagênese dirigida a sítio.
[0094] Uma "sequência de codificação" ou "região de codificação" refere-se a uma molécula de ácido nucleico que tem a informação da sequência necessária para obter um produto de proteína, tal como um aminoácido ou polipeptídio, quando a sequência é expressa. A se- quência de codificação pode compreender e/ou consistir em sequên- cias não traduzidas (incluindo íntrons ou regiões 5' ou 3' não traduzi- das) dentro das regiões traduzidas ou pode não conter tais sequências não traduzidas intermediárias (por exemplo, tal como no cDNA).
[0095] A abreviatura usada por todo o relatório descritivo para se referir aos ácidos nucleicos que compreendem e/ou consistem em se- quências de nucleotídeo inclui as abreviaturas convencionais de uma letra. Desse modo, quando incluídos em um ácido nucleico, os nucleo- tídeos de codificação de ocorrência natural são abreviados tal como segue: adenina (A), guanina (G), citosina (C), timina (T) e uracil (U). Além disso, a menos que esteja especificado de alguma outra manei- ra, as sequências de ácidos nucleicos apresentadas no presente do- cumento são na direção 5' > 3. b. Ácidos nucleicos que compreendem um gene de metil transferase recombinante
[0096] Um gene de metil transferase (por exemplo, um gene de metil transferase recombinante) codifica uma proteína de metil transfe- rase, a qual é uma enzima que tem a capacidade de transferir um átomo de carbono e um ou mais prótons ligados ao mesmo de um substrato tal como S-adenosil metionina a um ácido graxo como o áci- do oleico (por exemplo, em que o ácido graxo está presente como um ácido graxo livre, carboxilato, fosfolipídio, diacil glicerol ou triacil glice-
rol). O gene de metil transferase (por exemplo, um gene de metil trans- ferase recombinante) pode ter uma região de codificação que seja idêntica a uma de uma bactéria da classe Gammaproteobacteria. O gene de metil transferase pode compreender qualquer uma das se- quências de nucleotídeos indicadas na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 e SEQ ID NO: 17. O gene de metil transferase (por exemplo, um gene de metil transferase recombinante) pode ser um gene de ácido 10-metil esteárico B (tmpB) tal como descrito no presente documento ou uma porção biologicamente ativa do mesmo (isto é, em que a porção biologicamente ativa do mesmo compreende a atividade de metil transferase).
[0097] O gene de metil transferase (por exemplo, um gene de metil transferase recombinante) pode ser derivado de uma espécie de Gammaproteobacteria, tal como de bactérias dos gêneros Desulfobac- ter, Desulfobacula, Marinobacter, Thiohalospira ou Halofilum. O gene de metil transferase (por exemplo, um gene de metil transferase re- combinante) pode ser selecionado do grupo que consiste no gene de tmpB de Desulfobacula balticum (SEQ ID NO: 1), gene de tmpB de Marinobacter hydrocarbonclasticus (SEQ ID NO: 3), gene de tmpB de Thiohalospira halophila (SEQ ID NO: 5), gene de tmpB de Desulfobac- ter curvatus (SEQ ID NO: 7), gene de tmpB de Desulfobacter phenoli- ca (SEQ ID NO: 9), gene de tmpB de Desulfobacula toluolica (SEQ ID NO: 11), gene de tmpB de Desulfobacter postgatei (SEQ ID NO: 13), gene de tmpB de Halofilum ochraceum (SEQ ID NO: 15), e gene de tmpB de Marinobacter aquaeolei (SEQ ID NO: 17). É especificamente contemplado que um ou mais dos genes de metil transferase acima podem ser excluídos das modalidades da presente invenção.
[0098] Um gene de metil transferase recombinante pode ser re- combinante devido ao fato que ele é ligado operavelmente a um pro-
motor que não o promotor de ocorrência natural do gene de metil transferase. Tais genes podem ser úteis para dirigir a transcrição em uma espécie particular de célula. Um gene de metil transferase re- combinante pode ser recombinante devido ao fato que ele contém uma ou mais substituições de nucleotídeo em relação a um gene de ocor- rência natural de metil transferase. Tais genes podem ser úteis para aumentar a eficiência da tradução do transcrito de MRNA do gene de metil transferase em uma espécie particular de célula.
[0099] Um ácido nucleico pode compreender um gene de metil transferase recombinante e um promotor, em que o gene de metil transferase recombinante e o promotor são ligados operavelmente. O gene de metil transferase e o promotor podem ser derivados de espé- cies diferentes. Por exemplo, o gene de metil transferase recombinan- te pode codificar a proteína de metil transferase de uma espécie de Gammaproteobacteria, e o gene de metil transferase recombinante pode ser ligado operavelmente a um promotor que pode dirigir a trans- crição em um outro tipo de bactéria ou um eucariota (por exemplo, uma célula de alga, uma célula de levedura ou uma célula de planta). O promotor pode ser um promotor eucariótico. Uma célula pode com- preender o ácido nucleico, e o promotor pode ser capaz de dirigir a transcrição na célula. Uma célula pode compreender um gene de metil transferase recombinante, e o gene de metil transferase recombinante pode ser ligado operavelmente a um promotor capaz de dirigir a trans- crição do gene de metil transferase recombinante na célula. A célula pode ser uma espécie de levedura, e o promotor pode ser um promo- tor de levedura. A célula pode ser uma espécie de bactéria, e o promo- tor pode ser um promotor bacteriano (por exemplo, em que o promotor bacteriano não é um promotor de um Gammaproteobacterium). A célu- la pode ser uma espécie de algas, e o promotor pode ser um promotor de algas. A célula pode ser uma espécie de planta, e o promotor pode ser um promotor de planta.
[0100] Um gene de metil transferase recombinante pode ser ligado operavelmente a um promotor que não pode dirigir a transcrição na célula da qual originou o gene de metil transferase recombinante. Por exemplo, o promotor pode não ser capaz de ligar uma polimerase do RNA da célula da qual originou um gene de metil transferase recombi- nante. Em algumas modalidades, o promotor não pode ligar uma transcrição de polimerase de RNA procariótica e/ou iniciar a transcri- ção mediada por uma polimerase de RNA procariótica. Em algumas modalidades, um gene de metil transferase recombinante é ligado ope- ravelmente a um promotor que não pode dirigir a transcrição na célula da qual originou a proteína codificada pelo gene. Por exemplo, o pro- motor pode não ser capaz de ligar uma polimerase de RNA de uma célula que expressa naturalmente a enzima de metil transferase codifi- cada por um gene de metil transferase recombinante.
[0101] Um promotor pode ser um promotor induzível ou um promotor constitutivo. Um promotor pode ser qualquer um dos promotores descri- tos na Publicação de Pedido de Patente PCT no. WO 2016/014900, pu- blicada em 28 de janeiro de 2016 (incorporada no presente documento a título de referência em sua totalidade). O documento WO 2016/014900 descreve vários promotores derivados das espécies de levedura Yar- rowia lipolytica e Arxula adeninivorans, que podem ser particularmente úteis como promotores para dirigir a transcrição de um gene recombi- nante em uma célula de levedura. Um promotor pode ser um promotor de um gene que codifica um fator de Alongamento de Tradução EF-1a; Glicerol-3-fosfato desidrogenase; Triosefosfato isomerase 1; Fructose- 1,6-bisfosfato aldolase; Fosfoglicerato mutase; piruvato cinase; proteí- na Export EXP1; Proteína ribossomal S7; desidrogenase de álcool; Fosfoglicerato cinase; Transportador de Hexose; Permease de amino- ácido geral; serina protease; Isocitrato liase; Acil-CoA oxidase; ATP-
sulfurilase; Hexocinase; 3-fosfoglicerato desidrogenase; Subunidade alfa de piruvato desidrogenase; Subunidade beta de piruvato desidro- genase; Aconitase; Enolase; Actina; Proteína de resistência a múltiplos fármacos (ABC-transportador); Ubiquitina; GTPase; Cotransportador Na+/Pi de membrana de plasma; piruvato descarboxilase; Fitase; ou alpha-amilase, por exemplo, em que o gene é de levedura, tal como um gene de Yarrowia lipolytica ou de Arxula adeninivorans.
[0102] Um gene de metil transferase recombinante pode compre- ender uma sequência de nucleotídeos com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, 75%, 76%, 77%, 718%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de nucleo- tídeos indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: ou SEQ ID NO: 17. Um gene de metil transferase recombinante po- de compreender uma sequência de nucleotídeos com, com pelo me- nos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, T5%, 16%, T7T%, 718%, 719%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 291%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1.000, 1.050, 1.100, 1.150, 1.200, 1.250 ou 1.300 pares base contíguos da sequência de nucleotídeos indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID NO: 17. Uma metil transferase recombinante pode ou não ter 100% de identidade de se- quência com qualquer uma das sequências de nucleotídeos indicadas na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID
NO: 17. Um gene de metil transferase recombinante pode ou não ter 100% de identidade de sequência com 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1.000, 1.050,
1.100, 1.150, 1.200, 1.250 ou 1.300 pares base contíguos começando na posição de nucleotídeo 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, OO, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 2018, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386,
387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614, 615, 616, 617, 618, 619, 620, 621, 622, 623, 624, 625, 626, 627, 628, 629, 630, 631, 632, 633, 634, 635, 636, 637, 638, 639, 640, 641, 642, 643, 644, 645, 646, 647, 648, 649, 650, 651, 652, 653, 654, 655, 656, 657, 658, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, 693, 694, 695, 696, 697, 698, 699, 700, 701, 702, 703, 704, 705, 706, 707, 708, 709, 710, 711, 712, 713, 714, 715, 716, 717, 718, 719, 720, 721, 722, 723, 724, 725, 726, 727, 728, 729, 730, 731, 732, 733, 734, 735, 736, 737, 738, 739, 740, 741, 742, 743, 744, 745, 746, 747, 748, 749, 750, 751, 752, 753, 754, 755, 756, 757, 758, 759, 760, 761, 762, 763, 764, 765, 766, 767, 768, 769, 770, 771, 772, 773, 174, 1775, 176, 177, 778, 779, 780, 781, 782, 783, 784, 785, 786, 787, 788, 789, 790, 791, 792, 793, 794, 795, 796, 797, 798, 799, 800, 801, 802, 803, 804, 805, 806,
807, 808, 809, 810, 811, 812, 813, 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 828, 829, 830, 831, 832, 833, 834, 835, 836, 837, 838, 839, 840, 841, 842, 843, 844, 845, 846, 847, 848, 849, 850, 851, 852, 853, 854, 855, 856, 857, 858, 859, 860, 861, 862, 863, 864, 865, 866, 867, 868, 869, 870, 871, 872, 873, 874, 875, 876, 877, 878, 879, 880, 881, 882, 883, 884, 885, 886, 887, 888, 889, 890, 891, 892, 893, 894, 895, 896, 897, 898, 899, 900, 901, 902, 903, 904, 905, 906, 907, 908, 909, 910, 911, 912, 913, 914, 915, 916, 917, 918, 919, 920, 921, 922, 923, 924, 925, 926, 927, 928, 929, 930, 931, 932, 933, 934, 935, 936, 937, 938, 939, 940, 941, 942, 943, 944, 945, 946, 947, 948, 949, 950, 951, 952, 953, 954, 955, 956, 957, 958, 959, 960, 961, 962, 963, 964, 965, 966, 967, 968, 969, 970, 971, 972, 973, 974, 975, 976, 977, 978, 979, 980, 981, 982, 983, 984, 985, 986, 987, 988, 989, 990, 991, 992, 993, 994, 995, 996, 997, 998, 999, 1.000, 1.001,
1.002, 1.003, 1.004, 1.005, 1.006, 1.007, 1.008, 1.009, 1.010, 1.011,
1.012, 1.013, 1.014, 1.015, 1.016, 1.017, 1.018, 1.019, 1.020, 1.021,
1.022, 1.023, 1.024, 1.025, 1.026, 1.027, 1.028, 1.029, 1.030, 1.031,
1.032, 1.033, 1.034, 1.035, 1.036, 1.037, 1.038, 1.039, 1.040, 1.041,
1.042, 1.043, 1.044, 1.045, 1.046, 1.047, 1.048, 1.049, 1.050, 1.051,
1.052, 1.053, 1.054, 1.055, 1.056, 1.057, 1.058, 1.059, 1.060, 1.061,
1.062, 1.063, 1.064, 1.065, 1.066, 1.067, 1.068, 1.069, 1.070, 1.071,
1.072, 1.073, 1.074, 1.075, 1.076, 1.077, 1.078, 1.079, 1.080, 1.081,
1.082, 1.083, 1.084, 1.085, 1.086, 1.087, 1.088, 1.089, 1.090, 1.091,
1.092, 1.093, 1.094, 1.095, 1.096, 1.097, 1.098, 1.099, 1.100, 1.101,
1.102, 1.103, 1.104, 1.105, 1.106, 1.107, 1.108, 1.109, 1.110, 1.111,
1.112, 1.113, 1.114, 1.115, 1.116, 1.117, 1.118, 1.119, 1.120, 1.121,
1.122, 1.123, 1.124, 1.125, 1.126, 1.127, 1.128, 1.129, 1.130, 1.131,
1.132, 1.133, 1.134, 1.135, 1.136, 1.137, 1.138, 1.139, 1.140, 1.141,
1.142, 1.143, 1.144, 1.145, 1.146, 1.147, 1.148, 1.149, 1.150, 1.151,
1.152, 1.153, 1.154, 1.155, 1.156, 1.157, 1.158, 1.159, 1.160, 1.161,
1.162, 1.163, 1.164, 1.165, 1.166, 1.167, 1.168, 1.169, 1.170, 1.171,
1.172, 1.173, 1.174, 1.175, 1.176, 1.177, 1.178, 1.179, 1.180, 1.181,
1.182, 1.183, 1.184, 1.185, 1.186, 1.187, 1.188, 1.189, 1.190, 1.191,
1.192, 1.193, 1.194, 1.195, 1.196, 1.197, 1.198, 1.199 ou 1.200 da se- quência do nucleotídeo indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID NO: 17. Um gene de metil transfe- rase recombinante pode compreender uma sequência de nucleotídeos com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 171%, 72%, 73%, T4%, T5%, 16%, TT%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência do nucleotídeo indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID NO: 17, e o gene de metil transferase recombinante podem codificar uma proteína de metil trans- ferase com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, 15%, 16%, 177%, 718%, 19%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 294%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de aminoácidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18. Por exemplo, um gene que é otimizado nos códons para a expressão em levedura pode ter uma identidade da sequência de cerca de 70% com a SEQ ID NO: 1, ao passo que a proteína codificada por tal gene codificado no códon pode ter uma identidade de sequência de 100% com a sequência de aminoácidos indicada na SEQ ID NO: 2. Desse modo, embora um gene otimizado nos códons possa ter somente cer- ca de 70% de identidade de sequência ou menos em relação ao gene original, o gene otimizado nos códons codifica a mesma sequência de aminoácidos do gene original.
[0103] Um gene de metil transferase recombinante pode variar de um gene de metil transferase de ocorrência natural devido ao fato que o gene de metil transferase recombinante pode ser otimizado nos có- dons para a expressão em uma célula eucariótica, tal como uma célula de planta, uma célula de algas ou uma célula de levedura. Uma célula pode compreender um gene de metil transferase recombinante, em que o gene de metil transferase recombinante é otimizado nos códons para a célula.
[0104] Exatamente, pelo menos ou no máximo 1, 2, 3, 4,5,6,7,8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44,45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298,
299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499 ou 500 códons de um gene de metil transfera- se recombinante podem variar de um gene de metil transferase de ocorrência natural ou podem ser inalterados de um gene de metil transferase de ocorrência natural. Por exemplo, um gene de metil transferase recombinante pode compreender uma sequência de nu- cleotídeos com uma identidade de sequência de pelo menos cerca de 65% com a sequência natural do nucleotídeo indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID NO: 17 (por exemplo, pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência), e pelo menos 5 có- dons da sequência de nucleotídeos do gene de metil transferase re- combinante podem variar da sequência de nucleotídeos de ocorrência natural (por exemplo, pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 ou 100 códons).
[0105] Um gene de metil transferase codifica uma proteína de me-
til transferase. Uma proteína de metil transferase pode ser uma prote- Ína expressa por uma espécie de Gammaproteobacteria, tais como as bactérias dos gêneros Desulfobacter, Desulfobacula, Marinobacter, Thiohalospira ou Halofilum. Um gene de metil transferase recombinan- te pode codificar uma proteína de metil transferase de ocorrência natu- ral mesmo se o gene de metil transferase recombinante não for um gene de metil transferase de ocorrência natural. Por exemplo, um gene de metil transferase recombinante pode variar de um gene de metil transferase de ocorrência natural devido ao fato que o gene de metil transferase recombinante é otimizado nos códons para a expressão em uma célula específica. O gene de metil transferase recombinante otimizado nos códons, e o gene de metil transferase de ocorrência na- tural podem, no entanto, codificar a mesma proteína de metil transfe- rase de ocorrência natural.
[0106] Um gene de metil transferase recombinante pode codificar uma proteína de metil transferase selecionada do grupo que consiste em proteína de tmpB de Desulfobacula balticum (SEQ ID NO: 2), pro- teína de tmpB de Marinobacter hydrocarbonclasticus (SEQ ID NO: 4), proteína de tmpB de Thiohalospira halophila (SEQ ID NO: 6), proteína de tmpB de Desulfobacter curvatus (SEQ ID NO: 8), proteína de tmpB de Desulfobacter phenolica (SEQ ID NO: 10), proteína de tmpB de De- sulfobacula toluolica (SEQ ID NO: 12), proteína de tmpB de Desulfo- bacter postgatei (SEQ ID NO: 14), proteína de tmpB de Halofilum ochraceum (SEQ ID NO: 16), e proteína de tmpB de Marinobacter aquaeolei (SEQ ID NO: 18). É especificamente contemplado que uma ou mais das proteínas de metil transferase acima podem ser excluídas das modalidades da presente invenção. Um gene de metil transferase recombinante pode codificar uma proteína de metil transferase, e a proteína de metil transferase pode ser substancialmente idêntica a qualquer uma das enzimas acima, mas o gene de metil transferase recombinante pode variar do gene de ocorrência natural que codifica a enzima. O gene de metil transferase recombinante pode variar do ge- ne de ocorrência natural devido ao fato que o gene de metil transfera- se recombinante pode ser otimizado nos códons para a expressão em um filo, uma classe, uma ordem, uma família, um gênero, uma espécie ou uma cepa específica da célula.
[0107] As sequências de proteínas de metil transferase de ocor- rência natural são indicadas na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 e SEQ ID NO: 18. Um gene de metil transferase recombinante pode ou não codificar uma proteína que compreende 100% de identidade de sequência com a sequência de aminoácidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18. Por exemplo, um gene de metil transferase recombi- nante pode codificar uma proteína que tem 100% de identidade de se- quência com uma porção biologicamente ativa de uma sequência de aminoácidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18.
[0108] Um gene de metil transferase recombinante pode codificar uma proteína de metil transferase que tem, tem pelo menos ou tem no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, 75%, 76%, 77%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% e 100% de identidade de sequência com a sequência de aminoá- cidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18 ou uma porção biologicamente ativa da mesma. Um gene de metil transferase recombinante pode codificar uma proteína de metil transferase que tem cerca de, pelo menos cerca de ou no máximo cerca de 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 10%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%, 100%, 100,1%, 100,2%, 100,3%, 100,4%, 100,5%, 100,6%, 100,7%, 100,8%, 100,9%, 101%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145%, 150%, 160%, 170%, 180%, 190%, 200%, 220%, 240%, 260%, 280%, 300%, 320%, 340%, 360%, 380% ou 400% de atividade de metil trans- ferase em relação a uma proteína que compreende a sequência de aminoácido indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18. Um gene de metil transferase recombi- nante pode codificar uma proteína que tem pelo menos 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 173%, T4%, 15%, 16%, 77%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identi- dade de sequência com 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490 ou 500 aminoácidos contíguos começando na posição 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71,72, 73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147,
148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499 ou 500 da sequência de aminoácidos indicada na SEQ ID NO:2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18.
[0109] Os substratos para a proteína de metil transferase podem incluir ácidos graxos de 14 a 18 carbonos de comprimento com uma ligação dupla insaturada na posição A9, A10 ou A11. O substrato pode ter uma cadeia que tem 14, 15, 16, 17 ou 18 carbonos de comprimento ou qualquer faixa aí derivável. A proteína de metil transferase pode ser capaz de catalisar a formação de uma substituição de metileno na po- sição A9, A10 ou A11 de tal substrato.
[0110] Em algumas modalidades, o gene de metil transferase re- combinante codifica uma proteína de metil transferase que tem amino- ácidos específicos inalterados da sequência de aminoácidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18. Os aminoácidos inalterados podem incluir 1, 2, 3, 4, 5, 6,7, 8 ou 9 aminoácidos selecionados de Y163, T175, R199, E211, G269, Y271, N313, N319, e W389 de tmpB de Marinobacter hydrocarbon- clasticus ou aminoácidos correspondentes em tmpB de Desulfobacula balticum, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum ou Marinobacter aquaeolei, de acordo com o alinha- mento indicado nas Figuras 7A-D. Cc. Ácidos nucleicos que compreendem um gene de redutase recombi- nante
[0111] Um gene de redutase (por exemplo, um gene de redutase recombinante) codifica uma proteína de redutase, a qual é uma enzi- ma capaz de reduzir uma ligação dupla de um ácido graxo (por exem- plo, em que ácido graxo está presente como um ácido graxo livre, car- boxilato, fosfolipídio, diacil glicerol ou triacil glicerol). O gene de redu- tase (por exemplo, um gene de redutase recombinante) pode ter uma região de codificação que seja idêntica a uma de uma bactéria da classe Gammaproteobacteria. O gene de redutase pode compreender qualquer uma das sequências de nucleotídeos indicadas na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO:
27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 e SEQ ID NO: 35. O gene de redutase (por exemplo, um gene de redutase recombinan- te) pode ser um gene de 10-metil esteárico A (tmpA) tal como descrito no presente documento ou uma porção biologicamente ativa do mes- mo (isto é, em que a porção biologicamente ativa do mesmo compre- ende a atividade de redutase).
[0112] O gene de redutase (por exemplo, um gene de redutase recombinante) pode ser derivado de uma espécie de Gammaprote- obacteria, tal como as bactérias dos gêneros Desulfobacter, Desulfo- bacula, Marinobacter, Thiohalospira ou Halofilum. O gene de redutase (por exemplo, um gene de redutase recombinante) pode ser selecio- nado do grupo que consiste no gene de tmpA de Desulfobacula balti- cum (SEQ ID NO: 19), gene de tmpA de Marinobacter hydrocarbon- clasticus (SEQ ID NO: 21), gene de tmpA de Thiohalospira halophila (SEQ ID NO: 23), gene de tmpA de Desulfobacter curvatus (SEQ ID NO: 25), gene de tmpA de Desulfobacter phenolica (SEQ ID NO: 27), gene de tmpA de Desulfobacula toluolica (SEQ ID NO: 29), gene de tmpA de Desulfobacter postgatei (SEQ ID NO: 31), gene de tmpA de Halofilum ochraceum (SEQ ID NO: 33), e gene de tmpA de Marinobac- ter aquaeolei (SEQ ID NO: 35). É especificamente contemplado que um ou mais dos genes de redutase acima podem ser excluídos das modalidades da presente invenção.
[0113] Um gene de redutase recombinante pode ser recombinante devido ao fato que ele é ligado operavelmente a um promotor que não o promotor de gene de redutase de ocorrência natural. Tais genes po- dem ser úteis para dirigir a transcrição em uma espécie particular de célula. Um gene de redutase recombinante pode ser recombinante de- vido ao fato que ele contém uma ou mais substituições de nucleotídeo em relação a um gene de redutase de ocorrência natural. Tais genes podem ser úteis para aumentar a eficiência da tradução do transcrito de mRNA do gene de redutase em uma espécie particular de célula.
[0114] Um ácido nucleico pode compreender um gene de redutase recombinante e um promotor, em que o gene de redutase recombinan- te e o promotor são ligados operavelmente O gene de redutase re- combinante e o promotor podem ser derivados de espécies diferentes. Por exemplo, o gene de redutase recombinante pode codificar a prote- íÍna de redutase de uma espécie de Gammaproteobacteria, e o gene de redutase recombinante pode ser ligado operavelmente a um promo- tor que pode dirigir a transcrição em um outro tipo de bactéria ou um eucariota (por exemplo, célula de alga, célula de levedura ou célula de planta). O promotor pode ser um promotor eucariótico. Uma célula po- de compreender o ácido nucleico, e o promotor pode ser capaz de di- rigir a transcrição na célula. Uma célula pode compreender um gene de redutase recombinante, e o gene de redutase recombinante pode ser ligado operavelmente a um promotor capaz de dirigir a transcrição do gene de redutase recombinante na célula. A célula pode ser uma espécie de levedura, e o promotor pode ser um promotor de levedura. A célula pode ser uma espécie de bactéria, e o promotor pode ser um promotor bacteriano (por exemplo, em que o promotor bacteriano não é um promotor de um Gammaproteobacterium). A célula pode ser uma espécie de alga, e o promotor pode ser um promotor de alga. A célula pode ser uma espécie de planta, e o promotor pode ser um promotor de planta.
[0115] Um gene de redutase recombinante pode ser operavelmen- te ligado a um promotor que não pode dirigir a transcrição na célula da qual originou o gene de redutase recombinante. Por exemplo, o pro- motor pode não ser capaz de ligar uma polimerase de RNA da célula da qual originou um gene de redutase recombinante. Em algumas mo- dalidades, o promotor não pode ligar uma polimerase de RNA proca- riótica e/ou iniciar a transcrição mediada por uma polimerase de RNA procariótica. Em algumas modalidades, um gene de redutase recom- binante é ligado operavelmente a um promotor que não pode dirigir a transcrição na célula da qual originou a proteína codificada pelo gene. Por exemplo, o promotor pode não ser capaz de ligar uma polimerase de RNA de uma célula que expressa naturalmente a enzima de redu- tase codificada por um gene de redutase recombinante.
[0116] Um promotor pode ser um promotor induzível ou um promotor constitutivo. Um promotor pode ser qualquer um dos promotores descri- tos na Publicação de Pedido de Patente PCT no. WO 2016/014900, publicada em 28 de janeiro de 2016 (incorporada no presente docu- mento a título de referência em sua totalidade). O documento WO 2016/014900 descreve vários promotores derivados das espécies de levedura Yarrowia lipolytica e Arxula adeninivorans, que podem ser particularmente úteis como promotores para dirigir a transcrição de um gene recombinante em uma célula de levedura. Um promotor pode ser um promotor de um gene que codifica um fator de Alongamento de Tradução EF-10; Glicerol-3-fosfato desidrogenase; Triosefosfato iso- merase 1; Fructose-1,6-bisfosfato aldolase; Fosfoglicerato mutase; pi- ruvato cinase; proteína Export EXP1; Proteína ribossomal S7; desidro- genase de álcool; Fosfoglicerato cinase; Transportador de Hexose; Permease de aminoácido geral; serina protease; Isocitrato liase; Acil- CoA oxidase; ATP-sulfurilase; Hexocinase; 3-fosfoglicerato desidroge- nase; Subunidade alfa de piruvato desidrogenase; Subunidade beta de piruvato desidrogenase; Aconitase; Enolase; Actina; Proteína de resis- tência a múltiplos fármacos (ABC-transportador); Ubiquitina; GTPase; Cotransportador Na+/Pi de membrana de plasma; piruvato descarboxi- lase; Fitase; ou alpha-amilase, por exemplo, em que o gene é de leve- dura, tal como um gene de Yarrowia lipolytica ou de Arxula adeninivo- rans.
[0117] Um gene de redutase recombinante pode compreender uma sequência de nucleotídeos com, com pelo menos ou com no má- ximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, 15%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de nucleotídeos indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35. Um gene de redutase recombinante pode com- preender uma sequência de nucleotídeos com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 175%, 76%, TT%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950,
1.000, 1.050, 1.100, 1.150, 1.200, 1.250 ou 1.300 pares base contí- guos começando na posição de nucleotídeo 1, 2, 3, 4, 5, 6, 7, 8,9, 10, 11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229,
230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607 608, 609, 610, 611, 612, 613, 614, 615, 616, 617, 618, 619, 620, 621, 622, 623, 624, 625, 626, 627, 628, 629, 630, 631, 632, 633, 634, 635 636, 637, 638, 639, 640, 641, 642, 643, 644, 645, 646, 647, 648, 649
650, 651, 652, 653, 654, 655, 656, 657, 658, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, 693, 694, 695, 696, 697, 698, 699, 700, 701, 702, 703, 704, 705, 706, 707, 708, 709, 710, 711, 712, 713, 714, 715, 716, 717, 718, 719, 720, 721, 722, 723, 724, 725, 726, 727, 728, 729, 730, 731, 732, 733, 734, 735, 736, 737, 738, 739, 740, 741, 742, 743, 744, 745, 746, 747, 748, 749, 750, 751, 752, 753, 754, 755, 756, 757, 758, 759, 760, 761, 762, 763, 764, 765, 766, 767, 768, 769, 770, 771, 772, 773, TTA, 775, 776, 777, 778, 779, 780, 781, 782, 783, 784, 785, 786, 787, 788, 789, 790, 791, 792, 793, 794, 795, 796, 797, 798, 799, 800, 801, 802, 803, 804, 805, 806, 807, 808, 809, 810, 811, 812, 813, 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 828, 829, 830, 831, 832, 833, 834, 835, 836, 837, 838, 839, 840, 841, 842, 843, 844, 845, 846, 847, 848, 849, 850, 851, 852, 853, 854, 855, 856, 857, 858, 859, 860, 861, 862, 863, 864, 865, 866, 867, 868, 869, 870, 871, 872, 873, 874, 875, 876, 877, 878, 879, 880, 881, 882, 883, 884, 885, 886, 887, 888, 889, 890, 891, 892, 893, 894, 895, 896, 897, 898, 899, 900, 901, 902, 903, 904, 905, 906, 907, 908, 909, 910, 911, 912, 913, 914, 915, 916, 917, 918, 919, 920, 921, 922, 923, 924, 925, 926, 927, 928, 929, 930, 931, 932, 933, 934, 935, 936, 937, 938, 939, 940, 941, 942, 943, 944, 945, 946, 947, 948, 949, 950, 951, 952, 953, 954, 955, 956, 957, 958, 959, 960, 961, 962, 963, 964, 965, 966, 967, 968, 969, 970, 971, 972, 973, 974, 975, 976, 977, 978, 979, 980, 981, 982, 983, 984, 985, 986, 987, 988, 989, 990, 991, 992, 993, 994, 995, 996, 997, 998, 999,
1.000, 1.001, 1.002, 1.003, 1.004, 1.005, 1.006, 1.007, 1.008, 1.009,
1.010, 1.011, 1.012, 1.013, 1.014, 1.015, 1.016, 1.017, 1.018, 1.019,
1.020, 1.021, 1.022, 1.023, 1.024, 1.025, 1.026, 1.027, 1.028, 1.029,
1.030, 1.031, 1.032, 1.033, 1.034, 1.035, 1.036, 1.037, 1.038, 1.039,
1.040, 1.041, 1.042, 1.043, 1.044, 1.045, 1.046, 1.047, 1.048, 1.049,
1.050, 1.051, 1.052, 1.053, 1.054, 1.055, 1.056, 1.057, 1.058, 1.059,
1.060, 1.061, 1.062, 1.063, 1.064, 1.065, 1.066, 1.067, 1.068, 1.069,
1.070, 1.071, 1.072, 1.073, 1.074, 1.075, 1.076, 1.077, 1.078, 1.079,
1.080, 1.081, 1.082, 1.083, 1.084, 1.085, 1.086, 1.087, 1.088, 1.089,
1.090, 1.091, 1.092, 1.093, 1.094, 1.095, 1.096, 1.097, 1.098, 1.099,
1.100, 1.101, 1.102, 1.103, 1.104, 1.105, 1.106, 1.107, 1.108, 1.109,
1.110, 1.111, 1.112, 1.113, 1.114, 1.115, 1.116, 1.117, 1.118, 1.119,
1.120, 1.121, 1.122, 1.123, 1.124, 1.125, 1.126, 1.127, 1.128, 1.129,
1.130, 1.131, 1.132, 1.133, 1.134, 1.135, 1.136, 1.137, 1.138, 1.139,
1.140, 1.141, 1.142, 1.143, 1.144, 1.145, 1.146, 1.147, 1.148, 1.149,
1.150, 1.151, 1.152, 1.153, 1.154, 1.155, 1.156, 1.157, 1.158, 1.159,
1.160, 1.161, 1.162, 1.163, 1.164, 1.165, 1.166, 1.167, 1.168, 1.169,
1.170, 1.171, 1.172, 1.173, 1.174, 1.175, 1.176, 1.177, 1.178, 1.179,
1.180, 1.181, 1.182, 1.183, 1.184, 1.185, 1.186, 1.187, 1.188, 1.189,
1.190, 1.191, 1.192, 1.193, 1.194, 1.195, 1.196, 1.197, 1.198, 1.199,
1.200 da sequência de nucleotídeos indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35. Uma re- dutase recombinante pode ou não ter uma identidade de sequência de 100% com nenhuma das sequências de nucleotídeos indicadas na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, e SEQ ID NO: 35. Um gene de redutase recombinante pode ou não ter uma identidade de sequência de 100% com 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1.000,
1.050, 1.100, 1.150, 1.200, 1.250 ou 1.300 pares base contíguos da sequência de nucleotídeos indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35. Um gene de redu- tase recombinante pode compreender uma sequência de nucleotídeos com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 171%, 72%, 73%, T4%, T5%, 16%, TT%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de nucleotídeos indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO:29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35, e o gene de redutase recombinante pode codificar uma proteína de redutase com, com pelo menos ou com no máximo 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 291%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequên- cia de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36. Por exemplo, um gene que é otimizado nos códons para a expressão em levedura pode ter uma identidade de sequência de cerca de 70% com a SEQ ID NO: 19, ao passo que a proteína codificada por tal gene otimizado nos códons pode ter uma identidade de sequência de 100% com a sequência de aminoácidos indicada na SEQ ID NO: 20. Desse modo, mesmo que um gene otimizado nos códons possa ter apenas cerca de 70% de identidade de sequência ou menos com o gene original, o gene otimi- zado nos códons codifica a mesma sequência de aminoácidos do ge- ne original.
[0118] Um gene de redutase recombinante pode variar de um ge- ne de redutase de ocorrência natural devido ao fato que o gene de re- dutase recombinante pode ser otimizado nos códons para a expressão em uma célula eucariótica, tal como uma célula de planta, uma célula de alga ou uma célula de levedura. Uma célula pode compreender um gene de redutase recombinante, em que o gene de redutase recombi- nante é otimizado nos códons para a célula.
[0119] Exatamente, pelo menos ou no máximo 1, 2, 3, 4,5,6,7,8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44,45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438,
439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499 ou 500 códons de um gene de redutase re- combinante podem variar de um gene de redutase de ocorrência natu- ral ou podem ser inalterados de um gene de redutase de ocorrência natural. Por exemplo, um gene de redutase recombinante pode com- preender uma sequência de nucleotídeos com uma identidade de se- quência de pelo menos cerca de 65% com a sequência de nucleotí- deos de ocorrência natural indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35 (por exemplo, pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência), e pelo menos 5 códons da sequên- cia de nucleotídeos do gene de redutase recombinante podem variar da sequência de nucleotídeos de ocorrência natural (por exemplo, pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 ou 100 códons).
[0120] Um gene de redutase codifica uma proteína de redutase. Uma proteína de redutase pode ser uma proteína expressa por uma espécie de Gammaproteobacteria, tais como as bactérias dos gêneros Desulfobacter, Desulfobacula, Marinobacter, Thiohalospira ou Halofi- lum. Um gene de redutase recombinante pode codificar uma proteína de redutase de ocorrência natural mesmo se o gene de redutase re- combinante não for um gene de redutase de ocorrência natural. Por exemplo, um gene de redutase recombinante pode variar de um gene de redutase de ocorrência natural devido ao fato que o gene de redu- tase recombinante é otimizado nos códons para a expressão em uma célula específica. O gene de redutase recombinante otimizado nos có-
dons e o gene de redutase de ocorrência natural podem, no entanto, codificar a mesma proteína de redutase de ocorrência natural.
[0121] Um gene de redutase recombinante pode codificar uma proteína de redutase selecionada do grupo que consiste na proteína de tmpA de Desulfobacula balticum (SEQ ID NO: 20), proteína de tmpA de Marinobacter hydrocarbonclasticus (SEQ ID NO: 22), proteína de tmpA de Thiohalospira halophila (SEQ ID NO: 24), proteína de tmpA de Desulfobacter curvatus (SEQ ID NO: 26), proteína de tmpA de Desulfobacter phenolica (SEQ ID NO: 28), proteína de tmpA de De- sulfobacula toluolica (SEQ ID NO: 30), proteína de tmpA de Desulfo- bacter postgatei (SEQ ID NO: 32), proteína de tmpA de Halofilum ochraceum (SEQ ID NO: 34), e proteína de tmpA de Marinobacter aquaeolei (SEQ ID NO: 36). É contemplado especificamente que uma ou mais das proteínas de redutase acima podem ser excluídas das modalidades da presente invenção. Um gene de redutase recombinan- te pode codificar uma proteína de redutase, e a proteína de redutase pode ser substancialmente idêntica a qualquer uma das enzimas aci- ma, mas o gene de redutase recombinante pode variar do gene de ocorrência natural que codifica a enzima. O gene de redutase recom- binante pode variar do gene de ocorrência natural porque o gene de redutase recombinante pode ser otimizado nos códons para a expres- são em um filo, uma classe, uma ordem, uma família, um gênero, uma espécie ou uma cepa específica de célula.
[0122] As sequências de proteínas de redutase de ocorrência na- tural são indicadas na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 e SEQ ID NO: 36. Um gene de redutase recombinante pode ou não codificar uma proteína que compreende uma identidade de sequência de 100% com a sequência de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26,
SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36. Por exemplo, um gene de redutase recombinante po- de codificar uma proteína que tem 100% de identidade de sequência com uma porção biologicamente ativa de uma sequência de aminoáci- dos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36.
[0123] Um gene de redutase recombinante pode codificar uma proteína de redutase que tem, tem pelo menos ou tem no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 13%, T4%, 15%, 16%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36 ou uma porção biologicamente ativa da mesma. Um gene de redutase recombinante pode codificar uma proteína de redutase que tem cerca de, pelo menos cerca de ou no máximo cerca de 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 10%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%, 100%, 100.1%, 100.2%, 100.3%, 100,4%, 100,5%, 100,6%, 100,7%, 100,8%, 100,9%, 101%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145%, 150%, 160%, 170%, 180%, 190%, 200%, 220%, 240%, 260%, 280%, 300%, 320%, 340%, 360%, 380% ou 400% de atividade de redutase em relação a uma proteína que compreende a sequência de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36. Um gene de redutase recombinante pode codificar uma proteína que tem, tem pelo menos ou tem no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 173%, T4%, 15%, 16%, 77%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identi- dade de sequência com 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490 ou 500 aminoácidos contíguos começando na posição de aminoácido 1, 2, 3, 4, 5, 6,7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44,45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326,
327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499 ou 500 da sequência de aminoácido indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36.
[0124] Os substratos para a proteína de redutase podem incluir ácidos graxos com 14 a 18 carbonos de comprimento com uma substi- tuição de metileno na posição A9, A10 ou A11. O substrato pode ter 14, 15, 16, 17 ou 18 carbonos de comprimento ou qualquer faixa aí derivável. A proteína de redutase pode ser capaz de catalisar a redu- ção de um substrato de ácido graxo substituído por metileno em um (metil)lipídio. A proteína de redutase, em conjunto com uma proteína de metil transferase, pode ser capaz de catalisar a produção de uma ramificação metilada de qualquer ácido graxo de 14 a 18 carbonos de comprimento com uma ligação dupla insaturada na posição A9, A10 ou A11, incluindo ácidos graxos que têm 14, 15, 16, 17 ou 18 carbonos de comprimento ou qualquer faixa aí derivável.
[0125] Em algumas modalidades, o gene de redutase recombinan- te codifica uma proteína de redutase que tem aminoácidos específicos inalterados da sequência de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36. Os aminoácidos inalterados podem incluir 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 1213, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 aminoácidos selecionados de 18, L22, F37, P38, R39, K41, G45, WA46, P49, G144, C148, P149, E169, E171, L197, 1212, C249, H250, Y252, 1270, G275, L276, E283, A296 e A299 de tmpA de Marinobacter hydrocarbonclasti- cus ou aminoácidos correspondentes em tmpA de Desulfobacula balti- cum, Thiohalospira halophila, Desulfobacter curvatus, Desulfobacter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofilum ochraceum ou Marinobacter aquaeolei, de acordo com alinhamento indicado nas Figuras 8A-D.
[0126] Tal como usado no presente documento, o termo "comple- mentar" e os seus derivados são usados em referência ao empare- lhamento de ácidos nucleico pelas regras bem conhecidas que A em- parelha com T ou U e C emparelha com G. O complemento pode ser "parcial" ou "completo". No complemento parcial, somente algumas das bases de ácido nucleico são combinadas de acordo com as regras de emparelhamento de bases; ao passo que no complemento comple- to ou total, todas as bases são combinadas de acordo com a regra de emparelhamento. O grau de complemento entre os filamentos de ácido nucleico pode ter efeitos significativos na eficiência e intensidade da hibridização entre os filamentos de ácido nucleico tal como é bem co- nhecido no estado da técnica. A eficiência e a intensidade da dita hi- bridização dependem do método de detecção.
[0127] Qualquer ácido nucleico que é indicado no presente docu- mento como tendo uma determinada porcentagem de identidade de sequência com uma sequência indicada em uma SEQ ID NO: inclui ácidos nucleicos que têm a determinada porcentagem de identidade de sequência com o complemento da sequência indicada na SEQ ID NO:. d. Ácidos nucleicos que compreendem um gene de metil transferase recombinante e um gene de redutase recombinante
[0128] Um ácido nucleico pode compreender um gene de metil transferase recombinante e um gene de redutase recombinante. O ge- ne de metil transferase recombinante e o gene de redutase recombi- nante podem codificar proteínas da mesma espécie ou de espécies diferentes.
[0129] Um ácido nucleico pode compreender a sequência de nu- cleotídeos de um vetor de expressão que compreende um óperon tmp que inclui um gene de metil transferase e um gene de redutase. Tais vetores podem incluir DpNC1071 (SEQ ID NO: 39), que inclui um ópe- ron tmp de Desulfobacter postgatei; phC1072 (SEQ ID NO: 40), que inclui um óperon tmp de Desulfobacula balticum, pNC1073 (SEQ ID NO: 41), que inclui um óperon tmp de Desulfobacula toluolica; PNC1074 (SEQ ID NO: 42), que inclui um óperon tmp de Marinobacter hydrocarbonclasticus; e phNC1076 (SEQ ID NO: 43), que inclui um ópe- ron tmp de Thiohalospira halophila.
[0130] Em algumas modalidades, o ácido nucleico codifica uma proteína de fusão que inclui uma metil transferase e uma redutase ou fragmentos destas. No contexto da presente invenção, "proteína de fusão" refere-se a uma única molécula de proteína que contém duas ou mais proteínas distintas ou seus fragmentos, ligadas covalentemen- te através da ligação peptídica em uma única cadeia peptídica. Em algumas modalidades, a proteína de fusão compreende domínios en- zimaticamente ativos de uma proteína de metil transferase e de uma proteína de redutase. O ácido nucleico também pode codificar um pep- tídeo ligante entre a metil transferase e a redutase. Em algumas moda- lidades, o peptídeo ligante compreende a sequência de aminoácidos
AGGAEGGNGGGA. O ligante pode compreender cerca de ou pelo menos cerca de 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 ou 30 aminoácidos ou qualquer faixa aí derivável. O ácido nucleico pode compreender qualquer um dos genes de metil transferase e de redutase descritos no presente documento, e a proteína de fusão codificada pelo ácido nu- cleico pode compreender qualquer uma das proteínas de metil transfe- rase e de redutase descritas no presente documento, incluindo seus fragmentos biologicamente ativos. Em algumas modalidades, a proteí- na de fusão é uma proteína de tmpA-B, em que a proteína de tmpA fica mais perto do N-terminus do que a proteína de tmpB.
3. Composições
[0131] Vários aspectos da invenção referem-se às composições produzidas pelas células descritas no presente documento. A compo- sição pode ser uma composição de óleo que compreende cerca de, pelo menos cerca de ou no máximo cerca de 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 714%, 175%, 16%, 17%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100% em peso de lipídios. À composição pode compreender (metil)lipídios ramificados e/ou lipídios substituídos por exometilenos. O (metil)lipídio ramificado pode ser um ácido carboxílico (por exemplo, o ácido 10-metil esteárico, o ácido 10- metil palmítico, o ácido 12-metil oleico, o ácido 13-metil oleico, o ácido 10-metil-octadec-12-enoico), carboxilato (por exemplo, estearato de 10-metila, palmitato de 10-metila, oleato de 12-metila, oleato de 13- metila, 10-metil-octadec-12-enoato), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), tioéster (por exemplo, 10-metil estearil CoA, 10-metil palmitil CoA, 12-metil oleoil CoA, 13-metil oleoil CoA, 10-metil- octadec-12-enoil CoA) ou amida. O lipídio substituído por exometileno pode ser um ácido carboxílico (por exemplo, o ácido 10-metileno es- teárico, o ácido 10-metileno palmítico, o ácido 12-metileno oleico, o ácido 13-metileno oleico, o ácido 10-metileno-octadec-12-enoico), car- boxilato (por exemplo, estearato de 10-metileno, palmitato de 10- metileno, oleato de 12-metileno, oleato de 13-metileno, 10-metileno- octadec-12-enoato), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), ticéster (por exemplo, 10-metileno estearil CoA, 10- metileno palmitil CoA, 12-metileno oleoil CoA, 13-metileno oleoil CoA, 10-metileno-octadec-12-enoil CoA) ou amida. 10-metil lipídios, 10- metileno lipídios, ou ambos. É contemplado especificamente que um ou mais dos lipídios acima podem ser excluídos de determinadas mo- dalidades.
[0132] Em alguns aspectos, a composição é produzida mediante o cultivo de uma cultura que compreende qualquer uma das células des- critas no presente documento e que recuperação da composição de óleo da cultura de células. As células na cultura podem conter qual- quer dos genes de metil transferase recombinantes descritos no pre- sente documento e/ou qualquer um dos genes de redutase recombi- nantes descritos no presente documento. O meio de cultura e as con- dições podem ser escolhidos com base na espécie da célula a ser cul- tivada e podem ser otimizados para obter uma produção máxima do perfil de lipídio desejado.
[0133] São conhecidos vários métodos para a recuperação de uma composição de óleo de uma cultura de células. Por exemplo, os lipídios, os derivados de lipídios e os hidrocarbonetos podem ser extra- ídos com um solvente hidrofóbico tal como o hexano. Os lipídios e os derivados de lipídios também podem ser extraídos ao usar a liquefa- ção, a liquefação de óleo, e a extração de CO» supercrítica. O proces- so de recuperação pode incluir a colheita das células cultivadas, tal como por meio de filtração ou centrifugação, lise de células para criar um lisato, e extração dos componentes de lipídio/hidrocarboneto ao usar um solvente hidrofóbico.
[0134] Além de acumular dentro das células, os lipídios descritos no presente documento podem ser secretados pelas células. Nesse caso, um processo para recuperar o lipídio pode não requerer a cria- ção de um lisato das células, mas a coleta do lipídio secretado do meio de cultura. Desse modo, as composições descritas no presente docu- mento podem ser obtidas mediante o cultivo de uma célula que secre- ta um dos lipídios descritos no presente documento, tal como um ácido graxo linear com um comprimento de cadeia de 14 a 18 carbonos com uma ramificação de metila na posição A9, A10 ou A11.
[0135] Em algumas modalidades, a composição de óleo compre- ende cerca de, pelo menos cerca de ou no máximo cerca de 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 14%, 15%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso de (metil)lipídio ramificado, tal como um 10-metil ácido graxo ou qualquer faixa aí derivável. Em algumas modalidades, os ácidos 10-metil graxos compreendem cerca de, pelo menos cerca de ou no máximo cerca de 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 173%, T4%, T5%, 16%, 177%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,
96%, 97%, 98% ou 99% em peso dos ácidos graxos na composição ou qualquer faixa aí derivável.
[0136] A quantidade dos ácidos 10-metil graxos em uma célula pode otimizada por vários métodos. Por exemplo, o aumento da ex- pressão de tmpA e/ou tmpB pode aumentar a atividade da metil trans- ferase e/ou da redutase dentro da célula, o que pode conduzir à acu- mulação de maiores quantidades de (metil)lipídios ramificados. Uma maneira para que isto possa ser realizado é o aumento do número de cópias de gene na célula, tal como a inclusão dos genes em plasmí- deo de elevado número de cópias. Adicional ou alternativamente, as células de tmpA e/ou tmpB podem ser operavelmente ligadas a um promotor que dirige níveis elevados de expressão.
4. Métodos de produção de (metil)lipídio ramificado
[0137] Vários aspectos da invenção referem-se a um método de produção de (metil)lipídio ramificado. O método pode compreender a incubação de uma célula ou uma pluralidade de células tal como des- crito no presente documento, supra, com meios. Os meios podem ser opcionalmente suplementados com um ácido graxo insaturado não ramificado, tal como o ácido oleico, que serve como um substrato para a metilação. O substrato pode incluir um ou mais ácidos graxos de 14 a 18 carbonos de comprimento com uma ligação dupla na posição A9, A10 ou A11. O substrato pode ter 14, 15, 16, 17 ou 18 carbonos de comprimento ou qualquer faixa aí derivável. Os meios podem ser opci- onalmente suplementados com metionina ou s-adenosil metionina, que podem servir similarmente como um substrato. Desse modo, o método pode compreender a colocação de uma célula ou uma pluralidade de células em contato com ácido oleico (ou algum outro substrato a ser metilado), metionina, ou ambos. O método pode compreender a incu- bação de uma célula ou uma pluralidade de células tal como descrito no presente documento, supra, em um biorreator. O método pode compreender a recuperação dos lipídios das células, tal como pela ex- tração com um solvente orgânico.
[0138] O método pode compreender a desresinação da célula ou da pluralidade de células, por exemplo, para remover as proteínas. O método pode compreender a transesterificação ou a esterificação dos lipídios das células. Um álcool tal como o metanol ou o etanol pode ser usado para a transesterificação ou a esterificação, por exemplo, desse modo produzindo um éster metílico de ácido graxo ou um éster etílico de ácido graxo.
[0139] A presente invenção será descrita em maiores detalhes por meio de exemplos específicos. Os exemplos a seguir são oferecidos para finalidades ilustrativas somente, e não se prestam a limitar a in- venção de nenhuma maneira. Os elementos versados no estado da técnica irão reconhecer de imediato uma variedade de parâmetros não críticos que podem ser mudados ou modificados para atingir essenci- almente os mesmos resultados. Exemplo 1 Identificação de Genes de tmpB e tmpA em Gammaproteobacteria
[0140] É sabido que as Gammaproteobacteria selecionadas pro- duzem ácidos 10-metil graxos ramificados. Foi relatado que as bacté- rias Desulfobacter que oxidam acetato e reduzem sulfato produzem o ácido 10-metil hexadecanoico a 6% - 24% do teor total de ácido graxo ligado com éster fosfolipídio (Dowling, Microbiology 132:1815-25 (1986)). Há outros relatórios de produção de ácido 10-metil graxo rami- ficado para as bactérias dos gêneros Marinobacter (Márquez, J. Syst. Evol. Microbiol. 55:1349-51 (2005); Huu, Int. J. Syst. Evol. Microbiol. 49:367-75 (1999); Gauthier, Int. J. Int. Syst. Evol. Microbiol. 42:568-76 (1992); Thiohalospira (Sorokin, Int. J. Syst. Evol. Microbiol., 58:2890- 97 (2008)), Thiohalorhabdus (Sorokin, Int. J. Syst. Evol. Microbiol.
58:2890-97 (2008)), Desulfobacula, e Desulfotignum (Kuever, Int. J. Syst. Evol. Microbiol. 51:171-77 (2001)). No entanto, nenhum gene ou enzima envolvido na produção de ácido 10-metil graxo de Gammapro- teobacteria foi descrito. Neste exemplo, é descrito um par de genes filogeneticamente distintos com homologia de sequência em determi- nadas Gammaproteobacteria que dirigem a produção direta de ácidos 10-metil graxos em hospedeiros heterólogos.
[0141] Uma lista de Gammaproteobacteria que produzem ácidos 10-metil graxos e têm genomas arranjados em sequência foi compila- da a partir de relatórios da literatura. Além disso, as Gammaproteobac- teria representativas que não são relatadas como produtoras de ácidos 10-metil graxos foram incluídas para fins de comparação. De acordo com um estudo bioquímico na bactéria Mycobacterium phlei não rela- tado usando preparados de enzima não purificados, a primeira etapa da síntese de ácido 10-metil graxo ocorre através de um mecanismo similar à síntese de ácido ciclopropano graxo e é seguida por uma etapa de redução enzimática (Akamatsu, J. Biol. Chem. 245:701-08 (1970)). Para encontrar genes candidatos responsáveis pela produção de ácido 10-metil graxo de Gammaproteobacteria, genomas foram es- caneados quanto a homólogos de sintase de acil fosfolipídio graxa (cfa) de E. coli (cfa), que é responsável pela metilação de ácidos gra- xos insaturados para produzir ácidos ciclopropano graxos (Wang, Bio- chemistry 31:11020-28 (1992); Taylor, Biochemistry 18:3292-3300 (1979)). Isto foi executado ao usar a ferramenta de análise de proteína NCBI BLAST e o banco de dados genomico BioCyc (Caspi, Nucleic Acids Res. 40:D742-53 (2016)). Em seguida, os homólogos de cfa fo- ram escaneados quanto a genes adjacentes em uma estrutura de ópe- ron que tinha homologia a uma função de oxidorredutase ou de trans- ferência de elétrons. É interessante observar que todas as Gammapro- teobacteria com capacidade de produzir ácidos 10-metil graxos possu-
íam um óperon de gene (indicado no presente documento como ópe- ron de tmp) com um homólogo de gene de sintase de ácido ciclopro- pano graxo (indicado no presente documento como tmpB) e um gene com homologia a uma redutase de geranilgeranil (indicada no presente documento como tmpA). Estes resultados são resumidos na Figura 2. É improvável que a tmpA seja uma redutase de geranilgeranil verda- deira, uma vez que a enzima está envolvida na biossíntese de clorofila e tocoferol, componentes químicos nenhum dos quais as bactérias produzem. Exemplo 2 Expressão de E. coli de Produtos de Genes de tmpB e de tmpA
[0142] Para testar se o óperon do gene de tmp era responsável pela produção de ácido 10-metil graxo de Gammaproteobacteria, os genes foram projetados em um vetor de expressão de E. coli ao usar o software de manipulação de DNA A Plasmid Editor e sintetizados por Thermofisher Scientific-GeneArt. O uso do códon nativo dos genes de tmp não foi alterado. A transcrição do gene de tmpB foi controlada ao usar o promotor tac constitutivamente ativo (de Boer 1983), seguido pela região de ligador intergenes lacZ-lacY de E. coli, pelo gene de tmpA, e pelo terminador do gene de trpT' (Wu 1981). Esses óperons de genes sintéticos foram clonados em um vetor de expressão de E. coli que contém o gene de resistência a ampicilina AMpR e a origem ColE1 da replicação (Figuras 3A-3B). Os vetores de plasmídeo são nomeados pNC1071 (SEQ ID NO: 39), que inclui o óperon de tmp de Desulfobacter postgatei; pNC1072 (SEQ ID NO: 40), que inclui o ópe- ron de tmp de Desulfobacula balticum; pnC1073 (SEQ ID NO: 41), que inclui o óperon de tmp de Desulfobacula toluolica; pNC1074 (SEQ ID NO: 42), que inclui o óperon de tmp de Marinobacter hydrocarbonclas- ticus; e pnC1076 (SEQ ID NO: 43), que inclui o óperon de tmp de Thiohalospira halophila.
[0143] Os plasmídeos pNC1071, pNC1072, pNC1073, pNC1074, PNC1076, e o plasmídeo de controle pNC53 que contém o gene de AmpR, a origem ColE1, e o promotor tac foram transformados em Top10 de E.coli (Invitrogen) ao usar um protocolo de eletrotransforma- ção padrão que utiliza 50 ul de células suspensas, 1 ul de DNA de plasmídeo a uma concentração de 200 ng por ul, uma cubeta de ele- trotransformação com uma abertura de 1 mm, e um pulso com uma voltagem de 1,8 kV, 200 O, e 25 yuF com deterioração exponencial e uma constante de tempo de cerca de 4,5 milissegundos. Durante o protocolo, as células foram mantidas no gelo e a cubeta foi previamen- te esfriada antes da pulsação com Gene Pulser Electroporation Sys- tem da Bio-Rad. Depois da pulsação, as células foram transferidas a um meio de 1 ml de SOC e incubadas a 37ºC por 1 hora antes do chapeamento em ágar LB contendo 100 ug por ml do antibiótico ampi- cilina.
[0144] As colônias individuais das placas de transformação foram escolhidas e cultivadas em meios líquidos de 5 ml LB em tubos de plástico Falcon de 14 ml durante toda a noite a 37ºC. Estes foram usados na preparação de frascos de freezer com 0,75 ml de caldo de cultura e 0,75 ml de glicerol/água a 50% que foram armazenados a - 80ºC.
[0145] Os estudos de fermentação foram realizados em um meio de 50 ml LB com 100 ug por ml de ampicilina em frascos de agitação defletidos de 250 ml. 10 ul de material de partida de cultura congelado foram adicionados ao meio e o frasco foi incubado a 37ºC e agitado a 200 rpm em uma incubadora orbital New Brunswick por 24 horas. As células foram colhidas por meio de centrifugação a 4.000 rpm por 15 minutos em um centrifugador clínico Eppendorf 5810 R, resuspensas em 0,5 ml de água deionizada, e congeladas a -80ºC.
[0146] A Figura 6 mostra que E. coli transformadas com pNC1071,
PNC1073, pNC1074, e pNC1076, mas não o controle de vetor vazio (PNC53), produziram ácido 10-metileno hexadecenoico.
[0147] Para testar a faixa do substrato da cadeia de acila para as enzimas de tmpB e tmpA, E. coli transformadas com pNC1074 (óperon de tmp de M. hydrocarbonclausticus) ou pnC1076 (óperon de tmp de T. halophila) foram cultivadas em meio LB suplementado com ampicili- na e 100 mg/l de um dos ácidos graxos indicados na Tabela 1 a se- guir. Depois do cultivo, as células foram colhidas por meio de centrifu- gação, lavadas com água deionizada, ressuspensas em água deioni- zada, e congeladas. As células foram então liofilizadas até secar e usadas para realizar uma reação de transesterificação catalisada com etanol para produzir ésteres metílicos de ácido graxo (FAMA). Essas amostras foram dissolvidas em iso-octano e injetadas em um sistema de cromatografia de gás (Agilent Technologies) equipado com um de- tector de ionização de chama. A Tabela 1 mostra a porcentagem de cada ácido graxo que foi convertido em ácidos graxos ramíificados com metileno e metila. Tabela 1. Conversão de ácido graxo em ácidos graxos ramificados com metileno e metila com E. coli que expressa os genes de tmpB e tmpA de M. hydrocarbonclasticus e T. halophila. o Ecoli+rpNCIO74(impBA — — E.coli+tpNC1076(timpBAde Ácido graxo de M. hydrocarbonclausticus) (T. halophila) porcentagem de porcentagem de conversão conversão datada gg A. -::5mrirssrnns ISA | |] 13:1A12 0% 0% 14:1A9 89% 95% 15:1A10 86% 69% 16:1A9 55% 95% 17:1010 36% 19% 18:106 0% 0% 18:1A9 42% 47%
“o EcolitpNCIO74(timpBA — — E.colitpNC1076(timpBAde | Ácido graxo de M. hydrocarbonclausticus) (T. halophila) porcentagem de porcentagem de conversão conversão qeBaagg ag No222+?gaoaÓAÓ5"“" ,2=JÃM EU] 19:1A7 0% 0% 19:1A10 0% 0% 20:1A5 0% 0% 20:18 0% 0% 20:1A11 0% 0% 22:1013 0% 0% 24:1015 0% 0%
[0148] Tal como mostrado na Tabela 1, a metilação ocorreu em ácidos graxos com 14, 15, 16, 17, e 18 carbonos, e nas posições de ligação dupla 49, 410 e A11. Exemplo 3 Expressão do Gene de tmpB em Levedura
[0149] Para testar a produção dos ácidos 10-metileno graxos pelos genes de tmpB nas leveduras Saccharomyces cerevisiae e Yarrowia lipolytica, os genes que contêm códons bacterianos nativos foram clo- nados em um vetor de superexpressão de Yarrowia padrão. O vetor contém um marcador NAT selecionável e uma origem de replicação de 214 para a manutenção de elevadas cópias em Saccharomyces cerevi- siae. Os plasmídeos resultantes são pnC996 (tmpB de Desulfobacter postgatei), pnNC998 (pmpB de Desulfobacula balticum), pnNC1002 (tmpB de Desulfobacula toluolica), phC1004 (tmpB de Marinobacter hydrocarbonclasticus), pCN1006 (tmpB de Thiohalospira halophila). Para Saccharomyces, os plasmídeos foram transformados em NS20 pelo protocolo de choque térmico padrão. As células individuais das transformações resultantes foram selecionadas e cultivadas ainda em placas de agitação de 96 poços em YPD suplementado com os 50 pg/ml de Nourseotricina por 2 dias a 30º C. Para Yarrowia, os plasmí-
deos foram transformados na cepa NS1009. As cepas transformadas resultantes foram cultivadas em placas de agitação de 96 poços em mio limitado de nitrogênio padrão por 4 dias a 30ºC. Para todos os ex- perimentos de levedura, pelotas de células foram isoladas por meio de centrifugação e secadas por congelamento para a análise de ácido graxo através de cromatografia de gás tal como executado para as amostras de E. coli. O total de ácidos graxos foi medido e a quantida- de total de ácidos graxos de C16 e C18que contêm os intermediários de metileno foi quantificada.
[0150] Resultados: Três genes de tmpB produziram ácidos 10-me- tileno graxos em NS20, Desulfobacula balticum, Marinobacter hydro- carbonclasticus e Thiohalospira halophila (Figura 4). Os genes de tmpB de Marinobacter hydrocarbonclasticus e Thiohalospira halophila puderam produzir ácidos 10-metileno graxos em Yarrowia lipolytica (Figura 5). Exemplo 4 Análise da sequência de tmpB e de tmpA
[0151] As sequências de proteínas de TMpB codificadas pelos ge- nes de tmpB de Desulfobacula balticum, Marinobacter hydrocarbon- clasticus, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum e Marinobacter aquaeolei foram alinhadas com a en- zima de sintase de ácido ciclopropano graxo (Cfa) de Escherichia coli com o programa de software CLUSTAL OMEGA (European Molecular Biology Laboratory, EMBL). As Figuras 7A-D mostram o alinhamento dessas sequências de proteínas e indicam um número de aminoácidos que são conservados nas sequências de proteínas de tmsB, mas não na sequência de Cfa de E. coli. Os aminoácidos a seguir são conser- vados nas proteínas alinhadas de TmMpB, mas não estão presentes na proteína de Cfa de E. coli Y163, T175, R199, E211, G269, Y271,
N313, N319, W389 (número de aminoácido com base na proteína de TmpB de M. hydrocarbonclasticus). A porcentagem de identidade de sequência de cada uma das proteínas alinhadas em comparação a tmpB de M. hydrocarbonclasticus é indicada a seguir: % de identidade da sequência de aminoácidos TmpB de Desulfobacula balticum 37% TmpB de Thiohalospira halophila 58% TmpB de Desulfobacter curvatus 43% TmpB de Desulfobacter phenolica 39% TmpB de Desulfobacula toluolica 39% TmpB de Desulfobacter postgatei 43% TmpB de Halofilum ochraceum 59% TmpB de Marinobacter aquaeolei 88% Cfa de Escherichia coli 46%
[0152] As sequências de proteínas de TMpA codificadas pelos ge- nes de tmpA de Desulfobacula balticum, Marinobacter hydrocarbon- clasticus, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum e Marinobacter aquaeolei foram alinhados com a pro- teína AFO464 de geranilgeranil redutase de Archaeoglobus fulgidus com o programa de software CLUSTAL OMEGA (European Molecular Biology Laboratory, EMBL). As Figuras 8A-D mostram o alinhamento dessas sequências de proteínas e indicam um número de aminoácidos que são conservados nas sequências de proteínas de tmsA, mas não na proteína de geranilgeranil redutase AFO464 de Archaeoglobus ful- gidus. Os aminoácidos a seguir são conservados nas proteínas ali- nhadas TMpA, mas não estão presentes na proteína AFO464 de gera- nilgeranil redutase de Archaeoglobus fulgidus: 18, L22, F37, P38, R39, K41, G45, WA46, P49, G144, C148, P149, E169, E171, L197, 1212, C249, H250, Y252, 1270, G275, L276, E283, A296, A299 (número de aminoáci- do com base na proteína de TMpA de M. hydrocarbonclasticus).
% de identidade da sequência de aminoácidos TmpA de Desulfobacula balticum 33% TmpA de Thiohalospira halophila 57% TmpA de Desulfobacter curvatus 36% TmpA de Desulfobacter phenolica 34% TmpA de Desulfobacula toluolica 34% TmpA de Desulfobacter postgatei 34% TmpA de Halofilum ochraceum 64% TmpA de Marinobacter aquaeolei 83% AFO464 de Archaeoglobus fulgidus 27%
Claims (29)
1. Célula, caracterizada pelo fato de que compreende um gene de metil transferase recombinante que codifica uma proteína de metil transferase de uma bactéria da classe Gammaproteobacteria e um (metil)lipídio ramificado ou então um lipídio substituído por exome- tileno, em que o (metil)lipídio ramificado é um ácido carboxílico, um carboxilato, um éster, um tioéster, ou uma amida; e o (metil)lipídio ramificado compreende uma cadeia alifática ramiíficada saturada ou insaturada que compreende um grupo metila de ramificação; ou o lipídio substituído por exometileno é um ácido carboxílico, um carboxilato, um éster, um tioéster, ou uma amida; e o lipídio substituído por exometileno compreende uma ca- deia alifática ramificada; e a cadeia alifática é ramificada porque a cadeia alifática é substituída por um grupo exometileno.
2. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que o (metil)lipídio ramificado ou o lipídio substituído por exometileno é um ácido graxo de 14 a 18 carbonos de comprimento com uma porção metila na posição A9, A10 ou 411.
3. Célula de acordo com a reivindicação 2, caracterizada pelo fato de que o (metil)lipídio ramificado é 10-metil estearato, ou um éster, um tioéster, ou uma amida do mesmo ou o lipídio substituído por exometileno é 10-metileno estearato, ou um éster, um tioéster, ou uma amida do mesmo.
4. Célula de acordo com a reivindicação 3, caracterizada pelo fato de que o (metil)lipídio ramificado ou o lipídio substituído por exometileno é um diacil glicerol, triacil glicerol, ou fosfolipídio, e em que o diacil glicerol, o triacil glicerol ou o fosfolipídio compreende um éster de 10-metil estearato.
5. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a proteína de metil transferase é selecionada da en- zima tmpB de Desulfobacula balticum, da enzima tmpB de Marinobacter hydrocarbonclasticus, ou da enzima tmpB de Thiohalospira halophila.
6. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a proteína de metil transferase tem uma identidade de sequência de pelo menos 90% com a SEQ ID NO: 2, a SEQ ID NO: 4, ou a SEQ ID NO: 6.
7. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que ainda compreende um gene de redutase recombinan- te que codifica uma proteína de redutase de uma bactéria da classe Gammaproteobacteria.
8. Célula de acordo com a reivindicação 7, caracterizada pelo fato de que a proteína de redutase tem a capacidade de converter um lipídio substituído por metileno em um lipídio substituído por metila.
9. Célula de acordo com a reivindicação 8, caracterizada pelo fato de que o lipídio substituído por metileno é um ácido graxo de 14 a 18 carbonos de comprimento com uma substituição de metileno na posição A9, A10 ou A11 e o lipídio substituído por metila é um ácido graxo de 14 a 18 carbonos de comprimento com uma porção metila na posição A9, A10 ou A11.
10. Célula de acordo com a reivindicação 7, caracterizada pelo fato de que a proteína de redutase é selecionada da enzima tmpB de Desulfobacula balticum, da enzima tmpB de Marinobacter hydro- carbonclasticus, ou da enzima tmpB de Thiohalospira halophila.
11. Célula de acordo com a reivindicação 7, caracterizada pelo fato de que a proteína de redutase tem uma identidade de se- quência de pelo menos 90% com a SEQ ID NO: 20, a SEQ ID NO: 22, ou a SEQ ID NO: 24.
12. Célula de acordo com a reivindicação 7, caracterizada pelo fato de que o gene de metil transferase e o gene de redutase são incluídos em uma única estrutura de leitura aberta que codifica uma proteína de fusão que compreende a proteína de metil transferase e a proteína de redutase.
13. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos cerca de 1% a cerca de 15% em peso dos ácidos graxos da célula consistem em ácidos graxos de 10-metila ou ácidos graxos de 10-metileno.
14. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a célula não contém um gene endógeno de metil transferase.
15. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a célula não tem a capacidade endógena de produzir o (metil)lipídio ramificado ou o lipídio substituído por exometileno.
16. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a célula é uma célula de bactéria, uma célula de fun- go, uma célula de alga, uma célula de mofo, uma célula de planta, ou uma célula de levedura.
17. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a célula é selecionada do grupo que consiste em Ar- xula, Aspegillus, Aurantiochytrium, Candida, Claviceps, Cryptococcus, Cunninghamella, Geotrichum, Hansenula, Kluyveromyces, Kodamaea, Leucosporidiella, Lipomyces, Mortierella, Ogataea, Pichia, Prototheca, Rhizopus, Rhodosporidium, Rhodotorula, Saccharomyces, Schizosac- charomyces, Tremella, Trichosporon, Wickerhamomyces e Yarrowia.
18. Célula de acordo com a reivindicação 17, caracterizada pelo fato de que a célula é selecionada do grupo que consiste em Ar- xula adeninivorans, Aspergillus niger, Aspergillus orzyae, Aspergillus terreus, Aurantiochytrium limacinum, Candida utilis, Claviceps purpu- rea, Cryptococcus albidus, Cryptococcus curvatus, Cryptococcus rami-
rezgomezianus, Cryptococcus terreus, Cryptococcus wieringae, Cun- ninghamella echinulata, Cunninghamella japonica, Geotrichum fermen- tans, hansenula polymorpha, Kluyveromyces lactis, Kluyveromyces marxianus, Kodamaea ohmeri, Leucosporidiella creatinivora, Li- pomyces lipofer, Lipomyces starkeyi, Lipomyces tetrasporus, Mortierel- la isabellina, Mortierella alpina, Ogataea polymorpha, Pichia ciferrii, Pichia guilliermondii, Pichia pastoris, Pichia stipites, Prototheca zopfii, Rhizopus arrhizus, Rhodosporidium babjevae, Rhodosporidium toruloi- des, Rhodosporidium paludigenum, Rhodotorula glutinis, Rhodotorula mucilaginosa, Saccharomyces cerevisiae, Schizosaccharomyces pom- be, Tremella enchepala, Tichosporon cutaneum, Trichosporon fermen- tans, Wickerhamomyces ciferrii e Yarrowia lipolytica.
19. Método de produção de um (metil)lipídio ramificado ou um lipídio substituído por exometileno, caracterizado pelo fato de que compreende a colocação da célula como definida em qualquer uma das reivindicações 1 a 18 em contato com um substrato de ácido graxo, meti- onina, ou um substrato de ácido graxo e metionina, em que o substrato de ácido graxo compreende um ácido graxo de 14 a 18 carbonos de comprimento com uma ligação dupla na posição A9, A10 ou 411.
20. Ácido nucleico, caracterizado pelo fato de que compre- ende um gene de metil transferase recombinante que codifica uma proteína de metil transferase de uma bactéria da classe Gammaprote- obacteria e um primeiro promotor ligou operavelmente ao gene de me- til transferase recombinante.
21. Ácido nucleico de acordo com a reivindicação 20, carac- terizado pelo fato de que o gene de metil transferase tem uma identi- dade de sequência de pelo menos 80% com a SEQ ID NO: 1, a SEQ ID NO: 3, ou a SEQ ID NO: 5.
22. Ácido nucleico de acordo com a reivindicação 20, carac- terizado pelo fato de que o gene de metil transferase codifica uma pro-
teína que tem uma identidade de sequência de pelo menos 90% com a SEQ ID NO: 2, a SEQ ID NO: 4, ou a SEQ ID NO: 6.
23. Ácido nucleico de acordo com a reivindicação 20, carac- terizado pelo fato de que o gene de metil transferase é otimizado no códon para a expressão em levedura, algas ou plantas.
24. Ácido nucleico de acordo com a reivindicação 20, carac- terizado pelo fato de que ainda compreende um gene de redutase que codifica uma proteína de redutase de uma bactéria da classe Gamma- proteobacteria.
25. Ácido nucleico de acordo com a reivindicação 24, carac- terizado pelo fato de que o gene de redutase tem uma identidade de sequência de pelo menos 80% com a SEQ ID NO: 19, a SEQ ID NO: 21, ou a SEQ ID NO: 23.
26. Ácido nucleico de acordo com a reivindicação 24, carac- terizado pelo fato de que o gene de redutase codifica uma proteína que tem uma identidade de sequência de pelo menos 90% com a SEQ ID NO: 20, a SEQ ID NO: 22, ou a SEQ ID NO: 24.
27. Ácido nucleico de acordo com a reivindicação 24, carac- terizado pelo fato de que o gene de redutase é fundido na estrutura com o gene de metil transferase.
28. Ácido nucleico de acordo com a reivindicação 27, carac- terizado pelo fato de que ainda compreende uma sequência de ligante de ácido nucleico entre o gene de metil transferase e o gene de redu- tase, em que a sequência de ligantes de ácido nucleico codifica um peptídeo do ligante entre a proteína de metil transferase e a proteína de redutase.
29. Ácido nucleico de acordo com a reivindicação 24, carac- terizado pelo fato de que o gene de redutase é ligado operavelmente a um segundo promotor.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762561136P | 2017-09-20 | 2017-09-20 | |
US62/561,136 | 2017-09-20 | ||
PCT/US2018/051919 WO2019060527A1 (en) | 2017-09-20 | 2018-09-20 | HETEROLOGOUS PRODUCTION OF 10-METHYLSTEARIC ACID BY CELLS EXPRESSING RECOMBINANT METHYLTRANSFERASE |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112020005278A2 true BR112020005278A2 (pt) | 2020-09-24 |
Family
ID=63878797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112020005278-7A BR112020005278A2 (pt) | 2017-09-20 | 2018-09-20 | produção heteróloga de ácido 10-metil esteárico por células que expressam metil transferase recombinante |
Country Status (5)
Country | Link |
---|---|
US (2) | US11236373B2 (pt) |
EP (1) | EP3684896A1 (pt) |
BR (1) | BR112020005278A2 (pt) |
CA (1) | CA3076321A1 (pt) |
WO (1) | WO2019060527A1 (pt) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11208649B2 (en) | 2015-12-07 | 2021-12-28 | Zymergen Inc. | HTP genomic engineering platform |
US9988624B2 (en) | 2015-12-07 | 2018-06-05 | Zymergen Inc. | Microbial strain improvement by a HTP genomic engineering platform |
CN111690587B (zh) * | 2019-03-13 | 2022-10-25 | 上海凯赛生物技术股份有限公司 | 一种离心筛选具有高含油率油脂酵母菌株的方法及其应用 |
CA3182342A1 (en) | 2020-05-11 | 2021-11-18 | Lallemand Hungary Liquidity Management Llc | Recombinant yeast host cell expressing an hydrolase |
CN114807080A (zh) * | 2022-05-16 | 2022-07-29 | 上海交通大学 | 一种催化小分子羧酸甲酯化的甲基转移酶及其应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US7166766B1 (en) | 2000-04-03 | 2007-01-23 | Total Raffinage Distribution S.A. | Method for producing branched fatty acids using genetically modified plants |
EP3172314A4 (en) | 2014-07-25 | 2018-04-18 | Novogy Inc. | Promoters derived from yarrowia lipolytica and arxula adeninivorans, and methods of use thereof |
EP3230446A4 (en) | 2014-12-10 | 2018-09-05 | Novogy, Inc. | Oleic acid production in yeast |
US10457963B2 (en) * | 2016-09-20 | 2019-10-29 | Novogy, Inc. | Heterologous production of 10-methylstearic acid |
-
2018
- 2018-09-20 BR BR112020005278-7A patent/BR112020005278A2/pt unknown
- 2018-09-20 US US16/648,117 patent/US11236373B2/en active Active
- 2018-09-20 WO PCT/US2018/051919 patent/WO2019060527A1/en unknown
- 2018-09-20 CA CA3076321A patent/CA3076321A1/en active Pending
- 2018-09-20 EP EP18788933.2A patent/EP3684896A1/en active Pending
-
2022
- 2022-01-30 US US17/649,365 patent/US20220340939A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20200231998A1 (en) | 2020-07-23 |
US20220340939A1 (en) | 2022-10-27 |
EP3684896A1 (en) | 2020-07-29 |
US11236373B2 (en) | 2022-02-01 |
WO2019060527A1 (en) | 2019-03-28 |
CA3076321A1 (en) | 2019-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112020005278A2 (pt) | produção heteróloga de ácido 10-metil esteárico por células que expressam metil transferase recombinante | |
US7901928B2 (en) | Acyltransferases for alteration of polyunsaturated fatty acids and oil content in oleaginous yeasts | |
JP4718477B2 (ja) | 油性酵母中において多価不飽和脂肪酸レベルを変更するのに適したδ12デサチュラーゼ | |
JP5656836B2 (ja) | 油性生物中の含油量の変更のためのsnf1タンパク質キナーゼ活性の操作 | |
US10975398B2 (en) | Heterologous production of 10-methylstearic acid | |
WO2006052814A2 (en) | A mortierella alpina diacylglycerol acyltransferase for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms | |
JP2007525969A (ja) | 油性酵母における遺伝子発現のためのグリセルアルデヒド−3−リン酸脱水素酵素およびホスホグリセリン酸ムターゼプロモーター | |
JP2008524984A (ja) | 油性生物体中の多価不飽和脂肪酸および含油量変更のためのジアシルグリセロールアシルトランスフェラーゼ | |
WO2006052807A2 (en) | A dna molecule of mortierella alpina lpaat homolog | |
AU2014229307B2 (en) | Engineering microorganisms | |
JP2023027261A (ja) | 中鎖脂肪酸誘導体の生産のための改良された活性を有するチオエステラーゼ変種 | |
Cheng et al. | Cloning and functional analysis of putative malonyl-CoA: acyl-carrier protein transacylase gene from the docosahexaenoic acid-producer Schizochytrium sp. TIO1101 | |
JP2015512643A (ja) | 脂質生成を増大させるための遺伝子組換えヤロウィア属(Yarrowia)中における細胞質リンゴ酸酵素の発現 | |
US10131897B2 (en) | Molecules associated with fatty acid biosynthetic pathways and uses thereof | |
US20240060100A1 (en) | Processes for production of alkylated fatty acids and derivatives thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B25A | Requested transfer of rights approved |
Owner name: GINKGO BIOWORKS, INC. (US) |
|
B350 | Update of information on the portal [chapter 15.35 patent gazette] | ||
B06W | Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette] |