BR112020005278A2

BR112020005278A2 - produção heteróloga de ácido 10-metil esteárico por células que expressam metil transferase recombinante

Info

Publication number: BR112020005278A2
Application number: BR112020005278-7A
Authority: BR
Inventors: Arthur J. Shaw; Hannah Blitzblau; Donald V. Crabtree
Original assignee: Novogy, Inc.
Priority date: 2017-09-20
Filing date: 2018-09-20
Publication date: 2020-09-24
Also published as: US20200231998A1; US20220340939A1; EP3684896A1; US11236373B2; WO2019060527A1; CA3076321A1

Abstract

A presente invenção refere-se a células, ácidos nucleicos e proteínas que podem ser usados para produzir (metil)lipídios ramificados, tais como ácidos 10-metil esteárico, e as composições que incluem tais lipídios. As células descritas no presente documento compreendem genes de metil transferase e/ou redutase de bactérias da classe Gammaproteobacteria, que codificam as enzimas que têm capacidade de catalisar a produção de (metil)lipídios ramificados a partir de lipídios insaturados não ramificados. Os (metil)lipídios ramificados saturados produzidos ao usar as modalidades da presente invenção têm uma fluidez a baixa temperatura favorável e uma estabilidade oxidativa favorável, que são propriedades desejáveis para lubrificantes e fluidos de especialidades.

Description

Relatório Descritivo da Patente de Invenção para "PRODU- ÇÃO HETERÓLOGA DE ÁCIDO 10-METIL ESTEÁRICO POR CÉLU- LAS QUE EXPRESSAM METIL TRANSFERASE RECOMBINANTE".

DESCRIÇÃO REFERÊNCIA REMISSIVA A PEDIDOS RELACIONADOS

[0001] O presente pedido de patente reivindica o benefício da prio- ridade ao Pedido de Patente Provisório U.S. no. de série 62/561.136, depositado em 20 de setembro de 2017, incorporado ao presente do- cumento a título de referência em sua totalidade.

[0002] Este pedido de patente está é relacionado aos Pedidos de Patente U.S. no. de série 15/710.734 e PCT/US17/52491, ambos de- positados em 20 de setembro de 2017.

ANTECEDENTES DA INVENÇÃO A. Campo da Invenção

[0003] A invenção refere-se de maneira geral à produção de (me- til)lipídios ramificados por células que expressam metil transferases e/ou redutases recombinantes derivadas de Gammaproteobacteria. B. Descrição da Técnica Relacionada

[0004] Os ácidos graxos derivados de óleos de plantas agrícolas e animais encontram uso como lubrificantes industriais, fluidos hidráuli- cos, graxas, e outros líquidos de especialidades além de materiais de partida oleoquímicos para processamento. As propriedades físicas e químicas desses ácidos graxos resultam em grande parte de seus comprimentos da cadeia de carbono e número de ligações duplas in- saturadas. Os ácidos graxos são tipicamente 16:0 (dezesseis carbo- nos, nenhuma ligação dupla), 16:1 (dezesseis carbonos, 1 ligação du- pla), 18:0, 18:1, 18:2 ou 18:3. É importante observar que os ácidos graxos sem nenhuma ligação dupla (saturada) têm uma elevada esta- bilidade oxidativa, mas solidificam a baixas temperaturas. As ligações duplas melhoram a fluidez a baixas temperaturas, mas diminuem a estabilidade oxidativa. Essa alternativa acarreta desafios para o lubrifi- cante e as outras formulações de fluidos de especialidades, uma vez que o desempenho a longo prazo consistente (elevada estabilidade oxidativa) em uma faixa ampla de temperaturas operacionais é dese- jável. Os óleos de ácidos graxos altamente (oleicos) 18:1 conferem uma fluidez a baixas temperaturas com uma estabilidade oxidativa re- lativamente boa. Por conseguinte, vários produtos comerciais, tais co- mo o óleo de soja altamente oleico, o óleo de girassol altamente olei- co, e o óleo de alga altamente oleico, foram desenvolvidos com com- posições altamente oleicas. No entanto, o ácido oleico é um alceno, e sujeito à degradação oxidativa.

[0005] Uma alternativa superior é a adição de uma ramificação de metila totalmente saturada à cadeia de ácido graxo. Isto cria uma de- pressão similar da temperatura de fusão como uma ligação dupla, mas sem nenhuma diminuição na estabilidade oxidativa contra ácidos gra- xoOs lineares totalmente saturados. As ramificações de metila localiza- das perto do meio da cadeia de ácido graxo têm a maior depressão da temperatura de fusão. Vários processos químicos foram explorados para introduzir ramificações de metila; no entanto, o método industrial preferido resulta na colocação aleatória da ramificação de metila e cria uma quantidade substancial de subprodutos. Continua havendo uma necessidade quanto a processos eficientes e econômicos de produção de (metil)lipídios ramificados.

SUMÁRIO DA INVENÇÃO

[0006] No presente documento são divulgadas células, ácidos nu- cleicos e proteínas que podem ser usados na produção de (me- til)lipídios ramificados, tais como o ácido 10-metil esteárico, e as com- posições que incluem tais lipídios. Os (metil)lipídios ramificados satu- rados produzidos ao usar as modalidades da presente invenção têm uma fluidez a baixa temperatura favorável e uma estabilidade oxidativa favorável, que são propriedades desejáveis para lubrificantes e fluidos de especialidades.

[0007] Vários aspectos referem-se a ácidos nucleicos que com- preendem um gene de tmpB recombinante que codifica uma proteína de metil transferase e/ou um gene de tmpA recombinante que codifica uma proteína de redutase. A proteína de metil transferase e/ou a pro- teína de redutase podem ser proteínas expressas pela espécie da classe Gammaproteobacteria (filo, Proteobacteria), e o gene de tmpB recombinante e/ou o gene de tmpA recombinante podem ser otimiza- dos no códon para a expressão em um filo diferente de bactérias ou em eucariotas (por exemplo, levedura, tal como Arxula adeninivorans (também conhecida como Blastobotrys adeninivorans ou Trichosporon adeninivorans), Saccharomyces cerevisiae ou Yarrowia lipolytica). O gene de tmpB recombinante ou o gene de tmpA recombinante podem ser operavelmente ligados a um promotor com capacidade de dirigir a expressão em um filo de bactérias que não Gammaproteobacteria ou em eucariotas (por exemplo, levedura). O ácido nucleico pode ser um plasmídeo ou um cromossoma.

[0008] Alguns aspectos referem-se a uma célula que compreende um ácido nucleico tal como descrito no presente documento. A célula pode compreender um (metil)lipídio ramificado, tal como o ácido 10- metil esteárico e/ou um lipídio substituído por exometileno, tal como o ácido 10-metileno esteárico. A célula pode ser uma célula eucariótica, tal como uma célula de alga, uma célula de levedura ou uma célula de planta.

[0009] Alguns aspectos referem-se a uma composição produzida mediante o cultivo de uma cultura de células que compreende células tal como descrito no presente documento. A composição de óleo pode compreender um (metil)lipídio ramificado, tal como o ácido 10-metil esteárico, e/ou um lipídio substituído por exometileno, tal como o ácido

10-metileno esteárico. Em algumas modalidades, a composição de óleo é produzida mediante o cultivo de uma cultura de célula e a recu- peração da composição de óleo da cultura de células, em que a com- posição de óleo compreende ácidos 10-metil graxos, e em que os áci- dos 10-metil graxos compreendem pelo menos cerca de 1% em peso do total de ácidos graxos na composição de óleo. Em algumas modali- dades, os ácidos 20-metil graxos compreendem pelo menos cerca de 15% em peso do total de ácidos graxos na composição de óleo.

[0010] Alguns aspectos referem-se a um método de produção de uma composição de óleo, em que o método compreende: o cultivo de uma cultura de células que compreende qualquer uma das células di- vulgadas no presente documento; e a recuperação da composição de óleo da cultura de células. Em algumas modalidades, o método tam- bém compreende a colocação da cultura de células em contato com um substrato que compreende um ácido graxo de 14 a 18 carbonos de comprimento com uma ligação dupla na posição A9, A10 ou A11. Em algumas modalidades, a recuperação da composição de óleo da cultu- ra de células compreende a recuperação dos lipídios que foram secre- tados pela célula. Em algumas modalidades, a produção da composi- ção de óleo compreende a realização de reações químicas ou então a realização de reações químicas nas quais substratos de ácido oleico e metionina são convertidos em ácido 10-metileno esteárico, em que as reações químicas são catalisadas por uma proteína de tmpB. Em al- gumas modalidades, a produção da composição de óleo compreende a realização de reações químicas ou a realização de reações químicas nas quais o ácido 10-metileno esteárico é reduzido em ácido 10-metil esteárico, em que as reações químicas são catalisadas pela proteína de tmpA. Em algumas modalidades, a redução é realizada ao usar NADPH, ferredoxina, flavodoxina, rubredoxina, citocromo c ou combi- nações destes como agentes redutores. Em qualquer um dos métodos divulgados no presente documento que envolvem reações de redução, pode ser usado qualquer um ou qualquer combinação, de NADPH, fer- redoxina, flavodoxina, rubredoxina e citocromo c.

[0011] Outros objetos, características e vantagens da presente in- venção tornar-se-ão aparentes a partir das figuras, descrição detalha- da, e exemplos a seguir. Deve ser compreendido, no entanto, que as figuras, a descrição detalhada e os exemplos, embora indiquem moda- lidades específicas da invenção, são fornecidos apenas a título de ilus- tração e não se prestam a qualquer limitação. Além disso, é contem- plado que mudanças e modificações dentro do caráter e do âmbito da invenção tornar-se-ão aparentes aos elementos versados na técnica a partir desta descrição detalhada.

BREVE DESCRIÇÃO DOS DESENHOS

[0012] A Figura 1 ilustra um possível mecanismo para a conversão de ácido oleico em ácido 10-metil esteárico. Um substrato de ácido oleico pode estar presente como uma cadeia de acila de um gliceroli- pídio ou um fosfolipídio. Um substrato de metionina, que doa o grupo metila, pode estar presente como S-adenosil metionina. Os substratos de ácido oleico e metionina podem ser convertidos em ácido 10- metileno esteárico (por exemplo, presente como uma cadeia de acila de um glicerolipídio ou um fosfolipídio) e homocisteína (por exemplo, presente como S-adenosil homocisteína). Esta reação pode ser catali- sada por uma proteína de tmpB tal como descrito no presente docu- mento, infra. O ácido 10-metileno esteárico (por exemplo, presente como uma cadeia de acila de um glicerolipídio ou um fosfolipídio) pode ser reduzido em ácido 10-metil esteárico. A redução pode ser catalisa- da por uma proteína de tmpA tal como descrito no presente documen- to, infra, por exemplo, sem limitação, ao usar NADPH como um agente redutor. Outros exemplos do agente redutor podem incluir, sem limita- ção, a ferredoxina, a flavodoxina, a rubredoxina, o citocromo c ou as combinações destes. A linguagem do relatório descritivo e das reivin- dicações, no entanto, não são limitadas a nenhum mecanismo de rea- ção particular.

[0013] A Figura 2 mostra a ocorrência de homólogos de sintase de fosfolipídio de acil ciclopropano graxo (cfa) e de ácido 10-metil palmíti- co (10Me16) em certas Gammaproteobacteria com genomas arranja- dos em sequência e perfis de lipídios observados.

[0014] As Figuras 3A-3B ilusttam mapas dos seguintes vetores, que codificam um óperon de tmp: pNC1071 (SEQ ID NO: 39), que in- clui um óperon de tmp de Desulfobacter postgatei; pnNC1072 (SEQ ID NO: 40), que inclui um óperon de tmp de Desulfobacula balticum, PNC1073 (SEQ ID NO: 41), que inclui um óperon de tmp de Desulfo- bacula toluolica; DpNC1074 (SEQ ID NO: 42), que inclui um óperon de tmp de Marinobacter hydrocarbonclasticus; e pnC1076 (SEQ ID NO: 43), que inclui um óperon de tmp de Thiohalospira halophila.

[0015] A Figura 4 é um gráfico que mostra a porcentagem dos áci- dos 10-metileno graxos em Saccharomyces cerevisae transformados com plasmídeos que expressam tmpB da espécie indicada: D. postga- tei (D.po.), D. balticum (D.ba.), D. toluolica (D.to.), M. hydrocarbonclas- ticus (M.hy.) e T. halophila (T.ha.) ou um controle de vetor vazio (-).

[0016] A Figura 5 é um gráfico que mostra a porcentagem dos áci- dos 10-metileno graxos em Yarrowiano lipolytica transformados com os plasmídeos que expressam tmpB da espécie indicada: D. postgatei (D.po.), D. balticum (D.ba.), D. toluolica (D.to.), M. hydrocarbonclasticus (M.hy.) e T. halophila (T.ha.) ou um controle de vetor vazio (-).

[0017] A Figura 6 mostra o perfil do ácido graxo de células Top10 de E. coli com os plasmídeos pNC1071, pNC1072, pNC1073, PNC1074, pNC1076 e pNC53 (vetor de controle vazio) cultivadas no meio LB. Os valores da porcentagem mostram a porcentagem em pe- so do ácido graxo indicado como uma porcentagem de todos os ácidos graxos. 14:0 = ácido mirístico, 16:0 = ácido palmítico, 16:159 = ácido palmitoleico, 16:0cyc = ácido 17A,cis-9,10-metileno hexadecanoico, 10-metileno 16:0 = ácido 10-metileno hexadecenoico, 18:1A511 = ácido vacênico, 18:0 = ácido esteárico, SD = desvio-padrão.

[0018] As Figuras 7A a 7D mostram um alinhamento de CLUSTAL OMEGA das sequências de proteínas de tmpB codificadas pelos ge- nes de tmpB de Desulfobacula balticum, Marinobacter hydrocarbon- clasticus, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum e Marinobacter aquaeolei, junto com a enzima de sin- tase de ácido ciclopropano graxo (Cfa) de Escherichia coli.

[0019] As Figuras 8A a 8D mostram as sequências de uma proteí- na de tmpA de alinhamento de CLUSTAL OMEGA codificadas pelos genes de tmpA de Desulfobacula balticum, Marinobacter hydrocarbon- clasticus, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum e Marinobacter aquaeolei, junto com a proteína de ge- ranilgeranil redutase de Archaeoglobus fulgidus AFO464.

DESCRIÇÃO DETALHADA DA INVENÇÃO A. Definições

[0020] Os artigos "um" e "uma" são usados no presente documen- to para se referir a um ou mais de um (isto é, a pelo menos um) do ob- jeto gramatical do artigo. A título de exemplo, "um elemento" significa um elemento ou mais de um elemento.

[0021] O termo "porção biologicamente ativa" refere-se a uma se- quência de aminoácido que é menor do que uma sequência de amino- ácidos de comprimento total, mas exibe pelo menos uma atividade da sequência de comprimento total. Por exemplo, uma porção biologica- mente ativa de uma metil transferase pode se referir a um ou mais domínios de tmpB que tem uma atividade biológica para converter o ácido oleico (por exemplo, um fosfolipídio que compreende um éster de oleato) e a metionina (por exemplo, a S-adenosil metionina) em ácido 10-metileno esteárico (por exemplo, um fosfolipídio que compre- ende um éster de estearato de 10-metileno). Uma porção biologica- mente ativa de uma redutase pode se referir a um ou mais domínios de tmpA que tem uma atividade biológica para converter o ácido 10- metileno esteárico (por exemplo, um fosfolipídio que compreende um éster de estearato de 10-metileno) e um agente redutor (por exemplo, ferrodoxina, flavodoxina, rubredoxina, citocromo c, NADH, NADPH, FAD, FADH2, FMNH>2) em ácido 10-metil esteárico (por exemplo, um fosfolipídio que compreende um éster de estearato de 10-metila). As porções biologicamente ativas de uma proteína incluem peptídeos ou os polipeptídios que compreendem sequências de aminoácidos sufici- entemente idênticas a ou derivadas da sequência de aminoácidos da proteína, por exemplo, a sequência de aminoácidos indicada nas SEQ ID NOs: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 ou 36, que incluem menos aminoácidos do que a proteína de comprimen- to total, e exibem pelo menos uma atividade da atividade, especial- mente a atividade de metil transferase ou redutase.

Uma porção biolo- gicamente ativa de uma proteína pode compreender, compreender pe- lo menos ou compreender no máximo, por exemplo, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192,

193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500 ou mais aminoácidos ou qualquer faixa aí derivável.

Tipicamente, as porções biologicamente ativas compreendem um domínio ou um moti- vo que tem uma atividade catalítica, tal como a atividade catalítica pa- ra produzir o ácido 10-metileno esteárico ou o ácido 10-metil esteárico.

Uma porção biologicamente ativa de uma proteína inclui as porções da proteína que têm a mesma atividade que o peptídeo de comprimento total e cada porção que tem mais atividade do que a base.

Por exem- plo, uma porção biologicamente ativa de uma enzima pode ter, ter pelo menos ou ter no máximo 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 10%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%, 100%, 100,1%, 100,2%, 100,3%, 100,4%, 100,5%, 100,6%, 100,7%, 100,8%, 100,9%, 101%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145%, 150%, 160%, 170%, 180%, 190%, 200%, 220%, 240%, 260%, 280%, 300%, 320%, 340%, 360%, 380%, 400% ou uma atividade mais ele- vada em relação à enzima de comprimento total (ou qualquer faixa aí derivável). Uma porção biologicamente ativa de uma proteína pode incluir as porções de uma proteína que não têm um domínio que vise a proteína a um compartimento celular.

[0022] Os termos "otimizado no códon" e "otimizado no códon para a célula" referem-se à codificação de sequências de nucleotídeos (por exemplo, genes) que foram alteradas para substituir pelo menos um códon que é relativamente raro em uma célula hospedeira desejada por um códon sinônimo que é relativamente predominante na célula hospedeira. A otimização de códon permite desse modo uma melhor utilização do tRNA de uma célula hospedeira ao combinando os có- dons de um gene recombinante com o tRNA da célula hospedeira. Por exemplo, o uso do códon da espécie Gammaproteobacteria (procario- tas) varia a partir do uso do códon de levedura (eucariotas). A eficiên- cia da tradução em uma célula hospedeira de levedura de um mRNA que codifica uma proteína de Gammaproteobacteria pode ser aumen- tada mediante a substituição dos códons do gene de Gammaprote- obacteria correspondente por códons que são mais predominantes na espécie de levedura particular. Um gene otimizado nos códons tem desse modo uma sequência de nucleotídeos que varia a partir de um gene natural.

[0023] O termo "promotor constitutivo" refere-se a um promotor que media a transcrição de um gene ligado operavelmente indepen- dente de um estímulo particular (por exemplo, independente da pre- sença de um reagente tal como isopropil B-D-1-tiogalactopiranoside).

[0024] O termo "DGAT1" refere-se a um gene que codifica uma proteína de diacil glicerol acil transferase do tipo 1, tal como um gene que codifica uma proteína DGA?2 de levedura.

[0025] O termo "DGAT?2" refere-se a um gene que codifica uma proteína de diacil glicerol acil transferase do tipo 2, tal como um gene que codifica uma proteína DGA1 de levedura.

[0026] "Diacil glicerídeo", "diacil glicerol" e "diglicerídeo" são éste- res que compreendem glicerol e dois ácidos graxos.

[0027] Os termos "diacil glicerol acil transferase" e "DGA" referem- se a qualquer proteína que catalisa a formação de triacil glicerídeos de diacil glicerol. As diacil glicerol acil transferases incluem as diacil glice- rol acil transferases do tipo 1 (DGA1), as diacil glicerol acil transfera- ses do tipo 2 (DGA2Z), e as diacil glicerol acil transferases do tipo 3 (DGA3) e todos os homólogos que catalisam a reação acima mencio- nada.

[0028] Os termos "diacil glicerol acil transferase, tipo 1" e "diacil glicerol acil transferases do tipo 1" referem-se a DGA?2 e aos ortólogos de DGA?2.

[0029] Os termos "diacil glicerol acil transferase, tipo 2" e o "diacil glicerol acil transferase do tipo 2" referem-se a DGA1 e aos ortólogos de DGA1.

[0030] O termo "domínio" refere-se a uma parte da sequência de aminoácidos de uma proteína que pode se desdobrar em uma estrutu- ra tridimensional estável independente da estrutura do restante da pro- teína.

[0031] O termo "fármaco" refere-se a qualquer molécula que inibe o crescimento ou a proliferação de células, propiciando desse modo uma vantagem seletiva às células que contêm um gene que confere resistência ao fármaco. Os fármacos incluem antibióticos, microbici- das, toxinas e pesticidas.

[0032] "Peso seco" e "peso de célula seca" referem-se ao peso determinado na ausência relativa da água. Por exemplo, a referência às células oleaginosas como compreendendo uma porcentagem espe- cífica de um componente particular pelo peso da célula seca significa que a porcentagem é calculada com base no peso da célula depois que substancialmente toda a água foi removida. O termo "% em peso seco", quando se refere a um ácido graxo específico (por exemplo, ácido oleico ou ácido 10-metil esteárico), inclui os ácidos graxos que estão presentes como carboxilatos, ésteres, tioésteres e amidas. Por exemplo, uma célula que compreende o ácido 10-metil esteárico como uma porcentagem de total de ácidos graxos pela % em peso de célula seca inclui o ácido 10-metil esteárico, o estearato de 10-metila, a por- ção estearato de 10-metila de um diacil glicerol que compreende um éster de estearato de 10-metila, a porção estearato de 10-metila de um triacil glicerol que compreende um éster de estearato de 10-metila, a porção estearato de 10-metila de um fosfolipídio que compreende um éster de estearato de 10-metila, e a porção de estearato de 10-metila de estearato de 10-metila CoA. O termo "% em peso seco", quando se refere a um tipo específico de ácido graxo (por exemplo, ácidos graxos C16, ácidos graxos C18), inclui os ácidos graxos que estão presentes como carboxilatos, ésteres, tioésteres e amidas tal como descritos acima (por exemplo, para o ácido 10-metil esteárico).

[0033] O termo "gene", tal como usado no presente documento, pode englobar as sequências genômicas que contêm éxons, em parti- cular as sequências de polinucleotídeos que codificam as sequências de polipeptídios envolvidas em uma atividade específica. O termo também engloba os ácidos nucleicos sintéticos que não derivaram da sequência genômica. Em determinadas modalidades, os genes não contêm íntrons, uma vez que eles são sintetizados com base na se- quência de DNA conhecida de cDNA e na sequência de proteínas. Em outras modalidades, os genes são o cDNA não nativo sintetizado em que os códons foram otimizados para a expressão em Y. lipolytica ou A. adeninivorans com base no uso de códons. O termo também pode incluir as moléculas de ácido nucleico que compreendem sequências de nucleotídeos a montante, a jusante e/ou de íntrons.

[0034] O termo "promotor induzível" refere-se a um promotor que media a transcrição de um gene operavelmente ligado em resposta a um estímulo particular.

[0035] O termo "integrado" refere-se a um ácido nucleico que é mantido em uma célula como uma inserção no genoma da célula, tal como a inserção em um cromossoma, incluindo inserções em um ge- noma de plastídio.

[0036] "Em ligação operável" e "ligado operavelmente" referem-se a uma ligação funcional entre duas sequências de ácidos nucleicos, tais como uma sequência de controle (tipicamente um promotor) e a sequência ligada (tipicamente uma sequência que codifica uma proteí- na, também chamada de uma sequência de codificação). Um promotor está em ligação operável com um gene ou é ligado operavelmente a um gene se ele pode mediar a transcrição do gene.

[0037] O termo "ácido nucleico" refere-se a uma forma polimérica de nucleotídeos de qualquer comprimento, desoxirribonucleotídeos ou ribonucleotídeos ou seus análogos. Os polinucleotídeos podem ter qualquer estrutura tridimensional, e podem executar qualquer função. O que segue são exemplos não limitadores de polinucleotídeos: regi- ões de codificação ou de não codificação de um gene ou fragmento de gene, loci (locus) definidos a partir da análise da ligação, éxons, ín- trons, RNA mensageiro (mMRNA), RNA de transferência, RNA ribosso-

mal, ribozimas, DNA, polinucleotídeos recombinantes, polinucleotídeos ramificados, plasmídeos, vetores, DNA isolado de qualquer sequência, RNA isolado de qualquer sequência, sondas de ácido nucleico, e inici- adores. Um polinucleotídeo pode compreender nucleotídeos modifica- dos, tais como nucleotídeos metilados e análogos de nucleotídeos. Se estiverem presentes, modificações na estrutura do nucleotídeo podem ser providas antes ou depois da montagem do polímero. Um polinu- cleotídeo também pode ser modificado, tal como através da conjuga- ção com um componente de etiquetagem. Em todas as sequências de ácidos nucleicos fornecidas no presente documento, os nucleotídeos U são intercambiáveis com os nucleotídeos T.

[0038] O termo "fosfolipídio" refere-se aos ésteres que compreen- dem glicerol, dois ácidos graxos e um fosfato. O fosfato pode ser cova- lentemente ligado ao carbono-3 do glicerol e não compreender ne- nhuma outra substituição, isto é, o fosfolipídio pode ser um ácido fosfa- tídico. O fosfato pode ser substituído por etanolamina (por exemplo, fosfatidil etanolamina), colina (por exemplo, fosfatidil colina), serina (por exemplo, fosfatidil serina), inositol (por exemplo, fosfatidil inositol), fosfato de inositol (por exemplo, fosfatidil inositol-3-fosfato, fosfatidil inositol-4-fosfato, fosfatidil inositol-5-fosfato), bisfosfato de inositol (por exemplo, fosfatidil inositol-4,5-bisfosfato) ou trifosfato de inositol (por exemplo, fosfatidil inositol-3,4,5-bisfosfato).

[0039] Tal como usado no presente documento, o termo "plasmí- deo" refere-se a uma molécula de DNA circular que é fisicamente se- parada do DNA genômico de um organismo. Os plasmídeos podem ser linearizados antes de serem introduzidos em uma célula hospedei- ra (indicado no presente documento como um plasmídeo linearizado). Os plasmídeos linearizados podem não ser autorreplicantes, mas po- dem se integrar em e ser replicados com o DNA genômico de um or- ganismo.

[0040] Um "promotor" é uma sequência de controle de ácido nu- cleico que dirige a transcrição de um ácido nucleico. Tal como usado no presente documento, um promotor inclui as sequências de ácidos nucleicos necessárias perto do sítio do início da transcrição.

[0041] O termo "proteína" refere-se às moléculas que compreen- dem uma sequência de aminoácidos, em que os aminoácidos são |i- gados por ligações peptídicas.

[0042] "Transformação" refere-se à transferência de um ácido nu- cleico a um organismo hospedeiro ou ao genoma de um organismo hospedeiro, o que resulta em uma herança geneticamente estável. Os organismos hospedeiros que contêm o ácido nucleico transformado são indicados como organismos "recombinantes", "transgênicos" ou "transformados". Desse modo, os ácidos nucleicos da presente inven- ção podem ser incorporados em construtos recombinantes, tipicamen- te construtos de DNA, com a capacidade de introdução em e replica- ção em uma célula hospedeira. Tal construto pode ser um vetor que inclui um sistema de replicação e sequências que têm a capacidade de transcrição e tradução de uma sequência de codificação de polipeptí- dios em uma dada célula hospedeira. Tipicamente, os vetores de ex- pressão incluem, por exemplo, um ou mais genes clonados sob o con- trole transcricional das sequências reguladoras 5' e 3' e um marcador selecionável. Tais vetores também podem conter uma região regulado- ra de promotor (por exemplo, uma região reguladora de controle da expressão indizível ou constitutiva regulada ambientalmente ou de modo desenvolvido ou específica de localização), um sítio de começo de iniciação da transcrição, um sítio de ligação de ribossomo, um sítio de terminação da transcrição, e/ou um sinal de poliadenilação.

[0043] O termo "célula transformada" refere-se a uma célula que é submetida a uma transformação. Desse modo, uma célula transforma- da compreende o genoma do pai e uma modificação genética herdá-

vel.

[0044] Os termos "triacilglicerídeo", "triacil glicerol", "triglicerídeo" e "TAG" são ésteres que compreendem glicerol e três ácidos graxos.

[0045] O termo "gene recombinante" refere-se a um gene que (1) está ligado operavelmente a um polinucleotídeo ao qual não é ligado na natureza ou (2) tem uma sequência de nucleotídeos diferente da sequência de nucleotídeos de ocorrência natural tal como, por exem- plo, de uma mutação que não ocorre naturalmente, uma sequência de códons otimizada ou um DNA que não contém íntrons de ocorrência natural que são encontrados no locus genômico do gene. O termo "re- combinante" pode ser usado em referência aos isolatos de DNA clo- nados, aos análogos de polinucleotídeos quimicamente sintetizados ou aos análogos de polinucleotídeos que são biologicamente sintetizados por sistemas heterólogos, bem como as proteínas e/ou mMRNAs codifi- cados por tais ácidos nucleicos. Desse modo, por exemplo, uma prote- ína sintetizada por um micro-organismo é recombinante se for sinteti- zada de um mMRNA que é sintetizado de um gene recombinante pre- sente na célula. Como outros exemplos, um gene pode ser um gene recombinante se for ligado operavelmente a um promotor diferente do promotor ao qual é ligado operavelmente na natureza ou se for conec- tado a um outro gene ou porção do mesmo e, junto com o outro gene ou parte do mesmo, codifica uma proteína que não é encontrada na natureza, tal como uma proteína de fusão ou uma proteína etiquetada com epítopo. B. Engenharia de Micróbios

1. Visão Global

[0046] Os genes e os produtos de genes podem ser introduzidos em células hospedeiras microbiais. As células hospedeiras apropria- das para a expressão dos genes e das moléculas de ácido nucleico são hospedeiros microbiais que podem ser encontrados amplamente dentro das famílias de fungos ou bactérias. Os exemplos de cepas hospedeiras apropriadas incluem, mas sem ficar a elas limitadas, es- pécies de fungos ou de leveduras, tais como Arxula, Aspegillus, Auran- tiochytrium, Candida, Claviceps, Cryptococcus, Cunninghamella, Han- senula, Kluyveromyces, Leucosporidiella, Lipomyces, Mortierella, Oga- taea, Pichia, Prototheca, Rhizopus, Rhodosporidium, Rhodotorula, Saccharomyces, Schizosaccharomyces, Tremella, trichosporon, Yar- rowia ou espécies de bactérias, tais como membros de proteobacteria e actinomicetes, bem como os gêneros Acinetobacter, Arthrobacter, Brevibacterium, Acidovorax, Bacillus, Clostridia, Streptomyces, Esche- richia, Salmonella, Pseudomonas e Cornyebacterium. Yarrowia li- polytica e Arxula adeninivorans são adequados para o uso como um micro-organismo hospedeiro porque podem acumular uma grande porcentagem de seu peso como triacil gliceróis.

[0047] Os sistemas de expressão microbial e os vetores de ex- pressão que contêm as sequências reguladoras que dirigem a expres- são de nível elevado de proteínas estranhas são conhecidos dos ele- mentos versados na técnica. Qualquer um destes pode ser usado para construir genes quiméricos para produzir qualquer um dos produtos de genes das presentes sequências. Esses genes quiméricos podem en- tão ser introduzidos em micro-organismos apropriados através de téc- nicas de transformação para prover a expressão de elevado nível das enzimas.

[0048] Por exemplo, um gene que codifica uma enzima pode ser clonado em um plasmídeo apropriado, e uma cepa parental de partida acima mencionada como um hospedeiro pode ser transformada com o plasmídeo resultante. Esta abordagem pode aumentar o número de cópias de cada um dos genes que codificam as enzimas e, como re- sultado, as atividades das enzimas podem ser aumentadas. O plasmí- deo não é limitado particularmente contanto que resulte em uma modi-

ficação genética desejada herdável à progênie do micro-organismo.

[0049] Os vetores ou os cassetes úteis para a transformação de células hospedeiras apropriadas são bem conhecidos. Tipicamente, o vetor ou cassete contém sequências que dirigem a transcrição e tra- dução do gene relevante, um marcador selecionável, e as sequências que permitem a replicação autônoma ou a integração cromossomal. Os vetores apropriados compreendem uma região 5' do gene que abriga controles da iniciação transcricional e uma região 3' do frag- mento de DNA que controla a terminação transcricional. Em determi- nadas modalidades, ambas as regiões de controle são derivadas dos genes homólogos à célula hospedeira transformada, embora deva ser compreendido que tais regiões de controle não precisam ser derivadas dos genes nativos à espécie específica escolhida como um hospedeiro de produção.

[0050] Os promotores, cDNAS e 3' UTRs, assim como outros ele- mentos dos vetores, podem ser gerados através de técnicas de clona- gem ao usar os fragmentos isolados de fontes nativas (vide, por exemplo, Green & Sambrook, Molecular Cloning: A Laboratory Manual, (4º ed., 2012); Patente U.S. no. 4.683.202 (incorporada a título de refe- rência)). Alternativamente, os elementos podem ser gerados sinteti- camente ao usar métodos conhecidos (vide, por exemplo, Gene 164:49-53 (1995)).

2. Recombinação Homóloga

[0051] A recombinação homóloga é a capacidade de sequências de DNA complementares de alinhar e trocar regiões de homologia. O DNA transgênico ("doador") que contém sequências homólogas às se- quências genômicas que estão sendo visadas ("molde") é introduzido no organismo e é então submetido à recombinação no genoma no sítio das sequências genômicas homólogas correspondentes.

[0052] A capacidade de realizar a recombinação homóloga em um organismo hospedeiro tem muitas implicações práticas para o que po- de ser realizado ao nível genético molecular e é útil na geração de um micróbio que possa produzir um produto desejado. Por natureza, a re- combinação homóloga é um evento de focalização de gene preciso e, desse modo, a maior parte das linhagens transgênicas geradas com a mesma sequência de foco será essencialmente idêntica em termos do fenótipo, necessitando da seleção de muito menos eventos de trans- formação. A recombinação homóloga também visa eventos de inser- ção de gene no cromossoma hospedeiro, o que resulta potencialmente em uma excelente estabilidade genética, até mesmo na ausência da seleção genética. Devido ao fato que loci cromossomas diferentes irão provavelmente causar impactos na expressão de gene, mesmo de promotores/UTRs exógenos, a recombinação homóloga pode ser um método de procurar loci em um ambiente de genoma não familiar e avaliar o impacto desses ambientes na expressão do gene.

[0053] Uma abordagem particularmente útil da engenharia genéti- ca ao usar a recombinação homóloga consiste em cooptar elementos reguladores hospedeiros específicos, tais como promotores/UTRs, pa- ra dirigir a expressão heteróloga do gene de uma maneira altamente específica.

[0054] Devido ao fato que a recombinação homóloga é um evento de focalização de gene preciso, ela pode ser usada para modificar com precisão qualquer(quaisquer) nucleotídeo(s) dentro um gene ou uma região de interesse, contanto que regiões de flanqueio suficientes tenham sido identificadas. Portanto, a recombinação homóloga pode ser usada como um meio para modificar as sequências reguladoras que causam impactos na expressão do gene de RNA e/ou proteínas. Ela também pode ser usada para modificar regiões de codificação de proteína em um esforço para modificar as atividades da enzima tais como a especificidade, as afinidades e Km do substrato, afetando des-

se modo uma mudança desejada no metabolismo da célula hospedei- ra. A recombinação homóloga provê meios poderosos para manipular o genoma hospedeiro, o que resulta em focalização de gene, conver- são de gene, deleção de gene, duplicação de gene, inversão de gene, e troca de elementos reguladores da expressão de gene tais como promotores, intensificadores e 3' UTRs.

[0055] A recombinação homóloga pode ser obtida ao usar constru- tos de focalização que contêm pedaços de sequências endógenas "pa- ra focalizar" o gene ou a região de interesse dentro do genoma endó- geno da célula hospedeiro. Tais sequências de focalização podem ser localizadas em 5' do gene ou da região de interesse, 3' do gene/da re- gião de interesse ou até mesmo flanquear o gene/a região de interes- se. Tais construtos de focalização podem ser transformados na célula hospedeira em um DNA de plasmídeo superengraçado com cadeia principal de vetor adicional, em um produto de PCR sem nenhuma ca- deia principal de vetor ou em uma molécula linearizada. Em alguns casos, pode ser vantajoso expor primeiramente as sequências homó- logas dentro do DNA transgênico (DNA do doador) ao cortar o DNA transgênico com uma enzima de restrição. Esta etapa pode aumentar a eficiência da recombinação e diminuir a ocorrência de eventos inde- sejados. Outros métodos de aumentar a eficiência da recombinação incluem o uso de PCR para gerar o DNA transgênico de transformação que contém as extremidades lineares homólogas às sequências ge- nômicas que estão sendo visadas.

3. Vetores e Componentes de Vetor

[0056] Os vetores para a transformação de micro-organismos de acordo com a presente invenção podem ser preparados por técnicas conhecidas familiares dos elementos versados na técnica em vista da descrição no presente documento. Um vetor contém tipicamente um ou mais genes, em que cada gene codifica para a expressão de um produto desejado (o produto do gene) e é ligado operavelmente a uma ou mais sequências de controle que regulam a expressão do gene ou focalizam o produto do gene em uma localização particular na célula recombinante. a. Sequências de Controle

[0057] As sequências de controle são ácidos nucleicos que regu- lam a expressão de uma sequência de codificação ou dirigem um pro- duto de gene a uma localização particular ou fora de uma célula. As sequências de controle que regulam a expressão incluem, por exem- plo, promotores que regulam a transcrição de uma sequência de codi- ficação e os terminais que terminam a transcrição de uma sequência de codificação. Uma outra sequência de controle é uma sequência 3' não transladada localizada na extremidade de uma sequência de codi- ficação que codifica um sinal de poliadenilação. As sequências de con- trole que dirigem produtos de gene a localizações particulares incluem aquelas que codificam os peptídeos de sinal, que dirigem a proteína à qual são unidos a uma localização particular dentro ou fora da célula.

[0058] Desse modo, um desenho de vetor exemplificador para a expressão de um gene em um micróbio contém uma sequência de co- dificação para um produto de gene desejado (por exemplo, um marca- dor selecionável ou uma enzima) em ligação operável com um promo- tor ativo em levedura. Alternativamente, se o vetor não contiver um promotor na ligação operável com a sequência de codificação de inte- resse, a sequência de codificação pode ser transformada em células de maneira tal que se torna ligada operavelmente a um promotor en- dógeno no ponto de integração do vetor. O promotor usado para ex- pressar um gene pode ser o promotor ligado naturalmente a esse gene ou um promotor diferente.

[0059] Um promotor pode ser geralmente caracterizado como constitutivo ou induzível. Os promotores constitutivos são geralmente ativos ou funcionam de modo a dirigir a expressão o tempo todo (ou em determinados momentos no ciclo de vida da célula) ao mesmo ní- vel. Os promotores induzíveis, por outro lado, são ativos (ou tornados inativos) ou são significativamente regulados para cima ou para baixo somente em resposta a um estímulo. Ambos os tipos de promotores encontram aplicação nos métodos da invenção. Os promotores induzí- veis úteis na invenção incluem aqueles que mediam a transcrição de um gene operavelmente ligado em resposta a um estímulo, tal como uma molécula pequena provida exogenamente, a temperatura (calor ou frio), falta de nitrogênio no meio de cultura, etc. Os promotores apropriados podem ativar a transcrição de um gene essencialmente silente ou regular para cima, por exemplo, substancialmente, a trans- crição de um gene operavelmente ligado que é transcrito a um nível baixo.

[0060] A inclusão da sequência de controle da região de termina- ção é opcional, e se for empregada, então a escolha é principalmente uma escolha conveniente, porque a região de terminação é relativa- mente permutável. A região de terminação pode ser nativa à região de iniciação transcricional (promotor), pode ser nativa à sequência do DNA de interesse ou pode ser obtenível de uma outra fonte (vide, por exemplo, Chen & Orozco, Nucleic Acid Research 16:8411 (1988)). b. Genes e Otimização de Códon

[0061] Tipicamente, um gene inclui um promotor, uma sequência de codificação e sequências de controle de terminação. Quando mon- tado pela tecnologia de DNA recombinante, um gene pode ser deno- minado um cassete de expressão e pode ser flanqueado por sítios de restrição para a inserção conveniente em um vetor que é usado para introduzir o gene recombinante em uma célula hospedeira. O cassete de expressão pode ser flanqueado por sequências de DNA do genoma ou outro alvo do ácido nucleico para facilitar a integração estável do cassete de expressão no genoma pela recombinação homóloga. Alter- nativamente, o vetor e seu cassete de expressão podem permanecer não integrados (por exemplo, um epissoma), em cujo caso o vetor in- clui tipicamente uma origem da replicação, que tem a capacidade de prover a replicação do DNA do vetor.

[0062] Um gene comum presente em um vetor é um gene que co- difica para uma proteína, cuja expressão permite que a célula recom- binante que contém a proteína seja diferenciada das células que não expressam a proteína. Tal gene, e seu produto de gene corresponden- te, são chamados de marcador selecionável ou marcador de seleção. Qualquer um de uma ampla variedade de marcadores selecionáveis pode ser empregado em um construto de transgene útil para transfor- mar os organismos da invenção.

[0063] Para a expressão ideal de uma proteína recombinante, é vantajoso o emprego de sequências de codificação que produzem o MRNA com os códons usados idealmente pela célula hospedeira a ser transformada. Desse modo, a expressão apropriada dos transgenes pode requerer que o uso do códon do transgene combine com a pola- rização de códon específica do organismo em que o transgene está sendo expresso. Os mecanismos precisos subjacentes a este efeito são muitos, mas incluem o equilíbrio apropriado de aglomerados de tRNA aminoacilados disponíveis com proteínas sintetizadas na célula, acoplados com uma tradução mais eficiente do RNA mensageiro transgênico (mMRNA) quando esta necessidade é satisfeita. Quando o uso do códon no transgene não é otimizado, os aglomerados de tRNA disponíveis não são suficientes para permitir a tradução eficiente do MRNA transgênico, o que resulta em parada ribossomal e terminação e na possível instabilidade do mMRNA transgênico. Os recursos para a otimização de códon de sequências de genes são descritos em Puigbo et al., Nucleic Acids Research 35:W126-31 (2007), e os princípios sub-

jacentes às estratégias de otimização de códon são descritos em An- gov, Biotechnology Journal (2011). Os bancos de dados públicos que fornecem estatísticas para o uso de códons por organismos diferentes estão disponíveis, inclusive em www.kKazusa.or.jp/codon/ e outros ban- cos de dados e recursos publicamente disponíveis.

4. Transformação

[0064] As células podem ser transformadas por qualquer técnica apropriada incluindo, por exemplo, biolística, eletroporação, transfor- mação com grânulos de vidro, e transformação de fios finos de carbo- neto de silício. Qualquer técnica conveniente para a introdução de um transgene em um micro-organismo pode ser empregada na presente invenção. A transformação pode ser obtida, por exemplo, pelo método de D. M. Morrison (Methods in Enzymology 68:326 (1979)), o método de aumento da permeabilidade de células recipientes para o DNA com cloreto de cálcio (Mandel & Higa, J. Molecular Biology, 53:159 (1970)) ou outros ainda.

[0065] Os exemplos da expressão de transgenes em levedura ole- aginosa (por exemplo, Yarrowia lipolytica) podem ser encontrados na literatura (Bordes et al., J. Microbiological Methods, 70:493 (2007); Chen et al., Applied Microbiology & Biotechnology 48:232 (1997)). Os exemplos da expressão de genes exógenos nas bactérias tais como E. coli são bem conhecidos (Green & Sambrook, Molecular Cloning: À Laboratory Manual, (4 ed., 2012)).

[0066] Os vetores para a transformação dos micro-organismos de acordo com a presente invenção podem ser preparados por técnicas conhecidas familiares dos elementos versados na técnica. Em uma modalidade, um desenho de vetor exemplificador para a expressão de um gene em um micro-organismo contém um gene que codifica uma enzima na ligação operável com um promotor ativo no micro- organismo. Alternativamente, se o vetor não contiver um promotor na ligação operável com o gene de interesse, o gene pode ser transfor- mado nas células de maneira tal que se torna ligado operavelmente a um promotor nativo no ponto de integração do vetor. O vetor também pode conter um segundo gene que codifica uma proteína. Opcional- mente, um ou ambos os genes são seguidos por uma sequência 3' não traduzida que contém um sinal de poliadenilação. Os cassetes de expressão que codificam os dois genes podem ser fisicamente ligados no vetor ou em vetores separados. A cotransformação de micróbios também pode ser usada, em que as moléculas distintas do vetor são usadas simultaneamente para transformar as células (Protist 155:381- 93 (2004)). As células transformadas podem ser opcionalmente seleci- onadas com base na capacidade de crescer na presença de antibiótico ou um outro marcador selecionável sob as condições em que as célu- las que não contêm o cassete de resistência não devem crescer.

C. Células, Ácidos Nucleicos, Composições e Métodos Exemplificadores

1. Células Transformadas

[0067] Em alguns aspectos, as modalidades da invenção incluem as células transformadas com um ou mais ácidos nucleicos que codifi- cam uma proteína de metil transferase e/ou redutase. Em algumas modalidades, a célula transformada é uma célula procariótica, tal como uma célula bacteriana. Em algumas modalidades, a célula é uma célu- la eucariótica, tal como uma célula de mamífero, uma célula de levedu- ra, uma célula de fungo filamentoso, uma célula protista, uma célula de alga, uma célula de ave, uma célula de planta ou uma célula de inseto. Em algumas modalidades, a célula é uma levedura. Os elementos ver- sados no estado da técnica irão reconhecer que muitas formas de fun- gos filamentosos produzem o crescimento do tipo da levedura, e a de- finição de levedura no presente documento engloba tais células. A cé- lula pode ser selecionada do grupo que consiste em algas, bactérias, mofos, fungos, plantas e leveduras. A célula pode ser uma levedura,

um fungo ou uma alga do tipo levedura. A célula pode ser selecionada de algas unicelulares traustoquitrídicas (Aurantiochytrium) e aclorofíli- cas (Prototheca).

[0068] A célula pode ser selecionada do grupo que consiste em Arxula, Aspegillus, Aurantiochytrium, Candida, Claviceps, Cryptococ- cus, Cunninghamella, Geotrichum, Hansenula, Kluyveromyces, Koda- maea, Leucosporidiella, Lipomyces, Mortierella, Ogataea, Pichia, Pro- totheca, Rhizopus, Rhodosporidium, Rhodotorula, Saccharomyces, Schizosaccharomyces, Tremella, Trichosporon, Wickerhamomyces e Yarrowia. É especificamente contemplado que um ou mais destes ti- pos de célula podem ser excluídos das modalidades da presente in- venção.

[0069] A célula pode ser selecionada do grupo que consiste em Arxula adeninivorans, Aspergillus niger, Aspergillus orzyae, Aspergillus terreus, Aurantiochytrium limacinum, Candida utilis, Claviceps purpu- rea, Cryptococcus albidus, Cryptococcus curvatus, Cryptococcus rami- rezgomezianus, Cryptococcus terreus, Cryptococcus wieringae, Cun- ninghamella echinulata, Cunninghamella japonica, Geotrichum fermen- tans, Hansenula polymorpha, Kluyveromyces lactis, Kluyveromyces marxianus, Kodamaea ohmeri, Leucosporidiella creatinivora, Li- pomyces lipofer, Lipomyces starkeyi, Lipomyces tetrasporus, Mortierel- la isabellina, Mortierella alpina, Ogataea polymorpha, Pichia ciferrii, Pichia guilliermondii, Pichia pastoris, Pichia stipites, Prototheca zopfii, Rhizopus arrhizus, Rhodosporidium babjevae, Rhodosporidium toruloi- des, Rhodosporidium paludigenum, Rhodotorula glutinis, Rhodotorula mucilaginosa, Saccharomyces cerevisiae, Schizosaccharomyces pom- be, Tremella enchepala, Trichosporon cutaneum, Trichosporon fer- mentans, Wickerhamomyces ciferrii e Yarrowia lipolytica. É especifi- camente contemplado que um ou mais destes tipos de célula podem ser excluídos das modalidades da presente invenção.

[0070] Em determinadas modalidades, a célula transformada com- preende cerca de, pelo menos cerca de ou no máximo cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 11%, 12%, 13%, T4%, 75%, 16%, 177%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85% ou mais lipídios tal como medido pela % em peso seco da célula ou qualquer faixa derivável na mesma. Em algumas modalidades, a célula trans- formada compreende ácidos graxos C18 a uma concentração de cerca de, pelo menos cerca de ou no máximo cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 172%, 13%, T4%, T5%, 16%, 77%, 178%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% ou 95% como uma porcentagem em peso do total de ácidos graxos C16 e C18 na célula ou qualquer faixa aí derivável.

[0071] Em algumas modalidades, a célula transformada compre- ende o ácido oleico a uma concentração de cerca de, pelo menos cer- ca de ou no máximo cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 13%, T4%, 15%, 16%, 17%, 18%, 19%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90% ou mais como uma porcentagem em peso do total de ácidos graxos C16 e C18 ou qualquer faixa aí derivável. Em algumas modalidades, a célula trans- formada compreende o ácido 10-metil esteárico a uma concentração de cerca de, pelo menos cerca de ou no máximo cerca de 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,

64%, 65%, 66%, 67%, 68%, 69%, 70%, 11%, 172%, 13%, T4%, 15%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90% ou mais como uma porcentagem em peso do total de ácidos graxos na célula ou qualquer faixa aí derivável.

[0072] Uma célula pode ser modificada para aumentar o seu teor de oleato, que serve como um substrato para a síntese do estearato de 10-metila. As modificações genéticas que aumentam o teor de olea- to são conhecidas (vide, por exemplo, a Publicação de Pedido de Pa- tente PCT no. WO16/094520, publicada em 16 de junho de 2016, in- corporada no presente documento a título de referência em sua totali- dade). Por exemplo, uma célula pode compreender um knockdown ou um knockout de desaturase A12, que favorece a acumulação de oleato e desfavorece a produção de linoleato. Uma célula pode compreender um gene de desaturase A9 recombinante, o que favorece a produção de oleato e desfavorece a acumulação de estearato. O gene de desa- turase A9 recombinante pode ser, por exemplo, o gene de desaturase 49 de Y. lipolytica, de Arxula adeninivorans ou de Puccinia graminis. Uma célula pode compreender um gene de elongase 1 recombinante, o que favorece a produção de oleato e desfavorece a acumulação de palmitato e palmitoleato. O gene de elongase 1 recombinante pode ser o gene de elongase 1 de Y. lipolytica. Uma célula pode compreender um gene de elongase 2 recombinante, o que favorece a produção de oleato e desfavorece a acumulação de palmitato e palmitoleato. O ge- ne de elongase 2 recombinante pode ser o gene de elongase 2 de R. norvegicus.

[0073] Uma célula pode ser modificada para aumentar o seu teor de triacil glicerol, aumentando desse modo o seu teor de estearato de 10-metila. As modificações genéticas que aumentam o teor de triacil glicerol são conhecidas (vide, por exemplo, a Publicação de Pedido de Patente PCT no. WO16/094520, publicada em 16 de junho de 2016,

incorporada no presente documento a título de referência em sua tota- lidade). Uma célula pode compreender um gene de diacil glicerol acil transferase recombinante (por exemplo, DGAT1, DGAT2 ou DGAT3), o que favorece a produção de triacil gliceróis e desfavorece a acumu- lação de diacil gliceróis. O gene de diacil glicerol acil transferase re- combinante pode ser, por exemplo, DGAT?2 (proteína DGA1 de codifi- cação) de Y. lipolytica, DGAT1 (proteína DGA?2 de codificação) de C. purpurea ou DGAT?2 (proteína DGA1 de codificação) de R. toruloides. A célula pode compreender um knockdown ou knockout do gene de glicerol-3-fosfato acil transferase (Sct1), o que pode favorecer a acu- mulação de triacil gliceróis, dependendo do tipo da célula. A célula po- de compreender um gene de glicerol-3-fosfato acil transferase recom- binante (Sct1) como gene Sct1 de A. adeninivorans, o que pode favo- recer a acumulação de triacil gliceróis. A célula pode compreender um knockdown ou knockout do gene de triacil glicerol lipase (TGL), o que pode favorecer a acumulação de triacil gliceróis na célula.

[0074] Vários aspectos da invenção referem-se a uma célula trans- formada. A célula transformada pode compreender um gene de metil transferase recombinante (por exemplo, um gene de tmpB), um gene de redutase recombinante (por exemplo, um gene de tmpA), um lipídio substituído por exometileno, e/ou um (metil)lipídio ramificado. O (me- til)lipídio ramificado pode ser um ácido carboxílico (por exemplo, o áci- do 10-metil esteárico, o ácido 10-metil palmítico, o ácido 12-metil olei- co, o ácido 13-metil oleico, o ácido 10-metil-octadec-12-enoico), car- boxilato (por exemplo, o estearato de 10-metila, o palmitato de 10- metia, o oleato de 12-metila, o oleato de 13-metila, 10-metil-octadec- 12-enoato), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipí- dio), tioéster (por exemplo, 10-metil estearil CoA, 10-metil palmitil CoA, 12-metil oleoil CoA, 13-metil oleoil CoA, 10-metil-octadec-12-enoil CoA) ou amida. Um lipídio substituído por exometileno pode ser um ácido carboxílico (por exemplo, o ácido 10-metileno esteárico, o ácido 10-metileno palmítico, o ácido 12-metileno oleico, o ácido 13-metileno oleico, o ácido 10-metileno-octadec-12-enoico), carboxilato (por exem- plo, o estearato de 10-metileno, o palmitato de 10-metileno, o oleato de 12-metileno, o oleato de 13-metileno, 10-metileno-octadec-12- enoato), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), tioéster (por exemplo, 10-metileno estearil CoA, 10-metileno palmitil CoA, 12-metileno oleoil CoA, 13-metileno oleoil CoA, 10-metileno- octadec-12-enoil CoA) ou amida. É especificamente contemplado que um ou mais dos lipídios acima podem ser excluídos das modalidades da presente invenção. O gene de metil transferase e o gene de redu- tase podem ter a capacidade de produzir em conjunto uma ramificação metilada de qualquer ácido graxo de 14 a 18 carbonos de comprimen- to com uma ligação dupla insaturada na posição A9, A10 ou A11. Áci- do graxo podem ser de 14, 15, 16, 17 ou 18 carbonos ou qualquer fai- xa aí derivável.

[0075] Os "ácidos graxo" existem geralmente em uma célula como um fosfolipídio ou triacil glicerol, embora também posam existir como um monoacil glicerol ou um diacil glicerol, por exemplo, como um in- termediário metabólico. Os ácidos graxos livres também existem na célula em equilíbrio entre um ânion de carboxilato relativamente abun- dante e um ácido de carga neutra relativamente escasso. O ácido gra- xo pode existir em uma célula como um tioéster, especialmente como um tioéster com a coenzima A (CoA), durante a biossíntese ou a oxi- dação. O ácido graxo pode existir em uma célula como uma amida, por exemplo, quando ligado covalentemente a uma proteína para an- corar a proteína a uma membrana.

[0076] Uma célula pode compreender qualquer um dos ácidos nu- cleicos descritos no presente documento, infra (vide, por exemplo, a seção B, a seguir). Uma célula pode compreender múltiplas cópias de qualquer um dos ácidos nucleicos descritos no presente documento. Isto pode ser realizado, por exemplo, ao incluir um gene de tmpB e/ou um gene de tmpB em um plasmídeo de elevado número de cópias que é transformado em uma célula.

[0077] O (metil)lipídio ramificado pode compreender uma cadeia alifática ramificada saturada (por exemplo, o ácido 10-metil esteárico, o ácido 10-metil palmítico) ou uma cadeia alifática ramificada insatura- da (por exemplo, o ácido 12-metil oleico, o ácido 13-metil oleico, o áci- do 10-metil-octadec-12-enoico). O (metil)lipídio ramificado pode com- preender uma cadeia alifática ramificada saturada ou insaturada que compreende um grupo metila ramificando.

[0078] Um lipídio substituído por exometileno pode compreender uma cadeia alifática ramificada (por exemplo, o ácido 10-metileno es- teárico, o ácido 10-metileno palmítico, o ácido 12-metileno oleico, o ácido 13-metileno oleico, o ácido 10-metileno-octadec-12-enoico). À cadeia alifática pode ser ramificada porque a cadeia alifática é substi- tuída com um grupo do exometileno.

[0079] O (metil)lipídio ramificado pode ser o estearato de 10-metila ou um ácido (ácido 10-metil esteárico), éster (por exemplo, diacil glice- rol, triacil glicerol, fosfolipídio), tivoéster (por exemplo, 10-metil estearil CoA) ou amida (por exemplo, 10-metil estearil amida) do mesmo. Por exemplo, o (metil)lipídio ramificado pode ser um diacil glicerol, um tria- cil glicerol ou um fosfolipídio, e o diacil glicerol, o triacil glicerol ou o fosfolipídio podem compreender um éster de estearato de 10-metila.

[0080] Um lipídio substituído por exometileno pode ser o estearato de 10-metileno ou um ácido (ácido 10-metileno esteárico), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), tioéster (por exem- plo, 10-metileno estearil CoA) ou amida (por exemplo, 10-metileno es- tearl amida) do mesmo. Por exemplo, o lipídio substituído por exometi- leno pode ser um diacil glicerol, um triacil glicerol ou um fosfolipídio, e o diacil glicerol, o triacil glicerol ou o fosfolipídio podem compreender um éster de 10-metileno estearato.

[0081] Em algumas modalidades, cerca de, pelo menos cerca de ou no máximo cerca de 1% em peso dos ácidos graxos da célula po- dem consistir em ácido 10-metil esteárico. Cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, T5%, 16%, 17%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso dos ácidos graxos da célula podem consistir em ácido 10-metil esteárico ou qualquer faixa aí deri- vável.

[0082] Em algumas modalidades, cerca de, pelo menos cerca de ou no máximo cerca de 1% em peso dos ácidos graxos da célula po- dem consistir em ácido 10-metileno esteárico. Cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 171%, 72%, 13%, T4%, T5%, 16%, TT%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso dos ácidos graxos da célula podem consistir em ácido 10-metileno esteárico ou qualquer fai- xa aí derivável.

[0083] Em algumas modalidades, cerca de, pelo menos cerca de ou no máximo cerca de 1% em peso dos ácidos graxos da célula po- dem consistir em um ou mais dos (metil)lipídios ramificados descritos no presente documento. Cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, T%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 11%, 12%, 13%, 74%, 175%, 176%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso dos ácidos graxos da célula podem consistir em um ou mais dos (metil)lipídios ramificados descritos no presente do- cumento ou qualquer faixa aí derivável.

[0084] Em algumas modalidades, cerca de, pelo menos cerca de ou no máximo cerca de 1% em peso dos ácidos graxos da célula po- dem consistir em um ou mais dos (metil)lipídios ramificados descritos no presente documento. Cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, T%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 11%, 12%, 13%, 74%, 175%, 176%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso dos ácidos graxos da célula podem consistir em um ou mais dos (metil)lipídios ramificados descritos no presente do- cumento ou qualquer faixa aí derivável.

[0085] Em algumas modalidades, a célula pode compreender cer- ca de, pelo menos cerca de ou no máximo cerca de 1% de ácido 10- metil esteárico tal como medido pela % em peso seco da célula. A cé- lula pode compreender cerca de, pelo menos cerca de ou no máximo cerca de 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49% ou 50% de ácido 10-metil esteárico tal como medido pela % em peso se- co da célula ou qualquer faixa aí derivável.

[0086] Em algumas modalidades, a célula pode compreender cer- ca de, pelo menos cerca de ou no máximo cerca de 1% de ácido 10- metileno esteárico tal como medido pela % em peso seco da célula. A célula pode compreender cerca de, pelo menos cerca de ou no máxi- mo cerca de 2%, de 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49% ou 50% de ácido 10-metil esteárico tal como medido pela % em peso seco da célula ou qualquer faixa aí derivável.

[0087] Uma célula não modificada do mesmo tipo (por exemplo, espécie) como uma célula da invenção pode não compreender o este- arato de 10-metila ou um ácido (ácido 10-metil esteárico), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), tioéster (por exem- plo, 10-metil estearil CoA) ou amida (por exemplo, 10-metil estearil amida) do mesmo (por exemplo, em que a célula não modificada não compreende um gene de metil transferase recombinante ou um gene de redutase recombinante). Uma célula não modificada do mesmo tipo (por exemplo, espécie) como uma célula da invenção pode não com- preender o estearato de 10-metileno ou um ácido (ácido 10-metileno esteárico), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipí- dio), ticoéster (por exemplo, 10-metileno estearil CoA) ou amida (por exemplo, 10-metileno estearil amida) do mesmo (por exemplo, em que a célula não modificada não compreende um gene de metil transferase recombinante ou um gene de redutase recombinante). Em algumas modalidades, uma célula não modificada da mesma espécie que a cé- lula não compreende (metil)lipídio ramificado e/ou um lipídio substituí- do por exometileno. Em algumas modalidades, uma célula não modifi- cada da mesma espécie que a célula não compreende um ou mais dos (metil)lipídio ramificados ou dos lipídios substituídos por exometi- leno descritos no presente documento.

[0088] Em algumas modalidades, uma célula pode expressar de maneira constitutiva a proteína codificada por um gene de metil trans- ferase e/ou gene de redutase recombinante. Uma célula pode expres- sar de maneira constitutiva uma proteína de metil transferase e/ou uma proteína de redutase.

2. Ácidos Nucleicos a. Geral

[0089] Vários aspectos da invenção referem-se a um ácido nuclei- co que compreende um gene de metil transferase recombinante, um gene de redutase recombinante ou ambos. O ácido nucleico pode ser, por exemplo, um plasmídeo. Em algumas modalidades, um gene de metil transferase recombinante e/ou um gene de redutase recombinan- te são integrados no genoma de uma célula, e desse modo o ácido nucleico pode ser um cromossoma. Em algumas modalidades, a in- venção refere-se a uma célula que compreende um gene de metil transferase recombinante, por exemplo, em que o gene de metil trans- ferase recombinante está presente em um plasmídeo ou cromossoma. Em algumas modalidades, a invenção refere-se a uma célula que compreende um gene de redutase recombinante, por exemplo, em que o gene de redutase recombinante está presente em um plasmídeo ou cromossoma. Um gene de metil transferase recombinante e um gene de redutase recombinante podem estar presentes em uma célula no mesmo ácido nucleico (por exemplo, o mesmo plasmídeo ou cromos- soma) ou em ácidos nucleicos diferentes (por exemplo, plasmídeos ou cromossomas diferentes).

[0090] Um ácido nucleico pode ser inerdável à progênie de uma célula transformada. Um gene tal como um gene de metil transferase recombinante ou um gene de redutase recombinante pode ser inerdá- vel devido ao fato que ele reside em um plasmídeo ou cromossoma. Em determinadas modalidades, um gene pode ser inerdável devido ao fato que ele é integrado no genoma da célula transformada.

[0091] Um gene pode compreender substituições conservadoras, deleções e/ou inserções enquanto ainda codifica uma proteína que tenha atividade. Por exemplo, códons podem ser otimizados para uma célula hospedeira particular, códons diferentes podem ser substituídos para fins de conveniência, tal como para introduzir um sítio de restri- ção ou para criar iniciadores de PCR ideais ou códons podem ser substituídos para uma outra finalidade. Similarmente, a sequência de nucleotídeos pode ser alterada para criar substituições conservadoras, deleções e/ou inserções de aminoácidos.

[0092] As proteínas podem compreender substituições conserva- doras, deleções e/ou inserções enquanto ainda mantêm a atividade. As tabelas de substituição conservadora são bem conhecidas no esta- do da técnica (Creighton, Proteins (2º. ed., 1992)).

[0093] As substituições, as deleções e/ou as inserções de aminoá- cidos podem ser feitas de imediato ao usar técnicas de manipulação de DNA recombinante. Os métodos para a manipulação das sequên- cias do DNA para produzir variante da substituição, da inserção ou da deleção de uma proteína são bem conhecidos no estado da técnica.

Esses métodos incluem a mutagênese M13, a mutagênese T7-Gen in vitro (USB, Cleveland, OH), a mutagênese Quick Change Site Directed (Stratagene, San Diego, CA), a mutagênese dirigida a sítio mediada por PCR, e os outros protocolos de mutagênese dirigida a sítio.

[0094] Uma "sequência de codificação" ou "região de codificação" refere-se a uma molécula de ácido nucleico que tem a informação da sequência necessária para obter um produto de proteína, tal como um aminoácido ou polipeptídio, quando a sequência é expressa. A se- quência de codificação pode compreender e/ou consistir em sequên- cias não traduzidas (incluindo íntrons ou regiões 5' ou 3' não traduzi- das) dentro das regiões traduzidas ou pode não conter tais sequências não traduzidas intermediárias (por exemplo, tal como no cDNA).

[0095] A abreviatura usada por todo o relatório descritivo para se referir aos ácidos nucleicos que compreendem e/ou consistem em se- quências de nucleotídeo inclui as abreviaturas convencionais de uma letra. Desse modo, quando incluídos em um ácido nucleico, os nucleo- tídeos de codificação de ocorrência natural são abreviados tal como segue: adenina (A), guanina (G), citosina (C), timina (T) e uracil (U). Além disso, a menos que esteja especificado de alguma outra manei- ra, as sequências de ácidos nucleicos apresentadas no presente do- cumento são na direção 5' > 3. b. Ácidos nucleicos que compreendem um gene de metil transferase recombinante

[0096] Um gene de metil transferase (por exemplo, um gene de metil transferase recombinante) codifica uma proteína de metil transfe- rase, a qual é uma enzima que tem a capacidade de transferir um átomo de carbono e um ou mais prótons ligados ao mesmo de um substrato tal como S-adenosil metionina a um ácido graxo como o áci- do oleico (por exemplo, em que o ácido graxo está presente como um ácido graxo livre, carboxilato, fosfolipídio, diacil glicerol ou triacil glice-

rol). O gene de metil transferase (por exemplo, um gene de metil trans- ferase recombinante) pode ter uma região de codificação que seja idêntica a uma de uma bactéria da classe Gammaproteobacteria. O gene de metil transferase pode compreender qualquer uma das se- quências de nucleotídeos indicadas na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 e SEQ ID NO: 17. O gene de metil transferase (por exemplo, um gene de metil transferase recombinante) pode ser um gene de ácido 10-metil esteárico B (tmpB) tal como descrito no presente documento ou uma porção biologicamente ativa do mesmo (isto é, em que a porção biologicamente ativa do mesmo compreende a atividade de metil transferase).

[0097] O gene de metil transferase (por exemplo, um gene de metil transferase recombinante) pode ser derivado de uma espécie de Gammaproteobacteria, tal como de bactérias dos gêneros Desulfobac- ter, Desulfobacula, Marinobacter, Thiohalospira ou Halofilum. O gene de metil transferase (por exemplo, um gene de metil transferase re- combinante) pode ser selecionado do grupo que consiste no gene de tmpB de Desulfobacula balticum (SEQ ID NO: 1), gene de tmpB de Marinobacter hydrocarbonclasticus (SEQ ID NO: 3), gene de tmpB de Thiohalospira halophila (SEQ ID NO: 5), gene de tmpB de Desulfobac- ter curvatus (SEQ ID NO: 7), gene de tmpB de Desulfobacter phenoli- ca (SEQ ID NO: 9), gene de tmpB de Desulfobacula toluolica (SEQ ID NO: 11), gene de tmpB de Desulfobacter postgatei (SEQ ID NO: 13), gene de tmpB de Halofilum ochraceum (SEQ ID NO: 15), e gene de tmpB de Marinobacter aquaeolei (SEQ ID NO: 17). É especificamente contemplado que um ou mais dos genes de metil transferase acima podem ser excluídos das modalidades da presente invenção.

[0098] Um gene de metil transferase recombinante pode ser re- combinante devido ao fato que ele é ligado operavelmente a um pro-

motor que não o promotor de ocorrência natural do gene de metil transferase. Tais genes podem ser úteis para dirigir a transcrição em uma espécie particular de célula. Um gene de metil transferase re- combinante pode ser recombinante devido ao fato que ele contém uma ou mais substituições de nucleotídeo em relação a um gene de ocor- rência natural de metil transferase. Tais genes podem ser úteis para aumentar a eficiência da tradução do transcrito de MRNA do gene de metil transferase em uma espécie particular de célula.

[0099] Um ácido nucleico pode compreender um gene de metil transferase recombinante e um promotor, em que o gene de metil transferase recombinante e o promotor são ligados operavelmente. O gene de metil transferase e o promotor podem ser derivados de espé- cies diferentes. Por exemplo, o gene de metil transferase recombinan- te pode codificar a proteína de metil transferase de uma espécie de Gammaproteobacteria, e o gene de metil transferase recombinante pode ser ligado operavelmente a um promotor que pode dirigir a trans- crição em um outro tipo de bactéria ou um eucariota (por exemplo, uma célula de alga, uma célula de levedura ou uma célula de planta). O promotor pode ser um promotor eucariótico. Uma célula pode com- preender o ácido nucleico, e o promotor pode ser capaz de dirigir a transcrição na célula. Uma célula pode compreender um gene de metil transferase recombinante, e o gene de metil transferase recombinante pode ser ligado operavelmente a um promotor capaz de dirigir a trans- crição do gene de metil transferase recombinante na célula. A célula pode ser uma espécie de levedura, e o promotor pode ser um promo- tor de levedura. A célula pode ser uma espécie de bactéria, e o promo- tor pode ser um promotor bacteriano (por exemplo, em que o promotor bacteriano não é um promotor de um Gammaproteobacterium). A célu- la pode ser uma espécie de algas, e o promotor pode ser um promotor de algas. A célula pode ser uma espécie de planta, e o promotor pode ser um promotor de planta.

[0100] Um gene de metil transferase recombinante pode ser ligado operavelmente a um promotor que não pode dirigir a transcrição na célula da qual originou o gene de metil transferase recombinante. Por exemplo, o promotor pode não ser capaz de ligar uma polimerase do RNA da célula da qual originou um gene de metil transferase recombi- nante. Em algumas modalidades, o promotor não pode ligar uma transcrição de polimerase de RNA procariótica e/ou iniciar a transcri- ção mediada por uma polimerase de RNA procariótica. Em algumas modalidades, um gene de metil transferase recombinante é ligado ope- ravelmente a um promotor que não pode dirigir a transcrição na célula da qual originou a proteína codificada pelo gene. Por exemplo, o pro- motor pode não ser capaz de ligar uma polimerase de RNA de uma célula que expressa naturalmente a enzima de metil transferase codifi- cada por um gene de metil transferase recombinante.

[0101] Um promotor pode ser um promotor induzível ou um promotor constitutivo. Um promotor pode ser qualquer um dos promotores descri- tos na Publicação de Pedido de Patente PCT no. WO 2016/014900, pu- blicada em 28 de janeiro de 2016 (incorporada no presente documento a título de referência em sua totalidade). O documento WO 2016/014900 descreve vários promotores derivados das espécies de levedura Yar- rowia lipolytica e Arxula adeninivorans, que podem ser particularmente úteis como promotores para dirigir a transcrição de um gene recombi- nante em uma célula de levedura. Um promotor pode ser um promotor de um gene que codifica um fator de Alongamento de Tradução EF-1a; Glicerol-3-fosfato desidrogenase; Triosefosfato isomerase 1; Fructose- 1,6-bisfosfato aldolase; Fosfoglicerato mutase; piruvato cinase; proteí- na Export EXP1; Proteína ribossomal S7; desidrogenase de álcool; Fosfoglicerato cinase; Transportador de Hexose; Permease de amino- ácido geral; serina protease; Isocitrato liase; Acil-CoA oxidase; ATP-

sulfurilase; Hexocinase; 3-fosfoglicerato desidrogenase; Subunidade alfa de piruvato desidrogenase; Subunidade beta de piruvato desidro- genase; Aconitase; Enolase; Actina; Proteína de resistência a múltiplos fármacos (ABC-transportador); Ubiquitina; GTPase; Cotransportador Na+/Pi de membrana de plasma; piruvato descarboxilase; Fitase; ou alpha-amilase, por exemplo, em que o gene é de levedura, tal como um gene de Yarrowia lipolytica ou de Arxula adeninivorans.

[0102] Um gene de metil transferase recombinante pode compre- ender uma sequência de nucleotídeos com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, 75%, 76%, 77%, 718%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de nucleo- tídeos indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: ou SEQ ID NO: 17. Um gene de metil transferase recombinante po- de compreender uma sequência de nucleotídeos com, com pelo me- nos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, T5%, 16%, T7T%, 718%, 719%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 291%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1.000, 1.050, 1.100, 1.150, 1.200, 1.250 ou 1.300 pares base contíguos da sequência de nucleotídeos indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID NO: 17. Uma metil transferase recombinante pode ou não ter 100% de identidade de se- quência com qualquer uma das sequências de nucleotídeos indicadas na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID

NO: 17. Um gene de metil transferase recombinante pode ou não ter 100% de identidade de sequência com 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1.000, 1.050,

1.100, 1.150, 1.200, 1.250 ou 1.300 pares base contíguos começando na posição de nucleotídeo 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, OO, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 2018, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386,

387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509, 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523, 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537, 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565, 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579, 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593, 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607, 608, 609, 610, 611, 612, 613, 614, 615, 616, 617, 618, 619, 620, 621, 622, 623, 624, 625, 626, 627, 628, 629, 630, 631, 632, 633, 634, 635, 636, 637, 638, 639, 640, 641, 642, 643, 644, 645, 646, 647, 648, 649, 650, 651, 652, 653, 654, 655, 656, 657, 658, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, 693, 694, 695, 696, 697, 698, 699, 700, 701, 702, 703, 704, 705, 706, 707, 708, 709, 710, 711, 712, 713, 714, 715, 716, 717, 718, 719, 720, 721, 722, 723, 724, 725, 726, 727, 728, 729, 730, 731, 732, 733, 734, 735, 736, 737, 738, 739, 740, 741, 742, 743, 744, 745, 746, 747, 748, 749, 750, 751, 752, 753, 754, 755, 756, 757, 758, 759, 760, 761, 762, 763, 764, 765, 766, 767, 768, 769, 770, 771, 772, 773, 174, 1775, 176, 177, 778, 779, 780, 781, 782, 783, 784, 785, 786, 787, 788, 789, 790, 791, 792, 793, 794, 795, 796, 797, 798, 799, 800, 801, 802, 803, 804, 805, 806,

807, 808, 809, 810, 811, 812, 813, 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 828, 829, 830, 831, 832, 833, 834, 835, 836, 837, 838, 839, 840, 841, 842, 843, 844, 845, 846, 847, 848, 849, 850, 851, 852, 853, 854, 855, 856, 857, 858, 859, 860, 861, 862, 863, 864, 865, 866, 867, 868, 869, 870, 871, 872, 873, 874, 875, 876, 877, 878, 879, 880, 881, 882, 883, 884, 885, 886, 887, 888, 889, 890, 891, 892, 893, 894, 895, 896, 897, 898, 899, 900, 901, 902, 903, 904, 905, 906, 907, 908, 909, 910, 911, 912, 913, 914, 915, 916, 917, 918, 919, 920, 921, 922, 923, 924, 925, 926, 927, 928, 929, 930, 931, 932, 933, 934, 935, 936, 937, 938, 939, 940, 941, 942, 943, 944, 945, 946, 947, 948, 949, 950, 951, 952, 953, 954, 955, 956, 957, 958, 959, 960, 961, 962, 963, 964, 965, 966, 967, 968, 969, 970, 971, 972, 973, 974, 975, 976, 977, 978, 979, 980, 981, 982, 983, 984, 985, 986, 987, 988, 989, 990, 991, 992, 993, 994, 995, 996, 997, 998, 999, 1.000, 1.001,

1.002, 1.003, 1.004, 1.005, 1.006, 1.007, 1.008, 1.009, 1.010, 1.011,

1.012, 1.013, 1.014, 1.015, 1.016, 1.017, 1.018, 1.019, 1.020, 1.021,

1.022, 1.023, 1.024, 1.025, 1.026, 1.027, 1.028, 1.029, 1.030, 1.031,

1.032, 1.033, 1.034, 1.035, 1.036, 1.037, 1.038, 1.039, 1.040, 1.041,

1.042, 1.043, 1.044, 1.045, 1.046, 1.047, 1.048, 1.049, 1.050, 1.051,

1.052, 1.053, 1.054, 1.055, 1.056, 1.057, 1.058, 1.059, 1.060, 1.061,

1.062, 1.063, 1.064, 1.065, 1.066, 1.067, 1.068, 1.069, 1.070, 1.071,

1.072, 1.073, 1.074, 1.075, 1.076, 1.077, 1.078, 1.079, 1.080, 1.081,

1.082, 1.083, 1.084, 1.085, 1.086, 1.087, 1.088, 1.089, 1.090, 1.091,

1.092, 1.093, 1.094, 1.095, 1.096, 1.097, 1.098, 1.099, 1.100, 1.101,

1.102, 1.103, 1.104, 1.105, 1.106, 1.107, 1.108, 1.109, 1.110, 1.111,

1.112, 1.113, 1.114, 1.115, 1.116, 1.117, 1.118, 1.119, 1.120, 1.121,

1.122, 1.123, 1.124, 1.125, 1.126, 1.127, 1.128, 1.129, 1.130, 1.131,

1.132, 1.133, 1.134, 1.135, 1.136, 1.137, 1.138, 1.139, 1.140, 1.141,

1.142, 1.143, 1.144, 1.145, 1.146, 1.147, 1.148, 1.149, 1.150, 1.151,

1.152, 1.153, 1.154, 1.155, 1.156, 1.157, 1.158, 1.159, 1.160, 1.161,

1.162, 1.163, 1.164, 1.165, 1.166, 1.167, 1.168, 1.169, 1.170, 1.171,

1.172, 1.173, 1.174, 1.175, 1.176, 1.177, 1.178, 1.179, 1.180, 1.181,

1.182, 1.183, 1.184, 1.185, 1.186, 1.187, 1.188, 1.189, 1.190, 1.191,

1.192, 1.193, 1.194, 1.195, 1.196, 1.197, 1.198, 1.199 ou 1.200 da se- quência do nucleotídeo indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID NO: 17. Um gene de metil transfe- rase recombinante pode compreender uma sequência de nucleotídeos com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 171%, 72%, 73%, T4%, T5%, 16%, TT%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência do nucleotídeo indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID NO: 17, e o gene de metil transferase recombinante podem codificar uma proteína de metil trans- ferase com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, 15%, 16%, 177%, 718%, 19%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 294%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de aminoácidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18. Por exemplo, um gene que é otimizado nos códons para a expressão em levedura pode ter uma identidade da sequência de cerca de 70% com a SEQ ID NO: 1, ao passo que a proteína codificada por tal gene codificado no códon pode ter uma identidade de sequência de 100% com a sequência de aminoácidos indicada na SEQ ID NO: 2. Desse modo, embora um gene otimizado nos códons possa ter somente cer- ca de 70% de identidade de sequência ou menos em relação ao gene original, o gene otimizado nos códons codifica a mesma sequência de aminoácidos do gene original.

[0103] Um gene de metil transferase recombinante pode variar de um gene de metil transferase de ocorrência natural devido ao fato que o gene de metil transferase recombinante pode ser otimizado nos có- dons para a expressão em uma célula eucariótica, tal como uma célula de planta, uma célula de algas ou uma célula de levedura. Uma célula pode compreender um gene de metil transferase recombinante, em que o gene de metil transferase recombinante é otimizado nos códons para a célula.

[0104] Exatamente, pelo menos ou no máximo 1, 2, 3, 4,5,6,7,8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44,45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298,

299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499 ou 500 códons de um gene de metil transfera- se recombinante podem variar de um gene de metil transferase de ocorrência natural ou podem ser inalterados de um gene de metil transferase de ocorrência natural. Por exemplo, um gene de metil transferase recombinante pode compreender uma sequência de nu- cleotídeos com uma identidade de sequência de pelo menos cerca de 65% com a sequência natural do nucleotídeo indicada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15 ou SEQ ID NO: 17 (por exemplo, pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência), e pelo menos 5 có- dons da sequência de nucleotídeos do gene de metil transferase re- combinante podem variar da sequência de nucleotídeos de ocorrência natural (por exemplo, pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 ou 100 códons).

[0105] Um gene de metil transferase codifica uma proteína de me-

til transferase. Uma proteína de metil transferase pode ser uma prote- Ína expressa por uma espécie de Gammaproteobacteria, tais como as bactérias dos gêneros Desulfobacter, Desulfobacula, Marinobacter, Thiohalospira ou Halofilum. Um gene de metil transferase recombinan- te pode codificar uma proteína de metil transferase de ocorrência natu- ral mesmo se o gene de metil transferase recombinante não for um gene de metil transferase de ocorrência natural. Por exemplo, um gene de metil transferase recombinante pode variar de um gene de metil transferase de ocorrência natural devido ao fato que o gene de metil transferase recombinante é otimizado nos códons para a expressão em uma célula específica. O gene de metil transferase recombinante otimizado nos códons, e o gene de metil transferase de ocorrência na- tural podem, no entanto, codificar a mesma proteína de metil transfe- rase de ocorrência natural.

[0106] Um gene de metil transferase recombinante pode codificar uma proteína de metil transferase selecionada do grupo que consiste em proteína de tmpB de Desulfobacula balticum (SEQ ID NO: 2), pro- teína de tmpB de Marinobacter hydrocarbonclasticus (SEQ ID NO: 4), proteína de tmpB de Thiohalospira halophila (SEQ ID NO: 6), proteína de tmpB de Desulfobacter curvatus (SEQ ID NO: 8), proteína de tmpB de Desulfobacter phenolica (SEQ ID NO: 10), proteína de tmpB de De- sulfobacula toluolica (SEQ ID NO: 12), proteína de tmpB de Desulfo- bacter postgatei (SEQ ID NO: 14), proteína de tmpB de Halofilum ochraceum (SEQ ID NO: 16), e proteína de tmpB de Marinobacter aquaeolei (SEQ ID NO: 18). É especificamente contemplado que uma ou mais das proteínas de metil transferase acima podem ser excluídas das modalidades da presente invenção. Um gene de metil transferase recombinante pode codificar uma proteína de metil transferase, e a proteína de metil transferase pode ser substancialmente idêntica a qualquer uma das enzimas acima, mas o gene de metil transferase recombinante pode variar do gene de ocorrência natural que codifica a enzima. O gene de metil transferase recombinante pode variar do ge- ne de ocorrência natural devido ao fato que o gene de metil transfera- se recombinante pode ser otimizado nos códons para a expressão em um filo, uma classe, uma ordem, uma família, um gênero, uma espécie ou uma cepa específica da célula.

[0107] As sequências de proteínas de metil transferase de ocor- rência natural são indicadas na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 e SEQ ID NO: 18. Um gene de metil transferase recombinante pode ou não codificar uma proteína que compreende 100% de identidade de sequência com a sequência de aminoácidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18. Por exemplo, um gene de metil transferase recombi- nante pode codificar uma proteína que tem 100% de identidade de se- quência com uma porção biologicamente ativa de uma sequência de aminoácidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18.

[0108] Um gene de metil transferase recombinante pode codificar uma proteína de metil transferase que tem, tem pelo menos ou tem no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, 75%, 76%, 77%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% e 100% de identidade de sequência com a sequência de aminoá- cidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18 ou uma porção biologicamente ativa da mesma. Um gene de metil transferase recombinante pode codificar uma proteína de metil transferase que tem cerca de, pelo menos cerca de ou no máximo cerca de 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 10%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%, 100%, 100,1%, 100,2%, 100,3%, 100,4%, 100,5%, 100,6%, 100,7%, 100,8%, 100,9%, 101%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145%, 150%, 160%, 170%, 180%, 190%, 200%, 220%, 240%, 260%, 280%, 300%, 320%, 340%, 360%, 380% ou 400% de atividade de metil trans- ferase em relação a uma proteína que compreende a sequência de aminoácido indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18. Um gene de metil transferase recombi- nante pode codificar uma proteína que tem pelo menos 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 173%, T4%, 15%, 16%, 77%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identi- dade de sequência com 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490 ou 500 aminoácidos contíguos começando na posição 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71,72, 73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147,

148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499 ou 500 da sequência de aminoácidos indicada na SEQ ID NO:2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18.

[0109] Os substratos para a proteína de metil transferase podem incluir ácidos graxos de 14 a 18 carbonos de comprimento com uma ligação dupla insaturada na posição A9, A10 ou A11. O substrato pode ter uma cadeia que tem 14, 15, 16, 17 ou 18 carbonos de comprimento ou qualquer faixa aí derivável. A proteína de metil transferase pode ser capaz de catalisar a formação de uma substituição de metileno na po- sição A9, A10 ou A11 de tal substrato.

[0110] Em algumas modalidades, o gene de metil transferase re- combinante codifica uma proteína de metil transferase que tem amino- ácidos específicos inalterados da sequência de aminoácidos indicada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16 ou SEQ ID NO: 18. Os aminoácidos inalterados podem incluir 1, 2, 3, 4, 5, 6,7, 8 ou 9 aminoácidos selecionados de Y163, T175, R199, E211, G269, Y271, N313, N319, e W389 de tmpB de Marinobacter hydrocarbon- clasticus ou aminoácidos correspondentes em tmpB de Desulfobacula balticum, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum ou Marinobacter aquaeolei, de acordo com o alinha- mento indicado nas Figuras 7A-D. Cc. Ácidos nucleicos que compreendem um gene de redutase recombi- nante

[0111] Um gene de redutase (por exemplo, um gene de redutase recombinante) codifica uma proteína de redutase, a qual é uma enzi- ma capaz de reduzir uma ligação dupla de um ácido graxo (por exem- plo, em que ácido graxo está presente como um ácido graxo livre, car- boxilato, fosfolipídio, diacil glicerol ou triacil glicerol). O gene de redu- tase (por exemplo, um gene de redutase recombinante) pode ter uma região de codificação que seja idêntica a uma de uma bactéria da classe Gammaproteobacteria. O gene de redutase pode compreender qualquer uma das sequências de nucleotídeos indicadas na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO:

27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 e SEQ ID NO: 35. O gene de redutase (por exemplo, um gene de redutase recombinan- te) pode ser um gene de 10-metil esteárico A (tmpA) tal como descrito no presente documento ou uma porção biologicamente ativa do mes- mo (isto é, em que a porção biologicamente ativa do mesmo compre- ende a atividade de redutase).

[0112] O gene de redutase (por exemplo, um gene de redutase recombinante) pode ser derivado de uma espécie de Gammaprote- obacteria, tal como as bactérias dos gêneros Desulfobacter, Desulfo- bacula, Marinobacter, Thiohalospira ou Halofilum. O gene de redutase (por exemplo, um gene de redutase recombinante) pode ser selecio- nado do grupo que consiste no gene de tmpA de Desulfobacula balti- cum (SEQ ID NO: 19), gene de tmpA de Marinobacter hydrocarbon- clasticus (SEQ ID NO: 21), gene de tmpA de Thiohalospira halophila (SEQ ID NO: 23), gene de tmpA de Desulfobacter curvatus (SEQ ID NO: 25), gene de tmpA de Desulfobacter phenolica (SEQ ID NO: 27), gene de tmpA de Desulfobacula toluolica (SEQ ID NO: 29), gene de tmpA de Desulfobacter postgatei (SEQ ID NO: 31), gene de tmpA de Halofilum ochraceum (SEQ ID NO: 33), e gene de tmpA de Marinobac- ter aquaeolei (SEQ ID NO: 35). É especificamente contemplado que um ou mais dos genes de redutase acima podem ser excluídos das modalidades da presente invenção.

[0113] Um gene de redutase recombinante pode ser recombinante devido ao fato que ele é ligado operavelmente a um promotor que não o promotor de gene de redutase de ocorrência natural. Tais genes po- dem ser úteis para dirigir a transcrição em uma espécie particular de célula. Um gene de redutase recombinante pode ser recombinante de- vido ao fato que ele contém uma ou mais substituições de nucleotídeo em relação a um gene de redutase de ocorrência natural. Tais genes podem ser úteis para aumentar a eficiência da tradução do transcrito de mRNA do gene de redutase em uma espécie particular de célula.

[0114] Um ácido nucleico pode compreender um gene de redutase recombinante e um promotor, em que o gene de redutase recombinan- te e o promotor são ligados operavelmente O gene de redutase re- combinante e o promotor podem ser derivados de espécies diferentes. Por exemplo, o gene de redutase recombinante pode codificar a prote- íÍna de redutase de uma espécie de Gammaproteobacteria, e o gene de redutase recombinante pode ser ligado operavelmente a um promo- tor que pode dirigir a transcrição em um outro tipo de bactéria ou um eucariota (por exemplo, célula de alga, célula de levedura ou célula de planta). O promotor pode ser um promotor eucariótico. Uma célula po- de compreender o ácido nucleico, e o promotor pode ser capaz de di- rigir a transcrição na célula. Uma célula pode compreender um gene de redutase recombinante, e o gene de redutase recombinante pode ser ligado operavelmente a um promotor capaz de dirigir a transcrição do gene de redutase recombinante na célula. A célula pode ser uma espécie de levedura, e o promotor pode ser um promotor de levedura. A célula pode ser uma espécie de bactéria, e o promotor pode ser um promotor bacteriano (por exemplo, em que o promotor bacteriano não é um promotor de um Gammaproteobacterium). A célula pode ser uma espécie de alga, e o promotor pode ser um promotor de alga. A célula pode ser uma espécie de planta, e o promotor pode ser um promotor de planta.

[0115] Um gene de redutase recombinante pode ser operavelmen- te ligado a um promotor que não pode dirigir a transcrição na célula da qual originou o gene de redutase recombinante. Por exemplo, o pro- motor pode não ser capaz de ligar uma polimerase de RNA da célula da qual originou um gene de redutase recombinante. Em algumas mo- dalidades, o promotor não pode ligar uma polimerase de RNA proca- riótica e/ou iniciar a transcrição mediada por uma polimerase de RNA procariótica. Em algumas modalidades, um gene de redutase recom- binante é ligado operavelmente a um promotor que não pode dirigir a transcrição na célula da qual originou a proteína codificada pelo gene. Por exemplo, o promotor pode não ser capaz de ligar uma polimerase de RNA de uma célula que expressa naturalmente a enzima de redu- tase codificada por um gene de redutase recombinante.

[0116] Um promotor pode ser um promotor induzível ou um promotor constitutivo. Um promotor pode ser qualquer um dos promotores descri- tos na Publicação de Pedido de Patente PCT no. WO 2016/014900, publicada em 28 de janeiro de 2016 (incorporada no presente docu- mento a título de referência em sua totalidade). O documento WO 2016/014900 descreve vários promotores derivados das espécies de levedura Yarrowia lipolytica e Arxula adeninivorans, que podem ser particularmente úteis como promotores para dirigir a transcrição de um gene recombinante em uma célula de levedura. Um promotor pode ser um promotor de um gene que codifica um fator de Alongamento de Tradução EF-10; Glicerol-3-fosfato desidrogenase; Triosefosfato iso- merase 1; Fructose-1,6-bisfosfato aldolase; Fosfoglicerato mutase; pi- ruvato cinase; proteína Export EXP1; Proteína ribossomal S7; desidro- genase de álcool; Fosfoglicerato cinase; Transportador de Hexose; Permease de aminoácido geral; serina protease; Isocitrato liase; Acil- CoA oxidase; ATP-sulfurilase; Hexocinase; 3-fosfoglicerato desidroge- nase; Subunidade alfa de piruvato desidrogenase; Subunidade beta de piruvato desidrogenase; Aconitase; Enolase; Actina; Proteína de resis- tência a múltiplos fármacos (ABC-transportador); Ubiquitina; GTPase; Cotransportador Na+/Pi de membrana de plasma; piruvato descarboxi- lase; Fitase; ou alpha-amilase, por exemplo, em que o gene é de leve- dura, tal como um gene de Yarrowia lipolytica ou de Arxula adeninivo- rans.

[0117] Um gene de redutase recombinante pode compreender uma sequência de nucleotídeos com, com pelo menos ou com no má- ximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, T4%, 15%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de nucleotídeos indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35. Um gene de redutase recombinante pode com- preender uma sequência de nucleotídeos com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 175%, 76%, TT%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950,

1.000, 1.050, 1.100, 1.150, 1.200, 1.250 ou 1.300 pares base contí- guos começando na posição de nucleotídeo 1, 2, 3, 4, 5, 6, 7, 8,9, 10, 11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229,

230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495 496, 497, 498, 499, 500, 501, 502, 503, 504, 505, 506, 507, 508, 509 510, 511, 512, 513, 514, 515, 516, 517, 518, 519, 520, 521, 522, 523 524, 525, 526, 527, 528, 529, 530, 531, 532, 533, 534, 535, 536, 537 538, 539, 540, 541, 542, 543, 544, 545, 546, 547, 548, 549, 550, 551, 552, 553, 554, 555, 556, 557, 558, 559, 560, 561, 562, 563, 564, 565 566, 567, 568, 569, 570, 571, 572, 573, 574, 575, 576, 577, 578, 579 580, 581, 582, 583, 584, 585, 586, 587, 588, 589, 590, 591, 592, 593 594, 595, 596, 597, 598, 599, 600, 601, 602, 603, 604, 605, 606, 607 608, 609, 610, 611, 612, 613, 614, 615, 616, 617, 618, 619, 620, 621, 622, 623, 624, 625, 626, 627, 628, 629, 630, 631, 632, 633, 634, 635 636, 637, 638, 639, 640, 641, 642, 643, 644, 645, 646, 647, 648, 649

650, 651, 652, 653, 654, 655, 656, 657, 658, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 685, 686, 687, 688, 689, 690, 691, 692, 693, 694, 695, 696, 697, 698, 699, 700, 701, 702, 703, 704, 705, 706, 707, 708, 709, 710, 711, 712, 713, 714, 715, 716, 717, 718, 719, 720, 721, 722, 723, 724, 725, 726, 727, 728, 729, 730, 731, 732, 733, 734, 735, 736, 737, 738, 739, 740, 741, 742, 743, 744, 745, 746, 747, 748, 749, 750, 751, 752, 753, 754, 755, 756, 757, 758, 759, 760, 761, 762, 763, 764, 765, 766, 767, 768, 769, 770, 771, 772, 773, TTA, 775, 776, 777, 778, 779, 780, 781, 782, 783, 784, 785, 786, 787, 788, 789, 790, 791, 792, 793, 794, 795, 796, 797, 798, 799, 800, 801, 802, 803, 804, 805, 806, 807, 808, 809, 810, 811, 812, 813, 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 828, 829, 830, 831, 832, 833, 834, 835, 836, 837, 838, 839, 840, 841, 842, 843, 844, 845, 846, 847, 848, 849, 850, 851, 852, 853, 854, 855, 856, 857, 858, 859, 860, 861, 862, 863, 864, 865, 866, 867, 868, 869, 870, 871, 872, 873, 874, 875, 876, 877, 878, 879, 880, 881, 882, 883, 884, 885, 886, 887, 888, 889, 890, 891, 892, 893, 894, 895, 896, 897, 898, 899, 900, 901, 902, 903, 904, 905, 906, 907, 908, 909, 910, 911, 912, 913, 914, 915, 916, 917, 918, 919, 920, 921, 922, 923, 924, 925, 926, 927, 928, 929, 930, 931, 932, 933, 934, 935, 936, 937, 938, 939, 940, 941, 942, 943, 944, 945, 946, 947, 948, 949, 950, 951, 952, 953, 954, 955, 956, 957, 958, 959, 960, 961, 962, 963, 964, 965, 966, 967, 968, 969, 970, 971, 972, 973, 974, 975, 976, 977, 978, 979, 980, 981, 982, 983, 984, 985, 986, 987, 988, 989, 990, 991, 992, 993, 994, 995, 996, 997, 998, 999,

1.000, 1.001, 1.002, 1.003, 1.004, 1.005, 1.006, 1.007, 1.008, 1.009,

1.010, 1.011, 1.012, 1.013, 1.014, 1.015, 1.016, 1.017, 1.018, 1.019,

1.020, 1.021, 1.022, 1.023, 1.024, 1.025, 1.026, 1.027, 1.028, 1.029,

1.030, 1.031, 1.032, 1.033, 1.034, 1.035, 1.036, 1.037, 1.038, 1.039,

1.040, 1.041, 1.042, 1.043, 1.044, 1.045, 1.046, 1.047, 1.048, 1.049,

1.050, 1.051, 1.052, 1.053, 1.054, 1.055, 1.056, 1.057, 1.058, 1.059,

1.060, 1.061, 1.062, 1.063, 1.064, 1.065, 1.066, 1.067, 1.068, 1.069,

1.070, 1.071, 1.072, 1.073, 1.074, 1.075, 1.076, 1.077, 1.078, 1.079,

1.080, 1.081, 1.082, 1.083, 1.084, 1.085, 1.086, 1.087, 1.088, 1.089,

1.090, 1.091, 1.092, 1.093, 1.094, 1.095, 1.096, 1.097, 1.098, 1.099,

1.100, 1.101, 1.102, 1.103, 1.104, 1.105, 1.106, 1.107, 1.108, 1.109,

1.110, 1.111, 1.112, 1.113, 1.114, 1.115, 1.116, 1.117, 1.118, 1.119,

1.120, 1.121, 1.122, 1.123, 1.124, 1.125, 1.126, 1.127, 1.128, 1.129,

1.130, 1.131, 1.132, 1.133, 1.134, 1.135, 1.136, 1.137, 1.138, 1.139,

1.140, 1.141, 1.142, 1.143, 1.144, 1.145, 1.146, 1.147, 1.148, 1.149,

1.150, 1.151, 1.152, 1.153, 1.154, 1.155, 1.156, 1.157, 1.158, 1.159,

1.160, 1.161, 1.162, 1.163, 1.164, 1.165, 1.166, 1.167, 1.168, 1.169,

1.170, 1.171, 1.172, 1.173, 1.174, 1.175, 1.176, 1.177, 1.178, 1.179,

1.180, 1.181, 1.182, 1.183, 1.184, 1.185, 1.186, 1.187, 1.188, 1.189,

1.190, 1.191, 1.192, 1.193, 1.194, 1.195, 1.196, 1.197, 1.198, 1.199,

1.200 da sequência de nucleotídeos indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35. Uma re- dutase recombinante pode ou não ter uma identidade de sequência de 100% com nenhuma das sequências de nucleotídeos indicadas na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, e SEQ ID NO: 35. Um gene de redutase recombinante pode ou não ter uma identidade de sequência de 100% com 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1.000,

1.050, 1.100, 1.150, 1.200, 1.250 ou 1.300 pares base contíguos da sequência de nucleotídeos indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35. Um gene de redu- tase recombinante pode compreender uma sequência de nucleotídeos com, com pelo menos ou com no máximo 65%, 66%, 67%, 68%, 69%, 70%, 171%, 72%, 73%, T4%, T5%, 16%, TT%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de nucleotídeos indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO:29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35, e o gene de redutase recombinante pode codificar uma proteína de redutase com, com pelo menos ou com no máximo 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 291%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequên- cia de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36. Por exemplo, um gene que é otimizado nos códons para a expressão em levedura pode ter uma identidade de sequência de cerca de 70% com a SEQ ID NO: 19, ao passo que a proteína codificada por tal gene otimizado nos códons pode ter uma identidade de sequência de 100% com a sequência de aminoácidos indicada na SEQ ID NO: 20. Desse modo, mesmo que um gene otimizado nos códons possa ter apenas cerca de 70% de identidade de sequência ou menos com o gene original, o gene otimi- zado nos códons codifica a mesma sequência de aminoácidos do ge- ne original.

[0118] Um gene de redutase recombinante pode variar de um ge- ne de redutase de ocorrência natural devido ao fato que o gene de re- dutase recombinante pode ser otimizado nos códons para a expressão em uma célula eucariótica, tal como uma célula de planta, uma célula de alga ou uma célula de levedura. Uma célula pode compreender um gene de redutase recombinante, em que o gene de redutase recombi- nante é otimizado nos códons para a célula.

[0119] Exatamente, pelo menos ou no máximo 1, 2, 3, 4,5,6,7,8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44,45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438,

439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499 ou 500 códons de um gene de redutase re- combinante podem variar de um gene de redutase de ocorrência natu- ral ou podem ser inalterados de um gene de redutase de ocorrência natural. Por exemplo, um gene de redutase recombinante pode com- preender uma sequência de nucleotídeos com uma identidade de se- quência de pelo menos cerca de 65% com a sequência de nucleotí- deos de ocorrência natural indicada na SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33 ou SEQ ID NO: 35 (por exemplo, pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência), e pelo menos 5 códons da sequên- cia de nucleotídeos do gene de redutase recombinante podem variar da sequência de nucleotídeos de ocorrência natural (por exemplo, pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90 ou 100 códons).

[0120] Um gene de redutase codifica uma proteína de redutase. Uma proteína de redutase pode ser uma proteína expressa por uma espécie de Gammaproteobacteria, tais como as bactérias dos gêneros Desulfobacter, Desulfobacula, Marinobacter, Thiohalospira ou Halofi- lum. Um gene de redutase recombinante pode codificar uma proteína de redutase de ocorrência natural mesmo se o gene de redutase re- combinante não for um gene de redutase de ocorrência natural. Por exemplo, um gene de redutase recombinante pode variar de um gene de redutase de ocorrência natural devido ao fato que o gene de redu- tase recombinante é otimizado nos códons para a expressão em uma célula específica. O gene de redutase recombinante otimizado nos có-

dons e o gene de redutase de ocorrência natural podem, no entanto, codificar a mesma proteína de redutase de ocorrência natural.

[0121] Um gene de redutase recombinante pode codificar uma proteína de redutase selecionada do grupo que consiste na proteína de tmpA de Desulfobacula balticum (SEQ ID NO: 20), proteína de tmpA de Marinobacter hydrocarbonclasticus (SEQ ID NO: 22), proteína de tmpA de Thiohalospira halophila (SEQ ID NO: 24), proteína de tmpA de Desulfobacter curvatus (SEQ ID NO: 26), proteína de tmpA de Desulfobacter phenolica (SEQ ID NO: 28), proteína de tmpA de De- sulfobacula toluolica (SEQ ID NO: 30), proteína de tmpA de Desulfo- bacter postgatei (SEQ ID NO: 32), proteína de tmpA de Halofilum ochraceum (SEQ ID NO: 34), e proteína de tmpA de Marinobacter aquaeolei (SEQ ID NO: 36). É contemplado especificamente que uma ou mais das proteínas de redutase acima podem ser excluídas das modalidades da presente invenção. Um gene de redutase recombinan- te pode codificar uma proteína de redutase, e a proteína de redutase pode ser substancialmente idêntica a qualquer uma das enzimas aci- ma, mas o gene de redutase recombinante pode variar do gene de ocorrência natural que codifica a enzima. O gene de redutase recom- binante pode variar do gene de ocorrência natural porque o gene de redutase recombinante pode ser otimizado nos códons para a expres- são em um filo, uma classe, uma ordem, uma família, um gênero, uma espécie ou uma cepa específica de célula.

[0122] As sequências de proteínas de redutase de ocorrência na- tural são indicadas na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 e SEQ ID NO: 36. Um gene de redutase recombinante pode ou não codificar uma proteína que compreende uma identidade de sequência de 100% com a sequência de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26,

SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36. Por exemplo, um gene de redutase recombinante po- de codificar uma proteína que tem 100% de identidade de sequência com uma porção biologicamente ativa de uma sequência de aminoáci- dos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36.

[0123] Um gene de redutase recombinante pode codificar uma proteína de redutase que tem, tem pelo menos ou tem no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 13%, T4%, 15%, 16%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência com a sequência de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36 ou uma porção biologicamente ativa da mesma. Um gene de redutase recombinante pode codificar uma proteína de redutase que tem cerca de, pelo menos cerca de ou no máximo cerca de 0,1%, 0,5%, 1%, 2%, 3%, 4%, 5%, 10%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5%, 99,6%, 99,7%, 99,8%, 99,9%, 100%, 100.1%, 100.2%, 100.3%, 100,4%, 100,5%, 100,6%, 100,7%, 100,8%, 100,9%, 101%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145%, 150%, 160%, 170%, 180%, 190%, 200%, 220%, 240%, 260%, 280%, 300%, 320%, 340%, 360%, 380% ou 400% de atividade de redutase em relação a uma proteína que compreende a sequência de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36. Um gene de redutase recombinante pode codificar uma proteína que tem, tem pelo menos ou tem no máximo 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 173%, T4%, 15%, 16%, 77%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identi- dade de sequência com 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490 ou 500 aminoácidos contíguos começando na posição de aminoácido 1, 2, 3, 4, 5, 6,7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44,45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72,73, 74,75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, 280, 281, 282, 283, 284, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, 295, 296, 297, 298, 299, 300, 301, 302, 303, 304, 305, 306, 307, 308, 309, 310, 311, 312, 313, 314, 315, 316, 317, 318, 319, 320, 321, 322, 323, 324, 325, 326,

327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 342, 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 356, 357, 358, 359, 360, 361, 362, 363, 364, 365, 366, 367, 368, 369, 370, 371, 372, 373, 374, 375, 376, 377, 378, 379, 380, 381, 382, 383, 384, 385, 386, 387, 388, 389, 390, 391, 392, 393, 394, 395, 396, 397, 398, 399, 400, 401, 402, 403, 404, 405, 406, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469, 470, 471, 472, 473, 474, 475, 476, 477, 478, 479, 480, 481, 482, 483, 484, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499 ou 500 da sequência de aminoácido indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36.

[0124] Os substratos para a proteína de redutase podem incluir ácidos graxos com 14 a 18 carbonos de comprimento com uma substi- tuição de metileno na posição A9, A10 ou A11. O substrato pode ter 14, 15, 16, 17 ou 18 carbonos de comprimento ou qualquer faixa aí derivável. A proteína de redutase pode ser capaz de catalisar a redu- ção de um substrato de ácido graxo substituído por metileno em um (metil)lipídio. A proteína de redutase, em conjunto com uma proteína de metil transferase, pode ser capaz de catalisar a produção de uma ramificação metilada de qualquer ácido graxo de 14 a 18 carbonos de comprimento com uma ligação dupla insaturada na posição A9, A10 ou A11, incluindo ácidos graxos que têm 14, 15, 16, 17 ou 18 carbonos de comprimento ou qualquer faixa aí derivável.

[0125] Em algumas modalidades, o gene de redutase recombinan- te codifica uma proteína de redutase que tem aminoácidos específicos inalterados da sequência de aminoácidos indicada na SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34 ou SEQ ID NO: 36. Os aminoácidos inalterados podem incluir 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 1213, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 aminoácidos selecionados de 18, L22, F37, P38, R39, K41, G45, WA46, P49, G144, C148, P149, E169, E171, L197, 1212, C249, H250, Y252, 1270, G275, L276, E283, A296 e A299 de tmpA de Marinobacter hydrocarbonclasti- cus ou aminoácidos correspondentes em tmpA de Desulfobacula balti- cum, Thiohalospira halophila, Desulfobacter curvatus, Desulfobacter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofilum ochraceum ou Marinobacter aquaeolei, de acordo com alinhamento indicado nas Figuras 8A-D.

[0126] Tal como usado no presente documento, o termo "comple- mentar" e os seus derivados são usados em referência ao empare- lhamento de ácidos nucleico pelas regras bem conhecidas que A em- parelha com T ou U e C emparelha com G. O complemento pode ser "parcial" ou "completo". No complemento parcial, somente algumas das bases de ácido nucleico são combinadas de acordo com as regras de emparelhamento de bases; ao passo que no complemento comple- to ou total, todas as bases são combinadas de acordo com a regra de emparelhamento. O grau de complemento entre os filamentos de ácido nucleico pode ter efeitos significativos na eficiência e intensidade da hibridização entre os filamentos de ácido nucleico tal como é bem co- nhecido no estado da técnica. A eficiência e a intensidade da dita hi- bridização dependem do método de detecção.

[0127] Qualquer ácido nucleico que é indicado no presente docu- mento como tendo uma determinada porcentagem de identidade de sequência com uma sequência indicada em uma SEQ ID NO: inclui ácidos nucleicos que têm a determinada porcentagem de identidade de sequência com o complemento da sequência indicada na SEQ ID NO:. d. Ácidos nucleicos que compreendem um gene de metil transferase recombinante e um gene de redutase recombinante

[0128] Um ácido nucleico pode compreender um gene de metil transferase recombinante e um gene de redutase recombinante. O ge- ne de metil transferase recombinante e o gene de redutase recombi- nante podem codificar proteínas da mesma espécie ou de espécies diferentes.

[0129] Um ácido nucleico pode compreender a sequência de nu- cleotídeos de um vetor de expressão que compreende um óperon tmp que inclui um gene de metil transferase e um gene de redutase. Tais vetores podem incluir DpNC1071 (SEQ ID NO: 39), que inclui um ópe- ron tmp de Desulfobacter postgatei; phC1072 (SEQ ID NO: 40), que inclui um óperon tmp de Desulfobacula balticum, pNC1073 (SEQ ID NO: 41), que inclui um óperon tmp de Desulfobacula toluolica; PNC1074 (SEQ ID NO: 42), que inclui um óperon tmp de Marinobacter hydrocarbonclasticus; e phNC1076 (SEQ ID NO: 43), que inclui um ópe- ron tmp de Thiohalospira halophila.

[0130] Em algumas modalidades, o ácido nucleico codifica uma proteína de fusão que inclui uma metil transferase e uma redutase ou fragmentos destas. No contexto da presente invenção, "proteína de fusão" refere-se a uma única molécula de proteína que contém duas ou mais proteínas distintas ou seus fragmentos, ligadas covalentemen- te através da ligação peptídica em uma única cadeia peptídica. Em algumas modalidades, a proteína de fusão compreende domínios en- zimaticamente ativos de uma proteína de metil transferase e de uma proteína de redutase. O ácido nucleico também pode codificar um pep- tídeo ligante entre a metil transferase e a redutase. Em algumas moda- lidades, o peptídeo ligante compreende a sequência de aminoácidos

AGGAEGGNGGGA. O ligante pode compreender cerca de ou pelo menos cerca de 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 ou 30 aminoácidos ou qualquer faixa aí derivável. O ácido nucleico pode compreender qualquer um dos genes de metil transferase e de redutase descritos no presente documento, e a proteína de fusão codificada pelo ácido nu- cleico pode compreender qualquer uma das proteínas de metil transfe- rase e de redutase descritas no presente documento, incluindo seus fragmentos biologicamente ativos. Em algumas modalidades, a proteí- na de fusão é uma proteína de tmpA-B, em que a proteína de tmpA fica mais perto do N-terminus do que a proteína de tmpB.

3. Composições

[0131] Vários aspectos da invenção referem-se às composições produzidas pelas células descritas no presente documento. A compo- sição pode ser uma composição de óleo que compreende cerca de, pelo menos cerca de ou no máximo cerca de 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 714%, 175%, 16%, 17%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100% em peso de lipídios. À composição pode compreender (metil)lipídios ramificados e/ou lipídios substituídos por exometilenos. O (metil)lipídio ramificado pode ser um ácido carboxílico (por exemplo, o ácido 10-metil esteárico, o ácido 10- metil palmítico, o ácido 12-metil oleico, o ácido 13-metil oleico, o ácido 10-metil-octadec-12-enoico), carboxilato (por exemplo, estearato de 10-metila, palmitato de 10-metila, oleato de 12-metila, oleato de 13- metila, 10-metil-octadec-12-enoato), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), tioéster (por exemplo, 10-metil estearil CoA, 10-metil palmitil CoA, 12-metil oleoil CoA, 13-metil oleoil CoA, 10-metil- octadec-12-enoil CoA) ou amida. O lipídio substituído por exometileno pode ser um ácido carboxílico (por exemplo, o ácido 10-metileno es- teárico, o ácido 10-metileno palmítico, o ácido 12-metileno oleico, o ácido 13-metileno oleico, o ácido 10-metileno-octadec-12-enoico), car- boxilato (por exemplo, estearato de 10-metileno, palmitato de 10- metileno, oleato de 12-metileno, oleato de 13-metileno, 10-metileno- octadec-12-enoato), éster (por exemplo, diacil glicerol, triacil glicerol, fosfolipídio), ticéster (por exemplo, 10-metileno estearil CoA, 10- metileno palmitil CoA, 12-metileno oleoil CoA, 13-metileno oleoil CoA, 10-metileno-octadec-12-enoil CoA) ou amida. 10-metil lipídios, 10- metileno lipídios, ou ambos. É contemplado especificamente que um ou mais dos lipídios acima podem ser excluídos de determinadas mo- dalidades.

[0132] Em alguns aspectos, a composição é produzida mediante o cultivo de uma cultura que compreende qualquer uma das células des- critas no presente documento e que recuperação da composição de óleo da cultura de células. As células na cultura podem conter qual- quer dos genes de metil transferase recombinantes descritos no pre- sente documento e/ou qualquer um dos genes de redutase recombi- nantes descritos no presente documento. O meio de cultura e as con- dições podem ser escolhidos com base na espécie da célula a ser cul- tivada e podem ser otimizados para obter uma produção máxima do perfil de lipídio desejado.

[0133] São conhecidos vários métodos para a recuperação de uma composição de óleo de uma cultura de células. Por exemplo, os lipídios, os derivados de lipídios e os hidrocarbonetos podem ser extra- ídos com um solvente hidrofóbico tal como o hexano. Os lipídios e os derivados de lipídios também podem ser extraídos ao usar a liquefa- ção, a liquefação de óleo, e a extração de CO» supercrítica. O proces- so de recuperação pode incluir a colheita das células cultivadas, tal como por meio de filtração ou centrifugação, lise de células para criar um lisato, e extração dos componentes de lipídio/hidrocarboneto ao usar um solvente hidrofóbico.

[0134] Além de acumular dentro das células, os lipídios descritos no presente documento podem ser secretados pelas células. Nesse caso, um processo para recuperar o lipídio pode não requerer a cria- ção de um lisato das células, mas a coleta do lipídio secretado do meio de cultura. Desse modo, as composições descritas no presente docu- mento podem ser obtidas mediante o cultivo de uma célula que secre- ta um dos lipídios descritos no presente documento, tal como um ácido graxo linear com um comprimento de cadeia de 14 a 18 carbonos com uma ramificação de metila na posição A9, A10 ou A11.

[0135] Em algumas modalidades, a composição de óleo compre- ende cerca de, pelo menos cerca de ou no máximo cerca de 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 14%, 15%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% em peso de (metil)lipídio ramificado, tal como um 10-metil ácido graxo ou qualquer faixa aí derivável. Em algumas modalidades, os ácidos 10-metil graxos compreendem cerca de, pelo menos cerca de ou no máximo cerca de 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 173%, T4%, T5%, 16%, 177%, 18%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,

96%, 97%, 98% ou 99% em peso dos ácidos graxos na composição ou qualquer faixa aí derivável.

[0136] A quantidade dos ácidos 10-metil graxos em uma célula pode otimizada por vários métodos. Por exemplo, o aumento da ex- pressão de tmpA e/ou tmpB pode aumentar a atividade da metil trans- ferase e/ou da redutase dentro da célula, o que pode conduzir à acu- mulação de maiores quantidades de (metil)lipídios ramificados. Uma maneira para que isto possa ser realizado é o aumento do número de cópias de gene na célula, tal como a inclusão dos genes em plasmí- deo de elevado número de cópias. Adicional ou alternativamente, as células de tmpA e/ou tmpB podem ser operavelmente ligadas a um promotor que dirige níveis elevados de expressão.

4. Métodos de produção de (metil)lipídio ramificado

[0137] Vários aspectos da invenção referem-se a um método de produção de (metil)lipídio ramificado. O método pode compreender a incubação de uma célula ou uma pluralidade de células tal como des- crito no presente documento, supra, com meios. Os meios podem ser opcionalmente suplementados com um ácido graxo insaturado não ramificado, tal como o ácido oleico, que serve como um substrato para a metilação. O substrato pode incluir um ou mais ácidos graxos de 14 a 18 carbonos de comprimento com uma ligação dupla na posição A9, A10 ou A11. O substrato pode ter 14, 15, 16, 17 ou 18 carbonos de comprimento ou qualquer faixa aí derivável. Os meios podem ser opci- onalmente suplementados com metionina ou s-adenosil metionina, que podem servir similarmente como um substrato. Desse modo, o método pode compreender a colocação de uma célula ou uma pluralidade de células em contato com ácido oleico (ou algum outro substrato a ser metilado), metionina, ou ambos. O método pode compreender a incu- bação de uma célula ou uma pluralidade de células tal como descrito no presente documento, supra, em um biorreator. O método pode compreender a recuperação dos lipídios das células, tal como pela ex- tração com um solvente orgânico.

[0138] O método pode compreender a desresinação da célula ou da pluralidade de células, por exemplo, para remover as proteínas. O método pode compreender a transesterificação ou a esterificação dos lipídios das células. Um álcool tal como o metanol ou o etanol pode ser usado para a transesterificação ou a esterificação, por exemplo, desse modo produzindo um éster metílico de ácido graxo ou um éster etílico de ácido graxo.

EXEMPLOS

[0139] A presente invenção será descrita em maiores detalhes por meio de exemplos específicos. Os exemplos a seguir são oferecidos para finalidades ilustrativas somente, e não se prestam a limitar a in- venção de nenhuma maneira. Os elementos versados no estado da técnica irão reconhecer de imediato uma variedade de parâmetros não críticos que podem ser mudados ou modificados para atingir essenci- almente os mesmos resultados. Exemplo 1 Identificação de Genes de tmpB e tmpA em Gammaproteobacteria

[0140] É sabido que as Gammaproteobacteria selecionadas pro- duzem ácidos 10-metil graxos ramificados. Foi relatado que as bacté- rias Desulfobacter que oxidam acetato e reduzem sulfato produzem o ácido 10-metil hexadecanoico a 6% - 24% do teor total de ácido graxo ligado com éster fosfolipídio (Dowling, Microbiology 132:1815-25 (1986)). Há outros relatórios de produção de ácido 10-metil graxo rami- ficado para as bactérias dos gêneros Marinobacter (Márquez, J. Syst. Evol. Microbiol. 55:1349-51 (2005); Huu, Int. J. Syst. Evol. Microbiol. 49:367-75 (1999); Gauthier, Int. J. Int. Syst. Evol. Microbiol. 42:568-76 (1992); Thiohalospira (Sorokin, Int. J. Syst. Evol. Microbiol., 58:2890- 97 (2008)), Thiohalorhabdus (Sorokin, Int. J. Syst. Evol. Microbiol.

58:2890-97 (2008)), Desulfobacula, e Desulfotignum (Kuever, Int. J. Syst. Evol. Microbiol. 51:171-77 (2001)). No entanto, nenhum gene ou enzima envolvido na produção de ácido 10-metil graxo de Gammapro- teobacteria foi descrito. Neste exemplo, é descrito um par de genes filogeneticamente distintos com homologia de sequência em determi- nadas Gammaproteobacteria que dirigem a produção direta de ácidos 10-metil graxos em hospedeiros heterólogos.

[0141] Uma lista de Gammaproteobacteria que produzem ácidos 10-metil graxos e têm genomas arranjados em sequência foi compila- da a partir de relatórios da literatura. Além disso, as Gammaproteobac- teria representativas que não são relatadas como produtoras de ácidos 10-metil graxos foram incluídas para fins de comparação. De acordo com um estudo bioquímico na bactéria Mycobacterium phlei não rela- tado usando preparados de enzima não purificados, a primeira etapa da síntese de ácido 10-metil graxo ocorre através de um mecanismo similar à síntese de ácido ciclopropano graxo e é seguida por uma etapa de redução enzimática (Akamatsu, J. Biol. Chem. 245:701-08 (1970)). Para encontrar genes candidatos responsáveis pela produção de ácido 10-metil graxo de Gammaproteobacteria, genomas foram es- caneados quanto a homólogos de sintase de acil fosfolipídio graxa (cfa) de E. coli (cfa), que é responsável pela metilação de ácidos gra- xos insaturados para produzir ácidos ciclopropano graxos (Wang, Bio- chemistry 31:11020-28 (1992); Taylor, Biochemistry 18:3292-3300 (1979)). Isto foi executado ao usar a ferramenta de análise de proteína NCBI BLAST e o banco de dados genomico BioCyc (Caspi, Nucleic Acids Res. 40:D742-53 (2016)). Em seguida, os homólogos de cfa fo- ram escaneados quanto a genes adjacentes em uma estrutura de ópe- ron que tinha homologia a uma função de oxidorredutase ou de trans- ferência de elétrons. É interessante observar que todas as Gammapro- teobacteria com capacidade de produzir ácidos 10-metil graxos possu-

íam um óperon de gene (indicado no presente documento como ópe- ron de tmp) com um homólogo de gene de sintase de ácido ciclopro- pano graxo (indicado no presente documento como tmpB) e um gene com homologia a uma redutase de geranilgeranil (indicada no presente documento como tmpA). Estes resultados são resumidos na Figura 2. É improvável que a tmpA seja uma redutase de geranilgeranil verda- deira, uma vez que a enzima está envolvida na biossíntese de clorofila e tocoferol, componentes químicos nenhum dos quais as bactérias produzem. Exemplo 2 Expressão de E. coli de Produtos de Genes de tmpB e de tmpA

[0142] Para testar se o óperon do gene de tmp era responsável pela produção de ácido 10-metil graxo de Gammaproteobacteria, os genes foram projetados em um vetor de expressão de E. coli ao usar o software de manipulação de DNA A Plasmid Editor e sintetizados por Thermofisher Scientific-GeneArt. O uso do códon nativo dos genes de tmp não foi alterado. A transcrição do gene de tmpB foi controlada ao usar o promotor tac constitutivamente ativo (de Boer 1983), seguido pela região de ligador intergenes lacZ-lacY de E. coli, pelo gene de tmpA, e pelo terminador do gene de trpT' (Wu 1981). Esses óperons de genes sintéticos foram clonados em um vetor de expressão de E. coli que contém o gene de resistência a ampicilina AMpR e a origem ColE1 da replicação (Figuras 3A-3B). Os vetores de plasmídeo são nomeados pNC1071 (SEQ ID NO: 39), que inclui o óperon de tmp de Desulfobacter postgatei; pNC1072 (SEQ ID NO: 40), que inclui o ópe- ron de tmp de Desulfobacula balticum; pnC1073 (SEQ ID NO: 41), que inclui o óperon de tmp de Desulfobacula toluolica; pNC1074 (SEQ ID NO: 42), que inclui o óperon de tmp de Marinobacter hydrocarbonclas- ticus; e pnC1076 (SEQ ID NO: 43), que inclui o óperon de tmp de Thiohalospira halophila.

[0143] Os plasmídeos pNC1071, pNC1072, pNC1073, pNC1074, PNC1076, e o plasmídeo de controle pNC53 que contém o gene de AmpR, a origem ColE1, e o promotor tac foram transformados em Top10 de E.coli (Invitrogen) ao usar um protocolo de eletrotransforma- ção padrão que utiliza 50 ul de células suspensas, 1 ul de DNA de plasmídeo a uma concentração de 200 ng por ul, uma cubeta de ele- trotransformação com uma abertura de 1 mm, e um pulso com uma voltagem de 1,8 kV, 200 O, e 25 yuF com deterioração exponencial e uma constante de tempo de cerca de 4,5 milissegundos. Durante o protocolo, as células foram mantidas no gelo e a cubeta foi previamen- te esfriada antes da pulsação com Gene Pulser Electroporation Sys- tem da Bio-Rad. Depois da pulsação, as células foram transferidas a um meio de 1 ml de SOC e incubadas a 37ºC por 1 hora antes do chapeamento em ágar LB contendo 100 ug por ml do antibiótico ampi- cilina.

[0144] As colônias individuais das placas de transformação foram escolhidas e cultivadas em meios líquidos de 5 ml LB em tubos de plástico Falcon de 14 ml durante toda a noite a 37ºC. Estes foram usados na preparação de frascos de freezer com 0,75 ml de caldo de cultura e 0,75 ml de glicerol/água a 50% que foram armazenados a - 80ºC.

[0145] Os estudos de fermentação foram realizados em um meio de 50 ml LB com 100 ug por ml de ampicilina em frascos de agitação defletidos de 250 ml. 10 ul de material de partida de cultura congelado foram adicionados ao meio e o frasco foi incubado a 37ºC e agitado a 200 rpm em uma incubadora orbital New Brunswick por 24 horas. As células foram colhidas por meio de centrifugação a 4.000 rpm por 15 minutos em um centrifugador clínico Eppendorf 5810 R, resuspensas em 0,5 ml de água deionizada, e congeladas a -80ºC.

[0146] A Figura 6 mostra que E. coli transformadas com pNC1071,

PNC1073, pNC1074, e pNC1076, mas não o controle de vetor vazio (PNC53), produziram ácido 10-metileno hexadecenoico.

[0147] Para testar a faixa do substrato da cadeia de acila para as enzimas de tmpB e tmpA, E. coli transformadas com pNC1074 (óperon de tmp de M. hydrocarbonclausticus) ou pnC1076 (óperon de tmp de T. halophila) foram cultivadas em meio LB suplementado com ampicili- na e 100 mg/l de um dos ácidos graxos indicados na Tabela 1 a se- guir. Depois do cultivo, as células foram colhidas por meio de centrifu- gação, lavadas com água deionizada, ressuspensas em água deioni- zada, e congeladas. As células foram então liofilizadas até secar e usadas para realizar uma reação de transesterificação catalisada com etanol para produzir ésteres metílicos de ácido graxo (FAMA). Essas amostras foram dissolvidas em iso-octano e injetadas em um sistema de cromatografia de gás (Agilent Technologies) equipado com um de- tector de ionização de chama. A Tabela 1 mostra a porcentagem de cada ácido graxo que foi convertido em ácidos graxos ramíificados com metileno e metila. Tabela 1. Conversão de ácido graxo em ácidos graxos ramificados com metileno e metila com E. coli que expressa os genes de tmpB e tmpA de M. hydrocarbonclasticus e T. halophila. o Ecoli+rpNCIO74(impBA — — E.coli+tpNC1076(timpBAde Ácido graxo de M. hydrocarbonclausticus) (T. halophila) porcentagem de porcentagem de conversão conversão datada gg A. -::5mrirssrnns ISA | |] 13:1A12 0% 0% 14:1A9 89% 95% 15:1A10 86% 69% 16:1A9 55% 95% 17:1010 36% 19% 18:106 0% 0% 18:1A9 42% 47%

“o EcolitpNCIO74(timpBA — — E.colitpNC1076(timpBAde | Ácido graxo de M. hydrocarbonclausticus) (T. halophila) porcentagem de porcentagem de conversão conversão qeBaagg ag No222+?gaoaÓAÓ5"“" ,2=JÃM EU] 19:1A7 0% 0% 19:1A10 0% 0% 20:1A5 0% 0% 20:18 0% 0% 20:1A11 0% 0% 22:1013 0% 0% 24:1015 0% 0%

[0148] Tal como mostrado na Tabela 1, a metilação ocorreu em ácidos graxos com 14, 15, 16, 17, e 18 carbonos, e nas posições de ligação dupla 49, 410 e A11. Exemplo 3 Expressão do Gene de tmpB em Levedura

[0149] Para testar a produção dos ácidos 10-metileno graxos pelos genes de tmpB nas leveduras Saccharomyces cerevisiae e Yarrowia lipolytica, os genes que contêm códons bacterianos nativos foram clo- nados em um vetor de superexpressão de Yarrowia padrão. O vetor contém um marcador NAT selecionável e uma origem de replicação de 214 para a manutenção de elevadas cópias em Saccharomyces cerevi- siae. Os plasmídeos resultantes são pnC996 (tmpB de Desulfobacter postgatei), pnNC998 (pmpB de Desulfobacula balticum), pnNC1002 (tmpB de Desulfobacula toluolica), phC1004 (tmpB de Marinobacter hydrocarbonclasticus), pCN1006 (tmpB de Thiohalospira halophila). Para Saccharomyces, os plasmídeos foram transformados em NS20 pelo protocolo de choque térmico padrão. As células individuais das transformações resultantes foram selecionadas e cultivadas ainda em placas de agitação de 96 poços em YPD suplementado com os 50 pg/ml de Nourseotricina por 2 dias a 30º C. Para Yarrowia, os plasmí-

deos foram transformados na cepa NS1009. As cepas transformadas resultantes foram cultivadas em placas de agitação de 96 poços em mio limitado de nitrogênio padrão por 4 dias a 30ºC. Para todos os ex- perimentos de levedura, pelotas de células foram isoladas por meio de centrifugação e secadas por congelamento para a análise de ácido graxo através de cromatografia de gás tal como executado para as amostras de E. coli. O total de ácidos graxos foi medido e a quantida- de total de ácidos graxos de C16 e C18que contêm os intermediários de metileno foi quantificada.

[0150] Resultados: Três genes de tmpB produziram ácidos 10-me- tileno graxos em NS20, Desulfobacula balticum, Marinobacter hydro- carbonclasticus e Thiohalospira halophila (Figura 4). Os genes de tmpB de Marinobacter hydrocarbonclasticus e Thiohalospira halophila puderam produzir ácidos 10-metileno graxos em Yarrowia lipolytica (Figura 5). Exemplo 4 Análise da sequência de tmpB e de tmpA

[0151] As sequências de proteínas de TMpB codificadas pelos ge- nes de tmpB de Desulfobacula balticum, Marinobacter hydrocarbon- clasticus, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum e Marinobacter aquaeolei foram alinhadas com a en- zima de sintase de ácido ciclopropano graxo (Cfa) de Escherichia coli com o programa de software CLUSTAL OMEGA (European Molecular Biology Laboratory, EMBL). As Figuras 7A-D mostram o alinhamento dessas sequências de proteínas e indicam um número de aminoácidos que são conservados nas sequências de proteínas de tmsB, mas não na sequência de Cfa de E. coli. Os aminoácidos a seguir são conser- vados nas proteínas alinhadas de TmMpB, mas não estão presentes na proteína de Cfa de E. coli Y163, T175, R199, E211, G269, Y271,

N313, N319, W389 (número de aminoácido com base na proteína de TmpB de M. hydrocarbonclasticus). A porcentagem de identidade de sequência de cada uma das proteínas alinhadas em comparação a tmpB de M. hydrocarbonclasticus é indicada a seguir: % de identidade da sequência de aminoácidos TmpB de Desulfobacula balticum 37% TmpB de Thiohalospira halophila 58% TmpB de Desulfobacter curvatus 43% TmpB de Desulfobacter phenolica 39% TmpB de Desulfobacula toluolica 39% TmpB de Desulfobacter postgatei 43% TmpB de Halofilum ochraceum 59% TmpB de Marinobacter aquaeolei 88% Cfa de Escherichia coli 46%

[0152] As sequências de proteínas de TMpA codificadas pelos ge- nes de tmpA de Desulfobacula balticum, Marinobacter hydrocarbon- clasticus, Thiohalospira halophila, Desulfobacter curvatus, Desulfobac- ter phenolica, Desulfobacula toluolica, Desulfobacter postgatei, Halofi- lum ochraceum e Marinobacter aquaeolei foram alinhados com a pro- teína AFO464 de geranilgeranil redutase de Archaeoglobus fulgidus com o programa de software CLUSTAL OMEGA (European Molecular Biology Laboratory, EMBL). As Figuras 8A-D mostram o alinhamento dessas sequências de proteínas e indicam um número de aminoácidos que são conservados nas sequências de proteínas de tmsA, mas não na proteína de geranilgeranil redutase AFO464 de Archaeoglobus ful- gidus. Os aminoácidos a seguir são conservados nas proteínas ali- nhadas TMpA, mas não estão presentes na proteína AFO464 de gera- nilgeranil redutase de Archaeoglobus fulgidus: 18, L22, F37, P38, R39, K41, G45, WA46, P49, G144, C148, P149, E169, E171, L197, 1212, C249, H250, Y252, 1270, G275, L276, E283, A296, A299 (número de aminoáci- do com base na proteína de TMpA de M. hydrocarbonclasticus).

% de identidade da sequência de aminoácidos TmpA de Desulfobacula balticum 33% TmpA de Thiohalospira halophila 57% TmpA de Desulfobacter curvatus 36% TmpA de Desulfobacter phenolica 34% TmpA de Desulfobacula toluolica 34% TmpA de Desulfobacter postgatei 34% TmpA de Halofilum ochraceum 64% TmpA de Marinobacter aquaeolei 83% AFO464 de Archaeoglobus fulgidus 27%

Claims

REIVINDICAÇÕES

1. Célula, caracterizada pelo fato de que compreende um gene de metil transferase recombinante que codifica uma proteína de metil transferase de uma bactéria da classe Gammaproteobacteria e um (metil)lipídio ramificado ou então um lipídio substituído por exome- tileno, em que o (metil)lipídio ramificado é um ácido carboxílico, um carboxilato, um éster, um tioéster, ou uma amida; e o (metil)lipídio ramificado compreende uma cadeia alifática ramiíficada saturada ou insaturada que compreende um grupo metila de ramificação; ou o lipídio substituído por exometileno é um ácido carboxílico, um carboxilato, um éster, um tioéster, ou uma amida; e o lipídio substituído por exometileno compreende uma ca- deia alifática ramificada; e a cadeia alifática é ramificada porque a cadeia alifática é substituída por um grupo exometileno.

2. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que o (metil)lipídio ramificado ou o lipídio substituído por exometileno é um ácido graxo de 14 a 18 carbonos de comprimento com uma porção metila na posição A9, A10 ou 411.

3. Célula de acordo com a reivindicação 2, caracterizada pelo fato de que o (metil)lipídio ramificado é 10-metil estearato, ou um éster, um tioéster, ou uma amida do mesmo ou o lipídio substituído por exometileno é 10-metileno estearato, ou um éster, um tioéster, ou uma amida do mesmo.

4. Célula de acordo com a reivindicação 3, caracterizada pelo fato de que o (metil)lipídio ramificado ou o lipídio substituído por exometileno é um diacil glicerol, triacil glicerol, ou fosfolipídio, e em que o diacil glicerol, o triacil glicerol ou o fosfolipídio compreende um éster de 10-metil estearato.

5. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a proteína de metil transferase é selecionada da en- zima tmpB de Desulfobacula balticum, da enzima tmpB de Marinobacter hydrocarbonclasticus, ou da enzima tmpB de Thiohalospira halophila.

6. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a proteína de metil transferase tem uma identidade de sequência de pelo menos 90% com a SEQ ID NO: 2, a SEQ ID NO: 4, ou a SEQ ID NO: 6.

7. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que ainda compreende um gene de redutase recombinan- te que codifica uma proteína de redutase de uma bactéria da classe Gammaproteobacteria.

8. Célula de acordo com a reivindicação 7, caracterizada pelo fato de que a proteína de redutase tem a capacidade de converter um lipídio substituído por metileno em um lipídio substituído por metila.

9. Célula de acordo com a reivindicação 8, caracterizada pelo fato de que o lipídio substituído por metileno é um ácido graxo de 14 a 18 carbonos de comprimento com uma substituição de metileno na posição A9, A10 ou A11 e o lipídio substituído por metila é um ácido graxo de 14 a 18 carbonos de comprimento com uma porção metila na posição A9, A10 ou A11.

10. Célula de acordo com a reivindicação 7, caracterizada pelo fato de que a proteína de redutase é selecionada da enzima tmpB de Desulfobacula balticum, da enzima tmpB de Marinobacter hydro- carbonclasticus, ou da enzima tmpB de Thiohalospira halophila.

11. Célula de acordo com a reivindicação 7, caracterizada pelo fato de que a proteína de redutase tem uma identidade de se- quência de pelo menos 90% com a SEQ ID NO: 20, a SEQ ID NO: 22, ou a SEQ ID NO: 24.

12. Célula de acordo com a reivindicação 7, caracterizada pelo fato de que o gene de metil transferase e o gene de redutase são incluídos em uma única estrutura de leitura aberta que codifica uma proteína de fusão que compreende a proteína de metil transferase e a proteína de redutase.

13. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos cerca de 1% a cerca de 15% em peso dos ácidos graxos da célula consistem em ácidos graxos de 10-metila ou ácidos graxos de 10-metileno.

14. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a célula não contém um gene endógeno de metil transferase.

15. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a célula não tem a capacidade endógena de produzir o (metil)lipídio ramificado ou o lipídio substituído por exometileno.

16. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a célula é uma célula de bactéria, uma célula de fun- go, uma célula de alga, uma célula de mofo, uma célula de planta, ou uma célula de levedura.

17. Célula de acordo com a reivindicação 1, caracterizada pelo fato de que a célula é selecionada do grupo que consiste em Ar- xula, Aspegillus, Aurantiochytrium, Candida, Claviceps, Cryptococcus, Cunninghamella, Geotrichum, Hansenula, Kluyveromyces, Kodamaea, Leucosporidiella, Lipomyces, Mortierella, Ogataea, Pichia, Prototheca, Rhizopus, Rhodosporidium, Rhodotorula, Saccharomyces, Schizosac- charomyces, Tremella, Trichosporon, Wickerhamomyces e Yarrowia.

18. Célula de acordo com a reivindicação 17, caracterizada pelo fato de que a célula é selecionada do grupo que consiste em Ar- xula adeninivorans, Aspergillus niger, Aspergillus orzyae, Aspergillus terreus, Aurantiochytrium limacinum, Candida utilis, Claviceps purpu- rea, Cryptococcus albidus, Cryptococcus curvatus, Cryptococcus rami-

rezgomezianus, Cryptococcus terreus, Cryptococcus wieringae, Cun- ninghamella echinulata, Cunninghamella japonica, Geotrichum fermen- tans, hansenula polymorpha, Kluyveromyces lactis, Kluyveromyces marxianus, Kodamaea ohmeri, Leucosporidiella creatinivora, Li- pomyces lipofer, Lipomyces starkeyi, Lipomyces tetrasporus, Mortierel- la isabellina, Mortierella alpina, Ogataea polymorpha, Pichia ciferrii, Pichia guilliermondii, Pichia pastoris, Pichia stipites, Prototheca zopfii, Rhizopus arrhizus, Rhodosporidium babjevae, Rhodosporidium toruloi- des, Rhodosporidium paludigenum, Rhodotorula glutinis, Rhodotorula mucilaginosa, Saccharomyces cerevisiae, Schizosaccharomyces pom- be, Tremella enchepala, Tichosporon cutaneum, Trichosporon fermen- tans, Wickerhamomyces ciferrii e Yarrowia lipolytica.

19. Método de produção de um (metil)lipídio ramificado ou um lipídio substituído por exometileno, caracterizado pelo fato de que compreende a colocação da célula como definida em qualquer uma das reivindicações 1 a 18 em contato com um substrato de ácido graxo, meti- onina, ou um substrato de ácido graxo e metionina, em que o substrato de ácido graxo compreende um ácido graxo de 14 a 18 carbonos de comprimento com uma ligação dupla na posição A9, A10 ou 411.

20. Ácido nucleico, caracterizado pelo fato de que compre- ende um gene de metil transferase recombinante que codifica uma proteína de metil transferase de uma bactéria da classe Gammaprote- obacteria e um primeiro promotor ligou operavelmente ao gene de me- til transferase recombinante.

21. Ácido nucleico de acordo com a reivindicação 20, carac- terizado pelo fato de que o gene de metil transferase tem uma identi- dade de sequência de pelo menos 80% com a SEQ ID NO: 1, a SEQ ID NO: 3, ou a SEQ ID NO: 5.

22. Ácido nucleico de acordo com a reivindicação 20, carac- terizado pelo fato de que o gene de metil transferase codifica uma pro-

teína que tem uma identidade de sequência de pelo menos 90% com a SEQ ID NO: 2, a SEQ ID NO: 4, ou a SEQ ID NO: 6.

23. Ácido nucleico de acordo com a reivindicação 20, carac- terizado pelo fato de que o gene de metil transferase é otimizado no códon para a expressão em levedura, algas ou plantas.

24. Ácido nucleico de acordo com a reivindicação 20, carac- terizado pelo fato de que ainda compreende um gene de redutase que codifica uma proteína de redutase de uma bactéria da classe Gamma- proteobacteria.

25. Ácido nucleico de acordo com a reivindicação 24, carac- terizado pelo fato de que o gene de redutase tem uma identidade de sequência de pelo menos 80% com a SEQ ID NO: 19, a SEQ ID NO: 21, ou a SEQ ID NO: 23.

26. Ácido nucleico de acordo com a reivindicação 24, carac- terizado pelo fato de que o gene de redutase codifica uma proteína que tem uma identidade de sequência de pelo menos 90% com a SEQ ID NO: 20, a SEQ ID NO: 22, ou a SEQ ID NO: 24.

27. Ácido nucleico de acordo com a reivindicação 24, carac- terizado pelo fato de que o gene de redutase é fundido na estrutura com o gene de metil transferase.

28. Ácido nucleico de acordo com a reivindicação 27, carac- terizado pelo fato de que ainda compreende uma sequência de ligante de ácido nucleico entre o gene de metil transferase e o gene de redu- tase, em que a sequência de ligantes de ácido nucleico codifica um peptídeo do ligante entre a proteína de metil transferase e a proteína de redutase.

29. Ácido nucleico de acordo com a reivindicação 24, carac- terizado pelo fato de que o gene de redutase é ligado operavelmente a um segundo promotor.