BR112019025376A2 - método para produzir albicanol e/ou drimenol - Google Patents

método para produzir albicanol e/ou drimenol Download PDF

Info

Publication number
BR112019025376A2
BR112019025376A2 BR112019025376-9A BR112019025376A BR112019025376A2 BR 112019025376 A2 BR112019025376 A2 BR 112019025376A2 BR 112019025376 A BR112019025376 A BR 112019025376A BR 112019025376 A2 BR112019025376 A2 BR 112019025376A2
Authority
BR
Brazil
Prior art keywords
seq
sequence
polypeptide
sesquiterpene
drimane
Prior art date
Application number
BR112019025376-9A
Other languages
English (en)
Inventor
Michel Schalk
Pauline Anziani
Christian Goerner
Daniel Solis Escalante
Original Assignee
Firmenich S.A.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Firmenich S.A. filed Critical Firmenich S.A.
Publication of BR112019025376A2 publication Critical patent/BR112019025376A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

Método para produzir um sesquiterpeno drimane tal como albicanol, drimenol e/ou derivados dos mesmos colocando-se em contato pelo menos um polipeptídeo com farnesil difosfato (FPP) com um polipeptídeo que compreende um domínio de hidrolase semelhante a Haloácido deshalogenase (HAD) e que tem atividade de terpeno sintase bifuncional. O método pode ser realizado in vitro ou in vivo. Também são fornecidas sequências de aminoácidos de polipeptídeos úteis nos métodos e ácidos nucleicos que codificam os polipeptídeos descritos. O método fornece adicionalmente células ou organismos hospedeiros geneticamente modificados para expressar os polipeptídeos e úteis para produzir um sesquiterpeno drimane tal como albicanol, drimenol e/ou derivados dos mesmos.

Description

“MÉTODO PARA PRODUZIR ALBICANOL E/OU DRIMENOL” CAMPO DA TÉCNICA
[001] No presente documento são fornecidos métodos bioquímicos para produzir albicanol, drimenol e compostos e derivados relacionados, sendo que o método compreende o uso de polipeptídeos inovadores.
ANTECEDENTES
[002] Terpenos são encontrados na maioria dos organismos (micro- organismos, animais e plantas). Esses compostos são constituídos de cinco unidades de carbono chamadas unidades de isopreno e são classificados pelo número dessas unidades presentes em sua estrutura. Assim, monoterpenos, sesquiterpenos e diterpenos são terpenos que contêm 10, 15 e 20 átomos de carbono, respectivamente. Sesquiterpenos, por exemplo, são amplamente encontrados no reino vegetal. Muitas moléculas de sesquiterpeno são conhecidas por suas propriedades de sabor e aroma e seus efeitos cosméticos, medicinais e antimicrobianos. Inúmeros hidrocarbonetos sesquiterpeno e sesquiterpenóides têm sido identificados. As abordagens de síntese química foram desenvolvidas, mas ainda são complexas e nem sempre econômicas.
[003] A produção biossintética de terpenos envolve enzimas chamadas terpeno sintases. Existem inúmeras sesquiterpeno sintases presentes no reino vegetal, todas com o uso do mesmo substrato (farnesil difosfato, FPP), mas que têm perfis de produtos diferentes. Genes e cDNAs que codificam sesquiterpeno sintases têm sido clonados, e as enzimas recombinantes correspondentes caracterizadas.
[004] Muitas das principais fontes de sesquiterpenos, por exemplo, drimenol, são plantas que contêm naturalmente o sesquiterpeno; no entanto, o conteúdo de sesquiterpenos nessas fontes naturais pode ser baixo. Ainda existe uma necessidade da descoberta de novos terpenos, terpeno sintases e métodos mais econômicos para produzir sesquiterpenos tais como albicanol e/ou drimenol e derivados dos mesmos.
SUMÁRIO
[005] No presente documento é fornecido um método para produzir um sesquiterpeno drimane que compreende:
a. colocar em contato um precursor de farnesil difosfato acíclico (FPP) com um polipeptídeo que compreende um domínio de hidrolase semelhante a Haloácido deshalogenase (HAD) e que tem atividade de terpeno sintase bifuncional para produzir um sesquiterpeno drimane, em que o polipeptídeo compreende i. um motivo semelhante a terpeno sintase de classe | como estabelecido na SEQ ID NO: 53 (DDxx(D/E)); e ii. um motivo semelhante a terpeno sintase de classe |l como estabelecido na SEQ ID NO: 56 (DXD(T/S)T); e b. opcionalmente isolar o sesquiterpeno drimane ou uma mistura que compreende o sesquiterpeno drimane.
[006] Em um aspecto, o sesquiterpeno drimane compreende albicanol e/ou drimenol.
[007] Em um aspecto adicional, no método acima, o polipeptídeo que tem atividade de terpeno sintase bifuncional compreende a. uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63; e b. a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e C. a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 58.
[008] Em uma modalidade, o método acima compreende colocar em contato o sesquiterpeno drimane com pelo menos uma enzima para produzir um derivado de sesquiterpeno drimane. Em outra modalidade, o método acima compreende converter o sesquiterpeno drimane em um derivado de sesquiterpeno drimane com o uso de síntese química ou síntese bioquímica.
[009] Em um aspecto, o método acima compreende transformar uma célula hospedeira ou organismo hospedeiro não humano com um ácido nucleico que codifica o polipeptídeo acima.
[0010] Em um aspecto, o método compreende adicionalmente cultivar um organismo hospedeiro não humano ou uma célula hospedeira capaz de produzir FPP e transformada para expressar um polipeptídeo que compreende um domínio de hidrolase semelhante a HAD sob condições que permitem a produção do polipeptídeo, em que o polipeptídeo a. compreende a sequência de aminoácidos de SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63; ou b. compreende: i. uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63; e ii. a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e iii. a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 58.
[0011] Em um aspecto adicional, no método acima, o polipeptídeo compreende um ou mais motivos conservados como estabelecido na SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61 e/ou SEQ ID NO: 62.
[0012] Em uma modalidade, o motivo semelhante a terpeno sintase de classe | do método acima compreende a SEQ ID NO: 54 (DD(K/Q/R)(L/IVT)(D/E)), o motivo semelhante a terpeno sintase de classe |l compreende a SEQ ID NO: 57 (D(V/M/L)DTT), e o sesquiterpeno drimane é albicanol.
[0013] Em uma modalidade, no método acima o polipeptídeo compreende a. uma sequência de aminoácidos que tem pelo menos 90% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12,
SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29 ou SEQ ID NO: 32, e b. a sequência de SEQ ID NO: 54 (DD(K/Q/R)(L/VT)(D/E)), e Cc. a sequência de SEQ ID NO: 57 (D(V/IM/ILIF)DTTS); e d. o sesquiterpeno drimane é albicanol.
[0014] Em uma modalidade adicional, no método acima o polipeptídeo compreende a. uma sequência de aminoácidos que tem pelo menos 90% de identidade de sequência com a SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63, e b. a sequência de SEQ ID NO: 55, e Cc. a sequência de SEQ ID NO: 58; e d. o sesquiterpeno drimane é drimenol.
[0015] Também é fornecido um polipeptídeo isolado que compreende um domínio hidrolase semelhante a HAD e que tem atividade de terpeno sintase bifuncional que compreende a sequência de aminoácidos de SEQ ID NO: 1 ou SEQ ID NO: 5 ou que compreende a. uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1 ou SEQ ID NO: 5; e b. a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e C. a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 48.
[0016] Em um aspecto, o polipeptídeo isolado compreende adicionalmente um ou mais motivos conservados como estabelecido na SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61 e/ou SEQ ID NO: 62.
[0017] No presente documento é fornecida uma molécula de ácido nucleico isolada a. compreende uma sequência de nucleotídeos que codifica o polipeptídeo da reivindicação 13 ou 14; ou b. que compreende uma sequência de nucleotídeos que tem pelo menos
75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68, ou o complemento inverso da mesma; ou Cc. que compreende uma molécula de nucleotídeo que hibridiza sob condições rigorosas para a SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68; ou d. que compreende a sequência de nucleotídeos da SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69 ou SEQ ID NO: 70 ou o complemento inverso da mesma.
[0018] Também é fornecido um vetor que compreende a molécula de ácido nucleico acima ou um ácido nucleico que codifica o polipeptídeo acima. Em um aspecto, o vetor é um vetor de expressão. Em outro aspecto, o vetor é um vetor procariótico, vetor viral ou um vetor eucariótico.
[0019] É fornecida adicionalmente uma célula ou organismo não humano hospedeiro que compreende o ácido nucleico acima ou o vetor acima.
[0020] Em um aspecto, a célula ou organismo não humano hospedeiro é uma célula procariótica ou uma célula eucariótica ou um microrganismo ou célula fúngica.
[0021] Em um aspecto, a célula procariótica é uma célula bacteriana. Em um aspecto adicional, a célula bacteriana é E. coli.
[0022] Em outro aspecto, a célula ou organismo não humano hospedeiro é uma célula eucariótica. Em um aspecto, a célula eucariótica é uma célula de levedura ou célula vegetal. Em um aspecto adicional, a célula de levedura é Saccharomyces cerevisiae.
[0023] No presente documento é fornecido o uso do polipeptídeo acima para produzir um sesquiterpeno drimane ou uma mistura que compreende um sesquiterpeno drimane e um ou mais terpenos.
[0024] Em um aspecto, no uso acima do polipeptídeo, o sesquiterpeno drimane é albicanol. Em outro aspecto, no uso acima do polipeptídeo, o sesquiterpeno drimane é drimenol.
DESCRIÇÃO DOS DESENHOS
[0025] Figura 1: Estrutura de drimane, (+)-albicanol e (-)-drimenol.
[0026] Figura 2: Mecanismo de ciclização de farnesil difosfato por uma atividade enzimática de terpeno sintase classe |l e terpeno sintase classe |.
[0027] Figura 3: Análise GCMS dos sesquiterpenos produzidos in vivo pela enzima CvTpsi recombinante em células de bactéria modificadas para superproduzir farnesil difosfato. A. Cromatograma de íons totais de um extrato de células de E. coli que expressam CvTps1 e as enzimas da via do mevalonato. B. Cromatograma de íons totais de um padrão autêntico de albicanol. C. Cromatograma de íons totais de um extrato de células de E. coli que expressam apenas as enzimas da via do mevalonato. 1, albicanol; 2, trans-farnesol (de hidrólise de FPP por enzimas fosfatase endógenas).
[0028] Figura 4: Comparação dos espectros de massa do produto de CvTps1 e de um padrão autêntico de albicanol. A. Espectros de massa de pico 1 na Figura 3A (produto de CvTps1). B. Espectros de massa de pico 1 na Figura 3B (padrão autêntico de albicanol).
[0029] Figura 5: Análise GCMS dos sesquiterpenos produzidos pelas proteínas recombinantes LoTps1 e CvTps1. Cromatograma de íons totais de um extrato de células de E. coli que expressam LoTps1 (A) e CvTps1 (B). O pico identificado com 1º é (+)-albicanol.
[0030] Figuras 6A a C: Alinhamento de sequências de aminoácidos de supostas terpeno sintases que contêm motivos de classe | e classe II: CvTps1 (SEQ ID NO: 1), LoTps1 (SEQ ID NO: 5), OCH93767.1 (SEQ ID NO: 9), EMD37666.1 (SEQ ID NO: 12), EMD37666-B (SEQ ID NO: 15), XP 001217376.1 (SEQ ID NO: 17), OJJ98394.1 (SEQ ID NO: 20), GAO87501.1 (SEQ ID NO: 23), XP 008034151.1 (SEQ ID NO: 26), XP 007369631.1 (SEQ ID NO: 29), ACgo06372 (SEQ ID NO: 32), KIA7T5676.1 (SEQ ID NO: 35), XP 001820867.2
(SEQ ID NO: 38), CEN60542.1 (SEQ ID NO: 41), XP 009547469.1 (SEQ ID NO: 44), KLO09124.1 (SEQ ID NO: 47) e OJI95797.1 (SEQ ID NO: 50).
[0031] Figura 7, Cromatogramas de GCMS dos sesquiterpenos produzidos pelas proteínas recombinantes LoTps1, CvTps1, OCH93767.1, EMD37666.1, EMD37666-B e XP 001217376.1. O pico identificado com 1' é (+)-albicanol.
[0032] Figura 8. Cromatogramas de GCMS dos sesquiterpenos produzidos pelas proteínas recombinantes OJJ98394.1, GAO87501.1, XP 0080341511, XP 007369631.1 e ACgOO6372. O pico identificado com “1º é (+)-albicanol.
[0033] Figura 9. Cromatogramas de GCMS dos sesquiterpenos produzidos pelas proteínas recombinantes KIA75676.1, XP 001820867.2, CEN60542.1, XP 009547469.1, KLOO09124.1 e OJI95797.1. O pico identificado com 1' é (-)- drimenol e o pico identificado com '2' é farnesol.
[0034] Figura 10. Cromatogramas de GCMS dos sesquiterpenos produzidos por CvTps1 e AstC expressos em células de E. coli com e sem as fosfatases Astl e AstK. O pico principal obtido com AstC é drim-8-eno-11-0l e o pico principal obtido com CvTps1 é (+)-albicanol.
[0035] Figura 11. Análise GCMS dos sesquiterpenos produzidos in vivo pela enzima XP 006461126.1 recombinante em células de bactéria modificadas para superproduzir farnesil difosfato. A. Cromatograma de íons totais de um extrato de células de E. coli que expressam XP 006461126.1 e as enzimas da via do mevalonato. B. Espectros de massa de pico 13,1 minutos identificado como drimenol.
[0036] Figura 12. Análise GC-FID de sesquiterpenos drimane produzidos com o uso da cepa YSTO45 de S. cereviciae modificada que expressam cinco sintases diferentes: XP 007369631.1 de Dichomitus squalens, XP 006461126 de Agaricus bisporus, LoTps1 de Laricifomes officinalis, EMD37666.1 de Gelatoporia subvermispora e XP 001217376.1 Aspergillus terreus.
ABREVIAÇÕES USADAS
[0037] bp par de bases
[0038] kb quilobase
[0039] DNA ácido desoxirribonucleico
[0040] CDNA DNA complementar
[0041] DTT ditiotreito!
[0042] FPP farnesil difosfato
[0043] GC cromatógrafo a gás
[0044] HAD Haloácido deshalogenase
[0045] IPTG isopropil-D-tiogalacto-piranosídeo
[0046] LB caldo de lisogenia
[0047] MS espectrômetro de massa/espectrometria de massa
[0048] MVA ácido mevalônico
[0049] PCR reação em cadeia de polimerase
[0050] RNA ácido ribonucleico
[0051] MRNA ácido ribonucleico mensageiro
[0052] MIRNA micro RNA
[0053] SIiRNA RNA interferente curto
[0054] rRNA RNA ribossômico
[0055] tRNA RNA de transferência
DEFINIÇÕES
[0056] O termo “polipeptídeo” significa uma sequência de aminoácidos de resíduos de aminoácidos polimerizados consecutivamente, por exemplo, pelo menos 15 resíduos, pelo menos 30 resíduos, pelo menos 50 resíduos. Em algumas modalidades no presente documento, um polipeptídeo compreende uma sequência de aminoácidos que é uma enzima, ou um fragmento ou uma variante da mesma.
[0057] O termo “proteína” se refere a uma sequência de aminoácidos de qualquer comprimento, em que os aminoácidos estão ligados por ligações peptídicas covalentes, e inclui um oligopeptídeo, um peptídeo, um polipeptídeo e uma proteína de comprimento completo seja de ocorrência natural ou sintéticos.
[0058] O termo polipeptídeo “isolado” se refere a uma sequência de aminoácidos que é removida de seu ambiente natural por qualquer método ou combinação de métodos conhecidos na técnica e inclui métodos recombinantes, bioquímicos e sintéticos.
[0059] Os termos “terpeno sintase bifuncional” ou “polipeptídeo que tem atividade de terpeno sintase bifuncional” se referem a um polipeptídeo que compreende domínios de terpeno sintase classe | e classe || e tem atividade de terpeno sintase bifuncional de atividades catalíticas de ciclização iniciada por protonação e ciclização iniciada por ionização. Uma terpeno sintase bifuncional como descrita no presente documento compreende um domínio de hidrolase semelhante a HAD que é característica de polipeptídeos que pertencem à superfamília de hidrolase semelhante a Haloácido deshalogenase (HAD) (superfamília de proteína Interpro IPRO023214, http://www.ebi.ac.uk/interpro/entry/IPR023214; superfamília de proteina Pfam PF13419, http://pfam.xfam.org/family/PF13419). Um domínio de hidrolase semelhante a HAD é uma porção de um polipeptídeo que tem similaridades de sequência de aminoácidos com os membros da família de hidrolase semelhante a HAD e função relacionada. Um domínio de hidrolase semelhante a HAD pode ser identificado em um polipeptídeo buscando-se por motivos ou assinaturas de aminoácido característicos dessa família de proteínas. Ferramentas para realizar tais buscas estão disponíveis nos seguintes sites de: ebi.ac.uk/interpro/ ou ebi.ac.uk/Tools/hmmer/. Proteínas são geralmente compostas por uma ou mais regiões ou domínios funcionais. Combinações diferentes de domínios dão origem à gama diversificada de proteínas encontradas na natureza. A identificação de domínios que ocorre dentro de proteínas pode, portanto, fornecer visões sobre sua função. Um polipeptídeo que compreende um domínio de hidrolase semelhante a HAD e/ou característica motivos de hidrolase semelhante a HAD funciona na ligação e clivagem de grupos fosfato ou difosfato de um ligante. Uma terpeno sintase bifuncional também pode compreender um ou mais dos motivos conservados A, B, C e/ou D como representado na SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61 e/ou SEQ ID NO: 62.
[0060] O termo “sesquiterpeno drimane” se refere a um terpeno que tem uma estrutura de esqueleto de carbono semelhante a drimane como representado na Figura 1.
[0061] O termo “terpeno sintase classe |" se refere a uma terpeno sintase que catalisa reações iniciadas por ionização, por exemplo, monoterpeno e sesquiterpeno sintases.
[0062] O termo “motivo de terpeno sintase classe |” ou “motivo semelhante a terpeno sintase de classe |” se refere a um local ativo de uma terpeno sintase que compreende o motivo DDxx(D/E) conservado. Os resíduos de ácido aspártico desse motivo de classe | ligam, por exemplo, um íon metálico divalente (na maioria das vezes Mg?*) envolvido na ligação do grupo difosfato e catalisam a ionização e clivagem da ligação difosfato alílica do substrato.
[0063] O termo “terpeno sintase classe Il" se refere a uma terpeno sintase que catalisa reações de ciclização iniciada por protonação, por exemplo, tipicamente envolvidas na biossíntese de triterpenos e diterpenos labdano. Em terpeno sintases classe ||, a reação iniciada pela protonação pode envolver, por exemplo, aminoácidos ácidos que doam um próton para a ligação dupla terminal.
[0064] O termo “motivo de terpeno sintase classe II” ou “motivo semelhante a terpeno sintase de classe Il” se refere a um local ativo de uma terpeno sintase que compreende o motivo DxDD ou DxD(T/S)T conservado.
[0065] Os termos “albicanol sintase"” ou “polipeptídeo que tem atividade de albicanol sintase” ou “proteína albicanol sintase” se refere a um polipeptídeo capaz de catalisar a síntese de albicanol, na forma de qualquer um de seus estereoisômeros ou uma mistura dos mesmos, a partir de um pirofosfato de terpeno acíclico, particularmente, farnesil difosfato (FPP). Albicanol pode ser o único produto ou pode ser parte de uma mistura de sesquiterpenos.
[0066] Os termos “drimenol sintase” ou “polipeptídeo que tem uma atividade de drimenol sintase” ou “proteína drimenol sintase” se referem a um polipeptídeo capaz de catalisar a síntese de drimenol, na forma de qualquer um de seus estereoisômeros ou uma mistura dos mesmos, a partir de um pirofosfato de terpeno acíclico, particularmente, farnesil difosfato (FPP). Drimenol pode ser o único produto ou pode ser parte de uma mistura de sesquiterpenos.
[0067] Os termos “função biológica”, “função”, “atividade biológica” ou “atividade” se referem à capacidade da terpeno sintase bifuncional para catalisar a formação de albicanol e/ou drimenol ou uma mistura de compostos que compreende albicanol e/ou drimenol e um ou mais terpenos.
[0068] Os termos “mistura de terpenos” ou “mistura de sesquiterpenos” se referem a uma mistura de terpenos ou sesquiterpenos que compreende albicanol e/ou drimenol, e também pode compreender um ou mais terpenos ou sesquiterpenos adicionais.
[0069] Os termos “sequência de ácido nucleico”, “ácido nucleico”, “molécula de ácido nucleico” e “polinucleotídeo” são usados de forma intercambiável significando uma sequência de nucleotídeos. Uma sequência de ácidos nucleicos pode ser um desoxirribonucleotídeo, ou ribonucleotídeo, de cadeia simples ou cadeia dupla de qualquer comprimento e inclui sequência de codificação e não codificação de um gene, éxons, íntrons, sequências complementares senso e antissenso, DNA genômico, cDNA, miRNA, siRNA, mRNA, rRNA, tRNA, sequências de ácidos nucleicos recombinantes, sequências de DNA e/ou RNA de ocorrência natural isoladas e purificadas, fragmentos, iniciadores e sondas de ácido nucleico. O versado na técnica está ciente de que as sequências de ácidos nucleicos de RNA são idênticas às sequências de DNA com a diferença de que timina (T) é substituída por uracila (U). O termo “sequência de nucleotídeos” também deve ser entendido como compreendendo uma molécula de polinucleotídeo ou uma molécula de oligonucleotídeo na forma de um fragmento separado ou como um componente de um ácido nucleico maior.
[0070] Um “ácido nucleico isolado” ou “sequência de ácido nucleico isolado” se refere a um ácido nucleico ou sequência de ácido nucleico que está em um ambiente diferente daquele em que o ácido nucleico ou sequência de ácido nucleico ocorre naturalmente e pode incluir aqueles que são substancialmente livres de material endógeno contaminante. O termo “que ocorre naturalmente” como usado no presente documento como aplicado a um ácido nucleico se refere a um ácido nucleico que é encontrado em uma célula de um organismo na natureza e que não foi intencionalmente modificado por um ser humano em laboratório.
[0071] “Sequências de ácidos nucleicos recombinantes” são sequências de ácidos nucleicos que resultam do uso de métodos de laboratório (por exemplo, clonagem molecular) para reunir material genético de mais do que uma fonte, que criam ou modificam uma sequência de ácido nucleico que não ocorre naturalmente e que, de outra forma, não seria encontrada em organismos biológicos.
[0072] “Tecnologia de DNA recombinante” se refere a procedimentos de biologia molecular para preparar uma sequência de ácido nucleico recombinante, como descrito, por exemplo, em Laboratory Manuals editado por Weigel e Glazebrook, 2002, Cold Spring Harbor Lab Press; e Sambrook et al. , 1989, Cold
Spring Harbor, Nova lorque, Cold Spring Harbor Laboratory Press.
[0073] O termo “gene” significa uma sequência de DNA que compreende uma região, que é transcrita em uma molécula de RNA, por exemplo, um mRNA em uma célula, ligada operacionalmente a regiões reguladoras adequadas, por exemplo, um promotor. Um gene pode compreender, desse modo, diversas sequências ligadas operacionalmente, tais como um promotor, uma sequência de iniciação 5' que compreende, por exemplo, sequências envolvidas na iniciação de tradução, uma região de codificação de cDNA ou DNA genômico, íntrons, éxons e/ou uma sequência não traduzida 3' que compreende, por exemplo, locais de terminação de transcrição.
[0074] Um “gene quimérico” se refere a qualquer gene que não é normalmente encontrado na natureza em uma espécie, em particular, um gene em que estão presentes uma ou mais partes da sequência de ácidos nucleicos que não estão associadas uma à outra na natureza. Por exemplo, o promotor não é associado na natureza a parte ou toda a região transcrita ou a uma outra região reguladora. O termo “gene quimérico” é entendido incluindo construtos de expressão em que um promotor ou sequência reguladora de transcrição está ligado operacionalmente a uma ou mais sequências de codificação ou a um antissenso, isto é, complemento reverso da cadeia de senso, ou sequência de repetição invertida (senso e antissenso, segundo o qual o transcrito de RNA forma RNA de cadeia dupla mediante transcrição). O termo “gene quimérico” também inclui genes obtidos através da combinação de porções de uma ou mais sequências de codificação para produzir um novo gene.
[0075] Um “3 'UTR” ou “sequência não traduzida 3" (também conhecida como “região não traduzida 3" ou “extremidade 3") se refere à sequência de ácido nucleico encontrada a jusante da sequência de codificação de um gene, que compreende, por exemplo, um local de terminação da transcrição e (na maioria, mas não em todos os mMRNAs eucarióticos) um sinal de poliadenilação, tal como AAUAAA ou variantes do mesmo. Após a terminação da transcrição, o transcrito de MRNA pode ser clivado a jusante do sinal de poliadenilação e uma cauda poli(A) pode ser adicionada, a qual está envolvida no transporte do MRNA ao local de tradução, por exemplo, citoplasma.
[0076] “Expressão de um gene” abrange “expressão heteróloga” e “superexpressão” e envolve a transcrição do gene e a tradução do MRNA em uma proteína. Superexpressão se refere à produção do produto gênico conforme medido pelos níveis de mMRNA, polipeptídeo e/ou atividade enzimática em células ou organismos transgênicos que excedem os níveis de produção em células ou organismos não transformados de contexto genético similar.
[0077] “Vetor de expressão”, conforme usado no presente documento, significa uma molécula de ácido nucleico manipulada com o uso de métodos de biologia molecular e tecnologia de DNA recombinante para entrega de DNA estranho ou exógeno em uma célula hospedeira. O vetor de expressão inclui tipicamente as sequências exigidas para transcrição adequada da sequência de nucleotídeos. À região de codificação codifica usualmente uma proteína de interesse, mas também pode codificar um RNA, por exemplo, um RNA antissenso, siRNA e similares.
[0078] Um “vetor de expressão”, conforme usado no presente documento, inclui qualquer vetor recombinante linear ou circular que inclui, porém, sem limitação, vetores virais, bacteriófagos e plasmídeos. O versado na técnica tem a capacidade de selecionar um vetor adequado de acordo com o sistema de expressão. Em uma modalidade, o vetor de expressão inclui o ácido nucleico de uma modalidade no presente documento operacionalmente ligado a pelo menos uma sequência reguladora, que controla a transcrição, tradução, início e término, tal como um promotor de transcrição, operador ou intensificador ou um local de ligação ribossômico de mRNA e que inclui, opcionalmente, pelo menos um marcador de seleção. As sequências de nucleotídeos são “ligadas operacionalmente” quando a sequência reguladora se relaciona funcionalmente ao ácido nucleico de uma modalidade no presente documento.
[0079] “Sequência reguladora” se refere a uma sequência de ácidos nucleicos que determina o nível de expressão das sequências de ácidos nucleicos de uma modalidade no presente documento e tem capacidade de regular a taxa de transcrição da sequência de ácidos nucleicos ligada operacionalmente à sequência reguladora. As — sequências reguladoras compreendem promotores, intensificadores, fatores de transcrição, elementos promotores e similares.
[0080] “Promotor” se refere a uma sequência de ácidos nucleicos que controla a expressão de uma sequência de codificação fornecendo-se um sítio de ligação para RNA polimerase e outros fatores exigidos para transcrição adequada, incluindo, sem limitação, sítios de ligação de fator, sítios de ligação de proteína repressora e ativadora. O significado do termo promotor também inclui o termo “sequência reguladora de promotor”. As sequências reguladoras de promotor podem incluir elementos a montante e a jusante que podem influenciar a transcrição, o processamento de RNA ou a estabilidade da sequência de ácidos nucleicos de codificação associada. Os promotores incluem sequências sintéticas e derivadas naturalmente. As sequências de ácidos nucleicos de codificação estão usualmente localizadas a jusante do promotor em relação à direção da transcrição que se inicia no sítio de iniciação de transcrição.
[0081] O termo “promotor constitutivo” se refere a um promotor não regulado que permite a transcrição contínua da sequência de ácidos nucleicos à qual estão ligados operacionalmente.
[0082] Conforme usado no presente documento, o termo “ligado operacionalmente” se refere a uma ligação de elementos de polinucleotídeo em uma relação funcional. Um ácido nucleico “está ligado operacionalmente” quando está posicionado em uma relação funcional com outra sequência de ácidos nucleicos. Por exemplo, um promotor, ou, de preferência, uma sequência reguladora de transcrição, está ligado operacionalmente a uma sequência de codificação se afetar a transcrição da sequência de codificação. Ligado operacionalmente significa que as sequências de DNA que estão ligadas são tipicamente contíguas. A sequência de nucleotídeos associada à sequência promotora pode ser de origem homóloga ou heteróloga em relação à planta ser transformada. A sequência pode ser também inteira ou parcialmente sintética. Independentemente da origem, a sequência de ácido nucleico associada à sequência promotora será expressa ou silenciada de acordo com propriedades de promotor ao qual a mesma está ligada após se ligar ao polipeptídeo de uma modalidade no presente documento. O ácido nucleico associado pode codificar uma proteína que se deseja expressar ou suprimir em todo o organismo sempre ou, alternativamente, em um momento específico ou em tecidos, células ou compartimentos celulares específicos. Tais sequências de nucleotídeos codificam particularmente proteínas que conferem traços fenotípicos desejáveis às células ou organismos hospedeiros alterados ou transformados com as mesmas. Mais particularmente, a sequência de nucleotídeos associada leva à produção de albicanol e/ou drimenol ou uma mistura que compreende albicanol e/ou drimenol ou uma mistura que compreende albicanol e/ou drimenol e um ou mais terpenos na célula ou organismo. Particularmente, a sequência de nucleotídeos codifica uma terpeno sintase bifuncional.
[0083] “Peptídeo alvo” refere-se a uma sequência de aminoácidos que tem como alvo uma proteína ou polipeptídeo para organelas intracelulares, isto é, mitocôndrias ou plastídeos ou para o espaço extracelular (peptídeo sinal de secreção). Uma sequência de ácido nucleico que codifica um peptídeo alvo pode ser fundida com a sequência de ácido nucleico que codifica a extremidade do terminal amino, por exemplo, extremidade de N-terminal da proteína ou polipeptídeo, ou pode ser usada para substituir um polipeptídeo de direcionamento nativo.
[0084] O termo “iniciador” se refere a uma sequência de ácidos nucleicos curta que é hibridizada a uma sequência de ácidos nucleicos de modelo e é usada para polimerização de uma sequência de ácidos nucleicos complementar ao modelo.
[0085] Conforme usado no presente documento, o termo “célula hospedeira” ou “célula transformada” se refere a uma célula (ou organismo) alterada para abrigar pelo menos uma molécula de ácido nucleico, por exemplo, um gene recombinante que codifica uma proteína ou sequência de ácidos nucleicos desejada que, mediante transcrição, produz uma proteína terpeno sintase bifuncional para produzir albicanol e/ou drimenol. A célula hospedeira é particularmente uma célula bacteriana, uma célula fúngica ou uma célula vegetal. A célula hospedeira pode conter um gene recombinante que foi integrado nos genomas nuclear ou de organelas da célula hospedeira. Alternativamente, o hospedeiro pode conter o gene recombinante extracromossomicamente.
[0086] As sequências homólogas incluem sequências ortólogas ou parálogas. Os métodos para identificar ortólogos e parálogos, que incluem métodos filogenéticos, similaridade de sequência e métodos de hibridização são conhecidos na técnica e são descritos no presente documento.
[0087] Os parálogos resultam da duplicação de gene que gera dois ou mais genes com sequências similares e funções similares. Os parálogos tipicamente se agrupam e são formados por duplicações de genes dentro de espécies de planta relacionadas. Os parálogos são encontrados em grupos de genes similares com o uso de análise Blast em pareamento ou durante análise filogenética de famílias de genes com o uso de programas, tal como CLUSTAL. Em parálogos, as sequências consenso podem ser uma característica identificada de sequências dentro de genes relacionados e que têm funções similares dos genes.
[0088] Ortólogos, ou sequências ortólogas, são sequências similares uma a outra devido ao fato de que são encontradas em espécies que descenderam de um ancestral comum. Por exemplo, espécies de planta que têm ancestrais comuns são conhecidas por conter muitas enzimas que têm sequências e funções similares. O versado na técnica pode identificar sequências ortólogas e prever funções dos ortólogos, por exemplo, construindo-se uma árvore poligênica para uma família de genes de uma espécie com o uso dos programas CLUSTAL ou BLAST. Um método para identificar ou confirmar funções similares entre sequências homólogas é por comparação dos perfis de transcrito em células ou organismos hospedeiros, tais como plantas ou micro-organismos, que superexpressam ou carecem de polipeptídeos relacionados (Knockouts/knockdowns). O versado na técnica entenderá que genes que têm perfis de transcrito similares, com mais de 50% de transcritos regulados em comum, ou com mais de 70% de transcritos regulados em comum, ou mais de 90% transcritos regulados em comum terão funções similares. Espera-se que os homólogos, parálogos, ortólogos e quaisquer outras variantes das sequências no presente documento funcionem de uma maneira similar, fazendo-se as células hospedeiras, organismos tais como plantas ou micro- organismos que produzem proteínas terpeno sintase bifuncionais.
[0089] O termo “marcador selecionável” se refere a qualquer gene que mediante expressão possa ser usado para selecionar uma célula ou células que incluem o marcador selecionável. Exemplos de marcadores selecionáveis são descritos abaixo. O versado na técnica saberá que diferentes marcadores selecionáveis antibióticos, fungicidas, auxotróficos ou herbicidas são aplicáveis a diferentes espécies-alvo.
[0090] “Drimenol” para os propósitos desse pedido se refere a (-)-drimenol (CAS: 468-68-8).
[0091] “Albicanol” para o propósito desse pedido se refere a (+)-albicanol (CAS: 54632-04-1).
[0092] O termo “organismo” se refere a quaisquer organismos multicelulares ou unicelulares não humanos, tais como uma planta ou um microrganismo. Particularmente, um micro-organismo é uma bactéria, uma levedura, uma alga ou um fungo.
[0093] O termo “planta” é usado de forma intercambiável para incluir células vegetais, que incluem protoplasmas vegetais, tecidos vegetais, culturas de tecido de célula vegetal, que dão origem a plantas regeneradas, ou partes de plantas, ou órgãos de planta, tais como raízes, troncos, folhas, flores, pólen, óvulos, embriões, frutos e similares. Qualquer planta pode ser usada para executar os métodos de uma modalidade no presente documento.
[0094] Um organismo ou célula particular destina-se a ter a “capacidade de produzir FPP” quando produz FPP naturalmente ou quando não produz FPP naturalmente, mas é transformado para traduzir FPP, ou antes da transformação com um ácido nucleico conforme descrito no presente documento ou juntamente com o dito ácido nucleico. Os organismos ou células transformados para produzir uma quantidade de FPP superior ao organismo ou célula de ocorrência natural também são abrangidos pelos “organismos ou células que têm capacidade de produzir FPP”,
[0095] Para as descrições no presente documento e nas reivindicações anexas, o uso de “ou” significa “e/ou” a não ser que determinado de outro modo. De modo similar, “compreender”, “compreende”, “que compreende”, “incluir”, “inclui” e “que inclui" são intercambiáveis, e não se destinam a ser limitantes.
[0096] Deve-se entender, ainda, que, nos casos em que as descrições de várias modalidades usam o termo “que compreende”, aqueles versados na técnica entenderiam que, em alguns casos específicos, uma modalidade pode ser descrita alternativamente com o uso de linguagem “que consiste essencialmente em” ou “que consiste em”.
L.DESCRIÇÃO DETALHADA
[0097] No presente documento é fornecida uma molécula de ácido nucleico que compreende uma sequência de nucleotídeos que tem pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68 ou que compreende a sequência de nucleotídeos da SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69 ou SEQ ID NO: 70 ou o complemento inverso da mesma.
[0098] De acordo com uma modalidade, a molécula de ácido nucleico consiste na sequência de nucleotídeos de SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69 ou SEQ ID NO: 70 ou o complemento inverso da mesma.
[0099] Em uma modalidade, o ácido nucleico de uma modalidade no presente documento pode estar presente naturalmente em Cryptoporus ou Laricifomes ou em outras espécies fúngicas, ou ser obtido modificando-se a SEQ ID NO: 3 ou SEQ ID NO: 7 ou o complemento inverso do mesmo.
[00100] Em outra modalidade, o ácido nucleico é isolado ou é derivado de fungos do gênero Cryptoporus ou Laricifomes. Em uma modalidade adicional o ácido nucleico é isolado ou derivado de Cryptoporus volvatus ou Laricifomes officinalis.
[00101] É fornecida adicionalmente uma sequência de nucleotídeos obtida modificando-se a SEQ ID NO: 3 ou SEQ ID NO: 7 ou o complemento inverso do mesmo que abrange qualquer sequência que tenha sido obtida modificando-se a sequência da SEQ ID NO: 3 ou SEQ ID NO: 7, ou do complemento inverso da mesma com o uso de qualquer método conhecido na técnica, por exemplo, introduzindo-se qualquer tipo de mutações, tal como mutações de deleção, inserção e/ou substituição. Os ácidos nucleicos que compreendem uma sequência obtida por mutação da SEQ ID NO: 3 ou SEQ ID NO: 7 ou o complemento inverso da mesma são abrangidos por uma modalidade no presente documento, desde que as sequências que os mesmos compreendem compartilhem pelo menos as identidade de sequência definida da SEQ ID NO: 3 ou SEQ ID NO: 7 como definido em qualquer uma das modalidades acima ou o complemento inverso da mesma e desde que os mesmos codifiquem um polipeptídeo que compreende um domínio de hidrolase semelhante a HAD e que tem uma atividade de terpeno sintase bifuncional para produzir um sesquiterpeno drimane, em que o polipeptídeo compreende (1) um motivo semelhante a terpeno sintase de classe | como estabelecido na SEQ ID NO: 53 (DDxx(D/E)) e (2) um motivo semelhante a terpeno sintase de classe |l como estabelecido na SEQ ID NO: 56 (DxD(T/S)T). O polipeptídeo que tem atividade de terpeno sintase bifuncional pode compreender adicionalmente um ou mais motivos conservados como estabelecido na SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61 e/ou SEQ ID NO: 62. Mutações podem ser qualquer tipo de mutação desses ácidos nucleicos, por exemplo, mutações pontuais, mutações de exclusão, mutações de inserção e/ou mutações de deslocamento de quadro de um ou mais nucleotídeos da sequência de DNA da SEQ ID NO: 3 ou SEQ ID NO: 7. Em uma modalidade, o ácido nucleico de uma modalidade no presente documento pode ser truncado desde que o mesmo codifique um polipeptídeo como descrito no presente documento.
[00102] Um ácido nucleico variante pode ser preparado a fim de adaptar sua sequência de nucleotídeos a um sistema de expressão específico. Por exemplo, são conhecidos sistemas de expressão bacterianos para expressar de modo mais eficaz polipeptídeos se aminoácidos forem codificados por códons particulares.
[00103] Devido à degenerescência do código genético, mais de um códon pode codificar a mesma sequência de aminoácidos, múltiplas sequências de ácidos nucleicos podem codificar a mesma proteína ou polipeptídeo, em que todas essas sequências de DNA são abrangidas por uma modalidade no presente documento. Onde apropriado, as sequências de ácidos nucleicos que codificam a terpeno- sintase bifuncional podem ser otimizadas para aumentar a expressão na célula hospedeira. Por exemplo, os nucleotídeos de uma modalidade do presente documento podem ser sintetizados com o uso de códons particulares por um hospedeiro para expressão aprimorada. Em uma modalidade, a molécula de ácido nucleico compreende a sequência de nucleotídeos da SEQ ID NO: 4, SEQ ID NO: 8, SEQ ID NO: 11, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 19, SEQ ID NO: 22, SEQ ID NO: 25, SEQ ID NO: 28, SEQ ID NO: 31, SEQ ID NO: 34, SEQ ID NO: 37, SEQ ID NO: 40, SEQ ID NO: 43, SEQ ID NO: 46, SEQ ID NO: 49, SEQ ID NO: 52, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69 ou SEQ ID NO: 70 ou o complemento inverso da mesma.
[00104] Em uma modalidade aqui fornecida, é uma sequência isolada, recombinante ou sintética de ácido nucleico que compreende a sequência de nucleotídeos da SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69 ou SEQ ID NO: 70, que codifica para uma terpeno sintase bifuncional que compreende a sequência de aminoácidos de SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63 ou fragmentos funcionais do mesmo que catalisam a produção de um sesquiterpeno drimane em uma célula a partir de um precursor de FPP. Em uma modalidade adicional, o sesquiterpeno drimane compreende albicanol e/ou drimenol.
[00105] Também são fornecidas no presente documento sequências de cDNA,
DNA genômico e RNA. Qualquer sequência de ácido nucleico que codifica a terpeno sintase bifuncional ou variantes da mesma é denominada no presente documento como uma sequência que codifica terpeno sintase bifuncional.
[00106] De acordo com uma modalidade, o ácido nucleico de SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68 é a sequência de codificação de um gene de terpeno sintase bifuncional que codifica uma terpeno sintase bifuncional obtida como descrito nos Exemplos.
[00107] Um fragmento de um polinucleotídeo de SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68 se refere a nucleotídeos contíguos que têm, particularmente, pelo menos 15 bp, pelo menos 30 bp, pelo menos 40 bp, pelo menos 50 bp e/ou pelo menos 60 bp em comprimento do polinucleotídeo de uma modalidade no presente documento. Particularmente, o fragmento de um polinucleotídeo compreende pelo menos 25, mais particularmente pelo menos 50, mais particularmente pelo menos 75, mais particularmente pelo menos 100, mais particularmente pelo menos 150, mais particularmente pelo menos 200, mais particularmente pelo menos 300, mais particularmente pelo menos 400, mais particularmente pelo menos 500, mais particularmente pelo menos 600, mais particularmente pelo menos 700, mais particularmente pelo menos 800, mais particularmente pelo menos 900, mais particularmente pelo menos 1.000 nucleotídeos contíguos do polinucleotíideo de uma modalidade no presente documento. Sem limitação, o fragmento dos polinucleotídeos do presente documento pode ser usado como um iniciador de PCR, e/ou como uma sonda, ou para silenciamento de gene antissenso ou RNAi.
[00108] Está claro para a pessoa versada na técnica que os genes, incluindo os polinucleotídeos de uma modalidade do presente documento, podem ser clonados com base nas informações de sequência de nucleotídeos disponíveis, tal como encontrado na listagem de sequências anexa, por métodos conhecidos na técnica. Estes incluem, por exemplo, o projeto de iniciadores de DNA que representam as sequências de flanqueamento de tal gene do qual uma é gerada em orientações de senso e que inicia a síntese da cadeia de senso e a outra é criada na forma complementar inversa e gera a cadeia de antissenso. DNA polimerases termoestáveis, tais como aquelas usadas em reação em cadeia de polimerase, são comumente usadas para realizar tais experimentos. Alternativamente, as sequências de DNA que representam genes podem ser sintetizadas quimicamente e subsequentemente introduzidas em moléculas de vetor de DNA que podem ser multiplicadas, por exemplo, por bactérias compatíveis, tais como, por exemplo, E. coli.
[00109] Em uma modalidade relacionada fornecida no presente documento, são fornecidos iniciadores de PCR e/ou sondas para detectar sequências de ácidos nucleicos que codificam um polipeptídeo que tem atividade de terpeno sintase bifuncional. O versado na técnica estará ciente de métodos para sintetizar, degenerar ou especificar pares de iniciadores de PCR para amplificar uma sequência de ácidos nucleicos que codifica a terpeno sintase bifuncional ou fragmentos funcionais da mesma, com base na SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68. Um kit de detecção para sequências de ácidos nucleicos que codificam a terpeno sintase bifuncional pode incluir iniciadores e/ou sondas específicos para sequências de ácidos nucleicos que codificam a terpeno sintase bifuncional, e um protocolo associado para usar os iniciadores e/ou sondas para detectar sequências de ácidos nucleicos que codificam a terpeno sintase bifuncional em uma amostra. Tais kits de detecção podem ser usados para determinar se uma planta, organismo, microrganismo ou célula foi modificada, isto é, transformada com uma sequência que codifica a terpeno-sintase bifuncional.
[00110] Para testar uma função de sequências de DNA variantes de acordo com uma modalidade do presente documento, a sequência de interesse está ligada operacionalmente a um gene marcador selecionável ou triável, e a expressão do gene-repórter é testada em ensaios de expressão transiente, por exemplo, com micro-organismos ou com protoplasmas ou em plantas transformadas de maneira estável. O versado na técnica reconhecerá que as sequências de DNA com capacidade de acionar a expressão são construídas de moléculas. Consequentemente, os níveis de expressão de fragmentos de DNA mais curtos podem ser diferentes daquele do fragmento mais longo e podem ser diferentes um do outro. No presente documento também são fornecidos equivalentes funcionais da sequência de ácidos nucleicos que codifica as proteínas terpeno sintase bifuncionais fornecidas no presente documento, isto é, sequências que se hibridizam sob condições rigorosas para a sequência de ácidos nucleicos de SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68.
[00111] Como usado no presente documento, o termo hibridização ou hibridiza sob certas condições se destina a descrever condições para hibridização e lavagens sob as quais sequências nucleotídicas que são significativamente idênticas ou homólogas umas às outras permanecem ligadas umas às outras. As condições podem ser tais que sequências, que são pelo menos cerca de 70%, como pelo menos cerca de 80% e como pelo menos cerca de 85%, 90% ou 95% idênticas, permaneçam ligadas uma à outra. Definições de condições de hibridação de baixo rigor, moderado e alto rigor são fornecidas aqui.
[00112] Condições de hibridização apropriadas podem ser selecionadas por aqueles versados na técnica com experimentação mínima, como exemplificado em Ausubel et al. (1995, Current Protocols in Molecular Biology, John Wiley & Sons, seções 2, 4 e 6). Adicionalmente, condições de rigor são descritas em Sambrook et al. (1989, Molecular Cloning: A Laboratory Manual, 2º ed., Cold Spring Harbor Press, capítulos 7, 9 e 11). Como usado no presente documento, condições definidas como baixo rigor são como segue. Filtros que contêm DNA são pré- tratados por 6 h a 40 ºC em uma solução que contém formamida a 35%, SSC 5x, Tris-HCI 50 MM (pH 7,5), EDTA 5 mM, EDTA 5 mM, PVP a 0,1%, Ficoll a 0,1%, BSA 1% e 500 pg/ml de DNA de esperma de esperma de salmão desnaturado. Hibridizações são realizadas na mesma solução com as seguintes modificações: PVP a 0,02%, Ficoll a 0,02%, BSA a 0,2%, 100 pg/ml de DNA de esperma de salmão, 10% (peso/vol) de sulfato de dextrano, e sonda identificada com 5-20x106 32P é usada. Os filtros são incubados na mistura de hibridação por 18 a 20 h a 40 ºC e, em seguida, lavados por 1,5 h a 55 ºC. Em uma solução que contêm 2x SSC, Tris-HCI 25 mM (pH 7,4), EDTA 5 mM, e SDS a 0,1%. A solução de lavagem é substituída por solução nova e incubada por mais 1,5 h a 60 ºC. Os filtros são secos com papel absorvente e expostos para autorradiografia.
[00113] Como usado no presente documento, condições definidas de moderado rigor são como segue. Filtros que contêm DNA são pré-tratados por 7 h a 40 ºC em uma solução que contém formamida a 35%, SSC 5x, Tris-HCl 50 mM (pH 7,5),
EDTA 5 mM, EDTA 5 mM, PVP a 0,1%, Ficoll a 0,1%, BSA 1% e 500 pug/ml de DNA de esperma de esperma de salmão desnaturado. Hibridizações são realizadas na mesma solução com as seguintes modificações: PVP a 0,02%, Ficoll a 0,02%, BSA a 0,2%, 100 ug/ml de DNA de esperma de salmão, 10% (peso/vol) de sulfato de dextrano, e sonda identificada com 5-20x106 32P é usada. Os filtros são incubados em mistura de hibridização por 30 h a 50 ºC e, em seguida, lavados por 1,5h a 55 ºC. Em uma solução que contêm 2x SSC, Tris-HCI 25 mM (pH 7,4), EDTA 5 mM, e SDS a 0,1%. A solução de lavagem é substituída por solução nova e incubada por mais 1,5 h a 60 ºC. Os filtros são secos com papel absorvente e expostos para autorradiografia.
[00114] Como usado no presente documento, condições definidas de alto rigor são como segue. Pré-hibridização de filtros que contêm DNA é realizada por 8 h durante a noite a 65 ºC em composto de tampão de 6x SSC, Tris-HCI 50 mM (pH 7,5), EDTA 1 mM, PVP a 0,02%, Ficoll a 0,02%, BSA a 0,02% e 500 ug/ml de DNA de espermatozoide de salmão desnaturado Os filtros são hibridizados por 48 ha 65ºC na mistura de pré-hibridização que contêm 100 ug /ml de DNA de espermatozoide de salmão desnaturado e sonda identificada com 5-20x106 cpm de 32P. A lavagem de filtros é feita a 37 ºC por 1 h em uma solução que contêm 2x SSC, PVP a 0,01%, Ficoll a 0,01% e BSA a 0,01%. Isto é seguido por uma lavagem em 0,1x SSC a 50 ºC por 45 minutos.
[00115] Outras condições de rigor baixo, moderado e alto bem conhecidas na arte (por exemplo, como empregadas para hibridizações entre espécies) podem ser usadas se as condições acima forem inadequadas (por exemplo, como empregado para hibridizações entre espécies).
[00116] O especialista na técnica estará ciente de métodos para identificar sequências homólogas em outros organismos e métodos para determinar a porcentagem de identidade de sequência entre sequências homólogas. Tais moléculas de DNA recém-identificadas, então, podem ser sequenciadas, e a sequência pode ser comparada à sequência de ácidos nucleicos da SEQ ID NO: 3 ou SEQ ID NO: 7.
[00117] A porcentagem de identidade entre duas sequências de peptídeos ou nucleotídeos é uma função do número de aminoácidos ou resíduos de nucleotídeo que são idênticos nas duas sequências quando um alinhamento dessas duas sequências foi gerado. Os resíduos idênticos são definidos como resíduos que são os mesmos nas duas sequências em uma dada posição do alinhamento. A porcentagem da identidade de sequência, conforme usado no presente documento, é calculada a partir do alinhamento ideal tomando-se o número de resíduos idênticos entre duas sequências, dividindo o mesmo pelo número total de resíduos na sequência mais curta e multiplicando por 100. O alinhamento ideal é o alinhamento em que a porcentagem de identidade é a maior possível. Os vãos podem ser introduzidos em uma ou ambas as sequências em uma ou mais posições do alinhamento para obter o alinhamento ideal. Essas lacunas são, então, consideradas como resíduos não idênticos para o cálculo da porcentagem de identidade de sequência. O alinhamento para o propósito de determinar a porcentagem de identidade de sequência de aminoácidos ou ácidos nucleicos pode ser alcançado de vários modos com o uso de programas de computador e, por exemplo, programas de computador publicamente disponíveis na rede mundial de computadores. Preferencialmente, o programa BLAST (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247 a 250, 1999) definido para os parâmetros padrão, disponível no website do National Center for Biotechnology Information (NCBI) em ncbi.nIm.nih.gov/BLAST/bl2seq/wblast2.cgi, pode ser usado para obter um alinhamento ideal de sequências de proteínas ou ácidos nucleicos e para calcular a porcentagem de identidade de sequência.
[00118] Uma modalidade relacionada no presente documento fornece uma sequência de ácidos nucleicos que é complementar à sequência de ácidos nucleicos de acordo com a SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68, tais como RNAs inibidores, ou a sequência de ácidos nucleicos que se hibridiza sob condições rigorosas para pelo menos parte da sequência de nucleotídeos de acordo com a SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68. Uma modalidade alternativa de uma modalidade do presente documento fornece um método para alterar a expressão gênica em uma célula hospedeira. Por exemplo, o polinucleotídeo de uma modalidade no presente documento pode ser aprimorado ou superexpresso ou induzido em certos contextos (por exemplo, mediante exposição a certas temperaturas ou condições de cultura) em uma célula hospedeira ou organismo hospedeiro.
[00119] A alteração da expressão de um polinucleotídeo fornecido no presente documento pode também pode resultar em expressão ectópica que é um padrão de expressão diferente em um organismo alterado e em um controle ou organismo do tipo selvagem. A alteração de expressão ocorre a partir de interações de polipeptídeo de uma modalidade do presente documento com moduladores exógenos ou endógenos ou de um resultado de modificação química do polipeptídeo. O termo também se refere a um padrão de expressão alterado do polinucleotídeo de uma modalidade do presente documento, que é alterado para atividade abaixo do nível de detecção ou completamente suprimida.
[00120] Em uma modalidade, também é fornecido no presente documento um polinucleotídeo isolado, recombinante ou sintético que codifica um polipeptídeo ou polipeptídeo variante fornecido no presente documento.
[00121] Em uma modalidade é fornecida uma molécula de ácido nucleico isolada que codifica um polipeptídeo que compreende um domínio da superfamília da hidrolase semelhante a HAD que tem atividade de terpeno sintase bifuncional e que compreende uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63; e a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 58 ou que compreende a sequência de aminoácidos de SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35 ou SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63.
[00122] Em uma modalidade é fornecido no presente documento um polipeptídeo isolado que compreende um domínio de hidrolase semelhante a HAD que tem atividade de terpeno sintase bifuncional e que compreende uma sequência de aminoácidos que tem pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1 ou SEQ ID NO: 5 ou que compreende a sequência de aminoácidos de SEQ ID NO: 1 ou SEQ ID NO: 5.
[00123] De acordo com uma modalidade, o polipeptídeo consiste na sequência de aminoácidos de SEQ ID NO: 1 ou 5.
[00124] Em uma modalidade, o polipeptídeo de uma modalidade no presente documento pode estar presente naturalmente em fungos Cryptoporus ou Laricifomes ou em outras espécies de fungos, ou compreender uma sequência de aminoácidos que é uma variante da SEQ ID NO: 1 ou SEQ ID NO: 5, obtida por engenharia genética ou encontrada naturalmente em fungos Cryptoporus ou Laricifomes ou em outras espécies de fungos.
[00125] De acordo com outra modalidade, o polipeptídeo é isolado ou derivado de fungos do gênero Cryptoporus ou Laricifomes. Em uma modalidade adicional, o polipeptídeo é isolado ou derivado de Cryptoporus volvatus ou Laricifomes officinalis.
[00126] Em uma modalidade, o pelo menos um polipeptídeo que tem uma atividade de terpeno sintase bifuncional usado em qualquer uma das modalidades descritas no presente documento ou codificado pelo ácido nucleico usado em qualquer uma das modalidades descritas no presente documento compreende uma sequência de aminoácidos que é uma variante de SEQ ID NO: 1 ou SEQ ID NO: 5, obtida por engenharia genética. Em uma modalidade o polipeptídeo compreende uma sequência de aminoácidos codificada por uma sequência de nucleotídeos que tenha sido obtida modificando-se a SEQ ID NO: 3 ou SEQ ID NO: 7 ou o complemento inverso da mesma.
[00127] Os polipeptídeos também devem incluir variantes e polipeptídeos truncados desde que os mesmos tenham atividade de terpeno sintase bifuncional.
[00128] De acordo com outra modalidade, o pelo menos um polipeptídeo que tem uma atividade de terpeno sintase bifuncional usado em qualquer uma das modalidades descritas no presente documento ou codificadas pelo ácido nucleico usado em qualquer uma das modalidades descritas no presente documento compreende uma sequência de aminoácidos que é uma variante da SEQ ID NO: 1 ou SEQ ID NO: 5, obtida por engenharia genética, desde que a dita variante tenha atividade de terpeno sintase bifuncional para produzir um sesquiterpeno drimane e tenha a porcentagem exigida de identidade com a SEQ ID NO: 1 ou SEQ ID NO: 5 como descrito em qualquer uma das modalidades acima e compreenda (1) um motivo semelhante a terpeno sintase de classe | como estabelecido na SEQ ID NO: 53 (DDxx(D/E)) e (2) um motivo semelhante a terpeno sintase de classe |l como estabelecido na SEQ ID NO: 56 (DxD(T/S)T) e compreenda domínios que correspondem aos domínios Pfam PF13419.5 e PF13242.5. O polipeptídeo que tem atividade de terpeno sintase bifuncional pode compreender adicionalmente um ou mais motivos conservados como estabelecido na SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61 e/ou SEQ ID NO: 62.
[00129] De acordo com outra modalidade, o pelo menos um polipeptídeo que tem uma atividade de terpeno sintase bifuncional usado em qualquer uma das modalidades descritas no presente documento ou codificado pelo ácido nucleico usado em qualquer uma das modalidades descritas no presente documento é uma variante de SEQ ID NO: 1 ou SEQ ID NO: 5 que pode ser encontrada naturalmente em outros organismos, tal como outras espécies fúngicas, desde que as mesmas tenham atividade de terpeno sintase bifuncional e compreendam domínios que correspondem aos domínios Pfam PF13419.5 e PF13242.5. Como usado no presente documento, o polipeptídeo inclui um polipeptídeo ou fragmento de peptídeo que abrange as sequências de aminoácidos identificadas no presente documento, bem como polipeptídeos truncados ou variantes desde que os mesmos tenham atividade de terpeno sintase bifuncional e que os mesmos compartilhem pelo menos as porcentagem definida de identidade com o fragmento correspondente de SEQ ID NO: 1 ou SEQ ID NO: 5 e compreendam (1) um motivo semelhante a terpeno sintase de classe | como estabelecido na SEQ ID NO: 53 (DDxx(D/E)) e (2) um motivo semelhante a terpeno sintase de classe |l como estabelecido na SEQ ID NO: 56 (DxD(T/S)T) e compreendam domínios que correspondem a domínios Pfam PF13419.5 e PF13242.5.
[00130] Exemplos de polipeptídeos variantes são proteínas que ocorrem naturalmente que resultam de eventos de splicing de mRNA alternativos ou de clivagem proteolítica dos polipeptídeos descritos no presente documento. As variações atribuíveis à proteólise incluem, por exemplo, diferenças nos N- ou C- terminais mediante a expressão em diferentes tipos de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídeos de uma modalidade da presente invenção. Os polipeptídeos codificados por um ácido nucleico obtido pela mutação natural ou artificial de um ácido nucleico de uma modalidade do presente documento, conforme descrito posteriormente, são também abrangidos por uma modalidade do presente documento.
[00131] As variantes de polipeptídeo resultantes de uma fusão de sequências de peptídeos adicionais nas extremidades de terminal de amino e carboxila também podem ser usadas nos métodos de uma modalidade do presente documento. Em particular essa fusão pode melhorar a expressão dos polipeptídeos, ser úteis na purificação da proteína ou melhorar a atividade enzimática do polipeptídeo em um ambiente ou sistema de expressão desejado. Tais sequências de peptídeos adicionais podem ser peptídeos de sinal, por exemplo. Outro aspecto abrange métodos com o uso de polipeptídeos variantes, tais como aqueles obtidos por fusão com outros oligo- ou polipeptídeos e/ou aqueles que são ligados a peptídeos de sinalização. Os polipeptídeos resultantes de uma fusão com outra proteína funcional, tal como outra proteína da via de biossíntese de terpeno, também podem ser usados vantajosamente nos métodos de uma modalidade do presente documento.
[00132] Uma variante também pode diferir do polipeptídeo de uma modalidade no presente documento por fixação de grupos de modificação que são ligados de modo covalente ou não covalente à estrutura do polipeptídeo. A variante também inclui um polipeptídeo que difere do polipeptídeo fornecido no presente documento pelos locais de glicosilação ligados a N ou ligados ao introduzidos e/ou uma adição de resíduos de cisteína. O versado na técnica reconhecerá como modificar uma sequência de aminoácidos e preservar a atividade biológica.
[00133] Além das sequências de genes mostradas nas sequências reveladas no presente documento, será evidente para a pessoa versada na técnica que polimorfismos de sequência de DNA podem existir dentro de uma dada população, o que pode levar a mudanças na sequência de aminoácidos dos polipeptídeos revelados no presente documento. Tais polimorfismos genéticos podem existir em células de diferentes populações ou dentro de uma população devido à variação alélica natural. Variantes alélicas também podem incluir equivalentes funcionais.
[00134] Modalidades adicionais também se referem às moléculas derivadas por tais polimorfismos de sequência dos ácidos nucleicos revelados concretamente. Essas variações naturais usualmente ocasionam uma variação de cerca de 1 a 5% na sequência de nucleotídeos de um gene ou na sequência de aminoácidos dos polipeptídeos revelados no presente documento. Como mencionado acima, o ácido nucleico que codifica o polipeptídeo ou variantes do mesmo de uma modalidade no presente documento é uma ferramenta útil para modificar organismos hospedeiros não humanos, micro-organismos ou células e modificar organismos hospedeiros não humanos, micro-organismos ou células destinados a serem usados nos métodos descritos no presente documento.
[00135] Uma modalidade fornecida no presente documento fornece sequências de aminoácidos de proteínas de terpeno sintase bifuncional que incluem ortólogos e parálogos bem como métodos para identificar e isolar ortólogos e parálogos das terpeno sintases bifuncionais em outros organismos. Particularmente, ortólogos e parálogos assim identificados da terpeno sintase bifuncional que retêm atividade de terpeno sintase bifuncional, podem ser considerados um polipeptídeo da superfamília da hidrolase semelhante a HAD (superfamília da proteína Interpro IPR023214 ou superfamília da proteína Pfam PF13419) e que compreendem um domínio de hidrolase semelhante a HAD e são capazes de produzir um sesquiterpeno drimane, tal como albicanol e/ou drimenol, a partir de um precursor acíclico de pirofosfato de terpeno, por exemplo, FPP.
[00136] O polipeptídeo a ser colocado em contato com um pirofosfato de terpeno acíclico, por exemplo, FPP, in vitro pode ser obtido por extração de qualquer organismo que expresse o mesmo, com o uso de tecnologias padrão de extração de proteínas ou enzimas. Se o organismo hospedeiro for um organismo unicelular ou célula que libera o polipeptídeo de uma modalidade do presente documento no meio de cultura, o polipeptídeo pode simplesmente ser coletado do meio de cultura, por exemplo, por centrifugação, seguido opcionalmente por etapas de lavagem e ressuspensão em soluções tampão adequadas. Se o organismo ou célula acumula o polipeptídeo dentro de suas células, o polipeptídeo pode ser obtido por ruptura ou lise das células e, opcionalmente, extração adicional do polipeptídeo do lisado celular. O lisado celular ou o polipeptídeo extraído pode ser usado para ter contato com o pirofosfato de terpeno acíclico para a produção de um terpeno ou uma mistura de terpenos.
[00137] O polipeptídeo que tem uma atividade de terpeno sintase bifuncional, tanto na forma isolada quanto em conjunto com outras proteínas, por exemplo, em um extrato bruto de proteína obtido a partir de células ou micro-organismos cultivados, pode então ser suspenso em uma solução tampão em pH ideal. Caso adequado, sais, DTT, cátions inorgânicos e outros tipos de cofatores enzimáticos podem ser adicionados a fim de otimizar a atividade enzimática. O FPP precursor é adicionado à suspensão de polipeptídeo, que é, então, incubado em temperatura ideal, por exemplo, entre 15 e 40 ºC, particularmente entre 25 e 35 “C, mais particularmente a 30 ºC. Após a incubação, o sesquiterpeno drimane, tal como albicanol e/ou drimenol produzido pode ser isolado da solução incubada por procedimentos de isolamento padrão, tal como extração e destilação de solvente, opcionalmente após a remoção de polipeptídeos da solução.
[00138] De acordo com outra modalidade, o pelo menos um polipeptídeo que tem uma atividade de terpeno sintase bifuncional pode ser usado para produção de um sesquiterpeno drimane que compreende albicanol e/ou drimenol ou misturas de terpenos que compreendem albicanol e/ou drimenol.
[00139] Uma ferramenta particular para realizar o método de uma modalidade no presente documento é o próprio polipeptídeo, como descrito no presente documento.
[00140] De acordo com uma modalidade particular, o polipeptídeo é capaz de produzir uma mistura de sesquiterpenos em que albicanol e/ou drimenol representam pelo menos 20%, particularmente, pelo menos 30%, particularmente, pelo menos 35%, particularmente, pelo menos 90%, particularmente, pelo menos 95%, mais particularmente, pelo menos 98% dos sesquiterpenos produzidos. Em outro aspecto fornecido aqui, o albicanol e/ou drimenol é produzido com seletividade maior ou igual a 95%, mais particularmente, 98%.
[00141] A funcionalidade ou atividade de qualquer proteína terpeno sintase bifuncional, variante ou fragmento, pode ser determinada com o uso de vários métodos. Por exemplo, superexpressão transiente ou estável em células vegetais, bacterianas ou de leveduras pode ser usada para testar se a proteína tem atividade, isto é, produz albicanol e/ou drimenol a partir de precursores de FPP. A atividade bifuncional da terpeno sintase pode ser avaliada em um sistema de expressão microbiana, tal como o ensaio descrito no Exemplo 3 do presente documento sobre a produção de albicanol e/ou drimenol, que indica funcionalidade. Uma variante ou derivado de um polipeptídeo de terpeno sintase bifuncional de uma modalidade do presente documento retém uma capacidade para produzir um sesquiterpeno drimane tal como albicanol e/ou drimenol a partir de precursores de FPP. As variantes de sequência de aminoácidos das terpeno sintases bifuncionais fornecidas no presente documento podem ter funções biológicas desejáveis adicionais, que incluem, por exemplo, utilização de substrato alterado, cinética de reação, distribuição de produto ou outras alterações.
[00142] A capacidade de um polipeptídeo para catalisar a síntese de um sesquiterpeno particular (por exemplo, albicanol e/ou drimenol) pode ser confirmada simplesmente, por exemplo, realizando-se o ensaio enzimático como detalhado nos Exemplos 3, 4 e 6.
[00143] É fornecido adicionalmente pelo menos um vetor que compreende as moléculas de ácido nucleico descritas no presente documento.
[00144] Também é fornecido no presente documento um vetor selecionado do grupo de um vetor procariótico, vetor viral e um vetor eucariótico.
[00145] É fornecido adicionalmente no presente documento um vetor que é um vetor de expressão.
[00146] Em uma modalidade, diversas terpeno sintases bifuncionais que codificam sequências de ácidos nucleicos são coexpressas em um único hospedeiro, particularmente sob controle de diferentes promotores. Em outra modalidade, diversas proteínas terpeno sintase bifuncionais que codificam sequências de ácidos nucleicos podem estar presentes em um único vetor de transformação ou ser cotransformadas ao mesmo tempo com o uso de vetores separados e selecionando transformantes que compreendem ambos os genes quiméricos. Da mesma forma, um ou mais genes de codificação de terpeno sintase bifuncional podem ser expressos em uma única planta, célula, microrganismo ou organismo, juntamente com outros genes quiméricos.
[00147] As sequências de ácidos nucleicos de uma modalidade do presente documento que codifica proteínas terpeno sintase bifuncionais podem ser inseridas em vetores de expressão e/ou estar contidas em genes quiméricos inseridos em vetores de expressão, para produzir proteínas terpeno sintase bifuncionais em uma célula hospedeira ou organismo hospedeiro não humano. Os vetores para inserir transgenes no genoma de células hospedeiras são bem conhecidos na técnica e incluem plasmídeos, vírus, cosmídeos e cromossomos artificiais. Vetores binários ou de cointegração nos quais um gene quimérico é inserido também podem ser usados para transformar células hospedeiras.
[00148] Uma modalidade fornecida no presente documento fornece vetores de expressão recombinantes que compreendem uma sequência de ácido nucleico de um gene de terpeno sintase bifuncional, ou um gene quimérico que compreende uma sequência de ácido nucleico de um gene de terpeno sintase bifuncional, ligado operacionalmente a sequências de ácidos nucleicos associadas tais como, por exemplo, sequências promotoras. Por exemplo, um gene quimérico que compreende uma sequência de ácidos nucleicos da SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69 ou SEQ ID NO: 70 ou uma variante do mesmo pode ser ligada operacionalmente a uma sequência promotora adequada para expressão em células vegetais, células bacterianas ou células fúngicas, opcionalmente ligada a uma sequência de ácido nucleico não traduzida em 3 '.
[00149] Alternativamente, a sequência promotora pode já estar presente em um vetor de modo que a sequência de ácidos nucleicos que deve ser transcrita seja inserida no vetor a jusante da sequência promotora. Os vetores podem ser projetados para ter uma origem de replicação, um local de clonagem múltipla e um marcador selecionável.
[00150] Em uma modalidade, um vetor de expressão que compreende um ácido nucleico como descrito no presente documento pode ser usado como uma ferramenta para transformar organismos hospedeiros não humanos ou células hospedeiras adequadas para realizar o método de uma modalidade no presente documento in vivo.
[00151] Os vetores de expressão fornecidos no presente documento podem ser usados nos métodos para preparar um organismo hospedeiro não humano e/ou célula hospedeira transformados geneticamente, em organismos hospedeiros não humanos e/ou células hospedeiras que abrigam os ácidos nucleicos de uma modalidade no presente documento e nos métodos para produzir polipeptídeos que tem uma atividade de terpeno sintase bifuncional, como descrito no presente documento.
[00152] As células hospedeiras e organismos hospedeiros não humanos recombinantes transformados para alojar pelo menos um ácido nucleico de uma modalidade do presente documento de modo que expresse ou superexpresse de modo heterólogo pelo menos um polipeptídeo de uma modalidade do presente documento também são ferramentas muito úteis para executar o método de uma modalidade do presente documento. Tais organismos hospedeiros não humanos e células hospedeiras são, portanto, fornecidos no presente documento.
[00153] Em uma modalidade é fornecido uma célula hospedeira, microrganismo ou organismo hospedeiro não humano que compreende pelo menos uma das moléculas de ácido nucleico descritas no presente documento ou que compreende pelo menos um vetor que compreende pelo menos uma das moléculas de ácido nucleico.
[00154] Um ácido nucleico de acordo com qualquer uma das modalidades descritas acima pode ser usado para transformar os organismos e células hospedeiros não humanos e o polipeptídeo expresso pode ser qualquer um dos polipeptídeos descritos acima.
[00155] Em uma modalidade, o organismo hospedeiro não humano ou célula hospedeira é uma célula procariótica. Em outra modalidade, o organismo hospedeiro não humano ou célula hospedeira é uma célula bacteriana. Em uma modalidade adicional, o organismo hospedeiro não humano ou célula hospedeira é Escherichia coli.
[00156] Em uma modalidade, o organismo hospedeiro não humano ou célula hospedeira é uma célula eucariótica. Em outra modalidade, o organismo hospedeiro não humano ou célula hospedeira é uma célula de levedura. Em uma modalidade adicional, o organismo hospedeiro não humano ou célula é Saccharomyces cerevisiae.
[00157] Em uma modalidade adicional, o organismo não humano ou célula hospedeira é uma célula vegetal ou uma célula fúngica.
[00158] Em uma modalidade o organismo hospedeiro não humano ou célula hospedeira expressa um polipeptídeo, desde que o organismo ou célula é transformado para abrigar um ácido nucleico que codifica o dito polipeptídeo, esse ácido nucleico é transcrito para MRNA e o polipeptídeo é encontrado no organismo ou célula hospedeira.
[00159] Métodos adequados para transformar um organismo hospedeiro não humano ou uma célula hospedeira foram descritos anteriormente e também são fornecidos no presente documento.
[00160] Para realizar uma modalidade no presente documento in vivo, o organismo hospedeiro ou a célula hospedeira é cultivada sob condições propícias à produção de um sesquiterpeno drimane tal como albicanol e/ou drimenol. Consequentemente, se o hospedeiro for uma planta transgênica, condições ideais de crescimento podem ser fornecidas, tais como condições ideais de luz, água e nutrientes, por exemplo. Se o hospedeiro for um organismo unicelular, condições propícias à produção de um sesquiterpeno drimane tal como albicanol e/ou drimenol podem compreender a adição de cofatores adequados ao meio de cultura do hospedeiro. Além disso, um meio de cultura pode ser selecionado, de modo a maximizar a síntese de sesquiterpeno drimane, tal como albicanol e/ou drimenol. Exemplos de condições ideais de cultura são descritos de maneira mais detalhada nos Exemplos.
[00161] Organismos hospedeiros não humanos adequados para realizar o método de uma modalidade no presente documento in vivo podem ser quaisquer organismos multicelulares ou unicelulares não humanos. Em uma modalidade, o organismo hospedeiro não humano usado para realizar uma modalidade no presente documento in vivo é uma planta, um procarionte ou um fungo. Qualquer planta, procarioto ou fungo pode ser usado. As plantas particularmente úteis são aquelas que produzem naturalmente altas quantidades de terpenos. Em outra modalidade o organismo hospedeiro não humano usado para realizar o método de uma modalidade no presente documento in vivo é um microrganismo. Qualquer microrganismo pode ser usado, por exemplo, o microrganismo pode ser uma bactéria ou levedura, tal como E. coli ou Saccharomyces cerevisiae.
[00162] Alguns desses organismos não produzem FPP naturalmente. Para ser adequado para realizar o método de uma modalidade no presente documento, organismos ou células que não produzem um precursor acíclico de pirofosfato de terpeno, por exemplo, FPP, naturalmente são transformados para produzir o dito precursor. Os mesmos podem ser assim transformados antes da modificação com o ácido nucleico descrito de acordo com qualquer uma das modalidades acima ou simultaneamente, como explicado acima. Os métodos para transformar organismos, por exemplo micro-organismos, de modo que os mesmos produzam um precursor de pirofosfato de terpeno acíclico, por exemplo, FPP, já são conhecidos na técnica.
[00163] Células eucarióticas maiores isoladas também podem ser usadas, em vez de organismos completos, como hospedeiros para realizar o método de uma modalidade do presente documento in vivo. Células eucarióticas adequadas podem ser qualquer célula não humana, tais como células vegetais ou fúngicas.
[00164] No presente documento é fornecido adicionalmente um método para produzir um sesquiterpeno drimane que compreende: colocar em contato um pirofosfato de terpeno acíclico, particularmente, farnesil difosfato (FPP) com um polipeptídeo que compreende um domínio de hidrolase semelhante a HAD e que tem atividade de terpeno sintase bifuncional para produzir um sesquiterpeno drimane, em que o polipeptídeo compreende (1) um motivo semelhante a terpeno sintase de classe | como estabelecido na SEQ ID NO: 53 (DDxx(D/E)) e (2) um motivo semelhante a terpeno sintase de classe |l como estabelecido na SEQ ID NO: 56 (DxD(T/S)T); e opcionalmente isolar o sesquiterpeno drimane.
[00165] Também é fornecido o método acima em que o sesquiterpeno drimane compreende albicanol e/ou drimenol.
[00166] Além disso, é fornecido o método acima, em que o polipeptídeo compreende uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63 e (1) a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e (2) a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 58 ou que compreende a sequência de aminoácidos de SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63 para produzir um sesquiterpeno drimane ; e opcionalmente isolar o sesquiterpeno drimane. Em outro aspecto, o polipeptídeo compreende adicionalmente um ou mais motivos conservados como estabelecido na SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61 e/ou SEQ ID NO: 62.
[00167] Em um aspecto, o sesquiterpeno drimane é albicanol e/ou drimenol. Em outro aspecto, o sesquiterpeno drimane é isolado.
[00168] Em outro aspecto fornecido aqui, o albicanol e/ou drimenol é produzido com seletividade maior ou igual a 60%, 80%, ou 90% ou mesmo 95%. Em um aspecto adicional o sesquiterpeno drimane é albicanol.
[00169] É fornecido adicionalmente aqui um método que compreende transformar uma célula hospedeira, microrganismo ou um organismo hospedeiro não humano com um ácido nucleico que codifica um polipeptídeo que compreende um domínio de hidrolase semelhante a HAD que tem atividade de terpeno sintase bifuncional e que compreende uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ
ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35 ou SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63; e que compreende (1) a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e (2) a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 58 ou que compreende a sequência de aminoácidos de SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35 ou SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO:
63.
[00170] Em uma modalidade, um método fornecido no presente documento compreende cultivar um organismo hospedeiro não humano ou uma célula hospedeira capaz de produzir FPP e transformado para expressar um polipeptídeo em que o polipeptídeo compreende uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% ou 100% de identidade de sequência com a SEQ ID NO: 1 ou SEQ ID NO: 5 sob condições que permitem a produção do polipeptídeo.
[00171] Emuma outra modalidade, um método fornecido no presente documento compreende colocar em contato um sesquiterpeno tal como albicanol e/ou drimenol com pelo menos uma enzima para produzir um derivado de sesquiterpeno. Em uma modalidade, o derivado de sesquiterpeno pode ser obtido bioquímica ou quimicamente. Em uma modalidade, um derivado de drimenol é fornecido. Exemplos de tais derivados de drimenol incluem, porém, sem limitação, acetato de drimenil (CAS 40266-93-1), drimenal (CAS 105426-71-9), ácido drimênico (CAS 111319-84-7).
[00172] Em uma modalidade, um derivado de albicano! é fornecido. Exemplos de tais derivados do albicanol incluem ácido criptopárico E (CAS 120001-10-7), ácido criptopárico D (CAS 119979-95-2), ácido criptopárico B (CAS 113592-88-4), ácido criptopárico A (CAS 113592- 87-3), ácido laricinólico (CAS 302355-23-3), acetato de albicanil (CAS 83679-71-4).
[00173] O albicanol e/ou drimenol produzidos em qualquer um dos métodos descritos no presente documento podem ser convertidos para derivados tais como,
porém, sem limitação, hidrocarbonetos, ésteres, amidas, glicosídeos, éteres, epóxidos, aldeídos, cetonas, álcoois, dióis, acetais ou cetais.
[00174] Os derivados de albicanol e/ou drimenol podem ser obtidos por um método químico tal como, mas não limitado a oxidação, redução, alquilação, acilação e/ou rearranjo.
[00175] Alternativamente, os derivados de albicanol e/ou drimenol podem ser obtidos com o uso de um método bioquímico colocando-se em contato o albicano! e/ou drimenol com uma enzima tal como, porém, sem limitação, uma oxidorredutase, uma mono-oxigenase, uma dioxigenase, uma transferase. A conversão bioquímica pode ser realizada in vitro com o uso de enzimas isoladas, enzimas de células lisadas ou in vivo com o uso de células inteiras.
[00176] De acordo com outra modalidade particularmente, o método de qualquer uma das modalidades descritas acima é realizado in vivo. Nesse caso, a etapa a) compreende cultivar um organismo hospedeiro não humano ou uma célula hospedeira capaz de produzir FPP e transformada para expressar pelo menos um polipeptídeo que compreende um aminoácido que compreende a SEQ ID NO: 1 ou SEQ ID NO: 5 ou uma variante funcional do mesmo que pode ser considerada um polipeptídeo da superfamília da hidrolase semelhante a HAD (superfamília da proteína Interpro IPRO23214 ou superfamília da proteína Pfam PF13419) e que compreende um domínio de hidrolase semelhante a HAD e que tem uma atividade de terpeno sintase bifuncional, sob condições propícias para a produção de drimane sintase, por exemplo, albicanol e/ou drimenol. Em uma modalidade, albicanol pode ser o único produto ou pode ser parte de uma mistura de sesquiterpenos. Em outro aspecto, drimenol pode ser o único produto ou pode ser parte de uma mistura de sesquiterpenos.
[00177] De acordo com uma modalidade adicional, o método compreende adicionalmente, antes da etapa a), transformar um organismo não humano ou célula capaz de produzir FPP com pelo menos um ácido nucleico que codifica um polipeptídeo que compreende um aminoácido que compreende a SEQ ID NO: 1 ou SEQ ID NO: 5 ou que codifica um polipeptídeo que tem atividade de terpeno sintase bifuncional e que compreende uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%,
98% ou 99% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35 ou SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63; e (1) a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e (2) a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 58, de modo que o dito organismo expresse o dito polipeptídeo. O polipeptídeo pode compreender adicionalmente um ou mais motivos conservados como estabelecido na SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61 e/ou SEQ ID NO: 62.
[00178] Essas modalidades de uma modalidade no presente documento são particularmente vantajosas uma vez que é possível realizar o método in vivo sem isolar previamente o polipeptídeo. A reação ocorre diretamente dentro do organismo ou da célula transformada para expressar o dito polipeptídeo.
[00179] Uma modalidade no presente documento fornece polipeptídeos de uma modalidade no presente documento para ser usado em um método para produzir um sesquiterpeno drimane tal como albicanol e/ou drimenol que coloca em contato um precursor de FPP com os polipeptídeos de uma modalidade no presente documento in vitro ou in vivo.
[00180] É fornecido adicionalmente o uso de um polipeptídeo como descrito no presente documento para produzir um sesquiterpeno drimane, por exemplo, albicanol e/ou drimenol.
[00181] Os seguintes exemplos são ilustrativos apenas e não se destinam a limitar o escopo das reivindicações às modalidades descritas no presente documento.
[00182] EXEMPLOS
[00183] EXEMPLO 1
[00184] “CULTIVO DE MICRORGANISMO E EXTRAÇÃO DE DNA E RNA.
[00185] Sesquiterpenóides drimane são muito difundidos na natureza (Jansen e Groot, 2004, Nat. Prod. Rep., 21, 449-477). Os compostos na família sesquiterpeneóide drimane contêm a estrutura sesquiterpeno com o esqueleto de carbono drimane representado na Figura 1. Por exemplo, sesquiterpenos drimane encontrados comumente são drimenol e albicano! (Figura 1) e compostos derivados de drimenol e albicanol por reações enzimáticas tais como oxidações, redução, acilação, alquilação ou rearranjo. A família sesquiterpeneóide drimane também contém compostos em que o sesquiterpeno drimane é ligado a uma molécula derivada de outra via biossintética (Jansen e Groot, 2004, Nat. Prod. Rep., 21, 449 a 477).
[00186] Ácidos criptopóricos A-H são éteres sequiterpenóides drimane de ácido isocítrico encontrados no fungo Cryptoporus volvatus (Hashimoto et al, 1987, Tetrahedron Let. 28, 6303 a 6304; Asakawa et al, 1992, Phytochemistry 31(2), 579 a 592; Hirotani et al, 1991, Phytochemistry 30(5), 1555 a 1559). Em ácidos cripotopóricos, a porção química de sesquiterpeno tem a estrutura de albicanol e, portanto, esses compostos são supostamente derivados biossinteticamente de albicanol. Ácido laricinólico é um sesquiterpeno do tipo drimane que pode ser isolado do fungo que apodrece a madeira Laricifomes officinalis (Erb et al, 2000, J. Chem. Soc., Perkin Trans. 1, 2307 a 2309). Ácido laricinólico é muito provavelmente derivado de albicanol que segue diversas etapas enzimáticas oxidativas.
[00187] Comprometemo-nos a caracterizar albicanol sintases e a identificar sequências de nucleotídeo que codificam para albicanol sintases a partir de Cryptoporus volvatus e Laricifomes officinalis. Cepas de Laricifomes officinalis (ATCCº 644307Y) e Cryptoporus volvatus (ATCCº912212 TV) são conservadas na American Type Culture Collection (ATCC) sob os números de coleção ATCC-64430 e ATCC-12212, respectivamente. As cepas Laricifomes officinalis (NTCCº 644307V) e Cryptoporus volvatus (ATCCº12212TV) foram adquiridas de LGC Standards GmbH (46485 Wesel, Alemanha). As células foram cultivadas em meio de Bolor de Levedura (YM) (Wickerham, 1939, J. Tropical Med. Hyg. 42, 176).
[00188] Para cada uma das duas cepas, DNA genômico e RNA total foram extraídos a fim de sequenciar o genoma completo e um transcriptoma. As células propagadas em placas de YM-ágar foram usadas para inocular 100 ml de meio de YM líquido em tubos de vidro. As culturas foram incubadas por 6 dias com agitação a 25 ºC e 180 rpm. Para extração de RNA 0,5 ml de cultura foram retirados, as células (Aproximadamente 100 mg) foram recuperadas por centrifugação congeladas em nitrogênio líquido e trituradas com o uso de um almofariz e pilão. O agregado de RNA total foi extraído com o uso do ZR Fungal/Bacterial RNA MiniPrep'Y da Zymo Research Corp (Irvine, CA 92614, EUA). De 100 mg de células 18 e 23 microgramas de RNA total foram obtidos para ATCC-12212 e ATCC-64430, respectivamente. DNA genômico foi extraído com o uso do NucleoSpinº Soil Kit da Machery-Nagel (Duúren, Alemanha). Células foram recuperadas da cultura por centrifugação e o DNA genômico foi extraído seguindo o protocolo do fabricante. De 500 mg de células 1,05 e 0,93 microgramas de DNA genômico foram extraídos de ATCC-12212 e ATCC-64430, respectivamente.
[00189] EXEMPLO 2
[00190] SEQUENCIAMENTO DE GENOMA E TRANSCRIPTOMA.
[00191] O DNA genômico foi sequenciado com o uso de um protocolo de leitura emparelhado (lllumina). As bibliotecas foram preparadas para selecionar tamanhos de inserto entre 250 e 350 bp. A sequenciação foi realizada em um sequenciador HiSeq 2500 Illumina. O comprimento das leituras foi de 125 bases. Um total de 21,3 e 30,4 milhões de leituras emparelhadas (agrupamentos) foram sequenciadas para ATCC-12212 e ATCC-64430, respectivamente.
[00192] Para os transcriptomas a biblioteca foi preparada a partir do RNA total com o uso do TruSeg Stranded mRNA Library Preparation Kit (Illumina). Uma etapa de seleção de tamanho de inserto adicional (160 a 240 bp) foi realizada. As bibliotecas foram sequenciadas em 2x125 bases extremidades emparelhadas em um sequenciador HiSeq 2500 lIllumina. Para ATCC-12212 e ATCC-64430, 19,9 milhões e 126 milhões de leituras foram sequências, respectivamente.
[00193] Para montagem do transcriptoma C. volvatus, as leituras foram primeiro unidas em suas extremidades sobrepostas. As leituras emparelhadas unidas foram então montadas com o uso do montador Velvet V1.2.10 (Zerbino D.R. e Birney E. 2008, Genome Res. 18(5), 821 a 829; www.ebi.ac.uk/-zerbino/velvet/) e a software Oases (Schuz M.H et al, 2012, Bioinformatics 28(8), 1086 a 1092; http://Awww.ebi.ac.uk/-zerbino/oases/). Um total de 25'866 contigs com um comprimento médio de 1'792 bases foi obtido para o transcriptoma C. volvatus.
[00194] O genoma C. volvatus foi montado com o uso do montador Velvet V1.2.10 (Zerbino D.R. e Birney E., 2008, Genome Res. 18(5), 821 a 829; www.ebi.ac.uk/-zerbino/velvet/). O genoma poderia ser montado em 1'266 contigs com um tamanho médio de 20'000 bases e um tamanho total de 25'320'421 bases. Uma predição do gene ab-initio nos contigs genômicos de C. volvatus foi realizada pela Progenus SA (Gembloux, Bélgica) com o uso do software Augustus (Stanke et al., Nucleic Acids Res. (2004) 32, W309 a W312). Um total de 7738 genes foram preditos. Anotação funcional foi realizada combinando uma pesquisa no domínio Pfam (Finn, R.D. et al., 2016, Nucleic Acids Research Database Issue 44:D279 a D285) e uma pesquisa Blast (Altschul et al., 1990, J. Mol. Biol. 215, 403 a 410).
[00195] O genoma e transcriptoma de L. officinalis foram montados com o uso do CLC Genomic Workbench (Qiagen). O genoma foi montado em 16'831 contigs para um tamanho total do genoma de 90'591'190 bases. A montagem de transcriptoma forneceu 28'633 contigs com um comprimento médio de 1'962 bases.
[00196] EXEMPLO 3
[00197] IDENTIFICAÇÃO DE SESQUITERPENO SINTASES DRIMANE.
[00198] Como uso de uma pesquisa tBlastn (Altschul et al., 1990, J. Mol. Biol. 215, 403 a 410) com as sequências de aminoácidos de sesquiterpeno sintases conhecidas como sequências de consulta, 6 e 10 supostas sequências de sesquiterpeno sintases foram identificadas no genoma C. volvatus e genoma L. officinalis, respectivamente. As sequências foram corrigidas manualmente, em particular para as localizações de junção exon-intron, com o uso de um mapeamento das leituras de sequenciamento de RNA nos contigs genômicos. Os CDNAs correspondentes foram então otimizados por códon para expressão ótima de E.coli, sintetizados e clonados em um plasmídeo de expressão (pJ401, ATUM, Newark, Califórnia). A expressão funcional das células E coli e o ensaio de caracterização enzimática mostraram atividades de sesquiterpeno sintase, mas não revelaram qualquer formação de albicanol a partir da FPP.
[00199] O sesquiterpeno drimane é presumivelmente produzido a partir de farnesil difosfato (FPP) por um mecanismo enzimático que envolve uma ciclização iniciada por protonação seguida por uma reação iniciada por ionização (Henquet et al., 2017, Plant J. Mar 4. doi: 10.1111/tpj. 13527; Kwon, M.et al., 2014, FEBS Letters 588, 4597 a 4603) (Figura 2). Isso implica que as drimane sintases são compostas por dois domínios catalíticos, um domínio catalítico de ciclização iniciado por protonação e um domínio catalítico de ciclização iniciado por ionização.
[00200] As terpeno-sintases que catalisam a reação de ciclização iniciada por protonação são chamadas de terpeno sintases classe |l (ou tipo |l) e estão tipicamente envolvidas na biossíntese de triterpenos e diterpenos de labdano. Em terpeno sintases classe || a reação iniciada por protonação envolve aminoácidos ácidos que doam um próton para a ligação dupla terminal. Esses resíduos, usualmente ácidos aspárticos, são parte de um motivo DXDD conservado localizado no local ativo da enzima.
[00201] Terpeno sintases que catalisam reações iniciadas por ionização são chamadas terpeno sintases classe | (ou tipo 1), geralmente monoterpeno e sesquiterpeno sintases, e o centro catalítico contém um motivo DDxxD conservado (parte de SEQ ID NO: 53). Os resíduos de ácido aspártico desse motivo de classe | ligam um íon metálico divalente (na maioria das vezes Mg?*) envolvido na ligação do grupo difosfato e catalisam a ionização e clivagem da ligação difosfato alílica do substrato.
[00202] O suposto ciclização mecanismo de um farnesil difosfato para um sesquiterpeno drimane (tal como albicanol ou drimenol) inicia com a protonação da ligação dupla 10,11 seguida pelos rearranjos sequenciais e formações de ligação de carbono. O intermediário de carbocação dessa primeira reação (classe |1l) pode então sofrer desprotonação em C15 ou C4 (ou eventualmente em C2) que leva a um intermediário albicanil-difosfato ou drimenil-difosfato. Finalmente, o domínio catalítico de classe | catalisa a ionização da ligação difosfato alílica e o arrefecimento brusco da carbocação intermediada por uma molécula de água que leva a um sesquiterpeno drimane que contém um grupo hidroxila primário (Figura 2). Se necessário, quaisquer vestígios de intermediários fosforilados residuais da síntese de albicanol ou drimenol, como qualquer albicanil ou drimenil-monofosfato e/ou difosfato, podem ser convertidos quimicamente para o respectivo produto final albicanol ou drimenol. Certos métodos correspondentes são conhecidos e podem compreender, por exemplo, a clivagem hidrolítica da ligação éster do ácido fosfórico. Adicionalmente, certos intermediários também podem ser convertidos enzimaticamente, como mostrado nos Exemplos 7 e 8.
[00203] Com base nas considerações acima, foram pesquisados os dados do genoma e transcriptoma de C. volvatus e L. officinalis para sequências que codificam para polipeptídeos que contêm juntos um motivo terpeno-sintase classe | e classe Il. Recentemente, uma drimanil-difosfato sintase (AstC) foi identificada no fungo Aspergillus oryzea (Shinohara Y'. et al., 2016, Sci Rep. 6, 32865). A enzima contém um domínio de terpeno sintase classe || e catalisa a ciclização de iniciação da protonação de farnesil-difosfato em drimanil-difosfato. No entanto, essa enzima does não tem uma atividade de terpeno sintase classe | e, portanto, não catalisa a ionização e clivagem do grupo difosfato alílico. Com o uso da sequência de AstC, primeiro pesquisou-se as sequências de aminoácidos deduzidas dos genes preditos no genoma de C. volvatus. Com o uso de uma pesquisa Blastp contra as sequências de aminoácidos deduzidas a partir dos genes preditos, 5 sequências foram recuperadas com um valor E entre 0,77 e 3e-089 (Altschul et al., 1990, J. Mol. Biol. 215, 403 a 410).
[00204] Dentre essas 5 sequências, CvTps1 foi selecionado como o mais relevante para uma suposta albicanol sintase. A sequência de aminoácidos codificada pelo gene CvTps1 compartilhou 38% de identidade com a sequência de aminoácidos AstC. A análise dessa sequência revelou a presença de um motivo semelhante a terpeno sintase classe |l, DVDT, na posição 275 a 279. Essa é uma variante do motivo típico de terpeno sintase classe Il mencionado acima, em que o último Asp é substituído por um Thr. Esse motivo DXDT classe || é encontrado em algumas diterpeno sintases classe |! (Xu M. et al., 2014, J. Nat. Prod. 77, 2144 a 2147; Morrone D. et al., 2009, J. FEBS Lett., 583, 475 a 480) e em AstC. Outra característica interessante da sequência CvTps1 é a presença de um motivo típico de classe | na região N-terminal (DDKLD na posição 168 a 172). A presença desse motivo de classe |, não presente no AstC, sugere que o CvTps1 pode catalisar uma reação iniciada por ionização, além da reação da classe Il. Outra diferença com AstC é a presença de uma extensão de C-terminal, o peptídeo CvTps1 contém 46 aminoácidos adicionais na extremidade de C-terminal. Assim, o CvTps1 foi selecionado como suposto candidato a uma albicanol sintase bifuncional.
[00205] Os bancos de dados de família de proteínas, tais como Pfam e Interpro (Instituto Europeu de Bioinformática (EMBL-EBI), são bancos de dados de famílias de proteínas, que incluem anotação funcional, domínios de proteínas e assinaturas de domínios de proteínas. A sequência de aminoácidos de CvTps1 foi pesquisada quanto à ocorrência de motivos característicos de domínios de proteína com o uso do algoritmo HMMER disponível no site da HMMER (Finn R.D., 2015, Nucleic Acids Research Web Server Issue 43:W30 a W38; www.ebi.ac.uk/Tools/hmmer/). Nenhum domínio associado com terpeno sintases clássicas foi encontrado na sequência de aminoácidos CvTps1. A consulta identificou uma característica de domínio da superfamília da proteína hidrolase semelhante a Haloácido deshalogenase (HAD) (PF13419.5) na região entre os resíduos 115 e 187. Uma pesquisa similar com o uso do banco de dados da família de proteínas da Interpro (consultar o site ebi.ac.uk/interpro/) e o Banco de Dados de Domínio Conservado (site da NCBI em ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) forneceu os mesmos resultados: apenas a previsão de um domínio da superfamília de hidrolase do tipo HAD na região N-terminal (IPR 023214 e CL21460, respectivamente). A superfamília da hidrolase semelhante a HAD contém um grande número de proteínas com várias funções que incluem enzimas com atividade da fosfatase (Koonin e Tatusov, 1994, J. Mol. Biol 244, 125 a 132; Kuznetsova et al, 2015, J Biol Chem. 290(30), 18678 a 18698). O motivo semelhante a terpeno sintase de classe | identificado acima no polipeptídeo CvTps1 contém uma das assinaturas do motivo da hidrolase semelhante a HAD que contêm resíduos de ácido aspártico conservados envolvidos na atividade catalítica (fosfatase). Essa análise confirma, assim, que a região N-terminal de CvTps1 está envolvida na hidrólise do grupo difosfato (atividade de terpeno sintase classe |).
[00206] Nenhuma predição significativa de domínio foi obtida na porção C- terminal do polipeptídeo. Dada a presença de um motivo semelhante a terpeno sintase classe |l, a parte C-terminal provavelmente está envolvida na ciclização iniciada por protonação.
[00207] A sequência de aminoácidos CvTps1 foi usada para pesquisar sequências homólogas no genoma e transcriptoma de L. officinalis. Para essa pesquisa o algoritmo tBlastn foi usado (Altschul et al 1990, J. Mol. Biol. 215, 403 a 410). Uma transcrição, LoTps1 mostrou similaridade de sequência com CvTps1: o comprimento da sequência (521 aminoácidos) foi similar ao comprimento da sequência de aminoácidos CvTps1, a identidade geral da sequência entre as duas sequências foi de 71%, a região N-terminal continha um motivo de terpeno sintase classe | típico (DDKLD na posição 162 a 166), um motivo de terpeno sintase classe Il (DMDT) foi encontrado na posição 267 a 270 e a região N-terminal continha um domínio predito de hidrolase semelhante a HAD.
[00208] EXEMPLO 4
[00209] EXPRESSÃO E CARACTERIZAÇÃO HETERÓLOGAS DE CVTPS1 E LOTPS1.
[00210] As sequências de codificação CvTps1 e LoTps1 foram controle e as predições de junções exon-intron foram refinadas com o uso de mapeamentos das leituras de sequenciamento de RNA contra os contigs genômicos. As sequências de codificação dos cDNAs resultantes foram otimizadas por códon e clonadas no plasmídeo de expressão pJ401 E. coli (pJ401, ATUM, Newark, Califórnia).
[00211] As enzimas foram caracterizadas funcionalmente em células de E. coli projetadas para superproduzir farnesil-difosfato (FPP). As células de E. coli competentes foram transformadas com o plasmídeo pACYC-29258-4506 (descrito em WO2013064411 ou em Schalk et al., 2013, J. Am. Chem. Soc. 134, 18900 a 18903) e com o plasmídeo de expressão pJ401-CvTps1 ou pJ401-LoTps1. O pACYC-29258-4506 transporta o cCDNA que codifica para um gene da FPP sintase e os genes para uma via completa do mevalonato. As células KRX E. coli (Promega) foram usadas como um hospedeiro. As células transformadas foram selecionadas em placas de canamicina (50 pg/ml) e cloranfenicol (34 pg/ml) LB-agarose. Colônias únicas foram usadas para inocular 5 ml! de meio líquido LB suplementado com os mesmos antibióticos. A cultura foi incubada de um dia para o outro a 37 “C. No dia seguinte, 2 ml! de meio TB suplementado com os mesmos antibióticos foram inoculados com 0,2 ml da cultura de um dia para o outro. Após 6 horas de incubação a 37 ºC, a cultura foi resfriada até 28 ºC e 0,1 mM de IPTG, 0,2% de ramnose e 10% em volume (0.2 ml) de dodecano foram adicionados a cada tubo. As culturas foram incubadas por 48 horas a 28 º C. As culturas foram, então, extraídas duas vezes com 2 volumes de éter terc-butilmetílico (MTBE), a fase orgânica foi concentrada para 500 uL e analisada por GC-MS.
[00212] Aanálise GC-MS foi realizada com o uso de um sistema GC Agilent série 6890 conectado a um detector de massa Agilent 5975. O GC foi equipado com coluna capilar de diâmetro interno de 0,25 mm por 30 m DB-11MS (Agilent). O gás carreador era He a um fluxo constante de 1 ml/min. A temperatura de entrada foi ajustada em 250 º C. A temperatura inicial do forno foi de 80 ºC, seguida por um gradiente de 10 ºC/min para 220 ºC e um segundo gradiente de 30 º*C/min para 280 ºC. A identificação dos produtos foi com base na comparação dos espectros de massa e índices de retenção com padrões autênticos e bancos de dados internos de espectros de massa.
[00213] Nessas condições foi observada a formação de um único produto com a proteína recombinante CrVo07609. A concentração final para esse produto enzimático foi de 200 mg/l de meio de cultura. O tempo de retenção na cromatografia gasosa, bem como o espectro de massa, estava de acordo com os dados do GCMS de um padrão autêntico (+)-albicanol. Para confirmação da estrutura, as células recombinantes foram cultivadas em um volume maior (500 ml) nas condições descritas acima. O MTBE foi destilado do extrato e a suspensão resultante em dodecano foi submetida a cromatografia flash. O produto foi eluído com uma mistura 1:5 de MTBE e ciclo-hexano. O solvente foi removido por destilação, fornecendo um produto com 98% de pureza. A estrutura de albicano! foi confirmada por análise de 1H e 13C-NMR. A reação óptica foi medida com o uso de um espectrômetro a Bruker Avance de 500 MHz. O valor de [a]P20o = +3,8 * (0,26%, CHCI3) confirmou a formação de (+)-albicanol (com a estrutura mostrada na Figura 1) pela proteína CvTps1 recombinante.
[00214] A atividade de LoTps1 foi avaliada nas mesmas condições. O perfil do produto foi idêntico ao perfil de CvTps1 com (+)-albicanol como o único produto detectado da enzima LoTps1 recombinante.
[00215] Esses experimentos mostram que o CvTps1 e o LoTps1 são enzimas com atividade bifuncional de ciclase de classe Il e atividade de fosfatase de classe
LL
[00216] EXEMPLOS
[00217] PESQUISA POR SEQUÊNCIAS HOMÓLOGAS A CVTPS1 E LOTPS1 EM OUTROS ORGANISMOS.
[00218] As sequências de aminoácidos de CvTps1 e LoTps1 foram usadas para procurar sequências homólogas de outros organismos presentes em bancos de dados públicos. Uma abordagem de pesquisa blastp (Altschul et al., 1990, J. Mol.
Biol. 215, 403 a 410) foi primeiro usada para pesquisar no banco de dados de proteinas do National Center for Biotechnology Information (NCBI, https://www.ncbi.nIm.nih.gov/) por sequências que mostram homologia com CvTps1 e LoTps1. Os aminoácidos recuperados foram então analisados quanto à presença das características CvTps1 e LoTps1 descritas no Exemplo 3. Quinze sequências, todas de espécies de fungos, foram selecionadas para análise adicional e caracterização da atividade enzimática: Acesso NCNC OCH93767.1 de Obba rivulosa , Acesso NCBI EMD37666.1 de Gelatoporia subvermispora , acesso NCBI XP 001217376.1 de Aspergillus terreus , acesso NCBI OJJ98394.1 de Aspergillus aculeatus , acesso NCBI GAOB87ill1 ubo80501,1 de Aspergillus de Trametes versicolor , acesso NCBI XP 007369631.1 de Dichomitus squalens , acesso NCBI KIA75676.1 de Aspergillus ustus , acesso NCBI XP 001820867.2 de Aspergillus oryzae , acesso NCBI CEN60542.1 de acesso NCBI CEN60542.1 de Aspergillus calidoustus , NCBI irregular900 , NCBI de 1,15 ; adesão KLOO09124.1 de Schizopora paradoxa , NCBI adesão OJI95797.1 de Aspergillus versicolor .
[00219] Asequência de EMD3766.1 foi corrigida pela exclusão dos aminoácidos 261 a 266 presentes na sequência publicada e provavelmente resultante de previsão incorreta de splicing (sequência EMD37666-B na tabela 1). Outra sequência, ACg006372 foi selecionada da sequência anotada publicada de Antrodia cinnamomea (Lu et al., 2014, Proc. Natl. Acad. Sci. EUA. 111(44):E4743 a 52, (Conjunto de dados S1)).
[00220] As 15 supostas sequências de aminoácidos de terpeno sintases contêm um motivo semelhante a terpeno sintase de classe ||! com a sequência de consenso D(V/M/L/F)D(T/S) bem como um motivo semelhante a terpeno sintase de classe | com a sequência de consenso DD(K/N/Q/R/S)xD (em que x é um resíduo hidrofóbico L, |, G, T ou P). Os motivos de classe | e classe |l são facilmente localizados com o uso de um alinhamento das sequências de aminoácidos com as sequências de CvTps1 e LoTps1 (Figura 6). Tal alinhamento pode ser feito com o uso de, por exemplo, o programa Clustal W (Thompson J.D. et al., 1994, Nucleic Acids Res. 22(22), 4673 a 80). Além disso, a presença de um domínio hidrolase semelhante a HAD foi identificado na região N-terminal das 15 sequências de aminoácidos (entre as posições 1 e 183 a 243 das sequências) (Tabela 3).
[00221] As características das sequências acima sugerem, assim, que as proteínas contêm um domínio de fosfatase ou terpeno-sintase classe | e um domínio de terpeno-sintase classe || na região N-terminal e C-terminal, respectivamente, e, portanto, tem ciclização por iniciada protonação bifuncional e atividades catalíticas iniciadas por ionização. O alinhamento das sequências e as comparações aos pares (Tabela 2) das sequências de aminoácidos acima mostraram um valor de identidade de sequência inferior de 37% e um valor superior de 89% (sem considerar as duas variantes EMD37666.1). Comparadas a CvTps1 e LoTps1, as sequências mais próximas compartilhavam 85% de identidade e a sequência mais distante apenas 42% de identidade.
TABELA 1. LISTA DE SEQUÊNCIAS SELECIONADAS QUE MOSTRAM HOMOLOGIA DE SEQUÊNCIA COM CVTPS1 E LOTPS1 E CONTÊM MOTIVOS CLASSE | E UM CLASSE Il. A FONTE (ESPÉCIE) DAS SEQUÊNCIAS, SEQ ID NO, COMPRIMENTO DA SEQUÊNCIA, REGIÃO DE SEQUÊNCIA QUE CONTÉM OS MOTIVOS DE CLASSE | E CLASSE |l E POSIÇÕES DOS MOTIVOS DE CLASSE | E CLASSE |l SÃO LISTADAS. OS RESÍDUOS DE MOTIVOS DE CLASSE | E CLASSE Il ESTÃO EM NEGRITO.
Nome ou Pro- Goo Função Sequência | Posição Sequênci Posição acesso SEQ (amin do banco de motivo | motivo motivo motivo NCBI IDNO Ês de dados) classe | classe | classe || classe || mm je me ce ee os em fa e ae e ee | mm as o e FE ema OCcH9376 Obba 527 | Semelhan | VFVDDKI | 166a |fpdDLDT| 271a 71 rivulosa te a HAD DNVL 170 ts 274 ora ora ma Jess | | [os ]| vv [6] 7) OJJ98394 | Aspergillus 20 483 Proteína | víivDDKktEn | 162a | FpnDIDT| 268a A aculeatus hipotética vl 166 ts 271 fosfatase GAOS750 | Aspergillus de alía-D" | ippqienv | 1672 | fodDvDT | 273a 11 udagavae | 23 | 485 | glicose1- v 171 Ss 276 ' e fosfato YihX XP 00803 | Trametes Proteína | vEVDDKL | 168a |FPDDVD| 273a ; 26 524 | semelhan 41511 versicolor DNVV 172 TTS 276 te a HAD XP 00736 | Dichomitus Proteína | vEVDDKL | 168a |FPDDVD| 273a 29 527 | semelhan
9631.1 squalens DNVA 172 TITS 276 te a HAD Antrodia Proteína ACQ0DSST cinnamome 32 semelhan VFNDDRI Us rs “es a te a HAD KIA75676. | Aspergillus 35 543 Proteína | VEVDDNL | 161a | foDDMD | 267a 1 ustus hipotética ENVTS 165 Tts 270 XP 00182 | Aspergillus 38 477 Proteína | IFVDDQL 167a | fpDDVD 273a
0867.2 oryzae hipotética ENVIS 171 Tts 276 CENG6054 | Aspergillus Fr 528 Proteína | VEVDDNL 161a fpDDLD 267 a 21 calidoustus hipotética DNVT 165 Tts 270 XP 00954 Heterobasid aa | 534 | Proteína |VFVDDKG| 166a |fpFDLDT| 272a
7469.1 : hipotética DNVL 170 ts 275 irregulare ; Proteína KLOO09124 | Schizopora 47 518 | semelhan VFVDDKL | 209a | fpCDLD | 315a A paradoxa DNVI 213 Sts 318 te a HAD OJI95797. | Aspergillus 50 507 proteína | VFIDDSP 163a | FPNDLD | 269a 1 versicolor hipotética ENIL 167 TTS 272
TABELA 2. COMPARAÇÃO DE SEQUÊNCIA EM PARES DAS TERPENO SINTASES BIFUNCIONAIS SUPOSTAS SELECIONADAS. A PORCENTAGEM DE
IDENTIDADE DE SEQUÊNCIA É LISTADA PARA CADA COMPARAÇÃO EM PARES. = = = a = =. =| a 5 == E 8 3 = 8 - 2) 8/8 /8/s 3/8 3 8/3 8/3 3/5 S/s E Êê FF 8/88 Ss õ S 8 3 < 8 2 S 3 8 Ss 8 mia x dó xixi E x 8 | &x| 2 100 71 60 60 60 42 47 46 72 84 45 44 45 44 55 52 45 72 100 60 58 59 43 48 45 85 74 48 43 44 45 55 53 43 61 60 100 88 89 43 47 47 62 62 48 46 44 45 54 53 45 60 59 89 99 100 43 47 47 61 62 47 46 44 46 58 52 46 60 58 88 100 99 43 47 47 60 61 46 45 43 46 57 52 45 42 43 43 43 43 100 54 42 43 44 37 45 41 44 43 39 55 47 48 47 47 47 54 100 44 47 48 41 48 44 49 45 44 56 46 45 47 47 47 42 44 100 46 47 45 46 69 43 47 45 43 73 85 62 60 61 43 47 46 100 77 49 44 45 45 55 52 4 84 74 61 60 61 44 48 48 77 100 48 45 46 46 56 52 46 45 48 47 46 47 37 41 45 48 48 100 42 44 40 49 55 39 44 43 46 45 46 45 48 46 44 43 42 100 46 72 44 45 45 45 44 44 43 44 41 44 69 45 46 44 47 100 47 46 42 41 44 45 45 46 46 44 49 43 45 45 40 72 47 100 48 43 45 54 55 54 53 54 43 45 47 55 55 49 44 46 48 100 54 47 51 53 53 51 52 39 44 45 51 51 55 45 42 44 54 100 44 45 43 45 45 46 55 56 43 44 46 39 45 41 45 47 44 100
EXEMPLO 6
CARACTERIZAÇÃO FUNCIONAL DE OUTRAS SESQUITERPENO SINTASES BIFUNCIONAIS SEMELHANTES À HIDROLASE FÚNGICA.
[00222] Os cDNAs que codificam para as 15 novas supostas sintases descritas no Exemplo 5 foram otimizados por códon e clonados no plasmídeo de expressão E. coli (pJ401, ATUM, Newark, Califórnia). As enzimas foram caracterizadas funcionalmente em células de E. coli projetadas para superproduzir farnesil- difosfato (FPP) seguindo o procedimento descrito no Exemplo 4.
[00223] Entre as 15 novas enzimas recombinantes, 9 produziram (+)-albicanol como produto principal: OCH93767.1, EMD37666.1, EMD37666-B, XP 001217376.1, OJJ98394.1, GAO87501.1 XP 008034151.1, XP 007369631.1 e ACgo006372 (Figuras 7 e 8). Esses resultados confirmam que essas enzimas têm atividades enzimáticas de albicanol sintase bifuncional.
[00224] As outras 6 novas sintases, KIA75676.1, XP 001820867.2, CENG60542.1, XP 009547469.1 e KLOO09124.1 e OJI95797.1, produziram (-)- drimenol como produto principal (Figura 9). Drimenol é produzido por um mecanismo similar à formação de albicanol e que envolve uma atividade enzimática classe || seguida por classe |.
[00225] ParaXP 001820867.2, a formação de uma quantidade significativa de trans-farnesol foi detectada (Figura 9). Provavelmente, isso ocorreu devido à menor atividade enzimática dessa sintase e, portanto, uma quantidade significativa do farnesil-difosfato produzido na célula bacteriana não foi convertida para drimenol. Este excesso de farnesil-difosfato foi hidrolisado pela fosfatase alcalina endógena e o trans-farnesol produzido foi liberado no meio de cultivo.
[00226] Os dois domínios Pfam identificados em CvTps1, isto é, PF13419.5 e PF13242.5 como descrito no Exemplo 3, também são encontrados nessas novas supostas sintases, como mostrado na Tabela 3.
TABELA 3. LOCAIS DO DOMÍNIO HIDROLASE SEMALHANTE A HALOÁCIDO
DESHALOGENASE EM CADA UMA DAS SINTASES BIFUNCIONAIS DESCRITAS NO PRESENTE DOCUMENTO. Compr Início do domínio Fim do domínio de imento Produto de hidrolase hidrolase semelhante semelhante a HAD a HAD OCcH93767.1 Albicano! EMD37666.1 EMD37666-B Albicano! OJJ98394.1 Albicanol GAOB7501.1 ACg006372 | 496 | Abicanol |6o [| 198 | KIAT5676.1 OJI95797 EXEMPLO 7 ENSAIOS IN VITRO.
[00227] Os extratos de proteína bruta que contêm as terpeno sintases recombinantes são preparados com o uso de células KRX E. coli (Promega) ou BL21 Start" (DE3) E. coli (ThermoFisher). Colônias únicas de células transformadas com o plasmídeo de expressão são usadas para inocular 5 ml de meio LB. Após 5 a 6 horas de incubação a 37 º C, as culturas são transferidas para uma incubadora a 25 “ºC e deixadas 1 hora para o equilíbrio. A expressão da proteína é então induzida pela adição de 1 mM de IPTG e as culturas são incubadas durante a noite a 25 º C. No dia seguinte, as células são coletadas por centrifugação, ressuspensas em 0,1 volume de MOPSO 50 mM pH 7 (Ácido 3- morfolino-2-hidroxipropanossulfônico (sigma-Aldrich), glicerol a 10% e lisadas por sonicação. Os extratos são limpos por centrifugação (30 min a 20.000 g), e os sobrenadantes que contêm as proteínas solúveis são usados para experimentos adicionais.
[00228] Esses extratos de proteína de E. coli bruta que contêm a proteína recombinante são usados para a caracterização das atividades enzimáticas. Os ensaios são realizados em tubos de vidro em 2 ml de MOPSO 50 mM, pH 7, glicerol a 10%, DTT 1 mM, MgCI2 15 mM na presença de 80 uM de difosfato de farnesil (FPP, Sigma) e 0,1 a 0,5 mg de proteína bruta. Os tubos são incubados por 12 a 24 horas a 25 ºC e extraídos duas vezes com um volume de pentano. Após concentração sob um fluxo de nitrogênio, os extratos são analisados por GC-MS como descrito no Exemplo 4 e comparados a extratos de ensaios com proteínas de controle. A fase aquosa é então tratada por fosfatase alcalina (Sigma, 6 unidades/ml), seguida por extração com análise de pentano e GC-MS.
[00229] Os ensaios sem tratamento com fosfatase alcalina permitem detectar e identificar os compostos de sesquiterpenos (hidrocarbonetos e sesquiterpenos oxigenados) presentes no ensaio e produzidos pelas enzimas recombinantes. Compostos albicanil-difosfato ou drimenil-difosfato não são solúveis no solvente orgânico e, portanto, não são detectados na análise GC-MS. Após o tratamento com fosfatase alcalina, as ligações de difosfato alílico são clivadas e quando os compostos albicanil-difosfato ou drimenil-difosfato estão presentes, a porção química de sesquiterpeno é liberada, extraída na fase solvente e detectada na análise GC-MS. Esse exemplo permite diferenciar enzimas que têm apenas atividade de terpeno sintase classe || (tal como AstC, registro NCBI XP 001822013.2, Shinohara Y. et al., 2016, Sci Rep. 6, 32865) da enzima que tem atividade semelhante à terpeno sintase classe || e atividade classe | (fosfatase) tal como CvTps1 e LoTps1. EXEMPLO 8. COEXPRESSÃO DE TERPENO SINTASES E FOSFATASES.
[00230] Em Shinohara Y. et al., 2016, Sci Rep. 6, 32865 uma drimane terpeno sintase (AstC, registro NCBI XP 001822013.2) é descrita. Essa sintase produz um sesquiterpeno drimane ligado a uma porção química difosfato. Para produzir um sesquiterpeno drimane livre, a enzima AstC deve ser combinada com enzimas com atividade fosfatase. A publicação também descreve duas fosfatases Astl e AstK (XP 001822007.1 e XP 003189903.1) que catalisam a clivagem sequencial da porção química fosfato do drimane-difosfato produzido por AstC.
[00231] Operons sintéticos foram projetados para coexpressar a proteína CvTps1 com as proteínas Ast! e AstK. O operon sintético contém o cDNA otimizado que codifica para cada uma das 3 proteínas separadas por uma sequência de ligação ao ribossomo (RBS). Um operon similar foi projetado para coexpressar AstC com Astl e AstK. Os operons foram sintetizados e clonados no plasmídeo de expressão pJ401 (ATUM, Newark, Califórnia). Células E coliforam cotransformadas com esses plasmídeos de expressão e com o plasmídeo pACYC-29258-4506 (Exemplo 4) e as células foram cultivadas sob condições para produzir sesquiterpenos como descrito no Exemplo 4. Os sesquiterpenos produzidos foram analisados por GCMS como descrito no Exemplo 4 e comparados ao perfil de sesquiterpenos de expressão de células apenas de CvTps1 ou AstC.
[00232] Como mostrado na Figura 10, com AstC uma quantidade significativamente maior (aumento de 78 vezes) de sesquiterpeno é produzida quando a enzima é coexpressa com enzimas (Astl e AstK) que têm atividade de fosfatase. Concentrações típicas de sesquiterpeno drimane nas culturas de E. coli foram 2'600 mg/ml com células que expressam AstC, Astl e AstK e 34 mg/ml com células que expressam apenas AstC.
[00233] Por outrolado, com CvTps1, não é observada diferença significativa para a quantidade de sesquiterpeno drimane produzido quando a enzima é expressa isoladamente (1'000 mg/ml) ou coexpressa com as fosfatases (1'200 mg/ml). Esse experimento confirma que o polipeptídeo CvTps1, em contraste com a sintase AstC previamente conhecida, carrega atividade fosfatase além da atividade ciclase (isto é, atividade terpeno sintase classe | e classe |l). EXEMPLO 9 CARACTERIZAÇÃO FUNCIONAL DE XP 006461126.1.
[00234] O registo NCBI nº XP 0O06461126.1 de Agaricus bisporus foi selecionado com o uso do método descrito no Exemplo 5. O aminoácido XPOO6461126.1 (SEQ ID NO: 63) compartilhou 48,9% e 48.1% de identidade com as sequências de aminoácidos CvTpsi e LoTps1, respectivamente. O
XP 006461126.1 contém um motivo semelhante a terpeno sintase de classe || (DLDT) (parte da SEQ ID NO: 56) localizado entre as posições 278 e 271 e um motivo semelhante a terpeno sintase classe | (DDKLE) (parte da SEQ ID NO: 55) localizado na posição 167 a 171. O aminoácido contém também motivos característicos da superfamília da hidrolase semelhante a Haloácido deshalogenase na região N-terminal.
[00235] O cDNA que codifica para XP 006461126.1 foi otimizado por códon e clonado no plasmídeo de expressão pJ401 E. coli (pJ401, ATUM, Newark, Califórnia). A enzima foi caracterizada funcionalmente em células de E. coli manipuladas para superproduzir farnesil-difosfato (FPP) seguindo o procedimento descrito no Exemplo 4. Os resultados mostram que XP 006461126.1 é uma drimenol sintase bifuncional que produz drimenol como composto principal (Figura 11). EXEMPLO 10.
PRODUÇÃO IN VIVO DE SESQUITERPENOS DE DRIMANE EM CÉLULAS DE SACCHAROMYCES CEREVISIAE USANDO SESQUITERPENOS BIFUNCIONAIS DO TIPO HIDROLASE FÚNGICA-SINTASES.
[00236] Diferentes sesquiterpeno sintases bifuncionais semelhantes à hidrolase foram avaliadas para a produção de sesquiterpenos drimane em células de S. cerevisiae. As sintases selecionadas foram: XP 007369631.1, registro NCBI nº XP 007369631.1, de Dichomitus squalens XP 006461126, registro NCBI nº XP 006461126, de Agaricus bisporus LoTps1, SEQ ID NO: 5, de Laricifomes officinalis EMD37666.1, registo NCBI nº EMD37666.1, de Gelatoporia subvermispora XP 001217376.1, registro NCBI nº XP 001217376.1, de Aspergillus terreus
[00237] O uso de códons do cDNA que codifica para as diferentes sintases foi modificado para expressão ótima em S. cerevisiae (SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70).
[00238] Para expressão dos genes diferentes em S. cerevisiae, um conjunto de plasmídeos foi construído in vivo com o uso de recombinação homóloga endógena de levedura, como descrito anteriormente em Kuijpers et al., Microb Cell Fact, 2013, 12:47. Cada plasmídeo é composto por cinco fragmentos de DNA que foram usados para a cotransformação de S. cerevisiae. Os fragmentos foram: Fragmento a: Marcador de levedura LEU2, construído por PCR com o uso dos iniciadores 5-
AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGTCGTACC GCGCCATTCGACTACGTCGTAAGGCC-3' &É—(SEQ I|D NO: 71) e 5-
TCGTGGTCAAGGCGTGCAATTCTCAACACGAGAGTGATTCTTCGGCGTTGTT GCTGACCATCGACGGTCGAGGAGAACTT -3' (SEQ ID NO: 72) com o plasmídeo pESC-LEU (Agilent Technologies, Califórnia, EUA) como modelo; Fragmento b: Marcador AmpR E. coli, construído por PCR com o uso dos iniciadores 5-
TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCACGCCTT GACCACGACACGTTAAGGGATTTTGGTCATGAG-3' (SEQ ID NO: 73) e 5-
AACGCGTACCCTAAGTACGGCACCACAGTGACTATGCAGTCCGCACTTTGCC AATGCCAAAAATGTGCGCGGAACCCCTA-3' (SEQ ID NO: 74) com o plasmídeo pESC-URA como modelo; Fragmento c: Levedura origem de replicação, obtida por PCR com o uso dos iniciadores 5-
TTGGCATTGGCAAAGTGCGGACTGCATAGTCACTGTGGTGCCGTACTTAGGG TACGCGTTCCTGAACGAAGCATCTGTGCTTCA-3' (SEQ ID NO: 75) e 5-
CCGAGATGCCAAAGGATAGGTGCTATGTTGATGACTACGACACAGAACTGCG GGTGACATAATGATAGCATTGAAGGATGAGACT-3' (SEQ ID NO: 76) com pESC- URA como modelo; Fragmento d: Origem de replicação de E. coli, obtida por PCR com o uso dos iniciadores 5-
ATGTCACCCGCAGTTCTGTGTCGTAGTCATCAACATAGCACCTATCCTTTGGCA TCTCGGTGAGCAAAAGGCCAGCAAAAGG-3' (SEQ I|D NO: 77) e 5-
CTCAGATGTACGGTGATCGCCACCATGTGACGGAAGCTATCCTGACAGTGTAG CAAGTGCTGAGCGTCAGACCCCGTAGAA-3' (SEQ ID NO: 78) com o plasmídeo pESC-URA como modelo e
Fragmento e: Um fragmento composto pelos últimos 60 nucleotídeos do fragmento “d”, 200 nucleotídeos a jusante do códon de parada do gene de levedura PGKT1, uma das sequências de codificação da sesquiterpeno sintase bifuncional semelhante à hidrolase testadas, otimizado por códon para sua expressão em S. cerevisiae, o promotor de GAL1 e 60 nucleotídeos que correspondem ao início do fragmento “a”. Esses fragmentos foram obtidos por síntese de DNA (ATUM, Newark, Califórnia).
[00239] Para aumentar o nível de agregado de farnesil-difosfato endógeno (FPP) em de S. cerevisiae, uma cópia extra de todos os genes endógenos de levedura envolvidos na via do mevalonato, da codificação ERG10 para a acetil-CoA C- acetiltransferase para codificar ERG20 para a sintetase de FPP, foram integrados no genoma da cepa S. cerevisiae CEN.PK2-1C (Euroscarf, Frankfurt, Alemanha) sob o controle de promotores induzíveis por galactose, da mesma forma que descrito em Paddon et a/., Nature, 2013, 496:528 a 532 Resumidamente, três cassetes foram integrados nos locais LEU2, TRP1 e URA3, respectivamente. Um primeiro cassete contendo os genes ERG20 e um HMG71 truncado (tHMG1, conforme descrito em Donald et al., Proc Natl Acad Sci EUA, 1997, 109: E111-8) sob o controle do promotor bidirecional de GAL10/GAL1 e dos genes ERG19 e ERG13 também sob o controle do promotor GAL10/GAL1, o cassete foi flanqueado por duas regiões de 100 nucleotídeos que correspondem às seções a montante e a jusante de LEU2. Um segundo cassete em que os genes /DI1 e tHMG1 estavam sob o controle do promotor GAL10/GAL1 e o gene ERG13 sob o controle da região promotora de GAL7, o cassete foi flanqueado por duas regiões de 100 nucleotídeos que correspondem às seções a montante e a jusante de TRP1. Um terceiro cassete com os genes ERG10, ERG12, tHMG1 e ERGB8, todos sob o controle de promotores GAL10/GAL1, o cassete foi flanqueado por duas regiões de 100 nucleotídeos que correspondem às seções a montante e a jusante de URA3. Todos os genes nos três cassetes incluíam 200 nucleotídeos de suas próprias regiões terminadoras. Além disso, uma cópia extra de GAL4 sob o controle de uma versão mutada de seu próprio promotor, como descrito em Griggs e Johnston, Proc Natl Acad Sci EUA, 1991, 88:8597 a 8601, foi integrada a montante da região promotora de ERG9. Além disso, o promotor endógeno de ERG9 foi substituído pela região promotora de levedura de CTR3 gerando a cepa YSTO35. Por fim, YSTO35 foi correspondido com a cepa CEN.PK2-1D (Euroscarf, Frankfurt, Alemanha) obtendo uma cepa diplóide denominada YSTO45.
[00240] YSTO45 foi transformada com os fragmentos exigidos para montagem de plasmídeo in vivo. As transformações de leveduras foram realizadas com o protocolo de acetato de lítio, como descrito em Gietz e Woods, Methods Enzymol., 2002, 350:87 a 96. As misturas de transformação foram transferidas para placas em meio SmLeu contendo 6,7 g/l de Base de Nitrogênio de Levedura sem aminoácidos (BD Difco, Nova Jersey, EUA), 1.6 g/l de suplemento Dropout sem leucina (Sigma Aldrich, Missouri, EUA), 20 g/l de glicose e 20 g/Il de ágar. As placas foram incubadas por 3 a 4 dias a 30 ºC. Colônias individuais foram usadas para produzir sesquiterpenos drimanes em tubos ou balões de agitação contendo meios, como descrito em Westfall et al., Proc Natl Acad Sci EUA, 2012, 109:E111 a 118 e óleo mineral ((2705-01, J.T. Baker, Avantor Performance Materials, Inc. Center Valley, PA, EUA) como sobreposição orgânica.
[00241] Sob essas condições de cultura, o albicanol ou o drimenol foram produzidos com todas as sesquiterpeno sintases bifuncionais semelhantes à hidrolase testadas. A produção de sesquiterpenos drimane foi identificada com o uso de análise GC-MS e quantificada por GC-FID (consultar a Figura 12) com um padrão interno. A tabela abaixo mostra as quantidades de sesquiterpeno drimane produzidas em relação à quantidade obtida pela sintase XP 007369631.1 (sob essas condições experimentais, a concentração de sesquiterpeno drimane produzido por células que expressam XP 007369631.1 foi 805 a 854 mg/l, a maior quantidade produzida).
oe | ee | SITES | Produto sesquiterpeno drimane produzido
LISTAGENS DE SEQUÊNCIAS CvTps1 SEQ ID NO: 1 - Proteína CvTps1
MTTIHRRHTTLILDLGDVLFRWSPKTETAIPPRQLKEILTSVTWFEYER GQISQTECYERCAAEFKVDPLVIAEAFKQARESLRPNKAFIALIRELRHQMHGDLT VLALSNISLPDYEYIMSLSSDWATVFNRVFPSALVGERKPHLGCYRKVISEMSLEP QTTVFVDDKLDNVASARSLGMHGIVFDNEANVFRQLRNIFGNPVYSRGQGYLRKH AGKLESSTDNGLTFEENFTQLIIYEVTQDRSLITLSECPRTWNFFRGQPLFSESFP DDVDTTSVALTVLQPDRALVDSILDQMLEYVDADGIMQTYFDSSRPRIDPFVCVN VLSLFYANGRGRELPHTLEWVYEVLLHRAYHGGSRYYLSPDCFLFFMSRLLKRA NDSALQARFRPLFMERVKERVGAAGDSMDLAFRILAAATIGVHCPQDLERLAAA QCEDGGWDMCWFYAFGSTGIKAGNRGLTTALAVAAIRTALGRPPSPSPSNISSSS
KLDAPNSFLGIPRPTSPIRFGELFRSWRKNKPTAKSQ SEQ ID NO: 2 - transcrição CvTps1 (incluindo sequências não codificantes)
CATCCCGCCTTTTGAGCATGGCACACAAACAGCCTTTAAGGAGCTC CTTGGTTGCCTAGTCATGCCTCCACCTGCCCCCTCCTCACTCATCCCCOTCGCA
TCCTAAAACATGACCACGATTCACCGTCGGCACACCACTCTCATCTTGGACCT CGGCGACGTCCTCTTCCGCTGGTCACCAAAGACCGAGACCGCCATCCCCCCc
TCGGCAGCTTAAGGAGATACTTACCTCCGTCACCTGGTTCGAGTACGAACGA GGCCAGATATCCCAAACAGAATGTTACGAACGATGCGCTGCAGAATTCAAAGT CGACCCCTTAGTGATCGCTGAAGCCTTCAAGCAAGCTCGCGAGTCATTACGG CCCAACAAAGCGTTCATCGCCTTGATTCGCGAACTTCGCCATCAAATGCATGG AGACCTCACGGTCCTCGCCCTTTCCAACATTTCCCTCCCCGATTACGAATATAT CATGTCTCTGAGCTCGGATTGGGCAACCGTCTTCAATCGCGTATTCCCOTTCTG CACTTGTTGGCGAGCGAAAACCCCATCTGGGGTGCTACCGCAAGGTCATTTC GGAGATGAGCTTGGAACCCCAGACAACCGTATTTGTCGATGATAAGCTAGACA ACGTCGCCTCTGCTCGCTCACTTGGCATGCACGGCATCGTATTCGACAACGA AGCCAATGTCTTCCGGCAACTGCGCAATATCTTCGGGAATCCGGTTAGCCGC GGTCAAGGCTATCTTCGCAAGCATGCCGGAAAGCTTGAGTCTTCTACCGACAA TGGCTTGACCTTTGAGGAGAACTTCACCCAGCTCATCATCTACGAGGTGACAC AAGACAGGAGTCTCATCACGCTCTCAGAATGTCCCCGTACCTGGAATTTCTTT CGAGGTCAACCGCTCTTCTCGGAGTCTTTCCCGGATGATGTGGACACAACAT CCGTGGCATTGACAGTACTACAACCCGATAGAGCGCTCGTTGATTCTATTCTAG ACCAAATGCTTGAATATGTTGACGCCGACGGCATCATGCAGACATACTTCGAC AGCTCGCGACCACGCATAGACCCTTTTGTTTGCGTCAATGTGCTTTCTCTGTT CTACGCAAACGGCCGGGGTCGGGAGCTCCCTCACACACTGGAGTGGGTCTA TGAAGTACTCCTGCATCGCGCCTACCATGGAGGCTCACGTTACTACCTATCAC CGGACTGCTTTTTATTCTTCATGAGCCGCTTGCTCAAGCGCGCCAACGACTCG GCCCTCCAGGCTCGGTTCCGCCCACTGTTCATGGAGAGAGTGAAAGAACGA GTAGGGGCAGCCGGAGACTCAATGGACCTGGCCTTCCGCATCCTCGCCGCG GCTACCATTGGCGTCCATTGCCCCCAAGATCTAGAAAGATTGGCCGCCGCGC AATGCGAGGACGGTGGATGGGACATGTGCTGGTTCTACGCGTTCGGGTCGAC
AGGTATCAAGGCGGGCAACCGCGGCCTCACCACGGCCCTTGCCGTCGCAGC TATACGAACCGCCCTCGGGCGCCCCccoTtoTtcccCAGCCCCTCCAACATCOTCG
TCGTCGTCGAAGCTCGACGCTCCCAACAGCTTCTTGGGCATCCCGCGCCCAA CCAGCCCCATTCEGCTTTGGCGAACTTTTCCGTTCCTGGCGAAAGAACAAACC GACCGCAAAATCTCAATGAATCTCAGGTTCTCGTGCTCTCGTGCTATCTTCGTA CTTATGCTACTCGACATTACCCGTCGCTGTCTACAATGATACGGGTACTTTGAT GAAACTGTAGATGTATTTGTATCATATTGACCTCCATCCATAGTCACCTAGCTAC TGTTCGTGTTATCACCTGTTGCTGTTATATGATACAAGATGCCCAAACGAGAAT GTAGAAATGTTCCGTACACTTGTGTACCTGTGATGAAGCTACATAGGCCTTCAA
TCGATCACTTGGTCC SEQ ID NO: 3 - cCDONA de CvTps1
ATGACCACGATTCACCGTCGGCACACCACTCTCATCTTGGACCTCG GCGACGTCCTCTTCCGCTGGTCACCAAAGACCGAGACCGCCATCCCCceTe
GGCAGCTTAAGGAGATACTTACCTCCGTCACCTGGTTCGAGTACGAACGAGG CCAGATATCCCAAACAGAATGTTACGAACGATGCGCTGCAGAATTCAAAGTCG ACCCCTTAGTGATCGCTGAAGCCTTCAAGCAAGCTCGCGAGTCATTACGGCC CAACAAAGCGTTCATCGCCTTGATTCGCGAACTTCGCCATCAAATGCATGGAG ACCTCACGGTCCTCGCCCTTTCCAACATTTCCCTCCCCGATTACGAATATATCA TGTCTCTGAGCTCGGATTGGGCAACCGTCTTCAATCGCGTATTCCCTTCTGCA CTTGTTGGCGAGCGAAAACCCCATCTGGGGTGCTACCGCAAGGTCATTTCGG AGATGAGCTTGGAACCCCAGACAACCGTATTTGTCGATGATAAGCTAGACAAC GTCGCCTCTGCTCGCTCACTTGGCATGCACGGCATCGTATTCGACAACGAAG CCAATGTCTTCCGGCAACTGCGCAATATCTTCEGGGAATCCGGTTAGCCGCGGT CAAGGCTATCTTCGCAAGCATGCCGGAAAGCTTGAGTCTTCTACCGACAATGG CTTGACCTTTGAGGAGAACTTCACCCAGCTCATCATCTACGAGGTGACACAAG ACAGGAGTCTCATCACGCTCTCAGAATGTCCCCGTACCTGGAATTTCTTTCGA GGTCAACCGCTCTTCTCGGAGTCTTTCCCGGATGATGTGGACACAACATCCG TGGCATTGACAGTACTACAACCCGATAGAGCGCTCGTTGATTCTATTCTAGACC AAATGCTTGAATATGTTGACGCCGACGGCATCATGCAGACATACTTCGACAGC TCGCGACCACGCATAGACCCTTTTGTTTGCGTCAATGTGCTTTCTCTGTTCTAC GCAAACGGCCGGGGTCGGGAGCTCCCTCACACACTGGAGTGGGTCTATGAA GTACTCCTGCATCGCGCCTACCATGGAGGCTCACGTTACTACCTATCACCGGA CTGCTTTTTATTCTTCATGAGCCGCTTGCTCAAGCGCGCCAACGACTCGGCCC TCCAGGCTCGGTTCCGCCCACTGTTCATGGAGAGAGTGAAAGAACGAGTAGG GGCAGCCGGAGACTCAATGGACCTGGCCTTCCGCATCCTCGCCGCGGCTAC CATTGGCGTCCATTGCCCCCAAGATCTAGAAAGATTGGCCGCCGCGCAATGC GAGGACGGTGGATGGGACATGTGCTGGTTCTACGCGTTCGGGTCGACAGGT
ATCAAGGCGGGCAACCGCGGCCTCACCACGGCCCTTGCCGTCGCAGCTATA CGAACCGCCCTCGGGCGCCCocceTtoetoccAGCCCCOTCCAACATCTCOGTCG
TCGTCGAAGCTCGACGCTCCCAACAGCTTCTTGGGCATCCCGCGCCCAACCA GCCCCATTCGCTTTGGCGAACTTTTCCGTTCCTGGCGAAAGAACAAACCGAC
CGCAAAATCTCAATGA SEQ ID NO: 4 - cDNA otimizado CvTps1
ATGACTACGATCCACCGCCGCCATACTACGCTGATCCTGGACCTGG GTGATGTTCTGTTCCGCTGGTCCCCGAAAACCGAAACCGCAATTCCGCCTCG TCAGCTGAAAGAAATCTTGACCAGCGTTACCTGGTTCGAGTATGAGCGTGGC CAAATTAGCCAGACCGAATGCTACGAGCGTTGTGCTGCCGAGTTTAAAGTTGA TCCGCTGGTTATTGCCGAAGCGTTTAAACAAGCGCGTGAAAGCCTGCGTCCG AACAAAGCGTTTATCGCGTTGATCCGTGAGTTGCGCCACCAGATGCATGGTGA CCTGACGGTCCTGGCACTGAGCAACATTAGCCTGCCTGATTATGAGTACATTAT GTCGCTGAGCTCCGATTGGGCGACGGTCTTTAATCEGCGTGTTTCCGAGCGCA CTGGTGGGTGAGCGTAAGCCACACCTGGGTTGCTACCGCAAGGTCATCAGC GAGATGTCTCTGGAGCCGCAGACCACGGTTTTCGTCGATGACAAACTGGACA ATGTCGCAAGCGCTCGTAGCCTGGGCATGCATGGCATCGTGTTCGACAACGA AGCGAACGTTTTTCGTCAGCTGCGTAATATCTTOGGTAACCCGGTTAGCCGCG GTCAAGGTTACTTGCGTAAACACGCCGGTAAACTGGAATCTAGCACGGATAAT GGTCTGACCTTCGAAGAGAACTTCACTCAATTAATTATTTACGAAGTCACGCAA GACCGCAGCCTGATCACCCTGAGCGAGTGCCCGCGTACCTGGAACTTCTTCC GCGGTCAACCACTGTTTTCTGAGAGCTTTCCGGACGACGTGGACACCACCTC TGTGGCGTTGACCGTTCTGCAGCCGGATCGTGCGTTGGTGGATAGCATCCTG GACCAGATGTTGGAATATGTTGACGCGGATGGTATTATGCAAACCTACTTTGAT TCATCCCGTCCGCGCATTGACCCGTTCGTGTGCGTGAATGTCCTGAGCCTGT TCTACGCCAATGGCAGAGGCCGCGAGCTGCCACACACGCTGGAATGGGTCTA TGAAGTTCTGCTGCACCGTGCGTACCACGGCGGTAGCCGTTATTACCTGAGC CCGGACTGTTTCCTGTTCTTTATGAGCCGTCTGCTGAAGCGCGCGAATGACTC GGCGCTGCAGGCCCGTTTTCEGCCCGCTTTTCATGGAACGTGTGAAAGAGCGT GTGGGCGCAGCCGGCGATAGCATGGACCTGGCGTTCCGCATTCTGGCCGCT GCAACCATCGGCGTTCATTGCCCACAAGATCTGGAGCGTCTGGCAGCAGCGC AGTGCGAAGATGGTGGCTGGGATATGTGTTGGTTTTATGCGTTTGGCAGCACG
GGTATCAAGGCTGGCAACCGCGGTCTGACCACCGCGTTGGCTGTCGCCGCA ATTCGTACCGCGCTGGGTCGTCCGCCTTCCCoGAGCCCOGAGCAATATTTCTA
GCTCCAGCAAACTGGACGCGCCGAACTCCTTCCTGGGCATCCCGCGTCCGA CCAGCCCGATCCGTTTCGGTGAACTGTTTCGTAGCTGGCGTAAGAACAAGCC GACCGCGAAAAGCCAGTAA
LoTps1 SEQ ID NO: 5 - proteína LoTps1
MYTALILDLGDVLFSWSSTTNTTIPPRQLKEILSSPAWFEYERGRITOA ECYERVSAEFSLDATAVAEAFRQOARDSLRPNDKFLTLIRELRQQSHGELTVLALSN ISLPDYEFIMALDSKWTSVFDRVFPSALVGERKPHLGAFRQVLSEMNLDPHTTVF VDDKLDNVVSARSLGMHGVVFDSQDNVFRMLRNIFGDPIHRGRDYLRQHAGRL ETSTDAGVVFEENFTQLIIYELTNDKSLITTSNCARTWNFFRGKPLFSASFPDDMD TTSVALTVLRLDHALVNSVLDEMLKYVDADGIMQTYFDHTRPRMDPFVCVNVLSL FHEQGRGHELPNTLEWVHEVLLHRAYIGGSRYYLSADCFLFFMSRLLQRITDPSV
LGRFRPLFIERVRERVGATGDSIDLAFRIIAASTVGIQCPRDLESLLAAQCEDGGW DLCWFYQYGSTGVKAGNRGLTTALAIKAIDSAIlARPPSPALSVASSSKSEIPKPIQR
SLRPLSPRRFGGFLMPWRRSQRNGVAVSS SEQ ID NO: 6 - Transcrição LoTps1i (incluindo sequência não codificante)
GCGTCTGCTGCGGTCTCTCACCGCGCCGAGCGACGGGAAGCGGA GGCTTTTTGATGCAGCCAGCTCAGCGCCATCCTCTCACGCAGGGGGTTTGAT CCAGATCTGATCGCCTCCGGGTTCTCATCETAGAACGCACGGCGGCTCCCAGG AAGTTCTATCGACCCTCTGCGCGCTEGTCGGCGGCACGATGTGGCTACACCA
GTCCCAATCATATCETCACACCCAGCACCATCATCTCEGGGCCTCTTCGTCATGTA ACCCTCCCAAGCCTATTTTTCAGGGCGTTCCCcoTcACCGGCGCGCTTCTTAA
AGAATCCCGAAATGTATACGGCTCTTATCCTTGACCTCGGCGACGTTCTGTTCT CTTGGTCGTCGACGACCAACACGACTATTCCCCCTCGGCAGCTAAAGGAGAT CCTCTCATCTCCTGCCTGGTTTGAGTACGAGCGTGGTCGCATAACGCAAGCC GAATGCTACGAGCGTGTCAGCGCCGAGTTCAGCCTAGACGCCACCGCCGTC GCGGAAGCATTCCGGCAAGCTCGCGACTCCTTGCGCCCGAACGACAAGTTC CTCACGTTAATTCGCGAGCTTCGACAACAATCTCATGGGGAGCTCACGGTGCT TGCGCTGTCCAACATATCCCTTCCCGACTATGAATTCATCATGGCCCTCGACTC GAAGTGGACTTCTGTCTTTGACCGCGTCTTCCCTTCTGCCCTCGTGGGCGAA CGGAAGCCACACCTTGGAGCGTTTCGCCAGGTTCTGTCCGAGATGAATCTTG ACCCGCACACAACTGTGTTCGTCGATGACAAGCTGGACAATGTCGTCTCCGC ACGGTCCCTCGGGATGCACGGCGTCGTGTTCGACTCCCAAGACAATGTCOTTT CGGATGCTGAGAAACATCTTTGGCGATCCCATTCATCEGGGGACGTGACTATCT CCGACAGCACGCCGGACGTCTGGAGACCTCCACGGATGCCGGTEGTGGTCTT CGAAGAGAATTTCACGCAACTCATCATCTACGAACTGACGAATGACAAGTCTC TCATCACGACATCAAACTGTGCTCGTACTTGGAATTTCTTTCGTGGGAAGCCT TTGTTCTCAGCATCGTTCCCTGACGACATGGACACGACCTCGGTTGCCTTGA CTGTATTACGTTTAGACCACGCCCTCGTGAACTCGGTTTTGGACGAGATGCTA AAGTATGTCGACGCAGACGGCATCATGCAGACCTACTTCGACCATACACGCCC ACGCATGGATCCATTTGTCTGCGTCAATGTGCTCTCGTTGTTTCACGAACAAG GTCGTGGCCACGAGCTTCCGAACACCCTCGAATGGGTCCATGAGGTCCTCCT CCACCGCGCGTACATEGGGGGCTCGCGGTACTACCTCTCCGCGGACTGCTT CCTCTTTTTCATGAGCCGCCTCCTGCAGCGCATCACCGACCCGTCCOGTCCTT GGCCGCTTCCGTCCACTATTCATAGAGCGCGTTCGGGAGCGTGTAGETGCGA CCGGGGACTCCATCGATCTCGCATTCCGCATCATOEGCCGCGTCCACAGTAGG CATCCAGTGTCCACGCGACTTGGAAAGTCTCCTCGCCGCACAGTGTGAAGAC GGTGGCTGGGACCTGTGCTGGTTCTACCAGTACGGATCGACCGGTGTCAAG GCGGGCAACCGCGGGCTCACCACCGCTCTGGCGATCAAAGCTATTGACTCC
GCCATTGCGAGGCCACCTTCGCCTGCCCTCTCAGTCGCTTCGTCGTCCAAAT CGGAGATACCGAAACCCATACAACGGTCCCTTAGGCCCCTTAGCCCCCGCoG6
GTTTGGCGGTTTCCTGATGCCGTGGCGCAGGTCACAGCGCAATGGCGTGGC GGTCTCTAGTTGAACACTTGACCCTTGACACTTCGCTTTGCACTGCCTGCTCC CCTGCCAATCCTCCCCTACGATCGTATCATCCOTCTCTTGCCCOTCGCCTCCCC CTCGTACCCCCTCTCATGGGGTGCCATTTGTAGATATGTACGTAGCGTGATGTA GCGGTACTCGGATCGTTCTCGTACTCGTCTTGCTCTGCCGTCGCTTCCAGCC CGTGCTGTTCTCTCGTTCAGGCTATTCGTTGGTTACGCGTATATCGTAATAGAC CGCCCCGGTTCCTCEGCCTACAGACACTCGCCEGTCTCGCCACGGACTCGGC TACGGATTCAGACTACATGAGTGGCAGTTATCACACGCAGATCCCTCCTTGGT
CGTTCTGTAGTACCCACATATGTAATTGTACCAGTCCACTGTTGCAGATC SEQ ID NO: 7 - CONA de LoTps1
ATGTATACGGCTCTTATCCTTGACCTCGGCGACGTTCTGTTCTCTTG GTCGTCGACGACCAACACGACTATTCCCCCTCGGCAGCTAAAGGAGATCCTC TCATCTCCTGCCTGGTTTGAGTACGAGCGTGGTCGCATAACGCAAGCCGAAT GCTACGAGCGTGTCAGCGCCGAGTTCAGCCTAGACGCCACCGCCGTCGCEGG AAGCATTCCGGCAAGCTCGCGACTCCTTGCGCCCGAACGACAAGTTCCTCAC GTTAATTCGCGAGCTTCGACAACAATCTCATGGGGAGCTCACGGTGCTTGCG CTGTCCAACATATCCCTTCCCGACTATGAATTCATCATGGCCCTCGACTCGAAG TGGACTTCTGTCTTTGACCGCGTCTTCCCTTCTGCCCTCGTGGGCGAACGGA AGCCACACCTTGGAGCGTTTCGCCAGGTTCTGTCCGAGATGAATCTTGACCC GCACACAACTGTGTTCGTCGATGACAAGCTGGACAATGTCGTCTCCGCACGG TCCCTCGGGATGCACGGCGTCGTGTTCGACTCCCAAGACAATGTCTTTCGGA TGCTGAGAAACATCTTTGGCGATCCCATTCATCEGGGGACGTGACTATCTCCGA CAGCACGCCGGACGTCTGGAGACCTCCACGGATGCCGGTGTGGTCTTCGAA GAGAATTTCACGCAACTCATCATCTACGAACTGACGAATGACAAGTCTCTCATC ACGACATCAAACTGTGCTCGTACTTGGAATTTCTTTCGTGGGAAGCCTTTGTT CTCAGCATCGTTCCCTGACGACATGGACACGACCTCGGTTGCCTTGACTGTAT TACGTTTAGACCACGCCCTCGTGAACTCGGTTTTGGACGAGATGCTAAAGTAT GTCGACGCAGACGGCATCATGCAGACCTACTTCGACCATACACGCCCACGCA TGGATCCATTTGTCTGCGTCAATGTGCTCTCGTTGTTTCACGAACAAGGTCGT
GGCCACGAGCTTCCGAACACCCTCGAATGGGTCCATGAGGTCCTCCTCCACC GCGCGTACATCEGGGGGCTCGCGGTACTACCTCTCoGCGGACTGCTTCCTCTT
TTTCATGAGCCGCCTCCTGCAGCGCATCACCGACCCGTCCGTCCTTGGCCGC TTCCGTCCACTATTCATAGAGCGCGTTCGGGAGCGTGTAGGTGCGACCGGGG ACTCCATCGATCTCGCATTCCGCATCATOEGCCGCGTCCACAGTAGGCATCCAG TGTCCACGCGACTTGGAAAGTCTCCTCGCCGCACAGTGTGAAGACGGTGGC TGGGACCTGTGCTGGTTCTACCAGTACGGATCGACCGGTGTCAAGGCGGGC AACCGCGGGCTCACCACCGCTCTGGCGATCAAAGCTATTGACTCCGCCATTG CGAGGCCACCTTCGCCTGCCCTCTCAGTCGCTTCGTCGTCCAAATCGGAGAT ACCGAAACCCATACAACGGTCCCTTAGGCCCCTTAGCCCCCGCEGGTTTGGC GGTTTCCTGATGCCGTGGCGCAGGTCACAGCGCAATGGCGTGGCGGTCTCT
AGTTGA SEQ ID NO: 8 - cCDNA otimizado LoTps1
ATGTACACGGCGCTGATTTTGGATTTGGGTGATGTTCTGTTTAGCTG GAGCTCAACGACTAACACCACCATTCCGCCGCGTCAGCTGAAAGAAATCTTG AGCTCCCCGGCGTGGTTCGAGTACGAGCGTGGCCGTATCACCCAGGCAGAG TGTTATGAGCGTGTCAGCGCAGAGTTTAGCCTGGATGCGACGGCCGTGGCTG AGGCTTTTCGTCAGGCACGTGATAGCCTGCGTCCGAACGACAAATTTCTGAC CCTGATCCGTGAGCTGCGTCAACAGAGCCACGGTGAATTGACCGTTCTGGCC TTGTCTAACATCAGCCTGCCGGATTACGAATTTATTATGGCACTGGACTCGAAG TGGACCAGCGTGTTTGATCGTGTGTTCCCGAGCGCCCTEGTGGGCGAACEC AAGCCGCACCTGGGCGCGTTCCGCCAAGTCCTGTCCGAGATGAATTTGGACC CGCATACCACCGTTTTTGTGGACGACAAACTGGACAATGTTGTCAGCGCACG CAGCCTGGGTATGCACGGTGTCGTGTTCGACAGCCAAGACAATGTTTTTCGTA TGCTGCGTAACATTTTCGGTGACCCAATTCACCGCGGTCGTGACTATCTGCGC CAGCACGCTGGTCGTCTTGAAACGTCCACCGATGCGGGCGTTGTGTTCGAAG AGAACTTCACCCAACTGATCATTTACGAACTGACCAACGATAAGAGCCTGATC ACCACCTCTAATTGCGCCCGCACCTGGAACTTCTTCCGCGGCAAACCTCTGT TCTCCGCGAGCTTTCCGGACGATATGGACACTACGTCGGTAGCGCTGACCGT GCTGCGTCTGGACCATGCGCTGGTGAATAGCGTTCTGGATGAAATGCTGAAAT ACGTCGATGCTGACGGTATTATGCAGACCTACTTTGATCATACGCGTCCTCGTA TGGACCCGTTCGTTTGCGTCAATGTGCTGAGCCTGTTTCACGAGCAAGGTCG CGGTCATGAACTGCCGAATACGCTGGAATGGGTGCATGAAGTCCTGCTGCAC CGTGCGTATATCEGGTGGCAGCCGCTATTATOETGAGCGCGGATTGTTTCCOTGTT CTTTATGAGCCGTCTGTTGCAACGTATTACCGACCCGAGCGTTTTAGGTAGATT TCGCCCGCTGTTCATEGAGCGTGTTCEGCGAGCGCGTTEGCGCGACTGGCGA CAGCATCGACCTGGCATTCCGTATCATOEGCGGCCAGCACGGTCGGCATTCAA TGCCCGCGTGACCTGGAGTCTCTGCTGGCAGCACAGTGCGAAGATGGTGGC TGGGATCTGTGTTGGTTTTACCAGTACGGCAGCACGGGTGTTAAGGCCGGTA
ACCGTGGTCTGACCACGGCGTTGGCGATCAAAGCGATTGACAGCGCCATCGC GCGTCCGCCAAGCCCGGCCeTETCEGTTGCAAGCTCCAGCAAGAGCGAGAT TCCGAAGCCGATTCAGCGTAGCCTCCGCCeGTTGAGCCCGCGTCGCTTCGG
TGGCTTCCTGATGCCGTGGCGTCGTAGCCAACGCAATGGTGTCGCGGTGAG
CTCTTAA OcH93767.1 SEQ ID NO: 9 - proteína OCH93767.1
MSAAVRYTTLILDLGDVLFTWSPKTKTSISPRILKEILNSATWYEYERGS ITAQHECYERVGVEFGIAPSEIHNAFKQARDSMESNDELIALVRELKEQSDGELLVF ALSNISLPDYEYVLTKPADWSIFDKVFPSALVGERKPHLGIYKHVIAETGVDPRTTV FVDDKIDNVLSARSLGMHGIVFDKHEDVMRALRNIFGDPVRRGREYLRRNARKL ESITDHGVAFGENFTQLLILELTSDASLVTLPDRPRTWNFFRGKPLFSEAFPDDLD TTSLALTVLKRDAATVSSVMDEMLKYRDADGIMQTYFDNGRQRLDPFVNANVLTL FYANGRGHELDOSLSWVREVLLYRAYLGGSRYYPSADCFLYFISRLFACTSDPVL HHQLKPLFVERVHERIGVQGDALELAFRLLVCASFNISNQPDMRKLLEMQCQDG GWDGGNLYRFGTTGLKVTNRGLTTAAAVOQAIEATALRPPSPAFSVESPKSPVTPV
TPMLEIPALGLSISRPSSPLLGYFKLPWKKSAEVH SEQ ID NO: 10 - CONA OCH93767.1
ATGTCCGCAGCAGTTCGGTACACGACCCTCATCCTCGACCTTGGC GACGTCTTGTTCACTTGGTCACCGAAGACGAAGACCAGCATCTCGCCTCGTAT TCTGAAGGAGATCCTGAATTCCGCGACCTGGTATGAGTACGAGCGCGGTAGT ATCACTCAGCACGAATGTTACGAACGCGTTGGCGTGGAGTTCGGTATTGCGC CGAGCGAGATCCACAACGCGTTCAAGCAGGCTCGGGACTCTATGGAGTCGAA TGACGAGCTGATCGCCCTTGTTCGGGAACTGAAGGAGCAGTCAGATGGAGA GCTTCTCGTCTTCGCATTATOEGAACATCTCACTGCCGGACTACGAATACGTCCT GACGAAGCCCGCGGACTGGTCCATCTTCGACAAAGTCTTTCCTTCCGCTCTC GTCGGCGAGCGCAAGCCCCATCTCEGGCATCTACAAACACGTCATCGCAGAGA CGGGCGTTGATCCGCGAACAACCGTCTTCGTGGACGACAAGATCGACAATGT GCTTTCGGCGCGGTCGCTCGGTATGCACGGCATTGTCTTCGACAAACACGAA GACGTAATGCGCGCTCTGCGAAACATTTTCEGGTGACCCCGTGCGAAGAGGAC GAGAATATTTGCGTCGAAATGCAAGGAAATTGGAATCCATCACAGATCACGGC GTCGCCTTCGGGGAGAACTTCACCCAGCTTCTGATCCTCGAACTTACTAGTGA TGCGTCCCTCGTTACTCTCCCTGATCGTCCTCGGACATGGAATTTTTTCCGAG GGAAGCCGCTCTTTTCEGGAGGCCTTCCCCGATGACCTTGATACTACTTCCTTG GCACTCACTGTCCTGAAAAGAGATGCCGCCACTGTATCGTCCGTGATGGACG AGATGCTGAAATACAGGGACGCGGACGGCATCATGCAGACATACTTCGACAA CGGTCGGCAACGACTCGATCCGTTCGTCAACGCCAACGTTTTGACCCTCTTC TACGCCAACGGTCGCGGACACGAGCTGGATCAGAGCCTCAGCTGGGTTCGC GAAGTCTTGCTCTACCGCGCTTACCTCGGCGGTTCCOGCTACTACCCCOTCCG CCGACTGCTTCCTATATTTCATCAGCCGCCTCTTCGCCTGCACCAGCGACCCG GTCCTCCATCATCAACTTAAGCCCCTCTTTGTTGAGCGTGTGCACGAGCGGAT AGGAGTGCAGGGCGACGCGCTGGAGCTCGCCTTCCGCCTGCTTGTATGCGC GAGCTTCAACATCTCGAACCAGCCTGACATGCGCAAGCTGCTCGAGATGCAG TGCCAGGACGGAGGCTGGGATGGCGGAAACCTGTATCGTTTCGGCACCACG GGCCTCAAGGTCACGAACCGGGGTCTGACCACCGCAGCAGCCGTGCAAGCC ATCGAGGCGACGCAGCTGCGTCCACCATCACCGGCGTTCTCTGTCGAGTCG CCTAAGAGCCCGGTGACGCCGGTGACGCCCATGCTGGAGATTCCAGCGCTG GGTCTCAGCATCTCEGCGGCCCTCCAGTCCTCTGTTGGGGTATTTCAAGCTCC
CGTGGAAGAAGTCAGCCGAGGTTCATTGA SEQ ID NO: 11 - cDNA otimizado OCH93767
ATGTCTGCAGCTGTTCGTTATACTACTCTGATCCTGGATTTGGGCGA TGTTCTGTTCACCTGGTCCCCGAAAACCAAGACCTCTATCAGCCCACGTATCC TGAAAGAAATCCTGAACAGCGCGACCTGGTACGAGTATGAGCGTGGCAGCAT CACCCAGCACGAGTGCTACGAGCGTGTTGGCGTCGAATTTGGTATTGCGCCG AGCGAGATTCACAACGCGTTCAAACAAGCCCGCGACAGCATGGAATCCAACG ACGAACTGATTGCTCTGGTGCGTGAGCTGAAAGAACAGAGCGATGGTGAGCT GCTGGTCTTTGCCCTGAGCAATATCTCTCTGCCGGATTACGAATACGTTCTGA CCAAACCAGCGGACTGGTCAATCTTCGATAAAGTCTTTCCGAGCGCTTTGGTC GGTGAGCGTAAACCGCATCTGGGTATTTACAAACACGTTATTGCGGAAACCGG TGTTGACCCGAGAACGACCGTTTTTGTTGACGATAAGATTGACAACGTCCTGA GCGCACGCAGCCTGGGTATGCATGGTATTGTCTTTGATAMACACGAAGATGTG ATGCGTGCTCTGCGCAATATCTTTGGCGACCCGGTGCETCGCGGTCGTGAGT ATTTGCGCCGCAACGCGCGCAAATTGGAGTCCATTACCGATCATGGTGTCGCA TTTGGTGAGAATTTCACCCAGCTCCTGATTCTGGAACTGACCAGCGACGCGT CCCTGGTGACGCTGCCGGATEGTCCGCGTACGTGGAACTTCTTCCGCGGCA AGCCGCTGTTTAGCGAAGCGTTCCCGGATGACCTGGACACCACGAGCCTGG CACTGACGGTGCTGAAACGCGATGCAGCAACTGTGAGCTCCGTCATGGACGA AATGCTGAAGTACCGCGACGCGGATGGCATCATGCAGACGTATTTCGACAAC GGTCGTCAGCGTCTGGACCCGTTTGTCAACGCCAATGTTCTGACGCTGTTTTA CGCGAATGGCCGTGGTCATGAACTGGACCAGAGCTTATCATGGGTGCGTGAA GTGCTGCTGTATCGCGCCTATCTGGGTGGCAGCCGCTACTATCCGAGCGCGG ACTGTTTTCTGTACTTCATTAGCCGCTTGTTCGCCTGCACCAGCGATCCGGTT CTGCATCACCAACTGAAGCCATTGTTCGTCGAGCGTGTGCACGAGCGTATTG GTGTTCAGGGCGACGCACTGGAACTGGCGTTCCGTCTGTTGGTGTGTGCGA GCTTCAACATTAGCAATCAGCCGGATATGCGTAAGCTGCTGGAAATGCAATGC CAAGATGGCGGCTGGGACGGTGGTAATCTGTACCGTTTTGGCACCACCGGTT TAAAAGTGACGAATCGTGGTTTGACCACCGCTGCGGCCGTTCAAGCAATTGA AGCAACGCAACTGCGTCCGCCGAGCCCAGCATTTAGCGTAGAGTCGCCTAAG AGCCCGGTTACGCCGGTGACGCCGATGCTGGAAATCCCGGCGCTGGGTCTG TCTATCAGCCGTCCGTCGAGCCCGCTGCTGGGCTATTTCAAGTTGCCGTGGA
AGAAAAGCGCCGAAGTGCACTAA EMD37666.1 SEQ ID NO: 12 - proteína EMD37666.1
MSAAAQYTTLILDLGDVLFTWSPKTKTSIPPRTLKEILNSATWYEYERG RISQDECYERVGTEFGIAPSEIDNAFKQARDSMESNDELIALVRELKTQLDGELLV FALSNISLPDYEYVLTKPADWSIFDKVFPSALVGERKPHLGVYKHVIAETGIDPRTT VFVDDKIDNVLSARSVGMHGIVFEKQEDVMRALRNIFGDPVRRGREYLRRNAMR LESVTDHGVAFGENFTQLLILELTNDPSLVTLPDRPRTWNFFRGNGGRPSKPLFS EAFPDDLDTTSLALTVLAORDPGVISSVMDEMLNYRDPDGIMQTYFDDGRQORLDP FVNVNVLTFFYTNGRGHELDQCLTWVREVLLYRAYLGGSRYYPSADCFLYFISRL FACTNDPVLHHQLKPLFVERVQEQIGVEGDALELAFRLLVCASLDVQNAIDMRRL LEMQCEDGGWEGGNLYRFGTTGLKVTNRGLTTAAAVOQAIEASQORRPPSPSPSVE
STKSPITPVTPMLEVPSLGLSISRPSSPLLGYFRLPWKKSAEVH SEQ ID NO: 13 - cONA EMD37666.1
ATGTCCGCGGCAGCTCAATACACGACCCTCATTCTCGACCTTGGCG ACGTCCTGTTCACCTGGTCACCGAAAACCAAGACGAGCATCCCCCCTCGGAC TCTGAAGGAGATTCTCAATTCCGCGACATGGTATGAGTATGAGCGCGGCCGCA TCTCTCAGGACGAATGTTACGAACGCGTTGGCACGGAGTTCGGAATCGCGCC TAGCGAAATCGACAACGCGTTCAAGCAAGCTCGGGATTCCATGGAATCCAAC GACGAACTGATCGCCCTTGTTCGGGAACTCAAGACGCAGTTGGACGGCGAA CTCCTTGTCTTCGCACTCTCAAATATCTCEGTTGCCTGACTACGAGTACGTCCTC ACGAAACCGGCCGACTGGTCCATCTTCEGACAAGGTCTTCCCTTCOGCCCTCG TGGGCGAGCGCAAGCCGCACCTCGGCGTTTACAAGCACGTCATTGCAGAAA CGGGCATTGATCCGCGAACCACCGTTTTCEGTGGACGACAAGATCGACAACGT GCTCTCAGCGCGGTCTGTAGGTATGCATGGGATCGTTTTCGAGAAGCAGGAA GACGTAATGCGCGCTCTCCGAAACATCTTCEGGAGACCCGGTTCGGCGAGGG CGCGAGTACTTGCGCCGTAATGCCATGAGGCTTGAATCGGTTACAGACCATG GTGTGGCGTTTGGCGAGAACTTCACACAACTCCTTATCCTCGAACTAACGAAC GATCCCTCCCTCGTTACGCTCCCTGATCEGTCCTCGAACATGGAATTTCTTCCG AGGTAACGGGGGACGACCAAGCAAACCATTATTCTOEGGAGGCCTTCCCCGAT GACTTGGACACTACTTCACTAGCGTTGACTGTCCTCCAAAGAGATCCCGGCGT CATCTCTTCTGTGATGGACGAAATGTTGAACTACAGGGATCCGGACGGCATTA TGCAGACATACTTCGACGATGGTCGGCAAAGACTCGATCCATTTGTCAATGTC AATGTCTTAACGTTCTTCTACACCAACGGACGTGGTCATGAACTGGACCAATG CCTTACATGGGTCCGCGAAGTTTTGCTCTATCEGCGCCTATCETEGGCGGCTCAC GTTATTACCCCTCCGCCGACTGCTTTCTCTACTTCATCAGCCOGCCTTTTCGCAT GCACGAATGACCCCGTGCTACACCACCAACTCAAACCGCTCTTCGTCGAGCG CGTGCAGGAGCAAATCGGCGTGGAGGGCGATGCGCTCGAGTTGGCGTTCCG ATTGCTCGTCTGTGCAAGCCTGGACGTCCAAAACGCGATCGACATGCGCAGG CTGCTCGAGATGCAATGCGAAGATGGCGGCTGGGAGGGCGGGAACCTTTATA GGTTTGGCACGACCGGGCTCAAGGTGACTAACCGGGGCCTGACGACTGCAG CGGCCGTACAGGCCATCEGAGGCGTCCCAACGGCGCCCACCATCACCOGTCCC CCTCCGTCGAATCTACAAAGAGCCCAATAACCCCTGTGACGCCCATGCTGGA GGTCCCCTCGCTCGGCCTGAGCATCTEGAGGCCGTCCAGCCCTTTACTOEGG
CTACTTCAGGCTCCCGTGGAAGAAGTCGGCCGAAGTACACTGA SEQ ID NO: 14 - CDNA otimizado EMD37666.1
ATGTCTGCGGCGGCTCAATACACGACTTTGATTCTGGATCTGGGTG ATGTTCTGTTCACTTGGTCCCCGAAAACCAAGACCAGCATCCCTCCGCGTACC CTGAAAGAAATCCTGAATAGCGCTACCTGGTATGAGTACGAGCGTGGTCGCAT TTCCCAAGACGAGTGTTACGAACGTGTGGGCACCGAGTTCGGCATTGCGCCG AGCGAGATTGACAACGCGTTCAAACAAGCGCGCGATTCGATGGAAAGCAATG ATGAACTGATCGCACTGGTCCGTGAGCTGAAAACGCAGCTGGACGGTGAGCT GCTGGTTTTCGCACTGTCCAATATTAGCCTGCCGGATTACGAATACGTCTTGAC CAAACCGGCGGACTGGAGCATCTTTGACAAAGTGTTCCCTAGCGCCTTGGTG GGCGAGCGTAAGCCGCATCTGGGCGTTTATASACACGTTATTGCGGAAACGG GCATTGATCCGCGCACGACGGTTTTCGTGGACGACAAGATTGACAATGTGTTA AGCGCACGCAGCGTCGGTATGCATGGTATCGTGTTTGAGAAACAAGAAGATGT CATGCGTGCACTGCGTAACATCTTTGGTGATCCGGTCCGTCGTGGTCGTGAG TATCTGCGTAGAAACGCAATGCGTCTGGAGTCCGTGACCGACCACGGCGTGG CGTTTGGTGAGAACTTTACCCAGTTGCTGATTCTGGAATTGACGAACGACCCG AGCCTGGTCACCCTGCCTGATCGTCOGCGTACCTGGAACTTTTTTCEGCGGCA ATGGTGGCCGCCCGAGCAAGCCGCTGTTCAGCGAAGCGTTCCCGGATGATC TGGATACCACGAGCCTGGCGCTGACCGTGCTGCAGCGCGACCCGGGTGTTA TCAGCAGCGTTATGGACGAAATGCTGAATTACCGTGACCCGGACGGTATCATG CAGACTTATTTCGATGACGGTCGCCAACGCTTGGACCCATTTGTGAACGTCAA TGTTCTGACCTTTTTCTATACGAACGGCCGTGGTCACGAACTGGACCAGTGTC TGACGTGGGTGCGTGAAGTCCTCTTGTATCEGTGCGTACCTTGGTGGCTCACG CTACTACCCATCGGCGGATTGCTTCCTGTACTTCATCTCTCGTCTGTTTGCGTG TACCAATGACCCGGTGCTGCACCATCAGCTGAAGCCACTGTTTGTTGAGCGT GTCCAAGAGCAAATTGGTGTCGAGGGTGATGCACTGGAACTGGCTTTTCGTC TGCTGGTCTGCGCCAGCCTGGATGTCCAGAATGCCATCGACATGCGCCOGTCT GCTGGAAATGCAGTGCGAAGATGGCGGTTGGGAGGGTGGTAACCTCTACCG CTTCGGCACCACGGGCCTGAAAGTTACCAACCGCGGTCTGACGACCGCAGC CGCCGTTCAAGCGATCGAAGCGAGCCAACGCCGTCCGCCGAGCCCGAGCCC GTCTGTAGAGAGCACGAAAAGCCCGATTACCCCGGTGACCCCGATGCTGGAA GTTCCAAGCCTGGGCTTATCTATCAGCCGTCEGTCCAGCCEGCTGCTGGGTT
ATTTCCGTTTGCCGTGGAAGAAAAGCGCAGAAGTGCACTAA EMD37666-B SEQ ID NO: 15 - proteína EMD37666-B
MSAAAQYTTLILDLGDVLFTWSPKTKTSIPPRTLKEILNSATWYEYERG RISQDECYERVGTEFGIAPSEIDNAFKQARDSMESNDELIALVRELKTQLDGELLV FALSNISLPDYEYVLTKPADWSIFDKVFPSALVGERKPHLGVYKHVIAETGIDPRTT VFVDDKIDNVLSARSVGMHGIVFEKQEDVMRALRNIFGDPVRRGREYLRRNAMR LESVTDHGVAFGENFTQLLILELTNDPSLVTLPDRPRTWNFFRGKPLFSEAFPDDL DTTSLALTVLORDPGVISSVMDEMLNYRDPDGIMQTYFDDGRQRLDPFVNVNVL TFFYTNGRGHELDQCLTWVREVLLYRAYLGGSRYYPSADCFLYFISRLFACTNDP VLHHQLKPLFVERVQEQIGVEGDALELAFRLLVCASLDVQNAIDMRRLLEMQCED GGWEGGNLYRFGTTGLKVTNRGLTTAAAVQAIEASQRRPPSPSPSVESTKSPITP VTPMLEVPSLGLSISRPSSPLLGYFRLPWKKSAEVH
SEQ ID NO: 16 - CDNA otimizado EMD37666-B
ATGTCTGCGGCTGCTCAATATACTACTTTGATTCTGGATCTGGGCGA CGTTCTGTTCACGTGGAGCCCGAAAACCAAGACCAGCATTCCACCGCGTACC CTGAAGGAGATCCTCAATAGCGCGACTTGGTACGAGTATGAGCGTGGCCGCA TCAGCCAAGACGAGTGCTACGAACGCGTCGGTACGGAATTTGGCATTGCACC AAGCGAGATTGACAATGCGTTTAAACAAGCGCGTGACAGCATGGAAAGCAAT GACGAACTGATCGCGCTGGTCCGTGAGCTGAAAACCCAGCTGGATGGTGAG CTGTTGGTGTTTGCGCTGTCGAACATCTCTCTGCCGGACTACGAGTATGTTCT GACCAAACCGGCGGATTGGAGCATTTTTGATAAAGTGTTTCCGAGCGCGCTG GTTGGTGAGCGCAAGCCGCACCTGGGTGTGTACAAACACGTTATTGCAGAGA CTGGCATCGACCCGCGTACGACGGTTTTCGTTGACGACAAGATCGATAACGTT CTGAGCGCACGTAGCGTCGGTATGCACGGTATTGTTTTCGAAAAACAAGAAGA TGTTATGCGCGCACTGCGTAATATCTTCGGCGATCCGGTCAGACGTGGCCGT GAGTATCTGCGCCGCAATGCGATGCGTCTGGAATCGGTGACCGATCATGGTG TCGCCTTTGGCGAGAATTTCACCCAGCTGCTGATTTTAGAGCTGACCAATGAT CCTAGCCTGGTGACGCTGCCGGATCGTCCGCGTACCTGGAACTTTTTCCGCG GCAAGCCGTTGTTCTCCGAAGCCTTCCCGGACGACCTGGACACGACCAGCC TGGCGCTGACCGTGCTGCAACGTGATCCGGGTGTGATCTCTTCCGTAATGGA CGAAATGCTGAACTACCGTGACCCGGACGGTATCATGCAGACCTATTTTGACG ACGGTCGTCAGCGTCTGGACCCGTTTGTGAACGTGAATGTCCTGACGTTCTT TTACACCAATGGTCGCGGTCACGAACTGGATCAGTGTCTGACCTGGGTCCGC GAAGTGCTGCTGTATCGTGCATACCTGGGTGGCAGCCGTTATTACCCGAGCG CCGATTGCTTTCTGTACTTTATCAGCCGTCTGTTCGCGTGCACGAACGATCCG GTTCTGCATCACCAGCTGAAGCCGTTATTTGTTGAGCGCGTTCAGGAACAAAT TGGTGTCGAGGGTGATGCGCTGGAATTGGCATTCCGCCTGTTGGTCTGCGCC AGCCTTGATGTCCAGAACGCCATTGACATGCGTCGCTTGCTCGAAATGCAGT GTGAGGACGGCGGTTGGGAGGGTGGCAACCTGTACCGTTTCGGTACGACCG GCCTGAAAGTCACGAACCGTGGTCTGACGACGGCAGCTGCGGTGCAAGCAA TTGAAGCCAGCCAACGTCGTCCGCCATCCCCGTCACCGAGCGTTGAGTCCAC CAAGAGCCCGATTACCCCTGTGACCCCGATGCTTGAAGTTCCGAGCCTGGGT CTGAGCATCTCCCGTCCTAGCAGCCCGCTGTTGGGTTACTTCCGCCTGCCGT GGAAGAAAAGCGCTGAGGTGCATTAA
XP 0012173761 SEQ ID NO: 17 - proteína XP. 001217376.1
MAITKGPVKALILDFSNVLCSWKPPSNVAVPPQILKMIMSSDIWHDYEC GRYSREDCYARVADRFHISAADMEDTLKQARKSLQVHHETLLFIQQVKKDAGGE LMVCGMTNTPRPEQDVMHSINAEYPVFDRIYISGLMGMRKPSICFYQRVMEEIGL SGDAIMFIDDKLENVIAAQSVGIRGVLFAOSQQADLRRVVLNFLGDPVHRGLQFLAA NAKKMDSVTNTGDTIQDNFAQLLILELAQDRELVKLOAGKRTWNYFIGPPKLTTAT FPDDMDTTSMALSVLPVAEDVVSSVLDEMLKFVTDDGIFMTYFDSSRPRVDPVV CINVLGVFCRHNRERDVLPTFHWIRDILINRAYLSGTRYYPSPDLFLFFLARLCLAV RNQOSLREQLVLPLVDRLRERVGAPGEAVSLAARILACRSFGIDSARDMDSLRGKQ
CEDGGWPVEWVYRFASFGLNVGNRGLATAFAVRALESPYGESAVKVMRRIV SEQ ID NO: 18 - CONA XP. 001217376.1
ATGGCTATCACCAAGGGTCCAGTTAAGGCGCTTATTCTTGACTTTTC CAATGTTCTCTGCTCGTGGAAGCCTCCCAGCAATGTTGCGGTGCCGCCCCAG ATACTCAAAATGATCATGTCCTCTGACATATGGCATGACTACGAGTGCGGACG GTACTCGAGAGAGGACTGCTATGCCAGAGTGGCAGACCGTTTTCATATCAGC GCCGCEGGACATGGAAGACACGCTGAAACAGGCGCGCAAGAGCCTGCAGGTT CACCATGAGACACTGTTGTTTATCCAGCAAGTCAAGAAGGATGCCGGGGGCGÇ AGTTGATGGTGTGTGGGATGACCAACACGCCCCGGCCAGAGCAAGACGTAAT GCATTCAATCAACGCGGAGTATCCTGTGTTTGATAGGATATATATATCCGGTCTC ATGGGCATGAGGAAGCCGAGCATCTGCTTCTACCAGCGGGTGATGGAGGAGA TTGGCCTATCAGGCGATGCGATCATGTTTATAGATGACAAGTTGGAGAATGTCA TCGCCGCCCAGTEGGTAGGGATCCGAGGCGTTCTATTTCAGAGTCAGCAAGA TCTCCGTCGGGTTGTATTAAATTTCTTGGGCGATCCGGTCCATOEGCGGCCTGC AGTTCCTAGCGGCCAATGCGAAAAAGATGGATAGTGTGACCAACACCGGCGA TACTATCCAAGATAATTTTGCTCAGCTCCTCATCTTGGAGCTGGCCCAGGACA GGGAATTGGTGAAGCTTCAGGCTGGAAAAAGGACTTGGAATTACTTCATAGGG CCTCCCAAGCTCACAACAGCCACGTTCCCCGATGACATGGACACCACATCTAT GGCTCTCTCGGTCCTTCCTGTGGCCGAGGATGTGGTCTCTTCTGTCCTGGAT GAGATGCTTAAATTCGTCACCGATGACGGTATCTTTATGACTTACTTCGATTCCT CGCGCCCTCGAGTCEGACCCAGTCGTATGTATCAACGTCTTGGGTGTTTTCTGC AGGCATAACCGAGAGCGAGACGTCCTTCCAACGTTCCATTGGATTCGAGACAT CCTGATCAACCGGGCATATCTCTCEGGGCACCCGATACTACCCATCGCCCGATT TGTTTTTGTTTTTCCTTGCACGCCTCTGCCTGGCAGTCCGGAATCAGAGCCTA CGGGAACAACTTGTCTTGCCTCTGGTAGACCGACTGCGTGAGCGGGTEGÇC GCACCTGGAGAAGCGGTCTCATTGGCAGCGCGGATCCTTGCCTGCCGTAGCT TTGGTATCGACAGTGCGAGAGACATGGACAGCTTGAGGGGAAAACAATGCGA GGATGGCGGCTGGCCAGTGGAGTGGGTTTACCGGTTTGCCTCTTTCGGCCT GAACGTAGGCAATCGGGGTCTTGCTACTGCCTTCGCGGTCAGGGCGCTCGAA
AGCCCCTATGGTGAGTCGGCGGTGAAGGTTATGAGACGCATCGTCTGA SEQ ID NO: 19 - cDNA otimizado XP 001217376.1
ATGGCAATCACTAAGGGCCCAGTTAAAGCGCTGATTCTTGATTTTTC TAACGTTCTGTGTAGCTGGAAGCCGCCGAGCAATGTTGCGGTCCCGCCTCAA ATTCTGAAGATGATTATGTCGAGCGACATCTGGCATGATTATGAGTGTGGCCGT TACAGCCGTGAGGACTGCTACGCCCGTGTTGCTGACCGTTTTCATATCAGCG CAGCGGACATGGAAGATACCCTGAAACAGGCACGTAAGTCCCTGCAAGTGCA CCACGAAACGCTGCTGTTCATCCAACAGGTGAAGAAAGACGCGGGTGGTGA GCTGATGGTTTGCGGCATGACCAACACGCCGCGTCCGGAACAAGACGTGATG CATTCCATCAATGCTGAGTATCCGGTGTTCGACCGTATTTACATTAGCGGCCTG ATGGGCATGCGTAAACCGAGCATTTGTTTCTACCAACGCGTAATGGAAGAGAT TGGTCTGAGCGGTGACGCCATCATGTTCATTGACGATAAACTGGAAAATGTGA TTGCCGCACAGAGCGTGGGTATCCGCGGTGTGCTGTTCCAAAGCCAGCAAG ATCTGCGTCGTGTCGTGCTGAACTTTCTGGGCGATCCGGTCCACCGTGGTCET GCAGTTCTTGGCGGCGAACGCAAAGAAAATGGACAGCGTCACGAATACCGGC GACACTATCCAAGACAATTTCGCACAGCTGTTGATCTTAGAGCTGGCGCAGGA TCGCGAATTGGTGAAATTGCAGGCCGGTAAACGTACCTGGAACTACTTTATTG GTCCGCCGAAGCTGACCACGGCGACGTTTCCGGATGATATGGACACGACCAG CATGGCGCTGTCGGTGCTGCCTGTCGCGGAAGATGTCGTGAGCTCTGTTCTG GACGAGATGCTGAAGTTCGTGACCGATGATGGTATCTTTATGACCTATTTCGAC TCTAGCCGTCCGCGTGTCGATCCGGTTGTCTGCATTAATGTGTTGGGTGTTTT CTGCCGCCACAATCGTGAGCGCGACGTGTTGCCGACCTTTCACTGGATTCGT GATATTCTGATCAACCGCGCATATCTGAGCGGCACGCGCTATTACCCGTCCCC GGATCTGTTTCTGTTTTTCCTGGCTCGTCTGTGCCTGGCCGTTCGCAACCAGA GCCTGCGCGAACAACTGGTTCTCCCGCTGGTTGATCGTCTGCGCGAGCGTG TTGGTGCTCCGGGTGAGGCTGTGAGCCTGGCGGCACGTATCCTGGCGTGCCÇ GTAGCTTCGGTATCGACTCAGCCCGCGACATGGACTCCTTGCGTGGCAAACA GTGTGAAGATGGTGGTTGGCCGGTCGAATGGGTCTATOEGCTTCGCGAGCTTT GGTCTGAACGTTGGCAACCGTGGTTTGGCCACCGCGTTTGCGGTTAGAGCG CTGGAGTCCCCATACGGCGAGAGCGCAGTTAAGGTTATGCGCCGTATCGTGT
AA OJJ98394.1 SEQ ID NO: 20 - proteína OJJ98394.1
MPSVKALVLDFAGVLCSWTPPAESPLSPAQLKQLMSSEIWFEYERGR YSEEECYAKLVERFSISAADMASTMEQARQSLELNHAVLQLVSEIRKRNPGLKVY GMTNTPHAEQDCVNRIVNSYPVFDHVYLSGLVGMRKPDLGFYRFVLAETGLRPD EVVFVDDKTENVLVAQSVGMHGVVFQNVTDFKQQIINVTGDPVSRGLRYLRSNA KSLLTVTSNNSVIHENFAQLLILELTGDRDLIELEPWDRTWNYFIGVPQSPTSTFPN DLDTTSIALSVLPIHKDVVADVMDEIMLLLDNDGIVPTYFDPTRPRVDPVVCVNVLS LFAQNGRESELLATFNWVLDVLRHRAYLQGTRYYISPDAFLYFLARLSVFLRMSPL RARLMPLLEERVYERIGAHGDAISLAMRIYTCKLLGMSNMLDERALRDMQCEDG
GFPTSWVYRFGSTGVKIGNRGLTTALAIKAIEMPLASLWKSWGLTTDIR SEQ ID NO: 21 - CONA OJJ98394.1
ATGCCCTCCGTCAAAGCACTGGTCCTGGACTTCGCCGGAGTTCTAT GCTCATGGACCCCGCCAGCCGAGAGCCCGCTCTCCCCAGCCCAGCTCAAAC AACTCATGTCCTCCGAGATATGGTTCGAATACGAGCGCGGGAGATATTCCGAA GAAGAATGTTATGCGAAGCTCGTCGAACGGTTCTCCATCAGCGCTGCGGACA TGGCTTCCACCATGGAACAGGCCCGTCAGAGCCTGGAACTGAACCACGCCG TACTTCAGCTTGTCAGCGAGATAAGGAAGCGGAACCCCGGGCTCAAAGTTTAT GGCATGACGAACACGCCCCATGCGGAACAGGATTGTGTGAATCGCATCGTGA ACAGCTATCCTGTTTTCGACCATGTGTATCTCTCEGGGCTCGTTGGGATGCGC AAACCAGATCTTGGATTCTATCGGTTTGTTCTCGCAGAGACCGGGTTGAGGCC TGACGAGGTCGTGTTCGTCGACGACAAAACGGAGAATGTGTTGGTCGCGCA GTCCGTGGGGATGCACGGCGTGGTEGTTCCAGAACGTTACGGATTTCAAGCAG CAGATCATAMACGTGACGGGAGACCCTGTCTCTCGGGGCTTGAGGTATCTCC GCTCGAATGCAAAGAGCCTCCTCACTGTGACTAGCAATAACTCCGTGATCCAC GAAAACTTTGCGCAGTTGCTGATTCTGGAGCTGACGGGCGACCGAGACTTGA TCGAACTCGAGCCTTGGGATCGAACATGGAACTACTTCATCGGGGTTCCTCA GTCGCCGACGAGCACCTTCCCCAACGACCTGGACACCACCTCTATCGCGCTC TCGGTCCTTCCCATTCATAAGGACGTCGTTGCCGATGTGATGGACGAGATTAT GCTTCTCCTAGACAACGACGGGATAGTCCCAACATATTTTGATCCCACTCGCC CTCGAGTCGACCCAGTCGTGTGTGTGAATGTACTCAGCCTGTTTGCCCAAAA CGGCCGAGAATCCGAGTTACTCGCCACCTTCAACTGGGTGCTGGACGTGCTG CGACATAGAGCCTACCTGCAGGGCACGAGATATTACATCAGTCCGGACGCCTT CTTGTACTTTCTAGCCAGACTCTCGGTCTTTCTGAGGATGAGTCCACTCCGCG CTCGGCTAATGCCTCTCCTGGAAGAAAGAGTGTATGAGCGAATTGGTGCCCAT GGCGACGCCATTTCGCTGGCTATGCGGATCTATACGTGTAAGCTGCTCGGGAT GTCGAATATGCTCGATGAAAGAGCATTGCGGGACATGCAGTGTGAGGATGGC GGCTTCCCTACAAGTTGGGTCTATAGATTTGGATCGACCGGAGTGAAGATTGG GAACAGGGGGTTGACTACTGCACTTGCAATAMAGGCCATTGAGATGCCTCTC
GCTTCGCTTTGGAAGTCGTGGGGATTGACGACTGACATTCGATAA SEQ ID NO: 22 - cDNA otimizado OJJ98394.1
ATGCCGTCGGTTAAAGCGTTGGTTCTGGATTTTGCGGGTGTGTTGT GTTCTTGGACTCCACCGGCGGAAAGCCCGTTGTCCCCAGCGCAGCTGAAGC AGCTGATGAGCAGCGAGATCTGGTTTGAGTATGAGCGTGGCCGCTATAGCGA AGAAGAGTGTTATGCAAAATTGGTGGAGCGTTTCTCTATCTCEGGCCGCAGATA TGGCGAGCACGATGGAACAGGCCCGTCAATCGCTGGAGTTGAACCACGCCG TGCTGCAATTAGTTTCCGAGATTCGTAAACGTAATCCGGGCTTAAAGGTTTACG GTATGACTAATACCCCGCATGCAGAGCAAGATTGTGTGAACCGTATTGTCAATA GCTATCCGGTTTTTGATCATGTCTACCTGAGCGGTCTGGTGGGTATGCGCAAA CCGGATCTGGGCTTTTACCGTTTCGTTCTGGCAGAGACTGGTCTGCGCCCGG ATGAAGTCGTGTTCGTTGACGACAAGACCGAAAATGTCCTGGTGGCTCAATCC GTTGGCATGCATGGTGTGGTGTTCCAAAATGTAACCGACTTCAAACAACAGAT TATCAATGTCACGGGTGATCCTGTCAGCCGTGGTTTGCGCTACTTGCGTTCCA ACGCGAAGTCTCTGCTCACTGTTACCAGCAATAACAGCGTTATCCATGAGAATT TCGCGCAGCTGCTGATCCTGGAACTGACGGGCGACCGTGACCTGATTGAACT GGAACCGTGGGACCGTACGTGGAACTACTTTATEGGCGTGCCGCAAAGCCCG ACCAGCACCTTTCCGAACGACCTGGATACGACCAGCATTGCCCTGAGCGTTC TGCCGATTCACAAAGATGTGGTTGCGGACGTGATGGATGAGATTATGCTGCTG CTGGACAATGACGGTATTGTCCCGACCTACTTCGATCCAACCCGTCCGCGTGT TGATCCTGTTGTGTGCGTCAACGTTCTGAGCCTGTTCGCACAGAACGGTCGC GAGTCCGAATTGCTGGCGACGTTCAACTGGGTTTTGGACGTTCTGAGACACC GTGCGTATTTGCAGGGTACGCGCTATTATATCAGCCCGGATGCCTTTCTGTATT TTCTGGCGCGCCTGTCTGTGTTTCTGCGTATGTCTCCGTTGCGCGCTCGTCT GATGCCGCTGCTGGAAGAACGCGTTTATGAGCGTATCGGCGCACACGGCGAT GCTATTAGCCTGGCGATGCGCATTTACACCTGTAAGCTGCTGGGCATGAGCAA TATGCTGGACGAGCGTGCACTGCGTGACATGCAGTGTGAAGATGGTGGTTTC CCAACCAGCTGGGTGTACCGTTTTGGTAGCACGGGCGTGAAAATTGGTAACC GTGGCTTGACGACCGCACTGGCCATTAAGGCCATCGAAATGCCGCTGGCCAG
CCTTTGGAAAAGCTGGGGCCTGACCACCGATATTCGCTAA GAO87501.1 SEQ ID NO: 23 - proteína GAO87501.1
MTRQKSPQYKAIIFDLGDVFFTWDAPKDTAVLPNLFKKMLTSPTWSDY ERGKLSEESCYERLAEQFDVDSSEIARSLRKAQQSLTTDAAIVSLISEIRALAGHIAI YAMSNISAPAYAAVLOTQPEMGIFDGVFPSGCYGTRKPELLFYKKVLQEIAVPPNQ IFIDDQLENVVSAQSTGMHGIVYTGAGELSRQLRNLVLDPVORGREFLRRNAGA LYSICETGQVIRENFSQLLILEATGDRSLVNLEYQQRSWNFFQGGPPSTSETFPD DVDTTSIALMILPADDNTVNSVLGEISEVANDEGIVNTYFDQTRORIDPAVCVNVLR LFYTYGRGATLPLTLOWVSDVLEHRAHLHGTRYYPSPEVFLYFVSQLCRFSKREP TLQLLETLLTDRLKERIQVKADTLSLAMRILACLSVGISQVEVDVRELLALQCKDGS
WEPGSFYRFGSSKMNVGNRGLTTALATRAVELYQGTRIRSKGTE SEQ ID NO: 24 - CONA GAO87501.1
ATGACCCGACAGAAATCGCCTCAATACAAAGCAATCATCTTTGACCT AGGGGATGTCTTTTTCACCTGGGACGCCCCCAAAGACACTGCTGTCTTGCCC AACCTCTTCAAGAAAATGCTTACCTCGCCAACCTGGTCAGATTACGAGCGCGG CAAGTTGAGCGAAGAAAGCTGCTACGAGAGACTGGCCGAACAGTTTGACGTT GACTCGTCGGAAATCGCGCGCAGCTTAAGGAAAGCACAGCAGTCTCTTACCA CAGACGCAGCAATCGTGAGCCTGATATCAGAGATCAGAGCGTTGGCCGGACA TATTGCCATCTACGCCATGTCCAACATTTCCGCCCCAGCTTATGCAGCTGTGCT CCAGACTCAGCCCGAAATGGGCATCTTTGACGGAGTGTTCCCGTCTGGATGC TATGGGACGAGGAAGCCGGAGCTGTTGTTCTATAAGAAAGTCTTGCAGGAGAT TGCAGTGCCGCCAAATCAGATCATCTTTATTGATGATCAGCTAGAGAATGTAGT TTCTGCGCAGTCAACAGGTATGCACGGCATTGTCTACACCGGTGCGGGTGAG CTCAGTCGACAGCTCAGAAATCTGGTGTTGGACCCTGTACAAAGGGGTCGAG AGTTTCTACGGCGCAATGCTGGGGCATTGTATAGTATCTGCGAGACTGGTCAA GTCATCCGGGAAAACTTCTCGCAGCTGCTCATCCTAGAGGCGACGGGTGATA GAAGCCTGGTCAACCTTGAATATCAGCAGCGGAGCTGGAATTTCTTTCAAGGA GGTCCCCCTTCTACGTCGGAAACATTCCCAGATGATGTCGACACAACATCCAT TGCCTTGATGATTCTCCCTGCCGATGATAACACAGTCAACTCGGTTCTCGGCG AGATTTCCGAGGTAGCTAATGACGAGGGCATTGTAAATACGTACTTTGACCAGA CCCGACAGCGAATCGACCCAGCAGTCTGCGTCAATGTCCTCCGTCTCTTTTAT ACCTACGGCCGGGGCGCCACTCTCCCATTGACCCTCCAGTGGGTGTCCGAC GTTCTTGAGCATCGTGCGCACTTACATGGTACGCGATACTACCCCAGCCCGGA GGTTTTCCTCTACTTTGTCAGTCAACTCTGCCGGTTCTCCAAGAGGGAACCGA CGCTGCAGCTGCTGGAGACGTTGCTCACGGATCGCCTCAAGGAGCGCATTC AGGTCAAGGCAGACACTCTGTCACTGGCTATGCGGATCCTGGCATGCTTGTC TGTGGGTATATCACAAGTTGAAGTGGATGTCCGAGAGCTGCTCGCCTTGCAAT GCAAGGATGGATCGTGGGAACCCGGCTCGTTTTACCGGTTTGGGTCGTCCAA GATGAACGTTGGTAATCGAGGTCTTACGACTGCGTTGGCGACTAGGGCGGTT
GAGTTGTACCAGGGGACTAGAATACGCTCTAAGGGCACCGAGTAG SEQ ID NO: 25 - cCDNA otimizado GAO87501.1
ATGACTCGCCAAAAAAGCCCTCAATACAAAGCAATTATCTTCGATCT GGGTGACGTTTTCTTCACCTGGGATGCGCCGAAAGATACGGCCGTACTGCCG AACCTGTTCAAGAAAATGCTGACCTCGCCGACCTGGAGCGACTATGAGCGTG GTAAGCTGTCTGAGGAAAGCTGTTACGAACGCTTGGCCGAGCAATTTGACGT GGACAGCAGCGAGATCGCGCGTAGCCTCCGTAAAGCGCAGCAAAGCCTGAC GACCGACGCAGCCATCGTGAGCCTGATCAGCGAGATCCGCGCATTGGCGGG TCACATTGCTATCTATGCTATGTCTAACATTTCTGCGCCAGCATACGCAGCGGT GTTACAGACCCAGCCGGAAATGGGTATCTTTGATGGTGTTTTTCCGAGCGGCT GCTATGGTACGCGTAAACCGGAACTGCTGTTTTACAAAAAAGTGCTTCAAGAA ATTGCGGTTCCGCCGAATCAGATTATCTTCATTGACGATCAGCTGGAAAACGT CGTCAGCGCACAGTCCACGGGCATGCATGGCATTGTTTACACCGGTGCCGGT GAGCTGAGCCGTCAACTGCGTAATCTGGTCCTGGACCCGGTGCAGCGTGGT CGTGAGTTCCTGCGCCGTAATGCTGGCGCCCTGTACAGCATTTGTGAGACTG GCCAAGTTATCCGTGAGAACTTCAGCCAGCTGCTGATTCTGGAAGCAACCGG CGATCGTTCGCTGGTGAACCTGGAGTATCAACAACGTTCCTGGAACTTCTTTC AGGGTGGCCCTCCATCCACGAGCGAAACTTTTCCGGATGATGTTGACACGAC CTCAATCGCGCTGATGATTTTACCGGCGGACGATAATACCGTCAATAGCGTCC TGGGTGAAATCAGCGAAGTCGCGAATGACGAGGGCATTGTGAATACCTATTTC GATCAGACCCGCCAACGTATCGATCCGGCCGTGTGTGTCAACGTGTTGCGCC TGTTTTACACCTATGGTCGTGGCGCTACGCTGCCGTTGACCCTGCAATGGGTT AGCGACGTGCTGGAGCACCGTGCGCATCTGCACGGCACCCGCTACTATCCGT CCCCAGAGGTTTTCCTGTACTTTGTCTCTCAGCTGTGCCGTTTTTCCAAGCGC GAACCGACCCTGCAGCTGCTGGAAACGCTGTTGACCGACAGACTGAAGGAA CGCATCCAAGTTAAGGCAGATACGCTGAGCTTGGCAATGCGTATTTTGGCGTG CCTGAGCGTGGGCATCAGCCAGGTTGAGGTTGACGTCCGCGAACTGCTGGC GCTGCAGTGCAAGGACGGTAGCTGGGAGCCGGGTAGCTTCTACCGTTTCGG TAGCAGCAAGATGAATGTCGGTAACCGCGGTCTGACGACCGCTTTGGCGACC CGTGCGGTTGAGCTGTACCAGGGTACGCGTATTCGTAGCAAGGGCACCGAGT
AA XP 0080341511 SEQ ID NO: 26 - proteína XP. 008034151.1
MASPHRRYTTLILDLGDVLFSWSSKTNTPIPPKKLKEILSSLTWFEYER GRISQAECYDRVSSEFSLDAATIAEAFQQARDSLRPNEEFLALIRELRQQOTHGALT VLALSNISLPDYEYIMALDSDWTSVFDRVFPSALVGERKPHLGAYRRVISEMHLDP ETTVFVDDKLDNVVSARSLGMHGVVFDSQENVFOTLRNIFGDPIHRGRDYLRRH AGRLETSTDAGVVFEENFTQLIIYELTNDKSLITTSDCPRTWNFFRGKPLFSASFP DDVDTTSVALTVLRPPRTLVNSILDEMLEYVDADGIMQOTYFDHSRPRMDPFVCVN VLSLFYEYGRGQDLPKTLEWVYEVLLHRAYIGGSRYYMSADCFLFFMSRLLOQRIT DPAVLNRLRPLFVERMHERVSAPGDSMELAFRILAGSSVGIQFPRDLEKLLAAQC ADGGWDLCWFYQYGSTGVKAGNRGLTTALAIKAIESAIARPPSPALSAVSSSKLE
VPKPILORPLSPRRLGDFLMPWRRAQREVAVSS SEQ ID NO: 27 - CONA XP. 008034151.1
ATGGCTTCACCTCACCGCAGGTATACGACACTCATCCTAGACCTGG GCGACGTCCTCTTCTCTTGGTCATCCAAGACCAACACACCTATCCCTCCCAAG AAGCTGAAGGAGATCCTCTCGTCCCTGACCTGGTTCGAGTACGAGCGCGGTC GGATATCACAGGCCGAGTGCTATGACCGGGTCAGCTCCGAGTTCAGTCTTGA CGCTGCCACCATOEGCAGAAGCGTTCCAGCAGGCTCGCGACTCTCTGCGACC GAACGAAGAGTTCCTGGCGTTGATTCGCGAACTCCGCCAACAAACGCATGGT CAGCTTACCGTCCTCGCGCTCTCGAACATCTCACTCCCCGACTATGAATACAT CATGGCTCTCGACTCGGACTGGACGTCGGTCTTCGACCGCGTCTTCCCTTCT GCCCTCETCGGCGAGCGCAAGCCACATCTGGGGGCGTACCGCCGTGTCATC TCTGAGATGCACCTAGACCCAGAAACGACCGTCTTTGTGGACGACAAGCTGG ACAACGTGGTGTCCGCGCGATCEGCTCGGGATGCACGGCGTGGTCTTCGACT CCCAGGAGAACGTCTTCCAGACGCTGAGGAATATCTTCGGCGACCCGATACA TCGCGGACGTGACTATCTCCEGCAGGCATGCCGGTCGTCTGGAGACATCTACG GACGCCGGCGTTGTCTTCEGAGGAAAACTTTACGCAGCTCATCATCTACGAACT AACAAATGACAAATCCCTCATCACGACATCAGACTGTCCCCGCACTTGGAACT TCTTCCGCGGGAAGCCCTTGTTCTCGGCCTCGTTTCCCGACGATGTGGACAC GACGTCGGTTGCCCTGACAGTGTTGCGCCCACCCCGCACGCTTGTCAACTC GATCTTGGACGAGATGCTAGAGTATGTCGACGCCGACGGCATCATGCAGACC TACTTCGACCACTCGCGCCCGCGGATGGATCCGTTCGTCTGTGTCAACGTCC TGTCGCTGTTCTACGAGTACGGCCGGGGACAGGACCTCCCGAAGACCCTCG AATGGGTATACGAGGTTCTGCTGCACCGCGCCTACATEGGCGGCTCGCGGTA
CTACATGTCCGCGGACTGCTTCCTCTTCTTCATGAGCCGCCTTCTCCAACGTA TCACCGACCCAGCCGTCCTGAACCGCCTCEGCCeGTTGTTCGTCGAGCGCA
TGCACGAACGTGTCAGCGCACCGGGCGACTCCATGGAGCTCGCGTTCCGCA TCCTCGCTGGCTCGTCCGTCGGCATCCAGTTCCCACGTGACCTGGAGAAGCT CCTCGCCGCGCAGTGCGCCGACGGCGGCTEGGGACCTGTGCTGGTTCTACCA
GTATGGGTCCACCGGCGTGAAGGCAGGCAACCGCGGGCTCACCACCGCGCT CGCCATCAAGGCTATCEGAGAGCGCTATEGCGCGCCeTCeGTCCCCCGCTCTA
TCAGCTGTATCGTCGTCGAAACTGGAAGTGCCGAAACCAATTCTCCAGCGTC CCCTCAGCCCEGCGceseetT eEGCGACTTCCTGATGCCCTGGAGGAGAGCAC
AGCGCGAGGTCGCGGTTTCCAGCTAG
SEQ ID NO: 28 - cDNA otimizado XP 008034151
ATGGCTAGCCCGCACCGTCGCTATACTACTCTGATTCTGGATTTGG GTGATGTTTTGTTTAGCTGGAGCAGCAAAACCAATACGCCTATTCCGCCGAAA AAGCTGAAAGAAATCCTGTCTAGCCTGACCTGGTTCGAGTACGAGCGCGGTC GCATTTCTCAAGCCGAGTGCTATGACCGTGTGAGCTCTGAGTTTAGCCTGGAC GCAGCGACCATTGCAGAGGCATTCCAACAGGCTCGTGACTCGCTGCGCCCG AACGAAGAATTTCTGGCGTTGATTCGTGAGCTGCGCCAGCAGACCCACGGCC AACTCACCGTTCTGGCACTGAGCAACATCTCCCTGCCGGATTACGAGTACATC ATGGCTCTGGATAGCGATTGGACCAGCGTCTTTGATAGAGTTTTCCCGAGCGC GCTGGTTGGTGAGCGTAAGCCGCATCTGGGTGCTTACCGTCGTGTCATTAGC GAGATGCATCTGGACCCGGAGACTACGGTGTTTGTGGACGACAAACTGGACA ACGTTGTCTCCGCGCGCAGCCTGGGTATGCACGGCGTCGTTTTTGACTCACA AGAAAATGTTTTCCAGACGCTGCGTAACATTTTCGGTGACCCTATCCACCGTG GCCGCGACTATTTGCGTCGTCATGCCGGTCGTTTGGAAACCAGCACCGACGC GGGCGTTGTTTTTGAAGAAAACTTCACCCAGCTGATCATCTACGAACTGACGA ATGACAAGAGCCTGATCACCACGAGCGATTGTCCGCGCACCTGGAACTTCTT CCGTGGTAAGCCGCTGTTTAGCGCGTCCTTCCCAGACGATGTCGATACGACT TCGGTGGCCCTGACCGTTCTGCGCCCACCGCGCACCCTGGTAAACAGCATC CTGGACGAAATGTTAGAATACGTCGATGCGGATGGTATTATGCAGACCTATTTC GACCACAGCCGTCCGCGCATGGACCCGTTTGTGTGTGTGAATGTGTTGAGCC TGTTCTATGAGTACGGCCGTGGTCAAGATCTGCCAAAAACCCTGGAATGGGTC TACGAAGTCCTTCTGCATCGTGCCTACATCGGTGGCTCCCGTTATTACATGAG CGCAGATTGCTTTITTGTTCTTTATGTCTCGTCTGCTGCAGCGCATCACGGACC CTGCCGTGCTGAATCGTCTGCGTCCGCTGTTCGTGGAGCGTATGCACGAGCG CGTGTCTGCCCCGGGTGACAGCATGGAACTGGCGTTCCGTATCCTGGCGGG CAGCAGCGTGGGTATTCAATTTCCGCGTGATTTGGAGAAACTGCTGGCTGCG CAGTGTGCGGACGGTGGCTGGGATCTGTGCTGGTTTTATCAATACGGTAGCA CCGGCGTTAAGGCCGGCAATCEGTGGCCTGACGACGGCACTGGCAATTAAGG CCATTGAGTCCGCGATTGCGCGTCCGCCGAGCCCGGCATTGAGCGCGGTCA GCAGCAGCAAACTGGAAGTGCCGAAGCCGATCTTGCAGCGTCCACTGAGCC CGCGTCGTCTGGGTGACTTCCTGATGCCGTGGCGCCGTGCGCAACGCGAAG TCGCGGTTAGCTCCTAA
XP 007369631.1 SEQ ID NO: 29 - proteína XP. 007369631.1
MASIHRRYTTLILDLGDVLFRWSPKTETAIPPQQLKDILSSVTWFEYER GRLSQEACYERCAEEFKIEASVIAEAFKQARGSLRPNEEFIALIRDLRREMHGDLT VLALSNISLPDYEYIMSLSSDWTTVFDRVFPSALVGERKPHLGCYRKVISEMNLEP QTTVFVDDKLDNVASARSLGMHGIVFDNQANVFRQLRNIFGDPIRRGQEYLRGH AGKLESSTDNGLIFEENFTQLIIYELTQDRTLISLSECPRTWNFFRGEPLFSETFPD DVDTTSVALTVLQPDRALVNSVLDEMLEYVDADGIMQTYFDRSRPRMDPFVCVN VLSLFYENGRGHELPRTLDWVYEVLLHRAYHGGSRYYLSPDCFLFFMSRLLKRA DDPAVOQARLRPLFVERVNERVGAAGDSMDLAFRILAAASVGVQCPRDLERLTAG QCDDGGWDLCWFYVFGSTGVKAGNRGLTTALAVTAIQTAIGRPPSPSPSAASSS
FRPSSPYKFLGISRPASPIRFGDLLRPWRKMSRSNLKSQ SEQ ID NO: 30 - CONA XP. 007369631.1
ATGGCCTCAATCCACCGTCGATACACTACTCTCATCCTCGACCOTCG GCGACGTACTCTTTCGTTGGTCTCCAAAGACTGAGACCGCCATTCCACCTCAA CAACTCAAGGATATCCTCTCCTCTGTCACCTGGTTTGAGTACGAACGCGGCAG ACTATCCCAGGAAGCATGCTACGAGCGCTGCGCCGAGGAGTTCAAGATAGAG GCCTCGGTCATTGCAGAAGCCTTTAAGCAGGCTCGCGGGTCACTGCGGCCC AACGAGGAGTTCATCGCCTTGATCCGTGACCTCCGCCGTGAGATGCACGGTG ACCTTACCGTTCTTGCCCTCTCCAACATCTCCCTCCCCGACTACGAATACATCA TGTCGCTAAGCTCAGATTGGACGACCGTCTTCGATCGCGTATTCCCCOTCTGCA CTCGTTGGCGAGCGCAAGCCTCATCTGGGATGCTATCGCAAGGTCATCTCGG AGATGAACCTAGAACCTCAGACGACTGTGTTCGTGGATGACAAGCTTGACAA CGTCGCGTCTGCTCGCTCACTTGGTATGCACGGCATCGTGTTTGACAACCAA GCCAACGTCTTCCGCCAACTCCGCAATATOTTCGGAGACCCCATCCGCCGTG GCCAAGAGTATCTCCGTGGGCATGCTGGCAAACTCGAGTCTTCGACCGACAA CGGGTTGATCTTCGAGGAGAACTTCACACAGCTGATCATCTACGAGTTGACGC AAGACAGGACTCTCATCTCGCTTTCAGAATGTCCTCGTACTTGGAATTTCTTCC GAGGCGAACCGCTATTCTCGGAGACCTTCCCGGATGATGTCGACACAACATC TGTGGCGTTGACGGTATTGCAACCGGACAGAGCACTGGTCAACTCCGTTCTA GACGAGATGCTGGAGTATGTCGACGCCGATGGCATCATGCAGACATACTTCGA TCGTTCACGACCACGCATGGACCCCTTCGTCTGCGTGAACGTACTCTCCCTG TTCTACGAGAACGGTCGTGGTCACGAGCTCCCTCGCACATTGGACTGGGTCT ACGAGGTGCTCCTCCATCEGCGCGETACCACGGCGGTTCGCGTTATTACCOTGTC GCCCGACTGCTTTCTATTCTTCATGAGCCGCCTACTCAAGCGCGCAGACGATC CAGCAGTCCAGGCTCGGCTCCGCCCGCTCTTCGTCGAGCGGGTGAACGAGC
GAGTAGGCGCCGCTGGCGACTCGATGGACCTCGCCTTCCGCATCCTCGCCG CAGCGTCTGTTGGCGTCCAGTGCCCcoeGcGATCTGGAAAGGTTGACTGCCG
GGCAATGCGACGACGGTGGATGGGACCTCTGCTGGTTCTACGTGTTCGGCTC
GACGGGCGTGAAGGCGGGCAACCGCGGCCTCACAACGGCCCTCGCTGTCA CGGCCATACAGACGGCCATCGGACGCCCcceTtToeGcCCAGTCCCTCCOGCGG
CCTCCTCGTCTTTCAGACCTAGTTCCCCOTTACAAATTCCOTAGGCATTTCGCOGC CCAGCTAGCCCCATTEGCTTTGGCGACTTACTTCEGCCCATGGCGGAAGATGA
GCAGGTCGAACTTGAAGTCTCAATGA SEQ ID NO: 31 - cDNA otimizado XP 007369631.1
ATGGCAAGCATTCATCGTCGCTATACTACGCTGATTCTGGACCTGG GTGATGTTTTGTTCCGCTGGAGCCCGAAAACCGAGACTGCGATTCCTCCGCA ACAACTGAAAGACATCCTGAGCAGCGTCACCTGGTTCGAGTACGAGCGTGGC CGTCTGAGCCAAGAGGCTTGCTACGAGCGTTGCGCCGAAGAGTTCAAGATTG AAGCCAGCGTGATTGCGGAAGCGTTCAAACAAGCGCGTGGTAGCCTGCGTC CGAACGAAGAATTTATCGCACTGATCCGTGATCTGCGTCGCGAGATGCATGGT GACCTGACCGTTCTGGCTCTGAGCAATATCTOEGTTGCCGGATTACGAGTATATT ATGTCTCTGAGCAGCGACTGGACGACGGTCTTTGATCGTGTGTTCCCGTCAG CTCTGGTGGGCGAGCGTAAACCGCACTTGGGTTGCTATCGCAAGGTCATCAG CGAGATGAACCTGGAACCTCAGACCACGGTCTTTGTGGACGATAAACTGGATA ATGTCGCAAGCGCGCGTAGCCTGGGTATGCACGGTATCGTGTTTGATAATCAA GCGAATGTGTTTCGCCAGCTGCGTAATATTTTCEGGTGATCCAATCCGTCGCGG TCAAGAGTATCTGCGTGGCCATGCCGGTAAATTGGAGAGCAGCACGGACAAT GGTTTGATCTTTGAAGAGAACTTCACCCAGCTGATCATTTATGAACTGACCCA GGACCGCACGTTGATCAGCCTGTCGGAGTGTCCGCGTACCTGGAACTTCTTC CGTGGCGAGCCGTTGTTTTCTGAAACCTTCCCGGACGACGTGGACACCACGT CCGTTGCACTGACGGTTCTGCAACCGGATCGCGCACTGGTTAACAGCGTGCT GGACGAAATGCTGGAATATGTCGATGCGGATGGCATCATGCAGACGTATTTCG ACCGCTCGCGTCCGCGTATGGACCCGTTTGTTTGCGTCAACGTACTGAGCCT GTTTTACGAGAACGGTCGTGGTCACGAACTGCCGCGCACTCTGGATTGGGTG TACGAAGTCCTGCTCCACCGCGCCTACCACGGTGGTTCCCGTTACTACCTGA GCCCGGACTGTTTCTTGTTTTTTATGAGCCGTCTGCTGAAACGTGCAGACGAC CCAGCGGTTCAGGCGAGATTGCGTCCGCTGTTTGTGGAACGCGTTAACGAAC GTGTTGGCGCGGCCGGTGATAGCATGGACCTGGCGTTTCGCATTCTGGCCG CAGCGAGCGTGGGTGTGCAGTGTCCGCGCGACCTGGAGCGTCTGACCGCT GGTCAATGCGATGATGGCGGCTGGGATCTGTGTTGGTTCTACGTTTTCGGCA GCACCGGCGTTAAGGCCGGTAATCGTGGTCTGACCACGGCGCTGGCAGTCA CCGCGATCCAGACCGCCATEGGCCGTCEGCCTAGCCCGAGCCCGTCEGEGG CAAGCTCCAGCTTCCGCCCGAGCAGCCCGTACAAGTTTCTGGGTATTAGCCG TCCGGCGTCCCCAATTEGCTTCGGTGACCTTCTGCGTCCGTGGCGTAAAATG
TCTCGCTCTAACCTGAAGTCCCAGTAA ACg006372 SEQ ID NO: 32 - proteína ACgO06372
MRRNVLNKATHSQSPLKPNITTLIFDLGDVLLTWSDSTPKSPLPPKIVK GILRSLTWFEYEKGNLTESQTYGQVAQEFGVDASEVKASFEAARDSLKSNPMLL QLIRSLKDSGHVIYAMSNISAPDWEFLKTRADLSDWALFDRVFPSAEAHDRKPNI GFYQHVINETGLNPSNTVFVDDRIENVVSARSAGMHGIVFDDINNVIRQLKNLCE DPIHRARSFLYANKKCLNTVSTDGTIVSENFSQLLILEAIGDESLVDFVRHEGRFNF FQGEAKLIMTNHYPDDFDTTSIGLTVVPYIDDKTRNRVMDEILAYQSEDGIVLVYFD HKRPRIDPVYVCVNVLTLFYRYGRGHQLQKTLDWVEQVLINRACASGTFYYATEEQ FLFFLSRLIQSSPDVRQRLEGVFKRRVVERFGADGDALAMAMRIHTAASVGLVDH VDLDKLFALQQNDGSWRDSAFYRFPSARQLASNDGLTTAI/AIQAIQAAERLREDG
NVL SEQ ID NO: 33 - CONA ACgO06372
ATGAGGCGAAACGTACTCAACAAAGCAACACATTCTCAGTCACCAT TGAAGCCCAACATCACGACGCTCATATTTGACTTGGGCGACGTACTTCTCACG TGGTCCGACTCAACACCTAAATCTCCACTGCCCCCAAAAATTGTCAAGGGAAT ACTACGTTCACTGACCTGGTTTGAGTACGAGAAAGGGAACTTGACAGAGTCC CAGACCTACGGGCAAGTTGCTCAGGAATTTGGAGTGGATGCTTCCGAAGTCA AAGCTTCCTTCGAAGCAGCTCGCGACTCGCTCAAGAGCAACCCAATGCTTCT CCAGTTGATCCGTAGCCTCAAAGACTCTGGCCACGTCATTTACGCAATGTCTA ACATATCTGCTCCCGACTGGGAATTTTTGAAGACGCGGGCAGACCTCTCAGAT TGGGCTCTTTTTGACAGAGTCTTCCCTTCTGCCGAAGCGCATGACCGCAAGC CGAACATTGGTTTCTATCAGCACGTCATAAACGAGACTGGTCTGAACCCGTCC AACACTGTCTTTGTCGATGACAGGATCGAGAATGTTGTATCCGCACGCTCAGC AGGAATGCACGGGATCGTGTTTGACGACATAAATAATGTGATCCGACAGTTGA AAAACCTCTGCGAGGATCCGATTCACCGCGCACGATCTTTTCTTTATGCAAATA AGAAGTGTTTGAATACGGTTAGCACAGATGGCACAATTGTGAGCGAGAACTTC TCGCAATTGTTGATCCTTGAGGCCATTGGCGACGAAAGCCTAGTCGACTTTGT GAGGCATGAGGGCCGATTCAACTTCTTCCAGGGGGAGGCCAAACTCATCATG ACGAATCACTACCCCGATGATTTCGATACTACATCCATAGGTTTAACCGTTGTT CCATATATTGACGACAAGACTAGAAATAGAGTTATGGATGAGATCCTGGCCTAC CAAAGCGAAGACGGCATTGTGCTGGTATACTTTGACCACAAGCGCCCCAGGA TTGATCCTGTTGTCTGTGTCAATGTCCTCACCCTCTTCTATAGGTATGGCCGTG GGCACCAGCTTCAAAAGACACTGGATTGGGTCGAACAGGTCCTGATCAACCG TGCGTGTGCGTCCGGCACGTTCTATTACGCAACAGAGGAACAATTCCTCTTTT TCCTCTCCCGCCTGATCCAAAGCTCTCCGGACGTACGACAGCGGTTGGAAGG GGTCTTTAMAAGAAGAGTAGTCGAGCGGTTTGGTGCAGACGGCGACGCTCTC GCTATGGCGATGCGCATTCACACCGCGGCGAGCGTGGGCCTCGTTGACCAT GTCGATCTTGACAAGCTGTTCGCATTGCAGCAAAATGACGGTTCTTGGAGAGA CAGCGCTTTCTACAGATTTCCGTCGGCCAGGCAACTGGCTAGTAACGACGGC TTGACGACTGCAATCGCTATTCAGGCCATTCAAGCTGCGGAGAGGCTCAGGG
AGGATGGGAACGTGCTTTGA SEQ ID NO: 34 - cDNA otimizado ACgO06372
ATGCGCCGTAATGTCCTGAACAAAGCAACCCATAGCCAGTCACCGT TGAAACCGAATATCACCACGCTGATTTTTGACTTGGGCGATGTCCTGCTGACC TGGAGCGACAGCACTCCGAAATCTCCGTTGCCGCCGAAGATCGTCAAGGGC ATCCTGCGTAGCCTGACTTGGTTCGAGTACGAAAAGGGCAATTTGACCGAAA GCCAAACGTATGGTCAGGTCGCGCAAGAATTTGGTGTGGATGCCTCTGAAGT GAAGGCCAGCTTTGAGGCTGCGCGTGATAGCTTGAAATCGAATCCGATGCTG CTGCAGCTGATTCGCAGCCTGAAAGATTCCGGTCACGTGATCTACGCCATGA GCAACATCAGCGCGCCTGATTGGGAATTTCTGAAAACCCGCGCTGACCTGTC TGACTGGGCCCTGTTTGACCGCGTGTTCCCGTCTGCCGAGGCACATGACCG CAAACCGAACATTGGCTTTTACCAACACGTGATCAATGAAACGGGTCTGAATC CATCCAATACCGTGTTCGTTGACGACCGTATTGAAAACGTTGTTAGCGCACGT AGCGCTGGTATGCACGGTATCGTTTTCGATGACATTAACAACGTCATTCGCCA GCTGAAGAATCTGTGCGAGGACCCAATTCACCGTGCACGTTCCTTTTTGTATG CGAACAAAAAGTGCCTGAATACCGTGAGCACCGATGGTACGATCGTCAGCGA GAACTTTAGCCAGCTTCTGATTCTGGAAGCCATTGGTGACGAGTCCCTGGTAG ACTTCGTCCGCCATGAGGGCCGTTTTAACTTCTTCCAGGGTGAGGCAAAGCT GATCATGACCAATCACTACCCGGACGATTTCGATACCACGAGCATTGGTCTGA CCGTTGTCCCGTATATOEGATGACAAAACGCGTAATCGTGTGATGGATGAAATCC TGGCGTATCAGTCCGAGGATGGTATCGTTCTGGTGTACTTCGATCACAAGCGT CCGCGCATTGACCCGGTCGTTTGTGTGAACGTTCTGACGCTGTTCTACCGCT ATGGTCGTGGCCATCAACTGCAGAAAACCCTGGACTGGGTTGAGCAAGTCCT GATTAATCGTGCGTGTGCGAGCGGCACGTTCTACTACGCGACCGAAGAACAG TTCCTGTTTTTCCTGAGCCGTCTGATTCAGTCGAGCCCTGACGTGCGCCAAC GTCTGGAAGGCGTGTTCAAGCGTCGTGTCGTTGAGCGCTTTGGTGCGGACG GTGATGCCCTGGCAATGGCGATGCGTATCCATACCGCAGCGAGCGTTGGCCT GGTGGACCACGTGGATCTGGATAAGCTGTTCGCGCTGCAACAGAACGACGGT AGCTGGCGCGATAGCGCGTTTTATEGTTTTCCGAGCGCGCGTCAACTCGCGA GCAACGACGGCTTGACCACGGCAATTGCTATTCAGGCCATCCAAGCGGCTGA
GAGATTACGTGAGGATGGTAACGTTCTGTAA KIA75676.1 SEQ ID NO: 35 - proteína KIA75676.1
MVRALILDLGDVLFNWDAPKSTPVSRKTLSQMLHSDIWGEYECGQLT EPESYKALASRYSCQAQDVADTFYLARESLRLDATFKTFLQDLKQRANGSLRVY GMSNISQPDYEVLLSKADDLSLFDKIFPSGHVGMRKPDLAFFRHVLREISTASEDI VFVDDNLENVTSARSLGMQGIVFRDKEDVORQLRNLFGSPAERGREYLSINKTKL QSVTTTNIPILDNFGQLLILEATRDPDLVSMHPGQRTWNFFIGSPTLTTDAFPDDM DTTSLGLSIIPPSPEIAASVMDEIVTRLNKDGIVPTYFDSTRPRVDPIVCVNVLTLFA KYGREDELSGTIAWVRDVLYHRAYLAGTRYYASPEAFLFFFTRFTRNLRPGPRKQ ELTALLSQRLQERNKTPVDALALSMRIIACLTLGIESPADDVATLTGMQCGDGGWP ACVIYKYGAGGLGITNRGVSTAFAVKAITTTPLAVQPEVSVSAGAGGSSRPVGAD AAAVSLRPRWRAVVQSLHPLSRVGGLVAVIFAALHFNLAWLYNVSLASRIV
SEQ ID NO: 36 - CDONA KIA75676.1
ATGGTCCGCGCACTGATTCTCGATCTCEGGCGACGTCCTCTTCAACT GGGACGCCCCAAAGTCAACCCCCGTTTCCCGCAAGACACTCAGCCAGATGCT GCATAGCGACATCTGGGGCGAATACGAATGTGGCCAACTGACAGAGCCGGAA AGCTACAAGGCGCTTGCCAGCCGCTATTCTTGCCAGGCTCAAGATGTTGCAG ATACCTTCTATCTAGCCCGCGAATCGCTGAGGCTCGATGCGACCTTCAAGACC TTCCTGCAGGACTTGAAGCAGAGGGCCAACGGCTCACTTCGCGTATATGGGA TGTCCAACATCTCCCAGCCCGATTATGAGGTCCTGCTGTCCAAGGCGGATGA CTTGAGCCTGTTTGACAAGATCTTCCCATCCGGCCACGTCGGGATGCGTAAG CCTGACCTTGCGTTTTTTCGACATGTCCTGCGTGAGATCTCGACGGCCAGCG AGGATATTGTGTTTGTTGACGACAACCTGGAGAACGTGACATCTGCCCGGTCT CTGGGCATGCAGGGGATTGTCTTTCGCGACAAGGAGGATGTACAGAGACAGC TGCGGAACCTCTTTGGCAGTCCTGCTGAACGTGGAAGGGAGTATTTGTCCAT CAACAAGACAAAGCTCCAGAGCGTCACGACGACCAATATCCCCATTCTCGACA ACTTTGGCCAGCTCCTTATCCTEGAAGCCACCAGAGACCCAGACCTGGTGTC CATGCATCCTGGACAGAGGACCTGGAACTTTTTCATCGGATCTCCAACTCTGA CAACGGACGCCTTCCCAGACGATATGGACACCACCTCACTTGGCCTTTCTATT ATACCCCCAAGTCCCGAGATTGCAGCGTCCGTGATGGATGAGATTGTGACCC GCCTGAACAAGGACGGCATTGTCCCAACATATTTTGACAGCACCAGACCCCG CGTCGACCCGATCEGTCTGCGTCAACGTTCTCACCCTCTTCGCTAAATACGGCC GCGAAGACGAGCTGTCCGGGACCATAGCCTGGGTGCGCGATGTGCTGTATCA
CAGGGCCTACCTTGCAGGGACCAGATACTACGCATCCCCAGAAGCATTCCTTT TCTTCTTCACGCGCTTCACCCGAAACCTGCGCCeGGGCCEGCGCAAGCAGG
AGCTCACGGCGCTGCTGTCCCAGCGCCTGCAGGAGCGCAACAAGACGCCC GTTGACGCACTTGCGCTCTCGATGCGGATTATTGCGTGCCTCACGCTGGGTAT TGAATCCCCCGCTGACGACGTGGCTACCCTCACGGGCATGCAGTGTGGGGAT GGCGGCGTEGCCGGCCTETGTCATCTACAAGTACGGCGCCGGTEGGCTEGGÇE GATCACGAACAGGGGGGTCTCGACCGCGTTTGCTGTCAAGGCAATCACTACT ACTCCTTTGGCGGTGCAGCCTGAAGTTAGTGTCAGCGCAGGTGCAGGAGGC AGCAGTCGCCCTGTGGGTGCCGATGCTGCTGCAGTCTCGCTCCGCCCGAGA TGGCGAGCTGTTGTGCAGAGTCTCCATCCGCTCTCTCGGGTTGETEGGGTTEG TGGCCGTCATTTTTGCTGCACTGCATTTCAACTTGGCCTGGCTTTATAATGTGT
CCCTTGCTAGTAGGATCGTTTAG SEQ ID NO: 37 - CDNA otimizado KIA7T5676.1
ATGGTTCGTGCATTGATTTTGGATTTGGGTGATGTGTTGTTTAACTG GGATGCGCCTAAGAGCACCCCGGTTTCCCGCAAGACTCTGAGCCAAATGCTG CACTCGGATATTTGGGGCGAGTACGAGTGTGGTCAACTGACTGAGCCGGAGT CCTATAMAGCCCTGGCGAGCCGCTATAGCTGCCAGGCGCAAGATGTCGCTGA CACCTTTTACCTGGCGCGTGAGAGCCTGCGTCTGGACGCAACGTTTAAGACC TTCCTGCAAGATCTGAAGCAACGCGCCAACGGTTCTCTGCGTGTCTATGGTAT GAGCAATATCAGCCAGCCGGATTACGAAGTCCTGCTGAGCAAAGCTGACGAT CTCAGCCTGTTTGACAAAATCTTTCCGTCGGGTCACGTTGGTATGAGAAAGCC TGACCTGGCGTTTTTCCEGTCACGTTCTGCGTGAGATCAGCACGGCTAGCGAA GATATTGTGTTTGTTGACGACAATTTGGAAAACGTCACGTCTGCACGCTCCCT
GGGTATGCAAGGCATCGTCTTTCGTGATAAGGAAGATGTCCAGCGCCAGCTG CGCAATCTGTTCGGTTCCCcGGCAGAGCGCGGTCGTGAGTATCTGAGCATTA
ATAAGACCAAACTGCAGAGCGTGACCACCACCAATATCCCGATTCTGGACAAC TTCGGTCAGTTGCTGATCCTGGAAGCTACCCGTGACCCGGATTTAGTCAGCAT GCATCCAGGCCAACGTACGTGGAACTTCTTCATTGGCAGCCCGACCTTGACG ACCGACGCGTTTCCGGACGATATGGACACGACTTCTCTGGGCCTGAGCATCA TCCCGCCGAGCCCGGAAATTGCAGCAAGCGTTATGGACGAAATCGTCACCCG TCTGAATAAAGATGGTATTGTGCCGACCTACTTCGACAGCACGCGTCCACGTG TGGACCCGATCGTCTGCGTTAACGTCCTGACCTTGTTTGCGAAATATGGTCGT
GAAGATGAACTGAGCGGCACGATTGCGTGGGTCCGCGACGTTCTGTATCATC GCGCATACCTGGCGGGCACGCGCTACTACGCGTCCCcAGAGGCCTTCCTGTT
CTTCTTTACGCGTTTCACCCGCAATCTGCGTCCGGGTCCGCGTAAACAAGAAC TTACGGCGCTGCTGAGCCAGCGTCTGCAGGAACGCAACAAGACGCCGGTTG ACGCTCTGGCCCTGAGCATGCGTATCATEGCCTGTCTGACCCTGGGCATTGA GAGCCCGGCAGACGACGTGGCCACCCTGACCGGTATGCAGTGTGGTGATGG TGGCTGGCCGGCGTGCGTGATCTACAAATATGGTGCGGGTGGCTTGGGTATC ACGAATCGTGGCGTTAGCACTGCCTTCGCGGTGAAAGCGATTACGACCACCC CGCTGGCAGTGCAGCCAGAAGTCAGCGTCAGCGCTGGTGCCGGCGGCTCC AGCCGCCCGGEGTTGETGCGGATGCGGCAGCGGTTAGCTTGCGTCCEGCGTTEG CGTGCGGTTGTGCAGAGCCTGCATCCGCTGAGCCGCGTGGGTGGCCTEGTT GCCGTGATCTTCEGCGGCACTGCACTTTAACCTGGCGTGGCTGTACAACGTAA
GCCTGGCTAGCCGTATTGTGTAA XP 001820867.2 SEQ ID NO: 38 - proteína XP. 001820867.2
MTRWKSSQYQAIIFDLGGVILTWDLPEDTVISAQIFKRMLTSQTWSDY ERGNLSENGCYQRLAEDFGIDSADIAHTVRQARESLVTDTAIMNIISEIRAGANHIAI! FAMSNISQPDYAALLLDHRGMCSFDRVFPSGCYGTRKPELSFYNKVLREIDTPPE NVIFVDDQLENVISAQSIGIHGIAYTNAAELGRQLRNLIFDPVERGREFLRRNAGEF HSITETDQIVRENFSQLLILEATGDKSLVSLEYHQKSWNFFQGNPILTTETFPDDVD TTSLALMTLPTDTKTANLLLDQILGLVNADEIVTTYFDQTRERIDPVYVCVNVLRLFC TYGRGIALPLTLOWVYDVLAHRAYINGTRYYTSPESFLYFVGQLCRFSTGVLALRP LETLLIDRLKERLQVKADPLSLAMRILTCLSVGVSQVEVDLRELLSMQCEDGSWE
HCPFTRYGLSKVSIGNRGLTTAFVWVKAVEMCRGS SEQ ID NO: 39 - CONA XP. 001820867.2
ATGACTCGATGGAAATCGTCCCAATACCAAGCAATTATCTTTGACCT AGGCGGTGTCATTTTAACATGGGACCTCCCGGAAGACACTGTGATATCGGCC CAGATCTTTAAGAGAATGCTCACATCGCAGACATGGTCAGATTATGAGCGCGG AAATCTCAGCGAAAATGGTTGCTACCAGAGGTTGGCCGAGGATTTTGGCATTG ACTCTGCCGACATTGCACATACCGTTAGACAAGCACGGGAATCCCTTGTCACT GATACCGCTATCATGAACATTATATCTGAGATCAGAGCTGGGGCTAACCATATT GCTATCTTCGCTATGTCGAACATCTCCCAACCAGATTATGCGGCTCTGCTCCTT GATCATCGCGGGATGTGCAGTTTTGACCGGGTGTTCCCATCTGGATGCTACG GGACAAGGAAACCAGAGCTCTCATTCTATAACAAAGTCTTGCGGGAGATTGAC ACGCCACCGGAAAACGTCATCTTTGTCGATGATCAGCTGGAAAATGTGATCTC TGCGCAGTCCATTGGCATACACGGGATTGCCTATACGAATGCTGCTGAACTCG GTCGACAGCTTAGGAACCTAATATTTGACCCTGTAGAGAGGGGTAGGGAATTC TTACGGCGCAATGCTGGAGAGTTCCATAGCATCACTGAAACCGATCAAATTGT TCGGGAAAATTTCTCACAGTTGCTCATTCTAGAAGCGACTGGTGATAAGAGTC TGGTATCTCTTGAATATCACCAGAAGAGCTGGAATTTCTTCCAAGGAAACCCTA TTCTCACGACAGAGACATTCCCAGATGATGTTGACACAACATCTCTTGCCTTG ATGACTCTACCTACAGACACAAAAACTGCAAATTTGTTACTCGACCAGATTTTG GGGCTAGTCAACGCTGATGAAATCGTAACAACATACTTTGACCAGACCCGAGA ACGGATCGATCCAGTAGTCTGCGTCAATGTCCTTCGTCTCTTTTGCACCTACG GCCGGGGCATTGCGCTCCCTTTGACTCTTCAGTGGGTGTACGACGTCCTCGC TCATCGGGCATATATAMACGGTACACGTTACTACACAAGTCCCGAAAGCTTCCT ATACTTCGTCGGTCAACTTTGTCGATTCTCAACAGGGGTACTGGCACTTCGGC CGCTGGAAACGTTGCTTATAGATCGTCTCAAGGAACGTCTTCAGGTCAAAGCA GATCCTCTATCACTCGCTATGCGGATCTTGACCTGTTTGTCCGTTGGTGTGTCT CAAGTTGAAGTCGATCTCCGAGAGTTGCTCTCGATGCAGTGTGAAGATGGCT CGTGGGAACATTGTCCATTCACCCGGTATGGTTTGTCCAAAGTGAGCATTGGC AATCGGGGCCTTACAACTGCTTTTGTGGTCAAGGCGGTTGAAATGTGTCGAG
GCAGTTAG SEQ ID NO: 40 - cCDNA otimizado XP. 001820867.2
ATGACTCGTTGGAAAAGCTCTCAATATCAGGCAATCATTTTCGATCOT GGGCGGTGTTATTCTGACCTGGGACTTGCCGGAAGATACGGTTATCTCCGCG CAAATCTTTAAGCGTATGCTGACCAGCCAGACCTGGTCCGATTATGAGCGCGG TAATCTGAGCGAGAACGGCTGCTATCAACGTTTGGCGGAAGATTTCGGCATCG ATAGCGCCGATATTGCCCACACCGTCCGTCAGGCACGTGAGTCCCTGGTGAC CGACACCGCCATCATGAATATCATCTCCGAGATCCGTGCAGGCGCGAACCAC ATCGCAATTTTCGCGATGAGCAACATCTCACAGCCGGATTACGCTGCGCTGCT GCTGGACCATCGCGGTATGTGCAGCTTTGACCGCGTCTTTCCGAGCGGTTGET TACGGCACCCGTAAGCCTGAGCTGAGCTTCTACAATAAAGTGCTGCGTGAAAT TGACACCCCGCCGGAAAATGTTATTTTCGTTGACGATCAATTGGAAAATGTGAT TAGCGCGCAAAGCATTGGTATTCATGGCATTGCGTATACGAATGCCGCGGAAC TGGGCCGCCAGCTGAGAAACCTGATCTTCGATCCGGTGGAGCGCGGTCGTGE AGTTCCTGCGTCGTAACGCTGGTGAGTTTCACTCTATTACGGAAACGGACCAG ATTGTGCGCGAGAACTTCAGCCAGCTGCTGATTCTGGAAGCGACCGGTGACA AAAGCCTGGTTAGCCTGGAATACCACCAAAAGTCGTGGAACTTCTTCCAAGGT AACCCAATCCTGACGACGGAAACCTTCCCGGACGATGTTGACACTACTAGCCT GGCTCTGATGACGCTGCCGACGGACACCAAGACCGCGAATCTGTTGCTGGA CCAGATTCTGGGTTTGGTTAATGCCGATGAAATTGTGACTACGTACTTCGACCA GACCCGTGAGCGTATCGATCCAGTGGTCTGTGTGAATGTCCTGCGCCTGTTC TGTACGTACGGCCGCGGCATCEGCGCTGCCGCTGACCCTGCAATGGGTCTAC GATGTGCTGGCGCACCGCGCATACATTAACGGTACGCGTTATTACACCAGCCC GGAGAGCTTTCTGTATTTTGTCGGTCAGCTCTGTCGTTTTAGCACCGGTGTGC TGGCACTGCGTCCGCTGGAGACTCTGCTGATTGATCGTCTGAAAGAGCGCCT GCAAGTTAAAGCTGACCCGCTGAGCCTGGCAATGCGCATCCTTACGTGCTTAT CTGTCGGTGTCAGCCAGGTTGAAGTGGACTTGCGTGAGTTGTTGAGCATGCA GTGCGAGGACGGTAGCTGGGAGCATTGCCCGTTCACCCGCTACGGCCTGAG CAAGGTTTCCATCGGTAACCGTGGCCTGACCACGGCGTTTGTGGTTAAAGCC
GTCGAGATGTGCCGTGGCAGCTAA CENG60542.1 SEQ ID NO: 41 - proteína CEN60542.1
MVRALILDLGDVLFNWDAPASTPISRKTLGQMLHSEIWGEYERGHLTE DEAYNALAKRYSCEAKDVAHTFVLARESLRLDTKFKTFLOTLKQNANGSLRVYGM SNISKPDFEVLLGKADDWTLFDKIFPSGHVGMRKPDLAFFRYVLKDISTPVEDVVF VDDNLDNVTSARSLGMRSVLFHKKDEVQRQLTNIFGSPAERGLEYLSANKTNLQ SATTTDIPIQDNFGQLLILEATEDPSLVRMEPGKRTWNFFIGSPSLTTDTFPDDLDT TSLALSIVPTSPDVVNSVIDEIISRRDKDGIVPTYFDNTRPRVDPIVCVNVLSMFAK YGREHDLPATVAWVRDVLYHRAYLGGTRYYGSAEAFLFFFTRFVRNLRPGTLKQ DLHALLSERVRERLNTPVDALALSMRIQACHALGFDAPADIATLITMQDEDGGWP AAVIYKYGAGGLGITNRGVSTAFAVKAITGSPVKTETNIGGDGARAVSAMSSLEAR
RLQPISSVGDWVRFIIASLHVHLAWLWNVLLLSKVV SEQ ID NO: 42 - CONA CEN60542.1
ATGGTCCGCGCACTCATCCTCGATCTCGGCGATGTCCTCTTCAACT GGGACGCGCCTGCGTCCACCCCCATTTCACGCAAGACCCTCGGCCAGATGC TGCATAGTGAGATCTGGGGTGAGTATGAACGTGGCCATTTGACAGAAGACGA GGCATACAACGCACTCGCGAAGCGGTATTCCTGCGAGGCCAAGGATGTCGCA CATACCTTTGTCCTGGCACGAGAATCGCTGCGGCTCGACACGAAATTCAAAAC GTTTCTGCAGACTCTAAAGCAGAATGCCAACGGCTCCCTTCGTGTCTATGGCA TGTCGAATATATOEGAAACCGGATTTCGAAGTCCTGCTGGGCAAGGCCGATGAC TGGACTCTGTTTGACAAGATCTTCCCCTCTGGCCATGTCGGTATGCGCAAGCC AGATCTTGCCTTCTTCCGCTATGTGCTCAAGGACATTTCAACGCCTGTCGAGG ATGTGGTGTTTGTTGACGATAACCTGGACAACGTGACGAGTGCTCGGTCTCT GGGCATGCGCAGCGTCCTCTTTCATAAGAAAGACGAGGTCCAGCGACAGCTC ACCAACATCTTTGGCAGCCCTGCTGAGCGGGGCTTGGAGTATCTCTCCGCCA ACAAGACGAATCTGCAGAGTGCTACCACGACAGATATCCCAATCCAGGATAAC TTTGGCCAACTTCTGATTCTCGAGGCCACTGAAGACCCATCGCTGGTCCGCAT GGAGCCCGGTAAGCGAACCTGGAATTTCTTCATOEGGTTCTCCATCCCTCACAA CCGACACCTTCCCCGACGATCTCGACACCACATCCCOTTGCCCTCTCCATCGTA
CCCACAAGCCCCGACGTCGTCAACTCGGTCATCGACGAGATTATCAGCCGTC GCGACAAGGACGGTATCGTCCCGACTTACTTCEGACAACACCCGCCcceeesT
GGACCCAATCGTCTGCGTAAACGTCCTCTCCATGTTCGCAAAGTACGGCCGC GAGCACGACCTCCCCGCAACAGTTGCGTGGGTCCGCGACGTCTTGTATCATC GAGCATACCTCGGCGGAACACGGTACTACGGGTCAGCTGAGGCCTTCCTCTT CTTCTTCACTCGCTTCGTTCGCAACCTCCGACCGGGAACTCTCAAGCAGGAT CTACACGCATTGCTATCAGAGCGCGTGCEGCGAGCGACTCAATACCCCCGTCG ACGCACTCGCCCTGTCAATGCGCATCCAGGCCTGTCATGCGCTGGGCTTTGA CGCCCCEGCAGACATTGCGACGCTCATCACAATGCAGGACGAGGACGGCGG GTGGCCGGCAGCCGTCATCTACAAGTACGGGGCCGGEGEGTTGGGGATCAC GAACCGGGGTGTTTCGACTGCGTTTGCCGTAAAGGCGATTACAGGGTCGCCC GTGAAGACTGAAACCAACATAGGCGGCGATGGAGCTCGCGCTGTCTCGGCC ATGTCCTCCTTGGAGGCGAGGAGGCTACAGCCGATCTCGTCGGTTGGGGACT GGGTGCGGTTTATCATTGCGTCGTTGCATGTCCATCTGGCTTGGCTTTGGAAT
GTTTTGCTTTTGAGCAAGGTTGTTTGA SEQ ID NO: 43 - cCDNA otimizado CEN60542.1
ATGGTTCGTGCGTTGATTTTGGATTTGGGTGATGTGTTGTTTAATTG GGACGCCCCTGCAAGCACTCCGATCAGCCGTAAGACCCTGGGCCAGATGCT GCATTCCGAGATTTGGGGTGAGTATGAGCGTGGTCACCTGACCGAAGATGAA GCGTACAACGCGCTGGCAAAGCGCTACAGCTGCGAGGCAAAAGACGTGGCG CATACTTTTGTTTTGGCGCGTGAAAGCCTGCGCCTGGATACCAAGTTTAAGAC TTTTCTGCAGACCCTGAAACAGAACGCGAACGGCTCGCTGCGTGTTTATGGTA TGTCCAATATCAGCAAACCGGATTTTGAAGTGCTGCTGGGTAAAGCTGACGAC TGGACCTTGTTCGACAAGATCTTCCCGAGCGGTCATGTCGGTATGCGCAAAC CGGACCTGGCTTTCTTTCGTTACGTGCTGAAAGACATCAGCACCCCGGTTGA GGATGTTGTGTTTGTTGACGATAACCTGGATAATGTGACGTCTGCCCGTTCCC TGGGTATGCGTAGCGTCCTGTTCCACAAAAAAGACGAAGTCCAACGTCAGCT GACCAACATTTTCGGTAGCCCTGCTGAGCGCGGTCTGGAGTATCTGTCCGCG AACAAGACCAATCTGCAAAGCGCAACCACCACCGACATCCCTATCCAAGACAA CTTTGGTCAATTACTGATTCTGGAAGCCACCGAAGATCCGAGCCTGGTACGCA TGGAACCGGGCAAGCGTACCTGGAATTTCTTCATTGGCTCTCCGAGCCTGAC GACGGATACCTTCCCGGATGACCTGGACACGACGAGCCTCGCACTGTCCATC GTGCCGACCAGCCCAGATGTTGTTAATAGCGTGATCGATGAGATCATCAGCCG TCGCGACAAGGACGGTATTGTGCCGACGTACTTTGATAACACGCGCCCGCGT GTGGACCCGATTGTTTGTGTTAACGTTCTGTCTATGTTCGCGAAATATGGCCGT GAGCACGATCTGCCGGCGACGGTCGCGTGGGTCCGCGACGTCCTCTATCAT CGCGCATACCTGGGTGGCACCAGATACTACGGTAGCGCGGAAGCCTTCCTTT TCTTCTTTACGCGCTTTGTGCGTAATCTGCGTCCGGGCACGCTGAAACAAGAT CTGCACGCGTTGCTGAGCGAGCGTEGTCCGTGAGCGCCTGAATACCCCGGTGÇ GATGCGCTGGCGCTGAGCATGCGCATTCAGGCTTGCCACGCACTGGGCTTTG ACGCCCCAGCTGACATCGCGACGCTGATTACCATGCAAGATGAAGATGGTGG CTGGCCGGCGGCAGTTATCTACAAATATGGTGCGGGTGGCCTGGGCATTACG AACCGTGGTGTGTCCACGGCATTCEGCGGTGAAGGCAATCACGGGTAGCCCG GTTAAAACCGAAACCAACATCGGCGGCGACGGTGCCCGTGCAGTGTCGGCC ATGAGCAGCCTGGAAGCCCGTCGTTTGCAGCCGATTTCTAGCGTCGGCGACT GGGTCCGTTTCATCATEGCATCACTGCACGTCCACCTGGCGTGGCTGTGGAA
TGTCCTGCTGCTGAGCAAAGTCGTTTAA XP 009547469.1 SEQ ID NO: 44 - proteína XP. 009547469.1
MSMIPRCSNLILDIGDVLFTWSPKTSTSISPRTMKSILSSTTWHQYETG HISQGDCYRLIGNQFSIDPQEVGLAFQQARDSLQPNVDFIHFIRALKAESHGTLRV FAMSNISQPDYAVLRTKDADWAVFDDIFTSADAGVRKPHLGFYKLVLGKIGADPN DTVFVDDKGDNVLSARSLGLHGIVFDSMDNVKRALRYLISDPIRRGREFLQARAG HLESETNTGIEIGDNFAQLLILEATKDRTLVNYMDHPNKWNFFRDOQPLLTTEEFPF DLDTTSIGTLATARDDGTANLVMDEMLQOYRDEDGIIQTYFDHERPRIDPIVCVNVL SLFYSRGRGSELAPTLEWVRGVLKHRAYLDGTRYYETGECFLFFLSRLLOSTKD AALHASLKSLFAERVKERIGAPGDALALAMRILACAAVGVRDEIDLRSLLPLQCED GGWEAGWVYKYGSSGVKIGNRGLTTALALNAIEAVEGRRTRPKSGKISRVSRHS
EVAAAPRSSTSSHRSNRSISRTFQAYFKASWTSMKQVAVA SEQ ID NO: 45 - CONA XP. 009547469.1
ATGTCCATGATACCCAGATGCTCGAATCTCATCCTCGACATCGGGG ATGTTCTCTTCACATGGTCTCCGAAGACGTCCACTTCGATCTCCCocoGcACC
ATGAAGAGCATACTGTCATCGACGACCTGGCACCAATACGAGACCGGGCACA TTTCACAGGGCGACTGCTACCGCCTCATAGGCAACCAGTTCTCCATCGATCCT CAGGAAGTCGGACTTGCATTCCAACAAGCTCGGGACTCATTGCAGCCTAATGT TGACTTCATTCACTTCATCCGCGCCCTCAAGGCGGAATCACACGGGACGCTG CGCGTCTTCGCTATGTCCAACATCTCTCAGCCCGATTACGCAGTTCTTCGGAC TAAGGACGCCGACTGGGCCGTTTTTGACGATATATTCACGTCTGCAGATGCTG GGGTTCGAAAGCCACACCTTGGGTTCTACAAGTTGGTACTCGGAAAGATCGG CGCCGATCCAAACGATACCGTCTTCGTCGATGACAAGGGGGACAATGTCCTC TCTGCACGGTCTCTCGGCCTTCATGGAATCGTCTTTGACAGTATGGACAACGT CAAGCGAGCCCTGCGCTACTTGATCAGCGACCCCATACGGCGAGGACGAGA GTTTCTCCAAGCGCGAGCCGGCCATTTGGAGTCGGAGACCAATACGGGCATC GAAATCGGTGATAATTTTGCCCAGCTCCTTATTOCTOEGAGGCCACGAAGGATAG GACACTCGTCAATTATATGGACCATCCGAACAAATGGAATTTCTTCCGAGATCA ACCGCTCCTCACAACGGAGGAGTTCCCTTTCGATCTCGATACGACATCTATTG GAACGCTTGCGACGCAGCGCGATGATGGGACTGCCAATCTAGTAATGGATGA GATGCTTCAGTACCGTGATGAGGATGGCATAATACAAACATATTTCGATCATGA ACGACCGAGGATAGATCCCATCGTCTGTGTCAACGTCTTGAGCCTTTTCTACT CCCEGGGEGTCGTEGTTCEGGAGCTAGCACCGACACTAGAGTGGGTGCGTGGTGE TCCTCAAGCACCGCGCGTATCTCGATGGAACGCGATACTACGAGACAGGCGA ATGCTTCCTITTTCTTCCTCAGCCGGCTCTTGCAATCAACCAAGGACGCCGCCT TGCACGCATCGTTGAAATCTTTGTTCGCCGAACGGGTCAAGGAGCGCATAGG GGCACCAGGGGACGCGCTGGCGCTGGCGATGCGTATACTGGCATGCGCAGC AGTGGGCGTGCGGGACGAGATCGATCTTCGATCACTATTACCTCTGCAGTGC GAGGATGGGGGGTEGGGAGGCAGGCTGGGTGTACAAGTATGGGTCTTCGGGA GTCAAGATCGGCAATCGTGGCCTCACGACTGCGCTTGCGCTCAATGCCATCG AGGCTGTGGAGGGACGTCGCACGAGGCCGAAGTCGGGTAAGATCAGCCGAG TCAGCCGTCATTCTGAGGTCGCAGCAGCGCCACGGTCTTCCACCAGCAGTCA TCGTTCTAATCGCTCGATCTCAAGGACATTCCAGGCGTACTTCAAGGCGTCGT GGACATCGATGAAACAGGTGGCCGTGGCGTGA
SEQ ID NO: 46 - CDNA otimizado XP 009547469.1
ATGAGCATGATTCCACGTTGTAGCAATCTGATTCTCGACATCGGTGA TGTGTTGTTTACGTGGAGCCCGAAAACCAGCACCAGCATTAGCCCGCGTACC ATGAAATCTATCCTGAGCTCTACCACCTGGCATCAATATGAGACTGGCCACATC AGCCAGGGTGATTGCTACCGCCTGATCGGTAATCAGTTCTCCATEGACCCGCA AGAGGTCGGTTTGGCCTTCCAGCAAGCCAGAGACAGCCTGCAACCGAATGTT GATTTCATCCATTTCATTCGTGCCCTGAAAGCTGAGTCGCACGGCACCCTGCG CGTTTTTGCGATGAGCAATATCAGCCAACCTGACTATGCAGTCCTGCGTACGA AAGACGCGGACTGGGCTGTTTTTGATGATATCTTCACGAGCGCGGATGCTGG TGTTCGTAAACCGCACCTGGGTTTTTATAMACTGGTCTTAGGCAAGATTGGCG CGGACCCTAACGACACCGTTTTTGTGGATGATAAGGGTGACAACGTCCTCTCT GCACGTTCCCTGGGTCTGCACGGTATCGTTTTTGATTCAATGGACAACGTGAA GCGCGCACTGCGCTACCTGATTAGCGACCCGATCCGCCGCGGCCGTGAATTT CTGCAGGCCCGTEGCGGGTCACCTGGAGTCCGAAACGAACACGGGTATTGAG ATTGGTGATAATTTCGCGCAATTGCTGATCCTGGAAGCGACCAAAGATCGTAC TCTGGTGAACTACATGGACCACCCGAACAAGTGGAACTTCTTCCGTGACCAG CCGCTGCTGACCACCGAAGAATTTCCGTTCGACCTGGACACGACCAGCATTG GCACGCTGGCCACCCAACGTGACGATGGTACGGCGAATCTGGTAATGGACGA AATGTTGCAGTATCGTGACGAAGATGGCATCATTCAGACCTATTTCGATCATGA GCGCCCGCGTATTGATCCGATTGTTTGTGTGAATGTGCTGTCTCTGTTCTACA GCCGTGGCCGTEGGCTCTGAGTTGGCGCCGACGCTGGAATGGGTGCGCGGT GTGTTGAAACATCGTGCGTACCTGGATGGTACGCGTTATTACGAGACTGGTGA GTGTTTCCTGTTTTTCCTGAGCCGTCTGCTGCAGAGCACCAAAGACGCAGCC CTGCACGCGAGCCTGAAGTCCCTGTTTGCAGAGCGTGTTAAAGAGCGCATCG GTGCGCCGGGCGATGCTCTGGCGCTGGCTATGCGCATCCTGGCGTGCGCCG CTGTTGGTGTGCGCGATGAAATTGATTTGCGTAGCCTGCTGCCGCTGCAATG CGAAGATGGCGGCTGGGAAGCGGGCTGGGTCTACAAATACGGCAGCAGCGG TGTGAAGATTGGCAATCGCGGTCTTACCACGGCGCTGGCATTGAATGCTATCG AAGCCGTTGAGGGCCGTCGCACCCGCCCAAAGTCCGGTAAGATCAGCCGTG TTAGCCGTCATAGCGAAGTCGCAGCGGCACCGCGTTCCTCGACGAGCAGCC ACCGTAGCAACCGTAGCATTAGCCGCACCTTCCAGGCATATTTTAMAGCGAGC TGGACCAGCATGAAACAAGTCGCAGTGGCGTAA
KLO09124.1 SEQ ID NO: 47 - proteína KLO09124.1
MSIHGSSMSSYSSTVPSMTSSPASTSTPSSPASSIHEIGPVPEARRKG QCNALIFDLGDVLFTWSAETKTTISPKLLKKILNSLTWFEYEKGNIGEQEAYDAVAK EFGVPSSEVGAAFQCARDSLQSNPRLVSLIRELKSQYDLKVYAMSNISAPDWEVL RTKATPEEWAMFDRVFTSAAARERKPNLGFYRQVVEATGVDPARSVFVDDKLDN VISARSVGLNAIIFDSFENVARQLKNYVADPIGRAEAWLRDNAKKMLSITDAGVVV YENFGQMLILEATGDRSLVDYVEYPRLFNFFQGNGVFTTESFPCDLDSTSIGLTVT NHVDEKTRHSVMDEMLTYKNEDGIIATYFDATRPRIDPVYVCANVLTFFYKNGRGE ELNETLDWVYDILLHRAYLDGTRYYFGSDTFLFFLSRLLSESPSVYARFAPVFQER VKERMGATGDAMSLAMRIIAAATVKIQDRVDCDALLOQOTQAQEDDGGFPIGWMYKYG
ATGMLLGNKGLSTALAIQAIKAVESFP SEQ ID NO: 48 - CONA KLO09124.1
ATGTCGATTCACGGTTCTTCTATGTCCTCCTATTCOTCGACTGTGCC GTCAATGACTTCCTCTCCCGCGTCCACTTCTACTCCEGTCGTCTCCTGCATCGT CGATCCATGAGATTGGTCCTGTCCCAGAAGCTCGACGAAAGGGACAGTGCAA CGCGCTGATCTTCEGACCTCGGAGACGTCCTCTTCACCTGGTCGGCAGAGACT AAGACCACCATTTCCCCGAAACTCCTGAAAAAGATCCTTAACTCCTTAACATGG TTCGAATACGAGAAGGGAAACATCGGGGAGCAGGAGGCGTATGACGCAGTC
GCAAAGGAGTTTGGCGTCCCGTCGTCCGAGGTCGGGGCCGCTTTCCAGTGC GCGCGCGATTCEGCTACAGAGCAATCCCeGCCTCGTCTCGCTCATCCGTGAGC
TGAAGTCGCAATATGATCTCAAGGTGTACGCCATGTCCAACATCTCTGCGCCG GACTGGGAAGTCCTAAGGACGAAGGCGACCCCTGAGGAGTGGGCAATGTTT GACCGCGTCTTCACGAGCGCGGCCGCGCGCGAGCGTAAGCCAAACCTCGGA TTCTACAGACAGGTTGTTGAGGCGACCGGCGTCGACCCCGCTCGCTCCGTG TTCGTCGACGATAAACTCGACAATGTCATCTCTGCGCGTTCAGTCGGATTAAAT GCGATCATCTTCGACTCATTTGAGAACGTCGCCCGGCAGCTCAAAAACTATGT CGCTGATCCTATOEGGACGGGCGGAGGCGTGGTTGCGCGATAACGCAAAGAA GATGTTGTCAATTACGGATGCCGGGGTGGTCGTATACGAGAATTTCGGCCAGA TGCTGATCTTGGAGGCAACAGGCGATAGGTCGCTTGTGGACTACGTCGAGTA CCCTCGTCTCTTCAACTTCTTCCAAGGCAATGGCGTCTTTACGACCGAGTCAT TCCCTTGCGACCTTGATTCGACTTCCATCEGGCTTAACCGTCACGAACCACGTC GATGAGAAAACAAGGCACAGCGTCATGGATGAGATGCTGACCTACAAAAATGA GGATGGTATCATTGCGACTTACTTTGATGCCACGCGTCCCCGAATTGACCCCG TCGTCTGCGCCAATGTCTTGACGTTCTTCTACAAGAACGGCCGAGGGGAGGA GCTCAATGAAACACTTGACTGGGTCTACGACATCCTCCTTCATEGCGCGTACC TCGATGGCACACGCTATTATTTCEGGCTCAGACACCTTCCTCTTCTTCCOTTTCOTC GACTTCTCTCCGAATCGCCATCCGTTTACGCCCGTTTCGCTCCGGTGTTCCAG GAGAGAGTCAAGGAGCGCATGGGGGCGACGGGAGATGCGATGTCCCTTGCG ATGCGCATCATCGCGGCCGCAACTGTCAAGATCCAAGACCGAGTCGACTGCG ACGCTCTGCTGCAGACGCAGGAAGACGACGGTGGATTCCCGATAGGTTGGAT GTACAAGTACGGGGCGACCGGGATGCTTCTGGGTAACAAGGGCTTGTCGACA
GCTCTGGCAATCCAAGCTATCAAAGCGGTCGAATCTTTCCCTTGA SEQ ID NO: 49 - cDNA otimizado KLO09124.1
GGATCCAAGCTTAAGGAGGTAAAAAATGTCGATTCACGGTAGCAGC ATGTCGTCTTATAGCAGCACGGTTCCATCTATGACTAGCAGCCCGGCTTCCAC GAGCACGCCGTCCAGCCCGGCCAGCAGCATCCACGAAATCGGCCCGGTCCC TGAGGCGCGTCGCAAGGGCCAATGCAATGCACTGATCTTCGACCTGGGTGAT GTTCTGTTTACCTGGAGCGCAGAAACCAAGACCACGATCAGCCCGAAGCTGC TGAAAAAGATTCTGAACAGCTTGACCTGGTTTGAGTATGAGAAAGGCAACATC GGTGAACAAGAAGCCTATGACGCCGTTGCGAAAGAGTTCGGTGTGCCGAGCT CTGAGGTTGGCGCTGCGTTTCAATGTGCGCGTGACTCCCTGCAAAGCAATCC GCGTTTGGTTAGCCTGATTCGTGAGCTGAAGTCCCAGTACGACCTGAAAGTG TACGCTATGAGCAATATTAGCGCGCCAGACTGGGAAGTGCTGCGTACTAAAGC GACCCCGGAAGAGTGGGCAATGTTCGATCGTGTCTTTACTTCTGCGGCGGCG CGTGAGCGTAAGCCGAACTTGGGCTTTTACCGCCAAGTCGTGGAAGCAACCG GTGTCGATCCGGCGCGTAGCGTTTTCGTCGATGATAAACTGGACAATGTGATC AGCGCGCGCTCTGTCGGTCTGAACGCTATTATCTTCGACTCCTTCGAAAACGT CGCCCGTCAGCTGAAGAATTACGTCGCAGACCCGATTGGTCGCGCTGAGGC GTGGCTGCGCGACAACGCAAAGAAAATGCTGAGCATCACCGATGCGGGTGTT GTGGTTTACGAGAATTTTGGCCAGATGCTGATCCTGGAAGCTACCGGTGACC GTAGCCTGGTGGACTATGTGGAGTATCCGCGCCTCTTTAACTTCTTCCAGGGT AACGGCGTTTTTACGACCGAGAGCTTTCCATGCGATCTGGACAGCACCAGCA TCGGTCTGACTGTGACCAATCATGTGGACGAAAAGACTCGCCACAGCGTCAT GGACGAAATGCTGACCTACAAAAATGAAGATGGTATTATTGCGACGTACTTTGA CGCGACGCGCCCGCGCATTGACCCTGTTGTCTGTGCCAATGTTCTGACCTTC TTCTACAAAAACGGTCGTGGTGAAGAATTGAACGAAACCCTGGATTGGGTGTA CGACATTCTGCTGCATCGCGCGTATCTGGACGGTACGCGTTATTATTTOGGCT CCGATACGTTCCTGTTTTTCCTGAGCCGTCTGCTGAGCGAGTCTCCGAGCGT TTACGCGCGTTTTGCCCCGGTGTTTCAAGAGCGCGTGAAAGAGCGTATGGGC GCGACCGGTGATGCGATGAGCCTGGCCATGCGTATCATTGCAGCAGCAACCG TAAAGATCCAGGATCGTGTGGATTGCGACGCACTGTTGCAGACCCAAGAAGA TGATGGCGGTTTCCCGATTGGTTGGATGTACAAATATGGTGCGACCGGTATGT TGCTGGGCAACAAAGGCCTGAGCACGGCCCTGGCGATCCAGGCAATTAAAG
CCGTCGAGTCGTTCCCGTAAGGTACCATATATGAATTCATTAATCTCGAG OJI95797.1 SEQ ID NO: 50 - proteína OJI95797.1
MGSTKALVVDFGNVLCTWTPPRELSIPPKKLKQIMSSDIWLDYERGIY KSEDECYLAVATRFGVSPSDLSSVMKKARESLQPNTATLNHLSHLKKTQPGLRIY GLTNTPLPEQSSVRSIAQEWPIFDHIYISGILGMRKPDIGCYRLVLRKIGLPAESVVF IDDSPENILAAQSLGVHSILFOSHDQLSRALGNVLGDPIQRGHNFLLSNAKQMNS TTDKGVIIRDNFAQLLIIELTQNPDLVALETWDRTWNFFIGPPQLTTESFPNDLDTT SIALSVLPVDKEVVWSVMDEMLTFTNADGIFMTYFDRSRPRVDPVVCTNVLNLFC MHGRESEVAATFDWVLDVLRNSAYLSGSRYYSSPDCFLYFLSRLSCVVRDGTRR RELKSLLKQQVSQRIGADGDSVSLATRLLASNILGITNGRDRSRLLALQETDGGW PAGWVYKFGSSGVQIGNRGLSTALALKSIERQKGPVEAISSEPEAWWPSLRLDRL
LNVWPFIDWKGYSPS SEQ ID NO: 51 - CONA OJI95797.1
ATGGGTTCCACCAAGGCTCTTGTTGTTGACTTTGGGAATGTTTTGT GTACCTGGACACCACCCAGGGAGTTATCCATCCCGCCCAAGAAGCTGAAACA AATCATGTCTTCTGACATTTGGCTCGACTATGAACGGGGTATCTATAAGTCGGA GGACGAGTGCTACTTGGCGGTTGCAACTCGCTTCGGCGTCTCTCCCAGCGA CCTCTCCTCGGTGATGAAAAAGGCCCGCGAGAGCCTGCAACCAAACACCGC AACCCTGAATCATCTGTCTCATCTCAAAAAGACCCAGCCTGGCCTCAGGATAT ACGGTTTGACCAACACCCCTCTCCCAGAACAAAGCAGTGTACGATCCATCGC CCAGGAATGGCCTATCTTCGACCATATCTACATATCAGGCATCCTCGGAATGCG CAAGCCGGACATTGGCTGCTACAGGCTGGTGCTGCGAAAGATTGGGCTTCCA GCGGAGTCCGTGGTCTTCATTGATGATTCACCCGAGAACATCCTGGCCGCGC AGTCACTGGGAGTACACAGCATACTGTTCCAAAGCCACGACCAGCTCTCTCG TCAGCTTGGCAATGTGCTGGGTGATCCAATCCAGCGGGGCCATAACTTCCTAC TCTCGAACGCAAAGCAAATGAATAGTACGACCGACAAGGGAGTTATTATCCGG GACAACTTTGCGCAACTGCTGATCATCGAGCTGACGCAGAACCCAGACCTTG TGGCGTTAGAAACATGGGACCGTACCTGGAATTTTTTTATTGGACCTCCACAAT TGACAACTGAAAGCTTTCCCAATGATCTTGACACTACCTCCATCGCTCTCTCG GTTCTTCCGGTTGACAAAGAAGTGGTATGGTCTGTGATGGACGAGATGCTAAC GTTTACCAATGCGGATGGGATTTTTATGACCTATTTCGACCGATCACGCCCTCG AGTTGATCCGGTAGTTTGCACCAATGTCCTGAATCTTTTCTGCATGCATGGAC GGGAAAGCGAAGTTGCAGCCACATTTGACTGGGTGCTGGACGTTCTTCGAAA TTCGGCCTATTTATCAGGATCCAGATACTATTCTTCGCCTGATTGCTTTCTATAC TTTCTTTCACGGCTGAGCTGTGTGGTCCGAGACGGCACGCGACGCAGGGAG CTCAAGTCACTGTTGAAACAACAAGTGAGCCAGCGTATTGGCGCTGATGGTG ATTCCGTCTCTCTCGCCACTAGGCTACTTGCATCGAACATTTTAGGAATCACAA ATGGCCGTGATCGCTCCAGGCTTCTTGCTCTGCAGGAAACTGACGGTGGATG GCCTGCTGGGTGGGTTTATAMATTOEGGAAGCTCGGGGGTACAGATTGGCAAT CGGGGGCTCAGTACAGCCTTGGCGTTAAAATCAATTGAGCGTCAGAAGGGGC CTGTTGAGGCGATATCCAGTGAGCCAGAAGCGTGGTGGCCATCCCTCAGGCT TGACCGACTTCTCAACGTTTGGCCTTTCATCGACTGGAAGGGATATTCGCCGA
GTTGA SEQ ID NO: 52 - cDNA otimizado OJI95797.1
ATGGGTTCTACGAAAGCGTTGGTTGTTGATTTTGGTAATGTTCTGTG CACTTGGACGCCACCACGTGAATTGTCCATCCCGCCGAAGAAACTGAAGCAA ATCATGAGCAGCGACATTTGGCTGGACTATGAGCGTGGTATCTACAAATCGGA AGATGAGTGCTACCTGGCAGTTGCGACGCGCTTTGGTGTCAGCCCGTCCGAC CTGAGCTCCGTTATGAAAAAAGCCCGTGAGAGCCTGCAGCCGAATACCGCAA CGCTGAACCACTTGAGCCATCTGAAGAAAACCCAGCCTGGCCTTCGTATCTAC GGCCTGACGAACACCCCGTTGCCGGAACAGAGCTCAGTCCGTAGCATTGCG CAGGAATGGCCGATTTTTGACCACATCTACATTAGCGGCATCTTGGGTATGCG CAAACCGGATATTGGTTGTTACCGTCTGGTTCTGCGTAAGATCGGTCTGCCAG CGGAGTCCGTCGTATTCATOEGACGACAGCCCGGAGAACATTCTGGCAGCTCA ATCGTTGGGTGTCCATAGCATCCTGTTCCAGTCCCACGATCAGCTGAGCCGTC AGCTGGGCAATGTGCTGGGTGATCCGATTCAGCGCGGTCACAACTTCCTCCT GTCCAACGCGAAGCAAATGAACAGCACCACCGATAAGGGTGTGATTATCCGC GACAACTTCGCCCAGCTGCTGATTATTGAGCTGACCCAAAATCCGGATCTGGT TGCGCTGGAGACTTGGGACCGTACGTGGAATTTCTTTATTGGTCCGCCGCAA CTGACCACCGAGAGCTTTCCGAACGACCTGGACACCACGAGCATTGCCCTGA GCGTGTTGCCGGTGGATAAAGAAGTCGTTTGGTCTGTGATGGATGAGATGCT GACCTTCACCAACGCAGACGGCATCTTCATGACCTATTTCGATCGTAGCCGTC CGCGTGTTGACCCGGTCGTTTGTACCAATGTCCTGAATCTGTTTTGCATGCAT GGTCGCGAGAGCGAAGTGGCCGCGACGTTCGACTGGGTGCTGGACGETGCT GCGCAACAGCGCGTACCTGAGCGGTTCCCGTTATTACAGCAGCCCGGATTGT TTTCTGTATTTCCTGTCTCGTCTGAGCTGCGTCGTCCGTGATGGCACGCGTCG TCGTGAACTGAAAAGCCTGCTGAAGCAACAAGTTTCTCAACGTATCGGCGCT GACGGTGATTCCGTCAGCCTGGCCACCCGTTTGCTGGCGAGCAACATCCTG GGCATTACTAACGGTCGTGACCGCAGCCGTCTGCTGGCATTGCAAGAAACCG ATGGTGGCTGGCCTGCAGGCTGGGTCTATAAGTTTGGTAGCAGCGGCGTGCA AATTGGCAATCGCGGTCTGAGCACCGCGCTGGCTCTGAAGTCTATCEGAGCGC CAGAAAGGTCCGGTGGAAGCAATCAGCAGCGAGCCGGAAGCGTGGTGGCCT AGCTTACGCTTGGACCGCTTGCTGAATGTTTGGCCATTTATCGACTGGAAGGG
CTACTCCCCGAGCTAA Motivo semelhante a terpeno sintase classe | SEQ ID NO: 53 DDxx(D/E), em que x na posição 3 é K, N, R, Sou Q e x na posição 4 é L,1,G, PouT Motivo semelhante a terpeno sintase classe | SEQ ID NO: 54 DD(KQO/R)(L/VT)(D/E)NV Motivo semelhante a terpeno sintase classe | SEQ ID NO: 55 DD(N/K/S/Q)(L/G/P)(D/E)N(V/!)
Motivo semelhante a terpeno sintase classe || SEQ ID NO: 56 DxD (T / S) T, em que x na posição 2 é V, M, FouL Motivo semelhante a terpeno sintase classe || SEQ ID NO: 57 D(V/M/L/F)DTTS Motivo semelhante a terpeno sintase classe || SEQ ID NO: 58 D(V/M/L)D(T/S)TS Motivo conservado À SEQ ID NO: 59 SxXXxWxxYExG, em que x é qualquer aminoácido Motivo conservado B SEQ ID NO: 60 NFXQx(I/L)IXE, em que x é qualquer aminoácido Motivo conservado C SEQ ID NO: 61 (D/EXG/E)Ixx(T/V)YFDXxXxRXxRxDPxVxxNVL Motivo conservado D SEQ ID NO: 62 QxxDGx(W/F) XP 006461126.1 SEQ ID NO: 63 - proteína XP 006461126.1
MAPPQRPFTAIVFDIGDVLFQWSATTKTSISPKTLRSILNCPTWFDYER GRLAENACYAAISQEFNVNPDEVRDAFSQARDSLQANHDFISLIRELKAQANGRL RVYAMSNISLPDWEVLRMKPADWDIFDHVFTSGAVGERKPNLAFYRHVIAATDLO PHQTIFVDDKLENVLSARSLGFTGIVFDEPSEVKRALRNLIGDPVQRGGEFLVRNA GKLGSITRTTAKHESIPLDENFAQLLILEITGNRALVNLVEHPQTWNFFQGKGAQLTT EEFPFDLDTTSLGLTILKRSREIADSVMDEMLEYVDPDGIIQTYFDHRRPRFDPVV CVNALSLFYAYGRGEQLRSTLTWVHEVLLNRAYLDGTRYYETAECFLYFMSRLLA TSGDPDLHSLLKPLLKERVQERIGADGDSLALAMRILACDFVGIRDEVDLRTLLTL QCEDGGWEVGWMYKYGSSGISIGNRGLATALAIKAVDTMFQPQIRFSESPTDTLV
ENAIHKRRPSFSEKFLGKRPRSGSFRKPLQWILQGSKLRKSVEIGS SEQ ID NO: 64 - CONA XP. 006461126.1
ATGGCTCCGCCTCAGCGACCCTTTACTGCGATTGTCTTTGACATCG GGGATGTTCTATTCCAATGGTCTGCAACCACCAAAACCTCTATCTCACCAAAGA CACTCCGCTCTATTCTCAACTGTCCGACATGGTTTGACTATGAACGTGGACGC CTGGCAGAAAACGCTTGTTATGCCGCTATCTCACAAGAATTCAACGTCAACCC AGACGAAGTTCGCGACGCTTTCAGCCAAGCGCGCGACTCTCTCCAAGCAAAC CACGACTTCATCAGTCTCATCCGTGAGCTGAAGGCACAAGCAAATGGTCGTTT ACGTGTGTACGCCATGTCGAACATATCTCTTCCTGATTGGGAAGTGCTGCGGA TGAAACCTGCTGATTGGGATATTTTCGACCACGTCTTCACATCCGGTGCGGTT GGGGAACGCAAGCCCAATCTCGCCTTTTATOEGCCATGTTATOEGCGGCCACCOG ATCTGCAGCCTCATCAGACAATATTTGTTGACGATAAGCTGGAGAATGTTCTCT CAGCACGTTCCCTCGGGTTCACAGGCATCGTGTTTGACGAGCCCTCCGAGGT CAAACGTGCGCTTCGTAACCTCATTGGGGATCCTGTTCAACGAGGAGGTGAA TTCTTGGTTCGGAATGCCGGAAAGCTTGGCTCTATCACAAGGACTACTGCAAA GCACGAGTCAATCCCCCTCGACGAGAATTTTGCTCAGCTTCTTATTCTCGAGA TAACGGGGAACAGGTGCGTTAGCTTCTTGTAGGGTCTTCTGTCGTAATACTAA ATTTTTTCTGGTGTTTAGGGCTTTGGTCAACCTCGTTGAGCATCCTCAAACGT GGAATTTCTTCCAAGGTGCGCTGCTAAAATAAACATCCAGTTGCGTTTCGAAG CTCATTGTGGGCGTCCCGTCACAGGCAAGGGCCAGCTGACAACAGAAGAATT TCCATTCGATCTCGATACAACTTCTCTTGGTCTCACGATCCTCAAGCGAAGCA GGGAAATCGCCGATTCAGTCATGGATGAAATGCTGGAGTATGTCGATCCTGAT GGTATCATTCAGGCAAGTTTCATTTATOEGGCTTGAGAAAATAAAGACAAAAACG TTCTGATGGGGGGATGTTTCTAGACGTATTTCGATCATCEGGAGACCACGTTTT GATCCAGTCGTGTGTGTCAATGCATTAAGCCTCTTCTATGCTTACGGCCGCGG GGAGCAACTGCGGTCGACTTTGACATGGGTACATGAAGTCCTTCTCAATCGA GCCTACTTGGATGGCACACGGTACTACGAAACAGCCGAATGCTTCCTCTATTT CATGAGCCGACTTCTCGCCACTTCAGGCGACCCTGACCTTCACTCCCOTTCTTA AACCTCTTCTCAAAGAACGGGTGCAAGAACGCATTGGAGCTGATGGAGACTC TCTTGCACTCGCAATGCGTATTCTCGCCTGTGATTTCGTCGGAATCAGAGATG AAGTGGATTTACGCACACTTCTGACTTTGCAATGTGAAGATGGAGGTTGGGAA GTGGGTTGGATGTACAAGTATGGATCTTCCGGTATCAGTATCGGAAATCGTGG ACTGGCCACCGCGCTCGCTATCAAGGCCGTCGACACGATGTTTCAACCCCAA ATTCGGTTCTCTGAATCACCCACAGATACTTTGGTTGAAAACGCTATCCACAAA CGCCGTCCCTCATTTTCCGAAAAATTCOTCGGCAAACGTCCTCGCAGCGGAT CGTTCAGGAAACCTTTACAGTGGATACTGCAAGGTTCCAAGCTTCGCAAATCT
GTCGAAATAGGAAGCTAA SEQ ID NO: 65 - cCDNA otimizado XP 006461126.1
ATGGCACCACCGCAACGTCCGTTCACTGCAATTGTTTTCGATATTG GCGATGTTTTGTTCCAATGGTCTGCGACCACGAAAACCAGCATTAGCCCGAAA ACCCTGCGCAGCATTCTGAATTGTCCGACCTGGTTTGATTATGAGCGCGGCC GTCTGGCGGAAAATGCGTGTTACGCTGCGATCAGCCAAGAATTTAACGTCAAC CCGGACGAAGTTCGCGACGCCTTCAGCCAAGCGCGCGACAGCCTGCAGGC GAATCACGACTTCATCAGCCTGATTCGTGAGCTGAAAGCTCAGGCGAACGGT CGTCTGCGTGTCTACGCCATGTCTAATATCAGCCTGCCGGATTGGGAAGTCCT GCGTATGAAGCCAGCCGATTGGGACATCTTTGACCATGTATTTACCAGCGGTG CGGTGGGTGAGCGCAAGCCGAACCTGGCCTTTTATEGTCACGTCATCEGCGGC CACGGATCTGCAGCCGCACCAGACGATCTTCGTGGATGACAAACTGGAAAAC GTGCTGTCTGCGCGCTCGCTGGGCTTCACGGGTATCEGTGTTCGACGAGCCA AGCGAAGTCAAACGTGCGCTGCGTAATCTGATCEGGCGACCCGGTGCAGCGT GGTGGCGAGTTCCTGGTTCGTAATGCTGGCAAACTGGGTTCTATCACCCGTA CGACCGCAAAACATGAGAGCATCCCGCTGGATGAGAATTTTGCACAACTGTTG ATTCTGGAAATTACTGGTAACCGCGCACTGGTCAATCTGGTTGAGCACCCGCA GACGTGGAACTTCTTCCAGGGTAAGGGCCAGCTGACGACCGAAGAATTTCCT TTTGACCTGGATACGACGAGCCTGGGTCTGACGATCCTGAAGCGTAGCCGCG
AGATTGCCGACTCCGTCATGGACGAAATGTTGGAATACGTGGACCCTGACGG CATCATTCAGACCTACTTCGATCATCGTCGCCoGCGCTTTGACCCGGTTGTTT
GCGTTAATGCCCTGAGCCTGTTCTATGCATACGGCCGTGGTGAGCAACTGCG TTCCACCTTGACCTGGGTGCACGAAGTTCTGTTGAACCGTGCGTATTTGGATG GTACGCGTTACTATGAAACGGCCGAGTGCTTTCTGTATTTCATGTCCCGTCTG CTGGCAACCAGCGGTGACCCGGATCTGCATTCCCTGCTGAAGCCGTTGCTGA AGGAACGCGTGCAAGAGCGCATCGGCGCTGACGGTGACAGCCTGGCGCTG GCGATGCGCATTTTGGCATGTGATTTTGTTGGCATCCGTGATGAAGTGGATCT GCGTACCCTGCTGACCTTACAGTGCGAGGATGGCGGTTGGGAAGTGGGCTG GATGTACAAATACGGTAGCAGCGGTATTAGCATTGGTAACCGTGGTCTGGCAA CCGCATTGGCGATCAAAGCTGTTGACACCATGTTTCAACCGCAAATCCGTTTC AGCGAGAGCCCGACCGACACTCTGGTGGAGAACGCGATTCACAAGCGCCGC CCGAGCTTTTCAGAGAAATTTTTAGGTAAGCGTCCGCGTTCCGGTTCGTTCCG TAAACCGCTGCAATGGATTCTGCAGGGCAGCAAGCTGCGCAAGAGCGTCGA
GATCGGTAGCTAA XP 007369631.1 SEQ ID NO: 66 - cCDNA otimizado XP 007369631.1 para expressão de S. cerevisiae
ATGGCTTCTATCCACAGAAGATACACTACTTTGATCTTGGACTTGGG TGACGTTTTGTTCAGATGGTCTCCAAAGACTGAAACTGCTATCCCACCACAAC AATTGAAGGACATCTTGTCTTCTGTTACTTGGTTCGAATACGAAAGAGGTAGAT TGTCTCAAGAAGCTTGTTACGAAAGATGTGCTGAAGAATTCAAGATCGAAGCT TCTGTTATCGCTGAAGCTTTCAAGCAAGCTAGAGGTTCTTTGAGACCAAACGA AGAATTCATCGCTTTGATCAGAGACTTGAGAAGAGAAATGCACGGTGACTTGA CTGTTTTGGCTTTGTCTAACATCTCTTTGCCAGACTACGAATACATCATGTCTTT GTCTTCTGACTGGACTACTGTTTTCGACAGAGTTTTCCCATCTGCTTTGGTTG GTGAAAGAAAGCCACACTTGGGTTGTTACAGAAAGGTTATCTCTGAAATGAAC TTGGAACCACAAACTACTGTTTTCGTTGACGACAAGTTGGACAACGTTGCTTC TGCTAGATCTTTGGGTATGCACGGTATCGTTTTCGACAACCAAGCTAACGTTTT CAGACAATTGAGAAACATCTTCGGTGACCCAATCAGAAGAGGTCAAGAATACT TGAGAGGTCACGCTGGTAAGTTGGAATCTTCTACTGACAACGGTTTGATCTTC GAAGAAAACTTCACTCAATTGATCATCTACGAATTGACTCAAGACAGAACTTTG ATCTCTTTGTCTGAATGTCCAAGAACTTGGAACTTCTTCAGAGGTGAACCATTG TTCTCTGAAACTTTCCCAGACGACGTTGACACTACTTCTGTTGCTTTGACTGTT TTGCAACCAGACAGAGCTTTGGTTAACTCTGTTTTGGACGAAATGTTGGAATA CGTTGACGCTGACGGTATCATGCAAACTTACTTCGACAGATCTAGACCAAGAA TGGACCCATTCGTTTGTGTTAACGTTTTGTCTTTGTTCTACGAAAACGGTAGAG GTCACGAATTGCCAAGAACTTTGGACTGGGTTTACGAAGTTTTGTTGCACAGA GCTTACCACGGTGGTTCTAGATACTACTTGTCTCCAGACTGTTTCTTGTTCTITTC ATGTCTAGATTGTTGAAGAGAGCTGACGACCCAGCTGTTCAAGCTAGATTGAG ACCATTGTTCGTTGAAAGAGTTAACGAAAGAGTTGGTGCTGCTGGTGACTCTA TGGACTTGGCTTTCAGAATCTTGGCTGCTGCTTCTGTTGGTGTTCAATGTCCA AGAGACTTGGAAAGATTGACTGCTGGTCAATGTGACGACGGTGGTTGGGACT TGTGTTGGTTCTACGTTTTCGGTTCTACTGGTGTTAAGGCTGGTAACAGAGGT TTGACTACTGCTTTGGCTGTTACTGCTATCCAAACTGCTATCGGTAGACCACCA TCTCCATCTCCATOTGCTGCTTCTTCTTCTTTCAGACCATCTTCTCCATACAAG TTCTTGGGTATCTCTAGACCAGCTTCTCCAATCAGATTCGGTGACTTGTTGAGA
CCATGGAGAAAGATGTCTAGATCTAACTTGAAGTCTCAATAA XP 006461126 SEQ ID NO: 67 - cDNA otimizado XP 006461126 para expressão de S. cerevisiae
ATGGCTCCACCACAAAGACCATTCACTGCTATCGTTTTCGACATCG GTGACGTTTTGTTCCAATGGTCTGCTACTACTAAGACTTCTATCTCTCCAAAGA CTTTGAGATCTATCTTGAACTGTCCAACTTGGTTCGACTACGAAAGAGGTAGAT TGGCTGAAAACGCTTGTTACGCTGCTATCTCTCAAGAATTCAACGTTAACCCA GACGAAGTTAGAGACGCTTTCTCTCAAGCTAGAGACTCTTTGCAAGCTAACCA CGACTTCATCTCTTTGATCAGAGAATTGAAGGCTCAAGCTAACGGTAGATTGA GAGTTTACGCTATGTCTAACATCTCTTTGCCAGACTGGGAAGTTTTGAGAATGA AGCCAGCTGACTGGGACATCTTCGACCACGTTTTCACTTCTGGTGCTGTTGG TGAAAGAAAGCCAAACTTGGCTTTCTACAGACACGTTATCGCTGCTACTGACT TGCAACCACACCAAACTATCTTCGTTGACGACAAGTTGGAAAACGTTTTGTCT GCTAGATCTTTGGGTTTCACTGGTATCGTTTTCGACGAACCATCTGAAGTTAAG AGAGCTTTGAGAAACTTGATCGGTGACCCAGTTCAAAGAGGTGGTGAATTCTT GGTTAGAAACGCTGGTAAGTTGGGTTCTATCACTAGAACTACTGCTAAGCACG AATCTATCCCATTGGACGAAAACTTCGCTCAATTGTTGATCTTGGAAATCACTG GTAACAGAGCTTTGGTTAACTTGGTTGAACACCCACAAACTTGGAACTTCTTC CAAGGTAAGGGTCAATTGACTACTGAAGAATTCCCATTCGACTTGGACACTAC TTCTTTGGGTTTGACTATCTTGAAGAGATCTAGAGAAATCGCTGACTCTGTTAT GGACGAAATGTTGGAATACGTTGACCCAGACGGTATCATCCAAACTTACTTCG ACCACAGAAGACCAAGATTCGACCCAGTTGTTTGTGTTAACGCTTTGTCTTTG TTCTACGCTTACGGTAGAGGTGAACAATTGAGATCTACTTTGACTTGGGTTCAC GAAGTTTTGTTGAACAGAGCTTACTTGGACGGTACTAGATACTACGAAACTGCT GAATGTTTCTTGTACTTCATGTCTAGATTGTTGGCTACTTCTGGTGACCCAGAC TTGCACTCTTTGTTGAAGCCATTGTTGAAGGAAAGAGTTCAAGAAAGAATCGG TGCTGACGGTGACTCTTTGGCTTTGGCTATGAGAATCTTGGCTTGTGACTTCG TTGGTATCAGAGACGAAGTTGACTTGAGAACTTTGTTGACTTTGCAATGTGAA GACGGTGGTTGGGAAGTTGGTTGGATGTACAAGTACGGTTCTTCTGGTATCTC TATCGGTAACAGAGGTTTGGCTACTGCTTTGGCTATCAAGGCTGTTGACACTAT GTTCCAACCACAAATCAGATTCTCTGAATCTCCAACTGACACTTTGGTTGAAAA CGCTATCCACAAGAGAAGACCATCTTTCTCTGAAAAGTTCTTGGGTAAGAGAC CAAGATCTGGTTCTTTCAGAAAGCCATTGCAATGGATCTTGCAAGGTTCTAAGT
TGAGAAAGTCTGTTGAAATCGGTTCTTAA LoTps1 SEQ ID NO: 68 - cDNA otimizado LoTps1 para expressão de S. cerevisiae
ATGTACACTGCTTTGATCTTGGACTTGGGTGACGTTTTGTTCTCTTG GTCTTCTACTACTAACACTACTATCCCACCAAGACAATTGAAGGAAATCTTGTC TTCTCCAGCTTGGTTCGAATACGAAAGAGGTAGAATCACTCAAGCTGAATGTTA CGAAAGAGTTTCTGCTGAATTCTCTTTGGACGCTACTGCTGTTGCTGAAGCTT TCAGACAAGCTAGAGACTCTTTGAGACCAAACGACAAGTTCTTGACTTTGATC AGAGAATTGAGACAACAATCTCACGGTGAATTGACTGTTTTGGCTTTGTCTAAC ATCTCTTTGCCAGACTACGAATTCATCATGGCTTTGGACTCTAAGTGGACTTCT GTTTTCGACAGAGTTTTCCCATCTGCTTTGGTTGGTGAAAGAAAGCCACACTT GGGTGCTTTCAGACAAGTTTTGTCTGAAATGAACTTGGACCCACACACTACTG TTTTCGTTGACGACAAGTTGGACAACGTTGTTTCTGCTAGATCTTTGGGTATGC ACGGTGTTGTTTTCGACTCTCAAGACAACGTTTTCAGAATGTTGAGAAACATC TTCGGTGACCCAATCCACAGAGGTAGAGACTACTTGAGACAACACGCTGGTA GATTGGAAACTTCTACTGACGCTGGTGTTGTTTTCGAAGAAAACTTCACTCAAT TGATCATCTACGAATTGACTAACGACAAGTCTTTGATCACTACTTCTAACTGTG CTAGAACTTGGAACTTCTTCAGAGGTAAGCCATTGTTCTCTGCTTCTTTCCCAG ACGACATGGACACTACTTCTGTTGCTTTGACTGTTTTGAGATTGGACCACGCT TTGGTTAACTCTGTTTTGGACGAAATGTTGAAGTACGTTGACGCTGACGGTAT CATGCAAACTTACTTCGACCACACTAGACCAAGAATGGACCCATTCGTTTGTG TTAACGTTTTGTCTTTGTTCCACGAACAAGGTAGAGGTCACGAATTGCCAAAC ACTTTGGAATGGGTTCACGAAGTTTTGTTGCACAGAGCTTACATCGGTGGTTC TAGATACTACTTGTCTGCTGACTGTTTCTTGTTCTTCATGTCTAGATTGTTGCAA AGAATCACTGACCCATCTGTTTTGGGTAGATTCAGACCATTGTTCATCGAAAGA GTTAGAGAAAGAGTTGGTGCTACTGGTGACTCTATCGACTTGGCTTTCAGAAT CATCGCTGCTTCTACTGTTGGTATCCAATGTCCAAGAGACTTGGAATCTTTGTT GGCTGCTCAATGTGAAGACGGTGGTTGGGACTTGTGTTGGTTCTACCAATAC GGTTCTACTGGTGTTAAGGCTGGTAACAGAGGTTTGACTACTGCTTTGGCTAT CAAGGCTATCGACTCTGCTATCGCTAGACCACCATCTCCAGCTTTGTCTGTTG CTTCTTCTTCTAAGTCTGAAATCCCAAAGCCAATCCAAAGATCTTTGAGACCAT TGTCTCCAAGAAGATTCGGTGGTTTCTTGATGCCATGGAGAAGATCTCAAAGA
AACGGTGTTGCTGTTTCTTCTTAA EMD37666.1 SEQ ID NO: 69 - cDNA otimizado EMD37666.1 para expressão de S. cerevisiae
ATGTCTGCTGCTGCTCAATACACTACTTTGATCTTGGACTTGGGTGA CGTTTTGTTCACTTGGTCTCCAAAGACTAAGACTTCTATCCCACCAAGAACTTT GAAGGAAATCTTGAACTCTGCTACTTGGTACGAATACGAAAGAGGTAGAATCT CTCAAGACGAATGTTACGAAAGAGTTGGTACTGAATTCGGTATCGCTCCATCT GAAATCGACAACGCTTTCAAGCAAGCTAGAGACTCTATGGAATCTAACGACGA ATTGATCGCTTTGGTTAGAGAATTGAAGACTCAATTGGACGGTGAATTGTTGGT TTTCGCTTTGTCTAACATCTCTTTGCCAGACTACGAATACGTTTTGACTAAGCC AGCTGACTGGTCTATCTTCGACAAGGTTTTCCCATCTGCTTTGGTTGGTGAAA GAAAGCCACACTTGGGTGTTTACAAGCACGTTATCGCTGAAACTGGTATCGAC CCAAGAACTACTGTTTTCGTTGACGACAAGATCGACAACGTTTTGTCTGCTAG ATCTGTTGGTATGCACGGTATCGTTTTCGAAAAGCAAGAAGACGTTATGAGAG CTTTGAGAAACATCTTCGGTGACCCAGTTAGAAGAGGTAGAGAATACTTGAGA AGAAACGCTATGAGATTGGAATCTGTTACTGACCACGGTGTTGCTTTCGGTGA AAACTTCACTCAATTGTTGATCTTGGAATTGACTAACGACCCATCTTTGGTTAC TTTGCCAGACAGACCAAGAACTTGGAACTTCTTCAGAGGTAACGGTGGTAGA CCATCTAAGCCATTGTTCTCTGAAGCTTTCCCAGACGACTTGGACACTACTTCT TTGGCTTTGACTGTTTTGCAAAGAGACCCAGGTGTTATCTCTTCTGTTATGGAC GAAATGTTGAACTACAGAGACCCAGACGGTATCATGCAAACTTACTTCGACGA CGGTAGACAAAGATTGGACCCATTCGTTAACGTTAACGTTTTGACTTTCTTCTA CACTAACGGTAGAGGTCACGAATTGGACCAATGTTTGACTTGGGTTAGAGAAG TTTTGTTGTACAGAGCTTACTTGGGTGGTTCTAGATACTACCCATCTGCTGACT GTTTCTTGTACTTCATCTCTAGATTGTTCGCTTGTACTAACGACCCAGTTTTGC ACCACCAATTGAAGCCATTGTTCGTTGAAAGAGTTCAAGAACAAATCGGTGTT GAAGGTGACGCTTTGGAATTGGCTTTCAGATTGTTGGTTTGTGCTTCTTTGGA CGTTCAAAACGCTATCGACATGAGAAGATTGTTGGAAATGCAATGTGAAGACG GTGGTTGGGAAGGTGGTAACTTGTACAGATTCGGTACTACTGGTTTGAAGGTT ACTAACAGAGGTTTGACTACTGCTGCTGCTGTTCAAGCTATCGAAGCTTCTCA AAGAAGACCACCATCTCCATCTCCATCTGTTGAATCTACTAAGTCTCCAATCAC TCCAGTTACTCCAATGTTGGAAGTTCCATCTTTGGGTTTGTCTATCTCTAGACC ATCTTCTCCATTGTTGGGTTACTTCAGATTGCCATGGAAGAAGTCTGCTGAAGT
TCACTAA XP 001217376.1 SEQ ID NO: 70 - cDNA otimizado XP 001217376.1 para expressão de S. cerevisiae
ATGGCTATCACTAAGGGTCCAGTTAAGGCTTTGATCTTGGACTTCTC TAACGTTTTGTGTTCTTGGAAGCCACCATCTAACGTTGCTGTTCCACCACAAAT CTTGAAGATGATCATGTCTTCTGACATCTGGCACGACTACGAATGTGGTAGATA CTCTAGAGAAGACTGTTACGCTAGAGTTGCTGACAGATTCCACATCTCTGCTG CTGACATGGAAGACACTTTGAAGCAAGCTAGAAAGTCTTTGCAAGTTCACCAC GAAACTTTGTTGTTCATCCAACAAGTTAAGAAGGACGCTGGTGGTGAATTGAT GGTTTGTGGTATGACTAACACTCCAAGACCAGAACAAGACGTTATGCACTCTAT CAACGCTGAATACCCAGTTTTCGACAGAATCTACATCTCTGGTTTGATGGGTAT GAGAAAGCCATCTATCTGTTTCTACCAAAGAGTTATGGAAGAAATCGGTTTGTC TGGTGACGCTATCATGTTCATOEGACGACAAGTTGGAAAACGTTATCGCTGCTC AATCTGTTGGTATCAGAGGTGTTTTGTTCCAATCTCAACAAGACTTGAGAAGA GTTGTTTTGAACTTCTTGGGTGACCCAGTTCACAGAGGTTTGCAATTCTTGGC TGCTAACGCTAAGAAGATGGACTCTGTTACTAACACTGGTGACACTATCCAAG ACAACTTCGCTCAATTGTTGATCTTGGAATTGGCTCAAGACAGAGAATTGGTTA AGTTGCAAGCTGGTAAGAGAACTTGGAACTACTTCATCGGTCCACCAAAGTTG ACTACTGCTACTTTCCCAGACGACATGGACACTACTTCTATGGCTTTGTCTGTT TTGCCAGTTGCTGAAGACGTTGTTTCTTCTGTTTTGGACGAAATGTTGAAGTT CGTTACTGACGACGGTATCTTCATGACTTACTTCGACTCTTCTAGACCAAGAGT TGACCCAGTTGTTTGTATCAACGTTTTGGGTGTTTTCTGTAGACACAACAGAG AAAGAGACGTTTTGCCAACTTTCCACTGGATCAGAGACATCTTGATCAACAGA GCTTACTTGTCTGGTACTAGATACTACCCATCTCCAGACTTGTTCTTGTTCTTCOT TGGCTAGATTGTGTTTGGCTGTTAGAAACCAATCTTTGAGAGAACAATTGGTTT TGCCATTGGTTGACAGATTGAGAGAAAGAGTTGGTGCTCCAGGTGAAGCTGT TTCTTTGGCTGCTAGAATCTTGGCTTGTAGATCTTTCGGTATCGACTCTGCTAG AGACATGGACTCTTTGAGAGGTAAGCAATGTGAAGACGGTGGTTGGCCAGTT GAATGGGTTTACAGATTCGCTTCTTTCGGTTTGAACGTTGGTAACAGAGGTTT GGCTACTGCTTTCGCTGTTAGAGCTTTGGAATCTCCATACGGTGAATCTGCTG
TTAAGGTTATGAGAAGAATCGTTTAA Iniciadores SEQ ID NO: 71 - Iniciador para construção de fragmento “a” (marcador de levedura LEU2)
AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAG
TCGTACCGCGCCATTCGACTACGTCGTAAGGCC SEQ ID NO: 72 - Iniciador para construção de fragmento “a” (marcador de levedura LEU2)
TCGTGGTCAAGGCGTGCAATTCTCAACACGAGAGTGATTCTTCGG
CGTTGTTGCTGACCATCGACGGTCGAGGAGAACTT SEQ ID NO: 73 - Iniciador para construção de fragmento “b” (marcador de E. coliAmpR)
TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCA
CGCCTTGACCACGACACGTTAAGGGATTTTGGTCATGAG SEQ ID NO: 74 - Iniciador para construção de fragmento “b” (marcador de E. coli AmpR)
AACGCGTACCCTAAGTACGGCACCACAGTGACTATGCAGTCCGCA
CTTTGCCAATGCCAAAAATGTGCGCGGAACCCCTA SEQ ID NO: 75 - Iniciador para construção de fragmento “c” (Origem de replicação de levedura)
TTGGCATTGGCAAAGTGCGGACTGCATAGTCACTGTGGTGCCGTACTTAGGG TACGCGTTCCTGAACGAAGCATCTGTGCTTCA
SEQ ID NO: 76 - Iniciador para construção de fragmento “c” (Origem de replicação de levedura)
CCGAGATGCCAAAGGATAGGTGCTATGTTGATGACTACGACACAGA
ACTGCGGGTGACATAATGATAGCATTGAAGGATGAGACT SEQ ID NO: 77 - Iniciador para construção de fragmento “d” (Origem de replicação de E. coli)
ATGTCACCCGCAGTTCTGTGTCGTAGTCATCAACATAGCACCTATCC
TTTGGCATCTCGGTGAGCAAAAGGCCAGCAAAAGG SEQ ID NO: 78 - Iniciador para construção de fragmento “d” (Origem de replicação de E. coli)
CTCAGATGTACGGTGATCGCCACCATGTGACGGAAGCTATCCTGAC AGTGTAGCAAGTGCTGAGCGTCAGACCCCGTAGAA

Claims (27)

REIVINDICAÇÕES
1. Método para produzir um sesquiterpeno drimane caracterizado pelo fato de que compreende: a. colocar em contato um precursor de farnesil difosfato acíclico (FPP) com um polipeptídeo que compreende um domínio de hidrolase semelhante a Haloácido deshalogenase (HAD) e que tem atividade de terpeno sintase bifuncional para produzir um sesquiterpeno drimane, em que o polipeptídeo compreende i. um motivo semelhante a terpeno sintase de classe | como estabelecido na SEQ ID NO: 53 (DDxx(D/E)); e ii. um motivo semelhante a terpeno sintase de classe |l como estabelecido na SEQ ID NO: 56 (DXD(T/S)T); e b. opcionalmente isolar o sesquiterpeno drimane ou uma mistura que compreende o sesquiterpeno drimane.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o sesquiterpeno drimane compreende albicanol e/ou drimenol.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o polipeptídeo que tem atividade de terpeno sintase bifuncional compreende a. uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63;e b. a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e c. a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 58.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que compreende transformar uma célula hospedeira ou organismo hospedeiro não humano com um ácido nucleico que codifica um polipeptídeo que tem atividade de terpeno sintase bifuncional, em que o polipeptídeo a. compreende a sequência de aminoácidos de SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63; ou b. compreende i. uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63;e ii. a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e iii. a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 58.
5. Método, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que compreende adicionalmente cultivar um organismo hospedeiro não humano ou uma célula hospedeira capaz de produzir FPP e transformada para expressar um polipeptídeo que compreende um domínio de hidrolase semelhante a Haloácido deshalogenase (HAD) sob condições que permitem a produção do polipeptídeo, em que o polipeptídeo a. compreende a sequência de aminoácidos de SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63; ou b. compreende i. uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99%
de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29, SEQ ID NO: 32, SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63;e ii. a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e iii. a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 58.
6. Método, de acordo com qualquer uma das reivindicações 3 a 5, caracterizado pelo fato de que o polipeptídeo compreende um ou mais motivos conservados, como estabelecido na SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61 e/ou SEQ ID NO: 62.
7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que o sesquiterpeno drimane ou a mistura que compreende o sesquiterpeno drimane é isolada.
8. Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que compreende colocar em contato o sesquiterpeno drimane com pelo menos uma enzima para produzir um derivado de sesquiterpeno drimane.
9. Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que compreende converter o sesquiterpeno drimane em um derivado de sesquiterpeno drimane com o uso de síntese química ou síntese bioquímica.
10. Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que o motivo semelhante a terpeno sintase de classe | compreende SEQ ID NO: 54 (DD(K/Q/R)(LIVT)(D/E)), o motivo semelhante a terpeno sintase de classe |l compreende a SEQ ID NO: 57 (DIVIMILIDTT), e o sesquiterpeno drimane é albicanol.
11. Método, de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que o polipeptídeo compreende a. uma sequência de aminoácidos que tem pelo menos 90% de identidade de sequência com a SEQ ID NO: 1, SEQ ID NO: 5, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23, SEQ ID NO: 26, SEQ ID NO: 29 ou SEQ ID NO: 32, e b. a sequência de SEQ ID NO: 54 (DD(K/Q/R)(L/IVT)(D/E)), e c. a sequência de SEQ ID NO: 57 (D(V/IM/ILIF)DTTS); e em que o sesquiterpeno drimane é albicanol.
12. Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que o polipeptídeo compreende a. uma sequência de aminoácidos que tem pelo menos 90% de identidade de sequência com a SEQ ID NO: 35, SEQ ID NO: 38, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 50 ou SEQ ID NO: 63, e b. a sequência de SEQ ID NO: 55, e c. a sequência de SEQ ID NO: 58; e em que o sesquiterpeno drimane é drimenol.
13. Polipeptídeo isolado caracterizado pelo fato de que compreende um domínio de hidrolase semelhante a Haloácido deshalogenase (HAD) e que tem atividade de terpeno sintase bifuncional que compreende a sequência de aminoácidos de SEQ ID NO: 1 ou SEQ ID NO: 5 ou que compreende a. uma sequência de aminoácidos que tem pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a SEQ ID NO: 1 ou SEQ ID NO: 5; e b. a sequência como estabelecido na SEQ ID NO: 53, SEQ ID NO: 54 ou SEQ ID NO: 55; e c. a sequência como estabelecido na SEQ ID NO: 56, SEQ ID NO: 57 ou SEQ ID NO: 48.
14. Polipeptídeo isolado, de acordo com a reivindicação 13, sendo que o polipeptídeo é caracterizado pelo fato de que compreende adicionalmente um ou mais motivos conservados como estabelecido na SEQ ID NO: 59, SEQ ID NO: 60, SEQ ID NO: 61 e/ou SEQ ID NO: 62.
15. Molécula de ácido nucleico isolada caracterizada pelo fato de que a. compreende uma sequência de nucleotídeos que codifica o polipeptídeo da reivindicação 13 ou 14; ou b. que compreende uma sequência de nucleotídeos que tem pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68 ou o complemento inverso da mesma; c. que compreende uma molécula de nucleotídeo que hibridiza sob condições rigorosas para a SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8 ou SEQ ID NO: 68; ou d. que compreende a sequência de nucleotídeos da SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 52, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69 ou SEQ ID NO: 70 ou o complemento inverso da mesma.
16. Vetor caracterizado pelo fato de que compreende a. a molécula de ácido nucleico, de acordo com a reivindicação 15; ou b. um ácido nucleico que codifica o polipeptídeo, de acordo com a reivindicação 13 ou 14.
17. Vetor, de acordo com a reivindicação 16, sendo que o vetor é caracterizado pelo fato de que é um vetor procariótico, vetor viral ou um vetor eucariótico.
18. Vetor, de acordo com a reivindicação 16 ou 17, sendo que o vetor é caracterizado pelo fato de que é um vetor de expressão.
19. Célula hospedeira ou organismo hospedeiro não humano caracterizado pelo fato de que compreende a. o ácido nucleico isolado, de acordo com a reivindicação 15; ou b. o vetor, de acordo com qualquer uma das reivindicações 16 a 18.
20. Método, de acordo com a reivindicação 5 ou 6, caracterizado pelo fato de que a célula é uma célula procariótica.
21. Método, de acordo com a reivindicação 20, caracterizado pelo fato de que a célula procariótica é uma célula bacteriana.
22. Método, de acordo com a reivindicação 21, caracterizado pelo fato de que a célula bacteriana é E. coli.
23. Método, de acordo com a reivindicação 5 ou 6, caracterizado pelo fato de que a célula é uma célula eucariótica.
24. Método, de acordo com a reivindicação 23, caracterizado pelo fato de que a célula eucariótica é uma célula de levedura ou uma célula vegetal.
25. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que a célula de levedura é Saccharomyces cerevisiae.
26. Uso do polipeptídeo, de acordo com a reivindicação 13 ou 14 caracterizado pelo fato de que é para produzir um sesquiterpeno drimane ou uma mistura que compreende um sesquiterpeno drimane e um ou mais terpenos.
27. Uso do polipeptídeo, de acordo com a reivindicação 26, caracterizado pelo fato de que o sesquiterpeno drimane é albicanol.
BR112019025376-9A 2017-06-02 2018-05-31 método para produzir albicanol e/ou drimenol BR112019025376A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17174399.0 2017-06-02
EP17174399 2017-06-02
PCT/EP2018/064344 WO2018220113A1 (en) 2017-06-02 2018-05-31 Method for producing albicanol and/or drimenol

Publications (1)

Publication Number Publication Date
BR112019025376A2 true BR112019025376A2 (pt) 2020-06-30

Family

ID=59021376

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112019025376-9A BR112019025376A2 (pt) 2017-06-02 2018-05-31 método para produzir albicanol e/ou drimenol

Country Status (6)

Country Link
US (2) US11293037B2 (pt)
EP (1) EP3635123A1 (pt)
JP (1) JP7191860B2 (pt)
CN (1) CN110691850A (pt)
BR (1) BR112019025376A2 (pt)
WO (1) WO2018220113A1 (pt)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11345907B2 (en) * 2018-05-29 2022-05-31 Firmenich Sa Method for producing albicanol compounds
EP4013862A2 (en) 2019-11-27 2022-06-22 Firmenich SA Novel polypeptides for producing albicanol and/or drimenol compounds
EP4001417A1 (en) * 2020-11-13 2022-05-25 serYmun Yeast GmbH Yeast platform for the production of vaccines
WO2023156429A1 (en) 2022-02-16 2023-08-24 Firmenich Sa Process for preparing octahydro-2(1h)-naphthalenone derivatives

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7790413B2 (en) * 2005-06-17 2010-09-07 Firmenich Sa Sesquiterpene synthases and methods of their use
WO2013058655A1 (en) * 2011-10-19 2013-04-25 Keygene N.V. Methods and compositions for producing drimenol
US10000773B2 (en) 2011-11-01 2018-06-19 Firmenich Sa Cytochrome P450 and use thereof for the enzymatic oxidation of terpenes
WO2015165738A1 (en) 2014-05-01 2015-11-05 Firmenich Sa Eutectic flavor system
ES2761689T3 (es) * 2014-12-09 2020-05-20 Dsm Ip Assets Bv Métodos para producir abienol
MX2018003127A (es) 2015-09-21 2018-06-06 Firmenich & Cie Microemulsiones de monoesteres de sucrosa.
MX2018005218A (es) 2015-11-05 2018-08-01 Firmenich & Cie Drimenol sintasas iii.

Also Published As

Publication number Publication date
JP2020523005A (ja) 2020-08-06
US20220186265A1 (en) 2022-06-16
US11932894B2 (en) 2024-03-19
CN110691850A (zh) 2020-01-14
JP7191860B2 (ja) 2022-12-19
US11293037B2 (en) 2022-04-05
EP3635123A1 (en) 2020-04-15
US20200140898A1 (en) 2020-05-07
WO2018220113A1 (en) 2018-12-06
US20230148463A9 (en) 2023-05-11

Similar Documents

Publication Publication Date Title
Hsiao et al. A novel homodimeric geranyl diphosphate synthase from the orchid Phalaenopsis bellina lacking a DD (X) 2–4D motif
US11932894B2 (en) Method for producing albicanol and/or drimenol
CN102016051B (zh) 生产香紫苏醇的方法
US10351880B2 (en) Drimenol synthases I
Lan et al. Molecular cloning and expression of Hedychium coronarium farnesyl pyrophosphate synthase gene and its possible involvement in the biosynthesis of floral and wounding/herbivory induced leaf volatile sesquiterpenoids
CN111225979A (zh) 产生广藿香醇和榄香醇、以及优选地还有广藿香奥醇的萜烯合成酶
US10385363B2 (en) Drimenol synthases II
BR112020023411A2 (pt) Método para produzir compostos de albicanol
Lin et al. Molecular cloning and functional analysis of the gene encoding geranylgeranyl diphosphate synthase from Jatropha curcas
Pateraki et al. Isolation and functional analysis of two Cistus creticus cDNAs encoding geranylgeranyl diphosphate synthase
US10337031B2 (en) Production of fragrant compounds
BR112021003271A2 (pt) método para produzir compostos de acetato de drimanila
US11293040B2 (en) Methods of producing sesquiterpene compounds

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B06G Technical and formal requirements: other requirements [chapter 6.7 patent gazette]

Free format text: VER PARECER.